KR20230129395A - 유전자 편집을 위한 aav 벡터 - Google Patents

유전자 편집을 위한 aav 벡터 Download PDF

Info

Publication number
KR20230129395A
KR20230129395A KR1020237020585A KR20237020585A KR20230129395A KR 20230129395 A KR20230129395 A KR 20230129395A KR 1020237020585 A KR1020237020585 A KR 1020237020585A KR 20237020585 A KR20237020585 A KR 20237020585A KR 20230129395 A KR20230129395 A KR 20230129395A
Authority
KR
South Korea
Prior art keywords
seq
sequence
polynucleotide
promoter
grna
Prior art date
Application number
KR1020237020585A
Other languages
English (en)
Inventor
캐서린 바니
안거스 시도어
세실 포튜니
마루프 아딜
애디슨 라이트
브렛 티 스탈
션 히긴스
벤자민 오크스
수라즈 마키자
사라 데니
마누엘 모어
Original Assignee
스크라이브 테라퓨틱스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스크라이브 테라퓨틱스 인크. filed Critical 스크라이브 테라퓨틱스 인크.
Publication of KR20230129395A publication Critical patent/KR20230129395A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Document Processing Apparatus (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 명세서에는 재조합 아데노-관련 바이러스(AAV) 벡터 내로의 혼입을 위해 구성된 폴리뉴클레오티드가 제공된다. 폴리뉴클레오티드는 표적 핵산의 변형에 유용한 AAV 벡터의 CRISPR 단백질, gRNA, 및 부수적 구성성분을 인코딩한다. 본 시스템은 또한 유전자의 표적 핵산 내에 돌연변이를 갖는 세포, 예를 들어 진핵 세포 내로의 도입에 유용하다. 그러한 돌연변이를 갖는 세포를 변형시키기 위해 그러한 AAV 벡터를 사용하는 방법이 또한 제공된다.

Description

유전자 편집을 위한 AAV 벡터
관련 출원에 대한 교차-참조
본 출원은 2020년 12월 9일자로 출원된 미국 가특허 출원 제63/123,112호 및 2021년 8월 20일자로 출원된 제63/235,638호에 대한 우선권을 주장하며, 이들의 내용은 전체적으로 본 명세서에 참고로 포함된다.
서열 목록의 참고에 의한 포함
서열 목록 단락 출원은 EFS-웹을 통해 ASCII 포맷으로 제출된 서열 목록을 포함하며, 이는 전체적으로 본 명세서에 참고로 포함된다. 2021년 12월 9일에 생성된 상기 ASCII 카피는 SCRB-028_02WO_SeqList_ST25.txt로 명명되고 크기가 13 MB이다.
유전자 편집은 다수의 유전적 질환을 치료하거나 예방하기 위한 큰 가능성을 보유한다. 그러나, 치료적 이익을 달성하기 위해서는 원하는 세포 내로의 CRISPR 유전자 편집 기구의 안전하고 표적화된 전달이 필요하다. 시험관내 및/또는 생체내에서 CRISPR 유전자 편집 기구를 세포에 전달하기 위한 조성물 및 방법에 대한 필요성이 당업계에 남아 있다.
본 개시내용은 표적 핵산의 변형을 위해 세포에 CRISPR 뉴클레아제를 전달하기 위한 AAV 벡터에 관한 것이다.
일부 실시 형태에서, 본 개시내용은 AAV 이식유전자(예를 들어 이식유전자 플라스미드)의 생성뿐만 아니라, 재조합 아데노-관련 바이러스(AAV) 벡터의 생성에 유용한 폴리뉴클레오티드를 제공한다. 일부 실시 형태에서, 본 개시내용은 제1 아데노-관련 바이러스(AAV) 5' 역위 말단 반복(ITR: inverted terminal repeat) 서열, 제2 AAV 3' ITR 서열, CRISPR 뉴클레아제, 제1 가이드 RNA(gRNA), 하나 이상의 프로모터 및, 임의로, 액세서리(accessory) 요소를 인코딩하는 폴리뉴클레오티드를 제공하며; 이들은 모두 단일 AAV 입자 내로 혼입될 수 있는 단일 발현 카세트 내에 포함된다. 다른 실시 형태에서, 폴리뉴클레오티드는 제1 5' AAV ITR 서열, 제2 3' AAV ITR 서열, CRISPR 뉴클레아제, 제1 gRNA, 제1 프로모터, 제2 프로모터, 및, 임의로, 하나 이상의 액세서리 요소를 인코딩하는 서열을 포함한다. 또 다른 실시 형태에서, 폴리뉴클레오티드는 제1 5' AAV ITR 서열, 제2 3' AAV ITR 서열, CRISPR 뉴클레아제, 제1 gRNA, 제2 gRNA, 제1 프로모터, 제2 프로모터, 제3 프로모터, 및, 임의로, 하나 이상의 액세서리 요소를 인코딩하는 서열을 포함한다.
일부 실시 형태에서, CRISPR 단백질 및 gRNA 서열을 인코딩하는 서열은 조합된 길이로 약 3100개 미만, 약 3090개 미만, 약 3080개 미만, 약 3070개 미만, 약 3060개 미만, 약 3050개 미만, 또는 약 3040개 미만의 뉴클레오티드이다. 다른 실시 형태에서, CRISPR 단백질 서열 및 gRNA 서열을 인코딩하는 폴리뉴클레오티드는 조합된 길이로 약 3040 내지 약 3100개 미만의 뉴클레오티드이다.
일부 실시 형태에서, 제1 프로모터 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과이다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상 내지 약 1900개 이상의 뉴클레오티드 초과이다. 일부 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1314개 초과의 뉴클레오티드이다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1381개 초과의 뉴클레오티드이다. 일 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 총 폴리뉴클레오티드 서열 길이의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34% 이상, 또는 35% 이상을 차지한다.
일부 실시 형태에서, 폴리뉴클레오티드의 액세서리 요소는 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소, 핵 위치 신호(NLS: nuclear localization signal), 데아미나제, DNA 글리코실라제 억제제, CRISPR-매개 상동성-지정 복구(CRISPR-mediated homology-directed repair)의 자극제, 및 전사의 활성화제 또는 저해제로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 액세서리 요소는 상기 액세서리 요소의 부재 하의 CRISPR 단백질에 비교하여 CRISPR 단백질의 발현, 결합, 활성, 또는 성능을 향상시킨다. 특정 실시 형태에서, 향상된 성능은 시험관내 검정에서 CRISPR 구성성분의 발현시에 표적 핵산의 편집의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 1500% 이상, 약 200% 이상, 또는 약 300% 이상의 증가이다.
일부 실시 형태에서, 본 개시내용은 부류 2, 유형 V CRISPR 단백질인 CRISPR 단백질을 인코딩하는 폴리뉴클레오티드를 제공한다. 일부 실시 형태에서, 부류 2, 유형 V CRISPR 단백질은 CasX이다. 일부 실시 형태에서, CasX는 서열 번호 1 내지 3 및 서열 번호 49 내지 160, 40208 내지 40369, 및 40828 내지 40912의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함한다. 일부 실시 형태에서, 본 개시내용은 부류 2, 유형 V CRISPR 단백질을 인코딩하는 폴리뉴클레오티드를 제공하며, 여기서 인코딩된 CRISPR 단백질은 하나 이상의 도메인 내에 하나 이상의 변형을 포함하는 서열 번호 145의 서열을 포함하고, 여기서 하나 이상의 변형은 표 30 내지 표 33에 기술된 변형으로 이루어진 군으로부터 선택되고, 여기서 하나 이상의 변형은 서열 번호 145의 CRISPR 단백질에 비교하여 개선된 특징을 유발한다.
일부 실시 형태에서, 폴리뉴클레오티드는 제1 및 제2 gRNA를 인코딩하며, 여기서 인코딩된 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 각각 포함한다. 일부 실시 형태에서, 인코딩된 제1 및 제2 gRNA는 서열 번호 2238에 비교하여 하나 이상의 변형을 갖는 스캐폴드 서열을 포함하며, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발하고, 여기서 하나 이상의 변형은 표 28에 기술된 바와 같은 하나 이상의 뉴클레오티드 치환, 삽입, 및/또는 결실을 포함하고, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발한다. 다른 실시 형태에서, 인코딩된 제1 및 제2 gRNA는 서열 번호 2239에 비교하여 하나 이상의 변형을 갖는 스캐폴드 서열을 포함하며, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발하고, 여기서 하나 이상의 변형은 표 28에 기술된 바와 같은 하나 이상의 뉴클레오티드 치환, 삽입, 및/또는 결실을 포함하고, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발한다.
일부 실시 형태에서, 폴리뉴클레오티드는 5' 및 3' ITR을 포함하며, 여기서 ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래된다.
일부 실시 형태에서, 폴리뉴클레오티드는 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 22 및 표 24 내지 표 27의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함한다.
다른 실시 형태에서, 본 개시내용은 AAV 캡시드 단백질, 및 본 명세서에 개시된 실시 형태 중 어느 하나의 폴리뉴클레오티드를 포함하는 재조합 아데노-관련 바이러스(rAAV)를 제공한다. 일부 실시 형태에서, AAV 캡시드 단백질은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래된다.
일부 실시 형태에서 본 개시내용은, 재조합 AAV 벡터를 제조하는 방법으로서, 세포의 집단을 제공하는 단계, 및 본 명세서에 개시된 실시 형태 중 임의의 것의 폴리뉴클레오티드를 포함하는 벡터로 세포의 집단을 형질감염시키는 단계를 포함하는 방법을 제공한다. 일부 실시 형태에서, 세포의 집단은 AAV rep 및 cap 단백질을 발현한다.
일부 실시 형태에서 본 개시내용은, 하나 이상의 구성성분 서열은 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택되고, CpG 다이뉴클레오티드가 실질적으로 고갈된 AAV 벡터를 제공하며, 여기서 구성성분 서열은 이들의 기능적 특징(예를 들어, 발현을 구동하는 능력 또는 표적 핵산에 대한 편집 잠재력을 유지하는 능력)을 유지한다. 일부 실시 형태에서, CpG 다이뉴클레오티드가 실질적으로 고갈된 AAV 벡터는, 예를 들어 투여되는 경우, 감소된 면역원성 특성을 나타낸다(예를 들어, 염증성 사이토카인 또는 AAV의 구성성분에 대한 항체를 도출하는 능력이 감소됨).
일부 실시 형태에서 본 개시내용은, 포유류 세포의 집단에서 표적 핵산을 변형시키기 위한 방법으로서, 복수의 세포를 본 명세서에 개시된 실시 형태 중 임의의 것의 rAAV의 유효량과 접촉시키는 단계를 포함하며, 여기서 발현된 gRNA에 의해 표적화된 세포의 유전자의 표적 핵산은 발현된 CRISPR 단백질에 의해 변형되는 방법을 제공한다.
일부 실시 형태에서 본 개시내용은, 대상체(예를 들어 인간)에서 대상체의 유전자 내의 하나 이상의 돌연변이에 의해 야기된 질환을 치료하기 위한 방법으로서, 본 명세서에 개시된 실시 형태 중 임의의 것의 rAAV의 치료적 유효 용량을 투여하는 단계를 포함하는 방법을 제공한다.
일부 실시 형태에서 본 개시내용은, rAAV의 면역원성을 감소시키는 방법으로서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택된 AAV 구성성분의 서열의 CpG 다이뉴클레오티드의 전부 또는 일부를 결실시키는 단계를 포함하는 방법을 제공한다.
참고에 의한 포함
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별 간행물, 특허, 또는 특허 출원이 구체적으로 그리고 개별적으로 참고로 포함되는 것으로 표시되는 것과 동일한 정도로 본 명세서에 참고로 포함된다.
2020년 12월 10일자로 공개된 WO/2020/247882호 및 2021년 12월 2일자로 출원된 PCT/US2021/061673호의 내용은 전체적으로 본 명세서에 참고로 포함된다.
본 개시내용의 신규 특징은 첨부된 청구범위에 자세하게 기술된다. 본 개시내용의 원리가 이용되는, 예시적인 실시 형태를 기술하는 하기 상세한 설명, 및 첨부 도면을 참조함으로써 본 개시내용의 특징 및 이점의 더 양호한 이해가 얻어질 것이다.
도 1은 실시예 1에 기재된 AAV 작제물의 개략도를 나타낸다.
도 2는 실시예 1에 기재된 바와 같이 mNPC 내로 뉴클레오펙션된(nucleofected) AAV 이식유전자 플라스미드를 사용하는 편집 검정의 결과를 나타내며, 이는 3개의 상이한 벡터(작제물 1, 2, 및 3) 내의 CasX 및 표적화 가이드가 표적(티디토마토(tdTomato)) 상에서 비-표적화 대조군(NT)에 비교하여 높은 효율로 편집함을 입증한다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 3은 실시예 1에 기재된 바와 같이 4개의 상이한 용량 수준에서 mNPC 내로 뉴클레오펙션된 AAV 이식유전자 플라스미드를 사용하는 편집 검정의 결과를 나타낸다. AAV 이식유전자 플라스미드로서 mNPC에 전달된 CasX는 비-표적화 대조군(NT)에 비교하여 용량-의존적 방식으로 표적 상에서 높은 효율로 편집한다. 3개의 상이한 벡터(작제물 1, 2, 및 3) 내의 티디토마토를 표적화하는 스페이서 및 스캐폴드 변이체 174를 갖는 CasX 변이체 491을 mNPC에 뉴클레오펙션하고, 형질감염-후 5 일에 FACS에 의해 편집을 평가하였다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 4는 실시예 1에 기재된 바와 같이 형질도입-후 5 일에 FACS에 의해 평가된, 3-배 희석으로 mNPC 내로 형질도입된 AAV 벡터 작제물 3을 사용하는 편집 검정의 결과를 나타낸다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다. MOI: 감염 다중도.
도 5는 실시예 2에 기재된 바와 같이 패키징된 CasX 변이체 438, gRNA 스캐폴드 174, 및 스페이서 12.7을 갖는 AAV 입자를 나타내는 주사 투과 현미경 사진(scanning transmission micrograph)이다. AAV는 1% 우라닐 아세테이트로 음성 염색되었다. 빈 입자는 캡시드의 중앙에서의 전자 밀도가 높은 어두운 원에 의해 확인된다.
도 6은 실시예 3에 기재된 바와 같은 마우스 관상 뇌 절편의 면역조직화학 염색의 결과를 나타낸다. 마우스는 CasX 491, 스페이서 12.7을 갖는 gRNA 스캐폴드 174로 패키징된 1 x 1011개의 AAV의 ICV 주사를 받았으며(상단 패널), 이는 Ai9 마우스에서 tdTom 유전자좌를 편집할 수 있었다(편집된 세포는 백색으로 보임). 하단 패널은 AAV ICV 주사로서 투여된 비-표적화 스페이서를 갖는 스캐폴드 174 및 CasX 491은 tdTom 유전자좌에서 편집하지 않았음을 나타낸다. 주사-후 1 개월에 면역조직화학적 분석을 위해 조직을 가공하였다.
도 7은 실시예 4에 기재된 바와 같이 CasX 프로모터 내에 변이를 갖는 작제물의 AAV 이식유전자 플라스미드를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 8은 실시예 4에 기재된 바와 같이 CasX 프로모터 내에 변이를 갖는 작제물의 AAV 이식유전자 플라스미드를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n = 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 9는 실시예 4에 기재된 바와 같이 CasX 프로모터 내에 변이를 갖는 작제물의 AAV 이식유전자 플라스미드 및 이식유전자 크기(삽입 표 참조)를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n = 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 10은 실시예 4에 기재된 바와 같이 도 9에 나타낸 바와 동일한 프로모터를 포함하는 AAV 벡터를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 좌측의 그래프는 작제물의 3-배 희석을 시험하는 결과인 반면에, 우측의 그래프는 2 x 105 vg/세포의 MOI를 사용하는 편집의 결과이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n = 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 11은 실시예 4에 기재된 바와 같이 이전에 확인된 상위 4개의 단백질 프로모터 변이체(AAV.3, AAV.4, AAV.5, 및 AAV.6)를 갖는 AAV에 비교하여 이식유전자 크기를 감소시키도록 설계된 단백질 프로모터 변이체를 갖는 AAV 벡터를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n = 3 반복실험에 대한 평균 ± SEM으로서 제공된다. 파선은 본 실험에서 변이체들에 걸친 비교를 위한 기준선으로 사용된 AAV 작제물인 AAV.4의 편집 수준을 나타낸다.
도 12는 본 연구에서 시험된 다양한 프로모터를 갖는 모든 작제물에 대한 % 편집 대 이식유전자 크기의 그래프이다. 파선으로 원을 그린 작제물은 이식유전자 크기를 최소화하면서 평균 초과의 편집을 갖는 것으로 확인되었다. 파선은 본 실험에서 변이체들에 걸친 비교를 위한 기준선으로 사용된 AAV 작제물인 AAV.4의 편집 수준을 나타낸다.
도 13은 실시예 5에 기재된 바와 같이 gRNA 프로모터 강도에 변이를 갖는 AAV 이식유전자 플라스미드를 사용하는 mNPC의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 14는 실시예 5에 기재된 바와 같이 gRNA 프로모터 강도에 변이를 갖는 3개의 상이한 AAV 벡터를 사용하는 mNPC의 편집 검정의 결과를 나타낸다. 좌측의 그래프는 1 x 104 내지 5 x 105 vg/세포의 범위의 작제물의 3-배 희석을 시험하는 결과인 반면에, 우측의 그래프는 3 x 105 vg/세포의 MOI를 사용하는 편집의 결과이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 15는 실시예 5에 기재된 바와 같이 전달된 이식유전자 내의 Pol III 프로모터의 풋프린트(footprint)를 최소화하도록 설계된 AAV 이식유전자 플라스미드 내에서 전달될 경우에 작제물 내의 절단된 U6 RNA 프로모터의 사용을 평가하기 위한 실험에서 mNPC 내의 tdTom 유전자좌의 % 편집을 나타내는 막대 그래프이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 16은 실시예 5에 기재된 바와 같이 전달된 이식유전자 내의 Pol III 프로모터의 풋프린트를 최소화하도록 설계된 AAV 벡터로서 전달될 경우에, 기준 작제물(base construct) 53을 작제물 85에 비교하는 mNPC 내의 tdTom 유전자좌의 % 편집을 나타내는 막대 그래프이다.
도 17은 실시예 5에 기재된 바와 같이 AAV 이식유전자 내의 Pol III 프로모터의 풋프린트를 최소화하도록 설계된 AAV 벡터 내에서 mNPC에 전달될 경우에 조작된 U6 RNA 프로모터를 갖는 작제물의 효과를 평가하기 위한 실험에서 tdTom 유전자좌의 편집 결과를 나타내는 막대 그래프이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 18은 실시예 5에 기재된 바와 같이 X-축 상의 조작된 U6 RNA 프로모터를 갖는 모든 시험된 AAV 변이체의 이식유전자 크기 대 Y-축 상의 편집된 mNPC의 %를 도시하는 산포도이다. 파선은 시험된 최대 프로모터를 갖는 작제물 53을 표시하는 반면에, 점선은 시험된 최소 프로모터를 갖는 작제물 89를 표시한다.
도 19는 실시예 5에 기재된 바와 같이 AAV 이식유전자 내의 Pol III 프로모터의 풋프린트를 최소화하도록 설계된 AAV 벡터 내에서 전달될 경우에 조작된 Pol III RNA 프로모터를 갖는 작제물의 효과를 평가하기 위한 실험에서 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 20은 실시예 5에 기재된 바와 같이 표시된 작제물을 사용하는 3.0E+5 vg/세포의 MOI에서의 mNPC 내의 AAV-매개 편집 수준을 나타내는 막대 그래프이다.
도 21은 실시예 5에 기재된 바와 같이 X-축 상의 모든 시험된 변이체의 이식유전자 크기 대 Y-축 상의 편집된 mNPC의 %를 도시하는 산포도이다.
도 22는 실시예 6에 기재된 바와 같이 폴리(A) 신호 내에 변이를 갖는 AAV 이식유전자 플라스미드를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 23은 실시예 6에 기재된 바와 같이 상위 폴리(A) 신호를 갖는 2개의 AAV 벡터를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 24는 실시예 7에 기재된 바와 같이 가이드 RNA 전사 단위(U6 프로모터에 의해 구동되는 gRNA 스캐폴드-스페이서 스택(stack))를 단백질 프로모터 전사 단위에 대해 상이한 배향으로 함유하는 AAV 플라스미드 작제물의 개략도이다. 테이퍼링된 지점은 단백질 또는 가이드 RNA에 대한 전사 단위의 배향을 도시한다.
도 25는 실시예 7에 기재된 바와 같이 조절 요소 배향의 차이를 갖는 AAV 이식유전자 플라스미드를 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 26은 실시예 7에 기재된 바와 같이 가이드 RNA 전사 단위(U6 프로모터에 의해 구동되는 gRNA 스캐폴드-스페이서 스택)를 단백질 프로모터 전사 단위에 대해 상이한 배향으로 함유하는 AAV 벡터를 사용하는 NPC의 편집 검정의 결과를 나타낸다. 좌측의 그래프는 1 x 104 내지 2 x 106 vg/세포의 범위의 작제물의 3-배 희석을 시험하는 결과를 나타낸다. 우측의 막대 그래프는 3.0E+5 vg/세포의 MOI에서의 mNPC 내의 AAV-매개 % 편집을 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 27은 실시예 8에 기재된 바와 같이 전사-후 조절 요소를 갖지 않는 작제물에 비교하여 상이한 전사-후 조절 요소를 갖는 AAV 이식유전자 플라스미드 작제물을 사용하는 mNPC 내의 tdTom 유전자좌의 편집 검정의 결과의 막대 그래프이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 28은 실시예 8에 기재된 바와 같이 상이한 전사-후 조절 요소 서열(기준 플라스미드 4에 대해 작제물 35 내지 37, 기준 플라스미드 5에 대해 작제물 38 내지 39, 및 기준 플라스미드 6에 대해 작제물 42 내지 43)의 부재 하에(작제물 4, 5, 6), 또는 이와 조합되어 상위 프로모터의 제어 하에 CasX 단백질 491을 발현하는 150 ng의 AAV-시스 플라스미드(어두운 막대)를 사용하는 뉴클레오펙션 편집에 비교하여 3.0E+5의 바이러스 MOI에서의 mNPC의 AAV-매개 편집 수준(회색 막대)을 나타내는 막대 그래프이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 29는 실시예 8에 기재된 바와 같이 상이한 전사-후 조절 요소 서열(각각 Jet 프로모터를 함유하는 기준 플라스미드 58에 대해 작제물 72 내지 74, Jet+USP 프로모터를 함유하는 기준 플라스미드 59에 대해 작제물 75 내지 77, 및 UbC 프로모터를 함유하는 기준 플라스미드 53에 대해 작제물 80 내지 81)이 부재하거나(작제물 58, 59, 53) 이와 조합된 프로모터 하의 작제물에 대한 3.0E+5의 바이러스 MOI에서의 mNPC의 AAV-매개 편집 수준을 나타내는 막대 그래프이다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터(n=3)는 평균 ± SEM으로서 제공된다.
도 30은 실시예 8에 기재된 바와 같이, 평가된 각각의 작제물의 이식유전자 크기(ITR로부터 ITR까지, bp 단위)를 3.0e+5 vg/세포의 MOI에서의 mNPC 내의 AAV-매개 편집 수준에 비교하는 산포도이다. 원을 그린 데이터 지점은 선택된 이식유전자 크기의 편집 수준의 관점에서 상위의 확인된 작제물을 나타낸다. 회색 수평선은 비교 목적을 위한 벤치마크 벡터 AAV.53의 편집 수준을 나타낸다. 회색 수직선은 4.9 kb 이식유전자 크기 초과 또는 미만인 벡터의 한계를 정한다.
도 31은 실시예 8에 기재된 바와 같이 이식유전자 플라스미드 내의 표시된 PTRE 요소의 포함에 의한 AAV-매개 배수-개선을, 그의 기준(동일한 프로모터를 갖지만 PTRE를 갖지 않는 이식유전자, 회색 파선에 의해 표시됨)에 비교하여 나타내는 바이올린 플롯이다.
도 32는 실시예 8에 기재된 바와 같이 AAV 이식유전자 플라스미드로서 mNPC에 전달된 상이한 뉴런 인핸서(neuronal enhancer)를 갖는 작제물의 편집 결과를 나타내는 막대 차트이다. 회색 선은 CMV 인핸서 + 코어 프로모터를 보유하는 참조 플라스미드 64의 편집 수준을 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 33은 실시예 9에 기재된 바와 같이 다중 gRNA를 갖는 작제물에 대한 대안적인 gRNA 구성을 갖는 AAV 작제물의 개략도를 나타낸다. 상단 개략도는 아키텍처 1인 반면에, 하단은 아키텍처 2이다. 테이퍼링된 지점은 단백질 또는 가이드 RNA에 대한 전사 단위의 배향을 도시한다.
도 34는 실시예 9에 기재된 바와 같이 다중 gRNA를 갖는 작제물에 대한 대안적인 gRNA 구성을 갖는 AAV 작제물의 개략도를 나타낸다. 테이퍼링된 지점은 단백질 또는 가이드 RNA에 대한 전사 단위의 배향을 도시한다.
도 35는 실시예 9에 기재된 바와 같이 뉴클레오펙션 및 AAV 형질도입으로 시험된 가이드 RNA 스택(Pol III 프로모터, 스캐폴드, 스페이서) 아키텍처의 개략도를 나타낸다. 이식유전자는 스페이서 12.7, 12.2, 및 비-표적 스페이서 NT를 갖는 상이한 배향의 이중 스택을 보유한다. 테이퍼링된 지점은 단백질 또는 가이드 RNA에 대한 전사 단위의 배향을 도시한다.
도 36은 실시예 9에 기재된 바와 같이 플라스미드 형질감염을 통해 mNPC에 전달된 가이드 RNA 스택을 갖는 작제물에 대한 편집 검정의 결과를 나타내며, 이는 RNA 스택을 갖는 작제물이 비-표적화 대조군(NT)에 비교하여 향상된 효력으로 편집함을 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 37은 실시예 9에 기재된 바와 같이 단일 gRNA를 갖는 작제물 3 및 비-표적화 작제물에 비교하여 상이한 조합의 스페이서를 갖는 상이한 아키텍처의 다중 gRNA(도 35 참조)를 갖는 AAV 이식유전자 플라스미드 작제물을 사용하는 mNPC의 편집 검정의 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 38은 실시예 9에 기재된 바와 같이 작제물 3에 비교하여 상이한 조합의 스페이서를 갖는 상이한 아키텍처의 다중 gRNA(도 35 참조)를 갖는 AAV 벡터 작제물 45 내지 48을 사용하는 mNPC의 편집 검정의 결과를 나타낸다. 좌측 패널은 1 x 104 내지 3 x 105 vg/세포의 범위의 3-배 MOI 희석을 사용하는 편집 결과를 나타내는 반면에, 우측 패널은 3 x 105 vg/세포의 MOI에서의 편집 결과를 나타낸다. 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 39는 실시예 10에 기재된 바와 같이 mNPC 내에 3' NLS 1, 8, 및 9와 함께 다양한 5' NLS 조합(표 15에서의 2, 7, 및 9)을 갖는 AAV 이식유전자 플라스미드 작제물을 사용하는 mNPC에서의 % 편집의 막대 그래프이다.
도 40은 실시예 10에 기재된 바와 같이 mNPC 내에 3' NLS 1, 8, 및 9와 함께 다양한 5' NLS 조합을 갖는 AAV 벡터를 사용하는 mNPC에서의 % 편집의 막대 그래프이다.
도 41은 이식유전자 내의 Pol III 프로모터의 풋프린트를 최소화하도록 설계된 벡터 내에서 전달될 경우에 다양한 NLS 조합을 갖는 AAV 벡터를 사용하는 mNPC 내에서의 % 편집의 막대 그래프이다.
도 42는 실시예 12에 기재된 바와 같이 5'과 3' ITR 사이의 예시적인 AAV 이식유전자의 구성성분의 편성을 나타내는 개략도이다.
도 43a는 실시예 12에 기재된 바와 같이 용량-의존적 방식으로 마우스 RHO 엑손 1에서의 개선된 활성을 입증하는 마우스 RHO 엑손 1 유전자좌를 표적화하는 스페이서 11.30을 갖는 가이드 변이체 174, 229 내지 237 및 CMV의 CasX 단백질 491 발현을 발현하는 1000개의 AAV-시스 플라스미드로 뉴클레오펙션된 mNPC 내에서의 편집 검정의 결과를 나타낸다. gDNA 추출을 위해 삼중실험 웰을 함께 혼주하였으며, 따라서 n=1로서 처리되었다.
도 43b는 실시예 12에 기재된 바와 같이 2개의 플라스미드 뉴클레오펙션 용량 1000 및 500 ng의 AAV-시스 플라스미드에 걸쳐 스페이서 11.30(1.0의 값으로 설정됨)을 갖는 가이드 174에 비교하여 각각의 조작된 스캐폴드(229 내지 237)에 대한 편집 수준의 배수-변화를 나타내는 막대 그래프이다. gDNA 추출을 위해 삼중실험 웰을 함께 혼주하였으며, 따라서 n=1로서 처리되었다.
도 44a는 실시예 12에 기재된 바와 같이 ARPE-19 세포에서 Pol III hU6 프로모터의 발현 하에, 외인성 RHO-GFP 유전자좌(리포터로서 GFP를 가짐)에서 RHO를 표적화하는 스페이서 11.1을 갖는 가이드 174에 비교하여 조작된 가이드 235의 편집 결과를 나타내며, 이는 돌연변이체 RHO 리포터 유전자에서의 표적-외(off-target) 절단 없이 WT 외인성 RHO에서의 증가된 표적-내(on-target) 활성을 갖는, 인간 RHO 유전자좌에서의 235 변이체에 의한 개선된 활성을 입증한다. 데이터(n=3)는 평균 ± SD으로서 제공된다.
도 44b는 실시예 12에 기재된 바와 같이 1000 ng의 각각의 플라스미드로 뉴클레오펙션된 세포에서 벤치마크 p59.491.174.11.1 수준(값 1.0으로 설정됨)에 대해 정규화된 p59.491.235.11.1에 의한, 인간 RHO 유전자좌에서의 가이드 174에 비교한 조작된 가이드 235의 편집 수준의 배수-변화를 나타내는 막대 그래프이다. 데이터(n=3)는 평균 ± SD으로서 제공된다.
도 45a는 실시예 12에 기재된 바와 같이 3개의 상이한 MOI 수준에서 스페이서 11.30을 갖는 가이드 스캐폴드 174에 비교하여 CasX 분자 및 조작된 가이드 변이체 235의 AAV-매개 발현에 의한 mNPC에서의 편집 수준을 나타내며, 이는 표적-외 유전자좌 없이 내인성 마우스 Rho 엑손 1 유전자좌에서의 증가된 편집 수준을 확인한다.
도 45b는 실시예 12에 기재된 바와 같이 5.0e+5 MOI로 감염된 세포에서 스페이서 11.30을 갖는 가이드 스캐폴드 174에 비교하여 CasX 분자 및 조작된 가이드 변이체 235의 AAV-매개 발현에 의한 mNPC에서의 편집 수준의 배수-변화를 나타내는 막대 그래프이다. 데이터는 n =3의 평균으로서 제공된다.
도 46a는 실시예 12에 기재된 바와 같이 CasX 단백질 491 및 다양한 길이의 표적-내 스페이서를 갖는 sgRNA-스캐폴드 174를 발현하는 1000 및 500 ng의 AAV-시스 플라스미드로 뉴클레오펙션된 mNPC 내의 인간 RHO 유전자좌에서의 편집 결과를 나타내며, 이는 마우스 RHO 유전자좌에서의 개선된 표적-내 편집을 입증한다. 스페이서 변이체는 각각 11.30(20 nt WT RHO), 11.38(18 nt WT RHO), 및 11.39(19 nt WT RHO)이다. CasX 단백질 단독의 발현으로부터 생성되는 비특이적 표적화가 없음을 보장하기 위해, 마우스 및 인간 게놈에 걸쳐 임의의 서열을 인식하지 않도록 설계된 대조군 스페이서, 비-표적(NT)을 또한 음성 대조군으로서 시험하였다. gDNA 추출을 위해 삼중실험 웰을 함께 혼주하였으며, 따라서 n=1로서 처리되었다.
도 46b는 실시예 12에 기재된 바와 같이 표시된 표적-외 스페이서를 갖는 sgRNA-스캐폴드 174 및 CasX 단백질 491을 발현하는 1000 ng의 AAV-시스 플라스미드로 뉴클레오펙션된 mNPC 내의 인간 RHO 유전자좌에서의 편집 수준을 나타내는 막대 그래프이다.
도 46c는 실시예 12에 기재된 바와 같이 모 sgRNA-스캐폴드-스페이서 174.11.30의 수준에 대해 정규화된 스페이서 변이체 11.38 및 11.39를 갖는 각각의 sgRNA-스캐폴드 174에 대해 뉴클레오펙션된 mNPC 내의 인간 RHO 유전자좌에서의 편집 수준의 배수-변화를 나타내는 막대 그래프이다. 데이터는 3회의 상이한 생물학적 반복실험에 걸친 평균 + SD를 나타낸다.
도 47a는 실시예 13에 기재된 바와 같이 벤치마크 작제물에 비교하여 sgRNA 스캐폴드 변이체 및 최적화된 스페이서의 AAV-매개 전달을 비교하는 마우스 모델에서 RHO의 편집 결과를 나타내는 위스커 박스 그래프이다. 각각의 점은 1개의 망막을 나타낸다(n=8-16). 일원 ANOVA 통계 검정을 수행하였다(*** = p <0.001).
도 47b는 실시예 13에 기재된 바와 같이 벤치마크 작제물에 비교하여 sgRNA 스캐폴드 변이체 174 및 235 및 최적화된 스페이서의 AAV-매개 전달을 비교하는 마우스 모델에서 RHO의 편집의 상대 배수-변화를 나타내는 위스커 박스 그래프이다. 값은 벤치마크 벡터 AAV.RHO.174.11.30(1의 값으로 설정됨)에 비교한 것이다. 각각의 점은 1개의 망막을 나타낸다(n=8-16).
도 48a는 실시예 14에 기재된 바와 같이 각각 CasX 단백질 변이체 491, 515, 527, 528, 535, 536, 또는 537 및 sgRNA-스캐폴드 235.11.37(표적 내)을 발현하는 1000 및 500 ng의 AAV-시스 플라스미드로 뉴클레오펙션된 mNPC 내의 마우스 RHO 유전자좌에서의 CTC-PAM 편집 수준(인델 빈도(indel rate))을 나타내는 막대 그래프이다. CasX 단백질 단독의 발현으로부터 생성되는 비특이적 표적화가 없음을 보장하기 위해, 마우스 및 인간 게놈에 걸쳐 임의의 서열을 인식하지 않도록 설계된 대조군 스페이서, 비-표적(NT)을 또한 음성 대조군으로서 시험하였다. gDNA 추출을 위해 삼중실험 웰을 함께 혼주하였으며, 따라서 n=1로서 처리되었다.
도 48b는 실시예 14에 기재된 바와 같이 각각 CasX 단백질 변이체 491, 515, 527, 528, 535, 536, 또는 537 및 sgRNA-스캐폴드 235.11.39(표적 외)를 발현하는 AAV-시스 플라스미드로 뉴클레오펙션된 mNPC 내의 마우스 RHO 유전자좌에서의 CTC-PAM 편집 수준(인델 빈도)을 나타내는 막대 그래프이다.
도 48c는 실시예 14에 기재된 바와 같이 가이드 235 및 스페이서 11.39를 갖는 각각의 표시된 CasX 단백질 변이체에 대해 편집 수준의 배수-변화를 나타내는 막대 그래프를 나타내며, 결과는 모 CasX 단백질 491의 수준에 대해 정규화되었다.
도 49a는 실시예 14에 기재된 바와 같이 스페이서 11.41 또는 11.43을 갖는 가이드 변이체 235 및 CasX 단백질 변이체 491, 515, 527, 528, 535, 536, 또는 537을 발현하는 1000 ng의 AAV-시스 플라스미드로 뉴클레오펙션된 ARPE-19 mNPC에서의 편집 수준을 나타내는 막대 그래프를 나타낸다. 데이터(n=3)는 평균 ± SD으로서 제공된다.
도 49b는 실시예 14에 기재된 바와 같이 벤치마크 p59.491.235.11.41 수준(1.0의 값으로 설정됨)에 비교하여 스페이서 11.41 또는 11.43을 갖는 가이드 변이체 235 및 CasX 단백질 변이체 515, 527, 528, 535, 536, 또는 537을 발현하는 1000 ng의 AAV-시스 플라스미드로 뉴클레오펙션된 ARPE-19 mNPC에서의 편집 수준의 배수-변화를 나타내는 막대 그래프를 나타낸다. 데이터(n=3)는 평균 ± SD으로서 제공된다.
도 50a는 실시예 14에 기재된 바와 같이 내인성 마우스 Rho 엑손 1 유전자좌에서의 mNPC 내의 AAV-매개 편집 수준의 막대 그래프를 나타낸다. 실시예 14에 기재된 바와 같이 표시된 CasX 단백질 491, 515, 527, 528, 535, 또는 537 및 sgRNA-스캐폴드 변이체 235.11.39를 발현하는 AAV 벡터로 3.0e+5 및 1.0e+5 vg/세포 MOI를 사용하여 mNPC를 감염시켰다. 데이터(n=3)는 평균으로서 제공된다.
도 50b는 실시예 14에 기재된 바와 같이 표시된 MOI로 감염된 세포에서 스페이서 11.39를 갖는 가이드 174에 비교하여 가이드 스캐폴드 235를 갖는 표시된 CasX 변이체에 대한 편집 수준의 배수-변화를 나타내는 막대 그래프이다.
도 51은 실시예 15에 기재된 바와 같이 스페이서 11.30 표적 서열 및 예상되는 CasX-매개 절단을 나타내는 참조 mRHO 엑손 1 유전자좌 및 표적 아미노산 잔기 P23(CCC) 서열(굵은 체로 강조됨)의 예시이다. CRISPResso 편집(치환 /결실)에서 정량화된 가장 통상적인 예측 편집을 참조 게놈 아래에 나타낸다.
도 52a는 실시예 15에 기재된 바와 같이 C57BL6J 마우스에서 망막 내의 mRHO P23 유전자좌의 생체내 AAV CasX-매개 편집의 결과를 나타낸다(n=6-8; NGS에 의해 검출된 총 인델의 %로 정량화됨).
도 52b는 실시예 15에 기재된 바와 같이 C57BL6J(n=6-8) 마우스에서 망막 내의 mRHO P23 유전자좌의 AAV CasX-매개 프레임-시프트 편집의 분율(%)을 나타낸다(n=6-8; NGS에 의해 검출된 총 인델의 %로 정량화됨).
도 53a 내지 도 53f는 실시예 15에 기재된 바와 같이 AAV-CasX 처리되고 염색된 마우스 또는 음성 대조군으로부터의 망막의 대표적인 형광 영상화를 나타낸다. 세포 핵을 DAPI로 대조염색하여(상단 행; 도 53a 내지 도 53c) 망막층을 시각화하고 HA-태그(하단 행, 도 53d 내지 도 53f) 항체로 염색하여 광수용체(ONL) 및 다른 망막층(INL; GCL) 내의 CasX 발현을 검출하였다. 범례: ONL= 외핵층; INL= 내핵층, GCL= 신경절 세포층.
도 54a는 실시예 16에 기재된 바와 같이 5.0e+9 vg/안구의 AAV.X.491.174.11.30 벡터를 주사한 야생형 망막에서 주사-후 3 주에 NGS에 의해 검출된 CasX 491의 AAV-매개 발현을 사용하는 중위, 최소, 및 최고 편집 값을 나타내는 박스 플롯이며, 여기서 491 단백질은 간상 광수용체에서 선택적으로 발현되도록 설계된 프로모터 변이체(X=RP1-RP5) 또는 편재성 프로모터(ubiquitous promoter)(X=CMV)에 의해 구동된다. 시험된 다른 바이러스 벡터에 비교하기 위해 AAV.RP1.491.174.11.30에 의해 달성된 편집 수준에 회색 선을 위치시킨다.
도 54b는 실시예 16에 기재된 바와 같이 총 이식유전자 크기(bp)에 비교하여 5.0e+9 vg/안구의 AAV.X.491.174.11.30 벡터를 주사한 야생형 망막에서 AAV 벡터에 의해 달성된 편집의 수준을 나타내는 플롯이다. 회색 선은 4.9 kb 크기 미만 또는 초과의 이식유전자의 한계를 정한다.
도 55는 실시예 16에 기재된 바와 같이 간상 광수용체에서 CasX 491 및 sgRNA 스페이서 174.4.76의 AAV-매개 발현이 통합된 Nrl-GFP 유전자좌에서의 편집 수준의 검출가능한 수준을 용량-의존적 방식으로 유발했다는 생체내 편집 결과를 나타낸다. 막대 그래프는 표시된 용량의 AAV.RP1.491.174.4.76 벡터를 한쪽 안구에 주사하고, 반대쪽 안구에는 비히클 대조군을 주사한 이종접합 Nrl-GFP 마우스에서 주사-후 4-주 및 12-주에 통합된 GFP 유전자좌에서 NGS에 의해 검출된 편집 수준을 나타낸다.
도 56a는 양성(C1, 주사하지 않은 동종접합 Nrl-GFP 망막) 및 음성(N, 주사하지 않은 C57BL/6J 망막) 대조군, 비히클군(V, AAV 제형 완충액을 주사한 망막), 및 중간 용량 1.9e+9(M) 또는 높은 용량 1.0e+10 vg(H) 아암으로 AAV-CasX 491, sgRNA 174, 및 스페이서 4.76 처리된 망막으로부터의 망막 용해물의 웨스턴 블롯을 나타낸다. 실시예 16에 기재된 바와 같이 블롯은 HA 단백질(CasX 단백질, 상단), GFP 단백질(중간), 및 로딩 대조군으로 사용된 GAPDH(하단 패널)에 대한 각각의 밴드를 나타낸다. NGS에 의해 검출된 망막에서의 % 편집의 수준을 각각의 샘플에 대한 블롯 아래에 나타낸다.
도 56b는 실시예 16에 기재된 바와 같이 도 56a의 웨스턴 블롯에서 검출된 GFP 단백질의 수준을 나타내는 산포 박스플롯이다(비히클군 수준에 대해 정규화된, 단백질의 총량에 대한 GFP 밴드의 밀도계 값(densitometric value)의 비). 일원 ANOVA 통계 분석을 수행하였다(* =p<0.5).
도 56c는 실시예 16에 기재된 바와 같이 1.0e+9 및 1.0e+10 용량군 둘 모두에 대해 AAV-처리된 마우스의 마우스 망막에서 달성된 편집의 수준에 GFP 단백질 분율을 관련시키는 플롯이다.
도 57a는 실시예 16에 기재된 바와 같이 2가지 용량 수준의 AAV 작제물을 주사한 마우스에서 주사-후 12-주에 비교하여 4-주에 안저 영상화에 의해 검출된 GFP 형광 수준의 비(상부 대 하부 망막 평균 회색 값(superior to inferior retina mean grey values))를 나타내는 막대 그래프이다.
도 57b는 실시예 16에 기재된 바와 같이 4-주 및 (좌측 패널) 또는 12-주(우측 패널)에 1.0e+9 vg(#13) 또는 1.0e+10 vg(#34)로 AAV 작제물을 주사한 마우스로부터의 망막에서 GFP의 형광 안저 영상화의 대표적인 영상을 나타낸다.
도 58a 내지 도 58l은 실시예 16에 기재된 바와 같이 다양한 면역화학 시약으로 염색된 마우스의 조직학 영상 또는 망막을 제공하며, 이는 광수용체 세포에서의 GFP의 AAV-용량 의존적 방식의 효율적인 녹-다운을 확인한다. 영상은 비히클(도 58a, 도 58b, 도 58c, 도 58d), 1.0e+9 vg 용량(도 58e, 도 58f, 도 58g, 및 도 58h) 및 1.0E+10 vg 용량(도 58i, 도 58j, 도 58k, 및 도 58l)에서의 AAV-CasX를 주사한 단면화된 망막의 대표적인 공초점 영상이다. 구조적 영상화는 외절 내의 간상 광수용체에 의한 GFP 발현을 나타낸다(각각 20X 및 40X 배율에 대해, 도 58a, 도 58e, 도 58i의 영상 및 영상 도 58c, 도 58g, 및 도 58k). 세포 핵을 Hoechst로 대조염색하고(도 58b, 도 58f, 및 도 58j) 세포를 항-HA로 염색하여 HA의 수준(CasX 이식유전자 수준; 도 58d, 도 58h, 및 도 58l; 40X 배율)과 광수용체에서 발현된 GFP를 관련시켰다. b 및 f에서 백색 박스 외형선은 도 58c 및 도 58g에서 40X 배율로 분석된 망막 영역을 표시한다. 범례: RPE=망막 색소 상피, OS=외절, ONL=외핵층, INL=내핵층, GCL= 신경절.
도 59a는 실시예 3에 기재된 바와 같이 마우스 간 절편의 면역조직화학 염색의 결과를 나타내며, 이는 Ai9 마우스에서 AAV IV 주사로서 투여된 스페이서 12.7을 갖는 스캐폴드 174 및 CasX 491이 생체내에서 tdTom 유전자좌를 편집할 수 있었음을 나타낸다. 영상은 n=3 동물을 대표한다.
도 59b는 실시예 3에 기재된 바와 같이 마우스 심장 절편의 면역조직화학 염색의 결과를 나타내며, 이는 Ai9 마우스에서 AAV IV 주사로서 투여된 스페이서 12.7을 갖는 스캐폴드 174 및 CasX 491이 생체내에서 tdTom 유전자좌를 편집할 수 있었음을 나타낸다. 영상은 n=3 동물을 대표한다.
도 60은 실시예 17에 기재된 바와 같이 일련의 3-배 희석의 MOI로 인간 NPC 내로의 AAV의 형질도입-후 5 일에 B2M 유전자좌에서의 % 편집의 정량화의 그래프이다. 편집 수준은 NGS에 의해 인델 빈도로서, 그리고 유세포 분석법에 의해 B2M 유전자좌에서의 성공적인 편집으로 인해 HLA 단백질을 발현하지 않는 세포의 집단으로서 결정되었다.
도 61은 실시예 17에 기재된 바와 같이 특이적 스페이서 표적화 AAVS1을 갖는 gRNA 및 CasX 491을 각각 함유하는 3개의 표시된 AAV를 사용하는 인간 유도 뉴런(iN) 내의 인간 AAVS1 유전자좌에서의 NGS에 의해 검출된 인델 빈도로서 측정된 편집 검정의 결과를 나타낸다.
도 62는 실시예 17에 기재된 바와 같이 2E4 또는 6.67E3의 MOI에서 다양한 단백질 프로모터에 의해 구동되는 CasX 491을 발현하는 AAV의 형질도입-후 14 일에 인간 iN 내의 B2M 유전자좌에서의 % 편집을 나타내는 막대 그래프이다.
도 63은 실시예 18에 기재된 바와 같이 hNPC 내로 뉴클레오펙션된 AAV 이식유전자 플라스미드를 사용하는 편집 검정의 결과를 나타내며, 이는 U1a 프로모터(작제물 번호 178 및 179), U6 프로모터(작제물 번호 180 및 181), 또는 bGH 폴리(A)(작제물 번호 182) 내의 CpG 감소 또는 고갈이 원래의 CpG+ AAV 벡터(작제물 번호 177)로 달성된 편집에 비교하여 B2M 유전자좌에서의 CasX-매개 편집을 유의하게 감소시키지 않았음을 입증한다. 본 실험에서 사용된 대조군은 비-표적화(NT) 스페이서 및 비처리(NTx)였다.
도 64는 실시예 5에 기재된 바와 같이 AAV 벡터 내에서 mNPC에 전달될 경우에 조작된 Pol III 프로모터 혼성 변이체를 갖는 AAV 작제물의 효과를 평가하기 위한 실험에서 티디토마토 유전자좌의 편집 결과를 나타내는 막대 그래프이다. 편집은 뉴클레오펙션-후 5 일에 FACS에 의해 평가되었다.
도 65는 실시예 20에 기재된 바와 같이 스캐폴드 라이브러리를 설계하기 위해 사용되는 가이드 RNA의 영역 및 도메인의 개략도이다.
도 66은 실시예 20에 기재된 바와 같이 표시된 비편향(이중 및 단일 돌연변이) 및 표적화된 돌연변이(삼중체, 스캐폴드 스템 버블, 유사매듭(pseudoknot), 및 연장된 스템 및 루프를 지향함) 둘 모두를 갖는 스캐폴드 라이브러리의 설계 및 상대 분포의 파이 차트이다.
도 67은 실시예 20에 기재된 바와 같이 삼중체 내로 대체 삼중체-형성 염기쌍을 특이적으로 혼입시키도록 설계된 삼중체 돌연변이유발의 개략도이다. 실선은 삼중체 내의 왓슨-크릭(Watson-Crick) 쌍을 표시하고; 제3 가닥 뉴클레오티드는 이중체의 퓨린과의 비-정준 상호작용을 나타내는 점선으로서 표시된다. 라이브러리에서, 표시된 5개의 위치 각각은 모든 가능한 삼중체 모티프로 대체되었다(G:GC, T:AT, G:GC) = 243 서열. ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCANNNAUCAAAG의 서열(서열 번호 41829).
도 68은 실시예 20에 기재된 바와 같이 각각의 스크린에서 참조 가이드 스캐폴드 174 및 175의 농축(enrichment) 값의 결과를 갖는 막대 차트이다.
도 69는 실시예 20에 기재된 바와 같이 가이드 스캐폴드 174 및 175에 대한 돌연변이체 라이브러리의 2개의 독립적인 스크린 각각에서 측정된 바와 같은 각각의 측정된 단일 뉴클레오티드 치환, 결실, 또는 삽입에 대한 log2 농축 값을 나타내는 산포도이다.
도 70은 실시예 20에 기재된 바와 같이 서열들에 걸친 스캐폴드 내의 특이적 이변(mutable) 영역을 나타내는 가이드 스캐폴드 174 및 175 내의 단일 돌연변이체에 대한 열 지도이다. 황색 음영은 참조 스캐폴드와 유사한 농축을 갖는 값을 반영하고; 적색 음영은 참조 스캐폴드에 비교하여 농축, 및 따라서 활성의 증가를 표시하고; 청색 음영은 야생형 스캐폴드에 비교하여 활성의 손실을 표시하고; 백색은 누락 데이터(또는 야생형 서열을 유발할 치환)를 표시한다.
도 71은 실시예 20에 기재된 바와 같이 참조 가이드 스캐폴드 174 및 175 상의 단일 뉴클레오티드 돌연변이의 log2 농축을 비교하는 산포도이다. 174와 175 사이에 유사한 위치에 대한 돌연변이만 나타낸다. 결과는 전반적으로 가이드 스캐폴드 174가 175보다 변화에 대해 더 용인성임을 제시한다.
도 72는 실시예 20에 기재된 바와 같이 각각의 새로운 유사매듭이 스템 내에서 동일하지만 순서가 상이한 염기쌍의 조성을 갖도록 유사매듭 쌍이 셔플링된 스캐폴드의 세트에 대한 평균(및 95% 신뢰 구간) log2 농축 값을 나타내는 막대 차트이다. 각각의 막대는 표시된 G:A(또는 A:G) 쌍 위치를 갖는 스캐폴드의 세트를 나타낸다(우측의 다이어그램 참조). 291개의 유사매듭 스템을 시험하였으며; 막대 위의 숫자는 각각의 위치에 G:A(또는 A:G) 쌍을 갖는 스템의 수를 표시한다.
도 73은 5'에서 3'으로 주어진 도 55 및 도 56의 유사매듭 서열의 개략도이며, 2개의 가닥 서열은 밑줄에 의해 분리되어 있다.
도 74는 실시예 20에 기재된 바와 같이 유사매듭 스템 영역의 예측 2차 구조 안정성에 의해 분할된 스캐폴드에 대한 평균(및 95% 신뢰 구간) log2 농축 값을 나타내는 막대 차트이다. 매우 안정한 스템을 갖는 스캐폴드(예를 들어, -7 kcal/mol 미만의 ΔG)는 평균적으로 높은 농축 값을 가진 반면에, 불안정화된 스템을 갖는 스캐폴드(-5 kcal/mol 이상의 ΔG)는 평균적으로 낮은 농축 값을 가졌다.
도 75는 실시예 20에 기재된 바와 같이 스캐폴드 175 내의 위치 7 및 29의 모든 이중 돌연변이체의 열 지도이다. 유사매듭 서열은 우측에 5'에서 3'으로 주어진다.
도 76은 실시예 21에 기재된 바와 같이 CasX 단백질 515 및 스캐폴드 174에 의해 표적화될 경우에 상이한 스페이서에 대한 CcdB 선택의 선택적 엄격성을 결정하기 위한 생존 검정의 그래프이다.
예시적인 실시 형태를 본 명세서에 나타내고 기재하였지만, 그러한 실시 형태는 단지 예로서 제공됨이 당업자에게 명백할 것이다. 본 명세서에 청구된 발명으로부터 이탈하지 않으면서 다수의 변이, 변화, 및 치환이 당업자에게 이제 발생할 것이다. 본 명세서에 기재된 실시 형태에 대한 다양한 대안이 본 개시내용의 실시 형태의 실시에 사용될 수 있음을 이해해야 한다. 청구범위는 본 발명의 범주를 정의하고, 이들 청구범위 및 이들의 등가물의 범주 내의 방법 및 구조가 이에 의해 커버되는 것으로 의도된다.
달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것들과 유사하거나 등가인 방법 및 재료가 본 실시 형태의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료는 하기 기재된다. 상충되는 경우, 정의를 포함하는 특허 명세서가 우선할 것이다. 또한, 재료, 방법, 및 실시예는 단지 예시적이며 제한하려는 의도가 아니다. 본 발명으로부터 이탈하지 않으면서 다수의 변이, 변화, 및 치환이 당업자에게 이제 발생할 것이다.
정의
본 명세서에서 상호교환적으로 사용되는 용어 "폴리뉴클레오티드" 및 "핵산"은 리보뉴클레오티드 또는 데옥시리보뉴클레오티드인 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭한다. 따라서, 용어 "폴리뉴클레오티드" 및 "핵산"은 단일-가닥 DNA; 이중-가닥 DNA; 다중-가닥 DNA; 단일-가닥 RNA; 이중-가닥 RNA; 다중-가닥 RNA; 게놈 DNA; cDNA; DNA-RNA 혼성체; 및 퓨린 및 피리미딘 염기 또는 다른 천연 뉴클레오티드 염기, 화학적으로 또는 생물학적으로 변형된 뉴클레오티드 염기, 비-천연 뉴클레오티드 염기, 또는 유도체화된 뉴클레오티드 염기를 포함하는 중합체를 포함한다.
"혼성화가능한" 또는 "상보적인"은 핵산(예를 들어, RNA, DNA)이 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에 서열-특이적인 역평행 방식으로 다른 핵산에 대해 그것이 비-공유적으로 결합하는 것, 즉, 왓슨-크릭 염기쌍 및/또는 G/U 염기쌍을 형성하거나, "어닐링"되거나, "혼성화"되는 것(즉, 핵산이 상보적인 핵산에 특이적으로 결합함)을 가능하게 하는 뉴클레오티드의 서열을 포함한다는 것을 의미하기 위해 상호교환적으로 사용된다. 폴리뉴클레오티드의 서열은 특이적으로 혼성화가능하기 위해 그의 표적 핵산 서열의 것에 대해 100% 상보적일 필요는 없고; 그것은 약 70% 이상, 약 80% 이상, 또는 약 90% 이상, 또는 약 95% 이상의 서열 동일성을 가지며 표적 핵산 서열에 여전히 혼성화될 수 있다는 것이 이해된다. 추가로, 폴리뉴클레오티드는 개재되거나 인접한 세그먼트가 혼성화 사건에 참여하지 않도록 하나 이상의 세그먼트에 걸쳐 혼성화될 수 있다(예를 들어, 루프 구조 또는 헤어핀 구조, '벌지(bulge)', '버블' 등).
본 개시내용의 목적을 위해 "유전자"는, 유전자 생성물(예를 들어, 단백질, RNA)을 인코딩하는 DNA 영역뿐만 아니라, 유전자 생성물의 생성을 조절하는 모든 DNA 영역을, 그러한 조절 서열이 코딩 서열 및/또는 전사되는 서열에 인접한지 여부에 무관하게 포함한다. 따라서, 유전자는 프로모터 서열, 종결자, 번역 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 사일런서, 인슐레이터(insulator), 경계 요소, 복제 원점, 매트릭스 부착 부위, 및 유전자좌 제어 영역을 포함하지만 반드시 이로 제한되지는 않는 액세서리 요소 서열을 포함할 수 있다. 코딩 서열은 전사 또는 전사 및 번역시에 유전자 생성물을 인코딩하며; 본 개시내용의 코딩 서열은 단편을 포함할 수 있고 전장 개방 해독 프레임을 포함할 필요는 없다. 유전자는 전사되는 가닥뿐만 아니라 안티코돈을 함유하는 상보적인 가닥 둘 모두를 포함할 수 있다.
용어 "하류"는 참조 뉴클레오티드 서열에 대해 3'에 위치하는 뉴클레오티드 서열을 지칭한다. 소정의 실시 형태에서, 하류 뉴클레오티드 서열은 전사의 시작점 뒤에 있는 서열에 관한 것이다. 예를 들어, 유전자의 번역 개시 코돈은 전사의 시작 부위의 하류에 위치한다.
용어 "상류"는 참조 뉴클레오티드 서열에 대해 5'에 위치하는 뉴클레오티드 서열을 지칭한다. 소정의 실시 형태에서, 상류 뉴클레오티드 서열은 코딩 영역 또는 전사의 시작점의 5' 측에 위치하는 서열에 관한 것이다. 예를 들어, 대부분의 프로모터는 전사의 시작 부위의 상류에 위치한다.
용어 폴리뉴클레오티드 또는 아미노산 서열에 관련하여 "~에 인접한"은 폴리뉴클레오티드 또는 폴리펩티드에서 다음에 있거나 서로 연결되는 서열을 지칭한다. 2개의 서열은 서로 인접한 것으로 간주되며 여전히 제한된 양의 개재된 서열, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 뉴클레오티드 또는 아미노산을 포함할 수 있다는 것을 당업자는 인정할 것이다.
용어 "액세서리 요소"는 본 명세서에서 용어 "액세서리 서열"과 상호교환적으로 사용되며, 특히 폴리아데닐화 신호(폴리(A) 신호), 인핸서 요소, 인트론, 전사후 조절 요소(PTRE), 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, 부가적인 프로모터, CRISPR-매개 상동성-지정 복구를 자극하는 인자(예를 들어 시스 또는 트랜스로), 전사의 활성화제 또는 저해제, 자가-절단 서열, 및 융합 도메인, 예를 들어 CRISPR 단백질에 융합된 융합 도메인을 포함하도록 의도된다. 적절한 액세서리 요소 또는 요소들의 선택은 발현될 인코딩된 구성성분(예를 들어, 단백질 또는 RNA)에 따라 달라지거나, 핵산이 상이한 중합효소를 필요로 하는 다중 구성성분을 포함하거나 융합 단백질로서 발현되도록 의도되지 않는지 여부에 따라 달라질 것임이 이해될 것이다.
용어 "프로모터"는 중합효소 결합 및 전사를 용이하게 하는 전사 시작 부위 및 부가적인 서열을 함유하는 DNA 서열을 지칭한다. 예시적인 진핵생물 프로모터는 TATA 박스와 같은 요소, 및/또는 B 인식 요소(BRE)를 포함하며 관련된 전사가능한 폴리뉴클레오티드 서열 및/또는 유전자(또는 이식유전자)의 전사 및 발현을 보조하거나 촉진한다. 프로모터는 합성적으로 생성될 수 있거나 알려지거나 천연 발생하는 프로모터 서열 또는 다른 프로모터 서열로부터 유래될 수 있다. 프로모터는 전사될 유전자에 대해 근위 또는 원위일 수 있다. 프로모터는 또한 소정의 특성을 부여하기 위해 2개 이상의 이종 서열의 조합을 포함하는 키메라 프로모터를 포함할 수 있다. 본 개시내용의 프로모터는 알려지거나 본 명세서에 제공된 다른 프로모터 서열(들)과 조성이 유사하지만 동일하지는 않은 프로모터 서열의 변이체를 포함할 수 있다. 프로모터는, 구성성, 발생적, 조직-특이적, 유도성 등과 같은, 프로모터에 작동가능하게 연결된 관련된 코딩 또는 전사가능한 서열 또는 유전자의 발현 패턴에 관련된 기준에 따라 분류될 수 있다. 프로모터는 또한 그의 강도에 따라 분류될 수 있다. 프로모터의 맥락에서 사용되는 바와 같이, "강도"는 프로모터에 의해 제어되는 유전자의 전사 속도를 지칭한다. "강력한" 프로모터는 전사 속도가 높음을 의미하는 반면에, "약한"프로모터는 전사 속도가 비교적 낮음을 의미한다.
본 개시내용의 프로모터는 중합효소 II(Pol II) 프로모터일 수 있다. 중합효소 II는 모든 단백질 코딩 유전자 및 다수의 비-코딩 유전자를 전사한다. 대표적인 Pol II 프로모터는 전사 시작 부위를 둘러싸는 약 100개의 염기쌍의 서열인 코어 프로모터를 포함하며, Pol II 중합효소 및 관련된 일반 전사 인자에 대한 결합 플랫폼으로서의 역할을 한다. 프로모터는 TATA 박스, BRE, 개시제(INR), 모티프 10 요소(MTE), 하류 코어 프로모터 요소(DPE), 하류 코어 요소(DCE)와 같은 하나 이상의 코어 프로모터 요소를 함유할 수 있지만, 이들 요소가 결여된 코어 프로모터가 당업계에 알려져 있다.
본 개시내용의 프로모터는 중합효소 III(Pol III) 프로모터일 수 있다. Pol III은 DNA를 전사하여 작은 리보솜 RNA, 예컨대 5S rRNA, tRNA, 및 다른 작은 RNA를 합성한다. 대표적인 Pol III 프로모터는 전사를 지원하기 위해 내부 제어 서열(유전자의 전사된 섹션 내의 서열)을 사용하지만, TATA 박스와 같은 상류 요소가 또한 간혹 사용된다. 모든 Pol III 프로모터가 본 개시내용의 범주 내에 있는 것으로 예상된다.
용어 "인핸서"는, 전사 인자로 불리는 특이적 단백질에 의해 결합될 경우에 관련된 유전자의 발현을 조절하는 조절 DNA 서열을 지칭한다. 인핸서는 유전자의 인트론, 또는 유전자의 코딩 서열의 5' 또는 3'에 위치할 수 있다. 인핸서는 유전자에 대해 근위일 수 있거나(즉, 프로모터로부터 수십개 또는 수백개 염기쌍(bp) 이내), 유전자에 대해 원위에 위치될 수 있다(즉, 프로모터로부터 수천 bp, 수십만 bp, 또는 심지어 수백만 bp 떨어져 있음). 단일 유전자는 하나 초과의 인핸서에 의해 조절될 수 있으며, 이들 모두는 본 개시내용의 범주 내에 있는 것으로 예상된다.
본 명세서에 사용되는 바와 같이, "전사-후 조절 요소(PRE)", 예컨대 간염 PRE는, 전사될 경우에 전사-후 활성을 나타낼 수 있는 3차 구조를 생성하여 이에 작동가능하게 연결된 관련된 유전자의 발현을 향상시키거나 촉진하는 DNA 서열을 지칭한다.
본 명세서에 사용되는 바와 같이, "전사-후 조절 요소(PTRE)", 예컨대 간염 PTRE는, 전사될 경우에 전사-후 활성을 나타낼 수 있는 3차 구조를 생성하여 이에 작동가능하게 연결된 관련된 유전자의 발현을 향상시키거나 촉진하는 DNA 서열을 지칭한다.
본 명세서에 사용되는 바와 같이, "재조합"은 특정 핵산(DNA 또는 RNA)이 클로닝, 제한, 및/또는 라이게이션 단계의 다양한 조합의 생성물임을 의미하며, 이는 천연 시스템에서 발견되는 내인성 핵산과 구별가능한 구조 코딩 또는 비-코딩 서열을 갖는 작제물을 유발한다. 일반적으로, 구조 코딩 서열을 인코딩하는 DNA 서열은 cDNA 단편 및 짧은 올리고뉴클레오티드 링커로부터, 또는 일련의 합성 올리고뉴클레오티드로부터 조립되어, 세포 또는 무세포 전사 및 번역 시스템에 함유된 재조합 전사 단위로부터 발현될 수 있는 합성 핵산을 제공할 수 있다. 그러한 서열은 전형적으로 진핵생물 유전자에 존재하는 내부 비-번역 서열 또는 인트론에 의해 중단되지 않는 개방 해독 프레임의 형태로 제공될 수 있다. 관련 서열을 포함하는 게놈 DNA는 또한 재조합 유전자 또는 전사 단위의 형성에 사용될 수 있다. 비-번역 DNA의 서열은 개방 해독 프레임으로부터 5' 또는 3'에 존재할 수 있으며, 여기서 그러한 서열은 코딩 영역의 조작 또는 발현을 방해하지 않고, 실제로 다양한 기전에 의해 원하는 생성물의 생성을 조절하도록 작용할 수 있다(상기 "인핸서" 및 "프로모터" 참조).
용어 "재조합 폴리뉴클레오티드" 또는 "재조합 핵산"은 천연 발생하지 않는, 예를 들어, 인간 중재를 통해 서열의 달리 분리된 2개의 세그먼트의 인공 조합에 의해 제조되는 것을 지칭한다. 이러한 인공 조합은 종종 화학적 합성 수단에 의해, 또는 예를 들어 유전 공학 기술에 의한 핵산의 단리된 세그먼트의 인공 조작에 의해 달성된다. 그러한 것은 전형적으로 서열 인식 부위를 도입하거나 제거하면서 동일하거나 보존적인 아미노산을 인코딩하는 중복 코돈으로 코돈을 대체하기 위해 일반적으로 실행된다. 대안적으로, 기능들의 원하는 조합을 생성하도록 원하는 기능들의 핵산 세그먼트들을 함께 결합하기 위해 그것을 수행한다. 이러한 인공 조합은 종종 화학적 합성 수단에 의해, 또는 예를 들어 유전 공학 기술에 의한 핵산의 단리된 세그먼트의 인공 조작에 의해 달성된다.
유사하게, 용어 "재조합 폴리펩티드" 또는 "재조합 단백질"은 천연 발생하지 않는, 예를 들어, 인간 중재를 통해 아미노 서열의 달리 분리된 2개의 세그먼트의 인공 조합에 의해 제조되는 폴리펩티드 또는 단백질을 지칭한다. 따라서, 예를 들어, 이종성 아미노산 서열을 포함하는 단백질은 재조합이다.
본 명세서에 사용되는 바와 같이, 용어 "접촉시키는"은 2개 이상의 실체 사이의 물리적 연결을 확립하는 것을 의미한다. 예를 들어, 표적 핵산을 가이드 핵산과 접촉시키는 단계는 표적 핵산 및 가이드 핵산이 물리적 연결을 공유하게 만드는 것을 의미하며; 예를 들어, 서열이 서열 유사성을 공유하는 경우에는 혼성화될 수 있다.
"해리 상수" 또는 "Kd"는 상호교환적으로 사용되며 리간드 " L"과 단백질 "P" 사이의 친화도; 즉, 리간드가 특정 단백질에 얼마나 단단히 결합하는지를 의미한다. 그것은 화학식 Kd=[L] [P]/[LP]를 사용하여 계산될 수 있으며, 여기서 [P], [L], 및 [LP]는 각각 단백질, 리간드, 및 복합체의 몰 농도를 나타낸다.
본 개시내용은 표적 핵산 서열을 편집하기에 유용한 시스템 및 방법을 제공한다. 본 명세서에 사용되는 바와 같이"편집"은 "변형"과 상호교환적으로 사용되며, 절단, 닉킹, 결실, 노킹 인, 노킹 아웃 등을 포함하지만 이로 제한되지 않는다.
"절단"은 표적 핵산 분자(예를 들어, RNA, DNA)의 공유 골격의 파단을 의미한다. 절단은 포스포다이에스테르 결합의 효소적 또는 화학적 가수분해를 포함하지만 이로 제한되지 않는 다양한 방법에 의해 개시될 수 있다. 단일-가닥 절단 및 이중-가닥 절단 둘 모두가 가능하며, 이중-가닥 절단은 2개의 별개의 단일-가닥 절단 사건의 결과로서 발생할 수 있다.
용어 "녹-아웃"은 유전자 또는 유전자의 발현의 제거를 지칭한다. 예를 들어, 유전자는 판독 프레임의 붕괴로 이어지는 뉴클레오티드 서열의 결실 또는 부가에 의해 녹 아웃될 수 있다. 다른 예로서, 유전자는 유전자의 일부를 무관한 서열로 대체함으로써 녹 아웃될 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "녹-다운"은 유전자 또는 그의 유전자 생성물(들)의 발현의 감소를 지칭한다. 유전자 녹-다운의 결과로서, 단백질 활성 또는 기능이 약화되거나 단백질 수준이 감소되거나 제거될 수 있다.
본 명세서에 사용되는 바와 같이, "상동성-지정 복구"(HDR)는 세포에서 이중-가닥 파단의 복구 중에 일어나는 DNA 복구의 형태를 지칭한다. 이 공정은 뉴클레오티드 서열 상동성을 필요로 하며, 표적 DNA를 복구하거나 녹-아웃시키기 위해 공여자 주형을 사용하고, 공여자로부터 표적으로의 유전 정보의 전달로 이어진다. 상동성-지정 복구는 공여자 주형이 표적 DNA 서열과 상이하고 공여자 주형의 서열의 일부 또는 전부가 표적 DNA 내로 혼입되는 경우에 삽입, 결실, 또는 돌연변이에 의한 표적 서열의 서열 변경을 유발할 수 있다.
본 명세서에 사용되는 바와 같이, "비-상동성 단부 결합"(NHEJ)은 상동성 주형에 대한 필요 없이(복구를 가이드하기 위해 상동성 서열을 필요로 하는 상동성-지정 복구와는 대조적임) 파단 단부의 서로에 대한 직접 라이게이션에 의한 DNA에서의 이중-가닥 파단의 복구를 지칭한다. NHEJ는 종종 이중-가닥 파단 부위 부근의 뉴클레오티드 서열의 손실(결실)을 유발한다.
본 명세서에 사용되는 바와 같이, "미세-상동성 매개 단부 결합"(MMEJ)은 상동성 주형에 대한 필요 없이(복구를 가이드하기 위해 상동성 서열을 필요로 하는 상동성-지정 복구와는 대조적임) 파단 부위를 플랭킹(flanking)하는 결실과 항상 관련되는 돌연변이원성 DSB 복구 기전을 지칭한다. MMEJ는 종종 이중-가닥 파단 부위 부근의 뉴클레오티드 서열의 손실(결실)을 유발한다. 폴리뉴클레오티드 또는 폴리펩티드는 다른 폴리뉴클레오티드 또는 폴리펩티드에 대한 소정의 % "서열 유사성" 또는 "서열 동일성"을 가지며, 이는, 정렬되는 경우에, 염기 또는 아미노산의 백분율이 동일하고, 2개의 서열을 비교할 경우에, 동일한 상대 위치에 있다는 것을 의미한다. 서열 유사성(간혹 % 유사성, % 동일성, 또는 상동성으로 지칭됨)은 다수의 상이한 방식으로 결정될 수 있다. 서열 유사성을 결정하기 위해, 월드 와이드 웹 상에서 ncbi.nlm.nih.gov/BLAST에서 입수가능한 BLAST를 포함하는, 당업계에 알려진 방법 및 컴퓨터 프로그램을 사용하여 서열을 정렬할 수 있다. 핵산 내의 핵산 서열의 특정 스트레치 사이의 % 상보성은 임의의 편리한 방법을 사용하여 결정될 수 있다. 예시적인 방법은 BLAST 프로그램(기본 국소 정렬 검색 툴) 및 PowerBLAST 프로그램(문헌[Altschul et al., J. Mol. Biol., 1990, 215, 403-410]; 문헌[Zhang and Madden, Genome Res., 1997, 7, 649-656])을 포함하거나 문헌[Smith and Waterman, Adv. Appl. Math., 1981, 2, 482-489]의 알고리즘을 사용하는, 예를 들어, 디폴트 설정을 사용하는 Gap 프로그램(문헌[Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.])의 사용에 의한다.
용어 "폴리펩티드" 및 "단백질"은 본 명세서에서 상호교환적으로 사용되며, 코딩된 아미노산 및 비-코딩된 아미노산, 화학적으로 또는 생화학적으로 변형되거나 유도체화된 아미노산, 및 변형된 펩티드 골격을 갖는 폴리펩티드를 포함할 수 있는, 임의의 길이의 아미노산의 중합체 형태를 지칭한다. 이 용어는 이종성 아미노산 서열을 갖는 융합 단백질을 포함하지만 이로 제한되지 않는 융합 단백질을 포함한다.
"벡터" 또는 "발현 벡터"는, 부착된 세그먼트의 복제 또는 발현을 세포 내에서 유발하기 위해 다른 DNA 세그먼트, 즉, "삽입체"가 부착될 수 있는 플라스미드, 파지, 바이러스, 바이러스-유사 입자 또는 코스미드와 같은 레플리콘이다.
핵산, 폴리펩티드, 세포, 또는 유기체에 적용되어 본 명세서에 사용되는 바와 같이, 용어 "천연-발생" 또는 "변형되지 않은" 또는 "야생형"은 천연에서 발견되는 핵산, 폴리펩티드, 세포, 또는 유기체를 지칭한다.
본 명세서에 사용되는 바와 같이, "돌연변이"는 야생형 또는 참조 아미노산 서열 또는 야생형 또는 참조 뉴클레오티드 서열에 비교하여 하나 이상의 아미노산 또는 뉴클레오티드의 삽입, 결실, 치환, 복제, 또는 역위를 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "단리된"은 폴리뉴클레오티드, 폴리펩티드, 또는 세포가 천연 발생하는 것과는 상이한 환경에 있는 폴리뉴클레오티드, 폴리펩티드, 또는 세포를 기재하고자 하는 것이다. 단리된 유전자 변형된 숙주 세포는 유전자 변형된 숙주 세포의 혼합 집단 내에 존재할 수 있다.
본 명세서에 사용되는 바와 같이, "숙주 세포"는 진핵 세포, 원핵 세포, 또는 다세포 유기체로부터의 세포(예를 들어, 세포주에서)를 나타내며, 여기서 진핵 또는 원핵 세포는 핵산(예를 들어, 발현 벡터)에 대한 수용자로 사용되고, 핵산에 의해 유전자 변형된 원래의 세포의 자손을 포함한다. 단일 세포의 자손은 천연, 우발적, 또는 의도적 돌연변이로 인해 형태에 있어서 또는 게놈 또는 총 DNA 상보체에 있어서 원래의 모체와 반드시 완전히 동일하지는 않을 수 있음이 이해된다. "재조합 숙주 세포"("유전자 변형된 숙주 세포"로도 지칭됨)는 이종성 핵산, 예를 들어, 발현 벡터가 도입된 숙주 세포이다.
"표적 세포 마커"는 세포-표면 수용체, 사이토카인 수용체, 항원, 종양-관련 항원, 당단백질, 올리고뉴클레오티드, 효소 기질, 항원 결정기, 또는 항체 단편 또는 당단백질 향성 인자(glycoprotein tropism factor)에 대한 리간드로서의 역할을 할 수 있는 표적 조직 또는 세포 내에 또는 그의 표면 상에 존재할 수 있는 결합 부위를 포함하지만 이로 제한되지 않는 표적 세포에 의해 발현되는 분자를 지칭한다.
용어 "보존적 아미노산 치환"은 유사한 측쇄를 갖는 아미노산 잔기의 단백질에서의 상호교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 군은 글리신, 알라닌, 발린, 류신 및 아이소류신으로 이루어지고; 지방족-하이드록실 측쇄를 갖는 아미노산의 군은 세린 및 트레오닌으로 이루어지고; 아미드-함유 측쇄를 갖는 아미노산의 군은 아스파라긴 및 글루타민으로 이루어지고; 방향족 측쇄를 갖는 아미노산의 군은 페닐알라닌, 티로신, 및 트립토판으로 이루어지고; 염기성 측쇄를 갖는 아미노산의 군은 리신, 아르기닌, 및 히스티딘으로 이루어지고; 황-함유 측쇄를 갖는 아미노산의 군은 시스테인 및 메티오닌으로 이루어진다. 예시적인 보존적 아미노산 치환 군은 발린-류신-아이소류신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린, 및 아스파라긴-글루타민이다.
본 명세서에 사용되는 바와 같이, 용어 "항체"는 이들이 원하는 항원-결합 활성 또는 면역학적 활성을 나타내는 한, 단일클론 항체, 다중클론 항체, 다중특이성 항체(예를 들어, 이중특이성 항체), 나노바디, 단일 도메인 항체, 예컨대 VHH 항체, 및 항체 단편을 포함하지만 이로 제한되지 않는 다양한 항체 구조를 포함한다. 항체는 IgD, IgG, IgA, IgM, 및 IgE와 같은 몇몇 유형의 분자를 포함하는 분자의 큰 패밀리를 나타낸다.
"항체 단편"은 온전한 항체의 일부를 포함하고 온전한 항체가 결합하는 항원에 결합하는 온전한 항체 이외의 분자를 지칭한다. 항체 단편의 예는 Fv, Fab, Fab', Fab'-SH, F(ab')2, 다이아바디, 단일 사슬 다이아바디, 선형 항체, 단일 도메인 항체, 단일 도메인 낙타과 항체, 단일-사슬 가변 단편(scFv) 항체 분자, 및 항체 단편으로부터 형성된 다중특이성 항체를 포함하지만 이로 제한되지 않는다.
본 명세서에 사용되는 바와 같이, "치료" 또는 "치료하는"은 본 명세서에서 상호교환적으로 사용되며, 치료적 이익 및/또는 예방적 이익을 포함하지만 이로 제한되지 않는 유익하거나 원하는 결과를 얻기 위한 접근법을 지칭한다. 치료적 이익은 치료되는 기저 장애 또는 질환의 근절 또는 개선을 의미한다. 치료적 이익은 또한, 대상체가 여전히 기저 장애를 앓고 있을 수 있음에도 불구하고, 대상체에서 개선이 관찰되도록 하나 이상의 증상의 근절 또는 개선 또는 기저 질환과 관련된 하나 이상의 임상 파라미터의 개선으로 달성될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "치료적 유효량" 및 "치료적 유효 용량"은, 인간 또는 실험 동물과 같은 대상체에게 하나 또는 반복 용량으로 투여될 경우에 질환 상태 또는 병태의 임의의 증상, 태양, 측정된 파라미터 또는 특징에 대해 임의의 검출가능하고 유익한 효과를 가질 수 있는, 단독 또는 조성물의 일부로서의 약물 또는 생물제제의 양을 지칭한다. 그러한 효과가 절대적으로 유익할 필요는 없다.
본 명세서에 사용되는 바와 같이, "투여하는"은 화합물(예를 들어, 본 개시내용의 조성물) 또는 조성물(예를 들어, 약제학적 조성물)의 투여량을 대상체에게 제공하는 방법을 의미한다.
"대상체"는 포유류이다. 포유류는 가축, 비-인간 영장류, 인간, 개, 토끼, 마우스, 래트, 및 다른 설치류를 포함하지만 이로 제한되지 않는다.
본 명세서에 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별 간행물, 특허, 또는 특허 출원이 구체적으로 그리고 개별적으로 참고로 포함되는 것으로 표시되는 것과 동일한 정도로 본 명세서에 참고로 포함된다.
I. 일반 방법
본 발명의 실시는, 달리 표시되지 않는 한, 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포생물학, 게놈 및 재조합 DNA의 관용적인 기술을 사용하며, 이들은 문헌[Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001)]; 문헌[Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999)]; 문헌[Protein Methods (Bollag et al., John Wiley & Sons 1996)]; 문헌[Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999)]; 문헌[Viral Vectors (Kaplift & Loewy eds., Academic Press 1995)]; 문헌[Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997)]; 및 문헌[Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)]과 같은 표준 교과서에서 확인할 수 있고, 이들의 개시내용은 본 명세서에 참고로 포함된다.
값의 범위가 제공되는 경우, 종점이 포함되고, 문맥상 명확하게 달리 지시하지 않는 한 하한의 단위의 1/10까지, 그 범위의 상한과 하한 사이의 각각의 개재된 값 및 그 언급된 범위 내의 임의의 다른 언급되거나 개재된 값이 포함된다는 것이 이해된다. 이들 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고, 임의의 특이적으로 배제된 한계를 조건으로, 또한 언급된 범위에 포함된다. 언급된 범위가 한계 중 하나 또는 둘 모두를 포함하는 경우, 이들 포함된 한계 중 어느 하나 또는 둘 모두를 배제하는 범위가 또한 포함된다.
달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 언급된 모든 간행물은 간행물이 관련되어 인용되는 방법 및/또는 재료를 개시하고 기재하기 위해 본 명세서에 참고로 포함된다.
본 명세서 및 첨부된 청구범위에 사용되는 바와 같이, 단수 형태("a", "an", 및 "the")는 문맥상 명확하게 달리 지시하지 않는 한 복수의 지시 대상을 포함한다는 점에 유의해야 한다.
명확함을 위해 별도의 실시 형태의 맥락에서 기재된 본 개시내용의 소정의 특징은, 또한 단일 실시 형태에서 조합으로 제공될 수 있음이 인정될 것이다. 다른 경우에, 간결함을 위해 단일 실시 형태의 맥락에서 기재된 본 개시내용의 다양한 특징은, 또한 별도로 또는 임의의 적합한 하위-조합으로 제공될 수 있다. 본 개시내용에 관한 실시 형태의 모든 조합은 본 개시내용에 의해 특이적으로 포함되고, 각각의 그리고 모든 조합이 개별적으로 그리고 명시적으로 개시된 것처럼 본 명세서에 개시되는 것으로 의도된다. 또한, 다양한 실시 형태 및 이들의 요소의 모든 하위-조합들은 또한 본 개시내용에 의해 특이적으로 포함되고, 각각의 그리고 모든 그러한 하위-조합이 본 명세서에 개별적으로 그리고 명시적으로 개시된 것처럼 본 명세서에 개시된다.
II. AAV 벡터
제1 태양에서, 본 개시내용은 유전자 편집을 위해 표적 세포 및/또는 조직에 대한 CRISPR 뉴클레아제의 발현 및 전달을 위해 최적화된 AAV 벡터에 관한 것이다.
야생형 AAV는 파르보바이러스 패밀리에 속하는 작은 단일-가닥 DNA 바이러스이다. 야생형 AAV 게놈은 각각 4개의 복제 단백질 및 3개의 캡시드 단백질을 인코딩하며, 복제를 위해 중요한 헤어핀 형상으로 폴딩되는 130 내지 145개의 뉴클레오티드를 갖는 역위 말단 반복(ITR)에 의해 양쪽에서 플랭킹되는 2개의 유전자로 구성된다. 비리온은 동일한 개방 해독 프레임으로부터, 그러나 차별적 스플라이싱(Vp1) 및 대안적인 번역 시작 부위로부터(각각 Vp2 및 Vp3) 1:1:10 비로 생성되는 3개의 캡시드 단백질, Vp1, Vp2, 및 Vp3으로 구성된다. cap 유전자는 조립-활성화 단백질(AAP)로 불리는 부가적인 비-구조 단백질을 생성한다. 이 단백질은 ORF2로부터 생성되며 캡시드-조립 과정에 필수적이다. 캡시드는 대략 60개의 개별 캡시드 단백질 서브유닛의 초분자 조립체를 AAV 게놈을 보호할 수 있는 외피가 없는 T-1 정이십면체 격자로 형성한다.
천연적으로 복제-결손이고 인체에서 거의 모든 세포 유형에 형질도입할 수 있음으로써, AAV는 유전자 요법 또는 백신 전달에서의 치료적 용도에 적합한 벡터를 대표한다. 전형적으로, 재조합 AAV 벡터를 생성하는 경우, 2개의 ITR 사이의 서열이 하나 이상의 관심 서열(예를 들어, 이식유전자)로 대체되고, Rep 및 Cap 서열이 트랜스로 제공되어, ITR이 벡터 내에 잔류하는 유일한 바이러스 DNA가 되게 한다. 생성되는 재조합 AAV 벡터 게놈 작제물은 관심 이식유전자 서열을 인코딩하는 발현 카세트를 플랭킹하는 2개의 시스-작용 130 내지 145-뉴클레오티드 ITR을 포함하며, 이는 이식유전자, 하나 이상의 프로모터, 및 액세서리 요소를 포함할 수 있는 외래 DNA의 패키징을 위해 4.7 kb 이상을 제공하여, 벡터의 총 크기가 5 내지 5.2 kb 미만이 되도록 하며, 이는 AAV 캡시드 내의 패키징과 상용성이다(작제물의 크기가 이 역치를 초과함에 따라, 벡터의 패키징 효율이 감소함이 이해됨). 이식유전자를 사용하여 대상체의 세포에서 유전자 결핍을 교정하거나 개선할 수 있다. 그러나 CRISPR-매개 유전자 편집의 맥락에서, 뉴클레아제의 큰 크기를 고려할 때, 발현 카세트의 크기 제한은 대부분의 CRISPR 시스템의 경우에 난제이다.
본 개시내용은 AAV 이식유전자 플라스미드의 생성뿐만 아니라 AAV 바이러스 벡터의 생성을 위한 폴리뉴클레오티드를 제공한다. 일부 실시 형태에서, 폴리뉴클레오티드는 제1 아데노-관련 바이러스(AAV) 5' 역위 말단 반복(ITR) 서열, 제2 AAV 3' ITR 서열, CRISPR 뉴클레아제, 제1 가이드 RNA(gRNA), 하나 이상의 프로모터 및, 임의로, 액세서리 요소를 인코딩하는 서열을 포함하며; 이들은 모두 단일 AAV 바이러스 입자 내로 혼입될 수 있는 단일 폴리뉴클레오티드에 의해 인코딩되는 단일 발현 카세트 내에 포함된다. 다른 실시 형태에서, 폴리뉴클레오티드는 제1 5' AAV ITR 서열, 제2 3' AAV ITR 서열, CRISPR 뉴클레아제, 제1 gRNA, 제1 프로모터, 제2 프로모터, 및, 임의로, 하나 이상의 액세서리 요소를 인코딩하는 서열을 포함한다.
프로모터 및 액세서리 요소는 이식유전자, 예를 들어 CRISPR 단백질 및/또는 gRNA에, 실시 형태의 AAV 벡터로 형질감염된 세포에서 그의 전사, 번역, 및/또는 발현을 허용하는 방식으로 작동가능하게 연결될 수 있다. 본 명세서에 사용되는 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 근접한 액세서리 요소 서열 및 관심 유전자를 제어하기 위해 원방에 있는 액세서리 요소 서열 둘 모두를 포함한다. 일부 실시 형태에서, CRISPR 단백질 및 제1 gRNA는 제1 프로모터에 작동가능하게 연결되고 그의 제어 하에 있다. 다른 실시 형태에서, CRISPR 단백질은 제1 프로모터에 작동가능하게 연결되고 그의 제어 하에 있고, 제1 gRNA는 제2 프로모터에 작동가능하게 연결되고 그의 제어 하에 있다.
일부 실시 형태에서, 본 개시내용은 전사 개시, 종결을 제어하는 서열, 프로모터, 인핸서 요소, RNA 가공 신호 서열, 인핸서 요소, 세포질 mRNA를 안정화하는 서열, 번역 효율을 향상시키는 서열(즉, 코작 공통 서열(Kozak consensus sequence)), 인트론, 전사-후 조절 요소(PTRE), 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, 제2 가이드 RNA, CRISPR-매개 상동성-지정 복구의 자극제, 및 전사의 활성화제 또는 저해제를 포함하지만 이로 제한되지 않는 AAV 벡터 내에 포함되기 위한 액세서리 요소를 제공한다.
"아데노-관련 바이러스 역위 말단 반복" 또는 "AAV ITR"은 AAV 게놈의 각각의 단부에서 발견되는 당업계에 인식된 영역을 의미하며, 이는 DNA 복제의 원점으로서, 그리고 바이러스에 대한 패키징 신호로서 시스로 함께 기능한다. AAV ITR은 AAV rep 코딩 영역과 함께, 2개의 플랭킹 ITR 사이에 개재된 뉴클레오티드 서열의 효율적인 절제 및 그로부터의 구조, 및 포유류 세포 게놈 내로의 그의 통합을 제공한다.
AAV ITR 영역의 뉴클레오티드 서열은 알려져 있다. 예를 들어 문헌[Kotin, R. M. (1994) Human Gene Therapy 5:793-801]; 문헌[Berns, K. I. "Parvoviridae and their Replication" in Fundamental Virology, 2nd Edition, (B. N. Fields and D. M. Knipe, eds.)]을 참조한다. 본 명세서에 사용되는 바와 같이, AAV ITR은 도시된 야생형 뉴클레오티드 서열을 가질 필요는 없고, 예를 들어, 뉴클레오티드의 삽입, 결실, 또는 치환에 의해 변경될 수 있다. 부가적으로, AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 및 AAVRh10, 및 이들 혈청형의 변형된 캡시드를 제한 없이 포함하는 몇몇 AAV 혈청형 중 임의의 것으로부터 유래될 수 있다. 추가로, AAV 벡터 내의 선택된 뉴클레오티드 서열을 플랭킹하는 5′ 및 3′ ITR은, 이들이 의도된 바와 같이 기능하는 한, 즉, 숙주 세포 게놈 또는 벡터로부터 관심 서열의 절제 및 구조를 가능하게 하도록, 그리고 AAV Rep 유전자 생성물이 세포 내에 존재하는 경우에 수용자 세포 게놈 내로 이종성 서열의 통합을 가능하게 하도록 기능하는 한, 반드시 동일하거나 동일한 AAV 혈청형으로부터 유래되거나 단리될 필요는 없다. 숙주 세포 내로의 이종성 서열의 통합을 위한 AAV 혈청형의 사용은 당업계에 알려져 있다(예를 들어, 본 명세서에 참고로 포함된 WO2018195555A1호 및 US20180258424A1호 참조). 일 특정 실시 형태에서, ITR은 혈청형 AAV1로부터 유래된다. 다른 특정 실시 형태에서, ITR은 혈청형 AAV2로부터 유래되며, 서열 CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT(서열 번호 40557)를 갖는 5' ITR 및 서열 AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG(서열 번호 40576)를 갖는 3' ITR을 포함한다.
"AAV rep 코딩 영역"은 복제 단백질 Rep 78, Rep 68, Rep 52, 및 Rep 40을 인코딩하는 AAV 게놈의 영역을 의미한다. 이들 Rep 발현 생성물은 AAV DNA 복제의 원점의 인식, 결합, 및 닉킹, DNA 헬리카제 활성, 및 AAV(또는 다른 이종성) 프로모터로부터의 전사의 조절을 포함하는 다수의 기능을 보유하는 것으로 나타났다. Rep 발현 생성물은 AAV 게놈을 복제하기 위해 전체로서 필요하다.
"AAV cap 코딩 영역"은 캡시드 단백질 VP1, VP2, 및 VP3, 또는 이들의 기능적 상동체를 인코딩하는 AAV 게놈의 영역을 의미한다. 이들 Cap 발현 생성물은 바이러스 게놈을 패키징하기 위해 전체로서 필요한 패키징 기능을 공급한다.
일부 실시 형태에서, AAV 벡터는 혈청형 9 또는 혈청형 6의 것이며, 이는 근위축성 측색 경화증(ALS)의 전임상 모델에서 척수 전체에 걸쳐 운동 뉴런 및 신경교에 폴리뉴클레오티드를 효과적으로 전달하는 것으로 입증되었다(문헌[Foust, KD. et al. Therapeutic AAV9-mediated suppression of mutant RHO slows disease progression and extends survival in models of inherited ALS. Mol Ther. 21(12):2148 (2013)]). 일부 실시 형태에서, 본 방법은 뇌실질내 뇌 주사를 통한 뉴런의 표적화를 위한 AAV9 또는 AAV6의 용도를 제공한다. 일부 실시 형태에서, 본 방법은 벡터의 정맥내 투여를 위한 AAV9의 용도를 제공하며, 여기서 AAV9는 벡터의 뉴런 및 신경교 향성(glial tropism) 둘 모두를 통해 신경 시스템에서 유전자 발현을 구동하고 혈액-뇌 장벽을 침투하는 능력을 갖는다. 다른 실시 형태에서, AAV 벡터는 혈청형 8의 것이며, 이는 망막 세포에 폴리뉴클레오티드를 효과적으로 전달하는 것으로 입증되었다.
일부 실시 형태에서, 하나 이상의 액세서리 요소는 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소(PTRE), 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, 제3 프로모터, 제2 가이드 RNA(표적 핵산의 상이하거나 중첩되는 세그먼트를 표적화함), CRISPR-매개 상동성-지정 복구의 자극제, 및 전사의 활성화제 또는 저해제로 이루어진 군으로부터 선택된다. 일부 경우에, PTRE는 사이토메갈로바이러스 즉시/초기 인트론A, B형 간염 바이러스 PRE(HPRE), 우드척 간염 바이러스 PRE(WPRE), 및 인간 열 충격 단백질 70 mRNA(Hsp70)의 5' 비번역 영역(UTR)으로 이루어진 군으로부터 선택된다.
전술한 것들에서, 하나 이상의 액세서리 요소는 CRISPR 단백질에 작동가능하게 연결된다. AAV 작제물의 폴리뉴클레오티드 내의 액세서리 요소(들)의 포함은 AAV 작제물 내의 상기 액세서리 요소의 부재 하의 CRISPR 단백질에 비교하여 CRISPR 단백질의 발현, 결합, 활성, 또는 성능을 향상시킬 수 있다는 것이 발견되었다. 일 실시 형태에서, 하나 이상의 액세서리 요소의 포함은 AAV 작제물 내의 상기 액세서리 요소의 부재 하의 CRISPR 단백질에 비교하여 시험관내 검정에서 CRISPR 단백질에 의한 표적 핵산의 편집의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 1500% 이상, 약 200% 이상, 또는 약 300% 이상의 증가를 유발한다.
본 개시내용의 AAV 벡터의 특징에서, 더 작은 크기의 소정의 부류 2 CRISPR 시스템의 이용은 AAV 벡터의 제조에 사용되는 폴리뉴클레오티드 내에 부가적인 서열 공간의 포함을 허용하며, 이는 본 명세서에 기재된 바와 같이 이식유전자의 나머지 구성성분을 위해 이용될 수 있다는 것이 발견되었다. 일부 실시 형태에서, 부류 2 CRISPR 시스템은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j, 및 CasX로 이루어진 군으로부터 선택된 유형 V 단백질, 및 각각의 시스템의 관련된 가이드 RNA를 포함한다. 특정 실시 형태에서, CRISPR 단백질은 CasX이며, 여기서 CasX는 표 3에 열거된 바와 같은 서열 번호 1 내지 3 및 서열 번호 49 내지 160, 40208 내지 40369 및 40828 내지 40912, 또는 이들에 대해 약 85% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함한다. 특정 실시 형태에서, CRISPR 단백질은 CasX이며, 여기서 CasX는 표 3에 열거된 바와 같은 서열 번호 1 내지 3 및 서열 번호 49 내지 160 및 40208 내지 40369 및 40828 내지 40912의 서열로 이루어진 군으로부터 선택된 서열을 포함한다. 일부 실시 형태에서, gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 스캐폴드 서열을 포함한다. 특정 실시 형태에서, gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817의 서열의 군으로부터 선택된 서열을 포함한다. 전술한 실시 형태에서, gRNA는 변형될 표적 핵산에 상보적인 표적화 서열을 추가로 포함하며, 여기서 표적화 서열은 15 내지 20개 이상의 뉴클레오티드를 갖는다. 본 개시내용의 AAV 벡터 내로의 혼입에 대해 고려되는 CasX 단백질 및 gRNA 구성성분 실시 형태는 하기 더욱 완전하게 기재된다.
상기 기재된 바와 같이, AAV 작제물 내의 포함에 대해 고려되는 더 작은 크기의 부류 2, 유형 V 단백질 및 gRNA는 단일 AAV 입자 내로 패키징될 수 있는 부가적이거나 더 큰 구성성분의 포함을 허용한다. 일부 실시 형태에서, CRISPR 단백질 서열 및 gRNA 서열을 인코딩하는 폴리뉴클레오티드는 길이가 약 3100, 약 3090, 약 3080, 약 3070, 약 3060, 약 3050개 미만, 또는 약 3040개 미만의 뉴클레오티드이다. 다른 실시 형태에서, CRISPR 단백질 서열 및 gRNA 서열을 인코딩하는 폴리뉴클레오티드는 조합된 길이로 약 3040 내지 약 3100개 미만의 뉴클레오티드이다. 따라서, AAV 입자 내로 패키징될 수 있는 발현 카세트의 총 길이를 고려하여, 일부 실시 형태에서, 제1 프로모터 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드를 초과한다. 다른 실시 형태에서, 제1 프로모터 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상 내지 약 1900개 이상의 뉴클레오티드를 초과한다. 일 실시 형태에서, 제1 프로모터 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는다. 다른 실시 형태에서, 제1 프로모터 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드를 초과한다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상 내지 약 1900개 이상의 뉴클레오티드를 초과한다. 일 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는다. 또 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드를 초과한다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 약 1300개 이상 내지 약 1900개 이상의 뉴클레오티드를 초과한다. 일 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는다. 다른 실시 형태에서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 폴리뉴클레오티드 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는다.
일부 실시 형태에서, 본 개시내용은 제1 아데노-관련 바이러스(AAV) 역위 말단 반복(ITR) 서열, 제2 AAV ITR 서열, 제1 프로모터 서열, CRISPR 단백질을 인코딩하는 서열, 제2 프로모터 서열, 적어도 제1 가이드 RNA(gRNA)를 인코딩하는 서열, 및 하나 이상의 액세서리 요소 서열을 포함하는 폴리뉴클레오티드를 제공하며, 여기서 조합된 길이로 폴리뉴클레오티드 서열의 뉴클레오티드의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 또는 35% 이상은 제1 및 제2 프로모터 및 하나 이상의 액세서리 요소 서열을 포함한다. 다른 실시 형태에서, 본 개시내용은 제1 아데노-관련 바이러스(AAV) 역위 말단 반복(ITR) 서열, 제2 AAV ITR 서열, 제1 프로모터 서열, CRISPR 단백질을 인코딩하는 서열, 제2 프로모터 서열, 제1 가이드 RNA(gRNA)를 인코딩하는 서열, 제3 프로모터 서열, 제2 gRNA를 인코딩하는 서열, 및 하나 이상의 액세서리 요소 서열을 포함하는 폴리뉴클레오티드를 제공하며, 여기서 조합된 길이로 폴리뉴클레오티드 서열의 뉴클레오티드의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 또는 35% 이상은 제1, 제2, 및 제3 프로모터 및 하나 이상의 액세서리 요소 서열을 포함한다. 실시예에 상술된 바와 같이, 시험관내 검정 또는 대상체에서의 생체내에서; AAV 이식유전자의 발현 카세트의 총 폴리뉴클레오티드의 더 많은 양을 프로모터, 제2 gRNA, 및/또는 액세서리 요소에 할애하는 능력은 표적 숙주 세포에서 발현될 경우에 CRISPR 단백질 및 gRNA의 향상된 발현 및/또는 성능을 유발한다는 것이 발견되었다, 일부 실시 형태에서, AAV 폴리뉴클레오티드 및 생성되는 AAV 벡터에서의 대안적이거나 더 긴 프로모터 및/또는 액세서리 요소(예를 들어, 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소(PTRE), 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, CRISPR-매개 상동성-지정 복구의 자극제, 및 전사의 활성화제 또는 저해제)의 사용은, AAV를 시험관내 검정에서 평가할 경우에 대안적이거나 더 긴 프로모터 및/또는 액세서리 요소를 갖지 않는 작제물에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 1500% 이상, 약 200% 이상, 또는 약 300% 이상의 표적 핵산의 편집의 증가를 유발한다. 일 실시 형태에서, 폴리뉴클레오티드의 제1 프로모터 서열은 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상, 또는 약 800개 이상의 뉴클레오티드를 갖는다. 다른 실시 형태에서, 폴리뉴클레오티드의 제2 프로모터 서열은 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상, 또는 약 800개 이상의 뉴클레오티드를 갖는다. 프로모터의 실시 형태는 하기 더욱 완전하게 기재된다.
일부 실시 형태에서, 본 개시내용은 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22 및 표 24 내지 표 27에 기술된 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열의 군으로부터 선택된 하나 이상의 서열을 포함하는 폴리뉴클레오티드를 제공한다. 다른 실시 형태에서, 본 개시내용은 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 23 및 표 24 내지 표 27에 기술된 서열의 군으로부터 선택된 서열을 포함하는 폴리뉴클레오티드를 제공한다. 일부 실시 형태에서, 폴리뉴클레오티드 서열은 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 22 및 표 24 내지 표 26에 기술된 것들과는 폴리뉴클레오티드에 의해 인코딩되는 gRNA 또는 gRNA의 표적화 서열의 선택에 있어서만 상이하며, 여기서 표적화 서열은 표적 핵산의 서열과 혼성화될 수 있는 15 내지 30개의 뉴클레오티드를 갖는 서열이다. 전술한 것들의 특정 실시 형태에서, 표적화 서열은 표 27에 기술된 서열의 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 본 명세서에 기재된 실시 형태 중 임의의 것의 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 도 24, 도 33 내지 도 35, 또는 도 42의 작제물의 구성을 갖는다.
일부 실시 형태에서, 본 개시내용은 AAV 벡터의 제조에 사용하기 위한 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 22 및 표 24 내지 표 27에 기술된 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열의 군으로부터 선택된 하나 이상의 서열을 포함한다. 다른 실시 형태에서, 본 개시내용은 AAV 벡터의 제조에 사용하기 위한 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22 및 표 24 내지 표 27에 기술된 서열의 군으로부터 선택된 서열을 포함한다. 일부 실시 형태에서, 폴리뉴클레오티드 서열은 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22 및 표 24 내지 표 26에 기술된 것들과는 폴리뉴클레오티드에 의해 인코딩되는 gRNA 또는 gRNA의 표적화 서열의 선택에 있어서만 상이하며, 여기서 표적화 서열은 변형될 표적 핵산의 서열과 혼성화될 수 있고 15 내지 30개의 뉴클레오티드를 갖는 서열이다. 전술한 것들의 특정 실시 형태에서, 표적화 서열은 표 27에 기술된 서열의 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 AAV 벡터의 제조에 사용하기 위한 본 명세서에 기재된 실시 형태 중 임의의 것의 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 도 24, 도 33 내지 도 35, 또는 도 42의 작제물의 구성을 갖는다.
III. AAV 시스템의 가이드 핵산
일부 실시 형태에서, 본 개시내용은 세포 내의 표적 핵산의 게놈 편집에 유용한 AAV 시스템에 이용되는 특이적으로-설계된 가이드 리보핵산(gRNA)에 관한 것이다. 본 개시내용은 유전자 편집 AAV 시스템의 구성성분으로서 표적 핵산에 상보적인(그리고 따라서 이와 혼성화될 수 있음) 표적화 서열을 갖는 특이적으로-설계된 gRNA를 제공한다. 일부 실시 형태에서, 다중 gRNA(예를 들어, 다중 gRNA)는 표적 핵산의 변형을 위해 AAV 시스템 내에서 전달된다는 것이 예상된다. 예를 들어, 유전자 내의 2개의 상이하거나 중첩되는 부위에서 결합하고 절단하기 위해, 각각이 CRISPR 뉴클레아제와 복합체화될 경우, 표적 핵산 서열의 상이하거나 중첩되는 영역에 대한 표적화 서열을 갖는 gRNA의 쌍이 사용될 수 있으며, 이어서 이는 비-상동성 단부 결합(NHEJ), 상동성-지정 복구(HDR), 상동성-독립적 표적화 통합(HITI), 미세-상동성 매개 단부 결합(MMEJ), 단일 가닥 어닐링(SSA), 또는 염기 절제 복구(BER)에 의해 편집된다.
일부 실시 형태에서, 본 개시내용은 진핵 세포에서 유전자의 게놈 편집에 유용한 시스템에 이용되는 gRNA를 제공한다. 특정 실시 형태에서, 시스템의 gRNA는 CRISPR 뉴클레아제와의 복합체; 리보핵단백질(RNP) 복합체를 형성할 수 있으며, 하기 더욱 완전하게 기재된다.
a. 참조 gRNA 및 gRNA 변이체
일부 실시 형태에서, 본 개시내용의 gRNA는 천연-발생 가이드 RNA("참조 gRNA")의 서열을 포함한다. 일부 실시 형태에서, 참조 gRNA에 비교하여 향상되거나 변동된 특성을 갖는 하나 이상의 변이체(본 명세서에서 "gRNA 변이체"로 지칭됨)를 생성하기 위해, 본 개시내용의 참조 gRNA에는 하나 이상의 돌연변이유발 방법, 예컨대 본 명세서에 기재된 돌연변이유발 방법을 적용할 수 있으며, 이는 심층 돌연변이 진화(DME: Deep Mutational Evolution), 심층 돌연변이 스캐닝(DMS: deep mutational scanning), 오류 빈발 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 스태거드 연장 PCR(staggered extension PCR), 유전자 셔플링, 또는 도메인 스와핑(본 명세서에 참고로 포함된 WO2020247883A2호뿐만 아니라, 본 명세서에 기재된 바와 같음)을 포함할 수 있다. gRNA 변이체는 또한, 예를 들어 5' 또는 3' 단부에 융합되거나 내부적으로 삽입된 하나 이상의 외인성 서열을 포함하는 변이체를 포함한다. 참조 gRNA 또는 그것이 유래된 변이체의 활성을 벤치마크로 사용하여, 이에 대해 gRNA 변이체의 활성을 비교함으로써, gRNA 변이체의 기능 또는 다른 특징의 개선을 측정할 수 있다. 다른 실시 형태에서, gRNA 변이체; 예를 들어 합리적으로 설계된 변이체를 생성하기 위해, 참조 gRNA 또는 gRNA 변이체에 하나 이상의 의도적인 특이적으로-표적화된 돌연변이를 적용할 수 있다.
일부 실시 형태에서, 가이드는 리보핵산 분자("gRNA")이고, 다른 실시 형태에서, 가이드는 키메라이고, DNA 및 RNA 둘 모두를 포함한다.
본 개시내용의 gRNA는 2개의 세그먼트; 표적화 서열 및 단백질-결합 세그먼트를 포함한다. gRNA의 표적화 세그먼트는 표적 핵산(예를 들어, 표적 ssRNA, 표적 ssDNA, 이중 가닥 표적 DNA의 상보적인 가닥 등) 내의 특이적 서열(표적 부위)에 상보적이고, 따라서 이와 혼성화될 수 있는 뉴클레오티드 서열(가이드 서열, 스페이서, 표적화 서열, 또는 표적화 영역으로 상호교환적으로 지칭됨)을 포함하며, 하기 더욱 완전하게 기재된다. gRNA의 표적화 서열은 코딩 서열, 코딩 서열의 상보체, 비-코딩 서열을 포함하는 표적 핵산 서열에, 그리고 액세서리 요소에 결합할 수 있다. 단백질-결합 세그먼트(또는 "단백질-결합 서열")는 복합체로서 CasX 단백질과 상호작용하여(예를 들어, 이에 결합함), RNP를 형성한다(하기 더욱 완전하게 기재됨). 단백질-결합 세그먼트는 본 명세서에서 대안적으로 몇몇 영역으로 구성된 "스캐폴드"로 지칭되며, 하기 더욱 완전하게 기재된다.
이중 가이드 RNA(dgRNA)의 경우에, 표적화제(targeter) 및 활성화제 부분은 각각 이중체-형성 세그먼트를 가지며, 여기서 표적화제의 이중체 형성 세그먼트 및 활성화제의 이중체-형성 세그먼트는 서로 상보성을 갖고 서로에 혼성화되어 이중 가닥 이중체(gRNA의 경우에 dsRNA 이중체)를 형성한다. gRNA가 gRNA인 경우, 용어 "표적화제" 또는 "표적화제 RNA"는 본 명세서에서 CasX 이중 가이드 RNA의(그리고 따라서 "활성화제" 및 "표적화제"가, 예를 들어, 개재된 뉴클레오티드에 의해 함께 연결되는 경우에 CasX 단일 가이드 RNA의) crRNA-유사 분자(crRNA: "CRISPR RNA")를 지칭하기 위해 사용된다. crRNA는 tracrRNA와 어닐링되는 5' 영역에 이어서 표적화 서열의 뉴클레오티드를 갖는다. 따라서, 예를 들어, 가이드 RNA(dgRNA 또는 sgRNA)는 가이드 서열 및 crRNA의 이중체-형성 세그먼트를 포함하며, 이는 또한 crRNA 반복으로 지칭될 수 있다. 상응하는 tracrRNA-유사 분자(활성화제)는 가이드 RNA의 단백질-결합 세그먼트의 dsRNA 이중체의 다른 절반을 형성하는 뉴클레오티드의 이중체-형성 스트레치를 또한 포함한다. 따라서, 상응하는 쌍으로서, 표적화제 및 활성화제는 혼성화되어 본 명세서에서 "이중-분자 gRNA", "dgRNA", "이중-분자 가이드 RNA", 또는 "2-분자 가이드 RNA"로 지칭되는 이중 가이드 RNA를 형성한다. CasX 단백질에 의한 표적 핵산 서열(예를 들어, 게놈 DNA)의 부위-특이적 결합 및/또는 절단은 gRNA의 표적화 서열과 표적 핵산 서열 사이의 염기-대합 상보성에 의해 결정되는 하나 이상의 위치(예를 들어, 표적 핵산의 서열)에서 발생할 수 있다. 따라서, 예를 들어, 본 개시내용의 gRNA는 TC PAM 모티프 또는 PAM 서열, 예컨대 ATC, CTC, GTC, 또는 TTC에 상보적인 서열에 인접한 표적 핵산에 대한 서열 상보성을 가지며, 따라서 이와 혼성화될 수 있다. 가이드 서열의 표적화 서열은 표적 핵산 서열의 서열과 혼성화되기 때문에, PAM 서열의 위치가 고려되는 한, 표적화제는 특이적 표적 핵산 서열과 혼성화되도록 사용자에 의해 변형될 수 있다. 따라서, 일부 경우에, 표적화제의 서열은 비-천연 발생 서열에 대한 상보체일 수 있다. 다른 경우에, 표적화제의 서열은 편집될 유전자 서열에 대한 상보체로부터 유래된 천연-발생 서열일 수 있다. 다른 실시 형태에서, gRNA의 활성화제 및 표적화제는 (서로 혼성화되기 보다는) 서로 공유적으로 연결되며, 본 명세서에서 "단일-분자 gRNA", "단일 가이드 RNA", "단일-분자 가이드 RNA", "1-분자 가이드 RNA", 또는 "sgRNA"로 지칭되는 단일 분자를 포함한다. 일부 실시 형태에서, sgRNA는 "활성화제" 또는 "표적화제"를 포함하며, 따라서 각각 "활성화제-RNA" 및 "표적화제-RNA"일 수 있다. 일부 실시 형태에서, gRNA는 리보핵산 분자("gRNA")이고, 다른 실시 형태에서, gRNA는 키메라이고, DNA 및 RNA 둘 모두를 포함한다. 본 명세서에 사용되는 바와 같이, 용어 gRNA는 천연-발생 분자뿐만 아니라 서열 변이체(예를 들어 비-천연 발생 변형된 뉴클레오티드)를 커버한다.
전체로서, 본 개시내용의 조립된 gRNA는 4개의 별개의 영역 또는 도메인인 RNA 삼중체, 스캐폴드 스템, 연장된 스템, 및 표적화 서열을 포함하며, 이는 본 개시내용의 실시 형태에서 표적 핵산에 대해 특이적이고 gRNA의 3' 단부 상에 위치한다 RNA 삼중체, 스캐폴드 스템, 및 연장된 스템은 함께 gRNA의 "스캐폴드"(gRNA 스캐폴드)로 지칭된다. 본 개시내용의 gRNA 스캐폴드는 RNA, 또는 RNA 및 DNA를 포함할 수 있다.
b. RNA 삼중체
본 명세서에 제공된 가이드 NA(참조 sgRNA를 포함함)의 일부 실시 형태에는, RNA 삼중체가 있으며, RNA 삼중체는 2개의 개재된 스템 루프(스캐폴드 스템 루프 및 연장된 스템 루프) 뒤에 AAAG(서열 번호 40786)로 종료되는 UUU--nX(약 4 내지 15)--UUU(서열 번호 19) 스템 루프의 서열을 포함하고, 이는 삼중체를 지나 이중체 유사매듭 내로 또한 연장될 수 있는 유사매듭을 형성한다. 삼중체의 UU-UUU-AAA(서열 번호 40787) 서열이 표적화 서열, 스캐폴드 스템, 및 연장된 스템 사이에 넥서스(nexus)로서 형성된다. 예시적인 CasX sgRNA에는, UUU-루프-UUU 영역이 먼저 코딩된 후, 스캐폴드 스템 루프, 및 이어서 연장된 스템 루프가 코딩되며, 이는 테트라루프에 의해 연결되고, 이어서 AAAG(서열 번호 40786)가 삼중체를 폐쇄한 후에 표적화 서열이 된다.
c. 스캐폴드 스템 루프
본 개시내용의 CasX sgRNA의 일부 실시 형태에서, 삼중체 영역 뒤에는 스캐폴드 스템 루프가 이어진다. 스캐폴드 스템 루프는 CasX 단백질(예컨대 CasX 변이체 단백질)에 의해 결합되는 gRNA의 영역이다. 일부 실시 형태에서, 스캐폴드 스템 루프는 상당히 짧고 안정한 스템 루프이다. 일부 경우에, 스캐폴드 스템 루프는 많은 변화를 용인하지 않으며, 일부 형태의 RNA 버블을 필요로 한다. 일부 실시 형태에서, 스캐폴드 스템은 CasX sgRNA 기능에 필요하다. 그것은 결정적인 스템 루프이므로 아마도 Cas9의 넥서스 스템과 유사하지만, 일부 실시 형태에서, CasX sgRNA의 스캐폴드 스템은 필요한 벌지(RNA 버블)를 가지며, 이는 CRISPR/Cas 시스템에서 발견되는 다수의 다른 스템 루프와는 상이하다. 일부 실시 형태에서, 이 벌지의 존재는 상이한 CasX 단백질과 상호작용하는 sgRNA에 걸쳐 보존된다. gRNA의 스캐폴드 스템 루프 서열의 예시적인 서열은 서열 CCAGCGACUAUGUCGUAUGG(서열 번호 14)를 포함한다.
d. 연장된 스템 루프
본 개시내용의 CasX sgRNA의 일부 실시 형태에서, 스캐폴드 스템 루프 뒤에는 연장된 스템 루프가 이어진다. 일부 실시 형태에서, 연장된 스템은 합성 tracr 및 crRNA 융합체를 포함하며, 이는 대체로 CasX 단백질에 의해 결합되지 않는다. 일부 실시 형태에서, 연장된 스템 루프는 고도로 가단성(malleable)일 수 있다. 일부 실시 형태에서, 단일 가이드 gRNA는 연장된 스템 루프 내의 tracr과 crRNA 사이의 GAAA(서열 번호 40788) 테트라루프 링커 또는 GAGAAA(서열 번호 40789) 링커로 제조된다. 일부 경우에, CasX sgRNA의 표적화제 및 활성화제는 개재된 뉴클레오티드에 의해 서로 연결되며 링커는 길이가 3 내지 20개의 뉴클레오티드일 수 있다. 본 개시내용의 CasX sgRNA의 일부 실시 형태에서, 연장된 스템은 대형 32-bp 루프이며, 이는 리보핵단백질 복합체 내의 CasX 단백질의 외부에 있다. sgRNA의 연장된 스템 루프 서열의 예시적인 서열은 서열 GCGCUUAUUUAUCGGAGAGAAAUCCGAUAAAUAAGAAGC(서열 번호 15)를 포함한다.
e. 표적화 서열
본 개시내용의 gRNA의 일부 실시 형태에서, 연장된 스템 루프 뒤에는 삼중체의 부분을 형성하는 영역, 및 이어서 gRNA의 3' 단부에 표적화 서열(또는 "스페이서")이 이어진다. 표적화 서열은 CasX 리보핵단백질 홀로 복합체를 변형될 유전자의 표적 핵산 서열의 특이적 영역에 표적화한다. 따라서, 예를 들어, 본 개시내용의 gRNA 표적화 서열은, TC PAM 모티프 또는 PAM 서열 TTC, ATC, GTC, 또는 CTC 중 어느 하나가 표적 서열에 상보적인 비-표적 가닥 서열에 대해 1개 뉴클레오티드 5'에 위치하는 경우에 RNP의 구성성분으로서, 진핵 세포 내의 표적 핵산 내의 유전자의 일부(예를 들어, 진핵 염색체, 염색체 서열 등)에 상보성이고, 따라서 이에 혼성화될 수 있는 서열을 갖는다. PAM 서열 위치가 참작되는 한, gRNA의 표적화 서열은 gRNA가 임의의 원하는 표적 핵산 서열의 원하는 서열을 표적화할 수 있도록 변형될 수 있다. 일부 실시 형태에서, gRNA 스캐폴드는 표적화 서열의 5'에 있고, 표적화 서열은 gRNA의 3' 단부 상에 있다. 일부 실시 형태에서, RNP의 뉴클레아제에 의해 인식되는 PAM 모티프 서열은 TC이다. 다른 실시 형태에서, RNP의 뉴클레아제에 의해 인식되는 PAM 서열은 NTC; 즉, ATC, CTC, GTC, 또는 TTC이다.
일부 실시 형태에서, 본 개시내용은 gRNA의 표적화 서열이 변형될 유전자의 표적 핵산 서열에 상보적인 gRNA를 제공한다. 일부 실시 형태에서, 본 개시내용의 CasX:gRNA 시스템으로 돌연변이를 포함하는 서열을 편집하는 목적을 위해, gRNA의 표적화 서열은 야생형 유전자 서열에 비교하여 하나 이상의 돌연변이를 포함하는 유전자의 표적 핵산 서열에 상보적이다. 그러한 경우에, CasX:gRNA 시스템에 의해 이루어진 변형은 돌연변이를 교정 또는 보상할 수 있거나 돌연변이체 유전자 생성물의 발현을 녹 다운 또는 녹 아웃시킬 수 있다. 다른 실시 형태에서, 유전자를 녹-다운 또는 녹-아웃시키기 위해 본 개시내용의 CasX:gRNA 시스템으로 서열을 편집하여 돌연변이를 도입하는 목적을 위해, gRNA의 표적화 서열은 야생형 유전자의 표적 핵산 서열에 상보적이다. 일부 실시 형태에서, gRNA의 표적화 서열은 표적 핵산의 유전자의 엑손에 특이적이도록 설계된다. 다른 실시 형태에서, gRNA의 표적화 서열은 표적 핵산의 유전자의 인트론에 특이적이도록 설계된다. 다른 실시 형태에서, gRNA의 표적화 서열은 표적 핵산의 유전자의 인트론-엑손 접합부에 특이적이도록 설계된다. 다른 실시 형태에서, gRNA의 표적화 서열은 표적 핵산의 유전자의 조절 요소에 특이적이도록 설계된다. 일부 실시 형태에서, gRNA의 표적화 서열은 표적 핵산의 유전자 내의 하나 이상의 단일 뉴클레오티드 다형성(SNP)을 포함하는 서열에 상보적이도록 설계된다. 코딩 서열 또는 비-코딩 서열 내에 있는 SNP는 둘 모두 본 개시내용의 범주 내에 있다. 다른 실시 형태에서, gRNA의 표적화 서열은 표적 핵산의 유전자의 유전자간 영역의 서열에 상보적이도록 설계된다.
일부 실시 형태에서, 표적화 서열은 유전자 생성물의 발현을 조절하는 조절 요소에 특이적이다. 그러한 조절 요소는 프로모터 영역, 인핸서 영역, 유전자간 영역, 5' 비번역 영역(5' UTR), 3' 비번역 영역(3' UTR), 보존된 요소, 및 시스-조절 요소를 포함하는 영역을 포함하지만 이로 제한되지 않는다. 프로모터 영역은 인코딩 서열의 개시 지점의 5 kb 이내의 뉴클레오티드를 포함하도록 의도되거나, 유전자 인핸서 요소 또는 보존된 요소의 경우, 표적 핵산의 유전자의 인코딩 서열로부터 수천 bp, 수십만 bp, 또는 심지어 수백만 bp 떨어져 있을 수 있다. 전술한 것들에서, 표적은 유전자 생성물이 세포에서 발현되지 않거나 더 낮은 수준으로 발현되도록, 표적의 인코딩 유전자가 녹 아웃 또는 녹 다운되도록 의도된 것들이다.
일부 실시 형태에서, 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 내로 혼입된 gRNA의 표적화 서열은 14 내지 35개의 연속된 뉴클레오티드를 갖는다. 일부 실시 형태에서, gRNA의 표적화 서열은 10 내지 30개의 연속된 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속된 뉴클레오티드를 갖는다. 일부 실시 형태에서, gRNA의 표적화 서열은 20개의 연속된 뉴클레오티드로 이루어진다. 일부 실시 형태에서, 표적화 서열은 19개의 연속된 뉴클레오티드로 이루어진다. 일부 실시 형태에서, 표적화 서열은 18개의 연속된 뉴클레오티드로 이루어진다. 일부 실시 형태에서, 표적화 서열은 17개의 연속된 뉴클레오티드로 이루어진다. 일부 실시 형태에서, 표적화 서열은 16개의 연속된 뉴클레오티드로 이루어진다. 일부 실시 형태에서, 표적화 서열은 15개의 연속된 뉴클레오티드로 이루어진다. 일부 실시 형태에서, 표적화 서열은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속된 뉴클레오티드를 가지며, 표적화 서열은 표적 핵산 서열에 비교하여 0 내지 5, 0 내지 4, 0 내지 3, 또는 0 내지 2개의 불일치를 포함하고 표적화 서열을 포함하는 gRNA를 포함하는 RNP가 변형될 표적 핵산에 대해 상보적인 결합을 형성할 수 있도록 충분한 결합 특이성을 유지할 수 있다. 일부 실시 형태에서, 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 내로 혼입된 gRNA의 표적화 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776의 서열로 이루어진 군으로부터 선택된 서열, 또는 이에 대해 약 80% 이상, 또는 90% 이상, 또는 95% 이상을 갖는 서열을 포함한다. 일부 실시 형태에서, 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 내로 혼입된 gRNA의 표적화 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776의 서열로 이루어진 군으로부터 선택된 서열로 이루어진다.
일부 실시 형태에서, CasX:gRNA 시스템은 제1 gRNA를 포함하고 제2(및 임의로 제3, 제4, 제5, 또는 그 이상) gRNA를 추가로 포함하며, 여기서 표적 핵산 내의 다중 지점이 표적화되고, 예를 들어, CasX에 의해 표적 핵산 내에 다중 파단이 도입되도록, 제2 gRNA 또는 부가적인 gRNA는 제1 gRNA의 표적화 서열에 비교하여 표적 핵산 서열의 상이하거나 중첩되는 부분에 상보적인 표적화 서열을 갖는다. 그러한 경우에, 제2 또는 부가적인 gRNA는 CasX 단백질의 부가적인 카피와 복합체화된다는 것이 이해될 것이다. gRNA의 표적화 서열의 선택에 의해, 돌연변이를 일괄하는 표적 핵산 서열의 정의된 영역이 본 명세서에 기재된 CasX:gRNA 시스템을 사용하여 변형되거나 편집될 수 있으며,이는, 예를 들어, 돌연변이체 반복이 발생하는 경우 또는 돌연변이를 포함하는 엑손의 제거에도 불구하고 기능적 유전자 생성물의 발현이 유발되는 경우에 절단 부위들 사이의 DNA의 절제 또는 공여자 주형의 삽입을 용이하게 하는 단계를 포함한다.
f. gRNA 스캐폴드
표적화 서열 도메인을 제외한 gRNA의 나머지 구성성분은 본 명세서에서 스캐폴드로 지칭된다. 일부 실시 형태에서, gRNA 스캐폴드는 참조 gRNA로서 하기 기재된 천연 발생 서열로부터 유래된다. 다른 실시 형태에서, gRNA 스캐폴드는 gRNA 상에 바람직한 특성을 부여하기 위해 돌연변이, 삽입, 결실, 또는 도메인 치환이 도입된 참조 gRNA의 변이체이다.
일부 실시 형태에서, CasX 참조 gRNA는 델타프로테오박터(Deltaproteobacter)로부터 단리되거나 유래된 서열을 포함한다. 일부 실시 형태에서, 서열은 CasX tracrRNA 서열이다. 델타프로테오박터로부터 단리되거나 유래된 예시적인 CasX 참조 tracrRNA 서열은 ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(서열 번호 22) 및 ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(서열 번호 23)를 포함할 수 있다. 델타프로테오박터로부터 단리되거나 유래된 예시적인 crRNA 서열은 CCGAUAAGUAAAACGCAUCAAAG(서열 번호 24)의 서열을 포함할 수 있다. 일부 실시 형태에서, CasX 참조 gRNA는 델타프로테오박터로부터 단리되거나 유래된 서열과 동일한 서열을 포함한다.
일부 실시 형태에서, CasX 참조 가이드 RNA는 플랑크토마이세테스(Planctomycetes)로부터 단리되거나 유래된 서열을 포함한다. 일부 실시 형태에서, 서열은 CasX tracrRNA 서열이다. 플랑크토마이세테스로부터 단리되거나 유래된 예시적인 CasX 참조 tracrRNA 서열은 UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(서열 번호 25) 및
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(서열 번호 26)를 포함할 수 있다. 플랑크토마이세테스로부터 단리되거나 유래된 예시적인 crRNA 서열은
UCUCCGAUAAAUAAGAAGCAUCAAAG(서열 번호 27)의 서열을 포함할 수 있다. 일부 실시 형태에서, CasX 참조 gRNA는 플랑크토마이세테스로부터 단리되거나 유래된 서열과 동일한 서열을 포함한다.
일부 실시 형태에서, CasX 참조 gRNA는 칸디다투스 성박테리아(Candidatus Sungbacteria)로부터 단리되거나 유래된 서열을 포함한다. 일부 실시 형태에서, 서열은 CasX tracrRNA 서열이다. 칸디다투스 성박테리아로부터 단리되거나 유래된 예시적인 CasX 참조 tracrRNA 서열은 GUUUACACACUCCCUCUCAUAGGGU(서열 번호 28), GUUUACACACUCCCUCUCAUGAGGU(서열 번호 11), UUUUACAUACCCCCUCUCAUGGGAU(서열 번호 12), 및 GUUUACACACUCCCUCUCAUGGGGG(서열 번호 13)의 서열을 포함할 수 있다. 일부 실시 형태에서, CasX 참조 가이드 RNA는 칸디다투스 성박테리아로부터 단리되거나 유래된 서열과 동일한 서열을 포함한다.
표 1은 참조 gRNA tracr, cr, 및 스캐폴드 서열의 서열을 제공한다. 일부 실시 형태에서, 본 개시내용은 gRNA 변이체 서열을 제공하며, 여기서 gRNA는 표 1의 서열 번호 4 내지 16 중 어느 하나의 서열을 갖는 참조 gRNA 서열에 비교하여 하나 이상의 뉴클레오티드 변형을 갖는 서열을 포함하는 스캐폴드를 갖는다. 벡터가 gRNA에 대한 서열을 인코딩하는 DNA를 포함하거나, gRNA가 RNA 및 DNA의 키메라인 실시 형태에서, 본 명세서에 기재된 gRNA 서열 실시 형태 중 임의의 것의 우라실(U) 염기가 티민(T) 염기로 치환될 수 있다는 것이 이해될 것이다.
[표 1]
g. gRNA 변이체
다른 태양에서, 본 개시내용은 참조 gRNA 스캐폴드에 비교하여 하나 이상의 변형을 포함하거나 다른 gRNA 변이체로부터 유래된 gRNA 변이체에 관한 것이다. 본 명세서에 사용되는 바와 같이, "스캐폴드"는 스페이서 서열을 제외한 gRNA 기능에 필요한 gRNA에 대한 모든 부분을 지칭한다.
일부 실시 형태에서, gRNA 변이체는 본 개시내용의 참조 gRNA 서열에 비교하여 하나 이상의 뉴클레오티드 치환, 삽입, 결실, 또는 스와핑되거나 대체된 영역을 포함한다. 일부 실시 형태에서, 참조 gRNA 스캐폴드의 임의의 영역에 돌연변이가 발생하여 gRNA 변이체를 생성할 수 있다. 일부 실시 형태에서, gRNA 변이체 서열의 스캐폴드는 서열 번호 4 또는 서열 번호 5의 서열에 대해 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 또는 70% 이상, 80% 이상, 85% 이상, 약 90% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 동일성을 갖는다. 다른 실시 형태에서, gRNA 변이체는 본 개시내용의 gRNA 변이체 서열에 비교하여 하나 이상의 뉴클레오티드 치환, 삽입, 결실, 또는 스와핑되거나 대체된 영역을 포함한다. 일부 실시 형태에서, gRNA 변이체 서열의 스캐폴드는 서열 번호 2238 또는 서열 번호 2239의 서열에 대해 50% 이상, 60% 이상, 또는 70% 이상, 80% 이상, 85% 이상, 약 90% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 동일성을 갖는다.
일부 실시 형태에서, gRNA 변이체는 참조 gRNA 스캐폴드의 하나 이상의 영역 내에 하나 이상의 뉴클레오티드 변화를 포함하며, 이는 참조 gRNA의 특징을 개선한다. 예시적인 영역은 RNA 삼중체, 유사매듭, 스캐폴드 스템 루프, 및 연장된 스템 루프를 포함한다. 일부 경우에, 변이체 스캐폴드 스템은 버블을 추가로 포함한다. 다른 경우에, 변이체 스캐폴드는 삼중체 루프 영역을 추가로 포함한다. 또 다른 경우에, 변이체 스캐폴드는 5' 비구조화 영역을 추가로 포함한다. 일부 실시 형태에서, gRNA 변이체 스캐폴드는 서열 번호 14에 대해 60% 이상의 서열 동일성, 70% 이상의 서열 동일성, 80% 이상의 서열 동일성, 90% 이상의 서열 동일성, 95% 이상의 서열 동일성, 또는 99% 이상의 서열 동일성을 갖는 스캐폴드 스템 루프를 포함한다. 일부 실시 형태에서, gRNA 변이체 스캐폴드는 서열 번호 14에 대해 60% 이상의 서열 동일성을 갖는 스캐폴드 스템 루프를 포함한다. 다른 실시 형태에서, gRNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열 번호 32)의 서열을 갖는 스캐폴드 스템 루프를 포함한다. 다른 실시 형태에서 본 개시내용은, 서열 번호 5에 비교하여, C18G 치환, G55 삽입, U1 결실, 및 원래의 6 nt 루프 및 13개의 루프-최근위 염기쌍(most-loop-proximal base pair)(총 32개의 뉴클레오티드)이 Uvsx 헤어핀(4 nt 루프 및 5개의 루프-근위 염기쌍; 총 14개의 뉴클레오티드)에 의해 대체되고 연장된 스템의 루프-원위 염기가 A99의 결실 및 G65U의 치환에 의해 새로운 Uvsx 헤어핀과 근접한 완전히 염기-대합된 스템으로 전환된 변형된 연장된 스템 루프를 포함하는 gRNA 스캐폴드를 제공한다. 전술한 실시 형태에서, gRNA 스캐폴드 174는 서열 ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAGUGGGUAAAGCUCCCUCUUCGGAGGGAGCAUCAAAG(서열 번호 2238)를 포함한다.
본 명세서에 기재된 참조 gRNA에 변이체 gRNA를 비교할 경우에 하나 이상의 개선된 특징을 갖거나 하나 이상의 새로운 기능을 첨가하는 모든 gRNA 변이체는 본 개시내용의 범주 내에 있는 것으로 예상된다. 그러한 gRNA 변이체의 대표적인 예는, 그의 설계가 실시예에 기재되어 있는, 가이드 174(서열 번호 2238), 및 가이드 235(서열 번호 39987)이다. 일부 실시 형태에서, gRNA 변이체는 gRNA 변이체를 포함하는 RNP에 새로운 기능을 첨가한다. 일부 실시 형태에서, gRNA 변이체는 하기로부터 선택된 개선된 특징을 갖는다: 증가된 안정성; gRNA의 증가된 전사; 뉴클레아제 활성에 대한 증가된 저항성; gRNA의 증가된 폴딩 속도(folding rate); 폴딩 중의 감소된 부생성물 형성; 증가된 생산적 폴딩; CasX 단백질에 대한 증가된 결합 친화도; CasX 단백질과 복합체화되는 경우에 표적 핵산에 대한 증가된 결합 친화도; CasX 단백질과 복합체화되는 경우에 증가된 유전자 편집; CasX 단백질과 복합체화되는 경우에 표적 핵산의 편집의 증가된 특이성; CasX 단백질과 복합체화되는 경우에 감소된 표적-외 편집; 및 CasX 단백질과 복합체화되는 경우에 표적 핵산의 편집에서 ATC, CTC, GTC, 또는 TTC를 포함하는 하나 이상의 PAM 서열의 더 큰 스펙트럼을 이용하는 증가된 능력, 및 이들의 임의의 조합. 일부 경우에, gRNA 변이체의 개선된 특징 중 하나 이상은 서열 번호 4 또는 서열 번호 5의 참조 gRNA, 또는 gRNA 변이체 174 또는 175에 비교하여 약 1.1 내지 약 100,000-배 이상 증가된다. 다른 경우에, gRNA 변이체의 하나 이상의 개선된 특징은 서열 번호 4 또는 서열 번호 5의 참조 gRNA, 또는 gRNA 변이체 174 또는 175에 비교하여 약 1.1-배 이상, 약 10-배 이상, 약 100-배 이상, 약 1000-배 이상, 약 10,000-배 이상, 약 100,000-배 이상 증가된다. 다른 경우에, gRNA 변이체의 개선된 특징 중 하나 이상은 서열 번호 4 또는 서열 번호 5의 참조 gRNA, 또는 gRNA 변이체 174 또는 175에 비교하여 약 1.1 내지 100,00-배, 약 1.1 내지 10,00-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,00-배, 약 100 내지 10,00-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,00-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 증가된다. 다른 경우에, gRNA 변이체의 하나 이상의 개선된 특징은 서열 번호 4 또는 서열 번호 5의 참조 gRNA, 또는 gRNA 변이체 174 또는 175에 비교하여 약 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배, 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 증가된다.
일부 실시 형태에서, gRNA 변이체는 참조 gRNA 또는 gRNA 변이체에 하나 이상의 돌연변이유발 방법, 예컨대 본 명세서에 하기 기재된 돌연변이유발 방법을 적용함으로써 생성될 수 있으며, 이는 본 개시내용의 gRNA 변이체를 생성하기 위한 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 오류 빈발 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 스태거드 연장 PCR, 유전자 셔플링, 또는 도메인 스와핑을 포함할 수 있다. 참조 gRNA 또는 gRNA 변이체의 활성을 벤치마크로 사용하고, gRNA 변이체의 활성을 이에 대해 비교함으로써, gRNA 변이체의 기능의 개선을 측정할 수 있다. 다른 실시 형태에서, gRNA 변이체, 예를 들어 합리적으로 설계된 변이체를 생성하기 위해, 참조 gRNA 또는 gRNA 변이체에 하나 이상의 의도적인 표적화된 돌연변이, 치환, 또는 도메인 스왑을 적용할 수 있다. 그러한 방법에 의해 생성된 예시적인 gRNA 변이체는 실시예에 기재되어 있고 gRNA 스캐폴드의 대표적인 서열은 표 2에 제공된다.
일부 실시 형태에서, gRNA 변이체는 참조 가이드 핵산 스캐폴드 서열 또는 gRNA 변이체 스캐폴드 서열에 비교하여 하나 이상의 변형을 포함하며, 여기서 하나 이상의 변형은 gRNA의 영역 내의 하나 이상의 뉴클레오티드 치환, gRNA의 영역 내의 하나 이상의 뉴클레오티드 결실; gRNA의 영역 내의 하나 이상의 뉴클레오티드 삽입; gRNA의 영역의 전부 또는 일부의 치환; gRNA의 영역의 전부 또는 일부의 결실; 또는 전술한 것들의 임의의 조합으로부터 선택된다. 일부 경우에, 변형은 하나 이상의 영역에서의 gRNA 내의 1 내지 15개의 연속되거나 비-연속된 뉴클레오티드의 치환이다. 다른 경우에, 변형은 하나 이상의 영역에서의 gRNA 내의 1 내지 10개의 연속되거나 비-연속된 뉴클레오티드의 결실이다. 다른 경우에, 변형은 하나 이상의 영역에서의 gRNA 내의 1 내지 10개의 연속되거나 비-연속된 뉴클레오티드의 삽입이다. 다른 경우에, 변형은 근위 5' 및 3' 단부를 갖는 이종성 RNA 공급원으로부터의 RNA 스템 루프 서열을 이용한 스캐폴드 스템 루프 또는 연장된 스템 루프의 치환이다. 일부 경우에, 본 개시내용의 gRNA 변이체는 gRNA에 비교하여 1개의 영역에서의 2개 이상의 변형을 포함한다. 다른 경우에, 본 개시내용의 gRNA 변이체는 2개 이상의 영역에서의 변형을 포함한다. 다른 경우에, gRNA 변이체는 본 단락에 기재된 전술한 변형의 임의의 조합을 포함한다. 일부 실시 형태에서, 본 개시내용의 gRNA의 예시적인 변형은 표 2의 변형을 포함한다.
일부 실시 형태에서는, 시작 부위에 관하여 +1 뉴클레오티드가 G인 경우에 U6 프로모터로부터의 전사가 더 효율적이고 더 일관적이므로, 생체내 발현을 위해, 참조 gRNA에 비교하여 5' G를 gRNA 변이체 서열에 첨가한다. 다른 실시 형태에서는, T7 중합효소가 +1 위치에서의 G 및 +2 위치에서의 퓨린을 강력하게 선호하므로, 생성 효율을 증가시키기 위해 2개의 5' G를 첨가하여 시험관내 전사를 위한 gRNA 변이체 서열을 생성한다. 일부 경우에, 5' G 염기는 표 1의 참조 스캐폴드에 첨가된다. 다른 경우에, 5' G 염기는 표 2의 변이체 스캐폴드에 첨가된다.
표 2는 예시적인 gRNA 변이체 스캐폴드 서열을 제공한다. 일부 실시 형태에서, gRNA 변이체 스캐폴드는 표 2에 열거된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 또는 41817의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상의 서열 동일성을 갖는 서열 중 어느 하나를 포함한다. 일부 실시 형태에서, gRNA 변이체 스캐폴드는 서열 번호 2238 내지 2285, 39981 내지 40026, 40913 내지 40958, 또는 41817의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상의 서열 동일성을 갖는 서열 중 어느 하나를 포함한다. 일부 실시 형태에서, gRNA 변이체 스캐폴드는 서열 번호 2281 내지 2285, 39981 내지 40026, 40913 내지 40958, 또는 41817의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상의 서열 동일성을 갖는 서열 중 어느 하나를 포함한다. 벡터가 gRNA에 대한 서열을 인코딩하는 DNA를 포함하거나, gRNA가 RNA 및 DNA의 키메라인 실시 형태에서, 본 명세서에 기재된 gRNA 서열 실시 형태 중 임의의 것의 우라실(U) 염기가 티민(T) 염기로 치환될 수 있다는 것이 이해될 것이다.
[표 2]
일부 실시 형태에서, sgRNA 변이체는 표 2의 서열 번호 2238, 서열 번호 2239, 서열 번호 2240, 서열 번호 2241, 서열 번호 2243, 서열 번호 2256, 서열 번호 2274, 서열 번호 2275, 서열 번호 2279, 서열 번호 2281, 서열 번호 2285, 서열 번호 39984, 서열 번호 39987, 또는 서열 번호 40003의 서열에 대한 하나 이상의 부가적인 변형을 포함한다.
본 개시내용의 gRNA 변이체의 일부 실시 형태에서, gRNA 변이체는 서열 번호 5의 참조 가이드 스캐폴드에 비교하여 하나 이상의 변형을 포함하며, 여기서 하나 이상의 변형은 하기 중 하나 이상으로부터 선택된다: (a) 삼중체 루프에서의 C18G 치환; (b) 스템 버블에서의 G55 삽입; (c) U1 결실; (d) (i) 6 nt 루프 및 13개의 루프-근위 염기쌍이 Uvsx 헤어핀에 의해 대체되고; (ii) A99의 결실 및 G65U의 치환이 완전히 염기-대합된 루프-원위 염기를 유발하는, 연장된 스템 루프의 변형.
일부 실시 형태에서, gRNA 변이체는 긴 비-코딩 RNA(lncRNA)를 갖는 외인성 스템 루프를 포함한다. 본 명세서에 사용되는 바와 같이, lncRNA는 길이가 대략 200 bp보다 더 긴 비-코딩 RNA를 지칭한다. 일부 실시 형태에서, 외인성 스템 루프의 5' 및 3' 단부는 염기 대합되며; 즉, 상호작용하여 이중체 RNA의 영역을 형성한다. 일부 실시 형태에서, 외인성 스템 루프의 5' 및 3' 단부는 염기 대합되고, 외인성 스템 루프의 5' 및 3' 단부 사이의 하나 이상의 영역은 염기 대합되지 않음으로써, 루프를 형성한다.
일부 실시 형태에서 본 개시내용은, 하기를 갖는, 참조 gRNA에 비교하여 뉴클레오티드 변형을 갖는 gRNA 변이체를 제공한다: (a) 하나 이상의 영역에서의 gRNA 변이체 내의 1 내지 15개의 연속되거나 비-연속된 뉴클레오티드의 치환; (b) 하나 이상의 영역에서의 gRNA 변이체 내의 1 내지 10개의 연속되거나 비-연속된 뉴클레오티드의 결실; (c) 하나 이상의 영역에서의 gRNA 변이체 내의 1 내지 10개의 연속되거나 비-연속된 뉴클레오티드의 삽입; (d) 근위 5' 및 3' 단부를 갖는 이종성 RNA 공급원으로부터의 RNA 스템 루프 서열을 이용한 스캐폴드 스템 루프 또는 연장된 스템 루프의 치환; 또는 (a) 내지 (d)의 임의의 조합. 본 명세서에 기재된 치환, 삽입, 및 결실 중 임의의 것을 조합하여 본 개시내용의 gRNA 변이체를 생성할 수 있다. 예를 들어, gRNA 변이체는 참조 gRNA에 비교하여 하나 이상의 치환 및 하나 이상의 결실, 참조 gRNA에 비교하여 하나 이상의 치환 및 하나 이상의 삽입, 참조 gRNA에 비교하여 하나 이상의 삽입 및 하나 이상의 결실, 또는 참조 gRNA에 비교하여 하나 이상의 치환, 하나의 삽입, 및 하나의 결실을 포함할 수 있다.
일부 실시 형태에서, 본 개시내용의 sgRNA 변이체는 이전에 생성된 변이체의 서열에 대한 하나 이상의 변형을 포함하며, 이전에 생성된 변이체 자체는 변형될 서열로서의 역할을 한다. 일부 경우에, 하나 또는 변형은 스캐폴드의 유사매듭 영역에 도입된다. 다른 경우에, 하나 또는 변형은 스캐폴드의 삼중체 영역에 도입된다. 다른 경우에, 하나 또는 변형은 스캐폴드 버블에 도입된다. 다른 경우에, 하나 또는 변형은 스캐폴드의 연장된 스템 영역에 도입된다. 또 다른 경우에, 변형 중 하나는 전술한 영역 중 2개 이상 내로 도입된다. 그러한 변형은 전술한 영역에서의 하나 이상의 뉴클레오티드의 삽입, 결실, 또는 치환, 또는 이들의 임의의 조합을 포함할 수 있다. 변형을 생성하고 평가하는 예시적인 방법은 실시예 20에 기재된다.
일부 실시 형태에서, sgRNA 변이체는 서열 번호 2238, 서열 번호 2239, 서열 번호 2240, 서열 번호 2241, 서열 번호 2241, 서열 번호 2274, 서열 번호 2275, 서열 번호 2279, 또는 서열 번호 2285, 서열 번호 39984, 서열 번호 39987, 또는 서열 번호 40003의 서열에 대한 하나 이상의 변형을 포함한다.
예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 174(서열 번호 2238)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 174에 비교하여 개선된 기능적 특징을 나타낸다. 다른 예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 175(서열 번호 2239)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 175에 비교하여 개선된 기능적 특징을 나타낸다. 예를 들어, gRNA 변이체 175의 삼중체 루프에 대한 변형, 특히 C15 또는 C17에 대한 돌연변이를 갖는 변이체는 175 스캐폴드에 비교하여 높은 농축을 나타낸다. 부가적으로, G7과 A29 사이의 유사매듭 스템 내의 예측된 쌍의 양쪽 구성원에 대한 변화는 둘 모두 175 스캐폴드에 비교하여 고도로 농축되며, A29를 C 또는 T로 전환하는 것은 정준 왓슨-크릭 대합(G7:C29)을 형성하고, 이의 두번째는 GU 워블 쌍(G7:U29)을 형성할 것이며, 이들 둘 모두는 G:A 쌍에 비교하여 나선의 안정성을 증가시킬 것으로 예상될 수 있다. 또한, 가이드 스캐폴드 175 내의 위치 54에서의 C의 삽입은 농축된 변형을 유발한다.
일부 실시 형태에서, 본 개시내용은 표 28의 변형으로 이루어진 군으로부터 선택된 gRNA 스캐폴드 변이체 174(서열 번호 2238)에 대한 하나 이상의 변형을 포함하는 gRNA 변이체를 제공하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 174에 비교하여 개선된 기능적 특징을 나타낸다. 일부 실시 형태에서, 개선된 기능적 특징은 증가된 편집 활성, 증가된 유사매듭 스템 안정성, 증가된 삼중체 영역 안정성, 증가된 스캐폴드 스템 안정성, 연장된 스템 안정성, 감소된 표적-외 폴딩 중간체, 및 부류 2, 유형 V CRISPR 단백질에 대한 증가된 결합 친화도로 이루어진 군으로부터 선택된 하나 이상의 기능적 특성이다. 전술한 실시 형태에서, 표 28의 변형으로 이루어진 군으로부터 선택된 gRNA 스캐폴드 변이체 174에 대한 하나 이상의 변형을 포함하는 gRNA(연결된 표적화 서열을 가지며 부류 2, 유형 V CRISPR 단백질과 복합체화됨)는 시험관내 검정에서 서열 번호 2238의 gRNA 스캐폴드의 점수에 비교하여 약 2.0 이상, 약 2.5 이상, 약 3 이상, 또는 약 3.5 이상 더 큰 개선된 농축 점수(log2)를 나타낸다.
일부 실시 형태에서, 본 개시내용은 표 29의 변형으로 이루어진 군으로부터 선택된 gRNA 스캐폴드 변이체 175(서열 번호 2239)에 대한 하나 이상의 변형을 포함하는 gRNA 변이체를 제공하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 175에 비교하여 개선된 기능적 특징을 나타낸다. 일부 실시 형태에서, 개선된 기능적 특징은 증가된 편집 활성, 증가된 유사매듭 스템 안정성, 증가된 삼중체 영역 안정성, 증가된 스캐폴드 스템 안정성, 연장된 스템 안정성, 감소된 표적-외 폴딩 중간체, 및 부류 2, 유형 V CRISPR 단백질에 대한 증가된 결합 친화도로 이루어진 군으로부터 선택된 하나 이상의 기능적 특성이다. 전술한 실시 형태에서, 표 29의 변형으로 이루어진 군으로부터 선택된 gRNA 스캐폴드 변이체 175에 대한 하나 이상의 변형을 포함하는 gRNA(연결된 표적화 서열을 가지며 부류 2, 유형 V CRISPR 단백질과 복합체화됨)는 시험관내 검정에서 서열 번호 2239의 gRNA 스캐폴드의 점수에 비교하여 약 1.2 이상, 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 또는 약 3.5 이상 더 큰 개선된 농축 점수(log2)를 나타낸다.
특정 실시 형태에서, gRNA 스캐폴드 변이체 174의 하나 이상의 변형은 뉴클레오티드 위치 U11, U24, A29, U65, C66, C68, A69, U76, G77, A79, 및 A87로 이루어진 군으로부터 선택된다. 특정 실시 형태에서, gRNA 스캐폴드 변이체 174의 변형은 U11C, U24C, A29C, U65C, C66G, C68U, 위치 69에서의 ACGGA의 삽입, 위치 76에서의 UCCGU의 삽입, G77A, 위치 79에서의 GA의 삽입, A87G이다. 다른 특정 실시 형태에서, gRNA 스캐폴드 변이체 175의 변형은 뉴클레오티드 위치 C9, U11, C17, U24, A29, G54, C65, A89, 및 A96으로 이루어진 군으로부터 선택된다. 특정 실시 형태에서, gRNA 스캐폴드 변이체 174의 변형은 C9U, U11C, C17G, U24C, A29C, 위치 54에서의 G의 삽입, 위치 65에서의 C의 삽입, A89G, 및 A96G이다.
예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 215(서열 번호 2275)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 215에 비교하여 개선된 기능적 특징을 나타낸다.
예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 221(서열 번호 2281)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 221에 비교하여 개선된 기능적 특징을 나타낸다.
예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 225(서열 번호 2285)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 225에 비교하여 개선된 기능적 특징을 나타낸다.
예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 235(서열 번호 39987)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 225에 비교하여 개선된 기능적 특징을 나타낸다.
예시적인 실시 형태에서, gRNA 변이체는 gRNA 스캐폴드 변이체 251(서열 번호 40003)에 비교하여 하나 이상의 변형을 포함하며, 여기서 생성되는 gRNA 변이체는, 유사한 조건 하에 시험관내 또는 생체내 검정에서 평가할 경우에, 모 251에 비교하여 개선된 기능적 특징을 나타낸다.
전술한 실시 형태에서, 개선된 기능적 특징은 증가된 안정성, gRNA의 증가된 전사, 뉴클레아제 활성에 대한 증가된 저항성, gRNA의 증가된 폴딩 속도, 폴딩 중의 감소된 부생성물 형성, 증가된 생산적 폴딩, CasX 단백질에 대한 증가된 결합 친화도, CasX 단백질과 복합체화되는 경우에 표적 핵산에 대한 증가된 결합 친화도, CasX 단백질과 복합체화되는 경우에 증가된 유전자 편집, CasX 단백질과 복합체화되는 경우에 편집의 증가된 특이성, CasX 단백질과 복합체화되는 경우에 감소된 표적-외 편집, 및 CasX 단백질과 복합체화되는 경우에 표적 핵산의 변형에서 ATC, CTC, GTC, 또는 TTC를 포함하는 하나 이상의 PAM 서열의 더 큰 스펙트럼을 이용하는 증가된 능력 중 하나 이상을 포함하지만 이로 제한되지 않는다. 일부 경우에, gRNA 변이체의 개선된 특징 중 하나 이상은 그것이 유래된 gRNA에 비교하여 약 1.1 내지 약 100,000-배 이상 개선된다. 다른 경우에, gRNA 변이체의 하나 이상의 개선된 특징은 그것이 유래된 gRNA에 비교하여 약 1.1-배 이상, 약 10-배 이상, 약 100-배 이상, 약 1000-배 이상, 약 10,000-배 이상, 약 100,000-배 이상 개선된다. 다른 경우에, gRNA 변이체의 개선된 특징 중 하나 이상은 그것이 유래된 gRNA에 비교하여 약 1.1 내지 100,00-배, 약 1.1 내지 10,00-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,00-배, 약 100 내지 10,00-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,00-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 개선된다. 다른 경우에, gRNA 변이체의 하나 이상의 개선된 특징은 그것이 유래된 gRNA에 비교하여 약 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배, 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 개선된다.
일부 실시 형태에서, gRNA 변이체는 하기와 같이 기재된 참조 gRNA로부터의 그러한 차이를 갖는 외인성 연장된 스템 루프를 포함한다. 일부 실시 형태에서, 외인성 연장된 스템 루프는 본 명세서에 개시된 참조 스템 루프 영역(예를 들어, 서열 번호 15)에 대해 동일성이 없거나 거의 없다. 일부 실시 형태에서, 외인성 스템 루프는 10 bp 이상, 20 bp 이상, 30 bp 이상, 40 bp 이상, 50 bp 이상, 60 bp 이상, 70 bp 이상, 80 bp 이상, 90 bp 이상, 100 bp 이상, 200 bp 이상, 300 bp 이상, 400 bp 이상, 500 bp 이상, 600 bp 이상, 700 bp 이상, 800 bp 이상, 900 bp 이상, 1,000 bp 이상, 2,000 bp 이상, 3,000 bp 이상, 4,000 bp 이상, 5,000 bp 이상, 6,000 bp 이상, 7,000 bp 이상, 8,000 bp 이상, 9,000 bp 이상, 10,000 bp 이상, 12,000 bp 이상, 15,000 bp 이상, 또는 20,000 bp 이상이다. 일부 실시 형태에서, gRNA 변이체는 10개 이상, 100개 이상, 500개 이상, 1000개 이상, 또는 10,000개 이상의 뉴클레오티드를 포함하는 연장된 스템 루프 영역을 포함한다. 일부 실시 형태에서, 이종성 스템 루프는 gRNA의 안정성을 증가시킨다. 일부 실시 형태에서, 이종성 RNA 스템 루프는 단백질, RNA 구조, DNA 서열, 또는 소분자에 결합할 수 있다. 일부 실시 형태에서, 스템 루프를 대체하는 외인성 스템 루프 영역은 RNA 스템 루프 또는 헤어핀을 포함하며, 여기에서 생성되는 gRNA는 루프의 선택에 따라 증가된 안정성을 갖고, 소정의 세포 단백질 또는 RNA와 상호작용할 수 있다. 그러한 외인성 연장된 스템 루프는, 예를 들어 열안정성 RNA, 예컨대 MS2 헤어핀(ACAUGAGGAUCACCCAUGU(서열 번호 35)), Qβ 헤어핀(UGCAUGUCUAAGACAGCA(서열 번호 36)), U1 헤어핀 II(AAUCCAUUGCACUCCGGAUU(서열 번호 37)), Uvsx(CCUCUUCGGAGG(서열 번호 38)), PP7 헤어핀(AGGAGUUUCUAUGGAAACCCU(서열 번호 39)), 파지 복제 루프(AGGUGGGACGACCUCUCGGUCGUCCUAUCU(서열 번호 40)), 키싱 루프_a(UGCUCGCUCCGUUCGAGCA(서열 번호 41)), 키싱 루프_b1(UGCUCGACGCGUCCUCGAGCA(서열 번호 42)), 키싱 루프_b2(UGCUCGUUUGCGGCUACGAGCA(서열 번호 43)), G 사중체 M3q(AGGGAGGGAGGGAGAGG(서열 번호 44)), G 사중체 텔로미어 바스켓(GGUUAGGGUUAGGGUUAGG(서열 번호 45)), 사르신-라이신 루프(CUGCUCAGUACGAGAGGAACCGCAG(서열 번호 46)), 또는 유사매듭(UACACUGGGAUCGCUGAAUUAGAGAUCGGCGUCCUUUCAUUCUAUAUACUUUGGAGUUUUAAAAUGUCUCUAAGUACA(서열 번호 47))을 포함할 수 있다. 일부 실시 형태에서, 연장된 스템 루프는 UGGGCGCAGCGUCAAUGACGCUGACGGUACA(스템 IIB; 서열 번호 41843), GCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGC(스템 II; 서열 번호 41844), CAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUG(스템 II-V 서열 번호 41845), GCUGACGGUACAGGC(RBE; 서열 번호 41846), 및 AGGAGCUUUGUUCCUUGGGUUCUUGGGAGCAGCAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUGGCUGUGGAAAGAUACCUAAAGGAUCAACAGCUCCU(전장 RRE; 서열 번호 41847)를 포함한다.
일부 실시 형태에서, gRNA 변이체는 말단 융합 파트너를 포함한다. 용어 gRNA 변이체는 말단 융합 또는 내부 삽입과 같은 외인성 서열을 포함하는 변이체를 포함한다. 예시적인 말단 융합은 자가-절단 리보자임 또는 단백질 결합 모티프에 대한 gRNA의 융합을 포함할 수 있다. 본 명세서에 사용되는 바와 같이, "리보자임"은 단백질 효소와 유사한 하나 이상의 촉매 활성을 갖는 RNA 또는 이의 세그먼트를 지칭한다. 예시적인 리보자임 촉매 활성은, 예를 들어, RNA의 절단 및/또는 라이게이션, DNA의 절단 및/또는 라이게이션, 또는 펩티드 결합 형성을 포함할 수 있다. 일부 실시 형태에서, 그러한 융합은 스캐폴드 폴딩을 개선하거나 DNA 복구 기구를 동원할 수 있을 것이다. 예를 들어, 일부 실시 형태에서 gRNA는 D형 간염 바이러스(HDV) 안티게놈 리보자임, HDV 게놈 리보자임, 손도끼 리보자임(메타게놈 데이터로부터), env25 피스톨 리보자임(알리스티페스 푸트레디니스(Aliistipes putredinis)로부터 대표적임), HH15 최소 망치머리 리보자임, 담배 둥근무늬 바이러스(TRSV) 리보자임, WT 바이러스 망치머리 리보자임(및 합리적 변이체), 또는 트위스티드 시스터 1 또는 RBMX 동원 모티프에 융합될 수 있다. 망치머리 리보자임은 RNA 분자 내의 특이적 부위에서 가역적 절단 및 라이게이션 반응을 촉매하는 RNA 모티프이다. 망치머리 리보자임은 유형 I, 유형 II, 및 유형 III 망치머리 리보자임을 포함한다. HDV, 피스톨, 및 손도끼 리보자임은 자가-절단 활성을 갖는다. 하나 이상의 리보자임을 포함하는 gRNA 변이체는 gRNA 참조에 비교하여 확장된 gRNA 기능을 가능하게 할 수 있다. 예를 들어, 자가-절단 리보자임를 포함하는 gRNA는, 일부 실시 형태에서, 전사되고 폴리시스트론성 전사체의 부분으로서 성숙 gRNA로 가공될 수 있다. 그러한 융합은 gRNA의 5' 또는 3' 단부에서 발생할 수 있다. 일부 실시 형태에서, gRNA 변이체는 5' 및 3' 단부 둘 모두에서 융합을 포함하며, 여기서 각각의 융합은 본 명세서에 기재된 바와 같이 독립적이다.
gRNA 변이체의 실시 형태에서, gRNA 변이체는 gRNA의 3' 단부에 위치하는 스페이서(또는 표적화 서열) 영역을 추가로 포함하며, 이는 14 내지 약 35개 이상의 뉴클레오티드를 포함하는 표적 핵산과 혼성화될 수 있고, 여기서 스페이서는 표적 핵산에 상보적인 서열로 설계된다. 일부 실시 형태에서, 인코딩된 gRNA 변이체는 표적 핵산에 상보적인 10 내지 20개 이상의 뉴클레오티드의 표적화 서열을 포함한다. 일부 실시 형태에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 인코딩된 gRNA 변이체는 20개의 뉴클레오티드를 갖는 표적화 서열을 포함한다. 일부 실시 형태에서, 표적화 서열은 25개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 24개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 23개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 22개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 21개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 20개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 19개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 18개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 17개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 16개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 15개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 표적화 서열은 14개의 뉴클레오티드를 갖는다.
h. CasX 단백질과의 복합체 형성
일부 실시 형태에서, gRNA 변이체는 표 3의 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 동일성을 갖는 서열 중 어느 하나를 포함하는 CasX 변이체 단백질을 포함하는 부류 2, 유형 V 단백질과 RNP 복합체를 형성하는 개선된 능력을 갖는다. 일부 실시 형태에서, 발현시에, gRNA 변이체는 표 3의 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 동일성을 갖는 서열 중 어느 하나를 포함하는 CasX 변이체 단백질과 RNP로서 복합체화된다. 일부 실시 형태에서, 발현시에, gRNA 변이체는 서열 번호 85 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 91% 이상, 약 92% 이상, 약 93% 이상, 약 94% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 동일성을 갖는 서열 중 어느 하나를 포함하는 CasX 변이체 단백질과 RNP로서 복합체화된다.
일부 실시 형태에서, gRNA 변이체는 참조 gRNA에 비교할 경우에 CasX 변이체 단백질과 복합체를 형성하는 개선된 능력을 가지며, 실시예에 기재된 바와 같이 이에 의해 CasX 단백질과 절단-적격성 리보핵단백질(RNP) 복합체를 형성하는 그의 능력을 개선한다. 리보핵단백질 복합체 형성을 개선하는 것은, 일부 실시 형태에서, 기능적 RNP가 조립되는 효율을 개선한다. 일부 실시 형태에서, gRNA 변이체 및 그의 표적화 서열을 포함하는 RNP의 90% 초과, 93% 초과, 95% 초과, 96% 초과, 97% 초과, 98% 초과, 또는 99% 초과는 표적 핵산의 유전자 편집에 적격성이다.
CasX 단백질과 복합체를 형성하는 gRNA 변이체의 능력을 개선할 수 있는 예시적인 뉴클레오티드 변화는, 일부 실시 형태에서, 스캐폴드 스템을 열안정성 스템 루프로 대체하는 것을 포함할 수 있다. 임의의 이론에 구애되고자 함이 없이, 스캐폴드 스템을 열안정성 스템 루프로 대체하는 것은 gRNA 변이체의 CasX 단백질과의 전반적인 결합 안정성을 증가시킬 수 있을 것이다. 대안적으로, 또는 부가적으로, 스템 루프의 큰 섹션을 제거하는 것은, 예를 들어 gRNA 변이체가 그 자체로 "탱글링"될 수 있는 정도를 저감함으로써, gRNA 변이체 폴딩 동역학을 변화시키고 폴딩된 기능적 gRNA가 더 용이하고 더 신속하게 구조적으로-조립되게 할 수 있을 것이다. 일부 실시 형태에서, 스캐폴드 스템 루프 서열의 선택은 gRNA에 이용되는 상이한 스페이서와 함께 변화할 수 있을 것이다. 일부 실시 형태에서, 스캐폴드 서열은 스페이서, 및 따라서 표적 서열에 대해 조정될 수 있다. 실시예의 검정을 포함하는 생화학적 검정을 사용하여 RNP를 형성하기 위한 gRNA 변이체에 대한 CasX 단백질의 결합 친화도를 평가할 수 있다. 예를 들어, 부가적인 표지되지 않은 "비표지 경쟁물질(cold competitor)" gRNA의 증가하는 농도에 대한 반응으로서, 고정화된 CasX 단백질에 결합된 형광 태깅된 gRNA의 양의 변화를 당업자는 측정할 수 있다. 대안적으로, 또는 부가적으로, 형광 신호를 모니터링하여 상이한 양의 형광 표지된 gRNA를 고정화된 CasX 단백질 상에 유동시킴에 따라 그것이 어떻게 변화하는지를 관찰할 수 있다. 대안적으로, 정의된 표적 핵산 서열에 대한 시험관내 절단 검정을 사용하여 RNP를 형성하는 능력을 평가할 수 있다.
IV. AAV 시스템의 CRISPR 단백질
본 개시내용은 진핵 세포의 게놈 편집뿐만 아니라, 작제물의 자가-불활성화 특징의 필수적 구성성분이 되는 것에 유용한 CRISPR 뉴클레아제를 인코딩하는 AAV 시스템을 제공한다. 일부 실시 형태에서, 게놈 편집 시스템에 사용되는 CRISPR 뉴클레아제는 부류 2, 유형 V 뉴클레아제이다. 부류 2, 유형 V CRISPR-Cas 시스템의 구성원들에 차이가 있지만, 이들은 Cas9 시스템으로부터 이들을 구별하는 일부 공통의 특징을 공유한다. 첫째로, 부류 2, 유형 V 뉴클레아제는 단일 RNA-가이드 RuvC 도메인-함유 이펙터를 보유하지만 HNH 도메인은 보유하지 않고, 이들은 표적화되지 않은 가닥 상의 표적 영역에 대해 5′ 상류에 있는 T-풍부 PAM을 인식하며, 이는 표적 서열의 3′ 측에 있는 G-풍부 PAM에 의존하는 Cas9 시스템과는 상이하다. PAM에 근접한 근위 부위에서 평활 단부를 생성하는 Cas9와는 달리, 유형 V 뉴클레아제는 PAM 서열에 대해 원위에 스태거드 이중-가닥 파단을 생성한다. 또한, 유형 V 뉴클레아제는 시스로 결합하는 표적 dsDNA 또는 ssDNA에 의해 활성화되는 경우에 트랜스로 ssDNA를 분해한다. 일부 실시 형태에서, 실시 형태의 유형 V 뉴클레아제는 5′-TC PAM 모티프를 인식하고 RuvC 도메인에 의해 단독으로 절단되는 스태거드 단부를 생성한다. 일부 실시 형태에서, 유형 V 뉴클레아제는 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j, Cas12k, CasPhi, C2c4, C2c8, C2c5, C2c10, C2c9, CasZ, 및 CasX로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 CasX 변이체 단백질 및 하나 이상의 gRNA 산을 인코딩하는 AAV 시스템을 제공하며, 이는 형질감염된 세포에서 발현시에 RNP 복합체를 형성할 수 있고 진핵 세포에서 표적 핵산 서열을 변형시킬뿐만 아니라 AAV 작제물의 이식유전자를 포함하는 폴리뉴클레오티드 내로 혼입된 자가-불활성화 세그먼트를 절단하도록 특이적으로 설계된다.
본 명세서에 사용되는 바와 같이, 용어 "CasX 단백질"은 단백질의 패밀리를 지칭하고, 모든 천연 발생 CasX 단백질, 천연 발생 CasX 단백질에 대해 50% 이상의 동일성을 공유하는 단백질뿐만 아니라, 천연-발생 참조 CasX 단백질에 비교하여 하나 이상의 개선된 특징을 보유하는 CasX 변이체를 포함하며, 하기 더욱 완전하게 기재된다.
본 개시내용의 CasX 단백질은 하기 도메인 중 하나 이상을 포함한다: 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 로딩(TSL) 도메인, 나선형 I 도메인(이는 나선형 I-I 및 I-II 서브도메인으로 추가로 분할됨), 나선형 II 도메인, 올리고뉴클레오티드 결합 도메인(OBD, 이는 OBD-I 및 OBD-II 서브도메인으로 추가로 분할됨), 및 RuvC DNA 절단 도메인(이는 RuvC-I 및 II 서브도메인으로 추가로 분할됨). RuvC 도메인은 촉매 활성이 소멸된(catalytically-dead) CasX 변이체에서 변형되거나 결실될 수 있으며, 하기 더욱 완전하게 기재된다.
일부 실시 형태에서, CasX 변이체 단백질은 표적 핵산 서열 내의 서열에 혼성화되는 관련된 gRNA에 의해 표적화된 특이적 서열에서 표적 핵산에 결합하고/하거나 이를 변형시킬 수 있다(예를 들어, 닉킹, 이중-가닥 파단을 촉매함, 메틸화, 탈메틸화 등).
a. 참조 CasX 단백질
본 개시내용은 천연-발생 CasX 단백질(본 명세서에서 "참조 CasX 단백질"로 지칭됨)을 제공하며, 이는 후속적으로 변형되어 본 개시내용의 CasX 변이체를 생성하였다. 예를 들어, 참조 CasX 단백질은 천연 발생 원핵생물, 예컨대 델타프로테오박테리아, 플랑크토마이세테스, 또는 칸디다투스 성박테리아 종으로부터 단리될 수 있다. 참조 CasX 단백질은 CasX(상호교환적으로 Cas12e로 지칭됨) 단백질의 패밀리에 속하는 유형 II CRISPR/Cas 엔도뉴클레아제이며, 이는 가이드 RNA와 상호작용하여 리보핵단백질(RNP) 복합체를 형성한다.
일부 경우에, 참조 CasX 단백질은 델타프로테오박터로부터 단리되거나 유래된다. 일부 실시 형태에서, 참조 CasX 단백질은
일부 경우에, 참조 CasX 단백질은 플랑크토마이세테스로부터 단리되거나 유래된다. 일부 실시 형태에서, 참조 CasX 단백질은
일부 경우에, 참조 CasX 단백질은 칸디다투스 성박테리아로부터 단리되거나 유래된다. 일부 실시 형태에서, 참조 CasX 단백질은
b. 부류 2, 유형 V CasX 변이체 단백질
본 개시내용은 다른 CasX 변이체로부터 유래된 참조 CasX 단백질 또는 변이체의 부류 2, 유형 V, CasX 변이체(본 명세서에서 상호교환적으로 "부류 2, 유형 V CasX 변이체", "CasX 변이체", 또는 "CasX 변이체 단백질"로 지칭됨)를 제공하며, 여기서 부류 2, 유형 V CasX 변이체는 서열 번호 1 내지 3의 서열을 포함하지만 이로 제한되지 않는 참조 CasX 단백질에 비교하여 하나 이상의 도메인 내의 하나 이상의 변형, 또는 다른 CasX 변이체에 비교하여 하나 이상의 변형을 포함한다. CasX 단백질의 개선된 특징으로 이어지는 참조 CasX 단백질의, 또는 다른 CasX 변이체 단백질에 대한 아미노산 서열의 임의의 변화는 본 개시내용의 CasX 변이체 단백질로 간주된다. 예를 들어, CasX 변이체는 참조 CasX 단백질 서열에 비교하여 하나 이상의 아미노산 치환, 삽입, 결실, 또는 스와핑된 도메인, 또는 이들의 임의의 조합을 포함할 수 있다.
본 개시내용의 CasX 변이체는 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질, 또는 그것이 유래된 변이체; 예를 들어 CasX 491(서열 번호 138) 또는 CasX 515(서열 번호 145)에 비교하여 하나 이상의 개선된 특징을 갖는다. CasX 변이체 실시 형태의 예시적인 개선된 특징은 변이체의 개선된 폴딩, gRNA에 대한 증가된 결합 친화도, 표적 핵산에 대한 증가된 결합 친화도, 표적 핵산의 편집 및/또는 결합에서 PAM 서열의 더 큰 스펙트럼을 이용하는 개선된 능력, 표적 DNA의 개선된 풀림(unwinding), 증가된 편집 활성, 개선된 편집 효율, 표적 핵산에 대한 개선된 편집 특이성, 감소된 표적-외 편집 또는 절단, 효율적으로 편집될 수 있는 진핵생물 게놈의 증가된 백분율, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 닉킹에 대한 감소된 표적 가닥 로딩, DNA의 비-표적 가닥의 증가된 결합, 개선된 단백질 안정성, 개선된 단백질:gRNA(RNP) 복합체 안정성, 및 개선된 융합 특징을 포함하지만 이로 제한되지 않는다. 전술한 실시 형태에서, 유사한 양상으로 검정할 경우에, CasX 변이체의 개선된 특징 중 하나 이상은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질, 또는 CasX 491(서열 번호 138) 또는 CasX 515(서열 번호 145)에 비교하여 약 1.1 내지 약 100,000-배 이상 개선된다. 다른 실시 형태에서, 유사한 양상으로 검정할 경우에, 개선은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질, 또는 CasX 491(서열 번호 138) 또는 CasX 515(서열 번호 145)에 비교하여 약 1.1-배 이상, 약 2-배 이상, 약 5-배 이상, 약 10-배 이상, 약 50-배 이상, 약 100-배 이상, 약 500-배 이상, 약 1000-배 이상, 약 5000-배 이상, 약 10,000-배 이상, 또는 약 100,000-배 이상이다. 다른 경우에, CasX 변이체와 gRNA 변이체의 RNP의 하나 이상의 개선된 특징은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질과 표 1의 gRNA 또는 CasX 491 또는 CasX 515와 gRNA 174의 RNP에 비교하여 약 1.1-배 이상, 약 10-배 이상, 약 100-배 이상, 약 1000-배 이상, 약 10,000-배 이상, 약 100,000-배 이상 개선된다. 다른 경우에, 유사한 양상으로 검정할 경우에, CasX 변이체와 gRNA 변이체의 RNP의 개선된 특징 중 하나 이상은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질과 표 1의 gRNA, 또는 CasX 491 또는 CasX 515와 gRNA 174의 RNP에 비교하여 약 1.1 내지 100,00-배, 약 1.1 내지 10,00-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,00-배, 약 100 내지 10,00-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,00-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 개선된다. 다른 경우에, 유사한 양상으로 검정할 경우에, CasX 변이체와 gRNA 변이체의 RNP의 하나 이상의 개선된 특징은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질과 표 1의 gRNA, 또는 CasX 491 또는 CasX 515와 gRNA 174의 RNP에 비교하여 약 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배, 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 개선된다.
일부 실시 형태에서, CasX 변이체의 변형은 참조 CasX의 하나 이상의 아미노산에서의 돌연변이이다. 다른 실시 형태에서, 변형은 상이한 CasX 단백질로부터의 도메인의 일부 또는 전부의 삽입 또는 치환이다. 특정 실시 형태에서, 서열 번호 144 내지 160, 40208 내지 40369, 40828 내지 40912의 CasX 변이체는 서열 번호 1의 NTSB 및 나선형 1B 도메인을 갖는 반면에, 다른 도메인은 본 명세서에 기재된 선택된 도메인 내의 개별 변형에 부가하여, 서열 번호 2로부터 유래된다. 돌연변이는 참조 CasX 단백질의 임의의 하나 이상의 도메인 내에, 또는 CasX 변이체 내에 도입되어 CasX 변이체를 유발할 수 있으며, 예를 들어, 하나 이상의 도메인의 일부 또는 전부의 결실, 또는 참조 CasX 단백질 또는 그것이 유래된 CasX 변이체의 임의의 도메인 내의 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함할 수 있다. CasX 단백질의 도메인은 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 로딩(TSL) 도메인, 나선형 I 도메인, 나선형 II 도메인, 올리고뉴클레오티드 결합 도메인(OBD), 및 RuvC DNA 절단 도메인을 포함한다. 이론 또는 기전에 구애됨이 없이, CasX 내의 NTSB 도메인은 비-표적 핵산 가닥에 대한 결합을 가능하게 하며 비-표적 및 표적 가닥의 풀림을 보조할 수 있다. NTSB 도메인은 풀림, 또는 풀린 상태의 비-표적 핵산 가닥의 포획을 담당하는 것으로 추정된다. 예시적인 NTSB 도메인은 서열 번호 1의 아미노산 100 내지 190 또는 서열 번호 2의 아미노산 102 내지 191을 포함한다. 일부 실시 형태에서, 참조 CasX 단백질의 NTSB 도메인은 4-가닥 베타 시트를 포함한다. 일부 실시 형태에서, TSL은 폴딩된 상태의 표적-가닥을 위치시키거나 포획하는 작용을 하며, 이는 표적 가닥 DNA 골격의 절단가능한 포스페이트를 RuvC 활성 부위 내에 위치시킨다. 예시적인 TSL은 서열 번호 1의 아미노산 824 내지 933 또는 서열 번호 2의 아미노산 811 내지 920을 포함한다. 이론에 구애되고자 함이 없이, 일부 경우에 나선형 I 도메인은 프로토스페이서 인접 모티프(PAM)의 결합에 기여할 수 있는 것으로 생각된다. 일부 실시 형태에서, 참조 CasX 단백질의 나선형 I 도메인은 하나 이상의 알파 나선을 포함한다. 예시적인 나선형 I-I 및 I-II 도메인은 각각 서열 번호 1의 아미노산 56 내지 99 및 191 내지 331, 또는 각각 서열 번호 2의 아미노산 58 내지 101 및 192 내지 332를 포함한다. 나선형 II 도메인은 가이드 RNA 스캐폴드 스템 루프뿐만 아니라 결합된 DNA에 대한 결합을 담당한다. 예시적인 나선형 II 도메인은 서열 번호 1의 아미노산 332 내지 508 또는 서열 번호 2의 아미노산 333 내지 500을 포함한다. OBD는 대체로 가이드 RNA 스캐폴드의 RNA 삼중체에 결합한다. OBD는 또한 프로토스페이서 인접 모티프(PAM)에 대한 결합을 담당할 수 있다. 예시적인 OBD I 및 II 도메인은 각각 서열 번호 1의 아미노산 1 내지 55 및 509 내지 659, 또는 각각 서열 번호 2의 아미노산 1 내지 57 및 501 내지 646을 포함한다. RuvC는 둘 모두의 DNA 가닥의 절단을 담당하는 DED 모티프 활성 부위를 갖는다(차례로, 아마도 비-표적 가닥을 먼저 표적화된 서열 내로 11 내지 14개의 뉴클레오티드(nt)에서, 그리고 이어서 표적 가닥을 그 다음에 표적 서열 뒤의 2 내지 4개의 뉴클레오티드에서 절단하여, 스태거드 절단을 유발함). 특이적으로 CasX에서, RuvC 도메인은 그것이 또한 CasX 기능에 있어서 결정적인 가이드 RNA 스캐폴드 스템 루프에의 결합을 담당한다는 점에서 고유하다. 예시적인 RuvC I 및 II 도메인은 각각 서열 번호 1의 아미노산 660 내지 823 및 934 내지 986, 또는 각각 서열 번호 2의 아미노산 647 내지 810 및 921 내지 978을 포함하는 반면에, CasX 변이체는 서열 번호 2에 비교하여 위치 I658 및 A708에서의 돌연변이, 또는 하기 기재된 CasX 515의 돌연변이를 포함할 수 있다.
일부 실시 형태에서, CasX 변이체 단백질은 서열 번호 1 내지 3의 서열을 포함하는 참조 CasX 단백질의 1개 이상의 도메인에, 2개 이상의 도메인 각각에, 3개 이상의 도메인 각각에, 4개 이상의 도메인 각각에, 또는 5개 이상의 도메인 각각에 하나 이상의 변형을 포함한다. 일부 실시 형태에서, CasX 변이체 단백질은 참조 CasX 단백질의 1개 이상의 도메인에 2개 이상의 변형을 포함한다. 일부 실시 형태에서, CasX 변이체 단백질은 참조 CasX 단백질의 1개 이상의 도메인에 2개 이상의 변형, 참조 CasX 단백질의 1개 이상의 도메인에 3개 이상의 변형, 또는 참조 CasX 단백질의 1개 이상의 도메인에 4개 이상의 변형을 포함한다. CasX 변이체가 참조 CasX 단백질에 비교하여 2개 이상의 변형을 포함하는 일부 실시 형태에서, 각각의 변형은 NTSB, TSL, 나선형 I 도메인, 나선형 II 도메인, OBD, 및 RuvC DNA 절단 도메인으로 이루어진 군으로부터 독립적으로 선택된 도메인에서 이루어진다. CasX 변이체가 참조 CasX 단백질에 비교하여 2개 이상의 변형을 포함하는 일부 실시 형태에서, 변형은 2개 이상의 도메인에서 이루어진다. 일부 실시 형태에서, CasX 변이체 단백질의 하나 이상의 변형은 서열 번호 1 내지 3의 참조 CasX 단백질의 1개의 도메인의 적어도 일부의 결실을 포함한다. 일부 실시 형태에서, 결실은 NTSB 도메인, TSL 도메인, 나선형 I 도메인, 나선형 II 도메인, OBD, 또는 RuvC DNA 절단 도메인 내에 있다.
일부 경우에, 본 개시내용의 CasX 변이체는 하나 이상의 도메인을 포함할 수 있는 구조 영역 내에 변형을 포함한다. 일부 실시 형태에서, CasX 변이체는 CasX 변이체의 비-근접한 아미노산 잔기의 영역의 하나 이상의 변형을 포함하며, 이는CasX 변이체와의 gRNA:표적 핵산 복합체화가 발생하는 채널을 형성한다. 다른 실시 형태에서, CasX 변이체는 CasX 변이체의 비-근접한 아미노산 잔기의 영역의 하나 이상의 변형을 포함하며, 이는 gRNA와 결합하는 계면을 형성한다. 다른 실시 형태에서, CasX 변이체는 CasX 변이체의 비-근접한 아미노산 잔기의 영역의 하나 이상의 변형을 포함하며, 이는 비-표적 가닥 DNA와 결합하는 채널을 형성한다. 다른 실시 형태에서, CasX 변이체는 CasX 변이체의 비-근접한 아미노산 잔기의 영역의 하나 이상의 변형을 포함하며, 이는 표적 핵산의 프로토스페이서 인접 모티프(PAM)와 결합하는 계면을 형성한다. 다른 실시 형태에서, CasX 변이체는 CasX 변이체의 비-근접한 표면-노출된 아미노산 잔기의 영역의 하나 이상의 변형을 포함한다. 다른 실시 형태에서, CasX 변이체는 비-근접한 아미노산 잔기의 영역의 하나 이상의 변형을 포함하며, 이는 CasX 변이체의 도메인 내에 소수성 패킹을 통해 코어를 형성한다. 전술한 단락의 실시 형태에서, 영역의 변형은 영역의 하나 이상의 아미노산의 결실, 삽입, 또는 치환 중 하나 이상을 포함할 수 있거나; CasX 변이체의 영역의 2 내지 15개의 아미노산 잔기가 하전된 아미노산으로 치환되거나; CasX 변이체의 영역의 2 내지 15개의 아미노산 잔기가 극성 아미노산으로 치환되거나; CasX 변이체의 영역의 2 내지 15개의 아미노산 잔기가 DNA 또는 RNA 염기와 스태킹되거나 이들과의 친화도를 갖는 아미노산으로 치환된다.
다른 실시 형태에서, 본 개시내용은 다른 CasX 변이체에 비교하여 하나 이상의 변형을 포함하는 CasX 변이체를 제공하며; 예를 들어, CasX 변이체 515 및 527은 CasX 변이체 491의 변이체이고 CasX 변이체 668 및 672는 CasX 535의 변이체이다. 일부 실시 형태에서, 하나 이상의 변형은 아미노산 삽입, 결실, 또는 치환으로 이루어진 군으로부터 선택된다. 본 명세서에 기재된 참조 CasX 단백질 또는 그것이 유도된 변이체에 비교할 경우에 CasX 변이체 단백질의 하나 이상의 기능 또는 특징을 개선하는 모든 변이체는 본 개시내용의 범주 내에 있는 것으로 예상된다. 실시예에 기재된 바와 같이, CasX 변이체는 돌연변이화되어 다른 CasX 변이체를 생성한다. 특정 실시 형태에서, 본 개시내용은 실시예 21, 표 30에서, 인코딩 서열에 변형을 도입하여 하나 이상의 도메인 내의 하나 이상의 위치에서 아미노산 치환, 결실, 또는 삽입을 유발함으로써 생성된 CasX 515(서열 번호 145)의 변이체를 제공한다.
본 개시내용의 CasX 변이체 단백질을 생성하기에 적합한 돌연변이유발 방법은, 예를 들어, 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 오류 빈발 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 스태거드 연장 PCR, 유전자 셔플링, 또는 도메인 스와핑(본 명세서에 참고로 포함된 PCT/US20/36506호 및 WO2020247883A2호에 기재됨)을 포함할 수 있다. 일부 실시 형태에서, 예를 들어, 실시예에 기재된 검정을 사용하여, 예를 들어, 확인된 CasX 변이체 내의 원하는 다중 돌연변이를 선택함으로써, CasX 변이체가 설계된다. 소정의 실시 형태에서는, 참조 CasX 또는 돌연변이유발 전의 CasX 변이체 단백질의 활성을 벤치마크로 사용하며, 하나 이상의 생성되는 CasX 변이체의 활성을 이에 대해 비교함으로써, 새로운 CasX 변이체의 기능의 개선을 측정한다.
본 명세서에 기재된 CasX 변이체의 일부 실시 형태에서, 하나 이상의 변형은 하기를 포함한다: (a) 서열 번호 1, 서열 번호 2, 서열 번호 3의 참조 CasX, CasX 변이체 491(서열 번호 138) 또는 CasX 변이체 515(서열 번호 145)에 비교하여 CasX 변이체 내의 1 내지 100개의 연속되거나 비-연속된 아미노산의 치환; (b) 참조 CasX 또는 그것이 유래된 변이체에 비교하여 CasX 변이체 내의 1 내지 100개의 연속되거나 비-연속된 아미노산의 결실; (c) 참조 CasX 또는 그것이 유래된 변이체에 비교하여 CasX 내의 1 내지 100개의 연속되거나 비-연속된 아미노산의 삽입; 또는 (d) (a) 내지 (c)의 임의의 조합. 일부 실시 형태에서, 하나 이상의 변형은 하기를 포함한다: (a) 서열 번호 1, 서열 번호 2, 서열 번호 3의 참조 CasX, 또는 그것이 유래된 변이체에 비교하여 CasX 변이체 내의 1 내지 10개의 연속되거나 비-연속된 아미노산의 치환; (b) 참조 CasX 또는 그것이 유래된 변이체에 비교하여 CasX 변이체 내의 1 내지 5개의 연속되거나 비-연속된 아미노산의 결실; (c) 참조 CasX 또는 그것이 유래된 변이체에 비교하여 CasX 내의 1 내지 5개의 연속되거나 비-연속된 아미노산의 삽입; 또는 (d) (a) 내지 (c)의 임의의 조합.
일부 실시 형태에서, CasX 변이체 단백질은 서열 번호 1, 서열 번호 2, 서열 번호 3, CasX 491, 또는 CasX 515의 서열에 비교하여 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 20개 이상, 30개 이상, 40개 이상, 50개 이상, 60개 이상, 70개 이상, 80개 이상, 90개 이상, 또는 100개 이상의 변경을 갖는 서열을 포함하거나 이로 이루어진다. 일부 실시 형태에서, CasX 변이체 단백질은 CasX 491, 또는 서열 번호 138에 비교하여 하나 이상의 치환을 포함한다. 일부 실시 형태에서, CasX 변이체 단백질은 CasX 515, 또는 서열 번호 145에 비교하여 하나 이상의 치환을 포함한다. 이들 변경은 아미노산 삽입, 결실, 치환, 또는 이들의 임의의 조합일 수 있다. 변경은 CasX 변이체의 1개의 도메인 또는 임의의 도메인 또는 도메인들의 임의의 조합 내에 있을 수 있다. 본 명세서에 기재된 치환에서 임의의 아미노산으로 임의의 다른 아미노산을 치환할 수 있다. 치환은 보존적 치환(예를 들어, 염기성 아미노산으로 다른 염기성 아미노산을 치환함)일 수 있다. 치환은 비-보존적 치환(예를 들어, 염기성 아미노산으로 산성 아미노산을 치환하거나 또는 그의 역)일 수 있다. 예를 들어, 참조 CasX 단백질 내의 프롤린으로 아르기닌, 히스티딘, 리신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 알라닌, 아이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신, 또는 발린 중 임의의 것을 치환하여 본 개시내용의 CasX 변이체 단백질을 생성할 수 있다.
본 명세서에 기재된 치환, 삽입, 및 결실 실시 형태의 임의의 순열을 조합하여 본 개시내용의 CasX 변이체 단백질을 생성할 수 있다. 예를 들어, CasX 변이체 단백질은 참조 CasX 단백질 서열 또는 CasX 491 또는 CasX 515의 서열에 비교하여 하나 이상의 치환 및 하나 이상의 결실, 참조 CasX 단백질 서열 또는 CasX 491 또는 CasX 515의 서열에 비교하여 하나 이상의 치환 및 하나 이상의 삽입, 참조 CasX 단백질 서열 또는 CasX 491 또는 CasX 515의 서열에 비교하여 하나 이상의 삽입 및 하나 이상의 결실, 또는 참조 CasX 단백질 서열 또는 CasX 491 또는 CasX 515의 서열에 비교하여 하나 이상의 치환, 하나의 삽입, 및 하나의 결실을 포함할 수 있다.
일부 실시 형태에서, CasX 변이체 단백질은 400 내지 2000개의 아미노산, 500 내지 1500개의 아미노산, 700 내지 1200개의 아미노산, 800 내지 1100개의 아미노산, 또는 900 내지 1000개의 아미노산을 포함한다.
일부 실시 형태에서, CasX 변이체 단백질은 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열을 포함한다. 일부 실시 형태에서, CasX 변이체 단백질은 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열로 이루어진다. 다른 실시 형태에서, CasX 변이체 단백질은 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 동일한 서열을 포함한다. 일부 실시 형태에서, CasX 변이체 단백질은 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열을 포함하거나 이로 이루어진다. 다른 실시 형태에서, CasX 변이체 단백질은 서열 번호 85 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 동일한 서열을 포함한다. 일부 실시 형태에서, CasX 변이체 단백질은 서열 번호 85 내지 160, 40208 내지 40369, 또는 40828 내지 40912의 서열을 포함하거나 이로 이루어진다.
c. 다중 공급원 단백질로부터의 도메인을 갖는 CasX 변이체 단백질
소정의 실시 형태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 2개 이상의 상이한 CasX 단백질, 예컨대 2개 이상의 참조 CasX 단백질, 또는 2개 이상의 CasX 변이체 단백질 서열로부터의 단백질 도메인을 포함하는 AAV 시스템에 사용하기 위한 키메라 CasX 단백질을 제공한다. 본 명세서에 사용되는 바와 같이, "키메라 CasX 단백질"은, 일부 실시 형태에서, 상이한 종으로부터 단리될 수 있는 2개의 천연 발생 단백질과 같은 상이한 공급원으로부터 단리되거나 유래된 2개 이상의 도메인을 함유하는 CasX를 지칭한다. 예를 들어, 일부 실시 형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 제1 도메인 및 상이한 제2 CasX 단백질로부터의 제2 도메인을 포함한다. 일부 실시 형태에서, 제1 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 및 RuvC 도메인으로 이루어진 군으로부터 선택될 수 있다. 일부 실시 형태에서, 제2 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 및 RuvC 도메인으로 이루어진 군으로부터 선택되며, 제2 도메인은 전술한 제1 도메인과는 상이하다. 예를 들어, 키메라 CasX 단백질은 서열 번호 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 I, 나선형 II, OBD 도메인, 및 서열 번호 1의 CasX 단백질로부터의 RuvC 도메인, 또는 그의 역을 포함할 수 있다. 추가의 예로서, 키메라 CasX 단백질은 서열 번호 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD, 및 RuvC 도메인, 및 서열 번호 1의 CasX 단백질로부터의 나선형 I 도메인, 또는 그의 역을 포함할 수 있다. 따라서, 소정의 실시 형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD, 및 RuvC 도메인, 및 제2 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있다. 키메라 CasX 단백질의 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 서열로부터 유래되고, 제2 CasX 단백질의 도메인은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 서열로부터 유래되고, 제1 및 제2 CasX 단백질은 동일하지 않다. 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 1로부터 유래된 서열을 포함하고 제2 CasX 단백질의 도메인은 서열 번호 2로부터 유래된 서열을 포함한다. 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 1로부터 유래된 서열을 포함하고 제2 CasX 단백질의 도메인은 서열 번호 3으로부터 유래된 서열을 포함한다. 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 2로부터 유래된 서열을 포함하고 제2 CasX 단백질의 도메인은 서열 번호 3으로부터 유래된 서열을 포함한다.
일부 실시 형태에서, CasX 변이체 단백질은 제1 CasX 단백질로부터의 제1 부분 및 상이한 제2 CasX 단백질로부터의 제2 부분을 포함하는 하나 이상의 키메라 도메인을 포함한다. 본 명세서에 사용되는 바와 같이, "키메라 도메인"은 상이한 공급원으로부터 단리되거나 유래된 2개 이상의 부분, 예컨대 2개의 천연 발생 단백질 또는 2개의 참조 CasX 단백질로부터의 도메인의 부분을 함유하는 단일 도메인을 지칭한다. 하나 이상의 키메라 도메인은 본 명세서에 기재된 바와 같은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 또는 RuvC 도메인 중 임의의 것일 수 있다. 일부 실시 형태에서, CasX 도메인의 제1 부분은 서열 번호 1의 서열을 포함하고 CasX 도메인의 제2 부분은 서열 번호 2의 서열을 포함한다. 일부 실시 형태에서, CasX 도메인의 제1 부분은 서열 번호 1의 서열을 포함하고 CasX 도메인의 제2 부분은 서열 번호 3의 서열을 포함한다. 일부 실시 형태에서, CasX 도메인의 제1 부분은 서열 번호 2의 서열을 포함하고 CasX 도메인의 제2 부분은 서열 번호 3의 서열을 포함한다. 일부 실시 형태에서, 하나 이상의 키메라 도메인은 키메라 RuvC 도메인을 포함한다. 전술한 것들의 예로서, 키메라 RuvC 도메인은 서열 번호 1의 아미노산 661 내지 824 및 서열 번호 2의 아미노산 922 내지 978을 포함한다. 전술한 것들의 대안적인 예로서, 키메라 RuvC 도메인은 서열 번호 2의 아미노산 648 내지 812 및 서열 번호 1의 아미노산 935 내지 986을 포함한다. 일부 실시 형태에서, CasX 단백질은 제1 CasX 단백질로부터의 제1 도메인 및 제2 CasX 단백질로부터의 제2 도메인, 및 본 단락에 기재된 실시 형태의 접근법을 사용하여 상이한 CasX 단백질로부터 단리된 2개 이상의 부분을 포함하는 하나 이상의 키메라 도메인을 포함한다.
일부 실시 형태에서, AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 표 3에 기술된 서열을 포함한다. 다른 실시 형태에서, CasX 변이체 단백질은 표 3에 기술된 바와 같은 서열로 이루어진 군으로부터 선택된 서열과 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 99.5% 이상 동일한 서열을 포함한다.
[표 3]
d. gRNA에 대한 단백질 친화도
일부 실시 형태에서, 본 개시내용의 AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 참조 CasX 단백질에 비교하여 gRNA에 대한 개선된 친화도를 가지며, 이는 리보핵단백질 복합체의 형성으로 이어진다. gRNA에 대한 CasX 변이체 단백질의 증가된 친화도는, 예를 들어, RNP 복합체의 생성에 대한 더 낮은 Kd를 유발할 수 있으며, 이는 일부 경우에 더 안정한 리보핵단백질 복합체 형성을 유발한다. 일부 실시 형태에서, gRNA에 대한 CasX 변이체 단백질의 증가된 친화도는 인간 세포에 전달될 경우에 리보핵단백질 복합체의 증가된 안정성을 유발한다. 대상체에게 전달될 경우에, 이러한 증가된 안정성은 대상체의 세포에서 복합체의 기능 및 유용성에 영향을 미칠뿐만 아니라 개선된 혈중 약동학적 특성을 유발할 수 있다. 일부 실시 형태에서, CasX 변이체 단백질의 증가된 친화도, 및 생성되는 리보핵단백질 복합체의 증가된 안정성은, 원하는 활성, 예를 들어 생체내 또는 시험관내 유전자 편집을 여전히 가지면서 대상체 또는 세포에 전달될 CasX 변이체 단백질의 더 낮은 용량을 가능하게 한다. 일부 실시 형태에서, gRNA에 대한 CasX 변이체 단백질의 더 높은 친화도(더 강한 결합)는 CasX 변이체 단백질 및 gRNA 둘 모두가 RNP 복합체 내에 잔류할 경우에 더 많은 양의 편집 사건을 가능하게 한다. 증가된 편집 사건은 본 명세서에 기재된 EGFP 붕괴 검정과 같은 편집 검정을 사용하여 평가할 수 있다.
일부 실시 형태에서, gRNA에 대한 CasX 변이체 단백질의 Kd는 참조 CasX 단백질에 비교하여 약 1.1 이상, 약 1.2 이상, 약 1.3 이상, 약 1.4 이상, 약 1.5 이상, 약 1.6 이상, 약 1.7 이상, 약 1.8 이상, 약 1.9 이상, 약 2 이상, 약 3 이상, 약 4 이상, 약 5 이상, 약 6 이상, 약 7 이상, 약 8 이상, 약 9 이상, 약 10 이상, 약 15 이상, 약 20 이상, 약 25 이상, 약 30 이상, 약 35 이상, 약 40 이상, 약 45 이상, 약 50 이상, 약 60 이상, 약 70 이상, 약 80 이상, 약 90 이상, 또는 약 100 이상의 비율만큼 증가된다. 일부 실시 형태에서, CasX 변이체는 서열 번호 2의 참조 CasX 단백질에 비교하여 약 1.1 내지 약 10-배 증가된 gRNA에 대한 결합 친화도를 갖는다.
일부 실시 형태에서, gRNA에 대한 CasX 변이체 단백질의 증가된 친화도는, 대상체에 대한 생체내 전달을 포함하여, 포유류 세포에 전달될 경우에 리보핵단백질 복합체의 증가된 안정성을 유발한다. 대상체에게 전달될 경우에, 이러한 증가된 안정성은 대상체의 세포에서 복합체의 기능 및 유용성에 영향을 미칠뿐만 아니라 개선된 혈중 약동학적 특성을 유발할 수 있다. 일부 실시 형태에서, CasX 변이체 단백질의 증가된 친화도, 및 생성되는 리보핵단백질 복합체의 증가된 안정성은, 원하는 활성; 예를 들어 생체내 또는 시험관내 유전자 편집을 여전히 가지면서 대상체 또는 세포에 전달될 CasX 변이체 단백질의 더 낮은 용량을 가능하게 한다. RNP를 형성하고 이들을 안정한 형태로 유지하는 증가된 능력은 본 명세서에서 실시예에 기재된 시험관내 절단 검정과 같은 검정을 사용하여 평가할 수 있다. 일부 실시 형태에서, 본 개시내용의 CasX 변이체를 포함하는 RNP는 RNP로서 복합체화될 경우에 서열 번호 1 내지 3의 참조 CasX를 포함하는 RNP에 비교하여 2-배 이상, 5-배 이상, 또는 10-배 이상 더 높은 k절단 속도를 달성할 수 있다.
일부 실시 형태에서, gRNA에 대한 CasX 변이체 단백질의 더 높은 친화도(더 강한 결합)는 CasX 변이체 단백질 및 gRNA 둘 모두가 RNP 복합체 내에 잔류할 경우에 더 많은 양의 편집 사건을 가능하게 한다. 증가된 편집 사건은 본 명세서에 기재된 검정과 같은 편집 검정을 사용하여 평가할 수 있다.
이론에 구애되고자 함이 없이, 일부 실시 형태에서 나선형 I 도메인 내의 아미노산 변화는 gRNA 표적화 서열과 CasX 변이체 단백질의 결합 친화도를 증가시킬 수 있는 반면에, 나선형 II 도메인 내의 변화는 gRNA 스캐폴드 스템 루프와 CasX 변이체 단백질의 결합 친화도를 증가시킬 수 있고, 올리고뉴클레오티드 결합 도메인(OBD) 내의 변화는 gRNA 삼중체와 CasX 변이체 단백질의 결합 친화도를 증가시킨다.
gRNA에 대한 CasX 단백질 결합 친화도를 측정하는 방법은 정제된 CasX 단백질 및 gRNA를 사용하는 시험관내 방법을 포함한다. 참조 CasX 및 변이체 단백질에 대한 결합 친화도는 gRNA 또는 CasX 단백질이 형광단으로 태깅되는 경우에 형광 편광에 의해 측정될 수 있다. 대안적으로, 또는 부가적으로, 결합 친화도는 생물층 간섭계(biolayer interferometry), 전기영동 이동성 변화 검정(EMSA: electrophoretic mobility shift assay), 또는 필터 결합에 의해 측정될 수 있다. 참조 gRNA 및 이의 변이체와 같은 특이적 gRNA에 대한 본 개시내용의 참조 CasX 및 변이체 단백질과 같은 RNA 결합 단백질의 절대 친화도를 정량화하는 부가적인 표준 기술은 등온 열량측정법(ITC), 및 표면 플라스몬 공명 (SPR)뿐만 아니라 실시예의 방법을 포함하지만 이로 제한되지 않는다.
e. 표적 핵산에 대한 친화도
일부 실시 형태에서, 본 개시내용의 AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 표적 핵산 서열에 대한 참조 CasX 단백질의 친화도에 비교하여 개선된 표적 핵산 서열에 대한 결합 친화도를 갖는다. 그들의 표적 핵산에 대한 더 높은 친화도를 갖는 CasX 변이체는, 일부 실시 형태에서, 표적 핵산에 대한 증가된 친화도를 갖지 않는 참조 CasX 단백질보다 더 신속하게 표적 핵산 서열을 절단할 수 있다. 일부 실시 형태에서, 표적 핵산 서열에 대한 개선된 친화도는 표적 핵산 서열에 대한 개선된 친화도, 더 넓은 스펙트럼의 PAM 서열에 대한 개선된 결합 친화도, 표적 핵산 서열에 대해 DNA를 검색하는 개선된 능력, 또는 이들의 임의의 조합을 포함한다. 이론에 구애되고자 함이 없이, CasX와 같은 CRISPR/Cas 시스템 단백질은 DNA 분자를 따라 1-차원 확산에 의해 이들의 표적 핵산 서열을 탐색할 수 있는 것으로 생각된다. 본 공정은 (1) DNA 분자에 대한 리보핵단백질의 결합에 이어서 (2) 표적 핵산 서열에서 멈추는 단계를 포함하는 것으로 생각되며, 이들 중 어느 하나는, 일부 실시 형태에서, 표적 핵산 서열에 대한 CasX 단백질의 개선된 친화도에 의해 영향을 받음으로써, 참조 CasX 단백질에 비교하여 CasX 변이체 단백질의 기능을 개선할 수 있다.
일부 실시 형태에서, AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 표적 핵산의 비-표적 가닥에 대한 개선된 결합 친화도를 갖는다. 본 명세서에 사용되는 바와 같이, 용어 "비-표적 가닥"은 gRNA 내의 표적화 서열과 왓슨 및 크릭 염기쌍을 형성하지 않고 표적 가닥에 상보적인 DNA 표적 핵산 서열의 가닥을 지칭한다. 일부 실시 형태에서, CasX 변이체 단백질은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 단백질, 또는 CasX 변이체 119(서열 번호 72) 및 CasX 491(서열 번호 138)에 비교하여 표적 핵산의 비-표적 가닥에 대해 약 1.1 내지 약 100-배 증가된 결합 친화도를 갖는다.
표적 핵산 분자에 대한 CasX 단백질(예컨대 참조 또는 변이체) 친화도를 결정하는 방법은 전기영동 이동성 변화 검정(EMSA), 필터 결합, 등온 열량측정법(ITC), 및 표면 플라스몬 공명(SPR), 형광 편광, 및 생물층 간섭계(BLI)를 포함할 수 있다. 표적에 대한 CasX 단백질 친화도를 측정하는 추가의 방법은 시간 경과에 따라 DNA 절단 사건을 측정하는 시험관내 생화학적 검정을 포함한다.
일부 실시 형태에서, AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 촉매 활성이 소멸된다(dCasX). 일부 실시 형태에서, 본 개시내용은 표적 DNA에 결합하는 능력을 유지하는 촉매 활성이 소멸된 CasX 단백질을 포함하는 RNP를 제공한다. 예시적인 촉매 활성이 소멸된 CasX 변이체 단백질은 CasX 단백질의 RuvC 도메인의 활성 부위에 하나 이상의 돌연변이를 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은 서열 번호 1의 잔기 672, 769, 및/또는 935에 치환을 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은 서열 번호 1의 참조 CasX 단백질 내에 D672A, E769A, 및/또는 D935A의 치환을 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 단백질은 서열 번호 2의 아미노산 659, 765, 및/또는 922에 치환을 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 단백질은 서열 번호 2의 참조 CasX 단백질 내에 D659A, E756A, 및/또는 D922A 치환을 포함한다. 추가의 실시 형태에서, 촉매 활성이 소멸된 참조 CasX 단백질은 참조 CasX 단백질의 RuvC 도메인의 전부 또는 일부의 결실을 포함한다. 예시적인 dCasX 서열은 표 7에 서열 번호 40808 내지 40827, 41006 내지 41009로서 제공되어 있다.
일부 실시 형태에서, CasX 변이체 단백질의 DNA에 대한 개선된 친화도는 CasX 변이체 단백질의 촉매적으로 불활성인 버전의 기능을 또한 개선한다. 일부 실시 형태에서, CasX 변이체 단백질의 촉매적으로 불활성인 버전은 RuvC 내의 DED 모티프에 하나 또는 돌연변이를 포함한다. 촉매 활성이 소멸된 CasX 변이체 단백질은, 일부 실시 형태에서, 염기 편집 또는 후성유전학적 변형에 사용될 수 있다. DNA에 대한 더 높은 친화도로, 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은, 촉매적으로 활성인 CasX에 비교하여, 이들의 표적 DNA를 더 신속하게 탐색하거나, 더 긴 기간 동안 표적 DNA에 결합되어 유지되거나, 더 안정한 양상으로 표적 DNA에 결합하거나, 이들의 조합에 의해, 촉매 활성이 소멸된 CasX 변이체 단백질의 기능을 개선할 수 있다.
f. 표적 부위에 대한 개선된 특이성
일부 실시 형태에서, AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 참조 CasX 단백질에 비교하여 표적 핵산 서열에 대한 개선된 특이성을 갖는다. 본 명세서에 사용되는 바와 같이, 상호교환적으로 "표적 특이성"으로 지칭되는 "특이성"은 CRISPR/Cas 시스템 리보핵단백질 복합체가 표적 핵산 서열과 유사하지만 동일하지는 않은 표적-외 서열을 절단하는 정도를 지칭하며; 예를 들어, 더 높은 정도의 특이성을 갖는 CasX 변이체 RNP는 참조 CasX 단백질에 비교하여 서열의 감소된 표적-외 절단을 나타낼 것이다. CRISPR/Cas 시스템 단백질의 특이성, 및 잠재적으로 유해한 표적-외 효과의 감소는 포유류 대상체에서의 사용을 위해 허용가능한 치료 지수를 달성하기 위해 매우 중요할 수 있다.
이론에 구애되고자 함이 없이, 표적 핵산 가닥에 대한 CasX 변이체 단백질의 특이성을 증가시키는 나선형 I 및 II 도메인 내의 아미노산 변화는 전반적인 표적 핵산 서열에 대한 CasX 변이체 단백질의 특이성을 증가시킬 수 있다는 것이 가능하다. 일부 실시 형태에서, 표적 핵산 서열에 대한 CasX 변이체 단백질의 특이성을 증가시키는 아미노산 변화는 또한 DNA에 대한 CasX 변이체 단백질의 감소된 친화도를 유발할 수 있다.
CasX 단백질(예컨대 변이체 또는 참조) 표적 특이성을 시험하는 방법은 가이드 및 서열분석에 의한 절단 효과의 시험관내 보고를 위한 원형화(CIRCLE-seq: Circularization for In vitro Reporting of Cleavage Effects by Sequencing), 또는 유사한 방법을 포함할 수 있다. 약술하면, CIRCLE-seq 기술에서는, 게놈 DNA를 전단하고 스템-루프 어댑터의 라이게이션에 의해 원형화하며, 이를 스템-루프 영역 내에서 닉킹하여 4개 뉴클레오티드 회문성 돌출부를 노출시킨다. 이후에 분자내 라이게이션 및 나머지 선형 DNA의 분해가 이어진다. CasX 절단 부위를 함유하는 원형 DNA 분자를 후속적으로 CasX로 선형화하고, 어댑터를 노출된 단부에 라이게이션한 후에 표적-외 부위에 대한 정보를 함유하는 대합 단부 판독(paired end read)을 생성하기 위한 고-처리량 서열분석이 이어진다. 표적-외 사건, 및 따라서 CasX 단백질 특이성을 검출하기 위해 사용될 수 있는 부가적인 검정은, 그러한 선택된 표적-외 부위에 형성되는 인델(삽입 및 결실)을 검출하고 정량화하기 위해 사용되는 검정, 예컨대 불일치-검출 뉴클레아제 검정 및 차세대 서열분석(NGS)을 포함한다. 예시적인 불일치-검출 검정은 CasX 및 sgRNA로 처리된 세포로부터의 게놈 DNA를 PCR 증폭하고, 변성시키고, 재혼성화하여 하나의 야생형 가닥 및 인델을 갖는 하나의 가닥을 함유하는 헤테로-이중체 DNA를 형성하는 뉴클레아제 검정을 포함한다. 불일치는 Surveyor 뉴클레아제 또는 T7 엔도뉴클레아제 I과 같은 불일치 검출 뉴클레아제에 의해 인식되고 절단된다.
g. 프로토스페이서 및 PAM 서열
본 명세서에서, 프로토스페이서는 가이드 RNA의 표적화 서열에 상보적인 DNA 서열 및 그 서열에 상보적인 DNA로서 정의되며, 표적 가닥 및 비-표적 가닥으로 지칭된다. 본 명세서에 사용되는 바와 같이, PAM은 프로토스페이서에 대해 근위에 있는 뉴클레오티드 서열이며, 이는 gRNA의 표적화 서열과 함께, 프로토스페이서 가닥(들)의 잠재적 절단을 위한 CasX의 배향 및 위치설정을 보조한다.
PAM 서열은 축퇴될 수 있고, 특이적 RNP 작제물은 상이한 바람직하고 용인되는 PAM 서열을 가질 수 있으며, 이는 상이한 절단 효율을 지지한다. 관습에 따라, 달리 언급되지 않는 한, 본 개시내용은 PAM 및 프로토스페이서 서열 둘 모두 및 비-표적 가닥의 배향에 따른 이들의 방향성을 지칭한다. 이는 표적 가닥 보다는 비-표적 가닥의 PAM 서열이 절단의 결정요인이거나 기전적으로 표적 인식에 관여한다는 것을 암시하지 않는다. 예를 들어, TTC PAM을 참조하는 경우, 그것은 사실상 표적 절단에 필요한 상보적인 GAA 서열일 수 있거나, 그것은 둘 모두의 가닥으로부터의 뉴클레오티드의 일부 조합일 수 있다. 본 명세서에 개시된 CasX 단백질의 경우에, PAM은 프로토스페이서의 5'에 위치하며, 단일 뉴클레오티드가 PAM을 프로토스페이서의 제1 뉴클레오티드로부터 분리한다. 따라서, 정준 PAM이 TTC인 참조 CasX의 경우에, PAM은 화학식 5'-…NNTTCN(프로토스페이서)NNNNNN…3'에 따른 서열을 의미하는 것으로 이해되어야 하며, 상기 식에서 'N'은 임의의 DNA 뉴클레오티드이고 '(프로토스페이서)'는 가이드 RNA의 표적화 서열과 동일성을 갖는 DNA 서열이다. 확장된 PAM 인식을 갖는 CasX 변이체의 경우에, TTC, CTC, GTC, 또는 ATC PAM은 하기 화학식에 따른 서열을 의미하는 것으로 이해되어야 한다:
5'-…NNTTCN(프로토스페이서)NNNNNN…3';
5'-…NNCTCN(프로토스페이서)NNNNNN…3';
5'-…NNGTCN(프로토스페이서)NNNNNN…3'; 또는
5'-…NNATCN(프로토스페이서)NNNNNN…3'. 대안적으로, TC PAM은 화학식 5'-…NNNTCN(프로토스페이서)NNNNNN…3'에 따른 서열을 의미하는 것으로 이해되어야 한다.
부가적으로, 본 개시내용의 CasX 변이체 단백질은, TTC, ATC, GTC, 또는 CTC(5'에서 3'으로의 배향으로)로부터 선택된 PAM 서열을 포함하는 PAM TC 모티프를 이용하여, RNP로서 gRNA와 복합체화될 경우에, 참조 CasX 단백질 및 참조 gRNA의 RNP, 또는 그것이 유래된 다른 CasX 변이체의 RNP, 예컨대 CasX 491, 및 gRNA 174에 비교하여, 표적 핵산을 효율적으로 편집하고/하거나 결합하는 향상된 능력을 갖는다. 전술한 것들에서, PAM 서열은 유사한 검정 시스템에서 참조 CasX 단백질 및 참조 gRNA를 포함하는 RNP의 편집 효율 및/또는 결합에 비교하여 검정 시스템에서 gRNA의 표적화 서열과 동일성을 갖는 프로토스페이서의 비-표적 가닥에 대해 1개 이상의 뉴클레오티드 5'에 위치한다. 일 실시 형태에서, CasX 변이체 및 gRNA 변이체의 RNP는, 유사한 검정 시스템에서, 참조 CasX 단백질 및 참조 gRNA를 포함하는 RNP(또는 그것이 유래된 다른 CasX 변이체의 RNP, 예컨대 CasX 491, 및 gRNA 174)에 비교하여 표적 핵산 내의 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 TTC이다. 다른 실시 형태에서, CasX 변이체 및 gRNA 변이체의 RNP는, 유사한 검정 시스템에서, 참조 CasX 단백질 및 참조 gRNA를 포함하는 RNP(또는 그것이 유래된 다른 CasX 변이체의 RNP, 예컨대 CasX 491, 및 gRNA 174)에 비교하여 표적 핵산 내의 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 ATC이다. CasX 변이체가 ATC PAM을 이용한 향상된 편집을 나타내는, 전술한 것들의 특정 실시 형태에서, CasX 변이체는 528(서열 번호 157)이다. 다른 실시 형태에서, CasX 변이체 및 gRNA 변이체의 RNP는, 유사한 검정 시스템에서, 참조 CasX 단백질 및 참조 gRNA를 포함하는 RNP(또는 그것이 유래된 다른 CasX 변이체의 RNP, 예컨대 CasX 491, 및 gRNA 174)에 비교하여 표적 핵산 내의 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 CTC이다. 다른 실시 형태에서, CasX 변이체 및 gRNA 변이체의 RNP는, 유사한 검정 시스템에서, 참조 CasX 단백질 및 참조 gRNA를 포함하는 RNP(또는 그것이 유래된 다른 CasX 변이체 및 gRNA 174의 RNP)에 비교하여 표적 핵산 내의 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 GTC이다. 전술한 실시 형태에서, 하나 이상의 PAM 서열에 대한 증가된 편집 효율 및/또는 결합 친화도는 서열 번호 1 내지 3의 CasX 단백질 중 어느 하나 및 PAM 서열에 대해 표 1의 서열을 포함하는 gRNA의 RNP의 편집 효율 및/또는 결합 친화도에 비교하여 1.5-배 이상, 2-배 이상, 4-배 이상, 10-배 이상, 20-배 이상, 30-배 이상, 또는 40-배 이상 더 크다. 개선된 편집을 입증하는 예시적인 검정이 실시예에서 본 명세서에 기재된다. 일부 실시 형태에서, CasX 단백질은 표적 핵산 및/또는 표적 핵산과 관련된 폴리펩티드(예를 들어, 히스톤 테일의 메틸화 또는 아세틸화)에 결합하고/하거나 이를 변형시킬 수 있다(예를 들어, 절단, 닉킹, 메틸화, 탈메틸화 등). 일부 실시 형태에서, CasX 단백질은 촉매 활성이 소멸되지만(dCasX) 표적 핵산에 결합하는 능력은 유지한다.
h. 표적 RNA에 대한 친화도
일부 실시 형태에서, 본 개시내용의 AAV 시스템에 사용하기 위한 참조 CasX 단백질의 변이체는 참조 CasX 단백질에 비교할 경우에 표적 RNA에 대한 증가된 특이성, 및 표적 RNA에 대한 증가된 활성을 갖는다. 예를 들어, CasX 변이체 단백질은 참조 CasX 단백질에 비교할 경우에 표적 RNA에 대한 증가된 결합 친화도, 또는 표적 RNA의 증가된 절단을 나타낼 수 있다. 일부 실시 형태에서, CasX 변이체 단백질을 포함하는 리보핵단백질 복합체는 표적 RNA에 결합하고/하거나 표적 RNA를 절단한다. 일부 실시 형태에서, CasX 변이체는 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 단백질에 비교하여 약 2-배 내지 약 10-배 증가된 표적 RNA에 대한 결합 친화도를 갖는다.
i. 다중 공급원 단백질로부터의 도메인을 갖는 CasX 변이체 단백질
일부 실시 형태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 2개 이상의 상이한 CasX 단백질, 예컨대 2개 이상의 천연 발생 CasX 단백질, 또는 2개 이상의 CasX 변이체 단백질 서열로부터의 단백질 도메인을 포함하는 키메라 CasX 변이체 단백질을 인코딩하는 AAV를 제공한다. 본 명세서에 사용되는 바와 같이, "키메라 CasX 단백질"은, 일부 실시 형태에서, 상이한 종으로부터 단리될 수 있는 2개의 천연 발생 단백질과 같은 상이한 공급원으로부터 단리되거나 유래된 2개 이상의 도메인을 함유하는 CasX를 지칭한다. 예를 들어, 일부 실시 형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 제1 도메인 및 상이한 제2 CasX 단백질로부터의 제2 도메인을 포함한다. 일부 실시 형태에서, 제1 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 및 RuvC 도메인으로 이루어진 군으로부터 선택될 수 있다. 일부 실시 형태에서, 제2 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD, 및 RuvC 도메인으로 이루어진 군으로부터 선택되며, 제2 도메인은 전술한 제1 도메인과는 상이하다. 예를 들어, 키메라 CasX 단백질은 서열 번호 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 I, 나선형 II, OBD 도메인, 및 서열 번호 1의 CasX 단백질로부터의 RuvC 도메인, 또는 그의 역을 포함할 수 있다. 추가의 예로서, 키메라 CasX 단백질은 서열 번호 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD, 및 RuvC 도메인, 및 서열 번호 1의 CasX 단백질로부터의 나선형 I 도메인, 또는 그의 역을 포함할 수 있다. 따라서, 소정의 실시 형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD, 및 RuvC 도메인, 및 제2 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있다. 키메라 CasX 단백질의 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 서열로부터 유래되고, 제2 CasX 단백질의 도메인은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 서열로부터 유래되고, 제1 및 제2 CasX 단백질은 동일하지 않다. 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 1로부터 유래된 서열을 포함하고 제2 CasX 단백질의 도메인은 서열 번호 2로부터 유래된 서열을 포함한다. 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 1로부터 유래된 서열을 포함하고 제2 CasX 단백질의 도메인은 서열 번호 3으로부터 유래된 서열을 포함한다. 일부 실시 형태에서, 제1 CasX 단백질의 도메인은 서열 번호 2로부터 유래된 서열을 포함하고 제2 CasX 단백질의 도메인은 서열 번호 3으로부터 유래된 서열을 포함한다. 전술한 것들의 예로서, 키메라 RuvC 도메인은 서열 번호 1의 아미노산 660 내지 823 및 서열 번호 2의 아미노산 921 내지 978을 포함한다. 전술한 것들의 대안적인 예로서, 키메라 RuvC 도메인은 서열 번호 2의 아미노산 647 내지 810 및 서열 번호 1의 아미노산 934 내지 986을 포함한다. 일부 실시 형태에서, 하나 이상의 키메라 도메인은 서열 번호 1의 아미노산 56 내지 99 및 서열 번호 2의 아미노산 192 내지 332를 포함하는 키메라 나선형 I 도메인을 포함한다. 일부 실시 형태에서, 서열 번호 40959, 서열 번호 40960, 서열 번호 40968, 서열 번호 40977, 서열 번호 40969, 서열 번호 40970, 서열 번호 40971, 서열 번호 40972, 서열 번호 40973, 서열 번호 40961, 서열 번호 40978, 서열 번호 40962, 서열 번호 40979, 서열 번호 40963, 서열 번호 40980, 서열 번호 40964, 서열 번호 40981, 서열 번호 40965, 서열 번호 40982, 서열 번호 40966, 서열 번호 40983, 서열 번호 40967, 서열 번호 40974, 서열 번호 40975, 서열 번호 40976, 서열 번호 40984, 및 서열 번호 40985의 서열로 이루어진 군으로부터 선택된 CasX 변이체를 포함하는, 키메라 CasX 변이체는 추가로 변형된다. 일부 실시 형태에서, 하나 이상의 부가적인 변형은 본 명세서에 기재된 바와 같은 삽입, 치환, 또는 결실을 포함한다.
나선형 I, RuvC, 및 OBD와 같은 분할되거나 비-근접한 도메인의 경우, 비-근접한 도메인의 일부가 임의의 다른 공급원으로부터의 상응하는 부분으로 대체될 수 있다. 예를 들어, 서열 번호 2에서 나선형 I-I 도메인(간혹 나선형 I-a로 지칭됨)은 서열 번호 1로부터의 상응하는 나선형 I-I 서열 등으로 대체될 수 있다 참조 CasX 단백질로부터의 도메인 서열, 및 이들의 좌표(coordinate)를 표 4에 나타낸다. 키메라 CasX 단백질의 대표적인 예는 CasX 472 내지 483, 485 내지 491, 및 515의 변이체를 포함하며, 이들의 서열은 표 3에 기술된다.
[표 4]
예시적인 도메인 서열은 하기 표 5에 제공된다.
[표 5]
추가의 예시적인 나선형 II 도메인 서열은 서열 번호 41004로서 제공되고, 추가의 예시적인 RuvC a 도메인 서열은 서열 번호 41005로서 제공된다.
다른 실시 형태에서, CasX 변이체 단백질은 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40286, 또는 40828 내지 40912의 서열을 포함하며, N-말단, C-말단, 또는 둘 모두에 또는 그 부근에 본 명세서에 개시된 하나 이상의 NLS를 추가로 포함한다. 다른 실시 형태에서, CasX 변이체 단백질은 서열 번호 72 내지 160, 40208 내지 40286, 또는 40828 내지 40912의 서열을 포함하며, N-말단, C-말단, 또는 둘 모두에 또는 그 부근에 본 명세서에 개시된 하나 이상의 NLS를 추가로 포함한다. 다른 실시 형태에서, CasX 변이체 단백질은 서열 번호 144 내지 160, 40208 내지 40286, 또는 40828 내지 40912의 서열을 포함하며, N-말단, C-말단, 또는 둘 모두에 또는 그 부근에 본 명세서에 개시된 하나 이상의 NLS를 추가로 포함한다. 일부 경우에, 표의 CasX 변이체의 N-말단 메티오닌은 발현된 CasX 변이체로부터 번역-후 변형 중에 제거된다는 것이 이해될 것이다. 단백질의 N 또는 C 말단 부근의 NLS는 N 또는 C 말단의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20, 또는 20개의 아미노산 이내일 수 있다는 것을 당업자는 이해할 것이다.
j. 다른 CasX 변이체로부터 유래된 CasX 변이체
변이체 단백질의 생성의 추가의 반복에서, 변이체 단백질을 이용하여 본 개시내용의 부가적인 CasX 변이체를 생성할 수 있다. 예를 들어, CasX 119(서열 번호 72), CasX 491(서열 번호 138), 및 CasX 515(서열 번호 145)는 참조 CasX 또는 이들이 유래된 CasX 변이체에 비교하여 개선 또는 부가적인 특성을 갖는 본 개시내용의 부가적인 CasX 변이체를 생성하기 위해 변형되는 예시적인 변이체 단백질이다. CasX 119는 서열 번호 2의 L379R의 치환, A708K의 치환, 및 위치 793에서의 P의 결실을 포함한다. CasX 491은 서열 번호 1로부터의 NTSB 및 나선형 1B 스왑을 함유한다. CasX 515는 CasX 491로부터 위치 793에서의 P의 삽입(서열 번호 2에 비교하여)에 의해 유래되었으며, 실시예 21에 기재된 CasX 변이체를 생성하기 위해 사용되었다. 예를 들어, CasX 668은 CasX 515에 비교하여 위치 26에서의 R의 삽입 및 G223S의 치환을 갖는다. CasX 672는 CasX 515에 비교하여 L169K 및 G223S의 치환을 갖는다. CasX 676은 CasX 515에 비교하여 L169K 및 G223S의 치환 및 위치 26에서의 R의 삽입을 갖는다.
다른 CasX 변이체로부터 유래된 CasX 변이체를 생성하고 평가하기 위해 사용되는 예시적인 방법은 실시예에 기재되어 있으며, 이들은 CasX 변이체의 하나 이상의 도메인 내의 하나 이상의 위치에서 아미노산 치환, 결실, 또는 삽입을 유발하는 인코딩 서열에 변형을 도입함으로써 생성되었다. 특히, 실시예 21은 CasX 515(서열 번호 145)의 변이체를 생성하기 위해 사용되는 방법을 기재하며, 이어서 이를 검정하여 아미노산 삽입, 결실, 또는 치환에 의해 변형될 경우에 검정에서 농축 또는 개선을 유발한 서열 내의 위치를 결정하였다. 본 개시내용의 목적을 위해, CasX 515의 도메인의 서열은 표 6에 제공되며, 서열 번호 40995의 서열을 갖는 OBD-I 도메인, 서열 번호 41000의 서열을 갖는 OBD-II 도메인, 서열 번호 40988의 서열을 갖는 NTSB 도메인, 서열 번호 40996의 서열을 갖는 나선형 I-I 도메인, 서열 번호 40989의 서열을 갖는 나선형 I-II 도메인, 서열 번호 41004의 서열을 갖는 나선형 II 도메인, 서열 번호 41005의 서열을 갖는 RuvC-I 도메인, 서열 번호 41003의 서열을 갖는 RuvC-II 도메인, 및 서열 번호 41002의 서열을 갖는 TSL 도메인을 포함한다. 본 개시내용의 방법에 의해, CasX 515의 도메인 내의 개별 위치가 변형되고, 검정되고, 각각의 도메인 또는 서브도메인 내의 이들의 위치에 비교하여, 생성되는 위치 및 후속의 농축 또는 개선으로 이어지는 예시적인 변형이 제공된다. 일부 경우에, 그러한 위치는 실시예의 표 30 내지 표 33에 개시된다. 일부 실시 형태에서, 본 개시내용은 NTSB 도메인 서열(서열 번호 40988)에 비교하여 NTSB 도메인 내의 하나 이상의 아미노산 위치에 P2, S4, Q9, E15, G20, G33, L41, Y51, F55, L68, A70, E75, K88, 및 G90으로 이루어진 군으로부터 선택된 하나 이상의 변형(즉, 삽입, 결실, 또는 치환)을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, NTSB 도메인 서열(서열 번호 40988)에 비교하여 NTSB 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 ^G2, ^I4, ^L4, Q9P, E15S, G20D, [S30], G33T, L41A, Y51T, F55V, L68D, L68E, L68K, A70Y, A70S, E75A, E75D, E75P, K88Q, 및 G90Q(여기서 "^"는 그 위치에서의 삽입을 나타내고 "[ ]"은 결실을 나타냄)로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 나선형 I-II 도메인 서열(서열 번호 40989)에 비교하여 나선형 I-II 도메인 내의 하나 이상의 아미노산 위치에 I24, A25, Y29 G32, G44, S48, S51, Q54, I56, V63, S73, L74, K97, V100, M112, L116, G137, F138, 및 S140으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, 나선형 I-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 ^T24, ^C25, Y29F,G32Y, G32N, G32H, G32S, G32T, G32A, G32V, [G32], G32S, G32T, G44L, G44H, S48H, S48T, S51T, Q54H, I56T, V63T, S73H, L74Y, K97G, K97S, K97D, K97E, V100L, M112T, M112W, M112R, M112K, L116K, G137R, G137K, G137N, ^Q138, 및 S140Q로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 나선형 II 도메인 서열(서열 번호 41004)에 비교하여 나선형 II 도메인 내의 하나 이상의 아미노산 위치에 L2, V3, E4, R5, Q6, A7, E9, V10, D11, W12, W13, D14, M15, V16, C17, N18, V19, K20, L22, I23, E25, K26, K31, Q35, L37, A38, K41,R 42, Q43, E44, L46, K57, Y65, G68, L70, L71, L72, E75, G79, D81, W82, K84, V85, Y86, D87, I93, K95, K96, E98, L100, K102, I104, K105, E109, R110, D114, K118, A120, L121, W124, L125, R126, A127, A129, I133, E134, G135, L136, E138, D140, K141, D142, E143, F144, C145, C147, E148, L149, K150, L151, Q152, K153, L158, E166, 및 A167로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, 나선형 II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 ^A2, ^H2, [L2]+[V3], V3E, V3Q, V3F, [V3], ^D3, V3P, E4P, [E4], E4D, E4L, E4R, R5N, Q6V, ^Q6, ^G7, ^H9, ^A9, VD10, ^T10, [V10], ^F10, ^D11, [D11], D11S, [W12], W12T, W12H, ^P12, ^Q13, ^G12, ^R13, W13P, W13D, ^D13, W13L, ^P14, ^D14, [D14]+[M15], [M15], ^T16, ^P17, N18I, V19N, V19H, K20D, L22D, I23S, E25C, E25P, ^G25, K26T, K27E, K31L, K31Y, Q35D, Q35P, ^S37, [L37]+[A38], K41L, ^R42, [Q43]+[E44], L46N, K57Q, Y65T, G68M, L70V, L71C, L72D, L72N, L72W, L72Y, E75F, E75L, E75Y,G79P, ^E79, ^T81, ^R81, ^W81, ^Y81, ^W82, ^Y82, W82G, W82R, K84D, K84H, K84P, K84T, V85L, V85A, ^L85, Y86C, D87G, D87M, D87P, I93C, K95T, K96R, E98G, L100A, K102H, I104T, I104S, I104Q, K105D, ^K109, E109L, R110D, [R110], D114E, ^D114, K118P, A120R, L121T, W124L, L125C, R126D, A127E, A127L, A129T, A129K, I133E, ^C133, ^S134, ^G134, ^R135, G135P, L136K, L136D, L136S, L136H, [E138], D140R, ^D140, ^P141, ^D142, [E143]+[F144], ^Q143, F144K, [F144], [F144]+[C145], C145R, ^G145, C145K, C147D, ^V148, E148D, ^H149, L149R, K150R, L151H, Q152C, K153P, L158S, E166L, 및 ^F167로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 RuvC-I 도메인 서열(서열 번호 41005)에 비교하여 RuvC-I 도메인 내의 하나 이상의 아미노산 위치에 I4, K5, P6, M7, N8, L9, V12, G49, K63, K80, N83, R90, M125, 및 L146으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, RuvC-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 ^I4, ^S5, ^T6, ^N6, ^R7, ^K7, ^H8, ^S8, V12L, G49W, G49R, S51R, S51K, K62S, K62T, K62E, V65A, K80E, N83G, R90H, R90G, M125S, M125A, L137Y, ^P137, [L141], L141R, L141D, ^Q142, ^R143, ^N143, E144N, ^P146, L146F, P147A, K149Q, T150V, ^R152, ^H153, T155Q, ^H155, ^R155, ^L156, [L156], ^W156, ^A157, ^F157, A157S, Q158K, [Y159], T160Y, T160F, ^I161, S161P, T163P, ^N163, C164K, 및 C164M으로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 OBD-I 도메인 서열(서열 번호 40995)에 비교하여 OBD-I 도메인 내의 하나 이상의 아미노산 위치에 I4, K5, P6, M7, N8, L9, V12, G49, K63, K80, N83, R90, M125, 및 L146으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, OBD-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 ^G3, I3G, I3E, ^G4, K4G, K4P, K4S, K4W, K4W, R5P, ^P5, ^G5, R5S, ^S5, R5A, R5P, R5G, R5L, I6A, I6L, ^G6, N7Q, N7L, N7S, K8G, K15F, D16W, ^F16, ^F18, ^P27, M28P, M28H, V33T, R34P, M36Y, R41P, L47P, ^P48, E52P, ^P55, [P55]+[Q56], Q56S, Q56P, ^D56, ^T56, 및 Q56P로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 OBD-II 도메인 서열(서열 번호 41000)에 비교하여 OBD-II 도메인 내의 하나 이상의 아미노산 위치에 I4, K5, P6, M7, N8, L9, V12, G49, K63, K80, N83, R90, M125, 및 L146으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, OBD-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 [S2], I3R, I3K, [I3]+[L4], [L4], K11T, ^P24, K37G, R42E, ^S53, ^R58, [K63], M70T, I82T, Q92I, Q92F, Q92V, Q92A, ^A93, K110Q, R115Q, L121T, ^A124, ^R141, ^D143, ^A143, ^W144, 및 ^A145로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 TSL 도메인 서열(서열 번호 41002)에 비교하여 TSL 도메인 내의 하나 이상의 아미노산 위치에 S1, N2, C3, G4, F5, I7, K18, V58, S67, T76, G78, S80, G81, E82, S85, V96, 및 E98로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는 CasX 515로부터 유래된 CasX 변이체를 제공하며, 여기서 변형은 CasX 515에 비교하여 개선된 특징을 유발한다. 특정 실시 형태에서, OBD-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 ^M1, [N2], ^V2, C3S, ^G4, ^W4, F5P, ^W7, K18G, V58D, ^A67, T76E, T76D, T76N, G78D, [S80], [G81], ^E82, ^N82, S85I, V96C, V96T, 및 E98D로 이루어진 군으로부터 선택된다. 단락의 전술한 동일한 변형 중 임의의 것의 조합이 본 개시내용의 CasX 변이체 내로 유사하게 도입되어, 개선된 특징을 갖는 CasX 변이체를 유발할 수 있다는 것이 이해될 것이다. 예를 들어, 일 실시 형태에서, 본 개시내용은 CasX 변이체 535(서열 번호 40211)를 제공하며, 이는 CasX 515에 비교하여 G223S의 단일 돌연변이를 갖는다. 다른 실시 형태에서, 본 개시내용은 CasX 변이체 668(서열 번호 40344)을 제공하며, 이는 CasX 515에 비교하여 위치 26에서의 R의 삽입 및 G223S의 치환을 갖는다. 다른 실시 형태에서, 본 개시내용은 CasX 672(서열 번호 40347)를 제공하며, 이는 CasX 515에 비교하여 L169K 및 G223S의 치환을 갖는다. 다른 실시 형태에서, 본 개시내용은 CasX 676(서열 번호 40351)을 제공하며, 이는 CasX 515에 비교하여 L169K 및 G223S의 치환 및 위치 26에서의 R의 삽입을 갖는다. CasX 515에 비교하여 개선된 특징을 갖는 CasX 변이체는 표 3의 변이체를 포함한다.
참조 CasX 단백질에서의 동일한 특징에 비교하여, 또는 이들이 유래된 CasX 변이체에 비교하여 CasX 변이체 단백질에서 개선될 수 있는 예시적인 특징은 변이체의 개선된 폴딩, gRNA에 대한 증가된 결합 친화도, 표적 핵산에 대한 증가된 결합 친화도, 표적 핵산의 편집 및/또는 결합에서 PAM 서열의 더 큰 스펙트럼을 이용하는 개선된 능력, 표적 DNA의 개선된 풀림, 증가된 편집 활성, 개선된 편집 효율, 표적 핵산에 대한 개선된 편집 특이성, 감소된 표적-외 편집 또는 절단, 효율적으로 편집될 수 있는 진핵생물 게놈의 증가된 백분율, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 닉킹에 대한 감소된 표적 가닥 로딩, DNA의 비-표적 가닥의 증가된 결합, 개선된 단백질 안정성, 개선된 단백질:gRNA(RNP) 복합체 안정성, 및 개선된 융합 특징을 포함하지만 이로 제한되지 않는다. 특정 실시 형태에서, 실시예에 기재된 바와 같이, 그러한 개선된 특징은 TTC, ATC, 및 CTC PAM 서열을 갖는 표적 핵산에서의 개선된 절단 활성, 표적 핵산 서열의 절단에 대한 증가된 특이성, 및 표적 핵산의 감소된 표적-외 절단을 포함할 수 있지만 이로 제한되지 않는다.
[표 6]
본 명세서에 기재된 실시 형태의 CasX 변이체는 본 명세서에 개시된 gRNA와 RNP 복합체를 형성하는 능력을 갖는다. 일부 실시 형태에서, 본 개시내용의 CasX 변이체 단백질 및 gRNA를 포함하는 RNP는, 20 pM 이하의 농도에서, 80% 이상의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 일부 실시 형태에서, RNP는 20 pM 이하의 농도에서 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 일부 실시 형태에서, RNP는 50 pM 이하, 40 pM 이하, 30 pM 이하, 20 pM 이하, 10 pM 이하, 또는 5 pM 이하의 농도에서 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 또는 95% 이상의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 이들 개선된 특징은 하기 더욱 상세하게 기재된다.
k. 촉매 활성이 소멸된 CasX 변이체
일부 실시 형태, 예를 들어 표적 핵산 서열의 절단이 원하는 결과가 아닌 응용을 포함하는 실시 형태에서, CasX 변이체 단백질의 촉매 활성을 개선하는 것은 CasX 변이체 단백질의 촉매 활성을 변경하거나, 감소시키거나, 말소하는 것을 포함한다. 일부 실시 형태에서 본 개시내용은, 표적 핵산에 상보적인 표적화 서열을 갖는 gRNA와 복합체화될 경우에 표적 핵산에 결합할 수 있지만 표적 핵산을 절단할 수 없는 촉매 활성이 소멸된 CasX 변이체 단백질을 제공한다. 예시적인 촉매 활성이 소멸된 CasX 단백질은 CasX 단백질의 RuvC 도메인의 활성 부위에 하나 이상의 돌연변이를 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은 서열 번호 1에 비교하여 잔기 672, 769, 및/또는 935에 치환을 포함한다. 일 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은 서열 번호 1의 참조 CasX 단백질에 비교하여 D672A, E769A, 및/또는 D935A의 치환을 포함한다. 다른 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은 서열 번호 2의 참조 CasX 단백질에 비교하여 아미노산 659, 756, 및/또는 922에 치환을 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 단백질은 서열 번호 2의 참조 CasX 단백질에 비교하여 D659A, E756A, 및/또는 D922A 치환을 포함한다. 일부 실시 형태에서, 촉매 활성이 소멸된 CasX 변이체 527, 668, 및 676 단백질은 엔도뉴클레아제 활성을 말소하기 위한 D660A, E757A, 및 D922A 변형을 포함한다. 추가의 실시 형태에서, 촉매 활성이 소멸된 CasX 단백질은 CasX 단백질의 RuvC 도메인의 전부 또는 일부의 결실을 포함한다. 전술한 동일한 치환이 본 개시내용의 CasX 변이체 내로 유사하게 도입되어, 촉매 활성이 소멸된 CasX(dCasX) 변이체를 유발할 수 있다는 것이 이해될 것이다. 일 실시 형태에서는, RuvC 도메인의 전부 또는 일부가 CasX 변이체로부터 결실되어, dCasX 변이체를 유발한다. 촉매적으로 불활성인 dCasX 변이체 단백질은, 일부 실시 형태에서, 염기 편집 또는 후성유전학적 변형에 사용될 수 있다. DNA에 대한 더 높은 친화도로, 일부 실시 형태에서, 촉매적으로 불활성인 dCasX 변이체 단백질은, 촉매적으로 활성인 CasX에 비교하여, 이들의 표적 핵산을 더 신속하게 탐색하거나, 더 긴 기간 동안 표적 핵산에 결합되어 유지되거나, 더 안정한 양상으로 표적 핵산에 결합하거나, 이들의 조합에 의해, 그의 절단 역량을 유지하는 CasX 변이체에 비교하여 촉매 활성이 소멸된 CasX 변이체 단백질의 이들 기능을 개선할 수 있다. 예시적인 dCasX 변이체 서열은 표 7에 기술된 바와 같이 서열 번호 40808 내지 40827 및 41006 내지 41009로서 개시된다. 일부 실시 형태에서, dCasX 변이체는 서열 번호 40808 내지 40827, 41006 내지 41009의 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상 동일하며, dCasX 변이체 단백질의 기능적 특성을 유지한다. 일부 실시 형태에서, dCasX 변이체는 서열 번호 40808 내지 40827, 41006 내지 41009의 서열을 포함한다.
[표 7]
l. CasX 융합 단백질
일부 실시 형태에서, 본 개시내용은 CasX에 융합된 이종성 단백질을 포함하는 CasX 단백질을 인코딩하는 AAV를 제공한다. 일부 경우에, CasX는 본 명세서에 기재된 실시 형태 중 임의의 것의 CasX 변이체이다. 일부 실시 형태에서, CasX 변이체는 관심 활성을 갖는 하나 이상의 단백질 또는 이들의 도메인에 융합된 표 3에 기술된 바와 같은 서열 중 어느 하나를 포함한다.
일부 실시 형태에서, CasX 융합 단백질은, 상이한 관심 활성을 갖는 하나 이상의 단백질 또는 이들의 도메인에 융합되어 융합 단백질을 유발하는, 표 3에 기술된 바와 같은 변이체 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912 중 어느 하나를 포함한다. 예를 들어, 일부 실시 형태에서, CasX 변이체 단백질은 전사를 억제하거나, 표적 핵산을 변형시키거나, 핵산과 관련된 폴리펩티드를 변형시키는(예를 들어, 히스톤 변형) 단백질(또는 이의 도메인)에 융합된다.
일부 실시 형태에서는, 이종성 폴리펩티드(또는 이종성 아미노산, 예컨대 시스테인 잔기 또는 비-천연 아미노산)가 CasX 단백질 내의 하나 이상의 위치에 삽입되어 CasX 융합 단백질을 생성할 수 있다. 다른 실시 형태에서는, 시스테인 잔기가 CasX 단백질 내의 하나 이상의 위치에 삽입된 후에 하기 기재된 이종성 폴리펩티드의 접합이 이어질 수 있다. 일부 대안적인 실시 형태에서는, 이종성 폴리펩티드 또는 이종성 아미노산이 CasX 변이체 단백질의 N- 또는 C-말단에 첨가될 수 있다. 다른 실시 형태에서는, 이종성 폴리펩티드 또는 이종성 아미노산이 CasX 단백질의 서열 내에 내부적으로 삽입될 수 있다.
일부 실시 형태에서, CasX 변이체 융합 단백질은 RNA-가이드 서열 특이적 표적 핵산 결합 및 절단 활성을 유지한다. 일부 경우에, CasX 변이체 융합 단백질은 이종성 단백질의 삽입을 갖지 않는 상응하는 CasX 변이체 단백질의 활성(예를 들어, 절단 및/또는 결합 활성)의 50% 이상을 갖는다(유지한다). 일부 경우에, CasX 변이체 융합 단백질은 이종성 단백질의 삽입을 갖지 않는 상응하는 CasX 단백질의 활성(예를 들어, 절단 및/또는 결합 활성)의 약 60% 이상, 또는 약 70% 이상, 약 80% 이상, 또는 약 90% 이상, 또는 약 92% 이상, 또는 약 95% 이상, 또는 약 98% 이상, 또는 약 100%를 유지한다.
일부 경우에, CasX 변이체 융합 단백질은 삽입된 이종성 아미노산 또는 이종성 폴리펩티드가 없는 CasX 단백질의 활성에 비교하여 표적 핵산 결합 활성을 유지한다(갖는다). 일부 경우에, CasX 변이체 융합 단백질은 이종성 단백질의 삽입을 갖지 않는 상응하는 CasX 단백질의 결합 활성의 약 60% 이상, 또는 약 70% 이상, 약 80% 이상, 또는 약 90% 이상, 또는 약 92% 이상, 또는 약 95% 이상, 또는 약 98% 이상, 또는 약 100%를 유지한다.
일부 경우에, CasX 변이체 융합 단백질은 삽입된 이종성 아미노산 또는 이종성 폴리펩티드가 없는 모 CasX 단백질의 활성에 비교하여 표적 핵산 결합 및/또는 절단 활성을 유지한다(갖는다). 예를 들어, 일부 경우에, CasX 변이체 융합 단백질은 상응하는 모 CasX 단백질(삽입을 갖지 않는 CasX 단백질)의 결합 및/또는 절단 활성의 50% 이상을 갖는다(유지한다). 예를 들어, 일부 경우에, CasX 변이체 융합 단백질은 상응하는 CasX 모 단백질(삽입을 갖지 않는 CasX 단백질)의 결합 및/또는 절단 활성의 60% 이상(70% 이상, 80% 이상, 90% 이상, 92% 이상, 95% 이상, 98% 이상, 또는 100%)을 갖는다(유지한다). CasX 단백질 및/또는 CasX 융합 단백질의 절단 및/또는 결합 활성을 측정하는 방법은 당업자에게 알려져 있을 것이며 임의의 편리한 방법이 사용될 수 있다.
다양한 이종성 폴리펩티드가 본 개시내용의 참조 CasX 또는 CasX 변이체 융합 단백질에 포함되기에 적합하다. 일부 경우에, 융합 파트너는 표적 DNA의 전사를 조절할 수 있다(예를 들어, 전사를 억제하거나, 전사를 증가시킴). 예를 들어, 일부 경우에 융합 파트너는 전사를 억제하는 단백질(또는 단백질로부터의 도메인)이다(예를 들어, 전사 억제제 단백질의 동원, 메틸화와 같은 표적 DNA의 변형, DNA 변형제의 동원, 표적 DNA와 관련된 히스톤의 조절, 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 것들과 같은 히스톤 변형제의 동원 등을 통해 기능하는 단백질인 전사 저해제). 일부 경우에 융합 파트너는 전사를 증가시키는 단백질(또는 단백질로부터의 도메인)이다(예를 들어, 전사 활성화제 단백질의 동원, 탈메틸화와 같은 표적 DNA의 변형, DNA 변형제의 동원, 표적 DNA와 관련된 히스톤의 조절, 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 것들과 같은 히스톤 변형제의 동원 등을 통해 작용하는 단백질인 전사 활성화제).
일부 경우에, 융합 파트너는 표적 핵산 서열을 변형시키는 효소적 활성; 예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아민화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 리콤비나제 활성, 중합효소 활성, 리가제 활성, 헬리카제 활성, 포토리아제 활성, 또는 글리코실라제 활성을 갖는다. 일부 실시 형태에서, CasX 변이체는 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912 중 어느 하나 및 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 갖는 폴리펩티드를 포함한다.
전사를 증가시키기 위한 융합 파트너로 사용될 수 있는 단백질(또는 이의 단편)의 예는 전사 활성화제, 예컨대 VP16, VP64, VP48, VP160, p65 서브도메인(예를 들어, NFkB로부터의), 및 EDLL의 활성화 도메인 및/또는 TAL 활성화 도메인(예를 들어, 식물에서의 활성에 대한); 히스톤 리신 메틸트랜스퍼라제, 예컨대 SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1 등; 히스톤 리신 데메틸라제, 예컨대 JHDM2a/b, UTX, JMJD3 등; 히스톤 아세틸트랜스퍼라제, 예컨대 GCN5, PCAF, CBP, p300, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, SRC1, ACTR, P160, CLOCK 등; 및 DNA 데메틸라제, 예컨대 10-11 전위(TET) 다이옥시게나제 1(TET1CD), TET1, DME, DML1, DML2, ROS1 등을 포함하지만 이로 제한되지 않는다.
전사를 감소시키기 위한 융합 파트너로 사용될 수 있는 단백질(또는 이의 단편)의 예는 전사 저해제, 예컨대 크루펠(Kruppel) 관련 박스(KRAB 또는 SKD); KOX1 저해 도메인; 매드(Mad) mSIN3 상호작용 도메인(SID); ERF 저해제 도메인(ERD), SRDX 저해 도메인(예를 들어, 식물에서의 저해에 대한) 등; 히스톤 리신 메틸트랜스퍼라제, 예컨대 Pr-SET7/8, SUV4- 20H1, RIZ1 등; 히스톤 리신 데메틸라제, 예컨대 JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID 1C/SMCX, JARID1D/SMCY 등; 히스톤 리신 데아세틸라제, 예컨대 HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등; DNA 메틸라제, 예컨대 HhaI DNA m5c-메틸트랜스퍼라제(M.HhaI), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물) 등; 및 주변부 동원 요소, 예컨대 라민 A, 라민 B 등을 포함하지만 이로 제한되지 않는다.
일부 경우에, 융합 파트너는 표적 핵산 서열(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성의 예는 뉴클레아제 활성, 예컨대 제한 효소(예를 들어, FokI 뉴클레아제)에 의해 제공되는 것, 메틸트랜스퍼라제 활성, 예컨대 메틸트랜스퍼라제(예를 들어, Hhal DNA m5c-메틸트랜스퍼라제(M.Hhal), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물) 등)에 의해 제공되는 것; 데메틸라제 활성, 예컨대 데메틸라제(예를 들어, 10-11 전위(TET) 다이옥시게나제 1(TET 1 CD), TET1, DME, DML1, DML2, ROS1 등)에 의해 제공되는 것, DNA 복구 활성, DNA 손상 활성, 탈아민화 활성, 예컨대 데아미나제(예를 들어, 시토신 데아미나제 효소, 예를 들어, APOBEC 단백질, 예컨대 래트 APOBECl)에 의해 제공되는 것, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 예컨대 인테그라제 및/또는 레솔바제(예를 들어, Gin 인버타제, 예컨대 Gin 인버타제의 과활성 돌연변이체, GinH106Y; 인간 면역결핍 바이러스 유형 1 인테그라제(IN); Tn3 레솔바제; 등)에 의해 제공되는 것, 트랜스포사제 활성, 리콤비나제 활성, 예컨대 리콤비나제(예를 들어, Gin 리콤비나제의 촉매 도메인)에 의해 제공되는 것, 중합효소 활성, 리가제 활성, 헬리카제 활성, 포토리아제 활성, 및 글리코실라제 활성)에 의해 제공되는 것을 포함하지만 이로 제한되지 않는다.
일부 경우에, 본 개시내용의 AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 전사를 증가시키기 위한 도메인(예를 들어, VP16 도메인, VP64 도메인), 전사를 감소시키기 위한 도메인(예를 들어, Kox1 단백질로부터의, 예를 들어, KRAB 도메인), 히스톤 아세틸트랜스퍼라제의 코어 촉매 도메인(예를 들어, 히스톤 아세틸트랜스퍼라제 p300), 검출가능한 신호를 제공하는 단백질/도메인(예를 들어, 형광 단백질, 예컨대 GFP), 뉴클레아제 도메인(예를 들어, Fokl 뉴클레아제), 또는 염기 편집제(예를 들어, 시티딘 데아미나제, 예컨대 APOBEC1)로부터 선택된 폴리펩티드에 융합된다.
일부 경우에, 융합 파트너는 표적 핵산(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)과 관련된 단백질(예를 들어, 히스톤, RNA 결합 단백질, DNA 결합 단백질 등)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성(표적 핵산과 관련된 단백질을 변형시키는)의 예는 메틸트랜스퍼라제 활성, 예컨대 히스톤 메틸트랜스퍼라제(HMT)(예를 들어, 반문 3-9 상동체 1(variegation 3-9 homolog)의 억제제(SUV39H1, KMT1A로도 알려짐), 진정염색질 히스톤 리신 메틸트랜스퍼라제 2(G9A, KMT1C 및 EHMT2로도 알려짐), SUV39H2, ESET/SETDB 1 등, SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1, DOT1L, Pr-SET7/8, SUV4-20H1, EZH2, RIZ1)에 의해 제공되는 것, 데메틸라제 활성, 예컨대 히스톤 데메틸라제(예를 들어, 리신 데메틸라제 1A(LSD1로도 알려진 KDM1A), JHDM2a/b, JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID1C/SMCX, JARID1D/SMCY, UTX, JMJD3 등)에 의해 제공되는 것, 아세틸트랜스퍼라제 활성, 예컨대 히스톤 아세틸라제 트랜스퍼라제(예를 들어, 인간 아세틸트랜스퍼라제 p300, GCN5, PCAF, CBP, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, HB01/MYST2, HMOF/MYST1, SRC1, ACTR, P160, CLOCK 등의 촉매 코어/단편)에 의해 제공되는 것, 데아세틸라제 활성, 예컨대 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등)에 의해 제공되는 것, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 및 탈미리스토일화 활성을 포함하지만 이로 제한되지 않는다.
CasX 변이체의 적합한 융합 파트너의 부가적인 예는 (i) 다이하이드로폴레이트 리덕타제(DHFR) 불안정화 도메인(예를 들어, 화학적으로 제어가능한 대상 RNA-가이드 폴리펩티드 또는 조건부 활성 RNA-가이드 폴리펩티드를 생성하기 위한), 및 (ii) 엽록체 수송 펩티드(chloroplast transit peptide)이다.
일부 실시 형태에서, CasX 변이체는 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912 중 어느 하나, 및 하기를 포함하지만 이로 제한되지 않는 엽록체 수송 펩티드를 포함한다: MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGR VKCMQVWPPIGKKKFETLSYLPPLTRDSRA(서열 번호 40790); MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(서열 번호 39980); MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQV WPPIEKKKFETLSYLPDLTDSGGRVNC(서열 번호 39968); MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC(서열 번호 39969); MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC(서열 번호 39970); MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLF CSFRISASVATAC(서열 번호 39971); MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPH RFDRRCLSMVV(서열 번호 39972); MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQ QRSVQRGSRRFPSVVVC(서열 번호 39973); MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(서열 번호 39974); MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVIS RSAAAA(서열 번호 39975); 및 MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(서열 번호 39976).
일부 경우에, AAV 시스템에 사용하기 위한 본 개시내용의 CasX 변이체 단백질은 엔도솜 탈출 펩티드를 포함할 수 있다. 일부 경우에, 엔도솜 탈출 폴리펩티드는 아미노산 서열 GLFXALLXLLXSLWXLLLXA(서열 번호 39977)를 포함하며, 여기서 각각의 X는 리신, 히스티딘, 및 아르기닌으로부터 독립적으로 선택된다. 일부 경우에, 엔도솜 탈출 폴리펩티드는 아미노산 서열 GLFHALLHLLHSLWHLLLHA(서열 번호 39978), 또는 HHHHHHHHH(서열 번호 39979)를 포함한다.
ssRNA 표적 핵산 서열을 표적화할 경우에 CasX 변이체와 함께 사용하기 위한 융합 파트너의 비-제한적 예는 스플라이싱 인자(예를 들어, RS 도메인); 단백질 번역 구성성분(예를 들어, 번역 개시, 신장, 및/또는 방출 인자; 예를 들어, eIF4G); RNA 메틸라제; RNA 편집 효소(예를 들어, RNA 데아미나제, 예를 들어, RNA 상에 작용하는 아데노신 데아미나제(ADAR), A 내지 I 및/또는 C 내지 U 편집 효소를 포함함); 헬리카제; RNA-결합 단백질 등을 포함한다(이로 제한되지는 않음). 이종성 폴리펩티드는 전체 단백질을 포함할 수 있거나 일부 경우에는 단백질의 단편(예를 들어, 기능적 도메인)을 포함할 수 있다는 것이 이해된다.
일부 실시 형태에서, 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 또는 40828 내지 40912 중 어느 하나의 CasX 변이체는, ssRNA(이는 본 개시내용의 목적을 위해, 분자내 및/또는 분자간 2차 구조, 예를 들어, 이중-가닥 RNA 이중체, 예컨대 헤어핀, 스템-루프 등을 포함함)와 일시적으로든 비가역적으로든, 직접적으로든 간접적으로든 상호작용할 수 있는 임의의 도메인의 융합 파트너를 포함하며, 이는 엔도뉴클레아제(예를 들어 RNase III, CRR22 DYW 도메인, 다이서, 및 SMG5 및 SMG6과 같은 단백질로부터의 PIN(PilT N-말단) 도메인); RNA 절단의 자극을 담당하는 단백질 및 단백질 도메인(예를 들어 CPSF, CstF, CFIm, 및 CFIIm); 엑소뉴클레아제(예를 들어 XRN-1 또는 엑소뉴클레아제 T); 데아데닐라제(예를 들어 HNT3); 넌센스 매개 RNA 분해를 담당하는 단백질 및 단백질 도메인(예를 들어 UPF1, UPF2, UPF3, UPF3b, RNP SI, Y14, DEK, REF2, 및 Srm160); RNA의 안정화를 담당하는 단백질 및 단백질 도메인(예를 들어 PABP); 번역의 저해를 담당하는 단백질 및 단백질 도메인(예를 들어 Ago2 및 Ago4); 번역의 자극을 담당하는 단백질 및 단백질 도메인(예를 들어 슈타우펜); 번역의 조절을 담당하는(예를 들어, 할 수 있는) 단백질 및 단백질 도메인(예를 들어, 번역 인자, 예컨대 개시 인자, 신장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 담당하는 단백질 및 단백질 도메인(예를 들어 PAP1, GLD-2, 및 Star- PAP); RNA의 폴리우리디닐화를 담당하는 단백질 및 단백질 도메인(예를 들어 CI Dl 및 말단 우리딜레이트 트랜스퍼라제); RNA 위치결정을 담당하는 단백질 및 단백질 도메인(예를 들어 IMP1, ZBP1, She2p, She3p, 및 Bicaudal-D로부터의); RNA의 핵 체류를 담당하는 단백질 및 단백질 도메인(예를 들어 Rrp6); RNA의 핵외 수송을 담당하는 단백질 및 단백질 도메인(예를 들어 TAP, NXF1, THO, TREX, REF, 및 Aly); RNA 스플라이싱의 저해를 담당하는 단백질 및 단백질 도메인(예를 들어 PTB, Sam68, 및 hnRNP Al); RNA 스플라이싱의 자극을 담당하는 단백질 및 단백질 도메인(예를 들어 세린/아르기닌-풍부(SR) 도메인); 전사 효율의 감소를 담당하는 단백질 및 단백질 도메인(예를 들어 FUS(TLS)); 및 전사의 자극을 담당하는 단백질 및 단백질 도메인(예를 들어 CDK7 및 HIV Tat)을 포함하는 군으로부터 선택된 이펙터 도메인을 포함하지만 이로 제한되지 않는다. 대안적으로, 이펙터 도메인은 엔도뉴클레아제; RNA 절단을 자극할 수 있는 단백질 및 단백질 도메인; 엑소뉴클레아제; 데아데닐라제; 넌센스 매개 RNA 분해 활성을 갖는 단백질 및 단백질 도메인; RNA를 안정화할 수 있는 단백질 및 단백질 도메인; 번역을 저해할 수 있는 단백질 및 단백질 도메인; 번역을 자극할 수 있는 단백질 및 단백질 도메인; 번역을 조절할 수 있는 단백질 및 단백질 도메인(예를 들어, 번역 인자, 예컨대 개시 인자, 신장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 할 수 있는 단백질 및 단백질 도메인; RNA의 폴리우리디닐화를 할 수 있는 단백질 및 단백질 도메인; RNA 위치결정 활성을 갖는 단백질 및 단백질 도메인; RNA의 핵 체류를 할 수 있는 단백질 및 단백질 도메인; RNA 핵외 수송 활성을 갖는 단백질 및 단백질 도메인; RNA 스플라이싱을 저해할 수 있는 단백질 및 단백질 도메인; RNA 스플라이싱을 자극할 수 있는 단백질 및 단백질 도메인; 전사 효율을 감소시킬 수 있는 단백질 및 단백질 도메인; 및 전사를 자극할 수 있는 단백질 및 단백질 도메인을 포함하는 군으로부터 선택될 수 있다. 다른 적합한 이종성 폴리펩티드는 PUF RNA-결합 도메인이며, 이는 전체적으로 본 명세서에 참고로 포함된 WO2012068627호에 더욱 상세하게 기재되어 있다.
CasX 변이체에 대한 융합 파트너로서 사용될 수 있는(전체로, 또는 이의 단편으로서) 일부 RNA 스플라이싱 인자는 별도의 서열-특이적 RNA 결합 모듈 및 스플라이싱 이펙터 도메인을 갖는 모듈 편성을 갖는다. 예를 들어, 세린/아르기닌-풍부(SR) 단백질 패밀리의 구성원은 전구-mRNA 내의 엑손 스플라이싱 인핸서(ESE)에 결합하는 N-말단 RNA 인식 모티프(RRM) 및 엑손 포함을 촉진하는 C-말단 RS 도메인을 함유한다. 다른 예로서, hnRNP 단백질 hnRNP Al은 그의 RRM 도메인을 통해 엑손 스플라이싱 사일런서(ESS)에 결합하고, C-말단 글리신-풍부 도메인을 통해 엑손 포함을 억제한다. 일부 스플라이싱 인자는 2개의 대안적인 부위 사이의 조절 서열에 결합함으로써 스플라이스 부위(ss)의 대안적인 사용을 조절할 수 있다. 예를 들어, ASF/SF2는 ESE를 인식하고 인트론 근위 부위의 사용을 촉진할 수 있는 반면에, hnRNP Al은 ESS에 결합하고 스플라이싱을 인트론 원위 부위의 사용을 향해 이동시킬 수 있다. 그러한 인자에 대한 일 응용은 내인성 유전자, 특히 질환 관련 유전자의 대안적인 스플라이싱을 조절하는 ESF를 생성하는 것이다. 예를 들어, Bcl-x 전구-mRNA는 반대 기능의 단백질을 인코딩하기 위한 2개의 대안적인 5' 스플라이스 부위를 갖는 2개의 스플라이싱 동형을 생성한다. 긴 스플라이싱 동형 Bcl-xL은 유사분열 후에 오래 생존한 세포에서 발현되는 강력한 세포자멸 억제제이며, 다수의 암 세포에서 상향-조절되어 세포자멸 신호에 대해 세포를 보호한다. 짧은 동형 Bcl-xS는 세포자멸-촉진 동형이며 높은 대사 회전율을 갖는 세포(예를 들어, 발생하는 림프구)에서 높은 수준으로 발현된다. 2개의 Bcl-x 스플라이싱 동형의 비는 코어 엑손 영역 또는 엑손 연장 영역(즉, 2개의 대안적인 5' 스플라이스 부위 사이)에 위치하는 다중 시스-요소에 의해 조절된다. 더 많은 예로서, 전체적으로 본 명세서에 참고로 포함된 WO2010075303호를 참조한다.
CasX 변이체와 함께 사용하기에 추가로 적합한 융합 파트너는 경계 요소인 단백질(또는 이의 단편)(예를 들어, CTCF), 주변부 동원을 제공하는 단백질 및 이의 단편(예를 들어, 라민 A, 라민 B 등), 및 단백질 도킹 요소(예를 들어, FKBP/FRB, Pill/Abyl 등)를 포함하지만 이로 제한되지 않는다.
일부 경우에, CasX 변이체와 함께 사용하기 위한 이종성 폴리펩티드(융합 파트너)는 세포내 위치결정을 제공하며, 즉, 이종성 폴리펩티드는 세포내 위치결정 서열(예를 들어, 핵으로의 표적화를 위한 핵 위치 신호(NLS), 융합 단백질을 핵 바깥에 유지하는 서열, 예를 들어, 핵외 수송 서열(NES), 융합 단백질을 세포질 내에 유지하는 서열, 미토콘드리아로의 표적화를 위한 미토콘드리아 위치 신호(mitochondrial localization signal), 엽록체로의 표적화를 위한 엽록체 위치 신호(chloroplast localization signal), ER 체류 신호 등)을 함유한다. 일부 실시 형태에서, 단백질이 핵에 대해 표적화되지 않도록 대상 RNA-가이드 폴리펩티드 또는 조건부 활성 RNA-가이드 폴리펩티드 및/또는 대상 CasX 융합 단백질은 NLS를 포함하지 않는다(예를 들어, 표적 핵산 서열이 세포액 내에 존재하는 RNA인 경우에, 이는 유리할 수 있음). 일부 실시 형태에서, 추적 및/또는 정제의 용이성을 위해 융합 파트너는 태그를 제공할 수 있다(즉, 이종성 폴리펩티드는 검출가능한 표지임)(예를 들어, 형광 단백질, 예를 들어, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 청록색 형광 단백질(CFP), 엠체리(mCherry), 티디토마토 등; 히스티딘 태그, 예를 들어, 6XHis 태그; 헤마글루티닌(HA) 태그; FLAG 태그; Myc 태그 등).
일부 경우에, AAV 시스템에 사용하기 위한 CasX 변이체 단백질은 세포의 핵으로 CasX/gRNA를 표적화하기 위한 핵 위치 신호(NLS)를 포함한다(이에 융합됨). 일부 경우에, CasX 변이체 단백질은 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상, 6개 이상, 7개 이상, 8개 이상의 NLS에 융합된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및/또는 C-말단에 또는 그 부근에(예를 들어, 50개의 아미노산 이내에) 위치한다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단에 또는 그 부근에(예를 들어, 50개의 아미노산 이내에) 위치한다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 C-말단에 또는 그 부근에(예를 들어, 50개의 아미노산 이내에) 위치한다. 일부 경우에, 하나의 NLS는 N-말단에 위치하고 하나의 NLS는 C-말단에 위치한다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및 C-말단 둘 모두에 또는 그 부근에(예를 들어, 50개의 아미노산 이내에) 위치한다. 일부 경우에, CasX 변이체 단백질은 1 내지 10개의 NLS(예를 들어, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 또는 2 내지 5개의 NLS)를 포함한다(이에 융합됨). 일부 경우에, CasX 변이체 단백질은 2 내지 5개의 NLS(예를 들어, 2 내지 4, 또는 2 내지 3개의 NLS)를 포함한다(이에 융합됨). CasX 변이체와 함께 사용하기에 적합한 NLS의 비-제한적 예는 하기로부터 유래된 서열과 동일하거나 약 80% 이상, 약 90% 이상, 또는 약 95% 이상의 동일성을 갖는 서열을 포함한다: 아미노산 서열 PKKKRKV(서열 번호 196)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열 번호 197)를 갖는 뉴클레오플라스민 이분(bipartite) NLS; 아미노산 서열 PAAKRVKLD(서열 번호 248) 또는 RQRRNELKRSP(서열 번호 161)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열 번호 162)를 갖는 hRNPAl M9 NLS; 임포르틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열 번호 163); 근종 T 단백질의 서열 VSRKRPRP(서열 번호 164) 및 PPKKARED(서열 번호 165); 인간 p53의 서열 PQPKKKPL(서열 번호 166); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열 번호 167); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열 번호 168) 및 PKQKKRK(서열 번호 169); D형 간염 바이러스 항원의 서열 RKLKKKIKKL(서열 번호 170); 마우스 Mxl 단백질의 서열 REKKKFLKRR(서열 번호 171); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(서열 번호 172); 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열 번호 173); 보르나병 바이러스 P 단백질(BDV-P1)의 서열 PRPRKIPR(서열 번호 174); C형 간염 바이러스 비구조 단백질(HCV-NS5A)의 서열 PPRKKRTVV(서열 번호 175); LEF1의 서열 NLSKKKKRKREK(서열 번호 176); ORF57 시미라에(simirae)의 서열 RRPSRPFRKP(서열 번호 177); EBV LANA의 서열 KRPRSPSS(서열 번호 178); 인플루엔자 A 단백질의 서열 KRGINDRNFWRGENERKTR(서열 번호 179); 인간 RNA 헬리카제 A(RHA)의 서열 PRPPKMARYDN(서열 번호 180); 핵소체 RNA 헬리카제 II의 서열 KRSFSKAF(서열 번호 181); TUS-단백질의 서열 KLKIKRPVK(서열 번호 182); 임포르틴-알파와 관련된 서열 PKKKRKVPPPPAAKRVKLD(서열 번호 183); HTLV-1 내의 Rex 단백질로부터의 서열 PKTRRRPRRSQRKRPPT(서열 번호 184); 시노랩디티스 엘레강스(Caenorhabditis elegans)의 EGL-13 단백질로부터의 서열 MSRRRKANPTKLSENAKKLAKEVEN(서열 번호 185); 및 서열 KTRRRPRRSQRKRPPT(서열 번호 186), RRKKRRPRRKKRR(서열 번호 187), PKKKSRKPKKKSRK(서열 번호 188), HKKKHPDASVNFSEFSK(서열 번호 189), QRPGPYDRPQRPGPYDRP(서열 번호 190), LSPSLSPLLSPSLSPL(서열 번호 191), RGKGGKGLGKGGAKRHRK(서열 번호 192), PKRGRGRPKRGRGR(서열 번호 193), PKKKRKVPPPPAAKRVKLD(서열 번호 194) 및 PKKKRKVPPPPKKKRKV(서열 번호 195), PAKRARRGYKC(서열 번호 40188), KLGPRKATGRW(서열 번호 40189), PRRKREE(서열 번호 40190), PYRGRKE(서열 번호 40191), PLRKRPRR(서열 번호 40192), PLRKRPRRGSPLRKRPRR(서열 번호 40193), PAAKRVKLDGGKRTADGSEFESPKKKRKV(서열 번호 40194), PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(서열 번호 40195), PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(서열 번호 40196), PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(서열 번호 40197), KRKGSPERGERKRHW(서열 번호 40198), KRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 40199), 및 PKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 40200). 본 개시내용의 AAV 시스템에 혼입시키기 위한 부가적인 NLS는 표 15 및 표 16에 제공되며, 이는 CasX의 N- 또는 C-말단에 연결하기 위한 NLS를 표시한다. 일부 실시 형태에서, 하나 이상의 NLS는 링커 펩티드에 의해 CasX 또는 인접한 NLS에 연결되며, 여기서 링커 펩티드는 RS, (G)n(서열 번호 40201), (GS)n(서열 번호 40202), (GSGGS)n(서열 번호 208), (GGSGGS)n(서열 번호 209), (GGGS)n(서열 번호 210), GGSG(서열 번호 211), GGSGG(서열 번호 212), GSGSG(서열 번호 213), GSGGG(서열 번호 214), GGGSG(서열 번호 215), GSSSG(서열 번호 216), GPGP(서열 번호 217), GGP, PPP, PPAPPA(서열 번호 218), PPPG(서열 번호 40207), PPPGPPP(서열 번호 219), PPP(GGGS)n(서열 번호 40203), (GGGS)nPPP(서열 번호 40204), AEAAAKEAAAKEAAAKA(서열 번호 40205), 및 TPPKTKRKVEFE(서열 번호 40206)로 이루어진 군으로부터 선택되고, 여기서 n은 1 내지 5이다. 일부 실시 형태에서, 본 개시내용의 AAV 작제물은 단락의 전술한 실시 형태 중 임의의 것의 NLS 및 링커 펩티드뿐만 아니라, 표 15 및 표 16의 NLS를 인코딩하는 폴리핵산을 포함하며, 일부 경우에는, 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나에 도시된 바와 같은 작제물의 다른 구성성분에 관련하여 구성될 수 있다.
일반적으로, NLS(또는 다중 NLS)는 진핵 세포의 핵 내에 CasX 변이체 융합 단백질의 축적을 구동하기에 충분한 강도의 것이다. 핵 내의 축적의 검출은 임의의 적합한 기술에 의해 수행될 수 있다. 예를 들어, 세포 내의 위치가 시각화될 수 있도록 검출가능한 마커가 CasX 변이체 융합 단백질에 융합될 수 있다. 세포 핵은 또한 세포로부터 단리될 수 있으며, 이어서 이의 내용물을 단백질을 검출하기 위한 임의의 적합한 공정, 예컨대 면역조직화학, 웨스턴 블롯, 또는 효소 활성 검정에 의해 분석할 수 있다. 핵 내의 축적은 또한 간접적으로 결정될 수 있다.
일부 경우에, AAV 시스템에 사용하기 위한 CasX 변이체 융합 단백질은 "단백질 형질도입 도메인" 또는 PTD(CPP - 세포 침투 펩티드로도 알려짐)를 포함하며, 이는 지질 이중층, 미셀, 세포막, 소기관막, 또는 베시클막을 횡단하는 것을 용이하게 하는 단백질, 폴리뉴클레오티드, 탄수화물, 또는 유기 또는 무기 화합물을 지칭한다. 극성 소분자 내지 대형 거대분자 및/또는 나노입자의 범위일 수 있는, 다른 분자에 부착된 PTD는 분자가 막을 횡단하여, 예를 들어 세포외 공간으로부터 세포내 공간으로 가거나, 세포액으로부터 소기관 내로 가는 것을 용이하게 한다. 일부 실시 형태에서, PTD는 CasX 변이체 융합 단백질의 아미노 말단에 공유적으로 연결된다. 일부 실시 형태에서, PTD는 CasX 변이체 융합 단백질의 카르복실 말단에 공유적으로 연결된다. 일부 경우에, PTD는 적합한 삽입 부위에서 CasX 변이체 융합 단백질의 서열 내에 내부적으로 삽입된다. 일부 경우에, CasX 변이체 융합 단백질은 하나 이상의 PTD(예를 들어, 2개 이상의, 3개 이상의, 4개 이상의 PTD)를 포함한다(이에 접합되거나 융합됨). 일부 경우에, PTD는 하나 이상의 핵 위치 신호(NLS)를 포함한다. PTD의 예는 YGRKKRRQRRR(서열 번호 198), RKKRRQRR(서열 번호 199); YARAAARQARA(서열 번호 200); THRLPRRRRRR(서열 번호 201); 및 GGRRARRRRRR(서열 번호 202)을 포함하는 HIV TAT의 펩티드 형질도입 도메인; 세포 내로의 직접 진입에 충분한 다수의 아르기닌을 포함하는 폴리아르기닌 서열(예를 들어, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10 내지 50개의 아르기닌)(서열 번호 203); VP22 도메인(문헌[Zender et al. (2002) Cancer Gene Ther. 9(6):489-96]); 드로소필라 안텐나페디아(Drosophila Antennapedia) 단백질 형질도입 도메인(문헌[Noguchi et al. (2003) Diabetes 52(7): 1732-1737]); 절단된 인간 칼시토닌 펩티드(문헌[Trehin et al. (2004) Pharm. Research 21 :1248-1256]); 폴리리신(문헌[Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008]); RRQRRTSKLMKR(서열 번호 204); 트랜스포르탄 GWTLNSAGYLLGKINLKALAALAKKIL(서열 번호 205); KALAWEAKLAKALAKALAKHLAKALAKALKCEA(서열 번호 206); 및 RQIKIWFQNRRMKWKK(서열 번호 207)를 포함하지만 이로 제한되지 않는다. 일부 실시 형태에서, PTD는 활성화가능한 CPP(ACPP)이다(문헌[Aguilera et al. (2009) Integr Biol (Camb) June; 1(5-6): 371-381]). ACPP는 절단가능한 링커를 통해 일치하는 다중음이온(예를 들어, Glu9 또는 "E9")에 연결되는 다중양이온성 CPP(예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순 전하를 거의 0까지 감소시킴으로써 접착 및 세포 내로의 흡수를 억제한다. 링커의 절단시에, 다중음이온이 방출되어, 폴리아르기닌 및 그의 고유 접착성을 국소적으로 노출시키며, 따라서 막을 횡단하도록 ACPP를 "활성화"시킨다.
일부 실시 형태에서, CasX 변이체 융합 단백질은 링커 폴리펩티드(예를 들어, 하나 이상의 링커 폴리펩티드)를 통해 내부적으로 삽입된 이종성 아미노산 또는 이종성 폴리펩티드(이종성 아미노산 서열)에 연결된 CasX 단백질을 포함할 수 있다. 일부 실시 형태에서, CasX 변이체 융합 단백질은 C-말단 및/또는 N-말단 단부에서 링커 폴리펩티드(예를 들어, 하나 이상의 링커 폴리펩티드)를 통해 이종성 폴리펩티드(융합 파트너)에 연결될 수 있다. 링커 폴리펩티드는 다양한 아미노산 서열 중 임의의 것을 가질 수 있다. 단백질은 다른 화학적 연결이 배제되지는 않지만 일반적으로 가요성 성질의 스페이서 펩티드에 의해 결합될 수 있다. 적합한 링커는 4개 아미노산 내지 40개 아미노산의 길이, 또는 4개 아미노산 내지 25개 아미노산 길이의 폴리펩티드를 포함한다. 이들 링커는 일반적으로 합성, 링커-인코딩 올리고뉴클레오티드를 사용하여 단백질을 커플링함으로써 생성된다. 소정의 가요성 정도를 갖는 펩티드 링커가 사용될 수 있다. 연결 펩티드는 사실상 임의의 아미노산 서열을 가질 수 있으며, 바람직한 링커는 일반적으로 가요성인 펩티드를 유발하는 서열을 가질 것임에 유의한다. 작은 아미노산, 예컨대 글리신 및 알라닌의 사용은 가요성 펩티드를 생성함에 있어서 유용하다. 그러한 서열의 생성은 당업자에게 일상적이다. 다양한 상이한 링커가 구매가능하며, 사용에 적합한 것으로 간주된다. 예시적인 링커 폴리펩티드는 글리신 중합체 (G)n, 글리신-세린 중합체, 글리신-알라닌 중합체, 알라닌-세린 중합체, 글리신-프롤린 중합체, 프롤린 중합체, 및 프롤린-알라닌 중합체를 포함한다. 예시적인 링커는 (G)n(서열 번호 40201), (GS)n(서열 번호 40202), (GSGGS)n(서열 번호 208), (GGSGGS)n(서열 번호 209), (GGGS)n(서열 번호 210), GGSG(서열 번호 211), GGSGG(서열 번호 212), GSGSG(서열 번호 213), GSGGG(서열 번호 214), GGGSG(서열 번호 215), GSSSG(서열 번호 216), GPGP(서열 번호 217), GGP, PPP, PPAPPA(서열 번호 218), PPPG(서열 번호 40207), PPPGPPP(서열 번호 219), PPP(GGGS)n(서열 번호 40203), (GGGS)nPPP(서열 번호 40204), AEAAAKEAAAKEAAAKA(서열 번호 40205), 및 TPPKTKRKVEFE(서열 번호 40206)를 포함하지만 이로 제한되지 않는 아미노산 서열을 포함할 수 있으며, 여기서 n은 1 내지 5이다. 링커가 가요성 링커뿐만 아니라 덜 가요성인 구조를 부여하는 하나 이상의 부분을 포함할 수 있도록, 상기 기재된 임의의 요소에 접합된 펩티드의 설계는 전체 또는 부분적으로 가요성인 링커를 포함할 수 있다는 것을 당업자는 인식할 것이다.
V. AAV 시스템 및 표적 핵산의 변형 방법
본 명세서에 제공된 AAV는 치료제, 진단제로서, 그리고 연구용으로서의 응용을 포함하는 다양한 응용에 유용하다. 유전자 편집을 위한 본 개시내용의 방법을 실행하기 위해, 본 명세서에는 프로그래밍이 가능한 AAV 시스템이 제공된다. 본 명세서에 제공된 AAV 시스템의 CasX 및 gRNA 구성성분의 프로그래밍이 가능한 성질은 정밀한 표적화를 가능하게 하여 표적 핵산 서열 내의 사전결정된 하나 이상의 관심 영역에서 원하는 효과(닉킹, 절단 등)를 달성한다. 일부 실시 형태에서, 본 명세서에 제공된 AAV 시스템은 CasX 단백질 및 gRNA를 인코딩하는 서열을 포함하며, 여기서 gRNA의 표적화 서열은 표적 핵산 서열에 상보적이고, 따라서 이와 혼성화될 수 있다. 일부 경우에, AAV 시스템은 공여자 주형 핵산을 추가로 포함한다.
본 개시내용의 일부 실시 형태에서, 본 명세서에는 표적 핵산 서열을 변형시키는 방법이 제공된다. 일부 실시 형태에서 본 방법은, 표적 핵산 서열을 포함하는 세포를 본 개시내용의 CasX 단백질 및 표적화 서열을 포함하는 본 개시내용의 gRNA를 인코딩하는 AAV와 접촉시키는 단계를 포함하며, 여기서 gRNA의 표적화 서열은 표적 핵산의 서열에 상보적이고 이와 혼성화될 수 있는 서열을 갖는다. CasX 및 gRNA에 의한 표적 핵산과의 혼성화시에, CasX는 하나 이상의 단일-가닥 파단 또는 이중-가닥 파단을 표적 핵산 내에 또는 그 부근에 도입하며, 이는 유전자의 조절 요소 또는 비-코딩 영역을 함유하는 서열을 포함할 수 있고, 이는 본 명세서에 기재된 바와 같이 표적 핵산 내에 상응하는 발현의 조절 또는 유전자 생성물의 기능의 변경을 갖는 영구적인 인델(결실 또는 삽입) 또는 돌연변이를 유발함으로써, 편집된 세포를 생성한다. 다른 실시 형태에서 본 방법은, 표적 핵산 서열을 포함하는 세포를 표적 핵산의 상이하거나 중첩되는 부분에 대해 표적화된 복수의 gRNA를 인코딩하는 AAV와 접촉시키는 단계를 포함하며, 여기서 CasX 단백질은 다중의 파단을 표적 핵산 내에 도입하고, 이는 본 명세서에 기재된 바와 같이 표적 핵산 내에 상응하는 발현의 조절 또는 유전자 생성물의 기능의 변경을 갖는 영구적인 인델 또는 돌연변이를 유발함으로써, 편집된 세포를 생성한다.
일부 실시 형태에서, 표적 핵산의 변형은 표적 핵산을 포함하는 유전자의 유전자 생성물의 감소된 발현을 유발하며, 여기서 발현은 변형되지 않은 세포에 비교하여 약 10% 이상,약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 또는 약 90% 이상만큼 감소된다.
표적 핵산 서열을 변형시키는 방법의 일부 실시 형태에서, AAV 벡터의 gRNA는 가이드 DNA(gDNA)이다. 다른 실시 형태에서, gRNA는 가이드 RNA(gRNA)이다. 일부 실시 형태에서, gRNA는 단일-분자 gRNA(sgRNA)이다. 본 방법의 다른 실시 형태에서, gRNA는 개재된 뉴클레오티드에 의해 활성화제 및 표적화제 구성성분이 함께 연결된 이중-분자 gRNA(dgRNA)이다. 일부 실시 형태에서, gRNA는 키메라 gRNA-gDNA이다. 일부 실시 형태에서 본 방법은, 표적 핵산 서열을 표적 핵산의 상이하거나 중첩되는 영역에 대해 표적화된 복수의 gRNA를 인코딩하는 AAV와 접촉시키는 단계를 포함한다. 일부 실시 형태에서, gRNA 스캐폴드는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817의 서열 중 어느 하나를 포함한다.
표적 핵산 서열을 변형시키는 방법의 일부 실시 형태에서, AAV 벡터 내로 혼입된 CasX 단백질은 서열 번호 1 내지 3으로부터 선택된 참조 CasX, 또는 서열 번호 1 내지 3의 참조 CasX 단백질에 대해 50% 이상, 60% 이상, 70% 이상, 80% 이상, 또는 90% 이상, 또는 95% 이상, 또는 99% 이상의 서열 동일성을 갖는 CasX 변이체이다. 일부 실시 형태에서, CasX 변이체 단백질은 서열 번호 1 내지 3으로부터 선택된 서열을 갖는 참조 CasX 단백질에 비교하여 하나 이상의 변형을 포함한다. 일부 실시 형태에서, 하나 이상의 변형은 참조 CasX 단백질에 비교하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 도메인 내에 포함한다. 일부 실시 형태에서, 하나 이상의 변형은 참조 CasX 단백질에 비교하여 하나 이상의 아미노산 결실을 도메인 내에 포함한다. 다른 실시 형태에서, 하나 이상의 변형은 참조 CasX 단백질에 비교하여 하나 이상의 아미노산 삽입을 도메인 내에 포함한다. 일부 실시 형태에서, 하나 이상의 변형은 참조 CasX 단백질에 비교하여 하나 이상의 아미노산 치환을 도메인 내에 포함한다. 본 방법의 일부 실시 형태에서, AAV는 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 및 40828 내지 40912의 서열, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 또는 약 95% 이상, 또는 약 96% 이상, 또는 약 97% 이상, 또는 약 98% 이상, 또는 약 99% 이상의 서열 동일성을 갖는 서열을 갖는 CasX 변이체를 인코딩한다. 실시 형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비교하여 하나 이상의 개선된 특징을 나타낸다. 본 방법의 일부 실시 형태에서, CasX 변이체 단백질의 하나 이상의 개선된 특징은 CasX 단백질의 개선된 폴딩, 가이드 RNA에 대한 개선된 결합 친화도, 표적 핵산 서열에 대한 개선된 결합 친화도, 하나 이상의 PAM 서열에 대한 변경된 결합 친화도, 참조 CasX 단백질에 비교하여, TTC, ATC, GTC, 및 CTC를 포함하는 정준 PAM 서열의 더 큰 스펙트럼에 효과적으로 결합하는 능력, 표적 핵산 서열의 개선된 풀림, 증가된 활성, 개선된 편집 효율, 개선된 편집 특이성, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 닉킹에 대한 감소된 표적 가닥 로딩, 감소된 표적-외 절단, DNA의 비-표적 가닥의 개선된 결합, 개선된 단백질 안정성, 개선된 단백질:가이드 RNA 복합체 안정성, 개선된 단백질 용해도, 개선된 단백질:가이드 RNA 복합체 용해도, 개선된 단백질 수율, 개선된 단백질 발현, 및 개선된 융합 특징으로 이루어진 군으로부터 선택된다. 본 방법의 일부 실시 형태에서, CasX 변이체 단백질의 개선된 특징은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 단백질에 비교하여 약 1.1 내지 약 100,000-배 이상 개선된다. 일부 실시 형태에서, CasX 변이체 단백질의 개선된 특징은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 단백질에 비교하여 약 10 내지 약 10,000-배 이상 개선된다. 일부 실시 형태에서, CasX 변이체 단백질의 개선된 특징은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 단백질에 비교하여 gRNA에 대한 CasX 단백질의 약 1.1 내지 약 1000-배 이상 증가된 결합 친화도이다. 일부 실시 형태에서, CasX 변이체 단백질의 개선된 특징은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 참조 CasX 단백질에 비교하여 약 1.1-배 이상, 1.5-배 이상, 10-배 이상, 50-배 이상, 100-배 이상, 500-배 이상, 1,000-배 이상, 5,000-배 이상, 또는 10,000-배 이상 개선된다. 일부 실시 형태에서, CasX 변이체 단백질은 서열 번호 1, 서열 번호 2, 또는 서열 번호 3의 단백질에 비교하여 약 1.1 내지 약 10-배 이상 증가된 표적 핵산 서열에 대한 결합 친화도를 갖는다. 일부 실시 형태에서, CasX 변이체 단백질에 의해 증가된 표적 핵산 서열에 대한 결합 친화도는 TTC, ATC, GTC, 및 CTC를 포함하는 하나 이상의 PAM 서열에 대한 것이다,
일부 실시 형태에서, 표적 핵산 서열을 변형시키는 단계는 생체외에서 실행된다. 일부 실시 형태에서, 표적 핵산 서열을 변형시키는 단계는 시험관내 세포 내부에서 실행된다. 세포 내의 표적 핵산 서열의 변형의 일부 실시 형태에서, 세포는 설치류 세포, 마우스 세포, 래트 세포, 영장류 세포, 비-인간 영장류 세포, 및 인간 세포로 이루어진 군으로부터 선택된 진핵 세포이다. 특정 실시 형태에서, 진핵 세포는 인간 세포이다. 일부 실시 형태에서, 표적 핵산 서열의 변형은 대상체에서 생체내에서 실행된다. 일부 실시 형태에서, 대상체는 마우스, 래트, 돼지, 비-인간 영장류, 및 인간으로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 표적 핵산 서열을 변형시키는 방법은 CasX 단백질 및 gRNA 쌍을 인코딩하고 공여자 주형을 추가로 포함하는 AAV 벡터와 표적 핵산을 접촉시키는 단계를 포함한다. 공여자 주형은 유전자 생성물의 전부가 발현되거나, 일부가 발현되거나, 전혀 발현되지 않도록 표적 핵산 내로 삽입될 수 있다. 시스템이 단백질-코딩 서열을 녹-다운/녹-아웃시키기 위해 사용되는지, 또는 녹-인시키기 위해 사용되는지 여부에 따라, 공여자 주형은 짧은 단일-가닥 또는 이중-가닥 올리고뉴클레오티드일 수 있거나, 긴 단일-가닥 또는 이중-가닥 올리고뉴클레오티드일 수 있다. 녹-다운/녹-아웃의 경우, 공여자 주형 서열은 그것이 대체하는 게놈 서열과 동일할 필요는 없으며, 게놈 서열에 대해 하나 이상의 단일 염기 변화, 삽입, 결실, 역위, 또는 재배열을 함유할 수 있다. 상동성-지정 복구를 지원하기 위해 CasX:gRNA에 의해 표적화되는 표적 핵산 서열의 절단 부위(들)를 플랭킹하는(즉, 절단 부위에 대해 5' 및 3') 충분한 상동성을 갖는 충분한 수의 뉴클레오티드를 갖는 아암("상동성 아암")이 존재한다면, 그러한 공여자 주형의 사용은 유전자 생성물이 발현되지 않거나 더 낮은 수준으로 발현되도록 프레임-시프트 또는 다른 돌연변이를 유발할 수 있다. 일부 실시 형태에서, 상동성 아암은 10 내지 100개의 뉴클레오티드를 포함한다. 상류 및 하류 상동성 아암 서열은 절단 부위의 양쪽을 플랭킹하는 1 내지 50개 염기 이내의 뉴클레오티드 서열과 약 80%, 85%, 90%, 95% 이상, 또는 100%의 상동성을 공유하며, 여기서 CasX는 표적 핵산 서열을 절단하여, HDR에 의한 공여자 주형 서열의 삽입을 용이하게 한다. 일부 실시 형태에서, 표적 DNA 영역과 2개의 플랭킹 아암 서열 사이의 상동성-지정 복구가 표적 영역에서 비-상동성 또는 이종성 서열의 삽입을 유발하여, 결과적으로 유전자 생성물의 발현의 감소 또는 제거와 함께, 표적 유전자의 녹-다운 또는 녹-아웃을 유발하도록, 공여자 주형 서열은 2개의 상동성 아암에 의해 플랭킹된 비-상동성 또는 이종성 서열을 포함한다. 그러한 녹-다운의 경우에, 유전자 생성물의 발현은 변형되지 않은 표적 핵산에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 또는 약 90% 이상만큼 감소된다. 다른 경우에, 외인성 공여자 주형은 통합될 교정 서열(corrective sequence)을 포함할 수 있으며, 상류 상동성 아암 및 하류 상동성 아암에 의해 플랭킹되고, 각각은 세포 내로 도입되는 표적 핵산 서열에 대한 상동성을 갖는다. 그러한 공여자 주형의 사용은 유전자 편집 후에 기능적 단백질의 발현 또는 생리학적 정상 수준의 기능적 단백질의 발현을 유발할 수 있다. 다른 경우에는, 돌연변이, 이종성 서열, 또는 교정 서열을 포함할 수 있는 외인성 공여자 주형이, 상동성-독립적 표적화 통합(HITI) 기전에 의한 CasX 절단에 의해 생성된 단부들 사이에 삽입된다. HITI에 의해 삽입된 외인성 서열은 임의의 길이, 예를 들어, 1 내지 50개 뉴클레오티드 길이의 비교적 짧은 서열, 또는 약 50 내지 1000개 뉴클레오티드 길이의 더 긴 서열일 수 있다. 상동성의 결여는, 예를 들어, 20 내지 50% 이하의 서열 동일성을 갖는 것 및/또는 낮은 엄격성에서의 특이적 혼성화가 결여되는 것일 수 있다. 다른 경우에, 상동성의 결여는 5, 6, 7, 8, 또는 9 bp 이하의 동일성을 갖는 것의 기준을 추가로 포함할 수 있다.
일부 실시 형태에서, AAV 벡터는 공여자 주형 서열을 포함하며, 여기서 서열은 표적 핵산 서열에 비교하여 소정의 서열 차이, 예를 들어, 제한 부위, 뉴클레오티드 다형성, 선택가능한 마커(예를 들어, 약물 저항성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있고, 이는 절단 부위에서의 공여자 핵산의 성공적인 삽입에 대해 평가하기 위해 사용될 수 있거나, 일부 경우에는 다른 목적(예를 들어, 표적화된 게놈 유전자좌에서 발현을 나타내기 위해)을 위해 사용될 수 있다. 대안적으로, 이들 서열 차이는 플랭킹 재조합 서열, 예컨대 FLP, loxP 서열 등을 포함할 수 있으며, 이는 마커 서열의 제거를 위해 이후에 활성화될 수 있다. 본 방법의 일부 실시 형태에서, 공여자 폴리뉴클레오티드는 약 10개 이상, 약 50개 이상, 약 100개 이상, 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상의 뉴클레오티드를 포함한다. 다른 실시 형태에서, 공여자 폴리뉴클레오티드는 약 10 내지 약 700개 이상의 뉴클레오티드, 약 20 내지 약 600개 이상의 뉴클레오티드, 약 40 내지 약 400개 이상의 뉴클레오티드를 포함한다. 일부 실시 형태에서, 공여자 주형은 단일 가닥 DNA 주형 또는 단일 가닥 RNA 주형이다.
일부 경우에 본 방법은, 표적 핵산 서열을 공여자 주형과 접촉시키는 단계를 포함하지 않으며, 표적 핵산 서열은 표적 핵산 서열 내의 뉴클레오티드가 세포 자체의 복구 경로에 따라 결실되거나 삽입되도록 변형될 수 있고; 예를 들어, 세포 복구 경로는 NHEJ일 수 있다.
다른 실시 형태에서, 본 방법은 CasX/gRNA를 세포의 핵에 대해 표적화하기 위해 본 명세서에 기재된 실시 형태 중 임의의 것 또는 다수의 하나 이상의 핵 위치 신호(NLS)를 포함하는 CasX를 인코딩하는 AAV를 제공한다. NLS는 CasX 단백질의 N-말단, C-말단, 또는 둘 모두에 또는 그 부근에 융합될 수 있다.
본 개시내용의 이식유전자 구성성분(예를 들어, CasX, gRNA, 프로모터, 및 액세서리 구성성분, 및 임의로, 공여자 주형 서열)을 인코딩하는 서열을 포함하는 재조합 AAV 벡터를 시험관내 조건 하에 세포 내로 도입하는 단계는 세포의 생존 및 CasX:gRNA의 생성을 촉진하는 임의의 적합한 배양 배지 중에, 그리고 임의의 적합한 배양 조건 하에 일어날 수 있다. 표적 세포 내로 재조합 AAV 벡터를 도입하는 단계는 생체내, 시험관내, 또는 생체외에서 실행될 수 있다. 본 방법의 일부 실시 형태에서, 벡터는 표적 숙주 세포에 직접 제공될 수 있다. 예를 들어, 벡터가 세포에 의해 흡수되도록, 본 명세서에 기재된 실시 형태 중 임의의 것의 CasX 및 gRNA를 인코딩하는 핵산, 및 임의로 공여자 주형 서열을 갖는 벡터와 세포를 접촉시킬 수 있다. 플라스미드인 핵산 벡터와 세포를 접촉시키기 위한 방법은 전기천공, 칼슘 클로라이드 형질감염, 미세주입, 형질도입, 및 리포펙션을 포함하며, 당업계에 잘 알려져 있다. 일부 실시 형태에서, AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 선택된다.
일부 실시 형태에서, 벡터는 대상체에게 치료적 유효 용량으로 투여된다. 전술한 것들에서, 대상체는 마우스, 래트, 돼지, 비-인간 영장류, 및 인간으로 이루어진 군으로부터 선택된다. 특정 실시 형태에서, 대상체는 인간이다. 본 방법의 일부 실시 형태에서, 벡터는 대상체에게 약 1 x 105 벡터 게놈/kg(vg) 이상, 약 1 x 106 vg/kg 이상, 약 1 x 107 vg/kg 이상, 약 1 x 108 vg/kg 이상, 약 1 x 109 vg/kg 이상, 약 1 x 1010 vg/kg 이상, 약 1 x 1011 vg/kg 이상, 약 1 x 1012 vg/kg 이상, 약 1 x 1013 vg/kg 이상, 약 1 x 1014 vg/kg 이상, 약 1 x 1015 vg/kg 이상, 약 1 x 1016 vg/kg 이상의 용량으로 투여된다. 벡터는 피하, 피내, 신경내, 림프절내, 척수내, 근육내, 요추내, 척추강내, 지주막하, 뇌실내, 관절낭내, 정맥내, 림프내, 또는 복강내 경로로 이루어진 군으로부터 선택된 투여 경로에 의해 투여될 수 있으며, 여기서 투여 방법은 주사, 이입(transfusion), 또는 이식이다.
gRNA 및 CasX 단백질을 인코딩하는 핵산을 표적 숙주 세포에 제공하기 위해 사용되는 AAV 벡터는 발현, 즉, 관심 핵산의 전사 활성화를 구동하기에 적합한 프로모터 또는 다른 액세서리 요소를 포함할 수 있다. 일부 경우에, 인코딩하는 관심 핵산은 프로모터에 작동가능하게 연결될 것이다. 이는 편재성으로 작용하는 프로모터, 예를 들어, CMV-베타-액틴 프로모터, 또는 유도성 프로모터, 예컨대 특정 세포 집단에서 활성이거나 테트라사이클린 또는 카나마이신과 같은 약물의 존재에 반응하는 프로모터를 포함할 수 있다. 전사 활성화에 의해, 벡터를 포함하는 표적 숙주 세포 내의 기저 수준을 초과하여 약 10-배 이상만큼, 약 100-배 이상만큼, 더욱 일반적으로는 약 1000-배 이상만큼 전사가 증가될 것이 의도된다. 또한, CasX 단백질 및/또는 gRNA를 흡수한 세포를 확인하기 위해, gRNA 및/또는 CasX 단백질을 인코딩하는 핵산을 세포에 제공하기 위해 사용되는 벡터는 표적 세포 내의 선택가능한 마커를 인코딩하는 핵산 서열을 포함할 수 있다.
VI. AAV 벡터
다른 실시 형태에서, 본 개시내용은 본 명세서에 기재된 CasX 단백질, gRNA, 및 조절 및 액세서리 요소를 인코딩하는 폴리뉴클레오티드를 포함하는 재조합 AAV 벡터를 제공한다.
일부 실시 형태에서, 본 개시내용은 a) AAV 캡시드 단백질, 및 b) 본 명세서에 기재된 실시 형태 중 어느 하나의 폴리뉴클레오티드를 포함하는 재조합 아데노-관련 바이러스(rAAV)를 제공한다. 전술한 실시 형태에서, 폴리뉴클레오티드는 하기로부터 선택된 구성성분의 서열을 포함할 수 있다: 제1 아데노-관련 바이러스(AAV) 역위 말단 반복(ITR) 서열; 제2 AAV ITR 서열; 본 명세서에 기재된 실시 형태 중 임의의 것의 제1 프로모터 서열; 본 명세서에 기재된 실시 형태 중 임의의 것의 제2 프로모터 서열; 본 명세서에 기재된 실시 형태 중 임의의 것의 CRISPR 단백질을 인코딩하는 서열; 적어도 본 명세서에 기재된 실시 형태 중 임의의 것의 제1 가이드 RNA(gRNA); 및 본 명세서에 기재된 실시 형태 중 임의의 것의 하나 이상의 액세서리 요소 서열을 인코딩하는 서열. 일부 실시 형태에서, 폴리뉴클레오티드는 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 22 및 표 24 내지 표 27에 기술된 서열의 군으로부터 선택된 하나 이상의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함한다. 다른 실시 형태에서, 폴리뉴클레오티드는 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 22 및 표 24 내지 표 27에 기술된 서열의 군으로부터 선택된 서열을 포함한다. 일부 실시 형태에서, 폴리뉴클레오티드 서열은 표 8 내지 표 10, 표 12, 표 13, 및 표 17 내지 표 22 및 표 24 내지 표 26에 기술된 것들과는 폴리뉴클레오티드에 의해 인코딩되는 gRNA 또는 gRNA의 표적화 서열의 선택에 있어서만 상이하며, 여기서 표적화 서열은 표적 핵산의 서열과 혼성화될 수 있는 15 내지 30개의 뉴클레오티드를 갖는 서열이다. 특정 실시 형태에서, 폴리뉴클레오티드의 표적화 서열은 표 27에 기술된 서열로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 본 개시내용은 본 명세서에 기재된 실시 형태 중 임의의 것의 폴리뉴클레오티드를 제공하며, 여기서 폴리뉴클레오티드는 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나의 작제물의 구성을 갖는다.
일부 실시 형태에서, AAV 캡시드 단백질은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래된다. 일부 실시 형태에서, AAV 캡시드 단백질 및 5' 및 3' ITR은 동일한 혈청형의 AAV로부터 유래된다. 다른 실시 형태에서, AAV 캡시드 단백질 및 5' 및 3' ITR은 상이한 혈청형의 AAV로부터 유래된다. 특정 실시 형태에서, 5' 및 3' ITR은 AAV1로부터 유래된다. 다른 특정 실시 형태에서, 5' 및 3' ITR은 AAV2로부터 유래된다. 일부 실시 형태에서, 폴리뉴클레오티드는 서열 번호 1 내지 3의 참조 CasX를 인코딩하는 서열을 포함한다. 다른 실시 형태에서, 폴리뉴클레오티드는 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 및 40828 내지 40912, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 서열 동일성을 갖는 서열의 CasX 단백질 변이체를 포함하는, 본 명세서에 기재된 실시 형태 중 임의의 것의 CasX 변이체를 인코딩하는 서열을 포함한다. 일부 실시 형태에서, 폴리뉴클레오티드는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택된 gRNA 스캐폴드 서열을 인코딩한다. 일부 실시 형태에서, gRNA는 15 내지 30개의 뉴클레오티드를 갖는 표적화 서열을 포함하며, 이는 세포 내의 표적 핵산에 상보적이고, 따라서 이와 혼성화되고, gRNA 스캐폴드 서열의 3' 단부에 연결된다.
다른 실시 형태에서, 본 개시내용은 공여자 주형 핵산을 포함하는 AAV 시스템을 제공하며, 여기서 공여자 주형은 표적 핵산 서열에 대한 상동성을 갖는 뉴클레오티드 서열을 포함한다. 일부 실시 형태에서, 공여자 주형은 유전자 편집을 위해 의도되고 표적 유전자의 전부 또는 적어도 일부를 포함하며, 여기서 공여자 주형의 삽입시에, 유전자는 녹 다운되거나, 녹 아웃되거나, 돌연변이가 교정된다. 일부 실시 형태에서, 공여자 주형은 표적 핵산 엑손의 적어도 일부를 인코딩하는 서열을 포함한다. 다른 실시 형태에서, 공여자 주형은 표적 핵산 인트론의 적어도 일부를 인코딩하는 서열을 갖는다. 다른 실시 형태에서, 공여자 주형은 표적 핵산 인트론-엑손 접합부의 적어도 일부를 인코딩하는 서열을 갖는다. 또 다른 경우에, AAV 시스템의 공여자 주형 서열은 표적 핵산에 비교하여 하나 이상의 돌연변이를 포함한다. 전술한 실시 형태에서, 공여자 주형은 크기가 10 내지 700개 뉴클레오티드의 범위일 수 있다. 일부 실시 형태에서, 공여자 주형은 단일-가닥 DNA 주형이다.
다른 태양에서 본 개시내용은, 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 벡터를 인코딩하는 폴리뉴클레오티드 서열을 생성하는 방법뿐만 아니라, AAV를 발현시키고 회수하는 방법에 관한 것이다. 일반적으로, 본 방법은 본 명세서에 기재된 실시 형태 중 임의의 것의 발현 카세트의 구성성분에 더하여 플랭킹 ITR을 코딩하는 폴리뉴클레오티드 서열을 생성하는 단계 및 인코딩하는 유전자를 숙주 세포에 적절한 발현 벡터 내로 혼입시키는 단계를 포함한다. 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 벡터의 생성을 위해, 본 방법은 트랜스로 제공되는 Rep 및 Cap 서열과 함께, 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터로 적절한 숙주 세포를 형질전환하는 단계, 및 결과적으로 AAV가 생성되는 것을 야기하거나 허용하는 조건 하에 숙주 세포를 배양하고, 본 명세서에 기재된 방법 또는 당업계에 알려진 표준 정제 방법에 의해 이를 회수하는 단계를 포함한다. Rep 및 Cap은 플라스미드로서 패키징 숙주 세포에 제공될 수 있다. 대안적으로, 숙주 세포 게놈은 안정하게 통합된 Rep 및 Cap 유전자를 포함할 수 있다. 적합한 패키징 세포주는 당업자에게 알려져 있다. 예를 들어, www.cellbiolabs.com/aav-expression-and-packaging을 참조한다. 숙주 세포주에 의해 생성된 AAV를 정제하는 방법은 당업자에게 알려져 있을 것이며, 친화도 크로마토그래피, 구배 원심분리, 및 이온 교환 크로마토그래피를 제한 없이 포함한다. 실시예의 방법과 함께, 분자 생물학에서의 표준 재조합 기술을 사용하여, 본 개시내용의 폴리뉴클레오티드 및 AAV 벡터를 제조한다.
본 개시내용에 따라, 본 명세서에 기재된 실시 형태 중 임의의 것의 참조 CasX, CasX 변이체, 또는 gRNA를 인코딩하는 핵산 서열(또는 이들의 상보체)을 사용하여 적절한 숙주 세포에서 발현을 유도하는 재조합 DNA 분자를 생성한다. 몇몇 클로닝 전략이 본 개시내용을 수행하기에 적합하며, 이들 중 다수는 본 개시내용의 조성물을 코딩하는 유전자, 또는 그의 상보체를 포함하는 작제물을 생성하기 위해 사용된다. 일부 실시 형태에서는, 조성물의 발현을 위해 숙주 세포를 형질전환하기 위해 사용되는 참조 CasX, CasX 변이체, 또는 gRNA를 인코딩하는 뉴클레오티드를 포함하는 작제물을 인코딩하는 유전자를 생성하기 위해 클로닝 전략이 사용된다.
일부 접근법에서는, AAV 벡터의 구성성분 및 이식유전자를 인코딩하는 DNA 서열을 함유하는 작제물이 먼저 제조된다. 그러한 작제물의 제조를 위한 예시적인 방법은 실시예에 기재된다. 이어서, 숙주 패키징 세포, 예컨대 이식유전자를 포함하는 AAV 벡터의 발현 및 회수를 위한 진핵 숙주 세포를 형질전환하기에 적합한 발현 벡터를 생성하기 위해 작제물이 사용된다. 진핵 숙주 패키징 세포는 BHK 세포, HEK293 세포, HEK293T 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, NIH3T3 세포, COS 세포, HeLa 세포, CHO 세포, 또는 재조합 AAV의 생성에 적합한 당업계에 알려진 다른 진핵 세포로부터 선택될 수 있다. 다수의 형질감염 기술이 일반적으로 당업계에 알려져 있으며; 예를 들어, 문헌[Sambrook et al. (1989) Molecular Cloning, a laboratory manual, Cold Spring Harbor Laboratories, New York]을 참조한다. 특히 적합한 형질감염 방법은 칼슘 포스페이트 공동-침전, 배양된 세포 내로의 직접 미세주입, 전기천공, 리포솜 매개 유전자 이동, 지질-매개 형질도입, 및 고속 미세분사(high-velocity microprojectile)를 사용하는 핵산 전달을 포함한다. 발현 벡터의 생성을 위한 예시적인 방법, 숙주 세포의 형질전환, 및 핵산 및 AAV 벡터의 발현 및 회수는 실시예에 기재된다.
AAV 벡터를 인코딩하는 유전자는, 완전히 합성적으로 또는 효소적 공정과 조합된 합성, 예컨대 실시예에 더욱 완전하게 기재된 방법을 포함하는 제한 효소-매개 클로닝, PCR 및 중첩 연장(overlap extension)에 의해, 하나 이상의 단계로 제조될 수 있다. 예를 들어, 원하는 서열의 다양한 구성성분(예를 들어, ITR, CasX 및 gRNA, 프로모터 및 액세서리 요소)을 인코딩하는 폴리뉴클레오티드의 서열을 라이게이션하여 발현 벡터를 생성하기 위해, 본 명세서에 개시된 방법을 사용할 수 있다.
일부 실시 형태에서는, AAV ITR에 의해 플랭킹된 뉴클레오티드 서열을 복제하고 캡시드화하여 rAAV 바이러스 입자를 생성하기 위해, 상기-기재된 AAV 발현 벡터로 형질감염된 숙주 세포가 AAV 헬퍼 기능을 제공할 수 있게 만든다. AAV 헬퍼 기능은 일반적으로 AAV-유래의 코딩 서열이며, 이는 발현되어 AAV 유전자 생성물을 제공할 수 있고, 이는 결국 생산적 AAV 복제를 위해 트랜스로 기능한다. 본 명세서에서 AAV 헬퍼 기능은 AAV 발현 벡터로부터 누락된 필요한 AAV 기능을 보충하기 위해 사용된다. 따라서, AAV 헬퍼 기능은 rep 및 cap 코딩 영역, 또는 이들의 기능적 상동체를 인코딩하는, 주요 AAV ORF(개방 해독 프레임) 중 하나 또는 둘 모두를 포함한다. 당업자에게 알려진 방법을 사용하여 액세서리 기능을 숙주 세포 내로 도입한 후에 발현시킬 수 있다. 통상적으로, 액세서리 기능은 무관한 헬퍼 바이러스를 이용한 숙주 세포의 감염에 의해 제공된다. 일부 실시 형태에서, 액세서리 기능은 액세서리 기능 벡터를 사용하여 제공된다. 이용되는 숙주/벡터 시스템에 따라, 구성성 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결자 등을 포함하는, 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에 사용될 수 있다.
일부 실시 형태에서, AAV 벡터의 구성성분을 인코딩하는 뉴클레오티드 서열은 코돈 최적화된다. 동일한 CasX 단백질 또는 다른 단백질 구성성분을 인코딩하면서 의도된 숙주 유기체 또는 세포의 코돈 선호도(codon preference)를 모방하기 위해, 이 유형의 최적화는 인코딩하는 뉴클레오티드 서열의 돌연변이를 수반할 수 있다. 따라서, 코돈은 변화할 수 있지만, 인코딩된 단백질은 변화하지 않고 유지된다. 예를 들어, 의도된 숙주 세포가 인간 세포였던 경우, 인간 코돈-최적화된 CasX-인코딩 뉴클레오티드 서열이 사용될 수 있을 것이다. AAV 벡터의 생성에 이용되는 숙주 세포에 적절한 아미노산 조성 및 코돈 사용빈도를 최적화하는 알고리즘을 사용하여 유전자 설계를 수행할 수 있다. 본 개시내용의 일 방법에서는, 상기 기재된 바와 같이, 작제물의 구성성분을 인코딩하는 폴리뉴클레오티드의 라이브러리를 생성한 후에 조립한다. 이어서, 본 명세서에 기재된 바와 같이, 생성되는 유전자를 조립하고, 생성되는 유전자를 사용하여 숙주 세포를 형질전환하고, AAV 벡터 조성물을 그의 특성의 평가를 위해 생성하고 회수한다. 일부 실시 형태에서는, 하기 더욱 완전하게 기재된 바와 같이, 구성성분의 기능적 특징을 유지하면서 구성성분의 면역원성을 감소시키기 위해, AAV 벡터의 구성성분을 인코딩하는 뉴클레오티드 서열을 조작하여 CpG 다이뉴클레오티드를 제거한다.
일부 실시 형태에서, gRNA를 인코딩하는 뉴클레오티드 서열은 조절 요소에 작동가능하게 연결된다. 일부 실시 형태에서, CasX 단백질을 인코딩하는 뉴클레오티드 서열은 조절 요소에 작동가능하게 연결된다. 다른 경우에, CasX 및 gRNA를 인코딩하는 뉴클레오티드는 연결되고, 단일 조절 요소에 작동가능하게 연결된다. 예시적인 액세서리 요소는 전사 프로모터, 전사 인핸서 요소, 전사 종결 신호, 단일 전사체로부터 다중 유전자의 번역을 허용하기 위한 내부 리보솜 진입 부위(IRES) 또는 P2A 펩티드, 하류 전사 종결을 촉진하기 위한 폴리아데닐화 서열, 번역의 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 일부 경우에, 프로모터는 구성성으로 활성인 프로모터이다. 일부 경우에, 프로모터는 조절가능한 프로모터이다. 일부 경우에, 프로모터는 유도성 프로모터이다. 일부 경우에, 프로모터는 조직-특이적 프로모터이다. 일부 경우에, 프로모터는 세포 유형-특이적 프로모터이다. 일부 경우에, 전사 액세서리 요소(예를 들어, 프로모터)는 표적화된 세포 유형 또는 표적화된 세포 집단에서 기능적이다. 예를 들어, 일부 경우에, 전사 액세서리 요소는 진핵 세포, 예를 들어, AAV 벡터의 생성을 위한 패키징 숙주 세포에서 기능적일 수 있다. 일부 경우에, 액세서리 요소는 전사를 개시하기 위해 프로모터와 연합하여 작동하는 전사 활성화제이다. 전사 활성화에 의해, 표적 세포 내의 기저 수준을 초과하여 10-배만큼, 100-배만큼, 더욱 일반적으로는 1000-배만큼 전사가 증가될 것이 의도된다.
진핵생물 프로모터(진핵 세포에서 기능적인 프로모터)의 비-제한적 예는 EF-1알파, EF-1알파 코어 프로모터, 사이토메갈로바이러스(CMV) 즉시 초기, 단순 포진 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복(LTR), 및 마우스 메탈로티오네인-I로부터의 것들을 포함한다. 진핵생물 프로모터의 추가의 비-제한적 예는 CMV 프로모터 전장 프로모터, 최소 CMV 프로모터, 닭 β-액틴 프로모터, RSV 프로모터, HIV-Ltr 프로모터, hPGK 프로모터, HSV TK 프로모터, 미니-TK 프로모터, 뉴런-특이적 발현을 부여하는 인간 시냅신 I 프로모터, 뉴런에서의 선택적 발현을 위한 Mecp2 프로모터, 최소 IL-2 프로모터, 라우스 육종 바이러스 인핸서/프로모터(RSV), 비장 초점-형성 바이러스 긴 말단 반복(LTR) 프로모터, SV40 인핸서, 인간 티록신-결합 글로불린 유전자(간 특이적)로부터의 TBG 프로모터, PGK 프로모터, 인간 유비퀴틴 C 프로모터, UCOE 프로모터(HNRPA2B1-CBX3의 프로모터), 히스톤 H2 프로모터, 히스톤 H3 프로모터, U1a1 작은 핵 RNA 프로모터(226 nt), U1b2 작은 핵 RNA 프로모터(246 nt) 26, TTR 최소 인핸서/프로모터, b-키네신 프로모터, ROSA26 프로모터, 및 글리세르알데히드 3-포스페이트 데하이드로게나제(GAPDH) 프로모터를 포함한다. 일부 실시 형태에서, 제1 및/또는 제2 gRNA를 인코딩하는 서열에 작동가능하게 연결된 프로모터는 U6이다(문헌[Kunkel, GR et al. U6 small nuclear RNA is transcribed by RNA polymerase III. Proc Natl Acad Sci U S A. 83(22):8575 (1986)]).
본 개시내용의 AAV 작제물에 사용하기에 적합한 pol II 프로모터의 비-제한적 예는 폴리유비퀴틴 C(UBC), 사이토메갈로바이러스(CMV), 시미안 바이러스 40(SV40), 닭 베타-액틴 프로모터 및 토끼 베타-글로빈 스플라이스 수용자 부위 융합체(CAG), 사이토메갈로바이러스 인핸서(CB7)를 갖는 닭 β-액틴 프로모터, PGK, 젠스 토르노에(JeT), GUSB, CBA 혼성체(CBh), 신장 인자-1 알파(EF-1알파), 베타-액틴, 라우스 육종 바이러스(RSV), 침묵화-빈발 비장 초점 형성 바이러스(SFFV), CMVd1 프로모터, 절단된 인간 CMV(tCMVd2), 최소 CMV 프로모터, 닭 β-액틴 프로모터, 사이토메갈로바이러스 인핸서(CB7)를 갖는 닭 β-액틴 프로모터, HSV TK 프로모터, 미니-TK 프로모터, 최소 IL-2 프로모터, GRP94 프로모터, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, MLC, MCK, GRK1 단백질 프로모터, Rho 프로모터, CAR 단백질 프로모터, hSyn 프로모터, U1A 프로모터, 리보솜 Rpl 및 Rps 프로모터(예를 들어, hRpl30 및 hRps18), CMV53 프로모터, 최소 SV40 프로모터, CMV53 프로모터, SFCp 프로모터, pJB42CAT5 프로모터, MLP 프로모터, EFS 프로모터, MeP426 프로모터, MecP2 프로모터, MHCK7 프로모터, 베타-글루쿠로니다제(GUSB), CK7 프로모터, 및 CK8e 프로모터를 포함하지만 이로 제한되지 않는다. 일부 실시 형태에서, 본 개시내용의 AAV 작제물은 표 8에 기술된 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 pol II 프로모터를 포함한다. 특정 실시 형태에서, pol II 프로모터는 EF-1알파이며, 여기서 프로모터는 형질감염 효율, CRISPR 뉴클레아제의 이식유전자 전사 또는 발현, 발현-양성 클론의 비율, 및 장기 배양에서의 에피솜 벡터의 카피 수를 향상시킨다. 다른 특정 실시 형태에서, pol II 프로모터는 JeT이며, 여기서 프로모터는 형질감염 효율, CRISPR 뉴클레아제의 이식유전자 전사 또는 발현, 발현-양성 클론의 비율, 및 장기 배양에서의 에피솜 벡터의 카피 수를 향상시킨다. 일부 실시 형태에서, pol II 프로모터는 전술한 프로모터의 절단된 버전이다. 일부 실시 형태에서 본 개시내용의 AAV 작제물 내의 pol II 프로모터는 약 400개 미만의 뉴클레오티드, 약 350개 미만의 뉴클레오티드, 약 300개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 150개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 40개 미만의 뉴클레오티드를 갖는다. 일부 실시 형태에서 본 개시내용의 AAV 작제물 내의 pol II 프로모터는 약 40 내지 약 585개의 뉴클레오티드, 약 100 내지 약 400개의 뉴클레오티드, 또는 약 150 내지 약 300개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 본 개시내용의 AAV 작제물은 단락의 전술한 실시 형태 중 임의의 것의 pol II 프로모터뿐만 아니라, 표 8의 프로모터를 인코딩하는 폴리핵산을 포함하며, 일부 경우에는, 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나에 도시된 바와 같은 작제물의 다른 구성성분에 관련하여 구성될 수 있다.
일부 실시 형태에서, 본 개시내용의 AAV 작제물은 연결된 인트론을 갖는 pol II 프로모터를 포함하며, 여기서 인트론은 형질감염 효율, CRISPR 뉴클레아제의 이식유전자 전사 또는 발현, 발현-양성 클론의 비율, 및 장기 배양에서의 에피솜 벡터의 카피 수를 증가시키는 프로모터의 능력을 향상시킨다. 그러한 프로모터-인트론 조합의 예시적인 실시 형태는 실시예에 기재된다.
본 개시내용의 AAV 작제물에 사용하기에 적합한 pol III 프로모터의 비-제한적 예는 U6, 미니 U6, 7SK, 및 H1 변이체, BiH1(양방향 H1 프로모터), BiU6, Bi7SK, BiH1(양방향 U6, 7SK, 및 H1 프로모터), 고릴라 U6, 레수스 U6, 인간 7SK, 및 인간 H1 프로모터를 포함하지만 이로 제한되지 않는다. 전술한 실시 형태에서, pol III 프로모터는 AAV에 의해 인코딩되는 gRNA의 전사를 향상시킨다. 일부 실시 형태에서, 본 개시내용의 AAV 작제물은 표 9에 기술된 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 pol III 프로모터를 포함한다. 일부 실시 형태에서, pol III 프로모터는 전술한 프로모터의 절단된 버전이다. 일부 실시 형태에서 본 개시내용의 AAV 작제물 내의 pol III 프로모터는 약 250개 미만의 뉴클레오티드, 약 220개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 160개 미만의 뉴클레오티드, 약 140개 미만의 뉴클레오티드, 약 130개 미만의 뉴클레오티드, 약 120개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 70개 미만의 뉴클레오티드를 갖는다. 일부 실시 형태에서 본 개시내용의 AAV 작제물 내의 pol III 프로모터는 약 70 내지 약 245개의 뉴클레오티드, 약 100 내지 약 220개의 뉴클레오티드, 또는 약 120 내지 약 160개의 뉴클레오티드를 갖는다. 일부 실시 형태에서, 본 개시내용의 AAV 작제물은 단락의 전술한 실시 형태 중 임의의 것의 pol III 프로모터뿐만 아니라, 표 9의 프로모터를 인코딩하는 폴리핵산을 포함하며, 일부 경우에는, 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나에 도시된 바와 같은 작제물의 다른 구성성분에 관련하여 구성될 수 있다.
적절한 프로모터의 선택은, 그것이, 예를 들어, 유전자 또는 다른 표적 핵산을 변형시키기 위해 발현을 제어하는 단계에 관련되므로, 본 기술분야의 통상의 기술 수준 내에 잘 포함된다. 발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 벡터는 또한 발현을 증폭하기 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한 CasX 단백질에 융합될 수 있는 단백질 태그(예를 들어, 6xHis 태그, 헤마글루티닌 태그, 형광 단백질 등)를 인코딩하는 뉴클레오티드 서열을 포함할 수 있으며, 따라서 정제 또는 검출을 위해 사용되는 키메라 CasX 단백질을 유발한다.
일부 실시 형태에서, 본 개시내용은 유도성 프로모터, 구성성으로 활성인 프로모터, 공간적으로 제한된 프로모터(즉, 전사 제어 요소, 인핸서, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등), 또는 일시적으로 제한된 프로모터에 작동가능하게 연결된 gRNA 및/또는 CasX 단백질을 인코딩하는 폴리뉴클레오티드 서열을 제공한다.
소정의 실시 형태에서, 적합한 프로모터는 바이러스로부터 유래될 수 있고, 따라서 바이러스 프로모터로 지칭될 수 있거나, 이들은 원핵 또는 진핵 유기체를 포함하는 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터를 사용하여 임의의 RNA 중합효소(예를 들어, pol I, pol II, pol III)에 의한 발현을 구동할 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유선 종양 바이러스 긴 말단 반복(LTR) 프로모터; 아데노바이러스 주요 후기 프로모터(Ad MLP); 단순 포진 바이러스(HSV) 프로모터, 사이토메갈로바이러스(CMV) 프로모터, 예컨대 CMV 즉시 초기 프로모터 영역(CMVIE), 라우스 육종 바이러스(RSV) 프로모터, 인간 U6 작은 핵 프로모터(U6), 향상된 U6 프로모터, 인간 HI 프로모터(HI), Pol II 프로모터, 7SK 프로모터, tRNA 프로모터 등을 포함하지만 이로 제한되지 않는다. 일부 실시 형태에서, 본 개시내용은 이식유전자의 2개의 gRNA가 2개의 인코딩된 gRNA 서열 사이에 위치하는 단일 양방향 프로모터(예를 들어, 양방향 H1 프로모터 또는 양방향 U6 프로모터)에 작동가능하게 연결된 폴리뉴클레오티드 서열을 제공하며, 여기서 프로모터는 둘 모두의 gRNA 서열의 전사를 개시할 수 있다. 다른 실시 형태에서, 본 개시내용은 역방향으로(즉, 3'에서 5'으로) 배향된 프로모터를 포함하는 AAV 작제물을 제공한다. 예시적인 역방향 및 양방향 프로모터는 실시예 및 표 8에 기재되고 도 24 및 도 34에 개략적으로 도시된다.
일부 실시 형태에서, 본 개시내용은 이식유전자의 하나 이상의 구성성분이 진핵 세포에서 작동가능한 유도성 프로모터에 작동가능하게 연결된(이의 제어 하에 있는) 폴리뉴클레오티드 서열을 제공한다. 유도성 프로모터의 예는 T7 RNA 중합효소 프로모터, T3 RNA 중합효소 프로모터, 아이소프로필-베타-D-티오갈락토피라노시드(IPTG)-조절되는 프로모터, 락토스 유도 프로모터, 열 충격 프로모터, 테트라사이클린-조절되는 프로모터, 카나마이신-조절되는 프로모터, 스테로이드-조절되는 프로모터, 금속-조절되는 프로모터, 에스트로겐 수용체-조절되는 프로모터 등을 포함할 수 있지만 이로 제한되지 않는다. 따라서 유도성 프로모터는, 일부 실시 형태에서, 독시사이클린, 에스트로겐 및/또는 에스트로겐 유사체, IPTG 등을 포함하지만 이로 제한되지 않는 분자에 의해 조절될 수 있다. 유도성 프로모터의 부가적인 예는 화학적으로/생화학적으로-조절되고 물리적으로-조절되는 프로모터, 예컨대 알코올-조절되는 프로모터, 카나마이신-조절되는 프로모터, 테트라사이클린-조절되는 프로모터(예를 들어, 안하이드로테트라사이클린(aTc)-반응성 프로모터 및 다른 테트라사이클린-반응성 프로모터 시스템, 이는 테트라사이클린 저해제 단백질(tetR), 테트라사이클린 오퍼레이터 서열(tetO), 및 테트라사이클린 전사활성화제 융합 단백질(tTA)을 포함함), 스테로이드-조절되는 프로모터(예를 들어, 래트 글루코코르티코이드 수용체, 인간 에스트로겐 수용체, 나방 엑디손 수용체에 기초하는 프로모터, 및 스테로이드/레티노이드/갑상선 수용체 수퍼패밀리로부터의 프로모터), 금속-조절되는 프로모터(예를 들어, 효모, 마우스, 및 인간으로부터의 메탈로티오네인(금속 이온에 결합하여 격리시키는 단백질) 유전자로부터 유래된 프로모터), 병인-조절되는 프로모터(예를 들어, 살리실산, 에틸렌, 또는 벤조티아다이아졸(BTH)에 의해 유도됨), 온도/열-유도성 프로모터(예를 들어, 열 충격 프로모터), 및 광-조절되는 프로모터(예를 들어, 식물 세포로부터의 광 반응성 프로모터)를 제한 없이 포함한다.
일부 경우에, 다세포 유기체에서, 프로모터가 특이적 세포의 서브세트에서 활성(즉, "ON")이도록, 프로모터는 공간적으로 제한된 프로모터(즉, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이다. 공간적으로 제한된 프로모터는 또한 인핸서, 전사 액세서리 요소, 제어 서열 등으로 지칭될 수 있다. 프로모터가 표적화된 숙주 세포(예를 들어, 진핵 세포; 원핵 세포)에서 기능적인 한, 임의의 편리한 공간적으로 제한된 프로모터가 사용될 수 있다.
일부 경우에, 프로모터는 가역적 프로모터이다. 가역적 유도성 프로모터를 포함하는 적합한 가역적 프로모터가 당업계에 알려져 있다. 그러한 가역적 프로모터는 다수의 유기체, 예를 들어, 진핵생물 및 원핵생물로부터 단리되고 유래될 수 있다. 제2 유기체에 사용하기 위해 제1 유기체로부터 유래된(예를 들어, 제1 원핵생물 및 제2 진핵생물, 제1 진핵생물 및 제2 원핵생물 등) 가역적 프로모터의 변형이 당업계에 잘 알려져 있다. 그러한 가역적 프로모터, 및 그러한 가역적 프로모터에 기초하지만 부가적인 제어 단백질을 또한 포함하는 시스템은 알코올 조절되는 프로모터(예를 들어, 알코올 데하이드로게나제 I(alcA) 유전자 프로모터, 알코올 전사활성화제 단백질(AlcR 등)에 반응성인 프로모터, 테트라사이클린 조절되는 프로모터(예를 들어, Tet 활성화제, TetON, TetOFF 등을 포함하는 프로모터 시스템), 스테로이드 조절되는 프로모터(예를 들어, 래트 글루코코르티코이드 수용체 프로모터 시스템, 인간 에스트로겐 수용체 프로모터 시스템, 레티노이드 프로모터 시스템, 갑상선 프로모터 시스템, 엑디손 프로모터 시스템, 미페프리스톤 프로모터 시스템 등), 금속 조절되는 프로모터(예를 들어, 메탈로티오네인 프로모터 시스템 등), 병인-관련 조절되는 프로모터(예를 들어, 살리실산 조절되는 프로모터, 에틸렌 조절되는 프로모터, 벤조티아다이아졸 조절되는 프로모터 등), 온도 조절되는 프로모터(예를 들어, 열 충격 유도성 프로모터(예를 들어, HSP-70, HSP-90, 대두 열 충격 프로모터 등), 광 조절되는 프로모터, 합성 유도성 프로모터 등을 포함하지만 이로 제한되지 않는다.
본 개시내용의 재조합 발현 벡터는 또한 본 개시내용의 구성성분(예를 들어, CasX 또는 gRNA)의 강건한 발현을 용이하게 하는 요소를 포함할 수 있다. 예를 들어, 본 개시내용의 AAV 작제물에 이용되는 재조합 발현 벡터는 폴리아데닐화 신호(폴리(A)), 인트론 서열, 또는 전사-후 액세서리 요소(PTRE) 중 하나 이상, 예컨대 우드척 간염 전사-후 액세서리 요소(WPRE)를 포함할 수 있다. 본 개시내용의 AAV 작제물에 적합한 PTRE의 비-제한적 예는 표 12의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함한다. 본 개시내용의 발현 벡터에 포함되기에 적합한 예시적인 폴리(A) 서열은 hGH 폴리(A) 신호(짧은), HSV TK 폴리(A) 신호, 합성 폴리아데닐화 신호, SV40 폴리(A) 신호, SV40 후기 폴리A 신호, β-글로빈 폴리(A) 신호, 짧은 β-글로빈 폴리(A) 등을 포함한다. 본 개시내용의 AAV 작제물에 적합한 폴리(A) 신호의 비-제한적 예는 표 10의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함한다. 본 개시내용의 AAV 작제물에 적합한 인트론의 비-제한적 예는 표 17의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함한다. 당업자는 본 명세서에 기재된 재조합 발현 벡터에 포함할 적합한 요소를 선택할 수 있을 것이다.
이식유전자 구성성분을 인코딩하는 폴리뉴클레오티드는 AAV 발현 벡터 내로 개별적으로 클로닝될 수 있다. 일부 실시 형태에서, 폴리뉴클레오티드는 CasX 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 발현 벡터이다. 다른 실시 형태에서, 본 개시내용은 CasX 단백질을 인코딩하는 폴리뉴클레오티드 서열 및 제1 gRNA 및, 임의로, 제2 gRNA를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 발현 벡터를 제공한다. 일부 경우에, CasX 단백질 변이체를 인코딩하는 뉴클레오티드 서열 및/또는 gRNA를 인코딩하는 뉴클레오티드 서열은 선택된 세포 유형에서 작동가능한 프로모터에 각각 작동가능하게 연결된다. 다른 실시 형태에서, CasX 단백질 변이체를 인코딩하는 뉴클레오티드 서열 및 gRNA를 인코딩하는 뉴클레오티드 서열은 별도의 벡터 내에 제공된다.
이식유전자 구성성분을 인코딩하는 핵산 서열은 다양한 절차에 의해 벡터 내로 삽입된다. 일반적으로, 당업계에 알려진 기술을 사용하여 적절한 제한 엔도뉴클레아제 부위(들) 내로 DNA를 삽입한다. 벡터 구성성분은 일반적으로 신호 서열, 복제의 원점, 하나 이상의 마커 유전자, 인핸서 요소, 프로모터, 및 전사 종결 서열 중 하나 이상을 포함하지만 이로 제한되지 않는다. 이들 구성성분 중 하나 이상을 함유하는 적합한 벡터의 작제는 당업자에게 알려진 표준 라이게이션 기술을 사용한다. 그러한 기술은 당업계에 잘 알려져 있고 과학 및 특허 문헌에 잘 기재되어 있다. 다양한 벡터가 공공 입수가능하다.
하기 및 실시예에 더욱 완전하게 기재된 바와 같이, 재조합 발현 벡터는 다양한 방법에 의해 표적 숙주 세포에 전달될 수 있다. 그러한 방법은, 예를 들어, 바이러스 감염, 형질감염, 리포펙션, 전기천공, 칼슘 포스페이트 침전, 폴리에틸렌이민(PEI)-매개 형질감염, DEAE-덱스트란 매개 형질감염, 리포솜-매개 형질감염, 입자 총 기술, 뉴클레오펙션, 전기천공, 세포 압착(cell squeezing), 칼슘 포스페이트 침전, 직접 미세주입, 나노입자-매개 핵산 전달 등을 포함한다. 다수의 형질감염 기술이 일반적으로 당업계에 알려져 있으며; 예를 들어, 문헌[Sambrook et al. (1989) Molecular Cloning, a laboratory manual, Cold Spring Harbor Laboratories, New York]을 참조한다. 바이러스 입자를 형성하기 위해 패키징 세포가 전형적으로 사용되며; 그러한 세포는 HEK293 세포 또는 HEK293T 세포(및 당업계에 알려진 다른 세포)를 포함하며, 이들은 아데노바이러스를 패키징한다.
일부 실시 형태에서는, AAV ITR에 의해 플랭킹된 뉴클레오티드 서열을 복제하고 캡시드화하여 rAAV 바이러스 입자를 생성하기 위해, 상기-기재된 AAV 발현 벡터로 형질감염된 숙주 세포가 AAV 헬퍼 기능을 제공할 수 있게 만든다. AAV 헬퍼 기능은 일반적으로 AAV-유래의 코딩 서열이며, 이는 발현되어 AAV 유전자 생성물을 제공할 수 있고, 이는 결국 생산적 AAV 복제를 위해 트랜스로 기능한다. 일부 실시 형태에서는, AAV 발현 벡터로부터 누락된 필요한 AAV 기능을 보충하기 위해 AAV 헬퍼 기능을 포함하는 플라스미드로 패키징 세포를 형질감염시킨다. 따라서, AAV 헬퍼 기능은, 프로모터에 작동가능하게 연결된, rep 및 cap 코딩 영역, 또는 이들의 기능적 상동체를 인코딩하는, 주요 AAV ORF(개방 해독 프레임) 중 하나 또는 둘 모두, 및 E2A, E4, 및 VA 유전자를 포함하는 아데노바이러스 헬퍼 유전자를 포함한다. 당업자에게 알려진 방법을 사용하여 액세서리 기능을 숙주 세포 내로 도입한 후에 발현시킬 수 있다. 통상적으로, 액세서리 기능은 무관한 헬퍼 바이러스를 이용한 숙주 세포의 감염에 의해 제공된다. 일부 실시 형태에서, 액세서리 기능은 액세서리 기능 벡터를 사용하여 제공된다. 이용되는 숙주/벡터 시스템에 따라, 구성성 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결자 등을 포함하는, 다수의 적합한 전사 및 번역 액세서리 요소 중 임의의 것이 발현 벡터에 사용될 수 있다.
VII. 응용
본 명세서에 제공된 AAV 시스템은 치료제, 진단제, 및 연구를 포함하는 다양한 응용에서 표적 핵산 서열을 변형시키기 위한 방법에 유용하다.
본 명세서에 기재된 세포 내의 표적 핵산 서열을 변형시키는 방법에서, 본 방법은 본 명세서에 기재된 AAV 시스템의 실시 형태 중 임의의 것을 이용한다. 일부 경우에, 본 방법은 돌연변이체 유전자 생성물의 발현을 녹-다운시킨다. 일부 경우에, 본 방법은 돌연변이체 유전자 생성물의 발현을 녹-아웃시킨다.
또 다른 경우에, 본 방법은 유전자 생성물의 기능적 단백질의 발현을 유발한다.
일부 실시 형태에서 본 방법은, 표적 핵산 서열을 표적화 서열을 포함하는 가이드 핵산 및 CasX 단백질을 인코딩하는 AAV와 접촉시키는 단계를 포함하며, 여기서 상기 접촉시키는 단계는 RNP의 CasX 단백질에 의한 표적 핵산 서열의 변형을 유발한다. 일부 실시 형태에서 본 방법은, CasX 단백질 및 gRNA를 인코딩하는 AAV를 세포 내로 도입하는 단계를 포함하며, 여기서 gRNA의 표적화 서열은 표적 핵산의 일부에 상보적인 서열을 포함하고, 여기서 접촉시키는 단계는 RNP의 표적 핵산의 변형을 유발한다. 일부 실시 형태에서, gRNA의 인코딩된 스캐폴드는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하며, 인코딩된 CasX 단백질은 참조 CasX 단백질 서열 번호 1, 서열 번호 2, 또는 서열 번호 3 또는 표 3에 기술된 바와 같은 서열 번호 49 내지 160, 40208 내지 40369, 및 40828 내지 40912, 또는 이들에 대해 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 약 99% 이상의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는 CasX 변이체이다.
일부 실시 형태에서, 변형된 표적 핵산은 세포의 복구 기전에 의한 돌연변이, 삽입, 또는 결실을 유발하는 단일-가닥 파단을 포함한다. 다른 실시 형태에서, 변형된 표적 핵산은 세포의 복구 기전에 의한 돌연변이, 삽입, 또는 결실을 유발하는 이중-가닥 파단을 포함한다. 예를 들어, AAV에 의해 인코딩되는 CasX:gRNA 시스템은 세포 내로 인델, 예를 들어, 프레임시프트 돌연변이를 유전자의 개시 지점에 또는 그 부근에 도입할 수 있다. 다른 실시 형태에서, 세포의 변형된 표적 핵산은 공여자 주형의 삽입에 의해 변형되었으며, 여기서 표적 핵산을 포함하는 유전자는 녹 다운되었거나 녹 아웃되었다.
다른 실시 형태에서 본 방법은, 표적 핵산 서열을 하나 이상의 돌연변이 또는 복제를 갖는 표적 핵산의 상이하거나 중첩되는 영역에 대해 표적화된 복수의(예를 들어, 2개 이상) gRNA를 인코딩하는 AAV와 접촉시키는 단계를 포함한다. 전술한 것들에서, 생성되는 변형은 표적 핵산 서열에 비교하여 하나 이상의 뉴클레오티드의 삽입, 결실, 치환, 복제, 또는 역위일 수 있다.
VIII. 치료 방법
본 개시내용은 질환의 치료를 필요로 하는 대상체에서 질환을 치료하는 방법을 제공한다. 일부 실시 형태에서, 본 개시내용의 방법은 본 개시내용의 AAV 조성물의 대상체에 대한 투여에 의해 대상체의 질환을 예방, 치료, 및/또는 개선할 수 있다. 일부 실시 형태에서, 대상체에게 투여되는 조성물은 약제학적으로 허용가능한 담체, 희석제, 또는 부형제를 추가로 포함한다.
일부 실시 형태에서 본 개시내용은, 질환의 치료를 필요로 하는 대상체에서 질환을 치료하는 방법으로서, 대상체의 세포 내의 표적 핵산을 변형시키는 단계를 포함하며, 변형시키는 단계는 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 벡터의 치료적 유효 용량을 대상체에게 투여하는 단계를 포함하고, 여기서 인코딩된 gRNA의 표적화 서열은 표적 핵산과 혼성화되는 서열을 가짐으로써, CasX 단백질에 의한 표적 핵산의 변형을 유발하는 방법을 제공한다.
다른 실시 형태에서, 질환의 치료를 필요로 하는 대상체에서 질환을 치료하는 방법은 본 명세서에 기재된 실시 형태 중 임의의 것의 AAV 벡터의 치료적 유효 용량을 대상체에게 투여하는 단계를 포함하며, 여기서 인코딩된 gRNA의 표적화 서열은 표적 핵산과 혼성화되는 서열을 갖고, 여기서 AAV는 표적 핵산 서열 내로 삽입되거나 이를 대체하여 표적 핵산을 포함하는 유전자를 녹-다운시키거나 녹-아웃시키는 하나 이상의 돌연변이 또는 이종성 서열을 포함하는 공여자 주형을 추가로 포함한다. 전술한 것들에서, 공여자 주형의 삽입은 유전자의 발현 및 생성되는 유전자 생성물을 붕괴시키는 역할을 한다. 전술한 방법의 일부 실시 형태에서, 공여자 DNA 주형은 크기가 10 내지 15,000개 뉴클레오티드의 범위이다. 전술한 방법의 다른 실시 형태에서, 공여자 주형은 크기가 100 내지 1,000개 뉴클레오티드의 범위이다. 일부 경우에, 공여자 주형은 단일-가닥 RNA 또는 DNA 주형이다.
치료되는 대상체의 변형된 세포는 설치류 세포, 마우스 세포, 래트 세포, 영장류 세포, 비-인간 영장류 세포, 및 인간 세포로 이루어진 군으로부터 선택된 진핵 세포일 수 있다. 일부 실시 형태에서, 치료되는 대상체의 진핵 세포는 인간 세포이다.
일부 실시 형태에서 본 방법은, 본 명세서에 기재된 실시 형태의 AAV 벡터를 피하, 피내, 신경내, 림프절내, 척수내, 근육내, 요추내, 척추강내, 지주막하, 뇌실내, 관절낭내, 정맥내, 림프내, 안내, 또는 복강내 경로로 이루어진 군으로부터 선택된 투여 경로를 통해 대상체에게 투여하는 단계를 포함하며, 여기서 투여 방법은 주사, 이입, 또는 이식이다. 대상체에서 질환을 치료하는 방법의 일부 실시 형태에서, 대상체는 마우스, 래트, 돼지, 비-인간 영장류, 및 인간으로 이루어진 군으로부터 선택된다. 특정 실시 형태에서, 대상체는 인간이다.
질환의 치료를 필요로 하는 대상체에서 질환을 치료하는 방법의 일부 실시 형태에서, AAV 벡터는 약 1 x 105 벡터 게놈/kg(vg) 이상, 약 1 x 106 vg/kg 이상, 약 1 x 107 vg/kg 이상, 약 1 x 108 vg/kg 이상, 약 1 x 109 vg/kg 이상, 약 1 x 1010 vg/kg 이상, 약 1 x 1011 vg/kg 이상, 약 1 x 1012 vg/kg 이상, 약 1 x 1013 vg/kg 이상, 약 1 x 1014 vg/kg 이상, 약 1 x 1015 vg/kg 이상, 약 1 x 1016 vg/kg 이상의 용량으로 투여된다. 안구와 같은 기관 시스템에서, AAV 벡터는 약 1 x 105 벡터 게놈(vg) 이상, 약 1 x 106 vg 이상, 약 1 x 107 vg 이상, 약 1 x 108 vg 이상, 약 1 x 109 vg 이상, 약 1 x 1010 vg 이상, 약 1 x 1011 vg 이상, 약 1 x 1012 vg 이상, 약 1 x 1013 vg 이상, 약 1 x 1014 vg 이상, 약 1 x 1015 vg 이상, 약 1 x 1016 vg 이상의 용량으로 투여된다.
다수의 치료 전략을 사용하여 질환을 갖는 대상체의 치료 방법에 사용하기 위한 조성물을 설계하였다. 일부 실시 형태에서 본 발명은, 질환을 갖는 대상체의 치료 방법으로서, 치료적 유효 용량을 사용하는 하나 이상의 연속된 용량을 포함하는 치료 처방에 따라 본 명세서에 개시된 실시 형태 중 임의의 것의 AAV 벡터를 대상체에게 투여하는 단계를 포함하는 방법을 제공한다. 치료 처방의 일부 실시 형태에서, AAV 벡터의 치료적 유효 용량은 단일 용량으로서 투여된다. 치료 처방의 다른 실시 형태에서, 치료적 유효 용량은 2 주 이상, 또는 1 개월 이상, 또는 2 개월 이상, 또는 3 개월 이상, 또는 4 개월 이상, 또는 5 개월 이상, 또는 6 개월 이상의 기간에 걸쳐 2개 이상의 용량으로서 대상체에게 투여된다. 치료 처방의 일부 실시 형태에서, 유효 용량은 피하, 피내, 신경내, 림프절내, 척수내, 근육내, 요추내, 척추강내, 지주막하, 뇌실내, 관절낭내, 정맥내, 림프내, 안내, 망막하, 유리체내, 또는 복강내 경로로 이루어진 군으로부터 선택된 경로에 의해 투여되며, 여기서 투여 방법은 주사, 이입, 또는 이식이다.
일부 실시 형태에서, 하나 이상의 돌연변이를 갖는 유전자의 발현을 녹 다운시키거나 녹 아웃시키기 위한 AAV 벡터의 치료적 유효량의 투여는, 대상체가 기저 질환을 여전히 앓고 있을 수 있음에도 불구하고, 대상체에서 개선이 관찰되도록 기저 질환의 예방 또는 개선으로 이어진다. 일부 실시 형태에서, AAV 벡터의 치료적 유효량의 투여는 질환에 대한 하나 이상의 임상-관련 파라미터의 개선으로 이어진다. 치료 방법의 일부 실시 형태에서, 대상체는 마우스, 래트, 돼지, 개, 비-인간 영장류, 및 인간으로부터 선택된다.
일부 실시 형태에서, 본 개시내용은 치료를 필요로 하는 인간의 치료를 위한 의약으로 사용하기 위한 본 명세서에 기재된 AAV 실시 형태 중 임의의 것의 조성물을 제공한다. 일부 실시 형태에서, 의약은 치료적 유효 용량을 사용하여 하나 이상의 연속된 용량을 포함하는 치료 처방에 따라 대상체에게 투여된다.
IX. 면역원성을 감소시키기 위해 조작된 AAV는 편집 특성을 유지한다
포유류 숙주에서 면역 반응에 기여하는 AAV-관련된 병원체 관련 분자 패턴(PAMP)은, i) 간에서 비-실질 세포 상의 세포-표면 PRR인, 톨-유사 수용체 2(TLR2)에 결합하는 rAAV 바이러스 캡시드 상에 존재하는 리간드; 및 ii) 형질세포양 수지상 세포(pDC) 및 B 세포 내의 엔도솜 PRR인, TLR9에 결합하는 바이러스 DNA 내의 메틸화되지 않은 CpG 다이뉴클레오티드를 포함한다(문헌[Faust, SM, et al. CpG-depleted adeno-associated virus vectors evade immune detection. J. Clinical Invest. 123:2294 (2013)]). 특히, AAV 벡터 내의 CpG 다이뉴클레오티드 모티프(CpG PAMP)는 면역자극성이며, 이는 고도의 메틸화를 갖는 포유류 CpG 모티프에 비교하여, 이들의 고도의 저메틸화 때문이다. 따라서, AAV 벡터 게놈 내의 메틸화되지 않은 CpG의 빈도를 인간 TLR9를 활성화하는 역치 미만의 수준으로 감소시키는 것은 외인성으로 투여된 AAV-기반 생물제제에 대한 면역 반응을 감소시킬 것으로 예상된다. 유사하게, AAV 작제물 내의 CpG PAMP의 메틸화는 AAV-기반 생물제제에 대한 면역 반응을 감소시킬 것으로 유사하게 예상된다.
일부 실시 형태에서, 본 개시내용은 포유류 종으로부터의 상동성 뉴클레오티드 서열의 치환에 의해 이식유전자의 하나 이상의 구성성분이 CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 AAV 벡터를 제공하며, 여기서 하나 이상의 구성성분은 형질도입된 세포 내에서 발현시에 이들의 기능적 특성; 예를 들어, CRISPR 뉴클레아제의 발현을 구동하는 능력, gRNA의 발현을 구동하는 능력, CRISPR 뉴클레아제 및/또는 gRNA의 향상된 발현, 표적 핵산 서열을 편집하는 향상된 능력을 실질적으로 유지한다. 일부 실시 형태에서 본 개시내용은, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택된 하나 이상의 AAV 이식유전자 구성성분 서열이 CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 코돈-최적화된 AAV 벡터를 제공하며, 여기서 생성되는 AAV 벡터 이식유전자에는 CpG 다이뉴클레오티드가 실질적으로 없다. 일부 실시 형태에서 본 개시내용은, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 폴리(A), 및 액세서리 요소로 이루어진 군으로부터 선택된 하나 이상의 AAV 이식유전자 구성성분 서열이 약 10% 미만, 약 5% 미만, 또는 약 1% 미만의 CpG 다이뉴클레오티드를 포함하는 AAV 벡터를 제공한다. 일부 실시 형태에서, 본 개시내용은 5' ITR, 3 ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 및 폴리(A)로 이루어진 군으로부터 선택된 하나 이상의 AAV 이식유전자 구성성분 서열에 CpG 다이뉴클레오티드가 없는 AAV 벡터를 제공한다. 일부 실시 형태에서 본 개시내용은, 이식유전자가 약 10% 미만, 약 5% 미만, 또는 약 1% 미만의 CpG 다이뉴클레오티드를 포함하는 AAV 벡터를 제공한다. 일부 실시 형태에서 본 개시내용은, CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 하나 이상의 AAV 구성성분 서열이 표 25에 기술된 바와 같은 서열 번호 41045 내지 41055로 이루어진 서열, 또는 이들에 대해 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 서열 동일성을 갖는 서열로 이루어진 서열의 군으로부터 선택되는 AAV 벡터를 제공한다. 일부 실시 형태에서 본 개시내용은, CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 이식유전자의 하나 이상의 구성성분을 갖는 AAV 벡터를 제공하며, 여기서 발현된 CRISPR 뉴클레아제 및 gRNA는, 유사한 조건 하에 시험관내 검정에서 검정할 경우에, 이식유전자가 CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화되지 않은 AAV 벡터에 비교하여, 표적 핵산에 대한 편집 잠재력의 약 60% 이상, 약 70% 이상, 약 80% 이상, 또는 약 90% 이상을 유지한다. 특정 실시 형태에서 본 개시내용은, CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 편집 잠재력을 유지하는 하나 이상의 AAV 구성성분 서열이 표 25에 기술된 바와 같은 서열 번호 41045 내지 41055로 이루어진 서열, 또는 이들에 대해 약 80% 이상, 약 90% 이상, 약 95% 이상, 약 96% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 서열 동일성을 갖는 서열로 이루어진 서열의 군으로부터 선택되는 AAV 벡터를 제공한다.
CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 이식유전자의 하나 이상의 구성성분을 포함하는 AAV 벡터의 실시 형태는, 개선된 특징으로서, 생체내에서(대상체에게 투여되는 경우) 또는 염증 반응의 마커를 검출하도록 설계된 시험관내 포유류 세포 검정에서 면역 반응을 유도하는 더 낮은 잠재력을 갖는다. 일부 실시 형태에서, CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 이식유전자의 하나 이상의 구성성분을 포함하는 AAV 벡터의 치료적 유효 용량의 대상체에 대한 투여는 이식유전자가 CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화되지 않은 유사한 AAV 벡터의 면역 반응에 비교하여 감소된 면역 반응을 유발하며, 여기서 감소된 반응은 하나 이상의 파라미터, 예컨대 AAV 구성성분에 대한 항체의 생성 또는 지연형 과민반응(delayed-type hypersensitivity), 또는 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)와 같으나 이로 제한되지 않는 염증성 사이토카인 및 마커의 생성의 측정에 의해 결정된다. 일부 실시 형태에서, CpG 다이뉴클레오티드가 실질적으로 없는 이식유전자의 하나 이상의 구성성분을 포함하는 AAV 벡터는, 그러한 검정에 적절한 당업계에 알려진 세포; 예를 들어, 단핵구, 대식세포, T-세포, B-세포 등을 사용하는 세포-기반 시험관내 검정에서 검정할 경우에, CpG 고갈되지 않은 유사한 AAV에 비교하여, TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 하나 이상의 염증성 마커의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상의 감소된 생성을 도출한다. 특정 실시 형태에서, CpG 다이뉴클레오티드의 고갈을 위해 코돈-최적화된 이식유전자의 하나 이상의 구성성분을 포함하는 AAV 벡터는, 시험관내 검정에서, CpG 고갈되지 않은 유사한 AAV에 비교하여, hNPC 내의 TLR9의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상의 감소된 활성화를 나타낸다.
X. 키트 및 용품의 제조
다른 실시 형태에서, 본 명세서에는 본 개시내용의 실시 형태 중 임의의 것의 AAV 벡터, 및 적합한 용기(예를 들어 튜브, 바이알, 또는 플레이트)를 포함하는 키트가 제공된다.
일부 실시 형태에서, 키트는 완충액, 뉴클레아제 억제제, 프로테아제 억제제, 리포솜, 치료제, 표지, 표지 시각화 시약(label visualization reagent), 또는 전술한 것들의 임의의 조합을 추가로 포함한다. 일부 실시 형태에서, 키트는 약제학적으로 허용가능한 담체, 희석제, 또는 부형제를 추가로 포함한다.
일부 실시 형태에서, 키트는 유전자 변형 응용에 적절한 대조군 조성물, 및 사용 설명서를 포함한다.
XI. 나열된 실시 형태
하기 나열된 실시 형태의 세트는 예시적인 목적을 위해 포함되며, 본 발명의 범주를 제한하는 것을 의도하지 않는다.
세트 I:
세트 I의 실시 형태는 US 가특허 출원 제63/123,112호에 제공된 표 및 US 가특허 출원 제63/123,112호와 함께 2020년 12월 9일자로 제출된 서열 목록을 참조한다.
실시 형태 I-1.
a. 제1 아데노-관련 바이러스(AAV) 역위 말단 반복(ITR) 서열;
b. 제2 AAV ITR 서열;
c. 제1 프로모터 서열;
d. CRISPR 단백질을 인코딩하는 서열;
e. 적어도 제1 가이드 RNA(gRNA)를 인코딩하는 서열; 및, 임의로,
f. 하나 이상의 액세서리 요소 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-2. 실시 형태 I-1에 있어서, CRISPR 단백질 서열 및 적어도 제1 gRNA를 인코딩하는 서열은 길이가 약 3100개 미만, 약 3090개 미만, 약 3080개 미만, 약 3070개 미만, 약 3060개 미만, 약 3050개 미만, 또는 약 3040개 미만의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 I-3. 실시 형태 I-1 또는 실시 형태 I-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과를 갖는, 폴리뉴클레오티드.
실시 형태 I-4. 실시 형태 I-1 또는 실시 형태 I-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 I-5. 실시 형태 I-1 또는 실시 형태 I-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 I-6. 실시 형태 I-1 내지 실시 형태 I-5 중 어느 하나에 있어서, 제1 프로모터 서열 및 CRISPR 단백질을 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 I-7. 실시 형태 I-1 내지 실시 형태 I-6 중 어느 하나에 있어서, CRISPR 단백질 및 적어도 제1 가이드 RNA를 인코딩하는 서열은 제1 프로모터에 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 I-8. 실시 형태 I-1 내지 실시 형태 I-7 중 어느 하나에 있어서, 하나 이상의 액세서리 요소는 CRISPR 단백질에 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 I-9. 실시 형태 I-1 내지 실시 형태 I-6 중 어느 하나에 있어서, 제2 프로모터를 추가로 포함하는, 폴리뉴클레오티드.
실시 형태 I-10. 실시 형태 I-9에 있어서, 제2 프로모터 서열 및 gRNA를 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 I-11. 실시 형태 I-9 또는 실시 형태 I-10에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 I-12. 실시 형태 I-9 또는 실시 형태 I-10에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 I-13. 실시 형태 I-9 또는 실시 형태 I-10에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 I-14. 실시 형태 I-1 내지 실시 형태 I-13 중 어느 하나에 있어서, 2개 이상의 액세서리 요소를 포함하는, 폴리뉴클레오티드.
실시 형태 I-15. 실시 형태 I-14에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 I-16. 실시 형태 I-14에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 I-17. 실시 형태 I-14에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 I-18. 실시 형태 I-1 내지 실시 형태 I-17 중 어느 하나에 있어서, 제2 프로모터를 포함하며, 여기서 조합된 길이로 폴리뉴클레오티드 서열의 길이의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34% 이상, 또는 35% 이상은 제1 및 제2 프로모터 및 하나 이상의 액세서리 요소의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-19. 실시 형태 I-1 내지 실시 형태 I-18 중 어느 하나에 있어서, 하나 이상의 액세서리 요소는 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소, 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, 제3 프로모터, 제2 가이드 RNA, CRISPR-매개 상동성-지정 복구의 자극제, 전사의 활성화제 또는 저해제, 및 자가-절단 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 I-20. 실시 형태 I-1 내지 실시 형태 I-19 중 어느 하나에 있어서, 액세서리 요소(들)는 상기 액세서리 요소의 부재 하의 CRISPR 단백질에 비교하여 CRISPR 단백질의 발현, 결합, 활성, 또는 성능을 향상시키는, 폴리뉴클레오티드.
실시 형태 I-21. 실시 형태 I-20에 있어서, 향상된 성능은 시험관내 검정에서 표적 핵산의 편집의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 1500% 이상, 약 200% 이상, 또는 약 300% 이상의 증가인, 폴리뉴클레오티드.
실시 형태 I-22. 실시 형태 I-1 내지 실시 형태 I-21 중 어느 하나에 있어서, CRISPR 단백질은 부류 2 CRISPR 단백질인, 폴리뉴클레오티드.
실시 형태 I-23. 실시 형태 I-22에 있어서, CRISPR 단백질은 부류 2, 유형 V CRISPR 단백질인, 폴리뉴클레오티드.
실시 형태 I-24. 실시 형태 I-23에 있어서, 부류 2, 유형 V CRISPR 단백질은 CasX인, 폴리뉴클레오티드.
실시 형태 I-25. 실시 형태 I-24에 있어서, CasX는 표 3에 기술된 바와 같은 서열 번호 1 내지 3 및 49 내지 160, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-26. 실시 형태 I-24에 있어서, CasX는 표 3에 기술된 바와 같은 서열 번호 1 내지 3 및 49 내지 160의 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-27. 실시 형태 I-1 내지 실시 형태 I-26 중 어느 하나에 있어서, 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열의 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-28. 실시 형태 I-1 내지 실시 형태 I-27 중 어느 하나에 있어서, 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285의 서열의 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-29. 실시 형태 I-28에 있어서, 제1 gRNA는 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 20개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 I-30. 실시 형태 I-19 내지 실시 형태 I-29 중 어느 하나에 있어서, 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285의 서열로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-31. 실시 형태 I-30에 있어서, 제2 gRNA는 실시 형태 I-28의 표적 핵산과는 상이한 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 20개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 I-32. 실시 형태 I-1 내지 실시 형태 I-31 중 어느 하나에 있어서, 표 4, 표 5, 표 6, 표 7, 표 9, 표 10, 및 표 12의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-33. 실시 형태 I-1 내지 실시 형태 I-31 중 어느 하나에 있어서, 표 4, 표 5, 표 6, 표 7, 표 9, 표 10, 및 표 12의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 I-34. 실시 형태 I-1 내지 실시 형태 I-33 중 어느 하나에 있어서, 액세서리 요소는 사이토메갈로바이러스 즉시/초기 인트론A, B형 간염 바이러스 PRE(HPRE), 우드척 간염 바이러스 PRE(WPRE), 및 인간 열 충격 단백질 70 mRNA(Hsp70)의 5′ 비번역 영역(UTR)으로 이루어진 군으로부터 선택된 전사-후 조절 요소(PTRE)인, 폴리뉴클레오티드.
실시 형태 I-35. 실시 형태 I-1 내지 실시 형태 I-34 중 어느 하나에 있어서, 제1 프로모터 서열은 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상, 또는 약 800개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 I-36. 실시 형태 I-9 내지 실시 형태 I-35 중 어느 하나에 있어서, 제2 프로모터 서열은 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상, 또는 약 800개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 I-37. 실시 형태 I-1 내지 실시 형태 I-36 중 어느 하나에 있어서, 도 15, 도 21, 또는 도 22의 작제물의 구성을 갖는, 폴리뉴클레오티드.
실시 형태 I-38. 실시 형태 I-1 내지 실시 형태 I-37 중 어느 하나에 있어서, 5' 및 3' ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, 폴리뉴클레오티드.
실시 형태 I-39. a) AAV 캡시드 단백질, 및 b) 실시 형태 I-1 내지 실시 형태 I-38 중 어느 하나의 폴리뉴클레오티드를 포함하는, 재조합 아데노-관련 바이러스(rAAV).
실시 형태 I-40. 실시 형태 I-39에 있어서, AAV 캡시드 단백질은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, rAAV.
실시 형태 I-41. 실시 형태 I-40에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 동일한 혈청형의 AAV로부터 유래되는, rAAV.
실시 형태 I-42. 실시 형태 I-40에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 상이한 혈청형의 AAV로부터 유래되는, rAAV.
실시 형태 I-43. 실시 형태 I-39 내지 실시 형태 I-42 중 어느 하나의 rAAV 및 약제학적으로 허용가능한 담체, 희석제, 또는 부형제를 포함하는, 약제학적 조성물.
실시 형태 I-44. 포유류 세포의 집단에서 표적 핵산을 변형시키기 위한 방법으로서, 복수의 세포를 실시 형태 I-39 내지 실시 형태 I-42 중 어느 하나의 rAAV 또는 실시 형태 I-43의 약제학적 조성물의 유효량과 접촉시키는 단계를 포함하며, 여기서 gRNA에 의해 표적화된 세포의 표적 핵산은 CRISPR 단백질에 의해 변형되는, 방법.
실시 형태 I-45. 실시 형태 I-44에 있어서, 변형시키는 단계는 집단의 세포의 표적 핵산 내의 하나 이상의 뉴클레오티드의 삽입, 결실, 치환, 복제, 또는 역위를 도입하는 단계를 포함하는, 방법.
실시 형태 I-46. rAAV 벡터를 제조하는 방법으로서,
i) 세포의 집단을 제공하는 단계; 및
ii) 실시 형태 I-1 내지 실시 형태 I-38 중 어느 하나의 폴리뉴클레오티드를 포함하는 벡터로 세포의 집단을 형질감염시키는 단계를 포함하는, 방법.
실시 형태 I-47. 실시 형태 I-46에 있어서, 세포의 집단은 AAV rep 유전자 및 AAV cap 유전자를 발현하는, 방법.
실시 형태 I-48. 실시 형태 I-46에 있어서, AAV rep 유전자 및 AAV cap 유전자를 인코딩하는 하나 이상의 벡터로 세포를 형질감염시키는 단계를 추가로 포함하는, 방법.
실시 형태 I-49. 실시 형태 I-46 내지 실시 형태 I-48 중 어느 하나에 있어서, rAAV 벡터를 회수하는 단계를 추가로 포함하는, 방법.
세트 II:
세트 II의 실시 형태는 US 가특허 출원 제63/235,638호에 제공된 표 및 US 가특허 출원 제63/235,638호와 함께 2021년 8월 20일자로 제출된 서열 목록을 참조한다.
실시 형태 II-1.
a. 제1 아데노-관련 바이러스(AAV) 역위 말단 반복(ITR) 서열;
b. 제2 AAV ITR 서열;
c. 제1 프로모터 서열;
d. CRISPR 단백질을 인코딩하는 서열;
e. 적어도 제1 가이드 RNA(gRNA)를 인코딩하는 서열; 및,
f. 임의로, 하나 이상의 액세서리 요소 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-2. 실시 형태 II-1에 있어서, CRISPR 단백질을 인코딩하는 서열 및 적어도 제1 gRNA를 인코딩하는 서열은 길이가 약 3100개 미만, 약 3090개 미만, 약 3080개 미만, 약 3070개 미만, 약 3060개 미만, 약 3050개 미만, 또는 약 3040개 미만의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 II-3. 실시 형태 II-1 또는 실시 형태 II-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과를 갖는, 폴리뉴클레오티드.
실시 형태 II-4. 실시 형태 II-1 또는 실시 형태 II-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-5. 실시 형태 II-1 또는 실시 형태 II-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-6. 실시 형태 II-1 내지 실시 형태 II-5 중 어느 하나에 있어서, 제1 프로모터 서열 및 CRISPR 단백질을 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 II-7. 실시 형태 II-6에 있어서, 제1 프로모터는 pol II 프로모터인, 폴리뉴클레오티드.
실시 형태 II-8. 실시 형태 II-6 또는 실시 형태 II-7에 있어서, 프로모터는 폴리유비퀴틴 C(UBC), 사이토메갈로바이러스(CMV), 시미안 바이러스 40(SV40), 닭 베타-액틴 프로모터 및 토끼 베타-글로빈 스플라이스 수용자 부위 융합체(CAG), 사이토메갈로바이러스 인핸서(CB7)를 갖는 닭 β-액틴 프로모터, PGK, 젠스 토르노에(JeT), GUSB, CBA 혼성체(CBh), 신장 인자-1 알파(EF-1알파), 베타-액틴, 라우스 육종 바이러스(RSV), 침묵화-빈발 비장 초점 형성 바이러스(SFFV), CMVd1 프로모터, 절단된 인간 CMV(tCMVd2), 최소 CMV 프로모터, 닭 β-액틴 프로모터, HSV TK 프로모터, 미니-TK 프로모터, 최소 IL-2 프로모터, GRP94 프로모터, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, MLC, MCK, GRK1 단백질 프로모터, Rho 프로모터, CAR 단백질 프로모터, hSyn 프로모터, U1A 프로모터, 리보솜 Rpl 및 Rps 프로모터(예를 들어, hRpl30 및 hRps18), CMV53 프로모터, 최소 SV40 프로모터, CMV53 프로모터, SFCp 프로모터, pJB42CAT5 프로모터, MLP 프로모터, EFS 프로모터, MeP426 프로모터, MecP2 프로모터, MHCK7 프로모터, 베타-글루쿠로니다제(GUSB), CK7 프로모터, 및 CK8e 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-9. 실시 형태 II-8에 있어서, 프로모터는 UBC, CMV, SV40, CAG, CB7, PGK, JeT, GUSB, CB, EF-1알파, 베타-액틴, RSV, SFFV, CMVd1, tCMVd2, 최소 CMV, 닭 β-액틴, HSV TK, 미니-TK, 최소 IL-2, GRP94, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, MLC, MCK, GRK1 단백질 Rho, CAR 단백질, hSyn, U1A r, 리보솜 Rpl, 및 Rps(예를 들어, hRpl30 및 hRps18), CMV53, SV40 프로모터, CMV53, SFCp, pJB42CAT5, MLP, EFS, MeP426, MecP2, MHCK7, (GUSB, CK7, 또는 CK8e 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
실시 형태 II-10. 실시 형태 II-8 또는 실시 형태 II-9에 있어서, 프로모터는 약 400개 미만의 뉴클레오티드, 약 350개 미만의 뉴클레오티드, 약 300개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 150개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 40개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-11. 실시 형태 II-8 또는 실시 형태 II-9에 있어서, 프로모터는 약 40 내지 약 585개의 뉴클레오티드, 약 100 내지 약 400개의 뉴클레오티드, 또는 약 150 내지 약 300개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-12. 실시 형태 II-1 내지 실시 형태 II-11 중 어느 하나에 있어서, 프로모터는 표 4에 기술된 바와 같은 서열 번호 40370 내지 40400, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-13. 실시 형태 II-1 내지 실시 형태 II-12 중 어느 하나에 있어서, 하나 이상의 액세서리 요소는 CRISPR 단백질에 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 II-14. 실시 형태 II-1 내지 실시 형태 II-6 중 어느 하나에 있어서, 제2 프로모터를 추가로 포함하는, 폴리뉴클레오티드.
실시 형태 II-15. 실시 형태 II-14에 있어서, 제2 프로모터 서열 및 gRNA를 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 II-16. 실시 형태 II-14 또는 실시 형태 II-15에 있어서, 제2 프로모터는 pol III 프로모터인, 폴리뉴클레오티드.
실시 형태 II-17. 실시 형태 II-10 내지 실시 형태 II-12 중 어느 하나에 있어서, 제2 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1(양방향 H1 프로모터), BiU6(양방향 U6 프로모터), 고릴라 U6, 레수스 U6, 인간 7sk, 및 인간 H1 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-18. 실시 형태 II-17에 있어서, 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1, BiU6, 고릴라 U6, 레수스 U6, 인간 7sk, 또는 인간 H1 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
실시 형태 II-19. 실시 형태 II-17 또는 실시 형태 II-18에 있어서, 프로모터는 약 250개 미만의 뉴클레오티드, 약 220개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 160개 미만의 뉴클레오티드, 약 140개 미만의 뉴클레오티드, 약 130개 미만의 뉴클레오티드, 약 120개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 70개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-20. 실시 형태 II-17 또는 실시 형태 II-18에 있어서, 프로모터는 약 70 내지 약 245개의 뉴클레오티드, 약 100 내지 약 220개의 뉴클레오티드, 또는 약 120 내지 약 160개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-21. 실시 형태 II-14 내지 실시 형태 II-20 중 어느 하나에 있어서, 프로모터는 표 5에 기술된 바와 같은 서열 번호 40401 내지 40400, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-22. 실시 형태 II-14 내지 실시 형태 II-21 중 어느 하나에 있어서, 제2 프로모터는 gRNA의 전사를 향상시키는, 폴리뉴클레오티드.
실시 형태 II-23. 실시 형태 II-14 내지 실시 형태 II-22 중 어느 하나에 있어서, 제1 프로모터 및 제2 프로모터의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 II-24. 실시 형태 II-14 내지 실시 형태 II-23 중 어느 하나에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 II-25. 실시 형태 II-14 내지 실시 형태 II-24 중 어느 하나에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 II-26. 실시 형태 II-14 내지 실시 형태 II-24 중 어느 하나에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 II-27. 실시 형태 II-1 내지 실시 형태 II-26 중 어느 하나에 있어서, 2개 이상의 액세서리 요소를 포함하는, 폴리뉴클레오티드.
실시 형태 II-28. 실시 형태 II-27에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 II-29. 실시 형태 II-27에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 II-30. 실시 형태 II-27에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 II-31. 실시 형태 II-14 내지 실시 형태 II-30 중 어느 하나에 있어서, 조합된 길이로 폴리뉴클레오티드 서열의 길이의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34% 이상, 또는 35% 이상은 제1 및 제2 프로모터 및 하나 이상의 액세서리 요소의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-32. 실시 형태 II-1 내지 실시 형태 II-31 중 어느 하나에 있어서, 액세서리 요소는 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소(PTRE), 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, 제3 프로모터, 제2 가이드 RNA, CRISPR-매개 상동성-지정 복구의 자극제, 및 전사의 활성화제 또는 저해제로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-33. 실시 형태 II-1 내지 실시 형태 II-32 중 어느 하나에 있어서, 액세서리 요소는 상기 액세서리 요소가 결여된 그 밖에는 동일한 폴리뉴클레오티드에 비교하여 CRISPR 단백질의 전사, 전사 종결, 발현, 결합, 활성, 또는 성능을 향상시키는, 폴리뉴클레오티드.
실시 형태 II-34. 실시 형태 II-33에 있어서, 향상된 성능은 시험관내 검정에서 CRISPR 단백질에 의한 표적 핵산의 편집의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 150% 이상, 약 200% 이상, 또는 약 300% 이상의 증가인, 폴리뉴클레오티드.
실시 형태 II-35. 실시 형태 II-1 내지 실시 형태 II-34 중 어느 하나에 있어서, CRISPR 단백질은 부류 2 CRISPR 단백질인, 폴리뉴클레오티드.
실시 형태 II-36. 실시 형태 II-35에 있어서, CRISPR 단백질은 부류 2, 유형 V CRISPR 단백질인, 폴리뉴클레오티드.
실시 형태 II-37. 실시 형태 II-36에 있어서, 부류 2, 유형 V CRISPR 단백질은 CasX인, 폴리뉴클레오티드.
실시 형태 II-38. 실시 형태 II-37에 있어서, 인코딩된 CasX는 표 3에 기술된 바와 같은 서열 번호 1 내지 3, 49 내지 160, 및 40208 내지 40369, 및 표 21에 기술된 바와 같은 서열 번호 40808 내지 40827, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-39. 실시 형태 II-37에 있어서, 인코딩된 CasX는 표 3에 기술된 바와 같은 서열 번호 1 내지 3, 49 내지 160, 및 40208 내지 40369, 및 표 21에 기술된 바와 같은 서열 번호 40808 내지 40827의 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-40. 실시 형태 II-35 내지 실시 형태 II-39 중 어느 하나에 있어서, CasX를 인코딩하는 서열에 연결된 하나 이상의 NLS를 인코딩하는, 폴리뉴클레오티드.
실시 형태 II-41. 실시 형태 II-40에 있어서, 하나 이상의 NLS를 인코딩하는 서열은 CasX 단백질을 인코딩하는 서열의 5' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
실시 형태 II-42. 실시 형태 II-40 또는 실시 형태 II-41에 있어서, 하나 이상의 NLS를 인코딩하는 서열은 CasX 단백질을 인코딩하는 서열의 3' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
실시 형태 II-43. 실시 형태 II-41 또는 실시 형태 II-42에 있어서, 2개 이상의 NLS를 인코딩하며, 여기서 2개 이상의 NLS를 인코딩하는 서열은 CasX 단백질을 인코딩하는 서열의 5' 및 3' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
실시 형태 II-44. 실시 형태 II-40 내지 II-43 중 어느 하나에 있어서, 하나 이상의 인코딩된 NLS는 PKKKRKV(서열 번호 196), KRPAATKKAGQAKKKK(서열 번호 197), PAAKRVKLD(서열 번호 248), RQRRNELKRSP(서열 번호 161), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열 번호 162), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열 번호 163), VSRKRPRP(서열 번호 164), PPKKARED(서열 번호 165), PQPKKKPL(서열 번호 166), SALIKKKKKMAP(서열 번호 167), DRLRR(서열 번호 168), PKQKKRK(서열 번호 169), RKLKKKIKKL(서열 번호 170), REKKKFLKRR(서열 번호 171), KRKGDEVDGVDEVAKKKSKK(서열 번호 172), RKCLQAGMNLEARKTKK(서열 번호 173), PRPRKIPR(서열 번호 174), PPRKKRTVV(서열 번호 175), NLSKKKKRKREK(서열 번호 176), RRPSRPFRKP(서열 번호 177), KRPRSPSS(서열 번호 178), KRGINDRNFWRGENERKTR(서열 번호 179), PRPPKMARYDN(서열 번호 180), KRSFSKAF(서열 번호 181), KLKIKRPVK(서열 번호 182), PKKKRKVPPPPAAKRVKLD(서열 번호 183), PKTRRRPRRSQRKRPPT(서열 번호 184), SRRRKANPTKLSENAKKLAKEVEN(서열 번호 185), KTRRRPRRSQRKRPPT(서열 번호 186), RRKKRRPRRKKRR(서열 번호 187), PKKKSRKPKKKSRK(서열 번호 188), HKKKHPDASVNFSEFSK(서열 번호 189), QRPGPYDRPQRPGPYDRP(서열 번호 190), LSPSLSPLLSPSLSPL(서열 번호 191), RGKGGKGLGKGGAKRHRK(서열 번호 192), PKRGRGRPKRGRGR(서열 번호 193), PKKKRKVPPPPKKKRKV(서열 번호 195), PAKRARRGYKC(서열 번호 40408), KLGPRKATGRW(서열 번호 40809), PRRKREE(서열 번호 40810), PYRGRKE(서열 번호 40811), PLRKRPRR(서열 번호 40812), PLRKRPRRGSPLRKRPRR(서열 번호 40813), PAAKRVKLDGGKRTADGSEFESPKKKRKV(서열 번호 40814), PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(서열 번호 40815), PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(서열 번호 40816), PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(서열 번호 40452), KRKGSPERGERKRHW, KRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 40817), 및 PKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 40818)로 이루어진 서열의 군으로부터 선택되며, 여기서 하나 이상의 NLS는 CasX 변이체 또는 인접한 NLS에 링커 펩티드로 연결되고, 여기서 링커 펩티드는 (G)n(서열 번호 40201), (GS)n(서열 번호 40202), (GSGGS)n(서열 번호 208), (GGSGGS)n(서열 번호 209), (GGGS)n(서열 번호 210), GGSG(서열 번호 211), GGSGG(서열 번호 212), GSGSG(서열 번호 213), GSGGG(서열 번호 214), GGGSG(서열 번호 215), GSSSG(서열 번호 216), GPGP(서열 번호 217), GGP, PPP, PPAPPA(서열 번호 218), PPPG(서열 번호 40207), PPPGPPP(서열 번호 219), PPP(GGGS)n(서열 번호 40203), (GGGS)nPPP(서열 번호 40204), AEAAAKEAAAKEAAAKA(서열 번호 40205), 및 TPPKTKRKVEFE(서열 번호 40206)로 이루어진 군으로부터 선택되고, 여기서 n은 1 내지 5인, 폴리뉴클레오티드.
실시 형태 II-45. 실시 형태 II-40 내지 실시 형태 II-44 중 어느 하나에 있어서, 하나 이상의 인코딩된 NLS는 표 11 및 표 12에 기술된 바와 같은 서열 번호 40443 내지 40501, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-46. 실시 형태 II-40 내지 실시 형태 II-43 중 어느 하나에 있어서, 하나 이상의 인코딩된 NLS는 표 11 및 표 12에 기술된 바와 같은 서열 번호 40443 내지 40501로 이루어진 서열의 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 II-47. 실시 형태 II-1 내지 실시 형태 II-46 중 어느 하나에 있어서, 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285 및 39981 내지 40026, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열의 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-48. 실시 형태 II-1 내지 실시 형태 II-47 중 어느 하나에 있어서, 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285 및 39981 내지 40026으로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-49. 실시 형태 II-48에 있어서, 제1 gRNA는 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 30개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-50. 실시 형태 II-49에 있어서, 표적화 서열은 18, 19, 또는 20개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-51. 실시 형태 II-32 내지 실시 형태 II-50 중 어느 하나에 있어서, 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285 및 39981 내지 40026, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-52. 실시 형태 II-32 내지 실시 형태 II-51 중 어느 하나에 있어서, 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285 및 39981 내지 40026으로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-53. 실시 형태 II-51 또는 실시 형태 II-52에 있어서, 제2 gRNA는 실시 형태 II-49 또는 실시 형태 II-50의 표적 핵산과는 상이한 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 30개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-54. 실시 형태 II-53에 있어서, 표적화 서열은 18, 19, 또는 20개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 II-55. 실시 형태 II-1 내지 실시 형태 II-54 중 어느 하나에 있어서, 액세서리 요소는 사이토메갈로바이러스 즉시/초기 인트론A, B형 간염 바이러스 PRE(HPRE), 우드척 간염 바이러스 PRE(WPRE), 및 인간 열 충격 단백질 70 mRNA(Hsp70)의 5′ 비번역 영역(UTR)으로 이루어진 군으로부터 선택된 전사-후 조절 요소(PTRE)인, 폴리뉴클레오티드.
실시 형태 II-56. 실시 형태 II-1 내지 실시 형태 II-55 중 어느 하나에 있어서, 액세서리 요소는 표 8에 기술된 바와 같은 서열 번호 40431 내지 40442, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 PTRE인, 폴리뉴클레오티드.
실시 형태 II-57. 실시 형태 II-1 내지 실시 형태 II-56 중 어느 하나에 있어서, 5' 및 3' ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, 폴리뉴클레오티드.
실시 형태 II-58. 실시 형태 II-1 내지 실시 형태 II-57 중 어느 하나에 있어서, 5' 및 3' ITR은 혈청형 AAV2로부터 유래되는, 폴리뉴클레오티드.
실시 형태 II-59. 실시 형태 II-1 내지 실시 형태 II-58 중 어느 하나에 있어서, 표 4, 표 5, 표 6, 표 8, 표 9, 표 13 내지 표 16, 및 표 20의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-60. 실시 형태 II-1 내지 실시 형태 II-59 중 어느 하나에 있어서, 표 4, 표 5, 표 6, 표 8, 표 9, 표 13 내지 표 16, 및 표 20의 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 II-61. 실시 형태 II-1 내지 실시 형태 II-60 중 어느 하나에 있어서, 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나에 도시된 작제물의 구성을 갖는, 폴리뉴클레오티드.
실시 형태 II-62. a) AAV 캡시드 단백질, 및 b) 실시 형태 II-1 내지 실시 형태 II-58 중 어느 하나의 폴리뉴클레오티드를 포함하는, 재조합 아데노-관련 바이러스(rAAV).
실시 형태 II-63. 실시 형태 II-62에 있어서, AAV 캡시드 단백질은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, rAAV.
실시 형태 II-64. 실시 형태 II-63에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 동일한 혈청형의 AAV로부터 유래되는, rAAV.
실시 형태 II-65. 실시 형태 II-63에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 상이한 혈청형의 AAV로부터 유래되는, rAAV.
실시 형태 II-66. 실시 형태 II-65에 있어서, 5' 및 3' ITR은 AAV 혈청형 2로부터 유래되는, rAAV.
실시 형태 II-67. 실시 형태 II-62 중 어느 하나의 rAAV 및 약제학적으로 허용가능한 담체, 희석제, 또는 부형제를 포함하는, 약제학적 조성물.
실시 형태 II-68. 포유류 세포의 집단에서 표적 핵산을 변형시키기 위한 방법으로서, 복수의 세포를 실시 형태 II-62 내지 실시 형태 II-66 중 어느 하나의 rAAV 또는 실시 형태 II-67의 약제학적 조성물의 유효량과 접촉시키는 단계를 포함하며, 여기서 gRNA에 의해 표적화된 세포의 표적 핵산은 CRISPR 단백질에 의해 변형되는, 방법.
실시 형태 II-69. 실시 형태 II-68에 있어서, 변형시키는 단계는 집단의 세포의 표적 핵산 내의 하나 이상의 뉴클레오티드의 삽입, 결실, 치환, 복제, 또는 역위를 도입하는 단계를 포함하는, 방법.
실시 형태 II-70. 실시 형태 II-68 또는 실시 형태 II-69에 있어서, rAAV는 약 1 x 108 벡터 게놈(vg) 이상, 약 1 x 105 벡터 게놈/kg(vg/kg) 이상, 약 1 x 106 vg/kg 이상, 약 1 x 107 vg/kg 이상, 약 1 x 108 vg/kg 이상, 약 1 x 109 vg/kg 이상, 약 1 x 1010 vg/kg 이상, 약 1 x 1011 vg/kg 이상, 약 1 x 1012 vg/kg 이상, 약 1 x 1013 vg/kg 이상, 약 1 x 1014 vg/kg 이상, 약 1 x 1015 vg/kg 이상, 또는 약 1 x 1016 vg/kg 이상의 용량으로 대상체에게 투여되는, 방법.
실시 형태 II-71. 실시 형태 II-68 또는 실시 형태 II-69에 있어서, rAAV는 약 1 x 105 vg/kg 내지 약 1 x 1016 vg/kg 이상, 약 1 x 106 vg/kg 내지 약 1 x 1015 vg/kg 이상, 또는 약 1 x 107 vg/kg 내지 약 1 x 1014 vg/kg 이상의 용량으로 대상체에게 투여되는, 방법.
실시 형태 II-72. 실시 형태 II-68 내지 실시 형태 II-71 중 어느 하나에 있어서, rAAV는 피하, 피내, 신경내, 림프절내, 척수내, 근육내, 요추내, 척추강내, 지주막하, 뇌실내, 관절낭내, 정맥내, 림프내, 안내, 또는 복강내 경로로부터 선택된 투여 경로에 의해 대상체에게 투여되며, 여기서 투여 방법은 주사, 이입, 또는 이식인, 방법.
실시 형태 II-73. 실시 형태 II-68 내지 실시 형태 II-72 중 어느 하나에 있어서, 대상체는 마우스, 래트, 돼지, 및 비-인간 영장류로 이루어진 군으로부터 선택되는, 방법.
실시 형태 II-74. 실시 형태 II-68 내지 실시 형태 II-72 중 어느 하나에 있어서, 대상체는 인간인, 방법.
실시 형태 II-75. rAAV 벡터를 제조하는 방법으로서,
a. 패키징 세포의 집단을 제공하는 단계; 및
b.
i) 실시 형태 II-1 내지 실시 형태 II-57 중 어느 하나의 폴리뉴클레오티드를 포함하는 벡터;
ii) aap(조립체) 유전자를 포함하는 벡터; 및
iii) rep 및 cap 게놈을 포함하는 벡터로 세포의 집단을 형질감염시키는 단계를 포함하는, 방법.
실시 형태 II-76. 실시 형태 II-70에 있어서, rAAV 벡터를 회수하는 단계를 추가로 포함하는, 방법.
세트 III:
세트 III의 실시 형태는 본 명세서에 제공된 표 및 본 명세서와 함께 제출된 서열 목록을 참조한다.
실시 형태 III-1. 하기 구성성분 서열을 포함하며, 재조합 아데노-관련 바이러스(AAV) 내로의 혼입을 위해 구성되는, 폴리뉴클레오티드:
a. 제1 AAV 역위 말단 반복(ITR) 서열;
b. 제2 AAV ITR 서열;
c. 제1 프로모터 서열;
d. CRISPR 단백질을 인코딩하는 서열;
e. 제1 가이드 RNA(gRNA)를 인코딩하는 서열; 및,
f. 임의로, 하나 이상의 액세서리 요소 서열.
실시 형태 III-2. 실시 형태 III-1에 있어서, CRISPR 단백질 및 제1 gRNA를 인코딩하는 서열은 조합된 길이로 약 3100개 미만, 약 3090개 미만, 약 3080개 미만, 약 3070개 미만, 약 3060개 미만, 약 3050개 미만, 또는 약 3040개 미만의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 III-3. 실시 형태 III-1 또는 실시 형태 III-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과를 갖는, 폴리뉴클레오티드.
실시 형태 III-4. 실시 형태 III-1 또는 실시 형태 III-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-5. 실시 형태 III-1 또는 실시 형태 III-2에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-6. 실시 형태 III-1 내지 실시 형태 III-5 중 어느 하나에 있어서, 제1 프로모터 서열 및 CRISPR 단백질을 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 III-7. 실시 형태 III-6에 있어서, 제1 프로모터는 pol II 프로모터인, 폴리뉴클레오티드.
실시 형태 III-8. 실시 형태 III-6 또는 실시 형태 III-7에 있어서, 제1 프로모터는 폴리유비퀴틴 C(UBC) 프로모터, 사이토메갈로바이러스(CMV) 프로모터, 시미안 바이러스 40(SV40) 프로모터, 닭 베타-액틴 프로모터 및 토끼 베타-글로빈 스플라이스 수용자 부위 융합체(CAG), 사이토메갈로바이러스 인핸서(CB7)를 갖는 닭 β-액틴 프로모터, PGK 프로모터, 젠스 토르노에(JeT) 프로모터, GUSB 프로모터, CBA 혼성체(CBh) 프로모터, 신장 인자-1 알파(EF-1알파) 프로모터, 베타-액틴 프로모터, 라우스 육종 바이러스(RSV) 프로모터, 침묵화-빈발 비장 초점 형성 바이러스(SFFV) 프로모터, CMVd1 프로모터, 절단된 인간 CMV(tCMVd2), 최소 CMV 프로모터, hepB 프로모터, 닭 β-액틴 프로모터, HSV TK 프로모터, 미니-TK 프로모터, 최소 IL-2 프로모터, GRP94 프로모터, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, 수퍼 코어 프로모터 3, 아데노바이러스 주요 후기(AdML) 프로모터, MLC 프로모터, MCK 프로모터, GRK1 단백질 프로모터, Rho 프로모터, CAR 단백질 프로모터, hSyn 프로모터, U1a 프로모터, 리보솜 단백질 대형 서브유닛 30(Rpl30) 프로모터, 리보솜 단백질 소형 서브유닛 18(Rps18) 프로모터, CMV53 프로모터, 최소 SV40 프로모터, CMV53 프로모터, SFCp 프로모터, Mecp2 프로모터, pJB42CAT5 프로모터, MLP 프로모터, EFS 프로모터, MeP426 프로모터, MecP2 프로모터, MHCK7 프로모터, 베타-글루쿠로니다제(GUSB) 프로모터, CK7 프로모터, 및 CK8e 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-9. 실시 형태 III-8에 있어서, 제1 프로모터는 UBC, CMV, SV40, CAG, CB7, PGK, JeT, GUSB, CB, EF-1알파, 베타-액틴, RSV, SFFV, CMVd1, tCMVd2, 최소 CMV, 닭 β-액틴, HSV TK, 미니-TK, 최소 IL-2, GRP94, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, MLC, MCK, GRK1 단백질 Rho, CAR 단백질, hSyn, U1a, 리보솜 단백질 대형 서브유닛 30(Rpl30), 리보솜 단백질 소형 서브유닛 18(Rps18), CMV53, 최소 SV40, CMV53, SFCp, pJB42CAT5, MLP, EFS, MeP426, MecP2, MHCK7, CK7, 또는 CK8e 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
실시 형태 III-10. 실시 형태 III-7 또는 실시 형태 III-8에 있어서, 제1 프로모터 서열은 약 400개 미만의 뉴클레오티드, 약 350개 미만의 뉴클레오티드, 약 300개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 150개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 40개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-11. 실시 형태 III-7 또는 실시 형태 III-8에 있어서, 제1 프로모터 서열은 약 40 내지 약 585개의 뉴클레오티드, 약 100 내지 약 400개의 뉴클레오티드, 또는 약 150 내지 약 300개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-12. 실시 형태 III-1 내지 실시 형태 III-11 중 어느 하나에 있어서, 제1 프로모터는 표 8에 기술된 바와 같은 서열 번호 40370 내지 40400, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-13. 실시 형태 III-1 내지 실시 형태 III-12 중 어느 하나에 있어서, 제1 프로모터는 표 24에 기술된 바와 같은 서열 번호 41030 내지 41044, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-14. 실시 형태 III-1 내지 실시 형태 III-13 중 어느 하나에 있어서, 하나 이상의 액세서리 요소는 CRISPR 단백질을 인코딩하는 서열에 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 III-15. 실시 형태 III-1 내지 실시 형태 III-14 중 어느 하나에 있어서, 제2 프로모터를 추가로 포함하는, 폴리뉴클레오티드.
실시 형태 III-16. 실시 형태 III-15에 있어서, 제2 프로모터 서열 및 제1 gRNA를 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
실시 형태 III-17. 실시 형태 III-15 또는 실시 형태 III-16에 있어서, 제2 프로모터는 pol III 프로모터인, 폴리뉴클레오티드.
실시 형태 III-18. 실시 형태 III-15 내지 실시 형태 III-17 중 어느 하나에 있어서, 제2 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1(양방향 H1 프로모터), BiU6(양방향 U6 프로모터), 고릴라 U6, 레수스 U6, 인간 7sk, 및 인간 H1 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-19. 실시 형태 III-18에 있어서, 제2 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1, BiU6, 고릴라 U6, 레수스 U6, 인간 7sk, 또는 인간 H1 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
실시 형태 III-20. 실시 형태 III-18 또는 실시 형태 III-19에 있어서, 제2 프로모터 서열은 약 250개 미만의 뉴클레오티드, 약 220개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 160개 미만의 뉴클레오티드, 약 140개 미만의 뉴클레오티드, 약 130개 미만의 뉴클레오티드, 약 120개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 70개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-21. 실시 형태 III-18 또는 실시 형태 III-19에 있어서, 제2 프로모터 서열은 약 70 내지 약 245개의 뉴클레오티드, 약 100 내지 약 220개의 뉴클레오티드, 또는 약 120 내지 약 160개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-22. 실시 형태 III-15 내지 실시 형태 III-21 중 어느 하나에 있어서, 제2 프로모터 서열은 표 9에 기술된 바와 같은 서열 번호 40401 내지 40420 및 41010 내지 41029, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-23. 실시 형태 III-15 내지 실시 형태 III-22 중 어느 하나에 있어서, 제2 프로모터는 제1 gRNA의 전사를 향상시키는, 폴리뉴클레오티드.
실시 형태 III-24. 실시 형태 III-15 내지 실시 형태 III-23 중 어느 하나에 있어서, 제1 프로모터 및 제2 프로모터의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 III-25. 실시 형태 III-15 내지 실시 형태 III-24 중 어느 하나에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 III-26. 실시 형태 15 내지 실시 형태 III-25 중 어느 하나에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 III-27. 실시 형태 III-15 내지 실시 형태 III-26 중 어느 하나에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 III-28. 실시 형태 III-1 내지 실시 형태 III-27 중 어느 하나에 있어서, 2개 이상의 액세서리 요소 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-29. 실시 형태 III-28에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
실시 형태 III-30. 실시 형태 III-28에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 III-31. 실시 형태 III-28에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
실시 형태 III-32. 실시 형태 III-15 내지 실시 형태 III-31 중 어느 하나에 있어서, 폴리뉴클레오티드 서열의 길이의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34% 이상, 또는 35% 이상은 제1 및 제2 프로모터 및 하나 이상의 액세서리 요소의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-33. 실시 형태 III-1 내지 실시 형태 III-32 중 어느 하나에 있어서, 액세서리 요소는 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소(PTRE), 핵 위치 신호(NLS), 데아미나제, DNA 글리코실라제 억제제, CRISPR-매개 상동성-지정 복구의 자극제, 및 전사의 활성화제, 및 전사의 저해제로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-34. 실시 형태 III-1 내지 실시 형태 III-32 중 어느 하나에 있어서, 액세서리 요소는 상기 액세서리 요소가 결여된 그 밖에는 동일한 폴리뉴클레오티드에 비교하여 표적 핵산의 전사, 전사 종결, 발현, 결합, 표적 핵산의 편집, 또는 CRISPR 단백질의 성능을 향상시키는, 폴리뉴클레오티드.
실시 형태 III-35. 실시 형태 III-34에 있어서, 향상된 성능은 시험관내 검정에서 발현된 CRISPR 단백질 및 제1 gRNA에 의한 표적 핵산의 편집의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 150% 이상, 약 200% 이상, 또는 약 300% 이상의 증가인, 폴리뉴클레오티드.
실시 형태 III-36. 실시 형태 III-1 내지 실시 형태 III-35 중 어느 하나에 있어서, 인코딩된 CRISPR 단백질은 부류 2 CRISPR 단백질인, 폴리뉴클레오티드.
실시 형태 III-37. 실시 형태 III-36에 있어서, 인코딩된 CRISPR 단백질은 부류 2, 유형 V CRISPR 단백질인, 폴리뉴클레오티드.
실시 형태 III-38. 실시 형태 III-37에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은,
a. QPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPEKDSDEAVTYSLGKFGQ(서열 번호 41818)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 NTSB 도메인;
b. RALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSF(서열 번호 41819)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 나선형 I-II 도메인;
c. PLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALRPYLSSEEDRKKGKKFARYQLGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAE(서열 번호 41820)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 나선형 II 도메인; 및
d. SSNIKPMNLIGVDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAKKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTC(서열 번호 41821)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 RuvC-I 도메인을 포함하는, 폴리뉴클레오티드.
실시 형태 III-39. 실시 형태 III-38에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 QEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQ(서열 번호 41822)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 OBD-I 도메인을 포함하는, 폴리뉴클레오티드.
실시 형태 III-40. 실시 형태 III-38 또는 실시 형태 III-39에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 NSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLD(서열 번호 41823)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 OBD-II 도메인을 포함하는, 폴리뉴클레오티드.
실시 형태 III-41. 실시 형태 III-38 내지 실시 형태 III-40 중 어느 하나에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 PISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVA(서열 번호 41824)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 나선형 I-I 도메인을 포함하는, 폴리뉴클레오티드.
실시 형태 III-42. 실시 형태 III-38 내지 실시 형태 III-41 중 어느 하나에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 SNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETH(서열 번호 41825)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 TSL 도메인을 포함하는, 폴리뉴클레오티드.
실시 형태 III-43. 실시 형태 III-38 내지 실시 형태 III-42 중 어느 하나에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 ADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV(서열 번호 41826)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 RuvC-II 도메인을 포함하는, 폴리뉴클레오티드.
실시 형태 III-44. 실시 형태 III-38 내지 실시 형태 III-43 중 어느 하나에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 서열 번호 145의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-45. 실시 형태 III-38 내지 실시 형태 III-44 중 어느 하나에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 하나 이상의 도메인 내에 하나 이상의 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-46. 실시 형태 III-45에 있어서, 하나 이상의 변형은,
a. 도메인 내의 하나 이상의 아미노산 치환;
b. 도메인 내의 하나 이상의 아미노산 결실;
c. 도메인 내의 하나 이상의 아미노산 삽입; 또는
d. (a) 내지 (c)의 임의의 조합을 포함하는, 폴리뉴클레오티드.
실시 형태 III-47. 실시 형태 III-45 또는 실시 형태 III-46에 있어서, 서열 번호 41818에 비교하여 P2, S4, Q9, E15, G20, G33, L41, Y51, F55, L68, A70, E75, K88, 및 G90으로 이루어진 군으로부터 선택된 NTSB 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-48. 실시 형태 III-47에 있어서, 서열 번호 41818에 비교하여 NTSB 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 2에서의 G의 삽입, 위치 4에서의 I의 삽입, 위치 4에서의 L의 삽입, Q9P, E15S, G20D, 위치 30에서의 S의 결실, G33T, L41A, Y51T, F55V, L68D, L68E, L68K, A70Y, A70S, E75A, E75D, E75P, K88Q, 및 G90Q로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-49. 실시 형태 III-45 내지 실시 형태 III-48 중 어느 하나에 있어서, 서열 번호 41819에 비교하여 I24, A25, Y29 G32, G44, S48, S51, Q54, I56, V63, S73, L74, K97, V100, M112, L116, G137, F138, 및 S140으로 이루어진 군으로부터 선택된 나선형 I-II 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-50. 실시 형태 III-49에 있어서, 서열 번호 41819에 비교하여 나선형 I-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 24에서의 T의 삽입, 위치 25에서의 C의 삽입, Y29F,G32Y, G32N, G32H, G32S, G32T, G32A, G32V, 위치 32에서의 G의 결실, G32S, G32T, G44L, G44H, S48H, S48T, S51T, Q54H, I56T, V63T, S73H, L74Y, K97G, K97S, K97D, K97E, V100L, M112T, M112W, M112R, M112K, L116K, G137R, G137K, G137N, 위치 138에서의 Q의 삽입, 및 S140Q로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-51. 실시 형태 III-45 내지 실시 형태 III-50 중 어느 하나에 있어서, 서열 번호 41820에 비교하여 L2, V3, E4, R5, Q6, A7, E9, V10, D11, W12, W13, D14, M15, V16, C17, N18, V19, K20, L22, I23, E25, K26, K31, Q35, L37, A38, K41,R 42, Q43, E44, L46, K57, Y65, G68, L70, L71, L72, E75, G79, D81, W82, K84, V85, Y86, D87, I93, K95, K96, E98, L100, K102, I104, K105, E109, R110, D114, K118, A120, L121, W124, L125, R126, A127, A129, I133, E134, G135, L136, E138, D140, K141, D142, E143, F144, C145, C147, E148, L149, K150, L151, Q152, K153, L158, E166, 및 A167로 이루어진 군으로부터 선택된 나선형 II 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-52. 실시 형태 III-51에 있어서, 서열 번호 41820에 비교하여 나선형 II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 2에서의 A의 삽입, 위치 2에서의 H의 삽입, 위치 2에서의 L의 결실 및 위치 3에서의 V의 결실, V3E, V3Q, V3F, 위치 3에서의 V의 결실, 위치 3에서의 D의 삽입, V3P, E4P, 위치 4에서의 E의 결실, E4D, E4L, E4R, R5N, Q6V, 위치 6에서의 Q의 삽입, 위치 7에서의 G의 삽입, 위치 9에서의 H의 삽입, 위치 9에서의 A의 삽입, VD10, 위치 0에서의 T1의 삽입, 위치 10에서의 V의 결실, 위치 10에서의 F의 삽입, 위치 11에서의 D의 삽입, 위치 11에서의 D의 결실, D11S, 위치 12에서의 W의 결실, W12T, W12H, 위치 12에서의 P의 삽입, 위치 13에서의 Q의 삽입, 위치 12에서의 G의 삽입, 위치 13에서의 R의 삽입, W13P, W13D, 위치 13에서의 D의 삽입, W13L, 위치 14에서의 P의 삽입, 위치 14에서의 D의 삽입, 위치 14에서의 D의 결실 및 위치 15에서의 M의 결실, 위치 15에서의 M의 결실, 위치 16에서의 T의 삽입, 위치 17에서의 P의 삽입, N18I, V19N, V19H, K20D, L22D, I23S, E25C, E25P, 위치 25에서의 G의 삽입, K26T, K27E, K31L, K31Y, Q35D, Q35P, 위치 37에서의 S의 삽입, 위치 37에서의 L의 결실 및 위치 38에서의 A의 결실, K41L, 위치 42에서의 R의 삽입, 위치 43에서의 Q의 결실 및 위치 44에서의 E의 결실, L46N, K57Q, Y65T, G68M, L70V, L71C, L72D, L72N, L72W, L72Y, E75F, E75L, E75Y,G79P, 위치 79에서의 E의 삽입, 위치 81에서의 T의 삽입, 위치 81에서의 R의 삽입, 위치 81에서의 W의 삽입, 위치 81에서의 Y의 삽입, 위치 82에서의 W의 삽입, 위치 82에서의 Y의 삽입, W82G, W82R, K84D, K84H, K84P, K84T, V85L, V85A, 위치 85에서의 L의 삽입, Y86C, D87G, D87M, D87P, I93C, K95T, K96R, E98G, L100A, K102H, I104T, I104S, I104Q, K105D, 위치 109에서의 K의 삽입, E109L, R110D, 위치 110에서의 R의 결실, D114E, 위치 114에서의 D의 삽입, K118P, A120R, L121T, W124L, L125C, R126D, A127E, A127L, A129T, A129K, I133E, 위치 133에서의 C의 삽입, 위치 134에서의 S의 삽입, 위치 134에서의 G의 삽입, 위치 135에서의 R의 삽입, G135P, L136K, L136D, L136S, L136H, 위치 138에서의 E의 결실, D140R, 위치 140에서의 D의 삽입, 위치 141에서의 P의 삽입, 위치 142에서의 D의 삽입, 위치 143에서의 E의 결실+위치 144에서의 F의 결실, 위치 143에서의 Q의 삽입, F144K, 위치 144에서의 F의 결실, 위치 144에서의 F의 결실 및 위치 145에서의 C의 결실, C145R, 위치 145에서의 G의 삽입, C145K, C147D, 위치 148에서의 V의 삽입, E148D, 위치 149에서의 H의 삽입, L149R, K150R, L151H, Q152C, K153P, L158S, E166L, 및 위치 167에서의 F의 삽입으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-53. 실시 형태 III-45 내지 실시 형태 III-52 중 어느 하나에 있어서, 서열 번호 41821에 비교하여 I4, K5, P6, M7, N8, L9, V12, G49, K63, K80, N83, R90, M125, 및 L146으로 이루어진 군으로부터 선택된 RuvC-I 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-54. 실시 형태 III-53에 있어서, 서열 번호 41821에 비교하여 RuvC-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 4에서의 I의 삽입, 위치 5에서의 S의 삽입, 위치 6에서의 T의 삽입, 위치 6에서의 N의 삽입, 위치 7에서의 R의 삽입, 위치 7에서의 K의 삽입, 위치 8에서의 H의 삽입, 위치 8에서의 S의 삽입, V12L, G49W, G49R, S51R, S51K, K62S, K62T, K62E, V65A, K80E, N83G, R90H, R90G, M125S, M125A, L137Y, 위치 137에서의 P의 삽입, 위치 141에서의 L의 결실, L141R, L141D, 위치 142에서의 Q의 삽입, 위치 143에서의 R의 삽입, 위치 143에서의 N의 삽입, E144N, 위치 146에서의 P의 삽입, L146F, P147A, K149Q, T150V, 위치 152에서의 R의 삽입, H153의 삽입, T155Q, 위치 155에서의 H의 삽입, 위치 155에서의 R의 삽입, 위치 156에서의 L의 삽입, 위치 156에서의 L의 결실, 위치 156에서의 W의 삽입, 위치 157에서의 A의 삽입, 위치 157에서의 F의 삽입, A157S, Q158K, 위치 159에서의 Y의 결실, T160Y, T160F, 위치 161에서의 I의 삽입, S161P, T163P, 위치 163에서의 N의 삽입, C164K, 및 C164M으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-55. 실시 형태 III-45 내지 실시 형태 III-54 중 어느 하나에 있어서, 서열 번호 41822에 비교하여 I3, K4, R5, I6, N7, K8, K15, D16, N18, P27, M28, V33, R34, M36, R41, L47, R48, E52, P55, 및 Q56으로 이루어진 군으로부터 선택된 OBD-I 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-56. 실시 형태 III-55에 있어서, 서열 번호 41822에 비교하여 OBD-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 3에서의 G의 삽입, I3G, I3E, 위치 4에서의 G의 삽입, K4G, K4P, K4S, K4W, K4W, R5P, 위치 5에서의 P의 삽입, 위치 5에서의 G의 삽입, R5S, 위치 5에서의 S의 삽입, R5A, R5P, R5G, R5L, I6A, I6L, 위치 6에서의 G의 삽입, N7Q, N7L, N7S, K8G, K15F, D16W, 위치 16에서의 F의 삽입, F18의 삽입, 위치 27에서의 P의 삽입, M28P, M28H, V33T, R34P, M36Y, R41P, L47P, 위치 48에서의 P의 삽입, E52P, 위치 55에서의 P의 삽입, 위치 55에서의 P의 결실 및 위치 56에서의 Q의 결실, Q56S, Q56P, 위치 56에서의 D의 삽입, 위치 56에서의 T의 삽입, 및 Q56P로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-57. 실시 형태 III-45 내지 실시 형태 III-56 중 어느 하나에 있어서, 서열 번호 41823에 비교하여 S2, I3, L4, K11, V24, K37, R42, A53, T58, K63, M70, I82, Q92, G93, K110, L121, R124, R141, E143, V144, 및 L145로 이루어진 군으로부터 선택된 OBD-II 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-58. 실시 형태 III-57에 있어서, 서열 번호 41823에 비교하여 OBD-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 2에서의 S의 결실, I3R, I3K, 위치 3에서의 I의 결실 및 L4의 결실, 위치 4에서의 L의 결실, K11T, 위치 24에서의 P의 삽입, K37G, R42E, 위치 53에서의 S의 삽입, 위치 58에서의 R의 삽입, 위치 63에서의 K의 결실, M70T, I82T, Q92I, Q92F, Q92V, Q92A, 위치 93에서의 A의 삽입, K110Q, R115Q, L121T, 위치 124에서의 A의 삽입, 위치 141에서의 R의 삽입, 위치 143에서의 D의 삽입, 위치 143에서의 A의 삽입, 위치 144에서의 W의 삽입, 및 위치 145에서의 A의 삽입으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-59. 실시 형태 III-45 내지 실시 형태 III-58 중 어느 하나에 있어서, 서열 번호 41825에 비교하여 S1, N2, C3, G4, F5, I7, K18, V58, S67, T76, G78, S80, G81, E82, S85, V96, 및 E98로 이루어진 군으로부터 선택된 TSL 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-60. 실시 형태 III-59에 있어서, 서열 번호 41825에 비교하여 OBD-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 1에서의 M의 삽입, 위치 2에서의 N의 결실, 위치 2에서의 V의 삽입, C3S, 위치 4에서의 G의 삽입, 위치 4에서의 W의 삽입, F5P, 위치 7에서의 W의 삽입, K18G, V58D, 위치 67에서의 A의 삽입, T76E, T76D, T76N, G78D, 위치 80에서의 S의 결실, 위치 81에서의 G의 결실, 위치 82에서의 E의 삽입, 위치 82에서의 N의 삽입, S85I, V96C, V96T, 및 E98D로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-61. 실시 형태 III-45 내지 실시 형태 III-60 중 어느 하나에 있어서, 발현된 부류 2, 유형 V CRISPR 단백질은 서열 번호 2 또는 서열 번호 145에 비교하여 개선된 특징을 나타내며, 여기서 개선된 특징은 gRNA에 대한 증가된 결합 친화도, 표적 핵산에 대한 증가된 결합 친화도, 표적 핵산의 편집에 PAM 서열의 더 큰 스펙트럼을 이용하는 개선된 능력, 표적 핵산의 개선된 풀림, 증가된 편집 활성, 개선된 편집 효율, 표적 핵산의 절단에 대한 개선된 편집 특이성, 표적 핵산의 감소된 표적-외 편집 또는 절단, 편집될 수 있는 진핵생물 게놈의 증가된 백분율, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 닉킹에 대한 감소된 표적 가닥 로딩, DNA의 비-표적 가닥의 증가된 결합, 개선된 단백질 안정성, 증가된 단백질:gRNA(RNP) 복합체 안정성, 및 개선된 융합 특징을 포함하는, 폴리뉴클레오티드.
실시 형태 III-62. 실시 형태 III-61에 있어서, 개선된 특징은 TTC, ATC, GTC, 또는 CTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
실시 형태 III-63. 실시 형태 III-62에 있어서, 개선된 특징은 서열 번호 145의 서열의 절단 활성에 비교하여 ATC 또는 CTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
실시 형태 III-64. 실시 형태 III-63에 있어서, 개선된 절단 활성은 시험관내 검정에서 서열 번호 145의 서열의 점수에 비교하여 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 약 6 이상, 약 7 이상, 약 8 이상 더 큰 농축 점수(log2)인, 폴리뉴클레오티드.
실시 형태 III-65. 실시 형태 III-63에 있어서, 개선된 특징은 서열 번호 145의 서열에 비교하여 CTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
실시 형태 III-66. 실시 형태 III-65에 있어서, 개선된 절단 활성은 시험관내 검정에서 서열 번호 145의 서열의 점수에 비교하여 약 2 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 또는 약 6 이상 더 큰 농축 점수(log2)인, 폴리뉴클레오티드.
실시 형태 III-67. 실시 형태 III-62에 있어서, 개선된 특징은 서열 번호 145의 서열에 비교하여 TTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
실시 형태 III-68. 실시 형태 III-67에 있어서, 개선된 절단 활성은 시험관내 검정에서 서열 번호 145의 서열에 비교하여 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 또는 약 6 log2 이상 더 큰 농축 점수인, 폴리뉴클레오티드.
실시 형태 III-69. 실시 형태 III-61에 있어서, 개선된 특징은 서열 번호 145의 서열에 비교하여 표적 핵산 서열의 절단에 대한 증가된 특이성을 포함하는, 폴리뉴클레오티드.
실시 형태 III-70. 실시 형태 III-69에 있어서, 증가된 특이성은 시험관내 검정에서 서열 번호 145의 서열에 비교하여 약 2.0 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 또는 약 6 log2 이상 더 큰 농축 점수인, 폴리뉴클레오티드.
실시 형태 III-71. 실시 형태 III-61에 있어서, 개선된 특징은 표적 핵산 서열의 감소된 표적-외 절단을 포함하는, 폴리뉴클레오티드.
실시 형태 III-72. 실시 형태 III-37에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 Cas12f, Cas12j(CasPhi), 및 CasX로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-73. 실시 형태 III-72에 있어서, 인코딩된 CasX는 서열 번호 1 내지 3, 49 내지 160, 및 40208 내지 40369, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-74. 실시 형태 III-72에 있어서, 인코딩된 CasX는 서열 번호 1 내지 3, 49 내지 160, 40208 내지 40369, 및 40828 내지 40912의 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-75. 실시 형태 III-72에 있어서, 폴리뉴클레오티드의 CasX 서열은 표 21에 기술된 바와 같은 서열 번호 40577 내지 40588, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-76. 실시 형태 III-72에 있어서, 폴리뉴클레오티드의 CasX 서열은 표 21에 기술된 바와 같은 서열 번호 40577 내지 40588로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-77. 실시 형태 III-1 내지 실시 형태 III-76 중 어느 하나에 있어서, CRISPR 단백질을 인코딩하는 서열에 연결된 하나 이상의 NLS를 인코딩하는, 폴리뉴클레오티드.
실시 형태 III-78. 실시 형태 III-77에 있어서, 하나 이상의 NLS를 인코딩하는 서열은 CRISPR 단백질을 인코딩하는 서열의 5' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
실시 형태 III-79. 실시 형태 III-78 또는 실시 형태 III-79에 있어서, 하나 이상의 NLS를 인코딩하는 서열은 CRISPR 단백질을 인코딩하는 서열의 3' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
실시 형태 III-80. 실시 형태 III-78 또는 실시 형태 III-79에 있어서, 2개 이상의 NLS를 인코딩하며, 여기서 2개 이상의 NLS를 인코딩하는 서열은 CRISPR 단백질을 인코딩하는 서열의 5' 및 3' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
실시 형태 III-81. 실시 형태 III-77 내지 실시 형태 III-80 중 어느 하나에 있어서, 하나 이상의 인코딩된 NLS는 PKKKRKV(서열 번호 196), KRPAATKKAGQAKKKK(서열 번호 197), PAAKRVKLD(서열 번호 248), RQRRNELKRSP(서열 번호 161), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열 번호 162), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열 번호 163), VSRKRPRP(서열 번호 164), PPKKARED(서열 번호 165), PQPKKKPL(서열 번호 166), SALIKKKKKMAP(서열 번호 167), DRLRR(서열 번호 168), PKQKKRK(서열 번호 169), RKLKKKIKKL(서열 번호 170), REKKKFLKRR(서열 번호 171), KRKGDEVDGVDEVAKKKSKK(서열 번호 172), RKCLQAGMNLEARKTKK(서열 번호 173), PRPRKIPR(서열 번호 174), PPRKKRTVV(서열 번호 175), NLSKKKKRKREK(서열 번호 176), RRPSRPFRKP(서열 번호 177), KRPRSPSS(서열 번호 178), KRGINDRNFWRGENERKTR(서열 번호 179), PRPPKMARYDN(서열 번호 180), KRSFSKAF(서열 번호 181), KLKIKRPVK(서열 번호 182), PKKKRKVPPPPAAKRVKLD(서열 번호 183), PKTRRRPRRSQRKRPPT(서열 번호 184), SRRRKANPTKLSENAKKLAKEVEN(서열 번호 41827), KTRRRPRRSQRKRPPT(서열 번호 186), RRKKRRPRRKKRR(서열 번호 187), PKKKSRKPKKKSRK(서열 번호 188), HKKKHPDASVNFSEFSK(서열 번호 189), QRPGPYDRPQRPGPYDRP(서열 번호 190), LSPSLSPLLSPSLSPL(서열 번호 191), RGKGGKGLGKGGAKRHRK(서열 번호 192), PKRGRGRPKRGRGR(서열 번호 193), PKKKRKVPPPPKKKRKV(서열 번호 195), PAKRARRGYKC(서열 번호 40188), KLGPRKATGRW(서열 번호 40189), PRRKREE(서열 번호 40190), PYRGRKE(서열 번호 40191), PLRKRPRR(서열 번호 40192), PLRKRPRRGSPLRKRPRR(서열 번호 40193), PAAKRVKLDGGKRTADGSEFESPKKKRKV(서열 번호 40194), PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(서열 번호 40195), PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(서열 번호 40196), PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(서열 번호 40710), KRKGSPERGERKRHW(서열 번호 40198), KRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 41828), 및 PKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 40200)로 이루어진 서열의 군으로부터 선택되며, 여기서 하나 이상의 NLS는 CRISPR 변이체 또는 인접한 NLS에 링커 펩티드로 연결되고, 여기서 링커 펩티드는 RS, (G)n(서열 번호 40201), (GS)n(서열 번호 40202), (GSGGS)n(서열 번호 208), (GGSGGS)n(서열 번호 209), (GGGS)n(서열 번호 210), GGSG(서열 번호 211), GGSGG(서열 번호 212), GSGSG(서열 번호 213), GSGGG(서열 번호 214), GGGSG(서열 번호 215), GSSSG(서열 번호 216), GPGP(서열 번호 217), GGP, PPP, PPAPPA(서열 번호 218), PPPG(서열 번호 40207), PPPGPPP(서열 번호 219), PPP(GGGS)n(서열 번호 40203), (GGGS)nPPP(서열 번호 40204), AEAAAKEAAAKEAAAKA(서열 번호 40205), 및 TPPKTKRKVEFE(서열 번호 40206)로 이루어진 군으로부터 선택되고, 여기서 n은 1 내지 5인, 폴리뉴클레오티드.
실시 형태 III-82. 실시 형태 III-77 내지 실시 형태 III-80 중 어느 하나에 있어서, 하나 이상의 인코딩된 NLS는 표 15 및 표 16에 기술된 바와 같은 서열 번호 40443 내지 40501, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-83. 실시 형태 III-77 내지 실시 형태 III-80 중 어느 하나에 있어서, 하나 이상의 인코딩된 NLS는 표 15 및 표 16에 기술된 바와 같은 서열 번호 40443 내지 40501로 이루어진 서열의 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-84. 실시 형태 III-1 내지 실시 형태 III-83 중 어느 하나에 있어서, 인코딩된 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-85. 실시 형태 III-1 내지 실시 형태 III-84 중 어느 하나에 있어서, 인코딩된 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-86. 실시 형태 III-85에 있어서, 인코딩된 제1 gRNA는 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 30개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-87. 실시 형태 III-86에 있어서, 표적화 서열은 18, 19, 또는 20개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-88. 실시 형태 III-1 내지 실시 형태 III-87 중 어느 하나에 있어서, 제2 gRNA 및 제2 gRNA에 작동가능하게 연결된 제3 프로모터를 인코딩하는 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-89. 실시 형태 III-88에 있어서, 제3 프로모터는 pol III 프로모터인, 폴리뉴클레오티드.
실시 형태 III-90. 실시 형태 III-88 또는 실시 형태 III-89에 있어서, 제3 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1(양방향 H1 프로모터), BiU6(양방향 U6 프로모터), 고릴라 U6, 레수스 U6, 인간 7sk, 및 인간 H1 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-91. 실시 형태 III-90에 있어서, 제3 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1, BiU6, 고릴라 U6, 레수스 U6, 인간 7sk, 또는 인간 H1 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
실시 형태 III-92. 실시 형태 III-88 내지 실시 형태 III-91 중 어느 하나에 있어서, 제3 프로모터는 약 250개 미만의 뉴클레오티드, 약 220개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 160개 미만의 뉴클레오티드, 약 140개 미만의 뉴클레오티드, 약 130개 미만의 뉴클레오티드, 약 120개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 70개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-93. 실시 형태 III-88 내지 실시 형태 III-91 중 어느 하나에 있어서, 제3 프로모터는 약 70 내지 약 245개의 뉴클레오티드, 약 100 내지 약 220개의 뉴클레오티드, 또는 약 120 내지 약 160개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-94. 실시 형태 III-88 내지 실시 형태 III-93 중 어느 하나에 있어서, 제3 프로모터는 표 9에 기술된 바와 같은 서열 번호 40401 내지 40420 및 41010 내지 41029, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-95. 실시 형태 III-88 내지 실시 형태 III-94 중 어느 하나에 있어서, 제3 프로모터는 제2 gRNA의 전사를 향상시키는, 폴리뉴클레오티드.
실시 형태 III-96. 실시 형태 III-88 내지 실시 형태 III-95 중 어느 하나에 있어서, 인코딩된 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 및 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-97. 실시 형태 III-88 내지 실시 형태 III-95 중 어느 하나에 있어서, 인코딩된 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-98. 실시 형태 III-89 내지 실시 형태 III-97 중 어느 하나에 있어서, 인코딩된 제2 gRNA는 실시 형태 III-86 또는 실시 형태 III-87의 표적 핵산과는 상이한 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 30개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-99. 실시 형태 III-98에 있어서, 표적화 서열은 18, 19, 또는 20개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
실시 형태 III-100. 실시 형태 III-86 내지 실시 형태 III-99 중 어느 하나에 있어서, 표적화 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776, 또는 이들에 대해 80% 이상, 90% 이상, 또는 95% 이상의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-101. 실시 형태 III-86 내지 실시 형태 III-99 중 어느 하나에 있어서, 표적화 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-102. 실시 형태 III-86 내지 실시 형태 III-101 중 어느 하나에 있어서, 인코딩된 제1 및 제2 gRNA는 서열 번호 2238에 비교하여 하나 이상의 변형을 갖는 스캐폴드 서열을 포함하며, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발하는, 폴리뉴클레오티드.
실시 형태 III-103. 실시 형태 III-102에 있어서, 하나 이상의 변형은 표 28에 기술된 바와 같은 하나 이상의 뉴클레오티드 치환, 삽입, 및/또는 결실을 포함하는, 폴리뉴클레오티드.
실시 형태 III-104. 실시 형태 III-102 또는 실시 형태 III-103에 있어서, 개선된 특징은, 임의로 시험관내 검정에서, 증가된 편집 활성, 증가된 유사매듭 스템 안정성, 증가된 삼중체 영역 안정성, 증가된 스캐폴드 스템 안정성, 연장된 스템 안정성, 감소된 표적-외 폴딩 중간체, 및 부류 2, 유형 V CRISPR 단백질에 대한 증가된 결합 친화도로 이루어진 군으로부터 선택된 하나 이상의 기능적 특성인, 폴리뉴클레오티드.
실시 형태 III-105. 실시 형태 III-102 내지 실시 형태 III-104 중 어느 하나에 있어서, 발현된 gRNA 스캐폴드는 시험관내 검정에서 서열 번호 2238의 gRNA 스캐폴드의 점수에 비교하여 약 2.0 이상, 약 2.5 이상, 약 3 이상, 또는 약 3.5 이상 더 큰 개선된 농축 점수(log2)를 나타내는, 폴리뉴클레오티드.
실시 형태 III-106. 실시 형태 III-84 내지 실시 형태 III-101에 있어서, 인코딩된 제1 및 제2 gRNA는 서열 번호 2239에 비교하여 하나 이상의 변형을 갖는 스캐폴드 서열을 포함하며, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발하는, 폴리뉴클레오티드.
실시 형태 III-107. 실시 형태 III-106에 있어서, 하나 이상의 변형은 표 29에 기술된 바와 같은 하나 이상의 뉴클레오티드 치환, 삽입, 및/또는 결실을 포함하는, 폴리뉴클레오티드.
실시 형태 III-108. 실시 형태 III-106 또는 실시 형태 III-107에 있어서, 개선된 특징은, 임의로 시험관내 검정에서, 증가된 편집 활성, 증가된 유사매듭 스템 안정성, 증가된 삼중체 영역 안정성, 증가된 스캐폴드 스템 안정성, 연장된 스템 안정성, 감소된 표적-외 폴딩 중간체, 및 부류 2, 유형 V CRISPR 단백질에 대한 증가된 결합 친화도로 이루어진 군으로부터 선택된 하나 이상의 기능적 특성인, 폴리뉴클레오티드.
실시 형태 III-109. 실시 형태 III-106 내지 실시 형태 III-108 중 어느 하나에 있어서, 발현된 gRNA 스캐폴드는 시험관내 검정에서 서열 번호 2239의 gRNA 스캐폴드의 점수에 비교하여 약 1.2 이상, 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 또는 약 3.5 이상 더 큰 개선된 농축 점수(log2)를 나타내는, 폴리뉴클레오티드.
실시 형태 III-110. 실시 형태 III-106 내지 실시 형태 III-109 중 어느 하나에 있어서, 서열 번호 2239의 서열에 비교하여 C9, U11, C17, U24, A29, U54, G64, A88, 및 A95로 이루어진 군으로부터 선택된 위치에 하나 이상의 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-111. 실시 형태 III-110에 있어서, 서열 번호 2239의 서열에 비교하여 C9U, U11C, C17G, U24C, A29C, 위치 54에서의 G의 삽입, 위치 64에서의 C의 삽입, A88G, 및 A95G로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-112. 실시 형태 III-111에 있어서, 서열 번호 2239의 서열에 비교하여 C9U, U11C, C17G, U24C, A29C, 위치 54에서의 G의 삽입, 위치 64에서의 C의 삽입, A88G, 및 A95G로 이루어진 변형을 포함하는, 폴리뉴클레오티드.
실시 형태 III-113. 실시 형태 III-106 내지 실시 형태 III-112 중 어느 하나에 있어서, 개선된 특징은 유사매듭 스템 안정성, 삼중체 영역 안정성, 스캐폴드 버블 안정성, 연장된 스템 안정성, 및 부류 2, 유형 V CRISPR 단백질에 대한 결합 친화도로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-114. 실시 형태 III-112에 있어서, 서열 번호 2239의 서열에 비교하여 위치 64에서의 C의 삽입 및 A88G 치환은 연장된 스템의 비대칭 벌지 요소를 해소하여, gRNA 스캐폴드의 연장된 스템의 안정성을 향상시키는, 폴리뉴클레오티드.
실시 형태 III-115. 실시 형태 III-112에 있어서, U11C, U24C, 및 A95G의 치환은 gRNA 스캐폴드의 삼중체 영역의 안정성을 증가시키는, 폴리뉴클레오티드.
실시 형태 III-116. 실시 형태 III-112에 있어서, A29C의 치환은 유사매듭 스템의 안정성을 증가시키는, 폴리뉴클레오티드.
실시 형태 III-117. 실시 형태 III-1 내지 실시 형태 III-116 중 어느 하나에 있어서, 액세서리 요소는 사이토메갈로바이러스 즉시/초기 인트론A, B형 간염 바이러스 PRE(HPRE), 우드척 간염 바이러스 PRE(WPRE), 및 인간 열 충격 단백질 70 mRNA(Hsp70)의 5′ 비번역 영역(UTR)으로 이루어진 군으로부터 선택된 전사-후 조절 요소(PTRE)인, 폴리뉴클레오티드.
실시 형태 III-118. 실시 형태 III-117에 있어서, 액세서리 요소는 표 12에 기술된 바와 같은 서열 번호 40431 내지 40442, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 PTRE인, 폴리뉴클레오티드.
실시 형태 III-119. 실시 형태 III-1 내지 실시 형태 III-118 중 어느 하나에 있어서, 5' 및 3' ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, 폴리뉴클레오티드.
실시 형태 III-120. 실시 형태 III-119에 있어서, 5' 및 3' ITR은 혈청형 AAV2로부터 유래되는, 폴리뉴클레오티드.
실시 형태 III-121. 실시 형태 III-1 내지 실시 형태 III-120 중 어느 하나에 있어서, 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22, 및 표 24 내지 표 27의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-122. 실시 형태 III-1 내지 실시 형태 III-121 중 어느 하나에 있어서, 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22, 및 표 24 내지 표 27의 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-123. 실시 형태 III-1 내지 실시 형태 III-122 중 어느 하나에 있어서, 표 26의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-124. 실시 형태 III-1 내지 실시 형태 III-123 중 어느 하나에 있어서, 표 26의 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-125. 실시 형태 III-124에 있어서, 표 26에 기술된 바와 같은 1 내지 174, 177 내지 186, 및 188 내지 198의 작제물의 군으로부터 선택된 작제물의 서열을 포함하는, 폴리뉴클레오티드.
실시 형태 III-126. 실시 형태 III-123 내지 실시 형태 III-125 중 어느 하나에 있어서, 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776의 서열의 군으로부터 선택된 표적화 서열을 추가로 포함하며, 여기서 표적화 서열은 gRNA를 인코딩하는 폴리뉴클레오티드 서열의 3' 단부에 연결되는, 폴리뉴클레오티드.
실시 형태 III-127. 실시 형태 III-1 내지 실시 형태 III-126 중 어느 하나에 있어서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택된 하나 이상의 AAV 구성성분 서열은 서열의 CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형되는, 폴리뉴클레오티드.
실시 형태 III-128. 실시 형태 III-127에 있어서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 및 폴리(A), 및 액세서리 요소로 이루어진 군으로부터 선택된 하나 이상의 AAV 구성성분 서열은 약 10% 미만, 약 5% 미만, 또는 약 1% 미만의 CpG 다이뉴클레오티드를 포함하는, 폴리뉴클레오티드.
실시 형태 III-129. 실시 형태 III-127에 있어서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 및 폴리(A), 및 액세서리 요소로 이루어진 군으로부터 선택된 하나 이상의 AAV 구성성분 서열에는 CpG 다이뉴클레오티드가 없는, 폴리뉴클레오티드.
실시 형태 III-130. 실시 형태 III-127 내지 실시 형태 III-129 중 어느 하나에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 코돈-최적화된 하나 이상의 AAV 구성성분 서열은 표 25에 기술된 바와 같은 서열 번호 41045 내지 41055로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
실시 형태 III-131. 실시 형태 III-1 내지 실시 형태 III-130 중 어느 하나에 있어서, 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나에 도시된 작제물의 구성을 갖는, 폴리뉴클레오티드.
실시 형태 III-132. a) AAV 캡시드 단백질, 및 b) 실시 형태 III-1 내지 실시 형태 III-131 중 어느 하나의 폴리뉴클레오티드를 포함하는, 재조합 아데노-관련 바이러스 벡터(rAAV).
실시 형태 III-133. 실시 형태 III-132에 있어서, AAV 캡시드 단백질은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, rAAV.
실시 형태 III-134. 실시 형태 III-133에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 동일한 혈청형의 AAV로부터 유래되는, rAAV.
실시 형태 III-135. 실시 형태 III-133에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 상이한 혈청형의 AAV로부터 유래되는, rAAV.
실시 형태 III-136. 실시 형태 III-135에 있어서, 5' 및 3' ITR은 AAV 혈청형 2로부터 유래되는, rAAV.
실시 형태 III-137. 실시 형태 III-132 내지 실시 형태 III-136 중 어느 하나에 있어서, rAAV를 이용한 세포의 형질도입시에, CRISPR 단백질 및 gRNA가 발현될 수 있는, rAAV.
실시 형태 III-138. 실시 형태 III-137에 있어서, 발현시에, gRNA는 CRISPR 단백질과 리보핵단백질(RNP) 복합체를 형성할 수 있는, rAAV.
실시 형태 III-139. 실시 형태 III-137 또는 실시 형태 III-138에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열은 발현시에 이들의 기능적 특성을 실질적으로 유지하는, rAAV.
실시 형태 III-140. 실시 형태 III-137 또는 실시 형태 III-138에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열은 AAV 폴리뉴클레오티드가 CpG 다이뉴클레오티드의 고갈을 위해 변형되지 않은 rAAV에 비교하여 면역 반응을 유도하는 더 낮은 잠재력을 나타내는, rAAV.
실시 형태 III-141. 실시 형태 III-140에 있어서, 면역 반응을 유도하는 더 낮은 잠재력은 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 염증 반응의 하나 이상의 마커의 생성을 검출하도록 설계된 시험관내 포유류 세포 검정에서 나타나는, rAAV.
실시 형태 III-142. 실시 형태 III-141에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열을 포함하는 rAAV는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상 더 적은 하나 이상의 염증성 마커의 감소된 생성을 도출하는, rAAV.
실시 형태 III-143. 실시 형태 III-140에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열을 포함하는 rAAV의 용량의 대상체에 대한 투여는 CpG 고갈되지 않은 유사한 rAAV의 투여된 용량에 비교하여 감소된 면역 반응을 도출하는, rAAV.
실시 형태 III-144. 실시 형태 III-143에 있어서, 감소된 면역 반응은 대상체에서의 rAAV 구성성분에 대한 항-rAAV 항체의 생성 또는 지연형 과민반응의 감소인, rAAV.
실시 형태 III-145. 실시 형태 III-143에 있어서, 감소된 면역 반응은 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 대상체 혈중의 하나 이상의 염증성 마커의 측정에 의해 결정되며, 여기서 하나 이상의 마커는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상만큼 감소되는, rAAV.
실시 형태 III-146. 실시 형태 III-143 내지 실시 형태 III-145 중 어느 하나에 있어서, 대상체는 마우스, 래트, 돼지, 개, 및 비-인간 영장류로부터 선택되는, rAAV.
실시 형태 III-147. 실시 형태 III-143 내지 실시 형태 III-145 중 어느 하나에 있어서, 대상체는 인간인, rAAV.
실시 형태 III-148. 실시 형태 III-132 중 어느 하나의 rAAV 및 약제학적으로 허용가능한 담체, 희석제, 또는 부형제를 포함하는, 약제학적 조성물.
실시 형태 III-149. 포유류 세포의 집단에서 표적 핵산을 변형시키기 위한 방법으로서, 복수의 세포를 실시 형태 III-132 내지 실시 형태 III-147 중 어느 하나의 rAAV의 유효량과 접촉시키는 단계를 포함하며, 여기서 발현된 gRNA에 의해 표적화된 세포의 유전자의 표적 핵산은 발현된 CRISPR 단백질에 의해 변형되는, 방법.
실시 형태 III-150. 실시 형태 III-149에 있어서, 세포의 유전자는 하나 이상의 돌연변이를 포함하는, 방법.
실시 형태 III-151. 실시 형태 III-149 또는 실시 형태 III-150에 있어서, 변형시키는 단계는 집단의 세포의 표적 핵산 내의 하나 이상의 뉴클레오티드의 삽입, 결실, 치환, 복제, 또는 역위를 도입하는 단계를 포함하는, 방법.
실시 형태 III-152. 실시 형태 III-149 내지 실시 형태 III-151 중 어느 하나에 있어서, 유전자는 녹 다운되거나 녹 아웃되는, 방법.
실시 형태 III-153. 실시 형태 III-149 내지 실시 형태 III-151 중 어느 하나에 있어서, 유전자는 기능적 유전자 생성물이 발현될 수 있도록 변형되는, 방법.
실시 형태 III-154. 대상체에서 대상체의 유전자 내의 하나 이상의 돌연변이에 의해 야기된 질환을 치료하는 방법으로서, 실시 형태 III-132 내지 실시 형태 III-145 중 어느 하나의 rAAV의 치료적 유효 용량을 대상체에게 투여하는 단계를 포함하는, 방법.
실시 형태 III-155. 실시 형태 III-149에 있어서, rAAV는 약 1 x 108 벡터 게놈(vg) 이상, 약 1 x 105 벡터 게놈/kg(vg/kg) 이상, 약 1 x 106 vg/kg 이상, 약 1 x 107 vg/kg 이상, 약 1 x 108 vg/kg 이상, 약 1 x 109 vg/kg 이상, 약 1 x 1010 vg/kg 이상, 약 1 x 1011 vg/kg 이상, 약 1 x 1012 vg/kg 이상, 약 1 x 1013 vg/kg 이상, 약 1 x 1014 vg/kg 이상, 약 1 x 1015 vg/kg 이상, 또는 약 1 x 1016 vg/kg 이상의 용량으로 대상체에게 투여되는, 방법.
실시 형태 III-156. 실시 형태 III-154에 있어서, rAAV는 약 1 x 105 vg/kg 내지 약 1 x 1016 vg/kg 이상, 약 1 x 106 vg/kg 내지 약 1 x 1015 vg/kg 이상, 또는 약 1 x 107 vg/kg 내지 약 1 x 1014 vg/kg 이상의 용량으로 대상체에게 투여되는, 방법.
실시 형태 III-157. 실시 형태 III-154 내지 실시 형태 III-156 중 어느 하나에 있어서, rAAV는 피하, 피내, 신경내, 림프절내, 척수내, 근육내, 요추내, 척추강내, 지주막하, 뇌실내, 관절낭내, 정맥내, 림프내, 안내, 또는 복강내 경로로부터 선택된 투여 경로에 의해 대상체에게 투여되며, 여기서 투여 방법은 주사, 이입, 또는 이식인, 방법.
실시 형태 III-158. 실시 형태 III-149 내지 실시 형태 III-157 중 어느 하나에 있어서, 대상체는 마우스, 래트, 돼지, 및 비-인간 영장류로 이루어진 군으로부터 선택되는, 방법.
실시 형태 III-159. 실시 형태 III-149 내지 실시 형태 III-157 중 어느 하나에 있어서, 대상체는 인간인, 방법.
실시 형태 III-160. rAAV 벡터를 제조하는 방법으로서,
a. 패키징 세포의 집단을 제공하는 단계; 및
b.
i) 실시 형태 III-1 내지 실시 형태 III-131 중 어느 하나의 폴리뉴클레오티드를 포함하는 벡터;
ii) aap(조립체) 유전자를 포함하는 벡터; 및
iii) rep 및 cap 게놈을 포함하는 벡터로 세포의 집단을 형질감염시키는 단계를 포함하는, 방법.
실시 형태 III-161. 실시 형태 III-160에 있어서, 패키징 세포는 BHK 세포, HEK293 세포, HEK293T 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, NIH3T3 세포, COS 세포, HeLa 세포, 및 CHO 세포로 이루어진 군으로부터 선택되는, 방법.
실시 형태 III-162. 실시 형태 III-160 또는 실시 형태 III-161에 있어서, rAAV 벡터를 회수하는 단계를 추가로 포함하는, 방법.
실시 형태 III-163. 실시 형태 III-160 내지 실시 형태 III-162 중 어느 하나에 있어서, AAV 폴리뉴클레오티드의 구성성분 서열은 단일 rAAV 입자 내에 포함되는, 방법.
실시 형태 III-164. rAAV의 면역원성을 감소시키는 방법으로서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택된 AAV 구성성분 서열의 서열의 CpG 다이뉴클레오티드의 전부 또는 일부를 결실시키는 단계를 포함하는, 방법.
실시 형태 III-165. 실시 형태 III-164에 있어서, 하나 이상의 AAV 폴리뉴클레오티드 구성성분 서열은 약 10% 미만, 약 5% 미만, 또는 약 1% 미만의 CpG 다이뉴클레오티드를 포함하는, 방법.
실시 형태 III-166. 실시 형태 III-165에 있어서, 하나 이상의 AAV 폴리뉴클레오티드 구성성분 서열에는 CpG 다이뉴클레오티드가 없는, 방법.
실시 형태 III-167. 실시 형태 III-164 내지 실시 형태 III-166 중 어느 하나에 있어서, 하나 이상의 AAV 폴리뉴클레오티드 구성성분 서열은 표 25에 기술된 바와 같은 서열 번호 41045 내지 41055로 이루어진 군으로부터 선택되는, 방법.
실시 형태 III-168. 실시 형태 III-164 내지 실시 형태 III-167 중 어느 하나에 있어서, rAAV는 CpG 다이뉴클레오티드가 고갈되지 않은 유사한 rAAV에 비교하여 시험관내 포유류 세포 검정에서 염증 반응의 하나 이상의 마커의 생성을 유도하는 더 낮은 잠재력을 나타내며, 여기서 하나 이상의 염증성 마커는 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택되는, 방법.
실시 형태 III-169. 실시 형태 III-168에 있어서, rAAV는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상 더 적은 하나 이상의 염증성 마커의 감소된 생성을 도출하는, 방법.
실시 형태 III-170. 실시 형태 III-164 내지 실시 형태 III-167 중 어느 하나에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열을 포함하는 rAAV의 용량의 대상체에 대한 투여는 CpG 고갈되지 않은 유사한 rAAV의 투여된 용량에 비교하여 감소된 면역 반응을 도출하는, 방법.
실시 형태 III-171. 실시 형태 III-170에 있어서, 감소된 면역 반응은 대상체에서의 rAAV 구성성분에 대한 항-rAAV 항체의 생성 또는 지연형 과민반응의 감소인, 방법.
실시 형태 III-172. 실시 형태 III-170에 있어서, 감소된 면역 반응은 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 대상체 혈중의 하나 이상의 염증성 마커의 측정에 의해 결정되며, 여기서 하나 이상의 마커는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상만큼 감소되는, 방법.
실시 형태 III-173. 실시 형태 III-164 내지 실시 형태 III-172 중 어느 하나에 있어서, 대상체는 마우스, 래트, 돼지, 개, 및 비-인간 영장류로부터 선택되는, 방법.
실시 형태 III-174. 실시 형태 III-164 내지 실시 형태 III-172 중 어느 하나에 있어서, 대상체는 인간인, 방법.
실시 형태 III-175. 치료를 필요로 하는 인간의 치료를 위한 의약으로 사용하기 위한, 실시 형태 III-132 내지 실시 형태 III-147 중 어느 하나의 rAAV의 조성물.
본 설명은 다수의 예시적인 구성, 방법, 파라미터 등을 기술한다. 그러나, 그러한 설명은 본 개시내용의 범주에 대한 제한으로서 의도되는 것이 아니라, 그 대신에 예시적인 실시 형태의 설명으로서 제공된다는 것이 인식되어야 한다. 하기 실시예는 예시적인 목적을 위해 포함되며, 본 발명의 범주를 제한하는 것을 의도하지 않는다.
실시예
실시예 1: 작은 부류 2, 유형 V CRISPR 단백질은 시험관내에서 AAV 에피솜으로부터 발현될 경우에 게놈을 편집할 수 있다
작은 부류 2, 유형 V CRISPR 단백질은 시험관내에서 AAV 플라스미드 또는 AAV 벡터로부터 발현될 경우에 게놈을 편집할 수 있다는 것을 입증하기 위해 실험을 수행하였다.
재료 및 방법:
AAV 이식유전자는 개념적으로 ITR 사이에서 상이한 부분으로 파단되었으며, 이는 치료제 적재물(therapeutic cargo) 및 포유류 세포에서의 치료제 적재물의 발현에 관련된 액세서리 요소로 이루어졌다. AAV 벡터학(vectorology)은 부분 목록을 확인하는 단계 및 후속적으로 포유류 세포 내에서 플라스미드 및 AAV 형태 둘 모두로 벡터를 설계하고, 구축하고, 시험하는 단계로 이루어졌다. 그의 구성성분의 개략적인 일 구성을 도 1에 나타낸다.
본 제1 실시예에서는, 3개의 플라스미드가 작제되었으며(작제물 1, 작제물 2, 및 작제물 3; 구성성분 서열에 대해서는 표 26 참조), 여기서 ITR들 사이의 플라스미드 서열의 유일한 차이는 친화도 태그 영역 내에 있었다.
클로닝 및 QC:
예비-분해된(pre-digested) AAV 골격, 작은 CRISPR 단백질-인코딩 DNA, 및 플랭킹 5' 및 3' DNA 서열로 이루어진 4-부분 골든 게이트 조립체(4-part Golden Gate Assembly)를 사용하여 AAV 벡터를 클로닝하였다. 5' 서열은 인핸서, 단백질 프로모터, 및 N-말단 NLS를 함유한 반면에, 3' 서열은 C-말단 NLS, WPRE, 폴리(A) 신호, RNA 프로모터, 및 티디토마토를 표적화하는 스페이서 12.7(DNA 서열: CTGCATTCTAGTTGTGGTTT(서열 번호 40800))을 함유하는 가이드 RNA를 함유하였다. 5' 및 3' 부분은 Twist로부터 유전자 단편으로서 주문되고, PCR-증폭되고, T4 리가제 및 BbsI을 사용하는 주기적 골든 게이트 반응을 통해 AAV 벡터로 조립되었다.
조립된 AAV 벡터는 이어서 화학적-적격성 E. 콜라이(E. coli) 내로 형질전환되었다(Stbl3s). 형질전환된 세포를 1 시간 동안 37℃ 진탕 인큐베이터 내에서 회복시키고, 카나마이신 LB-아가 플레이트 상에 플레이팅하고, 37℃에서 12 내지 16 시간 동안 성장시켰다. 콜로니 PCR을 수행하여 전체 이식유전자를 함유한 클론을 결정하였다. 정확한 클론을 카나마이신을 갖는 50 mL의 LB 배지 중에 접종하고 하룻밤 성장시켰다. 이어서 다음 날에 플라스미드를 미디프렙(midiprep)하고 서열을 확인하였다. 미디프렙의 품질을 평가하기 위해, XmaI(이는 각각의 ITR 내에서 절단함) 및 XhoI(이는 AAV 게놈 내에서 1회 절단함)을 이용한 제한 분해에서 작제물을 가공하였다. 이어서 분해물 및 절단되지 않은 작제물을 1% 아가로스 겔 상에서 전개하고 ChemiDoc 상에서 영상화하였다. 플라스미드가 90%를 초과하여 수퍼코일링되었고, 크기가 정확하고, ITR이 온전한 경우, 뉴클레오펙션 및/또는 형질도입을 통해 작제물을 시험하였다.
플라스미드 뉴클레오펙션을 위한 방법:
AAV 게놈을 함유하는 플라스미드를 Lonza P3 1차 세포 96-웰 Nucleofector 키트를 사용하여 Ai9-티디토마토 마우스로부터 단리된 마우스 불멸화 신경 전구 세포주(NPC)(티디토마토 mNPC)에 형질감염시켰다. 약술하면, Ai9는 CAG 프로모터-구동 티디토마토 마커의 전사를 방지하는 loxP 플랭킹된 정지 카세트를 갖도록 설계된 Cre 리포터 툴 변종이다. Ai9 마우스, 또는 Ai9 mNPC는 정지 카세트를 제거하기 위한 Cre-매개 재조합 후에 티디토마토를 발현한다. 서열-검증된 플라스미드를 200 ng/μl, 100 ng/μl, 50 ng/μL, 및 25 ng/μL의 농도로 희석하고, 각각의 5 μL(1000 ng, 500 ng, 250 ng, 및 125 ng)를 200,000개의 티디토마토 mNPC를 함유하는 P3 용액에 첨가하였다. 합한 용액을 프로그램 EH-100에 따라 Lonza 4D Nucleofector 시스템을 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후에, 사전-평형화된 mNPC 배지(GlutaMax, 10 mM HEPES, 1X MEM 비-필수 아미노산, 1X 페니실린/스트렙토마이신, 1:1000 2-메르캅토에탄올, 1X B-27 보충제, 마이너스 비타민 A, 성장 인자 bFGF 및 EGF(20 ng/mL 최종 농도)가 보충된 1X N2를 갖는 DMEM/F12)로 용액을 켄칭(quenching)하였다. 이어서, PLF(1X 폴리-DL-오르니틴 하이드로브로마이드, 멸균 diH20 중의 10 mg/mL, 1X 라미닌, 및 1X 피브로넥틴)로 코팅된 96-웰 플레이트에 삼중실험으로 용액을 분취하였다(웰당 대략 67,000개의 세포). 형질감염 후 48 시간에, 처리된 세포에 성장 인자를 함유하는 새로운 mNPC 배지를 보급하였다. 형질감염 후 5 일에, 티디토마토 mNPC를 부양시키고 FACS에 의해 활성을 평가하였다.
AAV 생성:
모 HEK293T로부터 현탁액 HEK293T 세포를 적응시키고 FreeStyle 293 배지 중에 성장시켰다. 스크리닝 목적을 위해, 형질감염 당일에 소규모 배양물(125 mL 삼각 플라스크 내에 배양되고 110 rpm으로 교반되는 20 내지 30 mL)을 1.5e+6 세포/mL의 밀도로 희석하였다. 무-혈청 OPTIMEM 배지 중에 PEIMax(Polysciences)를 사용하여 복제를 위한 아데노바이러스 헬퍼 유전자 및 AAV rep/cap 게놈을 공급하는 플라스미드와 함께 ITR 반복에 의해 플랭킹된 이식유전자를 갖는 무-내독소 pAAV 플라스미드를 공동-형질감염시켰다. 형질감염-후 3 시간에 배양물을 10% CDM4HEK293(HyClone)으로 보충하였다. 3 일 후에, 배양물을 1000 rpm에서 10 분 동안 원심분리하여 세포 펠렛으로부터 상청액을 분리하였다. 상청액을 40% PEG 2.5 M NaCl(8% 최종 농도)과 혼합하고 얼음 상에서 2 시간 이상 동안 인큐베이션하여 AAV 바이러스 입자를 침전시켰다. 대부분의 AAV 벡터를 함유하는 세포 펠렛을 용해 배지(0.15 M NaCl, 50 mM 트리스 HCl, 0.05% Tween, pH 8.5) 중에 재현탁시키고, 얼음 상에서 초음파처리하고(15 초, 30% 진폭), 30 분 동안 37℃에서 Benzonase(250 U/μL, Novagen)로 처리하였다. 이어서 비정제 용해물 및 PEG-처리된 상청액을 4000 rpm에서 20 분 동안 4℃에서 원심분리하여 PEG 침전된 AAV(펠렛)를 무-세포 잔해 비정제 용해물(상청액)과 함께 재현탁시킨 후, 0.45 μM 필터를 사용하여 추가로 청징화하였다.
바이러스 게놈 역가를 결정하기 위해, 비정제 용해물 바이러스로부터의 1 μL를 DNase 및 ProtK로 분해한 후, 정량 PCR이 이어졌다. CMV 프로모터 영역(Fwd 5'-CATCTACGTATTAGTCATCGCTATTACCA-3'(서열 번호 40801)); Rev 5'-GAAATCCCCGTGAGTCAAACC-3'(서열 번호 40802)), 탐침 5'-TCAATGGGCGTGGATAG-3'(서열 번호 40803)) 또는 AAV2-ITR 내에 위치하는 62 뉴클레오티드-단편(Fwd 5'-GGAACCCCTAGTGATGGAGTT -3'(서열 번호 40804); Rev 5'-CGGCCTCAGTGAGCGA-3'(서열 번호 40805), 탐침 5'-CACTCCCTCTCTGCGCGCTCG-3')을 증폭하도록 설계된 IDT primetime 마스터 믹스 및 프라이머의 세트 및 6'FAM/Zen/IBFQ 탐침(IDT)으로 구성된 25 μL qPCR 반응에 5 μL의 분해된 바이러스를 사용하였다. AAV ITR 플라스미드의 10-배 연속 희석액(2e+9 내지 2e+4 DNA 카피/mL의 각각 5 μl)을 참조 표준으로 사용하여 바이러스 샘플의 역가(바이러스 게놈(vg)/mL)를 계산하였다. QPCR 프로그램은 95℃에서 5 분 동안의 초기 변성 단계에 이어서, 40 주기의 95℃에서 1 분 동안의 변성 및 60℃에서 1 분 동안의 어닐링/연장으로서 설정되었다.
AAV 형질도입:
AAV 형질도입 전 48-시간에 96-웰 플레이트 내의 PLF-코팅된 웰 상에 10,000개의 세포/웰의 mNPC를 시딩하였다. 모든 바이러스 감염 조건은, 약 1.0e+6 내지 1.0e+4 vg/세포 범위의 감염 다중도(MOI)의 일련의 3-배 희석에서, 실험 벡터들 사이에서 정규화된 vg의 수를 이용하여, 삼중실험으로 수행되었다. bFGF/EGF 성장 인자(20 ng/ml 최종 농도)로 보충된 사전-평형화된 mNPC 배지에 희석된 최종 부피 50 μL의 AAV 벡터를 각각의 웰에 적용하였다. 형질감염-후 48 시간에, 성장 인자로 보충된 새로운 배지로 완전 배지 교환을 수행하였다. 편집 활성(tdT+ 세포 정량화)은 형질감염-후 5 일에 FACS에 의해 평가되었다.
FACS에 의해 활성을 평가하기 위한 방법:
형질감염 후 5 일에, 96-웰 플레이트 내에서 처리된 티디토마토 mNPC를 dPBS로 세척하고 50 μL TrypLE로 15 분 동안 처리하였다. 세포 해리 후에, 처리된 웰을 DMEM, 10% FBS, 및 1X 페니실린/스트렙토마이신을 함유하는 배지로 켄칭하였다. 재현탁된 세포를 둥근-바닥 96-웰 플레이트에 이전하고 5 분 동안 1000 x g에서 원심분리하였다. 이어서 세포 펠렛을 1X DAPI를 함유하는 dPBS로 재현탁시키고, 플레이트를 Attune NxT 유세포 분석기 오토샘플러 내로 로딩하였다. 하기 게이팅 파라미터를 사용하여 Attune NxT 유세포 분석기를 실행하였다: 세포를 선택하기 위한 FSC-A x SSC-A, 단일 세포를 선택하기 위한 FSC-H x FSC-A, DAPI-음성 살아 있는 세포를 선택하기 위한 FSC-A x VL1-A, 및 티디토마토 양성 세포를 선택하기 위한 FSC-A x YL1-A.
결과:
도 2의 그래프는, CasX 변이체 491 및 티디토마토 정지 카세트를 표적화하는 스페이서 12.7을 갖는 가이드 변이체 174가, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우에, mNPC 내의 표적 정지 카세트를 편집할 수 있었음을 나타낸다(FACS에 의해 tdTom+인 세포의 백분율에 의해 측정됨). 시험된 벡터 중에서, 작제물 3 내에서 전달된 CasX 491.174(80% 티디토마토 + 세포를 가짐)가 다른 것들을 능가하였다. 도 3은 시험된 벡터 3개 모두가 티디토마토 유전자좌에서 용량-의존적 방식으로 편집을 달성하였음을 나타낸다. 도 4는, 고도의 편집을 달성하는 용량-의존적 반응을 입증한, AAV 벡터 내의 작제물 3을 사용하는 편집의 결과를 나타낸다.
본 실험은 작은 부류 2, 유형 V CRISPR 단백질(예컨대 CasX) 및 표적화된 가이드가 시험관내에서 AAV 이식유전자 플라스미드 또는 에피솜으로부터 발현될 경우에 게놈을 편집할 수 있다는 것을 입증한다.
실시예 2: AAV 벡터 내의 작은 부류 2, 유형 V CRISPR 시스템의 패키징
작은 부류 2, 유형 V CRISPR 단백질의 시스템, 예컨대 CasX 및 gRNA가 단일 AAV 벡터 내에 인코딩되고 효율적으로 패키징될 수 있다는 것을 입증하기 위해 실험을 수행하였다.
재료 및 방법:
본 실험을 위해, 실시예 1에 기재된 바와 같이, AAV 생성, 정제, 및 특성화를 위한 방법을 사용하여, CasX 변이체 438, gRNA 스캐폴드 174, 및 스페이서 12.7을 패키징하는 이식유전자로 AAV 벡터를 생성하였다. 특성화를 위해, qPCR에 의해 AAV 바이러스 게놈의 역가를 측정하고, 주사 투과 전자 현미경(STEM)을 사용하여 빈 입자-채워진 입자 비(empty-full ratio)를 정량화하였다. AAV는 1% 우라닐 아세테이트로 음성 염색되고 시각화되었다. 빈 입자는 캡시드의 중앙에서의 전자 밀도가 높은 어두운 원의 존재에 의해 확인되었다.
결과:
1 L의 HEK293T 세포 배양으로부터 생성된, AAV 제조를 위한 게놈 DNA 역가(qPCR에 의함)는 6e12 vg/mL인 것으로 측정되었다. 도 5는 본 AAV 제형 내의 입자의 추정된 90%가 바이러스 게놈을 함유했음을; 예를 들어, 채워졌음을 나타내는 주사 투과 전자 현미경(STEM) 현미경 사진으로부터의 영상이다. 실험 조건 하에, 결과는 CasX 변이체 단백질 및 gRNA가 단일 AAV 벡터 입자 내에 효율적으로 패키징되어 높은 역가 및 높은 패키징 효율을 유발할 수 있다는 것을 입증한다.
실시예 3: AAV 에피솜으로부터 발현된 작은 부류 2, 유형 V CRISPR 단백질을 이용한 게놈의 생체내 편집
작은 부류 2, 유형 V CRISPR 단백질, 예컨대 CasX가 생체내에서 AAV 에피솜으로부터 발현될 경우에 게놈을 편집할 수 있다는 것을 입증하기 위해 실험을 수행하였다.
재료 및 방법:
본 실험을 위해, 실시예 1에 기재된 바와 같이, AAV 생성, 정제, 및 특성화를 위한 방법을 사용하여 AAV 벡터를 생성하였다.
생체내 AAV 투여 및 조직 가공:
Ai9 마우스로부터의 P0-P1 새끼에게 CasX 변이체 491 및 스페이서 12.7을 갖는 가이드 변이체 174를 인코딩하는 이식유전자를 갖는 AAV를 주사하였다. 약술하면, 마우스를 동결-마취시키고(cryo-anesthetized) 33-게이지 바늘(작은 허브 RN NDL - 맞춤형 길이 0.5 인치, 포인트 4(45 도))이 장착된 Hamilton 주사기(10 μL, 모델 1701 RN SYR 카탈로그 번호 7653-01)를 사용하여 1 내지 2 μL의 AAV 벡터(약 1e11 바이러스 게놈(vg))를 뇌실내(ICV) 공간 내로 편측 주사하였다. 주사-후, 새끼를 가온 패드 상에서 회복시킨 후에 이들의 케이지로 복귀시켰다. ICV 주사 후 1 개월에, 케타민/자일라진의 복강내 주사로 동물을 종말 마취시키고(terminally anesthetized), 식염수 및 정착액(4% 파라포름알데히드)으로 경심 관류하였다. 뇌를 절개하고, 4% PFA 중에 추가로 후-고정하고, 30% 수크로스 용액을 이용한 침윤, 및 OCT 화합물 중의 포매가 이어졌다. OCT-포매된 뇌를 동결절편기를 사용하여 관상 절편화하였다. 이어서 절편을 슬라이드 상에 마운팅하고, DAPI로 대조-염색하여 세포 핵을 표지하고, 커버슬립을 덮고 형광 현미경 상에서 영상화하였다. ImageJ 소프트웨어를 사용하여 영상을 가공하고 DAPI-표지된 핵의 백분율로서 tdTom+ 세포의 수를 계수함으로써 편집 수준을 정량화하였다.
말초 조직, 특히 간 및 심장에서 편집을 평가하기 위한 후속 실험에서, Ai9 마우스로부터의 P0-P1 새끼를 동결-마취시키고 40 μL 부피 내의 약 1e12 바이러스 게놈(vg)의 동일한 AAV 작제물을 정맥내 주사하였다. 주사-후, 새끼를 가온 패드 상에서 회복시킨 후에 이들의 케이지로 복귀시켰다. 투여-후 1 개월에, 동물을 종말 마취시키고, 심장 및 간 조직을 부검하고, 상기 기재된 바와 같이 가공하였다.
결과:
도 6은, CasX 변이체 491 및 스페이서 12.7을 갖는 가이드 174를 패키징하는 AAV의 ICV 주사에 대해, CasX 변이체 491 및 스페이서 12.7을 갖는 가이드 스캐폴드 174를 패키징하는 AAV의 ICV 주사를 받고 4′,6-다이아미디노-2-페닐인돌로 염색된 Ai9 마우스로부터 가공된 뇌 조직의 비교 면역조직화학(IHC) 영상(상단)을 제공한다. tdTom 채널에서 세포로부터의 신호는 이들 세포 내의 tdTom 유전자좌가 성공적으로 편집되었음을 표시한다. tdTom+ 세포(백색으로 나타남)는 뇌의 모든 영역에 걸쳐 고르게 분포되며, 이는 비-표적화 대조군(하단 패널)에 비교하여 ICV-투여된 인코딩된 CasX, 가이드, 및 스페이서를 패키징하는 AAV가 이들 세포에 도달하고 편집할 수 있음을 표시한다(상단 패널). 도 6 영상은 각각의 군에 대해 3마리의 마우스로부터 얻어진 것들을 대표한다. 부가적으로, 도 59a(간) 및 도 59b(심장)에 제공된 결과는 AAV가 간 및 심장 내에 분포되고(편집된 세포는 백색으로 나타남) 생체내에서 단일 AAV 에피솜으로부터 발현될 경우에 게놈을 편집할 수 있었음을 입증한다.
결과는 작은 CRISPR 단백질(예컨대 CasX) 및 표적화 가이드를 인코딩하는 AAV가, 국소적으로(뇌) 또는 전신적으로 전달될 경우에, 조직 내에 분포되고, 생체내에서 단일 AAV 에피솜으로부터 발현될 경우에 게놈을 편집할 수 있음을 입증한다.
실시예 4: AAV 벡터 단백질 프로모터 선택에 의해 작은 CRISPR 단백질 효력이 향상된다
작은 CRISPR 단백질 발현, 예컨대 CasX가, 인코딩된 단백질에 대해 AAV 작제물 내의 상이한 프로모터를 이용함으로써 향상될 수 있음을 입증하기 위해 실험을 수행하였다. AAV 이식유전자 내의 적재 공간은 CasX와 조합된 짧은 프로모터의 사용에 의해 최대화될 수 있다. 부가적으로, 다른 방법으로는 AAV 벡터 내에 효율적으로 패키징되기에 너무 긴 프로모터의 사용에 의해, 이들이 더 큰 CRISPR 단백질, 예컨대 Cas9와 조합되는 경우에, 발현이 향상될 수 있음을 입증하기 위해 실험을 수행하였다. 작은 CRISPR 단백질을 향상시키기 위한 긴, 세포-유형-특이적 프로모터의 사용은 본 명세서에 기재된 AAV 시스템에 대한 이점이며, 다른 CRISPR 단백질의 크기로 인해 전통적인 CRISPR 시스템에서는 가능하지 않다.
재료 및 방법:
클로닝 및 QC는 실시예 1에 기재된 바와 같이 수행되었다. 프로모터 변이체는 AAV-시스 플라스미드에서 CasX 단백질의 상류에 클로닝되었다. CasX(표 21) 및 하나 이상의 gRNA(표 18 및 표 19)를 인코딩하는 서열을 제외하고는, AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다.
[표 8]
플라스미드 뉴클레오펙션을 위한 방법:
실시예 1에 기재된 바와 같이 불멸화 신경 전구 세포를 뉴클레오펙션시켰다. 서열-검증된 플라스미드를 200 ng/μl, 100 ng/μl, 50 ng/μL, 및 25 ng/μL의 농도로 희석하고, 각각의 5 μL(1000 ng, 500 ng, 250 ng, 및 125 ng)를 200,000개의 티디토마토 mNPC를 함유하는 P3 용액에 첨가하였다.
AAV 바이러스 생성 및 QC, 및 FACS에 의한 mNPTC-tdT 세포에서의 AAV 형질도입 및 편집 수준 평가를 실시예 1에 기재된 바와 같이 수행하였다.
결과:
도 7의 결과는, CasX 단백질 438, 스캐폴드 변이체 174, 및 티디토마토 정지 카세트를 표적화하는 스페이서(서열 CTGCATTCTAGTTGTGGTTT(서열 번호 40800)를 갖는, 스페이서 12.7)와 함께 몇몇 상이한 프로모터는, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 1000 ng의 용량에서 mNPC 내의 표적 정지 카세트를 편집한다는 것을 입증한다. 이들 프로모터는 길이가 700개 뉴클레오티드 초과로부터 81개 뉴클레오티드만큼 짧은 것의 범위였다(표 8). 시험된 프로모터 중에서, 작제물 7 및 14는 상당한 편집 효력을 나타냈다.
도 8의 결과는, CasX 변이체 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 조합된 몇몇 짧은 프로모터는, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 500 ng의 용량에서 mNPC 내의 표적 정지 카세트를 편집한다는 것을 입증한다. 584개 뉴클레오티드의 프로모터를 가진 작제물 2 이외에, 모든 작제물은 길이가 250개 미만의 뉴클레오티드인 프로모터를 가졌다. 시험된 단백질 프로모터 중에서, 작제물 15는, 특히 그의 짧은 길이(81개의 뉴클레오티드)를 고려하여, 상당한 편집 효력을 나타냈다.
도 9의 결과는, CasX 변이체 491, 및 스페이서 12.7을 갖는 스캐폴드 변이체 174와 함께 4개의 선도 프로모터는, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 125 ng 및 62.5 ng의 용량에서 mNPC 내의 표적 정지 카세트를 편집한다는 것을 입증한다. 작제물 4, 5, 및 6은 400개 뉴클레오티드 이하의 프로모터 길이를 가지며, 따라서 AAV 적재 용량을 최소화하면서 편집 효력을 최대화할 수 있다.
도 10의 결과는 AAV 내의 4개의 프로모터 변이체의 사용이 또한 강건한 편집을 유발한다는 것을 입증한다. 약술하면, AAV(AAV.3, AAV.4, AAV.5, 및 AAV.6)는 각각 이식유전자 작제물 3 내지 6으로 생성되었다. 각각의 작제물은 표적 유전자좌에서 용량-의존적 편집을 나타냈다(도 10, 좌측 패널). 2e5의 MOI에서, AAV.4는 표적 유전자좌에서 38% ± 3%로 편집을 나타냈으며, 이는 다른 작제물을 능가한다(도 10, 우측 패널).
도 11에 도시된 실험에서는, 몇몇 새로운 단백질 프로모터를 이전에 확인된 상위 4개의 단백질 프로모터 변이체(AAV.3, AAV.4, AAV.5, 및 AAV.6)에 대해 비교하였다. 약술하면, 상응하는 이식유전자 작제물로 AAV를 생성하고 티디토마토 mNPC에 형질도입하였다. 형질도입 후 5 일에 3e5의 MOI에서, 다수의 프로모터가 개선된 편집을 나타냈다(도 11). 특히, 작제물 58 및 59는 이식유전자 크기를 최소화하면서 30% 초과의 편집 활성을 가졌다(도 12). 작제물 58 및 59는 작제물 3보다 각각 420 및 258 bp 더 작은 프로모터를 함유했지만, 유사하거나 개선된 표적 유전자좌의 편집을 유발했다. 특히, 작제물 59의 프로모터 내의 인트론의 포함은 인트론이 결여된 작제물 58에 비교하여 증가된 편집으로 이어졌으며, 이는 AAV 작제물 프로모터 내의 인트론의 포함이 유익하다는 것을 제시한다.
결과는, AAV 게놈의 크기 제약으로 인해 다른 방법으로는 전통적인 CRISPR 단백질과 함께 사용할 수 없을 긴 프로모터를 이용함으로써 작은 CRISPR 단백질(예컨대 CasX)의 발현이 향상될 수 있다는 것을 입증한다. 추가로, 짧은 프로모터를 작은 CRISPR 단백질(예컨대 CasX)과 조합하는 것은 발현 효율을 훼손하지 않으면서 AAV 이식유전자 적재 용량의 유의한 감소를 가능하게 한다. 이러한 공간의 보존은 이식유전자 내의 부가적인 액세서리 요소, 예컨대 인핸서 및 조절 요소의 포함을 가능하게 하며, 이는 증가된 편집 잠재력을 가능하게 할 것이다.
실시예 5: AAV 벡터 RNA 프로모터 선택에 의해 작은 CRISPR 시스템 효력이 향상된다
AAV 벡터에서 편집을 위해 표적 DNA를 인식하는 가이드 RNA의 발현에 대해 소정의 프로모터가 선택되는 경우에 작은 CRISPR 시스템(예컨대 CasX)의 편집 효력이 향상될 수 있다는 것을 입증하기 위해 실험을 수행하였다. 상이한 강도를 갖는 RNA 프로모터를 사용함으로써, 가이드 RNA 발현을 조절할 수 있으며, 이는 편집 효력에 영향을 미친다. CasX 시스템에 기초하는 AAV 플랫폼은 2개의 가이드 RNA의 발현을 위한 2개 이상의 독립적인 프로모터를 포함하기에 충분한 AAV 내의 적재 공간을 제공한다. 상이한 발현 수준을 갖는 프로모터를 조합함으로써, 단일 AAV 이식유전자 내에서 다중 가이드 RNA의 발현을 조정할 수 있다. 유지된 편집 효력을 유발하는 더 짧은 버전의 RNA 프로모터를 조작하는 것은 또한 AAV 이식유전자 내의 다른 액세서리 요소의 첨가를 위한 증가된 조작 공간을 가능하게 한다.
재료 및 방법:
작제물의 클로닝 및 품질 관리뿐만 아니라, 플라스미드 뉴클레오펙션 및 AAV 생성, 형질도입, 및 FACS 분석을 위해 실시예 1의 방법을 사용하였다. Pol III 프로모터의 서열은 표 9에 제공된다. CasX(표 21) 및 하나 이상의 gRNA(표 18 및 표 19)를 인코딩하는 서열을 제외하고는, AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다.
[표 9]
결과:
도 13에 도시된 결과는, 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 3개의 별개의 RNA 프로모터는, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 250 ng 및 125 ng의 용량에서 mNPC 내의 표적 정지 카세트를 편집한다는 것을 입증한다. 작제물 3 및 32는 유사한 활성을 가지며, 표적 유전자좌에서 42% 효율로 편집한다. 작제물 33은 작제물 3 및 32의 활성의 약 56%를 나타낸다.
도 14에 도시된 결과는, 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 동일한 3개의 별개의 프로모터는, AAV로서 전달될 경우, mNPC 내의 표적 정지 카세트를 편집한다는 것을 입증한다. AAV.3, AAV.32, AAV.33은 각각 이식유전자 작제물 3, 32, 및 33으로 생성되었다. 각각의 벡터는 표적 유전자좌에서 용량-의존적 편집을 나타냈다(도 14, 좌측 패널). 3e5의 MOI에서, AAV.32 및 AAV.33은 AAV.3의 효력의 50 내지 60%를 가졌다(도 14, 우측 패널).
도 15의 결과는, 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 U6 프로모터의 4개의 상이한 절단 중 하나를 갖는 작제물은, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 250 ng 및 125 ng의 용량에서 mNPC 내의 표적 정지 카세트를 차별적 수준으로 각각 편집할 수 있었다는 것을 입증한다. 작제물 85는 기준 작제물 53의 효력의 33%를 가진 반면에, 작제물 86, 87, 및 88은 임의의 편집을 나타내지 않았고, 비-표적화 대조군과 유사하였다.
도 16은, AAV로서 전달될 경우, 기준 작제물 53과 작제물 85 사이의 mNPC에서의 편집을 비교하는 실험의 결과를 제공한다. 3e5의 MOI에서 AAV.53에 대한 15%에 비교하여 AAV.85는 7%에서 편집할 수 있었으며, 이는 도 15로부터의 결과와 일치한다.
도 17의 결과는, 인코딩된 CasX 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께, 작제물 53의 기준 U6에 비교하여 프로모터의 크기를 최소화하도록 설계된 조작된 U6 프로모터를 갖는 작제물은, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 250 ng 및 125 ng의 용량에서 mNPC 내의 표적 정지 카세트를 차별적 수준으로 편집할 수 있었다는 것을 입증한다. 작제물 53에 대한 55%에 비교하여, 일 클러스터의 작제물(89, 90, 92, 93, 96, 97, 98, 및 99)은 모두 15 내지 20%의 범위로 편집하였다. 다른 Pol II 변이체(작제물 94, 95, 및 100)는 모두 약 32% 편집으로 더 높은 수준의 편집을 나타낸 반면에, 작제물 101은 48% 편집을 유발하였다. Y-축 상의 편집된 mNPC의 %에 대비하여 조작된 U6 RNA 프로모터를 갖는 시험된 모든 AAV 변이체의 이식유전자 크기를 X-축 상에 도시하는 도 18의 산포도에 나타낸 바와 같이, 이들 프로모터는 모두 기준 작제물 53 내의 Pol III 프로모터보다 더 작았다.
도 19의 결과는, 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 조작된 U6 프로모터를 갖는 작제물은, AAV로서 전달될 경우, mNPC 내의 표적 정지 카세트를 용량-의존적 양상으로 편집할 수 있었다는 것을 나타낸다. 작제물 AAV.94, AAV.95, AAV.100, 및 AAV.101을 갖는 AAV를 이용한 편집의 가변적인 속도가 관찰되었으며, 이들은 모두 도 15 및 도 16으로부터의 AAV.85와 동일한 Pol III 프로모터를 갖는 AAV.89와 기준 작제물 AAV.53 사이의 속도로 편집한다.
도 20의 결과는, CasX 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 조작된 U6 프로모터를 갖는 작제물은, AAV로서 전달될 경우, mNPC 내의 표적 정지 카세트를 편집할 수 있었다는 것을 나타낸다. 작제물 AAV.94, AAV.95, AAV.100, 및 AAV.101을 갖는 AAV를 이용한 편집의 가변적인 속도가 관찰되었으며, 이들은 모두 도 15 및 도 16으로부터의 AAV.85와 동일한 Pol III 프로모터를 갖는 AAV.89와 기준 작제물 AAV.53 사이의 속도로 편집한다. 도 21은 이식유전자 크기에 대비한 편집의 산포도로서의 결과를 나타낸다.
도 64에 도시된 결과는, CasX 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7을 인코딩하는 서열과 함께 합리적으로 조작된 Pol III 프로모터의 작제물은, 250 ng 및 125 ng의 용량으로 AAV 이식유전자 플라스미드로서 마우스 NPC 내로 뉴클레오펙션될 경우에 다양한 효율로 표적 티디토마토 정지 카세트를 편집할 수 있었다는 것을 입증한다. 작제물 159 내지 174는 기준 U6(작제물 번호 157) 또는 H1(작제물 번호 158) 프로모터에 비교하여 프로모터의 크기를 최소화하도록 설계되었고, 작제물 160 내지 174는 7SK 및/또는 U6 프로모터로부터의 도메인 스왑의 변이를 갖는 H1 프로모터(작제물 159)의 코어 영역에 기초하는 짧은 혼성 변이체로서 조작되었다. 도 64는, 기준 U6 및 H1 프로모터보다 실질적으로 더 짧은 이들 프로모터 변이체 중 대부분은, Pol III 프로모터로서 기능하여 티디토마토 유전자좌에서 충분한 gRNA 전사 및 편집을 구동할 수 있었다는 것을 나타낸다. 구체적으로, 작제물 159, 161, 162, 165, 및 167은 250 ng의 더 높은 용량에서 30% 이상의 편집을 달성할 수 있었다. 이들 변이체는 표적화된 편집을 위해 적절한 gRNA 발현을 구동하면서 AAV 적재 용량의 유의한 감소를 허용할 AAV 작제물 설계에서 프로모터 대안으로서의 역할을 한다.
실험의 결과는, 작은 CRISPR 시스템(예컨대 CasX 및 가이드)의 발현은 대안적인 RNA 프로모터를 이용함으로써 선택적인 방식으로 조절될 수 있다는 것을 입증한다. 대부분의 다른 CRISPR 시스템은 가이드 RNA를 발현하기 위한 별도의 프로모터를 포함할 충분한 공간을 갖지 않지만, 본 명세서에 기재된 CRISPR 시스템은 발현 및 편집을 차별적으로 제어하기 위해 이식유전자 내의 다양한 길이의 몇몇 가능한 gRNA 프로모터의 사용을 가능하게 한다. 데이터는 또한 기능적 가이드의 전사를 용이하게 하는 능력을 유지하는 더 짧은 버전의 Pol III 프로모터가 조작될 수 있다는 것을 지지한다. 이러한 품질은 부가적인 조작 또는 부가적인 프로모터 및/또는 액세서리 요소의 포함을 위해 이식유전자 공간을 절약하기 위한 본 명세서에 기재된 AAV 시스템의 중요한 특징이다. 추가로, 본 발명자들의 시스템에서 다른 요소를 조정하는 것은, 다양한 효력을 갖는 것들을 포함하는 다중 gRNA 프로모터의 조합을 가능하게 한다.
실시예 6: AAV 벡터 내의 폴리(A)의 선택에 의해 작은 CRISPR 단백질 효력이 향상된다
다양한 폴리아데닐화(폴리(A)) 신호를 이용하여 AAV 게놈 내에서 작은 CRISPR 단백질(예컨대 CasX)이 발현될 수 있다는 것을 입증하기 위해 실험을 수행하였다. 구체적으로, 더 작은 CRISPR 시스템은 더 큰 폴리(A) 신호의 포함을 가능하게 한다. 또한, 작제물 내의 더 짧은 합성 폴리(A) 신호의 포함은 AAV 이식유전자 적재 용량의 추가의 감소를 가능하게 한다는 것을 입증하기 위해 실험을 수행하였다.
재료 및 방법:
클로닝 및 QC:
모듈 클로닝을 가능하게 하기 위해 AAV 게놈 내의 폴리(A) 신호는 제한 효소 부위에 의해 분리되었다. 부분들은 유전자 단편으로서 Twist로부터 주문되고, PCR 증폭되고, 상응하는 제한 효소로 분해되고, 정제되고, 이어서 동일한 효소로 또한 분해된 벡터 내로 라이게이션되었다.
작제물의 클로닝 및 품질 관리뿐만 아니라, 플라스미드 뉴클레오펙션 및 FACS 분석을 위해 실시예 1의 방법을 사용하였다. 폴리(A) 서열의 서열은 표 10에 제공된다. CasX(표 21) 및 하나 이상의 gRNA(표 18 및 표 19)를 인코딩하는 서열을 제외하고는, AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다.
[표 10]
플라스미드 뉴클레오펙션 및 FACS에 의한 활성 평가를 위한 방법은 실시예 1에 기재된 바와 같이 수행되었다.
결과:
도 22에 도시된 결과는, CasX 변이체 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 몇몇 대안적인 폴리(A) 신호를 갖는 작제물은, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, 250 ng 및 125 ng의 용량에서 mNPC 내의 표적 정지 카세트를 편집할 수 있었다는 것을 입증한다. 작제물 3은 본 실험에서 시험된 3개의 작제물 중에서 최고의 효력을 나타냈으며, 60% 효율(250 ng 용량)로 표적 유전자좌를 편집하였다. 각각 작제물 3의 폴리(A) 서열의 크기의 59% 및 39%인 폴리(A) 서열을 갖는 작제물 28 및 29는(표 11 참조), 각각 21% 및 24%로 편집하였다(250 ng 용량).
[표 11]
도 23에 도시된 결과는, 단백질 491, 스캐폴드 변이체 174, 및 스페이서 12.7과 함께 2개의 상이한 폴리(A) 신호는, AAV 벡터로서 전달될 경우, mNPC 내의 표적 정지 카세트를 편집할 수 있었다는 것을 입증한다. AAV.34 및 AAV.37은 각각 이식유전자 작제물 34(186개 뉴클레오티드의 폴리(A) 및 4565개 뉴클레오티드의 총 이식유전자 길이를 가짐) 및 37(208개 뉴클레오티드의 폴리(A) 및 4619개 뉴클레오티드의 총 이식유전자 길이를 가짐)로 생성되었다. 각각의 벡터는 표적 유전자좌에서 용량-의존적 편집을 나타냈으며, 더 짧은 폴리(A) 신호를 함유하는 AAV.34는 둘 모두의 용량에 대해 AAV.37의 편집 효력의 대략 75%를 가졌다.
실험 조건 하에, 결과는 작은 CRISPR 단백질(예컨대 CasX)의 발현이 다양한 길이의 폴리(A) 신호에 의해 조절될 수 있다는 것을 입증한다. 향상된 CasX 활성을 위해서는 더 긴 폴리(A) 서열이 AAV 작제물에 이용될 수 있는 반면에, AAV 이식유전자 내의 부가적인 액세서리 요소의 포함에 이용가능한 더 많은 서열 공간을 만들기 위해서는 더 짧은 폴리(A) 서열이 AAV 작제물에 이용될 수 있다.
실시예 7: AAV 벡터 내의 조절 요소의 위치에 의해 작은 CRISPR 단백질 효력이 조절된다
조절 요소, 예컨대 gRNA 프로모터 및 가이드 스캐폴드 복합체의 배향(정방향 또는 역방향) 및 위치(CRISPR 유전자의 상류 또는 하류)는 작은 CRISPR 단백질의 기저 발현 및 AAV 벡터 내의 CRISPR 시스템의 전반적인 편집 효율을 조절할 수 있다. 이들 실험의 목표는 작은 CRISPR 단백질 및 가이드 RNA의 효력을 향상시키기 위한 AAV 게놈 내의 조절 요소의 최상의 배향 및 위치를 평가하는 것이었다.
재료 및 방법:
AAV 벡터 생성 및 QC, 뉴클레오펙션, FACS에 의한 mNPTC-tdT 세포에서의 AAV 바이러스 생성 및 편집 수준 평가를 실시예 1에 기재된 바와 같이 수행하였다.
결과:
작제물 44(도 24, 상단으로부터 2번째에 나타낸 구성)는 가이드 스캐폴드 174 및 스페이서 12.7의 발현을 구동하는 Pol III 프로모터를 작제물 3(도 15의 상단 구성)의 역방향 배향으로 함유한다. 도 25는, 작제물 44가, AAV 이식유전자 플라스미드의 뉴클레오펙션에 의해 전달될 경우, mNPC 내의 표적 정지 카세트를 작제물 3과 유사하게 용량-의존적 방식으로 변형시킨다는 것을 입증한다.
도 26은, AAV 벡터로서 전달된 작제물 44가 mNPC 내의 표적 정지 카세트를 편집한다는 것을 나타내며, 이는 본 작제물의 유용성을 추가로 지지한다. AAV.3 및 AAV.44는 각각 이식유전자 작제물 3 및 44로 생성되었다. 각각의 벡터는 표적 유전자좌에서 용량-의존적 편집을 나타냈다(도 26, 좌측 패널, 여기서 벡터는 3-배 희석을 사용하여 검정함). 도 26, 우측 패널은 3 x 105의 MOI에서의 편집 결과를 나타내며, 여기서 AAV.44는 벡터 AAV.3의 원래의 구성의 편집 효력의 60%를 가졌다.
본 실험은, AAV 게놈 내의 부분들의 배향이 변동될 수 있지만, CRISPR 단백질 및 가이드 RNA의 충분한 발현을 유발한다는 것을 입증한다. 이는 인코딩된 단백질 또는 RNA 구성성분에 대한 조절 요소의 특이적 배향 또는 위치는 하나 또는 다중의 가이드를 함유하는 CasX-패키징 AAV 작제물에서 발현의 제어된 조절을 가능하게 할 수 있다는 것을 나타낸다.
실시예 8: AAV 벡터 내의 부가적인 조절 요소의 포함에 의해 작은 CRISPR 단백질 효력이 향상되며, 이는 더 큰 단백질에 의해서는 가능하지 않다.
이들 실험의 목적은, 작은 CRISPR 단백질(예컨대 CasX)을 전달하는 AAV 벡터에 의해 매개되는 전사 수준은 대형 이식유전자(예를 들어, spCas9) 플라스미드를 발현하는 AAV 벡터에 관용적으로 적합되지 않는 상이한 조절 요소(인트론 서열, 인핸서 등)의 포함에 의해 향상될 수 있다는 것을 입증하기 위한 것이었다.
재료 및 방법:
클로닝 및 QC: 예비-분해된 AAV 골격, 작은 CRISPR 단백질-인코딩 DNA, 및 플랭킹 5' 및 3' DNA 서열로 이루어진 4-부분 골든 게이트 조립체를 사용하여 실시예 1에 기재된 바와 같이 AAV-시스 플라스미드를 생성하였다. 5' 서열은 인핸서, 단백질 프로모터, 및 N-말단 NLS를 함유하는 반면에, 3' 서열은 C-말단 NLS, WPRE, 폴리(A) 신호, RNA 프로모터, 및 스페이서 12.7을 함유하는 가이드 RNA를 함유한다. 5' 및 3' 부분은 Twist로부터 유전자 단편으로서 주문되고, PCR-증폭되고, AAV 벡터로 조립되었다. 클로닝 및 플라스미드 QC, 뉴클레오펙션, 및 FACS 방법은 실시예 1에 기재된 바와 같이 수행되었다.
CasX의 발현을 구동하는 상이한 프로모터의 조합에서, AAV 시스 플라스미드 3 내의 번역-후 조절 요소(PTRE) 1, 2, 3의 포함에 의한 편집의 향상을 시험하였다. 제1 세트의 프로모터를 시험하였으며; 이식유전자 플라스미드 4, 35, 36 37, 이식유전자 플라스미드 5, 38, 39, 40, 및 이식유전자 플라스미드 6, 42, 43은 각각 CMV, UbC, EFS, CMV-s 프로모터에 의해 구동되는 CasX 단백질 발현을 갖는다. 시험된 제2 세트의 작제물은 단백질과 폴리(A) 서열 사이에 PTRE를 포함하였으며, CasX의 발현을 구동하는 UbC 프로모터(각각 이식유전자 58, 72, 73, 74; 이식유전자 59, 75, 76, 77, 및 이식유전자 53, 80, 및 81)에 비교하여 프로모터 Jet, JetUsp로 생성되었다. PTRE의 서열은 표 12에 열거되고, 인핸서에 더하여 프로모터 서열은 표 13에 열거된다. CasX(표 21) 및 하나 이상의 gRNA(표 18 및 표 19)를 인코딩하는 서열을 제외하고는, AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다.
[표 12]
[표 13]
결과:
3개의 인핸서 서열(PTRE1, PTRE2, 및 PTR3)을 AAV-시스 플라스미드(작제물 3) 내로 클로닝하고 더 짧은 단백질 프로모터를 함유하는 플라스미드(작제물 4, 5, 6, 53, 57, 및 58은 각각 400, 234, 335, 400, 164, 및 326 bp의 프로모터 서열을 함유함)를 작제함으로써 이식유전자 발현에 대한 PTRE의 효과를 평가하였다.
mNPC-tdt 세포에서 뉴클레오펙션에 의해 AAV-시스 플라스미드 활성을 먼저 확인하였다. 각각의 벡터에 대해, PTRE의 첨가는 다양한 수준에서 편집 활성을 향상시켰다(도 27). 표 14는 프로모터 및 PTRE의 길이를 제공한다. 이식유전자 카세트에 대한 PTRE2의 첨가는 최고의 CasX 편집 활성 향상을 나타냈으며, 작제물 36의 경우에 작제물 4에 비교하여 편집 수준이 2-배 증가하였고(58.5% 대 25%), 작제물 39의 경우에 작제물 5에 비교하여 1.5-배 증가하였고(35.4% 대 22.9%), 작제물 42의 경우에 작제물 6에 비교하여 3-배 증가하였다(30.5% 대 12%). 가장 짧은 인핸서 서열인 PTRE3도 다른 벡터에 비교하여 작제물 37 및 43 중에서 다양한 수준으로 단백질 활성을 증가시켰다.
편집 수준의 개선은 작제물이 AAV 내로 패키징되었을 경우에도 관찰되었다. 이식유전자 내의 PTRE2의 포함은 유사한 방식으로 AAV 벡터들에 걸쳐 편집을 증가시켰다. AAV 감염에 의해 mNPC에서 관찰되는 표적-내 편집의 경향은 일반적으로 AAV 플라스미드 뉴클레오펙션 데이터 세트에 관련되었다(도 28).
이들 인핸서 서열의 포함을 갖는 다른 세트의 프로모터를 시험함으로써 경향을 확인하였다. 시험된 모든 AAV 벡터에 걸쳐, 게놈 내에 PTRE1 및 PTRE2를 포함하는 작제물은 기준 벡터에 비교하여 평균 1.5-배 증가를 산출하였다(도 29). 짧은 프로모터와 이들 전사-후 서열의 고유 조합은 더 짧은 프로모터를 이용한 증가된 편집 수준을 갖는 벡터(예를 들어, AAV.74)의 확인으로 이어졌으며, 이는 AAV의 담지 용량 제한 하에 있는 AAV 제조, 및 더 많은 조절 요소 및 CRISPR 요소(예를 들어, 가이드)의 포함을 가능하게 하는 것 둘 모두를 위한 이점을 나타낸다(도 30).
결과는 또한 이식유전자 플라스미드 내의 PTRE1의 포함은 평가된 모든 프로모터에 걸쳐 더 적은 변동성으로 편집 수준을 개선한 반면에(도 31), PTRE2는 시험된 프로모터에 걸쳐 최고의 이식유전자 개선을 산출했지만 더 많은 변동성을 가졌음을 입증한다.
단일 구성성 프로모터의 상류에 조직-특이적 뉴런 인핸서를 갖는 몇몇 작제물을 시험하였다. 본 검정에서는, 코어 CMV 프로모터를 보유하는 단일 AAV-시스 플라스미드(64) 내로 7개의 뉴런 인핸서 서열(작제물 65 내지 72)을 클로닝하였으며, 모두 뉴클레오펙션을 통해 기준 작제물 64에 비해 개선된 편집을 입증하였다(도 32). 이들 작제물은 또한 UbC 프로모터를 함유하는 작제물 53을 능가하였으나 전체 CMV 프로모터(CMV 인핸서 + CMV 코어 프로모터)를 보유하는 작제물 3은 능가하지 않았다.
[표 14]
결과는 AAV 이식유전자 작제물 내의 작은 프로모터의 사용이 부가적인 액세서리 요소의 포함을 허용한다는 것을 입증한다. 이들 부가적인 액세서리 요소, 예컨대 짧지만 강력한 프로모터 서열의 제어 하에 CasX를 발현하는 AAV-이식유전자에 대한 전사-후 조절 요소는 모든 구성성분이 단일 AAV 벡터 내로 혼입될 수 있도록 적재 크기를 감소시키면서 증가된 CasX 발현 및 표적-내 편집을 가능하게 한다.
실시예 9: AAV 벡터 내에 부가적인 조절 요소를 포함하고 조합함으로써 작은 CRISPR 단백질 효력이 향상된다
이들 실험의 목표는 하나 초과의 가이드 RNA를 포함할 수 있는 일체형 단일 AAV 벡터에서 CRISPR 단백질 및 gRNA 복합체-매개 편집이 향상될 수 있다는 것을 입증하는 것이었다. 추가로, 다수의 조절 요소의 포함 및 조합은 효력을 향상시킬 수 있고 더 많은 조절 서열을 갖는 더 큰 AAV 게놈은 더 큰 편집 활성을 산출한다는 것을 입증하기 위해 실험을 수행하였다. AAV 이식유전자 내에 CasX 시스템과 함께 포함하는 것이 가능한 액세서리 및 조절 서열의 길이는, 더 큰 Cas 단백질, 예컨대 Cas9의 길이에 의해 제한되는 전통적으로 사용되는 CRISPR 단백질로 가능한 것을 초과한다.
재료 및 방법:
플라스미드 클로닝, QC, 및 뉴클레오펙션은 실시예 1에 기재된 바와 같이 수행되었다.
2개의 가이드 RNA 스택을 폴리(A)의 3' 단부 상에 테일 투 테일(tail to tail) 배향으로(플라스미드 번호 45 내지 49), 또는 CasX 단백질/프로모터와 여전히 동일한 전사 배향으로, 단백질의 각각의 측면 상에 하나씩(플라스미드 번호=50 내지 52) 클로닝함으로써, "가이드 RNA 스택"(각각의 스택은 U6 프로모터에 의해 구동되는 sgRNA 스캐폴드-스페이서 174.12.7, 1.74.12.2, 또는 174.NT로 구성됨)으로 지칭되는 다중 RNA 전사 단위 블록의 배향(도 35)을 조사하였다. 단백질 프로모터 및 Pol III 프로모터에 대한 오각형 형상의 박스는 전사의 배향을 도시한다(테이퍼링된 지점; 5'에서 3'으로, 또는 3'에서 5'으로의 배향). 스페이서 서열은 12.2(TATAGCATACATTATACGAA 서열 번호 40807)); 12.7(CTGCATTCTAGTTGTGGTTT(서열 번호 40800)); 및 NT(GGGTCTTCGAGAAGACCC(서열 번호 40505))이다. AAV 벡터 생성 및 역가결정은 실시예 1에 기재된 바와 같이 수행되었다. AAV 형질도입 및 FACs 분류를 통한 편집 평가는 실시예 1에 기재된 바와 같이 수행되었다.
결과:
도 33은 가이드 RNA 구성성분이 다양한 작제물(아키텍처 1 및 아키텍처 2) 내에 조합된 방법을 나타내는, 작제물의 아키텍처의 개략도이다. 도 34는 부가적인 구성을 나타낸다. 도 36에 도시된 편집 검정의 결과는, AAV 이식유전자 플라스미드로서 아키텍처 1로 mNPC에 전달된 작제물은 향상된 효력으로 편집한다는 것을 입증한다. 하나의 표적화 스페이서 및 하나의 비-표적화 스페이서를 갖는 아키텍처(작제물 45 및 46)는 대략 18% 더 낮은 편집 수준을 산출했지만, 스페이서와 비-표적화 스페이서의 상이한 조합은 각각의 개별 가이드 RNA가 활성임을 입증한다. 표적화 스페이서의 소정의 조합은 증가된 효능을 산출했다. CTGCATTCTAGTTGTGGTTT(서열 번호 40800)의 서열을 갖는 스페이서 12.7은, TATAGCATACATTATACGAA(서열 번호 40807)의 서열을 갖는 스페이서 12.2(작제물 48)와 조합되어, 가이드 RNA 아키텍처 1에서 유의한 효력으로 편집한 반면에, 2개의 세트의 12.7(작제물 47)은 작제물 3의 단일 가이드 아키텍처보다 10% 더 큰 효력으로 편집했다. 125 및 62.5 ng의 각각의 CasX 작제물이 mNPC 내에 뉴클레오펙션되었으며, 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 37의 결과는 AAV 이식유전자 플라스미드로서 mNPC에 전달된 가이드 RNA 스택 아키텍처 2(도 33 참조)가 또한 표적 핵산을 편집한다는 것을 나타낸다. 125 및 62.5 ng의 각각의 CasX 작제물이 mNPC 내에 뉴클레오펙션되었으며, 편집은 형질감염-후 5 일에 FACS에 의해 평가되었다. 데이터는 n= 3 반복실험에 대한 평균 ± SEM으로서 제공된다.
도 38의 결과는 AAV로서 가이드 RNA 아키텍처 1로 전달된 작제물 3, 45, 46, 47, 및 48이 mNPC 내의 표적 정지 카세트를 편집한다는 것을 나타낸다. AAV.3, AAV.45, AAV.46, AAV.47, 및 AAV.48은 각각 이식유전자 작제물 3 및 45, 46, 47 및 48로 생성되었다. 각각의 벡터는 표적 유전자좌에서 용량-의존적 편집을 나타냈다(도 38, 좌측 패널). 3e5의 MOI에서, AAV.47은 원래 배향 벡터 AAV.3보다 5% 미만의 더 적은 효력을 가졌다(도 38, 우측 패널).
이들 실험은 하나의 AAV 게놈 내의 전체 Cas 단백질 서열과 조합된 다중 가이드 RNA의 사용의 타당성을 입증하며, 이는 AAV 캡시드의 패키징 제약으로 인해, 더 큰 CRISPR 단백질, 예컨대 Cas9의 사용으로는 이전에 달성할 수 없었다. 추가로, 이들 실험은 또한 일체형 벡터 내의 다중 가이드 RNA가 표적 핵산을 편집하는 능력을 또한 유지한다는 것을 나타낸다.
실시예 10: 핵 위치 서열(NLS) 선택에 의해 작은 CRISPR 단백질 효력이 향상된다.
작제물에 이용된 핵 위치 서열(NLS)의 변경이 AAV 설정에서 편집 결과를 조절할 수 있는지 여부를 결정하기 위해 실험을 수행하였다. CasX 단백질로 편집하기 위한 AAV의 최적화의 더 큰 맥락에서, 이러한 초기 스크린은 정방향으로 이동하는 작제물에 어느 NLS가 사용되어야 하는지를 결정하기 위한 제1 시도로서의 역할을 했다.
재료 및 방법.
클로닝 및 QC: 예비-분해된 AAV 골격, 작은 CRISPR 단백질-인코딩 DNA, 및 플랭킹 5' 및 3' DNA 서열로 이루어진 4-부분 골든 게이트 조립체를 사용하여 AAV 벡터를 클로닝하였다. 5' 서열은 인핸서, 단백질 프로모터, 및 N-말단 NLS를 함유하는 반면에, 3' 서열은 C-말단 NLS, WPRE, 폴리(A) 신호, RNA 프로모터, 및 스페이서 12.7을 함유하는 가이드 RNA를 함유한다. 5' 및 3' 부분은 Twist로부터 유전자 단편으로서 주문되고, PCR-증폭되고, T4 리가제 및 BbsI을 사용하는 주기적 골든 게이트 반응을 통해 AAV 벡터로 조립되었다. NLS 서열은 표 15 및 표 16에 제공된다.
AAV 벡터의 조립 및 QC 및 뉴클레오펙션을 위한 방법은 실시예 1에 기재된 바와 같이 수행되었다. CasX(표 21) 및 하나 이상의 gRNA(표 18 및 표 19)를 인코딩하는 서열을 제외하고는, AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다.
[표 15]
[표 16]
FACS에 의한 mNPTC-tdT 세포에서의 AAV 형질도입 및 편집 수준 평가를 실시예 1에 기재된 바와 같이 수행하였다.
결과:
초기 플라스미드 뉴클레오펙션은 대조군(N- 및 C-말단 둘 모두 상의 1xSV40 NLS)에 비교할 경우에 다수의 NLS 순열이 개선된 편집을 나타냈다는 것을 규명하였다. 특히, Cmyc 또는 뉴클레오플라스민 NLS를 함유하는 N-말단 변이체는 SV40 NLS 조합을 유의하게 능가하였다(도 39). N-말단 NLS 변이의 이러한 경향은 AAV 형질도입에서 복제되었으며, 여기서 Cmyc 및 뉴클레오플라스민 NLS 변이체는 다시 SV40 NLS 변이체를 능가하였다(도 40). 최종적으로, Cmyc를 일정하게 유지하는 변이(도 41)를 시험하였으며, 결과는 최상의 작제물이 N- 및 C-말단 둘 모두 상에 Cmyc NLS를 함유했음을 입증한다.
데이터는 NLS의 아미노산 서열을 선택하는 것이 AAV 설정에서 편집 결과를 향상시킬 수 있다는 것을 제시한다. 구체적으로, N-말단 Cmyc-함유 NLS 변이체는 N-말단 SV40 NLS 변이체에 비교하여 명확한 개선을 나타냈다. 또한, C-말단 Cmyc 및 Nuc 변이체는 SV40 NLS 변이체에 비해 편집을 개선한다. N- 및 C-말단 둘 모두 상에서 SV40 NLS의 반복은 편집 효율에 유해한 것으로 보인다.
실시예 11: 5' UTR 내의 인트론의 첨가에 의해 작은 CRISPR 단백질 발현이 향상된다.
본 실험의 목표는, 작은 CRISPR 단백질(예컨대 CasX)을 전달하는 AAV 벡터에 의해 매개되는 전사 수준은 대형 이식유전자(예를 들어, spCas9) 플라스미드를 발현하는 AAV 벡터에 관용적으로 적합되지 않는 상이한 조절 요소, 예컨대 바이러스, 마우스, 또는 인간 게놈으로부터 얻어진 인트론 서열의 포함에 의해 향상될 수 있다는 것을 입증하기 위한 것이다.
방법:
예비-분해된 AAV 골격, 작은 CRISPR 단백질-인코딩 DNA, 및 플랭킹 5' 및 3' DNA 서열로 이루어진 4-부분 골든 게이트 조립체를 사용하여 AAV-시스 플라스미드를 생성할 것이다. 5' 서열은 UbC, JeT, CMV, CAG, CBH, hSyn, 또는 다른 Pol2 프로모터, 인트론 영역, 및 N-말단 NLS를 포함하는 단백질 프로모터를 함유할 것인 반면에, 3' 서열은 C-말단 NLS, 폴리 A 신호, RNA 프로모터, 및 스페이서 12.7을 함유하는 가이드 RNA를 함유할 것이다. 5' 및 3' 부분들은 실시예 1에 기재된 바와 같이 PCR-증폭되고 조립될 것이다. 클로닝 및 플라스미드 QC, FACS에 의한 mNPTC-tdT 세포에서의 AAV 바이러스 생성 및 편집 수준 평가를 실시예 1에 기재된 바와 같이 수행할 것이다. 작제물 내로 혼입될 인트론 서열의 비-제한적 예는 표 17에 열거되어 있다.
인트론을 함유하지 않는 기준 작제물이었던 이식유전자 플라스미드 58에 대해 인트론 36의 포함(이식유전자 플라스미드 59)에 의한 편집의 향상이 시험될 것이다. 나머지의 인트론들은 CasX에 대한 미래의 작제물 코딩에 사용될 수 있고 바이러스, 마우스, 및 인간 기원으로부터 유래된 예측성(prophetic) 인트론 서열이다.
[표 17]
결과:
50개의 상이한 인트론을 AAV-시스 플라스미드 내로 클로닝한 후에 티디토마토 검정에서 편집에 대해 검정함으로써 이식유전자 발현에 대한 인트론의 효과를 평가하고자 한다.
인트론이 없는 기준 작제물에 비교할 경우, 인트론 서열의 첨가는 일반적으로 AAV 이식유전자의 전반적인 편집 효율을 증가시킨다.
결과는, 짧지만 강력한 프로모터 서열의 제어 하에 CasX를 발현하는 AAV-이식유전자에 대한 인트론의 첨가는 적재 크기를 감소시키면서 증가된 CasX 발현 및 표적-내 편집을 가능하게 하여, AAV 시스템을 추가로 최적화할 것임을 지지할 것으로 예상된다.
실시예 12: 개선된 가이드 변이체는 시험관내에서 향상된 표적-내 활성을 입증한다
치료-관련 마우스 및 인간 Rho 엑손 1을 포함하는, 상이한 게놈 표적에서 증가된 활성을 갖는 조작된 가이드 RNA 변이체를 확인하기 위해 실험을 수행하였다. 이전의 검정은 편집 효율뿐만 아니라 특이성을 유의하게 증가시키는 잠재력을 보유하는 스캐폴드 서열 내의 다수의 상이한 "핫스팟" 영역(예를 들어, 스템 루프)을 확인하였다. 부가적으로, 표적-외 또는 비-특이적 편집을 촉발하지 않으면서, 다중의 상이한 PAM-스페이서 조합에 걸쳐 AAV 벡터 내의 본 발명자들의 CRISPR 시스템의 전반적인 활성을 증가시킬 스캐폴드 변이체를 확인하기 위해 스크린을 수행하였다. 현재의 벤치마크 벡터에 비교하여 증가된 편집 효율을 달성하는 것은 생체내 연구에서 사용될 감소된 바이러스 벡터 용량을 가능하게 할 것이며, 이는 AAV-매개 CasX-가이드 시스템의 안전성을 개선한다.
방법:
플라스미드 및 바이러스 벡터 검증을 위해 새로운 gRNA 스캐폴드 및 스페이서 변이체를 AAV 이식유전자 작제물 내로 삽입하였다(표 18 및 표 19의 인코딩 서열). 본 실험에서 평가된 모든 작제물에 CasX 491 변이체 단백질이 사용되었지만, 본 개시내용은 표 3의 것들 및 표 21의 인코딩 서열을 포함하는, CasX 변이체 중 임의의 것을 이용하는 것을 고려한다. 본 발명자들은 ITR 사이의 AAV 이식유전자를 상이한 부분으로 개념적으로 나누었으며, 이는 본 발명자들의 치료제 적재물 및 포유류 세포 내의 발현에 관련된 액세서리 요소 및 본 발명자들의 뉴클레아제-가이드 RNA 복합체(단백질 뉴클레아제, 스캐폴드, 스페이서)로 이루어졌다. 개략도 및 그의 개념적 부분은 도 42에 나타낸다. 이식유전자의 다양한 순열이 설명될 수 있도록, 다양한 작제물에 통상적인 나머지 구성성분의 핵산 서열은 표 26에 제공되고, 가이드의 인코딩 서열은 표 18 및 표 19에 제공되고, CasX의 인코딩 서열은 표 21에 제공된다.
클로닝: 모듈 클로닝을 가능하게 하기 위해 AAV 게놈 내의 각각의 부분은 제한 효소 부위에 의해 분리되었다. 부분들은 유전자 단편으로서 Twist로부터 주문되고, PCR 증폭되고, 상응하는 제한 효소로 분해되고, 정제되고, 이어서 동일한 효소로 또한 분해된 벡터 내로 라이게이션되었다. 새로운 AAV 작제물은 이어서 화학적 적격성 E. 콜라이 내로 형질전환되었다(Turbos 또는 Stbl3s). 형질전환된 세포를 1 시간 동안 37℃ 진탕 인큐베이터 내에서 회복시킨 후, 카나마이신 LB-아가 플레이트 상에 플레이팅하고, 37℃에서 12 내지 16 시간 동안 성장시켰다. 카나마이신으로 처리된 6 mL의 2xyt 내로 콜로니를 취하고 7 내지 14 시간 동안 성장시킨 후, 미니-프렙(mini-prep)하고 생거(Sanger) 서열분석하였다. 이어서 형질전환 및 미니프렙 프로토콜을 반복하고 스페이서-클로닝된 벡터를 다시 서열 확인하였다. 검증된 작제물을 맥시-프렙(maxi-prep)하였다. 맥시-프렙의 품질을 평가하기 위해, XmaI(이는 각각의 ITR 내의 몇몇 부위에서 절단함) 및 AAV 게놈 내에서 1회 절단하는 XhoI을 이용한 2개의 별도의 분해에서 작제물을 가공하였다. 이어서 이들 분해물 및 절단되지 않은 작제물을 1% 아가로스 겔 상에서 전개하고 ChemiDoc 상에서 영상화하였다. 플라스미드가 90%를 초과하여 수퍼코일링되었고, 크기가 정확하고, ITR이 온전한 경우, 작제물을 뉴클레오펙션을 통해 시험되도록 진행시키고, 후속적으로 AAV 벡터 생성에 사용하였다.
[표 18]
[표 19]
[표 20]
[표 21]
리포터 세포주: Ai9-티디토마토로부터 단리된 신경 전구 세포주를 사전-평형화된 mNPC 배지(GlutaMax, 10 mM HEPES, 1X MEM 비-필수 아미노산, 1X 페니실린/스트렙토마이신, 1:1000 2-메르캅토에탄올, 1X B-27 보충제, 마이너스 비타민 A, 성장 인자 bFGF 및 EGF가 보충된 1X N2를 갖는 DMEM/F12) 중의 현탁액 중에 배양하였다. 시험 전에, 온화한 재현탁과 함께, 신경구의 완전한 분리에 대해 모니터링하면서, accutase를 사용하여 세포를 해리시켰다. 이어서 세포를 배지로 켄칭하고, 회전 침강시키고, 새로운 배지에 재현탁시켰다. 세포를 계수하고 뉴클레오펙션에 직접 사용하거나, AAV 형질도입 전 2 일에 10,000개의 세포를 PLF(1X 폴리-DL-오르니틴 하이드로브로마이드, 멸균 diH20 중의 10 mg/mL, 1X 라미닌, 및 1X 피브로넥틴)로 코팅된 96-웰 플레이트에 플레이팅하였다.
GFP에 연결된 인간 RHO 유전자의 엑손 1 및 mscarlet에 연결된 인간 P23H.RHO 유전자의 엑손 1을 구성성으로 발현한 2개의 이식유전자 카세트를 HEK293T 세포 내로 녹킹함으로써 HEK293T 이중 리포터 세포주를 생성하였다. 변형된 세포를 3 내지 5 일마다의 연속 계대에 의해 확장시키고, 10% 소태아 혈청(FBS; Seradigm, #1500-500), 및 100 단위/mL 페니실린 및 100 mg/mL 스트렙토마이신(100x-Pen-Strep; GIBCO #15140-122)으로 보충되고, 부가적으로 소듐 피루베이트(100x, Thermofisher #11360070), 비-필수 아미노산(100x ThermoFisher #11140050), HEPES 완충액(100x ThermoFisher #15630080), 및 2-메르캅토에탄올(1000x ThermoFisher #21985023)을 포함할 수 있는 둘베코 변형 이글 배지(DMEM; Corning Cellgro, #10-013-CV)로 이루어진 섬유모세포(FB) 배지 중에 유지하였다. 세포를 37℃ 및 5% CO2에서 인큐베이션하였다. 1 내지 2 주 후에, GFP+/mscarlet+ 세포를 FB 배지 내로 벌크 분류하였다. 리포터 세포주를 3 내지 5 일마다의 연속 계대에 의해 확장시키고 37℃ 및 5% CO2의 인큐베이터 내에서 FB 배지 중에 유지하였다. 제한 희석 방법에 의해 리포터 클론을 생성하였다. 유세포 분석법, 게놈 서열분석, 및 이전에 검증된 RHO 표적화 CasX 분자를 사용하는 RHO 유전자좌의 기능적 변형을 통해 클론 세포주를 특성화하였다. 최적 리포터 세포주는 i) 세포당 정확하게 통합된 WTRHO.GFP 및 mutRHO.mscarlet의 단일 카피를 가졌고; ii) 변형되지 않은 세포와 등가인 배가 시간을 유지하였고; iii) 하기 기재된 방법을 사용하여 검정할 경우에 RHO 유전자의 붕괴시에 GFP 및 mscarlet 형광의 감소를 유발한 것들로서 확인되었다.
플라스미드 뉴클레오펙션: CasX-스캐폴드-가이드 시스템의 발현을 구동하는 AAV 시스-플라스미드를 Lonza P3 1차 세포 96-웰 Nucleofector 키트를 사용하여 mNPC에 뉴클레오펙션시켰다. ARPE-19 세포주의 경우에는, Lonza SF 용액 및 보충제를 사용하였다. 플라스미드를 200 ng/μl, 100 ng/μL의 농도로 희석하였다. 작제물당 5 μL의 DNA를 각각 200,000개의 티디토마토 mNPC 또는 ARPE-19 세포를 함유하는 P3 또는 SF 용액에 첨가하였다. 합한 용액을 제조사의 지침에 따라 Lonza 4D Nucleofector 시스템을 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후에, 적절한 배양 배지로 용액을 켄칭하였다. 이어서 용액을 삼중실험으로 96-웰 플레이트에 분취하였다(대략 웰당 67,000개의 세포). 형질감염 후 48 시간에, 처리된 mNPC에는 성장 인자를 함유하는 새로운 mNPC 배지를 보급하였고 처리된 ARPE-19 세포에는 새로운 FB 배지를 보급하였다. 형질감염 후 5 일에, 티디토마토 mNPC 및 ARPE-19 세포를 부양시키고 FACS에 의해 활성을 평가하였다.
AAV 벡터 생성: 모 HEK293T로부터 현탁액 HEK293T 세포를 적응시키고 FreeStyle 293 배지 중에 성장시켰다. 스크리닝 목적을 위해, 형질감염 당일에 소규모 배양물(125 mL 삼각 플라스크 내에 배양되고 110 rpm으로 교반되는 20 내지 30 mL)을 1.5e+6 세포/mL의 밀도로 희석하였다. 무-혈청 OPTIMEM 배지 중에 PEIMax(Polysciences)를 사용하여 복제를 위한 아데노바이러스 헬퍼 유전자 및 AAV rep/cap 게놈을 공급하는 플라스미드와 함께 ITR 반복에 의해 플랭킹된 이식유전자를 갖는 무-내독소 pAAV 플라스미드를 공동-형질감염시켰다. 형질감염-후 3 시간에 배양물을 10% CDM4HEK293(HyClone)으로 보충하였다. 3 일 후에, 배양물을 1000 rpm에서 10 분 동안 원심분리하여 세포 펠렛으로부터 상청액을 분리하였다. 상청액을 40% PEG 2.5 M NaCl(8% 최종 농도)과 혼합하고 얼음 상에서 2 시간 이상 동안 인큐베이션하여 AAV 바이러스 입자를 침전시켰다. 대부분의 AAV 벡터를 함유하는 세포 펠렛을 용해 배지(0.15 M NaCl, 50 mM 트리스 HCl, 0.05% Tween, pH 8.5) 중에 재현탁시키고, 얼음 상에서 초음파처리하고(15 초, 30% 진폭), 30 분 동안 37℃에서 Benzonase(250 U/μL, Novagen)로 처리하였다. 이어서 비정제 용해물 및 PEG-처리된 상청액을 4000 rpm에서 20 분 동안 4℃에서 회전시켜 PEG 침전된 AAV(펠렛)를 무-세포 잔해 비정제 용해물(상청액)과 함께 재현탁시키고 0.45 μM 필터를 사용하여 추가로 청징화하였다.
바이러스 게놈 역가를 결정하기 위해, 비정제 용해물 바이러스로부터의 1 μL를 DNase 및 ProtK로 분해한 후, 정량 PCR이 이어졌다. CMV 프로모터 영역(Fwd 5'-CATCTACGTATTAGTCATCGCTATTACCA-3'(서열 번호 40801); Rev 5'-GAAATCCCCGTGAGTCAAACC-3'(서열 번호 40802), 탐침 5'-TCAATGGGCGTGGATAG-3'(서열 번호 40803) 또는 AAV2-ITR 내에 위치하는 62 bp-단편(Fwd 5'-GGAACCCCTAGTGATGGAGTT -3'(서열 번호 40804); Rev 5'-CGGCCTCAGTGAGCGA-3'(서열 번호 40805), 탐침 5'-CACTCCCTCTCTGCGCGCTCG-3'(서열 번호 40806)을 증폭하도록 설계된 IDT primetime 마스터 믹스 및 프라이머의 세트 및 6'FAM/Zen/IBFQ 탐침(IDT)으로 구성된 25 μL qPCR 반응에 5 μL의 분해된 바이러스를 사용하였다. AAV ITR 플라스미드의 10-배 연속 희석액(2e+9 내지 2e+4 DNA 카피/mL의 각각 5 μl)을 참조 표준으로 사용하여 바이러스 샘플의 역가(바이러스 게놈(vg)/mL)를 계산하였다. QPCR 프로그램은 95 'C에서 5 분 동안의 초기 변성 단계에 이어서, 40 주기의 95 'C에서 1 분 동안의 변성, 및 60℃에서 1 분 동안의 어닐링/연장으로서 설정되었다.
AAV 형질도입: AAV 형질도입 전 48-시간에 96-웰 플레이트 내의 PLF-코팅된 웰 상에 10,000개의 세포/웰의 mNPC를 시딩하였다. 모든 바이러스 감염 조건은, 약 1.0e+6 내지 1.0e+4 vg/세포 범위의 감염 다중도(MOI)의 일련의 3-배 희석에서, 실험 벡터들 사이에서 정규화된 vg의 수를 이용하여, 삼중실험으로 수행되었다. 계산은 형질감염의 시점에 웰당 20,000개의 세포의 추정된 수에 기초하였다. bFGF/EGF 성장 인자(20 ng/ml 최종 농도)로 보충된 사전-평형화된 mNPC 배지에 희석된 최종 부피 50 μL의 AAV 벡터를 각각의 웰에 적용하였다. 형질감염-후 48 시간에, 성장 인자로 보충된 새로운 배지로 완전 배지 교환을 수행하였다. 편집 활성(tdT+ 세포 정량화)은 형질감염-후 5 일에 FACS에 의해 평가되었다.
FACS에 의한 편집 활성의 평가: 형질감염 후 5 일에, 96-웰 플레이트 내의 처리된 티디토마토 mNPC 또는 ARPE-19 세포를 dPBS로 세척하고 50 μL TrypLE 및 트립신(0.25%)으로 각각 15 및 5 분 동안 처리하였다. 세포 해리 후에, 처리된 웰을 DMEM, 10% FBS, 및 1X 페니실린/스트렙토마이신을 함유하는 배지로 켄칭하였다. 재현탁된 세포를 둥근-바닥 96-웰 플레이트에 이전하고 5 분 동안 1000 x g에서 원심분리하였다. 이어서 세포 펠렛을 1X DAPI를 함유하는 dPBS로 재현탁시키고, 플레이트를 Attune NxT 유세포 분석기 오토샘플러 내로 로딩하였다. 하기 게이팅 파라미터를 사용하여 Attune NxT 유세포 분석기를 실행하였다: 세포를 선택하기 위한 FSC-A x SSC-A, 단일 세포를 선택하기 위한 FSC-H x FSC-A, DAPI-음성 살아 있는 세포를 선택하기 위한 FSC-A x VL1-A, 및 티디토마토 양성 세포를 선택하기 위한 FSC-A x YL1-A.
mRHO 엑손 1 유전자좌에서의 인델의 NGS 분석: 형질감염 후 5 일에, 96-웰 플레이트 내의 처리된 티디토마토 mNPC를 dPBS로 세척하고 50 μL TrypLE 및 트립신(0.25%)으로 각각 15 및 5 분 동안 처리하였다. 세포 해리 후에, 처리된 웰을 DMEM, 10% FBS, 및 1X 페니실린/스트렙토마이신을 함유하는 배지로 켄칭하였다. 이어서 세포를 회전 침강시키고, 생성되는 세포 펠렛을 PBS로 세척한 후, 제조사의 설명서에 따라 Zymo 미니 DNA 키트를 사용하여 gDNA 추출을 위해 이들을 가공하였다. 마우스 RHO 엑손 1 유전자좌에서 발생하는 편집 수준을 평가하기 위해, 200 ng의 gDNA로부터 프라이머의 세트(Fwd 5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNGCAGCCTTGGTCTCTGTCTACG-3'(서열 번호 40595); Rev 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCCCAGTCTCTCTGCTCATACC-3'(서열 번호 40596))로 앰플리콘을 증폭하고, 비드-정제한 후(Beckman coulter, Agencourt Ampure XP), 재-증폭하여 illumina 어댑터 서열을 혼입하였다. 구체적으로, 이들 프라이머는 Illumina 판독 및 2개의 서열뿐만 아니라 고유 분자 식별자(UMI)로서 기능하는 16 nt 무작위 서열을 도입하기 위한 부가적인 서열을 5′ 단부에 함유하였다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석기 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq 상에서 앰플리콘을 서열분석하였다. 서열분석으로부터의 원시 fastq 파일은 하기와 같이 가공되었다: (1) 프로그램 cutadapt(v. 2.1)를 사용하여 품질 및 어댑터 서열을 위해 서열을 트리밍하였고; (2) 프로그램 flash2(v2.2.00)를 사용하여 판독 1 및 판독 2로부터의 서열을 단일 삽입 서열로 병합하였고; (3) 예상되는 앰플리콘 서열 및 스페이서 서열과 함께, 프로그램 CRISPResso2(v 2.0.29)를 통해 공통 삽입 서열을 실행하였다. 이 프로그램은 스페이서의 3′ 단부 주위의 윈도우(스페이서의 3′ 단부로부터 -3 bp에 중심이 있는 30 bp 윈도우)에서 변형된 판독의 %를 정량화한다. CasX 분자의 활성은 이 윈도우 내의 임의의 위치에 삽입, 치환, 및/또는 결실을 함유하는 판독의 총 %로서 정량화되었다.
결과:
다중의 관심 게놈 유전자좌를 표적화하는 상이한 스페이서를 갖는 gRNA 스캐폴드 변이체(가이드 174 및 229 내지 237)와 쌍을 이루는 CasX 491에 의해 매개된 표적-내 절단을 정량화하기 위해 상이한 편집 실험을 수행하였다. ITR2 서열에 의해 플랭킹된, CMV 프로모터의 제어 하에 단백질 Cas 491 뿐만 아니라, 인간 U6 프로모터의 제어 하에 스캐폴드-스페이서의 발현을 구동하는 작제물을, AAV 골격 p59 내로 클로닝하였다.
mNPC-tdT 리포터 세포주를 사용하여 내인성 마우스 RHO 엑손 1 유전자좌(스페이서 11.30, CTC PAM)에서 단일-절단 효율을 평가하였다. ARPE-19 유래 세포주 내에 통합된 이중 리포터 시스템을 또한 사용하여 외인성으로 발현된 인간 WT Rho 유전자좌 (스페이서 11.1, CTC PAM)에서 표적-내 편집을 평가하였다.
2개의 상이한 용량, 1000 ng 및 500 ng에서 마우스 NPC 세포주 내의 뉴클레오펙션을 통해, 스페이서 11.30을 갖는 스캐폴드 변이체를 시험하였다. 작제물을 현재의 벤치마크 gRNA 스캐폴드 174 활성에 비교하였다. 스캐폴드 변이체 231, 233, 234, 235를 발현하는 작제물은 스캐폴드 174.11.30을 갖는 것들보다 더 높은 수준으로 수행하였다(도 43a 및 도 43b). 스캐폴드 235는 gRNA 스캐폴드 174에 비교하여 mRHO 엑손 1 유전자좌에서 2-배 증가된 활성을 나타냈다. 본 발명자들은, 이중 리포터 ARPE-19 세포주를 작제물 p59.491.174.11.1 및 p59.491.235.11.1뿐만 아니라, 비-표적 스페이서 대조군으로 뉴클레오펙션시킴으로써, 스캐폴드 235가 증가된 표적-외 절단 없이 일관적으로 활성을 개선했다는 것을 추가로 검증하였다. 스페이서 11.1은 외인성으로 발현된 hRHO-GFP 유전자를 표적화하고 있었다. 스캐폴드 235는 174에 비교하여 3-배 증가된 활성을 나타냈다 (각각 9% 대 3%의 Rho-GFP- 세포, 도 44a 및 도 44b). 그의 서열이 야생형과는 1 bp만큼 상이한 hP23H-RHO-Scarlett- 세포 집단의 빈도를 조사함으로써 대립유전자-특이성을 평가하였다.
본 발명자들은 또한 이들 스캐폴드 변이체가 AAV 내에 효율적으로 패키징되고 바이러스에 의해 전달될 경우에 효력을 유지하였다는 것을 입증하고자 하였다. 스페이서 11.30을 갖는 가이드 스캐폴드 235를 발현하는 AAV 벡터로 형질도입된 mNPC(표적-내, 마우스 WT RHO)는 3.0e+5 MOI에서 AAV.491.174.11.30으로 감염된 것들에 비교하여 표적-내 유전자좌에서 증가된 활성을 나타냈으며(5-배 초과의 증가, 도 45a 및 도 45b), 각각 P23H-RHO SNP를 표적화하는 AAV.491.174.11.31 및 AAV.491.235.11.31 벡터 둘 모두에 의해 검출가능한 유의한 표적-외 인델은 없었다.
스페이서 길이의 효과의 평가: 스페이서 길이 변이체가 표적-내 활성을 개선할 수 있는지 여부를 시험하기 위해 다른 세트의 실험을 수행하였다. 각각 모 스페이서 11.30(20 nt WT RHO) 및 11.31(20 nt P23H RHO)로부터, 서열의 3' 단부 상에 1 또는 2 bp의 절단을 보유하는, 스페이서 11.39, 11.38 및 스페이서 11.37(19 nt P23H RHO), 11.36(18 nt P23H RHO)을 설계하였다. mfNPC-tdT 세포를 1000 ng 및 500 ng의 작제물 p59.491.174.11.30(20 nt WT RHO), p59.491.174.11.39(19 nt WT RHO), p49.491.174.11.38(18 nt WT RHO)로 뉴클레오펙션시키고, 5 일 후에 편집 수준을 평가하였다. 모든 절단된 스페이서 버전은 편집 수준을 개선하였으며(도 46a 및 도 46c), 최고의 개선은 p59.491.11.39 작제물에 의해 관찰되었다(20 bp 스페이서 길이 작제물에 비교하여 19 bp 스페이서에 의해 약 2-배 개선이 달성되었다). 마우스 P23H-RHO 유전자좌를 표적화하는 11.31 스페이서의 절단 스페이서 변이체에 의해 표적-외 절단의 증가는 관찰되지 않았다(도 46b).
이들 결과는 치료 관련 게놈 표적, 예컨대 마우스 및 인간 RHO 엑손 1 유전자좌를 조사하는 이중 리포터 시스템에서 증가된 활성을 갖는 구조적 돌연변이를 갖는 스캐폴드 변이체가 조작될 수 있다는 것을 지지한다. 추가로, 새로 특성화된 스캐폴드는 전반적으로 2-배를 초과하는 활성의 증가를 나타냈지만, 1-bp 불일치 스페이서 영역을 갖는 표적-외 절단은 검출되지 않았다. 이는 대립유전자-특이적 치료 전략, 예컨대 adRP P23H Rho에 있어서 유의미하며, 이 돌연변이된 대립유전자는 WT 서열로부터 1개의 뉴클레오티드만큼 상이하고, 스페이서 11.31에 의해 표적화된다. 본 연구는 P23H RHO 구조 및 유전자독성 연구뿐만 아니라 다른 치료 표적을 위해 설계된 AAV 벡터 내의 가이드 스캐폴드 235의 용도를 추가로 검증한다.
실시예 13: 개선된 스캐폴드 및 가이드 변이체는 생체내에서 향상된 표적-내 활성을 입증한다
조작된 CasX 및 sgRNA-가이드 및 선택성 및 표적-내 활성을 개선하는 구조적 돌연변이를 보유하는 스페이서 변이체가, WT에서 치료 관련 수준으로 P23 잔기를 표적화하는 스페이서와 함께, 마우스 망막 내의 광수용체에 생체내 전달될 경우에 편집의 증가로 이어진다는 것을 입증하기 위해 실험을 수행하였다. 여기서, 본 발명자들은 CasX 변이체 491, 가이드 변이체 235, 및 스페이서 11.39를 발현하는 벡터가 생체내에서 모 CasX 491, 가이드 변이체 174, 및 스페이서 11.30에 비교하여 편집 수준을 개선하는지 여부를 평가하였다.
재료 및 방법:
AAV 플라스미드 및 바이러스 벡터의 생성: RHO 프로모터의 제어 하의 CasX 변이체 491, 및 U6 프로모터 하에 P23 잔기에서 마우스 RHO 엑손 1을 표적화하는 스페이서 11.30 및 스페이서 11.31(AAGTGGCTCCGCACCACGCC(서열 번호 40503))을 갖는 sgRNA.가이드 변이체 174 또는 스페이서 11.39(AAGGGGCTCCGCACCACGCC(서열 번호 40531)) 및 11.37(AAGTGGCTCCGCACCACGC(서열 번호 40535))을 갖는 sgRNA-가이드 변이체 235를 AAV2 ITR로 플랭킹된 p59 플라스미드 내로 클로닝하였다.
클로닝: 모듈 클로닝을 가능하게 하기 위해 AAV 게놈 내의 각각의 부분은 제한 효소 부위에 의해 분리되었다. 부분들은 유전자 단편으로서 Twist로부터 주문되고, PCR 증폭되고, 상응하는 제한 효소로 분해되고, 정제되고, 이어서 동일한 효소로 또한 분해된 벡터 내로 라이게이션되었다. RHO 프로모터 하의 Cas X 변이체 491 및 인간 U6 프로모터의 제어 하의 스캐폴드 변이체 174 및 235를 AAV2 ITR에 의해 플랭킹된 AAV 골격 내로 클로닝하였다. 골든 게이트 클로닝을 사용하여 스페이서 11.30, 11.31 및 변이체 11.39, 11.37을 각각 pAAV.RHO.491.174 및 pAAV.RHO.491.235 내로 클로닝하였다. 새로운 AAV 작제물은 이어서 화학적 적격성 E. 콜라이 내로 형질전환되었다(Stbl3s). 검증된 작제물을 맥시-프렙하였다. 맥시-프렙의 품질을 평가하기 위해, XmaI(이는 각각의 ITR 내의 몇몇 부위에서 절단함) 및 AAV 게놈 내에서 1회 절단하는 XhoI을 이용한 2개의 별도의 분해에서 작제물을 가공하였다. 플라스미드가 90%를 초과하여 수퍼코일링되었고, 크기가 정확하고, ITR이 온전한 경우, 작제물을 후속적으로 AAV 벡터 생성에 사용하였다.
AAV 벡터 생성: 모 HEK293T로부터 현탁액 HEK293T 세포를 적응시키고 FreeStyle 293 배지 중에 성장시켰다. 형질감염 당일에 500 mL 배양물(110 rpm으로 교반되는 1 L 삼각 플라스크)을 2e+6 세포/mL의 밀도로 희석하였다. 무-혈청 OPTIMEM 배지 중에 PEIMax(Polysciences)를 사용하여 복제를 위한 아데노바이러스 헬퍼 유전자 및 AAV rep/cap 게놈을 공급하는 플라스미드와 함께 ITR 반복에 의해 플랭킹된 이식유전자를 갖는 무-내독소 pAAV 플라스미드를 공동-형질감염시켰다. 형질감염-후 3 시간에 배양물을 10% CDM4HEK293(HyClone)으로 보충하였다. 3 일 후에, 배양물을 1000 rpm에서 10 분 동안 원심분리하여 세포 펠렛으로부터 상청액을 분리하였다. 상청액을 40% PEG 2.5 M NaCl(8% 최종 농도)과 혼합하고 얼음 상에서 2 시간 이상 동안 인큐베이션하여 AAV 바이러스 입자를 침전시켰다. 대부분의 AAV 벡터를 함유하는 세포 펠렛을 용해 배지(0.15 M NaCl, 50 mM 트리스 HCl, 0.05% Tween, pH 8.5) 중에 재현탁시키고, 얼음 상에서 초음파처리하고(15 초, 30% 진폭), 30 분 동안 37℃에서 Benzonase(250 U/μL, Novagen)로 처리하였다. 이어서 비정제 용해물 및 PEG-처리된 상청액을 4000 rpm에서 20 분 동안 4℃에서 회전시켜 PEG 침전된 AAV(펠렛)를 무-세포 잔해 비정제 용해물(상청액)과 함께 재현탁시키고 0.45 μM 필터를 사용하여 추가로 청징화하였다. 친화도 크로마토그래피(POROS CaptureSelect AAVX, ThermoFisher)를 사용하여 AAV 용해물을 정제하였다. 용리액을 완충액 교환하고 PBS+200 mM NaCl+0.001% Pluronic 중에 농축하였다.
바이러스 게놈 역가를 결정하기 위해, 비정제 용해물 바이러스로부터의 1 μL를 DNase 및 ProtK로 분해한 후, 정량 PCR이 이어졌다. AAV2-ITR 내에 위치하는 62 bp-단편(Fwd 5'-GGAACCCCTAGTGATGGAGTT -3'(서열 번호 40804); Rev 5'-CGGCCTCAGTGAGCGA-3'(서열 번호 40805), 탐침 5'-CACTCCCTCTCTGCGCGCTCG-3'(서열 번호 40806))을 증폭하도록 설계된 IDT primetime 마스터 믹스 및 프라이머의 세트 및 6'FAM/Zen/IBFQ 탐침(IDT)으로 구성된 25 μL qPCR 반응에 5 μL의 분해된 바이러스를 사용하였다. AAV ITR 플라스미드를 참조 표준으로 사용하여 바이러스 샘플의 역가(바이러스 게놈(vg)/mL)를 계산하였다. QPCR 프로그램은 95 'C에서 5 분 동안의 초기 변성 단계에 이어서, 40 주기의 95 'C에서 1 분 동안의 변성, 및 60℃에서 1 분 동안의 어닐링/연장으로서 설정되었다.
망막하 주사 C57BL6J 마우스는 Jackson Laboratories로부터 얻어졌으며, 정상 12 시간 명/암 주기로 유지되었다. 주령 3 내지 4 주의 마우스에 망막하 주사를 수행하였다. 아이소플루란 흡입으로 마우스를 마취시켰다. 프로파라카인(0.5%)을 각막 상에 국소 적용하고, 수 방울의 트로피카마이드(1%) 및 페닐에프린(2.5%)으로 안구를 산동시켰다. 수술 중에 genteal 겔로 안구 윤활을 유지하였다. 수술 현미경 하에, 적도부에서, 그리고 그 다음에 주변부에, 초미세 30 1/2-게이지 1회용 바늘을 공막을 통해 통과시켜 유리체강 내로 작은 구멍을 생성하였다. 평활-말단 바늘을 사용하여, 1 내지 1.5 μL의 바이러스를 RPE와 망막층 사이의 망막하 공간 내로 직접 주사하였다. 실험군으로부터의 각각의 마우스에 1.5.0e+9 바이러스 게놈(vg)/안구를 주사하였다.
NGS 분석: 주사-후 3 주에, 동물을 희생시키고 안구를 새로운 PBS 중에 적출하였다. 전체 망막을 안구 컵으로부터 단리하고 제조사의 설명서에 따라 DNeasy Blood & Tissue Kit(Qiagen)를 사용하여 gDNA 추출을 위해 가공하였다. 200 ng의 gDNA로부터 마우스 RHO, 엑손 1 유전자좌를 표적화하는 프라이머의 세트(Fwd 5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNGCAGCCTTGGTCTCTGTCTACG-3'(서열 번호 40595); Rev 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCCCAGTCTCTCTGCTCATACC-3'(서열 번호 40596))로 앰플리콘을 증폭하고, 비드-정제한 후(Beckman coulter, Agencourt Ampure XP), 재-증폭하여 illumina 어댑터 서열을 혼입하였다. 구체적으로, 이들 프라이머는 Illumina 판독 및 2개의 서열뿐만 아니라, 고유 분자 식별자(UMI)로서 기능하는 16 nt 무작위 서열을 도입하기 위한 부가적인 서열을 5′ 단부에 함유하였다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석기 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq 상에서 앰플리콘을 서열분석하였다. 서열분석으로부터의 원시 fastq 파일은 하기와 같이 가공되었다: (1) 프로그램 cutadapt(v. 2.1)를 사용하여 품질 및 어댑터 서열을 위해 서열을 트리밍하였고; (2) 프로그램 flash2(v2.2.00)를 사용하여 판독 1 및 판독 2로부터의 서열을 단일 삽입 서열로 병합하였고; (3) 예상되는 앰플리콘 서열 및 스페이서 서열과 함께, 프로그램 CRISPResso2(v 2.0.29)를 통해 공통 삽입 서열을 실행하였다. 이 프로그램은 스페이서의 3′ 단부 주위의 윈도우(스페이서의 3′ 단부로부터 -3 bp에 중심이 있는 30 bp 윈도우)에서 변형된 판독의 %를 정량화한다. CasX 분자의 활성은 이 윈도우 내의 임의의 위치에 삽입, 치환, 및/또는 결실을 함유하는 판독의 총 %로서 정량화되었다.
결과:
벤치마크 벡터, AAV.491.174.11.30(표적-내)은 모든 샘플에 걸쳐 약 8%의 편집을 달성하였다(도 47a; n=8 망막). 스페이서 11.31(표적-외, P23H-RHO SNP를 표적화하는 11.30으로부터 1bp 불일치)을 갖는 유사한 벡터는 배경 수준의 편집(약 0.4%)을 나타냈다. 스캐폴드 변이체 235 및 스페이서 11.39를 발현하는 AAV 벡터는 AAV.491.174.11.30 모 벡터(도 47b)에 비교하여 2-배를 초과하는 개선을 달성하였으며, 평균은 16% 편집이었고, 일부 망막에서는 25%에 달하였다. AAV.491.174.11.31 모 벡터에 비교하여 스페이서 11.37(P23H-RHO SNP를 표적화함, 스페이서 11.39에 비교하여 1bp-불일치)을 갖는 표적-외 수준에 증가가 없으므로, 표적-내 편집의 이러한 증가는 선택성을 유지하였다.
이들 실험은 스캐폴드 174, 및 마우스 P23 RHO 유전자좌를 표적화하는 스페이서와 함께 간상 광수용체-선택적 프로모터에 의해 구동되는 CasX 491 발현이 쥐과 망막 내에 AAV를 통해 망막하 전달될 경우에 P23 마우스 유전자좌에서 치료-관련 수준의 편집을 달성할 수 있다는 개념 증명을 입증한다. 이들 결과는 또한, 시험관내에서 이전에 스크리닝된 조작된 sgRNA 가이드(235) 및 스페이서 변이체(11.39)로부터 달성된 편집 수준이 생체내에서도 나타나며, 대립유전자-특이적 선택성이 유지된다는 것을 지지한다. 본 연구는 P23H RHO 구조 및 유전자독성 연구뿐만 아니라, 다른 치료 표적을 위해 설계된 AAV 벡터 내의 가이드 스캐폴드 235의 용도를 추가로 검증한다.
실시예 11 및 실시예 12의 결과는 치료 관련 게놈 표적, 예컨대 마우스 및 인간 RHO 엑손 1 유전자좌를 조사하는 이중 리포터 시스템에서 증가된 활성을 갖는 구조적 돌연변이를 갖는 스캐폴드 변이체가 조작될 수 있다는 것을 지지한다. 추가로, 새로 특성화된 235 스캐폴드는 전반적으로 2-배를 초과하는 활성의 증가를 나타냈지만, 1-bp 불일치 스페이서 영역을 갖는 표적-외 절단은 검출되지 않았다. 이는 대립유전자-특이적 치료 전략, 예컨대 adRP P23H Rho에 있어서 유의미하며, 이 돌연변이된 대립유전자는 WT 서열로부터 1개의 뉴클레오티드만큼 상이하고, 스페이서 11.31에 의해 표적화된다. 본 연구는, 마우스 P23H RHO 구조 및 유전자독성 연구뿐만 아니라, 다른 치료 표적을 위해 설계된 AAV 벡터 내의 가이드 스캐폴드 235의 용도를 추가로 검증하기 위해 수행되었다.
실시예 14: 개선된 CasX 변이체는 시험관내에서 향상된 표적-내 활성을 입증한다
CasX 프로토스페이서 인접 모티프는 정밀도를 갖는 게놈 표적화를 가능하게 하며, 이는 다양한 게놈 편집 치료 응용, 예컨대 야생형 서열을 변경하지 않으면서 P23H 돌연변이의 대립유전자-특이적 표적화를 필요로 하는 상염색체 우성 RHO에 필요하다.
정확도를 높게 유지하면서 CTC-PAM 매개 표적-내 활성을 증가시킬 것으로 예측되는 돌연변이가 도입되고, 표적-외 사건이 감소된, 합리적으로-설계된 조작된 CasX 뉴클레아제가, 간상 광수용체 세포에 생체내 전달될 경우에 내인성 마우스 RHO 유전자좌에서 편집 수준을 개선했는지 여부를 조사하기 위해 실험을 수행하였다.
부가적으로, 마우스 P23H RHO 구조 및 유전자독성 연구뿐만 아니라, 다른 치료 표적을 위해 설계된 AAV 벡터 내의 가이드 스캐폴드 235의 용도를 추가로 검증하기 위해 실험을 수행하였다.
방법:
PAM 활성을 조사하는 상이한 검정에서 확인된 CasX 단백질 변이체를 CTC PAM에서의 이들의 증가된 활성에 대해 선택하였다. 플라스미드 및 바이러스 벡터 검증을 위해 CasX 단백질을 AAV 이식유전자 작제물 내로 클로닝하였다. 본 발명자들은 ITR 사이의 AAV 이식유전자를 상이한 부분으로 개념적으로 나누었으며, 이는 본 발명자들의 치료제 적재물 및 포유류 세포 내의 발현에 관련된 액세서리 요소 및 본 발명자들의 뉴클레아제-가이드 RNA 복합체(단백질, 스캐폴드, 스페이서)로 이루어졌다.
클로닝: 모듈 클로닝을 가능하게 하기 위해 AAV 게놈 내의 각각의 부분은 제한 효소 부위에 의해 분리되었다. 부분들은 유전자 단편으로서 Twist로부터 주문되고, PCR 증폭되고, 상응하는 제한 효소로 분해되고, 정제되고, 이어서 동일한 효소로 또한 분해된 벡터 내로 라이게이션되었다. 새로운 AAV 작제물은 이어서 화학적 적격성 E. 콜라이 내로 형질전환되었다(Stbl3s). 검증된 작제물을 맥시-프렙하였다. 맥시-프렙의 품질을 평가하기 위해, XmaI(이는 각각의 ITR 내의 몇몇 부위에서 절단함) 및 AAV 게놈 내에서 1회 절단하는 XhoI을 이용한 2개의 별도의 분해에서 작제물을 가공하였다. 이어서 이들 분해물 및 절단되지 않은 작제물을 1% 아가로스 겔 상에서 전개하였다. 플라스미드가 90%를 초과하여 수퍼코일링되었고, 크기가 정확하고, ITR이 온전한 경우, 작제물을 뉴클레오펙션을 통해 시험되도록 진행시키고, 후속적으로 AAV 벡터 생성에 사용하였다.
리포터 세포주: Ai9-티디토마토로부터 단리된 불멸화 신경 전구 세포주를 사전-평형화된 mNPC 배지(GlutaMax, 10 mM HEPES, 1X MEM 비-필수 아미노산, 1X 페니실린/스트렙토마이신, 1:1000 2-메르캅토에탄올, 1X B-27 보충제, 마이너스 비타민 A, 성장 인자 bFGF 및 EGF가 보충된 1X N2를 갖는 DMEM/F12) 중의 현탁액 중에 배양하였다. 시험 전에, 온화한 재현탁과 함께, 신경구의 완전한 분리에 대해 모니터링하면서, accutase를 사용하여 세포를 부양시켰다. 이어서 세포를 배지로 켄칭하고, 회전 침강시키고, 새로운 배지에 재현탁시켰다. 세포를 계수하고 뉴클레오펙션에 직접 사용하거나, AAV 형질도입 전 2 일에 10,000개의 세포를 PLF(1X 폴리-DL-오르니틴 하이드로브로마이드, 멸균 diH20 중의 10 mg/mL, 1X 라미닌, 및 1X 피브로넥틴)로 코팅된 96-웰 플레이트에 플레이팅하였다.
GFP에 연결된 인간 RHO 유전자의 엑손 1 및 mscarlet에 연결된 인간 P23H.RHO 유전자의 엑손 1을 구성성으로 발현한 2개의 이식유전자 카세트를 HEK293T 세포 내로 녹킹함으로써 HEK293T 이중 리포터 세포주를 생성하였다. 변형된 세포를 3 내지 5 일마다의 연속 계대에 의해 확장시키고, 10% 소태아 혈청(FBS; Seradigm, #1500-500), 및 100 단위/mL 페니실린 및 100 mg/mL 스트렙토마이신(100x-Pen-Strep; GIBCO #15140-122)으로 보충되고, 부가적으로 소듐 피루베이트(100x, Thermofisher #11360070), 비-필수 아미노산(100x ThermoFisher #11140050), HEPES 완충액(100x ThermoFisher #15630080), 및 2-메르캅토에탄올(1000x ThermoFisher #21985023)을 포함할 수 있는 둘베코 변형 이글 배지(DMEM; Corning Cellgro, #10-013-CV)로 이루어진 섬유모세포(FB) 배지 중에 유지하였다. 세포를 37℃ 및 5% CO2에서 인큐베이션하였다. 1 내지 2 주 후에, GFP+/mscarlet+ 세포를 FB 배지 내로 벌크 분류하였다. 리포터 세포주를 3 내지 5 일마다의 연속 계대에 의해 확장시키고 37℃ 및 5% CO2의 인큐베이터 내에서 FB 배지 중에 유지하였다. 제한 희석 방법에 의해 리포터 클론을 생성하였다. 유세포 분석법, 게놈 서열분석, 및 이전에 검증된 RHO 표적화 CasX 분자를 사용하는 RHO 유전자좌의 기능적 변형을 통해 클론 세포주를 특성화하였다. 최적 리포터 세포주는 i) 세포당 정확하게 통합된 WT-RHO.GFP 및 P23H-RHO.mscarlet의 단일 카피를 가졌고; ii) 변형되지 않은 세포와 등가인 배가 시간을 유지하였고; iii) 하기 기재된 방법을 사용하여 검정할 경우에 RHO 유전자의 붕괴시에 GFP 및 mscarlet 형광의 감소를 유발한 것들로서 확인되었다.
플라스미드 뉴클레오펙션: CasX-스캐폴드-가이드 시스템의 발현을 구동하는 AAV 시스-플라스미드를 Lonza P3 1차 세포 96-웰 Nucleofector 키트를 사용하여 mNPC에 뉴클레오펙션시켰다. ARPE-19 세포주의 경우에는, Lonza SF 용액 및 보충제를 사용하였다. 플라스미드를 200 ng/ul, 100 ng/μL의 농도로 희석하였다. 작제물당 5 μL의 DNA를 각각 200,000개의 티디토마토 mNPC 또는 ARPE-19 세포를 함유하는 P3 또는 SF 용액에 첨가하였다. 합한 용액을 제조사의 지침에 따라 Lonza 4D Nucleofector 시스템을 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후에, 적절한 배양 배지로 용액을 켄칭하였다. 이어서 용액을 삼중실험으로 96-웰 플레이트에 분취하였다(대략 웰당 67,000개의 세포). 형질감염 후 48 시간에, 처리된 세포에 성장 인자를 함유하는 새로운 mNPC 배지를 보급하였다. 형질감염 후 5 일에, 티디토마토 mNPC를 부양시키고 FACS에 의해 활성을 평가하였다.
AAV 벡터 생성: 모 HEK293T로부터 현탁액 HEK293T 세포를 적응시키고 FreeStyle 293 배지 중에 성장시켰다. 스크리닝 목적을 위해, 형질감염 당일에 소규모 배양물(125 mL 삼각 플라스크 내에 배양되고 110 rpm으로 교반되는 20 내지 30 mL)을 1.5e+6 세포/mL의 밀도로 희석하였다. 무-혈청 OPTIMEM 배지 중에 PEIMax(Polysciences)를 사용하여 복제를 위한 아데노바이러스 헬퍼 유전자 및 AAV rep/cap 게놈을 공급하는 플라스미드와 함께 ITR 반복에 의해 플랭킹된 이식유전자를 갖는 무-내독소 pAAV 플라스미드를 공동-형질감염시켰다. 형질감염-후 3 시간에 배양물을 10% CDM4HEK293(HyClone)으로 보충하였다. 3 일 후에, 배양물을 1000 rpm에서 10 분 동안 원심분리하여 세포 펠렛으로부터 상청액을 분리하였다. 상청액을 40% PEG 2.5 M NaCl(8% 최종 농도)과 혼합하고 얼음 상에서 2 시간 이상 동안 인큐베이션하여 AAV 바이러스 입자를 침전시켰다. 대부분의 AAV 벡터를 함유하는 세포 펠렛을 용해 배지(0.15 M NaCl, 50 mM 트리스 HCl, 0.05% Tween, pH 8.5) 중에 재현탁시키고, 얼음 상에서 초음파처리하고(15 초, 30% 진폭), 30 분 동안 37℃에서 Benzonase(250 U/μL, Novagen)로 처리하였다. 이어서 비정제 용해물 및 PEG-처리된 상청액을 4000 rpm에서 20 분 동안 4℃에서 회전시켜 PEG 침전된 AAV(펠렛)를 무-세포 잔해 비정제 용해물(상청액)과 함께 재현탁시키고, 0.45 μM 필터를 사용하여 추가로 청징화하였다.
바이러스 게놈 역가를 결정하기 위해, 비정제 용해물 바이러스로부터의 1 μL를 DNase 및 ProtK로 분해한 후, 정량 PCR이 이어졌다. CMV 프로모터 영역(Fwd 5'-CATCTACGTATTAGTCATCGCTATTACCA-3'(서열 번호 40801)); Rev 5'-GAAATCCCCGTGAGTCAAACC-3'(서열 번호 40802)), 탐침 5'-TCAATGGGCGTGGATAG-3'(서열 번호 40803)) 또는 AAV2-ITR 내에 위치하는 62 뉴클레오티드-단편(Fwd 5'-GGAACCCCTAGTGATGGAGTT -3'(서열 번호 40804); Rev 5'-CGGCCTCAGTGAGCGA-3'(서열 번호 40805), 탐침 5'-CACTCCCTCTCTGCGCGCTCG-3')을 증폭하도록 설계된 IDT primetime 마스터 믹스 및 프라이머의 세트 및 6'FAM/Zen/IBFQ 탐침(IDT)으로 구성된 25 μL qPCR 반응에 5 μL의 분해된 바이러스를 사용하였다. AAV ITR 플라스미드의 10-배 연속 희석액(2e+9 내지 2e+4 DNA 카피/mL의 각각 5 μl)을 참조 표준으로 사용하여 바이러스 샘플의 역가(바이러스 게놈(vg)/mL)를 계산하였다. QPCR 프로그램은 95 'C에서 5 분 동안의 초기 변성 단계에 이어서, 40 주기의 95 'C에서 1 분 동안의 변성 및 60℃에서 1 분 동안의 어닐링/연장으로서 설정되었다.
AAV 형질도입: AAV 형질도입 전 48-시간에 96-웰 플레이트 내의 PLF-코팅된 웰 상에 10,000개의 세포/웰의 mNPC를 시딩하였다. 모든 바이러스 감염 조건은, 약 1.0e+6 내지 1.0e+4 vg/세포 범위의 감염 다중도(MOI)의 일련의 3-배 희석에서, 실험 벡터들 사이에서 정규화된 vg의 수를 이용하여, 삼중실험으로 수행되었다. 계산은 형질감염의 시점에 웰당 20,000개의 세포의 추정된 수에 기초하였다. bFGF/EGF 성장 인자(20 ng/ml 최종 농도)로 보충된 사전-평형화된 mNPC 배지에 희석된 최종 부피 50 μL의 AAV 벡터를 각각의 웰에 적용하였다. 형질감염-후 48 시간에, 성장 인자로 보충된 새로운 배지로 완전 배지 교환을 수행하였다. 편집 활성(tdT+ 세포 정량화)은 형질감염-후 5 일에 FACS에 의해 평가되었다.
FACS에 의한 편집 활성의 평가: 형질감염 후 5 일에, 96-웰 플레이트 내의 처리된 티디토마토 mNPC 또는 ARPE-19 세포를 dPBS로 세척하고 50 μL TrypLE 및 트립신(0.25%)으로 각각 15 및 5 분 동안 처리하였다. 세포 해리 후에, 처리된 웰을 DMEM, 10% FBS, 및 1X 페니실린/스트렙토마이신을 함유하는 배지로 켄칭하였다. 재현탁된 세포를 둥근-바닥 96-웰 플레이트에 이전하고 5 분 동안 1000 x g에서 원심분리하였다. 이어서 세포 펠렛을 1X DAPI를 함유하는 dPBS로 재현탁시키고, 플레이트를 Attune NxT 유세포 분석기 오토샘플러 내로 로딩하였다. 하기 게이팅 파라미터를 사용하여 Attune NxT 유세포 분석기를 실행하였다: 세포를 선택하기 위한 FSC-A x SSC-A, 단일 세포를 선택하기 위한 FSC-H x FSC-A, DAPI-음성 살아 있는 세포를 선택하기 위한 FSC-A x VL1-A, 및 티디토마토 양성 세포를 선택하기 위한 FSC-A x YL1-A.
mRHO 엑손 1 유전자좌에서의 인델의 NGS 분석: 형질감염 후 5 일에, 96-웰 플레이트 내의 처리된 티디토마토 mNPC를 dPBS로 세척하고 50 μL TrypLE 및 트립신(0.25%)으로 각각 15 및 5 분 동안 처리하였다. 세포 해리 후에, 처리된 웰을 DMEM, 10% FBS, 및 1X 페니실린/스트렙토마이신을 함유하는 배지로 켄칭하였다. 이어서 세포를 회전 침강시키고, 생성되는 세포 펠렛을 PBS로 세척한 후, 제조사의 설명서에 따라 Zymo 미니 DNA 키트를 사용하여 gDNA 추출을 위해 이들을 가공하였다. 마우스 RHO 엑손 1 유전자좌에서 발생하는 편집 수준을 평가하기 위해, 200 ng의 gDNA로부터 프라이머의 세트(Fwd 5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNGCAGCCTTGGTCTCTGTCTACG-3'(서열 번호 40595); Rev 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCCCAGTCTCTCTGCTCATACC-3'(서열 번호 40596))로 앰플리콘을 증폭하고, 비드-정제한 후(Beckman coulter, Agencourt Ampure XP), 재-증폭하여 illumina 어댑터 서열을 혼입하였다. 구체적으로, 이들 프라이머는 Illumina 판독 및 2개의 서열뿐만 아니라 고유 분자 식별자(UMI)로서 기능하는 16 nt 무작위 서열을 도입하기 위한 부가적인 서열을 5′ 단부에 함유하였다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석기 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq 상에서 앰플리콘을 서열분석하였다. 서열분석으로부터의 원시 fastq 파일은 하기와 같이 가공되었다: (1) 프로그램 cutadapt(v. 2.1)를 사용하여 품질 및 어댑터 서열을 위해 서열을 트리밍하였고; (2) 프로그램 flash2(v2.2.00)를 사용하여 판독 1 및 판독 2로부터의 서열을 단일 삽입 서열로 병합하였고; (3) 예상되는 앰플리콘 서열 및 스페이서 서열과 함께, 프로그램 CRISPResso2(v 2.0.29)를 통해 공통 삽입 서열을 실행하였다. 이 프로그램은 스페이서의 3′ 단부 주위의 윈도우(스페이서의 3′ 단부로부터 -3 bp에 중심이 있는 30 bp 윈도우)에서 변형된 판독의 %를 정량화한다. CasX 분자의 활성은 이 윈도우 내의 임의의 위치에 삽입, 치환, 및/또는 결실을 함유하는 판독의 총 %로서 정량화되었다.
결과:
선행 검정에서 조작된 돌연변이는 뉴클레아제의 전반적인 활성, 특이성 둘 모두를 증가시키는 능력을 갖는 CasX 변이체를 확인했을 뿐만 아니라, CTC-PAM 부위를 표적화하는 스페이서로 활성을 증가시켰다. CasX 491 단백질에 대한 이들 돌연변이는 CasX 변이체 단백질 515, 527, 528, 535, 536, 및 537을 생성하였다(서열에 대해서는 표 3 참조).
gRNA 스캐폴드 174 또는 235 및 다중의 관심 게놈 유전자좌를 표적화하는 상이한 스페이서(가이드 및 스페이서의 인코딩 서열은 표 18 및 표 19에 제공됨)와 쌍을 이루는 이들 CasX 변이체 단백질에 의해 매개된 표적-내 편집 수준을 정량화하기 위해 다중 편집 스크린을 수행하였다. ITR2 서열에 의해 플랭킹된, CMV 프로모터의 제어 하에 Cas X 뿐만 아니라, 인간 U6 프로모터의 제어 하에 스캐폴드-스페이서의 발현을 구동하는 작제물을, AAV 골격 p59 내로 클로닝하였다. mNPC-tdT 리포터 세포주를 사용하여 내인성 마우스 RHO 엑손 1 유전자좌(스페이서 11.39, CTC PAM, 도 48a)에서 단일-절단 효율을 평가하였다. ARPE-19 유래 세포주 내에 통합된 이중 리포터 시스템을 또한 사용하여 외인성으로 발현된 인간 WT Rho 유전자좌(스페이서 11.41, CTC PAM)에서 또는 P23H-RHO 유전자좌(스페이서 11.43, CTC PAM, 도 48b)에서 표적-내 편집을 평가하였다.
2개의 상이한 용량, 1000 ng 및 500 ng에서 마우스 NPC 세포주 내의 뉴클레오펙션을 통해, 스페이서 11.39를 갖는 CasX 단백질 변이체를 시험하였다. 작제물을 모 CasX 491 활성에 비교하였다. 스캐폴드 174 및 스페이서 11.30과 함께 CasX 535 및 537을 발현하는 AAV 작제물은 CasX 변이체 중 임의의 것의 mRHO 엑손 1 유전자좌에서 최대 편집 활성을 입증하였으며(% 편집으로, 도 48a), 이는 스페이서 11.37을 갖는 단백질 변이체의 뉴클레오펙션에 의해 나타난 증가된 표적-외 절단(표적화 돌연변이체 P23H-Rho 대립유전자, 도 48b) 없이, CasX 491에 비교하여 1.5-배 증가되었다(도 48c, 1로 정규화됨).
이어서 돌연변이된 변이체를 갖는 마우스 RHO 유전자좌에서 관찰된 개선이, 더 임상적으로-관련되는 인간 RHO 유전자좌에서 나타나는지 여부를 결정하기 위해 실험을 수행하였다. 인간 RHO를 표적화하는, 스페이서 11.41 또는 스페이서11.43을 갖는 sgRNA-스캐폴드 235와 쌍을 이루는 CasX 변이체 단백질을 발현하는 작제물로 이중 리포터 ARPE-19 세포주를 뉴클레오펙션시켰다. CasX 535 및 537은 또한, 외인성 WT-RHO-GFP 유전자좌를 표적화하는 경우에 CasX 491에 비교하여 1.5-배를 초과하는 증가된 편집 활성을 나타냈다(Rho-GFP- 세포의 2.4% 편집에 비교하여 각각 약 4.3% 및 4.1% 편집, 도 49a 및 도 49b). CasX 변이체 515, 527, 및 536을 발현하는 작제물은 CasX 491과 유사한 수준으로 편집하였다. 흥미롭게, P23H-RHO-mscarlet 유전자좌를 표적화하는 스페이서를 사용하는 경우, 모든 변이체 단백질은 CasX 491에 비교하여 개선된 편집을 입증하였다. 최고 활성 수준은 CasX 527(2-배 증가) 및 CasX 535(1.8-배 증가)를 발현하는 작제물에 의해 달성되었다.
최종적으로, 본 발명자들은 이들 단백질 변이체가 AAV 내에 효율적으로 패키징되고 바이러스에 의해 전달될 경우에 효력을 유지하였다는 것을 입증하고자 하였다. CasX 527, 535, 및 537 및 스페이서 11.39를 갖는 가이드 스캐폴드 235를 발현하는 AAV 벡터로 형질도입된 mNPC(표적 내, 마우스 WT RHO)는 3.0e+5 MOI에서의 형질도입에 의한 AAV CasX 491 및 스페이서 11.39를 갖는 가이드 스캐폴드 235에 비교하여 표적-내 유전자좌에서 증가된 활성을 나타냈다(2-배 초과의 증가, 도 50a 및 도 50b). 활성의 배수-개선은 용량-의존적 방식으로 관찰되었다.
이들 결과는, 구조적 돌연변이를 갖는 CasX 변이체를 조작하여 치료 관련 게놈 표적, 예컨대 마우스 및 인간 RHO 엑손 1 유전자좌에서 이중 리포터 시스템 내의 증가된 편집 활성을 유발할 수 있다는 것을 지지한다. 추가로, 새로-특성화된 변이체는 전반적으로 1.5 내지 2-배의 활성의 증가를 나타냈지만, 이들은 대립유전자-특이적 표적화를 유지했으며, 1-bp 불일치 스페이서를 갖는 표적-외 절단은 검출되지 않았다. 이는 대립유전자-특이적 치료 전략, 예컨대 adRP P23H Rho에서의 편집에 있어서 유의미하며, 여기서 돌연변이된 대립유전자는 WT 서열로부터 1개의 뉴클레오티드만큼 상이하다(스페이서 11.37에 의해 표적화됨). 본 연구는 P23H RHO 구조 및 유전자독성 연구뿐만 아니라, 다른 치료 표적을 위해 설계된 AAV 벡터 내의 스캐폴드 235를 갖는 CasX 변이체 527, 535, 536의 용도를 추가로 검증한다.
실시예 15: CasX 및 표적화된 가이드를 갖는 AAV 작제물은 C57BL/6J 마우스에서 생체내에서 P23 RHO 유전자좌를 편집한다
P23 잔기를 치료 관련 수준으로 표적화하는 스페이서와 함께, 마우스 망막 내의 내인성 RHO 유전자좌를 생체내에서 편집하는 CasX의 능력을 입증하여, P23H 마우스 질환 모델에서의 실험의 타당성을 보여주고 정보를 제공할 개념 증명 데이터를 생성하기 위해 실험을 수행하였다. 여기서, 본 발명자들은 CasX 변이체 491 및 가이드 변이체 174, 및 마우스 RHO 유전자의 P23 유전자좌를 표적화하는 스페이서가 망막하 주사될 경우에 망막 내에 유의하고 검출가능한 것을 생성할 수 있는지 여부를 평가하였으며, 2개의 상이한 바이러스 용량(1.0e+9 및 1.0e+10 vg)의 효능 및 안전성을 평가하였다. 간상 광수용체의 10%의 구조는 AdRP의 경우에 시력을 회복시킬 수 있다. 그러므로, 망막에서 간상 광수용체 내의 RHO 유전자좌의 10%를 편집하는 것은 돌연변이체 로돕신 단백질의 수준을 감소시키고 간상 광수용체 퇴행을 예방함으로써 질환 맥락에서 치료적 이익을 제공할 수 있다.
재료 및 방법:
AAV 플라스미드 및 바이러스 벡터의 생성
CMV 프로모터의 제어 하의 CasX 변이체 491 및 U6 프로모터 하의 RNA 가이드 변이체 174 / 스페이서 11.30(AAGGGGCTCCGCACCACGCC(서열 번호 40502), P23 잔기에서 마우스 RHO 엑손 1을 표적화함)을 AAV2 ITR로 플랭킹된 pAAV 플라스미드 내로 클로닝하였다. AAV.491.174.11.30 벡터는 삼중-형질감염 방법을 사용하여 HEK293 세포에서 생성하였다.
망막하 주사
C57BL/6J 마우스는 Jackson Laboratories로부터 얻어졌으며, 정상 12 시간 명/암 주기로 유지되었다. 주령 5 내지 6 주의 마우스에 망막하 주사를 수행하였다. 아이소플루란 흡입으로 마우스를 마취시켰다. 프로파라카인(0.5%)을 각막 상에 국소 적용하고, 수 방울의 트로피카마이드(1%) 및 페닐에프린(2.5%)으로 안구를 산동시켰다. 수술 중에 genteal 겔로 안구 윤활을 유지하였다. 수술 현미경 하에, 적도부에서, 그리고 그 다음에 주변부에, 초미세 30 1/2-게이지 1회용 바늘을 공막을 통해 통과시켜 유리체강 내로 작은 구멍을 생성하였다. 평활-말단 바늘을 사용하여, 1 내지 1.5 μL의 바이러스를 RPE와 망막층 사이의 망막하 공간 내로 직접 주사하였다. 각각의 실험군(n=5)은 한쪽 안구에 1e+9 vg 또는 1e+10 바이러스 게놈(vg)/안구를 주사하고, 반대쪽 안구에 AAV 제형 완충액을 주사하였다.
NGS 분석
주사-후 3 주에, 동물을 희생시키고 안구를 새로운 PBS 중에 적출하였다. 전체 망막을 안구 컵으로부터 단리하고 제조사의 설명서에 따라 DNeasy Blood & Tissue Kit(Qiagen)를 사용하여 gDNA 추출을 위해 가공하였다. 200 ng의 gDNA로부터 마우스 RHO, 엑손 1 유전자좌를 표적화하는 프라이머의 세트(Fwd 5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNGCAGCCTTGGTCTCTGTCTACG-3'(서열 번호 40595); Rev 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCCCAGTCTCTCTGCTCATACC-3'(서열 번호 40596))로 앰플리콘을 증폭하고, 비드-정제한 후(Beckman coulter, Agencourt Ampure XP), 재-증폭하여 illumina 어댑터 서열을 혼입하였다. 구체적으로, 이들 프라이머는 Illumina 판독 및 2개의 서열뿐만 아니라 고유 분자 식별자(UMI)로서 기능하는 16 nt 무작위 서열을 도입하기 위한 부가적인 서열을 5′ 단부에 함유하였다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석기 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq 상에서 앰플리콘을 서열분석하였다. 서열분석으로부터의 원시 fastq 파일은 하기와 같이 가공되었다: (1) 프로그램 cutadapt(v. 2.1)를 사용하여 품질 및 어댑터 서열을 위해 서열을 트리밍하였고; (2) 프로그램 flash2(v2.2.00)를 사용하여 판독 1 및 판독 2로부터의 서열을 단일 삽입 서열로 병합하였고; (3) 예상되는 앰플리콘 서열 및 스페이서 서열과 함께, 프로그램 CRISPResso2(v 2.0.29)를 통해 공통 삽입 서열을 실행하였다. 이 프로그램은 스페이서의 3′ 단부 주위의 윈도우(스페이서의 3′ 단부로부터 -3 bp에 중심이 있는 30 bp 윈도우)에서 변형된 판독의 %를 정량화한다. CasX 분자의 활성은 이 윈도우 내의 임의의 위치에 삽입, 치환, 및/또는 결실을 함유하는 판독의 총 %로서 정량화되었다.
면역조직학:
주사-후 3 내지 4 주에 마우스를 안락사시켰다. 적출된 안구를 4℃에서 하룻밤 10% 포르말린에 넣었다. 망막을 안구 컵으로부터 절개해 내고, PBS에 완전히 헹구고, 15% 내지 30% 수크로스 구배에 침지시켰다. 조직을 최적 절단 온도(OCT)에 포매시키고, 드라이 아이스 상에서 동결시킨 후, -80 'C 저장에 이전하였다. 동결절편기를 사용하여 20 μM 절편을 절단하였다. 절편을 1 시간 이상 동안 실온에서 차단 완충액(2% 정상 염소 혈청, 1% BSA, 0.1% Triton-X 100) 중에 차단한 후에 항체 표지하였다. 사용된 항체는 항-마우스 HA(abcam, 1:500) 및 Alexa Fluor 488 토끼 항-마우스(Invitrogen, 1:2000)였다. 절편을 DAPI로 대조염색하여 핵을 표지하고, 슬라이드 상에 마운팅하고, 형광 현미경 상에서 영상화하였다.
결과:
본 발명자들은 마우스 망막에서 P23 RHO 유전자좌를 편집하는 CasX의 능력을 평가하였다. 2개의 치료 관련 용량, 1.0e+9 및 1.0E+10 vg의 AAV-CasX.491.174.11.30을 주령 5 내지 6 주의 C57BL/6J 마우스의 망막하 공간에 투여하였다. 주사-후 3 주에, 망막을 수확하고 NGS 및 CRISPResso 분석 파이프라인을 통해 편집 수준을 정량화하였다. 스페이서 11.30은 RHO의 제1 엑손의 시작점에 위치하는 WT P23 게놈 유전자좌(도 51)를 표적화한다. CasX-491.174.11.30의 과발현은 허위-주사 망막에 비교하여 처리-망막에서 mRHO 엑손 1 유전자좌의 유의한 용량-의존적 편집으로 이어졌다(도 52a 내지 도 52b). 좌측 패널(도 52a)은 마우스 참조 게놈에 비교하여 AAV-CasX 또는 허위-주사 망막 내의 마우스 P23 RHO 유전자좌에서 NGS에 의해 검출된 총 인델의 % 단위의 정량화를 나타낸다. 우측 패널(도 52b)은 RHO 단백질에서 프레임시프트 돌연변이로 이어질 것으로 예측된 편집의 분율(%)을 나타낸다. 데이터는 실험 코호트당 6 내지 8 마리의 동물로부터의, 전체 망막으로부터의 편집 결과의 NGS 판독값의 평균으로서 제공된다. 최고 AAV 용량인 1e+10 vg/안구는, 1.0e+9 vg 용량에 비교하여 인델 비율을 4-배만큼 증가시켰으며, 각각 40.3 ±22% 대 12.3±5%의 검출된 RHO 편집이었다. CasX.491에 의해 생성된 인델 중 대부분은 결실이었으며(좌측 패널), 이는 프레임시프트-돌연변이의 높은 빈도(각각 1.0e+9 및 1.0e+10 vg/용량에 대해 64.7 대 76.9%), 및 가설적으로 높은 수준의 RHO 단백질 녹 다운으로 나타날 것으로 예측된다. 이들 결과는, P23H+/- 마우스 모델에서 돌연변이체 P23H 유전자좌의 대립유전자-특이적 표적을 구동하는 스페이서를 이용하여, CasX는 간상 광수용체의 10%를 효율적으로 편집할 수 있었으며, 편집 중 대부분은 돌연변이체 P23H Rho를 녹-다운시키고 광수용체 퇴행을 유의하게 지연시키는 것으로 나타난다는 것을 제시한다.
도 53a 내지 도 53f에 나타낸 바와 같이, 주사한 망막 단면 상에 수행된 면역조직화학은 광수용체층 내의 CasX 발현을 확인했을뿐만 아니라, 내층으로의 바이러스의 확산을 나타냈다. 처리군은 1.0e+9 vg의 AAV-CasX(도 53b 및 도 53e); 1.0e+10 vg AAV-CasX(도 53c 및 도 53f); 또는 PBS였다(도 53a 및 도 53d). 1e9 vg(도 53b 및 도 53e) 및 1e10 vg(도 53c 및 도 53f) 둘 모두를 주사한 망막에서, 외핵층(ONL)뿐만 아니라 외절에 위치하는 광수용체 세포체에서의 항-HA 항체 염색(도 53e 및 도 53f의 하단 패널)에 의해 HA-태깅된 CasX의 수준을 평가하였다. 허위(도 53a 및 도 53c) 주사를 받은 대조군 망막은 RPE/공막에서 HA 염색에 대한 배경 수준의 신호를 나타냈을 뿐이며(도 53d) ONL/INL 층에서는 검출가능한 수준을 갖지 않았다. 부가적으로, 총체적 조직학적 분석은 CasX 작제물을 패키징하는 AAV의 망막하 투여 후에 망막 구조가 유지되었음을 나타냈다.
실험 조건 하에, 결과는 CasX 491, 스캐폴드 174, 및 마우스 P23 RHO 유전자좌를 표적화하는 스페이서가 AAV를 통해 쥐과 망막에 망막하 전달될 경우에 P23 마우스 유전자좌에서 치료-관련 수준의 편집을 달성할 수 있다는 개념 증명을 입증한다.
실시예 16: 광수용체에서의 CasX의 AAV-매개 선택적 발현은 생체내에서 NGS에 의한 강력한 표적-내 활성 및 구조적 분석을 유발한다.
야생형 망막에서 치료 관련 수준으로 P23 잔기를 표적화하는 스페이서와 함께, 선택적 광수용체 프로모터로 광수용체의 발현을 제한함으로써 마우스 망막에서 광수용체를 선택적으로 편집하는 CasX의 능력을 입증하기 위해 실험을 수행하였다. 본 발명자들은 간상 광수용체 내에 GFP만을 발현하는 유전자이식 리포터 모델에서 편집과 단백질체 수준 사이의 강력한 상관관계를 추가로 입증한다. 여기서, 본 발명자들은 CasX 변이체 491 및 통합된 GFP 유전자좌를 표적화하는 스페이서를 갖는 가이드 변이체 174가 망막하 주사될 경우에 망막에서 유의하고 검출가능한 편집 수준을 생성하는지 여부를 평가하고, 2개의 상이한 바이러스 용량(안구당 1.0e+9 및 1.0e+10 vg)의 효능을 평가하였다.
방법:
AAV 플라스미드 및 바이러스 벡터의 생성: 다양한 광수용체-특이적 프로모터(내인성 로돕신 RHO 프로모터에 기초하는 RP1, RP2, RP3, 및 내인성 G-커플링된 망막 키나제 GRK1 프로모터에 기초하는 RP4, RP5; 표 22의 서열)뿐만 아니라 CMV 프로모터의 제어 하의 CasX 변이체 491, 및 U6 프로모터 하에 P23 잔기에서 마우스 RHO 엑손 1을 표적화하는 sgRNA 가이드 변이체 174 / 스페이서 11.30(AAGGGGCTCCGCACCACGCC(서열 번호 40502))을 AAV2 ITR로 플랭킹된 pAAV 플라스미드 내로 클로닝하였다. 각각의 측면에서 EcoRI 제한 부위로 증폭된 WPRE 서열을 EcoRI 분해된 p59.RP4.491.174.11.30, 및 p59.RP5.491.174.11.30 플라스미드 내로 삽입하였다. Nrl-GFP 모델에서의 효능 연구를 위해, 스페이서 영역을 플랭킹하는 bbsI 제한 부위를 갖는 골든 게이트 클로닝을 사용하여, GFP를 표적화하는 스페이서 4.76(TGTGGTCGGGGTAGCGGCTG(서열 번호 17))을 AAV-시스 플라스미드 p59.RP1.491.174 내로 클로닝하였다.
[표 22]
AAV 벡터 생성: 모 HEK293T로부터 현탁액 HEK293T 세포를 적응시키고 FreeStyle 293 배지 중에 성장시켰다. 형질감염 당일에 500 mL 배양물(110 rpm으로 교반되는 1 L 삼각 플라스크)을 2e+6 세포/mL의 밀도로 희석하였다. 무-혈청 OPTIMEM 배지 중에 PEIMax(Polysciences)를 사용하여 복제를 위한 아데노바이러스 헬퍼 유전자 및 AAV rep/cap 게놈을 공급하는 플라스미드와 함께 ITR 반복에 의해 플랭킹된 이식유전자를 갖는 무-내독소 pAAV 플라스미드를 공동-형질감염시켰다. 형질감염-후 3 시간에 배양물을 10% CDM4HEK293(HyClone)으로 보충하였다. 3 일 후에, 배양물을 1000 rpm에서 10 분 동안 원심분리하여 세포 펠렛으로부터 상청액을 분리하였다. 상청액을 40% PEG 2.5 M NaCl(8% 최종 농도)과 혼합하고 얼음 상에서 2 시간 이상 동안 인큐베이션하여 AAV 바이러스 입자를 침전시켰다. 대부분의 AAV 벡터를 함유하는 세포 펠렛을 용해 배지(0.15 M NaCl, 50 mM 트리스 HCl, 0.05% Tween, pH 8.5) 중에 재현탁시키고, 얼음 상에서 초음파처리하고(15 초, 30% 진폭), 30 분 동안 37℃에서 Benzonase(250 U/μL, Novagen)로 처리하였다. 이어서 비정제 용해물 및 PEG-처리된 상청액을 4000 rpm에서 20 분 동안 4℃에서 회전시켜 PEG 침전된 AAV(펠렛)를 무-세포 잔해 비정제 용해물(상청액)과 함께 재현탁시키고 0.45 μM 필터를 사용하여 추가로 청징화하였다. 친화도 크로마토그래피(POROS CaptureSelect AAVX, ThermoFisher)를 사용하여 AAV 용해물을 정제하였다. 용리액을 완충액 교환하고 PBS+200 mM NaCl+0.001% Pluronic 중에 농축하였다. 바이러스 게놈 역가를 결정하기 위해, 비정제 용해물 바이러스로부터의 1 μL를 DNase 및 ProtK로 분해한 후, 정량 PCR이 이어졌다. AAV2-ITR 내에 위치하는 62 bp-단편(Fwd 5'-GGAACCCCTAGTGATGGAGTT -3'(서열 번호 40804); Rev 5'-CGGCCTCAGTGAGCGA-3'(서열 번호 40805), 탐침 5'-CACTCCCTCTCTGCGCGCTCG-3'(서열 번호 40806))을 증폭하도록 설계된 IDT primetime 마스터 믹스 및 프라이머의 세트 및 6'FAM/Zen/IBFQ 탐침(IDT)으로 구성된 25 μL qPCR 반응에 5 μL의 분해된 바이러스를 사용하였다. AAV ITR 플라스미드를 참조 표준으로 사용하여 바이러스 샘플의 역가(바이러스 게놈(vg)/mL)를 계산하였다. QPCR 프로그램은 95 'C에서 5 분 동안의 초기 변성 단계에 이어서, 40 주기의 95 'C에서 1 분 동안의 변성 및 60℃에서 1 분 동안의 어닐링/연장으로서 설정되었다.
AAV 벡터 AAV.RP1.491.174.4.76은 노스 캐롤라이나 대학교(UNC) 벡터 코어에서 삼중 형질감염 방법을 사용하여 HEK239T에서 생성되었다.
망막하 주사: C57BL/6J 마우스 및 이종접합 Nrl-GFP/C57BL/5J 마우스(Jackson Laboratories)는 정상 12 시간 명/암 주기로 유지되었다. 주령 4 내지 5 주의 마우스에 망막하 주사를 수행하였다. 아이소플루란 흡입으로 마우스를 마취시켰다. 프로파라카인(0.5%)을 각막 상에 국소 적용하고, 수 방울의 트로피카마이드(1%) 및 페닐에프린(2.5%)으로 안구를 산동시켰다. 수술 중에 genteal 겔로 안구 윤활을 유지하였다. 수술 현미경 하에, 적도부에서, 그리고 그 다음에 주변부에, 초미세 30 1/2-게이지 1회용 바늘을 공막을 통해 통과시켜 유리체강 내로 작은 구멍을 생성하였다. 평활-말단 바늘을 사용하여, 1 내지 1.5 μL의 바이러스를 RPE와 망막층 사이의 망막하 공간 내로 직접 주사하였다. 실험군으로부터의 각각의 마우스는 한쪽 안구에 1.0e+9, 5.0e+9, 또는 1.0e+10 게놈(vg)/안구를 주사하고, 반대쪽 안구에 AAV 제형 완충액을 주사하였다.
웨스턴 블롯: 단백질 용해물을 생성하기 위해, 안구를 새로 적출하고, 얼음-냉각 PBS 중에 절개하고, 드라이 아이스 중에 급속-동결하고, 망막당 개별 1.5 mL 에펜도르프 튜브에서 프로테아제 억제제(5 mg/mL 최종 농도), DTT 및 PMSF(각각 최종 농도 1 mM)로 새로 보충된 RIPA 완충액(150 mM NaCl, 1% NP40, 0.5% 데옥시콜레이트, 0.1% SDS, 50 mM 트리스 pH 8.0, dH20)에 재현탁시켰다. 무-RNA 1회용 펠렛 막자(Fisher scientific, #12-141-364)를 사용하여 망막 조직을 작은 조각으로 추가로 균질화하고, 튜브를 가끔 뒤집어 온화하게 혼합하면서 얼음 상에서 30 분 동안 인큐베이션하였다. 이어서 샘플을 4 oC에서 최고 속도로 20 분 동안 원심분리하여 게놈 DNA를 펠렛화하였다. 이어서 단백질 추출물 및 gDNA 세포 펠렛을 분리하였다. 단백질 추출물을 위해, 상청액을 수집하였다. BCA 검정에 의해 단백질 농도를 결정하고 Tecan 플레이트 판독기 상에서 판독하였다. 마우스 망막의 총 단백질 용해물 15 μg을 SDS-PAGE(Bio-Rad TGX 겔)에 의해 분리하고 Transblot Turbo를 사용하여 폴리비닐리덴 다이플루오라이드 막에 이전하였다. 막을 1 시간 동안 실온에서 5% 탈지 분유로 차단하고 4℃에서 1차 항체와 함께 하룻밤 인큐베이션하였다. 이어서, 블롯을 Tween-20을 갖는 트리스-완충 식염수(137 mM 소듐 클로라이드, 20 mM 트리스, 0.1% Tween-20, pH 7.6)로 3회 세척하고 호스래디쉬 퍼옥시다제-접합된 항-토끼 또는 항-마우스 2차 항체와 함께 1 시간 동안 실온에서 인큐베이션하였다. 3회 세척한 후에, 화학발광 기질 ECL을 사용하여 막을 현상하고 ChemicDoc (X) 상에서 영상화하였다. 블롯 영상을 ImageLab으로 가공하였다.
NGS 분석: 동물을 희생시키고 안구를 새로운 PBS 중에 적출하였다. 웨스턴 블롯 섹션에 이전에 기재된 바와 같이 안구 컵으로부터 전체 망막을 단리하고 gDNA 추출을 위해 가공하였다. 제조사의 설명서에 따라 DNeasy Blood & Tissue Kit(Qiagen)로 게놈 gDNA 펠렛을 가공하였다. 200 ng의 gDNA로부터 관심 게놈 영역을 표적화하는 프라이머의 세트(표 23)로 앰플리콘을 증폭하였다. 앰플리콘을 비드-정제한 후(Beckman coulter, Agencourt Ampure XP), 재-증폭하여 illumina 어댑터 서열을 혼입하였다. 구체적으로, 이들 프라이머는 Illumina 판독 및 2개의 서열뿐만 아니라 고유 분자 식별자(UMI)로서 기능하는 16 nt 무작위 서열을 도입하기 위한 부가적인 서열을 5′ 단부에 함유하였다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석기 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq 상에서 앰플리콘을 서열분석하였다. 서열분석으로부터의 원시 fastq 파일은 하기와 같이 가공되었다: (1) 프로그램 cutadapt(v. 2.1)를 사용하여 품질 및 어댑터 서열을 위해 서열을 트리밍하였고; (2) 프로그램 flash2(v2.2.00)를 사용하여 판독 1 및 판독 2로부터의 서열을 단일 삽입 서열로 병합하였고; (3) 예상되는 앰플리콘 서열 및 스페이서 서열과 함께, 프로그램 CRISPResso2(v 2.0.29)를 통해 공통 삽입 서열을 실행하였다. 이 프로그램은 스페이서의 3′ 단부 주위의 윈도우(스페이서의 3′ 단부로부터 -3 bp에 중심이 있는 30 bp 윈도우)에서 변형된 판독의 %를 정량화한다. CasX 분자의 활성은 이 윈도우 내의 임의의 위치에 삽입, 치환, 및/또는 결실을 함유하는 판독의 총 %로서 정량화되었다.
[표 23]
면역조직학: 적출된 안구를 4℃에서 하룻밤 10% 포르말린에 넣었다. 망막을 안구 컵으로부터 절개해 내고, PBS에 완전히 헹구고, 15% 내지 30% 수크로스 구배에 침지시켰다. 조직을 최적 절단 온도(OCT)에 포매시키고, 드라이 아이스 상에서 동결시킨 후, -80 'C 저장에 이전하였다. 동결절편기를 사용하여 20 μM 절편을 절단하였다. 절편을 1 시간 이상 동안 실온에서 차단 완충액(2% 정상 염소 혈청, 1% BSA, 0.1% Triton-X 100) 중에 차단한 후에 항체 표지하였다. 사용된 항체는 항-마우스 HA(abcam, 1:500); Alexa Fluor 488 토끼 항-마우스(Invitrogen, 1:2000)였다. 슬라이드를 Hoechst 33342(Thermo Fisher Scientific, 영국 헤멀 헴프스테드 소재)로 대조염색하고 Prolong Diamond 안티페이드 마운팅 배지(Thermo Fisher Scientific, 영국 헤멀 헴프스테드 소재)로 마운팅하였다. 이어서 LSM-710 도립 공초점 현미경 시스템(Carl Zeiss, 영국 케임브리지 소재)을 사용하여 공초점 형광 영상화를 수행하였다.
결과:
스페이서 11.30과 함께, 광수용체에서 강력한 수준의 편집을 구동하는 프로모터를 확인하기 위한 다중의 조작된 망막 및 편재성 프로모터의 제어 하에 CasX 491을 발현하는 AAV 벡터를 망막하 주사한 주령 3 주의 C57BL/6J에서 mRHO 엑손 유전자좌에서의 편집 수준을 정량화하였다. Rod-특이적 RP1, RP2, RP3, RP4 프로모터는 매우 유사한 수준의 편집(약 20%)을 매개하였다. 벡터 AAV.RP5.491.174.11.30 및 AAV RP5.491.WPRE.174.11.30은 더 낮은 발현 수준(각각 약 10 및 8%, 도 54a)으로 이어졌다. 본 발명자들은, 광수용체에서 높은 수준의 생체내 편집을 달성하는 것뿐만 아니라 AAV 내에 패키징될 유의하게 더 작은 크기의 이식유전자 플라스미드를 제조하는 것(유사한 수준의 활성을 갖는 다른 작제물보다 100 내지 400 bp 더 짧음(도 54b))을 목표로, 추가의 기능적 연구 및 분포 연구를 위한 가장 강력한 벡터로서 최적화된 벡터 AAV.RP1.491.174.11.30을 확인하였다. 이러한 최적화된 작제물은, 간상-특이적 또는 단백질의 녹 다운을 검증하기 위한 분야에서 사용되는 편리한 모델인, 간상 광수용체에서 GFP를 발현하는 유전자이식 모델에서 효능 연구를 수행함으로써 추가로 검증되었다. 효능을 연구하기 위해 AAV.RP1.491.174.4.76 벡터를 2개의 상이한 용량으로 주사하였다. 주사-후 4-주 및 12-주에, 본 발명자들은 NGS에 의해 통합된 GFP 유전자좌에서 편집의 수준을 정량화하였으며, 검출가능한 편집 수준을 관찰하였다. 1.0E+9 vg/안구 용량 아암에 의해, 본 발명자들은 약 8%의 편집 수준을 관찰하였다. 1.0e+10 vg를 주사한 증가된 용량군에 의해, 4-주에 10% 편집 수준이 검출가능하였으며, 이는 추적 조사 시점, 주사-후 12-주에 2-배만큼 증가되었다(도 55).
편집 수준은 구조적 분석 및 단백질체 분석에 의해 확인되었다. 주사-후 12-주 망막 용해물의 웨스턴 블롯 분석은 편집의 수준과 GFP 단백질의 감소 사이의 강력한 상관관계를 나타냈으며(도 56a 및 도 56c), 단백질 녹-다운은 전체-망막에서 5%에 불과한 편집으로 검출되었다. 1.0e+10 vg/안구 용량으로 AAV-CasX-처리된 망막에서 GFP 단백질 수준은 비히클군보다 유의하게 더 낮았다(도 56b).
이들 결과는 또한 GFP 형광의 생체내 안저 영상화에 의해 확인되었다. 상부 대 하부 망막 평균 회색 값의 비는 제12주까지 20% 및 50% GFP 형광의 감소를 나타냈다(도 57a). 시간 경과에 따른 GFP 형광의 완전한 감소는, 비히클군에 비교하여 주사한 망막에만 망막하 주사를 받은 사분위 내에서 가시적이었다(도 57b).
면역화학 염색은 간상 광수용체에서 GFP 단백질 발현의 감소를 확인하였다(도 58a 내지 도 58l). 대표적인 공초점 영상은 AAV 제형 완충액만을 주사한 망막에서 강력한 GFP 발현을 나타낸다. 전체 망막이 GFP를 발현하고 있으며, 이는 핵 염색과 일치한다(도 58a 내지 도 58c). AAV-매개 CasX 이식유전자 발현의 판독으로서, HA 발현은 검출가능하지 않았다(도 58d).
1.0e+9 및 1.0e+10을 주사한 망막은 전체 망막 절편에서 용량-의존적 방식으로 GFP 발현의 강력한 감소를 나타냈으며(도 58e 내지 도 58l), 이는 간상 외절(OS) 및 외핵층(ONL)만의 HA의 검출가능한 수준과 관련되었고, 간상 광수용체에 대한 프로모터 RP1 선택성을 확인한다. 고용량 처리는 주사한 망막의 완전한 녹다운(주사가 상부 구배(superior gradient)로 제한되므로, 전체-망막에서 약 50%의 GFP 녹다운)을 유발한 반면에, 1.0e+9vg 용량은 대조군(도 58c)에 비교하여 국소화된 영역에서 약 50%의 GFP 발현을 감소시켰다(도 58g 및 도 58k).
결과는 CasX 491, 스캐폴드 174, 및 마우스 P23 RHO 유전자좌를 표적화하는 스페이서가 AAV-매개 망막하 전달을 통해 치료 세포 표적인 간상-광수용체에서만 발현될 경우에 P23 마우스 유전자좌에서 치료-관련 수준의 편집을 달성할 수 있다는 개념 증명을 입증한다. 추가로, 광수용체 내에 GFP를 과발현하는 리포터 모델에서 통합된 GFP 유전자좌를 표적화하는 추적 조사 연구를 수행함으로써 벡터의 특이성 및 효능을 입증하였으며, 여기서 결과는 웨스턴 블롯, 안저 영상화, 및 조직학에 의해 평가된 단백질 녹-다운과 편집 수준 사이의 강력한 상관관계를 나타낸다.
실시예 17: CasX:gNA 시스템이 AAV를 통해 패키징되고 전달될 경우에 인간 신경 전구 세포를 편집할 수 있고 뉴런을 효율적으로 유도했다는 것을 입증함
시험관내에서 인간 신경 전구 세포(hNPC)의 편집 및 유도된 뉴런(iN)에 있어서 AAV-발현된 CasX:gNA 시스템의 효율을 입증하기 위해 실험을 수행하였다.
재료 및 방법:
AAV 작제물 클로닝:
CasX 변이체 491 및 가이드 스캐폴드 변이체 235를 이들 실험에 사용하였다.
hNPC에서 AAV-발현된 CasX:gNA 시스템의 편집 역량을 평가하기 위해, CasX 발현을 구동하는 UbC 프로모터 및 내인성 B2M 유전자좌를 표적화한, 스캐폴드 변이체 235 및 스페이서 7.37(GGCCGAGAUGUCUCGCUCCG; 서열 번호 379; 작제물 번호 183에 혼입됨)을 갖는 gRNA의 발현을 구동하는 Pol III 프로모터 스캐폴드를 함유하는 AAV 작제물을 표준 분자 클로닝 기술을 사용하여 생성하였다. 클로닝되고 서열-검증된 작제물을 맥시-프렙하고 품질 평가를 적용한 후에 AAV 생성을 위해 형질감염시켰다.
인간 iN에서 AAV-발현된 CasX:gNA 시스템의 편집 역량을 평가하는 실험을 위해, CasX 단백질 및 AAVS1-표적화 스페이서 31.12(UUCUCGGCGCUGCACCACGU; 서열 번호 41830; 작제물 번호 188에 혼입됨), 31.63
(CAAGAGGAGAAGCAGUUUGG; 서열 번호 41831; 작제물 번호 189에 혼입됨), 또는 31.82(GGGGCCUGUGCCAUCUCUCG; 서열 번호 41832; 작제물 번호 190)를 갖는 gRNA를 인코딩하는 AAV 작제물을, 기재된 바와 유사하게 생성하였다. 비-표적화 스페이서 0.1(AGGGGUCUUCGAGAAGACCC; 서열 번호 41833)을 또한 이들 실험에 사용하였다. 인간 iN에서 B2M 유전자좌를 편집하기 위해 gRNA 스페이서 7.37을 갖는 CasX 491의 발현을 구동하는 다양한 단백질 프로모터를 평가하는 실험을 위해, 이들 단백질 프로모터 변이체를 함유하는 AAV 작제물을 기재된 바와 유사하게 생성하였다(단백질 프로모터 변이체의 서열에 대해서는 표 24를 참조함). CasX 단백질을 인코딩하는 서열(표 21)을 제외하고는, AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다.
[표 24]
AAV 생성:
형질감염 당일에 FreeStyle 293 배지 중에 유지된 현탁액-적응된 HEK293T 세포를 20 내지 30 mL의 배지 중에 1.5E6 세포/mL로 시딩하였다. 무-혈청 Opti-MEM 배지 중에 PEI Max(Polysciences)를 사용하여 복제를 위한 아데노바이러스 헬퍼 유전자 및 AAV rep/cap 게놈을 공급하는 플라스미드와 함께 ITR 반복에 의해 플랭킹된 이식유전자를 갖는 무-내독소 pAAV 플라스미드를 공동-형질감염시켰다. 형질감염-후 3 시간에 배양물을 10% CDM4HEK293(HyClone)으로 보충하였다. 3 일 후에, 배양물을 원심분리하여 세포 펠렛으로부터 상청액을 분리하였다. 상청액을 40% PEG 2.5 M NaCl과 혼합하고 얼음 상에서 인큐베이션하여 AAV 바이러스 입자를 침전시켰다. 대부분의 AAV 벡터를 함유하는 세포 펠렛을 용해 배지(0.15 M NaCl, 50 mM 트리스 HCl, 0.05% Tween, pH 8.5) 중에 재현탁시키고, 얼음 상에서 초음파처리하고, 30 분 동안 37℃에서 Benzonase(250 U/μL, Novagen)로 처리하였다. PEG-처리된 상청액을 원심분리하여 침전된 AAV를 펠렛화한 반면에, 비정제 용해물을 원심분리하여 바이러스를 함유하는 상청액으로부터 세포 잔해를 제거한 후, 0.45 μm 필터를 사용하는 추가의 청징화를 위해 수집된 바이러스를 합하였다. 친화도 크로마토그래피(POROS CaptureSelect AAVX, ThermoFisher)를 사용하여 AAV 용해물을 정제하고, 용리액을 완충액 교환하고 PBS+200 mM NaCl+0.001% Pluronic 중에 농축하였다.
바이러스 게놈(vg) 역가를 결정하기 위해, 비정제 용해물 바이러스로부터의 1 μL를 DNase 및 ProtK로 분해한 후, 정량 PCR이 이어졌다. AAV2-ITR 내에 위치하는 62 bp-단편을 증폭하도록 설계된 IDT primetime 마스터 믹스 및 프라이머의 세트 및 6'FAM/Zen/IBFQ 탐침(IDT)으로 구성된 25 μL qPCR 반응에 5 μL의 분해된 바이러스를 사용하였다. AAV ITR 플라스미드를 참조 표준으로 사용하여 바이러스 샘플의 역가(vg/mL)를 계산하였다. qPCR 프로그램은 95 'C에서 5 분 동안의 초기 변성 단계에 이어서, 40 주기의 95 'C에서 1 분 동안의 변성, 및 60℃에서 1 분 동안의 어닐링/연장으로서 설정되었다.
hNPC의 시험관내 배양:
불멸화 hNPC를 hNPC 배지(GlutaMax, 10 mM HEPES, 1X NEAA, 비타민 A가 없는 1X B-27, 성장 인자 hFGF 및 EGF가 보충된 1X N2, Pen/Strep, 및 2-메르캅토에탄올을 갖는 DMEM/F12) 중에 배양하였다. 시험 전에, TrypLE로 세포를 부양시키고, 온화하게 재현탁시켜 신경구를 해리시키고, 배지로 켄칭하고, 회전 침강시키고, 새로운 배지 중에 재현탁시켰다. AAV 형질도입 전 24 시간에 세포를 계수하고 PLF(폴리-DL-오르니틴 하이드로브로마이드, 라미닌, 및 피브로넥틴)로 코팅된 96-웰 플레이트 상에 웰당 약 10,000개의 세포의 밀도로 직접 시딩하였다.
hNPC의 AAV 형질도입에 이어서, HLA 면역염색 및 유세포 분석법:
PLF-코팅된 96-웰 플레이트 상에 약 7,000개의 세포/웰의 hNPC를 시딩하였다. 24 시간 후에, 시딩된 세포를 CasX:gRNA 시스템을 발현하는 AAV로 처리하였다. 모든 바이러스 감염 조건은, 1E4 내지 1E6 vg/세포 범위의 MOI의 3-배 연속 희석에서, 실험 벡터들 사이에서 정규화된 바이러스 게놈(vg)의 수를 이용하여, 이중실험 이상으로 수행되었다. 형질도입-후 5 일에, AAV-처리된 hNPC를 TrypLE로 부양시켰다. 세포 해리 후에, 염색 완충액(dPBS 중의 3% 소태아 혈청)을 켄칭에 사용하였다. 해리된 세포를 둥근-바닥 96-웰 플레이트에 이전한 후에, 원심분리 및 염색 완충액을 이용한 세포 펠렛의 재현탁이 이어졌다. 또 한번의 원심분리 후에, 세포 표면 상에 발현되는 B2M-의존적 HLA 단백질을 검출할 항체(BioLegend)를 함유하는 염색 완충액 중에 세포 펠렛을 재현탁시켰다. HLA 면역염색 후에, 세포를 DAPI로 염색하여 세포 핵을 표지하였다. Attune NxT 유세포 분석기를 사용하여 HLA+ hNPC를 측정하였다. HLA 단백질 발현의 감소 또는 결여는 이들 hNPC 내의 B2M 유전자좌에서의 성공적인 편집을 표시할 것이다. 차세대 서열분석(NGS)을 통한 게놈 DNA 추출 및 편집 분석을 위해, 형질도입된 hNPC의 서브세트를 또한 부양시켰다.
NGS 가공 및 분석:
수확된 세포로부터 게놈 DNA(gDNA)를 제조사의 설명서에 따라 Zymo Quick-DNA Miniprep Plus 키트를 사용하여 추출하였다. 200 ng의 추출된 gDNA로부터의 관심 영역을 표적 유전자좌, 예컨대 인간 B2M 유전자좌에 특이적인 프라이머의 세트로 증폭함으로써 표적 앰플리콘을 형성하였다. 이들 유전자-특이적 프라이머는 Illumina 어댑터 및 16-뉴클레오티드 고유 분자 식별자를 도입하기 위해 5′ 단부에 부가적인 서열을 함유한다. 증폭된 DNA 생성물을 Ampure XP DNA 클린업 키트로 정제하였다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq 상에서 앰플리콘을 서열분석하였다. cutadapt v2.1, flash2 v2.2.00, 및 CRISPResso2 v2.0.29를 사용하여 서열분석으로부터의 원시 fastq 파일을 품질-관리하고 가공하였다. 스페이서의 3′ 단부 주위의 윈도우(스페이서의 3′ 단부로부터 -3 bp에 중심이 있는 30 bp 윈도우)에서 참조 서열에 비교하여 삽입 또는 결실(인델)을 함유하는 것에 대해 각각의 서열을 정량화하였다. 각각의 샘플에 대해 CasX 활성은 이 윈도우 내의 임의의 위치에 삽입, 치환, 및/또는 결실을 함유하는 판독의 총 %로서 정량화되었다.
환자로부터의 유도 다능성 줄기 세포(iPSC):
섬유모세포 세포의 재프로그래밍은 코리엘 세포 저장소(Coriell Cell Repository)로부터 얻어졌다. iPSC는 이들 세포주로부터 에피솜 재프로그래밍에 의해 생성되었고 뉴로제닌 2(Neurog2)를 이소성으로 발현하여 뉴런 분화를 가속시키도록 유전자 조작되었다. 하류 실험을 위해 3개의 iPSC 클론을 선택하였다.
뉴런 세포 배양:
모든 뉴런 세포 배양은 N2B27-기반 배지를 사용하여 수행하였다. 뉴런 분화를 유도하기 위해, 뉴런 플레이팅 배지(1 μg/mL 독시사이클린, 200 μM L-아스코르브산, 1 μM 다이부티릴 cAMP 소듐 염, 10 μM CultureOne, 100 ng/ml의 BDNF, 100 ng/ml의 GDNF를 갖는 N2B27 기반 배지) 중에 iPSC를 플레이팅하고. 3 일의 분화 후에 iN을 해리시키고, 분취하고, 장기 저장을 위해 동결시켰다(DIV3). DIV3 iN을 해동시키고 96-웰 플레이트 상에 웰당 30,000개의 세포로 시딩하였다. iN을 플레이팅 배지 중에 1 주 동안 배양하였으며, 이후로 피딩 배지(200 μM L-아스코르브산, 1 μM 다이부티릴 cAMP 소듐 염, 200 ng/ml의 BDNF, 200 ng/ml의 GDNF를 갖는 N2B27 기반 배지)를 사용하여 매주 1회 절반-배지 교환을 수행하였다.
iN의 시험관내 AAV 형질도입:
형질도입 전 24 시간에, 웰당 약 30,000 내지 50,000개의 iN을 Matrigel-코팅된 96-웰 플레이트 상에 시딩하였다. 이어서 CasX:gRNA 시스템을 발현하는 AAV를 뉴런 플레이팅 배지에 희석하고 세포에 첨가하였으며, 조건당 6개의 웰을 반복실험으로 사용하였다. 다양한 MOI(도 61의 경우에는 1E4 또는 1E5 vg/세포; 도 62의 경우에는 2E4 또는 6.67E3)에서 세포를 형질도입하였다. 형질도입-후 7 일에, 피딩 배지를 사용하여 iN을 보급하였다. 형질도입-후 14 일에, 용해 완충액을 사용하여 세포를 부양시키고, 6-웰 반복실험을 혼주하고, gDNA를 수확하고 NGS를 사용하는 인간 AAVS1 또는 B2M 유전자좌에서의 편집 분석을 위해 준비하였다.
결과:
도 60은 다양한 MOI에서의 AAV에 의한 형질도입-후 5 일에 인간 NPC에서 2개의 상이한 평가(NGS에 의해 유전자형으로 정량화된 인델 빈도로서, 그리고 유세포 분석법에 의해 검출된 표현형 판독 B2M- 세포 집단으로서)를 통해 측정된 B2M 유전자좌에서의 % 편집의 정량화를 나타낸다. 인간 B2M 유전자좌에서 효율적인 편집이 관찰되었으며, 최고 수준의 편집은 약 3E5의 MOI에서 달성되었다: 약 50%의 인델 빈도 및 B2M 단백질 녹아웃 표현형을 나타내는 약 13%의 세포. 도 61은 또한 1E5의 더 높은 MOI에서 약 90% 편집을 달성하는 작제물 번호 189를 이용한, 인간 iN 내의 AAVS1 유전자좌에서의 효율적인 편집을 예시한다. 예상된 바와 같이, 비-표적화 스페이서에 의해서는 AAVS1 유전자좌에서 편집이 관찰되지 않았다.
도 62는 CasX 변이체 491의 발현을 구동하기 위해 사용된 다양한 단백질 프로모터 중 몇 가지에 대해 B2M 유전자좌에서의 강건한 편집이 달성되었다는 것을 나타낸다. 약술하면, 표시된 이식유전자 작제물로 AAV를 생성하고 2E4 또는 6.67E3의 MOI에서 인간 iN 내로 형질도입하였다. AAV 작제물 177 및 183은 어느 하나의 MOI에서 80% 이상의 효율을 갖는 최고 편집 활성을 입증한 프로모터를 함유하였다.
이들 실험의 결과는 CasX 변이체 491 및 인간 B2M 유전자좌 또는 인간 AAVS1 유전자좌를 표적화하는 스페이서를 갖는 가이드 스캐폴드 235가 시험관내에서 AAV를 통해 인간 NPC 또는 iN 내로 패키징되고 전달될 경우에 효율적으로 표적-내 편집할 수 있다는 것을 입증한다.
실시예 18: CpG-고갈 AAV는 효과적인 CasX-매개 편집을 입증하며 더 적은 시험관내 TLR9-매개 면역 반응을 유도한다
병원체-관련된 분자 패턴(PAMP), 예컨대 메틸화되지 않은 CpG 모티프는 소정 부류의 미생물 내에서 보존된 소분자 모티프이다. 이들은 진핵생물 내의 톨-유사 수용체(TLR) 및 다른 패턴 인식 수용체에 의해 인식되며, 종종 비-특이적 면역 활성화를 유도한다. 유전자 요법의 맥락에서, 촉발되는 강력한 면역 반응을 고려할 때, PAMP를 함유하는 치료제는 종종 양호하게-용인되지 않고 환자로부터 신속하게 제거되며, 이는 궁극적으로 감소된 치료 효율로 이어진다. CpG 모티프는 다이뉴클레오티드 CG를 함유하는 짧은 단일-가닥 DNA 서열이다. 이들 CpG 모티프가 메틸화되지 않을 경우, 이들은 PAMP로서 작용하며, 따라서 면역 반응을 강력하게 자극한다.
CasX 변이체 491, 가이드 스캐폴드 변이체 235, 및 내인성 B2M 유전자좌를 표적화하는 스페이서 7.37을 인코딩하는 AAV 작제물(작제물 번호 183) 내의 CpG 모티프를 고갈시키고, CpG-고갈 AAV 벡터가 시험관내에서 효과적으로 편집할 수 있었다는 것을 입증하기 위해 실험을 수행하였다. 추가로, 시험관내에서 TLR9-매개 면역 반응의 활성화에 대한 CpG 고갈의 효과를 평가하기 위해 실험을 수행할 것이다. AAV 게놈의 개별 요소 및 이들 각각의 CpG-감소 버전에 초기에 편집 활성 및 면역원성의 시험관내 평가를 적용하여 강력한 편집을 산출하지만 원치 않는 TLR9 활성화를 감소시키는 최적의 CpG-고갈 서열을 확인한 후에, 조합하여 추가의 평가를 위해 CpG 존재가 대폭 감소된 AAV 게놈을 생성한다.
재료 및 방법:
CpG-고갈 AAV 플라스미드의 생성:
천연 CpG 모티프를 대체할 뉴클레오티드 치환은 하기 요소에 대해 관련 종으로부터의 상동성 뉴클레오티드 서열에 기초하여 컴퓨터내 설계하였다: 쥐과 U1a snRNA(작은 핵 RNA) 유전자 프로모터, 인간 UbC(폴리유비퀴틴 C) 유전자 프로모터, bGHpA(소 성장 호르몬 폴리아데닐화) 서열, 및 인간 U6 프로모터. CasX 491에 대한 코딩 서열은 CpG 고갈을 위해 코돈 최적화되었고, AAV2 ITR은 이전에 기재된 바와 같이 CpG-고갈되었다(문헌[Pan X, Yue Y, Boftsi M. et al., 2021, Rational engineering of a functional CpG-free ITR for AAV gene therapy. Gene Ther. https://doi.org/10.1038/s41434-021-00296-0]). 생성되는 모든 서열(표 25)은 기존의 기준 AAV 플라스미드(작제물 번호 183)의 상응하는 요소를 개별적으로 대체하기 위한 클로닝 및 등온 조립(isothermal assembly)을 위한 적절한 돌출부를 갖는 유전자 단편으로서 주문되었다. 내인성 유전자 베타-2-마이크로글로불린(B2M)을 표적화하는 스페이서 7.37(GGCCGAGAUGUCUCGCUCCG; 서열 번호 379)을 본 실시예에 논의된 관련 실험에 사용하였다. 등온 조립 후에, AAV 작제물을 화학적 적격성 E. 콜라이 세포(Stbl3s) 내로 형질전환하였으며, 이는 37 oC에서 1 시간 동안의 회복 후에 카나마이신 LB-아가 플레이트 상에 플레이팅되었다. 콜로니 PCR을 위해 단일 콜로니를 취하고 생거-서열분석하였다. 서열-검증된 작제물을 후속의 뉴클레오펙션 및 AAV 벡터 생성을 위해 미디-프렙하였다. CasX를 인코딩하는 서열(표 21)을 제외하고는, CpG가 고갈되지 않은 AAV 작제물의 부가적인 구성성분의 서열은 표 26에 열거되어 있다. CRISPR 구성성분의 강건한 발현 및 편집 활성의 유지의 입증에 기초하여, 표 26의 나머지 변경되지 않은 구성성분을 갖는 AAV 작제물을 변형시켜 CpG 모티프를 고갈시키고 실시예17에 기재된 방법을 사용하여 평가할 것이다.
[표 25]
AAV 벡터의 생성은 앞서 실시예 17에 기재된 바와 같이 수행되었다.
바이러스 게놈 역가는 앞서 실시예 17에 기재된 바와 같이 결정되었다.
인간 신경 전구 세포(hNPC)의 시험관내 배양:
불멸화 hNPC를 hNPC 배지(GlutaMax, 10 mM HEPES, 1X NEAA, 비타민 A가 없는 1X B-27, 성장 인자 hFGF 및 EGF가 보충된 1X N2, Pen/Strep, 및 2-메르캅토에탄올을 갖는 DMEM/F12) 중에 배양하였다. 시험 전에, TrypLE로 세포를 부양시키고, 온화하게 재현탁시켜 신경구를 해리시키고, 배지로 켄칭하고, 회전 침강시키고, 새로운 배지 중에 재현탁시켰다. 세포를 계수하고 뉴클레오펙션에 직접 사용하였거나 AAV 형질도입 전 48 시간에 PLF(폴리-DL-오르니틴 하이드로브로마이드, 라미닌, 및 피브로넥틴)로 코팅된 96-웰 플레이트 상에 웰당 약 10,000개의 세포의 밀도로 직접 시딩할 것이다.
인간 신경 전구 세포(hNPC) 내로의 플라스미드 뉴클레오펙션:
AAV 게놈의 개별 요소의 CpG 고갈이 있거나 없는, CasX:gRNA 시스템을 인코딩하는 AAV 플라스미드를 Lonza P3 1차 세포 96-웰 Nucleofector 키트를 사용하여 hNPC 내로 뉴클레오펙션시켰다. 플라스미드를 50 ng/μL 및 25 ng/μL의 2개의 농도로 희석하였다. 5 μL의 DNA를 18% V/V P3 보충제로 보충된 Lonza P3 용액 중의 20 μL의 200,000 hNPC와 혼합하였다. 합한 용액을 프로그램 EH-100에 따라 Lonza 4D Nucleofector 시스템을 사용하여 뉴클레오펙션시켰다. 이어서 뉴클레오펙션된 용액을 적절한 배양 배지로 켄칭한 후에 PLF로 코팅된 96-웰 플레이트의 3개의 웰 내로 분할하였다. 뉴클레오펙션-후 7 일에, HLA 면역염색에 이어서 유세포 분석법을 통한 B2M 단백질 발현 분석을 위해 hNPC를 부양시켰다. 이어서, 실질적인 CpG 고갈을 갖는 조합된 AAV 게놈을 생성하기 위한 개별 CpG-고갈 요소의 스태킹을 수행하고 시험관내에서 B2M 유전자좌에서의 편집 평가에 대해 유사하게 시험할 것이다.
HLA 면역염색 및 유세포 분석법에 의한 편집 활성 평가:
뉴클레오펙션 후 7 일에, AAV-처리된 hNPC를 TrypLE로 부양시켰다. 세포 해리 후에, 염색 완충액(dPBS 중의 3% 소태아 혈청)을 켄칭에 사용하였다. 해리된 세포를 둥근-바닥 96-웰 플레이트에 이전한 후에, 원심분리 및 염색 완충액을 이용한 세포 펠렛의 재현탁이 이어졌다. 또 한번의 원심분리 후에, 세포 표면 상에 발현되는 B2M-의존적 HLA 단백질을 검출할 항체(BioLegend)를 함유하는 염색 완충액 중에 세포 펠렛을 재현탁시켰다. HLA 면역염색 후에, 세포를 DAPI로 염색하여 세포 핵을 표지하였다. Attune NxT 유세포 분석기를 사용하여 HLA+ hNPC를 측정하였다.
hNPC의 시험관내 AAV 형질도입:
PLF-코팅된 96-웰 플레이트 상에 약 10,000개의 세포/웰의 hNPC를 시딩할 것이다. 48 시간 후에, 시딩된 세포를 AAV 게놈의 개별 요소의 CpG 고갈이 있거나 없는, CasX:gRNA 시스템을 발현하는 AAV로 처리할 것이다. 모든 바이러스 감염 조건은 이중실험 이상으로 수행될 것이다. 형질도입-후 5 내지 7 일에, 기재된 바와 같이 HLA 면역염색에 이어서 유세포 분석법을 통한 편집 활성 평가를 위해 hNPC를 부양시킬 것이다. 이어서, 실질적인 CpG 고갈을 갖는 조합된 AAV 게놈을 생성하기 위한 개별 CpG-고갈 요소의 스태킹을 수행하고 시험관내에서 B2M 유전자좌에서의 편집 평가에 대해 유사하게 시험할 것이다.
CpG-함유(CpG+) 또는 CpG-고갈(CpG-) AAV를 이용한 형질도입-후 시험관내 면역원성 평가를 위한 인간 TLR9 리포터 HEK293 세포(HEK-BlueTM hTLR9)의 용도:
HEK-BlueTM hTLR9 세포주(InvivoGen)는 HEK293 세포로부터 유래되었으며, TLR9-유도 NF-κB 신호전달의 연구를 위해 특이적으로 설계되었다. 이러한 HEK-BlueTM hTLR9 세포는 인간 TLR9 유전자뿐만 아니라, SEAP(분비 배아 알칼리 포스파타제) 리포터 유전자를 NF-κB 유도성 프로모터의 제어 하에 과발현한다. 비색 검정을 사용하여 정량화될 수 있는 세포 배양 배지 상청액 중의 SEAP 수준은 TLR9 활성화를 보고한다.
본 실험을 위해, 5,000개의 HEK-BlueTM hTLR9 세포를 10% FBS 및 Pen/Strep을 갖는 DMEM 배지 중에 96-웰 플레이트의 각각의 웰에 플레이팅할 것이다. 다음 날에, 시딩된 세포를 CasX:gRNA 시스템을 발현하는CpG+ 또는 CpG- AAV로 형질도입시켰다. 모든 바이러스 감염 조건은, 1E6 vg/세포의 유효 MOI로 시작하는 일련의 3-배 연속 희석의 MOI에서, 실험 벡터들 사이에서 정규화된 바이러스 게놈(vg)의 수를 이용하여, 이중실험 이상으로 수행될 것이다. 제조사의 설명서에 따라 형질도입-후 1, 2, 3, 및 4 일에 HEK-BlueTM 검출 키트를 사용하여 세포 배양 배지 상청액 내에 분비된 SEAP의 수준을 평가할 것이다.
결과:
도 63은 CpG-함유(CpG+) 또는 CpG-고갈(CpG-) AAV 벡터로 뉴클레오펙션된 hNPC 내의 B2M 유전자좌에서 편집 활성을 평가하는 검정의 조사결과를 나타낸다. 편집 활성은 B2M 유전자좌에서 편집되어 세포 표면 상에 B2M 발현의 감소/결여(B2M-)를 유발하는 hNPC의 백분율로서 측정되었다 도 63은 U1a 프로모터(작제물 번호 178 및 179), Pol III U6 프로모터(작제물 번호 180 및 181), 또는 bGH 폴리(A)(작제물 번호 182)의 서열 내의 CpG 모티프를 감소 또는 고갈시키는 것은 원래의 CpG+ AAV 작제물(작제물 번호 177)로 달성된 편집 수준에 비교하여 편집 활성을 실질적으로 감소시키지 않았다는 것을 예시한다. 구체적으로, CpG- U1a, CpG- U6, 또는 CpG- bGH는 기준 CpG+ AAV 작제물에 의해 얻어진 편집 수준의 약 80%, 약 94%, 또는 약 83% 편집을 유발하였다. 그러나, UbC 프로모터 서열 내의 CpG 모티프를 감소 또는 고갈시키는 것은(작제물 번호 184, 185, 및 186) 기준 UbC 작제물(작제물 번호 183)에 의해 관찰된 수준에 비교하여 편집 활성을 실질적으로 감소시켰으며, 이는 AAV 편집 활성에 대한 CpG 고갈의 상황-의존적(context-dependent) 효과를 강조하고 강력한 편집을 산출할 개별 CpG-고갈 AAV 요소를 스크리닝하는 것의 중요성을 부각시킨다. 이러한 조사결과는 CpG+ 또는 CpG- AAV를 이용한 hNPC 형질도입을 포함하는 실험에서 검증될 것이다. 최대 CpG 고갈을 갖는 조합된 AAV 게놈을 생성하기 위해 개별 CpG- 요소가 또한 스태킹될 것이며, 이는 시험관내 편집 활성에 대해 평가될 것이다.
TLR9-조절 면역 반응을 평가하기 위해 HEK-BlueTM hTLR9 세포를 사용하는 실험은 변형되지 않은 CpG+ AAV로 처리된 세포로부터의 수준에 비교하여 CpG- AAV로 처리된 세포로부터 분비된 SEAP의 감소된 수준을 나타낼 것으로 예상된다. 감소된 SEAP 수준은 감소된 TLR9-매개 면역 활성화를 표시할 것이다.
실시예 19: 염증성 사이토카인 생성 및 CasX-매개 편집에 대한 효과를 평가하기 위한 CpG-고갈 게놈이 있거나 없는 AAV 벡터의 생체내 투여
생체내에서 CpG-고갈 게놈이 있거나 없는 AAV 벡터를 투여하는 것의 효과를 평가하기 위해 실험을 수행할 것이다. 약술하면, CasX:gRNA 시스템(CpG 고갈이 있거나 없음)을 발현하는 AAV 입자를 C57BL/6J 마우스에 투여할 것이다. 이들 실험에서는, 실질적인 CpG 고갈이 있는 조합된 AAV 게놈을 평가에 사용할 것이다. AAV 투여 후에, 다양한 시점에 마우스를 채혈하여 혈액 샘플을 수집할 것이다. ELISA를 사용하여 염증성 사이토카인, 예컨대 IL-1β, IL-6, IL-12, 및 TNF-α의 생성을 측정할 것이다.
재료 및 방법:
CpG-고갈 AAV 플라스미드의 생성:
이식유전자-특이적 T 세포의 생성을 평가하기 위해, CasX 단백질의 N-말단 상의 AAV 이식유전자 플라스미드 내로 SIINFEKL 펩티드를 클로닝할 것이다. SIINFEKL 펩티드는 양호하게 특성화된 알부민-유래의 펩티드이며, 이 펩티드 에피토프에 특이적인 T 세포를 탐색하기 위한 광범위하게 이용가능한 시약을 갖는다. 이 펩티드를 인코딩하는 핵산 서열은 ROSA26-표적화 스페이서를 갖는 AAV 작제물에서 CasX에 대한 N-말단 융합으로서 클로닝될 것이다.
AAV 벡터의 생성은 앞서 실시예 17에 기재된 바와 같이 수행될 것이다.
바이러스 게놈 역가는 앞서 실시예 17에 기재된 바와 같이 결정될 것이다.
체액 면역 활성화를 평가하기 위한 염증성 사이토카인의 측정:
약 1E12 vg의 AAV를 C57BL/6J 마우스 내로 정맥내 주사할 것이다. AAV 주사 후 7 일 동안 꼬리 정맥 또는 복재 정맥으로부터 매일 채혈할 것이다. 쥐과 혈액 샘플에 대한 제조사의 권고(Abcam)에 따라 구매가능한 ELISA 키트를 사용하여, 수집된 혈액 혈청을 염증성 사이토카인, 예컨대 IL-1β, IL-6, IL-12, 및 TNF-α의 수준에 대해 평가할 것이다. 약술하면, 50 μL의 표준품, 대조군 완충액, 및 샘플을 IL-1β, IL-6, IL-12, 또는 TNF-α에 특이적인 항체로 사전-코팅된 ELISA 플레이트의 웰에 로딩하고, 실온(RT)에서 2 시간 동안 인큐베이션하고, 세척하고, 호스래디쉬 퍼옥시다제 효소(HRP)와 함께 2 시간 동안 RT에서 인큐베이션한 후, 부가적인 세척이 이어질 것이다. TMB ELISA 기질로 웰을 처리하고, 암소에서 30 분 동안 RT에서 인큐베이션한 후, H2SO4로 켄칭할 것이다. 570 nm에서 파장 보정을 갖는 TECAN 분광광도계를 사용하여 450 nm에서 흡광도를 측정할 것이다.
이식유전자-특이적 T 세포 집단의 평가:
AAV를 이용한 정맥내 주사 후 10 일에, 마우스로부터 혈액을 수집하고, EasySepTM 마우스 T 세포 단리 키트를 사용하여 T 세포를 단리할 것이다. 단리된 T 세포를 하기의 것들과 함께 인큐베이션할 것이다: FITC 마우스 항-인간 CD4 항체(BD Biosciences), APC 마우스 항-인간 CD8 항체(BD Biosciences), 및 BV421 난백 알부민 SIINFEKL MHC 사량체(Tetramer Shop). SIINFEKL MHC 사량체에 특이적인 CD4+ 및 CD8+ T 세포의 백분율을 유세포 분석법을 사용하여 정량화할 것이다. FITC, APC, 및 BV421은 488 nm, 561 nm, 및 405 nm 레이저에 의해 여기될 것이며, 신호는 각각 대역통과 필터 440/50, 530/30, 780/60으로 정량화될 것이다.
CasX-특이적 항체의 정량화:
6] 재조합적으로 생성되고 정제된 CasX 변이체 491(생성 및 정제 방법은 전체적으로 참고로 포함된 WO2020247882A1호에 기재되어 있음)은 pH 9 초과의 카르보네이트/바이카르보네이트 완충액을 사용하는 수동 흡착에 의해 폴리스티렌 96-웰 플레이트의 웰에 직접 부착될 것이다. 이어서 제조사의 권고(Bethyl Laboratories)에 따라 구매가능한 HRP-접합된 2차 항체 키트를 사용하는 표준 ELISA 기술을 사용하여 CasX 491-특이적 항체의 존재에 대해 혈청 샘플을 평가할 것이다. 570 nm에서 파장 보정을 갖는 TECAN 분광광도계를 사용하여 450 nm에서 흡광도를 측정할 것이다.
ROSA26 유전자좌에서의 AAV-매개 게놈 편집의 정량화:
CpG- AAV가 생체내에서 CpG+ AAV에 비교하여 향상된 CasX 편집 활성을 나타낸다는 것을 입증하기 위해, ROSA26 유전자좌를 표적화하는 gRNA와 함께 CasX 단백질 491을 함유하는 약 1E12개의 AAV 입자를 C57BL/6J 신생아의 안면 정맥을 통해 정맥내 투여할 것이다. 이어서 Scribe의 기관 동물 사용 프로토콜(institutional animal use protocol)에 따라 동물을 관리할 것이다. 주사-후 4 주에, 제조사의 설명서에 따라 Zymo Quick DNA/RNA miniprep 키트를 사용하는 gDNA 추출을 위해 마우스를 안락사시키고 간 및/또는 근육 조직을 수확할 것이다. 200 ng의 추출된 gDNA로부터 관심 마우스 ROSA26 유전자좌를 표적화하는 프라이머의 세트로 표적 앰플리콘을 증폭하고 앞서 실시예 17에 기재된 바와 같이 가공할 것이다.
결과:
혈청 염증성 사이토카인 수준을 측정하는 생체내 실험은 CpG- AAV가 염증성 사이토카인, 예컨대 IL-1β, IL-6, IL-12, 및 TNF-α의 생성을 유의하게 약화시킴으로써 면역원성 및 독성을 감소시킬 것임을 나타낼 것으로 예상된다. 또한, CpG- AAV는 더 적은 TLR9 활성화를 야기하여 CasX에 융합된 SIINFEKL 펩티드에 대한 T 세포의 감소된 확장으로 이어질 가능성이 있다. 그러므로, CpG- AAV를 이용한 주사는 CpG 요소를 함유하는 AAV 작제물로부터의 수준에 비교하여 SIINFEKL-특이적 CD4+ 및 CD8+ T 세포의 감소된 수준을 산출할 것으로 예상된다.
CpG- AAV는 더 적은 체액 면역 활성화 및 비-특이적 염증뿐만 아니라 더 적은 T-세포 매개 면역을 야기할 가능성이 있으므로, CasX-반응성 항체의 역가가 또한 감소될 것으로 예상된다(즉, CasX 항체를 정량화하는 더 낮은 ELISA 신호가 예상됨).
최종적으로, CpG- AAV의 편집 역량은 게놈 DNA 추출을 위해 근육 및/또는 간 조직을 수확하고 NGS를 적용하여 ROSA26 유전자좌에서의 편집 수준을 결정하는 단계에 의해 평가될 것이다. 생체내에서 더 적은 체액 면역 반응을 도출할 이들의 예상되는 가능성을 고려할 때, CpG- AAV에 의해 ROSA26 유전자좌에서의 향상된 CasX 편집 활성이 예상된다.
[표 26]
[표 27]
실시예 20: 가이드 RNA 가이드 스캐폴드 플랫폼 발전
이중-가닥 DNA(dsDNA) 절단에 대한 개선된 활성을 나타내는 가이드 RNA 가이드 스캐폴드 변이체를 확인하기 위해 실험을 수행하였다. 이를 달성하기 위하여, 스캐폴드 변이체의 대규모 라이브러리를 설계하고 인간 세포 내의 리포터 유전자의 기능적 녹아웃에 대해 혼주 방식으로 시험하였다. 개선된 녹아웃으로 이어지는 스캐폴드 변이체는 풀 내의 기능적 요소의 서열분석 및 후속의 컴퓨터 분석에 의해 결정되었다.
재료 및 방법
라이브러리 설계
RNA 2차 구조 안정성의 평가
RNAfold(v2.4.14)(문헌[Lorenz R, et al. ViennaRNA Package 2.0. Algorithms Mol Biol.6:26 (2011)])를 사용하여 RNA 서열의 2차 구조 안정성을 예측하였으며, 이는 문헌[Jarmoskaite I., et al. "A quantitative and predictive model for RNA binding by human pumilio proteins", Mol Cell. 74(5):966 (2019)]에서 실행된 것과 유사하다. ΔΔG_BC 값을 평가하기 위해, 제약되지 않은 앙상블의 앙상블 자유 에너지(ΔG)를 계산한 후, 제약된 앙상블의 앙상블 자유 에너지(ΔG)를 계산하였다. ΔΔG_BC는 제약된 ΔG 값과 제약되지 않은 ΔG 값 사이의 차이이다. 유사매듭 스템, 스캐폴드 스템, 및 연장된 스템의 염기-대합을 반영하는 제약 스트링이 사용되었으며, 삼중체의 염기들은 대합하지 않을 것을 필요로 한다.
유사매듭 스템 2차 구조 안정성의 계산
가이드 스캐폴드 175로부터의 삼중체 루프 서열을 사용하여 위치 3 내지 33에 걸친 전체 스템-루프에 대해 유사매듭 구조 안정성을 계산하였다. 추가로, 유사매듭 염기들의 대합 및 삼중체 루프 내의 염기들의 비대합(unpairing)을 강제한 제약 스트링이 생성되었다. 따라서 안정성의 변화는 단지 유사매듭 스템의 서열의 차이로 인한 것일 수 있다. 예를 들어, 최종 서열이 AAAACGCUUUAUCUCAUUACUUUGACGTTTT(서열 번호 41835)이고, 제약 스트링이 '((((((xxxxxxxxxxxxxxxxxxx))))))'(서열 번호 41836, 여기서 x=n)이도록, 삼중체 루프 서열 CUUUAUCUCAUUACUUUGA(서열 번호 41834)를 삽입함으로써 유사매듭 서열 AAAACG_CGTTTT이 스템-루프 서열로 변하였다.
분자 생물학
라이브러리 작제의 분자 생물학
가이드 RNA 스캐폴드 변이체의 설계된 라이브러리는 Twist Biosciences로부터 합성되고 얻어진 후에, 라이브러리에 특이적인 프라이머로 PCR에 의해 증폭되었다. 이들 프라이머는 라이브러리의 5′ 및 3' 단부에서 부가적인 서열을 증폭하여 제한 효소 SapI에 대한 서열 인식 부위를 도입한다. PCR은 Q5 DNA 중합효소(New England Biolabs)로 수행하였고, 제조사의 설명서에 따라 수행하였다. 전형적인 PCR 조건은, 50 μl 반응물 중의 10 ng의 주형 라이브러리 DNA, 1x Q5 DNA 중합효소 완충액, 300 nM dNTP, 300 nM의 각각의 프라이머, 0.25 μl의 Q5 DNA 중합효소였다. 유전자 증폭기 상에서 전형적인 프로그램은, 5 분 동안 95℃; 이어서 20 주기의 15 초 동안 98℃, 20 초 동안 65℃, 1 분 동안 72℃; 및 72℃에서 2 분의 최종 연장을 위한 주기일 것이다. 증폭된 DNA 생성물은 DNA Clean and Concentrator 키트(Zymo Research)로 정제하였다. 이어서 제조사의 설명서에 따라 이러한 PCR 앰플리콘뿐만 아니라 플라스미드 pKB4를 제한 효소 SapI(New England Biolabs)로 분해하고 둘 모두를 독립적으로 아가로스 겔 전기영동 후에 겔 추출(Zymo)에 의해 겔 정제하였다. 이어서 모두 제조사의 설명서에 따라 T4 DNA 리가제(New England Biolabs)를 사용하여 라이브러리를 라이게이션하고, DNA Clean and Concentrator 키트(Zymo)로 정제하고, MegaX DH10B T1R Electrocomp 세포(ThermoFisher Scientific) 내로 형질전환하였다. 형질전환된 라이브러리를 SOC 배지 중에 1 시간 동안 회복시킨 후, 37℃에서 5 mL의 2xyt 배지 중에 진탕하면서 하룻밤 성장시켰다. 이어서 플라스미드 DNA를 배양물로부터 미니프렙하였다(QIAGEN). 이어서 제한 효소 Esp3I(New England Biolabs)를 이용한 분해 후에, GFP를 표적화하기 위한 원하는 스페이서 서열 및 상보적인 단일 가닥 DNA 돌출부를 보유하는 어닐링된 올리고뉴클레오티드와의 라이게이션에 의해 플라스미드 DNA를 추가로 클로닝하였다. 올리고뉴클레오티드는 5' 인산화 변형을 보유했으며, 1 분 동안 95℃로 가열함으로써 어닐링한 후, 25℃의 최종 온도에 도달할 때까지 분당 2 도로 온도를 감소시켰다. 라이게이션은 골든 게이트 조립체 반응으로서 수행되었으며, 여기서 전형적인 반응 조건은 총 부피 40 μL의 물 중의 1 μg의 예비-분해된 플라스미드 라이브러리, 1 μM 어닐링된 올리고뉴클레오티드, 2 μL T4 DNA 리가제, 2 μL Esp3I, 및 1x T4 DNA 리가제 완충액으로 이루어졌다. 3 분 동안 37℃ 및 5 분 동안 16℃ 사이에서 반응을 25회 주기순환시켰다. 상기와 같이, 라이브러리를 정제하고, 형질전환하고, 하룻밤 성장시키고, 미니프렙하였다. 이어서 생성되는 플라스미드의 라이브러리를 렌티바이러스의 생성에 사용하였다.
라이브러리 스크리닝
LV 생성
70 내지 90%의 포화도로, 24 시간 전에 시딩된, LentiX HEK293T 세포를 형질감염시킴으로써 렌티바이러스 입자를 생성하였다. 무-혈청 배지 중에, 폴리에틸렌이민과 함께 패키징 및 VSV-G 외피 플라스미드를 함유하는 2세대 렌티바이러스 시스템에 혼주된 라이브러리를 함유하는 플라스미드를 도입하였다. 입자 생성을 위해, 형질감염-후 12 시간에 배지를 교환하고, 형질감염-후 36 내지 48 시간에 바이러스를 수확하였다. 0.45 μm PES 막 필터를 사용하여 바이러스 상청액을 여과하고, 적절한 경우에 세포 배양 배지에 희석한 후, 표적 세포에 첨가하였다.
여과-후 72 시간에, TaqMan qPCR에 의해 렌티바이러스 상청액의 분취액의 역가를 측정하였다. 페놀-클로로포름 추출(TRIzol)에 이어서 알코올 침전을 사용하여 바이러스 게놈 RNA를 단리하였다. nano-drop 판독에 의해 추출의 품질 및 양을 평가하였다. 이어서 ThermoFischer SuperScript IV 역전사효소에 의한 cDNA 생성 직전에 임의의 잔류 플라스미드 DNA를 DNase I로 분해하였다. Bio-Rad CFX96에 의한 qPCR 전에 바이러스 cDNA에 1:1000까지의 연속 희석을 적용하고 WPRE 기반 프라이머 및 TaqMan 마스터 믹스와 조합하였다. 모든 샘플 희석액을 이중실험으로 첨가하고 평균한 후에 알려진 플라스미드-기반 표준 곡선에 대해 역가를 계산한다. 음성 대조군으로서 항상 물을 측정한다.
LV 스크리닝(형질도입, 유지, 게이팅, 분류, gDNA 단리)
세포 분열이 발생함을 보장하기 위해, 형질도입 전 24 내지 48 시간에 표적 리포터 세포를 계대한다. 형질도입의 시점에, 세포를 트립신 처리하고, 계수하고, 적절한 밀도로 희석하였다. 이중 렌티바이러스 통합을 최소화하기 위해, 비처리, 라이브러리- 또는 대조군-함유 순 렌티바이러스 상청액으로 낮은 MOI(0.1 내지 5, 바이러스 게놈 기준)에서 세포를 재현탁시켰다. 렌티바이러스-세포 혼합물을 40 내지 60% 포화도로 시딩한 후에 37℃, 5% CO2에서 인큐베이션하였다. 형질도입-후 48 시간에 1 내지 3 μg/ml의 퓨로마이신으로 4 내지 6 일 동안 성공적인 형질도입에 대해 세포를 선택한 후 HEK 또는 Fb 배지 중에 회복시켰다.
선택 후에, 세포를 4′,6-다이아미디노-2-페닐인돌(DAPI) 및 포스페이트-완충 식염수(PBS)에 현탁시켰다. 이어서 세포를 Corning 스트레이너-캡 FACS 튜브(Prod. 352235)에 의해 여과하고 Sony MA900 상에서 분류하였다. 표준 방법을 통한 단일 생존 세포에 대한 게이팅에 부가하여, 형광 리포터의 녹다운에 대해 세포를 분류하였다. 실험으로부터 분류된 세포를 용해시키고, 제조사의 프로토콜에 따라 Zymo Quick-DNA Miniprep Plus를 사용하여 게놈을 추출하였다.
차세대 서열분석(NGS)을 위한 가공
가이드 RNA-인코딩 DNA에 특이적인 프라이머로 PCR을 통해 게놈 DNA를 증폭하여 표적 앰플리콘을 형성하였다. Illumina 판독 및 2개의 서열을 도입하기 위해 이들 프라이머는 5′ 단부에 부가적인 서열을 함유한다. 전형적인 PCR 조건은 50 μl 반응물 중의 2 μg의 gDNA, 1x Kapa Hifi 완충액, 300 nM dNTP, 300 nM의 각각의 프라이머, 0.75 μl의 Kapa Hifi Hotstart DNA 중합효소일 것이다. 유전자 증폭기 상에서, 5 분 동안 95℃; 이어서 15 주기의 15 초 동안 98℃, 20 초 동안 62℃, 1 분 동안 72℃; 및 72℃에서 2 분의 최종 연장으로 주기순환시킨다. 증폭된 DNA 생성물을 Ampure XP DNA 클린업 키트로 정제한다. Illumina 플랫폼 상의 멀티플렉싱(multiplexing)을 가능하게 하기 위해 인덱싱 어댑터(indexing adapter)로 제2 PCR 단계를 실행하였다. 이전 단계로부터 정제된 생성물 20 μl를 50 μl 반응물 중의 1x Kapa GC 완충액, 300 nM dNTP, 200 nM의 각각의 프라이머, 0.75 μl의 Kapa Hifi Hotstart DNA 중합효소와 조합하였다. 유전자 증폭기 상에서, 5 분 동안 95℃; 이어서 5 내지 16 주기의 15 초 동안 98℃, 15 초 동안 65℃, 30 초 동안 72℃; 및 72℃에서 2 분의 최종 연장으로 주기순환시킨다. 증폭된 DNA 생성물을 Ampure XP DNA 클린업 키트로 정제한다. 앰플리콘의 품질 및 정량화는 Fragment Analyzer DNA 분석기 키트(Agilent, dsDNA 35-1500 bp)를 사용하여 평가하였다. 제조사의 설명서에 따라 Illumina Miseq(v3, 150 주기의 단일-단부 서열분석) 상에서 앰플리콘을 서열분석하였다.
NGS 분석(샘플 가공 및 데이터 분석)
어댑터 서열을 위해 cutadapt(버전 2.1)로 판독값을 트리밍하고, 각각의 판독값에 대해 가이드 서열(스캐폴드 서열 및 스페이서 서열을 포함함)을 추출하였다(상류와 하류 앰플리콘 서열 사이의 서열을 추출하기 위해 cutadapt v 2.1 연결된 어댑터를 또한 사용함). 고유 가이드 RNA 서열을 계수한 후, 각각의 스캐폴드 서열을 설계된 서열의 목록 및 가이드 스캐폴드 174(서열 번호 2238) 및 175(서열 번호 2239)의 서열에 비교하여 각각의 동일성을 결정하였다.
각각의 고유 가이드 RNA 서열에 대한 판독 계수를 평균 정규화를 사용하여 서열분석 깊이에 대해 정규화하였다. 각각의 GFP-샘플에서의 정규화된 판독 계수를 관련된 미접촉 샘플에서의 정규화된 판독 계수로 나눔으로써 각각의 서열에 대해 농축을 계산하였다. 둘 모두의 선택(R2 및 R4)에 대해, 3개의 별도의 날에 NGS를 위해 GFP- 및 미접촉 집단을 가공하여, 각각의 스캐폴드에 대한 농축 값을 삼중실험으로 형성하였다. 미접촉 및 GFP-샘플에 대한 판독 계수를 삼중실험에 걸쳐 합산한 후에 스캐폴드당 전반적인 농축 점수를 계산하였다.
상이한 선택으로부터의 2개의 농축 점수를, 미접촉 집단 내에서의 이들의 상대적 표현(relative representation)에 의해 가중되는, 개별 log2 농축 점수의 가중 평균에 의해 조합하였다.
삼중실험 샘플에 걸쳐 평균 농축 점수 상의 95% 신뢰 구간을 계산하여 log2 농축 점수 상의 오차를 추정하였다. 2개의 별도의 선택에 대해 농축 값을 조합할 경우에 이들 오차는 전파된다.
결과 및 논의
라이브러리 설계, 주문, 및 클로닝
RNA 스캐폴드 내의 중심 모듈에 중점을 둔 표적화 방식으로, 그리고 비편향 방식으로 RNA 스캐폴드에 대한 변이를 둘 모두 시험하기 위해 가이드 RNA 변이체의 라이브러리를 설계하였다.
라이브러리의 비편향 부분에서, 모든 단일 뉴클레오티드 치환, 삽입, 및 결실은 가이드 스캐폴드 174(서열 번호 2238) 및 175(서열 번호 2239)(약 2800 개별 서열)의 각각의 잔기에 대해 설계되었다. 상호작용하고 있을 가능성이 있는 영역에 특이적으로 중점을 두기 위해 이중 돌연변이체를 설계하였으며; 따라서 CryoEM 구조(PDBid: 6NY2)에서, 정준 또는 비-정준 염기 대합 상호작용에 2개의 잔기가 관여했거나, RNAfold(v2.4.14)에 의해 예측된 최저-에너지 구조에서 2개의 잔기가 대합할 것으로 예측되었다면, 가이드 스캐폴드 174 및 174 내의 상응하는 잔기는 돌연변이되었다(둘 모두의 잔기의 모든 가능한 치환, 삽입, 및 결실을 포함함). 이들 '상호작용하는' 잔기에 인접하는 잔기가 또한 돌연변이되었지만; 이들에 대해서는 2개의 잔기 각각의 치환만이 포함되었다. 최종 라이브러리에서, 가이드 스캐폴드 174 또는 175에 비교하여 2개의 돌연변이를 갖는 약 27K 서열이 설계되었다.
RNA 스캐폴드의 중심 영역의 특이적 돌연변이유발에 할애하는 라이브러리의 부분에서, 유사매듭 영역, 삼중체 영역, 스캐폴드 버블, 및 연장된 스템(영역 확인에 대해서는 도 65를 참조함)에 대해 변형을 설계하였다. 라이브러리의 이들 표적화된 섹션 각각에서, 전체 도메인은 가설-구동 방식으로 돌연변이화되었다(도 66). 예로서, 삼중체 영역의 경우, 삼중체를 구성하는 염기 삼중항 각각이 상이한 삼중체-형성 모티프로 돌연변이화되었다(도 67 참조). 이러한 유형의 돌연변이유발은 버블을 둘러싼 염기의 모든 가능한 치환이 돌연변이화된(즉, 가이드 서열 174 또는 175에 비교하여 최대 5개의 돌연변이에 의함) 스캐폴드 스템 버블에 사용된 것과는 별개이다. 다시 대조적으로, 유사매듭 스템을 구성하는 5개의 염기쌍을 대체 왓슨-크릭 대합 서열로 완전히 대체하였다(최대 10개의 별개의 염기가 돌연변이화됨).
단백질의 결합에 순응하는 2차 구조를 형성할 가능성이 더 높은 서열을 위해 라이브러리의 최종 표적화된 섹션을 최적화하고자 하였다. 약술하면, 서열의 2차 구조 안정성을 하기 2개의 조건 하에 예측하였다: 1) 임의의 제약의 부재 하의 조건, 2) 중심 2차 구조 요소, 예컨대 유사매듭 스템, 스캐폴드 스템, 및 연장된 스템이 형성되도록 제약되는 조건(재료 및 방법 참조). 본 발명자들의 가설은 이들 2개의 조건들 사이의 안정성의 차이(본 명세서에서 ΔΔG_BC로 불림)는 단백질 결합에 더 순응하는 서열에 대해 최소가 될 것이라는 것이었으며, 따라서 본 발명자들은 이러한 차이가 최소인 서열을 찾아야 했다).
설계된 라이브러리는 Twist로부터 주문되었고(약 40 K 별개의 서열), 단백질 STX119를 또한 발현한 렌티바이러스 플라스미드 골격 내로의 클로닝을 위해 골든 게이트 부위를 포함하도록 합성되었다(재료 및 방법 참조). GFP 유전자를 표적화하는 스페이서 서열을 라이브러리 벡터 내로 클로닝하였으며, 이는 각각의 RNA 스캐폴드 변이체로부터 단일-가이드 RNA를 효과적으로 생성하여 GFP 유전자를 표적화하한다. 설계된 라이브러리 변이체의 표현은 차세대 서열분석으로 평가하였다(재료 및 방법 참조).
라이브러리 스크리닝 및 평가
가이드 RNA 변이체 및 단일 CasX 단백질(버전 119)을 함유하는 플라스미드 라이브러리를 렌티바이러스 입자로 제조하였고(재료 및 방법 참조); qPCR 검정을 사용하여 바이러스 게놈의 카피 수에 기초하여 입자의 역가를 측정하였다(재료 및 방법 참조). 각각의 세포가 최대 1개의 라이브러리 구성원을 통합하는 것을 강제하기 위해 낮은 감염 다중도(MOI)에서 렌티바이러스 입자 라이브러리로 GFP를 안정하게 발현하는 세포주를 형질도입하였다. 게놈 통합을 가진 세포만을 유지하도록 세포 풀을 선택하였다. 최종적으로, 세포 집단을 GFP 발현에 대해 분류하였으며, GFP 음성 세포의 집단이 얻어졌다. 이들 GFP 음성 세포는 CasX RNP를 GFP 단백질에 대해 효과적으로 표적화하여, 인델 및 후속의 기능 손실을 야기하는 라이브러리 구성원을 함유하였다.
분류되지 않은 세포 집단("미접촉") 및 GFP 음성 집단으로부터의 게놈 DNA를 가공하여 각각의 세포 내의 가이드 RNA 라이브러리 구성원의 서열을 단리하였다. 미접촉 및 GFP 음성 집단에서 가이드 RNA의 표현을 결정하기 위해, 차세대 서열분석을 수행하였다. GFP-집단에서의 라이브러리 구성원의 표현을 미접촉 집단에서의 그의 표현으로 나눔으로써 각각의 라이브러리 구성원에 대해 농축 점수를 계산하였다: 높은 농축 점수는 시작 풀에서보다 활성 GFP 음성 집단에서 훨씬 더 빈번한 라이브러리 구성원을 표시하며, 따라서 GFP 유전자 내에 인델을 효과적으로 생성할 수 있는 활성 변이체이다(1 초과의 농축 값, 0 초과의 log2 농축). 낮은 농축 점수는 미접촉에 비교하여 활성 GFP-집단에서 고갈되는 라이브러리 구성원을 표시하며, 따라서 인델을 형성함에 있어서 효과적이지 않다(1 미만의 농축 값, 0 미만의 log2 농축). 비교를 위한 최종 통계로서, 상대 농축 값은 라이브러리 구성원의 농축(GFP 음성 대 미접촉 집단에서)을 참조 스캐폴드 서열의 농축(GFP 음성 대 미접촉 집단에서)으로 나눈 것으로서 계산되었다. (로그 공간에서, 이들 값은 단순히 감산된다.) 참조 스캐폴드 서열의 농축 값은 도 68에 나타낸다).
렌티바이러스 입자의 독립적인 생성, 세포의 형질도입, 미접촉 및 GFP 음성 집단을 얻기 위한 선택 및 분류, 및 각각의 라이브러리 구성원의 농축 값을 학습하기 위한 서열분석과 함께, 스크린을 다회 수행하였다. 이들 스크린은 R2 및 R4로 불렸으며, 가이드 스캐폴드 174 및 175 상의 단일 뉴클레오티드 변이체에 대해 얻어진 농축 값을 대체로 재현한다(도 69). 스크린은 기능적 GFP-집단에서 농축된 돌연변이의 다수의 가능한 조합을 확인할 수 있었으며, 따라서 기능적 RNP로 이어질 수 있다. 대조적으로, 비-표적화 스페이서를 함유한 가이드는 농축되지 않았으며, 이는 농축이 선택적 컷오프(selective cutoff)임을 확인한다(데이터는 나타내지 않음). 농축된 가이드 스캐폴드 174 및 175 상의 돌연변이의 전체 세트는 각각 표 28 및 표 29에 주어진다. 이들 목록은 표적화된 기능적 RNP를 여전히 달성할 수 있는 서열 다양성을 규명한다.
단일 뉴클레오티드 돌연변이는 스캐폴드의 이변 영역을 표시한다:
가이드 스캐폴드 174 및 175에 비교하여 유사하거나 개선된 활성으로 이어지는 스캐폴드 돌연변이를 결정하기 위해, 단일 뉴클레오티드 치환, 삽입, 또는 결실의 농축 값을 플로팅하였다(도 70). 일반적으로, 가이드 스캐폴드 174 상의 단일 뉴클레오티드 변화는 가이드 스캐폴드 175보다 더 용인되었으며, 이는 아마도 이와 관련하여 가이드 스캐폴드 174의 더 높은 활성 및 따라서 활성을 약화시키는 돌연변이에 대한 더 높은 용인성을 반영한다(도 68 및 도 71). 바람직했던 175 상의 단일 뉴클레오티드 돌연변이는 대부분의 경우에 가이드 스캐폴드 174의 맥락에서 또한 바람직했으며(도 71), 따라서 가이드 스캐폴드 175 상의 돌연변이에 대한 값은 돌연변이 효과의 더 엄격한 판독인 것으로 이해되었다. 하기 단락에 기재된 바와 같이, 이러한 분석에 의해 중심 이변 영역을 규명하였다:
가장 주목할만한 특징은, 스캐폴드 174 또는 175에 대한 참조 서열과 유사한 농축값을 나타낸 연장된 스템이었으며, 이는 과거에 관찰되었고 연장된 스템이 단백질과의 접촉을 거의 갖지 않는 것으로 보이는 CasX RNP의 구조적 분석에 의해 예측될 것과 유사하게, 스캐폴드가 이 영역 내의 변화를 용인할 수 있을 것임을 제시한다.
특히 가이드 스캐폴드 175 내에 만들어질 경우에(예를 들어, 특히 C15 또는 C17에 대한 돌연변이), 삼중체 루프는 참조 스캐폴드에 비교하여 높은 농축을 나타낸 또 하나의 영역이었다. 특히, 175에서의 C17 위치는 스캐폴드 174에서 G로 이미 돌연변이되어 있으며, 이는 스캐폴드 175에 대한 이 위치에서의 2개의 고도로 농축된 돌연변이 중 하나이다.
특히 가이드 스캐폴드 175에서, G7과 A29 사이의 유사매듭 스템 내의 예측된 쌍의 양쪽 구성원에 대한 변화는 둘 모두 참조에 비교하여 고도로 농축되었다. 이 쌍은 가이드 스캐폴드 174 및 175 둘 모두에서 비정준 G:A 대합이다. 이들 위치에서 가장 강력하게 농축된 돌연변이는 가이드 스캐폴드 175 내에서 A29를 C 또는 T로 전환하는 것이었으며; 이의 첫번째는 정준 왓슨-크릭 대합(G7:C29)을 형성할 것이고, 이의 두번째는 GU 워블 쌍(G7:U29)을 형성할 것이며, 이들 둘 모두는 G:A 쌍에 비교하여 나선의 안정성을 증가시킬 것으로 예상될 수 있다. G7을 T로 전환하는 것이 또한 고도로 농축되었으며, 이는 이 위치에서 정준 쌍(U7:A29)을 형성할 것이다. 명확하게, 이들 위치는 더 안정하게 대합되는 것을 선호한다. 일반적으로, 5' 단부는 이변성이었으며, 탈-농축으로 이어지는 변화는 거의 없었다.
최종적으로, 가이드 스캐폴드 175 내의 위치 54에서의 C의 삽입은 고도로 농축된 반면에, 가이드 스캐폴드 174 내의 유사한 위치에서의 A 또는 삽입된 G의 결실은 둘 모두 참조와 유사한 농축 값을 가졌다. 종합하면, 가이드 스캐폴드는 이러한 스캐폴드 스템 버블 내에 2개의 뉴클레오티드를 갖는 것을 선호할 수 있지만, 그것은 강력한 선호도는 아닐 수 있다. 이들 결과는 하기 섹션에서 추가로 조사된다.
유사매듭 스템 안정성은 스캐폴드 활성에 필수적이다
스캐폴드 활성에 대한 유사매듭 스템의 효과를 추가로 탐구하기 위해, 유사매듭 스템을 하기 방식으로 변형시켰다: (1) 각각의 새로운 유사매듭이 스템 내에서 조성이 동일하지만 순서가 상이한 염기쌍을 갖도록, 스템 내의 염기쌍을 셔플링함; (2) 염기쌍을 무작위, WC-대합 서열로 완전히 대체함. 이백구십일(291)개의 유사매듭 스템을 시험하였다. 제1 세트의 서열의 분석은 G-A 쌍이 다른 가능한 위치(위치 2 내지 6; 야생형 서열에서 그것은 위치 5에 있음; 도 72)에 비교하여 유사매듭 스템의 제1 위치에 있는 것에 대한 강력한 선호도를 나타내는 반면에, 결과는 유사매듭 스템 내의 위치 2 내지 6 각각에 GA 쌍을 갖는 것이 낮은 평균 농축을 동반하여 일반적으로 바람직하지 한다는 것을 입증한다. 위치 1에 G-A 염기를 갖는 것은, 나선의 나머지가 스태킹으로부터 왓슨-크릭 쌍만을 형성하는 것을 가능하게 함으로써, 유사매듭 스템을 안정화시킬 가능성이 있다. 이 결과는 스캐폴드가 완전히 대합된 유사매듭 스템을 선호한다는 것을 추가로 지지한다.
실질적인 수의 유사매듭 서열이 양성 log2 농축을 가졌으며, 이는 이 서열을 대체 염기쌍으로 대체하는 것이 일반적으로 용인되었음을 제시한다(도 73에서의 유사매듭 구조). 유사매듭 스템 내의 더 안정한 나선이 더 활성인 스캐폴드를 유발할 것이라는 가설을 추가로 시험하기 위해, 각각의 유사매듭 스템의 2차 구조 안정성을 계산하였다(재료 및 방법). 유사매듭 안정성과 농축, 및 따라서 활성 사이에 강력한 관계가 관찰되었으며(도 74: 더 활성인 스캐폴드는 안정한 유사매듭 스템을 가짐), 안정한 유사매듭 스템(-7 kcal/mol 미만)을 갖는 가이드 스캐폴드는 높은 농축을 갖고 불안정화된 유사매듭 스템(-3 kcal/mol 이상)을 갖는 가이드 스캐폴드는 매우 낮은 농축을 갖는다.
이중 돌연변이는 가이드 스캐폴드의 이변 영역을 표시한다:
각각의 참조 가이드 스캐폴드에 대한 이중 돌연변이를 조사하여 스캐폴드 내의 이변 영역, 및 스캐폴드 활성을 개선하기 위한 잠재적 돌연변이를 추가로 확인하였다. 단일 쌍의 위치-유사매듭 스템 내의 비정준 G:A 쌍을 형성할 것으로 예측되고 돌연변이유발을 지원하는 위치 7 및 29(상기 섹션 참조)-에만 중점을 두고 본 발명자들은 이 쌍의 위치에 대한 64개의 이중 돌연변이 모두를 플로팅한다(도 75). 이들 2개의 위치에서는 정준 쌍이 선호된다(예를 들어 위치 7에서의 C 및 위치 29에서의 G의 치환은 G:C 쌍을 생성하며 농축되고; 위치 7에서의 C의 치환 및 위치 29에서의 G의 삽입은 유사하게 G:C 쌍을 생성하고, 위치 7에서의 A 및 위치 29에서의 U의 치환은 A:U 쌍을 생성함). 삽입의 쌍은 농축되지 않았으며, 아마도 이는G:A 쌍이 나선 내에서 위치가 상향 이동되고 완전히 제거되지 않음을 고려할 때 정준 쌍을 여기에 삽입하는 것이 나선을 안정화시키기에 충분하지 않기 때문이다. 의외로, 몇몇 농축된 이중 돌연변이; 예를 들어 위치 7에서의 U 및 위치 29에서의 C의 치환(이는 비정준 U:C 쌍을 형성함), 위치 7에서의 U 및 위치 29에서의 U의 치환(U:U 쌍을 형성함)뿐만 아니라, 몇가지 다른 것들은 정준 쌍을 형성하지 않았다(도 75). 퓨린:퓨린 쌍이 다른 비정준 쌍보다 나선에 대해 실질적으로 더 파괴적일 가능성이 있다. 실제로, 위치 7에서의 A 및 위치 29에서의 G의 치환은 다시 A:G 쌍을 형성하며, 이는 이 위치에서 농축되지 않는다.
가이드 스캐폴드 175의 중심 구조적 요소 각각의 내부의 이중 치환의 농축 값은 각각의 위치가 최대 3개의 치환을 가질 수 있었던 열 지도로부터 결정되었다. 스캐폴드 스템은 돌연변이에 대해 용인성이 가장 낮은 것으로 결정되었으며, 이는 이 영역 내의 강하게 제약된 서열을 제시한다.
결과는 편집 검정에 이용될 경우에 여전히 기능적 유전자 녹아웃을 유발하는 실질적인 변화가 가이드 스캐폴드에 대해 이루어질 수 있다는 것을 입증한다. 특히, 결과는 스캐폴드 내의 유사매듭 스템의 증가된 2차 구조 안정성을 포함하는, 가이드 스캐폴드 내의 변형을 통해 활성을 개선하기 위해 이용될 수 있는 중심 위치를 입증한다.
[표 28]
[표 29]
실시예 21: CcdB 선택 검정은 TTC, ATC, 및 CTC PAM 서열에서의 개선된 dsDNA 절단 또는 개선된 스페이서 특이성을 갖는 CasX 단백질 변이체를 확인한다
TTC 또는 ATC 또는 CTC의 PAM 서열과 관련된 표적 DNA 서열에서의 이중-가닥 DNA(dsDNA) 절단에 대해 생화학적으로 적격성이고 CasX 515에 비교하여 개선된 활성 또는 개선된 스페이서 특이성을 나타내는 CasX 515(서열 번호 145)로부터 유래된 변이체의 세트를 확인하기 위해 실험을 수행하였다. 이를 달성하기 위하여, 첫째로, CasX 515 및 가이드 스캐폴드 174를 사용하는 CcdB 선택 실험에서 배경 수준 초과의 생존으로 스페이서의 세트를 확인하였다. 둘째로, 이들 스페이서로 CcdB 선택을 수행하여 정준 "야생형" PAM 서열 TTC에서의 dsDNA 절단에 대해 생화학적으로 적격성인 CasX 515로부터 유래된 변이체의 세트를 결정하였다. 셋째로, 유형 ATC 또는 유형 CTC의 PAM 서열에서의 개선된 dsDNA 절단을 가능하게 하는 CasX 515의 변이체의 세트를 결정하기 위해 CcdB 선택 실험을 수행하였다. 넷째로, 개선된 스페이서 특이성을 유발한 CasX 515로부터 유래된 변이체의 세트를 결정하기 위해 플라스미드 반대-선택 실험을 수행하였다.
재료 및 방법:
CcdB 선택 실험을 위해, 표시된 CasX 단백질(또는 라이브러리) 및 sgRNA를 발현하는 300 ng의 플라스미드 DNA(p73)를 CcdB 독성 단백질을 발현하는 플라스미드를 보유하는 E. 콜라이 균주 BW25113 내로 전기천공하였다. 형질전환 후에, 배양물을 20 분 동안 37 oC에서 진탕하면서 글루코스-풍부 배지 중에 회복시킨 후, IPTG를 1 mM의 최종 농도로 첨가하고, 배양물을 부가적인 40 분 동안 추가로 인큐베이션하였다. 이어서 플라스미드에 대해 선택적인 항생제를 함유하는 LB 아가 플레이트(Teknova Cat# L9315) 상에서 회복된 배양물의 역가를 측정하였다. 글루코스(CcdB 독소가 발현되지 않음) 또는 아라비노스(CcdB 독소가 발현됨)를 함유하는 플레이트 상에서 세포의 역가를 측정하고, 도 76에 나타낸 바와 같이 상대 생존을 계산하고 플로팅하였다. 그 다음에, 상기와 같이 배양물을 전기천공하고 회복시키고, 역가결정을 위해 회복의 분획을 저장하였다. 각각 선택이 없거나 강력한 선택이 있는 혼주된 라이브러리의 샘플을 수집하기 위하여, 회복 기간 후에 회복된 배양물의 나머지를 분할하고, 글루코스 또는 아라비노스를 함유하는 배지 중에 성장시켰다. 이들 배양물을 수확하고 제조사의 설명서에 따라 플라스미드 미니프렙 키트(QIAGEN)를 사용하여 생존하는 플라스미드 풀을 추출하였다. 총 3 라운드의 선택에 대해 전체 공정을 반복하였다.
최종 플라스미드 풀을 단리하고 고유 분자 식별자(UMI)에 대해 특이적인 프라이머를 사용하여 p73 플라스미드의 PCR 증폭을 수행하였다. 이들 UMI 서열은 각각의 특이적 UMI가 CasX 515 단백질의 하나이고 유일한 단일 돌연변이와 관련되도록 설계되었다. 전형적인 PCR 조건을 증폭에 사용하였다. CasX 515의 변이체의 풀은 심층 돌연변이 진화(DME)로 명명된 접근법에서의 다수의 가능한 아미노산 치환뿐만 아니라, 가능한 삽입, 및 단일 아미노산 결실을 함유하였다. 증폭된 DNA 생성물은 30 μl의 물 중의 용리를 이용하여 Ampure XP DNA 클린업 키트로 정제하였다. 이어서 제조사의 설명서에 따라 MiSeq 기기 또는 NextSeq 기기(Illumina) 상의 차세대 서열분석(NGS)과 상용성인 어댑터 서열을 첨가하기 위한 제2 PCR로 서열분석을 위한 앰플리콘을 제조하였다. 제조된 샘플의 NGS를 수행하였다. 돌아온 원시 데이터 파일을 하기와 같이 가공하였다: (1) 품질 및 어댑터 서열을 위해 서열을 트리밍하였고; (2) 판독 1 및 판독 2로부터의 서열을 단일 삽입 서열로 병합하였고; (3) CasX 515에 대한 참조 서열에 비교하여 돌연변이와 관련된 UMI를 함유하는 것에 대해 각각의 서열을 정량화하였다. CasX 515에 비교하여 개별 돌연변이의 발생률을 계수하였다. 선택-후 돌연변이 계수를 선택-전 돌연변이 계수로 나누고, 10의 가성계수(pseudocount)를 사용하여 "농축 점수"를 생성하였다. 이 점수의 밑이 2인 로그(log2)를 계산하고 열 지도로서 플로팅하였으며, 여기서 삽입, 결실, 또는 치환을 위한 각각의 아미노산 위치에서 단일 스페이서에 대한 생물학적 반복실험에 대해 농축 점수를 결정하였다(나타내지 않음). 삼중실험으로 수행된 2개의 TTC PAM 스페이서(스페이서 23.2 AGAGCGTGATATTACCCTGT, 서열 번호 41837, 및 23.13 CCCTTTGACGTTGGAGTCCA, 서열 번호 41838) 및 이중실험으로 수행된 1개의 TTC PAM 스페이서(스페이서 23.11 TCCCCGATATGCACCACCGG, 서열 번호 41839)로 CcdB 선택을 통해 라이브러리를 통과시키고, 삼중실험 측정값의 평균을 측정된 CasX 515의 변이체에 대한 열지도로서 log2 농축 척도 상에 플로팅하였다. CasX 515에 비교하여 전체 절단 기능을 유지한 CasX 515의 변이체는 0 부근의 log2 농축 값을 나타냈고; 절단 기능의 손실을 갖는 변이체는 0 미만의 log2 값을 나타낸 반면에, 이러한 선택을 사용하여 개선된 절단을 갖는 변이체는 CasX 515의 값에 비교하여 0 초과의 log2 값을 유발했다. 선택성을 위해 하기 단일 스페이서(각각 11.2 AAGTGGCTGCGTACCACACC, 서열 번호 41840; 23.27 GTACATCCACAAACAGACGA, 서열 번호 41840; 및 23.19 CCGATATGCACCACCGGGTA, 서열 번호 41842)를 사용하여 부가적인 열 지도(나타내지 않음)를 생성하기 위한 실험을 수행했다.
플라스미드 반대-선택 실험을 위해, TTC PAM 스페이서로 CcdB 선택으로부터 유발된 최종 플라스미드 풀 상에서 부가적인 라운드의 박테리아 선택을 수행하였다. 반대-선택의 전반적인 계획은 플라스미드의 2개의 집단을 동시에 함유하는 E. 콜라이의 세포만의 복제를 가능하게 하는 것이다. 제1 플라스미드(p73)는 CasX 단백질(ATc에 의한 유도성 발현 하에) 및 sgRNA(구성성으로 발현됨)뿐만 아니라 항생제 저항성 유전자(클로람페니콜)를 발현한다. 이 플라스미드를 또한 선택 검정, 예컨대 CcdB를 위한 표준으로 사용할 수 있으며, 스페이서 서열은 실험자가 원하는 바와 같이 완전히 자유롭게 변동된다는 것에 유의한다. 제2 플라스미드(p74)는 항생제 저항성 유전자(카나마이신)를 발현하는 역할만을 하지만, p73에 인코딩된 스페이서와 일치하는 표적 부위를 함유하도록(또는 함유하지 않도록) 변형되었다. 추가로, 이들 표적 부위는 스페이서 서열에 비교하여 스페이서의 RNA와 표적 부위의 DNA 사이의 비-정준 왓슨-크릭 염기-대합으로 이루어진 "불일치"를 혼입하도록 설계될 수 있다. p73으로부터 발현된 RNP가 p74에서 표적 부위를 절단할 수 있는 경우, 세포는 클로람페니콜에만 저항성으로 유지될 것이다. 대조적으로, RNP가 표적 부위를 절단할 수 없는 경우, 세포는 클로람페니콜 및 카나마이신 둘 모두에 저항성으로 유지될 것이다. 최종적으로, 상기 기재된 이중 플라스미드 복제 시스템은 2가지 방식으로 달성될 수 있다. 순차적 방법에서는, 어느 하나의 플라스미드를 먼저 세포에 전달하고, 그 후에 균주를 전기적격성(electrocompetent)으로 만들고 제2 플라스미드를 전달할 수 있다(둘 모두 전기천공에 의함). 이전의 연구는 플라스미드 전달의 순서는 둘 중에 어느 것이든 성공적인 반대-선택에 충분하다는 것을 입증하였으며, 둘 모두의 계획을 수행하였다: "스크린 5"로 명명된 실험에서는, p74를 보유하는 적격성 세포 내로 p73을 전기천공하는 반면에, 스크린 6에서는 그 역순이다. 배양물을 전기천공하고, 회복시키고, 역가를 측정하고, 단일 라운드 동안 상기와 같은 선택 조건 하에 성장시키고, 플라스미드를 회수한 후에 증폭, NGS가 이어지고, 농축 계산을 또한 상기와 같이 수행하였다.
최종적으로, 부가적인 CcdB 선택을 유사한 방식으로 수행하였으나, 가이드 스캐폴드 235를 이용하고 대안적인 프로모터 WGAN45, Ran2, 및 Ran4를 이용하였으며, 모두 스페이서 23.2를 갖는 독성 CcdB 플라스미드를 표적화하였다. 이들 프로모터는 상기 CcdB 선택에 비교하여 가이드 RNA를 더 약하게 발현할 것으로 예상되며, 따라서 박테리아 세포 내의 CasX RNP의 총 농도를 감소시킬 것으로 예상된다. 이러한 생리학적 효과는 선택 검정에서 박테리아 세포의 전반적인 생존을 감소시킴으로써, 농축 점수의 동적 범위를 증가시키고 TTC PAM 스페이서 23.2에서의 RNP 뉴클레아제 활성과 더 정밀하게 관련시켜야 한다. 각각의 프로모터에 대해, 상기와 같이 3 라운드의 선택을 삼중실험으로 수행하였으며, 각각의 라운드의 실험은 상기와 같이 농축 데이터를 유발하였다. 이들 실험은 이하 스크린 7로 지칭된다.
결과:
라이브러리 스크린 열 지도의 결과는, 가이드 스캐폴드 174와 복합체화된 CasX 515는 TTC PAM 서열과 관련된 DNA 서열을 표적화하는 스페이서(하기 열거됨)를 사용하여 표적화될 경우에 CcdB 발현 플라스미드를 절단할 수 있었다는 것을 입증하였다. 대조적으로, 대안적인 PAM 서열을 이용하는 스페이서는 훨씬 더 가변적인 생존을 나타냈다. ATC PAM 스페이서(하기 열거됨)는 생존율에 있어서 수 % 내지 0.1% 훨씬 미만의 범위였던 반면에, CTC PAM 스페이서(하기 열거됨)은 50% 초과 내지 1% 미만의 범위의 생존율을 가증하게 하였다. 최종적으로, GTC PAM 스페이서(하기 열거됨)는 단지 0.1% 이하의 생존율을 가능하게 하였다. 이러한 벤치마킹 데이터는 이 선택 파이프라인의 실험적 설계를 지지하며, CcdB 박테리아 검정의 강건한 선택력을 임증한다. 구체적으로, 이중-가닥 DNA를 절단할 수 없는 CasX 단백질은 4 자릿수 이상만큼 탈-농축되는 반면에, 절단에 대해 생화학적으로 적격성인 CasX 단백질은 검정에서 생존할 것이다.
TTC PAM 서열과 관련된 표적 DNA 서열에서의 dsDNA 절단에 대해 생화학적으로 적격성인 CasX 515의 변이체의 세트뿐만 아니라, CTC(스페이서 11.2 및 23.27) 및 ATC(스페이서 (23.19)의 PAM 서열과 관련된 표적 DNA 서열에서의 개선된 dsDNA 절단을 나타내는 변이체를 확인하기 위해 열지도를 사용하였다.
이들 3개의 데이터세트는, 개별적으로, 또는 조합되어, 변이체들 사이의 기저의 생화학적 차이를 나타내며 인간 게놈 편집을 위한 개선된 CasX 치료제의 향후 조작을 위해 관심 영역을 확인한다. 이에 대한 증거로서, 단백질 전체에 걸쳐 각각의 위치에 정지 코돈의 존재와 같은 내부 대조군이 미접촉 라이브러리의 부분으로서 균일하게 포함되었다. 이들 정지 코돈은 선택의 라운드 전체에 걸쳐 상실되는 것으로 일관적으로 관찰되었으며, 이는 부분적으로 절단된 CasX 515는 dsDNA 절단을 가능하게 하지 않아야 한다는 예상과 일치한다. 유사하게, 열지도 데이터에 반영된 활성 손실을 갖는 변이체는 선택 중에 고갈됨으로써 본 검정에서 이중-가닥 DNA 절단에 대한 적합도의 극심한 손실을 갖는 것으로 관찰되었다. 그러나, 1 이상의 농축 값(및 0 이상의 상응하는 log2 농축 값)을 갖는 변이체는, 최소한, 생화학적 절단에 관련하여 중성이다. 중요하게, 이러한 변이체의 특이적 서브세트에서 확인된 돌연변이 중 하나 이상이 치료 분자에 대한 바람직한 특성을 나타내는 경우, 이들 돌연변이는 생화학적 기능과 상용성인 것으로 나타난 구조-기능 관계를 확립한다. 더욱 구체적으로, 이들 돌연변이는 CasX 단백질 전사, 번역, 폴딩, 안정성, 리보핵단백질(RNP) 형성, PAM 인식, 이중-가닥 DNA 풀림, 비-표적 가닥 절단, 및 표적 가닥 절단과 같은 특성에 영향을 미칠 수 있다.
CTC 및 ATC PAM 서열과 관련된 서열에서의 절단에 대해 적격성인 변이체의 경우, 이러한 데이터세트 내의 농축된 변이체(1 초과의 농축, 대략 0의 값에 대한 log2 농축과 등가임)는 CTC 또는 ATC PAM 표적 부위의 절단을 특이적으로 개선하는 돌연변이를 나타낸다. 이러한 기준을 충족시키는 돌연변이는 2가지의 일반적 방식으로 추가로 하위분류될 수 있다: 돌연변이는 PAM의 인식을 개선함으로써 절단 속도를 개선하거나(유형 1), 돌연변이는 PAM 서열과 무관하게 분자의 전반적인 절단 속도를 개선한다(유형 2).
제1 유형의 예로서, 위치 223에서의 치환 돌연변이는 시험된 모든 샘플에서 수백-배만큼 농축되는 것으로 확인되었다. 이 위치는 둘 모두의 야생형 참조 CasX 단백질 CasX 1 및 2에서 글리신을 인코딩하며, 이는 CasX 1의 공개된 CryoEM 구조(PDB ID: 6NY2) 내의 DNA 비-표적 가닥의 -4 뉴클레오티드 위치로부터 6.34 옹스트롬인 것으로 측정된다. 따라서 위치 223에서의 이러한 치환 돌연변이는 신규 PAM의 변경된 뉴클레오티드에 대해 물리적으로 근위에 있으며, DNA와 직접 상호작용할 가능성이 있다. 이 결론을 추가로 지지하여, 농축된 치환 중 다수는 대체된 아미노산(글리신)에 비교하여 부가적인 수소 결합을 형성할 수 있는 아미노산을 인코딩하였다. 이들 조사결과는, 특히 PAM DNA 서열에 대해 물리적으로 근위에 있는 경우(10 옹스트롬 이내), DNA 가닥 중 하나 또는 둘 모두와 상호작용하는 돌연변이를 도입함으로써 CasX 단백질 내에서 신규 PAM 서열의 개선된 인식이 달성될 수 있다는 것을 입증한다. ATC 및 CTC 스페이서에 대한 열 지도의 부가적인 특징은 비-정준 PAM 서열의 증가된 인식을 가능하게 하는 돌연변이를 나타냈으나, 이들의 작용 기전은 아직 조사된 바 없다.
제2 유형의 돌연변이의 예로서, DNA의 PAM 서열을 반드시 특이적으로 인식하지는 않으면서, CasX 515에 비교하여 전반적인 절단 속도를 개선하는 돌연변이를 확인하기 위해 열 지도의 결과를 사용하였다. 예를 들어, 위치 27에서의 아르기닌의 삽입으로 이루어진 CasX 515의 변이체는 스페이서 11.2(CTC PAM) 및 스페이서 23.19(ATC PAM)를 이용한 선택에서 1 초과의 농축 값을 갖는 것으로 측정되었다. 이 변이체는 CTC PAM 스페이서 상의 유사한 선택에 의해 이전에 확인되었으며, 여기서 이 돌연변이는 수 자릿수만큼 농축되었다(데이터는 나타내지 않음). 이 아미노산 돌연변이의 위치는 상기 구조 모델에서 위치 -1에서의 DNA 표적 가닥에 대해 물리적으로 근위(9.29 옹스트롬)에 있다. 이러한 이해는 이중-가닥 DNA를 갖는 CasX RNP에 의해 형성된 성숙한 R-루프가 아르기닌의 측쇄에 의해, 아마도 양성으로 하전된 측쇄와 음성으로 하전된 DNA 표적 가닥의 골격의 이온 상호작용에 의해 안정화되는 기전을 제시한다. 그러한 상호작용은 PAM 특이성을 변경하지 않으면서 전반적인 절단 동역학에 유익하다. 이러한 데이터는, 일부 농축된 돌연변이가 DNA 가닥 중 어느 하나 또는 둘 모두와 물리적으로 상호작용함으로써(이들에 대해 물리적으로 근위에 있을 경우(10 옹스트롬 이내)) CasX 515의 전반적인 절단 활성을 개선하는 변이체를 나타낸다는 결론을 지지한다.
데이터는 열 지도로부터 확인된 CTC 또는 ATC PAM 서열과 관련된 서열에서의 절단을 개선하는 것으로 측정된 돌연변이 중 다수는 상기 명시된 돌연변이의 2가지 유형 중 어느 하나로서 분류될 수 있다는 결론을 지지한다. 유형 1의 돌연변이의 경우, CTC PAM에서 시험된 스페이서 중 하나 이상에서 큰 농축 점수를 갖는 위치 223에 대한 돌연변이로 이루어진 변이체는 관련된 최대 농축 점수와 함께 표 30에 열거되어 있다. 유형 2의 돌연변이의 경우, 돌연변이의 더 작은 목록이 수천개의 농축된 변이체 중으로부터 체계적으로 선택되었다. CasX 515에 비교하여 전반적인 절단 활성을 개선할 가능성이 매우 높은 돌연변이를 확인하기 위해, 하기 접근법이 채택되었다. 첫째로, CTC 또는 ATM PAM 스페이서에 걸쳐 가장 일관적으로 농축된 것들에 대해 돌연변이를 여과하였다. 각각의 스페이서에 대한 각각의 돌연변이의 농축 점수에 대해 하위 경계(LB)가 정의되었다. LB는 생물학적 삼중실험에 걸친 조합된 log2 농축 점수, 마이너스 개별 반복실험에 대한 log2 농축 점수의 표준 편차로서 정의되었다. 둘째로, 3개의 독립적인 실험 데이터세트(1개의 ATC PAM 선택 및 2개의 CTC PAM 선택) 중에서 2개 이상에 대해 LB가 1 초과인 이들 돌연변이의 서브세트를 취하였다. 셋째로, 3개의 TTC PAM 선택 중 임의의 것에서 음성 log2 농축이 측정된 것들을 배제함으로써 이 돌연변이의 서브세트를 추가로 감소시켰다. 최종적으로, 하나 이상의 실험에서 구조적 특징 및 강력한 농축 점수의 조합에 기초하여 개별 돌연변이를 수동으로 선택하였다. 이러한 기준을 충족시키는 생성되는 274개의 돌연변이는 생성되는 열 지도에 나타낸 2개의 CTC 또는 1개의 ATC PAM 실험으로부터의 최대 관찰 log2 농축 점수뿐만 아니라 돌연변이가 위치하는 도메인과 함께 표 31에 열거되어 있다.
부류 I 돌연변이와는 대조적으로, CasX 단백질의 뉴클레아제 활성의 스페이서 특이성을 개선하는, 부류 II로 명명된, 스페이서 서열에 의해 결정되는 바와 같이, 게놈 DNA 내의 표적-내 부위와 표적-외 부위를 구별하는 CasX RNP의 능력을 개선하는 돌연변이의 다른 카테고리가 존재한다. 부류 II 돌연변이를 특이적으로 확인하기 위해 2가지의 부가적인 실험을 수행하였으며, 여기서 이들 실험은 플라스미드 반대-선택으로 이루어졌고, CasX 515에 비교하여, 가이드 RNA의 스페이서 서열과 의도된 표적 DNA 사이의 단일 불일치에 대한 생성된 변이체의 감도를 나타내는 농축 점수를 유발하였다. 생성되는 농축 점수를 실험 데이터에 걸쳐 모든 관찰된 돌연변이에 대해 순위화하고, 원하는 표적-내 부위에서의 뉴클레아제 활성을 실질적으로 감소시키지 않으면서 CasX 단백질의 스페이서 특이성을 개선할 가능성이 있는 돌연변이의 서브세트를 확인하기 위해 하기 분석을 수행하였다. 첫째로, 스페이서 23.2를 사용하는 3회의 기술적 반복실험에 걸쳐 스크린 5로부터의 돌연변이를 이들의 평균 농축 점수에 의해 순위화하였다. 스페이서들에 걸쳐 보편적이라기보다는, 단지 스페이서 23.2에서만 특이성에 개선을 부여할 수 있는 부류 II 돌연변이를 폐기하기 위하여, 표적 부위에 결합된 CasX RNP의 공개된 모델(PDB ID: 6Ny2)로부터 추론되는 바와 같이, 뉴클레오티드 불일치에 대해 물리적으로 근위에 있는 돌연변이를 제거하였다. 최종적으로, 이들 부류 II 돌연변이는 표적-내 TTC PAM 부위에서의 이들의 절단 활성이 돌연변이에 의해 음성 영향을 받았을 경우에 이들의 3개의 TTC PAM CcdB 선택으로부터의 평균 log2 농축이 0 미만이었던 경우에 폐기되었다. 이러한 기준을 충족시키는 생성되는 돌연변이는 스크린 5로부터의 최대 관찰 log2 농축 점수 및 돌연변이가 위치하는 도메인과 함께 표 32에 열거되어 있다. 부가적으로, 부류 II 돌연변이는 반대-선택 실험 스크린 6으로부터 확인되었다. 이들 돌연변이는 이들의 평균 농축 점수에 의해 유사하게 순위화되었지만, 상이한 여과 단계가 적용되었다. 특히, 돌연변이는 하기 카테고리 각각으로부터 확인되었다: 스페이서 23.2, 스페이서 23.11, 또는 스페이서 23.13으로부터의 최고 평균 농축 점수를 갖는 것들; 스페이서 23.2 및 스페이서 23.11로부터의 최고 조합 평균 농축 점수를 갖는 것들; 스페이서 23.11 및 스페이서 23.13으로부터의 최고 조합 평균 농축 점수를 갖는 것들; 또는 스크린 5에서의 스페이서 23.2 및 스크린 6에서의 스페이서 23.2로부터의 최고 조합 평균 농축 점수를 갖는 것들. 이들 생성되는 돌연변이는 스크린 6으로부터의 최대 관찰 log2 농축 점수 및 돌연변이가 위치하는 도메인과 함께 표 32에 열거되어 있다.
부류 I 또는 부류 II 돌연변이에 부가하여, TTC PAM 서열에서의 dsDNA 편집 활성을 개선하는 것으로 직접 관찰된 돌연변이의 다른 카테고리가 존재한다. 부류 III 돌연변이로 명명된 이들 돌연변이는 스크린 7에서 스페이서 23.2를 사용하여 CcdB 플라스미드를 표적화할 경우에 CasX 515의 농축 점수를 초과하는 농축 점수를 나타냄으로써 개선된 뉴클레아제 활성을 입증하였다. 컴퓨터 여과 단계를 사용하여 특히 관심의 대상인 이들 농축된 돌연변이의 서브세트를 확인하였다. 구체적으로, 시험된 3개의 프로모터 각각에 대해 0을 초과한 평균 농축 값을 가진 돌연변이를 3회의 반복실험에 걸쳐 확인하였다. 최종적으로, 아미노산 서열에 걸친 농축 점수의 특징을 사용하여 농축된 위치에서의 부가적인 돌연변이를 확인하였다. 예시적인 관심 특징은 하기를 포함하였다: 위상 변화를 용이하게 하기 위한 단백질 도메인의 접합부에서의 삽입 또는 결실; 폴리펩티드 골격을 굴곡시키기 위한 프롤린으로의 아미노산의 치환; 단백질과 어느 하나의 가이드 RNA 또는 어느 하나의 표적 DNA의 가닥의 음성으로 하전된 핵산 골격 사이에 이온 결합을 첨가하기 위한 양성으로 하전된 아미노산으로의 아미노산의 치환; 연속된 결실이 둘 모두 고도로 농축되는 아미노산의 결실; 다수의 고도로 농축된 치환을 함유하는 위치에 대한 치환; 단백질의 극단 N-말단에서의 고도로 농축된 아미노산으로의 아미노산의 치환. 이들 생성되는 돌연변이는 스크린 6으로부터의 최대 관찰 log2 농축 점수 및 돌연변이가 위치하는 도메인과 함께 표 33에 열거되어 있다.
[표 30]
[표 31]
[표 32]
[표 33]

Claims (175)

  1. 하기 구성성분 서열을 포함하며, 재조합 아데노-관련 바이러스(AAV) 내로의 혼입을 위해 구성되는, 폴리뉴클레오티드:
    a. 제1 AAV 역위 말단 반복(ITR: inverted terminal repeat) 서열;
    b. 제2 AAV ITR 서열;
    c. 제1 프로모터 서열;
    d. CRISPR 단백질을 인코딩하는 서열;
    e. 제1 가이드 RNA(gRNA)를 인코딩하는 서열; 및,
    f. 임의로, 하나 이상의 액세서리(accessory) 요소 서열.
  2. 제1항에 있어서, CRISPR 단백질 및 제1 gRNA를 인코딩하는 서열은 조합된 길이로 약 3100개 미만, 약 3090개 미만, 약 3080개 미만, 약 3070개 미만, 약 3060개 미만, 약 3050개 미만, 또는 약 3040개 미만의 뉴클레오티드인, 폴리뉴클레오티드.
  3. 제1항 또는 제2항에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과를 갖는, 폴리뉴클레오티드.
  4. 제1항 또는 제2항에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  5. 제1항 또는 제2항에 있어서, 제1 프로모터 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 제1 프로모터 서열 및 CRISPR 단백질을 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
  7. 제6항에 있어서, 제1 프로모터는 pol II 프로모터인, 폴리뉴클레오티드.
  8. 제6항 또는 제7항에 있어서, 제1 프로모터는 폴리유비퀴틴 C(UBC) 프로모터, 사이토메갈로바이러스(CMV) 프로모터, 시미안 바이러스 40(SV40) 프로모터, 닭 베타-액틴 프로모터 및 토끼 베타-글로빈 스플라이스 수용자 부위 융합체(CAG), 사이토메갈로바이러스 인핸서(CB7)를 갖는 닭 β-액틴 프로모터, PGK 프로모터, 젠스 토르노에(JeT) 프로모터, GUSB 프로모터, CBA 혼성체(CBh) 프로모터, 신장 인자-1 알파(EF-1알파) 프로모터, 베타-액틴 프로모터, 라우스 육종 바이러스(RSV) 프로모터, 침묵화-빈발 비장 초점 형성 바이러스(SFFV) 프로모터, CMVd1 프로모터, 절단된 인간 CMV(tCMVd2), 최소 CMV 프로모터, hepB 프로모터, 닭 β-액틴 프로모터, HSV TK 프로모터, 미니-TK 프로모터, 최소 IL-2 프로모터, GRP94 프로모터, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, 수퍼 코어 프로모터 3, 아데노바이러스 주요 후기(AdML) 프로모터, MLC 프로모터, MCK 프로모터, GRK1 단백질 프로모터, Rho 프로모터, CAR 단백질 프로모터, hSyn 프로모터, U1a 프로모터, 리보솜 단백질 대형 서브유닛 30(Rpl30) 프로모터, 리보솜 단백질 소형 서브유닛 18(Rps18) 프로모터, CMV53 프로모터, 최소 SV40 프로모터, CMV53 프로모터, SFCp 프로모터, Mecp2 프로모터, pJB42CAT5 프로모터, MLP 프로모터, EFS 프로모터, MeP426 프로모터, MecP2 프로모터, MHCK7 프로모터, 베타-글루쿠로니다제(GUSB) 프로모터, CK7 프로모터, 및 CK8e 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  9. 제8항에 있어서, 제1 프로모터는 UBC, CMV, SV40, CAG, CB7, PGK, JeT, GUSB, CB, EF-1알파, 베타-액틴, RSV, SFFV, CMVd1, tCMVd2, 최소 CMV, 닭 β-액틴, HSV TK, 미니-TK, 최소 IL-2, GRP94, 수퍼 코어 프로모터 1, 수퍼 코어 프로모터 2, MLC, MCK, GRK1 단백질 Rho, CAR 단백질, hSyn, U1a, 리보솜 단백질 대형 서브유닛 30(Rpl30), 리보솜 단백질 소형 서브유닛 18(Rps18), CMV53, 최소 SV40, CMV53, SFCp, pJB42CAT5, MLP, EFS, MeP426, MecP2, MHCK7, CK7, 또는 CK8e 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
  10. 제7항 또는 제8항에 있어서, 제1 프로모터 서열은 약 400개 미만의 뉴클레오티드, 약 350개 미만의 뉴클레오티드, 약 300개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 150개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 40개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  11. 제7항 또는 제8항에 있어서, 제1 프로모터 서열은 약 40 내지 약 585개의 뉴클레오티드, 약 100 내지 약 400개의 뉴클레오티드, 또는 약 150 내지 약 300개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 제1 프로모터는 표 8에 기술된 바와 같은 서열 번호 40370 내지 40400, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 제1 프로모터는 표 24에 기술된 바와 같은 서열 번호 41030 내지 41044, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 하나 이상의 액세서리 요소는 CRISPR 단백질을 인코딩하는 서열에 작동가능하게 연결되는, 폴리뉴클레오티드.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 제2 프로모터를 추가로 포함하는, 폴리뉴클레오티드.
  16. 제15항에 있어서, 제2 프로모터 서열 및 제1 gRNA를 인코딩하는 서열은 작동가능하게 연결되는, 폴리뉴클레오티드.
  17. 제15항 또는 제16항에 있어서, 제2 프로모터는 pol III 프로모터인, 폴리뉴클레오티드.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서, 제2 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1(양방향 H1 프로모터), BiU6(양방향 U6 프로모터), 고릴라 U6, 레수스 U6, 인간 7sk, 및 인간 H1 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  19. 제18항에 있어서, 제2 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1, BiU6, 고릴라 U6, 레수스 U6, 인간 7sk, 또는 인간 H1 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
  20. 제18항 또는 제19항에 있어서, 제2 프로모터 서열은 약 250개 미만의 뉴클레오티드, 약 220개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 160개 미만의 뉴클레오티드, 약 140개 미만의 뉴클레오티드, 약 130개 미만의 뉴클레오티드, 약 120개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 70개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  21. 제18항 또는 제19항에 있어서, 제2 프로모터 서열은 약 70 내지 약 245개의 뉴클레오티드, 약 100 내지 약 220개의 뉴클레오티드, 또는 약 120 내지 약 160개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  22. 제15항 내지 제21항 중 어느 한 항에 있어서, 제2 프로모터 서열은 표 9에 기술된 바와 같은 서열 번호 40401 내지 40420 및 41010 내지 41029, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  23. 제15항 내지 제22항 중 어느 한 항에 있어서, 제2 프로모터는 제1 gRNA의 전사를 향상시키는, 폴리뉴클레오티드.
  24. 제15항 내지 제23항 중 어느 한 항에 있어서, 제1 프로모터 및 제2 프로모터의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
  25. 제15항 내지 제24항 중 어느 한 항에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상의 뉴클레오티드, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
  26. 제15항 내지 제25항 중 어느 한 항에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
  27. 제15항 내지 제26항 중 어느 한 항에 있어서, 제1 프로모터, 제2 프로모터, 및 하나 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 2개 이상의 액세서리 요소 서열을 포함하는, 폴리뉴클레오티드.
  29. 제28항에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 약 1300개 이상, 약 1350개 이상, 약 1360개 이상, 약 1370개 이상, 약 1380개 이상, 약 1390개 이상, 약 1400개 이상, 약 1500개 이상, 약 1600개 이상, 1650개 이상, 약 1700개 이상, 약 1750개 이상, 약 1800개 이상, 약 1850개 이상, 또는 약 1900개 이상의 뉴클레오티드 초과인, 폴리뉴클레오티드.
  30. 제28항에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1314개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
  31. 제28항에 있어서, 제1 프로모터, 제2 프로모터, 및 2개 이상의 액세서리 요소의 서열은 조합된 길이로 1381개 초과의 뉴클레오티드인, 폴리뉴클레오티드.
  32. 제15항 내지 제31항 중 어느 한 항에 있어서, 폴리뉴클레오티드 서열의 길이의 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34% 이상, 또는 35% 이상은 제1 및 제2 프로모터 및 하나 이상의 액세서리 요소의 서열을 포함하는, 폴리뉴클레오티드.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 액세서리 요소는 폴리(A) 신호, 유전자 인핸서 요소, 인트론, 전사후 조절 요소(PTRE), 핵 위치 신호(NLS: nuclear localization signal), 데아미나제, DNA 글리코실라제 억제제, CRISPR-매개 상동성-지정 복구(CRISPR-mediated homology-directed repair)의 자극제, 및 전사의 활성화제, 및 전사의 저해제로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  34. 제1항 내지 제32항 중 어느 한 항에 있어서, 액세서리 요소는 상기 액세서리 요소가 결여된 그 밖에는 동일한 폴리뉴클레오티드에 비교하여 표적 핵산의 전사, 전사 종결, 발현, 결합, 표적 핵산의 편집, 또는 CRISPR 단백질의 성능을 향상시키는, 폴리뉴클레오티드.
  35. 제34항에 있어서, 향상된 성능은 시험관내 검정에서 발현된 CRISPR 단백질 및 제1 gRNA에 의한 표적 핵산의 편집의 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 100% 이상, 약 150% 이상, 약 200% 이상, 또는 약 300% 이상의 증가인, 폴리뉴클레오티드.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 인코딩된 CRISPR 단백질은 부류 2 CRISPR 단백질인, 폴리뉴클레오티드.
  37. 제36항에 있어서, 인코딩된 CRISPR 단백질은 부류 2, 유형 V CRISPR 단백질인, 폴리뉴클레오티드.
  38. 제37항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은,
    a. QPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPEKDSDEAVTYSLGKFGQ(서열 번호 41818)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 NTSB 도메인;
    b. RALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSF(서열 번호 41819)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 나선형 I-II 도메인;
    c. PLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALRPYLSSEEDRKKGKKFARYQLGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAE(서열 번호 41820)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 나선형 II 도메인; 및
    d. SSNIKPMNLIGVDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAKKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTC(서열 번호 41821)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 RuvC-I 도메인을 포함하는, 폴리뉴클레오티드.
  39. 제38항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 QEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQ(서열 번호 41822)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 OBD-I 도메인을 포함하는, 폴리뉴클레오티드.
  40. 제38항 또는 제39항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 NSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLD(서열 번호 41823)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 OBD-II 도메인을 포함하는, 폴리뉴클레오티드.
  41. 제38항 내지 제40항 중 어느 한 항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 PISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVA(서열 번호 41824)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 나선형 I-I 도메인을 포함하는, 폴리뉴클레오티드.
  42. 제38항 내지 제41항 중 어느 한 항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 SNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETH(서열 번호 41825)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 TSL 도메인을 포함하는, 폴리뉴클레오티드.
  43. 제38항 내지 제42항 중 어느 한 항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 ADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV(서열 번호 41826)의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는 RuvC-II 도메인을 포함하는, 폴리뉴클레오티드.
  44. 제38항 내지 제43항 중 어느 한 항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 서열 번호 145의 서열, 또는 이들에 대해 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열을 포함하는, 폴리뉴클레오티드.
  45. 제38항 내지 제44항 중 어느 한 항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 하나 이상의 도메인 내에 하나 이상의 변형을 포함하는, 폴리뉴클레오티드.
  46. 제45항에 있어서, 하나 이상의 변형은,
    a. 도메인 내의 하나 이상의 아미노산 치환;
    b. 도메인 내의 하나 이상의 아미노산 결실;
    c. 도메인 내의 하나 이상의 아미노산 삽입; 또는
    d. (a) 내지 (c)의 임의의 조합을 포함하는, 폴리뉴클레오티드.
  47. 제45항 또는 제46항에 있어서, 서열 번호 41818에 비교하여 P2, S4, Q9, E15, G20, G33, L41, Y51, F55, L68, A70, E75, K88, 및 G90으로 이루어진 군으로부터 선택된 NTSB 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  48. 제47항에 있어서, 서열 번호 41818에 비교하여 NTSB 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 2에서의 G의 삽입, 위치 4에서의 I의 삽입, 위치 4에서의 L의 삽입, Q9P, E15S, G20D, 위치 30에서의 S의 결실, G33T, L41A, Y51T, F55V, L68D, L68E, L68K, A70Y, A70S, E75A, E75D, E75P, K88Q, 및 G90Q로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  49. 제45항 내지 제48항 중 어느 한 항에 있어서, 서열 번호 41819에 비교하여 I24, A25, Y29 G32, G44, S48, S51, Q54, I56, V63, S73, L74, K97, V100, M112, L116, G137, F138, 및 S140으로 이루어진 군으로부터 선택된 나선형 I-II 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  50. 제49항에 있어서, 서열 번호 41819에 비교하여 나선형 I-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 24에서의 T의 삽입, 위치 25에서의 C의 삽입, Y29F,G32Y, G32N, G32H, G32S, G32T, G32A, G32V, 위치 32에서의 G의 결실, G32S, G32T, G44L, G44H, S48H, S48T, S51T, Q54H, I56T, V63T, S73H, L74Y, K97G, K97S, K97D, K97E, V100L, M112T, M112W, M112R, M112K, L116K, G137R, G137K, G137N, 위치 138에서의 Q의 삽입, 및 S140Q로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  51. 제45항 내지 제50항 중 어느 한 항에 있어서, 서열 번호 41820에 비교하여 L2, V3, E4, R5, Q6, A7, E9, V10, D11, W12, W13, D14, M15, V16, C17, N18, V19, K20, L22, I23, E25, K26, K31, Q35, L37, A38, K41,R 42, Q43, E44, L46, K57, Y65, G68, L70, L71, L72, E75, G79, D81, W82, K84, V85, Y86, D87, I93, K95, K96, E98, L100, K102, I104, K105, E109, R110, D114, K118, A120, L121, W124, L125, R126, A127, A129, I133, E134, G135, L136, E138, D140, K141, D142, E143, F144, C145, C147, E148, L149, K150, L151, Q152, K153, L158, E166, 및 A167로 이루어진 군으로부터 선택된 나선형 II 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  52. 제51항에 있어서, 서열 번호 41820에 비교하여 나선형 II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 2에서의 A의 삽입, 위치 2에서의 H의 삽입, 위치 2에서의 L의 결실 및 위치 3에서의 V의 결실, V3E, V3Q, V3F, 위치 3에서의 V의 결실, 위치 3에서의 D의 삽입, V3P, E4P, 위치 4에서의 E의 결실, E4D, E4L, E4R, R5N, Q6V, 위치 6에서의 Q의 삽입, 위치 7에서의 G의 삽입, 위치 9에서의 H의 삽입, 위치 9에서의 A의 삽입, VD10, 위치 0에서의 T1의 삽입, 위치 10에서의 V의 결실, 위치 10에서의 F의 삽입, 위치 11에서의 D의 삽입, 위치 11에서의 D의 결실, D11S, 위치 12에서의 W의 결실, W12T, W12H, 위치 12에서의 P의 삽입, 위치 13에서의 Q의 삽입, 위치 12에서의 G의 삽입, 위치 13에서의 R의 삽입, W13P, W13D, 위치 13에서의 D의 삽입, W13L, 위치 14에서의 P의 삽입, 위치 14에서의 D의 삽입, 위치 14에서의 D의 결실 및 위치 15에서의 M의 결실, 위치 15에서의 M의 결실, 위치 16에서의 T의 삽입, 위치 17에서의 P의 삽입, N18I, V19N, V19H, K20D, L22D, I23S, E25C, E25P, 위치 25에서의 G의 삽입, K26T, K27E, K31L, K31Y, Q35D, Q35P, 위치 37에서의 S의 삽입, 위치 37에서의 L의 결실 및 위치 38에서의 A의 결실, K41L, 위치 42에서의 R의 삽입, 위치 43에서의 Q의 결실 및 위치 44에서의 E의 결실, L46N, K57Q, Y65T, G68M, L70V, L71C, L72D, L72N, L72W, L72Y, E75F, E75L, E75Y,G79P, 위치 79에서의 E의 삽입, 위치 81에서의 T의 삽입, 위치 81에서의 R의 삽입, 위치 81에서의 W의 삽입, 위치 81에서의 Y의 삽입, 위치 82에서의 W의 삽입, 위치 82에서의 Y의 삽입, W82G, W82R, K84D, K84H, K84P, K84T, V85L, V85A, 위치 85에서의 L의 삽입, Y86C, D87G, D87M, D87P, I93C, K95T, K96R, E98G, L100A, K102H, I104T, I104S, I104Q, K105D, 위치 109에서의 K의 삽입, E109L, R110D, 위치 110에서의 R의 결실, D114E, 위치 114에서의 D의 삽입, K118P, A120R, L121T, W124L, L125C, R126D, A127E, A127L, A129T, A129K, I133E, 위치 133에서의 C의 삽입, 위치 134에서의 S의 삽입, 위치 134에서의 G의 삽입, 위치 135에서의 R의 삽입, G135P, L136K, L136D, L136S, L136H, 위치 138에서의 E의 결실, D140R, 위치 140에서의 D의 삽입, 위치 141에서의 P의 삽입, 위치 142에서의 D의 삽입, 위치 143에서의 E의 결실+위치 144에서의 F의 결실, 위치 143에서의 Q의 삽입, F144K, 위치 144에서의 F의 결실, 위치 144에서의 F의 결실 및 위치 145에서의 C의 결실, C145R, 위치 145에서의 G의 삽입, C145K, C147D, 위치 148에서의 V의 삽입, E148D, 위치 149에서의 H의 삽입, L149R, K150R, L151H, Q152C, K153P, L158S, E166L, 및 위치 167에서의 F의 삽입으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  53. 제45항 내지 제52항 중 어느 한 항에 있어서, 서열 번호 41821에 비교하여 I4, K5, P6, M7, N8, L9, V12, G49, K63, K80, N83, R90, M125, 및 L146으로 이루어진 군으로부터 선택된 RuvC-I 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  54. 제53항에 있어서, 서열 번호 41821에 비교하여 RuvC-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 4에서의 I의 삽입, 위치 5에서의 S의 삽입, 위치 6에서의 T의 삽입, 위치 6에서의 N의 삽입, 위치 7에서의 R의 삽입, 위치 7에서의 K의 삽입, 위치 8에서의 H의 삽입, 위치 8에서의 S의 삽입, V12L, G49W, G49R, S51R, S51K, K62S, K62T, K62E, V65A, K80E, N83G, R90H, R90G, M125S, M125A, L137Y, 위치 137에서의 P의 삽입, 위치 141에서의 L의 결실, L141R, L141D, 위치 142에서의 Q의 삽입, 위치 143에서의 R의 삽입, 위치 143에서의 N의 삽입, E144N, 위치 146에서의 P의 삽입, L146F, P147A, K149Q, T150V, 위치 152에서의 R의 삽입, H153의 삽입, T155Q, 위치 155에서의 H의 삽입, 위치 155에서의 R의 삽입, 위치 156에서의 L의 삽입, 위치 156에서의 L의 결실, 위치 156에서의 W의 삽입, 위치 157에서의 A의 삽입, 위치 157에서의 F의 삽입, A157S, Q158K, 위치 159에서의 Y의 결실, T160Y, T160F, 위치 161에서의 I의 삽입, S161P, T163P, 위치 163에서의 N의 삽입, C164K, 및 C164M으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  55. 제45항 내지 제54항 중 어느 한 항에 있어서, 서열 번호 41822에 비교하여 I3, K4, R5, I6, N7, K8, K15, D16, N18, P27, M28, V33, R34, M36, R41, L47, R48, E52, P55, 및 Q56으로 이루어진 군으로부터 선택된 OBD-I 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  56. 제55항에 있어서, 서열 번호 41822에 비교하여 OBD-I 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 3에서의 G의 삽입, I3G, I3E, 위치 4에서의 G의 삽입, K4G, K4P, K4S, K4W, K4W, R5P, 위치 5에서의 P의 삽입, 위치 5에서의 G의 삽입, R5S, 위치 5에서의 S의 삽입, R5A, R5P, R5G, R5L, I6A, I6L, 위치 6에서의 G의 삽입, N7Q, N7L, N7S, K8G, K15F, D16W, 위치 16에서의 F의 삽입, F18의 삽입, 위치 27에서의 P의 삽입, M28P, M28H, V33T, R34P, M36Y, R41P, L47P, 위치 48에서의 P의 삽입, E52P, 위치 55에서의 P의 삽입, 위치 55에서의 P의 결실 및 위치 56에서의 Q의 결실, Q56S, Q56P, 위치 56에서의 D의 삽입, 위치 56에서의 T의 삽입, 및 Q56P로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  57. 제45항 내지 제56항 중 어느 한 항에 있어서, 서열 번호 41823에 비교하여 S2, I3, L4, K11, V24, K37, R42, A53, T58, K63, M70, I82, Q92, G93, K110, L121, R124, R141, E143, V144, 및 L145로 이루어진 군으로부터 선택된 OBD-II 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  58. 제57항에 있어서, 서열 번호 41823에 비교하여 OBD-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 2에서의 S의 결실, I3R, I3K, 위치 3에서의 I의 결실 및 L4의 결실, 위치 4에서의 L의 결실, K11T, 위치 24에서의 P의 삽입, K37G, R42E, 위치 53에서의 S의 삽입, 위치 58에서의 R의 삽입, 위치 63에서의 K의 결실, M70T, I82T, Q92I, Q92F, Q92V, Q92A, 위치 93에서의 A의 삽입, K110Q, R115Q, L121T, 위치 124에서의 A의 삽입, 위치 141에서의 R의 삽입, 위치 143에서의 D의 삽입, 위치 143에서의 A의 삽입, 위치 144에서의 W의 삽입, 및 위치 145에서의 A의 삽입으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  59. 제45항 내지 제58항 중 어느 한 항에 있어서, 서열 번호 41825에 비교하여 S1, N2, C3, G4, F5, I7, K18, V58, S67, T76, G78, S80, G81, E82, S85, V96, 및 E98로 이루어진 군으로부터 선택된 TSL 도메인 내의 하나 이상의 아미노산 위치에 변형을 포함하는, 폴리뉴클레오티드.
  60. 제59항에 있어서, 서열 번호 41825에 비교하여 OBD-II 도메인 내의 하나 이상의 아미노산 위치에서의 하나 이상의 변형은 위치 1에서의 M의 삽입, 위치 2에서의 N의 결실, 위치 2에서의 V의 삽입, C3S, 위치 4에서의 G의 삽입, 위치 4에서의 W의 삽입, F5P, 위치 7에서의 W의 삽입, K18G, V58D, 위치 67에서의 A의 삽입, T76E, T76D, T76N, G78D, 위치 80에서의 S의 결실, 위치 81에서의 G의 결실, 위치 82에서의 E의 삽입, 위치 82에서의 N의 삽입, S85I, V96C, V96T, 및 E98D로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  61. 제45항 내지 제60항 중 어느 한 항에 있어서, 발현된 부류 2, 유형 V CRISPR 단백질은 서열 번호 2 또는 서열 번호 145에 비교하여 개선된 특징을 나타내며, 여기서 개선된 특징은 gRNA에 대한 증가된 결합 친화도, 표적 핵산에 대한 증가된 결합 친화도, 표적 핵산의 편집에 PAM 서열의 더 큰 스펙트럼을 이용하는 개선된 능력, 표적 핵산의 개선된 풀림(unwinding), 증가된 편집 활성, 개선된 편집 효율, 표적 핵산의 절단에 대한 개선된 편집 특이성, 표적 핵산의 감소된 표적-외(off-target) 편집 또는 절단, 편집될 수 있는 진핵생물 게놈의 증가된 백분율, 뉴클레아제의 증가된 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 로딩, 단일 가닥 닉킹에 대한 감소된 표적 가닥 로딩, DNA의 비-표적 가닥의 증가된 결합, 개선된 단백질 안정성, 증가된 단백질:gRNA(RNP) 복합체 안정성, 및 개선된 융합 특징을 포함하는, 폴리뉴클레오티드.
  62. 제61항에 있어서, 개선된 특징은 TTC, ATC, GTC, 또는 CTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
  63. 제62항에 있어서, 개선된 특징은 서열 번호 145의 서열의 절단 활성에 비교하여 ATC 또는 CTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
  64. 제63항에 있어서, 개선된 절단 활성은 시험관내 검정에서 서열 번호 145의 서열의 점수에 비교하여 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 약 6 이상, 약 7 이상, 약 8 이상 더 큰 농축(enrichment) 점수(log2)인, 폴리뉴클레오티드.
  65. 제63항에 있어서, 개선된 특징은 서열 번호 145의 서열에 비교하여 CTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
  66. 제65항에 있어서, 개선된 절단 활성은 시험관내 검정에서 서열 번호 145의 서열의 점수에 비교하여 약 2 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 또는 약 6 이상 더 큰 농축 점수(log2)인, 폴리뉴클레오티드.
  67. 제62항에 있어서, 개선된 특징은 서열 번호 145의 서열에 비교하여 TTC PAM 서열을 포함하는 표적 핵산 서열에서의 증가된 절단 활성을 포함하는, 폴리뉴클레오티드.
  68. 제67항에 있어서, 개선된 절단 활성은 시험관내 검정에서 서열 번호 145의 서열에 비교하여 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 또는 약 6 log2 이상 더 큰 농축 점수인, 폴리뉴클레오티드.
  69. 제61항에 있어서, 개선된 특징은 서열 번호 145의 서열에 비교하여 표적 핵산 서열의 절단에 대한 증가된 특이성을 포함하는, 폴리뉴클레오티드.
  70. 제69항에 있어서, 증가된 특이성은 시험관내 검정에서 서열 번호 145의 서열에 비교하여 약 2.0 이상, 약 2.5 이상, 약 3 이상, 약 3.5 이상, 약 4 이상, 약 4.5 이상, 약 5 이상, 또는 약 6 log2 이상 더 큰 농축 점수인, 폴리뉴클레오티드.
  71. 제61항에 있어서, 개선된 특징은 표적 핵산 서열의 감소된 표적-외 절단을 포함하는, 폴리뉴클레오티드.
  72. 제37항에 있어서, 인코딩된 부류 2, 유형 V CRISPR 단백질은 Cas12f, Cas12j(CasPhi), 및 CasX로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  73. 제72항에 있어서, 인코딩된 CasX는 서열 번호 1 내지 3, 49 내지 160, 및 40208 내지 40369, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  74. 제72항에 있어서, 인코딩된 CasX는 서열 번호 1 내지 3, 49 내지 160, 40208 내지 40369, 및 40828 내지 40912의 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  75. 제72항에 있어서, 폴리뉴클레오티드의 CasX 서열은 표 21에 기술된 바와 같은 서열 번호 40577 내지 40588, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  76. 제72항에 있어서, 폴리뉴클레오티드의 CasX 서열은 표 21에 기술된 바와 같은 서열 번호 40577 내지 40588로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  77. 제1항 내지 제76항 중 어느 한 항에 있어서, CRISPR 단백질을 인코딩하는 서열에 연결된 하나 이상의 NLS를 인코딩하는, 폴리뉴클레오티드.
  78. 제77항에 있어서, 하나 이상의 NLS를 인코딩하는 서열은 CRISPR 단백질을 인코딩하는 서열의 5' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
  79. 제77항에 있어서, 하나 이상의 NLS를 인코딩하는 서열은 CRISPR 단백질을 인코딩하는 서열의 3' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
  80. 제78항 또는 제79항에 있어서, 2개 이상의 NLS를 인코딩하며, 여기서 2개 이상의 NLS를 인코딩하는 서열은 CRISPR 단백질을 인코딩하는 서열의 5' 및 3' 단부에 또는 그 부근에 위치하는, 폴리뉴클레오티드.
  81. 제77항 내지 제80항 중 어느 한 항에 있어서, 하나 이상의 인코딩된 NLS는 PKKKRKV(서열 번호 196), KRPAATKKAGQAKKKK(서열 번호 197), PAAKRVKLD(서열 번호 248), RQRRNELKRSP(서열 번호 161), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열 번호 162), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열 번호 163), VSRKRPRP(서열 번호 164), PPKKARED(서열 번호 165), PQPKKKPL(서열 번호 166), SALIKKKKKMAP(서열 번호 167), DRLRR(서열 번호 168), PKQKKRK(서열 번호 169), RKLKKKIKKL(서열 번호 170), REKKKFLKRR(서열 번호 171), KRKGDEVDGVDEVAKKKSKK(서열 번호 172), RKCLQAGMNLEARKTKK(서열 번호 173), PRPRKIPR(서열 번호 174), PPRKKRTVV(서열 번호 175), NLSKKKKRKREK(서열 번호 176), RRPSRPFRKP(서열 번호 177), KRPRSPSS(서열 번호 178), KRGINDRNFWRGENERKTR(서열 번호 179), PRPPKMARYDN(서열 번호 180), KRSFSKAF(서열 번호 181), KLKIKRPVK(서열 번호 182), PKKKRKVPPPPAAKRVKLD(서열 번호 183), PKTRRRPRRSQRKRPPT(서열 번호 184), SRRRKANPTKLSENAKKLAKEVEN(서열 번호 41827), KTRRRPRRSQRKRPPT(서열 번호 186), RRKKRRPRRKKRR(서열 번호 187), PKKKSRKPKKKSRK(서열 번호 188), HKKKHPDASVNFSEFSK(서열 번호 189), QRPGPYDRPQRPGPYDRP(서열 번호 190), LSPSLSPLLSPSLSPL(서열 번호 191), RGKGGKGLGKGGAKRHRK(서열 번호 192), PKRGRGRPKRGRGR(서열 번호 193), PKKKRKVPPPPKKKRKV(서열 번호 195), PAKRARRGYKC(서열 번호 40188), KLGPRKATGRW(서열 번호 40189), PRRKREE(서열 번호 40190), PYRGRKE(서열 번호 40191), PLRKRPRR(서열 번호 40192), PLRKRPRRGSPLRKRPRR(서열 번호 40193), PAAKRVKLDGGKRTADGSEFESPKKKRKV(서열 번호 40194), PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(서열 번호 40195), PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(서열 번호 40196), PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(서열 번호 40710), KRKGSPERGERKRHW(서열 번호 40198), KRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 41828), 및 PKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(서열 번호 40200)로 이루어진 서열의 군으로부터 선택되며, 여기서 하나 이상의 NLS는 CRISPR 변이체 또는 인접한 NLS에 링커 펩티드로 연결되고, 여기서 링커 펩티드는 RS, (G)n(서열 번호 40201), (GS)n(서열 번호 40202), (GSGGS)n(서열 번호 208), (GGSGGS)n(서열 번호 209), (GGGS)n(서열 번호 210), GGSG(서열 번호 211), GGSGG(서열 번호 212), GSGSG(서열 번호 213), GSGGG(서열 번호 214), GGGSG(서열 번호 215), GSSSG(서열 번호 216), GPGP(서열 번호 217), GGP, PPP, PPAPPA(서열 번호 218), PPPG(서열 번호 40207), PPPGPPP(서열 번호 219), PPP(GGGS)n(서열 번호 40203), (GGGS)nPPP(서열 번호 40204), AEAAAKEAAAKEAAAKA(서열 번호 40205), 및 TPPKTKRKVEFE(서열 번호 40206)로 이루어진 군으로부터 선택되고, 여기서 n은 1 내지 5인, 폴리뉴클레오티드.
  82. 제77항 내지 제80항 중 어느 한 항에 있어서, 하나 이상의 인코딩된 NLS는 표 15 및 표 16에 기술된 바와 같은 서열 번호 40443 내지 40501, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  83. 제77항 내지 제80항 중 어느 한 항에 있어서, 하나 이상의 인코딩된 NLS는 표 15 및 표 16에 기술된 바와 같은 서열 번호 40443 내지 40501로 이루어진 서열의 군으로부터 선택되는, 폴리뉴클레오티드.
  84. 제1항 내지 제83항 중 어느 한 항에 있어서, 인코딩된 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  85. 제1항 내지 제84항 중 어느 한 항에 있어서, 인코딩된 제1 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  86. 제85항에 있어서, 인코딩된 제1 gRNA는 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 30개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  87. 제86항에 있어서, 표적화 서열은 18, 19, 또는 20개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  88. 제1항 내지 제87항 중 어느 한 항에 있어서, 제2 gRNA 및 제2 gRNA에 작동가능하게 연결된 제3 프로모터를 인코딩하는 서열을 포함하는, 폴리뉴클레오티드.
  89. 제88항에 있어서, 제3 프로모터는 pol III 프로모터인, 폴리뉴클레오티드.
  90. 제88항 또는 제89항에 있어서, 제3 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1(양방향 H1 프로모터), BiU6(양방향 U6 프로모터), 고릴라 U6, 레수스 U6, 인간 7sk, 및 인간 H1 프로모터로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  91. 제90항에 있어서, 제3 프로모터는 U6, 미니 U61, 미니 U62, 미니 U63, BiH1, BiU6, 고릴라 U6, 레수스 U6, 인간 7sk, 또는 인간 H1 프로모터의 절단된 변이체인, 폴리뉴클레오티드.
  92. 제88항 내지 제91항 중 어느 한 항에 있어서, 제3 프로모터는 약 250개 미만의 뉴클레오티드, 약 220개 미만의 뉴클레오티드, 약 200개 미만의 뉴클레오티드, 약 160개 미만의 뉴클레오티드, 약 140개 미만의 뉴클레오티드, 약 130개 미만의 뉴클레오티드, 약 120개 미만의 뉴클레오티드, 약 100개 미만의 뉴클레오티드, 약 80개 미만의 뉴클레오티드, 또는 약 70개 미만의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  93. 제88항 내지 제91항 중 어느 한 항에 있어서, 제3 프로모터는 약 70 내지 약 245개의 뉴클레오티드, 약 100 내지 약 220개의 뉴클레오티드, 또는 약 120 내지 약 160개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  94. 제88항 내지 제93항 중 어느 한 항에 있어서, 제3 프로모터는 표 9에 기술된 바와 같은 서열 번호 40401 내지 40420 및 41010 내지 41029, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  95. 제88항 내지 제94항 중 어느 한 항에 있어서, 제3 프로모터는 제2 gRNA의 전사를 향상시키는, 폴리뉴클레오티드.
  96. 제88항 내지 제95항 중 어느 한 항에 있어서, 인코딩된 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 및 39981 내지 40026, 40913 내지 40958, 및 41817, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  97. 제88항 내지 제95항 중 어느 한 항에 있어서, 인코딩된 제2 gRNA는 표 2에 기술된 바와 같은 서열 번호 2101 내지 2285, 39981 내지 40026, 40913 내지 40958, 및 41817로 이루어진 군으로부터 선택된 서열을 포함하는, 폴리뉴클레오티드.
  98. 제89항 내지 제97항 중 어느 한 항에 있어서, 인코딩된 제2 gRNA는 제86항 또는 제87항의 표적 핵산과는 상이한 표적 핵산 서열에 상보적인 표적화 서열을 포함하며, 여기서 표적화 서열은 15 내지 30개 이상의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  99. 제98항에 있어서, 표적화 서열은 18, 19, 또는 20개의 뉴클레오티드를 갖는, 폴리뉴클레오티드.
  100. 제86항 내지 제99항 중 어느 한 항에 있어서, 표적화 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776, 또는 이들에 대해 80% 이상, 90% 이상, 또는 95% 이상의 서열 동일성을 갖는 서열로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  101. 제86항 내지 제99항 중 어느 한 항에 있어서, 표적화 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776으로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  102. 제86항 내지 제101항 중 어느 한 항에 있어서, 인코딩된 제1 및 제2 gRNA는 서열 번호 2238에 비교하여 하나 이상의 변형을 갖는 스캐폴드 서열을 포함하며, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발하는, 폴리뉴클레오티드.
  103. 제102항에 있어서, 하나 이상의 변형은 표 28에 기술된 바와 같은 하나 이상의 뉴클레오티드 치환, 삽입, 및/또는 결실을 포함하는, 폴리뉴클레오티드.
  104. 제102항 또는 제103항에 있어서, 개선된 특징은, 임의로 시험관내 검정에서, 증가된 편집 활성, 증가된 유사매듭(pseudoknot) 스템 안정성, 증가된 삼중체 영역 안정성, 증가된 스캐폴드 스템 안정성, 연장된 스템 안정성, 감소된 표적-외 폴딩 중간체, 및 부류 2, 유형 V CRISPR 단백질에 대한 증가된 결합 친화도로 이루어진 군으로부터 선택된 하나 이상의 기능적 특성인, 폴리뉴클레오티드.
  105. 제102항 내지 제104항 중 어느 한 항에 있어서, 발현된 gRNA 스캐폴드는 시험관내 검정에서 서열 번호 2238의 gRNA 스캐폴드의 점수에 비교하여 약 2.0 이상, 약 2.5 이상, 약 3 이상, 또는 약 3.5 이상 더 큰 개선된 농축 점수(log2)를 나타내는, 폴리뉴클레오티드.
  106. 제84항 내지 제101항 중 어느 한 항에 있어서, 인코딩된 제1 및 제2 gRNA는 서열 번호 2239에 비교하여 하나 이상의 변형을 갖는 스캐폴드 서열을 포함하며, 여기서 하나 이상의 변형은 발현된 제1 및 제2 gRNA에 개선된 특징을 유발하는, 폴리뉴클레오티드.
  107. 제106항에 있어서, 하나 이상의 변형은 표 29에 기술된 바와 같은 하나 이상의 뉴클레오티드 치환, 삽입, 및/또는 결실을 포함하는, 폴리뉴클레오티드.
  108. 제106항 또는 제107항에 있어서, 개선된 특징은, 임의로 시험관내 검정에서, 증가된 편집 활성, 증가된 유사매듭 스템 안정성, 증가된 삼중체 영역 안정성, 증가된 스캐폴드 스템 안정성, 연장된 스템 안정성, 감소된 표적-외 폴딩 중간체, 및 부류 2, 유형 V CRISPR 단백질에 대한 증가된 결합 친화도로 이루어진 군으로부터 선택된 하나 이상의 기능적 특성인, 폴리뉴클레오티드.
  109. 제106항 내지 제108항 중 어느 한 항에 있어서, 발현된 gRNA 스캐폴드는 시험관내 검정에서 서열 번호 2239의 gRNA 스캐폴드의 점수에 비교하여 약 1.2 이상, 약 1.5 이상, 약 2.0 이상, 약 2.5 이상, 약 3 이상, 또는 약 3.5 이상 더 큰 개선된 농축 점수(log2)를 나타내는, 폴리뉴클레오티드.
  110. 제106항 내지 제109항 중 어느 한 항에 있어서, 서열 번호 2239의 서열에 비교하여 C9, U11, C17, U24, A29, U54, G64, A88, 및 A95로 이루어진 군으로부터 선택된 위치에 하나 이상의 변형을 포함하는, 폴리뉴클레오티드.
  111. 제110항에 있어서, 서열 번호 2239의 서열에 비교하여 C9U, U11C, C17G, U24C, A29C, 위치 54에서의 G의 삽입, 위치 64에서의 C의 삽입, A88G, 및 A95G로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함하는, 폴리뉴클레오티드.
  112. 제111항에 있어서, 서열 번호 2239의 서열에 비교하여 C9U, U11C, C17G, U24C, A29C, 위치 54에서의 G의 삽입, 위치 64에서의 C의 삽입, A88G, 및 A95G로 이루어진 변형을 포함하는, 폴리뉴클레오티드.
  113. 제106항 내지 제112항 중 어느 한 항에 있어서, 개선된 특징은 유사매듭 스템 안정성, 삼중체 영역 안정성, 스캐폴드 버블 안정성, 연장된 스템 안정성, 및 부류 2, 유형 V CRISPR 단백질에 대한 결합 친화도로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  114. 제112항에 있어서, 서열 번호 2239의 서열에 비교하여 위치 64에서의 C의 삽입 및 A88G 치환은 연장된 스템의 비대칭 벌지(bulge) 요소를 해소하여, gRNA 스캐폴드의 연장된 스템의 안정성을 향상시키는, 폴리뉴클레오티드.
  115. 제112항에 있어서, U11C, U24C, 및 A95G의 치환은 gRNA 스캐폴드의 삼중체 영역의 안정성을 증가시키는, 폴리뉴클레오티드.
  116. 제112항에 있어서, A29C의 치환은 유사매듭 스템의 안정성을 증가시키는, 폴리뉴클레오티드.
  117. 제1항 내지 제116항 중 어느 한 항에 있어서, 액세서리 요소는 사이토메갈로바이러스 즉시/초기 인트론A, B형 간염 바이러스 PRE(HPRE), 우드척 간염 바이러스 PRE(WPRE), 및 인간 열 충격 단백질 70 mRNA(Hsp70)의 5′ 비번역 영역(UTR)으로 이루어진 군으로부터 선택된 전사-후 조절 요소(PTRE)인, 폴리뉴클레오티드.
  118. 제117항에 있어서, 액세서리 요소는 표 12에 기술된 바와 같은 서열 번호 40431 내지 40442, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 PTRE인, 폴리뉴클레오티드.
  119. 제1항 내지 제118항 중 어느 한 항에 있어서, 5' 및 3' ITR은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, 폴리뉴클레오티드.
  120. 제119항에 있어서, 5' 및 3' ITR은 혈청형 AAV2로부터 유래되는, 폴리뉴클레오티드.
  121. 제1항 내지 제120항 중 어느 한 항에 있어서, 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22, 및 표 24 내지 표 27의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
  122. 제1항 내지 제121항 중 어느 한 항에 있어서, 표 8 내지 표 10, 표 12, 표 13, 표 17 내지 표 22, 및 표 24 내지 표 27의 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
  123. 제1항 내지 제122항 중 어느 한 항에 있어서, 표 26의 서열, 또는 이들에 대해 85% 이상, 90% 이상, 95% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 동일성을 갖는 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
  124. 제1항 내지 제123항 중 어느 한 항에 있어서, 표 26의 서열로 이루어진 군으로부터 선택된 하나 이상의 서열을 포함하는, 폴리뉴클레오티드.
  125. 제124항에 있어서, 표 26에 기술된 바와 같은 1 내지 174, 177 내지 186, 및 188 내지 198의 작제물의 군으로부터 선택된 작제물의 서열을 포함하는, 폴리뉴클레오티드.
  126. 제123항 내지 제125항 중 어느 한 항에 있어서, 서열은 표 27에 기술된 바와 같은 서열 번호 41056 내지 41776의 서열의 군으로부터 선택된 표적화 서열을 추가로 포함하며, 여기서 표적화 서열은 gRNA를 인코딩하는 폴리뉴클레오티드 서열의 3' 단부에 연결되는, 폴리뉴클레오티드.
  127. 제1항 내지 제126항 중 어느 한 항에 있어서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택된 하나 이상의 AAV 구성성분 서열은 서열의 CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형되는, 폴리뉴클레오티드.
  128. 제127항에 있어서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 및 폴리(A), 및 액세서리 요소로 이루어진 군으로부터 선택된 하나 이상의 AAV 구성성분 서열은 약 10% 미만, 약 5% 미만, 또는 약 1% 미만의 CpG 다이뉴클레오티드를 포함하는, 폴리뉴클레오티드.
  129. 제127항에 있어서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 및 폴리(A), 및 액세서리 요소로 이루어진 군으로부터 선택된 하나 이상의 AAV 구성성분 서열에는 CpG 다이뉴클레오티드가 없는, 폴리뉴클레오티드.
  130. 제127항 내지 제129항 중 어느 한 항에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 코돈-최적화된 하나 이상의 AAV 구성성분 서열은 표 25에 기술된 바와 같은 서열 번호 41045 내지 41055로 이루어진 군으로부터 선택되는, 폴리뉴클레오티드.
  131. 제1항 내지 제130항 중 어느 한 항에 있어서, 도 24, 도 33 내지 도 35, 또는 도 42 중 어느 하나에 도시된 작제물의 구성을 갖는, 폴리뉴클레오티드.
  132. a. AAV 캡시드 단백질, 및
    b. 제1항 내지 제131항 중 어느 한 항의 폴리뉴클레오티드를 포함하는, 재조합 아데노-관련 바이러스 벡터(rAAV).
  133. 제132항에 있어서, AAV 캡시드 단백질은 혈청형 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV 44.9, AAV-Rh74, 또는 AAVRh10으로부터 유래되는, rAAV.
  134. 제133항에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 동일한 혈청형의 AAV로부터 유래되는, rAAV.
  135. 제133항에 있어서, AAV 캡시드 단백질 및 5' 및 3' ITR은 상이한 혈청형의 AAV로부터 유래되는, rAAV.
  136. 제135항에 있어서, 5' 및 3' ITR은 AAV 혈청형 2로부터 유래되는, rAAV.
  137. 제132항 내지 제136항 중 어느 한 항에 있어서, rAAV를 이용한 세포의 형질도입시에, CRISPR 단백질 및 gRNA가 발현될 수 있는, rAAV.
  138. 제137항에 있어서, 발현시에, gRNA는 CRISPR 단백질과 리보핵단백질(RNP) 복합체를 형성할 수 있는, rAAV.
  139. 제137항 또는 제138항에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열은 발현시에 이들의 기능적 특성을 실질적으로 유지하는, rAAV.
  140. 제137항 또는 제138항에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열은 AAV 폴리뉴클레오티드가 CpG 다이뉴클레오티드의 고갈을 위해 변형되지 않은 rAAV에 비교하여 면역 반응을 유도하는 더 낮은 잠재력을 나타내는, rAAV.
  141. 제140항에 있어서, 면역 반응을 유도하는 더 낮은 잠재력은 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 염증 반응의 하나 이상의 마커의 생성을 검출하도록 설계된 시험관내 포유류 세포 검정에서 나타나는, rAAV.
  142. 제141항에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열을 포함하는 rAAV는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상 더 적은 하나 이상의 염증성 마커의 감소된 생성을 도출하는, rAAV.
  143. 제140항에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열을 포함하는 rAAV의 용량의 대상체에 대한 투여는 CpG 고갈되지 않은 유사한 rAAV의 투여된 용량에 비교하여 감소된 면역 반응을 도출하는, rAAV.
  144. 제143항에 있어서, 감소된 면역 반응은 대상체에서의 rAAV 구성성분에 대한 항-rAAV 항체의 생성 또는 지연형 과민반응(delayed-type hypersensitivity)의 감소인, rAAV.
  145. 제143항에 있어서, 감소된 면역 반응은 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 대상체 혈중의 하나 이상의 염증성 마커의 측정에 의해 결정되며, 여기서 하나 이상의 마커는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상만큼 감소되는, rAAV.
  146. 제143항 내지 제145항 중 어느 한 항에 있어서, 대상체는 마우스, 래트, 돼지, 개, 및 비-인간 영장류로부터 선택되는, rAAV.
  147. 제143항 내지 제145항 중 어느 한 항에 있어서, 대상체는 인간인, rAAV.
  148. 제132항 중 어느 하나의 rAAV 및 약제학적으로 허용가능한 담체, 희석제, 또는 부형제를 포함하는, 약제학적 조성물.
  149. 포유류 세포의 집단에서 표적 핵산을 변형시키기 위한 방법으로서, 복수의 세포를 제132항 내지 제147항 중 어느 한 항의 rAAV의 유효량과 접촉시키는 단계를 포함하며, 여기서 발현된 gRNA에 의해 표적화된 세포의 유전자의 표적 핵산은 발현된 CRISPR 단백질에 의해 변형되는, 방법.
  150. 제149항에 있어서, 세포의 유전자는 하나 이상의 돌연변이를 포함하는, 방법.
  151. 제149항 또는 제150항에 있어서, 변형시키는 단계는 집단의 세포의 표적 핵산 내의 하나 이상의 뉴클레오티드의 삽입, 결실, 치환, 복제, 또는 역위를 도입하는 단계를 포함하는, 방법.
  152. 제149항 내지 제151항 중 어느 한 항에 있어서, 유전자는 녹 다운되거나 녹 아웃되는, 방법.
  153. 제149항 내지 제151항 중 어느 한 항에 있어서, 유전자는 기능적 유전자 생성물이 발현될 수 있도록 변형되는, 방법.
  154. 대상체에서 대상체의 유전자 내의 하나 이상의 돌연변이에 의해 야기된 질환을 치료하는 방법으로서, 제132항 내지 제145항 중 어느 한 항의 rAAV의 치료적 유효 용량을 대상체에게 투여하는 단계를 포함하는, 방법.
  155. 제149항에 있어서, rAAV는 약 1 x 108 벡터 게놈(vg) 이상, 약 1 x 105 벡터 게놈/kg(vg/kg) 이상, 약 1 x 106 vg/kg 이상, 약 1 x 107 vg/kg 이상, 약 1 x 108 vg/kg 이상, 약 1 x 109 vg/kg 이상, 약 1 x 1010 vg/kg 이상, 약 1 x 1011 vg/kg 이상, 약 1 x 1012 vg/kg 이상, 약 1 x 1013 vg/kg 이상, 약 1 x 1014 vg/kg 이상, 약 1 x 1015 vg/kg 이상, 또는 약 1 x 1016 vg/kg 이상의 용량으로 대상체에게 투여되는, 방법.
  156. 제154항에 있어서, rAAV는 약 1 x 105 vg/kg 내지 약 1 x 1016 vg/kg 이상, 약 1 x 106 vg/kg 내지 약 1 x 1015 vg/kg 이상, 또는 약 1 x 107 vg/kg 내지 약 1 x 1014 vg/kg 이상의 용량으로 대상체에게 투여되는, 방법.
  157. 제154항 내지 제156항 중 어느 한 항에 있어서, rAAV는 피하, 피내, 신경내, 림프절내, 척수내, 근육내, 요추내, 척추강내, 지주막하, 뇌실내, 관절낭내, 정맥내, 림프내, 안내, 또는 복강내 경로로부터 선택된 투여 경로에 의해 대상체에게 투여되며, 여기서 투여 방법은 주사, 이입(transfusion), 또는 이식인, 방법.
  158. 제149항 내지 제157항 중 어느 한 항에 있어서, 대상체는 마우스, 래트, 돼지, 및 비-인간 영장류로 이루어진 군으로부터 선택되는, 방법.
  159. 제149항 내지 제157항 중 어느 한 항에 있어서, 대상체는 인간인, 방법.
  160. rAAV 벡터를 제조하는 방법으로서,
    a. 패키징 세포의 집단을 제공하는 단계; 및
    b.
    i) 제1항 내지 제131항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 벡터;
    ii) aap(조립체) 유전자를 포함하는 벡터; 및
    iii) rep 및 cap 게놈을 포함하는 벡터로 세포의 집단을 형질감염시키는 단계를 포함하는, 방법.
  161. 제160항에 있어서, 패키징 세포는 BHK 세포, HEK293 세포, HEK293T 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, NIH3T3 세포, COS 세포, HeLa 세포, 및 CHO 세포로 이루어진 군으로부터 선택되는, 방법.
  162. 제160항 또는 제161항에 있어서, rAAV 벡터를 회수하는 단계를 추가로 포함하는, 방법.
  163. 제160항 내지 제162항 중 어느 한 항에 있어서, AAV 폴리뉴클레오티드의 구성성분 서열은 단일 rAAV 입자 내에 포함되는, 방법.
  164. rAAV의 면역원성을 감소시키는 방법으로서, 5' ITR, 3' ITR, pol III 프로모터, pol II 프로모터, CRISPR 뉴클레아제에 대한 인코딩 서열, gRNA에 대한 인코딩 서열, 액세서리 요소, 및 폴리(A)로 이루어진 군으로부터 선택된 AAV 구성성분 서열의 서열의 CpG 다이뉴클레오티드의 전부 또는 일부를 결실시키는 단계를 포함하는, 방법.
  165. 제164항에 있어서, 하나 이상의 AAV 폴리뉴클레오티드 구성성분 서열은 약 10% 미만, 약 5% 미만, 또는 약 1% 미만의 CpG 다이뉴클레오티드를 포함하는, 방법.
  166. 제165항에 있어서, 하나 이상의 AAV 폴리뉴클레오티드 구성성분 서열에는 CpG 다이뉴클레오티드가 없는, 방법.
  167. 제164항 내지 제166항 중 어느 한 항에 있어서, 하나 이상의 AAV 폴리뉴클레오티드 구성성분 서열은 표 25에 기술된 바와 같은 서열 번호 41045 내지 41055로 이루어진 군으로부터 선택되는, 방법.
  168. 제164항 내지 제167항 중 어느 한 항에 있어서, rAAV는 CpG 다이뉴클레오티드가 고갈되지 않은 유사한 rAAV에 비교하여 시험관내 포유류 세포 검정에서 염증 반응의 하나 이상의 마커의 생성을 유도하는 더 낮은 잠재력을 나타내며, 여기서 하나 이상의 염증성 마커는 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택되는, 방법.
  169. 제168항에 있어서, rAAV는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상 더 적은 하나 이상의 염증성 마커의 감소된 생성을 도출하는, 방법.
  170. 제164항 내지 제167항 중 어느 한 항에 있어서, CpG 다이뉴클레오티드의 전부 또는 일부의 고갈을 위해 변형된 AAV 폴리뉴클레오티드 구성성분 서열을 포함하는 rAAV의 용량의 대상체에 대한 투여는 CpG 고갈되지 않은 유사한 rAAV의 투여된 용량에 비교하여 감소된 면역 반응을 도출하는, 방법.
  171. 제170항에 있어서, 감소된 면역 반응은 대상체에서의 rAAV 구성성분에 대한 항-rAAV 항체의 생성 또는 지연형 과민반응의 감소인, 방법.
  172. 제170항에 있어서, 감소된 면역 반응은 TLR9, 인터류킨-1(IL-1), IL-6, IL-12, IL-18, 종양 괴사 인자 알파(TNF-α), 인터페론 감마(IFNγ), 및 과립구-대식세포 콜로니 자극 인자(GM-CSF)로 이루어진 군으로부터 선택된 대상체 혈중의 하나 이상의 염증성 마커의 측정에 의해 결정되며, 여기서 하나 이상의 마커는 CpG 고갈되지 않은 유사한 rAAV에 비교하여 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 60% 이상, 약 80% 이상, 또는 약 90% 이상만큼 감소되는, 방법.
  173. 제164항 내지 제172항 중 어느 한 항에 있어서, 대상체는 마우스, 래트, 돼지, 개, 및 비-인간 영장류로부터 선택되는, 방법.
  174. 제164항 내지 제172항 중 어느 한 항에 있어서, 대상체는 인간인, 방법.
  175. 치료를 필요로 하는 인간의 치료를 위한 의약으로 사용하기 위한, 제132항 내지 제147항 중 어느 한 항의 rAAV의 조성물.
KR1020237020585A 2020-12-09 2021-12-09 유전자 편집을 위한 aav 벡터 KR20230129395A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063123112P 2020-12-09 2020-12-09
US63/123,112 2020-12-09
US202163235638P 2021-08-20 2021-08-20
US63/235,638 2021-08-20
PCT/US2021/062714 WO2022125843A1 (en) 2020-12-09 2021-12-09 Aav vectors for gene editing

Publications (1)

Publication Number Publication Date
KR20230129395A true KR20230129395A (ko) 2023-09-08

Family

ID=80050609

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237020585A KR20230129395A (ko) 2020-12-09 2021-12-09 유전자 편집을 위한 aav 벡터

Country Status (8)

Country Link
US (1) US20240033377A1 (ko)
EP (1) EP4259791A1 (ko)
JP (1) JP2023552820A (ko)
KR (1) KR20230129395A (ko)
AU (1) AU2021394878A1 (ko)
CA (1) CA3201392A1 (ko)
IL (1) IL303498A (ko)
WO (1) WO2022125843A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115461465A (zh) * 2020-04-07 2022-12-09 密苏里大学管理机构 用于AAV基因治疗的无CpG的ITR
WO2023240074A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
WO2023240076A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
WO2023240162A1 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Aav vectors for gene editing
WO2023240157A2 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of dmd
CN117603965A (zh) * 2022-08-22 2024-02-27 北京脑神康科技开发中心(有限合伙) sgRNA及其在制备用于治疗亨廷顿舞蹈症的产品中的应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075303A1 (en) 2008-12-23 2010-07-01 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same
WO2012068627A1 (en) 2010-11-24 2012-05-31 The University Of Western Australia Peptides for the specific binding of rna targets
WO2017083722A1 (en) 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
AU2017335890B2 (en) * 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
WO2018195555A1 (en) 2017-04-21 2018-10-25 The Board Of Trustees Of The Leland Stanford Junior University Crispr/cas 9-mediated integration of polynucleotides by sequential homologous recombination of aav donor vectors
US20210309981A1 (en) * 2018-08-22 2021-10-07 Junjie Liu Variant type v crispr/cas effector polypeptides and methods of use thereof
US20200199555A1 (en) * 2018-12-05 2020-06-25 The Broad Institute, Inc. Cas proteins with reduced immunogenicity and methods of screening thereof
CA3137961A1 (en) * 2019-04-26 2020-10-29 Sangamo Therapeutics, Inc. Engineering aav
GB2600274A (en) 2019-06-07 2022-04-27 Scribe Therapeutics Inc Engineered CasX systems
WO2020247883A2 (en) 2019-06-07 2020-12-10 Scribe Therapeutics Inc. Deep mutational evolution of biomolecules
US20220348925A1 (en) * 2019-09-09 2022-11-03 Scribe Therapeutics Inc. Compositions and methods for the targeting of sod1

Also Published As

Publication number Publication date
EP4259791A1 (en) 2023-10-18
IL303498A (en) 2023-08-01
WO2022125843A1 (en) 2022-06-16
US20240033377A1 (en) 2024-02-01
CA3201392A1 (en) 2022-06-16
JP2023552820A (ja) 2023-12-19
AU2021394878A1 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
US20240033377A1 (en) Aav vectors for gene editing
US20240026385A1 (en) Engineered class 2 type v crispr systems
US11535835B1 (en) Compositions and methods for the targeting of rhodopsin
AU2021394878A9 (en) Aav vectors for gene editing
US11613742B2 (en) Compositions and methods for the targeting of SOD1
CA3172178A1 (en) Compositions and methods for the targeting of c9orf72
JP2023510352A (ja) Pcsk9の標的化のための組成物および方法
US20240026386A1 (en) Compositions and methods for the targeting of bcl11a
US20240100185A1 (en) Compositions and methods for the targeting of ptbp1
WO2023049872A2 (en) Self-inactivating vectors for gene editing
JP2023551874A (ja) 筋強直性ジストロフィー1型を処置するためのrna標的化組成物および方法
AU2021391643A1 (en) Rna-targeting compositions and methods for treating cag repeat diseases
CN117083378A (zh) 用于基因编辑的aav载体
IL303360A (en) CRISPR systems engineered class 2 V type
WO2023240162A1 (en) Aav vectors for gene editing
CN117120607A (zh) 工程化2类v型crispr系统
WO2023152669A1 (en) Therapeutic factors for the treatment of polyq diseases