KR20160079119A - 돌연변이 cas9 단백질 - Google Patents
돌연변이 cas9 단백질 Download PDFInfo
- Publication number
- KR20160079119A KR20160079119A KR1020167015908A KR20167015908A KR20160079119A KR 20160079119 A KR20160079119 A KR 20160079119A KR 1020167015908 A KR1020167015908 A KR 1020167015908A KR 20167015908 A KR20167015908 A KR 20167015908A KR 20160079119 A KR20160079119 A KR 20160079119A
- Authority
- KR
- South Korea
- Prior art keywords
- cas9
- acid sequence
- protein
- amino acid
- nucleic acid
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6897—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/573—Immunoassay; Biospecific binding assay; Materials therefor for enzymes or isoenzymes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/90—Enzymes; Proenzymes
- G01N2333/914—Hydrolases (3)
- G01N2333/916—Hydrolases (3) acting on ester bonds (3.1), e.g. phosphatases (3.1.3), phospholipases C or phospholipases D (3.1.4)
- G01N2333/922—Ribonucleases (RNAses); Deoxyribonucleases (DNAses)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Urology & Nephrology (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Cas9 단백질의 결실 돌연변이 제조 방법 및 키메라 Cas9 단백질의 제조 방법이 기술된다. Cas9 N- 및 C-말단 도메인은 crRNA/tracrRNA 결합 및/또는 PAM 선택성에서 중요한 역할을 할 수 있다. 활성을 분석하기 위하여, NM (네이쎄리아 메닝기티데스 Cas9)의 N 및/또는 C 말단을 ST1으로부터의 상동성 영역으로 대체함으로써, NM 및 ST1 (스트렙토코쿠스 서모필루스 Cas9) 사이의 일련의 도메인 교환 돌연변이들을 제조하였다. 다음에는, 가이드 RNA 및/또는 리포터 내 Cas9 특이적 PAM을 변경하는 본원에서 기술되는 전사 리포터 검정을 사용하여 상기 키메라 단백질을 시험함으로써, 단백질 특이성에 대한 도메인 교환의 영향을 확인하였다. NM 및 ST1 사이의 N-말단 도메인 스왑들 중 어느 것도 신규한 특성을 가지는 NM을 제공하지 않았다. C-말단 교환은 ST1 crRNA/tracrRNA 복합체와 상호작용할 수 없으며 또한 ST1 특이적 PAM을 포함하는 리포터를 억제할 수 있는 NM-ST1 혼성체를 생성시켰다.
Description
[관련 출원]
본 출원은 2013년 11월 19일자 U.S. 특허 가출원 제61/906,374호의 우선권을 주장하며, 이는 모든 목적에 있어서 그 전체가 본원에 참조로 포함된다.
[정부
권리에 대한 진술
]
본 발명은 국립 보건원(National Institutes of Health)이 수여하는 교부금 제P50 HG005550호 하의 정부 후원으로 이루어졌다. 정부는 본 발명에 있어서 소정의 권리를 가진다.
세균 및 고세균 CRISPR-Cas 시스템은 Cas 단백질과 복합체로 짧은 가이드(short guide) RNA에 의존하여 침입 외래 핵산 내에 존재하는 상보성 서열의 분해를 유도한다. 문헌 [Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011)]; [Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012)]; [Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012)]; [Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282 (2011)]; 및 [Bhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011)]을 참조하라. 에스 피오게네스 (S. pyogenes ) 유형 II CRISPR 시스템의 최근의 시험관내 재구성은 정상적으로 트랜스-코딩된 tracrRNA ("트랜스-활성화 CRISPR RNA")에 융합된 crRNA ("CRISPR RNA")이면 crRNA와 매치하는 표적 DNA 서열을 서열-특이적으로 절단하도록 Cas9 단백질에게 지시하기에 충분하다는 것을 입증하였다. 표적 부위에 대하여 상동성인 gRNA를 발현시키는 것은 Cas9 동원 및 표적 DNA의 분해를 초래한다. 문헌 [H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008)]을 참조하라.
Cas9는 Cas9를 동원하는 모티프 및 표적화하기를 원하는 게놈의 영역에 대하여 상보성인 20개 염기쌍을 포함하는 가이드 RNA (gRNA)를 발현시키는 것에 의해 게놈의 거의 모든 영역을 표적으로 하도록 프로그래밍될 수 있는 DNA 뉴클레아제이다. 모든 특성화되어 있거나 추정상인 Cas9 계열 구성원은 크기가 수 킬로베이스 (> 3,000개 염기쌍)로써, 가장 작은 기능적으로 유효한 구성원인 NM-Cas9 (네이쎄 리아 메닝기티데스 ( Neisseria meningitides) Cas9)가 3,249개 염기쌍의 크기이다. 이와 같은 단백질의 커다란 크기는 전달 및 조작의 어려움으로 인하여, 생물공학 및 치료 적용분야를 위한 그의 잠재력을 제한한다.
[발명의 개요]
본 개시내용의 측면은 단백질의 일부를 생략하도록 조작되어 있으면서도 표적 DNA에 결합하여 표적 DNA에 이중 가닥 절단을 야기할 수 있는 RNA 가이드된 DNA 결합 뉴클레아제로 여전히 기능하는, DNA에 결합하며 1종 이상의 RNA에 의해 가이드되는 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질에 관한 것이다. 일 측면에 있어서, 유형 II CRISPR 시스템의 상기 RNA 가이드된 DNA 결합 단백질은 Cas9 단백질이다.
본 개시내용의 측면은 단백질의 일부를 생략하도록 조작되어 있으면서도 표적 DNA에 결합하여 표적 DNA에 단일 가닥 절단 또는 틈(nick)을 야기할 수 있는 RNA 가이드된 DNA 결합 니카제로 여전히 기능하는, 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질에 관한 것이다. 일 측면에 있어서, 유형 II CRISPR 시스템의 상기 RNA 가이드된 DNA 결합 단백질은 Cas9 단백질이다.
본 개시내용의 측면은 단백질의 일부를 생략하도록 조작되어 있으면서도 뉴클레아제 무효(null)인 RNA 가이드된 DNA 결합 단백질, 즉 뉴클레아제 활성이 결여되어 있는 RNA 가이드된 DNA 결합 단백질로 여전히 기능하는, 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질에 관한 것이다. 일 측면에 있어서, 유형 II CRISPR 시스템의 상기 RNA 가이드된 DNA 결합 단백질은 Cas9 단백질이다.
일 측면에 있어서, RNA 가이드된 DNA 결합 단백질의 일부가, 종들의 군집 내에서 특정 RNA 가이드된 DNA 결합 단백질 계열 내의 잘 보존되지 않거나 아니면 고도로 분기성인 RNA 가이드된 DNA 결합 단백질 서열, 및/또는 특정 RNA 가이드된 DNA 결합 단백질 계열 내의 본원에서 "보존성 가장자리(conservation edge)"로 지칭되는 저보존성과 고보존성 사이 경계들 사이의 단백질 서열을 확인하는 것에 의해 결실용으로 확인된다. 이와 같은 측면에 있어서, RNA 가이드된 DNA 결합 단백질, 예컨대 Cas9와 같은 DNA 결합 단백질 내의 아미노산 서열들은 본원에서 기술되는 방법을 사용하여 통상의 기술자에게 알려져 있는 바와 같이 고보존성 또는 저보존성 중 어느 하나를 가지는 것으로 확인된다. 일 측면에 있어서, 고보존성의 아미노산 서열과 저보존성의 아미노산 서열은 전체로서의 DNA 결합 단백질의 단백질 서열 내에서 서로 인접하는데, 예컨대 바로 인접한다. 고보존성의 아미노산 서열과 저보존성의 아미노산 서열은 저보존성의 아미노산 서열로부터 고보존성의 아미노산 서열을 분리하는 아미노산에 의해 구별된다. 이와 같은 방식에서, 저보존성의 아미노산 서열로부터 고보존성의 아미노산 서열을 분리하는 아미노산은 그것이 고보존성의 아미노산 서열 또는 저보존성의 아미노산 서열 중 어느 하나의 가장자리 또는 말단 부분에 있다는 점에서, 본원에서 "가장자리 아미노산(edge amino acid)" 또는 "보존성 가장자리"로 지칭된다. 따라서, 본 개시내용의 방법은 저보존성의 아미노산 서열로부터 고보존성의 아미노산 서열을 분리하거나, 또는 달리 저보존성의 아미노산 서열로부터 고보존성의 아미노산 서열을 구별하는 아미노산을 확인하는 것을 고려한다. 그와 같은 아미노산은 본원에서 "가장자리 아미노산"으로 지칭된다. 이와 같은 측면에 따르면, 고보존성의 아미노산 서열 양 말단에는 한 쌍의 가장자리 아미노산이 측접 또는 결합될 수 있다. 마찬가지로, 한 쌍의 가장자리 아미노산이 저보존성의 아미노산 서열 양 말단에 측접 또는 결합될 수 있다. 역시 이와 같은 측면에 있어서, 대표적인 일 실시양태는 전체로서의 DNA 결합 단백질의 단백질 서열 내에서의 인접 고보존성 아미노산 서열 및 저보존성 아미노산 서열의 확인에 관한 것이다. 구체적으로, 대표적인 일 실시양태는 전체로서의 DNA 결합 단백질의 단백질 서열 내에서의 저보존성 서열과 탠덤 또는 직렬인 고보존성 서열, 특히 양 말단에 저보존성 서열 (LC)이 결합되어 있는 고보존성 서열 (HC), 또는 대안적으로는 양 말단에 고보존성 서열 (HC)이 결합되어 있는 저보존성 서열 (LC)의 확인에 관한 것이다. 이와 같은 방식에서, 본원에서 기술되는 방법에 의해 확인되는 대표적인 탠덤 서열 또는 직렬 서열은 개략적으로 LC-HC-LC 또는 HC-LC-HC로 나타낼 수 있다. 이와 같은 측면에 따르면, 고보존성 또는 저보존성 중 어느 하나인 중간 서열에 각각 저보존성 또는 고보존성 중 어느 하나인 측접 서열들이 결합된다. 대표적인 탠덤 서열 LC-HC-LC에서는, 한 쌍의 가장자리 아미노산이 고보존성 아미노산 서열의 양 말단에 존재하거나 달리 거기에 결합되어 있는 저보존성인 2개의 측접 아미노산 서열 (LC)로부터 고보존성인 아미노산 서열 (HC)을 구별 또는 분리한다. 대표적인 탠덤 서열 HC-LC-HC에서는, 한 쌍의 가장자리 아미노산이 저보존성 아미노산 서열의 양 말단에 존재하거나 달리 거기에 결합되어 있는 고보존성인 2개의 측접 아미노산 서열 (HC)로부터 저보존성인 아미노산 서열 (LC)을 구별 또는 분리한다. 본원에서 기술되는 방법을 사용하여 이와 같은 대표적인 탠덤 서열이 확인되는 경우, 중간 서열이 고보존성의 아미노산 서열 또는 저보존성의 아미노산 서열 중 어느 것인지에 관계없이, DNA 결합 활성을 유지하며 야생형 DNA 결합 단백질에 비해 크기는 더 작은 본원에서 기술되는 방법에 따른 돌연변이 DNA 결합 단백질을 생성시키기 위하여, 상기 중간 서열은 제거된다. 돌연변이 DNA 결합 단백질을 생성시키 위하여, 상기 가장자리 아미노산은 중간 서열에 측접하는 것, 또는 직렬로 인접하는 서열로부터 달리 중간 서열을 분리하는 것에 의해, 제거될 중간 서열을 한정한다. 본 개시내용의 소정 측면에 있어서, 탠덤 서열의 중간 서열은 돌연변이 DNA 결합 단백질이 유용한 DNA 결합 단백질 활성을 유지한다는 전제하에, 중간 서열이 고보존성의 아미노산 서열인지 또는 저보존성의 아미노산 서열인지 여부에 관계없이 제거될 수 있다.
본 개시내용의 맥락에서 잘 보존되지 않는 서열 또는 보존성 가장자리들 사이의 단백질 서열을 확인하기 위해서는, PFAM으로부터 정렬을 입수하거나, 아니면 Cas9 동족체의 데이터베이스 서치(search)에서 생성된 서열 모음으로부터 정렬을 생성시켰다. 이와 같은 정렬은 컴퓨터로 조정하여, 아미노산 빈도의 위치 당 (상대적) 엔트로피(entropy)로서 보존성을 계산하였다. 다음에는, RNA 가이드된 DNA 결합 단백질로부터 서열을 제거하여, 돌연변이를 생성시켰다.
일 측면에서는, 결실에 적합할 수 있는 다중-도메인 Cas9 단백질 내 영역을 확인하기 위하여, 생물정보학 접근법을 사용하여 Cas9 단백질 내의 잠재적인 도메인 경계들을 확인한다. MUSCLE을 사용하여 PFAM 데이터베이스 (PF 13395)에서 Cas9 서열을 재-정렬하는 것에 의해 다중 서열 정렬이 생성되는데, 상기 정렬은 다양성 및 전체-길이 서열에 대하여 컴퓨터로 조정된다. 서열 보존성은 에스케리키아 콜라이(Escherichia coli)의 모든 유전자에 걸친 평균 빈도에 대한 관찰된 아미노산 빈도의 상대적 엔트로피로서 계산된다. 다중-척도 가장자리 필터 (가우스 (DoG) 밴드패스 필터(Gaussians (DoG) band-pass filter)의 변형)를 보존성 프로파일에 적용함으로써, 본원에서 언급되는 잠재적 단백질 도메인 경계들을 보존성 가장자리로 할당한다. 보존성 가장자리들 사이의 영역은 결실 돌연변이의 제1 반복에서의 결실용으로 선택된다.
소정 측면에 있어서, 본 개시는 크기가 더 작으면서도 여전히 야생형 단백질 활성에 가깝게 유지되는 합성 NM-Cas9 결실 돌연변이에 대해 기술한다. 상기 합성 NM-Cas9 결실 돌연변이는 세포에서 가이드 RNA와의 공동-국재화 복합체로서 DNA에 결합하여 이중 가닥 절단, 단일 가닥 절단을 생성시키는 데에, 또는 원하는 기능을 수행하도록 이펙터 기를 해당 표적 DNA 부근에 위치시키는 데에 사용될 수 있다.
소정 측면에서는, DNA에 결합하는 데에는 필요가 없으며 야생형 DNA 결합 단백질에 비해 크기가 더 작은 돌연변이 DNA 결합 단백질을 형성시키기 위하여 제거될 수 있는 Cas9와 같은 DNA 결합 단백질의 영역을 확인하기 위한 정렬-기반 도메인 검출 방법이 제공된다. 본원에서 기술되는 방법에 따르면, 세균 및 인간 세포에서 강력한 활성을 나타내는 최소화된 Cas9 변이가 생성된다. 본원에서 기술되는 측면에 따르면, 야생형 DNA 결합 단백질에 비해 더 작은 돌연변이 기능성 DNA 결합 단백질 변이, 예컨대 돌연변이 기능성 Cas9 변이가 제공된다.
소정 측면에 있어서, 대표적인 DNA 결합 단백질에는 원핵생물 및 더 고등인 진핵생물 모두에서 기능하는 것으로 나타나 있는 네이쎄리아 메닝기티디스 ( Neisseria meningitidis ) Cas9 (NM, GI:218767588) 및 스트렙토코쿠스 서모필루 스(Streptococcus thermophilus ) Cas9 (ST1, GI:116627542)와 같은 Cas9 오르토로그들이 포함된다. 그 전체가 참조로 포함되는 문헌 [Hou, Z. et al. Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis. Proceedings of the National Academy of Sciences of the United States of America 110, 15644- 15649, doi:10.1073/pnas.1313587110 (2013)]을 참조하라.
이러한 대표적인 Cas9 오르토로그들은 스트렙토코쿠스 피오게네스 (Streptococcus pyogenes ) Cas9 (SP, GI:13622193)에 비해 유전자 크기가 더 작은데, 다시 말하자면 약 3200 대 4100 염기쌍이다. 이에 따라, 본 개시내용의 측면은 특히 유전자 길이가 바이러스 역가에 크게 영향을 줄 수 있는 바이러스 패키지화 기술을 사용하여 Cas9 DNA 결합 단백질이 전달될 수 있는 효율을 증가시키기 위하여 Cas9 DNA 결합 단백질의 크기를 감소시키는 것에 관한 것이다. 각각 그 전체가 참조로 포함되는 문헌 [Kumar, M., Keller, B., Makalou, N. & Sutton, R. E. Systematic determination of the packaging limit of lentiviral vectors. Human gene therapy 12, 1893-1905, doi:10.1089/104303401753153947 (2001)]; [Wu, Z., Yang, H. & Colosi, P. Effect of genome size on AAV vector packaging. Molecular therapy: the journal of the American Society of Gene Therapy 18, 80-86, doi:10.1038/mt.2009.255 (2010)]; 및 [Gelinas, C. & Temin, H. M. Nondefective spleen necrosis virus-derived vectors define the upper size limit for packaging reticuloendotheliosis viruses. Proceedings of the National Academy of Sciences of the United States of America 83, 9211-9215 (1986)]을 참조하라.
합성에 의해 Cas9 유전자의 크기를 감소시키는 것은 더 복잡한 조절 시스템 및 기능성 도메인이 단일 벡터 내에 패키지화되는 것을 가능케 한다. 추가적인 측면에서는, 합성에 의해 PAM 특이성을 변경함으로써 증가된 표적화 잠재력을 가지는 더 작은 Cas9 변이의 생성을 가능케 하는 방법이 제공된다.
소정 측면에서는, 제1 Cas9 종의 C-말단 도메인을 제2 Cas9 종의 C-말단 도메인으로 교환하는 것에 의한 Cas9 키메라의 제조 방법이 제공된다. 일 측면에 있어서, 본 개시는 NM의 C-말단 도메인을 ST1으로 교환하는 것에 의해, 도메인 교환 Cas9 키메라, 예컨대 기능성 NM-ST1-Cas9 키메라를 제공한다. 상기 키메라 Cas9 단백질은 ST1 가이드RNA 및 PAM 특이성을 나타낸다.
일 측면에 있어서, 세포는 원핵 세포 또는 진핵 세포이다. 일 측면에 있어서, 세포는 세균 세포, 효모 세포, 식물 세포 또는 동물 세포이다. 일 측면에 있어서, 세포는 포유동물 세포이다.
일 측면에 있어서, RNA는 약 10 내지 약 500개 뉴클레오티드 사이이다. 일 측면에 있어서, RNA는 약 20 내지 약 100개 뉴클레오티드 사이이다.
일 측면에 있어서, 1종 이상의 RNA는 가이드 RNA이다. 일 측면에 있어서, 1종 이상의 RNA는 crRNA이다. 일 측면에 있어서, 1종 이상의 RNA는 tracrRNA이다. 일 측면에 있어서, 1종 이상의 RNA는 tracrRNA-crRNA 융합체이다.
일 측면에 있어서, 표적 DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA, 접합가능 요소 또는 외인성 DNA이다.
일 측면에 있어서, RNA 가이드된 DNA 결합 단백질은 DNA에 결합하며 1종 이상의 RNA에 의해 가이드되는, 유형 II CRISPR 시스템의 것이다. 일 측면에 있어서, RNA 가이드된 DNA 결합 단백질은 DNA에 결합하며 1종 이상의 RNA에 의해 가이드되는 Cas9 단백질이다.
본 발명 소정 실시양태의 다른 특징 및 장점들은 실시양태에 대한 하기의 설명 및 그의 도면, 그리고 청구범위로부터 더 완전히 드러나게 될 것이다.
본 특허 또는 출원 파일은 컬러로 작성된 하나 이상의 도면을 포함하고 있다. 컬러 도면(들)을 포함하는 이와 같은 특허 또는 특허 출원 공개의 사본은 요청 및 필요 비용의 납부시 특허청에 의해 제공될 것이다. 본 발명의 전기 및 기타 특징 및 장점들은 첨부 도면과 함께 선택된 예시적인 실시양태들의 하기 상세한 설명으로부터 더 완전하게 이해될 것인 바, 도면 중:
도 1은 이. 콜라이 세포가 NM-Cas9 활성에 대한 YFP 리포터를 포함하며, 다양한 NM-Cas9 뉴클레아제 무효 유전자로 형질전환된 이미지이다. NM-Cas9의 부재하에서는 세포가 형광성이며 (상부 우측 사분면 - 음성 대조군), 전체 길이 뉴클레아제 무효 NM-Cas9의 존재하에서는 세포가 비-형광성이다 (상부 좌측 사분면 - 양성 대조군). 생성된 NM-Cas9 결실들 중 2종을 나타내었는데, NM-Cas9-Δ255-449는 야생형에 가까운 억제 수준을 보이며 (하부 좌측 사분면), NM-Cas9-Δ874-922은 대부분 DNA 결합 능력의 결핍을 나타낸다 (하부 우측 사분면).
도 2는 그 전체가 참조로 포함되는 문헌 [Fonfara I, et al., (2014) Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems, Nucleic Acids Res. 42, 2577-90]에 기술되어 있는 바와 같은 계통발생수(phylogenetic tree)이다. 적색으로 표시된 것은 PFAM 재정렬을 위한 개시 시드(seed)로 사용된 서열이다.
도 3은 NM-Cas9의 위치로 말단절단 후 Cas9 정렬의 보존성 프로파일이다.
도 4는 SP-Cas9에서의 위치로 말단절단된 보존성 프로파일이다.
도 5A는 Cas9 단백질 내에서의 일차 아미노산 보존성의 플롯이다. 에스케리키아 콜라이의 모든 유전자에 걸친 평균 아미노산 빈도에 대하여 상대적 엔트로피가 계산된다. 플롯 상부의 수직인 선은 정렬-기반 경계 검출 알고리즘에 의해 측정된 경계들을 나타내는데, 굵은 선은 검출된 6개의 가장 중요한 경계를 나타낸다. 도 5B는 그 전체가 참조로 포함되는 문헌 [Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids research 42, 2577-2590, doi:10.1093/nar/gkt1074 (2014)]을 바탕으로 한 도메인 정렬을 나타낸다. RuvCI-III은 RuvC 뉴클레아제 도메인으로 접히는 부분이다. HNH는 HNH 뉴클레아제 도메인이다. RRR은 아르기닌-풍부 알파-나선 영역이다. 빗살 십자-음영은 위치 140 부근의 아르기닌-풍부 연장체를 기반으로 하는 이와 같은 영역의 연장이다.
도 6A는 NM Cas9 전사 리포터의 설계를 도시하는 개략도이다. 프로토스페이서 및 NM 특이적 PAM의 위치를 나타내고 있다. 도 6B는 이. 콜라이에서 시험된 다양한 뉴클레아제 무효 NM 돌연변이들을 사용한 NM Cas9 전사 억제 검정 데이터의 그래프이다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다. 도 6C는 NM Cas9 도메인 구조를 도시하는 개략도이다. 파선 윤곽을 가지는 백색의 박스는 최소한의 DNA 결합 활성의 변경을 야기하는 NM 돌연변이로부터의 최대 절제 영역의 범위를 제시한다.
도 7은 NM Cas9 결실 분석에 관한 것으로써, NM Cas9 전사 리포터의 설계를 도시한다. 프로토스페이서 및 NM 특이적 PAM의 위치를 나타내고 있다. 이 . 콜라이에서 다양한 뉴클레아제 무효 NM 돌연변이들을 사용한 NM Cas9 전사 억제 검정을 시험하였다. 데이터는 평균 ± 표준 편차 (n=5)를 나타낸다.
도 8A는 이. 콜라이 및 인간 세포에서의 ST1 Cas9 결실 분석 및 기능성 확인, 특히 ST1 Cas9 전사 리포터의 설계를 도시한다. 프로토스페이서 및 ST1 특이적 PAM의 위치를 나타내고 있다. 이 . 콜라이에서 ST1 뉴클레아제-무효 결실 돌연변이들을 사용한 ST1 Cas9 전사 억제 검정을 시험하였다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다. 도 8B는 tdTomato 리포터의 상류에 최소 CMV 프로모터 (min CMV)를 포함하는 ST1 활성화 시험용 리포터 구축물을 도시하는 개략도이다. 최소 CMV 프로모터 상류에 결합하는 ST1 뉴클레아제 무효 Cas9-VP64 융합 단백질은 인간 세포 내에서 전사 활성화 및 형광으로 이어진다. 도 8C는 결실 돌연변이를 포함하는 ST1 활성화인자를 사용하여 형질감염된 세포의 이미지로써, sgRNA 및 tdTomato 리포터와 함께 형질감염되었으며, 형광 현미경에 의해 가시화되었다. 도 8D는 유동 세포측정법에 의한 패널 C로부터의 ST1 활성화의 정량을 보여주는 그래프이다. 데이터는 평균 ± 표준 편차 (n=3)를 나타낸다.
도 9는 이. 콜라이에서의 TD Cas9 결실 분석 및 기능성 확인에 관한 것이다. 전사 억제 검정을 사용하여 TD 뉴클레아제-무효 결실 돌연변이들을 시험하였다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다.
도 10A는 전사 억제 검정에 의해 확인되었을 때의 NM-ST1 도메인 스왑 분석, 특히 예시된 NM 또는 ST1 특이적 PAM의 서열을 포함하는 NM 및 ST1 전사 리포터의 설계에 관한 것이다. 도 10B는 나타낸 아미노산 스왑 지점의 위치와 함께 NM 및 ST1 Cas9의 윤곽을 도시하는 개략도이다. 도 10C-10F는 NM (도 10C 및 도 10F) 또는 ST1 Cas9 (도 10D 및 도 10E) 중 어느 하나에 특이적인 PAM 서열을 가지는 리포터와 함께, 특히 NM (도 10C 및 도 10D) 또는 ST1 Cas9 (도 10E 및 도 10F)에 대한 가이드RNA와 공동으로 발현되는 NM-ST1 뉴클레아제 무효 도메인 교환 돌연변이의 형광 그래프이다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다.
도 11A는 전사 억제 검정에 의해 확인되었을 때의 NM-ST1 도메인 스왑 분석, 특히 예시된 ST1 특이적 PAM의 서열을 포함하는 ST1 전사 리포터의 설계에 관한 것이다. 도 11B는 나타낸 아미노산 스왑 지점의 위치를 가지는 NM 및 ST1 Cas9의 개략적 윤곽이다. 도 11C-11D는 ST1 Cas9 (도 11C 및 도 11D)에 특이적인 PAM 서열을 가지는 리포터와 함께, 특히 NM (도 11D) 또는 ST1 Cas9 (도 11C)에 대한 가이드RNA와 공동으로 발현되는 NM-ST1 뉴클레아제 무효 도메인 교환 돌연변이의 형광 그래프이다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다.
도 1은 이. 콜라이 세포가 NM-Cas9 활성에 대한 YFP 리포터를 포함하며, 다양한 NM-Cas9 뉴클레아제 무효 유전자로 형질전환된 이미지이다. NM-Cas9의 부재하에서는 세포가 형광성이며 (상부 우측 사분면 - 음성 대조군), 전체 길이 뉴클레아제 무효 NM-Cas9의 존재하에서는 세포가 비-형광성이다 (상부 좌측 사분면 - 양성 대조군). 생성된 NM-Cas9 결실들 중 2종을 나타내었는데, NM-Cas9-Δ255-449는 야생형에 가까운 억제 수준을 보이며 (하부 좌측 사분면), NM-Cas9-Δ874-922은 대부분 DNA 결합 능력의 결핍을 나타낸다 (하부 우측 사분면).
도 2는 그 전체가 참조로 포함되는 문헌 [Fonfara I, et al., (2014) Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems, Nucleic Acids Res. 42, 2577-90]에 기술되어 있는 바와 같은 계통발생수(phylogenetic tree)이다. 적색으로 표시된 것은 PFAM 재정렬을 위한 개시 시드(seed)로 사용된 서열이다.
도 3은 NM-Cas9의 위치로 말단절단 후 Cas9 정렬의 보존성 프로파일이다.
도 4는 SP-Cas9에서의 위치로 말단절단된 보존성 프로파일이다.
도 5A는 Cas9 단백질 내에서의 일차 아미노산 보존성의 플롯이다. 에스케리키아 콜라이의 모든 유전자에 걸친 평균 아미노산 빈도에 대하여 상대적 엔트로피가 계산된다. 플롯 상부의 수직인 선은 정렬-기반 경계 검출 알고리즘에 의해 측정된 경계들을 나타내는데, 굵은 선은 검출된 6개의 가장 중요한 경계를 나타낸다. 도 5B는 그 전체가 참조로 포함되는 문헌 [Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids research 42, 2577-2590, doi:10.1093/nar/gkt1074 (2014)]을 바탕으로 한 도메인 정렬을 나타낸다. RuvCI-III은 RuvC 뉴클레아제 도메인으로 접히는 부분이다. HNH는 HNH 뉴클레아제 도메인이다. RRR은 아르기닌-풍부 알파-나선 영역이다. 빗살 십자-음영은 위치 140 부근의 아르기닌-풍부 연장체를 기반으로 하는 이와 같은 영역의 연장이다.
도 6A는 NM Cas9 전사 리포터의 설계를 도시하는 개략도이다. 프로토스페이서 및 NM 특이적 PAM의 위치를 나타내고 있다. 도 6B는 이. 콜라이에서 시험된 다양한 뉴클레아제 무효 NM 돌연변이들을 사용한 NM Cas9 전사 억제 검정 데이터의 그래프이다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다. 도 6C는 NM Cas9 도메인 구조를 도시하는 개략도이다. 파선 윤곽을 가지는 백색의 박스는 최소한의 DNA 결합 활성의 변경을 야기하는 NM 돌연변이로부터의 최대 절제 영역의 범위를 제시한다.
도 7은 NM Cas9 결실 분석에 관한 것으로써, NM Cas9 전사 리포터의 설계를 도시한다. 프로토스페이서 및 NM 특이적 PAM의 위치를 나타내고 있다. 이 . 콜라이에서 다양한 뉴클레아제 무효 NM 돌연변이들을 사용한 NM Cas9 전사 억제 검정을 시험하였다. 데이터는 평균 ± 표준 편차 (n=5)를 나타낸다.
도 8A는 이. 콜라이 및 인간 세포에서의 ST1 Cas9 결실 분석 및 기능성 확인, 특히 ST1 Cas9 전사 리포터의 설계를 도시한다. 프로토스페이서 및 ST1 특이적 PAM의 위치를 나타내고 있다. 이 . 콜라이에서 ST1 뉴클레아제-무효 결실 돌연변이들을 사용한 ST1 Cas9 전사 억제 검정을 시험하였다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다. 도 8B는 tdTomato 리포터의 상류에 최소 CMV 프로모터 (min CMV)를 포함하는 ST1 활성화 시험용 리포터 구축물을 도시하는 개략도이다. 최소 CMV 프로모터 상류에 결합하는 ST1 뉴클레아제 무효 Cas9-VP64 융합 단백질은 인간 세포 내에서 전사 활성화 및 형광으로 이어진다. 도 8C는 결실 돌연변이를 포함하는 ST1 활성화인자를 사용하여 형질감염된 세포의 이미지로써, sgRNA 및 tdTomato 리포터와 함께 형질감염되었으며, 형광 현미경에 의해 가시화되었다. 도 8D는 유동 세포측정법에 의한 패널 C로부터의 ST1 활성화의 정량을 보여주는 그래프이다. 데이터는 평균 ± 표준 편차 (n=3)를 나타낸다.
도 9는 이. 콜라이에서의 TD Cas9 결실 분석 및 기능성 확인에 관한 것이다. 전사 억제 검정을 사용하여 TD 뉴클레아제-무효 결실 돌연변이들을 시험하였다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다.
도 10A는 전사 억제 검정에 의해 확인되었을 때의 NM-ST1 도메인 스왑 분석, 특히 예시된 NM 또는 ST1 특이적 PAM의 서열을 포함하는 NM 및 ST1 전사 리포터의 설계에 관한 것이다. 도 10B는 나타낸 아미노산 스왑 지점의 위치와 함께 NM 및 ST1 Cas9의 윤곽을 도시하는 개략도이다. 도 10C-10F는 NM (도 10C 및 도 10F) 또는 ST1 Cas9 (도 10D 및 도 10E) 중 어느 하나에 특이적인 PAM 서열을 가지는 리포터와 함께, 특히 NM (도 10C 및 도 10D) 또는 ST1 Cas9 (도 10E 및 도 10F)에 대한 가이드RNA와 공동으로 발현되는 NM-ST1 뉴클레아제 무효 도메인 교환 돌연변이의 형광 그래프이다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다.
도 11A는 전사 억제 검정에 의해 확인되었을 때의 NM-ST1 도메인 스왑 분석, 특히 예시된 ST1 특이적 PAM의 서열을 포함하는 ST1 전사 리포터의 설계에 관한 것이다. 도 11B는 나타낸 아미노산 스왑 지점의 위치를 가지는 NM 및 ST1 Cas9의 개략적 윤곽이다. 도 11C-11D는 ST1 Cas9 (도 11C 및 도 11D)에 특이적인 PAM 서열을 가지는 리포터와 함께, 특히 NM (도 11D) 또는 ST1 Cas9 (도 11C)에 대한 가이드RNA와 공동으로 발현되는 NM-ST1 뉴클레아제 무효 도메인 교환 돌연변이의 형광 그래프이다. 데이터는 평균 ± 표준 편차 (n=4)를 나타낸다.
본 발명의 실시양태는 유형 II CRISPR 시스템의 돌연변이 RNA 가이드된 DNA 결합 단백질에 관한 것이다. 이와 같은 돌연변이는 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질의 속 내 종들 간에 잘 보존되지 않거나 아니면 고도로 분기성인 서열을 제거하는 것에 의해 생성된다. 일 측면에 따르면, RNA 가이드된 DNA 결합 단백질의 계열 내 종들의 서열이 정렬된 후, 낮은 보존성을 가지는 서열 또는 보존성 가장자리들 사이의 서열이 확인된다. 이후, 이들 서열은 특정 RNA 가이드된 DNA 결합 단백질로부터 결실된다. 대표적인 RNA 가이드된 DNA 결합 단백질에는 예를 들면 유형 II CRISPR 시스템에 존재하는 Cas9 단백질이 포함된다. 이와 같은 Cas9 단백질 및 유형 II CRISPR 시스템에 대해서는 관련 기술분야에 잘 입증되어 있다. 문헌 [Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477]을 참조하라. 본원에서 기술되는 돌연변이 DNA 결합 단백질은 표적 DNA에 이중 가닥 절단을 형성시키거나, 표적 DNA에 단일 가닥 절단을 형성시키거나, 또는 이펙터 기를 표적 DNA 부근에 위치시키는 방식으로 표적 DNA에 결합함으로써 그 이펙터 기가 표적 DNA와 상호작용할 수 있도록 하는 데에 사용될 수 있다. 이와 같은 이펙터 기에는 통상의 기술자에게 알려져 있는 활성화인자, 억제인자 또는 후성 변형인자가 포함된다.
뉴클레아제 활성을 가지는 대표적인 DNA 결합 단백질은 이중 가닥 DNA에 틈을 형성하거나 그것을 절단하는 기능을 한다. 이와 같은 뉴클레아제 활성은 뉴클레아제 활성을 나타내는 하나 이상의 폴리펩티드 서열을 가지는 DNA 결합 단백질로부터 기인할 수 있다. 이와 같은 대표적인 DNA 결합 단백질은 각 도메인이 이중 가닥 DNA를 절단하거나 그의 특정 가닥에 틈새를 형성하는(nicking) 작용을 하는 2개의 별도 뉴클레아제 도메인을 가질 수 있다. 통상의 기술자에게 알려져 있는 뉴클레아제 활성을 가지는 대표적인 폴리펩티드 서열에는 McrA-HNH 뉴클레아제 관련 도메인 및 RuvC-유사 뉴클레아제 도메인이 포함된다. 이에 따라, 대표적인 DNA 결합 단백질은 자연상에서 McrA-HNH 뉴클레아제 관련 도메인 및 RuvC-유사 뉴클레아제 도메인 중 하나 이상을 포함하는 것들이다.
일 측면에 있어서, 2개 이상의 뉴클레아제 도메인을 가지는 DNA 결합 단백질은 뉴클레아제 도메인들 중 하나를 제외한 모두를 불활성화하도록 변형 또는 변경될 수 있다. DNA 결합 단백질이 이중 가닥 DNA의 하나의 가닥만을 절단하거나 거기에 틈새를 형성한다는 점에서, 그와 같은 변형되거나 변경된 DNA 결합 단백질은 DNA 결합 단백질 니카제로 지칭된다. RNA에 의해 DNA로 가이드되는 경우, 상기 DNA 결합 단백질 니카제는 RNA 가이드된 DNA 결합 단백질 니카제로 지칭된다.
대표적인 DNA 결합 단백질은 유형 II CRISPR 시스템의 RNA 가이드된 DNA 결합 단백질이다. 대표적인 DNA 결합 단백질은 Cas9 단백질이다.
에스 . 피오게네스에서, Cas9는 프로토스페이서(protospacer)-인접 모티프 (PAM)의 3 bp 상류에서 단백질의 하기 2개 촉매촉진 도메인에 의해 매개되는 과정을 통하여 둔단 이중-가닥 절단을 생성시킨다: DNA의 상보성 가닥을 절단하는 HNH 도메인 및 비-상보성 가닥을 절단하는 RuvC-유사 도메인. 그 전체가 참조로 포함되는 문헌 [Jinke et al., Science 337, 816-821 (2012)]을 참조하라. 문헌 [Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477]의 보충 정보에 확인되어 있는 바와 같이, Cas9 단백질은 하기를 포함한 많은 유형 II CRISPR 시스템에 존재하는 것으로 알려져 있다: 메타노코쿠스 마리팔루디스(Methanococcus maripaludis) C7; 코리네박테리움 디프테리아에(Corynebacterium diphtheriae); 코리네박테리움 에피시엔스(Corynebacterium efficiens) YS-314; 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) ATCC 13032 Kitasato; 코리네박테리움 글루타미쿰 ATCC 13032 Bielefeld; 코리네박테리움 글루타미쿰 R; 코리네박테리움 크로펜스테드티이(Corynebacterium kroppenstedtii) DSM 44385; 마이코박테리움 아브세수스(Mycobacterium abscessus) ATCC 19977; 노카르디아 파르시니카(Nocardia farcinica) IFM10152; 로도코쿠스 에리트로폴리스(Rhodococcus erythropolis) PR4; 로도코쿠스 조스티이(Rhodococcus jostii) RHA1; 로도코쿠스 오파쿠스(Rhodococcus opacus) B4 uid36573; 아시도테르무스 셀룰롤리티쿠스(Acidothermus cellulolyticus) 11B; 아르트로박터 클로로페놀리쿠스(Arthrobacter chlorophenolicus) A6; 크리벨라 플라비다(Kribbella flavida) DSM 17836 uid43465; 서모모노스포라 쿠르바타(Thermomonospora curvata) DSM 43183; 비피도박테리움 덴티움(Bifidobacterium dentium) Bd1; 비피도박테리움 롱굼(Bifidobacterium longum) DJO10A; 슬라키아 헬리오트리니레두센스(Slackia heliotrinireducens) DSM 20476; 페르세포넬라 마리나(Persephonella marina) EX H1; 박테로이데스 프라길리스(Bacteroides fragilis) NCTC 9434; 카프노사이토파가 오크라세아(Capnocytophaga ochracea) DSM 7271; 플라보박테리움 사이크로필룸(Flavobacterium psychrophilum) JIP0286; 알케르만시아 무시니필라(Akkermansia muciniphila) ATCC BAA 835; 로세이플렉수스 카스텐홀지이(Roseiflexus castenholzii) DSM 13941; 로세이플렉수스 RS1; 시네코시스티스(Synechocystis) PCC6803; 엘루시미크로븀 미누툼(Elusimicrobium minutum) Pei191; 비배양 흰개미 군 1 세균 계통 Rs D17; 피브로박터 숙시노제네스(Fibrobacter succinogenes) S85; 바실루스 세레우스(Bacillus cereus) ATCC 10987; 리스테리아 이노쿠아(Listeria innocua); 락토바실루스 카세이(Lactobacillus casei); 락토바실루스 람노수스(Lactobacillus rhamnosus) GG; 락토바실루스 살리바리우스(Lactobacillus salivarius) UCC118; 스트렙토코쿠스 아갈락티아에(Streptococcus agalactiae) A909; 스트렙토코쿠스 아갈락티아에 NEM316; 스트렙토코쿠스 아갈락티아에 2603; 스트렙토코쿠스 디스갈락티아에 에퀴시밀리스(Streptococcus dysgalactiae equisimilis) GGS 124; 스트렙토코쿠스 에퀴주에피데미쿠스(Streptococcus equi zooepidemicus) MGCS10565; 스트렙토코쿠스 갈롤리티쿠스(Streptococcus gallolyticus) UCN34 uid46061; 스트렙토코쿠스 고르도니이 칼리스(Streptococcus gordonii Challis) subst CH1; 스트렙토코쿠스 뮤탄스(Streptococcus mutans) NN2025 uid46353; 스트렙토코쿠스 뮤탄스; 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) M1 GAS; 스트렙토코쿠스 피오게네스 MGAS5005; 스트렙토코쿠스 피오게네스 MGAS2096; 스트렙토코쿠스 피오게네스 MGAS9429; 스트렙토코쿠스 피오게네스 MGAS 10270; 스트렙토코쿠스 피오게네스 MGAS6180; 스트렙토코쿠스 피오게네스 MGAS315; 스트렙토코쿠스 피오게네스 SSI-1; 스트렙토코쿠스 피오게네스 MGAS10750; 스트렙토코쿠스 피오게네스 NZ131; 스트렙토코쿠스 서모필레스(Streptococcus thermophiles) CNRZ1066; 스트렙토코쿠스 서모필레스 LMD-9; 스트렙토코쿠스 서모필레스 LMG18311; 클로스트리듐 보툴리눔(Clostridium botulinum) A3 Loch Maree; 클로스트리듐 보툴리눔 B Eklund 17B; 클로스트리듐 보툴리눔 Ba4 657; 클로스트리듐 보툴리눔 F Langeland; 클로스트리듐 셀룰로라이티쿰(Clostridium cellulolyticum) H10; 피네골리다 마그나(Finegoldia magna) ATCC 29328; 유박테리움 렉탈레(Eubacterium rectale) ATCC 33656; 마이코플라스마 갈리셉티쿰(Mycoplasma gallisepticum); 마이코플라스마 모빌(Mycoplasma mobile) 163K; 마이코플라스마 페네트란스(Mycoplasma penetrans); 마이코플라스마 시노비아에(Mycoplasma synoviae) 53; 스트렙토바실루스 모닐리포르미스(Streptobacillus moniliformis) DSM12112; 브라디리조븀(Bradyrhizobium) BTAi1; 니트로박터 함부르젠시스(Nitrobacter hamburgensis) X14; 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris) BisB18; 로도슈도모나스 팔루스트리스 BisB5; 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans) DS-1; 디노로세오박터 쉬바에(Dinoroseobacter shibae) DFL 12; 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus) Pal 5 FAPERJ; 글루코나세토박터 디아조트로피쿠스 Pal 5 JGI; 아조스피릴룸(Azospirillum) B510 uid46085; 로도스피릴룸 루브룸(Rhodospirillum rubrum ATCC 11170; 디아포로박터(Diaphorobacter) TPSY uid29975; 베르미네프로박터 에이세니아에(Verminephrobacter eiseniae) EF01-2; 네이쎄리아 메닝기티데스(Neisseria meningitides) 053442; 네이쎄리아 메닝기티데스 alpha14; 네이쎄리아 메닝기티데스 Z2491; 데술포비브리오 살렉시젠스(Desulfovibrio salexigens) DSM 2638; 캄필로박터 제주니 도일레이(Campylobacter jejuni doylei) 269 97; 캄필로박터 제주니 81116; 캄필로박터 제주니; 캄필로박터 라리(Campylobacter lari) RM2100; 헬리코박터 헤파티쿠스(Helicobacter hepaticus); 월리넬라 숙시노제네스(Wolinella succinogenes); 톨루모나스 아우엔시스(Tolumonas auensis) DSM 9187; 슈도알테로모나스 아틀란티카(Pseudoalteromonas atlantica) T6c; 세와넬라 페알레아나(Shewanella pealeana) ATCC 700345; 레지오넬라 뉴모필라 파리스(Legionella pneumophila Paris); 악티노바실루스 숙시노제네스(Actinobacillus succinogenes) 130Z; 파스튜렐라 물토시다(Pasteurella multocida); 프란시셀라 툴라렌시스 노비시다(Francisella tularensis novicida) U112; 프란시셀라 툴라렌시스 홀락티카(Francisella tularensis holarctica); 프란시셀라 툴라렌시스 FSC 198; 프란시셀라 툴라렌시스 툴라렌시스(Francisella tularensis tularensis); 프란시셀라 툴라렌시스 WY96-3418; 및 트레포네마 덴티콜라(Treponema denticola) ATCC 35405. 이에 따라, 본 개시내용의 측면은 상기에 확인되어 있는 종들 중 어느 하나와 같은 유형 II CRISPR 시스템에 존재하는 Cas9 단백질의 돌연변이에 관한 것이다. 대표적인 Cas9 단백질은 네이쎄리아 메닝기티데스, 예컨대 네이쎄리아 메닝기티데스 053442; 네이쎄리아 메닝기티데스 alpha14; 네이쎄리아 메닝기티데스 Z2491에서 발견되는 것이다.
본 개시에 따른 세포에는 본원에서 기술되는 바와 같이 외래 핵산이 도입 및 발현될 수 있는 임의의 세포가 포함된다. 본원에서 기술되는 본 개시내용의 기본적인 개념이 세포 유형에 의해 제한되는 것은 아니라는 것이 이해되어야 한다. 본 개시에 따른 세포에는 진핵 세포, 원핵 세포, 동물 세포, 식물 세포, 진균 세포, 고세균 세포, 진정세균 세포 등이 포함된다. 세포에는 효모 세포, 식물 세포 및 동물 세포와 같은 진핵 세포가 포함된다. 구체적인 세포에는 포유동물 세포가 포함된다. 구체적인 세포에는 줄기 세포, 예컨대 다능성 줄기 세포, 예컨대 인간 유도 다능성 줄기 세포가 포함된다.
표적 핵산에는 돌연변이 RNA 가이드된 DNA 결합 단백질 뉴클레아제가 틈새를 형성하거나 절단하는 데에 유용할 수 있는 임의의 핵산 서열이 포함된다. 표적 핵산에는 유전자가 포함된다. 본 개시내용의 목적상, 이중 가닥 DNA와 같은 DNA에는 표적 핵산이 포함될 수 있으므로, 공동-국재화 복합체는 표적 핵산에서, 또는 그와 인접하여, 또는 그 부근에서 공동-국재화 복합체가 표적 핵산에 대하여 원하는 효과를 가질 수 있는 방식으로 DNA에 결합하거나 달리 그와 공동-국재화될 수 있다. 이와 같은 표적 핵산에는 내인성 (또는 자연 발생) 핵산 및 외인성 (또는 외래) 핵산이 포함될 수 있다. 통상의 기술자라면, 본 개시를 바탕으로, 표적 핵산을 포함하는 DNA에 공동-국재화되는 가이드 RNA 및 돌연변이 Cas9 단백질을 용이하게 확인 또는 설계할 수 있을 것이다. DNA에는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA, 접합가능 요소 또는 외인성 DNA가 포함된다.
외래 핵산 (즉 세포의 자연 핵산 조성의 일부가 아닌 것들)은 해당 도입용으로 통상의 기술자에게 알려져 있는 임의의 방법을 사용하여 세포에 도입될 수 있다. 그와 같은 방법에는 형질감염, 형질도입, 바이러스 형질도입, 미세주사, 리포펙션, 뉴클레오펙션, 나노입자 폭격, 형질전환, 접합 등이 포함된다. 통상의 기술자라면, 용이하게 확인가능한 문헌 자료들을 사용하여 그와 같은 방법들을 용이하게 이해하고 적합화하게 될 것이다.
일 측면에서는, Cas9 계열 내 종들 내에서 잘 보존되지 않거나 아니면 분기성이거나, 또는 Cas9 계열 내 종들 내에서 보존성 가장자리 사이에 존재하는 Cas9 단백질의 일부를 결실시키는 것에 의해, Cas9 단백질을 코딩하는 데에 요구되는 유전 물질이 감소된다. 기능성인 Cas9를 코딩하는 데에 요구되는 핵산의 크기를 감소시키는 것에 의해, 가이드 RNA 또는 조절 요소 또는 이펙터 도메인을 코딩하는 핵산과 같은 추가적인 핵산들이 Cas9를 전달하도록 설계되는 벡터와 함께 포함될 수 있다. 가장 작은 특징적인 Cas9 계열 구성원을 사용하는 경우, 원하는 게놈 좌위에 Cas9를 적정하게 위치지정하기 위하여 필요한 유전자 요소들 (Cas9 단백질 및 gRNA)을 코딩하는 데에 ~4,500 킬로베이스의 DNA가 필요하게 된다. ~4,500개 염기쌍이면, Cas9는 AAV 기반 바이러스 벡터 (유럽에서 규제 승인된 바이러스 벡터임) 내에서의 패키지화를 위한 크기 한계에 가깝다. 또한, 프로그램가능 DNA 결합 단백질에 융합될 제1 전사 및 후성 이펙터 도메인 중 일부는 2,000개 염기쌍을 초과하는데, 이에 따라 일단 Cas9에 융합되고 나면, AAV 벡터의 패키지화 한계를 훨씬 지나 렌티바이러스 패키지화 시스템의 한계 (~8,000개 염기쌍)에 접근한다.
본 개시내용의 대표적인 것으로써 하기의 실시예가 제시된다. 이러한 실시예가 본 개시내용의 영역을 제한하는 것으로 간주되어서는 아니되는데, 본 개시, 도면 및 첨부된 청구범위를 보게 되면, 이들 및 기타 등가의 실시양태들이 드러나게 될 것이기 때문이다.
[
실시예
]
실시예 1
돌연변이 Cas9
Cas9를 코딩하는 커다란 유전자 크기 문제를 극복하기 위하여, 가장 작은 특징적인 Cas9 계열 구성원 중 하나인 NM-Cas9 (네이쎄리아 메닝기티데스 Cas9) 내의 다양한 영역들에 대하여 표적화된 결실을 수행하였다. NM-Cas9는 크기가 3,249 bp이다. 게놈에 표적화하기 위한 요건 및 뉴클레아제 활성에 연관되어 있는 잔기들을 확인하였다. 크기가 더 작은 NM-Cas9의 버전을 생성시키기 위하여, Cas9 단백질들의 정렬을 생성시키고, 저보존성의 연속 연장체 또는 보존성 가장자리들 사이의 연장체를 결실용으로 확인하였다. 수개의 해당 영역을 확인하고, NM-Cas9로부터 선택적으로 제거한 다음, Cas9 억제인자 검정을 사용하여 기능에 대하여 그것을 평가하였다. 상기 검정에서는, 뉴클레아제 활성은 결핍되어 있으나 리포터 유전자의 5' 영역에 표적화될 수 있는 NM-Cas9의 변이체를 사용하였다. NM-Cas9가 리포터 유전자에 결합할 수 있는 경우, 그것은 전사를 억제하게 되며, 형광 리포터인 경우라면, 세포가 비-형광으로 보이게 된다.
Cas9 정렬 및 결실 예측: PFAM 데이터베이스 또는 데이터베이스 서치 예컨대 jackHMMER (그 전체가 참조로 포함되는 문헌 [R.D. Finn, J. Clements, S.R. Eddy, Nucleic Acids Research (2011) Web Server Issue 39:W29-W37]) 중 어느 하나로부터 Cas9 동족체들의 전체 길이 서열을 입수하였다. 서열 모음이 정렬되지 않는 경우, CLUSTALW (그 전체가 참조로 포함되는 문헌 [Sievers F, Wilm A, Dineen DG, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Soding J, Thompson JD, Higgins DG (2011)]) 또는 등가물과 같은 정렬 알고리즘을 사용하여 정렬을 생성시켰다. 컴퓨터에 의해 해당 서열의 위치에 맞게 상기 정렬을 절단하고 조정하여 정렬 바이어스(alignment bias)를 감소시켰다 (예컨대 95 %를 초과하는 쌍별 동일성을 가지는 서열을 제거함). 보존성은 그 위치에서의 아미노산 및 갭의 양을 고려하여 위치 당 아미노산 빈도의 엔트로피 또는 상대적 엔트로피로 계산하였다. 결실은 저보존성 또는 보존성 가장자리들 사이의 영역으로 표적화하였다. 실험 검증을 위한 반복에서는, 결실을 확장하거나 이동시켰다.
결실 구성 및 특성화: 그 전체가 참조로 포함되는 문헌 [Esvelt, K.M., Mali, P., Braff, J.L., Moosburner, M., Yaung, S.J., and Church, G.M. (2013) Nat Methods 10, 1116-1121]에 기술되어 있는 바와 같이, 뉴클레아제 무효 NM-Cas9를 발현하는 세균 플라스미드를 미리 생성시켰다. NM-Cas9 내에 표적화된 결실을 생성시키는 데에는, 그 전체가 참조로 포함되는 문헌 [Gibson, D.G., Young, L., Chuang, R.Y., Venter, J.C, Hutchison, C.A., 3rd, and Smith, H.O. (2009) Nat Methods 6, 343-345]에 기술되어 있는 바와 같이 깁슨 조립체(Gibson assembly)를 사용하였다. 상보성인 중복부를 포함하며 SGGGS 링커를 삽입하는 것과 함께 NM-Cas9 내의 표적화된 영역을 제거하도록 설계되는 프라이머를 구매하여, PCR 반응에 사용하였다. PCR 단편들을 겔 정제하고, 깁슨 조립체를 사용하여 시험관 내에서 조립한 후, 이. 콜라이 (E. coli)에 형질전환시켰다. 클론의 서열을 확인하고, (2개 대신) 단일 플라스미드가 NM-Cas9 스페이서, 표적화된 프로토스페이서 및 YFP 리포터를 포함하는 미리 생성된 NM-Cas9 리포터 플라스미드의 변형된 형태 (문헌 [(2013) Nat Methods 10, 1116-1121] 참조)를 사용하여, NM-Cas9 활성에 대하여 시험하였다. 간단하게 말하자면, 이와 같은 검정에서는, 세포를 합성 NM-Cas9 변이 및 리포터 플라스미드로 공동-형질전환시켰다. 다음에, 이중으로 형질전환된 세포를 37 ℃에서 성장시키고, 형광 플레이트 해독기를 사용하여 YFP 형광의 양을 측정한 후, 야생형 뉴클레아제 무효 NM-Cas9 및 리포터 플라스미드를 포함하는 대조군 플라스미드를 사용하여 형질전환된 세포와 비교하였다.
하기 서열은 YFP 리포터 검정으로 측정하였을 때 야생형에 근접한 수준의 활성을 유지한 2종의 최대 NM-Cas9 단일 결실 돌연변이에 대한 것이다. NM-Cas9 내의 결실된 영역을 대체하는 SGGGS 링커의 서열은 대문자로 나타내었다.
NM-Cas9-Δ255-449
NM-Cas9-Δ567-654
YFP 리포터 플라스미드
본원에서 기술되는 방법에 따라, 수개의 NM-Cas9 내 결실이 확인되었는데, 최대인 NM-Cas9-Δ255-449는 595개 염기쌍을 제거하였으며, 리포터 검정에 의해 측정되었을 때 겨우 16 %의 활성 감소를 나타내었다. 소정 측면에서는, NM-Cas9와 같은 야생형 Cas9에 비해 1000개 더 적은 염기쌍 또는 900개 더 적은 염기쌍을 가지는 돌연변이 Cas9 단백질이 제공되었는데, 야생에 가까운 수준의 활성을 유지하였다.
실시예 II
결실용 Cas9 뉴클레아제 도메인의 표적화
Cas9의 니카제 또는 뉴클레아제 무효 대립유전자를 원하는 경우에 낮은 서열 보존성 또는 서열 보존성 가장자리들 사이의 영역을 표적화하는 것과 함께, 결실용으로 그것을 둘러싸고 있는 뉴클레오티드들과 함께 Cas9 뉴클레아제 도메인을 표적으로 할 수 있다. 이와 같은 접근법을 이용하여, YFP 리포터 검정에 의해 측정하였을 때 DNA에 결합하는 야생에 가까운 능력을 보유하는 HNH 모티프 및 둘러싸고 있는 뉴클레오티드가 결여되어 있는 기능성 NM-Cas9 대립유전자 NM-Cas9-Δ567-654를 구성하였다.
실시예 III
비-바이어스 NM-Cas9 결실 라이브러리의 구축 방법
Cas9 결실을 생성시킴에 있어서 표적화된 접근법을 선택하는 것 이외에, 본 개시내용의 측면에는 무작위 결실 생성 및 기능성 돌연변이의 스크리닝을 위한 고-처리량 접근법이 포함된다. 대표적인 방법에 따르면, 무차별 뉴클레아제, 초음파처리, 샘플을 반복적으로 피펫팅하는 것, 또는 기타 화학적, 효소적 또는 환경적 수단을 사용하여 원하는 Cas9 대립유전자를 포함하는 플라스미드 DNA가 전단될 수 있다. 일단 단편화되고 나면, 플라스미드 DNA는 Cas9 유전자로부터 뉴클레오티드들을 제거하기 위하여 엑소뉴클레아제를 사용하여 처리될 수 있다. 엑소뉴클레아제 처리 후에는, 녹두 뉴클레아제 또는 클리나우 폴리머라제와 같은 효소를 사용하여 단편화된 말단들이 둔단화된 후, 무작위 결실을 포함하는 Cas9 플라스미드를 생성시키기 위하여 서로 라이게이션된다. Cas9의 결실된 부분 내에 링커 또는 이펙터 모티프와 같은 외인성 도메인을 삽입하기 위하여 해당 도메인이 둔단 단편화된 DNA에 라이게이션될 수 있으며, 이후의 플라스미드 원형화는 Cas9의 결실된 부분 내에 외인성 도메인이 삽입되어 있는 Cas9 코딩 서열을 생성시키게 된다. 이후, 원형화된 분자의 라이브러리가 이. 콜라이로 형질전환되게 되며, 플라스미드 DNA가 추출되게 된다.
이 부분에서, 라이브러리는 Cas9 활성에 대한 리포터 검정을 포함하는 세포로 형질전환될 수 있으며, 기능적인 활성을 유지하는 라이브러리 구성원이 확인될 수 있다. 대안적으로는, 스크리닝될 라이브러리의 크기를 감소시키기 위하여, 분해 또는 PCR을 통하여 새롭게 생성된 라이브러리로부터의 Cas9의 코딩 서열이 단리될 수 있으며, 개시 야생형 Cas9 유전자에 비해 더 짧도록 단편들이 크기-선택될 수 있다. 이러한 더 적은 구성원들은 이후 다시 개시 벡터로 라이게이션되어, Cas9 활성의 리포터를 포함하는 세포로 형질전환될 수 있다.
플라스미드 전단 이외에, Cas9 유전자에 대한 3' 상동성을 가지나 5' 상동성은 서로에 대하여 포함하며 여기서 각 올리고뉴클레오티드의 3' 말단은 Cas9 내의 서로 다른 30개 가량 염기쌍 연장체에 결합하는 올리고뉴클레오티드들의 라이브러리가 생성될 수 있다. 이러한 올리고뉴클레오티드들은 Cas9 코딩 서열의 센스 및 안티-센스 가닥 모두를 포괄한다. 이후, 이들 올리고뉴클레오티드를 사용하여 PCR이 수행됨으로써 일련의 Cas9 단편들이 생성될 수 있는데, 주어진 센스 PCR 반응으로부터의 각 생성물은 모든 다른 안티-센스 PCR 생성물에 대하여 상보성을 가지며, 그 반대도 마찬가지이다. 이들 단편은 이후 깁슨 조립체 또는 중복 연장 PCR과 같은 방법을 사용하여 서로 어닐링된 후, 이어서 벡터 백본으로 라이게이션되고, 세포에 형질전환되어, 제거된 Cas9 유전자의 무작위 연장체를 포함하는 Cas9 변이들의 라이브러리를 생성시킬 수 있다. 더 긴 링커를 위해서는, 또는 결실된 영역 내에 이펙터 도메인을 삽입하기 위해서는, 그의 5' 말단의 올리고뉴클레오티드들이 상기 더 긴 링커 또는 이펙터 도메인에 대하여 상보성을 가져야 하며, 이후 이와 같은 도메인이 깁슨 조립체 반응에, 또는 중복 연장 PCR 동안 포함되어야 한다. 일단 라이브러리가 생성되고 나면, 본원에서 기술되는 YFP 리포터 시스템과 같은 리포터 검정을 사용하여 기능성인 변이들이 확인될 수 있다.
실시예 IV
벡터 구축
Cas9 뉴클레아제 무효 플라스미드는 ST1 (Addgene# 48659)이거나, 또는 하기의 점 돌연변이 (NM: D16A D587A H588A N611A 및 TD: D13A D878A H879A N902A)를 도입하는 것에 의해 플라스미드 NM 및 TD (각각 Addgene# 48646 및 48648)로부터 구축하였다. Cas9 결실은 깁슨 조립체를 사용하여 생성시켰다. 이루어진 경우, 내부 결실은 연결된 단편들 사이에 링커가 결여되어 있는 NM Δ566-620을 제외하고는 5개 아미노산 Ser-Gly-Gly-Gly-Ser 링커에 의해 연결하였다. N-말단 도메인 교환으로써, ST1의 잔기 1-117을 NM의 잔기 118-1082에 융합시켰다. C-말단 도메인 교환은 NM의 잔기 1-727을 ST1의 잔기 743-1121에 융합시켰다.
실시예 V
세균 리포터 구축물
결실 돌연변이의 분석에 사용된 리포터 구축물은 그것이 단일 SC101-kanR 플라스미드 백본에 스페이서 요소 및 YFP 리포터를 조합하였다는 것 이외에는 이전에 공개된 것들과 유사하였다. 도메인-교환 분석을 위한 리포터 구축물은 이전에 사용된 것들과 동일하였다. 그 전체가 참조로 포함되는 문헌 [Esvelt, K.M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013)]을 참조하라.
실시예 VI
포유동물 리포터 구축물
M-ST1n-VP64 구축물, ST1 가이드 RNA 플라스미드 및 ST1 특이적 포유동물 전사 리포터는 문헌 [Esvelt, K.M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013)]에서 이전에 공개된 바 있다 (각각 Addgene# 48675, 48672 및 48678). 결실 돌연변이는 세균 구축물에서와 같이 구성하였다.
실시예 VII
억제 검정
Cas9 억제 검정은 적절한 스페이서/리포터 구축물 및 조사될 Cas9 벡터를 사용하여 NEB 10-베타 세포 (뉴 잉글랜드 바이오랩스(New England BioLabs) 사)를 공동-형질전환시키는 것에 의해 수행하였다. 형질전환으로부터의 집락을 선발하여, 96 웰 플레이트에서 연속적으로 진탕하면서 37 ℃로 성장시켰다. 다음날, 495-528 nm에서의 형광 및 600 nm에서의 흡광도를 측정하는 시너지 네오(Synergy Neo) 마이크로플레이트 해독기 (바이오텍(BioTek) 사)를 사용하여 플레이트를 해독하였다. 스왑(swap) 실험용으로는, 2종의 서로 다른 이전에 공개된 스페이서/프로토스페이서 조합 (A 및 B) (문헌 [Esvelt, K.M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013)] 참조)을 시험하였다. 모든 다른 실험에서는, 스페이서/프로토스페이서 조합 B만을 조사하였다.
실시예 VIII
세포 배양 및 형질감염
HEK 293T 세포를 10 % FBS (인비트로겐(Invitrogen) 사) 및 페니실린/스트렙토마이신 (인비트로겐 사)이 보충된 고도 글루코스의 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium) (인비트로겐 사)에서 유지하였다. 가습 인큐베이터에서 37 ℃ 및 5 % CO2로 세포를 유지하였다. 웰 당 50,000개 세포로 접종된 24 웰 플레이트에서 세포를 형질감염시켰다. 2.5 μl의 리포펙타민 2000을 사용하여, 400 ng의 Cas9 활성화인자, 100 ng의 gRNA 및 60 ng의 리포터 플라스미드를 각 웰로 전달하였다. 세포를 추가 36-48시간 성장시킨 후, 면역형광 또는 FACS를 사용하여 검정하였다.
실시예 IX
다중 서열 정렬 및 가장자리 필터
MUSCLE의 PFAM 데이터베이스 (PF13395, 798개 서열)에서 Cas9 서열들을 재-정렬하는 것에 의해 다수의 서열 정렬들을 구성하고, MATLAB 스크립트(script)를 사용하여 다양성 및 전체-길이 서열에 대해 정렬을 조정하였다. 하기에서 더 상세하게 기술되는 이와 같은 방법은 217개 서열을 산출하였다.
PFAM 데이터베이스 (PF13395, 798개 서열)에서 Cas9 서열의 최종 재-정렬에 도달하기 위하여, 하기의 단계들 (MATLAB의 모든 프로그램 코드)을 수행하였다. 문헌 [Fonfara I, et al, (2014) Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems, Nucleic Acids Res. 42, 2577-90]으로부터의 정렬을 입수하여, 군 IIA 및 IIC로부터의 서열만을, 그리고 49개의 총 서열을 포함하는 IIA와 IIC를 분리하는 분지 (도 2에 적색 박스로 표시)까지만 후자로부터 포함시켰다.
다음에, 대략 위치 150에 대형 삽입물이 있는 것과 없는 것 (이는 예를 들면 한편으로는 NM-Cas9와 ST-Cas9 사이를, 다른 한편으로는 SP-Cas9와 TD-Cas9 사이를 구별함)의 2개의 군으로 서열들을 분할하였다. MUSCLE (문헌 [Edgar, RC (2004) MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Res 32, 1792-97] 참조)을 사용하여 이들 군을 별도로 정렬하고, 윈도우화된 접근법(windowed approach) (서열의 길이 때문임)을 사용하여 재-정렬한 다음, 다시 하나의 시드(seed) 정렬에 프로파일-프로파일 정렬하였다.
MUSCLE을 사용하고 시드 정렬을 사용하여, PF13395의 서열을 정렬하였다. 시드를 사용하는 모든 정렬은 각 표적 서열을 하나씩 시드에 대하여 정렬하는 것에 의해 수행하였다. 이와 같은 정렬은 탑-히트 동일성(top-hit identity)이 감소하는 대로 재-순서화되는 시드와 표적 서열 사이의 탑-히트 동일성을 확인하는 데에 사용되었다. 다음에, 이번에는 동일성이 감소하는 순서로 표적 서열을 다시 하나씩 시드에 대하여 정렬하였다. 이와 같은 2-단계 접근법은 정렬의 강력성을 보장하기 위하여 선택되었다. 이들 서열 역시 그것이 삽입물을 포함하는지 여부에 따라 분할하고, 프로파일로서 시드를 사용하여 2개의 별도 군을 재-정렬하였다. 짧은 서열 및 대형 말단절단이 있는 서열을 수동으로 제거하였다. 90 %를 초과하는 쌍별 유사성을 가지는 서열들을 제거하였다.
생성되는 2개 정렬을 서로 프로파일-프로파일 정렬하였는데, 이는 217개의 총 서열로 이어졌다. 생성 정렬들을 해당 Cas9 오르토로그의 위치까지 말단절단하였다.
에스케리키아 콜라이 O157의 모든 유전자에 걸쳐 평균된 아미노산의 바탕 빈도에 대한 상대적 엔트로피로서 서열 보존성을 계산하였다. 도메인 경계 검출은 가우스 (DoG) 가장자리 필터 (그 전체가 참조로 포함되는 문헌 [Marr, D. & Hildreth, E. Theory of edge detection. Proceedings of the Royal Society of London. Series B, Containing papers of a Biological character. Royal Society 207, 187-217 (1980)] 참조)의 차이를 생성되는 보존성 프로파일에 적용하는 것, 다수의 길이 규모에 걸쳐 평균함으로써 파라미터의 선택 및 다양한 길이 규모에서의 검출에 대한 강력성을 달성하는 것에 의해 수행하였다.
구체적으로, 정렬의 보존성은 에스케리키아 콜라이 O157의 모든 유전자에 대한 평균 빈도에 대한 아미노산 빈도의 상대적 엔트로피 (문헌 [Cover, TM and Thomas, JT (2006) Elements of Information Theory; 2nd edition, Wiley-Interscience] 참조)인 것으로 계산하였다:
(식 중, 는 위치 i에서의 아미노산 a의 빈도이며, 는 아미노산 a의 평균 빈도임). 합계는 전체 20개 아미노산에 걸친 것이다. log는 2를 바탕으로 하며, 엔트로피는 비트(bit)로 제시된다. 평균 빈도 는 하기와 같다:
Cas9 정렬은 NM-Cas9의 위치로 말단절단 후 도 3의 보존성 프로파일을 산출하였다.
보존성 프로파일을 SP-Cas9 (유형 IIA 하위계열에 속하는 더 큰 Cas9-단백질의 예임)의 위치로 말단절단하여 플로팅하였다. 대략 위치 NM145 (SP170)까지, 그리고 다음에 다시 상기한 대형 삽입물인 위치 NM200 (SP400) 후에, N-말단에서 유사한 특징들이 관찰되었다. 도 4를 참조하라.
다중-규모 가장자리 필터를 보존성 프로파일에 적용하는 것에 의해, 잠재적 도메인 경계들을 확인하였다. 이와 같은 필터는 일련의 규모에 걸쳐 가우스 (DoG) (그 전체가 참조로 포함되는 문헌 [Marr, D and Hildreth, E (1980) Theory of Edge Detection, Proc R Soc Lond B Biol Sci 207, 187-217] 참조)의 차이를 계산하고, 생성되는 그래프를 합계한다. 이와 같은 곡선의 극값은 단백질의 낮고 높게 보존되는 영역 사이의 경계로 해석된다. 도메인들은 진화 분기의 분화 속도로 이어지는 그의 잠재적으로 상이한 기능상의 중요성으로 인한 서로 다른 보존성 수준을 나타낼 수 있다. 분화 보존성은 진화 시간규모에 걸친 도메인 삽입의 결과인 다중-도메인 단백질의 특징일 수 있다. 극값의 값들은 중요성 면에서 경계들을 순위화하는 데에 사용된다.
NM 위치로 제한되는 Cas9 정렬을 위하여, 본원에서 기술되는 방법을 사용하여, 하기의 경계 또는 보존성 가장자리 또는 가장자리 아미노산들을 확인하였다:
순위 위치 극값의 Abs Val
1 736 0.0225
2 620 0.0148
3 554 0.0148
4 472 0.0144
5 288 0.0136
6 144 0.0131
7 87 0.0106
8 661 0.0101
9 825 0.0100
10 205 0.0099
11 512 0.0092
12 414 0.0092
13 108 0.0092
14 853 0.0067
15 438 0.0050
16 936 0.0041
17 1011 0.0038
실시예 X
컴퓨터에 의한 Cas9 계열 구성원의 분석
결실에 적합할 수 있는 다중-도메인 Cas9 단백질 내의 영역을 확인하기 위하여, 생물정보학 접근법을 사용하여 도메인들 사이의 잠재적인 경계들을 확인하였다. 잘-관리되는 시드 정렬을 사용하여 PFAM (PF13395)으로부터의 전체-길이 Cas9 서열들을 정렬하고, 상기한 바와 같이 고도의 쌍별 동일성을 가지는 서열들을 제거하였다. 에스케리키아 콜라이 (Escherichia coli)의 모든 유전자에 걸친 평균 빈도에 대한 관찰된 아미노산 빈도의 상대적 엔트로피 (문헌 [Cover, T.M., Thomas, J.T. Elements of Information Theory, 2nd edition. (Wiley-Interscience, 2006)] 참조)로서 일차 서열 보존성을 계산하였다. 다중-도메인 단백질의 도메인은 가변적인 서열 보존성 수준을 나타낼 것으로 예측될 수 있기 때문에, 보존성 프로파일에 다중-규모 가장자리 필터를 적용하는 것이 도메인 경계들의 위치를 확인하는 데에 사용될 수 있다.
좁은 공간적 빈도 범위에 민감한 가우스 (DoG) 밴드-패스 필터의 차이를 사용하여 보존성 프로파일에서의 가장자리 검출을 수행하였다. 문헌 [Marr, D. & Hildreth, E. Theory of edge detection. Proceedings of the Royal Society of London. Series B, Containing papers of a Biological character. Royal Society 207, 187-217 (1980)]을 참조하라. 다양한 길이 규모에서의 검출을 가능케 하기 위하여, 그리고 필터를 특정 파라미터 선택에 대하여 민감하지 않게 되도록 하기 위하여, 다중 규모 (5-50개 아미노산)에 걸친 평균화를 수행하였다. 다음에, 밴드-패스 필터를 Cas9 정렬을 위하여 보존성 프로파일에 적용하였다. NM-Cas9의 확인된 잠재적 경계 위치를 도 5A에 나타내었는데, 상위 6개 순위의 경계들은 굵고 더 긴 적색 선으로 나타내었다. 볼 수 있는 바와 같이, 필터는 이전에 위치 500의 상류에서 시작하여 위치 750의 범위까지 각각이 전체적으로 참조로써 개재되는 문헌 [Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282, doi:10.1093/nar/gkr606 (2011)] 및 [Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids research 42, 2577-2590, doi:10.1093/nar/gkt1074 (2014)]에서 할당된 바 있는 알려져 있는 HNH 및 RuvC 도메인 정렬을 올바르게 확인하였다 (도 5B 참조). 위치 560 및 620 부근의 도메인들 사이 경계 역시 올바르게 예측되었다. 위치 88에서의 제1 아르기닌-풍부 알파-나선의 경계 역시 예측되었다. 위치 144에서의 단백질 N-말단측의 상위-순위 경계들 중 하나는 이전에 문헌 [Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids research 42, 2577-2590, doi:10.1093/nar/gkt1074 (2014)]에서는 도메인 경계로 확인되지 않았었으나, 이제는 보존되는 제2의 아르기닌-풍부 나선을 포함하는 Arg-풍부 알파-나선 영역에 대한 더 우수한 묘사를 나타낸다.
실시예 XI
Cas9의 말단절단 및 결실 분석
실험에 의해 Cas9 내의 기능성 및 잠재적 비-기능성 도메인을 탐색하기 위하여, 본원에서 기술되는 도메인 검출 분석을 바탕으로 하는 일련의 소정 내부 결실과 함께, N 및 C-말단 말단절단을 생성시켰다. 기능성인 뉴클레아제-무효 Cas9 단백질이 YFP 리포터의 5' 말단에 결합함으로써 그의 발현 수준을 낮추게 되는 에스케리키아 콜라이에서의 전사 억제인자 검정을 사용하여 결실의 효과를 분석하였다 (도 6A 참조). 각각 그 전체가 참조로 포함되는 문헌 [Qi, L.S. et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression. Cell 152, 1173-1183, doi:10.1016/j.cell.2013.02.022 (2013)]; [Esvelt, K.M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nature methods 10, 1116-1121, doi:10.1038/nmeth.2681 (2013)] 및 [Bikard, D. et al. Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system. Nucleic acids research 41, 7429-7437, doi:10.1093/nar/gkt520 (2013)]을 참조하라. N- 또는 C-말단 말단절단들 중 어느 것도 리포터를 억제할 수 없었던 반면, NMΔ566-620 결실과 함께, 위치 288에서의 경계 하류 및 상류인 2종의 내부 결실 NMΔ255-289 및 NMΔ330-389는 야생에 가까운 억제 수준을 나타내었다 (도 6B 및 도 7). 결실을 반복적으로 확장하면서 리포터를 억제하는 능력을 분석하는 수차례의 추가적인 분석 (도 6B)을 수행하였다. 무시할만한 NM 활성 손실로 제거될 수 있는 2개의 대형 비-중복 영역 254-449 및 567-654 (각각 단백질 총 길이의 18 % 및 8 %를 포함함)을 확인하였다 (도 6C). 정렬에서 볼 수 있는 바와 같이, NM 위치 254-449는 Cas9 단백질에 고유한 단백질 영역의 상대적으로 낮은 보존성의 연장체를 나타낸다. 위치 567 내지 654는 Cas9 DNA 촉매촉진에 중요한 것으로 알려져 있으나 DNA 결합에는 필요 없는 것으로 밝혀져 있는 도메인인 HNH 도메인을 나타낸다.
NM-Cas9로부터 제거되는 영역들이 NM 고유의 것이 아니라 다른 Cas9 계열 구성원으로부터 제거될 수 있는 일반적인 영역을 나타낸다는 것을 확실히 하기 위하여, 스트렙토코쿠스 서모필루스 Cas9 (ST1) 및 트레포네마 덴티콜라(Treponema denticola ) Cas9 (TD, GI:42525843)의 뉴클레아제 무효-변이 내에서 상응하는 결실을 생성시키고, 전사 억제 검정에서의 그의 기능을 측정하였다 (도 8A 및 도 9). ST1 및 TD 모두의 상응하는 결실 돌연변이들이 그의 야생형 상대물과 유사한 활성을 나타냄으로써, 제거된 영역이 Cas9 계통발생 전체에 걸쳐, 심지어는 TD와 같이 유형 II-A 하위계열 내에서 더 먼 구성원 간에도 Cas9 DNA 결합에는 필요 없다는 것을 암시하였다.
전사 활성화인자 검정을 사용하여, ST1-Cas9 내에서 본원에서 기술되는 2종의 최대 기능성 결실의 활성을 시험하였다 (도 8B). 이 . 콜라이에서의 분석과 마찬가지로, VP64 활성화 도메인에 융합되어 인간 세포에서 형광 리포터에 대하여 표적화되었을 때, ST1 결실 돌연변이들 모두가 야생형 단백질과 유사한 활성을 유지하였다 (도 8C-8D). 2종의 결실 돌연변이 중 더 큰 것인 Δ255-450 (ST1 번호 기준)은 크기가 2,793개 염기쌍인 Cas9 유전자를 생성시켰다.
실시예 XII
Cas9 도메인 교환
Cas9 N- 및 C-말단 도메인은 crRNA:tracrRNA 결합 및/또는 PAM 선택성에 중요한 역할을 할 수 있다. 활성을 분석하기 위하여, ST1으로부터의 상동성 영역을 사용하여 NM의 N 및/또는 C 말단을 대체하는 NM과 ST1 사이의 일련의 도메인 교환 돌연변이들을 생성시켰다. 다음에, 가이드RNA 및/또는 리포터 내 Cas9 특이적 PAM을 변경하는 본원에서 기술되는 전사 리포터 검정을 사용하여 키메라 단백질을 시험함으로써, 단백질 특이성에 대한 도메인 교환의 영향을 확인하였다 (도 10A). 도메인 경계 분석을 바탕으로 도메인 스왑의 정확한 위치를 확인하였는데: 확인된 가장 중요한 N- 및 C-말단 경계에 가능한 한 가까우며 (도 5A) 동시에 정렬 내에서 거의 전체적으로 보존된 (도 10B) 위치들을 선택하였다. NM과 ST1 사이의 N-말단 도메인 스왑 중 어느 것도 신규한 특성을 가지는 NM을 제공하지 않음으로써, ST1 N-말단이 모듈형이 아니며, 그 대신 전달되지 않은 다른 ST1의 영역과 함께 기능한다는 것을 암시하였다 (도 10C-10F). C-말단 교환은 ST1 crRNA:tracrRNA 복합체와 상호작용을 할 수 있으며 또한 ST1 특이적 PAM을 가지는 리포터를 억제할 수 있는 NM-ST1 혼성체를 생성시켰다 (도 10E). 이와 같은 결과는 도 11(A)-11(D)에 나타낸 바와 같이 추가적인 ST1 특이적 리포터를 사용하여 추가적으로 확인되었다.
SEQUENCE LISTING
<110> The President and Fellows of Harvard College
<120> MUTANT CAS9 PROTEINS
<130> 010498_00553
<140> PCT/US2014/066375
<141> 2014-11-19
<150> 61/906,374
<151> 2013-11-19
<160> 3
<170> PatentIn version 3.5
<210> 1
<211> 2679
<212> DNA
<213> Neisseria meningitidis
<400> 1
atggccgcct tcaagcccaa ccccatcaac tacatcctgg gcctggccat cggcatcgcc 60
agcgtgggct gggccatggt ggagatcgac gaggacgaga accccatctg cctgatcgac 120
ctgggtgtgc gcgtgttcga gcgcgctgag gtgcccaaga ctggtgacag tctggctatg 180
gctcgccggc ttgctcgctc tgttcggcgc cttactcgcc ggcgcgctca ccgccttctg 240
cgcgctcgcc gcctgctgaa gcgcgagggt gtgctgcagg ctgccgactt cgacgagaac 300
ggcctgatca agagcctgcc caacactcct tggcagctgc gcgctgccgc tctggaccgc 360
aagctgactc ctctggagtg gagcgccgtg ctgctgcacc tgatcaagca ccgcggctac 420
ctgagccagc gcaagaacga gggcgagacc gccgacaagg agctgggtgc tctgctgaag 480
ggcgtggccg acaacgccca cgccctgcag actggtgact tccgcactcc tgctgagctg 540
gccctgaaca agttcgagaa ggagagcggc cacatccgca accagcgcgg cgactacagc 600
cacaccttca gccgcaagga cctgcaggcc gagctgatcc tgctgttcga gaagcagaag 660
gagttcggca acccccacgt gagcggcggc ctgaaggagg gcatcgagac cctgctgatg 720
acccagcgcc ccgccctgag cggcgacgcc gtgcagaaga tgtccggcgg cggttcgggc 780
gaccactacg gcaagaagaa caccgaggag aagatctacc tgcctcctat ccccgccgac 840
gagatccgca accccgtggt gctgcgcgcc ctgagccagg cccgcaaggt gatcaacggc 900
gtggtgcgcc gctacggcag ccccgcccgc atccacatcg agaccgcccg cgaggtgggc 960
aagagcttca aggaccgcaa ggagatcgag aagcgccagg aggagaaccg caaggaccgc 1020
gagaaggccg ccgccaagtt ccgcgagtac ttccccaact tcgtgggcga gcccaagagc 1080
aaggacatcc tgaagctgcg cctgtacgag cagcagcacg gcaagtgcct gtacagcggc 1140
aaggagatca acctgggccg cctgaacgag aagggctacg tggagatcgc cgctgccctg 1200
cccttcagcc gcacctggga cgacagcttc aacaacaagg tgctggtgct gggcagcgag 1260
gctcagaaca agggcaacca gaccccctac gagtacttca acggcaagga caacagccgc 1320
gagtggcagg agttcaaggc ccgcgtggag accagccgct tcccccgcag caagaagcag 1380
cgcatcctgc tgcagaagtt cgacgaggac ggcttcaagg agcgcaacct gaacgacacc 1440
cgctacgtga accgcttcct gtgccagttc gtggccgacc gcatgcgcct gaccggcaag 1500
ggcaagaagc gcgtgttcgc cagcaacggc cagatcacca acctgctgcg cggcttctgg 1560
ggcctgcgca aggtgcgcgc cgagaacgac cgccaccacg ccctggacgc cgtggtggtg 1620
gcctgcagca ccgtggccat gcagcagaag atcacccgct tcgtgcgcta caaggagatg 1680
aacgccttcg acggtaaaac catcgacaag gagaccggcg aggtgctgca ccagaagacc 1740
cacttccccc agccctggga gttcttcgcc caggaggtga tgatccgcgt gttcggcaag 1800
cccgacggca agcccgagtt cgaggaggcc gacacccccg agaagctgcg caccctgctg 1860
gccgagaagc tgagcagccg ccctgaggcc gtgcacgagt acgtgactcc tctgttcgtg 1920
agccgcgccc ccaaccgcaa gatgagcggt cagggtcaca tggagaccgt gaagagcgcc 1980
aagcgcctgg acgagggcgt gagcgtgctg cgcgtgcccc tgacccagct gaagctgaag 2040
gacctggaga agatggtgaa ccgcgagcgc gagcccaagc tgtacgaggc cctgaaggcc 2100
cgcctggagg cccacaagga cgaccccgcc aaggccttcg ccgagccctt ctacaagtac 2160
gacaaggccg gcaaccgcac ccagcaggtg aaggccgtgc gcgtggagca ggtgcagaag 2220
accggcgtgt gggtgcgcaa ccacaacggc atcgccgaca acgccaccat ggtgcgcgtg 2280
gacgtgttcg agaagggcga caagtactac ctggtgccca tctacagctg gcaggtggcc 2340
aagggcatcc tgcccgaccg cgccgtggtg cagggcaagg acgaggagga ctggcagctg 2400
atcgacgaca gcttcaactt caagttcagc ctgcacccca acgacctggt ggaggtgatc 2460
accaagaagg cccgcatgtt cggctacttc gccagctgcc accgcggcac cggcaacatc 2520
aacatccgca tccacgacct ggaccacaag atcggcaaga acggcatcct ggagggcatc 2580
ggcgtgaaga ccgccctgag cttccagaag taccagatcg acgagctggg caaggagatc 2640
cgcccctgcc gcctgaagaa gcgccctcct gtgcgctaa 2679
<210> 2
<211> 3000
<212> DNA
<213> Neisseria meningitidis
<400> 2
atggccgcct tcaagcccaa ccccatcaac tacatcctgg gcctggccat cggcatcgcc 60
agcgtgggct gggccatggt ggagatcgac gaggacgaga accccatctg cctgatcgac 120
ctgggtgtgc gcgtgttcga gcgcgctgag gtgcccaaga ctggtgacag tctggctatg 180
gctcgccggc ttgctcgctc tgttcggcgc cttactcgcc ggcgcgctca ccgccttctg 240
cgcgctcgcc gcctgctgaa gcgcgagggt gtgctgcagg ctgccgactt cgacgagaac 300
ggcctgatca agagcctgcc caacactcct tggcagctgc gcgctgccgc tctggaccgc 360
aagctgactc ctctggagtg gagcgccgtg ctgctgcacc tgatcaagca ccgcggctac 420
ctgagccagc gcaagaacga gggcgagacc gccgacaagg agctgggtgc tctgctgaag 480
ggcgtggccg acaacgccca cgccctgcag actggtgact tccgcactcc tgctgagctg 540
gccctgaaca agttcgagaa ggagagcggc cacatccgca accagcgcgg cgactacagc 600
cacaccttca gccgcaagga cctgcaggcc gagctgatcc tgctgttcga gaagcagaag 660
gagttcggca acccccacgt gagcggcggc ctgaaggagg gcatcgagac cctgctgatg 720
acccagcgcc ccgccctgag cggcgacgcc gtgcagaaga tgctgggcca ctgcaccttc 780
gagccagccg agcccaaggc cgccaagaac acctacaccg ccgagcgctt catctggctg 840
accaagctga acaacctgcg catcctggag cagggcagcg agcgccccct gaccgacacc 900
gagcgcgcca ccctgatgga cgagccctac cgcaagagca agctgaccta cgcccaggcc 960
cgcaagctgc tgggtctgga ggacaccgcc ttcttcaagg gcctgcgcta cggcaaggac 1020
aacgccgagg ccagcaccct gatggagatg aaggcctacc acgccatcag ccgcgccctg 1080
gagaaggagg gcctgaagga caagaagagt cctctgaacc tgagccccga gctgcaggac 1140
gagatcggca ccgccttcag cctgttcaag accgacgagg acatcaccgg ccgcctgaag 1200
gaccgcatcc agcccgagat cctggaggcc ctgctgaagc acatcagctt cgacaagttc 1260
gtgcagatca gcctgaaggc cctgcgccgc atcgtgcccc tgatggagca gggcaagcgc 1320
tacgacgagg cctgcgccga gatctacggc gaccactacg gcaagaagaa caccgaggag 1380
aagatctacc tgcctcctat ccccgccgac gagatccgca accccgtggt gctgcgcgcc 1440
ctgagccagg cccgcaaggt gatcaacggc gtggtgcgcc gctacggcag ccccgcccgc 1500
atccacatcg agaccgcccg cgaggtgggc aagagcttca aggaccgcaa ggagatcgag 1560
aagcgccagg aggagaaccg caaggaccgc gagaaggccg ccgccaagtt ccgcgagtac 1620
ttccccaact tcgtgggcga gcccaagagc aaggacatcc tgaagctgcg cctgtacgag 1680
cagcagcacg gcaagtgctc cggcggcggt tcgcagaagt tcgacgagga cggcttcaag 1740
gagcgcaacc tgaacgacac ccgctacgtg aaccgcttcc tgtgccagtt cgtggccgac 1800
cgcatgcgcc tgaccggcaa gggcaagaag cgcgtgttcg ccagcaacgg ccagatcacc 1860
aacctgctgc gcggcttctg gggcctgcgc aaggtgcgcg ccgagaacga ccgccaccac 1920
gccctggacg ccgtggtggt ggcctgcagc accgtggcca tgcagcagaa gatcacccgc 1980
ttcgtgcgct acaaggagat gaacgccttc gacggtaaaa ccatcgacaa ggagaccggc 2040
gaggtgctgc accagaagac ccacttcccc cagccctggg agttcttcgc ccaggaggtg 2100
atgatccgcg tgttcggcaa gcccgacggc aagcccgagt tcgaggaggc cgacaccccc 2160
gagaagctgc gcaccctgct ggccgagaag ctgagcagcc gccctgaggc cgtgcacgag 2220
tacgtgactc ctctgttcgt gagccgcgcc cccaaccgca agatgagcgg tcagggtcac 2280
atggagaccg tgaagagcgc caagcgcctg gacgagggcg tgagcgtgct gcgcgtgccc 2340
ctgacccagc tgaagctgaa ggacctggag aagatggtga accgcgagcg cgagcccaag 2400
ctgtacgagg ccctgaaggc ccgcctggag gcccacaagg acgaccccgc caaggccttc 2460
gccgagccct tctacaagta cgacaaggcc ggcaaccgca cccagcaggt gaaggccgtg 2520
cgcgtggagc aggtgcagaa gaccggcgtg tgggtgcgca accacaacgg catcgccgac 2580
aacgccacca tggtgcgcgt ggacgtgttc gagaagggcg acaagtacta cctggtgccc 2640
atctacagct ggcaggtggc caagggcatc ctgcccgacc gcgccgtggt gcagggcaag 2700
gacgaggagg actggcagct gatcgacgac agcttcaact tcaagttcag cctgcacccc 2760
aacgacctgg tggaggtgat caccaagaag gcccgcatgt tcggctactt cgccagctgc 2820
caccgcggca ccggcaacat caacatccgc atccacgacc tggaccacaa gatcggcaag 2880
aacggcatcc tggagggcat cggcgtgaag accgccctga gcttccagaa gtaccagatc 2940
gacgagctgg gcaaggagat ccgcccctgc cgcctgaaga agcgccctcc tgtgcgctaa 3000
<210> 3
<211> 5064
<212> DNA
<213> Neisseria meningitidis
<400> 3
agctctcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat 60
gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc 120
gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac 180
acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg 240
caagcaggca tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag 300
cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc 360
gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc 420
gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga 480
tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa 540
tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc 600
cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga 660
caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc 720
atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc 780
ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc ctcatcctgt 840
ctcttgatca gatcttgatc ccctgcgcca tcagatcctt ggcggcaaga aagccatcca 900
gtttactttg cagggcttcc caaccttacc agagggcgcc ccagctggca attccgacgt 960
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 1020
tcgtcttcac ctcgagggga caatgaaaac gttagtcatg gcgcgccttg acggctagct 1080
cagtcctagg tacagtgcta gcttaatgct cgcacatagc agaactttaa aagtattcgc 1140
catgttgtag ctccctttct catttcgcag tgctacaatc cgccgctatg gtcccacgta 1200
gagcatacgg aaaaaaaagt caaaagcctc cgaccggagg tcggccttac ttgctagcag 1260
agtttgtaga aacgcaaaaa ggccatccgt caggatggcc ttctgcttaa tttgatgcct 1320
ggcagtttat ggcgggcgtc ctgcccgcca ccctccgggc cgttgcttcg caacgttcaa 1380
atccgctccc ggcggatttg tcctactcag gagagcgttc accgacaaac aacagataaa 1440
acgaaaggcc cagtctttcg actgagcctt tcgttttatt tgatgcctgg cagttcccta 1500
ctctcgcatg gggagacccc acactaccat cggcgctacg gcgtttcact tctgagttcg 1560
gcatggggtc aggtgggacc accgcgctac tgccgccagg caaattctgt tttatcagac 1620
cgcttctgcg ttctgattta atctgtatca ggctgaaaat cttctctcat ccgccaaaac 1680
agccccgtag aaaaagggac gttgatcggc acgtaagagg ttccacgata aatatctaac 1740
accgtgcgtg ttgactattt tacctctggc ggtgataatg gttgcatgta ctagaattct 1800
ttaactttaa gaaggagata tacatatgaa tcccctatgg cgaatacttt taaagtctcg 1860
taaaggagaa gaacttttca ctggagttgt cccaattctt gttgaattag atggtgatgt 1920
taatgggcac aaattttctg tcagtggaga gggtgaaggt gatgcaacat acggaaaact 1980
tacccttaaa tttatttgca ctactggaaa actacctgtt ccatggccaa cacttgtcac 2040
tactttcggt tatggtctaa aatgctttgc tagataccca gatcatatga aacggcatga 2100
ctttttcaag agtgccatgc ccgaaggtta tgtacaggaa agaactatat ttttcaaaga 2160
tgacgggaac tacaagacac gtgctgaagt caagtttgaa ggtgataccc ttgttaatag 2220
aatcgagtta aaaggtattg attttaaaga agatggaaac attcttggac acaaattgga 2280
atacaactat aactcacaca atgtatacat catggcagac aaacaaaaga atggaatcaa 2340
agttaacttc aaaattagac acaacattga agatggaagc gttcaactag cagaccatta 2400
tcaacaaaat actccaattg gcgatggccc tgtcctttta ccagacaacc attacctgtc 2460
ctatcaatct gccctttcga aagatcccaa cgaaaagaga gaccacatgg tccttcttga 2520
gtttgtaaca gctgctggga ttacacatgg catggatgaa ctatacaaat aagcttaacc 2580
gaagcgtttg atagttgata tcctttgcct gcggccgcaa ctagaggcat caaataaaac 2640
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 2700
tcctgagtag gacaaatccg ccgccctaga cctagggtac gggttttgct gcccgcaaac 2760
gggctgttct ggtgttgcta gtttgttatc agaatcgcag atccggcttc aggtttgccg 2820
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 2880
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 2940
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 3000
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 3060
cgatctgttc atggtgaaca gctttaaatg caccaaaaac tcgtaaaagc tctgatgtat 3120
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatctaac 3180
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 3240
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 3300
ttttgcgtga gccatgagaa cgaaccattg agatcatgct tactttgcat gtcactcaaa 3360
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 3420
cttagtccgt tacgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 3480
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 3540
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 3600
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 3660
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 3720
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 3780
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 3840
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 3900
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3960
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 4020
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 4080
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 4140
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 4200
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 4260
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 4320
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 4380
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 4440
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 4500
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 4560
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 4620
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 4680
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 4740
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 4800
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 4860
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 4920
tatcatcaac aggcttaccc gtcttactgt ccctagtgct tggattctca ccaataaaaa 4980
acgcccggcg gcaaccgagc gttctgaaca aatccagatg gagttctgag gtcattactg 5040
gatctatcaa caggagtcca agcg 5064
Claims (22)
- DNA 결합 단백질의 계열 내에서 각각 저보존성 또는 고보존성 중 어느 하나인 2개의 측접 아미노산 서열이 측접하는 고보존성 또는 저보존성 중 어느 하나인 제1 아미노산 서열을 확인하고,
상기 제1 아미노산 서열의 핵산 서열을 확인하고,
제1 아미노산 서열의 핵산 서열이 결여되어 있는 표적 DNA 결합 단백질의 핵산 서열을 생성시키고,
생성된 핵산 서열로부터 돌연변이 DNA 결합 단백질을 생성시키는 것
을 포함하는, 돌연변이 DNA 결합 단백질의 제조 방법. - 제1항에 있어서, 표적 DNA 결합 단백질이 뉴클레아제 활성을 갖는 것인 방법.
- 제1항에 있어서, 표적 DNA 결합 단백질이 니카제인 방법.
- 제1항에 있어서, 표적 DNA 결합 단백질이 뉴클레아제 무효(null)인 방법.
- 제1항에 있어서, 제1 아미노산 서열의 핵산 서열이 표적 DNA 결합 단백질의 핵산 서열로부터 결실되는 것인 방법.
- 제1항에 있어서, 제1 아미노산 서열의 핵산 서열이 표적 DNA 결합 단백질의 핵산 서열로부터 결실되고, 링커로 대체되는 것인 방법.
- 제1항에 있어서, 제1 아미노산 서열의 핵산 서열이 표적 DNA 결합 단백질의 핵산 서열로부터 결실되고, SGGGS 링커로 대체되는 것인 방법.
- 제1항에 있어서, DNA 결합 단백질이 Cas9 단백질인 방법.
- 제1항에 있어서, 제1 아미노산 서열이 제1 아미노산 서열을 측접 아미노산 서열들로부터 구별하는 한 쌍의 가장자리 아미노산 서열을 포함하는 것인 방법.
- 서열 1인 돌연변이 Cas9 단백질.
- 서열 2인 돌연변이 Cas9 단백질.
- 고도로 보존성이 아니거나 낮은 보존성을 가지는 Cas9 단백질 계열 내의 하나 이상 아미노산 서열을 확인하고,
상기 하나 이상의 확인된 아미노산 서열의 핵산 서열을 확인하고,
상기 하나 이상의 확인된 아미노산 서열의 핵산 서열이 결여되어 있는 표적 Cas9 단백질의 핵산 서열을 생성시키고
생성된 핵산 서열로부터 돌연변이 Cas9 단백질을 생성시키는 것
을 포함하는, 돌연변이 Cas9 단백질의 제조 방법. - 제12항에 있어서, 표적 Cas9 단백질이 뉴클레아제 활성을 갖는 것인 방법.
- 제12항에 있어서, 표적 Cas9 단백질이 니카제인 방법.
- 제12항에 있어서, 표적 Cas9 단백질이 뉴클레아제 무효인 방법.
- 제12항에 있어서, 하나 이상의 확인된 아미노산 서열의 핵산 서열이 표적 Cas9 단백질의 핵산 서열로부터 결실되는 것인 방법.
- 제12항에 있어서, 하나 이상의 확인된 아미노산 서열의 핵산 서열이 표적 Cas9 단백질의 핵산 서열로부터 결실되고, 링커로 대체되는 것인 방법.
- 제12항에 있어서, 하나 이상의 확인된 아미노산 서열의 핵산 서열이 표적 Cas9 단백질의 핵산 서열로부터 결실되고, SGGGS 링커로 대체되는 것인 방법.
- 제1 Cas9 단백질 종으로부터의 C 말단 도메인을 제2 Cas9 단백질 종으로부터의 C 말단 도메인으로 대체하는 것
을 포함하는, 돌연변이 Cas9 단백질의 제조 방법. - 제19항에 있어서, 제1 Cas9 단백질 종이 NM-Cas9이며, 제2 Cas9 단백질 종이 ST1-Cas9인 방법.
- 제1 Cas9 단백질 종으로부터의 N 말단 도메인을 제2 Cas9 단백질 종으로부터의 N 말단 도메인으로 대체하는 것
을 포함하는, 키메라 Cas9 단백질의 제조 방법. - 제21항에 있어서, 제1 Cas9 단백질 종이 NM-Cas9이며, 제2 Cas9 단백질 종이 ST1-Cas9인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361906374P | 2013-11-19 | 2013-11-19 | |
US61/906,374 | 2013-11-19 | ||
PCT/US2014/066375 WO2015077318A1 (en) | 2013-11-19 | 2014-11-19 | Mutant cas9 proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160079119A true KR20160079119A (ko) | 2016-07-05 |
KR102212295B1 KR102212295B1 (ko) | 2021-02-03 |
Family
ID=53180093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167015908A KR102212295B1 (ko) | 2013-11-19 | 2014-11-19 | 돌연변이 cas9 단백질 |
Country Status (8)
Country | Link |
---|---|
US (5) | US9074199B1 (ko) |
EP (2) | EP3071694B1 (ko) |
JP (4) | JP6984096B2 (ko) |
KR (1) | KR102212295B1 (ko) |
AU (2) | AU2014353128B2 (ko) |
CA (2) | CA2930829C (ko) |
ES (1) | ES2774677T3 (ko) |
WO (1) | WO2015077318A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230022258A (ko) * | 2018-02-15 | 2023-02-14 | 시그마-알드리치 컴퍼니., 엘엘씨 | 진핵 게놈 변형을 위한 조작된 cas9 시스템 |
Families Citing this family (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
WO2014204578A1 (en) | 2013-06-21 | 2014-12-24 | The General Hospital Corporation | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
EP3467125B1 (en) | 2013-03-15 | 2023-08-30 | The General Hospital Corporation | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
EP3004339B1 (en) * | 2013-05-29 | 2021-07-07 | Cellectis | New compact scaffold of cas9 in the type ii crispr system |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9834791B2 (en) | 2013-11-07 | 2017-12-05 | Editas Medicine, Inc. | CRISPR-related methods and compositions with governing gRNAS |
US9074199B1 (en) * | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
CA3075047C (en) | 2014-02-11 | 2022-02-01 | The Regents Of The University Of Colorado, A Body Corporate | Crispr enable method for multiplex genome editing |
WO2015134812A1 (en) | 2014-03-05 | 2015-09-11 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US9938521B2 (en) | 2014-03-10 | 2018-04-10 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating leber's congenital amaurosis 10 (LCA10) |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
EP3981876A1 (en) | 2014-03-26 | 2022-04-13 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
CA2956224A1 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
CA2965509C (en) | 2014-10-24 | 2023-03-14 | Avectas Limited | Delivery across cell plasma membranes |
US11680268B2 (en) | 2014-11-07 | 2023-06-20 | Editas Medicine, Inc. | Methods for improving CRISPR/Cas-mediated genome-editing |
EP4400584A3 (en) | 2014-12-03 | 2024-10-16 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
KR20240038141A (ko) | 2015-04-06 | 2024-03-22 | 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 | Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna |
CN107690480B (zh) | 2015-04-24 | 2022-03-22 | 爱迪塔斯医药公司 | Cas9分子/指导rna分子复合物的评价 |
WO2016182959A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Optimized crispr/cas9 systems and methods for gene editing in stem cells |
EP3303634B1 (en) * | 2015-06-03 | 2023-08-30 | The Regents of The University of California | Cas9 variants and methods of use thereof |
CN108026526B (zh) | 2015-06-09 | 2023-05-12 | 爱迪塔斯医药公司 | 用于改善移植的crispr/cas相关方法和组合物 |
CA2990699A1 (en) | 2015-06-29 | 2017-01-05 | Ionis Pharmaceuticals, Inc. | Modified crispr rna and modified single crispr rna and uses thereof |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
EP3353296B1 (en) | 2015-09-24 | 2020-11-04 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
US10167457B2 (en) | 2015-10-23 | 2019-01-01 | President And Fellows Of Harvard College | Nucleobase editors and uses thereof |
JP2019500899A (ja) | 2015-11-23 | 2019-01-17 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | CRISPR/Cas9の核送達を通じた細胞RNAの追跡と操作 |
WO2017115128A2 (en) | 2015-12-30 | 2017-07-06 | Avectas Limited | Vector-free delivery of gene editing proteins and compositions to cells and tissues |
CN108473986A (zh) * | 2016-01-08 | 2018-08-31 | 诺维信公司 | 芽孢杆菌宿主细胞的基因组编辑 |
US11512311B2 (en) | 2016-03-25 | 2022-11-29 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency |
WO2017165826A1 (en) | 2016-03-25 | 2017-09-28 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
GB2565461B (en) * | 2016-03-31 | 2022-04-13 | Harvard College | Methods and compositions for the single tube preparation of sequencing libraries using Cas9 |
US11236313B2 (en) | 2016-04-13 | 2022-02-01 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
DK3474669T3 (da) | 2016-06-24 | 2022-06-27 | Univ Colorado Regents | Fremgangsmåde til generering af stregkodede kombinatoriske biblioteker |
BR112019001887A2 (pt) | 2016-08-02 | 2019-07-09 | Editas Medicine Inc | composições e métodos para o tratamento de doença associada a cep290 |
SG11201900907YA (en) | 2016-08-03 | 2019-02-27 | Harvard College | Adenosine nucleobase editors and uses thereof |
CN109804066A (zh) | 2016-08-09 | 2019-05-24 | 哈佛大学的校长及成员们 | 可编程cas9-重组酶融合蛋白及其用途 |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US20190225974A1 (en) | 2016-09-23 | 2019-07-25 | BASF Agricultural Solutions Seed US LLC | Targeted genome optimization in plants |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
WO2018074979A1 (en) * | 2016-10-17 | 2018-04-26 | Nanyang Technological University | Truncated crispr-cas proteins for dna targeting |
US11229662B2 (en) | 2016-11-15 | 2022-01-25 | The Schepens Eye Research Institute, Inc. | Compositions and methods for the treatment of aberrant angiogenesis |
US11981915B2 (en) | 2016-12-22 | 2024-05-14 | Avectas Limited | Vector-free intracellular delivery by reversible permeabilization |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
EP3565907B1 (en) | 2017-01-06 | 2022-05-04 | Editas Medicine, Inc. | Methods of assessing nuclease cleavage |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
WO2018165629A1 (en) | 2017-03-10 | 2018-09-13 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
WO2018170184A1 (en) | 2017-03-14 | 2018-09-20 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
US11268082B2 (en) | 2017-03-23 | 2022-03-08 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable DNA binding proteins |
US11499151B2 (en) | 2017-04-28 | 2022-11-15 | Editas Medicine, Inc. | Methods and systems for analyzing guide RNA molecules |
CN110869498A (zh) | 2017-05-10 | 2020-03-06 | 加利福尼亚大学董事会 | 经由核递送crispr/cas9导向编辑细胞rna |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
EP3635104A1 (en) | 2017-06-09 | 2020-04-15 | Editas Medicine, Inc. | Engineered cas9 nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
WO2019014564A1 (en) | 2017-07-14 | 2019-01-17 | Editas Medicine, Inc. | SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES |
EP3658573A1 (en) | 2017-07-28 | 2020-06-03 | President and Fellows of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace) |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
CA3073848A1 (en) | 2017-09-21 | 2019-03-28 | The Broad Institute, Inc. | Systems, methods, and compositions for targeted nucleic acid editing |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
EP3710008A4 (en) | 2017-11-14 | 2021-08-25 | The Schepens Eye Research Institute, Inc. | RUNX1 INHIBITION FOR THE TREATMENT OF PROLIFERATIVE VITREORETINOPATHY AND DISEASES ASSOCIATED WITH EPITHELIAL-MESENCHYMAL TRANSITION |
AU2019207409B2 (en) | 2018-01-12 | 2023-02-23 | Basf Se | Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a |
US20190233816A1 (en) | 2018-01-26 | 2019-08-01 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
SG11202008956XA (en) | 2018-03-14 | 2020-10-29 | Editas Medicine Inc | Systems and methods for the treatment of hemoglobinopathies |
US20210054353A1 (en) * | 2018-03-19 | 2021-02-25 | Crispr Therapeutics Ag | Novel rna-programmable endonuclease systems and uses thereof |
US20210261901A1 (en) | 2018-06-01 | 2021-08-26 | Avectas Limited | Cell engineering platform |
WO2020076976A1 (en) | 2018-10-10 | 2020-04-16 | Readcoor, Inc. | Three-dimensional spatial molecular indexing |
BR112021007672A2 (pt) * | 2018-10-24 | 2021-08-10 | Modalis Therapeutics Corporation | proteína cas9 modificada e uso da mesma |
BR112021018607A2 (pt) | 2019-03-19 | 2021-11-23 | Massachusetts Inst Technology | Métodos e composições para editar sequências de nucleotídeos |
CN110241099B (zh) * | 2019-06-05 | 2021-04-30 | 复旦大学 | 酿脓链球菌的CRISPR核酸酶SpCas9 的截短变异体及其应用 |
EP3983536A4 (en) * | 2019-06-14 | 2023-11-29 | Arbor Biotechnologies, Inc. | NOVEL CRISPR DNA TARGETING ENZYMES AND SYSTEMS |
US11060141B1 (en) | 2019-12-23 | 2021-07-13 | Stilla Technologies | Multiplex drop-off digital polymerase chain reaction methods |
US20210290757A1 (en) | 2020-03-23 | 2021-09-23 | Avectas Limited | Engineering of dendritic cells for generation of vaccines against sars-cov-2 |
JP2023525304A (ja) | 2020-05-08 | 2023-06-15 | ザ ブロード インスティテュート,インコーポレーテッド | 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物 |
CA3206787A1 (en) | 2021-02-01 | 2022-08-04 | Michael Maguire | Delivery platform |
WO2022225978A1 (en) | 2021-04-21 | 2022-10-27 | The Regents Of The University Of California | Use of a split dcas fusion protein system for epigenetic editing |
WO2023039586A1 (en) | 2021-09-10 | 2023-03-16 | Agilent Technologies, Inc. | Guide rnas with chemical modification for prime editing |
US20230183687A1 (en) * | 2021-10-13 | 2023-06-15 | University Of Massachusetts | Modified guide rnas for neisseria meningitidis cas9 |
IL312452A (en) | 2021-11-01 | 2024-06-01 | Tome Biosciences Inc | A transformant has a single structure for the simultaneous transfer of a gene editing mechanism and a nucleic acid cargo |
EP4452335A1 (en) | 2021-12-22 | 2024-10-30 | Tome Biosciences, Inc. | Co-delivery of a gene editor construct and a donor template |
WO2023205744A1 (en) | 2022-04-20 | 2023-10-26 | Tome Biosciences, Inc. | Programmable gene insertion compositions |
WO2023225670A2 (en) | 2022-05-20 | 2023-11-23 | Tome Biosciences, Inc. | Ex vivo programmable gene insertion |
WO2024020587A2 (en) | 2022-07-22 | 2024-01-25 | Tome Biosciences, Inc. | Pleiopluripotent stem cell programmable gene insertion |
WO2024138194A1 (en) | 2022-12-22 | 2024-06-27 | Tome Biosciences, Inc. | Platforms, compositions, and methods for in vivo programmable gene insertion |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100952754B1 (ko) * | 2007-09-28 | 2010-04-14 | 동아대학교 산학협력단 | 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 |
KR102116153B1 (ko) * | 2012-05-07 | 2020-05-27 | 상가모 테라퓨틱스, 인코포레이티드 | 도입유전자의 뉴클레아제-매개 표적화된 통합을 위한 방법 및 조성물 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1341907A2 (en) * | 2000-12-14 | 2003-09-10 | Genencor International, Inc. | Target enzymes |
ES2541693T3 (es) | 2007-03-02 | 2015-07-23 | Dupont Nutrition Biosciences Aps | Cultivos con resistencia mejorada a fagos |
US8546553B2 (en) | 2008-07-25 | 2013-10-01 | University Of Georgia Research Foundation, Inc. | Prokaryotic RNAi-like system and methods of use |
US20100076057A1 (en) | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
WO2010054108A2 (en) | 2008-11-06 | 2010-05-14 | University Of Georgia Research Foundation, Inc. | Cas6 polypeptides and methods of use |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
WO2011143124A2 (en) | 2010-05-10 | 2011-11-17 | The Regents Of The University Of California | Endoribonuclease compositions and methods of use thereof |
US9089520B2 (en) | 2010-05-21 | 2015-07-28 | Baylor College Of Medicine | Methods for inducing selective apoptosis |
US20140113376A1 (en) | 2011-06-01 | 2014-04-24 | Rotem Sorek | Compositions and methods for downregulating prokaryotic genes |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
RU2650811C2 (ru) | 2012-02-24 | 2018-04-17 | Фред Хатчинсон Кэнсер Рисерч Сентер | Композиции и способы лечения гемоглобинопатии |
US8841260B2 (en) | 2012-02-29 | 2014-09-23 | Sangamo Biosciences, Inc. | Methods and compositions for treating Huntington's Disease |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
HUE038850T2 (hu) | 2012-05-25 | 2018-11-28 | Univ California | Eljárások és kompozíciók cél-DNS RNS-irányított módosításához és transzkripció RNS-irányított modulálásához |
WO2014022702A2 (en) | 2012-08-03 | 2014-02-06 | The Regents Of The University Of California | Methods and compositions for controlling gene expression by rna processing |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
ES2786193T3 (es) | 2012-12-12 | 2020-10-09 | Broad Inst Inc | Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias |
CN105980575A (zh) * | 2013-03-14 | 2016-09-28 | 卡里布生物科学公司 | 以核酸为靶的核酸的组合物和方法 |
US9234213B2 (en) * | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
US9074199B1 (en) * | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
-
2014
- 2014-06-30 US US14/319,784 patent/US9074199B1/en active Active
- 2014-11-19 ES ES14864613T patent/ES2774677T3/es active Active
- 2014-11-19 JP JP2016532542A patent/JP6984096B2/ja active Active
- 2014-11-19 CA CA2930829A patent/CA2930829C/en active Active
- 2014-11-19 WO PCT/US2014/066375 patent/WO2015077318A1/en active Application Filing
- 2014-11-19 AU AU2014353128A patent/AU2014353128B2/en active Active
- 2014-11-19 EP EP14864613.6A patent/EP3071694B1/en active Active
- 2014-11-19 KR KR1020167015908A patent/KR102212295B1/ko active IP Right Grant
- 2014-11-19 EP EP19213645.5A patent/EP3647418A1/en active Pending
- 2014-11-19 US US15/037,696 patent/US10100291B2/en active Active
- 2014-11-19 CA CA3191825A patent/CA3191825A1/en active Pending
-
2018
- 2018-10-11 US US16/157,481 patent/US10435679B2/en active Active
-
2019
- 2019-04-16 JP JP2019077510A patent/JP7020635B2/ja active Active
- 2019-06-13 US US16/440,241 patent/US10683490B2/en active Active
-
2020
- 2020-04-20 US US16/852,592 patent/US11286470B2/en active Active
- 2020-07-23 AU AU2020207837A patent/AU2020207837B2/en active Active
- 2020-12-15 JP JP2020207668A patent/JP2021052784A/ja active Pending
-
2022
- 2022-10-28 JP JP2022173487A patent/JP7469433B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100952754B1 (ko) * | 2007-09-28 | 2010-04-14 | 동아대학교 산학협력단 | 토양 메타게놈에서 유래한 항생 활성을 암호화하는유전자군 |
KR102116153B1 (ko) * | 2012-05-07 | 2020-05-27 | 상가모 테라퓨틱스, 인코포레이티드 | 도입유전자의 뉴클레아제-매개 표적화된 통합을 위한 방법 및 조성물 |
Non-Patent Citations (1)
Title |
---|
nature biotechnology. Vol.31, No.9, pp.833-838 (온라인 개시일: 2013.08.01) 1부.* * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230022258A (ko) * | 2018-02-15 | 2023-02-14 | 시그마-알드리치 컴퍼니., 엘엘씨 | 진핵 게놈 변형을 위한 조작된 cas9 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP6984096B2 (ja) | 2021-12-17 |
US10435679B2 (en) | 2019-10-08 |
AU2020207837A1 (en) | 2020-08-13 |
EP3071694A1 (en) | 2016-09-28 |
JP2017501688A (ja) | 2017-01-19 |
KR102212295B1 (ko) | 2021-02-03 |
US20190367892A1 (en) | 2019-12-05 |
JP7469433B2 (ja) | 2024-04-16 |
EP3071694B1 (en) | 2020-01-08 |
US20200283747A1 (en) | 2020-09-10 |
CA2930829C (en) | 2023-05-02 |
CA3191825A1 (en) | 2015-05-28 |
EP3647418A1 (en) | 2020-05-06 |
JP2023002785A (ja) | 2023-01-10 |
CA2930829A1 (en) | 2015-05-28 |
US10100291B2 (en) | 2018-10-16 |
AU2014353128A1 (en) | 2016-06-09 |
EP3071694A4 (en) | 2017-10-25 |
US11286470B2 (en) | 2022-03-29 |
ES2774677T3 (es) | 2020-07-22 |
JP2019150033A (ja) | 2019-09-12 |
US10683490B2 (en) | 2020-06-16 |
US20190040371A1 (en) | 2019-02-07 |
US20160298097A1 (en) | 2016-10-13 |
US9074199B1 (en) | 2015-07-07 |
WO2015077318A1 (en) | 2015-05-28 |
AU2020207837B2 (en) | 2023-04-06 |
JP7020635B2 (ja) | 2022-02-16 |
JP2021052784A (ja) | 2021-04-08 |
AU2014353128B2 (en) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020207837B2 (en) | Mutant Cas9 proteins | |
RU2771583C1 (ru) | Ортогональные белки cas9 для рнк-направляемой регуляции и редактирования генов | |
KR20160014036A (ko) | Rna-가이드된 전사 조절 | |
NZ754837B2 (en) | Orthogonal cas9 proteins for rna-guided gene regulation and editing | |
NZ754836B2 (en) | Orthogonal cas9 proteins for rna-guided gene regulation and editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |