KR20180037139A - Cas9 분자/가이드 rna 분자 복합체의 평가 - Google Patents
Cas9 분자/가이드 rna 분자 복합체의 평가 Download PDFInfo
- Publication number
- KR20180037139A KR20180037139A KR1020177034040A KR20177034040A KR20180037139A KR 20180037139 A KR20180037139 A KR 20180037139A KR 1020177034040 A KR1020177034040 A KR 1020177034040A KR 20177034040 A KR20177034040 A KR 20177034040A KR 20180037139 A KR20180037139 A KR 20180037139A
- Authority
- KR
- South Korea
- Prior art keywords
- molecule
- grna
- cas9
- value
- complex
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6811—Selection methods for production or design of target specific oligonucleotides or binding molecules
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6486—Measuring fluorescence of biological material, e.g. DNA, RNA, cells
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
- C12N2320/11—Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/90—Enzymes; Proenzymes
- G01N2333/914—Hydrolases (3)
- G01N2333/916—Hydrolases (3) acting on ester bonds (3.1), e.g. phosphatases (3.1.3), phospholipases C or phospholipases D (3.1.4)
- G01N2333/922—Ribonucleases (RNAses); Deoxyribonucleases (DNAses)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Cas9 분자/gRNA 분자 복합체의 평가, 선택, 최적화 및 설계 방법이 본 명세서에 개시된다.
Description
관련 출원
본 출원은 2015년 4월 24일자로 출원된 미국 가출원 제62/152,473호에 대한 우선권을 주장한다.
기술분야
본 발명(들)은 Cas9 분자/가이드 RNA(gRNA) 분자 복합체의 평가, 선택 및 설계에 관한 것이다.
Cas9 리보핵단백질(RNP) 복합체의 직접적인 전달은 세포에서의 Cas9 단백질의 신속한 전환 때문에 표적-외 활성을 최소화시키면서 효율적인 유전자-교정(editing)을 가능하게 한다. 유전자 교정은 시험관내 전사되거나 화학적으로 합성된 가이드 RNA(gRNA)와 복합체화된 정제된 Cas9 단백질의 양이온성 지질 전달에 의해 다양한 포유동물 세포에서 달성될 수 있다. RNP 전달에 의해 매개되는 유전자 교정의 효율은 유전자좌에 의해 달라지며, gRNA의 길이, 및 전달되는 Cas9 단백질 및 gRNA의 양과 비에 따라 달라진다. RNP 복합체의 2-성분 성질을 고려해 볼 때, Cas9 단백질과 gRNA 간의 완전하고 생산적인 복합체 형성을 얻는데 정밀한 조건이 필요하다. 단백질 및 RNA의 양이 염료-결합 분석, 예를 들어, 브래드포드(Bradford) 염료 결합 분석 또는 리보퀀트(riboquant) RNA 분석에 의해 정량화될 수 있지만, 이들 기법은 유전자 교정 활성을 위해 필요한 생산적인 RNP 복합체의 정량화를 제공하지 않는다.
Cas9/gRNA 복합체의 구조적 및 생물물리학적 특성화에 의해, 큰 접촉 면적 및 높은 친화성이 드러났다. 열 용융 곡선은 단백질-리간드 복합체의 안정성 및 결합을 특성화하는데 유용한 특성이다. 시차 주사 형광측정법(DSF)은 소분자 염료, 예를 들어, SYPRO® 오렌지(orange)의 형광의 변화를 사용하여 단백질의 열 변성을 모니터링하고, 그의 열 용융 온도를 결정하는 생물물리학적 기법이다(). 단백질로의 리간드의 결합은 단백질을 상이한 정도로 안정화시키고, 그의 Tm을 변경시키는 경향이 있다. 상이한 리간드 농도에서의 단백질의 Tm의 측정에 의해, 상기 리간드에 대한 단백질의 친화성의 측정이 가능해질 수 있다. 광범위한 열 용융 특징을 사용하여 높은 신호 대 잡음 비와 함께 높은 처리효율로 RNP 복합체의 질을 신속하게 분석할 수 있다.
따라서, Cas9 분자/gRNA 분자 복합체의 질을 평가하기 위해, 예를 들어, RNP 매개의 유전자 교정을 위한 전제조건인 생산적인 복합체 형성을 정량화하기 위해 사용될 수 있는 DSF와 같은 분석을 개발하는 것이 여전히 필요하다.
요약
(a) 복수의 시료를 생성하는 단계로서, 각 시료가 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 단계; (b) 복수의 시료의 각각에서 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계; 및 (c) (i) 기준 Cas9 분자/gRNA 분자 복합체의 Tm 값 또는 미리 결정된 역치 Tm 값과 복수의 시료에서의 Tm 값의 비교, 또는 (ii) 복수의 시료의 Tm 값의 상대적 순서화 중 하나 이상을 기반으로 하여 복수의 시료로부터 적어도 하나의 시료를 선택하는 단계를 포함하는 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법이 본 명세서에 제공된다. 특정 구현예에서, 복수의 시료의 각 시료에서 Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계는 시차 주사 형광측정법(DSF)에 의해 복수의 시료에서 각 시료를 평가하는 것을 포함할 수 있다. 특정 구현예에서, gRNA는 키메라 gRNA일 수 있다. 특정 구현예에서, gRNA는 모듈(modular) gRNA일 수 있다. 특정 구현예에서, 시료는 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 기타 완충제 구성성분을 포함하는 구성성분을 포함할 수 있다. 특정 구현예에서, gRNA 분자 부재의 Cas9 분자의 Tm 값보다 적어도 8℃ 더 큰 Tm을 갖는 Cas9 분자/gRNA 분자 복합체를 포함하는 시료가 선택될 수 있다.
특정 구현예에서, 본 명세서에 제공되는 방법에 따라 선택되는 gRNA 분자 부재의 Cas9 분자의 Tm 값보다 적어도 8℃ 더 큰 Tm을 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체가 본 명세서에 제공된다.
특정 구현예에서, 본 명세서에 제공되는 방법에 따라 선택되는 gRNA 분자 부재의 Cas9 분자의 Tm보다 적어도 8℃ 더 큰 Tm을 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체를 포함하는 조성물이 본 명세서에 제공된다. 특정 구현예에서, Cas9 분자 및 gRNA 분자의 비-자연 발생 복합체의 Tm과 gRNA 분자 부재의 Cas9 분자의 Tm의 차이는 DSF에 의해 평가될 수 있다. 특정 구현예에서, gRNA는 키메라 또는 모듈 gRNA일 수 있다.
특정 구현예에서, (a) 복수의 Cas9 분자/gRNA 분자 복합체를 생성하는 단계로서, 각각이 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 단계; (b) 복수의 Cas9 분자/gRNA 분자 복합체의 각 Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 복수의 Cas9 분자/gRNA 분자 복합체 중 하나 이상이 안정한 것을 결정하는 단계를 포함하는 Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법이 본 명세서에 제공된다.
본 명세서의 방법의 특정 구현예에서, 복수의 gRNA 분자는 후보 gRNA 분자의 라이브러리일 수 있다. 특정 구현예에서, 후보 gRNA 분자의 라이브러리는 tracrRNA 분자 또는 서열의 라이브러리를 포함할 수 있다. 특정 구현예에서, tracrRNA 분자 또는 서열의 라이브러리는 상이한 길이의 것일 수 있다.
특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체의 촉진하는 조건의 결정 방법이 본 명세서에 제공된다.
특정 구현예에서, (a) DSF를 통해 Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계; 및 (b) Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법이 본 명세서에 제공된다.
특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법이 본 명세서에 제공된다.
특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계; (c) Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및 (d) (i) Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크고, (ii) Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법이 본 명세서에 제공된다.
특정 구현예에서, (a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계; (c) Cas9 분자/gRNA 분자 복합체의 Tm 값과 기준 분자의 Tm 값 또는 Tm 기준 값 사이의 델타 값을 결정하는 단계; 및 (d) 델타 값이 적어도 8℃이고, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 Cas9 분자로의 gRNA 분자의 결합의 최적화 방법이 본 명세서에 제공된다.
특정 구현예에서, (a) 기준 분자의 열안정성 값을 검출하는 단계; (b) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (c) Cas9 분자/gRNA 분자 복합체의 열안정성 값을 측정하는 단계; 및 (d) Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 안정한 Cas9 분자/gRNA 분자 복합체의 검출 방법이 본 명세서에 제공된다.
본 명세서의 방법의 특정 구현예에서, 열안정성 값은 변성 온도 값일 수 있으며, 열안정성 기준 값은 변성 온도 기준 값일 수 있다. 본 명세서의 방법의 특정 구현예에서, 열안정성 값은 Tm 값일 수 있으며, 열안정성 기준 값은 Tm 기준 값일 수 있다.
본 명세서의 방법의 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃ 또는 적어도 20℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정할 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정하다.
본 명세서의 방법의 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃ 또는 약 20℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정할 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정하다.
본 명세서의 방법의 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 1℃ 내지 5℃, 약 6℃ 내지 10℃, 약 11℃ 내지 15℃ 또는 약 16℃ 내지 20℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정할 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 6℃ 내지 10℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정하다.
본 명세서의 방법의 특정 구현예에서, Tm 값은 열 변화 분석을 사용하여 검출될 수 있다. 특정 구현예에서, 열 변화 분석은 DSF, 시차 주사 열량계(DSC) 또는 등온 적정 열량계(ITC)로부터 선택될 수 있다.
본 명세서의 방법의 특정 구현예에서, gRNA 분자는 키메라 gRNA 분자를 포함할 수 있다. 특정 구현예에서, gRNA 분자는 모듈 gRNA 분자를 포함할 수 있다.
본 명세서의 방법의 특정 구현예에서, Cas9 분자는 본 명세서에 개시된 Cas9 분자 중 임의의 것일 수 있다. 예를 들어, Cas9 분자는 표 1로부터 선택되는 Cas9 분자일 수 있다. 특정 구현예에서, Cas9 분자는 키메라 Cas9 분자, 또는 합성 또는 조작된(engineered) Cas9 분자일 수 있다. 예를 들어, Cas9 분자는 부분 또는 부분들이 결실된 Cas9 분자일 수 있다. 특정 구현예에서, Cas9 분자는 스트렙토코커스 피오게네스(S. pyogenes) 또는 스타필로코커스 아우레우스(S. aureus) Cas9 분자를 포함할 수 있다.
본 명세서의 방법의 특정 구현예에서, 기준 분자는 (a) gRNA 분자의 부재 하의 기준 Cas9 분자; (b) 제2 gRNA 분자(즉, 평가 중인 복합체에서의 것 이외의 gRNA)와 복합체화된 기준 Cas9 분자(예를 들어, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자); 및 (c) 기준 Cas9 분자/gRNA 분자 복합체로부터 선택될 수 있으며, 기준 Cas9 분자/gRNA 분자는 상이한 조건 하에, 예를 들어, Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상이한 완충제에서 형성되었다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 상이할 수 있다. 특정 구현예에서, 기준 Cas9 분자는 일차 서열이 평가 중인 복합체의 Cas9 분자와 상이할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 상이할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 서열이 상이할 수 있거나, 변형에 의해 상이하다.
본 명세서의 방법의 특정 구현예에서, Tm 기준 값은 Tm에 대한 미리 선택된 수치를 포함할 수 있다. 특정 구현예에서, Tm 기준 값은 본 명세서에 기재된 기준 분자 중 임의의 것의 Tm과 상호연관된 값을 포함할 수 있다.
특정 구현예에서, 본 명세서에 개시된 방법은 Cas9 분자/gRNA 분자 복합체의 활성을 검출하는 단계; Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및 Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 추가로 포함할 수 있다. 특정 구현예에서, 활성은 삽입결실(indel)을 유도하는 능력; 표적 DNA를 변형시키는 능력; 미리 선택된 수선 방법의 경향; DNA 표적에 계속 혼성화되는 gRNA 분자의 능력; 및 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력 중 하나 이상을 포함할 수 있다. 특정 구현예에서, 활성 값은 결합 값일 수 있으며, 활성은 Cas9 분자에 결합하는 gRNA 분자의 능력일 수 있으며, (a) 시료에서 gRNA 분자와 Cas9 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계; (b) Cas9 분자/gRNA 분자 복합체의 결합 값을 측정하는 단계; 및 (c) Cas9 분자/gRNA 분자 복합체의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함한다. 특정 구현예에서, 결합 값은 반응속도론(kinetics) 분석을 사용하여 측정될 수 있다. 특정 구현예에서, 반응속도론 분석은 표면 플라스몬 공명(SPR) 분석, 바이오-층 간섭(BLI) 분석 또는 겔 밴드 변화 분석으로부터 선택될 수 있다. 특정 구현예에서, 미리 선택된 수선 방법의 경향은 HDR 또는 NHEJ일 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성을 시험관내 시스템; 생체외 시스템; 생체내 시스템; 세포 분석; 또는 동물 모델을 사용하여 시험할 수 있다.
특정 구현예에서, 기준 분자는 본 명세서에 제공되는 기준 분자 중 임의의 것으로부터 선택된다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체는 Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, Cas9 분자/gRNA 분자 복합체와 상이한 완충제에서 형성된다.
특정 구현예에서, 본 명세서에 기재되는 방법 중 임의의 것을 사용하여 생성되는 합성 Cas9 분자/gRNA 분자 복합체가 본 명세서에 제공된다.
특정 구현예에서, 본 명세서에 기재되는 방법 중 임의의 것을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 조성물이 본 명세서에 제공된다.
특정 구현예에서, 본 명세서에 기재되는 방법 중 임의의 것을 사용하여 생성되는 하나 이상의 Cas9 분자/gRNA 분자 복합체를 인코딩하는 핵산을 포함하는 벡터계가 본 명세서에 제공된다.
특정 구현예에서, 본 명세서에 기재된 Cas9 분자/gRNA 분자 복합체 중 임의의 것을 표적 세포로 전달하는 단계를 포함하는 표적 세포로의 Cas9 분자/gRNA 분자 복합체의 전달 방법이 본 명세서에 제공된다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체는 RNP 양이온성 지질 트랜스펙션, 바이러스 벡터 또는 RNA 트랜스펙션에 의해 세포로 전달될 수 있다. 특정 구현예에서, 바이러스 벡터는 AAV 벡터일 수 있다.
특정 구현예에서, 본 명세서에 제공되는 방법, 조성물 또는 제형에서 gRNA 분자는 단분자 또는 키메라 gRNA일 수 있다. 다른 구현예에서, gRNA 분자는 모듈 gRNA일 수 있다.
특정 구현예에서, 본 명세서에 제공되는 방법, 조성물 또는 제형에서 Cas9 분자는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스(S. thermophilus) Cas9 분자, 또는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스 Cas9 분자로부터 유래된 Cas9 분자일 수 있다. 특정 구현예에서, Cas9 분자는 표지될 수 있으며, 이들 중 특정 구현예에서, 표지는 형광 염료일 수 있다.
본 발명의 다른 특징 및 이점은 상세한 설명, 도면으로부터 그리고 특허청구범위로부터 명확하게 될 것이다.
도 1a 내지 도 1i는 몇몇의 예시적인 gRNA의 표현이다.
도 1a는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된(또는 부분적으로 서열 상에서 모델링된) 모듈 gRNA 분자를 도시하며(출현 순서대로 각각 서열번호 39 및 40);
도 1b는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 41);
도 1c는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 42);
도 1d는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 43);
도 1e는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 44);
도 1f는 듀플렉스 구조로서 스트렙토코커스 써모필러스로부터 부분적으로 유래된 모듈 gRNA 분자를 도시하며(출현 순서로 각각 서열번호 45 및 46);
도 1g는 스트렙토코커스 피오게네스 및 스트렙토코커스 써모필러스의 모듈 gRNA 분자의 정렬을 도시한다(출현 순서로 각각 서열번호 39, 45, 47 및 46).
도 1h 내지 도 1i는 단분자 gRNA 분자의 추가의 예시적인 구조를 도시한다.
도 1h는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자의 예시적인 구조를 보여준다(서열번호 42).
도 1i는 듀플렉스 구조로서 스타필로코커스 아우레우스로부터 부분적으로 유래된 단분자 gRNA 분자의 예시적인 구조를 보여준다(서열번호 38).
도 2a 내지 도 2g는 Cas9 서열의 정렬을 도시한다(문헌[Chylinski 2013]). N-말단 RuvC-유사 도메인은 네모 안에 있으며, "Y"로 표시되어 있다. 다른 2개의 RuvC-유사 도메인은 네모 안에 있으며, "B"로 표시되어 있다. HNH-유사 도메인은 네모 안에 있으며, "G"로 표시되어 있다. Sm: 스트렙토코커스 뮤탄스(S. mutans)(서열번호 1); Sp: 스트렙토코커스 피오게네스(서열번호 2); St: 스트렙토코커스 써모필러스(서열번호 4); 및 Li: 리스테리아 이노쿠아(L. innocua)(서열번호 5). "모티프"(서열번호 14)는 4개의 서열을 기반으로 한 공통 서열이다. 4개 모두의 서열에서 보존된 잔기는 단일 문자 아미노산 약어로 표시되어 있고; "*"는 4개 서열 중 임의의 것의 상응하는 위치에서 발견되는 임의의 아미노산을 표시하며; "-"는 부재함을 표시한다.
도 3a 및 도 3b는 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 N-말단 RuvC-유사 도메인의 정렬을 보여준다(서열번호 52 내지 95, 120 내지 123). 도 3b의 마지막 줄은 4개의 고도로 보존된 잔기를 나타낸다.
도 4a 및 도 4b는 서열 이상점(outlier)이 제거된 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 N-말단 RuvC-유사 도메인의 정렬을 보여준다(서열번호 52 내지 123). 도 4b의 마지막 선은 3개의 고도로 보존된 잔기를 나타낸다.
도 5a 내지 도 5c는 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 HNH-유사 도메인의 정렬을 보여준다(서열번호 124 내지 198). 도 5c의 마지막 선은 보존된 잔기를 나타낸다.
도 6a 및 도 6b는 서열 이상점이 제거된 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 HNH-유사 도메인의 정렬을 보여준다(서열번호 124 내지 141, 148, 149, 151 내지 153, 162, 163, 166 내지 174, 177 내지 187, 194 내지 198). 도 6b의 마지막 선은 3개의 고도로 보존된 잔기를 나타낸다.
도 7은 예시적인 gRNA 서열(서열번호 42)을 사용한 gRNA 도메인 명명법을 예시한 것이다.
도 8a 및 도 8b는 스트렙토코커스 피오게네스 Cas9의 도메인 구성의 개략적 표현을 제공한다. 도 8a는 Cas9의 2개의 엽(인식(REC) 및 뉴클레아제(NUC) 엽)과 관련하여, 아미노산 위치를 포함한 Cas9 도메인의 구성을 보여준다. 도 8b는 83개의 Cas9 오솔로그(ortholog)에 걸친 각 도메인의 상동성 백분율을 보여준다.
도 9a는 DSF에 의해 결정시 gRNA의 부재 하의 스타필로코커스 아우레우스 Cas9의 열 안정성을 도시한다.
도 9b는 DSF에 의해 결정시 gRNA의 부재 하의 스트렙토코커스 피오게네스 Cas9의 열 안정성을 도시한다.
도 10은 DSF에 의해 결정시, (1) 스트렙토코커스 피오게네스 Cas9, (2) 스트렙토코커스 피오게네스 gRNA의 존재 하의 스트렙토코커스 피오게네스 Cas9, 및 (3) 스타필로코커스 아우레우스 gRNA의 존재 하의 스트렙토코커스 피오게네스 Cas9의 열 안정성을 도시한다.
도 11a는 DSF에 의해 결정시, (1) 스타필로코커스 아우레우스 Cas9 및 (2) CD3을 표적화하는 gRNA와 함께 스타필로코커스 아우레우스 Cas9의 열 안정성을 도시한다.
도 11b는 Jurkat T 세포로의 스타필로코커스 아우레우스 Cas9 및 CD3을 표적화하는 gRNA의 전달 후의 생성 CD3 음성 집단을 보여주는 예시적인 FACS 분석을 도시한다.
도 1a는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된(또는 부분적으로 서열 상에서 모델링된) 모듈 gRNA 분자를 도시하며(출현 순서대로 각각 서열번호 39 및 40);
도 1b는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 41);
도 1c는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 42);
도 1d는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 43);
도 1e는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자를 도시하며(서열번호 44);
도 1f는 듀플렉스 구조로서 스트렙토코커스 써모필러스로부터 부분적으로 유래된 모듈 gRNA 분자를 도시하며(출현 순서로 각각 서열번호 45 및 46);
도 1g는 스트렙토코커스 피오게네스 및 스트렙토코커스 써모필러스의 모듈 gRNA 분자의 정렬을 도시한다(출현 순서로 각각 서열번호 39, 45, 47 및 46).
도 1h 내지 도 1i는 단분자 gRNA 분자의 추가의 예시적인 구조를 도시한다.
도 1h는 듀플렉스 구조로서 스트렙토코커스 피오게네스로부터 부분적으로 유래된 단분자 gRNA 분자의 예시적인 구조를 보여준다(서열번호 42).
도 1i는 듀플렉스 구조로서 스타필로코커스 아우레우스로부터 부분적으로 유래된 단분자 gRNA 분자의 예시적인 구조를 보여준다(서열번호 38).
도 2a 내지 도 2g는 Cas9 서열의 정렬을 도시한다(문헌[Chylinski 2013]). N-말단 RuvC-유사 도메인은 네모 안에 있으며, "Y"로 표시되어 있다. 다른 2개의 RuvC-유사 도메인은 네모 안에 있으며, "B"로 표시되어 있다. HNH-유사 도메인은 네모 안에 있으며, "G"로 표시되어 있다. Sm: 스트렙토코커스 뮤탄스(S. mutans)(서열번호 1); Sp: 스트렙토코커스 피오게네스(서열번호 2); St: 스트렙토코커스 써모필러스(서열번호 4); 및 Li: 리스테리아 이노쿠아(L. innocua)(서열번호 5). "모티프"(서열번호 14)는 4개의 서열을 기반으로 한 공통 서열이다. 4개 모두의 서열에서 보존된 잔기는 단일 문자 아미노산 약어로 표시되어 있고; "*"는 4개 서열 중 임의의 것의 상응하는 위치에서 발견되는 임의의 아미노산을 표시하며; "-"는 부재함을 표시한다.
도 3a 및 도 3b는 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 N-말단 RuvC-유사 도메인의 정렬을 보여준다(서열번호 52 내지 95, 120 내지 123). 도 3b의 마지막 줄은 4개의 고도로 보존된 잔기를 나타낸다.
도 4a 및 도 4b는 서열 이상점(outlier)이 제거된 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 N-말단 RuvC-유사 도메인의 정렬을 보여준다(서열번호 52 내지 123). 도 4b의 마지막 선은 3개의 고도로 보존된 잔기를 나타낸다.
도 5a 내지 도 5c는 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 HNH-유사 도메인의 정렬을 보여준다(서열번호 124 내지 198). 도 5c의 마지막 선은 보존된 잔기를 나타낸다.
도 6a 및 도 6b는 서열 이상점이 제거된 문헌[Chylinski 2013]에 개시된 Cas9 분자 유래의 HNH-유사 도메인의 정렬을 보여준다(서열번호 124 내지 141, 148, 149, 151 내지 153, 162, 163, 166 내지 174, 177 내지 187, 194 내지 198). 도 6b의 마지막 선은 3개의 고도로 보존된 잔기를 나타낸다.
도 7은 예시적인 gRNA 서열(서열번호 42)을 사용한 gRNA 도메인 명명법을 예시한 것이다.
도 8a 및 도 8b는 스트렙토코커스 피오게네스 Cas9의 도메인 구성의 개략적 표현을 제공한다. 도 8a는 Cas9의 2개의 엽(인식(REC) 및 뉴클레아제(NUC) 엽)과 관련하여, 아미노산 위치를 포함한 Cas9 도메인의 구성을 보여준다. 도 8b는 83개의 Cas9 오솔로그(ortholog)에 걸친 각 도메인의 상동성 백분율을 보여준다.
도 9a는 DSF에 의해 결정시 gRNA의 부재 하의 스타필로코커스 아우레우스 Cas9의 열 안정성을 도시한다.
도 9b는 DSF에 의해 결정시 gRNA의 부재 하의 스트렙토코커스 피오게네스 Cas9의 열 안정성을 도시한다.
도 10은 DSF에 의해 결정시, (1) 스트렙토코커스 피오게네스 Cas9, (2) 스트렙토코커스 피오게네스 gRNA의 존재 하의 스트렙토코커스 피오게네스 Cas9, 및 (3) 스타필로코커스 아우레우스 gRNA의 존재 하의 스트렙토코커스 피오게네스 Cas9의 열 안정성을 도시한다.
도 11a는 DSF에 의해 결정시, (1) 스타필로코커스 아우레우스 Cas9 및 (2) CD3을 표적화하는 gRNA와 함께 스타필로코커스 아우레우스 Cas9의 열 안정성을 도시한다.
도 11b는 Jurkat T 세포로의 스타필로코커스 아우레우스 Cas9 및 CD3을 표적화하는 gRNA의 전달 후의 생성 CD3 음성 집단을 보여주는 예시적인 FACS 분석을 도시한다.
상세한 설명
정의
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 해당 분야의 숙련자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 다른 참고문헌은 그들의 전문이 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.
본 명세서에 사용되는 "Alt-HDR", "대안적인 상동성-유도 수선" 또는 "대안적인 HDR"은 상동성 핵산(예를 들어, 내인성 상동성 서열, 예를 들어, 자매 염색분체 또는 외인성 핵산, 예를 들어, 주형 핵산)을 사용한 DNA 손상의 수선 과정을 지칭한다. Alt-HDR은 과정에서 정규 HDR과 상이한 경로를 사용하며, 정규 HDR 매개체, RAD51 및 BRCA2에 의해 억제될 수 있다는 점에서 정규 HDR과 구별된다. 또한, alt-HDR은 파단부의 수선을 위하여 단일-가닥 또는 닉이 있는 상동성 핵산을 사용한다.
본 명세서에 사용되는 "정규 HDR" 또는 정규 상동성-유도 수선은 상동성 핵산(예를 들어, 내인성 상동성 서열, 예를 들어, 자매 염색분체 또는 외인성 핵산, 예를 들어, 주형 핵산)을 사용한 DNA 손상의 수선 과정을 지칭한다. 정규 HDR은 전형적으로 이중 가닥 파단부에 유의미한 절제가 존재하여, DNA의 적어도 하나의 단일 가닥 부분을 형성하는 경우에 작용한다. 정상 세포에서, HDR은 전형적으로, 일련의 단계, 예를 들어, 파단부의 인식, 파단부의 안정화, 절제, 단일 가닥 DNA의 안정화, DNA 교차 중간체의 형성, 교차 중간체의 분리(resolution) 및 라이게이션을 수반한다. 상기 과정은 RAD51 및 BRCA2를 필요로 하며, 상동성 핵산은 전형적으로 이중-가닥이다.
달리 표시되지 않는 한, 본 명세서에 사용되는 용어 "HDR"은 정규 HDR 및 alt-HDR 둘 모두를 포함한다.
본 명세서에 사용되는 "비-상동성 말단 연결" 또는 "NHEJ"는 정규 NHEJ(cNHEJ), 대안적인 NHEJ(altNHEJ), 마이크로상동성-매개의 말단 연결(MMEJ), 단일-가닥 어닐링(SSA) 및 합성-의존성 마이크로상동성-매개의 말단 연결(SD-MMEJ)을 포함하는 라이게이션 매개의 수선 및/또는 비-주형 매개의 수선을 지칭한다.
"획득하다" 또는 "획득하는"은 이 용어가 본 명세서에 사용되는 바와 같이, 물리적 엔티티(entity) 또는 값을 "직접적으로 획득하는" 또는 "간접적으로 획득하는" 또는 값의 경우에 "계산에 의해 획득하는" 것 중 하나 이상 또는 이의 전부에 의한, 물리적 엔티티 또는 값, 예를 들어, 수치의 보유를 얻는 것을 지칭한다.
"직접적으로 획득하는"은 물리적 엔티티 또는 값을 수득하기 위한 과정을 수행하는 것(예를 들어, 합성 또는 분석 방법을 수행하는 것)을 의미한다. 물리적 엔티티를 "직접적으로 획득하는"은 물리적 물질, 예를 들어, 출발 물질의 물리적 변화를 포함하는 과정을 수행하는 것을 포함한다. 예시적인 변화는 둘 이상의 출발 물질로부터 물리적 엔티티의 제조, 물질의 전단 또는 단편화, 물질의 분리 또는 정제, 혼합물 내로 둘 이상의 개별 엔티티의 조합, 공유 또는 비공유 결합의 파단 또는 형성을 포함하는 화학 반응의 수행을 포함한다. 값을 직접적으로 획득하는 것은 시료 또는 다른 물질의 물리적 변화를 포함하는 과정의 수행, 예를 들어, 물질, 예를 들어, 시료, 피분석물 또는 시약의 물리적 변화를 포함하는 분석 과정(때때로, 본 명세서에 "물리적 분석"으로 지칭)의 수행, 분석 방법, 예를 들어, 다음 중 하나 이상을 포함하는 방법의 수행을 포함한다: 물질, 예를 들어, 피분석물, 또는 이의 단편 또는 다른 유도체를 또 다른 물질로부터 분리 또는 정제; 피분석물, 또는 이의 단편 또는 다른 유도체와, 또 다른 물질, 예를 들어, 완충제, 용매, 또는 반응물질의 조합; 또는 예를 들어, 피분석물의 제1 및 제2 원자 사이의 공유 또는 비공유 결합의 파단 또는 형성에 의한 피분석물, 또는 이의 단편 또는 다른 유도체의 구조의 변경; 또는 예를 들어, 시약의 제1 및 제2 원자 사이의 공유 또는 비공유 결합의 파단 또는 형성에 의한 시약, 또는 이의 단편 또는 다른 유도체 구조의 변경.
"간접적으로 획득하는"은 또 다른 사람 또는 공급처(예를 들어, 물리적 엔티티 또는 값을 직접적으로 획득하는 제3자 실험실)로부터 물리적 엔티티 또는 값을 받는 것을 지칭한다. 예를 들어, 당사자는 제2자로부터 값을 획득할 수 있으며(간접적으로 획득), 상기 제2자는 직접적으로 획득하거나, 또는 계산에 의해 획득한다.
"계산에 의해 획득하는"은 예를 들어, 기계, 예를 들어, 컴퓨터에서 수행되는 바와 같은 계산 또는 산정에 의해 값을 획득하는 것을 지칭한다.
본 명세서에서 사용되는 "도메인"은 단백질 또는 핵산의 세그먼트를 기재하기 위해 사용된다. 달리 표시되지 않는 한, 도메인은 임의의 특정 기능적 특성을 가질 필요는 없다.
두 서열 간의 상동성 또는 서열 동일성(상기 용어는 본 명세서에서 상호호환적으로 사용됨)의 계산은 다음과 같이 수행된다. 서열을 최적의 비교 목적을 위해 정렬한다(예를 들어, 갭은 최적의 정렬을 위해 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 도입될 수 있고, 비교 목적을 위해 비-상동성 서열은 무시될 수 있다). 최적의 정렬은 갭 페널티 12, 갭 확장 페널티 4, 및 프레임 이동 갭 페널티 5를 이용한 Blossum 62 점수화 매트릭스를 이용하는 GCG 소프트웨어 패키지의 GAP 프로그램을 이용한 최상의 점수로서 결정된다. 이어서, 상응하는 아미노산 위치 또는 뉴클레오타이드 위치에서 아미노산 잔기 또는 뉴클레오타이드를 비교한다. 제1 서열 내 위치가 제2 서열 내의 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오타이드에 의해 점유되면, 분자는 상기 위치에서 동일하다. 두 서열 간의 동일성 백분율은 서열에 의해 공유되는 동일한 위치 수의 함수이다.
본 명세서에 사용되는 "폴리펩타이드"는 100개 미만의 아미노산 잔기를 갖는 아미노산의 폴리머를 지칭한다. 특정 구현예에서, 그것은 50, 20 또는 10개 미만의 아미노산 잔기를 갖는다.
본 명세서에 사용되는 "기준 분자"는 변형된 분자 또는 후보 분자가 비교되는 분자를 지칭한다. 예를 들어, 기준 Cas9 분자는 변형된 Cas9 분자 또는 후보 Cas9 분자가 비교되는 Cas9 분자를 지칭한다. 마찬가지로, 기준 gRNA는 변형된 gRNA 분자 또는 후보 gRNA 분자가 비교되는 gRNA 분자를 지칭한다. 추가로, 기준 Cas9 분자/gRNA 분자 복합체는 Cas9 분자/gRNA 분자 복합체가 비교되는 Cas9 분자/gRNA 분자 복합체를 지칭한다. 변형된 분자 또는 후보 분자는 서열(예를 들어, 변형된 분자 또는 후보 분자는 기준 분자와 X%의 서열 동일성 또는 상동성을 가질 수 있음), 열안정성 또는 활성(예를 들어, 변형된 분자 또는 후보 분자는 X%의 기준 분자의 활성을 가질 수 있음)을 기반으로 하여 기준 분자와 비교될 수 있다. 예를 들어, 기준 분자가 Cas9 분자인 경우, 변형된 분자 또는 후보 분자는 10% 이하의 기준 Cas9 분자의 뉴클레아제 활성을 갖는 것을 특징으로 할 수 있다. 기준 Cas9 분자의 예에는 자연 발생 비변형 Cas9 분자, 예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스, 스트렙토코커스 써모필러스 또는 나이세리아 메닌지티디스(N. meningitidis)로부터의 자연 발생 Cas9 분자가 포함된다. 특정 구현예에서, 기준 Cas9 분자는 그것이 비교되는 변형된 Cas9 분자 또는 후보 Cas9 분자와 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다. 특정 구현예에서, 기준 Cas9 분자는 돌연변이가 변형된 Cas9 분자 또는 후보 Cas9 분자에 도달하도록 이루어지는 자연 발생 서열 또는 공지된 서열을 갖는 모 분자이다.
본 명세서에 사용되는 "기준 값"은 미리 선택된 수치인 기준 값을 지칭한다. 미리 선택된 수치는 단일의 수 또는 범위일 수 있다. 특정 구현예에서, 기준 값은 기준 분자의 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 기준 값은 열안정성 기준 값일 수 있다. 특정 구현예에서, 열안정성 기준 값은 열안정성에 대한 미리 선택된 수치이다. 특정 구현예에서, 열안정성 기준 값은 기준 분자의 열안정성 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 열안정성 기준 값은 열안정성과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, 열안정성 기준 값은 변성 온도 기준 값 또는 용융 온도(Tm) 기준 값일 수 있다. 특정 구현예에서, 변성 온도 기준 값은 변성에 대한 미리 선택된 수치이다. 특정 구현예에서, 변성 온도 기준 값은 기준 분자의 변성 온도 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 변성 온도 기준 값은 변성과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, Tm 기준 값은 Tm에 대한 미리 선택된 수치일 수 있다. 특정 구현예에서, Tm 기준 값은 미리 결정된 역치 Tm일 수 있다. 특정 구현예에서, Tm 기준 값은 기준 분자의 Tm 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, Tm 기준 값은 Tm과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, 기준 값은 활성 기준 값일 수 있다. 특정 구현예에서, 활성 기준 값은 기준 분자의 활성 값과 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 활성 기준 값은 활성과 상호연관된 파라미터를 포함할 수 있다. 특정 구현예에서, 활성 기준 값은 절단 기준 값 또는 결합 기준 값일 수 있다. 특정 구현예에서, 절단 기준 값은 핵산의 절단에 대한 미리 선택된 수치일 수 있다. 특정 구현예에서, 결합 기준 값은 2개 이상의 분자의 결합에 대한 미리 선택된 수치일 수 있다. 특정 구현예에서, 기준 값은 델타 기준 값일 수 있다. 특정 구현예에서, 델타 기준 값은 델타 값에 대한 미리 선택된 수치일 수 있다.
본 명세서에 사용되는 "델타 값"은 2개의 값 사이의 차이 또는 변화를 나타내는 값이다. 예를 들어, 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 열안정성 값과, 기준 분자의 열안정성 값 또는 열안정성 기준 값 사이의 차이를 나타내는 값일 수 있다. 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 활성 값과, 기준 분자의 활성 값 또는 활성 기준 값 사이의 차이를 나타내는 값일 수 있다.
분자의 변형과 관련하여 본 명세서에 사용되는 "대체", 또는 "대체되는"은 처리 제한을 필요로 하지 않고, 단지 대체 엔티티가 존재하는 것만을 나타낸다.
본 명세서에 사용되는 "대상체"는 인간 또는 비-인간 동물 중 어느 하나를 의미할 수 있다. 상기 용어는 포유동물(예를 들어, 인간, 다른 영장류, 돼지, 설치류(예를 들어, 마우스 및 랫트 또는 햄스터), 토끼, 기니피그, 소, 말, 고양이, 개, 양 및 염소)을 포함하지만, 이들로 제한되지 않는다. 특정 구현예에서, 대상체는 인간이다. 또 다른 구현예에서, 대상체는 가금류이다. 특정 구현예에서, 대상체는 인간이며, 이들 중 특정 구현예에서, 인간은 유아, 소아, 청소년 또는 성인이다.
아미노산 서열의 맥락에서, 본 명세서에 사용되는 "X"는 다르게 특정되지 않는 한 임의의 아미노산(예를 들어, 20가지의 천연 아미노산 중 임의의 것)을 지칭한다.
본 명세서에 사용되는 "약"은 명시된 값 또는 값의 범위의 10% 이내를 의미한다.
본 명세서에 사용되는 "Cas9 분자" 또는 "Cas9 폴리펩타이드"는 각각 gRNA 분자와 상호작용하고, gRNA 분자와 협력하여 표적 도메인 및 특정 구현예에서, PAM 서열을 포함하는 부위에 국소화할 수 있는 분자 또는 폴리펩타이드를 지칭한다. Cas9 분자 및 Cas9 폴리펩타이드는 자연 발생 Cas9 분자 및 Cas9 폴리펩타이드, 및 기준 서열, 예를 들어, 가장 유사한 자연 발생 Cas9 분자와 예를 들어, 적어도 하나의 아미노산 잔기가 상이한 조작되거나, 변경되거나, 또는 변형된 Cas9 분자 또는 Cas9 폴리펩타이드 둘 모두를 포함한다.
개요
본 발명자들은 DSF에 의해 결정시 Cas9 분자/gRNA 분자 복합체의 안정성이 Cas9 분자/gRNA 분자 복합체의 다양한 특성과 상호연관되는 것을 발견하였다. 이와 같이, 안정성의 결정을 사용하여 다양한 특성, 예를 들어, 표적을 절단하는 능력, 특정 경로, 예를 들어, HDR 또는 NHEJ에 의해 결정될 Cas9 분자/gRNA 분자 복합체에 의해 매개되는 절단 사건의 경향, 표적을 조절하는 능력 또는 미리 선택된 전달 방법에 대한 적합성에 대하여 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 평가할 수 있다. 또한, 안정성의 결정을 사용하여, 예를 들어, Cas9 분자/gRNA 분자 복합체의 효능 또는 강건성에 대하여, 그리고 일반적으로 Cas9 분자/gRNA 분자 복합체 내의 포함에 대하여 Cas9 분자, gRNA 분자, 복합체의 제조 방법(예를 들어, 구성성분의 비 또는 화학량론) 또는 추가의 구성성분의 첨가를 평가할 수 있다.
개시된 실험 결과에 기반하여, Cas9/분자 gRNA 분자 복합체의 열안정성을 측정하는 단계를 포함하는 방법이 본 명세서에 제공된다. 단백질의 열안정성은 유리한 조건, 예를 들어, 결합 RNA 분자, 예를 들어, gRNA의 첨가 하에 증가할 수 있다. 따라서, Cas9/gRNA 복합체의 열안정성에 관한 정보는 복합체가 안정한지 여부의 결정에 유용하다. Cas9/분자 gRNA 분자 복합체의 열안정성을 측정하는 단계를 포함할 수 있는 방법은 제한 없이, Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법, 대상체로의 투여를 위한 Cas9/gRNA 복합체에 대한 스크리닝 방법 및 대상체로의 투여를 위한 Cas9/gRNA 복합체의 선택 방법을 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값을 측정할 수 있다. 추가로, 특정 구현예에서, 기준 분자의 열안정성 값도 또한 측정할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 본 명세서에 기재된 바와 같은 열안정성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다. 특정 구현예에서, 측정되는 열안정성 값은 변성 온도 값일 수 있다. 이들 구현예에서, 열안정성 기준 값은 변성 온도 기준 값이다. 특정 구현예에서, 측정되는 열안정성 값은 Tm 값일 수 있다. 이들 구현예에서, 열안정성 기준 값은 Tm 기준 값일 수 있다. 특정 구현예에서, 열안정성 값은 열 변화 분석을 사용하여 측정될 수 있다. 본 명세서에 개시된 바와 같이, DSF는 단백질의 열안정성을 측정하는데 사용될 수 있는 기법이다. 특정 구현예에서, 열안정성을 측정하는데 사용되는 열 변화 분석은 DSF, 시차 주사 열량계(DSC) 또는 등온 적정 열량계(ITC)일 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 예를 들어, 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 적어도 8℃ 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자의 부재 하의 기준 Cas9 분자일 수 있다. 특정 구현예에서, 열안정성 값을 측정하는 단계를 포함하는 방법은 본 명세서에 기재된 바와 같은 Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 것을 포함하는 단계를 추가로 포함할 수 있다.
또한, 개시된 실험 결과에 기반하여, 복합체의 안정성의 결정에도 유용할 수 있는 Cas9/분자 gRNA 분자 복합체의 활성을 측정하는 단계를 포함하는 방법이 본 명세서에 제공된다. Cas9/분자 gRNA 분자 복합체의 활성을 측정하는 단계를 포함할 수 있는 방법은 제한 없이, Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법, 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법 및 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체의 선택 방법을 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값을 검출할 수 있다. 추가로, 특정 구현예에서, 기준 분자의 활성 값을 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, 검출 중인 활성은 결합 활성일 수 있다. 특정 구현예에서, 결합 활성은 제한 없이, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력, 또는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력을 포함할 수 있다. 특정 구현예에서, 분자의 결합 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 선택되거나, 안정한 것으로 결정될 수 있다. 특정 구현예에서, 활성은 절단 활성이다. 절단 활성의 일부 예는 제한 없이, 표적을 절단하는 Cas9 분자/gRNA 분자 복합체의 능력, 특정 경로, 예를 들어, HDR 또는 NHEJ에 의해 결정될 Cas9 분자/gRNA 분자 복합체에 의해 매개되는 절단 사건의 경향, 표적을 조절하는 Cas9 분자/gRNA 분자 복합체의 능력 중 임의의 하나 이상을 포함할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 절단 값을 측정할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 절단 값이 기준 분자의 절단 값 또는 절단 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 선택되거나, 안정한 것으로 결정될 수 있다.
본 명세서에 개시된 방법은 복수의 시료에서 수행될 수 있다. 예를 들어, 특정 구현예에서, 상기 방법은 복수의 시료를 생성하는 단계를 포함할 수 있으며, 각 시료는 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값 및/또는 활성 값을 복수의 시료의 각각에서 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체를 포함하는 적어도 하나의 시료는 복수의 시료로부터 선택될 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체를 포함하는 시료는 (i) 기준 복합체의 Tm 또는 미리 결정된 역치 Tm과 복수의 시료의 Tm의 비교, 또는 (ii) 복수의 시료의 Tm 값의 상대적 순서화 중 하나 이상에 기반하여 선택될 수 있다.
특정 구현예에서, 상기 방법은 복수의 Cas9 분자/gRNA 분자 복합체를 생성하는 단계를 포함할 수 있으며, 각각은 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함한다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값을 복수의 Cas9 분자/gRNA 분자 복합체의 각각에 대하여 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값을 복수의 Cas9 분자/gRNA 분자 복합체의 각각에 대하여 검출할 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체는 안정한 것으로 결정될 수 있다.
또한, 본 명세서에 개시되는 방법 중 임의의 것을 사용하여 생성되는 비-자연 발생 Cas9 분자/gRNA 분자 복합체가 본 명세서에 제공된다.
본 명세서에 기재된 방법을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체 중 임의의 것을 포함할 수 있는 조성물이 본 명세서에 제공된다. 예를 들어, 본 명세서에서 조성물은 본 명세서에 제공되는 방법에 따라 선택되는 기준 분자의 Tm 또는 Tm 기준 값보다 적어도 8℃ 더 큰 Tm을 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체를 포함할 수 있다.
또한, 본 명세서에 기재된 방법 중 임의의 것을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체를 인코딩(encoding)하는 핵산을 포함하는 벡터계가 본 명세서에 제공된다.
본 명세서에 기재된 방법 중 임의의 것을 사용하여 생성되는 Cas9 분자/gRNA 분자 복합체를 전달하는 단계를 포함하는 표적 세포로의 Cas9 분자/gRNA 분자 복합체의 전달 방법이 본 명세서에 제공된다.
개시된 실험 결과에 기반한, Cas9 분자/gRNA 분자 복합체 또는 이의 구성성분의 평가, 선택, 최적화 또는 설계 방법이 본 명세서에 제공된다. 특정 구현예에서, 이들 방법은 Cas9 분자/gRNA 분자 복합체 또는 이의 제제에서 Cas9 분자의 안정성 값(즉, 안정성과 상호연관되는 값(예를 들어, 열안정성 값 또는 활성 값))을 획득하거나 결정하는 단계를 포함한다. 특정 구현예에서, 안정성 값은 Cas9 분자/gRNA 분자 복합체 또는 이의 제제에서의 Cas9 분자의 열안정성 값 또는 활성 값일 수 있다. 특정 구현예에서, 열안정성 값은 Tm 값 또는 변성 온도 값일 수 있으며, 특정 구현예에서, 열안정성 값은 DSF를 사용하여 획득되거나 결정된다. 특정 구현예에서, 안정성 값을 gRNA 분자와 복합체화된 Cas9 분자에 대하여 획득한다. 다른 구현예에서, 안정성 값을 gRNA 분자의 존재 하의 Cas9 분자에 대하여 획득한다. 특정 구현예에서, 안정성 값을 열안정성 기준 값(즉, 열안정성과 상호연관되는 파라미터), 예를 들어, Tm 기준 값 또는 활성 기준 값(즉, 활성과 상호연관되는 파라미터), 예를 들어, 절단 활성, 예를 들어, 표적 DNA를 절단하는 능력과 비교한다. 예를 들어, 안정성 값은 Tm 값이며, Tm 값을 Tm 기준 값과 비교하여, Tm 값이 Tm 기준 값과 동일한지, 그보다 큰지, 또는 그보다 낮은지 여부를 결정할 수 있다.
특정 구현예에서, 본 명세서에 개시되는 방법을 사용하여, 최적의 Cas9 분자/gRNA 쌍형성, 예를 들어, 최대 안정성 또는 요망되는 표적 범위에 포함되는 안정성으로의 쌍형성을 선택하거나 설계한다. 특정 구현예에서, 상기 방법을 사용하여, 특정 Cas9 분자와의 쌍형성을 위한 하나 이상의 gRNA를 선택하거나 설계하여, 예를 들어, 안정성이 가장 크게, 특정 Cas9 분자와 복합체화하는 gRNA 분자를 확인한다. 다른 구현예에서, 상기 방법을 사용하여, 특정 gRNA 또는 gRNA의 세트와의 쌍형성을 위한 Cas9 분자를 선택하여, 예를 들어, 안정성이 가장 크게, 특정 gRNA(들)와 복합체화하는 Cas9 분자를 확인한다. 또 다른 구현예에서, 상기 방법을 사용하여, Cas9 분자/gRNA 분자 복합체에서의 쌍형성을 위한 Cas9 분자 및 gRNA 또는 gRNA의 세트 둘 모두를 선택한다.
특정 구현예에서, 복합체에서 Cas9 분자의 안정성과 상호연관되는 요망되는 값을 나타내는 Cas9 분자/gRNA 복합체 또는 이의 구성성분, 및 이들 복합체 또는 이의 구성성분을 포함하는 조성물 및 약제학적 제형이 본 명세서에 제공된다. 특정 구현예에서, 이러한 값은 Tm 또는 변성 온도일 수 있으며, 특정 구현예에서, 값은 DSF를 사용하여 획득되거나 결정된다. 이들 중 특정 구현예에서, 본 명세서에 제공되는 방법을 사용하여 복합체가 생성된다.
특정 구현예에서, 열안정성 값을 비교하는 단계를 포함하는 방법이 본 명세서에 제공된다. 특정 구현예에서, 상기 방법은 열안정성 값을 열안정성 기준 값과 비교하는 단계를 포함한다. 특정 구현예에서, 열안정성 기준 값은 미리 선택된 수치(여기서, 값은 단일의 수 또는 범위일 수 있음), 예를 들어, 열안정성에 대한 미리 선택된 수치, 예를 들어, Tm 값을 포함한다. 특정 구현예에서, 열안정성 기준 값은 a) 기준 Cas9 분자, 예를 들어, gRNA 분자의 부재 하의, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자(또는 상이한 Cas9 분자); b) 제2 gRNA 분자(즉, 평가 중인 복합체의 gRNA 이외의 gRNA)와 복합체화되는 기준 Cas9 분자(예를 들어, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자); 또는 c) 기준 Cas9 분자/gRNA 분자 복합체로서, 기준 Cas9 분자/gRNA 분자가 Cas9 분자/gRNA 분자 복합체와 상이한 조건 하에, 예를 들어, 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상이한 완충제에서 형성되는 기준 Cas9 분자/gRNA 분자 복합체의 열안정성과 상호연관되는 값일 수 있다.
특정 구현예에서, 기준 Cas9 분자가 본 명세서에 제공된다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자는 평가 중인 복합체의 Cas9 분자와 상이할 수 있으며, 예를 들어, 이와 일차 서열이 상이하다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 평가 중인 복합체의 gRNA 분자와 동일할 수 있다. 특정 구현예에서, 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자는 gRNA 분자와 상이할 수 있으며, 예를 들어, 서열이 상이하거나, 변형에 의해 상이하다.
본 명세서에 제공되는 특정 구현예에서, 델타 값(예를 들어, 델타 값은 2개의 값 간의 차이 또는 변화임)을 획득, 예를 들어, 결정할 수 있다. 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 안정성과 기준 값의 차이와 상호연관된 값을 포함할 수 있다. 특정 구현예에서, 델타 값은 평가 중인 Cas9 분자/gRNA 분자 복합체의 안정성, 예를 들어, 변성 온도 또는 Tm과; 기준 값, 예를 들어, 기준 Cas9 분자/gRNA 분자 복합체에 대한 값의 안정성, 예를 들어, 변성 온도 또는 Tm 사이의 차이와 상호연관된 값을 포함할 수 있다.
본 명세서에 제공되는 특정 구현예에서, 상기 방법은 델타 값을 델타 기준 값(예를 들어, 델타 값에 대한 기준 값)과 비교하는 단계를 포함할 수 있다. 특정 구현예에서, 이는 델타 값이 델타 기준 값 이하인지; 델타 기준 값 이상인지; 또는 미리 결정된 범위의 델타 기준 값 이내인지를 평가하는 것을 포함할 수 있다.
본 명세서에 제공되는 특정 구현예에서, 상기 방법은 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다. 특정 구현예에서, 상기 방법은 Cas9 분자/gRNA 분자 복합체의 값(예를 들어, 열안정성 값(예를 들어, Tm 값), 활성 값 또는 델타 값을 포함하지만 이들로 제한되지 않음)과 기준 값의 비교에 기반하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다. 특정 구현예에서, 기준 값은 미리 결정된 역치, 상한 값, 표적 값을 포함하지만, 이들로 제한되지 않을 수 있다. 특정 구현예에서, 값은 델타 값일 수 있다. 특정 구현예에서, 기준 값은 델타 기준 값일 수 있다.
특정 구현예에서, 상기 방법은 델타 값이 델타 기준 값 이하인지; 델타 기준 값 이상인지; 미리 결정된 델타 기준 값의 범위 이내인지를 평가하는 단계를 포함할 수 있다.
특정 구현예에서, 상기 방법은 또한 선택된 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)의 활성 또는 특성을 평가하거나 측정하는 단계를 포함할 수 있다. 특정 구현예에서, 활성은 절단 활성, 예를 들어, 절단 능력일 수 있다. 특정 구현예에서, 활성은 성공적으로 전달되는 능력일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.
특정 구현예에서, 평가 단계는 시스템, 예를 들어, 시험관내 시스템, 생체외 시스템 또는 생체내 시스템 및 분석, 예를 들어, 세포 분석 또는 모델, 예를 들어, 세포 또는 동물 모델에서 선택된 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)의 활성을 평가하거나 측정하는 것을 포함할 수 있다.
특정 구현예에서, 평가 단계는 선택된 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)의 활성을 평가하거나 측정하는 것을 포함할 수 있다. 특정 구현예에서, 활성은 절단 활성, 예를 들어, 삽입결실을 유도하는 능력, 표적 DNA를 변형시키는 능력, Cas9 분자/gRNA 분자 복합체에 의해 촉매작용되는 절단 사건을 매개하는 미리 선택된 수선 방법, 예를 들어, 본 명세서에 기재되는 경로, 예를 들어, HDR 또는 NHEJ의 경향일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.
특정 구현예에서, 상기 방법은 활성을 위하여 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다. 예를 들어, 활성은 절단 활성, 예를 들어, 삽입결실을 유도하는 능력; 표적 DNA를 변형시키는 능력; Cas9 분자/gRNA 분자 복합체에 의해 촉매작용되는 절단 사건을 매개하는 미리 선택된 수선 방법, 예를 들어, 본 명세서에 기재되는 경로, 예를 들어, HDR 또는 NHEJ의 경향일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.
특정 구현예에서, 상기 방법은 활성을 위하여 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 설계하거나 최적화시키는 단계를 포함할 수 있다. 예를 들어, 활성은 절단 활성, 예를 들어, 삽입결실을 유도하는 능력; 표적 DNA를 변형시키는 능력; Cas9 분자/gRNA 분자 복합체에 의해 촉매작용되는 절단 사건을 매개하는 미리 선택된 수선 방법, 예를 들어, 본 명세서에 기재되는 경로, 예를 들어, HDR 또는 NHEJ의 경향일 수 있다. 특정 구현예에서, 활성은 결합 활성, 예를 들어, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력일 수 있다.
특정 구현예에서, 상기 방법은 적어도 X가지의 Cas9 분자/gRNA 분자 복합체의 Cas9 분자의 안정성을 결정하는 단계를 포함할 수 있다. 특정 구현예에서, X는 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 500 또는 1,000일 수 있다. 특정 구현예에서, 안정성을 결정하는 단계는 Cas9 분자의 안정성 값을 측정하는 것을 포함할 수 있다. 특정 구현예에서, 안정성 값은 열안정성 값일 수 있다. 특정 구현예에서, 열안정성 값은 Tm 값일 수 있다. 특정 구현예에서, Tm 값은 DSF에 의해 결정될 수 있다.
특정 구현예에서, 안정성을 결정하는 단계는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자가 변성하는 온도를 결정하는 것, 예를 들어, Tm 값을 결정하는 것을 포함할 수 있다. 특정 구현예에서, Tm 값은 DSF에 의해 결정될 수 있다.
특정 구현예에서, 상기 방법은 Cas9 분자/gRNA 분자 복합체의 Cas9 분자가 변성하는 온도를 DSF에 의해 결정하는 단계, 예를 들어, 제1 Cas9 분자/gRNA 분자 복합체 및 제2 Cas9 분자/gRNA 분자 복합체에 대한 Tm 값을 결정하는 단계를 포함할 수 있다.
특정 구현예에서, 적어도 X가지의 Cas9 분자/gRNA 분자 복합체 중 제1 Cas9 분자/gRNA 분자 복합체 및 제2 Cas9 분자/gRNA 분자 복합체는 상이한 서열의 Cas9 분자를 갖는 것, 서열이 상이하거나 변형에 의해, 캡핑(capping) 또는 테일링(tailing)에 의해 상이한 gRNA 분자를 갖는 것, 상이한 조건, 예를 들어, 상이한 화학량론 하에 형성되는 것이 상이하다.
특정 구현예에서, 안정성의 결정에 대응하여, 최적화된 또는 미리 선택된 전달 특징을 위해 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택할 수 있으며, 예를 들어, 전달은 RNP 양이온성 지질 트랜스펙션, 바이러스 벡터(예를 들어, AAV) 또는 RNA 트랜스펙션에 의한 전달을 포함한다.
특정 구현예에서, 안정성의 결정에 대응하여, 품질 제어 표준과의 최적화된 또는 미리 선택된 관계를 위해 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.
특정 구현예에서, 안정성의 결정에 대응하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)는 품질 제어 또는 방출 표준을 만족시키는 것으로서 선택될 수 있다.
특정 구현예에서, 본 명세서의 방법은 열안정성 값, 예를 들어, Tm 값 또는 변성 온도 값 또는 델타 값이 기준 값 또는 델타 기준 값과 미리 선택된 관계를 가지면, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)를 선택하는 단계를 포함할 수 있다.
특정 구현예에서, 안정성의 결정에 대응하여, 최적화된 또는 미리 선택된 특징, 예를 들어, 절단 특징을 위해 Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.
특정 구현예에서, Cas9 분자/gRNA 분자 복합체에 대한 열안정성 값과 기준 분자, 예를 들어, gRNA 분자의 부재 하의 Cas9 분자의 열안정성 값 사이의 델타 값의 평가에 대응하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.
특정 구현예에서, Cas9 분자/gRNA 분자 복합체에 대한 활성 값과, 기준 분자, 예를 들어, gRNA 분자의 부재 하의 Cas9 분자의 활성 값 사이의 델타 값의 평가에 대응하여, Cas9 분자/gRNA 분자 복합체(또는 이의 구성성분)가 선택된다.
특정 구현예에서, 본 명세서의 방법은 후보 gRNA 분자의 라이브러리(또는 단일의 분자), 예를 들어, Cas9 분자와 복합체화된 tracrRNA 분자 또는 서열의 라이브러리를 평가하는 단계 및 Cas9 분자/후보 gRNA 분자 복합체의 안정성의 결정에 대응하여, 후보 gRNA 분자 또는 서열, 예를 들어, 후보 tracr gRNA 분자 또는 서열을 선택하는 단계를 포함할 수 있다.
특정 구현예에서, 라이브러리는 상이한 구조, 예를 들어, 상이한 길이, 상이한 서열의, 또는 상이한 변형을 갖는, 예를 들어, 추가의 포스페이트 기 또는 대안적인 5' 캡 구조를 갖는 tracr RNA 분자 또는 서열을 포함할 수 있다.
특정 구현예에서, tracr RNA 분자 또는 서열은 키메라 gRNA 상에 배치될 수 있다.
특정 구현예에서, 본 명세서의 방법은 구성성분을 포함하는 제제에서 Cas9 분자/gRNA 분자 복합체의 Cas9 분자의 안정성을 평가하는 것을 포함하여, Cas9 분자/gRNA 분자 제제에의 포함을 위해 구성성분을 평가하는 단계를 포함할 수 있다. 특정 구현예에서, 구성성분은 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 다른 완충제 구성성분을 포함할 수 있다.
특정 구현예에서, 본 명세서의 방법은 Cas9 분자/gRNA 분자 복합체의 Cas9 분자의 안정성을 평가하는 것을 포함하여, Cas9 분자/gRNA 분자 복합체에의 포함을 위하여 후보 Cas9 분자를 평가하는 단계를 포함할 수 있다. 특정 구현예에서, 후보 Cas9 분자는 키메라 Cas9 분자, 또는 합성 또는 조작된 Cas9 분자, 예를 들어, 부분 또는 부분들이 결실된 Cas9 분자를 포함할 수 있다.
특정 구현예에서, 안정성을 결정하는 단계는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자가 변성되는 온도, 예를 들어, Cas9 분자의 Tm을 시차 주사 형광측정법(DSF)에 의해 결정하는 것을 포함할 수 있다.
반응 혼합물이 본 명세서에 제공된다. 반응 혼합물은 Cas9 분자/gRNA 분자 복합체, 예를 들어, 본 명세서에 기재된 Cas9 분자/gRNA 분자 복합체; 및 신호 방출 화합물, 예를 들어, 염료를 포함할 수 있으며, 신호 방출은 Cas9 분자의 변성과 상호연관된다.
그 안에 Cas9 분자/gRNA 분자 복합체; 및 신호 방출 화합물, 예를 들어, 염료가 배치된 시차 주사 형광측정계(DSF)가 본 명세서에 제공되며, 신호 방출은 Cas9 분자의 변성과 상호연관된다.
본 명세서에 기재된 방법에 의해 평가되거나, 선택되거나, 최적화되거나, 선택되는 Cas9 분자/gRNA 분자 복합체가 본 명세서에 제공된다.
본 명세서에 기재된 방법에 의해 선택되거나 설계된 Cas9 분자/gRNA 분자 복합체를 포함하는 조성물이 본 명세서에 제공된다. 특정 구현예에서, 조성물은 약제학적 조성물일 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체는 약제학적으로 허용되는 담체에서 제형화될 수 있다.
본 명세서에 논의된 바와 같이, 본 명세서에 개시된 방법을 사용하여 제형 또는 전달을 위해 최적화된 복합체를 평가하거나, 선택하거나, 설계할 수 있다. 예를 들어, 본 명세서에 기재된 방법은 임의의 전달 방법, 예를 들어, 비제한적으로, RNP 양이온성 지질 트랜스펙션, 바이러스 벡터(예를 들어, AAV) 또는 RNA 트랜스펙션을 사용하여 키메라 gRNA 또는 tracrRNA와 Cas9 분자(예를 들어, Cas9 단백질)의 복합체 형성을 개선시키기 위해 다수의 방식으로 사용될 수 있다.
본 명세서에 논의된 방법은 품질 제어를 위해 또는 방출 표준이 단백질 및 RNA 구성성분 둘 모두에 대하여 충족되는지를 결정하기 위해 사용될 수 있다. 예를 들어, 열 변화에 대한 표준이 충족되지 않는다면, 예를 들어, Cas9 단백질을 RNA와 인큐베이션시키는 경우 열 변화가 존재하지 않는 경우, 불충분한 품질의 Cas9 분자 또는 gRNA 분자를 나타낸다. 일 구현예에서, 상기 방법은 예를 들어, 불순물의 검출 및 제거에 의하여 이러한 문제를 해결하기 위한 지침 또는 공정 제어로 사용된다.
본 명세서에 기재된 방법은 Cas9/gRNA 복합체에 사용하기 위하여 후보 Cas9 분자 또는 후보 gRNA 분자의 라이브러리를 평가하기 위해 사용될 수 있다. 일 구현예에서, 상기 방법에 의해 최적화된 결합을 위한 구성성분이 확인된다. 이는 최적화된 표적 절단 또는 기타 특성에 대한 후보의 스크리닝을 가능하게 할 수 있다. 또한, 본 명세서에 기재된 방법을 사용하여, gRNA의 길이 및 조성의 변형을 평가할 수 있다. 예를 들어, 돌연변이 Cas9 단백질을 정제한 후에, gRNA 분자(예를 들어, tracrRNA 분자) 또는 서열의 라이브러리를 미리 선택된 비로, 예를 들어, 최소 1:1의 RNA:단백질 비로 단백질과 인큐베이션시킬 수 있다. gRNA 분자의 부재 하의 Cas9 단백질과 비교하는 경우 관찰되는 열 변화의 출현은 효율적인 gRNA 분자, 예를 들어, 시험관내, 생체외 또는 생체내에서 하나 이상의 CRISPR/Cas-관련 활성을 매개할 수 있는 gRNA 분자를 나타낸다.
본 명세서에 기재된 방법을 사용하여 상이한 길이의 tracr-영역을 갖는 gRNA 분자(예를 들어, tracrRNA 분자) 또는 서열의 라이브러리를 스크리닝하고, 상이한 링커 서열과 융합된 동족 가이드 서열과 조합하고, DSF를 사용하여 결합에 대하여 분석할 수 있다. 잘 결합된 복합체를 시험관내에서 절단 활성에 대하여 스크리닝할 수 있다. 본 명세서에 기재된 방법은 절단, 전달을 위한 적합성 또는 본 명세서에 논의된 기타 특징에서의 효과에 대한, RNA, 추가의 포스페이트 기 또는 대안적인 5' 캡 구조의 화학적 변형의 평가를 가능하게 한다.
본 명세서에 기재된 방법을 사용하여 Cas9 분자 및 gRNA 분자의 상호작용을 안정화하기 위해 구성성분, 예를 들어, 첨가제, 소분자 안정화 시약, 완충제, 염, 예를 들어, 염 몰농도, 글리세롤 농도 및 기타 완충제 구성성분의 라이브러리를 스크리닝할 수 있다.
본 명세서에 기재된 방법을 사용하여 Cas9 분자와 gRNA 분자의 상호작용을 안정화시키기 위하여 키메라, 조작된 또는 합성 Cas9 분자, 예를 들어, 키메라 또는 조작된 Cas9 분자의 라이브러리를 스크리닝할 수 있다. 불충분한 열 변화는 RNA 결합이 준최적이거나 파괴되는 것을 나타낸다. 부분적인 열 변화는 RNA가 생산적으로 결합함을 암시할 것이다. DSF Tm을 갖지 않는 키메라 또는 조작된 Cas9 분자에 있어서, DSF에 의해 측정시 결합의 복구에 대하여 gRNA 분자(예를 들어, tracrRNA 분자) 또는 서열의 라이브러리를 스크리닝할 수 있다.
비활성으로 인지되는 Cas9 분자는 핵산 분자 라이브러리, 예를 들어, 무작위화 핵산 라이브러리에 대한 열안정성 분석에 사용될 수 있다. 이것은 tracrRNA의 역할을 충족시킬 수 있는 신규한 분자에 대한 스크리닝을 가능하게 할 것이다. 이러한 새로 발견된 핵산 분자(예를 들어, tracrRNA 분자)를 사용하여, 게놈 DNA, 생체내 RNA 및/또는 침입성 유기체 및 바이러스로부터의 유전 물질을 표적화하는 새로운 gRNA를 개발할 수 있다.
본 명세서에 기재된 방법은 임의의 돌연변이 및 키메라 형태의 Cas9 분자에 적용될 수 있다. 또한, 본 명세서에 기재된 방법이 다른 Cas 분자, 예를 들어, 본 명세서에 기재된 다른 Cas 분자에 적용될 수 있는 것이 이해된다.
가이드 RNA(gRNA) 분자
gRNA 분자는 상기 용어가 본 명세서에 사용되는 바와 같이, 표적 핵산에 대한 gRNA 분자/Cas9 분자 복합체의 특이적 표적화 또는 귀소(homing)를 촉진시키는 핵산을 지칭한다. gRNA 분자는 본 명세서에서 때때로 "키메라" gRNA 또는 모듈(하나 초과, 전형적으로 2개의 개별 RNA 분자 포함)로서 지칭되는 단분자(단일 RNA 분자를 가짐)일 수 있다. 본 명세서에 제공되는 gRNA 분자는 표적 핵산 서열에 완전히 또는 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진 표적화 도메인을 포함한다. 특정 구현예에서, gRNA 분자는 예를 들어, 제1 상보성 도메인, 연결 도메인, 제2 상보성 도메인, 근위 도메인, 꼬리 도메인 및/또는 5' 연장 도메인을 포함하는 하나 이상의 추가의 도메인을 추가로 포함한다. 이들 도메인의 각각은 하기에 상세히 논의된다. 특정 구현예에서, gRNA 분자에서 도메인 중 하나 이상은 예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스로부터의 자연 발생 서열과 동일하거나, 또는 이와 서열 상동성을 공유하는 아미노산 서열을 포함한다.
몇몇의 예시적인 gRNA 구조는 도 1a 내지 도 1i에 제공되어 있다. gRNA의 3차원 형태, 또는 활성 형태의 가닥내(intra-strand) 또는 가닥간(inter-strand) 상호작용과 관련하여, 높은 상보성의 영역은 때때로 도 1a 내지 도 1i 및 본 명세서에 제공되는 다른 묘사에 듀플렉스로 나타낸다. 도 7은 tracrRNA-유래 영역 내에 하나의 헤어핀 루프를 함유하는 서열번호 42의 gRNA 서열을 사용한 gRNA 도메인 명명법을 예시한 것이다. 특정 구현예에서, gRNA는 이러한 영역에 1개 초과의(예를 들어, 2개, 3개 이상의) 헤어핀 루프를 함유할 수 있다(예를 들어, 도 1h 내지 도 1i 참조).
특정 구현예에서, 단분자, 또는 키메라, gRNA는 바람직하게는 5'에서 3'으로:
표적 핵산 서열에 완전히 또는 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진 표적화 도메인;
제1 상보성 도메인;
연결 도메인;
제2 상보성 도메인(제1 상보성 도메인에 상보적임);
근위 도메인; 및
선택적으로, 꼬리 도메인을 포함한다.
특정 구현예에서, 모듈 gRNA는:
바람직하게는 5'에서 3'으로,
표적 핵산 서열에 완전히 또는 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진 표적화 도메인; 및
제1 상보성 도메인을 포함하는 제1 가닥; 및
바람직하게는 5'에서 3'으로,
선택적으로, 5' 연장 도메인;
제2 상보성 도메인;
근위 도메인; 및
선택적으로, 꼬리 도메인을 포함하는 제2 가닥을 포함한다.
표적화 도메인
표적화 도메인(때때로 대안적으로 가이드 서열 또는 상보성 영역으로서 지칭됨)은 표적 핵산에 상보적이거나 부분적으로 상보적인 핵산 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진다. 표적화 도메인의 전부 또는 일부가 상보적이거나, 부분적으로 상보적인 핵산 서열은 본 명세서에 표적 도메인으로 지칭된다. 표적화 도메인의 선택 방법은 해당 분야에 알려져 있다(예를 들어, 문헌[Fu 2014]; 문헌[Sternberg 2014] 참조).
표적 도메인을 포함하는 표적 핵산의 가닥은 그것이 표적화 도메인 서열에 상보적이기 때문에, 본 명세서에서 상보적 가닥으로 지칭된다. 표적화 도메인이 gRNA 분자의 부분이기 때문에, 그것은 티민(T)보다는 염기 우라실(U)을 포함하며; 역으로, gRNA 분자를 인코딩하는 임의의 DNA 분자는 우라실보다는 티민을 포함할 것이다. 표적화 도메인/표적 도메인 쌍에서, 표적화 도메인 내의 우라실 염기는 표적 도메인 내의 아데닌 염기와 쌍을 형성할 것이다. 특정 구현예에서, 표적화 도메인과 표적 도메인 간의 상보성 정도는 표적 핵산으로의 gRNA 분자/Cas9 분자 복합체의 표적화를 가능하게 하기에 충분하다.
특정 구현예에서, 표적화 도메인은 코어 도메인 및 선택적인 2차 도메인을 포함한다. 이들 중 특정 구현예에서, 코어 도메인은 2차 도메인에 대하여 3'에 위치하며, 이들 중 특정 구현예에서, 코어 도메인은 표적화 도메인의 3' 말단에 또는 그 근처에 위치한다. 이들 중 특정 구현예에서, 코어 도메인은 표적화 도메인의 3' 말단에서 약 8개 내지 약 13개의 뉴클레오타이드로 이루어지거나, 본질적으로 이로 이루어진다. 특정 구현예에서, 오직 코어 도메인만이 표적 도메인의 상응하는 부분에 상보적이거나 부분적으로 상보적이며, 이들 중 특정 구현예에서, 코어 도메인은 표적 도메인의 상응하는 부분에 완전히 상보적이다. 다른 구현예에서, 2차 도메인은 또한, 표적 도메인의 일부에 상보적이거나 부분적으로 상보적이다. 특정 구현예에서, 코어 도메인은 표적 도메인 내의 코어 도메인 표적에 상보적이거나 부분적으로 상보적인 한편, 2차 도메인은 표적 도메인 내의 2차 도메인 표적에 상보적이거나 부분적으로 상보적이다. 특정 구현예에서, 코어 도메인 및 2차 도메인은 표적 도메인의 그들의 각각의 상응하는 부분과 동일한 상보성 정도를 갖는다. 다른 구현예에서, 코어 도메인과 그의 표적 간의 상보성 정도 및 2차 도메인과 그의 표적 간의 상보성 정도는 상이할 수 있다. 이들 중 특정 구현예에서, 코어 도메인은 그의 표적에 대하여 2차 도메인보다 더 큰 상보성 정도를 가질 수 있는 한편, 다른 구현예에서, 2차 도메인은 코어 도메인보다 더 높은 상보성 정도를 가질 수 있다.
특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 도메인은 3개 내지 100개, 5개 내지 100개, 10개 내지 100개, 또는 20개 내지 100개 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 표적화 도메인 또는 코어 도메인은 3개 내지 15개, 3개 내지 20개, 5개 내지 20개, 10개 내지 20개, 15개 내지 20개, 5개 내지 50개, 10개 내지 50개, 또는 20개 내지 50개의 뉴클레오타이드 길이이다. 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 도메인은 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 도메인은 6+/-2개, 7+/-2개, 8+/-2개, 9+/-2개, 10+/-2개, 10+/-4개, 10 +/-5개, 11+/-2개, 12+/-2개, 13+/-2개, 14+/-2개, 15+/-2개, 또는 16+-2개, 20+/-5개, 30+/-5개, 40+/-5개, 50+/-5개, 60+/-5개, 70+/-5개, 80+/-5개, 90+/-5개, 또는 100+/-5개의 뉴클레오타이드 길이이다.
표적화 도메인이 코어 도메인을 포함하는 특정 구현예에서, 코어 도메인은 3개 내지 20개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 코어 도메인은 5개 내지 15개 또는 8개 내지 13개의 뉴클레오타이드 길이이다. 표적화 도메인이 2차 도메인을 포함하는 특정 구현예에서, 2차 도메인은 0개, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개 또는 15개의 뉴클레오타이드 길이이다. 표적화 도메인이 8개 내지 13개의 뉴클레오타이드 길이인 코어 도메인을 포함하는 특정 구현예에서, 각각 표적화 도메인은 26개, 25개, 24개, 23개, 22개, 21개, 20개, 19개, 18개, 17개 또는 16개의 뉴클레오타이드 길이이며, 2차 도메인은 13개 내지 18개, 12개 내지 17개, 11개 내지 16개, 10개 내지 15개, 9개 내지 14개, 8개 내지 13개, 7개 내지 12개, 6개 내지 11개, 5개 내지 10개, 4개 내지 9개, 또는 3개 내지 8개의 뉴클레오타이드 길이이다.
특정 구현예에서, 표적화 도메인은 표적 도메인에 완전히 상보적이다. 이와 같이, 표적화 도메인은 코어 도메인 및/또는 2차 도메인을 포함하며, 특정 구현예에서, 코어 도메인 및 2차 도메인 중 하나 또는 둘 모두는 표적 도메인의 상응하는 부분에 완전히 상보적이다. 다른 구현예에서, 표적화 도메인은 표적 도메인에 부분적으로 상보적이며, 표적화 도메인이 코어 도메인 및/또는 2차 도메인을 포함하는 이들 중 특정 구현예에서, 코어 도메인 및 2차 도메인 중 하나 또는 둘 모두는 표적 도메인의 상응하는 부분에 부분적으로 상보적이다. 이들 중 특정 구현예에서, 표적화 도메인 또는, 표적화 도메인 내의 코어 도메인 또는 표적화 도메인의 핵산 서열은 표적 도메인에 또는 표적 도메인의 상응하는 부분에 적어도 80%, 85%, 90% 또는 95% 상보적이다. 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 또는 2차 도메인은 표적 도메인 또는 이의 부분과 상보적이지 않은 하나 이상의 뉴클레오타이드를 포함하며, 이들 중 특정 구현예에서, 표적화 도메인 및/또는 표적화 도메인 내의 코어 또는 2차 도메인은 표적 도메인과 상보적이지 않은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개의 뉴클레오타이드를 포함한다. 특정 구현예에서, 코어 도메인은 표적 도메인의 상응하는 부분과 상보적이지 않은 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드를 포함한다. 표적화 도메인이 표적 도메인과 상보적이지 않은 하나 이상의 뉴클레오타이드를 포함하는 특정 구현예에서, 상기 비-상보적 뉴클레오타이드 중 하나 이상은 표적화 도메인의 5' 또는 3' 말단의 5개 뉴클레오타이드 이내에 위치한다. 이들 중 특정 구현예에서, 표적화 도메인은 그의 5' 말단, 3' 말단 또는 그의 5' 및 3' 말단 둘 모두의 5개 뉴클레오타이드 이내에 표적 도메인에 상보적이지 않은 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드를 포함한다. 표적화 도메인이 표적 도메인에 상보적이지 않은 2개 이상의 뉴클레오타이드를 포함하는 특정 구현예에서, 상기 비-상보적 뉴클레오타이드 중 2개 이상은 서로 인접하며, 이들 중 특정 구현예에서, 2개 이상의 연속 비-상보적 뉴클레오타이드는 표적화 도메인의 5' 또는 3' 말단의 5개 뉴클레오타이드 내에 위치한다. 다른 구현예에서, 2개 이상의 연속 비-상보적 뉴클레오타이드는 둘 모두 표적화 도메인의 5' 및 3' 말단으로부터 5개 초과의 뉴클레오타이드에 위치한다.
특정 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인, 또는 그 안의 하나 이상의 뉴클레오타이드는 하기 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 표적화 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 표적화 도메인, 코어 도메인 및/또는 2차 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 도메인 및/또는 표적화 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 표적화 도메인 및/또는 코어 또는 2차 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 표적화 도메인 및/또는 코어 또는 2차 도메인은 그들의 각각의 5' 말단의 5개의 뉴클레오타이드 내의 1개, 2개, 3개 또는 4개의 변형 및/또는 그들의 각각의 3' 말단의 5개의 뉴클레오타이드 내의 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 표적화 도메인 및/또는 코어 또는 2차 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.
표적화 도메인이 코어 및 2차 도메인을 포함하는 특정 구현예에서, 코어 및 2차 도메인은 동일한 수의 변형을 함유한다. 이들 중 특정 구현예에서, 둘 모두의 도메인에는 변형이 없다. 다른 구현예에서, 코어 도메인은 2차 도메인보다 더 많은 변형을 포함하거나 또는 그 반대이다.
특정 구현예에서, 코어 또는 2차 도메인을 포함하는 표적화 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템을 사용하여 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는, 후보 표적화 도메인을 갖는 gRNA는 하기 기재된 시스템을 사용하여 평가될 수 있다. 후보 표적화 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.
특정 구현예에서, 변형된 뉴클레오타이드의 전부는 표적 도메인에 존재하는 상응하는 뉴클레오타이드에 상보적이며, 이에 혼성화할 수 있다. 또 다른 구현예에서, 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형된 뉴클레오타이드는 표적 도메인에 존재하는 상응하는 뉴클레오타이드에 상보적이지 않거나 이에 혼성화할 수 없다.
도 1a 내지 도 1i는 gRNA 분자 내의 표적화 도메인의 배치의 예를 제공한다.
제1 및 제2 상보성 도메인
제1 및 제2 상보성(때때로 대안적으로 각각 crRNA-유래 헤어핀 서열 및 tracrRNA-유래 헤어핀 서열로 지칭) 도메인은 서로 완전히 또는 부분적으로 상보적이다. 특정 구현예에서, 상보성 정도는 적어도 일부의 생리학적 조건 하에서 2개의 도메인이 듀플렉스 영역을 형성하기에 충분하다. 모듈 gRNA 분자에서, 2개의 분자는 상보성 도메인의 혼성화 때문에 회합된다(예를 들어, 도 1a 참조). 특정 구현예에서, gRNA의 다른 특성과 함께 제1 및 제2 상보성 도메인 간의 상보성의 정도는 Cas9 분자의 표적화가 핵산을 표적화하기에 충분하다. 제1 및 제2 상보성 도메인의 예는 도 1a 내지 도 1g에 나타나 있다.
특정 구현예(예를 들어, 도 1a 및 도 1b 참조)에서, 제1 및/또는 제2 상보성 도메인은 상응하는 상보성 도메인과의 상보성이 결여된 하나 이상의 뉴클레오타이드를 포함한다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 상응하는 상보성 도메인과 상보적이지 않은 1개, 2개, 3개, 4개, 5개 또는 6개의 뉴클레오타이드를 포함한다. 예를 들어, 제2 상보성 도메인은 제1 상보성 도메인 내의 상응하는 뉴클레오타이드와 쌍을 형성하지 않는 1개, 2개, 3개, 4개, 5개 또는 6개의 뉴클레오타이드를 함유할 수 있다. 특정 구현예에서, 상응하는 상보성 도메인과 상보적이지 않은 제1 또는 제2 상보성 도메인 상의 뉴클레오타이드는 제1 및 제2 상보성 도메인 사이에 형성된 듀플렉스로부터 루프-아웃(loop-out)된다. 이들 중 특정 구현예에서, 쌍을 형성하지 않는 루프-아웃은 제2 상보성 도메인 상에 위치하며, 이들 중 특정 구현예에서, 쌍을 형성하지 않는 영역은 제2 상보성 도메인의 5' 말단으로부터 1개, 2개, 3개, 4개, 5개 또는 6개의 뉴클레오타이드에서 시작한다.
특정 구현예에서, 제1 상보성 도메인은 5개 내지 30개, 5개 내지 25개, 7개 내지 25개, 5개 내지 24개, 5개 내지 23개, 7개 내지 22개, 5개 내지 22개, 5개 내지 21개, 5개 내지 20개, 7개 내지 18개, 7개 내지 15개, 9개 내지 16개 또는 10개 내지 14개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 제1 상보성 도메인은 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인은 5개 내지 27개, 7개 내지 27개, 7개 내지 25개, 5개 내지 24개, 5개 내지 23개, 5개 내지 22개, 5개 내지 21개, 7개 내지 20개, 5개 내지 20개, 7개 내지 18개, 7개 내지 17개, 9개 내지 16개 또는 10개 내지 14개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 제2 상보성 도메인은 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제1 및 제2 상보성 도메인은 각각 독립적으로 6+/-2개, 7+/-2개, 8+/-2개, 9+/-2개, 10+/-2개, 11+/-2개, 12+/-2개, 13+/-2개, 14+/-2개, 15+/-2개, 16+/-2개, 17+/-2개, 18+/-2개, 19+/-2개 또는 20+/-2개, 21+/-2개, 22+/-2개, 23+/-2개 또는 24+/-2개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인은 제1 상보성 도메인보다 더 길며, 예를 들어, 2개, 3개, 4개, 5개 또는 6개 뉴클레오타이드가 더 길다.
특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로 3개의 서브도메인을 포함하며, 5'에서 3' 방향으로, 5' 서브도메인, 중앙 서브도메인 및 3' 서브도메인이다. 특정 구현예에서, 제1 상보성 도메인의 5' 서브도메인 및 3' 서브도메인은 제2 상보성 도메인의 각각 3' 서브도메인 및 5' 서브도메인에 완전히 또는 부분적으로 상보적이다.
특정 구현예에서, 제1 상보성 도메인의 5' 서브도메인은 4개 내지 9개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 5' 도메인은 4개, 5개, 6개, 7개, 8개 또는 9개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인의 5' 서브도메인은 3개 내지 25개, 4개 내지 22개, 4개 내지 18개 또는 4개 내지 10개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 5' 도메인은 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제1 상보성 도메인의 중앙 서브도메인은 1개, 2개 또는 3개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인의 중앙 서브도메인은 1개, 2개, 3개, 4개 또는 5개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제1 상보성 도메인의 3' 서브도메인은 3개 내지 25개, 4개 내지 22개, 4개 내지 18개 또는 4개 내지 10개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 3' 서브도메인은 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 제2 상보성 도메인의 3' 서브도메인은 4개 내지 9개, 예를 들어, 4개, 5개, 6개, 7개, 8개 또는 9개의 뉴클레오타이드 길이이다.
제1 및/또는 제2 상보성 도메인은 자연 발생 또는 기준 제1 및/또는 제2 상보성 도메인과 상동성을 공유하거나, 그로부터 유래될 수 있다. 이들 중 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 자연 발생 또는 기준 제1 및/또는 제2 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖거나, 그와 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다. 이들 중 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 스트렙토코커스 피오게네스 또는 스타필로코커스 아우레우스로부터의 제1 및/또는 제2 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가질 수 있다.
특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 제1 및/또는 제2 상보성 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 하기 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 표적화 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 제1 및/또는 제2 상보성 도메인 및/또는 제1 및/또는 제2 상보성 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로, 그들의 각각의 5' 말단, 3' 말단 또는 그들의 5' 및 3' 말단 둘 모두의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 다른 구현예에서, 제1 및/또는 제2 상보성 도메인은 각각 독립적으로, 그들의 각각의 5' 말단, 3' 말단 또는 그들의 5' 및 3' 말단 둘 모두의 5개의 뉴클레오타이드 내에 변형을 함유하지 않는다. 특정 구현예에서, 제1 및 제2 상보성 도메인 중 하나 또는 둘 모두는 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.
특정 구현예에서, 제1 및/또는 제2 상보성 도메인 내의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템에서 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는, 후보 제1 또는 제2 상보성 도메인을 갖는 gRNA는 하기 기재된 시스템을 사용하여 평가될 수 있다. 후보 상보성 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.
특정 구현예에서, 제1 및 제2 상보성 도메인에 의해 형성되는 듀플렉스 영역은 예를 들어, 임의의 루프 아웃된 또는 쌍을 형성하지 않은 뉴클레오타이드를 배제하여, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22 bp 길이이다.
특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 11개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 48의 gRNA 참조). 특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 15개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 50의 gRNA 참조). 특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 16개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 51의 gRNA 참조). 특정 구현예에서, 제1 및 제2 상보성 도메인은 듀플렉스인 경우, 21개의 쌍을 형성하는 뉴클레오타이드를 포함한다(예를 들어, 서열번호 29의 gRNA 참조).
특정 구현예에서, 제1 및 제2 상보성 도메인 사이에서 하나 이상의 뉴클레오타이드를 교환하여, 폴리-U 트랙트(trat)를 제거한다. 예를 들어, 서열번호 48의 gRNA의 뉴클레오타이드 23 및 48 또는 뉴클레오타이드 26 및 45를 교환하여, 각각 서열번호 49 또는 31의 gRNA를 생성할 수 있다. 유사하게, 서열번호 29의 gRNA의 뉴클레오타이드 23 및 39를 뉴클레오타이드 50 및 68과 교환하여, 서열번호 30의 gRNA를 생성할 수 있다.
연결 도메인
연결 도메인은 단분자 또는 키메라 gRNA 내의 제1 및 제2 상보성 도메인 사이에 배치되며, 이들을 연결시키는 역할을 한다. 도 1b 내지 도 1e는 연결 도메인의 예를 제공한다. 특정 구현예에서, 연결 도메인의 부분은 crRNA-유래 영역으로부터의 것이며, 다른 부분은 tracrRNA-유래 영역으로부터의 것이다.
특정 구현예에서, 연결 도메인은 제1 및 제2 상보성 도메인을 공유적으로 연결시킨다. 이들 중 특정 구현예에서, 연결 도메인은 공유 결합으로 이루어지거나, 이를 포함한다. 다른 구현예에서, 연결 도메인은 제1 및 제2 상보성 도메인을 비공유적으로 연결시킨다. 특정 구현예에서, 연결 도메인은 10개 이하의 뉴클레오타이드 길이, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오타이드이다. 다른 구현예에서, 연결 도메인은 10개 초과의 길이, 예를 들어, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개 이상의 뉴클레오타이드이다. 특정 구현예에서, 연결 도메인은 2개 내지 50개, 2개 내지 40개, 2개 내지 30개, 2개 내지 20개, 2개 내지 10개, 2개 내지 5개, 10개 내지 100개, 10개 내지 90개, 10개 내지 80개, 10개 내지 70개, 10개 내지 60개, 10개 내지 50개, 10개 내지 40개, 10개 내지 30개, 10개 내지 20개, 10개 내지 15개, 20개 내지 100개, 20개 내지 90개, 20개 내지 80개, 20개 내지 70개, 20개 내지 60개, 20개 내지 50개, 20개 내지 40개, 20개 내지 30개 또는 20개 내지 25개의 뉴클레오타이드 길이이다. 특정 구현예에서, 연결 도메인은 10+/-5개, 20+/-5개, 20+/-10개, 30+/-5개, 30+/-10개, 40+/-5개, 40+/-10개, 50+/-5개, 50+/-10개, 60+/-5개, 60+/-10개, 70+/-5개, 70+/-10개, 80+/-5개, 80+/-10개, 90+/-5개, 90+/-10개, 100+/-5개 또는 100+/-10개의 뉴클레오타이드 길이이다.
특정 구현예에서, 연결 도메인은 자연 발생 서열, 예를 들어, 제2 상보성 도메인에 대해 5'의 tracrRNA의 서열과 상동성을 공유하거나 그로부터 유래된다. 특정 구현예에서, 연결 도메인은 본 명세서에 개시된 연결 도메인, 예를 들어, 도 1b 내지 도 1e의 연결 도메인과 적어도 50%, 60%, 70%, 80%, 90% 또는 95%의 상동성을 갖거나, 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.
특정 구현예에서, 연결 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 연결 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 하기 기재된 변형을 포함하나 이에 한정되지 않는 변형을 갖는다. 특정 구현예에서, 연결 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 연결 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 연결 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 연결 도메인 및/또는 연결 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 연결 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 연결 도메인은 그의 5' 말단 및/또는 3' 말단의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 연결 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.
특정 구현예에서, 연결 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템을 사용하여 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는 후보 연결 도메인을 갖는 gRNA는 하기 기재된 시스템에서 평가될 수 있다. 후보 연결 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.
특정 구현예에서, 연결 도메인은 전형적으로, 제1 상보성 도메인의 3' 말단 및/또는 제2 상보성 도메인의 5' 말단의 1개, 2개 또는 3개 뉴클레오타이드에 인접한, 또는 그 내의 듀플렉스 영역을 포함한다. 이들 중 특정 구현예에서, 연결 영역의 듀플렉스 영역은 10+/-5, 15+/-5, 20+/-5, 20+/-10 또는 30+/-5 bp 길이이다. 특정 구현예에서, 연결 도메인의 듀플렉스 영역은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15 bp 길이이다. 특정 구현예에서, 연결 도메인의 듀플렉스 영역을 형성하는 서열은 완전히 상보적이다. 다른 구현예에서, 듀플렉스 영역을 형성하는 서열 중 하나 또는 둘 모두는 다른 듀플렉스 서열과 상보적이지 않은 하나 이상의 뉴클레오타이드(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개의 뉴클레오타이드)를 함유한다.
5' 연장 도메인
특정 구현예에서, 본 명세서에 개시된 모듈 gRNA는 제2 상보성 도메인에 대해 5'에 5' 연장 도메인, 즉, 하나 이상의 추가의 뉴클레오타이드를 포함한다(예를 들어, 도 1a 참조). 특정 구현예에서, 5' 연장 도메인은 2개 내지 10개 이상, 2개 내지 9개, 2개 내지 8개, 2개 내지 7개, 2개 내지 6개, 2개 내지 5개, 또는 2개 내지 4개의 뉴클레오타이드 길이이며, 이들 중 특정 구현예에서, 5' 연장 도메인은 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이상의 뉴클레오타이드 길이이다.
특정 구현예에서, 5' 연장 도메인 뉴클레오타이드는 변형, 예를 들어, 하기에 제공되는 유형의 변형을 포함하지 않는다. 그러나, 특정 구현예에서, 5' 연장 도메인은 하나 이상의 변형, 예를 들어, 그것을 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만드는 변형을 포함한다. 예로서, 5' 연장 도메인의 백본은 포스포로티오에이트 또는 하기 기재된 다른 변형(들)으로 변형될 수 있다. 특정 구현예에서, 5' 연장 도메인의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화 또는 하기 기재된 다른 변형(들)을 포함할 수 있다.
특정 구현예에서, 5' 연장 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개만큼 많은 변형을 포함할 수 있다. 특정 구현예에서, 5' 연장 도메인은 예를 들어, 모듈 gRNA 분자에서, 그의 5' 말단의 5개 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개만큼 많은 변형을 포함한다. 특정 구현예에서, 5' 연장 도메인은, 예를 들어, 모듈 gRNA 분자에서, 그의 3' 말단의 5개 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개만큼 많은 변형을 포함한다.
특정 구현예에서, 5' 연장 도메인은 2개의 연속 뉴클레오타이드, 예를 들어, 5' 연장 도메인의 5' 말단의 5개 뉴클레오타이드 내에 있거나, 5' 연장 도메인의 3' 말단의 5개 뉴클레오타이드 내에 있거나, 또는 5' 연장 도메인의 말단 중 하나 또는 둘 다로부터 5개 초과의 뉴클레오타이드만큼 떨어진 2개의 연속 뉴클레오타이드에서 변형을 포함한다. 특정 구현예에서, 2개의 연속 뉴클레오타이드는 5' 연장 도메인의 5' 말단의 5개 뉴클레오타이드 내에서, 5' 연장 도메인의 3' 말단의 5개 뉴클레오타이드 내에서, 또는 5' 연장 도메인의 말단 중 하나 또는 둘 다로부터 5개 초과의 뉴클레오타이드만큼 떨어진 영역 내에서 변형되지 않는다. 특정 구현예에서, 뉴클레오타이드는 5' 연장 도메인의 5' 말단의 5개 뉴클레오타이드 내에서, 5' 연장 도메인의 3' 말단의 5개 뉴클레오타이드 내에서, 또는 5' 연장 도메인의 말단 중 하나 또는 둘 다로부터 5개 초과의 뉴클레오타이드만큼 떨어진 영역 내에서 변형되지 않는다.
5' 연장 도메인 내의 변형은 하기에 기재된 시스템에서 후보 변형을 시험함으로써 평가될 수 있는 gRNA 분자 효능을 방해하지 않도록 선택될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는 후보 5' 연장 도메인을 갖는 gRNA는 하기에 기재된 시스템에서 평가될 수 있다. 후보 5' 연장 도메인은 선택된 표적과 기능성인 것으로 알려진 gRNA 분자/Cas9 분자 시스템에서 단독으로, 또는 하나 이상의 다른 후보 변화와 함께 배치하고, 평가할 수 있다.
특정 구현예에서, 5' 연장 도메인은 기준 5' 연장 도메인, 예를 들어, 자연 발생, 예를 들어, 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스, 5' 연장 도메인, 또는 본 명세서에 기재된 5' 연장 도메인과, 예를 들어, 도 1a 내지 도 1g와 적어도 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지거나, 또는 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.
근위 도메인
도 1a 내지 도 1g는 근위 도메인의 예를 제공한다.
특정 구현예에서, 근위 도메인은 5개 내지 20개 이상의 뉴클레오타이드 길이, 예를 들어, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, 근위 도메인은 6+/-2개, 7+/-2개, 8+/-2개, 9+/-2개, 10+/-2개, 11+/-2개, 12+/-2개, 13+/-2개, 14+/-2개, 14+/-2개, 16+/-2개, 17+/-2개, 18+/-2개, 19+/-2개 또는 20+/-2개의 뉴클레오타이드 길이이다. 특정 구현예에서, 근위 도메인은 5개 내지 20개, 7개 내지 18개, 9개 내지 16개 또는 10개 내지 14개의 뉴클레오타이드 길이이다.
특정 구현예에서, 근위 도메인은 자연 발생 근위 도메인과 상동성을 공유하거나, 그로부터 유래될 수 이다. 이들 중 특정 구현예에서, 근위 도메인은 본 명세서에 개시된 근위 도메인, 예를 들어, 도 1a 내지 도 1g에 기재된 것들을 포함하는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스 근위 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖거나, 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.
특정 구현예에서, 근위 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 근위 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 본 명세서에서 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 근위 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 근위 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 근위 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 근위 도메인 및/또는 근위 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 근위 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 근위 도메인은 그의 5' 말단 및/또는 3' 말단의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 근위 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.
특정 구현예에서, 근위 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 시스템에서 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는, 후보 근위 도메인을 갖는 gRNA는 하기 기재된 시스템에서 평가될 수 있다. 후보 근위 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.
꼬리 도메인
넓은 스펙트럼의 꼬리 도메인은 본 명세서에 개시된 gRNA 분자에 사용하기에 적합하다. 도 1a 및 도 1c 내지 도 1g는 이러한 꼬리 도메인의 예를 제공한다.
특정 구현예에서, 꼬리 도메인은 부재이다. 다른 구현예에서, 꼬리 도메인은 1개 내지 100개 이상의 뉴클레오타이드 길이, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개 또는 100개의 뉴클레오타이드 길이이다. 특정 구현예에서, 꼬리 도메인은 1개 내지 5개, 1개 내지 10개, 1개 내지 15개, 1개 내지 20개, 1개 내지 50개, 10개 내지 100개, 20개 내지 100개, 10개 내지 90개, 20개 내지 90개, 10개 내지 80개, 20개 내지 80개, 10개 내지 70개, 20개 내지 70개, 10개 내지 60개, 20개 내지 60개, 10개 내지 50개, 20개 내지 50개, 10개 내지 40개, 20개 내지 40개, 10개 내지 30개, 20개 내지 30개, 20개 내지 25개, 10개 내지 20개 또는 10개 내지 15개의 뉴클레오타이드 길이이다. 특정 구현예에서, 꼬리 도메인은 5+/-5개, 10 +/-5개, 20+/-10개, 20+/-5개, 25+/-10개, 30+/-10개, 30+/-5개, 40+/-10개, 40+/-5개, 50+/-10개, 50+/-5개, 60+/-10개, 60+/-5개, 70+/-10개, 70+/-5개, 80+/-10개, 80+/-5개, 90+/-10개, 90+/-5개, 100+/-10개 또는 100+/-5개의 뉴클레오타이드 길이이다.
특정 구현예에서, 꼬리 도메인은 자연 발생 꼬리 도메인 또는 자연 발생 꼬리 도메인의 5' 말단과 상동성을 공유하거나, 그로부터 유래될 수 있다. 이들 중 특정 구현예에서, 근위 도메인은 본 명세서에 개시된 자연 발생 꼬리 도메인, 예를 들어, 도 1a 및 도 1c 내지 도 1g에 기재되는 것들을 포함하는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 또는 스트렙토코커스 써모필러스 꼬리 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖거나, 1개, 2개, 3개, 4개, 5개 또는 6개 이하의 뉴클레오타이드가 상이하다.
특정 구현예에서, 꼬리 도메인은 서로 상보적이며, 적어도 일부 생리학적 조건 하에 듀플렉스 영역을 형성하는 서열을 포함한다. 이들 중 특정 구현예에서, 꼬리 도메인은 꼬리 듀플렉스 영역을 형성할 수 있는 꼬리 듀플렉스 도메인을 포함한다. 특정 구현예에서, 꼬리 듀플렉스 영역은 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12 bp 길이이다. 특정 구현예에서, 꼬리 도메인은 듀플렉스를 형성하지 않는 꼬리 듀플렉스 도메인에 대해 3'에 단일 가닥 도메인을 포함한다. 이들 중 특정 구현예에서, 단일 가닥 도메인은 3개 내지 10개 뉴클레오타이드 길이, 예를 들어, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 4개 내지 6개의 뉴클레오타이드 길이이다.
특정 구현예에서, 꼬리 도메인은 임의의 변형을 포함하지 않는다. 다른 구현예에서, 꼬리 도메인 또는 그 안의 하나 이상의 뉴클레오타이드는 본 명세서에 기재된 변형을 포함하나 이로 한정되지 않는 변형을 갖는다. 특정 구현예에서, 꼬리 도메인의 하나 이상의 뉴클레오타이드는 2' 변형(예를 들어, 리보스 상의 2' 위치에서의 변형), 예를 들어, 2-아세틸화, 예를 들어, 2' 메틸화를 포함할 수 있다. 특정 구현예에서, 꼬리 도메인의 백본은 포스포로티오에이트로 변형될 수 있다. 특정 구현예에서, 꼬리 도메인의 하나 이상의 뉴클레오타이드에 대한 변형은 꼬리 도메인 및/또는 꼬리 도메인을 포함하는 gRNA를 분해에 대한 감수성이 더 낮거나 더욱 생체-적합성이게, 예를 들어, 면역원성이 더 낮게 만든다. 특정 구현예에서, 꼬리 도메인은 1개, 2개, 3개, 4개, 5개, 6개, 7개 또는 8개 이상의 변형을 포함하며, 이들 중 특정 구현예에서, 꼬리 도메인은 그의 5' 말단 및/또는 3' 말단의 5개의 뉴클레오타이드 내에 1개, 2개, 3개 또는 4개의 변형을 포함한다. 특정 구현예에서, 꼬리 도메인은 2개 이상의 연속 뉴클레오타이드에서 변형을 포함한다.
특정 구현예에서, 꼬리 도메인에서의 하나 이상의 뉴클레오타이드에 대한 변형은 표적화 효능을 간섭하지 않도록 선택되며, 표적화 효능은 하기에 기재된 바와 같이 후보 변형을 시험함으로써 평가될 수 있다. 선택된 길이, 서열, 상보성 정도 또는 변형 정도를 갖는 후보 꼬리 도메인을 갖는 gRNA는 하기 기재된 시스템을 사용하여 평가될 수 있다. 후보 꼬리 도메인은 선택된 표적과 기능성인 것으로 알려져 있는 gRNA 분자/Cas9 분자 시스템 내에 단독으로 또는 하나 이상의 다른 후보 변화와 함께 배치되고 평가될 수 있다.
특정 구현예에서, 꼬리 도메인은 3' 말단에 시험관내 또는 생체내 전사 방법과 관련된 뉴클레오타이드를 포함한다. T7 프로모터가 gRNA의 시험관내 전사를 위해 사용되는 경우, 이들 뉴클레오타이드는 DNA 주형의 3' 말단 전에 존재하는 임의의 뉴클레오타이드일 수 있다. U6 프로모터가 생체내 전사를 위해 사용되는 경우, 이들 뉴클레오타이드는 서열 UUUUUU일 수 있다. H1 프로모터가 전사를 위해 사용되는 경우, 이들 뉴클레오타이드는 서열 UUUU일 수 있다. 대안적인 pol-III 프로모터가 사용되는 경우, 이들 뉴클레오타이드는 예를 들어, pol-III 프로모터의 종결 신호에 따라 다양한 수의 우라실 염기일 수 있거나, 그들은 대체 염기를 포함할 수 있다.
특정 구현예에서, 근위 및 꼬리 도메인은 함께 취하는 경우, 서열번호 32, 33, 34, 35, 36 또는 37에 기재된 서열을 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어진다.
예시적인 단분자/키메라 gRNA
특정 구현예에서, 본 명세서에 개시된 단분자 또는 키메라 gRNA는 하기의 구조를 갖는다: 5' [표적화 도메인]-[제1 상보성 도메인]-[연결 도메인]-[제2 상보성 도메인]-[근위 도메인]-[꼬리 도메인]-3', 여기서:
표적화 도메인은 코어 도메인 및 선택적으로 2차 도메인을 포함하며, 10개 내지 50개의 뉴클레오타이드 길이이며;
제1 상보성 도메인은 5개 내지 25개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 제1 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지며;
연결 도메인은 1개 내지 5개의 뉴클레오타이드 길이이며;
제2 상보성 도메인은 5개 내지 27개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 제2 상보성 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지며;
근위 도메인은 5개 내지 20개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 근위 도메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 가지며;
꼬리 도메인은 부재이거나, 뉴클레오타이드 서열은 1개 내지 50개의 뉴클레오타이드 길이이며, 특정 구현예에서, 본 명세서에 개시된 기준 꼬리 고메인과 적어도 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 상동성을 갖는다.
특정 구현예에서, 본 명세서에 개시된 단분자 gRNA는 바람직하게는 5'에서 3'으로:
예를 들어, 10개 내지 50개의 뉴클레오타이드를 포함하는 표적화 도메인;
예를 들어, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드를 포함하는 제1 상보성 도메인;
연결 도메인;
제2 상보성 도메인;
근위 도메인; 및
꼬리 도메인을 포함하며,
(a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하거나;
(b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하거나; 또는
(c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, (a), (b) 및/또는 (c)로부터의 서열은 자연 발생 gRNA의 상응하는 서열 또는 본 명세서에 기재된 gRNA와 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95% 또는 99%의 상동성을 갖는다.
특정 구현예에서, 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함한다.
특정 구현예에서, 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 제1 상보성 도메인의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인 또는 그의 부분에 상보적인 또는 부분적으로 상보적인 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드(예를 들어, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 연속 뉴클레오타이드)로 이루어지거나, 본질적으로 이로 이루어지거나, 이를 포함하며, 예를 들어, 표적화 도메인은 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, 표적화 도메인은 표적화 도메인의 전체 길이, 표적 도메인의 전체 길이 또는 둘 모두에 걸쳐 표적 도메인에 상보적이다.
특정 구현예에서, 본 명세서에 개시된 단분자 또는 키메라 gRNA 분자(표적화 도메인, 제1 상보성 도메인, 연결 도메인, 제2 상보성 도메인, 근위 도메인 및 선택적으로 꼬리 도메인 포함)는 서열번호 42에 기재된 아미노산 서열을 포함하며, 표적화 도메인은 20개의 뉴클레오타이드(잔기 1 내지 20)로 열거되어 있지만, 길이가 16개 내지 26개의 뉴클레오타이드 범위일 수 있으며, 최종 6개의 잔기(잔기 97 내지 102)는 U6 프로모터에 대한 종결 신호를 나타내지만, 부재이거나, 수가 더 적을 수 있다. 특정 구현예에서, 단분자 또는 키메라 gRNA 분자는 스트렙토코커스 피오게네스 gRNA 분자이다.
특정 구현예에서, 본 명세서에 개시된 단분자 또는 키메라 gRNA 분자(표적화 도메인, 제1 상보성 도메인, 연결 도메인, 제2 상보성 도메인, 근위 도메인 및 선택적으로 꼬리 도메인 포함)는 서열번호 38에 기재된 아미노산 서열을 포함하며, 표적화 도메인은 20개의 뉴클레오타이드(잔기 1 내지 20)로 열거되어 있지만, 길이가 16개 내지 26개의 뉴클레오타이드 범위일 수 있으며, 최종 6개의 잔기(잔기 97 내지 102)는 U6 프로모터에 대한 종결 신호를 나타내지만, 부재이거나, 수가 적을 수 있다. 특정 구현예에서, 단분자 또는 키메라 gRNA 분자는 스타필로코커스 아우레우스 gRNA 분자이다.
예시적인 키메라 gRNA의 서열 및 구조는 도 1h 내지 도 1i에도 나타나 있다.
예시적인 모듈 gRNA
특정 구현예에서, 본 명세서에 개시된 모듈 gRNA는:
바람직하게는 5'에서 3'으로,
예를 들어, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드를 포함하는 표적화 도메인;
제1 상보성 도메인을 포함하는 제1 가닥; 및
바람직하게는 5'에서 3'으로,
선택적으로 5' 연장 도메인;
제2 상보성 도메인;
근위 도메인; 및
꼬리 도메인을 포함하는 제2 가닥을 포함하며;
(a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하거나;
(b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하거나;
(c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 대하여 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, (a), (b) 또는 (c)로부터의 서열은 자연 발생 gRNA의 상응하는 서열 또는 본 명세서에 기재된 gRNA와 적어도 60%, 75%, 80%, 85%, 90%, 95% 또는 99%의 상동성을 갖는다.
특정 구현예에서, 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함한다.
특정 구현예에서, 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다. 특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드(예를 들어, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 연속 뉴클레오타이드)를 포함하거나, 이를 갖거나, 이로 이루어지며, 예를 들어, 표적화 도메인은 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드 길이이다.
특정 구현예에서, 표적화 도메인은 표적 도메인 또는 그의 부분과 상보적인 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 뉴클레오타이드(예를 들어, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개 또는 26개의 연속 뉴클레오타이드)로 이루어지거나, 본질적으로 이로 이루어지거나, 이를 포함한다. 이들 중 특정 구현예에서, 표적화 도메인은 표적화 도메인의 전체 길이, 표적 도메인의 전체 길이 또는 둘 모두에 걸쳐 표적 도메인에 상보적이다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 16개의 뉴클레오타이드(예를 들어, 16개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 16개의 뉴클레오타이드 길이이다. 이들 구현예 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나 (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 대하여 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 17개의 뉴클레오타이드(예를 들어, 17개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 17개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 18개의 뉴클레오타이드(예를 들어, 18개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 18개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 19개의 뉴클레오타이드(예를 들어, 19개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 19개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 20개의 뉴클레오타이드(예를 들어, 20개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 20개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 21개의 뉴클레오타이드(예를 들어, 21개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 21개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 22개의 뉴클레오타이드(예를 들어, 22개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 22개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 23개의 뉴클레오타이드(예를 들어, 23개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 23개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드와 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 24개의 뉴클레오타이드(예를 들어, 24개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 24개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대하여 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 25개의 뉴클레오타이드(예를 들어, 25개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 25개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; (c) 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
특정 구현예에서, 표적화 도메인은 표적 도메인과 상보성을 갖는 26개의 뉴클레오타이드(예를 들어, 26개의 연속 뉴클레오타이드)를 포함하거나, 이로 이루어지거나, 본질적으로 이로 이루어지며, 예를 들어, 표적화 도메인은 26개의 뉴클레오타이드 길이이다. 이들 중 특정 구현예에서, (a) 근위 및 꼬리 도메인은 함께 취하는 경우, 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드를 포함하고/거나; (b) 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 15개, 18개, 20개, 25개, 30개, 31개, 35개, 40개, 45개, 49개, 50개 또는 53개의 뉴클레오타이드가 존재하고/거나; 제1 상보성 도메인의 그의 상응하는 뉴클레오타이드에 상보적인 제2 상보성 도메인의 마지막 뉴클레오타이드에 대해 3'에 적어도 16개, 19개, 21개, 26개, 31개, 32개, 36개, 41개, 46개, 50개, 51개 또는 54개의 뉴클레오타이드가 존재한다.
gRNA의 설계 방법
본 명세서에 기재된 gRNA에 사용하기 위한 표적화 도메인의 선택, 설계 및 확인 방법을 포함하는 gRNA의 설계 방법이 본 명세서에 기재된다. gRNA로의 혼입을 위한 예시적인 표적화 도메인도 또한 본 명세서에 제공된다. 특정 구현예에서, 표적화 도메인이 상보적 염기 쌍형성을 통해 표적 도메인에 혼성화하는 것이 본 명세서에서 고려된다.
표적 서열의 선택 및 확인 방법뿐만 아니라 표적-외 분석이 이전에 기재되어 있다(예를 들어, 문헌[Mali 2013]; 문헌[Hsu 2013]; 문헌[Fu 2014]; 문헌[Heigwer 2014]; 문헌[Bae 2014]; 문헌[Xiao 2014] 참조). 예를 들어, 소프트웨어 툴을 사용하여, 사용자의 표적 서열에 상응하는 가능한 표적화 도메인의 선택을 최적화하고, 예를 들어, 게놈에 걸쳐 전체 표적-외 활성을 최소화할 수 있다. 표적-외 활성은 절단 이외의 것일 수 있다. 스트렙토코커스 피오게네스 Cas9를 이용하는 각각의 가능한 표적화 도메인 선택에 있어서, 툴은 게놈에 걸쳐 모든 표적-외 서열(예를 들어, NAG 또는 NGG PAM 중 어느 하나의 앞)을 동정할 수 있으며, 이는 특정 수(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개)까지의 불일치된 염기쌍을 함유한다. 각각의 표적-외 서열에서 절단 효능은, 예를 들어, 실험으로 유도된 가중치 계획을 이용하여 예측될 수 있다. 이어서, 각각의 가능한 표적화 도메인은 그의 예측된 전체 표적-외 절단에 따라 순위를 정하고; 상위-순위의 표적화 도메인은 가장 큰 표적-상의 절단 및 최소의 표적-외 절단을 가질 가능성이 있는 것을 나타낸다. 다른 기능, 예를 들어, CRISPR 작제를 위한 자동화된 시약 설계, 표적 상의 서베이어(Surveyor) 분석을 위한 프라이머 설계 및 높은 처리효율의 검출을 위한 프라이머 설계 및 차세대 시퀀싱(next-gen sequencing)을 통한 표적-외 절단의 정량화가 또한 툴에 포함될 수 있다. 후보 표적화 도메인 및 이들 표적화 도메인을 포함하는 gRNA를 해당 분야에 공지된 방법을 사용하여 및/또는 본 명세서에 기재된 바와 같이, 기능적으로 평가할 수 있다.
비제한적인 예로서, 스트렙토코커스 피오게네스 및 스타필로코커스 아우레우스 Cas9와 사용하기 위한 gRNA에서 사용하기 위한 표적화 도메인을 DNA 서열 검색 알고리즘을 사용하여 동정하였다. gRNA 설계를 공개 툴 cas-offinder(문헌[Bae 2014])에 기반한 맞춤(custom) gRNA 설계 소프트웨어를 사용하여 수행하였다. 이러한 소프트웨어는 그들의 게놈-와이드 표적-외 경향을 계산한 후에 가이드를 점수화한다. 전형적으로, 완벽한 일치로부터 7개의 불일치까지의 범위의 일치가 17개 내지 24개 길이의 범위의 가이드에 대하여 고려된다. 일단 표적-외 부위가 계산에 의해 결정되면, 각 가이드에 대하여 총 점수를 계산하고, 웹-인터페이스를 사용하여 표 출력물에 요약한다. PAM 서열에 인접한 가능한 표적 부위의 동정에 더하여, 소프트웨어에 의해, 선택된 표적 부위와 1개, 2개, 3개 또는 3개 초과의 뉴클레오타이드가 상이한 모든 PAM 인접 서열도 또한 동정된다. 각 유전자에 대한 게놈 DNA 서열을 UCSC 게놈 브라우저로부터 수득하였으며, 서열을 공개 이용가능한 RepeaTmasker 프로그램을 사용하여 반복 요소에 대하여 스크리닝하였다. RepeaTmasker는 반복 요소 및 저 복잡성 영역에 대하여 입력 DNA 서열을 검색한다. 출력은 주어진 질의 서열에 존재하는 반복부의 상세한 주석이다.
동정 후에, 표적화 도메인을 그들의 직교성(orthogonality) 및 5' G의 존재에 기반하여(관련 PAM, 예를 들어, 스트렙토코커스 피오게네스에 있어서 NGG PAM 또는 스타필로코커스 아우레우스에 있어서 NNGRRT(서열번호 204) 또는 NNGRRV(서열번호 205) PAM을 함유하는 인간 게놈에서 가까운 일치의 동정에 기반하여) 계층(tier)으로 순위를 정하였다. 직교성은 표적 서열에 대하여 최소의 수의 불일치를 함유하는 인간 게놈 내의 서열의 수를 말한다. "높은 수준의 직교성" 또는 "우수한 직교성"은 예를 들어, 의도된 표적 외에 인간 게놈 내에 동일한 서열을 갖지 않고, 표적 서열 내에 1개 또는 2개의 불일치를 함유하는 임의의 서열도 갖지 않는 20-mer 표적화 도메인을 지칭할 수 있다. 우수한 직교성을 갖는 표적화 도메인을 선택하여, 표적-외 DNA 절단을 최소화한다.
단일-gRNA 뉴클레아제 절단 및 이중-gRNA 쌍형성 "틈내기효소(nickase)" 전략 둘 모두를 위하여 표적화 도메인을 동정하였다. 표적화 도메인의 선택 및 어떤 표적화 도메인이 이중-gRNA 쌍형성 "틈내기효소" 전략을 위해 사용될 수 있는지의 결정을 위한 기준은 2가지 고려사항을 기반으로 한다:
(1) 표적화 도메인 쌍은 PAM이 외측을 향하도록 DNA 상에 지향되어야 하며, D10A Cas9 틈내기효소로의 절단이 5' 오버행을 초래할 것임; 및
(2) 이중 틈내기효소 쌍으로의 절단이 타당한 빈도로 전체 개재 서열의 결실을 초래할 것이라는 추정. 그러나, 이중 틈내기효소 쌍으로의 절단은 또한 gRNA 중 오직 하나의 부위에서 삽입결실 돌연변이를 초래할 수 있다. 하나의 표적화 도메인의 표적 부위에서 삽입결실 돌연변이를 야기하는 것에 비해 그들이 전체 서열을 얼마나 효율적으로 제거하지에 대하여 후보 쌍 구성원을 시험할 수 있다.
Cas9 분자
다양한 종의 Cas9 분자를 본 명세서에 기재된 방법 및 조성물에 사용할 수 있다. 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스 및 스트렙토코커스 써모필러스 Cas9 분자가 본 명세서에서 많은 개시내용의 대상이지만, 본 명세서에 열거된 다른 종의 Cas9 단백질의, 그로부터 유래된, 또는 그에 기반한 Cas9 분자도 또한 사용될 수 있다. 이들은 예를 들어, 아시도보락스 아베나에(Acidovorax avenae), 악티노바실러스 플뢰로뉴모니애(Actinobacillus pleuropneumoniae), 악티노바실러스 숙시노게네스(Actinobacillus succinogenes), 악티노바실러스 수이스(Actinobacillus suis), 악티노마이세스 종(Actinomyces sp.), 사이클리필러스 데니트리피칸스(Cycliphilus denitrificans), 아미노모나스 파우시보란스(Aminomonas paucivorans), 바실러스 세레우스(Bacillus cereus), 바실러스 스미티(Bacillus smithii), 바실러스 투린기엔시스(Bacillus thuringiensis), 박테로이데스 종(Bacteroides sp.), 블라스토피레룰라 마리나(Blastopirellula marina), 브라디리조븀 종(Bradyrhizobium sp.), 브레비바실러스 라테로스포러스(Brevibacillus laterosporus), 캄필로박터 콜라이(Campylobacter coli), 캄필로박터 제주니(Campylobacter jejuni), 캄필로박터 라리(Campylobacter lari), 칸디다투스 푸니세이스피릴룸(Candidatus puniceispirillum), 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 페르프린겐스(Clostridium perfringens), 코리네박테리움 악콜렌스(Corynebacterium accolens), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 코리네박테리움 마트루코티(Corynebacterium matruchotii), 디노로세오박터 쉬배(Dinoroseobacter shibae), 유박테리움 돌리춤(Eubacterium dolichum), 감마 프로테오박테리움(Gamma proteobacterium), 글루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus), 헤모필루스 파라인플루엔자(Haemophilus parainfluenzae), 헤모필루스 스푸토룸(Haemophilus sputorum), 헬리코박터 카나덴시스(Helicobacter canadensis), 헬리코박터 시나에디(Helicobacter cinaedi), 헬리코박터 무스텔라(Helicobacter mustelae), 일리오박터 폴리트로푸스(Ilyobacter polytropus), 킨겔라 킨가에(Kingella kingae), 락토바실러스 크리스파투스(Lactobacillus crispatus), 리스테리아 이바노비(Listeria ivanovii), 리스테리아 모노사이토게네스(Listeria monocytogenes), 리스테리아세 박테리움(Listeriaceae bacterium), 메틸로시스티스 종(Methylocystis sp.), 메틸로시너스 트리코스포리움(Methylosinus trichosporium), 모빌룬커스 물리에리스(Mobiluncus mulieris), 네이세리아 바실리포르미스(Neisseria bacilliformis), 네이세리아 시네레아(Neisseria cinerea), 네이세리아 플라베센스(Neisseria flavescens), 네이세리아 락타미카(Neisseria lactamica), 네이세리아 종(Neisseria sp.), 네이세리아 와드워티(Neisseria wadsworthii), 니트로소모나스 종(Nitrosomonas sp.), 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans), 파스테우렐라 물토시다(Pasteurella multocida), 파스콜락토박테리움 숙시나투텐스(Phascolarctobacterium succinatutens), 랄스토니아 시지기(Ralstonia syzygii), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 로도불룸 종(Rhodovulum sp.), 시몬시엘라 무엘레리(Simonsiella muelleri), 스핑고모나스 종(Sphingomonas sp.), 스포로락토바실러스 비니애(Sporolactobacillus vineae), 스타필로코커스 루그두넨시스(Staphylococcus lugdunensis), 스트렙토코커스 종(Streptococcus sp.), 서브돌리그라눌룸 종(Subdoligranulum sp.), 티스트렐라 모빌리스(Tistrella mobilis), 트레포네마 종(Treponema sp.) 또는 베르미네프로박터 에이세니아(Verminephrobacter eiseniae)로부터의 Cas9 분자를 포함한다.
Cas9 도메인
2가지의 상이한 자연 발생 박테리아 Cas9 분자(문헌[Jinek 2014]) 및 가이드 RNA(예를 들어, crRNA 및 tracrRNA의 합성 융합체)와 함께 스트렙토코커스 피오게네스 Cas9에 대한 결정 구조를 결정하였다(문헌[Nishimasu 2014]; 문헌[Anders 2014]).
자연 발생 Cas9 분자는 2개의 엽: 인식(REC) 엽 및 뉴클레아제(NUC) 엽을 포함하며; 이의 각각은 본 명세서에 기재된 도메인을 추가로 포함한다. 도 8a 및 도 8b는 일차 구조에서의 중요한 Cas9 도메인의 구성의 개략도를 제공한다. 본 개시내용에 사용되는 도메인 명명법 및 각 도메인에 의해 포함되는 아미노산 잔기의 넘버링은 이전에 기재된 바와 같다(문헌[Nishimasu 2014]). 아미노산 잔기의 넘버링은 스트렙토코커스 피오게네스로부터의 Cas9와 관련하여 이루어진다.
REC 엽은 아르기닌-풍부 가교 헬릭스(BH), REC1 도메인 및 REC2 도메인을 포함한다. REC 엽은 다른 알려져 있는 단백질과 구조적 유사성을 공유하지 않으며, 이는 그것이 Cas9-특이적 기능성 도메인임을 나타낸다. BH 도메인은 긴 α 헬릭스 및 아르기닌 풍부 영역이며, 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 60 내지 93을 포함한다. REC1 도메인은 예를 들어, gRNA 또는 tracrRNA의 반복부:역-반복부 듀플렉스의 인식에 중요하며, 이에 따라 표적 서열의 인식에 의한 Cas9 활성에 중요하다. REC1 도메인은 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 94 내지 179 및 308 내지 717에 2개의 REC1 모티프를 포함한다. 이들 2개의 REC1 도메인은 선형 일차 서열에서 REC2 도메인에 의해 분리되어 있지만, 3차 구조에서 조립되어 REC1 도메인을 형성한다. REC2 도메인 또는 그의 부분은 또한 반복부:역-반복부 듀플렉스의 인식에서 역할을 수행할 수 있다. REC2 도메인은 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 180 내지 307을 포함한다.
NUC 엽은 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. RuvC 도메인은 레트로바이러스 인테그라제 상과 구성원과 구조적 유사성을 공유하며, 단일의 가닥, 예를 들어, 표적 핵산 분자의 비상보적 가닥을 절단한다. RuvC 도메인은 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 각각 아미노산 1 내지 59, 718 내지 769 및 909 내지 1098에서 3개의 분할 RuvC 모티프(각각 RuvCI 도메인 또는 N-말단 RuvC 도메인, RuvCII 도메인 및 RuvCIII 도메인으로 해당 분야에서 종종 통상적으로 지칭되는 RuvCI, RuvCII 및 RuvCIII)로부터 조립된다. 3개의 RuvC 모티프는 REC1 도메인과 유사하게, 선형으로 일차 구조에서 다른 도메인에서 의해 분리된다. 그러나, 3차 구조에서, 3개의 RuvC 모티프는 조립되고, RuvC 도메인을 형성한다. HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어, 표적 핵산 분자의 상보적 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 존재하며, 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 775 내지 908을 포함한다. PI 도메인은 표적 핵산 분자의 PAM과 상호작용하며, 스트렙토코커스 피오게네스 Cas9(서열번호 2)의 아미노산 1099 내지 1368을 포함한다.
RuvC-유사 도메인 및 HNH-유사 도메인
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 HNH-유사 도메인 및 RuvC-유사 도메인을 포함하며, 이들 중 특정 구현예에서, 절단 활성은 RuvC-유사 도메인 및 HNH-유사 도메인에 따라 달라진다. Cas9 분자 또는 Cas9 폴리펩타이드는 RuvC-유사 도메인 및 HNH-유사 도메인 중 하나 이상을 포함할 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 RuvC-유사 도메인, 예를 들어, 하기 기재된 RuvC-유사 도메인 및/또는 HNH-유사 도메인, 예를 들어, 하기 기재된 HNH-유사 도메인을 포함한다.
RuvC-유사 도메인
특정 구현예에서, RuvC-유사 도메인은 단일 가닥, 예를 들어, 표적 핵산 분자의 비상보적 가닥을 절단한다. Cas9 분자 또는 Cas9 폴리펩타이드는 1개 초과의 RuvC-유사 도메인(예를 들어, 1개, 2개, 3개 이상의 RuvC-유사 도메인)을 포함할 수 있다. 특정 구현예에서, RuvC-유사 도메인은 적어도 5개, 6개, 7개, 8개의 아미노산 길이이나, 20개, 19개, 18개, 17개, 16개 또는 15개 이하의 아미노산 길이이다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 약 10개 내지 20개의 아미노산, 예를 들어, 약 15개의 아미노산 길이의 N-말단 RuvC-유사 도메인을 포함한다.
N-말단 RuvC-유사 도메인
일부 자연 발생 Cas9 분자는 1개 초과의 RuvC-유사 도메인을 포함하며, 절단은 N-말단 RuvC-유사 도메인에 따라 달라진다. 따라서, Cas9 분자 또는 Cas9 폴리펩타이드는 N-말단 RuvC-유사 도메인을 포함할 수 있다. 예시적인 N-말단 RuvC-유사 도메인은 하기에 기재된다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 I의 아미노산 서열을 포함하는 N-말단 RuvC-유사 도메인을 포함한다:
D-X1-G-X2-X3-X4-X5-G-X6-X7-X8-X9(서열번호 20),
상기 식에서,
X1은 I, V, M, L 및 T로부터 선택되며(예를 들어, I, V 및 L로부터 선택되며);
X2는 T, I, V, S, N, Y, E 및 L로부터 선택되며(예를 들어, T, V 및 I로부터 선택되며);
X3은 N, S, G, A, D, T, R, M 및 F로부터 선택되며(예를 들어, A 또는 N);
X4는 S, Y, N 및 F로부터 선택되며(예를 들어, S);
X5는 V, I, L, C, T 및 F로부터 선택되며(예를 들어, V, I 및 L로부터 선택되며);
X6은 W, F, V, Y, S 및 L로부터 선택되며(예를 들어, W);
X7은 A, S, C, V 및 G로부터 선택되며(예를 들어, A 및 S로부터 선택되며);
X8은 V, I, L, A, M 및 H로부터 선택되며(예를 들어, V, I, M 및 L로부터 선택되며);
X9는 임의의 아미노산으로부터 선택되거나 부재이다(예를 들어, T, V, I, L, Δ, F, S, A, Y, M 및 R로부터 선택되며, 예를 들어, T, V, I, L 및 Δ로부터 선택된다).
특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 20의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.
특정 구현예에서, N-말단 RuvC-유사 도메인은 절단 적격(competent)이다. 다른 구현예에서, N-말단 RuvC-유사 도메인은 절단 부적격이다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 II의 아미노산 서열을 포함하는 N-말단 RuvC-유사 도메인을 포함한다:
D-X1-G-X2-X3-S-X5-G-X6-X7-X8-X9(서열번호 21),
상기 식에서,
X1은 I, V, M, L 및 T로부터 선택되며(예를 들어, I, V 및 L로부터 선택되며);
X2는 T, I, V, S, N, Y, E 및 L로부터 선택되며(예를 들어, T, V 및 I로부터 선택되며);
X3은 N, S, G, A, D, T, R, M 및 F로부터 선택되며(예를 들어, A 또는 N);
X5는 V, I, L, C, T 및 F로부터 선택되며(예를 들어, V, I 및 L로부터 선택되며);
X6은 W, F, V, Y, S 및 L로부터 선택되며(예를 들어, W);
X7은 A, S, C, V 및 G로부터 선택되며(예를 들어, A 및 S로부터 선택되며);
X8은 V, I, L, A, M 및 H로부터 선택되며(예를 들어, V, I, M 및 L로부터 선택되며);
X9는 임의의 아미노산으로부터 선택되거나 부재이다(예를 들어, T, V, I, L, Δ, F, S, A, Y, M 및 R로부터 선택되거나, 예를 들어, T, V, I, L 및 Δ로부터 선택된다).
특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 21의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.
특정 구현예에서, N-말단 RuvC-유사 도메인은 식 III의 아미노산 서열을 포함한다:
D-I-G-X2-X3-S-V-G-W-A-X8-X9(서열번호 22),
상기 식에서,
X2는 T, I, V, S, N, Y, E 및 L로부터 선택되며(예를 들어, T, V 및 I로부터 선택되며);
X3은 N, S, G, A, D, T, R, M 및 F로부터 선택되며(예를 들어, A 또는 N);
X8은 V, I, L, A, M 및 H로부터 선택되며(예를 들어, V, I, M 및 L로부터 선택되며);
X9는 임의의 아미노산으로부터 선택되거나 부재이다(예를 들어, T, V, I, L, Δ, F, S, A, Y, M 및 R로부터 선택되거나, 예를 들어, T, V, I, L 및 Δ로부터 선택된다).
특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 22의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.
특정 구현예에서, N-말단 RuvC-유사 도메인은 식 IV의 아미노산 서열을 포함한다:
D-I-G-T-N-S-V-G-W-A-V-X(서열번호 23),
상기 식에서,
X는 비극성 알킬 아미노산 또는 하이드록실 아미노산이며, 예를 들어, X는 V, I, L 및 T로부터 선택된다(예를 들어, Cas9 분자는 도 2a 내지 도 2g에 나타낸(Y로 도시) N-말단 RuvC-유사 도메인을 포함할 수 있다).
특정 구현예에서, N-말단 RuvC-유사 도메인은 서열번호 23의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.
특정 구현예에서, N-말단 RuvC-유사 도메인은 본 명세서에, 예를 들어, 도 3a 및 도 3b에 개시된 N-말단 RuvC 유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 일 구현예에서, 도 3a 및 도 3b에서 동정된 고도로 보존된 잔기 중 1개, 2개, 3개 또는 전부가 존재한다.
특정 구현예에서, N-말단 RuvC-유사 도메인은 본 명세서에, 예를 들어, 도 4a 및 도 4b에 개시된 N-말단 RuvC-유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 일 구현예에서, 도 4a 및 도 4b에서 동정된 고도로 보존된 잔기 중 1개, 2개 또는 전부가 존재한다.
추가의 RuvC-유사 도메인
N-말단 RuvC-유사 도메인에 더하여, Cas9 분자 또는 Cas9 폴리펩타이드는 하나 이상의 추가의 RuvC-유사 도메인을 포함할 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 2개의 추가의 RuvC-유사 도메인을 포함할 수 있다. 바람직하게는 추가의 RuvC-유사 도메인은 적어도 5개의 아미노산 갈이이며, 예를 들어, 15개 미만의 아미노산 길이, 예를 들어, 5개 내지 10개의 아미노산 길이, 예를 들어, 8개의 아미노산 길이이다.
추가의 RuvC-유사 도메인은 식 V의 아미노산 서열을 포함할 수 있다:
I-X1-X2-E-X3-A-R-E(서열번호 15),
상기 식에서,
X1은 V 또는 H이며;
X2는 I, L 또는 V(예를 들어, I 또는 V)이며;
X3은 M 또는 T이다.
특정 구현예에서, 추가의 RuvC-유사 도메인은 식 VI의 아미노산 서열을 포함한다:
I-V-X2-E-M-A-R-E(서열번호 16),
상기 식에서,
X2는 I, L 또는 V(예를 들어, I 또는 V)이다(예를 들어, Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 나타낸(B로서 도시된) 추가의 RuvC-유사 도메인을 포함할 수 있다).
추가의 RuvC-유사 도메인은 식 VII의 아미노산 서열을 포함할 수 있다:
H-H-A-X1-D-A-X2-X3(서열번호 17),
상기 식에서,
X1은 H 또는 L이며;
X2는 R 또는 V이며;
X3은 E 또는 V이다.
특정 구현예에서, 추가의 RuvC-유사 도메인은 아미노산 서열: H-H-A-H-D-A-Y-L(서열번호 18)을 포함한다.
특정 구현예에서, 추가의 RuvC-유사 도메인은 서열번호 15 내지 18의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.
특정 구현예에서, N-말단 RuvC-유사 도메인의 측부배치(flanking) 서열은 식 VIII의 아미노산 서열을 갖는다:
K-X1'-Y-X2'-X3'-X4'-Z-T-D-X9'-Y(서열번호 19),
상기 식에서,
X1'는 K 및 P로부터 선택되며;
X2'는 V, L, I 및 F로부터 선택되며(예를 들어, V, I 및 L);
X3'는 G, A 및 S로부터 선택되며(예를 들어, G);
X4'는 L, I, V 및 F로부터 선택되며(예를 들어, L);
X9'는 D, E, N 및 Q로부터 선택되며;
Z는 예를 들어, 상기 기재된 바와 같은 N-말단 RuvC-유사 도메인이다.
HNH-유사 도메인
특정 구현예에서, HNH-유사 도메인은 단일 가닥 상보성 도메인, 예를 들어, 이중 가닥 핵산 분자의 상보성 가닥을 절단한다. 특정 구현예에서, HNH-유사 도메인은 적어도 15개, 20개 또는 25개의 아미노산 길이이나, 40개, 35개 또는 30개 이하의 아미노산 길이이며, 예를 들어, 20개 내지 35개의 아미노산 길이, 예를 들어, 25개 내지 30개의 아미노산 길이이다. 예시적인 HNH-유사 도메인은 하기 기재되어 있다.
일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 IX의 아미노산 서열을 갖는 HNH-유사 도메인을 포함한다:
X1-X2-X3-H-X4-X5-P-X6-X7-X8-X9-X10-X11-X12-X13-X14-X15-N-X16-X17-X18-X19-X20-X21-X22-X23-N(서열번호 25),
상기 식에서,
X1은 D, E, Q 및 N으로부터 선택되며(예를 들어, D 및 E);
X2는 L, I, R, Q, V, M 및 K로부터 선택되며;
X3은 D 및 E로부터 선택되며;
X4는 I, V, T, A 및 L로부터 선택되며(예를 들어, A, I 및 V);
X5는 V, Y, I, L, F 및 W로부터 선택되며(예를 들어, V, I 및 L);
X6은 Q, H, R, K, Y, I, L, F 및 W로부터 선택되며;
X7은 S, A, D, T 및 K로부터 선택되며(예를 들어, S 및 A);
X8은 F, L, V, K, Y, M, I, R, A, E, D 및 Q로부터 선택되며(예를 들어, F);
X9는 L, R, T, I, V, S, C, Y, K, F 및 G로부터 선택되며;
X10은 K, Q, Y, T, F, L, W, M, A, E, G 및 S로부터 선택되며;
X11은 D, S, N, R, L 및 T로부터 선택되며(예를 들어, D);
X12는 D, N 및 S로부터 선택되며;
X13은 S, A, T, G 및 R로부터 선택되며(예를 들어, S);
X14는 I, L, F, S, R, Y, Q, W, D, K 및 H로부터 선택되며(예를 들어, I, L 및 F);
X15는 D, S, I, N, E, A, H, F, L, Q, M, G, Y 및 V로부터 선택되며;
X16은 K, L, R, M, T 및 F로부터 선택되며(예를 들어, L, R 및 K);
X17은 V, L, I, A 및 T로부터 선택되며;
X18은 L, I, V 및 A로부터 선택되며(예를 들어, L 및 I);
X19는 T, V, C, E, S 및 A로부터 선택되며(예를 들어, T 및 V);
X20은 R, F, T, W, E, L, N, C, K, V, S, Q, I, Y, H 및 A로부터 선택되며;
X21은 S, P, R, K, N, A, H, Q, G 및 L로부터 선택되며;
X22는 D, G, T, N, S, K, A, I, E, L, Q, R 및 Y로부터 선택되며;
X23은 K, V, A, E, Y, I, C, L, S, T, G, K, M, D 및 F로부터 선택된다.
특정 구현예에서, HNH-유사 도메인은 서열번호 25의 서열과 적어도 1개가 상이하나, 2개, 3개, 4개 또는 5개 이하의 잔기가 상이하다.
특정 구현예에서, HNH-유사 도메인은 절단 적격이다. 다른 구현예에서, HNH-유사 도메인은 절단 부적격이다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 X의 아미노산 서열을 포함하는 HNH-유사 도메인을 포함한다:
X1-X2-X3-H-X4-X5-P-X6-S-X8-X9-X10-D-D-S-X14-X15-N-K-V-L-X19-X20-X21-X22-X23-N(서열번호 26),
상기 식에서,
X1은 D 및 E로부터 선택되며;
X2는 L, I, R, Q, V, M 및 K로부터 선택되며;
X3은 D 및 E로부터 선택되며;
X4는 I, V, T, A 및 L로부터 선택되며(예를 들어, A, I 및 V);
X5는 V, Y, I, L, F 및 W로부터 선택되며(예를 들어, V, I 및 L);
X6은 Q, H, R, K, Y, I, L, F 및 W로부터 선택되며;
X8은 F, L, V, K, Y, M, I, R, A, E, D 및 Q로부터 선택되며(예를 들어, F);
X9는 L, R, T, I, V, S, C, Y, K, F 및 G로부터 선택되며;
X10은 K, Q, Y, T, F, L, W, M, A, E, G 및 S로부터 선택되며;
X14는 I, L, F, S, R, Y, Q, W, D, K 및 H로부터 선택되며(예를 들어, I, L 및 F);
X15는 D, S, I, N, E, A, H, F, L, Q, M, G, Y 및 V로부터 선택되며;
X19는 T, V, C, E, S 및 A로부터 선택되며(예를 들어, T 및 V);
X20은 R, F, T, W, E, L, N, C, K, V, S, Q, I, Y, H 및 A로부터 선택되며;
X21은 S, P, R, K, N, A, H, Q, G 및 L로부터 선택되며;
X22는 D, G, T, N, S, K, A, I, E, L, Q, R 및 Y로부터 선택되며;
X23은 K, V, A, E, Y, I, C, L, S, T, G, K, M, D 및 F로부터 선택된다.
특정 구현예에서, HNH-유사 도메인은 서열번호 26의 서열과 1개, 2개, 3개, 4개 또는 5개의 잔기가 상이하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 XI의 아미노산 서열을 포함하는 HNH-유사 도메인을 포함한다:
X1-V-X3-H-I-V-P-X6-S-X8-X9-X10-D-D-S-X14-X15-N-K-V-L-T-X20-X21-X22-X23-N(서열번호 27),
상기 식에서,
X1은 D 및 E로부터 선택되며;
X3은 D 및 E로부터 선택되며;
X6은 Q, H, R, K, Y, I, L 및 W로부터 선택되며;
X8은 F, L, V, K, Y, M, I, R, A, E, D 및 Q로부터 선택되며(예를 들어, F);
X9는 L, R, T, I, V, S, C, Y, K, F 및 G로부터 선택되며;
X10은 K, Q, Y, T, F, L, W, M, A, E, G 및 S로부터 선택되며;
X14는 I, L, F, S, R, Y, Q, W, D, K 및 H로부터 선택되며(예를 들어, I, L 및 F);
X15는 D, S, I, N, E, A, H, F, L, Q, M, G, Y 및 V로부터 선택되며;
X20은 R, F, T, W, E, L, N, C, K, V, S, Q, I, Y, H 및 A로부터 선택되며;
X21은 S, P, R, K, N, A, H, Q, G 및 L로부터 선택되며;
X22는 D, G, T, N, S, K, A, I, E, L, Q, R 및 Y로부터 선택되며;
X23은 K, V, A, E, Y, I, C, L, S, T, G, K, M, D 및 F로부터 선택된다.
특정 구현예에서, HNH-유사 도메인은 서열번호 27의 서열과 1개, 2개, 3개, 4개 또는 5개의 잔기가 상이하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 XII의 아미노산 서열을 갖는 HNH-유사 도메인을 포함한다:
D-X2-D-H-I-X5-P-Q-X7-F-X9-X10-D-X12-S-I-D-N-X16-V-L-X19-X20-S-X22-X23-N(서열번호 28),
상기 식에서,
X2는 I 및 V로부터 선택되며;
X5는 I 및 V로부터 선택되며;
X7은 A 및 S로부터 선택되며;
X9는 I 및 L로부터 선택되며;
X10은 K 및 T로부터 선택되며;
X12는 D 및 N으로부터 선택되며;
X16은 R, K 및 L로부터 선택되며;
X19는 T 및 V로부터 선택되며;
X20은 S 및 R로부터 선택되며;
X22는 K, D 및 A로부터 선택되며;
X23은 E, K, G 및 N으로부터 선택된다(예를 들어, Cas9 분자 또는 Cas9 폴리펩타이드는 본 명세서에 기재된 바와 같은 HNH-유사 도메인을 포함할 수 있다).
일 구현예에서, HNH-유사 도메인은 서열번호 28의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 식 XIII의 아미노산 서열을 포함한다:
L-Y-Y-L-Q-N-G-X1'-D-M-Y-X2'-X3'-X4'-X5'-L-D-I-X6'-X7'-L-S-X8'-Y-Z-N-R-X9'-K-X10'-D-X11'-V-P(서열번호 24),
상기 식에서,
X1'는 K 및 R로부터 선택되며;
X2'는 V 및 T로부터 선택되며;
X3'는 G 및 D로부터 선택되며;
X4'는 E, Q 및 D로부터 선택되며;
X5'는 E 및 D로부터 선택되며;
X6'는 D, N 및 H로부터 선택되며;
X7'는 Y, R 및 N으로부터 선택되며;
X8'는 Q, D 및 N으로부터 선택되며;
X9'는 G 및 E로부터 선택되며;
X10'는 S 및 G로부터 선택되며;
X11'는 D 및 N으로부터 선택되며;
Z는 예를 들어, 상기 기재된 바와 같은 HNH-유사 도메인이다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 서열번호 24의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이한 아미노산 서열을 포함한다.
특정 구현예에서, HNH-유사 도메인은 본 명세서에, 예를 들어, 도 5a 내지 도 5c에 개시된 HNH-유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 특정 구현예에서, 도 5a 내지 도 5c에서 동정된 고도로 보존된 잔기 중 1개 또는 둘 모두가 존재한다.
특정 구현예에서, HNH-유사 도메인은 본 명세서에, 예를 들어, 도 6a 및 도 6b에 개시된 HNH-유사 도메인의 서열과 1개 만큼 많은(그러나 2개, 3개, 4개 또는 5개 이하의) 잔기가 상이하다. 일 구현예에서, 도 6a 및 도 6b에서 동정된 고도로 보존된 잔기 중 1개, 2개 또는 3개 모두가 존재한다.
Cas9 활성
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 표적 핵산 분자를 절단할 수 있다. 전형적으로, 야생형 Cas9 분자는 표적 핵산 분자의 둘 모두의 가닥을 절단한다. Cas9 분자 및 Cas9 폴리펩타이드를 조작하여, 뉴클레아제 절단(또는 다른 특성)을 변경시킬 수 있으며, 예를 들어, 틈내기효소이거나, 또는 표적 핵산을 절단하는 능력이 결여된 Cas9 분자 또는 Cas9 폴리펩타이드를 제공할 수 있다. 표적 핵산 분자를 절단할 수 있는 Cas9 분자 또는 Cas9 폴리펩타이드는 본 명세서에 eaCas9(효소적 활성 Cas9) 분자 또는 eaCas9 폴리펩타이드로 지칭된다.
특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 하기의 효소 활성 중 하나 이상을 포함한다:
(1) 틈내기효소 활성, 즉, 핵산 분자의 단일 가닥, 예를 들어, 비상보성 가닥 또는 상보성 가닥을 절단하는 능력;
(2) 이중 가닥 뉴클레아제 활성, 즉, 이중 가닥 핵산의 둘 모두의 가닥을 절단하고 이중 가닥 파단부를 생성하는 능력, 일 구현예에서, 2개의 틈내기효소 활성의 존재임;
(3) 엔도뉴클레아제 활성;
(4) 엑소뉴클레아제 활성; 및
(5) 헬리카제 활성, 즉, 이중 가닥 핵산의 나선 구조를 푸는 능력.
특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 둘 모두의 DNA 가닥을 절단하며, 이중 가닥 파단부를 초래한다. 특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 단지 하나의 가닥, 예를 들어, gRNA가 혼성화하는 가닥, 또는 gRNA와 혼성화하는 가닥에 상보적인 가닥을 절단한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 HNH 도메인과 관련된 절단 활성을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 RuvC 도메인과 관련된 절단 활성을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 HNH 도메인과 관련된 절단 활성 및 RuvC 도메인과 관련된 절단 활성을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 활성, 또는 절단 적격, HNH 도메인 및 비활성, 또는 절단 부적격, RuvC 도메인을 포함한다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 비활성, 또는 절단 부적격, HNH 도메인 및 활성, 또는 절단 적격, RuvC 도메인을 포함한다.
일부 Cas9 분자 또는 Cas9 폴리펩티드는 gRNA 분자와 상호작용하는 능력을 갖고, gRNA 분자와 함께 코어 표적 도메인에 국소화되지만, 표적 핵산을 절단할 수 없거나 또는 효율적인 속도로 절단할 수 없다. 절단 활성이 없거나 또는 이것이 실질적으로 없는 Cas9 분자는 본 명세서에서 eiCas9 분자 또는 eiCas9 폴리펩타이드로서 지칭된다. 예를 들어, eiCas9 분자 또는 eiCas9 폴리펩타이드는 본 명세서에 기재된 분석에 의해 측정시 절단 활성이 결여되거나 또는 기준 Cas9 분자 또는 eiCas9 폴리펩타이드의 절단 활성보다 실질적으로 낮을 수 있고, 예를 들어, 이의 20%, 10%, 5%, 1% 또는 0.1% 미만일 수 있다.
표적화 및 PAM
Cas9 분자 또는 Cas9 폴리펩타이드는 gRNA 분자와 상호작용하며, gRNA 분자와 협력하여, 표적 도메인, 특정 구현예에서, PAM 서열을 포함하는 부위에 국소화된다.
특정 구현예에서, 표적 핵산과 상호작용하고, 이를 절단하는 eaCas9 분자 또는 eaCas9 폴리펩타이드의 능력은 PAM 서열 의존적이다. PAM 서열은 표적 핵산 내의 서열이다. 일 구현예에서, 표적 핵산의 절단은 PAM 서열로부터 상류에서 발생한다. 상이한 박테리아 종으로부터의 EaCas9 분자는 상이한 서열 모티프(예를 들어, PAM 서열)를 인식할 수 있다. 일 구현예에서, 스트렙토코커스 피오게네스의 eaCas9 분자는 서열 모티프 NGG를 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다(예를 들어, 문헌[Mali 2013] 참조). 일 구현예에서, 스트렙토코커스 써모필러스의 eaCas9 분자는 서열 모티프 NGGNG(서열번호 199) 및/또는 NNAGAAW(W = A 또는 T)(서열번호 200)를 인식하며, 이들 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다(예를 들어, 문헌[Horvath 2010]; 문헌[Deveau 2008] 참조). 일 구현예에서, 스트렙토코커스 뮤탄스의 eaCas9 분자는 서열 모티프 NGG 및/또는 NAAR(R = A 또는 G)(서열번호 201)을 인식하며, 이들 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다(예를 들어, 문헌[Deveau 2008] 참조). 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRR(R = A 또는 G)(서열번호 202)을 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRRN(R = A 또는 G)(서열번호 203)을 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRRT(R = A 또는 G)(서열번호 204)를 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. 일 구현예에서, 스타필로코커스 아우레우스의 eaCas9 분자는 서열 모티프 NNGRRV(R = A 또는 G, V = A, G 또는 C)(서열번호 205)를 인식하며, 해당 서열로부터 1 내지 10, 예를 들어, 3 내지 5 bp 상류의 표적 핵산 서열의 절단을 지시한다. PAM 서열을 인식하는 Cas9 분자의 능력은 예를 들어, 이전에 기재된 바와 같은 형질전환 분석을 사용하여 결정될 수 있다(문헌[Jinek 2012]). 상기 언급된 구현예의 각각(즉, 서열번호 199 내지 205)에서, N은 임의의 뉴클레오타이드 잔기, 예를 들어, A, G, C 또는 T 중 임의의 것일 수 있다.
본 명세서에 논의된 바와 같이, Cas9 분자를 조작하여, Cas9 분자의 PAM 특이성을 변경시킬 수 있다.
예시적인 자연 발생 Cas9 분자가 이전에 기재되어 있다(예를 들어, 문헌[Chylinski 2013] 참조). 이러한 Cas9 분자는 클러스터 1 박테리아과, 클러스터 2 박테리아과, 클러스터 3 박테리아과, 클러스터 4 박테리아과, 클러스터 5 박테리아과, 클러스터 6 박테리아과, 클러스터 7 박테리아과, 클러스터 8 박테리아과, 클러스터 9 박테리아과, 클러스터 10 박테리아과, 클러스터 11 박테리아과, 클러스터 12 박테리아과, 클러스터 13 박테리아과, 클러스터 14 박테리아과, 클러스터 15 박테리아과, 클러스터 16 박테리아과, 클러스터 17 박테리아과, 클러스터 18 박테리아과, 클러스터 19 박테리아과, 클러스터 20 박테리아과, 클러스터 21 박테리아과, 클러스터 22 박테리아과, 클러스터 23 박테리아과, 클러스터 24 박테리아과, 클러스터 25 박테리아과, 클러스터 26 박테리아과, 클러스터 27 박테리아과, 클러스터 28 박테리아과, 클러스터 29 박테리아과, 클러스터 30 박테리아과, 클러스터 31 박테리아과, 클러스터 32 박테리아과, 클러스터 33 박테리아과, 클러스터 34 박테리아과, 클러스터 35 박테리아과, 클러스터 36 박테리아과, 클러스터 37 박테리아과, 클러스터 38 박테리아과, 클러스터 39 박테리아과, 클러스터 40 박테리아과, 클러스터 41 박테리아과, 클러스터 42 박테리아과, 클러스터 43 박테리아과, 클러스터 44 박테리아과, 클러스터 45 박테리아과, 클러스터 46 박테리아과, 클러스터 47 박테리아과, 클러스터 48 박테리아과, 클러스터 49 박테리아과, 클러스터 50 박테리아과, 클러스터 51 박테리아과, 클러스터 52 박테리아과, 클러스터 53 박테리아과, 클러스터 54 박테리아과, 클러스터 55 박테리아과, 클러스터 56 박테리아과, 클러스터 57 박테리아과, 클러스터 58 박테리아과, 클러스터 59 박테리아과, 클러스터 60 박테리아과, 클러스터 61 박테리아과, 클러스터 62 박테리아과, 클러스터 63 박테리아과, 클러스터 64 박테리아과, 클러스터 65 박테리아과, 클러스터 66 박테리아과, 클러스터 67 박테리아과, 클러스터 68 박테리아과, 클러스터 69 박테리아과, 클러스터 70 박테리아과, 클러스터 71 박테리아과, 클러스터 72 박테리아과, 클러스터 73 박테리아과, 클러스터 74 박테리아과, 클러스터 75 박테리아과, 클러스터 76 박테리아과, 클러스터 77 박테리아과, 또는 클러스터 78 박테리아과의 Cas9 분자를 포함한다.
예시적인 자연 발생 Cas9 분자는 클러스터 1 박테리아과의 Cas9 분자를 포함한다. 예는 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스(예를 들어, 균주 SF370, MGAS10270, MGAS10750, MGAS2096, MGAS315, MGAS5005, MGAS6180, MGAS9429, NZ131, SSI-1), 스트렙토코커스 써모필러스(예를 들어, 균주 LMD-9), 스트렙토코커스 수도포르시누스(S. pseudoporcinus)(예를 들어, 균주 SPIN 20026), 스트렙토코커스 뮤탄스(예를 들어, 균주 UA159, NN2025), 스트렙토코커스 마카카에(S. macacae)(예를 들어, 균주 NCTC11558), 스트렙토코커스 갈로리티쿠스(S. gallolyticus)(예를 들어, 균주 UCN34, ATCC BAA-2069), 스트렙토코커스 에쿠이네스(S. equines)(예를 들어, 균주 ATCC 9812, MGCS 124), 스트렙토코커스 디스달락티애(S. dysdalactiae)(예를 들어, 균주 GGS 124), 스트렙토코커스 보비스(S. bovis)(예를 들어, 균주 ATCC 700338), 스트렙토코커스 안기노서스(S. anginosus)(예를 들어, 균주 F0211), 스트렙토코커스 아갈락티애(S. agalactiae)(예를 들어, 균주 NEM316, A909), 리스테리아 모노사이토게네스(예를 들어, 균주 F6854), 리스테리아 이노쿠아(리스테리아 이노쿠아, 예를 들어, 균주 Clip11262), 엔테로코커스 이탈리쿠스(Enterococcus italicus)(예를 들어, 균주 DSM 15952) 또는 엔테로코커스 파에시움(Enterococcus faecium)(예를 들어, 균주 1,231,408)의 Cas9 분자를 포함한다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는
본 명세서에 기재된 임의의 Cas9 분자 서열 또는 자연 발생 Cas9 분자 서열, 예를 들어, 본 명세서에 열거되거나(예를 들어, 서열번호 1, 2, 4 내지 6 또는 12) 또는 문헌[Chylinski 2013]에 기재된 종으로부터의 Cas9 분자와,
60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
이와 비교하는 경우 아미노산 잔기의 2%, 5%, 10%, 15%, 20%, 30% 또는 40% 이하가 상이하거나;
이와 적어도 1개, 2개, 5개, 10개 또는 20개의(그러나 100개, 80개, 70개, 60개, 50개, 40개 또는 30개 이하의) 아미노산이 상이하거나; 또는
이와 동일한 아미노산 서열을 포함한다. 일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 다음의 활성 중 하나 이상을 포함한다: 틈내기효소 활성; 이중 가닥 절단 활성(예를 들어, 엔도뉴클레아제 및/또는 엑소뉴클레아제 활성); 헬리카제 활성; 또는 gRNA 분자와 함께 표적 핵산에 국소화하는 능력.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g의 공통 서열의 아미노산 서열 중 임의의 것을 포함하며, "*"는 스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9 분자의 아미노산 서열 내의 상응하는 위치에서 발견되는 임의의 아미노산을 나타내고, "-"는 부재임을 나타낸다. 일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열의 서열과 적어도 1개의(그러나 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이하의) 아미노산 잔기가 상이하다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함한다. 다른 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 서열번호 2의 서열과 적어도 1개의(그러나 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 이하의) 아미노산 잔기가 상이하다.
다수의 Cas9 분자의 서열 비교는, 특정 영역이 보존되는 것을 나타낸다. 이들은 이하에
영역 1(잔기 1 내지 180, 또는 영역 1'의 경우에 잔기 120 내지 180)
영역 2(잔기 360 내지 480);
영역 3(잔기 660 내지 720);
영역 4(잔기 817 내지 900); 및
영역 5(잔기 900 내지 960)로서 확인된다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 생물학적으로 활성인 분자, 예를 들어, 본 명세서에 기재된 적어도 하나의 활성을 갖는 Cas9 분자를 제공하기 위해 충분한 추가적인 Cas9 분자 서열과 함께 영역 1 내지 5를 포함한다. 특정 구현예에서, 영역 1 내지 5는 각각 독립적으로 본 명세서에 기재된 Cas9 분자 또는 Cas9 폴리펩타이드의 상응하는 잔기, 예를 들어, 도 2a 내지 도 2g로부터의 서열(서열번호 1, 2, 4, 5, 14)과 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 가진다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 1로서 지칭되는 아미노산 서열을 포함하며, 이는:
스트렙토코커스 피오게네스의 Cas9의 아미노산 서열(서열번호 2)의 아미노산 1 내지 180(넘버링은 도 2에서 모티프 서열에 따르며; 도 2a 내지 도 2g의 4개의 Cas9 서열 내 잔기의 52%는 보존됨)과 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 1 내지 180과 적어도 1개, 2개, 5개, 10개 또는 20개의(그러나 90개, 80개, 70개, 60개, 50개, 40개 또는 30개 이하의) 아미노산이 상이하거나; 또는
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 1 내지 180과 동일하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 1'로서 지칭되는 아미노산 서열을 포함하며, 이는:
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 120 내지 180(도 2에서 4가지 Cas9 서열에서 잔기의 55%가 보존됨)과 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 120 내지 180과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 120 내지 180과 동일하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 2로서 지칭되는 아미노산 서열을 포함하며, 이는:
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 360 내지 480(도 2에서 4가지 Cas9 서열에서 잔기의 52%가 보존됨)과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 360 내지 480과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 360 내지 480과 동일하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 3으로서 지칭되는 아미노산 서열을 포함하며, 이는:
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 660 내지 720(도 2에서 4가지 Cas9 서열에서 잔기의 56%가 보존됨)과 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 660 내지 720과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 660 내지 720과 동일하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 4로서 지칭되는 아미노산 서열을 포함하며, 이는:
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 817 내지 900(도 2a 내지 도 2g에서 4가지 Cas9 서열에서 잔기의 55%가 보존됨)과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 817 내지 900과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 817 내지 900과 동일하다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 영역 5로서 지칭되는 아미노산 서열을 포함하며, 이는:
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 900 내지 960(도 2a 내지 도 2g에서 4가지 Cas9 서열에서 잔기의 60%가 보존됨)과 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 갖거나;
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 900 내지 960과 적어도 1개, 2개 또는 5개의(그러나 35개, 30개, 25개, 20개 또는 10개 이하의) 아미노산이 상이하거나; 또는
스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 또는 리스테리아 이노쿠아의 Cas9의 아미노산 서열(각각 서열번호 2, 4, 1 및 5)의 아미노산 900 내지 960과 동일하다.
조작된 또는 변경된 Cas9
본 명세서에 기재된 Cas9 분자 및 Cas9 폴리펩타이드는 뉴클레아제 활성(예를 들어, 엔도뉴클레아제 및/또는 엑소뉴클레아제 활성); 헬리카제 활성; gRNA 분자와 기능적으로 회합하는 능력; 및 핵산 상의 부위를 표적화하는(예를 들어, 이에 국소화하는) 능력(예를 들어, PAM 인식 및 특이성)을 포함하는 다수의 특성 중 임의의 것을 지닐 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 이들 특성의 모두 또는 하위세트를 포함할 수 있다. 전형적인 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 gRNA 분자와 상호작용하고, gRNA 분자와 협력하여, 핵산 내 부위에 국소화하는 능력을 가진다. 다른 활성, 예를 들어, PAM 특이성, 절단 활성 또는 헬리카제 활성은 Cas9 분자 및 Cas9 폴리펩타이드에서 더욱 광범위하게 변할 수 있다.
Cas9 분자는 조작된 Cas9 분자 및 조작된 Cas9 폴리펩타이드를 포함한다(이러한 맥락에서 사용되는 조작된은 단지 Cas9 분자 또는 Cas9 폴리펩타이드가 기준 서열과 상이함을 의미하며, 과정 또는 기원 제한을 암시하지 않는다). 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 (자연 발생 또는 기타 기준 Cas9 분자와 비교하여) 변경된 효소 특성, 예를 들어, 변경된 뉴클레아제 활성 또는 변경된 헬리카제 활성을 포함할 수 있다. 본 명세서에 논의된 바와 같이, 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 (이중 가닥 뉴클레아제 활성과 대조적인) 틈내기효소 활성을 가질 수 있다. 특정 구현예에서, 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 예를 들어, 하나 이상의 Cas9 활성에 대한 유의미한 영향 없이, 그의 크기를 변경시키는 변경, 예를 들어, 그의 크기를 감소시키는 아미노산 서열의 결실을 가질 수 있다. 특정 구현예에서, 조작된 Cas9 분자 또는 Cas9 폴리펩타이드는 PAM 인식에 영향을 미치는 변경을 포함할 수 있드며, 예를 들어, 조작된 Cas9 분자는 내인성 야생형 PI 도메인에 의해 인식되는 것 이외의 PAM 서열을 인식하도록 변경될 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 서열이 상이할 수 있지만, 하나 이상의 Cas9 활성의 유의미한 변경을 갖지 않는다.
원하는 특성을 갖는 Cas9 분자 또는 Cas9 폴리펩타이드는 다수의 방식으로, 예를 들어, 모체, 예를 들어, 자연 발생 Cas9 분자 또는 Cas9 폴리펩타이드의 변경에 의해 원하는 특성을 갖는 변경된 Cas9 분자 또는 Cas9 폴리펩타이드를 제공하도록 제조될 수 있다. 예를 들어, 모체 Cas9 분자, 예를 들어, 자연 발생 또는 조작된 Cas9 분자에 비한 하나 이상의 돌연변이 또는 차이가 도입될 수 있다. 이러한 돌연변이 및 차이는 치환(예를 들어, 보존적 치환 또는 비필수 아미노산의 치환); 삽입; 또는 결실을 포함한다. 일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 기준, 예를 들어, 모체 Cas9 분자에 비하여, 하나 이상의 돌연변이 또는 차이, 예를 들어, 적어도 1개, 2개, 3개, 4개, 5개, 10개, 15개, 20개, 30개, 40개 또는 50개의 돌연변이를 포함할 수 있지만, 200개, 100개 또는 80개 미만의 돌연변이를 포함할 수 있다.
특정 구현예에서, 돌연변이 또는 돌연변이들은 Cas9 활성, 예를 들어, 본 명세서에 기재된 Cas9 활성에 상당한 영향을 가질 수 있다. 다른 구현예에서, 돌연변이 또는 돌연변이들은 Cas9 활성, 예를 들어, 본 명세서에 기재된 Cas9 활성에 상당한 영향을 갖는다.
비-절단 및 변형된-절단 Cas9
일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 상이한, 예를 들어, 가장 근접한 상동성을 갖는 자연 발생 Cas9 분자와 상이한 절단 특성을 포함한다. 예를 들어, Cas9 분자 또는 Cas9 폴리펩타이드는 하기와 같이 자연 발생 Cas9 분자, 예를 들어, 스트렙토코커스 피오게네스의 Cas9 분자와 상이할 수 있다: 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스트렙토코커스 피오게네스의 Cas9 분자)와 비교시, 이중 가닥 핵산의 절단(엔도뉴클레아제 및/또는 엑소뉴클레아제 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스트렙토코커스 피오게네스의 Cas9 분자)와 비교시, 핵산의 단일 가닥, 예를 들어, 핵산 분자의 비-상보성 가닥 또는 핵산 분자의 상보성 가닥의 절단(틈내기효소 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 또는 핵산 분자, 예를 들어, 이중 가닥 또는 단일 가닥 핵산 분자를 절단하는 능력이 제거될 수 있음.
특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 하기의 활성 중 하나 이상을 포함한다: N-말단 RuvC-유사 도메인과 관련된 절단 활성; HNH-유사 도메인과 관련된 절단 활성; HNH-유사 도메인과 관련된 절단 활성 및 N-말단 RuvC-유사 도메인과 관련된 절단 활성.
특정 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 활성, 또는 절단 적격, HNH-유사 도메인(예를 들어, 본 명세서, 예를 들어, 서열번호 24 내지 28에 기재된 HNH-유사 도메인) 및 비활성, 또는 절단 부적격, N-말단 RuvC-유사 도메인을 포함한다. 예시적인 비활성, 또는 절단 부적격 N-말단 RuvC-유사 도메인은 N-말단 RuvC-유사 도메인의 아스파르트산, 예를 들어, 도 2a 내지 도 2g에 개시된 공통 서열의 위치 9에서 아스파르트산 또는 서열번호 2의 위치 10에서 아스파르트산의 돌연변이를 가질 수 있고, 예를 들어, 알라닌으로 치환될 수 있다. 일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 N-말단 RuvC-유사 도메인이 야생형과 상이하며, 예를 들어, 본 명세서에 기재된 분석에 의해 측정시, 표적 핵산을 절단하지 않거나, 또는 기준 Cas9 분자의 절단 활성보다 상당히 더 적은 효율로, 예를 들어, 20%, 10%, 5%, 1% 또는 0.1% 미만으로 절단한다. 기준 Cas9 분자는 자연 발생 비변형 Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예컨대 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스의 Cas9 분자일 수 있다. 일 구현예에서, 기준 Cas9 분자는 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다.
일 구현예에서, eaCas9 분자 또는 eaCas9 폴리펩타이드는 비활성, 또는 절단 부적격, HNH 도메인 및 활성, 또는 절단 적격, N-말단 RuvC-유사 도메인(예를 들어, 본 명세서, 예를 들어, 서열번호 15 내지 23에 기재된 RuvC-유사 도메인)을 포함한다. 예시적인 비활성, 또는 절단 부적격 HNH-유사 도메인은 예를 들어, 알라닌으로 치환될 수 있는, HNH-유사 도메인 내의 히스티딘, 예를 들어, 도 2a 내지 도 2g에 개시된 공통 서열의 위치 856에 나타난 히스티딘; 및 예를 들어, 알라닌으로 치환될 수 있는, HNH-유사 도메인 내의 하나 이상의 아스파라긴, 예를 들어, 도 2a 내지 도 2g에 개시된 공통 서열의 위치 870에 및/또는 도 2a 내지 도 2g에 개시된 공통 서열의 위치 879에 나타난 아스파라긴 중 하나 이상에서 돌연변이를 가질 수 있다. 일 구현예에서, eaCas9는 HNH-유사 도메인이 야생형과 상이하고, 예를 들어, 본 명세서에 기재된 분석에 의해 측정시, 표적 핵산을 절단하지 않거나, 또는 기준 Cas9 분자의 절단 활성보다 상당히 더 적은 효율, 예를 들어, 20%, 10%, 5%, 1% 또는 0.1% 미만으로 절단한다. 기준 Cas9 분자는 자연 발생 비변형 Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예컨대 스트렙토코커스 피오게네스 또는 스트렙토코커스 써모필러스의 Cas9 분자일 수 있다. 일 구현예에서, 기준 Cas9 분자는 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다.
특정 구현예에서, 예시적인 Cas9 활성은 PAM 특이성, 절단 활성 및 헬리카제 활성 중 하나 이상을 포함한다. 돌연변이(들)는 예를 들어, 하나 이상의 RuvC 도메인, 예를 들어, N-말단 RuvC 도메인; HNH 도메인; RuvC 도메인 및 HNH 도메인 외측의 영역에 존재할 수 있다. 일 구현예에서, 돌연변이(들)는 RuvC 도메인에 존재한다. 일 구현예에서, 돌연변이(들)는 HNH 도메인에 존재한다. 일 구현예에서, 돌연변이는 RuvC 도메인 및 HNH 도메인 둘 모두에 존재한다.
스트렙토코커스 피오게네스 서열과 관련하여 RuvC 도메인 또는 HNH 도메인에서 이루어질 수 있는 예시적인 돌연변이는 D10A, E762A, H840A, N854A, N863A 및/또는 D986A를 포함한다.
특정 구현예에서, Cas9 분자는 기준 Cas9 분자와 비교시, RuvC 도메인 및/또는 HNH 도메인의 하나 이상의 차이를 포함하는 eiCas9 분자일 수 있으며, eiCas9 분자는 예를 들어, 본 명세서에 기재된 절단 분석에서, 핵산을 절단하지 않거나, 기준 Cas9 분자보다 유의미하게 더 낮은 효율로 절단하고, 예를 들어, eiCas9 분자는 기준 Cas9 분자, 예를 들어, 상응하는 야생형 Cas9 분자보다 50%, 25%, 10% 또는 1% 더 낮은 효율로 절단한다.
특정 서열, 예를 들어, 치환이 하나 이상의 활성, 예컨대 표적화 활성, 절단 활성 등에 영향을 미칠 수 있는지 여부는, 예를 들어, 돌연변이가 보존적인지의 여부를 평가함으로써 평가 또는 예측될 수 있다. 일 구현예에서, Cas9 분자와 관련하여 사용된 바와 같은 "비필수" 아미노산 잔기는 Cas9 활성(예를 들어, 절단 활성)을 없애지 않고, 또는 더욱 바람직하게는 실질적으로 변경시키지 않고, Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예를 들어, eaCas9 분자의 야생형 서열로부터 변경될 수 있는 잔기인 반면, "필수" 아미노산 잔기를 바꾸는 것은 활성(예를 들어, 절단 활성)의 상당한 소실을 초래한다.
일 구현예에서, Cas9 분자는 자연 발생 Cas9 분자와 상이한, 예를 들어, 가장 가까운 상동성을 갖는 자연 발생 Cas9 분자와 상이한 절단 특성을 포함한다. 예를 들어, Cas9 분자는 하기와 같이, 자연 발생 Cas9 분자, 예를 들어, 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니의 Cas9 분자와 상이할 수 있다: 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니의 Cas9 분자)와 비교시, 이중 가닥 파단의 절단(엔도뉴클레아제 및/또는 엑소뉴클레아제 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 예를 들어, 자연 발생 Cas9 분자(예를 들어, 스타필로코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니의 Cas9 분자)와 비교시, 핵산의 단일 가닥, 예를 들어, 핵산 분자의 비-상보성 가닥 또는 핵산 분자의 상보성 가닥의 절단(틈내기효소 활성)을 조절, 예를 들어, 감소 또는 증가시키는 그의 능력; 또는 핵산 분자, 예를 들어, 이중 가닥 또는 단일 가닥 핵산 분자를 절단하는 능력이 제거될 수 있음.
일 구현예에서, 변경된 Cas9 분자는 하기의 활성 중 하나 이상을 포함하는 eaCas9 분자이다: RuvC 도메인과 관련된 절단 활성; HNH 도메인과 관련된 절단 활성; HNH 도메인과 관련된 절단 활성 및 RuvC 도메인과 관련된 절단 활성.
특정 구현예에서, 변경된 Cas9 분자는 예를 들어, 본 명세서에 기재된 분석에 의해 측정시, 핵산 분자(이중-가닥 또는 단일-가닥 핵산 분자)를 절단하지 않거나, 또는 기준 Cas9 분자의 절단 활성보다 상당히 더 적은 효율로, 예를 들어, 20%, 10%, 5%, 1% 또는 0.1% 미만으로 핵산 분자를 절단하는 eiCas9 분자이다. 기준 Cas9 분자는 자연 발생 비변형 Cas9 분자, 예를 들어, 자연 발생 Cas9 분자, 예컨대 스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스타필로코커스 아우레우스, 캄필로박터 제주니 또는 나이세리아 메닌지티디스의 Cas9 분자일 수 있다. 특정 구현예에서, 기준 Cas9 분자는 가장 가까운 서열 동일성 또는 상동성을 갖는 자연 발생 Cas9 분자이다. 특정 구현예에서, eiCas9 분자는 RuvC 도메인과 관련된 상당한 절단 활성 및/또는 HNH 도메인과 관련된 절단 활성이 결여되어 있다.
특정 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 소정의 서열을 가지며:
도 2a 내지 도 2g에 개시된 공통 서열의 고정 서열에 상응하는 서열은 도 2a 내지 도 2g에 개시된 공통 서열 내의 고정 잔기의 1%, 2%, 3%, 4%, 5%, 10%, 15% 또는 20% 이하가 상이하고;
도 2a 내지 도 2g에 개시된 공통 서열에서 "*"로 확인된 서열에 상응하는 서열은 자연 발생 Cas9 분자, 예를 들어, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스, 스트렙토코커스 피오게네스 또는 리스테리아 이노쿠아 Cas9 분자의 상응하는 서열과, "*" 잔기의 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35% 또는 40% 이하가 상이하다.
일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 스트렙토코커스 써모필러스의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 스트렙토코커스 써모필러스 Cas9의 아미노산 서열(서열번호 4)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.
일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 스트렙토코커스 뮤탄스의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 스트렙토코커스 뮤탄스 Cas9의 아미노산 서열(서열번호 1)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.
일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 스트렙토코커스 피오게네스의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 스트렙토코커스 피오게네스 Cas9의 아미노산 서열(서열번호 2)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.
일 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드는 도 2a 내지 도 2g에 개시된 공통 서열(서열번호 14)에서 "*"로 나타낸 하나 이상의 잔기(예를 들어, 2개, 3개, 5개, 10개, 15개, 20개, 30개, 50개, 70개, 80개, 90개, 100개 또는 200개의 아미노산 잔기)에서 리스테리아 이노쿠아의 서열과 상이한 하나 이상의 아미노산을 갖는(예를 들어, 치환) 도 2a 내지 도 2g에 개시된 리스테리아 이노쿠아 Cas9의 아미노산 서열(서열번호 5)을 포함하는 eaCas9 분자 또는 eaCas9 폴리펩타이드이다.
특정 구현예에서, 변경된 Cas9 분자 또는 Cas9 폴리펩타이드, 예를 들어, eaCas9 분자 또는 eaCas9 폴리펩타이드는 예를 들어, 둘 이상의 상이한 Cas9 분자의, 예를 들어, 상이한 종의 둘 이상의 자연 발생 Cas9 분자의 융합체일 수 있다. 예를 들어, 하나의 종의 자연 발생 Cas9 분자의 단편은 제2 종의 Cas9 분자의 단편에 융합될 수 있다. 일 예로서, N-말단 RuvC-유사 도메인을 포함하는 스트렙토코커스 피오게네스의 Cas9 분자의 단편은 HNH-유사 도메인을 포함하는 스트렙토코커스 피오게네스(예를 들어, 스트렙토코커스 써모필러스) 이외의 종의 Cas9 분자의 단편에 융합될 수 있다.
변경된 PAM 인식을 갖거나 PAM 인식을 갖지 않는 Cas9
자연 발생 Cas9 분자는 특이적 PAM 서열, 예를 들어, 스트렙토코커스 피오게네스, 스트렙토코커스 써모필러스, 스트렙토코커스 뮤탄스 및 스타필로코커스 아우레우스에 대하여 상기 기재된 PAM 인식 서열을 인식할 수 있다.
특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 동일한 PAM 특이성을 갖는다. 다른 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 자연 발생 Cas9 분자와 관련되지 않은 PAM 특이성, 또는 그것이 가장 가까운 서열 상동성을 갖는 자연 발생 Cas9 분자와 관련되지 않은 PAM 특이성을 갖는다. 예를 들어, 자연 발생 Cas9 분자는 예를 들어, PAM 인식을 변경하도록, 예를 들어, 표적-외 부위를 감소시키고/거나 특이성을 개선하거나; PAM 인식 요건을 제거하기 위하여 Cas9 분자 또는 Cas9 폴리펩타이드가 인식하는 PAM 서열을 변경하도록 변경될 수 있다. 특정 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드는 예를 들어, PAM 인식 서열의 길이를 증가시키고/거나 높은 수준의 동일성(예를 들어, gRNA와 PAM 서열 간의 98%, 99% 또는 100% 일치)까지 Cas9 특이성을 개선시키기 위해, 예를 들어, 표적-외 부위를 감소시키고/거나 특이성을 증가시키기 위해 변경될 수 있다. 특정 구현예에서, PAM 인식 서열의 길이는 적어도 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 15개의 아미노산 길이이다. 일 구현예에서, Cas9 특이성은 gRNA와 PAM 서열 간의 적어도 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 상동성을 필요로 한다. 상이한 PAM 서열을 인식하고/거나 감소된 표적-외 활성을 갖는 Cas9 분자 또는 Cas9 폴리펩타이드를 유도 진화를 사용하여 생성할 수 있다. Cas9 분자의 유도 진화를 위해 사용될 수 있는 예시적인 방법 및 시스템이 기재되어 있다(예를 들어, 문헌[Esvelt 2011] 참조). 후보 Cas9 분자를 예를 들어, 본 명세서에 기재된 방법에 의해 평가할 수 있다.
크기-최적화 Cas9
본 명세서에 기재된 조작된 Cas9 분자 및 조작된 Cas9 폴리펩타이드는 원하는 Cas9 특성, 예를 들어, 본질적으로 고유의 입체구조, Cas9 뉴클레아제 활성 및/또는 표적 핵산 분자 인식을 계속 유지하면서 분자의 크기를 감소시키는 결실을 포함하는 Cas9 분자 또는 Cas9 폴리펩타이드를 포함한다. 하나 이상의 결실 및 선택적으로 하나 이상의 링커를 포함하는 Cas9 분자 또는 Cas9 폴리펩타이드가 본 명세서에 제공되며, 링커는 결실부의 측부 배치된 아미노산 잔기 사이에 배치된다. 기준 Cas9 분자에서의 적합한 결실의 동정 방법, 결실 및 링커를 사용한 Cas9 분자의 생성 방법 및 이러한 Cas9 분자의 이용 방법은 본 명세서의 검토시 해당 분야의 숙련자에게 명백해질 것이다.
Cas9 분자, 예를 들어, 결실을 갖는 스트렙토코커스 아우레우스, 스트렙토코커스 피오게네스 또는 캄필로박터 제주니, Cas9 분자는 상응하는 자연-발생 Cas9 분자보다 더 작으며, 예를 들어, 감소된 수의 아미노산을 갖는다. 더 작은 크기의 Cas9 분자는 전달 방법에 대한 유연성의 증가를 가능하게 하며, 이에 의해, 게놈-교정을 위한 유용성을 증가시킨다. Cas9 분자는 본 명세서에 기재된 초래되는 Cas9 분자의 활성에 실질적으로 영향을 미치거나 이를 감소시키지 않는 하나 이상의 결실을 포함할 수 있다. 본 명세서에 기재된 바와 같은 결실을 포함하는 Cas9 분자에서 보유되는 활성은 다음 중 하나 이상을 포함한다:
틈내기효소 활성, 즉, 핵산 분자의 단일 가닥, 예를 들어, 비상보성 가닥 또는 상보성 가닥을 절단하는 능력; 이중 가닥 뉴클레아제 활성, 즉, 이중 가닥 핵산의 둘 모두의 가닥을 절단하고 이중 가닥 파단부를 생성하는 능력, 일 구현예에서, 2개의 틈내기효소 활성의 존재임;
엔도뉴클레아제 활성;
엑소뉴클레아제 활성;
헬리카제 활성, 즉, 이중 가닥 핵산의 나선 구조를 푸는 능력; 및
핵산 분자, 예를 들어, 표적 핵산 또는 gRNA의 인식 활성.
본 명세서에 기재된 Cas9 분자의 활성을 본 명세서에 또는 해당 분야에 기재된 활성 분석을 사용하여 평가할 수 있다.
결실에 적합한 영역의 동정
결실에 적합한 Cas9 분자의 영역을 다양한 방법에 의해 동정할 수 있다. 다양한 박테리아 종으로부터의 자연-발생 이종상동성 Cas9 분자, 예를 들어, 표 1에 열거된 것들 중 임의의 것을 스트렙토코커스 피오게네스 Cas9의 결정 구조(문헌[Nishimasu 2014]) 상으로 모델링하여, 단백질의 3차원 입체구조에 관하여 선택된 Cas9 오솔로그에 걸친 보존 수준을 시험할 수 있다. Cas9 활성에 연루되는 영역으로부터 공간적으로 원위에 위치한, 예를 들어, 표적 핵산 분자 및/또는 gRNA를 간섭하는 더 낮게 보존되거나, 보존되지 않는 영역은 상기 영역 또는 도메인이 Cas9 활성에 실질적으로 영향을 미치거나 이를 감소시키지 않는, 결실을 위한 후보임을 나타낸다.
Cas9 분자를 인코딩하는 핵산
Cas9 분자 또는 Cas9 폴리펩타이드, 예를 들어, eaCas9 분자 또는 eaCas9 폴리펩타이드를 인코딩하는 핵산이 본 명세서에 제공된다. Cas9 분자 또는 Cas9 폴리펩타이드를 인코딩하는 예시적인 핵산이 이전에 기재되어 있다(예를 들어, 문헌[Cong 2013]; 문헌[Wang 2013]; 문헌[Mali 2013]; 문헌[Jinek 2012] 참조).
일 구현예에서, Cas9 분자 또는 Cas9 폴리펩타이드를 인코딩하는 핵산은 합성 핵산 서열일 수 있다. 예를 들어, 합성 핵산 분자는 예를 들어, 본 명세서에 기재된 바와 같이 화학적으로 변형될 수 있다. 일 구현예에서, Cas9 mRNA는 하기의 특성 중 하나 이상, 예를 들어, 전부를 갖는다: 그것이 캡핑되는 특성, 폴리아데닐화되는 특성, 5-메틸시티딘 및/또는 슈도우리딘으로 치환되는 특성.
또한, 또는 대안적으로, 합성 핵산 서열은 코돈 최적화될 수 있으며, 예를 들어, 적어도 하나의 비-통상적인 코돈 또는 덜-통상적인 코돈은 통상적인 코돈에 의해 대체된다. 예를 들어, 합성 핵산은 최적화된 메신저 mRNA의 합성을 지시할 수 있으며, 예를 들어, 본 명세서에 기재된 포유동물 발현 시스템에서의 발현을 위해 예를 들어, 최적화된다.
또한, 또는 대안적으로, Cas9 분자 또는 Cas9 폴리펩타이드를 인코딩하는 핵산은 핵 국소화 서열(NLS)을 포함할 수 있다. 핵 국소화 서열은 해당 분야에 알려져 있다.
스트렙토코커스 피오게네스의 Cas9 분자를 인코딩하는 예시적인 코돈 최적화된 핵산 서열은 서열번호 3에 기재되어 있다. 스트렙토코커스 피오게네스 Cas9 분자의 상응하는 아미노산 서열은 서열번호 2에 기재되어 있다.
스타필로코커스 아우레우스의 Cas9 분자를 인코딩하는 예시적인 코돈 최적화된 핵산 서열은 서열번호 7에 기재되어 있다. 스타필로코커스 아우레우스 Cas9 분자의 아미노산 서열은 서열번호 6에 기재되어 있다.
스타필로코커스 아우레우스 Cas9의 Cas9 분자를 인코딩하는 예시적인 코돈 최적화된 핵산 서열이 하기에 제공된다.
상기 Cas9 서열 중 임의의 것이 C-말단에서 펩타이드 또는 폴리펩타이드와 융합된다면, 중단 코돈이 제거될 것이 이해된다.
기타 Cas 분자 및 Cas 폴리펩타이드
다양한 유형의 Cas 분자 또는 Cas 폴리펩타이드가 본 명세서에 개시된 본 발명을 실시하는데 사용될 수 있다. 일부 구현예에서, II형 Cas 시스템의 Cas 분자가 사용된다. 다른 구현예에서, 다른 Cas 시스템의 Cas 분자가 사용된다. 예를 들어, I형 또는 III형 Cas 분자가 사용될 수 있다. 예시적인 Cas 분자(및 Cas 시스템)는 이전에 기재되어 있다(예를 들어, 문헌[Haft 2005] 및 문헌[Makarova 2011] 참조). 예시적인 Cas 분자(및 Cas 시스템)는 또한 표 2에 나타나 있다.
후보 분자의 기능적 분석
후보 Cas9 분자, 후보 gRNA 분자 및 후보 Cas9 분자/gRNA 분자 복합체를 해당 분야에 알려져 있는 기법에 의해 또는 본 명세서에 기재된 바와 같이 평가할 수 있다. 본 명세서에 기재된 각각의 기법을 단독으로 또는 하나 이상의 기법과 함께 사용하여 후보 분자를 평가할 수 있다. 본 명세서에 개시된 기법을 제한 없이, Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법, 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 최적의 gRNA를 동정하여, 안정한 Cas9 분자/gRNA 분자 복합체를 형성하는 방법, 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법, 및 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체의 선택 방법을 포함하는 다양한 방법을 위해 사용할 수 있다.
Cas9/gRNA 복합체의 열안정성의 측정 기법
Cas9-gRNA 리보핵단백질(RNP) 복합체의 열안정성을 시차 주사 형광측정계(DSF) 및 기타 기법에 의해 검출할 수 있다. 단백질의 열안정성은 유리한 조건, 예를 들어, 결합 RNA 분자, 예를 들어, gRNA의 부가 하에 증가할 수 있다. 따라서, Cas9/gRNA 복합체의 열안정성에 관한 정보는 복합체가 안정한지 여부의 결정에 유용하다.
시차 주사 형광측정계(DSF)
DSF는 단백질의 열안정성을 측정하기 위해 사용될 수 있는 기법이다. 분석은 다수의 방식으로 적용될 수 있다. 예시적인 프로토콜은 RNP 형성을 위해 원하는 용액 조건을 결정하기 위한 프로토콜(분석 1, 하기 참조), gRNA:Cas9 단백질의 원하는 화학량론적 비를 시험하기 위한 프로토콜(분석 2, 하기 참조), Cas9 분자, 예를 들어, 야생형 또는 돌연변이 Cas9 분자에 효율적인 gRNA 분자를 스크리닝하기 위한 프로토콜(분석 3, 하기 참조) 및 표적 DNA의 존재하의 RNP 형성을 시험하기 위한 프로토콜(분석 4)을 포함하나 이에 한정되지 않는다.
분석 1
RNP 복합체를 형성하기 위해 요망되는 용액을 결정하기 위하여, Cas9의 2 μM 용액을 10x SYPRO 오렌지®(라이프 테크놀로지즈(Life Technologies) 카탈로그 번호 S-6650)를 사용하여 수 중에 제조하고, 384 웰 플레이트 내로 분배한다. 그 다음, 다양한 pH 및 염이 있는 용액에 희석된 등몰량의 gRNA를 첨가한다. 실온에서 10분 간의 인큐베이션 및 임의의 거품을 제거하기 위한 2000 rpm에서의 원심분리 후에, 바이오-래드(Bio-Rad) CFX 매니저(Manager) 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치(Touch)™ 써멀 사이클러(Thermal Cycler)를 사용하여, 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.
분석 2
제2 분석은 다양한 농도의 gRNA 분자를 상기 분석 1로부터의 완충제에서 2 μM의 Cas9와 혼합하고, 384 웰 플레이트에서 실온에서 10분 동안 인큐베이션시키는 것을 포함한다. 10x SYPRO 오렌지®(라이프 테크놀로지즈 카탈로그 번호 S-6650)가 있는 동일한 부피의 최적의 완충제를 첨가하고, 플레이트를 마이크로실(Microseal)® B 접착제(MSB-1001)로 밀봉한다. 임의의 거품을 제거하기 위한 2000 rpm에서의 원심분리 후에, 바이오-래드 CFX 매니저 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치™ 써멀 사이클러를 사용하여 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.
분석 3
제3 분석에서, 관심 Cas9 분자(예를 들어, Cas9 단백질, 예를 들어, Cas9 변이체 단백질)를 정제한다. 변이체 gRNA 분자의 라이브러리를 합성하고, 20 μM의 농도로 재현탁화시킨다. Cas9 분자를 5x SYPRO 오렌지®(라이프 테크놀로지즈 카탈로그 번호 S-6650)의 존재하에 미리 결정된 완충제에 각각 1 μM의 최종 농도로 gRNA 분자와 인큐베이션시킨다. 실온에서의 10분 동안의 인큐베이션 및 임의의 거품을 제거하기 위한 2000 rpm에서의 2분 동안의 원심분리 후에, 바이오-래드 CFX 매니저 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치™ 써멀 사이클러를 사용하여 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.
분석 4
제4 분석에서, 하기의 시료를 사용하여 DSF 실험을 수행한다: Cas9 단백질 단독, gRNA와 함께 Cas9 단백질, gRNA 및 표적 DNA와 함께 Cas9 단백질, 및 표적 DNA와 함께 Cas9 단백질. 구성성분의 혼합 순서는 다음과 같다: 반응 용액, Cas9 단백질, gRNA, DNA 및 SYPRO 오렌지. 반응 용액은 MgCl2의 부재 또는 존재 하에 10 mM HEPES pH 7.5, 100 mM NaCl을 함유한다. 임의의 거품을 제거하기 위한 2000 rpm에서의 2분 동안의 원심분리 후에, 바이오-래드 CFX 매니저 소프트웨어와 함께 바이오-래드 CFX384™ 리얼-타임 시스템 C1000 터치™ 써멀 사이클러를 사용하여 10초마다 1℃의 온도 증가와 함께 20℃로부터 90℃까지의 기울기를 전개시킨다.
본 명세서에 기재된 바와 같은 실시예 1 및 2에는 Cas9 분자 및 Cas9/gRNA 복합체의 안정성을 평가하고 결정하기 위해 DSF를 사용한 예시적인 결과가 개시되어 있다. 본 명세서에 나타낸 바와 같이, gRNA 분자의 부재하의 Cas9 분자의 Tm 값에 비하여 더 높은 Cas9/gRNA 복합체의 Tm 값은 Cas9와 gRNA 간의 더욱 단단한 복합체를 나타낸다. 따라서, Cas9 분자 및 Cas9/gRNA 복합체의 Tm에 관한 정보는 Cas9/gRNA 복합체가 안정한지 여부를 결정하는데 유용하다.
DSF에 더하여, Cas9 분자/gRNA 분자 복합체 또는 그의 제제에서 Cas9 분자의 안정성을 결정하기 위해 사용될 수 있는 해당 분야에 알려져 있는 수많은 추가의 기법이 존재한다. 이들은 시차 주사 열량계(DSC) 및 등열 적정 열량계(ITC)를 포함하나 이들에 한정되지 않는 열안정성을 측정하는 DSF에 대한 대안적인 방법을 포함한다.
DSC
DSC는 상이한 완충제 및 아포(apo) 대 복합체 중에서 물질의 열안정성을 측정하는데 매우 정밀한 기법이다. DSC의 이점은 그것이 또한 시료 간의 전이의 엔탈피의 차이를 제공할 수 있다는 점이다. 그러나, DSC는 수행하는데 DSF보다 더 많은 양의 물질을 필요로 한다(50배 초과). DSC는 한번에 단일의 시료만을 수행할 수 있기 때문에, 처리효율이 더 낮다.
ITC
ITC는 2개의 분자의 열안정성 및 상호작용의 운동 속도 둘 모두를 측정할 수 있다. 다른 기법에 비한 ITC의 이점은 그것이 더욱 정밀한 측정 및 운동 정보를 제공한다는 점이다. 그러나, 그것은 더 낮은 처리효율 및 더 많은 양의 물질을 필요로 한다.
본 명세서에 개시된 열안정성 기법을 사용하여, 분자(예를 들어, Cas9 분자)의 열안정성을 측정할 수 있으며, 이는 유리한 조건, 예를 들어, 결합 RNA 분자의 부가 하에서 증가할 수 있다. 또한, 분자의 열안정성은 유리한 조건, 예를 들어, 구성성분의 존재 하에서 증가할 수 있다. 특정 구현예에서, 구성성분은 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 다른 완충제 구성성분을 포함할 수 있다.
특정 구현예에서, 분자(예를 들어, Cas9/gRNA 복합체)의 열안정성 값이 기준 분자의 열안정성 값 또는 열안정성 기준 값보다 더 크면, 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 측정 중인 열안정성 값은 분자의 변성 온도 값이다. 예를 들어, 특정 구현예에서, 분자(예를 들어, Cas9/gRNA 복합체)의 변성 온도 값이 기준 분자의 변성 온도 값 또는 변성 온도 기준 값보다 더 크면, 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 측정 중인 열안정성 값은 분자의 Tm 값이다. 예를 들어, 특정 구현예에서, 분자(예를 들어, Cas9/gRNA 복합체)의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자의 부재 하의 Cas9 분자일 수 있다.
특정 구현예에서, 분자의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃, 적어도 20℃, 적어도 21℃, 적어도 22℃, 적어도 23℃, 적어도 24℃, 적어도 25℃, 적어도 26℃, 적어도 27℃, 적어도 28℃, 적어도 29℃, 적어도 30℃, 적어도 31℃, 적어도 32℃, 적어도 33℃, 적어도 34℃, 적어도 35℃, 적어도 36℃, 적어도 37℃, 적어도 38℃, 적어도 39℃, 적어도 40℃, 적어도 41℃, 적어도 42℃, 적어도 43℃, 적어도 44℃, 적어도 45℃, 적어도 46℃, 적어도 47℃, 적어도 48℃, 적어도 49℃ 또는 적어도 50℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 분자의 Tm 값이 기준 분자 또는 Tm 기준 값보다 적어도 8℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.
특정 구현예에서, 분자의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 약 42℃, 약 43℃, 약 44℃, 약 45℃, 약 46℃, 약 47℃, 약 48℃, 약 49℃ 또는 약 50℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 분자의 Tm 값이 기준 분자 또는 Tm 기준 값보다 약 8℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.
특정 구현예에서, 분자의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 약 1℃ 내지 약 5℃, 약 6℃ 내지 약 10℃, 약 11℃ 내지 약 15℃, 약 16℃ 내지 약 20℃, 약 21℃ 내지 약 25℃, 약 26℃ 내지 약 30℃, 약 31℃ 내지 약 35℃, 약 36℃ 내지 약 40℃, 약 41℃ 내지 약 45℃, 약 46℃ 내지 약 50℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 분자의 Tm 값이 기준 분자 또는 Tm 기준 값보다 약 6℃ 내지 약 10℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 분자의 Tm 값이 기준 분자 또는 Tm 기준 값보다 약 8℃ 내지 약 9℃ 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.
본 명세서에 제공되는 특정 구현예에서, 본 명세서의 방법은 Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계, Cas9 분자/gRNA 분자 복합체의 Tm 값과 기준 분자의 Tm 값 또는 Tm 기준 값 사이의 델타 값을 결정하는 단계, 및 델타 값이 적어도 8℃이며, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.
특정 구현예에서, 평가 중인 분자의 Tm 값과 기준 분자의 Tm 값 또는 Tm 기준 값 사이의 델타 값이 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃, 적어도 20℃, 적어도 21℃, 적어도 22℃, 적어도 23℃, 적어도 24℃, 적어도 25℃, 적어도 26℃, 적어도 27℃, 적어도 28℃, 적어도 29℃, 적어도 30℃, 적어도 31℃, 적어도 32℃, 적어도 33℃, 적어도 34℃, 적어도 35℃, 적어도 36℃, 적어도 37℃, 적어도 38℃, 적어도 39℃, 적어도 40℃, 적어도 41℃, 적어도 42℃, 적어도 43℃, 적어도 44℃, 적어도 45℃, 적어도 46℃, 적어도 47℃, 적어도 48℃, 적어도 49℃ 또는 적어도 50℃이고, 평가 중인 분자의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 평가 중인 분자는 CA9 분자/gRNA 분자 복합체일 수 있으며, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.
특정 구현예에서, 평가 중인 분자의 Tm 값과 기준 분자의 Tm 값 또는 Tm 기준 값 사이의 델타 값이 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 약 42℃, 약 43℃, 약 44℃, 약 45℃, 약 46℃, 약 47℃, 약 48℃, 약 49℃ 또는 약 50℃이고, 평가 중인 분자의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 델타 값이 약 8℃이고, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.
특정 구현예에서, 평가 중인 분자의 Tm 값과 기준 분자의 Tm 값 또는 Tm 기준 값 사이의 델타 값이 약 1℃ 내지 약 5℃, 약 6℃ 내지 약 10℃, 약 11℃ 내지 약 15℃, 약 16℃ 내지 약 20℃, 약 21℃ 내지 약 25℃, 약 26℃ 내지 약 30℃, 약 31℃ 내지 약 35℃, 약 36℃ 내지 약 40℃, 약 41℃ 내지 약 45℃, 약 46℃ 내지 약 50℃이고, 평가 중인 분자의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다. 예를 들어, 델타 값이 약 6℃ 내지 약 10℃이고, Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, Cas9 분자/gRNA 분자 복합체를 선택하거나, 안정한 것으로 결정할 수 있다. 특정 구현예에서, 기준 분자는 gRNA 분자 부재의 Cas9 분자일 수 있다.
특정 구현예에서, 본 명세서에 사용되는 방법을 사용하여, Cas9 분자와 복합체화된 상이한 길이를 갖는 복수의 gRNA를 평가하여, 어떤 Cas9/gRNA 복합체가 안정한 Cas9/gRNA 복합체를 형성하는지를 결정할 수 있다. 또한, 이들 방법을 사용하여, Cas9 분자 및 gRNA 분자의 상이한 화학량론을 평가하여, 어떤 Cas9/gRNA 복합체가 안정한 Cas9/gRNA 복합체를 형성하는지를 결정할 수 있다.
특정 구현예에서, Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 복수의 시료를 생성할 수 있으며, 각각의 시료는 Cas9/gRNA 복합체를 포함한다. 특정 구현예에서, Cas9/gRNA 복합체의 Tm 값을 복수의 시료의 각각에서 검출할 수 있다. 특정 구현예에서, (i) 기준 Cas9/gRNA 복합체의 Tm 값 또는 미리 결정된 역치 Tm 값과 복수의 시료에서의 Tm 값의 비교, 또는 (ii) 복수의 시료의 Tm 값의 상대적 순서화 중 하나 이상에 기반하여, 복수의 시료로부터 적어도 하나의 시료를 선택할 수 있다. 특정 구현예에서, Tm 값은 DSF에 의해 검출될 수 있다. 특정 구현예에서, Cas9 분자/gRNA 분자 복합체의 Tm 값이 gRNA 분자 부재의 Cas9 분자의 Tm 값보다 적어도 8℃ 더 크면, 적어도 하나의 시료를 선택할 수 있다.
Cas9 및 Cas9/gRNA 복합체의 활성을 측정하기 위한 기법
열안정성 기법에 더하여, 본 명세서의 방법과 함께 사용될 수 있는 해당 분야에 알려져 있는 다양한 다른 기법이 존재한다. 예를 들어, Cas9 분자/gRNA 분자 복합체 또는 그의 분자의 특정 활성을 측정하여, Cas9 분자/gRNA 분자 복합체 또는 그의 분자가 안정한지 여부를 결정하거나 선택할 수 있다. 이들 기법을 단독으로 또는 본 명세서에 기재된 열안정성 기법과 함께 사용하여, Cas9 분자/gRNA 분자 복합체 또는 그의 분자가 안정한지 여부를 결정할 수 있다. 본 명세서에 개시된 기법을 사용하여 평가 중인 분자의 활성을 검출할 수 있다(예를 들어, Cas9 분자/gRNA 분자 복합체 내의 Cas9 분자, Cas9 분자/gRNA 분자 복합체 내의 gRNA 분자, 또는 Cas9 분자/gRNA 분자 복합체 또는 그의 제제). 특정 구현예에서, 평가 중인 분자의 활성 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, 평가 중인 분자를 선택하거나, 안정한 것으로 결정할 수 있다.
검출될 수 있는 평가될 분자의 다양한 활성은 분자의 결합 활성 및 절단 활성을 포함한다. 평가될 분자의 결합 활성 및 절단 활성을 본 명세서에 기재된 기법을 사용하여 검출할 수 있다.
분자의 결합 활성의 일부 예는 제한 없이, DNA 표적에 계속 혼성화되는 gRNA 분자의 능력, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력 또는 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력을 포함한다. 특정 구현예에서, 분자의 결합 활성이 검출 중인 경우, 결합 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, 평가 중인 분자를 선택하거나 안정한 것으로 결정할 수 있다.
절단 활성의 일부 예는 제한 없이, 삽입결실을 유도하는 능력, 표적 DNA를 변형시키는 능력 및 미리 선택된 수선 방법의 경향을 포함한다. 특정 구현예에서, 절단 활성이 검출 중인 경우, 절단 값을 측정할 수 있다. 특정 구현예에서, 평가 중인 분자의 절단 값이 기준 분자의 절단 값 또는 절단 기준 값보다 더 크면, 평가 중인 분자를 선택하거나 안정한 것으로 결정할 수 있다.
Cas9 및 Cas9/gRNA 복합체의 결합 활성(반응속도론)을 측정하기 위한 기법
평가 중인 분자(예를 들어, Cas9 분자/gRNA 분자 복합체 내의 Cas9 분자, Cas9 분자/gRNA 분자 복합체 내의 gRNA 분자, 또는 Cas9 분자/gRNA 분자 복합체 또는 그의 제제)의 결합 활성을 다양한 기법을 사용하여 검출할 수 있다. 2개의 분자 간의 결합 반응속도론은 특정 조건, 예를 들어, 구성성분의 존재하에서 더욱 유리할 수 있다. 특정 구현예에서, 구성성분은 첨가제, 소분자, 안정화 시약, 완충제, pH, 염 농도, 글리세롤 농도 또는 다른 완충제 구성성분 또는 특성 구성성분의 첨가를 포함할 수 있다.
Cas9/gRNA 복합체의 결합 활성을 검출하는 것을 포함하는 방법은 제한 없이, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력을 검출하는 것 및 표적 DNA에 결합하는 Cas9 분자 및 Cas9/gRNA 복합체의 능력을 검출하는 것을 포함한다. 이들 방법은 기법, 예를 들어, 평가 중인 분자의 결합에 대한 생물물리학적 정보를 제공하는 반응속도론 분석을 사용하여, 수행될 수 있다. 사용될 수 있는 반응속도론 분석의 일부 예에는 제한 없이, 하기에 기재된 바와 같은 표면 플라스몬 공명(SPR), 바이오층 간섭법(BLI) 및 겔 밴드 변화 분석이 있다.
SPR
SPR은 비아코어(BiaCore) 또는 프로테온(ProteOn) XPR 시스템 중 어느 하나의 이용을 필요로 한다. 이러한 기법에서, 하나의 분자는 공유적으로 또는 친화성 방법을 통하여 칩의 표면에 부착된다. 제2 분자를 유세포 내로 주입하고, 완충제를 통과하도록 추진한다. 반사광의 각의 변화는 플라스몬 공명의 양의 변화를 야기한다. 이로부터, 운동 회합 및 해리를 측정할 수 있다.
BLI
BLI는 포르테바이오(forteBio)에 의해 옥테트(Octet)로 지칭되는 기기를 필요로 한다. SPR과 유사하게, BLI는 2개의 분자 사이의 상호작용의 운동 속도를 결정할 수 있다.
겔 밴드 변화 분석
겔 밴드 변화 분석(예를 들어, 전기영동 이동성 변화 분석)은 2개의 상호작용 분자의 KD를 결정하기 위한 또 다른 방법이다. 이러한 결정은 다른 이용가능한 기법보다 더욱 조잡하지만 상대적으로 저렴한 시약으로 수행될 수 있다는 이점을 갖는다.
결합 분석: 표적 DNA로의 Cas9 분자 및 Cas9/gRNA 복합체의 결합의 시험
표적 DNA로의 Cas9 분자의 결합을 평가하기 위한 예시적인 방법이 이전에 기재되어 있다(문헌[Jinek 2012]). 본 명세서에 기재된 기법, 예를 들어, SPR, BLI 및 겔 밴드 변화 분석을 사용하여, 예를 들어, Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 gRNA 분자의 능력 또는 표적 DNA에 결합하는 Cas9 분자 및 Cas9/gRNA 복합체의 능력을 측정할 수 있다.
예를 들어, 전기영동 이동성 변화 분석에서, 표적 DNA 듀플렉스는 탈이온수 중에 각각의 가닥(10 nmol)을 혼합하고, 95℃로 3분 동안 가열하고 실온으로 서서히 냉각시킴으로써 형성된다. 모든 DNA를 1X TBE를 함유하는 8% 고유 겔 상에서 정제한다. DNA 밴드를 UV 투영법에 의해 가시화한 다음, 절개하고, DEPC-처리 H2O 중에 겔 조각을 침지시킴으로써 용리시킨다. 용리된 DNA를 에탄올 침전시키고, DEPC-처리된 H2O 중에 용해시킨다. DNA 시료를 37℃에서 30분 동안 T4 폴리뉴클레오타이드 키나제를 이용하여 [γ-32P]-ATP로 5' 말단 표지한다. 폴리뉴클레오타이드 키나제를 65℃에서 20분 동안 열 변성시키고, 컬럼을 이용하여 비혼입 방사성 표지를 제거한다. 총 부피 10 ㎕에 20 mM HEPES pH 7.5, 100 mM KCl, 5 mM MgCl2, 1 mM DTT 및 10% 글리세롤을 함유하는 완충제 중에서 결합 분석을 수행한다. Cas9 단백질 분자를 등몰량의 미리 어닐링된 gRNA 분자에 의해 프로그래밍시키고, 100 pM로부터 1 μM까지 적정한다. 방사성 표지된 DNA를 최종 농도 20 pM로 첨가한다. 시료를 1 시간 동안 37℃에서 인큐베이션시키고, 4℃에서 1X TBE 및 5 mM MgCl2를 함유하는 8% 고유 폴리아크릴아미드 겔 상에서 분리한다. 겔을 건조시키고, DNA를 인광 영상화에 의해 가시화시킨다.
Cas9/gRNA 복합체의 절단 활성을 측정하기 위한 기법
본 명세서에 기재된 방법은 Cas9/gRNA 복합체의 절단 활성을 검출하는 것을 포함할 수 있다. 이것은 표적 DNA를 변형시키는 Cas9/gRNA 복합체의 능력, 예를 들어, 표적 핵산을 절단하는 Cas9/gRNA 복합체의 능력을 검출하는 것을 포함할 수 있다. Cas9/gRNA 복합체의 절단 활성을 검출하기 위해 사용될 수 있는 기법의 일부 예는 본 명세서에 기재된다.
절단 분석: Cas9 분자/gRNA 분자 복합체의 엔도뉴클레아제 활성의 시험
Cas9/gRNA 복합체의 안정성을 결정하기 위해 시험될 수 있는 추가의 활성은 표적 DNA를 변형시키는 Cas9/gRNA 복합체의 능력, 예를 들어, 표적 핵산을 절단하는 Cas9/gRNA 복합체의 능력을 포함한다. Cas9/gRNA 복합체의 엔도뉴클레아제 활성을 본 명세서에 개시된 바와 같이 측정할 수 있다. 예를 들어, Cas9 분자의 엔도뉴클레아제 활성을 평가하기 위한 예시적인 방법이 이전에 기재되어 있다(문헌[Jinek 2012]).
표적 핵산에 결합하고, 이를 절단하는 Cas9 분자/gRNA 분자 복합체의 능력을 플라스미드 절단 분석에서 평가할 수 있다. 이러한 분석에서, 합성 또는 시험관내-전사된 gRNA 분자를 95℃로 가열시키고, 실온으로 서서히 냉각시킴에 의해 반응 이전에 미리 어닐링시킨다. 고유 또는 제한 분해-선형화된 플라스미드 DNA(300 ng(약 8 nM))를 37℃에서 60분 동안 10 mM MgCl2가 존재하거나, 이것이 존재하지 않는 Cas9 플라스미드 절단 완충제(20 mM HEPES pH 7.5, 150 mM KCl, 0.5 mM DTT, 0.1 mM EDTA)에서, 정제된 Cas9 단백질 분자(50 내지 500 nM) 및 gRNA(50 내지 500 nM, 1:1)와 인큐베이션시킨다. 반응을 5X DNA 로딩 완충제(30% 글리세롤, 1.2% SDS, 250 mM EDTA)로 중단시키고, 0.8% 또는 1% 아가로스 겔 전기영동에 의해 분리하고, 에티듐 브로마이드 염색에 의해 가시화시킨다. 초래되는 절단 산물은 Cas9 분자가 둘 모두의 DNA 가닥을 절단하는지, 2개 중 오직 1개의 가닥만을 절단하는지를 나타낸다. 예를 들어, 선형 DNA 산물은 둘 모두의 DNA 가닥의 절단을 나타내는 한편, 닉이 있는 열린 원형 산물은 2개의 가닥 중 오직 1개 만이 절단된 것을 나타낸다.
대안적으로, 표적 핵산에 결합하고, 이를 절단하는 Cas9 분자/gRNA 분자 복합체의 능력을 올리고뉴클레오타이드 DNA 절단 분석에서 평가할 수 있다. 이러한 분석에서, DNA 올리고뉴클레오타이드(10 pmol)를 50 ㎕ 반응물 중에서 37℃에서 30분 동안 1X T4 폴리뉴클레오타이드 키나제 반응 완충제 중 5 유닛의 T4 폴리뉴클레오타이드 키나제 및 약 3 pmol 내지 6 pmol(약 20 mCi 내지 40 mCi)[γ-32P]-ATP와 함께 인큐베이션시킴으로써 방사성 표지한다. 열 불활성화 후에(65℃에서 20분 동안), 혼입되지 않은 표지를 제거하기 위해 칼럼을 통해 반응물을 정제한다. 95℃에서 3분 동안 등몰량의 비표지 상보성 올리고뉴클레오타이드를 이용하여 표지된 올리고뉴클레오타이드를 어닐링한 후에, 실온으로 서서히 냉각시킴으로써 듀플렉스 기질(100 nM)을 생성한다. 절단 분석을 위해, gRNA 분자를 95℃로 30초 동안 가열한 후에 실온으로 서서히 냉각함으로써 어닐링시킨다. Cas9(500 nM 최종 농도)는 총 부피 9 ㎕ 중에서 절단 분석 완충제(20 mM HEPES pH 7.5, 100 mM KCl, 5 mM MgCl2, 1 mM DTT, 5% 글리세롤) 중에서 어닐링된 gRNA 분자(500 nM)와 함께 미리 인큐베이션시킨다. 1 ㎕의 표적 DNA(10 nM)의 첨가에 의해 반응을 개시하고, 37℃에서 1시간 동안 인큐베이션시킨다. 20 ㎕의 로딩 염료(5 mM EDTA, 0.025% SDS, 포름아미드 중 5% 글리세롤)의 첨가에 의해 반응을 퀀칭시키고, 95℃로 5분 동안 가열하였다. 7M 우레아를 함유하는 12% 변성 폴리아크릴아미드 겔 상에서 절단 산물을 분리하고, 인광 영상화에 의해 가시화시킨다. 얻어진 절단 산물은 상보성 가닥, 비상보성 가닥 또는 둘 모두가 절단되는지의 여부를 나타낸다.
이들 분석 중 하나 또는 둘 모두는 Cas9/gRNA 복합체의 안정성을 결정하고, 후보 gRNA 분자 또는 후보 Cas9 분자의 적합성을 평가하기 위해 사용될 수 있다.
게놈 교정 방법
본 명세서에 기재된 방법은 Cas9 분자/gRNA 분자 복합체를 평가하기 위해 사용될 수 있다. 이들 Cas9 분자/gRNA 분자 복합체는 본 명세서에 논의된 방법 또는 경로 중 하나 이상을 사용하여 유전자를 표적화하기 위해 사용될 수 있다. 특정 구현예에서, 표적 유전자의 돌연변이는 외인적으로 제공되는 주형 핵산을 사용하여 HDR에 의해 보정된다. 다른 구현예에서, 표적 유전자의 돌연변이는 외인적으로 제공되는 주형 핵산을 사용하지 않고, HDR에 의해 보정된다. 특정 구현예에서, 표적 유전자의 하나 또는 둘 모두의 대립유전자를 NHEJ를 사용하여 낙 아웃시킨다. 특정 구현예에서, 표적 유전자의 발현을 낙 다운시킨다. 본 명세서에 기재된 방법을 사용하여 Cas9 분자/gRNA 분자 복합체가 본 명세서에 논의된 방법 또는 경로 중 하나 이상에 바람직한지 여부를 평가할 수 있다.
HDR 수선 및 주형 핵산
본 명세서에 기재된 바와 같이, 뉴클레아제-유도된 HDR을 사용하여, 표적 서열 내의 표적 위치를 변경(예를 들어, 게놈 내의 돌연변이를 보정, 예를 들어, 수선 또는 교정)시킬 수 있다.
특정 구현예에서, 표적 위치를 변경시키기 위한 HDR-기반의 방법은 외인적으로 제공되는 주형 핵산(본 명세서에서 공여자 작제물 또는 공여자 주형으로도 지칭)을 사용한다. 이론에 의해 구속되지 않고, 표적 위치의 변경은 외인적으로 제공되는 공여자 주형 또는 주형 핵산에 의한 HDR에 의해 일어나는 것으로 여겨진다. 플라스미드 공여자 주형이 상동성 재조합을 위한 주형으로서 사용될 수 있는 것이 고려된다. 추가로, 단일 가닥 공여자 주형이 표적 서열과 공여자 주형 사이의 HDR(예를 들어, 단일 가닥 어닐링)의 대안의 방법에 의해 표적 위치의 변경을 위한 주형으로서 사용될 수 있는 것이 고려된다. 표적 위치의 공여자 주형-영향 변경은 Cas9 분자에 의한 절단에 좌우된다. Cas9에 의한 절단은 이중 가닥 파단 또는 2개의 단일 가닥 파단을 포함할 수 있다.
다른 구현예에서, 표적 위치를 변경시키기 위한 HDR-기반의 방법은 외인적으로 제공되는 주형 핵산을 사용하지 않는다. 이론에 의해 구속되지 않고, 표적 위치의 변경은 내인성 게놈 공여자 서열에 의한 HDR에 의해 일어나는 것으로 여겨진다. 특정 구현예에서, 내인성 게놈 공여자 서열은 표적 위치와 동일한 염색체 상에 위치한다. 다른 구현예에서, 내인성 게놈 공여자 서열은 표적 서열과 상이한 염색체 상에 위치한다. 내인성 게놈 공여자 서열에 의한 표적 위치의 변경은 Cas9 분자에 의한 절단에 좌우된다. Cas9에 의한 절단은 이중 가닥 파단 또는 2개의 단일 가닥 파단을 포함할 수 있다.
주형 핵산을 사용하여 또는 내인성 게놈 공여자 서열을 사용하여 HDR에 의해 보정될 수 있는 돌연변이는 점 돌연변이를 포함한다. 특정 구현예에서, 점 돌연변이는 하나의 이중-가닥 파단 또는 2개의 단일-가닥 파단 중 어느 하나를 사용하여 보정될 수 있다. 특정 구현예에서, 점 돌연변이는 (1) 하나의 이중-가닥 파단, (2) 2개의 단일 가닥 파단, (3) 파단이 표적 위치의 각각의 측 상에서 일어나는 2개의 이중 가닥 파단, (4) 이중 가닥 파단 및 2개의 단일 가닥 파단이 표적 위치의 각각의 측 상에서 일어나는 하나의 이중 가닥 파단 및 2개의 단일 가닥 파단, (5) 단일 가닥 파단의 쌍이 표적 위치의 각각의 측 상에서 일어나는 4개의 단일 가닥 파단, 또는 (6) 하나의 단일-가닥 파단에 의해 보정될 수 있다.
단일 가닥 주형 핵산이 사용되는 특정 구현예에서, 표적 위치는 대안적인 HDR에 의해 변경될 수 있다.
표적 위치의 공여자 주형-영향 변경은 Cas9 분자에 의한 절단에 좌우된다. Cas9에 의한 절단은 닉, 이중 가닥 파단 또는 예를 들어, 표적 핵산의 각 가닥 상에 있는 2개의 단일 가닥 파단을 포함할 수 있다. 표적 핵산 상의 파단의 도입 후에, 파단 말단에 절제가 일어나서, 단일 가닥 오버행 DNA 영역이 초래된다.
정규 HDR에서, 표적 핵산 내로 직접 혼입되거나, 표적 핵산의 서열을 보정하기 위한 주형으로 사용될 표적 핵산에 대한 상동성 서열을 포함하는 이중 가닥 공여자 주형을 도입한다. 파단부에서의 절제 후에, 상이한 경로에 의해, 예를 들어, 이중 홀리데이(Holliday) 접합 모델(또는 이중 가닥 파단 수선, DSBR, 경로) 또는 합성-의존성 가닥 어닐링(SDSA) 경로에 의해 수선이 진행될 수 있다. 이중 홀리데이 접합 모델에서, 공여자 주형 내의 상동성 서열로의 표적 핵산의 2개의 단일 가닥 오버행에 의한 가닥 침입이 발생하여, 2개의 홀리데이 접합부가 있는 중간체의 형성을 초래한다. 새로운 DNA가 침입하는 가닥의 말단으로부터 합성되어 절제로부터 초래되는 갭을 채우는 동안, 접합부가 이동한다. 새로 합성된 DNA의 말단은 절제된 말단에 라이게이션되며, 접합부는 분리되어, 표적 핵산의 보정, 예를 들어, 상응하는 표적 위치에서의 공여자 주형의 보정 서열의 혼입을 초래한다. 접합부의 분리시에 공여자 주형과의 교차가 발생할 수 있다. SDSA 경로에서, 오직 하나의 단일 가닥 오버행이 공여자 주형을 침입하며, 신규한 DNA가 침입 가닥의 말단으로부터 합성되어 절제로부터 초래되는 갭을 채운다. 그 다음, 새로 합성된 DNA는 남아 있는 단일 가닥 오버행에 어닐링되며, 새로운 DNA가 합성되어, 갭을 채우고, 가닥은 라이게이션되어, 보정된 DNA 듀플렉스를 생성한다.
대안적 HDR에서, 단일 가닥 공여자 주형, 예를 들어, 주형 핵산이 도입된다. 원하는 A1AT 표적 위치를 변경하기 위한 표적 핵산에서의 닉, 단일-가닥 파단 또는 이중-가닥 파단은 예를 들어, 본 명세서에 기재된 Cas9 분자에 의해 매개되며, 파단부에서의 절제가 발생하여, 단일 가닥 오버행이 드러난다. 표적 핵산의 표적 위치를 보정하거나 변경시키기 위한 주형 핵산의 서열의 혼입은 전형적으로 상기 기재된 바와 같이 SDSA 경로에 의해 일어난다.
주형 핵산에 대한 추가의 상세사항은 국제 출원 제PCT/US2014/057905호에 제목이 "Template nucleic acids"인 섹션 IV에 제공되어 있다.
유전자 표적화를 위한 NHEJ 방법
본 명세서에 기재된 바와 같이, 뉴클레아제-유도 NHEJ는 유전자-특이적 넉아웃(knockout)을 표적화하고 관심 대상의 유전자에서 서열을 제거하기 위해(예를 들어, 결실시키기 위해) 사용될 수 있다.
이론에 의해 구속되지 않고, 특정 구현예에서, 본 명세서에 기재된 방법과 관련된 게놈 변경은 뉴클레아제-유도 NHEJ 및 NHEJ 수선 경로의 오류 유발 성질에 의존하는 것으로 여겨진다. NHEJ는 2개의 말단을 함께 연결함으로써 DNA 내 이중 가닥 파단을 수선하지만; 일반적으로, 원래의 서열은 두 적합성 말단이 그들이 정확히 이중 가닥 파단에 의해 형성되어서, 완벽하게 라이게이션되는 경우에만 수선된다. 이중 가닥 파단부의 DNA 말단은 빈번하게는 효소적 가공 대상이며, 이는 말단의 재연결 이전에 하나 또는 둘 모두의 가닥에서 뉴클레오타이드의 첨가 또는 제거를 초래한다. 이는 NHEJ 수선 부위에서 DNA 서열 내의 삽입 및/또는 결실(삽입결실) 돌연변이의 존재를 초래한다. 통상적으로 이들 돌연변이 중 2/3는 리딩 프레임을 변경시키며, 따라서, 비기능성 단백질을 생성한다. 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이는 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 결정적이지 않은 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 유전자좌 의존적이다.
NHEJ에 의해 생성된 삽입결실 돌연변이는 성질이 예측불가능하지만; 그러나, 주어진 파단 부위에서 특정 삽입결실 서열이 선호되며, 집단에서 과다 표현되는데, 이는 작은 영역의 마이크로상동성 때문일 가능성이 있다. 결실의 길이는 광범위하게 달라질 수 있으며; 그들은 가장 통상적으로는 1 bp 내지 50 bp 범위이지만, 그들은 100 bp 내지 200 bp 초과에 도달할 수 있다. 삽입은 더 짧게 되는 경향이 있으며, 종종 파단 부위를 바로 둘러싸는 서열의 짧은 중복을 포함한다. 그러나, 큰 삽입을 얻을 수 있고, 이들 경우에 삽입된 서열을 종종 게놈의 다른 영역에 대해 또는 세포 내에 존재하는 플라스미드 DNA에 대해 추적하였다.
NHEJ는 돌연변이유발 과정이기 때문에, 이는 또한 특이적 최종 서열의 생성이 필요하지 않는 한, 작은 서열 모티프(예를 들어, 50개 이하의 뉴클레오타이드 길이의 모티프)를 결실시키는데 사용될 수 있다. 이중 가닥 파단부가 표적 서열 근처에서 표적화된다면, NHEJ 수선에 의해 야기되는 결실 돌연변이는 종종 걸쳐서 이어지고, 따라서 원치않는 뉴클레오타이드를 제거한다. 더 큰 DNA 세그먼트의 결실을 위해, 서열의 각각의 측면 상에서 하나씩 두 이중-가닥 파단을 도입시키는 것은 전체 개재 서열의 제거에 의해 말단들 사이에 NHEJ를 초래할 수 있다. 이러한 방식으로, 수백 킬로베이스만큼 큰 DNA 세그먼트가 결실될 수 있다. 이들 방법 중 둘 모두는 특이적 DNA 서열을 결실시키기 위해 사용될 수 있지만; NHEJ의 오류-유발 성질은 여전히 수선 부위에서 삽입결실 돌연변이를 생성할 수 있다.
둘 모두의 이중 가닥 절단 eaCas9 분자 및 단일 가닥 또는 틈내기효소, eaCas9 분자는 NHEJ-매개 삽입결실을 생성하기 위해 본 명세서에 기재된 방법 및 조성물에서 사용될 수 있다. 유전자, 예를 들어, 코딩 영역, 예를 들어, 관심 대상 유전자의 초기 코딩 영역에 표적화된 NHEJ-매개 삽입결실은 관심 대상의 유전자를 넉아웃시키기 위해(즉, 유전자의 발현을 제거하기 위해) 사용될 수 있다. 예를 들어, 관심 대상의 유전자의 초기 코딩 영역은 출발 코돈의 직후의, 코딩 서열의 제1 엑손 내의, 또는 출발 코돈의 500 bp(예를 들어, 500 bp, 450 bp, 400 bp, 350 bp, 300 bp, 250 bp, 200 bp, 150 bp, 100 bp 또는 50 bp 미만) 내의 서열을 포함한다.
표적화된 넉다운
DNA 수준에서 유전자를 돌연변이시킴으로써 발현을 영구적으로 제거하는 CRISPR/Cas-매개 유전자 넉아웃과 달리, CRISPR/Cas 넉아웃은 인공 전사 인자의 사용을 통해 유전자 발현이 일시적으로 감소되게 한다. Cas9 단백질의 DNA 절단 도메인 둘 다에서 중요한 잔기의 돌연변이(예를 들어, D10A 및 H840A 돌연변이)는 효소적 불활성 Cas9(사멸 Cas9 또는 dCas9로서도 알려진 eiCas9) 분자의 생성을 초래한다. eiCas9 분자는 gRNA와 복합체화하고, gRNA의 표적화 도메인에 의해 구체화되는 DNA 서열에 국소화되지만, 표적 DNA를 절단하지 않는다. 효과기(effector) 도메인, 예를 들어, 전사 억제 도메인으로의 eiCas9의 융합은 gRNA에 의해 구체화된 임의의 DNA 부위로의 효과기의 동원을 가능하게 한다. eiCas9 분자 그 자체는 코딩 서열 내 초기 영역에 동원되는 경우 전사를 차단할 수 있지만, 더욱 강력한 억제는 전사 억제 도메인(예를 들어, KRAB, SID 또는 ERD)을 eiCas9에 융합시키고 그것을 표적 넉다운 위치에, 예를 들어, 출발 코돈에 대하여 3'의 서열의 1000 bp 이내에 또는 유전자 출발 코돈에 대하여 5'의 프로모터 영역의 500 bp 이내에 동원함으로써 달성될 수 있다. 프로모터의 DNAse I 과민성 부위(DHS)를 표적화하는 것은 이들 영역이 Cas9 단백질에 접근가능하게 될 가능성이 더 많고 또한 내인성 전사 인자에 대한 부위를 보유할 가능성이 더 많기 때문에 더 효율적인 유전자 억제 또는 활성화를 수득할 수 있는 가능성이 있다. 특히 유전자 억제를 위해, 본 명세서에서 내인성 전사 인자의 결합 부위를 차단하는 것은 유전자 발현을 하향조절하는데 도움을 줄 것으로 고려된다. 특정 구현예에서, 하나 이상의 eiCas9 분자를 사용하여, 하나 이상의 내인성 전사 인자의 결합을 차단할 수 있다. 다른 구현예에서, eiCas9 분자는 염색질 변형 단백질에 융합될 수 있다. 염색질 상태를 변경시키는 것은 표적 유전자의 감소된 발현을 초래할 수 있다. 하나 이상의 염색질 변형 단백질에 융합된 하나 이상의 eiCas9 분자는 염색질 상태를 변경시키기 위해 사용될 수 있다.
특정 구현예에서, gRNA 분자는 공지된 전사 반응 요소(예를 들어, 프로모터, 인핸서 등), 공지된 상류 활성화 서열(UAS) 및/또는 표적 DNA의 발현을 제어할 수 있는 것으로 의심되는 알려지지 않은 또는 알려진 기능의 서열에 표적화될 수 있다.
CRISPR/Cas-매개 유전자 넉다운은 원치않는 대립유전자 또는 전사물의 발현을 감소시키기 위해 사용될 수 있다. 본 명세서에서 유전자의 영구적인 파괴가 이상적이지 않은 시나리오가 고려된다. 이들 시나리오에서, 부위-특이적 억제는 발현을 일시적으로 감소시키거나 또는 제거하기 위해 사용될 수 있다. 또한 본 명세서에서 Cas-억제제의 표적-외 효과는 뉴클레아제가 임의의 DNA 서열을 절단하고 돌연변이를 야기할 수 있기 때문에 Cas-뉴클레아제보다 덜 심각할 수 있는 반면, Cas-억제제는 단지 그것이 활성적으로 전사된 유전자의 프로모터 영역을 표적화하는 경우에만 효과를 가질 수 있는 것으로 고려된다. 그러나, 뉴클레아제-매개 넉아웃은 영구적이지만, Cas-억제제가 세포 내에 존재하는 한 억제는 단지 지속될 수 있다. 일단 억제제가 더 이상 존재하지 않는다면, 내인성 전사 인자 및 유전자 조절 요소는 발현을 그의 천연 상태로 회복시킬 가능성이 있다.
단일-가닥 어닐링
단일 가닥 어닐링(SSA)은 표적 핵산에 존재하는 2개의 반복 서열 사이의 이중-가닥 파단부를 수선하는 또 다른 DNA 수선 과정이다. SSA 경로에 의해 사용되는 반복 서열은 일반적으로 30개 초과의 뉴클레오타이드 길이이다. 파단 말단에서 절제가 발생하여, 표적 핵산의 둘 모두의 가닥 상에 반복 서열이 드러난다. 절제 후에, 반복 서열을 함유하는 단일 가닥 오버행은 RPA 단백질로 코팅되어, 반복 서열이 예를 들어, 그들 자체에 부적절하게 어닐링되는 것을 방지한다. RAD52는 오버행 상의 반복 서열의 각각에 결합하며, 서열을 정렬시켜, 상보적 반복 서열의 어닐링을 가능하게 한다. 어닐링 후에, 오버행의 단일-가닥 플랩(flap)이 절단된다. 새로운 DNA 합성은 임의의 갭을 채우고, 라이게이션에 의해 DNA 듀플렉스가 회복된다. 가공의 결과로서, 2개의 반복부 사이의 DNA 서열은 결실된다. 결실 길이는 사용되는 2개의 반복부의 위치 및 절제의 경로 또는 진행성을 포함하는 많은 인자에 따라 달라질 수 있다.
HDR 경로와 대조적으로, SSA는 표적 핵산 서열을 변경시키거나 보정하기 위하여 주형 핵산을 필요로 하지 않는다. 대신에, 상보적 반복 서열이 이용된다.
다른 DNA 수선 경로
SSBR(단일 가닥 파단부 수선)
게놈 내의 단일-가닥 파단부(SSB)는 SSBR 경로에 의해 수선되며, 이는 상기 논의된 DSB 수선 메커니즘과 별개의 메커니즘이다. SSBR 경로는 4개의 주요 단계를 갖는다: SSB 검출, DNA 말단 가공, DNA 갭 채움 및 DNA 라이게이션. 더욱 상세한 설명은 문헌[Caldecott 2008]에 제공되어 있으며, 요약이 본 명세서에 제공되어 있다.
제1 단계에서, SSB가 형성되는 경우, PARP1 및/또는 PARP2는 파단부를 인식하고, 수선 기구를 동원한다. DNA 파단부에서의 PARP1의 결합 및 활성은 일시적이며, 병변에서 SSBR 단백질 복합체의 국소 축적 또는 안정성을 촉진시킴으로써 SSBR를 가속화시키는 것으로 보여진다. 거의 틀림 없이, 이들 SSBR 단백질 중 가장 중요한 것은 XRCC1이며, 이는 DNA 3' 및 5' 말단의 정리(cleaning)를 담당하는 단백질을 포함하는 SSBR 과정의 다수의 효소 구성성분과 상호작용하고, 이를 안정화시키고, 이를 자극하는 분자 스캐폴드로서 기능한다. 예를 들어, XRCC1은 말단 가공을 촉진시키는 몇몇의 단백질(DNA 중합효소 베타, PNK 및 3가지 뉴클레아제, APE1, APTX 및 APLF)과 상호작용한다. APE1은 엔도뉴클레아제 활성을 갖는다. APLF는 엔도뉴클레아제 및 3'에서 5'의 엑소뉴클레아제 활성을 나타낸다. APTX는 엔도뉴클레아제 및 3'에서 5'의 엑소뉴클레아제 활성을 갖는다.
전부는 아닐지라도 SSB의 대부분의 3'- 및/또는 5'-말단이 '손상'되기 때문에, 이러한 말단 가공은 SSBR의 중요한 단계이다. 각각의 가공은 일반적으로 손상된 3'-말단을 하이드록실화된 상태로 및/또는 손상된 5' 말단을 포스페이트 모이어티로 회복하여, 말단이 라이게이션-적격이 되게 하는 것을 수반한다. 손상된 3' 말단을 처리할 수 있는 효소는 PNKP, APE1 및 TDP1을 포함한다. 손상된 5' 말단을 처리할 수 있는 효소는 PNKP, DNA 중합효소 베타 및 APTX를 포함한다. LIG3(DNA 리가제 III)은 또한 말단 가공에 참여할 수 있다. 일단 말단이 정리되면, 갭 채움이 발생할 수 있다.
DNA 갭 채움 단계에서, 전형적으로 존재하는 단백질은 PARP1, DNA 중합효소 베타, XRCC1, FEN1(플랩 엔도뉴클레아제 1), DNA 중합효소 델타/엡실론, PCNA 및 LIG1이다. 2가지 경로의 갭 채움, 짧은 패치 수선 및 긴 패치 수선이 존재한다. 짧은 패치 수선은 소실 중인 단일의 뉴클레오타이드의 삽입을 포함한다. 일부 SSB에서, "갭 채움"은 2개 이상의 뉴클레오타이드를 계속 대체할 수 있다(12개까지의 염기의 대체가 보고됨). FEN1은 대체된 5'-잔기를 제거하는 엔도뉴클레아제이다. Polβ를 포함하는 다수의 DNA 중합효소는 SSB의 수선에 연루되며, DNA 중합효소의 선택은 SSB의 공급원 및 유형에 의해 영향을 받는다.
제4 단계에서, DNA 리가제, 예를 들어, LIG1(리가제 I) 또는 LIG3(리가제 III)은 말단의 연결을 촉매작용시킨다. 짧은 패치 수선은 리가제 III를 이용하고, 긴 패치 수선은 리가제 I을 이용한다.
때때로, SSBR은 복제-결합된다. 이러한 경로는 CtIP, MRN, ERCC1 및 FEN1 중 하나 이상을 수반할 수 있다. SSBR을 촉진할 수 있는 추가의 인자는 aPARP, PARP1, PARP2, PARG, XRCC1, DNA 중합효소 b, DNA 중합효소 d, DNA 중합효소 e, PCNA, LIG1, PNK, PNKP, APE1, APTX, APLF, TDP1, LIG3, FEN1, CtIP, MRN 및 ERCC1을 포함한다.
MMR(불일치 수선)
세포는 3가지의 절제 수선 경로를 함유한다: MMR, BER 및 NER. 절제 수선 경로는 그들이 전형적으로 DNA의 한 가닥 상의 병변을 인식하고, 이어서 엑소/엔도뉴클레아제가 병변을 제거하며, 1개 내지 30개의 뉴클레오타이드 갭을 남기며, 이것이 이후에 DNA 중합효소에 의해 채워지고, 최종적으로 리가제로 밀봉된다는 공통의 특징을 갖는다. 더욱 완벽한 그림은 문헌[Li 2008]에 제공되어 있으며, 요약은 본 명세서에 제공된다.
불일치 수선(MMR)은 잘못된 쌍의 DNA 염기에 작용한다.
MSH2/6 또는 MSH2/3 복합체는 둘 모두 불일치 인식 및 수선의 개시에 중요한 역할을 수행하는 ATPase 활성을 갖는다. MSH2/6은 염기-염기 불일치를 우선적으로 인식하며, 1개 또는 2개의 뉴클레오타이드의 불일치를 확인하는 한편, MSH2/3은 우선적으로 더 큰 ID 잘못된 쌍을 인식한다.
hMLH1은 hPMS2와 이종이량체화하여, ATPase 활성을 지니며, MMR의 다수의 단계에 중요한 hMutLα를 형성한다. 그것은 EXO1(EXO1은 HR 및 MMR 둘 모두에서의 참가제이다)을 수반하는 3' 닉-유도 MMR에서 중요한 역할을 수행하는 PCNA/복제 인자 C (RFC)-의존성 엔도뉴클레아제 활성을 지닌다. 그것은 불일치-유발 절제의 종결을 조절한다. 리가제 I은 이러한 경로에 대한 관련 리가제이다. MMR을 촉진시킬 수 있는 추가의 인자는 EXO1, MSH2, MSH3, MSH6, MLH1, PMS2, MLH3, DNA Pol d, RPA, HMGB1, RFC 및 DNA 리가제 I을 포함한다.
염기 절제 수선(BER)
염기 절제 수선(BER) 경로는 세포 주기 내내 활성이며; 주로 게놈으로부터 작은, 비-나선-왜곡 염기 병변의 제거를 담당한다. 대조적으로, 관련 뉴클레오타이드 절제 수선 경로(다음 섹션에 논의)는 부피가 큰 나선-왜곡 병변을 수선한다. 더욱 상세한 설명은 문헌[Caldecott 2008]에 제공되어 있으며, 요약이 본 명세서에 제공된다.
DNA 염기 손상시에, 염기 절제 수선(BER)이 개시되며, 과정은 5가지 주요 단계로 단순화될 수 있다: (a) 손상된 DNA 염기의 제거; (b) 이후의 기본 부위의 절개; (c) DNA 말단의 정리; (d) 수선 갭으로의 보정 뉴클레오타이드의 삽입; 및 (e) DNA 백본에 남아 있는 닉의 라이게이션. 이들 마지막 단계는 SSBR과 유사하다.
제1 단계에서, 손상-특이적 DNA 글리코실라제는 염기를 당 포스페이트 백본에 연결시키는 N-글리코시드 결합의 절단을 통해 손상된 염기를 절제한다. 그 다음, 관련 리아제 활성을 갖는 AP 엔도뉴클레아제-1(APE1) 또는 이중작용성 DNA 글리코실라제는 포스포디에스테르 백본을 절개하여, DNA 단일 가닥 파단부(SSB)를 생성한다. BER의 제3 단계는 DNA 말단의 정리를 수반한다. BER에서 제4 단계는 새로운 상보적 뉴클레오타이드를 수선 갭 내로 첨가하는 Polβ에 의해 행해지며, 최종 단계에서, XRCC1/리가제 III은 DNA 백본에 남아 있는 닉을 밀봉한다. 이에 의해, 짧은 패치 BER 경로가 완료되며, 여기서, 손상된 DNA 염기의 대다수(약 80%)가 수선된다. 그러나, 단계 3에서 5'-말단이 Pol β에 의한 하나의 뉴클레오타이드 삽입 후에, 말단 가공 활성에 저항성이 있다면, 복제성 DNA 중합효소, Pol δ/ε로의 중합효소 전환이 존재하며, 이는 이어서, 약 2개 내지 8개 이상의 뉴클레오타이드를 DNA 수선 갭에 부가한다. 이에 의해, 5' 플랩 구조가 생성되며, 이는 진행성 인자 증식 세포 핵 항원(PCNA)과 회합된 플랩 엔도뉴클레아제-1(FEN-1)에 의해 인식되고 절제된다. 그 다음, DNA 리가제 I은 DNA 백본에서 남아 있는 닉을 밀봉하고, 긴-패치 BER을 완료한다. BER 경로를 촉진시킬 수 있는 추가의 인자는 DNA 글리코실라제, APE1, Polb, Pold, Pole, XRCC1, 리가제 III, FEN-1, PCNA, RECQL4, WRN, MYH, PNKP 및 APTX를 포함한다.
뉴클레오타이드 절제 수선(NER)
뉴클레오타이드 절제 수선(NER)은 부피가 큰 나선-왜곡 병변을 DNA로부터 제거하는 중요한 절제 메커니즘이다. NER에 관한 추가의 상세사항은 문헌[Marteijn 2014]에 제공되어 있으며, 요약이 본 명세서에 제공된다. NER은 2가지 더 작은 경로: 전체 게놈 NER(GG-NER) 및 전사 결합된 수선 NER(TC-NER)을 포함하는 넓은 경로이다. GG-NER 및 TC-NER은 DNA 손상을 인식하기 위하여 상이한 인자를 이용한다. 그러나 그들은 병변 절개, 수선 및 라이게이션을 위하여 동일한 기구를 이용한다.
일단 손상이 인식되면, 세포는 병변을 함유하는 짧은 단일-가닥 DNA 세그먼트를 제거한다. 엔도뉴클레아제 XPF/ERCC1 및 XPG(ERCC5에 의해 인코딩)는 병변의 어느 하나의 측 상의 손상된 가닥을 절단함으로써 병변을 제거하여, 22개 내지 30개 뉴클레오타이드의 단일-가닥 갭을 초래한다. 다음으로, 세포는 DNA 갭을 채우는 합성 및 라이게이션을 수행한다. 이러한 과정에는 PCNA, RFC, DNA Pol δ, DNA Pol ε 또는 DNA Pol κ 및 DNA 리가제 I 또는 XRCC1/리가제 III가 수반된다. 라이게이션 단계를 수행하기 위하여 복제성 세포는 DNA pol ε 및 DNA 리가제 I을 이용하는 경향이 있는 한편, 비-복제성 세포는 DNA Pol δ, DNA Pol κ 및 XRCC1/리가제 III 복합체를 이용하는 경향이 있다.
NER은 하기의 인자를 수반할 수 있다: XPA-G, POLH, XPF, ERCC1, XPA-G 및 LIG1. 전사-결합 NER(TC-NER)는 하기의 인자를 수반할 수 있다: CSA, CSB, XPB, XPD, XPG, ERCC1 및 TTDA. NER 수선 경로를 촉진시킬 수 있는 추가의 인자는 XPA-G, POLH, XPF, ERCC1, XPA-G, LIG1, CSA, CSB, XPA, XPB, XPC, XPD, XPF, XPG, TTDA, UVSSA, USP7, CETN2, RAD23B, UV-DDB, CAK 하위복합체, RPA 및 PCNA를 포함한다.
사슬간 교차결합(ICL)
ICL 수선 경로로 지칭되는 전용 경로는 사슬간 교차결합을 수선한다. 상이한 DNA 가닥에서 염기 사이의 사슬간 교차결합 또는 공유적 교차결합은 복제 또는 전사 동안 발생할 수 있다. ICL 수선은 다수의 수선 과정, 특히 핵산 분해 활성, 병변통과(translesion) 합성 및 HDR의 협동을 수반한다. 뉴클레아제는 교차결합된 염기의 어느 하나의 측 상의 ICL을 절제하기 위해 동원되는 한편, TLS 및 HDR은 절단된 가닥을 수선하기 위하여 협동한다. ICL 수선은 하기의 인자를 수반할 수 있다: 엔도뉴클레아제, 예를 들어, XPF 및 RAD51C, 엔도뉴클레아제, 예를 들어, RAD51, 병변통과 중합효소, 예를 들어, DNA 중합효소 제타 및 Rev1), 및 판코니 빈혈(FA) 단백질, 예를 들어, FancJ.
기타 경로
포유동물에 몇몇의 다른 DNA 수선 경로가 존재한다.
병변통과 합성(TLS)은 결함이 있는 복제 사건 후에 남겨진 단일 가닥 파단부를 수선하기 위한 경로이며, 병변통과 중합효소, 예를 들어, DNA polβ 및 Rev1을 수반한다.
오류-유발 복제후 수선(PRR)은 결함이 있는 복제 사건 후에 남겨진 단일 가닥 파단부를 수선하기 위한 또 다른 경로이다.
표적 세포
Cas9 분자 및 gRNA 분자, 예를 들어, Cas9 분자/gRNA 분자 복합체를 사용하여 매우 다양한 세포에서 표적 핵산을 변경(예를 들어, 그 내에 돌연변이를 도입)시킬 수 있다. 이러한 변경을 시험관내, 생체외 또는 생체내에서 수행될 수 있다. 특정 구현예에서, 이러한 변경은 유전자 발현의 조절을 초래한다.
본 명세서에 기재된 Cas9 및 gRNA 분자를 표적 세포로 전달할 수 있다. 예시적인 표적 세포는 혈액 세포, 신경 세포, 면역 세포, 근육 세포, 신장 세포, 유방 세포, GI 관 세포, 혈관 세포, 폐 세포, 골 세포, 췌장 세포, 피부 세포, 지방세포, 호르몬 분비 세포, 간 세포, 상피 세포 및 섬유아세포를 포함하나 이들에 한정되지 않는다. 특정 구현예에서, 표적 세포는 정상 세포이다. 다른 구현예에서, 표적 세포는 이환 세포이다. 이들 중 특정 구현예에서, 표적 세포는 암 세포이다.
적합한 세포는 줄기 세포, 예를 들어, 배아 줄기 세포, 유도된 만능 줄기 세포, 조혈 줄기 세포, 뉴런 줄기 세포 또는 중간엽 줄기 세포를 포함할 수 있다. 특정 구현예에서, 세포는 유도된 만능 줄기(iPS) 세포 또는 iPS 세포로부터 유래된 세포, 예를 들어, 대상체로부터 생성된, 돌연변이를 보정하기 위하여 변형된, 및 임상적 관련 세포, 예를 들어, 간세포, 대식세포, 단핵 식세포, 폐포 대식세포, 골수 전구 세포, 폐 상피 세포 또는 조혈 줄기 세포로 분화된 iPS 세포이다. 특정 구현예에서, AAV는 표적 세포를 형질도입시키기 위해 사용된다.
본 명세서에 기재된 방법에 의해 생성되는 세포를 바로 사용할 수 있다. 대안적으로, 세포를 동결시키고(예를 들어, 액체 질소에서), 이후의 이용을 위해 보관할 수 있다. 세포를 통상 이러한 동결 온도에서 세포를 보존하기 위하여 해당 분야에 통상적으로 사용되는 바와 같이 10% 디메틸설폭시드(DMSO), 50% 혈청, 40% 완충 매질 또는 몇몇의 다른 이러한 용액에서 동결시키고, 동결된 배양 세포를 해동시키기 위하여 해당 분야에 통상적으로 알려져 있는 방식으로 해동시킬 것이다.
전달, 제형 및 투여 경로
Cas 시스템 구성성분, 예를 들어, Cas9 분자, gRNA 분자(예를 들어, Cas9 분자/gRNA 분자 복합체), 공여자 주형 핵산 또는 3가지 모두가 다양한 형태로 전달되거나, 제형화되거나, 투여될 수 있으며, 예를 들어, 표 3 및 표 4를 참조한다. 표 3은 구성성분이 제형화되거나, 전달되거나, 투여될 수 있는 방법의 예를 제공한다. 표 4에는 본 명세서에 기재된 바와 같이, Cas 시스템의 구성성분, 예를 들어, Cas9 분자 구성성분 및 gRNA 분자 구성성분을 위한 다양한 전달 방법이 요약되어 있다.
Cas9, gRNA 및/또는 공여자 주형의 DNA-기반의 전달
Cas9 분자(예를 들어, eaCas9 분자) 또는 gRNA 분자를 인코딩하는 DNA, 공여자 주형 또는 이들의 임의의 조합(예를 들어, 둘 또는 전부)을 해당 분야에 알려진 방법에 의해 또는 본 명세서에 기재된 바와 같이 대상체에게 투여하거나 세포 내로 전달할 수 있다. 예를 들어, Cas9 및/또는 gRNA를 인코딩하는 DNA 및 공여자 주형을 예를 들어, 벡터(예를 들어, 바이러스 또는 비-바이러스 벡터), 비-벡터 기반의 방법(예를 들어, 네이키드 DNA 또는 DNA 복합체를 이용), 또는 이의 조합에 의해 전달할 수 있다. 유사하게, 공여자 주형을 예를 들어, 벡터(예를 들어, 바이러스 또는 비-바이러스 벡터), 비-벡터 기반의 방법(예를 들어, 네이키드 DNA 또는 DNA 복합체를 이용), 또는 이의 조합에 의해 전달할 수 있다.
Cas9 분자(예를 들어, eaCas9 분자) 및/또는 gRNA 분자를 인코딩하는 DNA를 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자(예를 들어, N-아세틸갈락토사민)에 컨쥬게이트시킬 수 있다. 이와 같이, 공여자 주형을 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자(예를 들어, N-아세틸갈락토사민)에 컨쥬게이트시킬 수 있다.
특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA를 벡터(예를 들어, 바이러스 벡터/바이러스 또는 플라스미드)에 의해 전달한다.
특정 구현예에서, 벡터는 Cas9 분자 및/또는 gRNA 분자를 인코딩하는 DNA 서열을 포함할 수 있다. 특정 구현예에서, 벡터는 표적화되는 영역(예를 들어, 표적 서열)에 높은 상동성을 갖는 공여자 주형을 포함할 수 있다. 이들 중 특정 구현예에서, 공여자 주형은 표적 서열의 전부 또는 일부를 포함한다. 예시적인 공여자 주형은 수선 주형, 예를 들어, 유전자 보정 주형 또는 유전자 돌연변이 주형, 예를 들어, 점 돌연변이(예를 들어, 단일 뉴클레오타이드(nt) 치환) 주형이다.
특정 구현예에서, 벡터는 예를 들어, Cas9 분자 서열에 융합된 (예를 들어, 핵 국소화, 인 국소화 또는 미토콘드리아 국소화를 위해) 신호 펩타이드를 인코딩하는 서열을 포함할 수 있다. 특정 구현예에서, 벡터는 하나 이상의 조절/제어 요소, 예를 들어, 프로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작(Kozak) 공통 서열, 내부 리보솜 유입 부위(IRES), 2A 서열, 및/또는 스플라이스 수용자 또는 공여자를 포함할 수 있다. 벡터가 프로모터를 포함하는 이들 중 특정 구현예에서, 프로모터는 RNA 중합효소 II(예를 들어, CMV 프로모터)에 의해 인식된다. 다른 구현예에서, 프로모터는 RNA 중합효소 III(예를 들어, U6 프로모터)에 의해 인식된다.
특정 구현예에서, 벡터는 (예를 들어, 재조합 바이러스의 생성을 위한) 바이러스 벡터이다. 이들 중 특정 구현예에서, 바이러스는 DNA 바이러스(예를 들어, dsDNA 또는 ssDNA 바이러스)이다. 다른 구현예에서, 바이러스는 RNA 바이러스(예를 들어, ssRNA 바이러스)이다. 예시적인 바이러스 벡터/바이러스는, 예를 들어, 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아 바이러스, 폭스바이러스 및 단순 포진 바이러스를 포함한다. 특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA는 재조합 AAV에 의해 전달된다. 특정 구현예에서, 공여자 주형 핵산은 재조합 AAV에 의해 전달된다. 특정 구현예에서, 바이러스 벡터는 세포 유형 및/또는 조직 유형을 인식할 수 있다. 특정 구현예에서, 바이러스 벡터는 세포 유형-특이적 발현을 달성한다. 특정 구현예에서, 바이러스 벡터는 바이러스 벡터와 표적 세포 막의 융합의 효율을 증가시킨다.
특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA는 (예를 들어, 네이키드 DNA 또는 DNA 복합체를 사용하는) 비-벡터 기반의 방법에 의해 전달된다. 예를 들어, DNA는 예를 들어, 유기적으로 변형된 실리카 또는 실리케이트(오르모실(Ormosil)), 전기천공법, 일시적 세포 압축 또는 압착(예를 들어, 문헌[Lee 2012] 참조), 유전자총, 초음파천공법, 자성주입법(magnetofection), 지질-매개 트랜스펙션, 덴드리머, 무기 나노입자, 인산칼슘, 또는 이들의 조합에 의해 전달될 수 있다.
특정 구현예에서, Cas9 및/또는 gRNA를 인코딩하는 DNA는 벡터 및 비-벡터 기반의 방법의 조합에 의해 전달된다. 특정 구현예에서, 공여자 주형은 벡터 및 비-벡터 기반의 방법의 조합에 의해 전달된다.
유전자 전달을 위한 예시적인 지질은 하기 표 1에 나타나 있다. 유전자 전달을 위한 예시적인 중합체는 하기 표 5에 나타나 있다.
특정 구현예에서, 비-벡터 전달 비히클은 나노입자 및 리포좀의 표적 세포 갱신을 증가시키기 위한 표적화 변형, 예를 들어 세포 특이적 항원, 모노클로널 항체, 단쇄 항체, 압타머, 중합체, 당(예를 들어, N-아세틸갈락토사민(GalNAc)) 및 세포 투과 펩타이드를 가진다. 특정 구현예에서, 비히클은 융합생성 및 엔도좀-탈안정화 펩타이드/중합체를 이용한다. 특정 구현예에서, 비히클은 (예를 들어, 카고(cargo)의 엔도좀 탈출을 가속화시키도록) 산-촉발 입체형태적 변화를 겪는다. 특정 구현예에서, 자극-절단성 중합체는, 예를 들어 세포 구획에서의 방출을 위해 사용된다. 특정 구현예에서, 전달 비히클은 생물학적 비-바이러스 전달 비히클이다.
특정 구현예에서, Cas 시스템의 구성성분 이외의 하나 이상의 핵산 분자(예를 들어, DNA 분자)(즉, Cas9 분자 및/또는 gRNA 분자를 인코딩하는 DNA 또는 공여자 주형 이외의 것)가 전달된다. 이들 중 특정 구현예에서, 이들 다른 핵산 분자는 Cas 시스템의 구성성분 중 하나 이상과 동시에 전달된다. 다른 구현예에서, 이들 다른 핵산 분자는 Cas 시스템의 구성성분 중 하나 이상 (예를 들어, 약 30분, 1시간, 2시간, 3시간, 6시간, 9시간, 12시간, 1일, 2일, 3일, 1주, 2주 또는 4주 미만) 전에 또는 후에 전달된다. 특정 구현예에서, 이들 다른 핵산 분자는 Cas 시스템의 구성성분 중 하나 이상과 상이한 수단에 의해 전달된다. 다른 핵산 분자는 본 명세서에 기재된 임의의 전달 방법에 의해 전달될 수 있다.
Cas9 및/또는 gRNA의 RNA-기반의 전달
gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 해당 분야에 알려져 있는 방법에 의해, 또는 본 명세서에 기재된 바와 같이, 세포, 예를 들어, 본 명세서에 기재된 표적 세포 내로 전달될 수 있다. 예를 들어, gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 예를 들어, 마이크로주입, 전기천공법, 일시적 세포 압축 또는 압착(예를 들어, 문헌[Lee 2012] 참조), 지질-매개 트랜스펙션, 펩타이드-매개 전달 또는 이들의 조합에 의해 전달될 수 있다. gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자에 컨쥬게이트될 수 있다.
특정 구현예에서, 전기천공법을 통한 전달은 세포를 카트리지, 챔버 또는 큐벳 내에서 공여자 주형 핵산 분자와 함께 또는 이것 없이 gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자와 혼합하고, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하는 것을 포함한다. 특정 구현예에서, 전기천공법을 통한 전달은 혼합물을 카트리지, 챔버 또는 큐벳 내로 공급하는 장치(예를 들어, 펌프)와 연결된 용기에서 세포를 공여자 주형 핵산 분자와 함께 또는 이것 없이, gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자와 혼합하는 시스템을 사용하여 수행되며, 여기서, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하고, 그 후에, 세포를 제2 용기에 전달한다. gRNA 분자 및/또는 Cas9 분자를 인코딩하는 RNA 분자는 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키기 위해 분자에 컨쥬게이트된다.
Cas9 분자의 전달
Cas9 분자는 해당 분야에 알려져 있는 방법에 의해 또는 본 명세서에 기재된 바와 같이 세포 내로 전달될 수 있다. 예를 들어, Cas9 단백질 분자는 예를 들어, 마이크로주입, 전기천공법, 일시적 세포 압축 또는 압착(예를 들어, 문헌[Lee 2012] 참조), 지질-매개 트랜스펙션, 펩타이드-매개 전달 또는 이들의 조합에 의해 전달될 수 있다. 전달은 gRNA를 인코딩하는 DNA에 의해 또는 gRNA에 의해 달성될 수 있다. Cas9 단백질은 표적 세포(예를 들어, 본 명세서에 기재된 표적 세포)에 의한 흡수를 촉진시키는 분자에 컨쥬게이트될 수 있다.
특정 구현예에서, Cas9 단백질을 gRNA 분자와 조합하여, 해당 분야에 알려져 있는 방법에 의해 또는 본 명세서에 기재된 바와 같이 대상체로 투여하거나, 세포 내로 전달될 리보핵단백질(RNP) 복합체를 형성할 수 있다. 세포로의 Cas9/gRNA RNP 복합체의 직접적인 전달은 핵산으로부터 발현될 필요를 없앤다(예를 들어, Cas9 및 gRNA를 인코딩하는 플라스미드의 트랜스펙션). 그것은 또한, 핵산 전달로부터 유래되는 DNA 세그먼트의 원치않는 통합(예를 들어, Cas9 및 gRNA를 인코딩하는 플라스미드의 트랜스펙션)을 없앤다. 따라서, 그것은 신속한 작용, 신속한 전환, 높은 비의 표적-상의 변형, 감소된 표적-외 효과 및 세포에 대한 더 낮은 독성을 제공하는 대안적인 전달 방법이다. 또한, 그것은 트랜스펙션시키기 어려운 세포(예를 들어, 트랜스펙션시키기 어려운 일차 및 만능 줄기 세포)로 Cas9/gRNA 복합체를 전달하기 위해 이용될 수 있다. 특정 구현예에서, Cas9/gRNA RNP 복합체는 투여 이전에 형성(미리 형성)될 수 있다. 특정 구현예에서, 다수의(예를 들어, 1개 초과의) Cas9/gRNA RNP 복합체가 동시에 또는 순차적으로 전달(예를 들어, 투여)될 수 있다. 특정 구현예에서, Cas9/gRNA RNP 복합체는 전기천공법에 의해 세포로 전달될 수 있다.
특정 구현예에서, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳에서 세포를 gRNA 분자 및/또는 공여자 주형 핵산과 함께 또는 이것 없이, Cas9 분자와 혼합하고, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하는 것을 포함한다. 특정 구현예에서, 전기천공법을 통한 전달은 혼합물을 카트리지, 챔버 또는 큐벳 내로 공급하는 장치(예를 들어, 펌프)와 연결된 용기에서 세포를 gRNA 및/또는 공여자 주형 핵산과 함께 또는 이것 없이, Cas9 분자와 혼합하는 시스템을 이용하여 수행되며, 여기서, 정해진 기간 및 진폭의 하나 이상의 전기적 임펄스를 적용하고, 그 후에 세포를 제2 용기로 전달한다.
Cas 시스템 구성성분의 투여 경로
전신 투여 방식은 경구 및 비경구 경로를 포함한다. 비경구 경로는, 예로서 정맥내, 동맥내, 근육내, 진피내, 피하, 비강내 및 복막내 경로를 포함한다. 전신으로 투여되는 구성성분은 혈액 및 골수의 세포에 구성성분을 표적화하도록 변형 또는 제형화될 수 있다.
국소 투여 방식은, 예로서 골수내, 척추강내 및 뇌실내 경로를 포함한다. 특정 구현예에서, (전신 방법에 비해) 상당히 더 적은 양의 구성성분이 전신으로(예를 들어, 정맥내로) 투여되는 경우에 비해 국소로 투여되는 경우에 효과를 발휘할 수 있다. 국소 투여 방식은 치료적 유효량의 구성성분이 전신으로 투여되는 경우 발생할 수 있는 잠재적 독성 부작용의 발생을 감소 또는 제거할 수 있다.
또한, 구성성분은 연장된 기간에 걸쳐 방출을 가능하게 하도록 제형화될 수 있다.
Cas 시스템 구성성분의 생체외 전달
특정 구현예에서, 표 3에 기재된 Cas 시스템 구성성분을 세포 내로 도입하고, 이를 이어서 대상체 내로 도입하며, 예를 들어, 세포를 대상체로부터 제거하고, 생체 외에서 조작하고, 대상체 내로 재도입한다. 구성성분의 도입 방법은 예를 들어, 표 4에 기재된 전달 방법 중 임의의 것을 포함할 수 있다.
변형된 뉴클레오사이드, 뉴클레오타이드 및 핵산
변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는 핵산, 예를 들어, 특히 gRNA뿐만 아니라 RNA의 다른 형태, 예를 들어, mRNA, RNAi, 또는 siRNA에 존재할 수 있다. 본 명세서에서 기재된 바와 같이, "뉴클레오사이드"는 5탄당 분자(펜토스 또는 리보스) 또는 이의 유도체, 및 유기 염기, 퓨린 또는 피리미딘, 또는 이의 유도체를 함유하는 화합물로서 정의된다. 본 명세서에서 기재된 바와 같이, "뉴클레오타이드"는 포스페이트기를 추가로 포함하는 뉴클레오사이드로서 정의된다.
변형된 뉴클레오사이드 및 뉴클레오타이드는 다음 중 하나 이상을 포함할 수 있다:
(i) 포스포디에스테르 백본 결합에서 비결합 포스페이트 산소 중 하나 또는 둘 다 및/또는 결합 포스페이트 산소 중 하나 이상의 변경, 예를 들어, 대체;
(ii) 리보스 당의 구성요소, 예를 들어, 리보스 당에서의 2' 하이드록실의 변경, 예를 들어, 대체;
(iii) "데포스포" 링커로의 포스페이트 모이어티의 대규모 대체;
(iv) 자연 발생 핵염기의 변형 또는 대체;
(v) 리보스-포스페이트 백본의 대체 또는 변형;
(vi) 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트 기의 제거, 변형 또는 대체, 또는 모이어티의 컨쥬게이션; 및
(vii) 당의 변형.
상기 열거된 변형을 조합하여, 2개, 3개, 4개 이상의 변형을 가질 수 있는 변형된 뉴클레오사이드 및 뉴클레오타이드를 제공할 수 있다. 예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드는 변형된 당 및 변형된 핵염기를 가질 수 있다. 일 구현예에서, gRNA의 모든 염기는 변형되어 있으며, 예를 들어, 모든 염기는 변형된 포스페이트기를 가지고, 예를 들어, 모든 변형된 포스페이트기는 포스포로티오에이트기이다. 일 구현예에서, 단분자 또는 모듈 gRNA 분자의 포스페이트기의 전부, 또는 실질적으로 전부는 포스포로티오에이트기로 대체된다.
일 구현예에서, 변형된 뉴클레오타이드, 예를 들어, 본 명세서에 기재된 바와 같은 변형을 가지는 뉴클레오타이드는, 핵산, 예를 들어, "변형된 핵산" 내로 혼입될 수 있다. 일 구현예에서, 변형된 핵산은 1개, 2개, 3 이상의 변형된 뉴클레오타이드를 포함한다. 일 구현예에서, 변형된 핵산에서 위치의 적어도 5%(예를 들어, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 약 100%)가 변형된 뉴클레오타이드이다.
변형되지 않은 핵산은, 예를 들어, 세포 뉴클레아제에 의해 분해되는 경향이 있을 수 있다. 예를 들어, 뉴클레아제는 핵산 포스포디에스테르 결합을 가수분해할 수 있다. 따라서, 일 양태에서, 본 명세서에 기재된 변형된 핵산은 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하여, 예를 들어, 뉴클레아제에 대하여 안정성을 도입할 수 있다.
일 구현예에서, 본 명세서에 기재된 변형된 뉴클레오사이드, 변형된 뉴클레오타이드, 및 변형된 핵산은, 생체내 및 생체외 둘 다에서, 세포의 집단으로 도입될 때, 감소된 선천성 면역 반응을 나타낼 수 있다. 용어 "선천성 면역 반응"은, 일반적으로 바이러스 또는 박테리아 기원의 단일 가닥 핵산을 포함하는 외인성 핵산에 대한 세포 반응을 포함하며, 이는 사이토카인 발현 및 방출, 특히 인터페론의 도입, 및 세포 사멸을 수반한다. 일 구현예에서, 본 명세서에 기재된 변형된 뉴클레오사이드, 변형된 뉴클레오타이드, 및 변형된 핵산은 파트너와 핵산이 상호작용하는 주홈의 결합을 파괴할 수 있다. 일 구현예에서, 본 명세서에 기재된 변형된 뉴클레오사이드, 변형된 뉴클레오타이드, 및 변형된 핵산은, 생체내 및 생체외 둘 다에서, 세포의 집단으로 도입될 때, 감소된 선천성 면역 반응을 나타낼 수 있으며, 또한 파트너와 핵산이 상호작용하는 주홈의 결합을 방해할 수 있다.
화학적 기의 정의
본 명세서에서 사용되는 "알킬"은 직쇄 또는 분지형인 포화 탄화수소기를 말하는 것으로 의미된다. 알킬기의 예는 메틸(Me), 에틸(Et), 프로필(예를 들어, n-프로필 및 이소프로필), 부틸(예를 들어, n-부틸, 이소부틸, t-부틸), 펜틸(예를 들어, n-펜틸, 이소펜틸, 네오펜틸) 등을 포함한다. 알킬기는 1개 내지 약 20개, 2개 내지 약 20개, 1개 내지 약 12개, 1개 내지 약 8개, 1개 내지 약 6개, 1개 내지 약 4개, 또는 1개 내지 약 3개의 탄소 원자를 포함할 수 있다.
본 명세서에서 사용되는 "아릴"은 모노사이클릭 또는 폴리사이클릭(예를 들어, 2개, 3개 또는 4개의 융합된 고리를 가짐) 방향족 탄화수소, 예를 들어, 페닐, 나프틸, 안트라세닐, 페난트레닐, 인다닐, 인데닐 등을 말한다. 일 구현예에서, 아릴기는 6개 내지 약 20개의 탄소 원자를 가진다.
본 명세서에서 사용되는 "알케닐"은 적어도 1개의 이중 결합을 포함하는 지방족 기를 말한다.
본 명세서에서 사용되는 "알키닐"은 2개 내지 12개의 탄소 원자를 포함하고, 하나 이상의 삼중 결합을 가지는 것을 특징으로 하는 직선 또는 분지형 탄화수소 사슬을 말한다. 알키닐기의 예는 에티닐, 프로파르길, 및 3-헥시닐을 포함하지만, 이로 제한되는 것은 아니다.
본 명세서에서 사용되는 "아릴알킬" 또는 "아르알킬"은 알킬 수소 원자가 아릴기로 대체된 알킬 모이어티를 말한다. 아르알킬은 하나 초과의 수소 원자가 아릴기로 대체된 기를 포함한다. "아릴알킬" 또는 "아르알킬"의 예는 벤질, 2-페닐에틸, 3-페닐프로필, 9-플루오레닐, 벤즈하이드릴, 및 트리틸기를 포함한다.
본 명세서에서 사용되는 "사이클로알킬"은 3개 내지 12개의 탄소를 가지는 사이클릭, 비사이클릭, 트리사이클릭, 또는 폴리사이클릭 비방향족 탄화수소기를 말한다. 사이클로알킬 모이어티의 예는 사이클로프로필, 사이클로펜틸, 및 사이클로헥실을 포함하지만, 이로 제한되는 것은 아니다.
본 명세서에서 사용되는 "헤테로사이클릴"은 헤테로사이클릭 고리계의 1가 라디칼을 말한다. 대표적인 헤테로사이클릴은 제한없이, 테트라하이드로푸라닐, 테트라하이드로티에닐, 피롤리디닐, 피롤리도닐, 피페리디닐, 피롤리닐, 피페라지닐, 디옥사닐, 디옥솔라닐, 디아제피닐, 옥사제피닐, 티아제피닐, 및 모르폴리닐을 포함한다.
본 명세서에서 사용되는 "헤테로아릴"은 헤테로방향족 고리계의 1가 라디칼을 말한다. 헤테로아릴 모이어티의 예는 이미다졸릴, 옥사졸릴, 티아졸릴, 트리아졸릴, 피롤릴, 푸라닐, 인돌릴, 티오페닐 피라졸릴, 피리디닐, 피라지닐, 피리다지닐, 피리미디닐, 인돌리지닐, 퓨리닐, 나프티리디닐, 퀴놀릴, 및 프테리디닐을 포함하지만, 이로 제한되는 것은 아니다.
포스페이트 백본 변형
포스페이트기
일 구현예에서, 변형된 뉴클레오타이드의 포스페이트기는 하나 이상의 산소를 상이한 치환기로 대체함으로써 변형될 수 있다. 추가로, 변형된 뉴클레오타이드, 예를 들어, 변형된 핵산에 존재하는 변형된 뉴클레오타이드는, 본 명세서에 기재된 바와 같은 변형된 포스페이트로 비변형 포스페이트 모이어티를 대량 대체하는 것을 포함할 수 있다. 일 구현예에서, 포스페이트 백본의 변형은 비하전된 링커 또는 하전된 링커 중 어느 하나가 비대칭 전하 분포를 갖도록 하는 변경을 포함할 수 있다.
변형된 포스페이트기의 예는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스테르를 포함한다. 일 구현예에서, 포스페이트 백본 모이어티에서 비가교 포스페이트 산소 원자 중 하나는 다음의 기 중 임의의 것으로 대체될 수 있다: 황(S), 셀레늄(Se), BR3(여기서, R은 예를 들어, 수소, 알킬, 또는 아릴일 수 있음), C(예를 들어, 알킬기, 아릴기 등), H, NR2(여기서, R은 예를 들어, 수소, 알킬, 또는 아릴일 수 있음), 또는 OR(여기서, R은 예를 들어, 알킬 또는 아릴일 수 있음). 비변형 포스페이트기에서 인 원자는 아키랄이다. 그러나, 상기 원자 또는 원자 그룹 중 하나로 비가교 산소 중 하나를 대체하는 것은 인 원자를 키랄로 만들 수 있으며; 다시 말하면 이러한 방식으로 변형된 포스페이트기에서 인 원자가 입체 중심이다. 입체 인 원자는 "R" 입체구조(본 명세서에서는 Rp) 또는 "S" 입체구조(본 명세서에서는 Sp)를 가질 수 있다.
포스포로디티오에이트는 비가교 산소 둘 다 황으로 대체된다. 포스포로디티오에이트에서 인 중심은 올리고리보뉴클레오타이드 부분입체이성질체의 형성을 불가능하게 하는 아키랄이다. 일 구현예에서, 비가교 산소 하나 또는 둘 다의 변형은 또한 S, Se, B, C, H, N, 및 OR(R은 예를 들어, 알킬 또는 아릴일 수 있음)로부터 독립적으로 선택되는 기로 비가교 산소를 대체하는 것을 포함할 수 있다.
포스페이트 링커는 또한 질소(가교 포스포로아미데이트), 황(가교 포스포로티오에이트) 및 탄소(가교 메틸렌포스포네이트)로 가교 산소(즉, 뉴클레오사이드에 포스페이트를 연결하는 산소)를 대체함으로써 변형될 수 있다. 대체는 연결 산소 중 어느 하나 또는 연결 산소의 둘 다에서 일어날 수 있다.
포스페이트기의 대체
포스페이트기는 비-인 함유 연결기(non-phosphrous containing connector)에 의해 대체될 수 있다. 구현예에서, 하전 포스페이트기는 중성 모이어티로 대체될 수 있다.
포스페이트기를 대체할 수 있는 모이어티의 예는, 예를 들어, 메틸 포스포네이트, 하이드록실아미노, 실록산, 카르보네이트, 카르복시메틸, 카르바메이트, 아미드, 티오에테르, 에틸렌 옥사이드 링커, 설포네이트, 설폰아미드, 티오포름아세탈, 포름아세탈, 옥심, 메틸렌이미노, 메틸렌메틸이미노, 메틸렌하이드라조, 메틸렌디메틸하이드라조 및 메틸렌옥시메틸이미노를 포함할 수 있지만, 이로 제한되는 것은 아니다.
리보포스페이트 백본의 대체
포스페이트 링커 및 리보스 당이 뉴클레아제 내성 뉴클레오사이드 또는 뉴클레오타이드 대용물로 대체되는, 핵산을 모방할 수 있는 스캐폴드가 또한 작제될 수 있다. 일 구현예에서, 핵염기는 대용물 백본에 의해 테터링될 수 있다. 예는, 제한없이, 모르폴리노, 사이클로부틸, 피롤리딘 및 펩타이드 핵산(PNA) 뉴클레오사이드 대용물을 포함할 수 있다.
당 변형
변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는 당기에 대한 하나 이상의 변형을 포함할 수 있다. 예를 들어, 2' 하이드록실기(OH)는 다수의 상이한 "옥시" 또는 "데옥시" 치환기로 대체되거나 변형될 수 있다. 일 구현예에서, 2' 하이드록실기에 대한 변형은, 하이드록실이 더 이상 탈양자화되어 2'-알콕사이드 이온을 형성할 수 없으므로, 핵산의 안정성을 향상시킬 수 있다. 2'-알콕사이드는 링커 인 원자 상에서 분자내 친핵성 공격에 의한 분해를 촉진시킬 수 있다.
"옥시"-2' 하이드록실기 변형의 예는 알콕시 또는 아릴옥시(OR, 여기서 "R"은, 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음); 폴리에틸렌글리콜(PEG), O(CH2CH2O)nCH2CH2OR(여기서, R은 예를 들어, H 또는 선택적으로 치환된 알킬일 수 있고, n은 0 내지 20(예를 들어, 0 내지 4, 0 내지 8, 0 내지 10, 0 내지 16, 1 내지 4, 1 내지 8, 1 내지 10, 1 내지 16, 1 내지 20, 2 내지 4, 2 내지 8, 2 내지 10, 2 내지 16, 2 내지 20, 4 내지 8, 4 내지 10, 4 내지 16, 및 4 내지 20)의 정수일 수 있음)을 포함할 수 있다. 구현예에서, "옥시"-2' 하이드록실기 변형은 "잠금(locked)" 핵산(LAN)을 포함할 수 있으며, 여기서 2' 하이드록실은, 예를 들어, C1-6 알킬렌 또는 C1-6 헤테로알킬렌 가교에 의해, 동일한 리보스 당의 4' 탄소에 연결될 수 있으며, 여기서 예시적인 가교는 메틸렌, 프로필렌, 에테르, 또는 아미노 가교; O-아미노(여기서, 아미노는 예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노) 및 아미노알콕시, O(CH2)n-아미노(여기서, 아미노는, 예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노)를 포함할 수 있다. 일 구현예에서, "옥시"-2' 하이드록실기 변형은 메톡시에틸기(MOE)(OCH2CH2OCH3, 예를 들어, PEG 유도체)를 포함할 수 있다.
"데옥시" 변형은 수소(즉, 데옥시리보스 당, 예를 들어, 부분적으로 ds RNA의 오버행 부분에서); 할로(예를 들어, 브로모, 클로로, 플루오로, 또는 요오도); 아미노(여기서, 아미노는, 예를 들어, NH2; 알킬아미노, 디아킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 디헤테로아릴아미노, 또는 아미노산일 수 있음); NH(CH2CH2NH)nCH2CH2-아미노(여기서, 아미노는, 예를 들어, 본 명세서에 기재된 바와 같을 수 있음), -NHC(O)R(여기서, R은, 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음), 시아노; 메르캅토; 알킬-티오-알킬; 티오알콕시; 및 알킬, 사이클로알킬, 아릴, 알케닐 및 알키닐을 포함할 수 있으며, 이는 예를 들어, 본 명세서에 기재된 아미노로 선택적으로 치환될 수 있다.
당기는 또한 리보스 중 상응하는 탄소와 반대의 위치화학 입체구조를 가지는 하나 이상의 탄소를 포함할 수 있다. 따라서, 변형된 핵산은, 당으로서 예를 들어, 아라비노스를 포함하는 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드 "단량체"는 당의 1' 위치에서 알파 연결, 예를 들어, 알파-뉴클레오사이드를 가질 수 있다. 변형된 핵산은 또한 "비염기성" 당을 포함할 수 있으며, 상기 비염기성 당은 C-1'에서 핵염기가 없다. 이러한 비염기성 당은 또한 구성하는 당 원자 중 하나 이상에서 추가로 변형될 수 있다. 변형된 핵산은 또한 L 형태인 하나 이상의 당, 예를 들어, L-뉴클레오사이드를 포함할 수 있다.
일반적으로, RNA는 당기 리보스를 포함하며, 당기 리보스는 산소를 가지는 5-원 고리이다. 예시적인 변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는 제한없이 리보스 중 산소의 (예를 들어, 황(S), 셀레늄(Se), 또는 알킬렌, 예를 들어, 메틸렌 또는 에틸렌으로의) 대체; 이중 결합의 첨가(예를 들어, 리보스를 사이클로펜테닐 또는 사이클로헥세닐로 대체); 리보스의 고리 축소(예를 들어, 사이클로부탄 또는 옥세탄의 4-원 고리 형성); 리보스의 고리 확장(예를 들어, 추가적인 탄소 또는 헤테로원자를 가지는 6-원 또는 7-원 고리, 예를 들어, 안하이드로헥시톨, 알트리톨, 만니톨, 사이클로헥사닐, 사이클로헥세닐, 및 모르폴리노(이는 또한 포스포르아미데이트 백본을 가짐) 형성)을 포함할 수 있다. 일 구현예에서, 변형된 뉴클레오타이드는 멀티사이클릭 형태(예를 들어, 트리사이클로); 및 "비잠금(unlocked)" 형태, 예컨대 글리콜 핵산(GNA)(예를 들어, R-GNA 또는 S-GNA, 여기서 리보스는 포스포디에스테르 결합에 부착된 글리콜 단위에 의해 대체됨), 트레오스 핵산(TNA, 여기서 리보스는 α-L-트레오푸르노실-(3'→2')로 대체됨)을 포함할 수 있다.
핵염기 상의 변형
변형된 핵산으로 혼입될 수 있는, 본 명세서에 기재된 변형된 뉴클레오사이드 및 변형된 뉴클레오타이드는, 변형된 핵염기를 포함할 수 있다. 핵염기의 예는 아데신(A), 구아닌(G), 시토신(C), 및 우라실(U)을 포함하지만, 이로 제한되는 것은 아니다. 이들 핵염기는 변형되거나 완전히 대체되어 변형된 핵산에 혼입될 수 있는 변형된 뉴클로오타이드 및 변형된 뉴클레오사이드를 제공할 수 있다. 뉴클레오타이드의 핵염기는 퓨린, 피리미딘, 퓨린 또는 피리미딘 유사체로부터 독립적으로 선택될 수 있다. 일 구현예에서, 핵염기는, 예를 들어 염기의 자연-발생 및 합성 유도체를 포함할 수 있다.
우라실
일 구현예에서, 변형된 핵염기는 변형된 우라실이다. 변형된 우라실을 가지는 예시적인 뉴클레오사이드 및 핵염기는 제한 없이, 슈도우리딘(Ψ), 피리딘-4-온 리보뉴클레오사이드, 5-아자-우리딘, 6-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오-우리딘(s2U), 4-티오-우리딘(s4U), 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시-우리딘(ho5U), 5-아미노알릴-우리딘, 5-할로-우리딘(예를 들어, 5-요오도-우리딘 또는 5-브로모-우리딘), 3-메틸-우리딘(m3U), 5-메톡시-우리딘(mo5U), 우리딘 5-옥시아세트산(cmo5U), 우리딘 5-옥시아세트산 메틸 에스테르(mcmo5U), 5-카르복시메틸-우리딘(cm5U), 1-카르복시메틸-슈도우리딘, 5-카르복시하이드록시메틸-우리딘(chm5U), 5-카르복시하이드록시메틸-우리딘 메틸 에스테르(mchm5U), 5-메톡시카르보닐메틸-우리딘(mcm5U), 5-메톡시카르보닐메틸-2-티오-우리딘(mcm5s2U), 5-아미노메틸-2-티오-우리딘(nm5s2U), 5-메틸아미노메틸-우리딘(mnm5U), 5-메틸아미노메틸-2-티오-우리딘(mnm5s2U), 5-메틸아미노메틸-2-셀레노-우리딘(mnm5se2U), 5-카르바모일메틸-우리딘(ncm5U), 5-카르복시메틸아미노메틸-우리딘(cmnm5U), 5-카르복시메틸아미노메틸-2-티오-우리딘(cmnm5s2U), 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸-우리딘(τcm5U), 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘(τm5s2U), 1-타우리노메틸-4-티오-슈도우리딘, 5-메틸-우리딘(m5U, 즉 핵염기 데옥시티민을 가짐), 1-메틸-슈도우리딘(m1ψ), 5-메틸-2-티오-우리딘(m5s2U), 1-메틸-4-티오-슈도우리딘(m1s4ψ), 4-티오-1-메틸-슈도우리딘, 3-메틸-슈도우리딘(m3ψ), 2-티오-1-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 디하이드로우리딘(D), 디하이드로슈도우리딘, 5,6-디하이드로우리딘, 5-메틸-디하이드로우리딘(m5D), 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시-우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 4-메톡시-2-티오-슈도우리딘, N1-메틸-슈도우리딘, 3-(3-아미노-3-카르복시프로필)우리딘(acp3U), 1-메틸-3-(3-아미노-3-카르복시프로필)슈도우리딘(acp3ψ), 5-(이소펜테닐아미노메틸)우리딘(inm5U), 5-(이소펜테닐아미노메틸)-2-티오-우리딘(inm5s2U), α-티오-우리딘, 2'-O-메틸-우리딘(Um), 5,2'-O-디메틸-우리딘(m5Um), 2'-O-메틸-슈도우리딘(ψm), 2-티오-2'-O-메틸-우리딘(s2Um), 5-메톡시카르보닐메틸-2'-O-메틸-우리딘(mcm5Um), 5-카르바모일메틸-2'-O-메틸-우리딘(ncm5Um), 5-카르복시메틸아미노메틸-2'-O-메틸-우리딘(cmnm5Um), 3,2'-O-디메틸-우리딘(m3Um), 5-(이소펜테닐아미노메틸)-2'-O-메틸-우리딘(inm5Um), 1-티오-우리딘, 데옥시티미딘, 2'-F-아라-우리딘, 2'-F-우리딘, 2'-OH-아라-우리딘, 5-(2-카르보메톡시비닐) 우리딘, 5-[3-(1-E-프로페닐아미노)우리딘, 피라졸로[3,4-d]피리미딘, 잔틴, 및 하이포잔틴을 포함한다.
시토신
일 구현예에서, 변형된 핵염기는 변형된 시토신이다. 변형된 시토신을 가지는 예시적인 뉴클레오사이드 및 핵염기는 제한 없이, 5-아자-시티딘, 6-아자-시티딘, 슈도이소시티딘, 3-메틸-시티딘(m3C), N4-아세틸-시티딘(act), 5-포르밀-시티딘(f5C), N4-메틸-시티딘(m4C), 5-메틸-시티딘(m5C), 5-할로-시티딘(예를 들어, 5-요오도-시티딘), 5-하이드록시메틸-시티딘(hm5C), 1-메틸-슈도이소시티딘, 피롤로-시티딘, 피롤로-슈도이소시티딘, 2-티오-시티딘(s2C), 2-티오-5-메틸-시티딘, 4-티오-슈도이소시티딘, 4-티오-1-메틸-슈도이소시티딘, 4-티오-1-메틸-1-데아자-슈도이소시티딘, 1-메틸-1-데아자-슈도이소시티딘, 제부라린, 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시-슈도이소시티딘, 4-메톡시-1-메틸-슈도이소시티딘, 라이시딘(k2C), α-티오-시티딘, 2'-O-메틸-시티딘(Cm), 5,2'-O-디메틸-시티딘(m5Cm), N4-아세틸-2'-O-메틸-시티딘(ac4Cm), N4,2'-O-디메틸-시티딘(m4Cm), 5-포르밀-2'-O-메틸-시티딘(f5Cm), N4,N4,2'-O-트리메틸-시티딘(m4 2Cm), 1-티오-시티딘, 2'-F-아라-시티딘, 2'-F-시티딘, 및 2'-OH-아라-시티딘을 포함한다.
아데닌
일 구현예에서, 변형된 핵염기는 변형된 아데닌이다. 변형된 아데닌을 가지는 예시적인 뉴클레오사이드 및 핵염기는, 제한 없이, 2-아미노-퓨린, 2,6-디아미노퓨린, 2-아미노-6-할로-퓨린(예를 들어, 2-아미노-6-클로로-퓨린), 6-할로-퓨린(예를 들어, 6-클로로-퓨린), 2-아미노-6-메틸-퓨린, 8-아지도-아데노신, 7-데아자-아데노신, 7-데아자-8-아자-아데노신, 7-데아자-2-아미노-퓨린, 7-데아자-8-아자-2-아미노-퓨린, 7-데아자-2,6-디아미노퓨린, 7-데아자-8-아자-2,6-디아미노퓨린, 1-메틸-아데노신(m1A), 2-메틸-아데노신(m2A), N6-메틸-아데노신(m6A), 2-메틸티오-N6-메틸-아데노신(ms2m6A), N6-이소펜테닐-아데노신(i6A), 2-메틸티오-N6-이소펜테닐-아데노신(ms2i6A), N6-(cis-하이드록시이소펜테닐)아데노신(io6A), 2-메틸티오-N6-(cis-하이드록시이소펜테닐)아데노신(ms2io6A), N6-글리시닐카르바모일-아데노신(g6A), N6-트레오닐카르바모일-아데노신(t6A), N6-메틸-N6-트레오닐카르바모일-아데노신(m6t6A), 2-메틸티오-N6-트레오닐카르바모일-아데노신(ms2g6A), N6,N6-디메틸-아데노신(m6 2A), N6-하이드록시노르발릴카르바모일-아데노신(hn6A), 2-메틸티오-N6-하이드록시노르발릴카르바모일-아데노신(ms2hn6A), N6-아세틸-아데노신(ac6A), 7-메틸-아데노신, 2-메틸티오-아데노신, 2-메톡시-아데노신, α-티오-아데노신, 2'-O-메틸-아데노신(Am), N6,2'-O-디메틸-아데노신(m6Am), N6-메틸-2'-데옥시아데노신, N6,N6,2'-O-트리메틸-아데노신(m6 2Am), 1,2'-O-디메틸-아데노신(m1Am), 2'-O-리보실아데노신(포스페이트)(Ar(p)), 2-아미노-N6-메틸-퓨린, 1-티오-아데노신, 8-아지도-아데노신, 2'-F-아라-아데노신, 2'-F-아데노신, 2'-OH-아라-아데노신, 및 N6-(19-아미노-펜타옥사논아데실)-아데노신을 포함한다.
구아닌
일 구현예에서, 변형된 핵염기는 변형된 구아닌이다. 변형된 구아닌을 가지는 예시적인 뉴클레오사이드 및 핵염기는 제한 없이, 이노신(I), 1-메틸-이노신(m1I), 와이오신(imG), 메틸와이오신(mimG), 4-데메틸-와이오신(imG-14), 이소와이오신(imG2), 와이부토신(yW), 퍼옥시와이부토신(o2yW), 하이드록시와이부토신(OHyW), 저변형 하이드록시와이부토신(OHyW*), 7-데아자-구아노신, 케오신(Q), 에폭시케오신(oQ), 갈락토실-케오신(galQ), 만노실-케오신(manQ), 7-시아노-7-데아자-구아노신(preQ0), 7-아미노메틸-7-데아자-구아노신(preQ1), 아케오신(G+), 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신(m7G), 6-티오-7-메틸-구아노신, 7-메틸-이노신, 6-메톡시-구아노신, 1-메틸-구아노신(m'G), N2-메틸-구아노신(m2G), N2,N2-디메틸-구아노신(m2 2G), N2,7-디메틸-구아노신(m2,7G), N2, N2,7-디메틸-구아노신(m2,2,7G), 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, N2,N2-디메틸-6-티오-구아노신, α-티오-구아노신, 2'-O-메틸-구아노신(Gm), N2-메틸-2'-O-메틸-구아노신(m2Gm), N2,N2-디메틸-2'-O-메틸-구아노신(m2 2Gm), 1-메틸-2'-O-메틸-구아노신(m'Gm), N2,7-디메틸-2'-O-메틸-구아노신(m2,7Gm), 2'-O-메틸-이노신(Im), 1,2'-O-디메틸-이노신(m'Im), O6-페닐-2'-디옥시이노신, 2'-O-리보실구아노신(포스페이트)(Gr(p)), 1-티오-구아노신, O6-메틸-구아노신, O6-메틸-2'-데옥시구아노신, 2'-F-아라-구아노신, 및 2'-F-구아노신을 포함한다.
예시적인 변형된 gRNA
특정 구현예에서, 본 명세서에 기재된 바와 같은 변형된 핵산은 변형된 gRNA일 수 있다. 본 명세서에 기재된 gRNA 중 임의의 것이 본 명세서에 기재된 바와 같이 변형될 수 있음을 이해해야 한다.
실험(결과 미도시)을 통하여, gRNA가 5' 말단에서 또는 그 근처에서 변형되는 경우(예를 들어, gRNA의 5' 말단이 진핵 mRNA 캡 구조 또는 캡 유사체의 포함에 의해 변형되는 경우) CRISPR/Cas 시스템의 gRNA 구성성분이 T 세포에서의 유전자의 교정에 더욱 효율적인 것이 밝혀졌다. 이론에 구속되지 않고, 본 명세서에 기재된 이들 및 다른 변형된 gRNA가 특정 순환 세포 유형(예를 들어, T 세포)로부터 감소된 고유 면역 반응을 야기하며, 이러한 감소된 반응이 관찰되는 개선의 원인인 수 있는 것으로 여겨진다. 본 발명은 gRNA에 대한 순환 세포(예를 들어, T 세포)의 고유 면역 반응을 최소화시키는 것이 순환하는 세포(생체외이든 생체내이든)를 교정하기 위하여 gRNA를 사용하는 경우에 유리할 수 있으며, 비-순환 세포를 교정하기 위하여 gRNA를 사용하는 경우, 예를 들어, gRNA가 생체내 유전자 교정 목적을 위하여 전신으로 또는 국소로 투여되는 경우에도 또한 유리할 수 있다는 인식을 포함한다. 또한, 본 발명은 5' 캡핑 gRNA로 관찰되는 개선이 (예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드의 포함에 의해 또는 시험관내 전사된 gRNA가 포스파타제, 예를 들어, 송아지 장 알칼리성 포스파타제로 처리하여, 5' 트리포스페이트기를 제거함으로써 변형되는 경우) 동일한 유형의 구조적 또는 기능적 결과를 달성하기 위하여 다른 방식으로 변형될 수 있는 gRNA로 연장될 수 있다는 인식을 포함한다. 이론에 구속되지 않고, 특정 구현예에서, 본 명세서에 기재된 변형된 gRNA는 (예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드 및/또는 3' 폴리A 트랙트의 포함에 의해) 뉴클레아제에 대한 안정성을 도입하는 하나 이상의 변형(예를 들어, 변형된 뉴클레오사이드 또는 뉴클레오타이드)을 함유할 수 있다.
따라서, 특정 구현예에서, 본 명세서에 제공된 조성물 및 방법은 본 명세서에 기재된 바와 같은 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하는 gRNA를 사용한다. 이들 중 특정 구현예에서, 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드의 포함은 gRNA가 다르게 비변형된 gRNA에 비하여 특정 순환 세포 유형(예를 들어, T 세포, 대식세포, 수지상 세포 및/또는 B 세포)에서 감소된 선천 면역 반응을 유도하게 한다.
특정 구현예에서, 본 명세서에 제공되는 조성물 및 방법에 사용하기 위한 gRNA는 그의 5' 말단에서 또는 그 근처에서(예를 들어, 그의 5' 말단의 1개 내지 10개, 1개 내지 5개 또는 1개 내지 2개 뉴클레오타이드 이내) 변형된다. 특정 구현예에서, gRNA는 진핵 mRNA 캡 구조 또는 캡 유사체(예를 들어, G(5')ppp(5')G 캡 유사체, m7G(5')ppp(5')G 캡 유사체 또는 3'-O-Me-m7G(5')ppp(5')G 안티 리버스 캡 유사체(ARCA))의 포함에 의해 변형된다. 캡 또는 캡 유사체는 gRNA의 화학적 합성 또는 시험관내 전사 동안 혼입될 수 있다. 특정 구현예에서, 시험관내 전사된 gRNA를 포스파타제(예를 들어, 송아지 장 알칼리성 포스파타제)로의 처리에 의해 변형시켜, 5' 트리포스페이트기를 제거한다.
특정 구현예에서, 본 명세서에 제공되는 조성물 및 방법에 사용하기 위한 gRNA는 그의 3' 말단에서 또는 그 근처에서(예를 들어, 그의 3' 말단의 1개 내지 10개, 1개 내지 5개 또는 1개 내지 2개 뉴클레오타이드 이내) 변형된다.
일 구현예에서, gRNA의 3' 말단은 하나 이상의(예를 들어, 25개 내지 200개의) 아데닌(A) 잔기의 부가에 의해 변형된다. 폴리A 트랙트는 gRNA를 인코딩하는 핵산(예를 들어, 플라스미드, PCR 산물, 바이러스 게놈)에 함유되거나, 화학적 합성 동안 또는 폴리아데노신 중합효소(예를 들어, 에스케리키아 콜라이(E. coli) 폴리(A) 중합효소)를 사용한 시험관내 전사 후에 gRNA에 부가될 수 있다.
특정 구현예에서, 본 명세서에 제공되는 조성물 및 방법에 사용하기 위한 gRNA는 그의 5' 말단에서의 또는 그 근처에서의 변형 및 그의 3' 말단에서의 또는 그 근처에서의 변형 둘 모두를 포함한다.
특정 구현예에서, 시험관내 전사되는 gRNA는 5' 캡 구조 또는 캡 유사체 및 3' 폴리A 트랙트를 함유한다. 일 구현예에서, 시험관내 전사된 gRNA를 포스파타제(예를 들어, 송아지 장 알칼리성 포스파타제)로 처리함으로써 변형시켜, 5' 트리포스페이트기를 제거하며, 3' 폴리A 트랙트를 포함한다.
일부 구현예에서, gRNA는 3' 말단 U 리보스에서 변형될 수 있다. 예를 들어, U 리보스의 2개의 말단 하이드록실기는 알데하이드기로 산화되고 리보스 고리의 부수적인 개환이 일어나 하기에 나타낸 바와 같은 변형된 뉴클레오사이드를 제공할 수 있다:
상기 식에서, "U"는 비변형 또는 변형된 우리딘일 수 있다.
또 다른 구현예에서, 3' 말단 U는 하기에 나타낸 바와 같은 2'3' 사이클릭 포스페이트로 변형될 수 있다:
상기 식에서, "U"는 비변형 또는 변형된 우리딘일 수 있다.
일부 구현예에서, gRNA 분자는, 예를 들어, 본 명세서에 기재된 변형된 뉴클레오타이드 중 하나 이상을 혼입함으로써, 분해에 대하여 안정화될 수 있는 3' 뉴클레오타이드를 포함할 수 있다. 이 구현예에서, 예를 들어, 우리딘은 변형된 우리딘, 예를 들어, 5-(2-아미노)프로필 우리딘, 및 5-브로모 우리딘으로, 또는 본 명세서에 기재된 변형된 우리딘 중 임의의 것으로 대체될 수 있으며; 아데노신 및 구아노신은 변형된 아데노신 및 구아노신으로, 예를 들어, 8-위치에서의 변형, 예를 들어, 8-브로모 구아노신으로, 또는 본 명세서에 기재된 변형된 아데노신 또는 구아노신 중 임의의 것으로 대체될 수 있다.
일부 구현예에서, 당-변형된 리보뉴클레오타이드는 gRNA 내로 혼입될 수 있으며, 예를 들어, 2' OH-기는 H, -OR, -R(여기서, R은 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음), 할로, -SH, -SR(여기서, R은 예를 들어, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당일 수 있음), 아미노(여기서, 아미노는 예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 디헤테로아릴아미노 또는 아미노산일 수 있음); 또는 시아노(-CN)로부터 선택되는 기로 대체된다. 일부 구현예에서, 포스페이트 백본은 본 명세서에 기재된 바와 같이, 예를 들어, 포스포티오에이트기로 변형될 수 있다. 일부 구현예에서, gRNA의 뉴클레오타이드 중 하나 이상은 각각 독립적으로 변형된 2'-당, 예를 들어, 변형된 2'-O-메틸, 2'-O-메톡시에틸 또는 2'-플루오로, 예를 들어, 2'-F 또는 2'-O-메틸, 아데노신(A), 2'-F 또는 2'-O-메틸, 시티딘(C), 2'-F 또는 2'-O-메틸, 우리딘(U), 2'-F 또는 2'-O-메틸, 티미딘(T), 2'-F 또는 2'-O-메틸, 구아노신(G), 2'-O-메톡시에틸-5-메틸우리딘(Teo), 2'-O-메톡시에틸아데노신(Aeo), 2'-O-메톡시에틸-5-메틸시티딘(m5Ceo) 및 이들의 임의의 조합을 포함하나 이들에 한정되지 않는 변형된 또는 비변형 뉴클레오타이드일 수 있다.
일부 구현예에서, gRNA는 "잠금" 핵산(LNA)을 포함할 수 있으며, 여기서 2' OH-기는, 예를 들어, C1-6 알킬렌 또는 C1-6 헤테로알킬렌 가교에 의해, 동일한 리보스 당의 4' 탄소에 연결될 수 있으며, 여기서 예시적인 가교는 메틸렌, 프로필렌, 에테르, 또는 아미노 가교; O-아미노(여기서, 아미노는 예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노일 수 있음) 및 아미노알콕시, O(CH2)n-아미노(여기서, 아미노는, 예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노, 또는 디헤테로아릴아미노, 에틸렌디아민, 또는 폴리아미노일 수 있음)를 포함할 수 있다.
일부 구현예에서, gRNA는 멀티사이클릭(예를 들어, 트리사이클로); 및 "비잠금" 형태, 예컨대 글리콜 핵산(GNA)(예를 들어, R-GNA 또는 S-GNA, 여기서 리보스는 포스포디에스테르 결합에 부착된 글리콜 단위에 의해 대체됨) 또는 트레오스 핵산(TNA, 여기서 리보스는 α-L-트레오푸라노실-(3'→2')로 대체됨)인 변형된 뉴클레오티드를 포함할 수 있다.
일반적으로, gRNA 분자는 산소를 갖는 5-원 고리인 당기 리보스를 포함한다. 예시적인 변형된 gRNA는 제한 없이 리보스에서의 (예를 들어, 황(S), 셀레늄(Se) 또는 알킬렌, 예를 들어, 메틸렌 또는 에틸렌으로의) 산소의 대체; 이중 결합의 부가(예를 들어, 리보스를 사이클로펜테닐 또는 사이클로헥세닐로 대체); 리보스의 고리 축소(예를 들어, 사이클로부탄 또는 옥세탄의 4-원 고리를 형성); 리보스의 고리 확장(예를 들어, 추가적인 탄소 또는 헤테로원자를 가지는 6-원 또는 7-원 고리, 예를 들어, 안하이드로헥시톨, 알트리톨, 만니톨, 사이클로헥사닐, 사이클로헥세닐, 및 모르폴리노(이는 또한 포스포르아미데이트 백본을 가짐)를 형성)을 포함할 수 있다. 당 유사체 변경의 대다수가 2' 위치에 국소화되지만, 4' 위치를 포함하는 다른 부위는 변형되기 쉽다. 일 구현예에서, gRNA는 4'-S, 4'-Se 또는 4'-C-아미노메틸-2'-O-Me 변형을 포함한다.
일부 구현예에서, 데아자 뉴클레오타이드, 예를 들어, 7-데아자-아데노신은 gRNA 내로 혼입될 수 있다. 일부 구현예에서, O- 및 N-알킬화 뉴클레오타이드, 예를 들어, N6-메틸 아데노신은 gRNA 내로 혼입될 수 있다. 일부 구현예에서, gRNA 분자 내의 하나 이상의 또는 모든 뉴클레오타이드는 데옥시뉴클레오타이드이다.
miRNA 결합 부위
마이크로RNA(또는 miRNA)는 자연 발생 세포 19개 내지 25개 뉴클레오타이드 길이의 비코딩 RNA이다. 그들은 예를 들어, mRNA의 3' UTR에 적절한 miRNA 결합 부위를 갖는 핵산 분자에 결합하며, 유전자 발현을 하향 조절한다. 이론에 구속되지 않고, 핵산 분자 안정성을 감소시키거나 번역을 억제함으로써 이러한 하향 조절이 발생하는 것으로 여겨진다. 본 명세서에 개시된 RNA 종, 예를 들어, Cas9를 인코딩하는 mRNA는 예를 들어, 그의 3'UTR에 miRNA 결합 부위를 포함할 수 있다. miRNA 결합 부위는 선택된 세포 유형에서 발현의 하향 조절을 촉진시키도록 선택될 수 있다.
실시예
하기 실시예는 단지 예시하는 것이고, 본 발명의 범주 또는 내용을 어떠한 방식으로든 제한하는 것으로 의도되지 않는다.
실시예 1: Cas9 리보핵단백질 복합체의 생물물리학적 특성화 및 직접적인 전달
Cas9 리보핵단백질(RNP) 복합체의 직접적인 전달을 효율적인 유전자 교정을 가능하게 하면서, 세포에서 Cas9 단백질의 신속한 전환으로 인해 표적외 활성을 최소화시킨다. RNP 전달에 의해 매개되는 유전자 교정의 효율은 유전자좌마다 달라지며, gRNA의 길이 및 전달되는 Cas9 단백질 및 gRNA의 양과 비에 좌우된다.
gRNA와 함께 Cas9 복합체의 구조적 및 생물물리학적 특성화에 의해, 큰 접촉 영역 및 높은 친화성이 드러났다. 열 용융 곡선은 복합체의 결합 및 안정성을 검출하는데 유용한 특성이다. 아포-Cas9 분자(즉, gRNA 분자의 부재 하의 Cas9 분자)로부터 gRNA와 복합체화된 Cas9 분자까지의 용융 온도의 큰 증가를 사용하여, gRNA에 대한 Cas9의 친화성을 특성화하였다. 상이한 길이의 다수의 gRNA를 상이한 화학량론에서 Cas9와 복합체화시키고, 열 변화(예를 들어, 용융 온도의 변화)를 사용하여 상호작용을 측정하였다. 그 다음, 이들 생물물리학적으로 특성화된 복합체를 293T 세포 내로 트랜스펙션시키고, 생성된 삽입결실의 효율을 측정하였다. gRNA 길이 및 염기 조성의 미묘한 차이가 RNP 복합체의 결합 및 형성에 영향을 미치는 것으로 나타났다. 결합 친화성과 게놈 교정의 효율의 상관관계는 예를 들어, 양이온성 지질 매개 직접 전달을 위한 최적의 조성의 RNP의 설계를 가능하게 한다.
DSF에 의한 Cas9 분자 및 Cas9 분자/gRNA 분자 복합체의 평가
스타필로코커스 아우레우스 및 스트렙토코커스 피오게네스 Cas9 분자를 재조합에 의해 발현시키고, Ni 친화성 크로마토그래피, SP 세파로스 및 슈퍼덱스(Superdex) 200을 사용하여 정제하였다.
DSF를 사용하여, gRNA 분자의 부재 하의, 정제된 스타필로코커스 아우레우스 및 스트렙토코커스 피오게네스 Cas9 분자의 안정성을 시험하였다. 반응 혼합물은 10 ㎕ 부피에 5 μM Cas9 분자 및 5x SYPRO 오렌지®(라이프 테크놀로지즈 카탈로그 번호 S-6650)를 함유하였다. 기울기를 1분 동안 20℃에 이어서, 10초마다 1℃ 증분식으로 20℃에서 95℃까지 전개시켰다. 형광 신호의 도함수를 온도에 대하여 플롯팅하고, 비폴딩 전이(Tm)에 대한 온도 중간점을 결정하였다. 도 9a 및 도 9b에 나타낸 바와 같이, 스타필로코커스 아우레우스 Cas9 분자(Tm = 36℃)는 스트렙토코커스 피오게네스 Cas9 분자(Tm = 40℃)보다 덜 안정적이었다.
또한, DSF를 사용하여 Cas9 분자/gRNA 분자 복합체를 시험하였다. 단독의 스트렙토코커스 피오게네스 Cas9, 1 μM 스트렙토코커스 피오게네스 gRNA와 함께 스트렙토코커스 피오게네스 Cas9 및 1 μM 스타필로코커스 아우레우스 gRNA와 함께 스트렙토코커스 피오게네스 Cas9를 H150(10 mM Hepes pH 7.5, 150 mM NaCl)에서 시험하였다. 이들 실험에 사용되는 gRNA 분자를 인코딩하는 DNA 서열은 하기와 같았다:
스트렙토코커스 피오게네스 gRNA:
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT(서열번호 206); 및
스타필로코커스 아우레우스 gRNA:
GTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTT(서열번호 207).
도 10에 나타낸 바와 같이, 스트렙토코커스 피오게네스 Cas9의 열 변성은 42℃였으며, 50℃로의 열 변화가 공존 gRNA 분자의 존재 하에 관찰되었다. 그러나, 스트렙토코커스 피오게네스 Cas9를 맞지 않는 gRNA 분자와 인큐베이션시키는 경우 변화가 관찰되지 않았다. 이들 결과에 의해, Cas9 분자/gRNA 분자 복합체 형성이 열 변화와 상호연관이 있을 수 있음이 뒷받침된다.
Jurkat T 세포로의 Cas9 분자/gRNA 분자 복합체의 전달
Cas9 및 gRNA는 1:25 비로 존재하였다. gRNA 작제물을 PCR 프로토콜을 사용하여 생성하였다. gRNA를 시험관내 전사하고 캡핑하고(예를 들어, 5' 안티-리버스 캡 유사체(ARCA) 캡) 및 테일링시켰다(예를 들어, 3' 폴리A 테일). 도 11a에 나타낸 바와 같이, gRNA 결합은 32℃로부터 46℃까지의 Tm 변화를 유도하였다. Cas9/gRNA 복합체를 Jurkat T 세포에 전달하였다. 도 11b는 세포의 약 20%가 CD3 마커를 소실한 것을 나타낸다.
실시예 2: 시험관내 전사 또는 화학적 합성으로부터의 gRNA 분자의 비교
DSF를 사용하여, Cas9 분자/gRNA 분자 복합체의 성공적인 형성을 분석하고, 3가지 방법 또는 공급처로부터 수득되는 gRNA 분자의 질과 무결성을 비교하였다.
표 6의 것들에 상응하는 서열을 갖는 gRNA 분자를 15 내지 50 ㎍ 규모로 수득하였다.
4 μM에서 정제된 Cas9 단백질을 H150 완충제(10 mM Hepes pH 7.5, 150 mM NaCl) 중에 실온에서 등몰량의 gRNA와 복합체화하였다. 그 다음, Cas9 분자/gRNA 분자 복합체(RNP)를 함유하는 이러한 반응물의 일부를 리포펙타민-2000 트랜스펙션 시약을 사용하여 HEK293FT 세포 내로 트랜스펙션시켰다. 100 nM의 RNP를 모든 경우에 가이드 공급처와 무관하게 사용하였다. 각각의 경우에, RNP의 나머지를 H150 완충제에 1 μM로 희석하고, SYPRO 오렌지를 5000X 원액으로부터 5X의 최종 농도로 첨가하고, DSF 분석을 본 명세서에 기재된 분석 1에 따라 수행하였다. 삽입결실 정량화를 본 명세서에 기재된 프로토콜에 따라 수행하였다.
실험의 결과는 표 6에 요약되어 있다. 델타 Tm을 42℃에서 용융하는 Cas9 단백질과 비교하였다. 결과에 의해, 8℃ 내지 9℃의 델타 Tm에 의해 입증되는 바와 같이 완전한 RNP 복합체 형성을 나타내는 시료가 모두 HEK293FT 세포에서 우수한 NHEJ 활성을 보이는 것으로 나타났다.
회사 2로부터의 화학적으로 합성된 gRNA는 미소한 델타 Tm 및 보다 낮은 NHEJ 활성(11% 삽입결실)과 함께 부적당한 것으로 관찰되었다.
MEGAshortscript T7 키트에 의해 시험관내 전사된 gRNA 및 회사 1로부터 구매한 gRNA는 7℃ 내지 8℃의 Tm 및 22 내지 27℃ 범위에서의 NHEJ 활성에 의해 입증되는 바와 같이 충분한 질 및 무결성의 것이었다.
실시예 3: gRNA의 클로닝 및 초기 스크리닝
본 실시예에는 키메라 gRNA를 평가하기 위한 방법이 개시되어 있다. 또한, 동일한 방법을 사용하여 모듈 gRNA를 평가할 수 있다.
벡터 내로의 gRNA의 클로닝
각각의 gRNA에 있어서, 중첩 올리고뉴클레오타이드의 쌍을 설계하고 수득한다. 올리고뉴클레오타이드를 어닐링하고, 상류 U6 프로모터 및 긴 키메라 gRNA의 나머지 서열을 함유하는 분해된 벡터 백본 내로 라이게이션시켰다. 플라스미드를 서열-확인하고, 충분한 양의 트랜스펙션-품질의 DNA를 생성하기 위해 제조한다. 특정 구현예에서, U6 프로모터를 대안적 프로모터로 대체하여, 생체내 전사(예를 들어, H1 프로모터) 또는 시험관내 전사(예를 들어, T7 프로모터)를 추진할 수 있다.
선형 dsDNA 분자 내로의 gRNA의 클로닝(STITCHR)
단일의 올리고뉴클레오타이드를 설계하고, 각각의 gRNA에 대하여 수득한다. U6 프로모터 및 gRNA 스캐폴드(예를 들어, crRNA 및 tracrRNA로부터 유래되는 서열을 포함하는, 예를 들어, 제1 상보성 도메인; 연결 도메인; 제2 상보성 도메인; 근위 도메인; 및 꼬리 도메인을 포함하는 표적화 도메인을 제외한 모든 것 포함)를 개별적으로 PCR 증폭시키고, dsDNA 분자로서 정제한다. gRNA-특이적 올리고뉴클레오타이드를 PCR 반응에서 사용하여, 올리고뉴클레오타이드에서 특정된 표적화 도메인에 의해 연결되는 U6 및 gRNA 스캐폴드를 연결한다. 생성된 dsDNA 분자(STITCHR 산물)를 트랜스펙션을 위해 정제한다. 임의의 gRNA 스캐폴드를 사용하여 임의의 박테리아 종으로부터의 Cas9와 양립가능한 gRNA를 생성할 수 있다. 특정 구현예에서, U6 프로모터를 대안적 프로모터로 교체하여, 생체내 전사(예를 들어, H1 프로모터) 또는 시험관내 전사(예를 들어, T7 프로모터)를 추진할 수 있다.
초기 gRNA 스크린
시험할 각각의 gRNA를 Cas9를 발현하는 플라스미드 및 소량의 GFP-발현 플라스미드와 함께 인간 세포 내로 트랜스펙션시킨다. 예비 실험에서, 이들 세포는 불멸화된 인간 세포주, 예를 들어, 293T, K562 또는 U2OS일 수 있다. 대안적으로, 일차 인간 세포가 사용될 수 있다. 스크리닝을 위해 사용되는 세포는 궁극적인 치료적 세포 표적(예를 들어, 적혈구 세포)와 관련될 수 있다. 잠재적인 치료 표적 세포 집단과 유사한 일차 세포의 이용은 내인성 염색질 및 유전자 발현의 맥락에서 유전자 표적화 비에 대한 중요한 정보를 제공할 수 있다.
지질 트랜스펙션(예를 들어, 리포펙타민 또는 Fugene)을 사용하여 또는 전기천공법(예를 들어, 론자 뉴클레오펙션(Lonza Nucleofection))에 의해 트랜스펙션을 수행할 수 있다. 트랜스펙션 후에, 형광 현미경에 의해 또는 유세포분석에 의해 GFP 발현을 결정하여, 일관된 높은 수준의 트랜스펙션을 확인할 수 있다. 예비 트랜스펙션은 어떤 gRNA/gRNA의 조합이 가장 큰 활성을 제공하는지를 결정하기 위하여 상이한 gRNA 및 상이한 표적화 방법(예를 들어, 17-mer, 20-mer, 뉴클레아제, 이중-틈내기효소 등)을 포함할 수 있다.
T7E1 엔도뉴클레아제 분석에 의해 표적 유전자좌에서 NHEJ-유도된 삽입결실 형성을 측정함으로써 각 gRNA를 사용한 절단의 효율을 평가할 수 있다. 이러한 분석을 위하여, PCR 앰플리콘은 대략 500 내지 700 bp이며, 의도되는 절단 부위는 앰플리콘 내에 비대칭적으로 배치된다. 증폭, 정제 및 PCR 산물의 크기-입증 후에, 95℃로 가열시킨 다음 서서히 냉각시킴으로써 DNA를 변성시키고, 재혼성화시킨다. 그 다음, 혼성화된 PCR 산물을 완벽하게 일치되지 않는 DNA를 인식하고 이를 절단하는 T7 엔도뉴클레아제 I(또는 다른 불일치-감수성 효소)으로 분해한다. 삽입결실이 원래의 주형 DNA에 존재한다면, 앰플리콘의 변성 및 재-어닐링은 상이한 삽입결실을 지니는 DNA 가닥의 혼성화를 초래하며, 이는 완벽하게 일치되지 않는 이중-가닥 DNA를 야기한다. 분해 산물을 겔 전기영동 또는 모세관 전기영동에 의해 가시화시킬 수 있다. 절단된 DNA의 분율(절단 및 비절단된 밀도로 나눈 절단 산물의 밀도)을 사용하여, 하기의 식을 사용하여 NHEJ 백분율을 추정할 수 있다: NHEJ% = (1-(1-절단 분율)½). T7E1 분석은 약 2 내지 5% NHEJ에 이르기까지 감수성이다.
특정 구현예에서, 예를 들어, 시퀀싱 및 불일치-감수성 효소, 예를 들어, 세포/서베이어(Surveyor) 뉴클레아제의 이용을 포함하는 다른 방법을 사용하여 절단 효율을 평가할 수 있다. 생거 시퀀싱을 위하여, 정제된 PCR 앰플리콘을 플라스미드 백본 내로 클로닝하고, 형질전환시키고, 소규모 제조하고, 단일의 프라이머로 시퀀싱한다. NHEJ 비를 T7E1에 의해 결정한 후에, 삽입결실의 정확한 성질을 결정하기 위하여 생거 시퀀싱을 사용할 수 있다. 차세대 시퀀싱을 위하여, 앰플리콘은 300 내지 500 bp일 수 있으며, 의도되는 절단 부위는 비대칭적으로 배치된다. PCR 후에, 차세대 시퀀싱 어댑터 및 바코드(예를 들어, 일루미나 멀티플렉스 어댑터 및 인덱스)를 예를 들어, (예를 들어, 일루미나 MiSeq에서의) 높은 처리효율의 시퀀싱에 사용하기 위하여 앰플리콘의 말단에 부가할 수 있다. 이러한 방법은 매우 낮은 NHEJ 비의 검출을 가능하게 한다.
실시예 4: NHEJ에 의한 유전자 표적화의 평가
초기 시험에서 가장 큰 수준의 NHEJ를 유도하는 gRNA를 유전자 표적화 효율의 추가의 평가를 위해 선택할 수 있다. 이러한 경우에, 세포는 이환 대상체로부터 유래되며, 이에 따라 관련 돌연변이를 지닌다.
트랜스펙션 후에(통상 트랜스펙션 후 2일 내지 3일), 게놈 DNA를 부피가 큰 트랜스펙션된 세포의 집단으로부터 분리할 수 있으며, PCR을 사용하여 표적 영역을 증폭시킬 수 있다. PCR 후에, 요망되는 돌연변이(표적 유전자의 넉아웃 또는 표적 서열 모티프의 제거 중 어느 하나)를 생성하기 위한 유전자 표적화 효율을 시퀀싱에 의해 결정할 수 있다. 생거 시퀀싱을 위하여, PCR 앰플리콘은 500 내지 700 bp 길이일 수 있다. 차세대 시퀀싱을 위하여, PCR 앰플리콘은 300 내지 500 bp 길이일 수 있다. 목적이 유전자 기능을 넉아웃시키는 것이면, 시퀀싱을 사용하여 몇 퍼센트의 대립유전자가 유전자 기능을 파괴하는 것으로 예상되는 프레임시프트 또는 대형 결실 또는 삽입를 초래하는 NHEJ-유도되는 삽입결실을 겪는지를 평가할 수 있다. 목적이 특정 서열 모티프를 제거하는 것이면, 시퀀싱을 사용하여 몇 퍼센트의 대립유전자가 이러한 서열에 걸쳐 있는 NHEJ-유도된 결실을 겪는지를 평가할 수 있다.
실시예 5: HDR에 의한 유전자 표적화의 평가
초기 시험에서 가장 큰 수준의 NHEJ를 유도하는 gRNA를 유전자 표적화 효율의 추가의 평가를 위해 선택할 수 있다. 이러한 경우에, 세포는 이환 대상체로부터 유래되며, 이에 따라 관련 돌연변이를 지닌다.
트랜스펙션 후에(통상 트랜스펙션 후 2일 내지 3일), 게놈 DNA를 부피가 큰 트랜스펙션된 세포의 집단으로부터 분리할 수 있으며, PCR을 사용하여 표적 영역을 증폭시킬 수 있다. PCR 후에, 유전자 표적화 효율을 몇몇의 방법에 의해 결정할 수 있다.
유전자 표적화 빈도의 결정은 외인적으로 제공되는 공여자 주형 또는 내인성 게놈 공여자 서열과 상동성 유도 수선(HDR)을 겪고, 이에 따라, 요망되는 보정이 혼입된 대립유전자의 백분율을 측정하는 것을 수반한다. 요망되는 HDR 사건이 제한 효소 부위를 생성하거나 파괴하면, 유전자 표적화의 빈도를 RFLP 분석에 의해 결정할 수 있다. 제한 효소가 생성되거나 파괴되지 않는다면, 시퀀싱을 사용하여 유전자 표적화 빈도를 결정할 수 있다. RFLP 분석이 사용된다면, 여전히 시퀀싱을 사용하여 요망되는 HDR 사건을 확인하고, 다른 돌연변이가 존재하지 않음을 보장할 수 있다. 외인적으로 제공되는 공여자 주형이 사용된다면, 프라이머 중 적어도 하나는 여전히 세포에 존재하는 공여자 주형의 증폭을 방해하는 상동성 아암(arm)에 포함되는 영역의 외측의 내인성 유전자 서열에 배치된다. 따라서, 공여자 주형에 존재하는 상동성 아암의 길이는 PCR 앰플리콘의 길이에 영향을 미칠 수 있다. PCR 앰플리콘은 전체 공여자 영역에 걸쳐 있을 수 있거나(두 프라이머 모두는 상동성 아암의 외측에 배치됨), 그들은 오직 공여자 영역의 일부 및 공여자와 내인성 DNA 사이의 단일의 접합부에 걸쳐 있을 수 있다(하나는 내측, 하나는 외측 프라이머). 앰플리콘이 전체 공여자 영역 미만의 영역에 걸쳐 있다면, 2가지의 상이한 PCR을 사용하여 5' 및 3' 접합부 둘 모두에서 서열을 증폭시켜야 한다.
PCR 앰플리콘이 짧으면(600 bp 미만), 차세대 시퀀싱을 사용할 수 있다. PCR 후에, 차세대 시퀀싱 어댑터 및 바코드(예를 들어, 일루미나 멀티플렉스 어댑터 및 인덱스)를 예를 들어, (예를 들어, 일루미나 MiSeq에서의) 높은 처리효율의 시퀀싱에 사용하기 위하여 앰플리콘의 말단에 부가할 수 있다. 이러한 방법은 매우 낮은 유전자 표적화 비의 검출을 가능하게 한다.
차세대 시퀀싱을 위해 PCR 앰플리콘이 너무 길면, 생거 시퀀싱을 수행할 수 있다. 생거 시퀀싱을 위하여, 정제된 PCR 앰플리콘을 플라스미드 백본(예를 들어, 라이프테크 제로 블런트(LifeTech Zero Blunt)® TOPO® 클로닝 키트를 사용하여 클로닝된 TOPO) 내로 클로닝하고, 형질전환시키고, 소규모 제조하고, 시퀀싱할 것이다.
상기 기재된 것과 동일하거나 유사한 분석을 사용하여 내인성 게놈 공여자 서열과 HDR을 겪고, 이에 따라 요망되는 보정이 혼입된 대립유전자의 백분율을 측정할 수 있다.
참고문헌의 포함
본 명세서에서 언급된 모든 간행물, 특허, 및 특허 출원은, 각각의 개별적인 간행물, 특허 또는 특허 출원이 구체적으로 그리고 개별적으로 참고로 포함되어 있는 것처럼 전체가 참고로 본 명세서에 포함되어 있다. 상충하는 경우, 본 명세서의 임의의 정의를 포함하여, 본 출원이 우선할 것이다.
균등물
당업자는 단지 일상적인 실험을 이용하여 본 명세서에 기재된 발명의 구체적인 구현예에 대한 많은 균등물을 인식하거나 알아낼 수 있을 것이다. 이러한 균등물은 하기 청구범위에 포함되는 것으로 의도된다.
참고문헌
Anders et al. Nature 513(7519):569-573 (2014)
Bae et al. Bioinformatics 30(10):1473-1475 (2014)
Caldecott Nat Rev Genet 9(8):619-631 (2008)
Chylinski et al. RNA Biol 10(5):726?737 (2013)
Cong et al. Science 399(6121):819-823 (2013)
Deveau et al. J Bacterial 190(4):1390-1400 (2008)
Esvelt et al. Nature 472(7344):499-503 (2011)
Fu et al. Nat Biotechnol 32:279-284 (2014)
Haft PLoS Comput Biol 1(6):e60 (2005)
Heigwer Nat Methods 11(2):122-123 (2014)
Horvath & Barrangou Science 327(5962):167-170 (2010)
Hsu et al. Nat Biotechnol 31(9):827-832 (2013)
Jinek et al. Science 337(6096):816-821 (2012)
Jinek et al. Science 343(6176):1247997 (2014)
Lee et al. Nano Lett 12(12):6322-6327 (2012)
Li Cell Res 18(1):85-98 (2008)
Makarova et al. Nat Rev Microbiol 9(6):467-477 (2011)
Mali et al. Science 339(6121):823-826 (2013)
Marteijn et al. Nat Rev Mol Cell Biol 15(7):465-481 (2014)
Nishimasu et al. Cell 156(5):935-949 (2014)
Sternberg et al. Nature 507(7490):62-67 (2014)
Wang et al. Cell 153(4):910-918 (2013)
Xiao et al. "CasOT: a genome-wide Cas9/gRNA off-target searching tool." Bioinformatics (epub Jan. 21, 2014)
SEQUENCE LISTING
<110> Editas Medicine
Jayaram, Hari
Selleck, William Jr.
<120> Evaluation of Cas9 molecule/guide RNA molecule complexes
<130> 118945.8008.WO00 (EM050PCT)
<150> US 62/152,473
<151> 2015-04-24
<160> 210
<170> PatentIn version 3.5
<210> 1
<211> 1345
<212> PRT
<213> Streptococcus mutans
<220>
<221> misc_feature
<222> (10)..(21)
<223> N-terminal RuvC-like domain
<220>
<221> misc_feature
<222> (759)..(766)
<223> RuvC-like domain
<220>
<221> misc_feature
<222> (837)..(863)
<223> HNH-like domain
<220>
<221> misc_feature
<222> (982)..(989)
<223> RuvC-like domain
<400> 1
Met Lys Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Asp Lys Ser His Ile Glu Lys Asn Leu Leu
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Asn Thr Ala Glu Asp Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Glu Glu Met Gly Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Asp Ser Phe Leu Val Thr Glu Asp Lys Arg
100 105 110
Gly Glu Arg His Pro Ile Phe Gly Asn Leu Glu Glu Glu Val Lys Tyr
115 120 125
His Glu Asn Phe Pro Thr Ile Tyr His Leu Arg Gln Tyr Leu Ala Asp
130 135 140
Asn Pro Glu Lys Val Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Lys Phe Asp Thr
165 170 175
Arg Asn Asn Asp Val Gln Arg Leu Phe Gln Glu Phe Leu Ala Val Tyr
180 185 190
Asp Asn Thr Phe Glu Asn Ser Ser Leu Gln Glu Gln Asn Val Gln Val
195 200 205
Glu Glu Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp Arg
210 215 220
Val Leu Lys Leu Phe Pro Asn Glu Lys Ser Asn Gly Arg Phe Ala Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe
245 250 255
Glu Leu Glu Glu Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Glu
260 265 270
Glu Glu Leu Glu Val Leu Leu Ala Gln Ile Gly Asp Asn Tyr Ala Glu
275 280 285
Leu Phe Leu Ser Ala Lys Lys Leu Tyr Asp Ser Ile Leu Leu Ser Gly
290 295 300
Ile Leu Thr Val Thr Asp Val Gly Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Gln Arg Tyr Asn Glu His Gln Met Asp Leu Ala Gln Leu Lys
325 330 335
Gln Phe Ile Arg Gln Lys Leu Ser Asp Lys Tyr Asn Glu Val Phe Ser
340 345 350
Asp Val Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Ala Phe Tyr Lys Tyr Leu Lys Gly Leu Leu Asn Lys Ile Glu
370 375 380
Gly Ser Gly Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Ile Arg Arg Gln Ala Glu Phe Tyr Pro Phe
420 425 430
Leu Ala Asp Asn Gln Asp Arg Ile Glu Lys Leu Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Lys Ser Asp Phe Ala Trp
450 455 460
Leu Ser Arg Lys Ser Ala Asp Lys Ile Thr Pro Trp Asn Phe Asp Glu
465 470 475 480
Ile Val Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Asn Tyr Asp Leu Tyr Leu Pro Asn Gln Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Lys Thr Glu Gln Gly Lys Thr Ala Phe Phe Asp Ala Asn Met Lys
530 535 540
Gln Glu Ile Phe Asp Gly Val Phe Lys Val Tyr Arg Lys Val Thr Lys
545 550 555 560
Asp Lys Leu Met Asp Phe Leu Glu Lys Glu Phe Asp Glu Phe Arg Ile
565 570 575
Val Asp Leu Thr Gly Leu Asp Lys Glu Asn Lys Val Phe Asn Ala Ser
580 585 590
Tyr Gly Thr Tyr His Asp Leu Cys Lys Ile Leu Asp Lys Asp Phe Leu
595 600 605
Asp Asn Ser Lys Asn Glu Lys Ile Leu Glu Asp Ile Val Leu Thr Leu
610 615 620
Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Glu Asn Tyr
625 630 635 640
Ser Asp Leu Leu Thr Lys Glu Gln Val Lys Lys Leu Glu Arg Arg His
645 650 655
Tyr Thr Gly Trp Gly Arg Leu Ser Ala Glu Leu Ile His Gly Ile Arg
660 665 670
Asn Lys Glu Ser Arg Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly
675 680 685
Asn Ser Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser
690 695 700
Phe Lys Glu Glu Ile Ala Lys Ala Gln Val Ile Gly Glu Thr Asp Asn
705 710 715 720
Leu Asn Gln Val Val Ser Asp Ile Ala Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Ile Met
740 745 750
Gly His Gln Pro Glu Asn Ile Val Val Glu Met Ala Arg Glu Asn Gln
755 760 765
Phe Thr Asn Gln Gly Arg Arg Asn Ser Gln Gln Arg Leu Lys Gly Leu
770 775 780
Thr Asp Ser Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Ser Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Thr Gly Glu Glu Leu Asp Ile Asp Tyr
820 825 830
Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys
835 840 845
Asp Asn Ser Ile Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn Arg
850 855 860
Gly Lys Ser Asp Asp Val Pro Ser Lys Asp Val Val Arg Lys Met Lys
865 870 875 880
Ser Tyr Trp Ser Lys Leu Leu Ser Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Asp Asp Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe Asn Thr Glu Thr Asp
930 935 940
Glu Asn Asn Lys Lys Ile Arg Gln Val Lys Ile Val Thr Leu Lys Ser
945 950 955 960
Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Ile Gly Lys Ala Leu Leu Gly Val Tyr Pro Gln Leu Glu Pro Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Pro His Phe His Gly His Lys Glu Asn Lys
1010 1015 1020
Ala Thr Ala Lys Lys Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1025 1030 1035
Lys Lys Asp Asp Val Arg Thr Asp Lys Asn Gly Glu Ile Ile Trp
1040 1045 1050
Lys Lys Asp Glu His Ile Ser Asn Ile Lys Lys Val Leu Ser Tyr
1055 1060 1065
Pro Gln Val Asn Ile Val Lys Lys Val Glu Glu Gln Thr Gly Gly
1070 1075 1080
Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Asn Ser Asp Lys Leu
1085 1090 1095
Ile Pro Arg Lys Thr Lys Lys Phe Tyr Trp Asp Thr Lys Lys Tyr
1100 1105 1110
Gly Gly Phe Asp Ser Pro Ile Val Ala Tyr Ser Ile Leu Val Ile
1115 1120 1125
Ala Asp Ile Glu Lys Gly Lys Ser Lys Lys Leu Lys Thr Val Lys
1130 1135 1140
Ala Leu Val Gly Val Thr Ile Met Glu Lys Met Thr Phe Glu Arg
1145 1150 1155
Asp Pro Val Ala Phe Leu Glu Arg Lys Gly Tyr Arg Asn Val Gln
1160 1165 1170
Glu Glu Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Lys Leu
1175 1180 1185
Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Arg Glu Leu Gln
1190 1195 1200
Lys Gly Asn Glu Ile Val Leu Pro Asn His Leu Gly Thr Leu Leu
1205 1210 1215
Tyr His Ala Lys Asn Ile His Lys Val Asp Glu Pro Lys His Leu
1220 1225 1230
Asp Tyr Val Asp Lys His Lys Asp Glu Phe Lys Glu Leu Leu Asp
1235 1240 1245
Val Val Ser Asn Phe Ser Lys Lys Tyr Thr Leu Ala Glu Gly Asn
1250 1255 1260
Leu Glu Lys Ile Lys Glu Leu Tyr Ala Gln Asn Asn Gly Glu Asp
1265 1270 1275
Leu Lys Glu Leu Ala Ser Ser Phe Ile Asn Leu Leu Thr Phe Thr
1280 1285 1290
Ala Ile Gly Ala Pro Ala Thr Phe Lys Phe Phe Asp Lys Asn Ile
1295 1300 1305
Asp Arg Lys Arg Tyr Thr Ser Thr Thr Glu Ile Leu Asn Ala Thr
1310 1315 1320
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1325 1330 1335
Leu Asn Lys Leu Gly Gly Asp
1340 1345
<210> 2
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<220>
<221> misc_feature
<222> (10)..(21)
<223> N-terminal RuvC-like domain
<220>
<221> misc_feature
<222> (759)..(766)
<223> RuvC-like domain
<220>
<221> misc_feature
<222> (837)..(863)
<223> HNH-like domain
<220>
<221> misc_feature
<222> (982)..(989)
<223> RuvC-like domain
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 3
<211> 4107
<212> DNA
<213> Streptococcus pyogenes
<400> 3
atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg gtgggccgtg 60
attacggacg agtacaaggt accctccaaa aaatttaaag tgctgggtaa cacggacaga 120
cactctataa agaaaaatct tattggagcc ttgctgttcg actcaggcga gacagccgaa 180
gccacaaggt tgaagcggac cgccaggagg cggtatacca ggagaaagaa ccgcatatgc 240
tacctgcaag aaatcttcag taacgagatg gcaaaggttg acgatagctt tttccatcgc 300
ctggaagaat cctttcttgt tgaggaagac aagaagcacg aacggcaccc catctttggc 360
aatattgtcg acgaagtggc atatcacgaa aagtacccga ctatctacca cctcaggaag 420
aagctggtgg actctaccga taaggcggac ctcagactta tttatttggc actcgcccac 480
atgattaaat ttagaggaca tttcttgatc gagggcgacc tgaacccgga caacagtgac 540
gtcgataagc tgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct 600
ataaatgctt caggagtcga cgctaaagca atcctgtccg cgcgcctctc aaaatctaga 660
agacttgaga atctgattgc tcagttgccc ggggaaaaga aaaatggatt gtttggcaac 720
ctgatcgccc tcagtctcgg actgacccca aatttcaaaa gtaacttcga cctggccgaa 780
gacgctaagc tccagctgtc caaggacaca tacgatgacg acctcgacaa tctgctggcc 840
cagattgggg atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatc 900
ctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct tagcgcatct 960
atgatcaagc ggtacgacga gcatcatcag gatctgaccc tgctgaaggc tcttgtgagg 1020
caacagctcc ccgaaaaata caaggaaatc ttctttgacc agagcaaaaa cggctacgct 1080
ggctatatag atggtggggc cagtcaggag gaattctata aattcatcaa gcccattctc 1140
gagaaaatgg acggcacaga ggagttgctg gtcaaactta acagggagga cctgctgcgg 1200
aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctggg cgaactgcac 1260
gcaatcctga ggaggcagga ggatttttat ccttttctta aagataaccg cgagaaaata 1320
gaaaagattc ttacattcag gatcccgtac tacgtgggac ctctcgcccg gggcaattca 1380
cggtttgcct ggatgacaag gaagtcagag gagactatta caccttggaa cttcgaagaa 1440
gtggtggaca agggtgcatc tgcccagtct ttcatcgagc ggatgacaaa ttttgacaag 1500
aacctcccta atgagaaggt gctgcccaaa cattctctgc tctacgagta ctttaccgtc 1560
tacaatgaac tgactaaagt caagtacgtc accgagggaa tgaggaagcc ggcattcctt 1620
agtggagaac agaagaaggc gattgtagac ctgttgttca agaccaacag gaaggtgact 1680
gtgaagcaac ttaaagaaga ctactttaag aagatcgaat gttttgacag tgtggaaatt 1740
tcaggggttg aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc 1800
ataaaggaca aagacttcct ggacaacgaa gaaaatgagg atattctcga agacatcgtc 1860
ctcaccctga ccctgttcga agacagggaa atgatagaag agcgcttgaa aacctatgcc 1920
cacctcttcg acgataaagt tatgaagcag ctgaagcgca ggagatacac aggatgggga 1980
agattgtcaa ggaagctgat caatggaatt agggataaac agagtggcaa gaccatactg 2040
gatttcctca aatctgatgg cttcgccaat aggaacttca tgcaactgat tcacgatgac 2100
tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg agactccctt 2160
catgaacaca tcgcgaattt ggcaggttcc cccgctatta aaaagggcat ccttcaaact 2220
gtcaaggtgg tggatgaatt ggtcaaggta atgggcagac ataagccaga aaatattgtg 2280
atcgagatgg cccgcgaaaa ccagaccaca cagaagggcc agaaaaatag tagagagcgg 2340
atgaagagga tcgaggaggg catcaaagag ctgggatctc agattctcaa agaacacccc 2400
gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgt actatctgca gaacggcaga 2460
gacatgtacg tcgaccaaga acttgatatt aatagactgt ccgactatga cgtagaccat 2520
atcgtgcccc agtccttcct gaaggacgac tccattgata acaaagtctt gacaagaagc 2580
gacaagaaca ggggtaaaag tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag 2640
aactactggc gacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg 2700
acgaaagcag agagaggtgg cttgtctgag ttggacaagg cagggtttat taagcggcag 2760
ctggtggaaa ctaggcagat cacaaagcac gtggcgcaga ttttggacag ccggatgaac 2820
acaaaatacg acgaaaatga taaactgata cgagaggtca aagttatcac gctgaaaagc 2880
aagctggtgt ccgattttcg gaaagacttc cagttctaca aagttcgcga gattaataac 2940
taccatcatg ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaag 3000
tacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga tgtgaggaaa 3060
atgatagcca agtccgagca ggagattgga aaggccacag ctaagtactt cttttattct 3120
aacatcatga atttttttaa gacggaaatt accctggcca acggagagat cagaaagcgg 3180
ccccttatag agacaaatgg tgaaacaggt gaaatcgtct gggataaggg cagggatttc 3240
gctactgtga ggaaggtgct gagtatgcca caggtaaata tcgtgaaaaa aaccgaagta 3300
cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcaga caagctcatc 3360
gcccgcaaga aagattggga ccctaagaaa tacgggggat ttgactcacc caccgtagcc 3420
tattctgtgc tggtggtagc taaggtggaa aaaggaaagt ctaagaagct gaagtccgtg 3480
aaggaactct tgggaatcac tatcatggaa agatcatcct ttgaaaagaa ccctatcgat 3540
ttcctggagg ctaagggtta caaggaggtc aagaaagacc tcatcattaa actgccaaaa 3600
tactctctct tcgagctgga aaatggcagg aagagaatgt tggccagcgc cggagagctg 3660
caaaagggaa acgagcttgc tctgccctcc aaatatgtta attttctcta tctcgcttcc 3720
cactatgaaa agctgaaagg gtctcccgaa gataacgagc agaagcagct gttcgtcgaa 3780
cagcacaagc actatctgga tgaaataatc gaacaaataa gcgagttcag caaaagggtt 3840
atcctggcgg atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag 3900
cctattaggg aacaagccga gaatataatt cacctcttta cactcacgaa tctcggagcc 3960
cccgccgcct tcaaatactt tgatacgact atcgaccgga aacggtatac cagtaccaaa 4020
gaggtcctcg atgccaccct catccaccag tcaattactg gcctgtacga aacacggatc 4080
gacctctctc aactgggcgg cgactag 4107
<210> 4
<211> 1388
<212> PRT
<213> Streptococcus thermophilus
<220>
<221> misc_feature
<222> (10)..(21)
<223> N-terminal RuvC-like domain
<220>
<221> misc_feature
<222> (760)..(767)
<223> RuvC-like domain
<220>
<221> misc_feature
<222> (844)..(870)
<223> HNH-like domain
<220>
<221> misc_feature
<222> (989)..(996)
<223> RuvC-like domain
<400> 4
Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Thr Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu
35 40 45
Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala
85 90 95
Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg
100 105 110
Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr
115 120 125
His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp
130 135 140
Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser
165 170 175
Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr
180 185 190
Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu
195 200 205
Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg
210 215 220
Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe
245 250 255
Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp
260 265 270
Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp
275 280 285
Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala
305 310 315 320
Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys
325 330 335
Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys
340 345 350
Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Asp Phe Tyr Val Tyr Leu Lys Lys Leu Leu Ala Glu Phe Glu
370 375 380
Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe
420 425 430
Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp
450 455 460
Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp
465 470 475 480
Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg
515 520 525
Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln
530 535 540
Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr
545 550 555 560
Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly
565 570 575
Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr
580 585 590
Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp
595 600 605
Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile
610 615 620
Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn
625 630 635 640
Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr
645 650 655
Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu
660 665 670
Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys
690 695 700
Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn
705 710 715 720
Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met
740 745 750
Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn
755 760 765
Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg
770 775 780
Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn
785 790 795 800
Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp
805 810 815
Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly
820 825 830
Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile
835 840 845
Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu
850 855 860
Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu
865 870 875 880
Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser
885 890 895
Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu
930 935 940
Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val
945 950 955 960
Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp
965 970 975
Phe Glu Leu Tyr Lys Val Arg Glu Ile Asn Asp Phe His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Ala Ser Ala Leu Leu Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr
1010 1015 1020
Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala
1040 1045 1050
Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu
1055 1060 1065
Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val
1070 1075 1080
Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val
1085 1090 1095
Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu
1100 1105 1110
Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu
1115 1120 1125
Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly
1130 1135 1140
Gly Tyr Ala Gly Ile Ser Asn Ser Phe Thr Val Leu Val Lys Gly
1145 1150 1155
Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu
1160 1165 1170
Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp
1175 1180 1185
Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu
1190 1195 1200
Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly
1205 1210 1215
Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg
1220 1225 1230
Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe
1235 1240 1245
Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn
1250 1255 1260
Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu
1265 1270 1275
Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly
1280 1285 1290
Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp
1295 1300 1305
Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro
1310 1315 1320
Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly
1325 1330 1335
Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr
1340 1345 1350
Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala
1370 1375 1380
Lys Leu Gly Glu Gly
1385
<210> 5
<211> 1334
<212> PRT
<213> Listeria innocua
<220>
<221> misc_feature
<222> (10)..(21)
<223> N-terminal RuvC-like domain
<220>
<221> misc_feature
<222> (762)..(769)
<223> RuvC-like domain
<220>
<221> misc_feature
<222> (840)..(866)
<223> HNH-like domain
<220>
<221> misc_feature
<222> (985)..(992)
<223> RuvC-like domain
<400> 5
Met Lys Lys Pro Tyr Thr Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Leu Thr Asp Gln Tyr Asp Leu Val Lys Arg Lys Met
20 25 30
Lys Ile Ala Gly Asp Ser Glu Lys Lys Gln Ile Lys Lys Asn Phe Trp
35 40 45
Gly Val Arg Leu Phe Asp Glu Gly Gln Thr Ala Ala Asp Arg Arg Met
50 55 60
Ala Arg Thr Ala Arg Arg Arg Ile Glu Arg Arg Arg Asn Arg Ile Ser
65 70 75 80
Tyr Leu Gln Gly Ile Phe Ala Glu Glu Met Ser Lys Thr Asp Ala Asn
85 90 95
Phe Phe Cys Arg Leu Ser Asp Ser Phe Tyr Val Asp Asn Glu Lys Arg
100 105 110
Asn Ser Arg His Pro Phe Phe Ala Thr Ile Glu Glu Glu Val Glu Tyr
115 120 125
His Lys Asn Tyr Pro Thr Ile Tyr His Leu Arg Glu Glu Leu Val Asn
130 135 140
Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Tyr Arg Gly Asn Phe Leu Ile Glu Gly Ala Leu Asp Thr
165 170 175
Gln Asn Thr Ser Val Asp Gly Ile Tyr Lys Gln Phe Ile Gln Thr Tyr
180 185 190
Asn Gln Val Phe Ala Ser Gly Ile Glu Asp Gly Ser Leu Lys Lys Leu
195 200 205
Glu Asp Asn Lys Asp Val Ala Lys Ile Leu Val Glu Lys Val Thr Arg
210 215 220
Lys Glu Lys Leu Glu Arg Ile Leu Lys Leu Tyr Pro Gly Glu Lys Ser
225 230 235 240
Ala Gly Met Phe Ala Gln Phe Ile Ser Leu Ile Val Gly Ser Lys Gly
245 250 255
Asn Phe Gln Lys Pro Phe Asp Leu Ile Glu Lys Ser Asp Ile Glu Cys
260 265 270
Ala Lys Asp Ser Tyr Glu Glu Asp Leu Glu Ser Leu Leu Ala Leu Ile
275 280 285
Gly Asp Glu Tyr Ala Glu Leu Phe Val Ala Ala Lys Asn Ala Tyr Ser
290 295 300
Ala Val Val Leu Ser Ser Ile Ile Thr Val Ala Glu Thr Glu Thr Asn
305 310 315 320
Ala Lys Leu Ser Ala Ser Met Ile Glu Arg Phe Asp Thr His Glu Glu
325 330 335
Asp Leu Gly Glu Leu Lys Ala Phe Ile Lys Leu His Leu Pro Lys His
340 345 350
Tyr Glu Glu Ile Phe Ser Asn Thr Glu Lys His Gly Tyr Ala Gly Tyr
355 360 365
Ile Asp Gly Lys Thr Lys Gln Ala Asp Phe Tyr Lys Tyr Met Lys Met
370 375 380
Thr Leu Glu Asn Ile Glu Gly Ala Asp Tyr Phe Ile Ala Lys Ile Glu
385 390 395 400
Lys Glu Asn Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile
405 410 415
Pro His Gln Leu His Leu Glu Glu Leu Glu Ala Ile Leu His Gln Gln
420 425 430
Ala Lys Tyr Tyr Pro Phe Leu Lys Glu Asn Tyr Asp Lys Ile Lys Ser
435 440 445
Leu Val Thr Phe Arg Ile Pro Tyr Phe Val Gly Pro Leu Ala Asn Gly
450 455 460
Gln Ser Glu Phe Ala Trp Leu Thr Arg Lys Ala Asp Gly Glu Ile Arg
465 470 475 480
Pro Trp Asn Ile Glu Glu Lys Val Asp Phe Gly Lys Ser Ala Val Asp
485 490 495
Phe Ile Glu Lys Met Thr Asn Lys Asp Thr Tyr Leu Pro Lys Glu Asn
500 505 510
Val Leu Pro Lys His Ser Leu Cys Tyr Gln Lys Tyr Leu Val Tyr Asn
515 520 525
Glu Leu Thr Lys Val Arg Tyr Ile Asn Asp Gln Gly Lys Thr Ser Tyr
530 535 540
Phe Ser Gly Gln Glu Lys Glu Gln Ile Phe Asn Asp Leu Phe Lys Gln
545 550 555 560
Lys Arg Lys Val Lys Lys Lys Asp Leu Glu Leu Phe Leu Arg Asn Met
565 570 575
Ser His Val Glu Ser Pro Thr Ile Glu Gly Leu Glu Asp Ser Phe Asn
580 585 590
Ser Ser Tyr Ser Thr Tyr His Asp Leu Leu Lys Val Gly Ile Lys Gln
595 600 605
Glu Ile Leu Asp Asn Pro Val Asn Thr Glu Met Leu Glu Asn Ile Val
610 615 620
Lys Ile Leu Thr Val Phe Glu Asp Lys Arg Met Ile Lys Glu Gln Leu
625 630 635 640
Gln Gln Phe Ser Asp Val Leu Asp Gly Val Val Leu Lys Lys Leu Glu
645 650 655
Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Met
660 665 670
Gly Ile Arg Asp Lys Gln Ser His Leu Thr Ile Leu Asp Tyr Leu Met
675 680 685
Asn Asp Asp Gly Leu Asn Arg Asn Leu Met Gln Leu Ile Asn Asp Ser
690 695 700
Asn Leu Ser Phe Lys Ser Ile Ile Glu Lys Glu Gln Val Thr Thr Ala
705 710 715 720
Asp Lys Asp Ile Gln Ser Ile Val Ala Asp Leu Ala Gly Ser Pro Ala
725 730 735
Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val
740 745 750
Ser Val Met Gly Tyr Pro Pro Gln Thr Ile Val Val Glu Met Ala Arg
755 760 765
Glu Asn Gln Thr Thr Gly Lys Gly Lys Asn Asn Ser Arg Pro Arg Tyr
770 775 780
Lys Ser Leu Glu Lys Ala Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys
785 790 795 800
Glu His Pro Thr Asp Asn Gln Glu Leu Arg Asn Asn Arg Leu Tyr Leu
805 810 815
Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Gln Asp Leu Asp
820 825 830
Ile His Asn Leu Ser Asn Tyr Asp Ile Asp His Ile Val Pro Gln Ser
835 840 845
Phe Ile Thr Asp Asn Ser Ile Asp Asn Leu Val Leu Thr Ser Ser Ala
850 855 860
Gly Asn Arg Glu Lys Gly Asp Asp Val Pro Pro Leu Glu Ile Val Arg
865 870 875 880
Lys Arg Lys Val Phe Trp Glu Lys Leu Tyr Gln Gly Asn Leu Met Ser
885 890 895
Lys Arg Lys Phe Asp Tyr Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr
900 905 910
Glu Ala Asp Lys Ala Arg Phe Ile His Arg Gln Leu Val Glu Thr Arg
915 920 925
Gln Ile Thr Lys Asn Val Ala Asn Ile Leu His Gln Arg Phe Asn Tyr
930 935 940
Glu Lys Asp Asp His Gly Asn Thr Met Lys Gln Val Arg Ile Val Thr
945 950 955 960
Leu Lys Ser Ala Leu Val Ser Gln Phe Arg Lys Gln Phe Gln Leu Tyr
965 970 975
Lys Val Arg Asp Val Asn Asp Tyr His His Ala His Asp Ala Tyr Leu
980 985 990
Asn Gly Val Val Ala Asn Thr Leu Leu Lys Val Tyr Pro Gln Leu Glu
995 1000 1005
Pro Glu Phe Val Tyr Gly Asp Tyr His Gln Phe Asp Trp Phe Lys
1010 1015 1020
Ala Asn Lys Ala Thr Ala Lys Lys Gln Phe Tyr Thr Asn Ile Met
1025 1030 1035
Leu Phe Phe Ala Gln Lys Asp Arg Ile Ile Asp Glu Asn Gly Glu
1040 1045 1050
Ile Leu Trp Asp Lys Lys Tyr Leu Asp Thr Val Lys Lys Val Met
1055 1060 1065
Ser Tyr Arg Gln Met Asn Ile Val Lys Lys Thr Glu Ile Gln Lys
1070 1075 1080
Gly Glu Phe Ser Lys Ala Thr Ile Lys Pro Lys Gly Asn Ser Ser
1085 1090 1095
Lys Leu Ile Pro Arg Lys Thr Asn Trp Asp Pro Met Lys Tyr Gly
1100 1105 1110
Gly Leu Asp Ser Pro Asn Met Ala Tyr Ala Val Val Ile Glu Tyr
1115 1120 1125
Ala Lys Gly Lys Asn Lys Leu Val Phe Glu Lys Lys Ile Ile Arg
1130 1135 1140
Val Thr Ile Met Glu Arg Lys Ala Phe Glu Lys Asp Glu Lys Ala
1145 1150 1155
Phe Leu Glu Glu Gln Gly Tyr Arg Gln Pro Lys Val Leu Ala Lys
1160 1165 1170
Leu Pro Lys Tyr Thr Leu Tyr Glu Cys Glu Glu Gly Arg Arg Arg
1175 1180 1185
Met Leu Ala Ser Ala Asn Glu Ala Gln Lys Gly Asn Gln Gln Val
1190 1195 1200
Leu Pro Asn His Leu Val Thr Leu Leu His His Ala Ala Asn Cys
1205 1210 1215
Glu Val Ser Asp Gly Lys Ser Leu Asp Tyr Ile Glu Ser Asn Arg
1220 1225 1230
Glu Met Phe Ala Glu Leu Leu Ala His Val Ser Glu Phe Ala Lys
1235 1240 1245
Arg Tyr Thr Leu Ala Glu Ala Asn Leu Asn Lys Ile Asn Gln Leu
1250 1255 1260
Phe Glu Gln Asn Lys Glu Gly Asp Ile Lys Ala Ile Ala Gln Ser
1265 1270 1275
Phe Val Asp Leu Met Ala Phe Asn Ala Met Gly Ala Pro Ala Ser
1280 1285 1290
Phe Lys Phe Phe Glu Thr Thr Ile Glu Arg Lys Arg Tyr Asn Asn
1295 1300 1305
Leu Lys Glu Leu Leu Asn Ser Thr Ile Ile Tyr Gln Ser Ile Thr
1310 1315 1320
Gly Leu Tyr Glu Ser Arg Lys Arg Leu Asp Asp
1325 1330
<210> 6
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<400> 6
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 7
<211> 3159
<212> DNA
<213> Staphylococcus aureus
<400> 7
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 8
<211> 3159
<212> DNA
<213> Staphylococcus aureus
<400> 8
atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg ctacggcatc 60
atcgactacg agacacggga cgtgatcgat gccggcgtgc ggctgttcaa agaggccaac 120
gtggaaaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa gcggcggagg 180
cggcatagaa tccagagagt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240
agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag ccagaagctg 300
agcgaggaag agttctctgc cgccctgctg cacctggcca agagaagagg cgtgcacaac 360
gtgaacgagg tggaagagga caccggcaac gagctgtcca ccaaagagca gatcagccgg 420
aacagcaagg ccctggaaga gaaatacgtg gccgaactgc agctggaacg gctgaagaaa 480
gacggcgaag tgcggggcag catcaacaga ttcaagacca gcgactacgt gaaagaagcc 540
aaacagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600
tacatcgacc tgctggaaac ccggcggacc tactatgagg gacctggcga gggcagcccc 660
ttcggctgga aggacatcaa agaatggtac gagatgctga tgggccactg cacctacttc 720
cccgaggaac tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780
gacctgaaca atctcgtgat caccagggac gagaacgaga agctggaata ttacgagaag 840
ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900
aaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag caccggcaag 960
cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acattaccgc ccggaaagag 1020
attattgaga acgccgagct gctggatcag attgccaaga tcctgaccat ctaccagagc 1080
agcgaggaca tccaggaaga actgaccaat ctgaactccg agctgaccca ggaagagatc 1140
gagcagatct ctaatctgaa gggctatacc ggcacccaca acctgagcct gaaggccatc 1200
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctat cttcaaccgg 1260
ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aagagatccc caccaccctg 1320
gtggacgact tcatcctgag ccccgtcgtg aagagaagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcattatcga gctggcccgc 1440
gagaagaact ccaaggacgc ccagaaaatg atcaacgaga tgcagaagcg gaaccggcag 1500
accaacgagc ggatcgagga aatcatccgg accaccggca aagagaacgc caagtacctg 1560
atcgagaaga tcaagctgca cgacatgcag gaaggcaagt gcctgtacag cctggaagcc 1620
atccctctgg aagatctgct gaacaacccc ttcaactatg aggtggacca catcatcccc 1680
agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaac 1740
agcaagaagg gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc 1800
tacgaaacct tcaagaagca catcctgaat ctggccaagg gcaagggcag aatcagcaag 1860
accaagaaag agtatctgct ggaagaacgg gacatcaaca ggttctccgt gcagaaagac 1920
ttcatcaacc ggaacctggt ggataccaga tacgccacca gaggcctgat gaacctgctg 1980
cggagctact tcagagtgaa caacctggac gtgaaagtga agtccatcaa tggcggcttc 2040
accagctttc tgcggcggaa gtggaagttt aagaaagagc ggaacaaggg gtacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga gtggaagaaa 2160
ctggacaagg ccaaaaaagt gatggaaaac cagatgttcg aggaaaagca ggccgagagc 2220
atgcccgaga tcgaaaccga gcaggagtac aaagagatct tcatcacccc ccaccagatc 2280
aagcacatta aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcctaat 2340
agagagctga ttaacgacac cctgtactcc acccggaagg acgacaaggg caacaccctg 2400
atcgtgaaca atctgaacgg cctgtacgac aaggacaatg acaagctgaa aaagctgatc 2460
aacaagagcc ccgaaaagct gctgatgtac caccacgacc cccagaccta ccagaaactg 2520
aagctgatta tggaacagta cggcgacgag aagaatcccc tgtacaagta ctacgaggaa 2580
accgggaact acctgaccaa gtactccaaa aaggacaacg gccccgtgat caagaagatt 2640
aagtattacg gcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc 2700
agaaacaagg tcgtgaagct gtccctgaag ccctacagat tcgacgtgta cctggacaat 2760
ggcgtgtaca agttcgtgac cgtgaagaat ctggatgtga tcaaaaaaga aaactactac 2820
gaagtgaata gcaagtgcta tgaggaagct aagaagctga agaagatcag caaccaggcc 2880
gagtttatcg cctccttcta caacaacgat ctgatcaaga tcaacggcga gctgtataga 2940
gtgatcggcg tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacc 3000
taccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat taagacaatc 3060
gcctccaaga cccagagcat taagaagtac agcacagaca ttctgggcaa cctgtatgaa 3120
gtgaaatcta agaagcaccc tcagatcatc aaaaagggc 3159
<210> 9
<211> 3159
<212> DNA
<213> Staphylococcus aureus
<400> 9
atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg atacggcatc 60
atcgattacg aaactaggga tgtgatcgac gctggagtca ggctgttcaa agaggcgaac 120
gtggagaaca acgaggggcg gcgctcaaag aggggggccc gccggctgaa gcgccgccgc 180
agacatagaa tccagcgcgt gaagaagctg ctgttcgact acaaccttct gaccgaccac 240
tccgaacttt ccggcatcaa cccatatgag gctagagtga agggattgtc ccaaaagctg 300
tccgaggaag agttctccgc cgcgttgctc cacctcgcca agcgcagggg agtgcacaat 360
gtgaacgaag tggaagaaga taccggaaac gagctgtcca ccaaggagca gatcagccgg 420
aactccaagg ccctggaaga gaaatacgtg gcggaactgc aactggagcg gctgaagaaa 480
gacggagaag tgcgcggctc gatcaaccgc ttcaagacct cggactacgt gaaggaggcc 540
aagcagctcc tgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc 600
tacatcgatc tgctcgagac tcggcggact tactacgagg gtccagggga gggctcccca 660
tttggttgga aggatattaa ggagtggtac gaaatgctga tgggacactg cacatacttc 720
cctgaggagc tgcggagcgt gaaatacgca tacaacgcag acctgtacaa cgcgctgaac 780
gacctgaaca atctcgtgat cacccgggac gagaacgaaa agctcgagta ttacgaaaag 840
ttccagatta ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgcc 900
aaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc aacgggaaag 960
ccggagttca ccaatctgaa ggtctaccac gacatcaaag acattaccgc ccggaaggag 1020
atcattgaga acgcggagct gttggaccag attgcgaaga ttctgaccat ctaccaatcc 1080
tccgaggata ttcaggaaga actcaccaac ctcaacagcg aactgaccca ggaggagata 1140
gagcaaatct ccaacctgaa gggctacacc ggaactcata acctgagcct gaaggccatc 1200
aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctat tttcaatcgg 1260
ctgaagctgg tccccaagaa agtggacctc tcacaacaaa aggagatccc tactaccctt 1320
gtggacgatt tcattctgtc ccccgtggtc aagagaagct tcatacagtc aatcaaagtg 1380
atcaatgcca ttatcaagaa atacggtctg cccaacgaca ttatcattga gctcgcccgc 1440
gagaagaact cgaaggacgc ccagaagatg attaacgaaa tgcagaagag gaaccgacag 1500
actaacgaac ggatcgaaga aatcatccgg accaccggga aggaaaacgc gaagtacctg 1560
atcgaaaaga tcaagctcca tgacatgcag gaaggaaagt gtctgtactc gctggaggcc 1620
attccgctgg aggacttgct gaacaaccct tttaactacg aagtggatca tatcattccg 1680
aggagcgtgt cattcgacaa ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaac 1740
tcgaagaagg gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc 1800
tacgaaacct tcaagaagca catcctcaac ctggcaaagg ggaagggtcg catctccaag 1860
accaagaagg aatatctgct ggaagaaaga gacatcaaca gattctccgt gcaaaaggac 1920
ttcatcaacc gcaacctcgt ggatactaga tacgctactc ggggtctgat gaacctcctg 1980
agaagctact ttagagtgaa caatctggac gtgaaggtca agtcgattaa cggaggtttc 2040
acctccttcc tgcggcgcaa gtggaagttc aagaaggaac ggaacaaggg ctacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga atggaagaaa 2160
cttgacaagg ctaagaaggt catggaaaac cagatgttcg aagaaaagca ggccgagtct 2220
atgcctgaaa tcgagactga acaggagtac aaggaaatct ttattacgcc acaccagatc 2280
aaacacatca aggatttcaa ggattacaag tactcacatc gcgtggacaa aaagccgaac 2340
agggaactga tcaacgacac cctctactcc acccggaagg atgacaaagg gaataccctc 2400
atcgtcaaca accttaacgg cctgtacgac aaggacaacg ataagctgaa gaagctcatt 2460
aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc ctcagactta ccagaagctc 2520
aagctgatca tggagcagta tggggacgag aaaaacccgt tgtacaagta ctacgaagaa 2580
actgggaatt atctgactaa gtactccaag aaagataacg gccccgtgat taagaagatt 2640
aagtactacg gcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc 2700
cgcaacaagg tcgtcaagct gagcctcaag ccctaccggt ttgatgtgta ccttgacaat 2760
ggagtgtaca agttcgtgac tgtgaagaac cttgacgtga tcaagaagga gaactactac 2820
gaagtcaact ccaagtgcta cgaggaagca aagaagttga agaagatctc gaaccaggcc 2880
gagttcattg cctccttcta taacaacgac ctgattaaga tcaacggcga actgtaccgc 2940
gtcattggcg tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcact 3000
taccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat taagactatc 3060
gcctcaaaga cccagtcgat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120
gtcaaatcga agaagcaccc ccagatcatc aagaaggga 3159
<210> 10
<211> 3159
<212> DNA
<213> Staphylococcus aureus
<400> 10
atgaaaagga actacattct ggggctggcc atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 11
<211> 3159
<212> DNA
<213> Staphylococcus aureus
<400> 11
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagaggcc 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 12
<211> 1082
<212> PRT
<213> Neisseria meningitidis
<400> 12
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 13
<211> 3249
<212> DNA
<213> Neisseria meningitidis
<220>
<221> misc_feature
<222> (1)..(3249)
<223> Exemplary codon optimized Cas9
<400> 13
atggccgcct tcaagcccaa ccccatcaac tacatcctgg gcctggacat cggcatcgcc 60
agcgtgggct gggccatggt ggagatcgac gaggacgaga accccatctg cctgatcgac 120
ctgggtgtgc gcgtgttcga gcgcgctgag gtgcccaaga ctggtgacag tctggctatg 180
gctcgccggc ttgctcgctc tgttcggcgc cttactcgcc ggcgcgctca ccgccttctg 240
cgcgctcgcc gcctgctgaa gcgcgagggt gtgctgcagg ctgccgactt cgacgagaac 300
ggcctgatca agagcctgcc caacactcct tggcagctgc gcgctgccgc tctggaccgc 360
aagctgactc ctctggagtg gagcgccgtg ctgctgcacc tgatcaagca ccgcggctac 420
ctgagccagc gcaagaacga gggcgagacc gccgacaagg agctgggtgc tctgctgaag 480
ggcgtggccg acaacgccca cgccctgcag actggtgact tccgcactcc tgctgagctg 540
gccctgaaca agttcgagaa ggagagcggc cacatccgca accagcgcgg cgactacagc 600
cacaccttca gccgcaagga cctgcaggcc gagctgatcc tgctgttcga gaagcagaag 660
gagttcggca acccccacgt gagcggcggc ctgaaggagg gcatcgagac cctgctgatg 720
acccagcgcc ccgccctgag cggcgacgcc gtgcagaaga tgctgggcca ctgcaccttc 780
gagccagccg agcccaaggc cgccaagaac acctacaccg ccgagcgctt catctggctg 840
accaagctga acaacctgcg catcctggag cagggcagcg agcgccccct gaccgacacc 900
gagcgcgcca ccctgatgga cgagccctac cgcaagagca agctgaccta cgcccaggcc 960
cgcaagctgc tgggtctgga ggacaccgcc ttcttcaagg gcctgcgcta cggcaaggac 1020
aacgccgagg ccagcaccct gatggagatg aaggcctacc acgccatcag ccgcgccctg 1080
gagaaggagg gcctgaagga caagaagagt cctctgaacc tgagccccga gctgcaggac 1140
gagatcggca ccgccttcag cctgttcaag accgacgagg acatcaccgg ccgcctgaag 1200
gaccgcatcc agcccgagat cctggaggcc ctgctgaagc acatcagctt cgacaagttc 1260
gtgcagatca gcctgaaggc cctgcgccgc atcgtgcccc tgatggagca gggcaagcgc 1320
tacgacgagg cctgcgccga gatctacggc gaccactacg gcaagaagaa caccgaggag 1380
aagatctacc tgcctcctat ccccgccgac gagatccgca accccgtggt gctgcgcgcc 1440
ctgagccagg cccgcaaggt gatcaacggc gtggtgcgcc gctacggcag ccccgcccgc 1500
atccacatcg agaccgcccg cgaggtgggc aagagcttca aggaccgcaa ggagatcgag 1560
aagcgccagg aggagaaccg caaggaccgc gagaaggccg ccgccaagtt ccgcgagtac 1620
ttccccaact tcgtgggcga gcccaagagc aaggacatcc tgaagctgcg cctgtacgag 1680
cagcagcacg gcaagtgcct gtacagcggc aaggagatca acctgggccg cctgaacgag 1740
aagggctacg tggagatcga ccacgccctg cccttcagcc gcacctggga cgacagcttc 1800
aacaacaagg tgctggtgct gggcagcgag aaccagaaca agggcaacca gaccccctac 1860
gagtacttca acggcaagga caacagccgc gagtggcagg agttcaaggc ccgcgtggag 1920
accagccgct tcccccgcag caagaagcag cgcatcctgc tgcagaagtt cgacgaggac 1980
ggcttcaagg agcgcaacct gaacgacacc cgctacgtga accgcttcct gtgccagttc 2040
gtggccgacc gcatgcgcct gaccggcaag ggcaagaagc gcgtgttcgc cagcaacggc 2100
cagatcacca acctgctgcg cggcttctgg ggcctgcgca aggtgcgcgc cgagaacgac 2160
cgccaccacg ccctggacgc cgtggtggtg gcctgcagca ccgtggccat gcagcagaag 2220
atcacccgct tcgtgcgcta caaggagatg aacgccttcg acggtaaaac catcgacaag 2280
gagaccggcg aggtgctgca ccagaagacc cacttccccc agccctggga gttcttcgcc 2340
caggaggtga tgatccgcgt gttcggcaag cccgacggca agcccgagtt cgaggaggcc 2400
gacacccccg agaagctgcg caccctgctg gccgagaagc tgagcagccg ccctgaggcc 2460
gtgcacgagt acgtgactcc tctgttcgtg agccgcgccc ccaaccgcaa gatgagcggt 2520
cagggtcaca tggagaccgt gaagagcgcc aagcgcctgg acgagggcgt gagcgtgctg 2580
cgcgtgcccc tgacccagct gaagctgaag gacctggaga agatggtgaa ccgcgagcgc 2640
gagcccaagc tgtacgaggc cctgaaggcc cgcctggagg cccacaagga cgaccccgcc 2700
aaggccttcg ccgagccctt ctacaagtac gacaaggccg gcaaccgcac ccagcaggtg 2760
aaggccgtgc gcgtggagca ggtgcagaag accggcgtgt gggtgcgcaa ccacaacggc 2820
atcgccgaca acgccaccat ggtgcgcgtg gacgtgttcg agaagggcga caagtactac 2880
ctggtgccca tctacagctg gcaggtggcc aagggcatcc tgcccgaccg cgccgtggtg 2940
cagggcaagg acgaggagga ctggcagctg atcgacgaca gcttcaactt caagttcagc 3000
ctgcacccca acgacctggt ggaggtgatc accaagaagg cccgcatgtt cggctacttc 3060
gccagctgcc accgcggcac cggcaacatc aacatccgca tccacgacct ggaccacaag 3120
atcggcaaga acggcatcct ggagggcatc ggcgtgaaga ccgccctgag cttccagaag 3180
taccagatcg acgagctggg caaggagatc cgcccctgcc gcctgaagaa gcgccctcct 3240
gtgcgctaa 3249
<210> 14
<211> 859
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Cas9 consensus sequence derived from Sm, Sp, St, and Li
Cas9 sequences
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(18)
<223> N-terminal RuvC-like domain
<220>
<221> misc_feature
<222> (21)..(21)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (23)..(23)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (24)..(24)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (26)..(26)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (29)..(31)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (33)..(33)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (36)..(36)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (45)..(45)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (54)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (63)..(63)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (71)..(71)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (75)..(75)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (76)..(76)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (78)..(80)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (82)..(82)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (84)..(84)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (85)..(85)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (89)..(89)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (90)..(90)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (98)..(98)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (100)..(100)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (106)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (113)..(113)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (116)..(116)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (125)..(125)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (126)..(126)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (128)..(133)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (135)..(135)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (137)..(137)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (139)..(147)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (153)..(155)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (157)..(157)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (159)..(159)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (161)..(161)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (163)..(163)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (166)..(168)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (170)..(170)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (171)..(171)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (173)..(175)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (177)..(177)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (183)..(183)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (185)..(187)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (189)..(189)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (192)..(195)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (198)..(198)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (199)..(199)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (202)..(202)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (206)..(206)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (207)..(207)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (210)..(210)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (212)..(212)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (213)..(213)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (219)..(219)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (220)..(220)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (222)..(222)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (224)..(224)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (226)..(226)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (236)..(236)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (240)..(240)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (241)..(241)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (244)..(246)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (248)..(248)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (249)..(249)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (250)..(250)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (252)..(254)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (256)..(256)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (257)..(257)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (268)..(268)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (271)..(271)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (273)..(273)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (277)..(277)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (280)..(280)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (281)..(281)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (283)..(283)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (289)..(289)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (290)..(290)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (292)..(294)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (301)..(301)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (308)..(308)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (319)..(322)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (328)..(328)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (329)..(329)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (335)..(337)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (346)..(346)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (347)..(347)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (356)..(361)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (363)..(363)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (370)..(373)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (375)..(375)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (376)..(376)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (379)..(379)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (386)..(390)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (393)..(393)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (395)..(395)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (396)..(396)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (398)..(398)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (400)..(400)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (403)..(403)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (407)..(407)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (410)..(410)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (411)..(411)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (413)..(416)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (418)..(418)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (422)..(422)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (428)..(428)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (431)..(431)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (433)..(433)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (437)..(439)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (445)..(445)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (451)..(451)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (456)..(456)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (459)..(459)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (465)..(469)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (481)..(481)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (482)..(482)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (484)..(484)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (490)..(490)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (494)..(494)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (495)..(502)
<223> RuvC-like domain
<220>
<221> misc_feature
<222> (497)..(497)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (506)..(506)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (510)..(510)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (513)..(513)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (514)..(514)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (517)..(517)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (520)..(520)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (525)..(525)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (526)..(526)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (529)..(529)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (531)..(531)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (532)..(532)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (534)..(534)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (542)..(542)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (546)..(546)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (547)..(547)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (553)..(553)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (555)..(575)
<223> HNH-like domain
<220>
<221> misc_feature
<222> (556)..(556)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (560)..(560)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (563)..(563)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (565)..(565)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (567)..(567)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (579)..(579)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (582)..(582)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (583)..(583)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (585)..(585)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (588)..(588)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (590)..(590)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (592)..(592)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (594)..(596)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (610)..(610)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (616)..(616)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (628)..(628)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (631)..(631)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (633)..(633)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (634)..(634)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (636)..(636)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (638)..(641)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (643)..(645)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (653)..(653)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (657)..(657)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (659)..(659)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (660)..(660)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (665)..(665)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (666)..(666)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (668)..(668)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (669)..(669)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (670)..(677)
<223> RuvC-like domain
<220>
<221> misc_feature
<222> (680)..(680)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (681)..(681)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (683)..(683)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (686)..(686)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (696)..(696)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (697)..(697)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (704)..(704)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (708)..(708)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (710)..(710)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (711)..(711)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (714)..(714)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (717)..(720)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (722)..(722)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (725)..(725)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (727)..(727)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (733)..(735)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (740)..(740)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (742)..(742)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (749)..(754)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (758)..(761)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (763)..(768)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (771)..(771)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (774)..(777)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (782)..(782)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (784)..(786)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (788)..(788)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (790)..(790)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (795)..(795)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (799)..(799)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (801)..(801)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (802)..(802)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (804)..(804)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (806)..(813)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (815)..(818)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (820)..(820)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (823)..(827)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (829)..(829)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (830)..(830)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (832)..(832)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (835)..(837)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (842)..(844)
<223> Each Xaa can independently be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (846)..(846)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (848)..(848)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (851)..(851)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (857)..(857)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (857)..(857)
<223> Xaa can be any naturally occurring amino acid
<400> 14
Met Lys Tyr Xaa Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly Trp
1 5 10 15
Ala Val Thr Asp Xaa Tyr Xaa Xaa Lys Xaa Lys Gly Xaa Xaa Xaa Ile
20 25 30
Xaa Lys Asn Xaa Gly Leu Phe Asp Gly Thr Ala Arg Xaa Arg Thr Ala
35 40 45
Arg Arg Arg Arg Arg Xaa Asn Arg Ile Tyr Leu Gln Ile Phe Xaa Glu
50 55 60
Met Asp Phe Phe Arg Leu Xaa Ser Phe Val Xaa Xaa Lys Xaa Xaa Xaa
65 70 75 80
Pro Xaa Phe Xaa Xaa Glu Tyr His Xaa Xaa Pro Thr Ile Tyr His Leu
85 90 95
Arg Xaa Leu Xaa Lys Asp Leu Arg Leu Xaa Tyr Leu Ala Leu Ala His
100 105 110
Xaa Ile Lys Xaa Arg Gly Asn Phe Leu Ile Glu Gly Xaa Xaa Asn Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Tyr Xaa Phe Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Pro Glu Lys Gly Phe Xaa Xaa Xaa Leu Xaa Gly Xaa Phe
145 150 155 160
Xaa Phe Xaa Leu Glu Xaa Xaa Xaa Lys Xaa Xaa Tyr Xaa Xaa Xaa Leu
165 170 175
Xaa Leu Leu Ile Gly Asp Xaa Tyr Xaa Xaa Xaa Phe Xaa Ala Lys Xaa
180 185 190
Xaa Xaa Xaa Leu Ser Xaa Xaa Val Thr Xaa Ala Leu Ser Xaa Xaa Met
195 200 205
Ile Xaa Arg Xaa Xaa His Asp Leu Leu Lys Xaa Xaa Tyr Xaa Glu Xaa
210 215 220
Phe Xaa Lys Gly Tyr Ala Gly Tyr Ile Asp Gly Xaa Gln Phe Tyr Xaa
225 230 235 240
Xaa Lys Leu Xaa Xaa Xaa Gly Xaa Xaa Xaa Lys Xaa Xaa Xaa Glu Xaa
245 250 255
Xaa Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Xaa Ile Pro Xaa Gln
260 265 270
Xaa His Leu Glu Xaa Ala Ile Xaa Xaa Gln Xaa Tyr Pro Phe Leu Asn
275 280 285
Xaa Xaa Ile Xaa Xaa Xaa Thr Phe Arg Ile Pro Tyr Xaa Val Gly Pro
290 295 300
Leu Ala Gly Xaa Ser Phe Ala Trp Arg Lys Ile Pro Trp Asn Xaa Xaa
305 310 315 320
Xaa Xaa Asp Ser Ala Phe Ile Xaa Xaa Met Thr Asp Leu Pro Xaa Xaa
325 330 335
Xaa Val Leu Pro Lys His Ser Leu Tyr Xaa Xaa Val Tyr Asn Glu Leu
340 345 350
Thr Lys Val Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa Ile Phe Lys Arg Lys
355 360 365
Val Xaa Xaa Xaa Xaa Gly Xaa Xaa Phe Asn Xaa Ser Thr Tyr His Asp
370 375 380
Leu Xaa Xaa Xaa Xaa Xaa Leu Asp Xaa Asn Xaa Xaa Glu Xaa Ile Xaa
385 390 395 400
Leu Thr Xaa Phe Glu Asp Xaa Met Ile Xaa Xaa Leu Xaa Xaa Xaa Xaa
405 410 415
Lys Xaa Leu Arg Arg Xaa Tyr Thr Gly Trp Gly Xaa Leu Ser Xaa Leu
420 425 430
Xaa Gly Ile Arg Xaa Xaa Xaa Ser Thr Ile Leu Asp Xaa Leu Asp Asn
435 440 445
Arg Asn Xaa Met Gln Leu Ile Xaa Asp Leu Xaa Phe Lys Ile Lys Gln
450 455 460
Xaa Xaa Xaa Xaa Xaa Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
465 470 475 480
Xaa Xaa Lys Xaa Val Asp Glu Leu Val Xaa Met Gly Pro Xaa Ile Val
485 490 495
Xaa Glu Met Ala Arg Glu Asn Gln Thr Xaa Gly Asn Ser Xaa Arg Lys
500 505 510
Xaa Xaa Lys Glu Xaa Gly Ser Xaa Ile Leu Lys Glu Xaa Xaa Asn Leu
515 520 525
Xaa Asn Xaa Xaa Leu Xaa Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met
530 535 540
Tyr Xaa Xaa Leu Asp Ile Leu Ser Xaa Tyr Asp Xaa Asp His Ile Xaa
545 550 555 560
Pro Gln Xaa Phe Xaa Asp Xaa Ser Ile Asp Asn Val Leu Ser Asn Arg
565 570 575
Lys Asp Xaa Val Pro Xaa Xaa Val Xaa Lys Lys Xaa Trp Xaa Leu Xaa
580 585 590
Leu Xaa Xaa Xaa Arg Lys Phe Asp Leu Thr Lys Ala Glu Arg Gly Gly
595 600 605
Leu Xaa Asp Lys Ala Phe Ile Xaa Arg Gln Leu Val Glu Thr Arg Gln
610 615 620
Ile Thr Lys Xaa Val Ala Xaa Leu Xaa Xaa Asn Xaa Asp Xaa Xaa Xaa
625 630 635 640
Xaa Val Xaa Xaa Xaa Thr Leu Lys Ser Leu Val Ser Xaa Phe Arg Lys
645 650 655
Xaa Phe Xaa Xaa Leu Tyr Lys Val Xaa Xaa Asn Xaa Xaa His His Ala
660 665 670
His Asp Ala Tyr Leu Asn Val Xaa Xaa Leu Xaa Tyr Pro Xaa Leu Glu
675 680 685
Glu Phe Val Tyr Gly Asp Tyr Xaa Xaa Lys Ala Thr Lys Phe Tyr Xaa
690 695 700
Asn Ile Met Xaa Phe Xaa Xaa Gly Glu Xaa Trp Lys Xaa Xaa Xaa Xaa
705 710 715 720
Val Xaa Met Gln Xaa Asn Xaa Val Lys Lys Glu Gln Xaa Xaa Xaa Pro
725 730 735
Lys Asn Ser Xaa Leu Xaa Lys Asp Lys Tyr Gly Gly Xaa Xaa Xaa Xaa
740 745 750
Xaa Xaa Lys Gly Lys Xaa Xaa Xaa Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa
755 760 765
Phe Leu Xaa Gly Tyr Xaa Xaa Xaa Xaa Leu Pro Lys Tyr Xaa Leu Xaa
770 775 780
Xaa Xaa Gly Xaa Arg Xaa Leu Ala Ser Glu Xaa Lys Gly Asn Xaa Leu
785 790 795 800
Xaa Xaa Leu Xaa Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Xaa Xaa
805 810 815
Xaa Xaa Phe Xaa Ala Asn Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Gly Xaa
820 825 830
Ala Phe Xaa Xaa Xaa Ile Arg Arg Tyr Xaa Xaa Xaa Thr Xaa Ile Xaa
835 840 845
Gln Ser Xaa Thr Gly Leu Tyr Glu Xaa Arg Leu
850 855
<210> 15
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> RuvC-like domain
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Val or His
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa is Ile, Leu, or Val
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Met or Thr
<400> 15
Ile Xaa Xaa Glu Xaa Ala Arg Glu
1 5
<210> 16
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> RuvC-like domain
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa is Ile, Leu, or Val
<400> 16
Ile Val Xaa Glu Met Ala Arg Glu
1 5
<210> 17
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> RuvC-like domain
<220>
<221> VARIANT
<222> (4)..(4)
<223> Xaa is His or Leu
<220>
<221> VARIANT
<222> (7)..(7)
<223> Xaa is Arg or Val
<220>
<221> VARIANT
<222> (8)..(8)
<223> Xaa is Glu or Val
<400> 17
His His Ala Xaa Asp Ala Xaa Xaa
1 5
<210> 18
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> RuvC-like domain
<400> 18
His His Ala His Asp Ala Tyr Leu
1 5
<210> 19
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal RuvC-like domain
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Lys or Pro
<220>
<221> VARIANT
<222> (4)..(4)
<223> Xaa is Val, Leu, Ile, or Phe
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Gly, Ala, or Ser
<220>
<221> VARIANT
<222> (6)..(6)
<223> Xaa is Leu, Ile, Val, or Phe
<220>
<221> MOD_RES
<222> (7)..(26)
<223> N-terminal RuvC-like domain, each Xaa can be any amino acid or
absent, region may encompass 5-20 residues
<220>
<221> VARIANT
<222> (29)..(29)
<223> Xaa is Asp, Glu, Asn, or Gln
<400> 19
Lys Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Asp Xaa Tyr
20 25 30
<210> 20
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal RuvC-like domain
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Ile, Val, Met, Leu, or Thr
<220>
<221> VARIANT
<222> (4)..(4)
<223> Xaa is Thr, Ile, Val, Ser, Asn, Tyr, Glu, or Leu
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Asn, Ser, Gly, Ala, Asp, Thr, Arg, Met, or Phe
<220>
<221> VARIANT
<222> (6)..(6)
<223> Xaa is Ser, Tyr, Asn, or Phe
<220>
<221> VARIANT
<222> (7)..(7)
<223> Xaa is Val, Ile, Leu, Cys, Thr, or Phe
<220>
<221> VARIANT
<222> (9)..(9)
<223> Xaa is Trp, Phe, Val, Tyr, Ser, or Leu
<220>
<221> VARIANT
<222> (10)..(10)
<223> Xaa is Ala, Ser, Cys, Val, or Gly
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Val, Ile, Leu, Ala, Met, or His
<220>
<221> VARIANT
<222> (12)..(12)
<223> Any amino acid or absent
<400> 20
Asp Xaa Gly Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
1 5 10
<210> 21
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal RuvC-like domain
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Ile, Val, Met, Leu, or Thr
<220>
<221> VARIANT
<222> (4)..(4)
<223> Xaa is Thr, Ile, Val, Ser, Asn, Tyr, Glu, or Leu
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Asn, Ser, Gly, Ala, Asp, Thr, Arg, Met, or Phe
<220>
<221> VARIANT
<222> (7)..(7)
<223> Xaa is Val, Ile, Leu, Cys, Thr, or Phe
<220>
<221> VARIANT
<222> (9)..(9)
<223> Xaa is Trp, Phe, Val, Tyr, Ser, or Leu
<220>
<221> VARIANT
<222> (10)..(10)
<223> Xaa is Ala, Ser, Cys, Val, or Gly
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Val, Ile, Leu, Ala, Met, or His
<220>
<221> VARIANT
<222> (12)..(12)
<223> Any amino acid or absent
<400> 21
Asp Xaa Gly Xaa Xaa Ser Xaa Gly Xaa Xaa Xaa Xaa
1 5 10
<210> 22
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal RuvC-like domain
<220>
<221> VARIANT
<222> (4)..(4)
<223> Xaa is Thr, Ile, Val, Ser, Asn, Tyr, Glu, or Leu
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Asn, Ser, Gly, Ala, Asp, Thr, Arg, Met, or Phe
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Val, Ile, Leu, Ala, Met, or His
<220>
<221> VARIANT
<222> (12)..(12)
<223> Any amino acid or absent
<400> 22
Asp Ile Gly Xaa Xaa Ser Val Gly Trp Ala Xaa Xaa
1 5 10
<210> 23
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal RuvC-like domain
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Any non-polar alkyl amino acid or a hydroxyl amino acid
<400> 23
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Xaa
1 5 10
<210> 24
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> HNH-like domain
<220>
<221> VARIANT
<222> (8)..(8)
<223> Xaa is Lys or Arg
<220>
<221> VARIANT
<222> (12)..(12)
<223> Xaa is Val or Thr
<220>
<221> VARIANT
<222> (13)..(13)
<223> Xaa is Gly or Asp
<220>
<221> VARIANT
<222> (14)..(14)
<223> Xaa is Glu, Gln, or Asp
<220>
<221> VARIANT
<222> (15)..(15)
<223> Xaa is Glu or Asp
<220>
<221> VARIANT
<222> (19)..(19)
<223> Xaa is Asp, Asn, or His
<220>
<221> VARIANT
<222> (20)..(20)
<223> Xaa is Tyr, Arg, or Asn
<220>
<221> VARIANT
<222> (23)..(23)
<223> Xaa is Gln, Asp, or Asn
<220>
<221> MOD_RES
<222> (25)..(64)
<223> HNH-like domain, each Xaa can be any amino acid or absent, region
may encompass 15-40 residues
<220>
<221> VARIANT
<222> (67)..(67)
<223> Xaa is Gly or Glu
<220>
<221> VARIANT
<222> (69)..(69)
<223> Xaa is Ser or Gly
<220>
<221> VARIANT
<222> (71)..(71)
<223> Xaa is Asp or Asn
<400> 24
Leu Tyr Tyr Leu Gln Asn Gly Xaa Asp Met Tyr Xaa Xaa Xaa Xaa Leu
1 5 10 15
Asp Ile Xaa Xaa Leu Ser Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Asn Arg Xaa Lys Xaa Asp Xaa Val Pro
65 70
<210> 25
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> HNH-like domain
<220>
<221> VARIANT
<222> (1)..(1)
<223> Xaa is Asp, Glu, Gln, or Asn
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Leu, Ile, Arg, Gln, Val, Met, or Lys
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa is Asp or Glu
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Ile, Val, Thr, Ala, or Leu
<220>
<221> VARIANT
<222> (6)..(6)
<223> Xaa is Val, Tyr, Ile, Leu, Phe, or Trp
<220>
<221> VARIANT
<222> (8)..(8)
<223> Xaa is Gln, His, Arg, Lys, Tyr, Ile, Leu, Phe, or Trp
<220>
<221> VARIANT
<222> (9)..(9)
<223> Xaa is Ser, Ala, Asp, Thr, or Lys
<220>
<221> VARIANT
<222> (10)..(10)
<223> Xaa is Phe, Leu, Val, Lys, Tyr, Met, Ile, Arg, Ala, Glu, Asp, or
Gln
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Leu, Arg, Thr, Ile, Val, Ser, Cys, Tyr, Lys, Phe, or Gly
<220>
<221> VARIANT
<222> (12)..(12)
<223> Xaa is Lys, Gln, Tyr, Thr, Phe, Leu, Trp, Met, Ala, Glu, Gly, or
Ser
<220>
<221> VARIANT
<222> (13)..(13)
<223> Xaa is Asp, Ser, Asn, Arg, Leu, or Thr
<220>
<221> VARIANT
<222> (14)..(14)
<223> Xaa is Asp, Asn, or Ser
<220>
<221> VARIANT
<222> (15)..(15)
<223> Xaa is Ser, Ala, Thr, Gly, or Arg
<220>
<221> VARIANT
<222> (16)..(16)
<223> Xaa is Ile, Leu, Phe, Ser, Arg, Tyr, Gln, Trp, Asp, Lys, or His
<220>
<221> VARIANT
<222> (17)..(17)
<223> Xaa is Asp, Ser, Ile, Asn, Glu, Ala, His, Phe, Leu, Gln, Met,
Gly, Tyr, or Val
<220>
<221> VARIANT
<222> (19)..(19)
<223> Xaa is Lys, Leu, Arg, Met, Thr, or Phe
<220>
<221> VARIANT
<222> (20)..(20)
<223> Xaa is Val, Leu, Ile, Ala, or Thr
<220>
<221> VARIANT
<222> (21)..(21)
<223> Xaa is Leu, Ile, Val, or Ala
<220>
<221> VARIANT
<222> (22)..(22)
<223> Xaa is Thr, Val, Cys, Glu, Ser, or Ala
<220>
<221> VARIANT
<222> (23)..(23)
<223> Xaa is Arg, Phe, Thr, Trp, Glu, Leu, Asn, Cys, Lys, Val, Ser,
Gln, Ile, Tyr, His, or Ala
<220>
<221> VARIANT
<222> (24)..(24)
<223> Xaa is Ser, Pro, Arg, Lys, Asn, Ala, His, Gln, Gly, or Leu
<220>
<221> VARIANT
<222> (25)..(25)
<223> Xaa is Asp, Gly, Thr, Asn, Ser, Lys, Ala, Ile, Glu, Leu, Gln,
Arg, or Tyr
<220>
<221> VARIANT
<222> (26)..(26)
<223> Xaa is Lys, Val, Ala, Glu, Tyr, Ile, Cys, Leu, Ser, Thr, Gly,
Lys, Met, Asp, or Phe
<400> 25
Xaa Xaa Xaa His Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asn
20 25
<210> 26
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> HNH-like domain
<220>
<221> VARIANT
<222> (1)..(1)
<223> Xaa is Asp or Glu
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Leu, Ile, Arg, Gln, Val, Met, or Lys
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa is Asp or Glu
<220>
<221> VARIANT
<222> (5)..(5)
<223> Xaa is Ile, Val, Thr, Ala, or Leu
<220>
<221> VARIANT
<222> (6)..(6)
<223> Xaa is Val, Tyr, Ile, Leu, Phe, or Trp
<220>
<221> VARIANT
<222> (8)..(8)
<223> Xaa is Gln, His, Arg, Lys, Tyr, Ile, Leu, Phe, or Trp
<220>
<221> VARIANT
<222> (10)..(10)
<223> Xaa is Phe, Leu, Val, Lys, Tyr, Met, Ile, Arg, Ala, Glu, Asp, or
Gln
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Leu, Arg, Thr, Ile, Val, Ser, Cys, Tyr, Lys, Phe, or Gly
<220>
<221> VARIANT
<222> (12)..(12)
<223> Xaa is Lys, Gln, Tyr, Thr, Phe, Leu, Trp, Met, Ala, Glu, Gly, or
Ser
<220>
<221> VARIANT
<222> (16)..(16)
<223> Xaa is Ile, Leu, Phe, Ser, Arg, Tyr, Gln, Trp, Asp, Lys, or His
<220>
<221> VARIANT
<222> (17)..(17)
<223> Xaa is Asp, Ser, Ile, Asn, Glu, Ala, His, Phe, Leu, Gln, Met,
Gly, Tyr, or Val
<220>
<221> VARIANT
<222> (22)..(22)
<223> Xaa is Thr, Val, Cys, Glu, Ser, or Ala
<220>
<221> VARIANT
<222> (23)..(23)
<223> Xaa is Arg, Phe, Thr, Trp, Glu, Leu, Asn, Cys, Lys, Val, Ser,
Gln, Ile, Tyr, His, or Ala
<220>
<221> VARIANT
<222> (24)..(24)
<223> Xaa is Ser, Pro, Arg, Lys, Asn, Ala, His, Gln, Gly, or Leu
<220>
<221> VARIANT
<222> (25)..(25)
<223> Xaa is Asp, Gly, Thr, Asn, Ser, Lys, Ala, Ile, Glu, Leu, Gln,
Arg, or Tyr
<220>
<221> VARIANT
<222> (26)..(26)
<223> Xaa is Lys, Val, Ala, Glu, Tyr, Ile, Cys, Leu, Ser, Thr, Gly,
Lys, Met, Asp, or Phe
<400> 26
Xaa Xaa Xaa His Xaa Xaa Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa
1 5 10 15
Xaa Asn Lys Val Leu Xaa Xaa Xaa Xaa Xaa Asn
20 25
<210> 27
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> HNH-like domain
<220>
<221> VARIANT
<222> (1)..(1)
<223> Xaa is Asp or Glu
<220>
<221> VARIANT
<222> (3)..(3)
<223> Xaa is Asp or Glu
<220>
<221> VARIANT
<222> (8)..(8)
<223> Xaa is Gln, His, Arg, Lys, Tyr, Ile, Leu, or Trp
<220>
<221> VARIANT
<222> (10)..(10)
<223> Xaa is Phe, Leu, Val, Lys, Tyr, Met, Ile, Arg, Ala, Glu, Asp, or
Gln
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Leu, Arg, Thr, Ile, Val, Ser, Cys, Tyr, Lys, Phe, or Gly
<220>
<221> VARIANT
<222> (12)..(12)
<223> Xaa is Lys, Gln, Tyr, Thr, Phe, Leu, Trp, Met, Ala, Glu, Gly, or
Ser
<220>
<221> VARIANT
<222> (16)..(16)
<223> Xaa is Ile, Leu, Phe, Ser, Arg, Tyr, Gln, Trp, Asp, Lys, or His
<220>
<221> VARIANT
<222> (17)..(17)
<223> Xaa is Asp, Ser, Ile, Asn, Glu, Ala, His, Phe, Leu, Gln, Met,
Gly, Tyr, or Val
<220>
<221> VARIANT
<222> (23)..(23)
<223> Xaa is Arg, Phe, Thr, Trp, Glu, Leu, Asn, Cys, Lys, Val, Ser,
Gln, Ile, Tyr, His, or Ala
<220>
<221> VARIANT
<222> (24)..(24)
<223> Xaa is Ser, Pro, Arg, Lys, Asn, Ala, His, Gln, Gly, or Leu
<220>
<221> VARIANT
<222> (25)..(25)
<223> Xaa is Asp, Gly, Thr, Asn, Ser, Lys, Ala, Ile, Glu, Leu, Gln,
Arg, or Tyr
<220>
<221> VARIANT
<222> (26)..(26)
<223> Xaa is Lys, Val, Ala, Glu, Tyr, Ile, Cys, Leu, Ser, Thr, Gly,
Lys, Met, Asp, or Phe
<400> 27
Xaa Val Xaa His Ile Val Pro Xaa Ser Xaa Xaa Xaa Asp Asp Ser Xaa
1 5 10 15
Xaa Asn Lys Val Leu Thr Xaa Xaa Xaa Xaa Asn
20 25
<210> 28
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> HNH-like domain
<220>
<221> VARIANT
<222> (2)..(2)
<223> Xaa is Ile or Val
<220>
<221> VARIANT
<222> (6)..(6)
<223> Xaa is Ile or Val
<220>
<221> VARIANT
<222> (9)..(9)
<223> Xaa is Ala or Ser
<220>
<221> VARIANT
<222> (11)..(11)
<223> Xaa is Ile or Leu
<220>
<221> VARIANT
<222> (12)..(12)
<223> Xaa is Lys or Thr
<220>
<221> VARIANT
<222> (14)..(14)
<223> Xaa is Asp or Asn
<220>
<221> VARIANT
<222> (19)..(19)
<223> Xaa is Arg, Lys, or Leu
<220>
<221> VARIANT
<222> (22)..(22)
<223> Xaa is Thr or Val
<220>
<221> VARIANT
<222> (23)..(23)
<223> Xaa is Ser or Arg
<220>
<221> VARIANT
<222> (25)..(25)
<223> Xaa is Lys, Asp, or Ala
<220>
<221> VARIANT
<222> (26)..(26)
<223> Xaa is Glu, Lys, Gly, or Asn
<400> 28
Asp Xaa Asp His Ile Xaa Pro Gln Xaa Phe Xaa Xaa Asp Xaa Ser Ile
1 5 10 15
Asp Asn Xaa Val Leu Xaa Xaa Ser Xaa Xaa Asn
20 25
<210> 29
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> targeting region
<220>
<221> misc_feature
<222> (21)..(42)
<223> first complementarity domain
<220>
<221> misc_feature
<222> (43)..(46)
<223> linking domain
<220>
<221> misc_feature
<222> (47)..(70)
<223> second complementarity domain
<400> 29
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 30
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> targeting region
<220>
<221> misc_feature
<222> (21)..(42)
<223> first complementarity domain
<220>
<221> misc_feature
<222> (43)..(46)
<223> linking domain
<220>
<221> misc_feature
<222> (47)..(70)
<223> second complementarity domain
<400> 30
nnnnnnnnnn nnnnnnnnnn guauuagagc uaugcuguau uggaaacaau acagcauagc 60
aaguuaauau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 116
<210> 31
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> targeting domain
<220>
<221> misc_feature
<222> (21)..(32)
<223> first complementarity domain
<220>
<221> misc_feature
<222> (33)..(36)
<223> linking domain
<220>
<221> misc_feature
<222> (37)..(50)
<223> second complementarity domain
<220>
<221> misc_feature
<222> (51)..(62)
<223> proximal domain
<400> 31
nnnnnnnnnn nnnnnnnnnn guuuaagagc uagaaauagc aaguuuaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 32
<211> 47
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA proximal and tail domains derived from S. pyogenes
<400> 32
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcu 47
<210> 33
<211> 49
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA proximal and tail domains
<400> 33
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cgguggugc 49
<210> 34
<211> 51
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA proximal and tail domains
<400> 34
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcggau c 51
<210> 35
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA proximal and tail domains
<400> 35
aaggcuaguc cguuaucaac uugaaaaagu g 31
<210> 36
<211> 18
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA proximal and tail domains
<400> 36
aaggcuaguc cguuauca 18
<210> 37
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA proximal and tail domains
<400> 37
aaggcuaguc cg 12
<210> 38
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Unimolecular gRNA derived from S. aureus
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<400> 38
nnnnnnnnnn nnnnnnnnnn guuuuaguac ucuggaaaca gaaucuacua aaacaaggca 60
aaaugccgug uuuaucucgu caacuuguug gcgagauuuu uu 102
<210> 39
<211> 42
<212> RNA
<213> Artificial
<220>
<223> Modular gRNA derived from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(42)
<223> First complementarity domain
<400> 39
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 40
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> Modular gRNA derived from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(9)
<223> 5' extension domain
<220>
<221> misc_feature
<222> (10)..(33)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (34)..(45)
<223> Proximal domain
<220>
<221> misc_feature
<222> (46)..(85)
<223> Tail domain
<400> 40
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuu 85
<210> 41
<211> 62
<212> RNA
<213> Artificial Sequence
<220>
<223> Unimolecular gRNA derived from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(32)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (33)..(36)
<223> Linking domain
<220>
<221> misc_feature
<222> (37)..(50)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (51)..(62)
<223> Proximal domain
<400> 41
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cg 62
<210> 42
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> Unimolecular gRNA derived from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(32)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (33)..(36)
<223> Linking domain
<220>
<221> misc_feature
<222> (37)..(50)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (51)..(62)
<223> Proximal domain
<220>
<221> misc_feature
<222> (63)..(102)
<223> Tail domain
<400> 42
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uu 102
<210> 43
<211> 75
<212> RNA
<213> Artificial Sequence
<220>
<223> Unimolecular gRNA derived from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (21)..(36)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (37)..(40)
<223> Linking domain
<220>
<221> misc_feature
<222> (41)..(58)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (59)..(70)
<223> Proximal domain
<220>
<221> misc_feature
<222> (71)..(75)
<223> Tail domain
<400> 43
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuauc 75
<210> 44
<211> 87
<212> RNA
<213> Artificial Sequence
<220>
<223> Unimolecular gRNA derived from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(32)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (43)..(46)
<223> Linking domain
<220>
<221> misc_feature
<222> (57)..(70)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (71)..(82)
<223> Proximal domain
<220>
<221> misc_feature
<222> (83)..(87)
<223> Tail domain
<400> 44
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu uggaaacaaa acagcauagc 60
aaguuaaaau aaggcuaguc cguuauc 87
<210> 45
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Modular gRNA derived from S. thermophilus
<220>
<221> misc_feature
<222> (1)..(20)
<223> a, c, u, g, unknown or other
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(42)
<223> First complementarity domain
<400> 45
nnnnnnnnnn nnnnnnnnnn guuuuagagc uguguuguuu cg 42
<210> 46
<211> 78
<212> RNA
<213> Artificial Sequence
<220>
<223> Modular gRNA derived from S. thermophilus
<220>
<221> misc_feature
<222> (1)..(3)
<223> 5' extension domain
<220>
<221> misc_feature
<222> (4)..(27)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (28)..(40)
<223> Proximal domain
<220>
<221> misc_feature
<222> (41)..(78)
<223> Tail domain
<400> 46
gggcgaaaca acacagcgag uuaaaauaag gcuuaguccg uacucaacuu gaaaaggugg 60
caccgauucg guguuuuu 78
<210> 47
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> Modular gRNA derived from S. pyogenes
<400> 47
gaaccauuca aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa 60
guggcaccga gucggugcuu uuuuu 85
<210> 48
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA from S. pyogenes
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<400> 48
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 49
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(32)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (33)..(36)
<223> Linking domain
<220>
<221> misc_feature
<222> (37)..(50)
<223> Second complementarity domain
<220>
<221> misc_feature
<222> (51)..(62)
<223> Proximal domain
<400> 49
nnnnnnnnnn nnnnnnnnnn guauuagagc uagaaauagc aaguuaauau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugc 96
<210> 50
<211> 104
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(36)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (37)..(40)
<223> Linking domain
<220>
<221> misc_feature
<222> (41)..(58)
<223> Second complementarity domain
<400> 50
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcugaaa agcauagcaa guuaaaauaa 60
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugc 104
<210> 51
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (1)..(20)
<223> Targeting domain
<220>
<221> misc_feature
<222> (21)..(37)
<223> First complementarity domain
<220>
<221> misc_feature
<222> (38)..(41)
<223> Linking domain
<220>
<221> misc_feature
<222> (42)..(60)
<223> Second complementarity domain
<400> 51
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuggaa acagcauagc aaguuaaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugc 106
<210> 52
<211> 12
<212> PRT
<213> Peptoniphilus duerdenii
<400> 52
Asp Ile Gly Thr Ala Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 53
<211> 12
<212> PRT
<213> Treponema denticola
<400> 53
Asp Val Gly Thr Gly Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 54
<211> 12
<212> PRT
<213> S. mutans
<400> 54
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Val
1 5 10
<210> 55
<211> 12
<212> PRT
<213> S. pyogenes
<400> 55
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 56
<211> 12
<212> PRT
<213> L. innocua
<400> 56
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Leu
1 5 10
<210> 57
<211> 12
<212> PRT
<213> Flavobacterium branchiophilum FL-15
<400> 57
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Val Val
1 5 10
<210> 58
<211> 11
<212> PRT
<213> Pedobacter glucosidilyticus
<400> 58
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Ile
1 5 10
<210> 59
<211> 12
<212> PRT
<213> Bacteroides fragilis, NCTC 9343
<400> 59
Asp Leu Gly Thr Asn Ser Ile Gly Trp Ala Leu Val
1 5 10
<210> 60
<211> 12
<212> PRT
<213> Fusobacterium nucleatum
<400> 60
Asp Ile Gly Thr Asn Ser Val Gly Trp Cys Val Thr
1 5 10
<210> 61
<211> 12
<212> PRT
<213> Acidaminococcus sp. D21
<400> 61
Asp Ile Gly Thr Asn Ser Val Gly Tyr Ala Val Thr
1 5 10
<210> 62
<211> 12
<212> PRT
<213> Coprococcus catus GD-7
<400> 62
Asp Met Gly Thr Gly Ser Leu Gly Trp Ala Val Thr
1 5 10
<210> 63
<211> 12
<212> PRT
<213> Oenococcus kitaharae DSM 17330
<400> 63
Asp Ile Gly Thr Ser Ser Val Gly Trp Ala Ala Ile
1 5 10
<210> 64
<211> 12
<212> PRT
<213> Catenibacterium mitsuokai DSM 15897
<400> 64
Asp Leu Gly Thr Gly Ser Val Gly Trp Ala Val Val
1 5 10
<210> 65
<211> 12
<212> PRT
<213> Mycoplasma gallisepticum str. F
<400> 65
Asp Leu Gly Val Gly Ser Val Gly Trp Ala Ile Val
1 5 10
<210> 66
<211> 12
<212> PRT
<213> Mycoplasma ovipneumoniae SC01
<400> 66
Asp Leu Gly Ile Ala Ser Ile Gly Trp Ala Ile Ile
1 5 10
<210> 67
<211> 12
<212> PRT
<213> Mycoplasma canis PG 14
<400> 67
Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Ile Val
1 5 10
<210> 68
<211> 12
<212> PRT
<213> Mycoplasma synoviae 53
<400> 68
Asp Leu Gly Val Ala Ser Val Gly Trp Ser Ile Val
1 5 10
<210> 69
<211> 12
<212> PRT
<213> Eubacterium rectale
<400> 69
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Leu
1 5 10
<210> 70
<211> 12
<212> PRT
<213> Enterococcus faecalis TX0012
<400> 70
Asp Leu Gly Ile Ser Ser Val Gly Trp Ser Val Ile
1 5 10
<210> 71
<211> 12
<212> PRT
<213> Ilyobacter polytropus DSM 2926
<400> 71
Asp Ile Gly Ile Ala Ser Val Gly Trp Ser Val Ile
1 5 10
<210> 72
<211> 12
<212> PRT
<213> Ruminococcus albus 8
<400> 72
Asp Val Gly Ile Gly Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 73
<211> 12
<212> PRT
<213> Elusimicrobium minutum Pei191
<400> 73
Asp Leu Gly Val Gly Ser Ile Gly Phe Ala Ile Val
1 5 10
<210> 74
<211> 12
<212> PRT
<213> Akkermansia muciniphila
<400> 74
Asp Ile Gly Tyr Ala Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 75
<211> 12
<212> PRT
<213> Prevotella ruminicola
<400> 75
Asp Thr Gly Thr Asn Ser Leu Gly Trp Ala Ile Val
1 5 10
<210> 76
<211> 12
<212> PRT
<213> Cand. Puniceispirillum marinum
<400> 76
Asp Leu Gly Thr Asn Ser Ile Gly Trp Cys Leu Leu
1 5 10
<210> 77
<211> 12
<212> PRT
<213> Rhodospirillum rubrum
<400> 77
Asp Ile Gly Thr Asp Ser Leu Gly Trp Ala Val Phe
1 5 10
<210> 78
<211> 12
<212> PRT
<213> Lactobacillus rhamnosus GG
<400> 78
Asp Ile Gly Ser Asn Ser Ile Gly Phe Ala Val Val
1 5 10
<210> 79
<211> 12
<212> PRT
<213> Sphaerochaeta globus str. Buddy
<400> 79
Asp Leu Gly Val Gly Ser Ile Gly Val Ala Val Ala
1 5 10
<210> 80
<211> 12
<212> PRT
<213> Rhodopseudomonas palustris
<400> 80
Asp Leu Gly Ile Ala Ser Cys Gly Trp Gly Val Val
1 5 10
<210> 81
<211> 12
<212> PRT
<213> Mycoplasma mobile 163K
<400> 81
Asp Leu Gly Ile Ala Ser Val Gly Trp Cys Leu Thr
1 5 10
<210> 82
<211> 12
<212> PRT
<213> Streptococcus thermophilus LMD-9
<400> 82
Asp Ile Gly Ile Gly Ser Val Gly Val Gly Ile Leu
1 5 10
<210> 83
<211> 12
<212> PRT
<213> Staphylococcus lugdunensis M23590
<400> 83
Asp Ile Gly Ile Thr Ser Val Gly Tyr Gly Leu Ile
1 5 10
<210> 84
<211> 12
<212> PRT
<213> Eubacterium dolichum DSM 3991
<400> 84
Asp Ile Gly Ile Thr Ser Val Gly Phe Gly Ile Ile
1 5 10
<210> 85
<211> 12
<212> PRT
<213> Lactobacillus coryniformis KCTC 3535
<400> 85
Asp Val Gly Ile Thr Ser Thr Gly Tyr Ala Val Leu
1 5 10
<210> 86
<211> 12
<212> PRT
<213> Nitratifractor salsuginis DSM 16511
<400> 86
Asp Leu Gly Ile Thr Ser Phe Gly Tyr Ala Ile Leu
1 5 10
<210> 87
<211> 12
<212> PRT
<213> Bifidobacterium bifidum S17
<400> 87
Asp Ile Gly Asn Ala Ser Val Gly Trp Ser Ala Phe
1 5 10
<210> 88
<211> 12
<212> PRT
<213> Lactobacillus gasseri
<400> 88
Asp Val Gly Thr Asn Ser Cys Gly Trp Val Ala Met
1 5 10
<210> 89
<211> 12
<212> PRT
<213> Acidothermus cellulolyticus 11B
<400> 89
Asp Val Gly Glu Arg Ser Ile Gly Leu Ala Ala Val
1 5 10
<210> 90
<211> 12
<212> PRT
<213> Bifidobacterium longum DJO10A
<400> 90
Asp Val Gly Leu Asn Ser Val Gly Leu Ala Ala Val
1 5 10
<210> 91
<211> 12
<212> PRT
<213> Bifidobacterium dentium
<400> 91
Asp Val Gly Leu Met Ser Val Gly Leu Ala Ala Ile
1 5 10
<210> 92
<211> 12
<212> PRT
<213> Corynebacterium diphtheriae
<400> 92
Asp Val Gly Thr Phe Ser Val Gly Leu Ala Ala Ile
1 5 10
<210> 93
<211> 12
<212> PRT
<213> Staphylococcus pseudintermedius ED99
<400> 93
Asp Ile Gly Thr Gly Ser Val Gly Tyr Ala Cys Met
1 5 10
<210> 94
<211> 12
<212> PRT
<213> Capnocytophaga ochracea
<400> 94
Asp Leu Gly Thr Thr Ser Ile Gly Phe Ala His Ile
1 5 10
<210> 95
<211> 12
<212> PRT
<213> Prevotella denticola
<400> 95
Asp Leu Gly Thr Asn Ser Ile Gly Ser Ser Val Arg
1 5 10
<210> 96
<211> 12
<212> PRT
<213> Ralstonia solanacearum
<400> 96
Asp Ile Gly Thr Asn Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 97
<211> 12
<212> PRT
<213> Pasteurella multocida str. Pm70
<400> 97
Asp Leu Gly Ile Ala Ser Val Gly Trp Ala Val Val
1 5 10
<210> 98
<211> 12
<212> PRT
<213> Comamonas granuli
<400> 98
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Val Leu
1 5 10
<210> 99
<211> 12
<212> PRT
<213> Helicobacter mustelae 12198
<400> 99
Asp Ile Gly Ile Ala Ser Ile Gly Trp Ala Val Ile
1 5 10
<210> 100
<211> 12
<212> PRT
<213> Agathobacter rectalis
<400> 100
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Ile Ile
1 5 10
<210> 101
<211> 12
<212> PRT
<213> Clostridium cellulolyticum H10
<400> 101
Asp Val Gly Ile Ala Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 102
<211> 11
<212> PRT
<213> Methylophilus sp. OH31
<400> 102
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Leu
1 5 10
<210> 103
<211> 12
<212> PRT
<213> Neisseria meningitidis
<400> 103
Asp Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val
1 5 10
<210> 104
<211> 12
<212> PRT
<213> Clostridium perfringens
<400> 104
Asp Ile Gly Ile Thr Ser Val Gly Trp Ala Val Ile
1 5 10
<210> 105
<211> 12
<212> PRT
<213> Wolinella succinogenes DSM 1740
<400> 105
Asp Leu Gly Ile Ser Ser Leu Gly Trp Ala Ile Val
1 5 10
<210> 106
<211> 12
<212> PRT
<213> Azospirillum sp. B510
<400> 106
Asp Leu Gly Thr Asn Ser Ile Gly Trp Gly Leu Leu
1 5 10
<210> 107
<211> 12
<212> PRT
<213> Verminephrobacter eiseniae
<400> 107
Asp Leu Gly Ser Thr Ser Leu Gly Trp Ala Ile Phe
1 5 10
<210> 108
<211> 12
<212> PRT
<213> Campylobacter jejuni, NCTC 11168
<400> 108
Asp Ile Gly Ile Ser Ser Ile Gly Trp Ala Phe Ser
1 5 10
<210> 109
<211> 12
<212> PRT
<213> Parvibaculum lavamentivorans DS-1
<400> 109
Asp Ile Gly Thr Thr Ser Ile Gly Phe Ser Val Ile
1 5 10
<210> 110
<211> 12
<212> PRT
<213> Dinoroseobacter shibae DFL 12
<400> 110
Asp Ile Gly Thr Ser Ser Ile Gly Trp Trp Leu Tyr
1 5 10
<210> 111
<211> 12
<212> PRT
<213> Nitrobacter hamburgensis X14
<400> 111
Asp Leu Gly Ser Asn Ser Leu Gly Trp Phe Val Thr
1 5 10
<210> 112
<211> 12
<212> PRT
<213> Bradyrhizobium sp. BTAi1
<400> 112
Asp Leu Gly Ala Asn Ser Leu Gly Trp Phe Val Val
1 5 10
<210> 113
<211> 15
<212> PRT
<213> Bacillus cereus
<400> 113
Asp Ile Gly Leu Arg Ile Gly Ile Thr Ser Cys Gly Trp Ser Ile
1 5 10 15
<210> 114
<211> 12
<212> PRT
<213> Sutterella wadsworthensis
<400> 114
Asp Met Gly Ala Lys Tyr Thr Gly Val Phe Tyr Ala
1 5 10
<210> 115
<211> 12
<212> PRT
<213> Wolinella succinogenes DSM 1740
<400> 115
Asp Leu Gly Gly Lys Asn Thr Gly Phe Phe Ser Phe
1 5 10
<210> 116
<211> 12
<212> PRT
<213> Francisella tularensis
<400> 116
Asp Leu Gly Val Lys Asn Thr Gly Val Phe Ser Ala
1 5 10
<210> 117
<211> 12
<212> PRT
<213> Gamma proteobacterium HTCC5015
<400> 117
Asp Leu Gly Ala Lys Phe Thr Gly Val Ala Leu Tyr
1 5 10
<210> 118
<211> 12
<212> PRT
<213> Legionella pneumophila str. Paris
<400> 118
Asp Leu Gly Gly Lys Phe Thr Gly Val Cys Leu Ser
1 5 10
<210> 119
<211> 12
<212> PRT
<213> Parasutterella excrementihominis
<400> 119
Asp Leu Gly Gly Thr Tyr Thr Gly Thr Phe Ile Thr
1 5 10
<210> 120
<211> 12
<212> PRT
<213> S. thermophilus
<400> 120
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 121
<211> 12
<212> PRT
<213> Eubacterium yurii
<400> 121
Asp Val Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 122
<211> 12
<212> PRT
<213> Butyrivibrio hungatei
<400> 122
Asp Met Gly Thr Asn Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 123
<211> 12
<212> PRT
<213> Solobacterium moorei F0204
<400> 123
Asp Val Gly Thr Ser Ser Val Gly Trp Ala Val Thr
1 5 10
<210> 124
<211> 27
<212> PRT
<213> Treponema denticola
<400> 124
Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Ser Asn Arg Val Leu Val Cys Ser Ser Cys Asn
20 25
<210> 125
<211> 27
<212> PRT
<213> Coprococcus catus GD-7
<400> 125
Asp Ile Asp His Ile Tyr Pro Gln Ser Lys Thr Met Asp Asp Ser Leu
1 5 10 15
Asn Asn Arg Val Leu Val Lys Lys Asn Tyr Asn
20 25
<210> 126
<211> 27
<212> PRT
<213> Peptoniphilus duerdenii
<400> 126
Asp Gln Asp His Ile Tyr Pro Lys Ser Lys Ile Tyr Asp Asp Ser Leu
1 5 10 15
Glu Asn Arg Val Leu Val Lys Lys Asn Leu Asn
20 25
<210> 127
<211> 27
<212> PRT
<213> Catenibacterium mitsuokai DSM 15897
<400> 127
Gln Ile Asp His Ile Val Pro Gln Ser Leu Val Lys Asp Asp Ser Phe
1 5 10 15
Asp Asn Arg Val Leu Val Val Pro Ser Glu Asn
20 25
<210> 128
<211> 27
<212> PRT
<213> S. mutans
<400> 128
Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp Asn Ser Ile
1 5 10 15
Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn
20 25
<210> 129
<211> 27
<212> PRT
<213> S. thermophilus
<400> 129
Asp Ile Asp His Ile Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Val Ser Ser Ala Ser Asn
20 25
<210> 130
<211> 27
<212> PRT
<213> Oenococcus kitaharae DSM 17330
<400> 130
Asp Ile Asp His Ile Ile Pro Gln Ala Tyr Thr Lys Asp Asn Ser Leu
1 5 10 15
Asp Asn Arg Val Leu Val Ser Asn Ile Thr Asn
20 25
<210> 131
<211> 27
<212> PRT
<213> L. inocua
<400> 131
Asp Ile Asp His Ile Val Pro Gln Ser Phe Ile Thr Asp Asn Ser Ile
1 5 10 15
Asp Asn Leu Val Leu Thr Ser Ser Ala Gly Asn
20 25
<210> 132
<211> 27
<212> PRT
<213> S. pyogenes
<400> 132
Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
20 25
<210> 133
<211> 27
<212> PRT
<213> Acidaminococcus sp. D21
<400> 133
Asn Ile Asp His Ile Tyr Pro Gln Ser Met Val Lys Asp Asp Ser Leu
1 5 10 15
Asp Asn Lys Val Leu Val Gln Ser Glu Ile Asn
20 25
<210> 134
<211> 27
<212> PRT
<213> Lactobacillus rhamnosus GG
<400> 134
Asp Ile Asp His Ile Leu Pro Gln Ser Leu Ile Lys Asp Asp Ser Leu
1 5 10 15
Asp Asn Arg Val Leu Val Asn Ala Thr Ile Asn
20 25
<210> 135
<211> 27
<212> PRT
<213> Lactobacillus gasseri
<400> 135
Asp Ile Asp His Ile Leu Pro Gln Ser Phe Ile Lys Asp Asp Ser Leu
1 5 10 15
Glu Asn Arg Val Leu Val Lys Lys Ala Val Asn
20 25
<210> 136
<211> 27
<212> PRT
<213> Staphylococcus pseudintermedius ED99
<400> 136
Glu Val Asp His Ile Phe Pro Arg Ser Phe Ile Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Lys Val Leu Val Ile Lys Lys Met Asn
20 25
<210> 137
<211> 27
<212> PRT
<213> Olsenella uli
<400> 137
Glu Val Asp His Ile Ile Pro Arg Ser Tyr Ile Lys Asp Asp Ser Phe
1 5 10 15
Glu Asn Lys Val Leu Val Tyr Arg Glu Glu Asn
20 25
<210> 138
<211> 27
<212> PRT
<213> Bifidobacterium bifidum S17
<400> 138
Asp Ile Asp His Ile Ile Pro Gln Ala Val Thr Gln Asn Asp Ser Ile
1 5 10 15
Asp Asn Arg Val Leu Val Ala Arg Ala Glu Asn
20 25
<210> 139
<211> 27
<212> PRT
<213> Mycoplasma gallisepticum str. F
<400> 139
Glu Ile Asp His Ile Ile Pro Tyr Ser Ile Ser Phe Asp Asp Ser Ser
1 5 10 15
Ser Asn Lys Leu Leu Val Leu Ala Glu Ser Asn
20 25
<210> 140
<211> 27
<212> PRT
<213> Mycoplasma canis PG 14
<400> 140
Glu Ile Asp His Ile Ile Pro Tyr Ser Leu Cys Phe Asp Asp Ser Ser
1 5 10 15
Ala Asn Lys Val Leu Val His Lys Gln Ser Asn
20 25
<210> 141
<211> 27
<212> PRT
<213> Ilyobacter polytropus DSM 2926
<400> 141
Asp Ile Asp His Ile Ile Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr
1 5 10 15
Ser Asn Lys Val Leu Val Leu Ser Gly Glu Asn
20 25
<210> 142
<211> 27
<212> PRT
<213> Uncultured Termite group 1 bacterium
<400> 142
Asp Ile Asp His Ile Ile Pro Tyr Ser Lys Ser Met Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Cys Leu Ala Glu Glu Asn
20 25
<210> 143
<211> 27
<212> PRT
<213> Campylobacter jejuni
<400> 143
Glu Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr
1 5 10 15
Met Asn Lys Val Leu Val Phe Thr Lys Gln Asn
20 25
<210> 144
<211> 27
<212> PRT
<213> Clostridium cellulolyticum H10
<400> 144
Gln Ile Asp His Ile Tyr Pro Tyr Ser Arg Ser Met Asp Asp Ser Tyr
1 5 10 15
Met Asn Lys Val Leu Val Leu Thr Asp Glu Asn
20 25
<210> 145
<211> 27
<212> PRT
<213> Clostridium perfringens
<400> 145
Glu Ile Asp His Ile Ile Pro Phe Ser Arg Ser Phe Asp Asp Ser Leu
1 5 10 15
Ser Asn Lys Ile Leu Val Leu Gly Ser Glu Asn
20 25
<210> 146
<211> 27
<212> PRT
<213> N. meningitides
<400> 146
Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Val Leu Gly Ser Glu Asn
20 25
<210> 147
<211> 27
<212> PRT
<213> Pasteurella multocida str. Pm70
<400> 147
Glu Ile Asp His Ala Leu Pro Phe Ser Arg Thr Trp Asp Asp Ser Phe
1 5 10 15
Asn Asn Lys Val Leu Val Leu Ala Ser Glu Asn
20 25
<210> 148
<211> 27
<212> PRT
<213> Enterococcus faecalis TX0012
<400> 148
Glu Ile Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile
1 5 10 15
Asn Asn Lys Val Leu Val Leu Ser Lys Ala Asn
20 25
<210> 149
<211> 27
<212> PRT
<213> Eubacterium dolichum DSM 3991
<400> 149
Glu Val Asp His Ile Ile Pro Ile Ser Ile Ser Leu Asp Asp Ser Ile
1 5 10 15
Thr Asn Lys Val Leu Val Thr His Arg Glu Asn
20 25
<210> 150
<211> 27
<212> PRT
<213> Acidovorax ebreus
<400> 150
Gln Val Asp His Ala Leu Pro Tyr Ser Arg Ser Tyr Asp Asp Ser Lys
1 5 10 15
Asn Asn Lys Val Leu Val Leu Thr His Glu Asn
20 25
<210> 151
<211> 27
<212> PRT
<213> Streptococcus thermophilus LMD-9
<400> 151
Glu Val Asp His Ile Leu Pro Leu Ser Ile Thr Phe Asp Asp Ser Leu
1 5 10 15
Ala Asn Lys Val Leu Val Tyr Ala Thr Ala Asn
20 25
<210> 152
<211> 27
<212> PRT
<213> Eubacterium rectale
<400> 152
Glu Ile Asp His Ile Ile Pro Arg Ser Ile Ser Phe Asp Asp Ala Arg
1 5 10 15
Ser Asn Lys Val Leu Val Tyr Arg Ser Glu Asn
20 25
<210> 153
<211> 27
<212> PRT
<213> Staphylococcus lugdunensis M23590
<400> 153
Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr
1 5 10 15
His Asn Lys Val Leu Val Lys Gln Ser Glu Asn
20 25
<210> 154
<211> 27
<212> PRT
<213> Roseburia intestinalis
<400> 154
Asp Ile Asp His Ile Leu Pro Tyr Ser Ile Thr Phe Asp Asp Ser Phe
1 5 10 15
Arg Asn Lys Val Leu Val Thr Ser Gln Glu Asn
20 25
<210> 155
<211> 27
<212> PRT
<213> Wolinella succinogenes DSM 1740
<400> 155
Glu Ile Asp His Ile Leu Pro Arg Ser Arg Ser Ala Asp Asp Ser Phe
1 5 10 15
Ala Asn Lys Val Leu Cys Leu Ala Arg Ala Asn
20 25
<210> 156
<211> 27
<212> PRT
<213> Cand. Puniceispirillum marinum
<400> 156
Glu Ile Glu His Leu Leu Pro Phe Ser Leu Thr Leu Asp Asp Ser Met
1 5 10 15
Ala Asn Lys Thr Val Cys Phe Arg Gln Ala Asn
20 25
<210> 157
<211> 27
<212> PRT
<213> Azospirillum sp. B510
<400> 157
Asp Ile Asp His Ile Leu Pro Phe Ser Val Ser Leu Asp Asp Ser Ala
1 5 10 15
Ala Asn Lys Val Val Cys Leu Arg Glu Ala Asn
20 25
<210> 158
<211> 27
<212> PRT
<213> Bradyrhizobium sp. BTAi1
<400> 158
Asp Ile Asp His Leu Ile Pro Phe Ser Ile Ser Trp Asp Asp Ser Ala
1 5 10 15
Ala Asn Lys Val Val Cys Met Arg Tyr Ala Asn
20 25
<210> 159
<211> 27
<212> PRT
<213> Nitrobacter hamburgensis X14
<400> 159
Asp Ile Asp His Ile Leu Pro Val Ala Met Thr Leu Asp Asp Ser Pro
1 5 10 15
Ala Asn Lys Ile Ile Cys Met Arg Tyr Ala Asn
20 25
<210> 160
<211> 27
<212> PRT
<213> Dinoroseobacter shibae
<400> 160
Asp Val Asp His Ile Leu Pro Tyr Ser Arg Thr Leu Asp Asp Ser Phe
1 5 10 15
Pro Asn Arg Thr Leu Cys Leu Arg Glu Ala Asn
20 25
<210> 161
<211> 27
<212> PRT
<213> Verminephrobacter eiseniae
<400> 161
Glu Ile Glu His Ile Leu Pro Phe Ser Arg Thr Leu Asp Asp Ser Leu
1 5 10 15
Asn Asn Arg Thr Val Ala Met Arg Arg Ala Asn
20 25
<210> 162
<211> 27
<212> PRT
<213> Lactobacillus coryniformis KCTC 3535
<400> 162
Glu Val Asp His Ile Ile Pro Tyr Ser Ile Ser Trp Asp Asp Ser Tyr
1 5 10 15
Thr Asn Lys Val Leu Thr Ser Ala Lys Cys Asn
20 25
<210> 163
<211> 27
<212> PRT
<213> Rhodopseudomonas palustris
<400> 163
Gln Val Asp His Ile Leu Pro Trp Ser Arg Phe Gly Asp Asp Ser Tyr
1 5 10 15
Leu Asn Lys Thr Leu Cys Thr Ala Arg Ser Asn
20 25
<210> 164
<211> 27
<212> PRT
<213> Ralstonia syzygii R24
<400> 164
Gln Val Asp His Ile Leu Pro Phe Ser Lys Thr Leu Asp Asp Ser Phe
1 5 10 15
Ala Asn Lys Val Leu Ala Gln His Asp Ala Asn
20 25
<210> 165
<211> 27
<212> PRT
<213> Helicobacter mustelae 12198
<400> 165
Gln Ile Asp His Ala Phe Pro Leu Ser Arg Ser Leu Asp Asp Ser Gln
1 5 10 15
Ser Asn Lys Val Leu Cys Leu Thr Ser Ser Asn
20 25
<210> 166
<211> 27
<212> PRT
<213> Mycoplasma mobile 163K
<400> 166
Asp Ile Asp His Ile Val Pro Arg Ser Ile Ser Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Leu Val Ile Val Asn Lys Leu Asp Asn
20 25
<210> 167
<211> 27
<212> PRT
<213> Mycoplasma ovipneumoniae SC01
<400> 167
Glu Ile Glu His Ile Ile Pro Tyr Ser Met Ser Tyr Asp Asn Ser Gln
1 5 10 15
Ala Asn Lys Ile Leu Thr Glu Lys Ala Glu Asn
20 25
<210> 168
<211> 27
<212> PRT
<213> Mycoplasma synoviae 53
<400> 168
Glu Ile Asp His Val Ile Pro Tyr Ser Lys Ser Ala Asp Asp Ser Trp
1 5 10 15
Phe Asn Lys Leu Leu Val Lys Lys Ser Thr Asn
20 25
<210> 169
<211> 27
<212> PRT
<213> Aminomonas paucivorans DSM 12260
<400> 169
Glu Met Asp His Ile Leu Pro Tyr Ser Arg Ser Leu Asp Asn Gly Trp
1 5 10 15
His Asn Arg Val Leu Val His Gly Lys Asp Asn
20 25
<210> 170
<211> 27
<212> PRT
<213> Ruminococcus albus 8
<400> 170
Glu Val Asp His Ile Val Pro Tyr Ser Leu Ile Leu Asp Asn Thr Ile
1 5 10 15
Asn Asn Lys Ala Leu Val Tyr Ala Glu Glu Asn
20 25
<210> 171
<211> 27
<212> PRT
<213> Fibrobacter succinogenes
<400> 171
Glu Ile Glu His Val Ile Pro Gln Ser Leu Tyr Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Val Ile Cys Glu Ala Glu Val Asn
20 25
<210> 172
<211> 27
<212> PRT
<213> Bacteroides fragilis, NCTC 9343
<400> 172
Asp Ile Glu His Ile Ile Pro Gln Ala Arg Leu Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Thr Leu Glu Ala Arg Ser Val Asn
20 25
<210> 173
<211> 27
<212> PRT
<213> Capnocytophaga sputigena
<400> 173
Glu Ile Glu His Ile Val Pro Lys Ala Arg Val Phe Asp Asp Ser Phe
1 5 10 15
Ser Asn Lys Thr Leu Thr Phe His Arg Ile Asn
20 25
<210> 174
<211> 28
<212> PRT
<213> Finegoldia magna
<400> 174
Asp Lys Asp His Ile Ile Pro Gln Ser Met Lys Lys Asp Asp Ser Ile
1 5 10 15
Ile Asn Asn Leu Val Leu Val Asn Lys Asn Ala Asn
20 25
<210> 175
<211> 27
<212> PRT
<213> Parvibaculum lavamentivorans DS-1
<400> 175
Glu Val Glu His Ile Trp Pro Arg Ser Arg Ser Phe Asp Asn Ser Pro
1 5 10 15
Arg Asn Lys Thr Leu Cys Arg Lys Asp Val Asn
20 25
<210> 176
<211> 27
<212> PRT
<213> Bacillus cereus
<400> 176
Ile Val Asn His Ile Ile Pro Tyr Asn Arg Ser Phe Asp Asp Thr Tyr
1 5 10 15
His Asn Arg Val Leu Thr Leu Thr Glu Thr Lys
20 25
<210> 177
<211> 27
<212> PRT
<213> Prevotella micans
<400> 177
Asp Met Glu His Thr Ile Pro Lys Ser Ile Ser Phe Asp Asn Ser Asp
1 5 10 15
Gln Asn Leu Thr Leu Cys Glu Ser Tyr Tyr Asn
20 25
<210> 178
<211> 27
<212> PRT
<213> Prevotella ruminicola
<400> 178
Asp Ile Glu His Thr Ile Pro Arg Ser Ala Gly Gly Asp Ser Thr Lys
1 5 10 15
Met Asn Leu Thr Leu Cys Ser Ser Arg Phe Asn
20 25
<210> 179
<211> 27
<212> PRT
<213> Flavobacterium columnare
<400> 179
Asp Ile Glu His Thr Ile Pro Arg Ser Ile Ser Gln Asp Asn Ser Gln
1 5 10 15
Met Asn Lys Thr Leu Cys Ser Leu Lys Phe Asn
20 25
<210> 180
<211> 27
<212> PRT
<213> Rhodospirillum rubrum
<400> 180
Asp Ile Asp His Val Ile Pro Leu Ala Arg Gly Gly Arg Asp Ser Leu
1 5 10 15
Asp Asn Met Val Leu Cys Gln Ser Asp Ala Asn
20 25
<210> 181
<211> 27
<212> PRT
<213> Elusimicrobium minutum Pei191
<400> 181
Asp Ile Glu His Leu Phe Pro Ile Ala Glu Ser Glu Asp Asn Gly Arg
1 5 10 15
Asn Asn Leu Val Ile Ser His Ser Ala Cys Asn
20 25
<210> 182
<211> 27
<212> PRT
<213> Sphaerochaeta globus str. Buddy
<400> 182
Asp Val Asp His Ile Phe Pro Arg Asp Asp Thr Ala Asp Asn Ser Tyr
1 5 10 15
Gly Asn Lys Val Val Ala His Arg Gln Cys Asn
20 25
<210> 183
<211> 27
<212> PRT
<213> Nitratifractor salsuginis DSM 16511
<400> 183
Asp Ile Glu His Ile Val Pro Gln Ser Leu Gly Gly Leu Ser Thr Asp
1 5 10 15
Tyr Asn Thr Ile Val Thr Leu Lys Ser Val Asn
20 25
<210> 184
<211> 27
<212> PRT
<213> Acidothermus cellulolyticus 11B
<400> 184
Glu Leu Asp His Ile Val Pro Arg Thr Asp Gly Gly Ser Asn Arg His
1 5 10 15
Glu Asn Leu Ala Ile Thr Cys Gly Ala Cys Asn
20 25
<210> 185
<211> 28
<212> PRT
<213> Bifidobacterium longum DJO10A
<400> 185
Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr
1 5 10 15
Arg Thr Asn Phe Ala Ala Val Cys Ala Glu Cys Asn
20 25
<210> 186
<211> 28
<212> PRT
<213> Bifidobacterium dentium
<400> 186
Glu Met Asp His Ile Val Pro Arg Lys Gly Val Gly Ser Thr Asn Thr
1 5 10 15
Arg Val Asn Leu Ala Ala Ala Cys Ala Ala Cys Asn
20 25
<210> 187
<211> 28
<212> PRT
<213> Corynebacterium diphtheria
<400> 187
Glu Met Asp His Ile Val Pro Arg Ala Gly Gln Gly Ser Thr Asn Thr
1 5 10 15
Arg Glu Asn Leu Val Ala Val Cys His Arg Cys Asn
20 25
<210> 188
<211> 33
<212> PRT
<213> Sutterella wadsworthensis
<400> 188
Glu Ile Asp His Ile Leu Pro Arg Ser Leu Ile Lys Asp Ala Arg Gly
1 5 10 15
Ile Val Phe Asn Ala Glu Pro Asn Leu Ile Tyr Ala Ser Ser Arg Gly
20 25 30
Asn
<210> 189
<211> 33
<212> PRT
<213> Gamma proteobacterium HTCC5015
<400> 189
Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Gly Arg Thr Lys Lys
1 5 10 15
Thr Val Phe Asn Ser Glu Ala Asn Leu Ile Tyr Cys Ser Ser Lys Gly
20 25 30
Asn
<210> 190
<211> 33
<212> PRT
<213> Parasutterella excrementihominis
<400> 190
Glu Ile Asp His Ile Ile Pro Arg Ser Leu Thr Leu Lys Lys Ser Glu
1 5 10 15
Ser Ile Tyr Asn Ser Glu Val Asn Leu Ile Phe Val Ser Ala Gln Gly
20 25 30
Asn
<210> 191
<211> 33
<212> PRT
<213> Legionella pneumophila str. Paris
<400> 191
Glu Ile Asp His Ile Tyr Pro Arg Ser Leu Ser Lys Lys His Phe Gly
1 5 10 15
Val Ile Phe Asn Ser Glu Val Asn Leu Ile Tyr Cys Ser Ser Gln Gly
20 25 30
Asn
<210> 192
<211> 33
<212> PRT
<213> Wolinella succinogenes DSM 1740
<400> 192
Glu Ile Asp His Ile Leu Pro Arg Ser His Thr Leu Lys Ile Tyr Gly
1 5 10 15
Thr Val Phe Asn Pro Glu Gly Asn Leu Ile Tyr Val His Gln Lys Cys
20 25 30
Asn
<210> 193
<211> 30
<212> PRT
<213> Francisella tularensis
<400> 193
Glu Leu Asp His Ile Ile Pro Arg Ser His Lys Lys Tyr Gly Thr Leu
1 5 10 15
Asn Asp Glu Ala Asn Leu Ile Cys Val Thr Arg Gly Asp Asn
20 25 30
<210> 194
<211> 27
<212> PRT
<213> Akkermansia muciniphila
<400> 194
Glu Leu Glu His Ile Val Pro His Ser Phe Arg Gln Ser Asn Ala Leu
1 5 10 15
Ser Ser Leu Val Leu Thr Trp Pro Gly Val Asn
20 25
<210> 195
<211> 27
<212> PRT
<213> Solobacterium moorei F0204
<400> 195
Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Thr Asn Arg Val Leu Val Glu Lys Asp Ile Asn
20 25
<210> 196
<211> 28
<212> PRT
<213> Veillonella atypica ACS-134-V-Col7a
<400> 196
Tyr Asp Ile Asp His Ile Tyr Pro Arg Ser Leu Thr Lys Asp Asp Ser
1 5 10 15
Phe Asp Asn Leu Val Leu Cys Glu Arg Thr Ala Asn
20 25
<210> 197
<211> 28
<212> PRT
<213> Fusobacterium nucleatum
<400> 197
Asp Ile Asp His Ile Tyr Pro Arg Ser Lys Val Ile Lys Asp Asp Ser
1 5 10 15
Phe Asp Asn Leu Val Leu Val Leu Lys Asn Glu Asn
20 25
<210> 198
<211> 27
<212> PRT
<213> Filifactor alocis
<400> 198
Asp Arg Asp His Ile Tyr Pro Gln Ser Lys Ile Lys Asp Asp Ser Ile
1 5 10 15
Asp Asn Leu Val Leu Val Asn Lys Thr Tyr Asn
20 25
<210> 199
<211> 5
<212> DNA
<213> Streptococcus thermophilus
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (4)..(4)
<223> Any nucleotide (e.g., A, G, C, or T)
<400> 199
nggng 5
<210> 200
<211> 7
<212> DNA
<213> Streptococcus thermophilus
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (2)..(2)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (7)..(7)
<223> A or T
<400> 200
nnagaaw 7
<210> 201
<211> 4
<212> DNA
<213> Streptococcus mutans
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (4)..(4)
<223> A or G
<400> 201
naar 4
<210> 202
<211> 5
<212> DNA
<213> Staphylococcus aureus
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (2)..(2)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (4)..(4)
<223> A or G
<220>
<221> misc_feature
<222> (5)..(5)
<223> A or G
<400> 202
nngrr 5
<210> 203
<211> 6
<212> DNA
<213> Staphylococcus aureus
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (2)..(2)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (4)..(4)
<223> A or G
<220>
<221> misc_feature
<222> (5)..(5)
<223> A or G
<220>
<221> misc_feature
<222> (6)..(6)
<223> Any nucleotide (e.g., A, G, C, or T)
<400> 203
nngrrn 6
<210> 204
<211> 6
<212> DNA
<213> Staphylococcus aureus
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (2)..(2)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (4)..(4)
<223> A or G
<220>
<221> misc_feature
<222> (5)..(5)
<223> A or G
<400> 204
nngrrt 6
<210> 205
<211> 6
<212> DNA
<213> Staphylococcus aureus
<220>
<221> misc_feature
<222> (1)..(1)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (2)..(2)
<223> Any nucleotide (e.g., A, G, C, or T)
<220>
<221> misc_feature
<222> (4)..(4)
<223> A or G
<220>
<221> misc_feature
<222> (5)..(5)
<223> A or G
<220>
<221> misc_feature
<222> (6)..(6)
<223> A, G, or C
<400> 205
nngrrv 6
<210> 206
<211> 80
<212> DNA
<213> Streptococcus pyogenes
<400> 206
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgctttt 80
<210> 207
<211> 80
<212> DNA
<213> Staphylococcus aureus
<400> 207
gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60
caacttgttg gcgagatttt 80
<210> 208
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA molecule
<400> 208
guaacggcag acuucuccuc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 209
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA molecule
<400> 209
gguaacggca gacuucuccu cguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 101
<210> 210
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA molecule
<400> 210
ggguaacggc agacuucucc ucguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60
uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102
Claims (57)
- 대상체로의 투여를 위한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법으로서, 상기 방법이
(a) 복수의 시료를 생성하는 단계로서, 각 시료가 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는, 단계;
(b) 상기 복수의 시료의 각각에서 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계; 및
(c) (i) 기준 Cas9 분자/gRNA 분자 복합체의 Tm 값 또는 미리 결정된 역치 Tm 값과 상기 복수의 시료에서의 Tm 값의 비교, 또는 (ii) 상기 복수의 시료의 Tm 값의 상대적 순서화 중 하나 이상에 기반하여, 복수의 시료로부터 적어도 하나의 시료를 선택하는 단계를 포함하는 방법. - 제1항에 있어서, 상기 복수의 시료의 각 시료에서 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값을 검출하는 단계가 시차 주사 형광측정법(DSF)에 의해 상기 복수의 시료에서 각 시료를 평가하는 것을 포함하는 방법.
- 제1항에 있어서, 상기 gRNA가 키메라 gRNA인 방법.
- 제1항에 있어서, 상기 gRNA가 모듈 gRNA인 방법.
- 제1항 및 제2항 중 어느 한 항의 방법에 따라 선택되는 gRNA 분자의 부재 하의 Cas9 분자의 Tm 값보다 적어도 8℃ 더 큰 용융 온도(Tm)를 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체.
- 제1항 및 제2항 중 어느 한 항의 방법에 따라 선택되는 gRNA 분자의 부재 하의 Cas9 분자의 Tm 값보다 적어도 8℃ 더 큰 용융 온도(Tm)를 갖는 Cas9 분자 및 gRNA 분자의 분리된 복합체를 포함하는 조성물.
- 제6항에 있어서, 상기 Cas9 분자 및 gRNA 분자의 비-자연 발생 복합체의 용융 온도(Tm)와, gRNA 분자의 부재 하의 Cas9 분자의 용융 온도(Tm)의 차이가 시차 주사 형광측정법(DSF)에 의해 평가되는 조성물.
- 제6항에 있어서, 상기 gRNA가 키메라 또는 모듈 gRNA인 조성물.
- Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법으로서, 상기 방법이
(a) 복수의 Cas9 분자/gRNA 분자 복합체를 생성하는 단계로서, 각각이 Cas9 분자와, 복수의 gRNA 분자 중 하나를 조합함으로써 생성되는 Cas9 분자/gRNA 분자 복합체를 포함하는 단계;
(b) 상기 복수의 Cas9 분자/gRNA 분자 복합체의 각각의 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계; 및
(c) 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 상기 복수의 Cas9 분자/gRNA 분자 복합체 중 하나 이상이 안정한 것을 결정하는 단계를 포함하는 방법. - 안정한 Cas9 분자/gRNA 분자 복합체를 촉진시키는 조건의 결정 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계; 및
(c) 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법. - 안정한 Cas9 분자/gRNA 분자 복합체에 대한 스크리닝 방법으로서, 상기 방법이
(a) 시차 주사 형광측정법(DSF)에 의해 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계; 및
(b) 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법. - 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 최적의 gRNA의 확인 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계; 및
(c) 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 8℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법. - Cas9 분자/gRNA 분자 복합체의 안정성의 결정 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm) 값을 검출하는 단계;
(c) 상기 Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및
(d) (i) 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 기준 분자의 Tm 값 또는 Tm 기준 값보다 더 크고, (ii) 상기 Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법. - 안정한 Cas9 분자/gRNA 분자 복합체를 형성하기 위한 Cas9 분자로의 gRNA 분자의 결합의 최적화 방법으로서, 상기 방법이
(a) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(b) 상기 Cas9 분자/gRNA 분자 복합체의 용융 온도(Tm)를 검출하는 단계;
(c) 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값과 기준 분자의 Tm 값 또는 Tm 기준 값 사이의 델타 값을 결정하는 단계; 및
(d) 상기 델타 값이 적어도 8℃이며, 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 상기 기준 분자의 Tm 값 또는 상기 Tm 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법. - 안정한 Cas9 분자/gRNA 분자 복합체의 검출 방법으로서, 상기 방법이
(a) 기준 분자의 열안정성 값을 검출하는 단계;
(b) 시료에서 Cas9 분자와 gRNA 분자를 조합하여, Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
(c) 상기 Cas9 분자/gRNA 분자 복합체의 열안정성 값을 측정하는 단계; 및
(d) 상기 Cas9 분자/gRNA 분자 복합체의 열안정성 값이 상기 기준 분자의 열안정성 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는 방법. - 제15항에 있어서, 상기 열안정성 값이 변성 온도 값이며, 상기 열안정성 기준 값이 변성 온도 기준 값인, 방법.
- 제15항에 있어서, 상기 열안정성 값이 용융 온도(Tm) 값이며, 상기 열안정성 기준 값이 Tm 기준 값인, 방법.
- 제9항 내지 제11항, 제13항 및 제17항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 상기 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 1℃, 적어도 2℃, 적어도 3℃, 적어도 4℃, 적어도 5℃, 적어도 6℃, 적어도 7℃, 적어도 8℃, 적어도 9℃, 적어도 10℃, 적어도 11℃, 적어도 12℃, 적어도 13℃, 적어도 14℃, 적어도 15℃, 적어도 16℃, 적어도 17℃, 적어도 18℃, 적어도 19℃ 또는 적어도 20℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
- 제18항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 Tm이 상기 기준 분자의 Tm 값 또는 Tm 기준 값보다 적어도 8℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
- 제9항 내지 제11항, 제13항 및 제17항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 상기 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 1℃, 약 2℃, 약 3℃, 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃ 또는 약 20℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
- 제9항 내지 제11항, 제13항 및 제17항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 상기 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 1℃ 내지 5℃, 약 6℃ 내지 10℃, 약 11℃ 내지 15℃ 또는 약 16℃ 내지 20℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
- 제21항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 Tm 값이 상기 기준 분자의 Tm 값 또는 Tm 기준 값보다 약 6℃ 내지 10℃ 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한, 방법.
- 제9항, 제10항, 제12항 내지 제14항 및 제17항 내지 제22항 중 어느 한 항에 있어서, 상기 Tm 값이 열 변화 분석을 사용하여 검출되는, 방법.
- 제23항에 있어서, 상기 열 변화 분석이 시차 주사 형광측정법(DSF), 시차 주사 열량계(DSC) 또는 등온 적정 열량계(ITC)로부터 선택되는, 방법.
- 제9항 내지 제24항 중 어느 한 항에 있어서, 상기 gRNA 분자가 키메라 gRNA 분자를 포함하는, 방법.
- 제9항 내지 제24항 중 어느 한 항에 있어서, 상기 gRNA 분자가 모듈 gRNA 분자를 포함하는, 방법.
- 제1항 내지 제4항 및 제9항 내지 제26항 중 어느 한 항에 있어서, 상기 Cas9 분자가 표 1로부터 선택되는 Cas9 분자인, 방법.
- 제1항 내지 제4항 및 제9항 내지 제26항 중 어느 한 항에 있어서, 상기 Cas9 분자가 키메라 Cas9 분자, 또는 합성 또는 조작된 Cas9 분자, 예를 들어, 부분 또는 부분들이 결실된 Cas9 분자인, 방법.
- 제1항 내지 제4항 및 제9항 내지 제26항 중 어느 한 항에 있어서, 상기 Cas9 분자가 스트렙토코커스 피오게네스(S. pyogenes) 또는 스타필로코커스 아우레우스(S. aureus) Cas9 분자를 포함하는, 방법.
- 제9항 내지 제29항 중 어느 한 항에 있어서, 상기 기준 분자가
(a) gRNA 분자의 부재 하의 기준 Cas9 분자;
(b) 제2 gRNA 분자(즉, 평가 중인 복합체에서의 gRNA 이외의 gRNA)와 복합체화된 기준 Cas9 분자(예를 들어, 평가 중인 복합체에서의 Cas9 분자와 동일한 Cas9 분자); 및
(c) 기준 Cas9 분자/gRNA 분자 복합체로서, 상기 기준 Cas9 분자/gRNA 분자가 상이한 조건 하에, 예를 들어, 상기 Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상이한 완충제에서 형성된 기준 Cas9 분자/gRNA 분자 복합체로부터 선택되는, 방법. - 제30항에 있어서, 상기 기준 Cas9 분자가 상기 평가 중인 복합체의 Cas9 분자와 동일한, 방법.
- 제30항에 있어서, 상기 기준 Cas9 분자가 상기 평가 중인 복합체의 Cas9 분자와 상이한, 방법.
- 제32항에 있어서, 상기 기준 Cas9 분자는 일차 서열이 상기 평가 중인 복합체의 Cas9 분자와 상이한, 방법.
- 제30항 내지 제33항 중 어느 한 항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자가 상기 평가 중인 복합체의 gRNA 분자와 동일한, 방법.
- 제30항 내지 제33항 중 어느 한 항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자가 상기 평가 중인 복합체의 gRNA 분자와 상이한, 방법.
- 제35항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체의 gRNA 분자가 상기 평가 중인 복합체의 gRNA 분자와 서열이 상이하거나, 변형에 의해 상이한, 방법.
- 제9항 내지 제14항 및 제17항 내지 제36항 중 어느 한 항에 있어서, 상기 Tm 기준 값이 Tm에 대한 미리 선택된 수치를 포함하는, 방법.
- 제9항 내지 제14항 및 제17항 내지 제36항 중 어느 한 항에 있어서, 상기 Tm 기준 값이 제22항 내지 제27항 중 어느 한 항의 기준 분자 중 임의의 것의 Tm과 상호연관되는 값을 포함하는, 방법.
- 제1항 내지 제4항, 제9항 내지 제12항 및 제14항 내지 제38항 중 어느 한 항에 있어서,
상기 Cas9 분자/gRNA 분자 복합체의 활성을 검출하는 단계;
상기 Cas9 분자/gRNA 분자 복합체의 활성 값을 측정하는 단계; 및
상기 Cas9 분자/gRNA 분자 복합체의 활성 값이 기준 분자의 활성 값 또는 활성 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 추가로 포함하는, 방법. - 제13항 및 제39항 중 어느 한 항에 있어서, 상기 활성이
삽입결실을 유도하는 능력;
표적 DNA를 변형시키는 능력;
미리 선택된 수선 방법의 경향;
DNA 표적에 계속 혼성화되는 상기 gRNA 분자의 능력; 및
상기 Cas9 분자/gRNA 분자 복합체의 Cas9 분자에 결합하는 상기 gRNA 분자의 능력 중 하나 이상을 포함하는, 방법. - 제40항에 있어서,
상기 활성 값이 결합 값이며, 상기 활성이 상기 Cas9 분자에 결합하는 상기 gRNA 분자의 능력이며,
시료에서 상기 gRNA 분자와 상기 Cas9 분자를 조합하여, 상기 Cas9 분자/gRNA 분자 복합체를 형성하는 단계;
상기 Cas9 분자/gRNA 분자 복합체의 결합 값을 측정하는 단계; 및
상기 Cas9 분자/gRNA 분자 복합체의 결합 값이 기준 분자의 결합 값 또는 결합 기준 값보다 더 크면, 상기 Cas9 분자/gRNA 분자 복합체가 안정한 것을 결정하는 단계를 포함하는, 방법. - 제41항에 있어서, 상기 결합 값이 반응속도론(kinetics) 분석을 사용하여 측정되는, 방법.
- 제42항에 있어서, 상기 반응속도론 분석이 표면 플라스몬 공명(SPR) 분석, 바이오층 간섭법(BLI) 분석 또는 겔 밴드 변화 분석으로부터 선택되는, 방법.
- 제40항에 있어서, 상기 미리 선택된 수선 방법의 경향이 HDR 또는 NHEJ인, 방법.
- 제13항 및 제39항 내지 제44항 중 어느 한 항에 있어서, 상기 Cas9 분자/gRNA 분자 복합체의 활성이
시험관내 시스템;
생체외 시스템;
생체내 시스템;
세포 분석; 또는
동물 모델을 사용하여 시험되는, 방법. - 제41항 내지 제45항 중 어느 한 항에 있어서, 상기 기준 분자가 제30항 내지 제33항 중 어느 한 항의 기준 분자 중 어느 하나로부터 선택되는, 방법.
- 제41항 내지 제45항 중 어느 한 항에 있어서, 상기 기준 Cas9 분자/gRNA 분자 복합체가 상기 Cas9 분자/gRNA 분자 복합체와 상이한 비의 Cas9 분자 및 gRNA 분자로 형성되거나, 상기 Cas9 분자/gRNA 분자 복합체와 상이한 완충제에서 형성되는, 방법.
- 제10항에 있어서, 상기 시료가 첨가제, 소분자, 안정화 시약, 완충제, pH, 염농도, 글리세롤 농도 또는 다른 완충제 구성성분을 포함하는 구성성분을 포함하는, 방법.
- 제1항 내지 제4항 및 제9항 내지 제48항 중 어느 한 항의 방법을 이용하여 생성되는 합성 Cas9 분자/gRNA 분자 복합체.
- 제1항 내지 제3항 및 제9항 내지 제48항 중 어느 한 항의 방법을 이용하여 생성되는 안정한 Cas9 분자/gRNA 분자 복합체를 포함하는 조성물.
- 제1항 내지 제4항 및 제9항 내지 제48항 중 어느 한 항의 방법을 사용하여 생성되는 안정한 Cas9 분자/gRNA 분자 복합체를 인코딩(encoding)하는 핵산을 포함하는 벡터계(vector system).
- 제9항 내지 제48항 중 어느 한 항의 안정한 Cas9 분자/gRNA 분자 복합체를 표적 세포로 전달하는 단계를 포함하는 표적 세포로의 Cas9 분자/gRNA 분자 복합체의 전달 방법.
- 제52항에 있어서, 상기 안정한 Cas9 분자/gRNA 분자 복합체가 RNP 양이온성 지질 트랜스펙션(transfection), 바이러스 벡터 또는 RNA 트랜스펙션에 의해 상기 세포로 전달되는, 방법.
- 제53항에 있어서, 상기 바이러스 벡터가 AAV 벡터인, 방법.
- 제1항 및 제9항 중 어느 한 항에 있어서, 상기 복수의 gRNA 분자가 후보 gRNA 분자의 라이브러리인, 방법.
- 제55항에 있어서, 상기 후보 gRNA 분자의 라이브러리가 tracrRNA 분자 또는 서열의 라이브러리를 포함하는, 방법.
- 제56항에 있어서, 상기 tracrRNA 분자 또는 서열의 라이브러리가 상이한 길이의 것인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562152473P | 2015-04-24 | 2015-04-24 | |
US62/152,473 | 2015-04-24 | ||
PCT/US2016/029252 WO2016172727A1 (en) | 2015-04-24 | 2016-04-25 | Evaluation of cas9 molecule/guide rna molecule complexes |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180037139A true KR20180037139A (ko) | 2018-04-11 |
KR102535217B1 KR102535217B1 (ko) | 2023-05-19 |
Family
ID=55967433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177034040A KR102535217B1 (ko) | 2015-04-24 | 2016-04-25 | Cas9 분자/가이드 rna 분자 복합체의 평가 |
Country Status (11)
Country | Link |
---|---|
US (2) | US11180793B2 (ko) |
EP (2) | EP4019975A1 (ko) |
JP (1) | JP2018522249A (ko) |
KR (1) | KR102535217B1 (ko) |
CN (1) | CN107690480B (ko) |
AU (1) | AU2016253150B2 (ko) |
CA (1) | CA2982966C (ko) |
IL (1) | IL255125A0 (ko) |
SG (1) | SG11201708653RA (ko) |
WO (1) | WO2016172727A1 (ko) |
ZA (1) | ZA201707018B (ko) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
US10093967B2 (en) | 2014-08-12 | 2018-10-09 | The Regents Of The University Of Michigan | Detection of nucleic acids |
WO2016182959A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Optimized crispr/cas9 systems and methods for gene editing in stem cells |
EP3307887A1 (en) | 2015-06-09 | 2018-04-18 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for improving transplantation |
EP4089175A1 (en) | 2015-10-13 | 2022-11-16 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
IL310721A (en) | 2015-10-23 | 2024-04-01 | Harvard College | Nucleobase editors and their uses |
CN114196746A (zh) * | 2016-02-10 | 2022-03-18 | 密歇根大学董事会 | 核酸的检测 |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
CN110214180A (zh) | 2016-10-14 | 2019-09-06 | 哈佛大学的校长及成员们 | 核碱基编辑器的aav递送 |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
CA3048434A1 (en) * | 2016-12-30 | 2018-07-05 | Editas Medicine, Inc. | Synthetic guide molecules, compositions and methods relating thereto |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
US11542496B2 (en) | 2017-03-10 | 2023-01-03 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
CN110914426A (zh) | 2017-03-23 | 2020-03-24 | 哈佛大学的校长及成员们 | 包含核酸可编程dna结合蛋白的核碱基编辑器 |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
US10947599B2 (en) | 2017-06-13 | 2021-03-16 | Genetics Research, Llc | Tumor mutation burden |
US10081829B1 (en) | 2017-06-13 | 2018-09-25 | Genetics Research, Llc | Detection of targeted sequence regions |
US20180355380A1 (en) * | 2017-06-13 | 2018-12-13 | Genetics Research, Llc, D/B/A Zs Genetics, Inc. | Methods and kits for quality control |
US10527608B2 (en) | 2017-06-13 | 2020-01-07 | Genetics Research, Llc | Methods for rare event detection |
CA3069938A1 (en) | 2017-06-13 | 2018-12-20 | Genetics Research, Llc, D/B/A Zs Genetics, Inc. | Isolation of target nucleic acids |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
AU2018352592A1 (en) | 2017-10-16 | 2020-06-04 | Beam Therapeutics, Inc. | Uses of adenosine base editors |
US20210309995A1 (en) * | 2018-04-27 | 2021-10-07 | Seattle Children's Hospital (dba Seattle Children's Research Institute) | Homology-directed repair template design and delivery to edit hemoglobin-related mutations |
CN113166754A (zh) | 2018-10-16 | 2021-07-23 | 蓝色等位基因有限责任公司 | 用于将dna靶向插入基因中的方法 |
AU2020242032A1 (en) | 2019-03-19 | 2021-10-07 | Massachusetts Institute Of Technology | Methods and compositions for editing nucleotide sequences |
CA3177481A1 (en) | 2020-05-08 | 2021-11-11 | David R. Liu | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007503000A (ja) * | 2003-05-30 | 2007-02-15 | シーメンス アクチエンゲゼルシヤフト | Dna点変異の検出方法(snp分析法)および装置 |
US20140068797A1 (en) * | 2012-05-25 | 2014-03-06 | University Of Vienna | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
WO2015006294A2 (en) * | 2013-07-10 | 2015-01-15 | President And Fellows Of Harvard College | Orthogonal cas9 proteins for rna-guided gene regulation and editing |
WO2015048690A1 (en) * | 2013-09-27 | 2015-04-02 | The Regents Of The University Of California | Optimized small guide rnas and methods of use |
Family Cites Families (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7150982B2 (en) | 1991-09-09 | 2006-12-19 | Third Wave Technologies, Inc. | RNA detection assays |
US6203986B1 (en) | 1998-10-22 | 2001-03-20 | Robert H. Singer | Visualization of RNA in living cells |
WO2001028472A1 (en) | 1999-10-21 | 2001-04-26 | Alcon Universal Ltd. | Drug delivery device |
WO2002089767A1 (en) | 2001-05-03 | 2002-11-14 | Massachusetts Eye And Ear Infirmary | Implantable drug delivery device and use thereof |
WO2003072788A1 (en) | 2002-02-21 | 2003-09-04 | The Wistar Institute Of Anatomy And Biology | Methods and compositions for reversibly controlling expression of target genes in cells |
AU2003274404A1 (en) | 2002-06-11 | 2003-12-22 | The Scripps Research Institute | Artificial transcription factors |
WO2007014181A2 (en) | 2005-07-25 | 2007-02-01 | Johns Hopkins University | Site-specific modification of the human genome using custom-designed zinc finger nucleases |
WO2007106690A2 (en) | 2006-03-15 | 2007-09-20 | Siemens Healthcare Diagnostics Inc. | Degenerate nucleobase analogs |
ES2719789T3 (es) | 2007-03-02 | 2019-07-16 | Dupont Nutrition Biosci Aps | Cultivos con resistencia mejorada a fagos |
WO2010011961A2 (en) | 2008-07-25 | 2010-01-28 | University Of Georgia Research Foundation, Inc. | Prokaryotic rnai-like system and methods of use |
US20100076057A1 (en) | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
US9404098B2 (en) | 2008-11-06 | 2016-08-02 | University Of Georgia Research Foundation, Inc. | Method for cleaving a target RNA using a Cas6 polypeptide |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
MX2012013037A (es) | 2010-05-10 | 2013-07-29 | Univ California | Composiciones de endorribonucleasa y metodos de uso de las mismas. |
WO2011146121A1 (en) | 2010-05-17 | 2011-11-24 | Sangamo Biosciences, Inc. | Novel dna-binding proteins and uses thereof |
GB201013153D0 (en) | 2010-08-04 | 2010-09-22 | Touchlight Genetics Ltd | Primer for production of closed linear DNA |
US9499592B2 (en) | 2011-01-26 | 2016-11-22 | President And Fellows Of Harvard College | Transcription activator-like effectors |
SG10201800873WA (en) | 2011-04-22 | 2018-03-28 | Univ California | Adeno-associated virus virions with variant capsid and methods of use thereof |
WO2012164565A1 (en) | 2011-06-01 | 2012-12-06 | Yeda Research And Development Co. Ltd. | Compositions and methods for downregulating prokaryotic genes |
WO2013012674A1 (en) | 2011-07-15 | 2013-01-24 | The General Hospital Corporation | Methods of transcription activator like effector assembly |
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US8450107B1 (en) | 2011-11-30 | 2013-05-28 | The Broad Institute Inc. | Nucleotide-specific recognition sequences for designer TAL effectors |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
BR112014021104B1 (pt) | 2012-02-29 | 2023-03-28 | Sangamo Biosciences, Inc | Proteína de fusão de ocorrência não natural compreendendo um domínio de ligação de dna de dedo de zinco manipulado que se liga a um gene htt, seu uso, método in vitro de modificação da expressão de um gene htt em uma célula, e método de geração de um sistema modelo para o estudo da doença de huntington |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
US9890364B2 (en) | 2012-05-29 | 2018-02-13 | The General Hospital Corporation | TAL-Tet1 fusion proteins and methods of use thereof |
CN105188767A (zh) | 2012-07-25 | 2015-12-23 | 布罗德研究所有限公司 | 可诱导的dna结合蛋白和基因组干扰工具及其应用 |
EP2880171B1 (en) | 2012-08-03 | 2018-10-03 | The Regents of The University of California | Methods and compositions for controlling gene expression by rna processing |
KR102218562B1 (ko) | 2012-08-29 | 2021-02-19 | 상가모 테라퓨틱스, 인코포레이티드 | 유전적 병태를 치료하기 위한 방법 및 조성물 |
EP2906602B1 (en) | 2012-10-12 | 2019-01-16 | The General Hospital Corporation | Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins |
DE202013012597U1 (de) | 2012-10-23 | 2017-11-21 | Toolgen, Inc. | Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung |
PL3138910T3 (pl) | 2012-12-06 | 2018-01-31 | Sigma Aldrich Co Llc | Oparta na CRISPR modyfikacja i regulacja genomu |
WO2014093479A1 (en) | 2012-12-11 | 2014-06-19 | Montana State University | Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation |
JP6552965B2 (ja) | 2012-12-12 | 2019-07-31 | ザ・ブロード・インスティテュート・インコーポレイテッド | 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化 |
PL2931898T3 (pl) | 2012-12-12 | 2016-09-30 | Le Cong | Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi |
MX2015007549A (es) | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
US20140189896A1 (en) | 2012-12-12 | 2014-07-03 | Feng Zhang | Crispr-cas component systems, methods and compositions for sequence manipulation |
US20140186843A1 (en) | 2012-12-12 | 2014-07-03 | Massachusetts Institute Of Technology | Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
EP3434776A1 (en) | 2012-12-12 | 2019-01-30 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
SG10201707569YA (en) | 2012-12-12 | 2017-10-30 | Broad Inst Inc | Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
WO2014099744A1 (en) | 2012-12-17 | 2014-06-26 | President And Fellows Of Harvard College | Rna-guided human genome engineering |
WO2014124284A1 (en) | 2013-02-07 | 2014-08-14 | The General Hospital Corporation | Tale transcriptional activators |
WO2014150624A1 (en) | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
KR102210319B1 (ko) | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
WO2014204578A1 (en) | 2013-06-21 | 2014-12-24 | The General Hospital Corporation | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
US9828582B2 (en) | 2013-03-19 | 2017-11-28 | Duke University | Compositions and methods for the induction and tuning of gene expression |
CN105683376A (zh) | 2013-05-15 | 2016-06-15 | 桑格摩生物科学股份有限公司 | 用于治疗遗传病状的方法和组合物 |
WO2014197568A2 (en) | 2013-06-04 | 2014-12-11 | President And Fellows Of Harvard College | Rna-guideded transcriptional regulation |
EP3539573B1 (en) | 2013-06-05 | 2024-02-14 | Duke University | Rna-guided gene editing and gene regulation |
KR20160034901A (ko) | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
JP2016528890A (ja) | 2013-07-09 | 2016-09-23 | プレジデント アンド フェローズ オブ ハーバード カレッジ | CRISPR/Cas系を用いるゲノム編集の治療用の使用 |
SG10201913026TA (en) | 2013-07-09 | 2020-02-27 | Harvard College | Multiplex rna-guided genome engineering |
US11306328B2 (en) | 2013-07-26 | 2022-04-19 | President And Fellows Of Harvard College | Genome engineering |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US20160237455A1 (en) | 2013-09-27 | 2016-08-18 | Editas Medicine, Inc. | Crispr-related methods and compositions |
JP6182667B2 (ja) | 2013-09-27 | 2017-08-16 | 京セラ株式会社 | エナジーセービングセルの起動のためのユーザ機器検出 |
DK3066201T3 (en) | 2013-11-07 | 2018-06-06 | Editas Medicine Inc | CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES |
AU2014350051A1 (en) | 2013-11-18 | 2016-07-07 | Crispr Therapeutics Ag | CRISPR-Cas system materials and methods |
US10787684B2 (en) | 2013-11-19 | 2020-09-29 | President And Fellows Of Harvard College | Large gene excision and insertion |
US9074199B1 (en) | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
BR112016013201B1 (pt) | 2013-12-12 | 2023-01-31 | The Broad Institute, Inc. | Uso de uma composição compreendendo um sistema crispr-cas no tratamento de uma doença genética ocular |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
KR20160102056A (ko) | 2013-12-26 | 2016-08-26 | 더 제너럴 하스피탈 코포레이션 | 멀티플렉스 가이드 rna |
WO2015188056A1 (en) | 2014-06-05 | 2015-12-10 | Sangamo Biosciences, Inc. | Methods and compositions for nuclease design |
CN106852157B (zh) | 2014-06-16 | 2022-04-12 | 约翰斯·霍普金斯大学 | 用于使用h1启动子表达crispr向导rna的组合物和方法 |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
EP3215617B1 (en) | 2014-11-07 | 2024-05-08 | Editas Medicine, Inc. | Systems for improving crispr/cas-mediated genome-editing |
EP3274453B1 (en) | 2015-03-26 | 2021-01-27 | Editas Medicine, Inc. | Crispr/cas-mediated gene conversion |
US20160324987A1 (en) | 2015-04-15 | 2016-11-10 | Cedars-Sinai Medical Center | Use of crispr/cas9 as in vivo gene therapy to generate targeted genomic disruptions in genes bearing dominant mutations for retinitis pigmentosa |
WO2016182959A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Optimized crispr/cas9 systems and methods for gene editing in stem cells |
CA2986021A1 (en) | 2015-05-16 | 2016-11-24 | Genzyme Corporation | Gene editing of deep intronic mutations |
EP3436575A1 (en) | 2015-06-18 | 2019-02-06 | The Broad Institute Inc. | Novel crispr enzymes and systems |
WO2017015637A1 (en) | 2015-07-22 | 2017-01-26 | Duke University | High-throughput screening of regulatory element function with epigenome editing technologies |
MX2018002339A (es) | 2015-08-25 | 2018-12-19 | Univ Duke | Composiciones y metodos de mejora de la especificidad en ingenieria genomica usando endonucleasas guiadas por arn. |
US10526590B2 (en) | 2015-08-31 | 2020-01-07 | Agilent Technologies, Inc. | Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination |
AU2016321244B2 (en) | 2015-09-08 | 2020-09-24 | Precision Biosciences, Inc. | Treatment of retinitis pigmentosa using engineered meganucleases |
CN110382692A (zh) | 2016-04-19 | 2019-10-25 | 博德研究所 | 新型crispr酶以及系统 |
CA3048434A1 (en) | 2016-12-30 | 2018-07-05 | Editas Medicine, Inc. | Synthetic guide molecules, compositions and methods relating thereto |
-
2016
- 2016-04-25 JP JP2018506818A patent/JP2018522249A/ja active Pending
- 2016-04-25 KR KR1020177034040A patent/KR102535217B1/ko active IP Right Grant
- 2016-04-25 EP EP21191237.3A patent/EP4019975A1/en active Pending
- 2016-04-25 US US15/569,053 patent/US11180793B2/en active Active
- 2016-04-25 EP EP16722467.4A patent/EP3286571B1/en active Active
- 2016-04-25 AU AU2016253150A patent/AU2016253150B2/en active Active
- 2016-04-25 CN CN201680032169.2A patent/CN107690480B/zh active Active
- 2016-04-25 WO PCT/US2016/029252 patent/WO2016172727A1/en active Application Filing
- 2016-04-25 SG SG11201708653RA patent/SG11201708653RA/en unknown
- 2016-04-25 CA CA2982966A patent/CA2982966C/en active Active
-
2017
- 2017-10-17 ZA ZA2017/07018A patent/ZA201707018B/en unknown
- 2017-10-18 IL IL255125A patent/IL255125A0/en unknown
-
2021
- 2021-11-22 US US17/533,007 patent/US20220325326A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007503000A (ja) * | 2003-05-30 | 2007-02-15 | シーメンス アクチエンゲゼルシヤフト | Dna点変異の検出方法(snp分析法)および装置 |
US20140068797A1 (en) * | 2012-05-25 | 2014-03-06 | University Of Vienna | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
WO2015006294A2 (en) * | 2013-07-10 | 2015-01-15 | President And Fellows Of Harvard College | Orthogonal cas9 proteins for rna-guided gene regulation and editing |
WO2015048690A1 (en) * | 2013-09-27 | 2015-04-02 | The Regents Of The University Of California | Optimized small guide rnas and methods of use |
Non-Patent Citations (1)
Title |
---|
XIA GUO et al., J. Mol. Biol., Vol.360, pp.190-203 (2006) * |
Also Published As
Publication number | Publication date |
---|---|
KR102535217B1 (ko) | 2023-05-19 |
EP3286571B1 (en) | 2021-08-18 |
CA2982966A1 (en) | 2016-10-27 |
US20220325326A1 (en) | 2022-10-13 |
EP4019975A1 (en) | 2022-06-29 |
ZA201707018B (en) | 2024-02-28 |
IL255125A0 (en) | 2017-12-31 |
JP2018522249A (ja) | 2018-08-09 |
AU2016253150A1 (en) | 2017-11-09 |
EP3286571A1 (en) | 2018-02-28 |
CN107690480A (zh) | 2018-02-13 |
AU2016253150B2 (en) | 2022-04-21 |
CN107690480B (zh) | 2022-03-22 |
US11180793B2 (en) | 2021-11-23 |
WO2016172727A1 (en) | 2016-10-27 |
US20180135109A1 (en) | 2018-05-17 |
CA2982966C (en) | 2024-02-20 |
SG11201708653RA (en) | 2017-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102535217B1 (ko) | Cas9 분자/가이드 rna 분자 복합체의 평가 | |
US20230026726A1 (en) | Crispr/cas-related methods and compositions for treating sickle cell disease | |
US20220106600A1 (en) | Crispr-cas-related methods, compositions and components for cancer immunotherapy | |
EP3215617B1 (en) | Systems for improving crispr/cas-mediated genome-editing | |
JP2023075166A (ja) | β異常ヘモグロビン症を治療するためのCRISPR/CAS関連方法および組成物 | |
EP3443088A1 (en) | Grna fusion molecules, gene editing systems, and methods of use thereof | |
AU2022201038A1 (en) | Compositions and methods for promoting homology directed repair | |
US20160281111A1 (en) | Crispr/cas-mediated gene conversion | |
WO2015148860A1 (en) | Crispr/cas-related methods and compositions for treating beta-thalassemia | |
KR20010071227A (ko) | 무세포 키메라플라스티 및 이형이중나선 돌연변이성벡터를 진핵세포에 이용 | |
JP2024073596A (ja) | がん免疫療法のためのcrispr-cas関連方法、組成物および構成要素 | |
CN117377761A (zh) | 用于位点特异性修饰的组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |