KR20210024010A - Crispr 이중 닉카제 기반 증폭 조성물, 시스템, 및 방법 - Google Patents

Crispr 이중 닉카제 기반 증폭 조성물, 시스템, 및 방법 Download PDF

Info

Publication number
KR20210024010A
KR20210024010A KR1020217001478A KR20217001478A KR20210024010A KR 20210024010 A KR20210024010 A KR 20210024010A KR 1020217001478 A KR1020217001478 A KR 1020217001478A KR 20217001478 A KR20217001478 A KR 20217001478A KR 20210024010 A KR20210024010 A KR 20210024010A
Authority
KR
South Korea
Prior art keywords
nucleic acid
crispr
cas
amplification
rna
Prior art date
Application number
KR1020217001478A
Other languages
English (en)
Inventor
펑 장
맥스 켈너
조나단 구텐버그
오마르 아부다예
Original Assignee
더 브로드 인스티튜트, 인코퍼레이티드
프레지던트 앤드 펠로우즈 오브 하바드 칼리지
매사추세츠 인스티튜트 오브 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 브로드 인스티튜트, 인코퍼레이티드, 프레지던트 앤드 펠로우즈 오브 하바드 칼리지, 매사추세츠 인스티튜트 오브 테크놀로지 filed Critical 더 브로드 인스티튜트, 인코퍼레이티드
Publication of KR20210024010A publication Critical patent/KR20210024010A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/125Specific component of sample, medium or buffer
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 명세서에 개시된 구현예는 RNA 표적화 이펙터를 이용하여 강력한 CRISPR-기반 핵산 증폭 방법 및 시스템을 제공한다. 본 명세서에 개시된 구현예는 이중 가닥 및 단일-가닥 핵산 표적 둘 모두를 증폭할 수 있다. 게다가, 본 명세서에 개시된 구현예는 다양한 검출 플랫폼, 예를들어, CRISPR-SHERLOCK과 조합하여, 아토몰라 감도에서 검출 및 진단을 달성할 수 있다. 이러한 구현예는 예를 들어, 바이러스, 검출, 박테리아 균주 유형 분석, 민감한 유전자형 분석, 및 질환-연관 세포 무함유 DNA의 검출을 포함한, 인간 건강에서의 다수 시나리오에서 유용하다.

Description

CRISPR 이중 닉카제 기반 증폭 조성물, 시스템, 및 방법
관련 출원의 교차-참조
본 출원은 2018년 11월 14일 출원된 미국 가출원 제62/767,059호, 및 2018년 6월 26일 출원된 미국 가출원 제62/690,278호의 우선권 이득을 청구한다. 상기 확인된 출원의 전체 내용은 참조로 본 명세서에 완전히 편입된다.
연방 정부 지원 연구에 관한 진술
본 발명은 미국 국립 보건원이 수여하는 보조금 번호 MH100706, MH110049, 및 HL141201 하의 정부 지원으로 만들어졌다. 정부는 본 발명의 일정 권리를 갖는다.
기술 분야
본 명세서에 개시된 주제는 일반적으로 CRISPR 이펙터 시스템의 사용과 관련된 핵산 증폭 방법, 시스템, 및 신속 진단에 관한 것이다.
핵산은 생물학적 정보의 보편적인 서명이다. 휴대용 플랫폼 상에서 높은 감도 및 단일-염기 특이성으로 핵산을 신속하게 검출하는 능력은 많은 질환에 대한 진단 및 모니터링을 혁신시키고, 가치있는 역학 정보를 제공하며, 일반화가능한 과학 도구로서 역할을 수행할 잠재성을 갖는다. 많은 방법들이 핵산 검출을 위해 개발되었지만 (Du et al., 2017; Green et al., 2014; Kumar et al., 2014; Pardee et al., 2014; Pardee et al., 2016; Urdea et al., 2006), 그들은 부득이 하게 감도, 특이성, 및 속도 간에 상호절충을 겪게 된다. 예를 들어, qPCR 접근법은 민감하지만 값비싸고 복합한 기계 장비에 의존적이어서, 실험실 상황에서 고도로 숙련된 작업자에게 사용가능성이 제한된다. 핵산 진단이 점차로 다양한 건강 관리 적용과 관련되어 감에 따라, 저비용으로 높은 특이성 및 감도를 제공하는 검출 기술은 임상 및 기초 연구 상황 둘 모두에서 상당한 유용성이 있을 것이다.
많은 핵산 증폭 접근법이 다양한 검출 플랫폼과 함께 이용가능하다. 특히, 등온 핵산 증폭 방법은 급격한 온도 순환 및 복잡한 기계 장비 없이 증폭을 위해 개발되었다. 이들 방법은 핵산 서열-기반 증폭 (NASBA), 리콤비나제 중합효소 증폭 (RPA), 루프-매개 등온 증폭 (LAMP), 가닥 치환 증폭 (SDA), 헬리카제-의존적 증폭 (HDA), 또는 닉킹 효소 증폭 반응 (NEAR)을 포함한다. 그러나, 이들 등온 증폭 접근법은 여전히 초기 변성 단계 및 다수의 프라이머 세트를 필요로 할 수 있다. 더 나아가서, 등온 핵산 증폭과 휴대용 플랫폼을 조합한 새로운 접근법 (Du et al., 2017; Pardee et al., 2016)은 현장 진단 (point-of-care) (POC) 상황에서 높은 검출 특이성을 제공하지만, 어느 정도 낮은 감도로 인해 제한된 적용성을 갖는다.
본 개시는 일반적으로 닉카제-기반 핵산 증폭 및 검출 방법에 관한 것이다.
일정 예의 구현예에서, 본 발명은 (a) 표적 이중-가닥 핵산을 포함하는 샘플을 증폭 반응 혼합물과 배합시키는 단계로서, 증폭 반응 혼합물은 (i) 증폭 CRISPR 시스템으로서, 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산 상의 제1 위치로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 위치로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템; 및 (ii) 중합효소를 포함하는 것인 단계; (b) 표적 핵산을 증폭시키는 단계; (c) 제1 및 제2 프라이머를 포함하는 프라이머 쌍을 반응 혼합물에 첨가하는 단계로서, 제1 프라이머는 표적 핵산의 제1 위치에 상보성인 부분 및 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 제2 위치에 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 단계; 및 (d) 등온 조건 하에서 반복된 연장 및 닉킹 (nicking)을 통해 표적 핵산을 더 증폭시키는 단계를 포함하는, 표적 이중-가닥 핵산을 증폭하고/검출하는 방법을 제공한다.
구현예에서, 제1 및 제2 위치는 표적 핵산의 동일 가닥 상에 존재한다. 다른 구현예에서, 제1 및 제2 위치는 이중 가닥 표적 핵산의 제1 가닥 및 제2 가닥 상에 존재한다. 제1 위치 및 제2 위치가 표적 핵산의 제1 및 제2 가닥 상에 존재하는 적용에서, 증폭 단계는 제1 및 제2 CRISPR/Cas 복합체를 사용하여 표적 핵산의 제1 및 제2 가닥을 닉킹시키는 단계 및 중합효소를 사용하여 닉킹된 가닥을 치환시키고 연장시키는 단계, 그리하여 제1 및 제2 닉 (nick) 부위 사이에 표적 핵산 서열을 포함하는 듀플렉스를 생성시키는 단계를 포함할 수 있다.
일정 구현예에서, Cas-기반 닉카제는 Cas9 닉카제, Cpf1 닉카제, 및 C2c1 닉카제로 이루어진 군으로부터 선택될 수 있다.
일 구현예에서, Cas-기반 닉카제는 HNH 도메인에 돌연변이를 포함하는 Cas9 닉카제 단백질이다. 다른 구현예에서, Cas-기반 닉카제는 SpCas9의 N863A 또는 SaCas9의 N580A에 상응하는 돌연변이를 포함하는 Cas9 닉카제 단백질이다. Cas-기반 닉카제는 스트렙토코커스 피오게네스 (Streptococcus pyogenes), 스타필로코커스 아우레우스 (Staphylococcus aureus), 스트렙토코커스 써모필러스 (Streptococcus thermophilus), 에스. 뮤탄스 (S. mutans), 에스. 아갈락티아에 (S. agalactiae), 에스. 에퀴시밀리스 (S. equisimilis), 에스. 산귀니스 (S. sanguinis), 에스. 뉴모니아 (S. pneumonia); 씨. 제주니 (C. jejuni), 씨. 콜라이 (C. coli); 엔. 살수기니스 (N. salsuginis), 엔. 테르가르쿠스 (N. tergarcus); 에스. 아우리쿨라리스 (S. auricularis), 에스. 카르노서스 (S. carnosus); 엔. 메닌지티데스 (N. meningitides), 엔. 고노로에아에 (N. gonorrhoeae); 엘. 모노시토게네스 (L. monocytogenes), 엘. 이바노비이 (L. ivanovii); 씨. 보툴리넘 (C. botulinum), 씨. 디피실 (C. difficile), 씨. 테타니 (C. tetani), 씨. 소르델리이 (C. sordellii), 프란시셀라 툴라렌시스 (Francisella tularensis) 1, 프레보텔라 알벤시스 (Prevotella albensis), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MC2017 1, 부티리비브리오 프로테오클라스티커스 (Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움 (Peregrinibacteria bacterium) GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 (Parcubacteria bacterium) GW2011_GWC2_44_17, 스미텔라 (Smithella) sp. SCADC, 악시다미노코커스 (Acidaminococcus) sp. BV3L6, 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MA2020, 칸디다투스 메타노플라스마 테르미텀 (Candidatus Methanoplasma termitum), 유박테리움 엘리겐스 (Eubacterium eligens), 모락셀라 보보쿨리 (Moraxella bovoculi) 237, 렙토스피라 이나다이 (Leptospira inadai), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) ND2006, 포르피로모나스 크레비오리카니스 (Porphyromonas crevioricanis) 3, 프레보텔라 디시엔스 (Prevotella disiens) 및 포르피로모나스 마카카에 (Porphyromonas macacae)로부터 선택되는 박테리아 종으로부터 유래된 Cas9 단백질일 수 있다.
일 구현예에서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 Cpf1 닉카제 단백질이다. 다른 구현예에서, Cas-기반 닉카제는 AsCpf1의 R1226A에 상응하는 돌연변이를 포함하는 Cpf1 닉카제 단백질이다. Cas-기반 닉카제는 프란시셀라 툴라렌시스, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움, 파르쿠박테리아 박테리움, 스미텔라 sp., 악시다미노코커스 sp., 라크노스피라세아에 박테리움, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리, 렙토스피라 이나다이, 포르피로모나스 크레비오리카니스, 프레보텔라 디시엔스 및 포르피로모나스 마카카에, 숙시니비브리오 덱스트리노솔벤스 (Succinivibrio dextrinosolvens), 프레보텔라 디시엔스, 플라보박테리움 브란키오필럼 (Flavobacterium branchiophilum), 헬코코커스 쿤지 (Helcococcus kunzii), 유박테리움 (Eubacterium) sp., 미크로게노마테스 (Microgenomates) (로이즈만박테리아 (Roizmanbacteria)) 박테리움, 플라보박테리움 (Flavobacterium) sp., 프레보텔라 브레비스 (Prevotella brevis), 모락셀라 카프라에 (Moraxella caprae), 경구 박테로이데테스 (Bacteroidetes oral), 포르피로모나스 칸술시 (Porphyromonas cansulci), 시너지스테스 조네시이 (Synergistes jonesii), 프레보텔라 브리안티이 (Prevotella bryantii), 아나에로비브리오 (Anaerovibrio) sp., 부티리비브리오 피브리솔벤스 (Butyrivibrio fibrisolvens), 칸디다투스 메타노메틸로필러스 (Candidatus Methanomethylophilus), 부티리비브리오 (Butyrivibrio) sp., 오리박테리움 (Oribacterium) sp., 슈도부티리비브리오 루미니스 (PseudoButyrivibrio ruminis) 및 프로테오카텔라 스페니시 (Proteocatella sphenisci)로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 Cpf1 단백질일 수 있다.
일 구현예에서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 C2c1 닉카제 단백질이다. 다른 구현예에서, Cas-기반 닉카제는 AacC2c1의 D570A, E848A, 또는 D977A에 상응하는 돌연변이를 포함하는 C2c1 닉카제 단백질이다. Cas-기반 닉카제는 알리시클로바실러스 악시도테레스트리스 (Alicyclobacillus acidoterrestris), 알리시클로바실러스 콘타미난스 (Alicyclobacillus contaminans), 알리시클로바실러스 마크로스포란지이더스 (Alicyclobacillus macrosporangiidus), 바실러스 히사시이 (Bacillus hisashii), 칸디다투스 린도우박테리아 (Candidatus Lindowbacteria), 데술포비브리오 이노피나투스 (Desulfovibrio inopinatus), 데술포나트로넘 티오디스무탄스 (Desulfonatronum thiodismutans), 엘루시미크로비아 박테리움 (Elusimicrobia bacterium) RIFOXYA12, 옴니트로피카 (Omnitrophica) WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 (Opitutaceae bacterium) TAV5, 피시스파에라에 박테리움 (Phycisphaerae bacterium) ST-NAGAB-D1, 플란크토마이세테스 박테리움 (Planctomycetes bacterium) RBG_13_46_10, 스피로카에테스 박테리움 (Spirochaetes bacterium) GWB1_27_13, 베루코미크로비아세아에 박테리움 (Verrucomicrobiaceae bacterium) UBA2429, 투베리바실러스 칼리더스 (Tuberibacillus calidus), 바실러스 써모아밀로보란스 (Bacillus thermoamylovorans), 브레비바실러스 (Brevibacillus) sp. CF112, 바실러스 (Bacillus) sp. NSP2.1, 데술파티라브디움 부티라티보란스 (Desulfatirhabdium butyrativorans), 알리시클로바실러스 허바리우스 (Alicyclobacillus herbarius), 시트로박터 프레운디이 (Citrobacter freundii), 브레비바실러스 아그리 (Brevibacillus agri)(예를 들어, BAB-2500), 및 메틸로박테리움 노둘란스 (Methylobacterium nodulans)로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래되는 C2c1 단백질일 수 있다.
일 구현예에서, 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 동일하다. 다른 구현예에서, 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 상이하다.
DNA 중합효소는 5'에서 3'으로의 엑소뉴클레아제 활성이 결여되고 추가로 임의로 3'-5' 엑소뉴클레아제 활성이 결여될 수 있는 중합효소의 군으로부터 선택될 수 있다. 적합한 DNA 중합효소의 예는 이. 콜라이 (E. coli) DNA 중합효소 I의 엑소뉴클레아제-결핍 클레노우 (Klenow) 단편 (New England Biolabs, Inc. (Beverly, Mass.)), 엑소뉴클레아제 결핍 T7 DNA 중합효소 (시쿼나제; USB, (Cleveland, Ohio)), 이. 콜라이 DNA 중합효소 I의 클레노우 단편 (New England Biolabs, Inc. (Beverly, Mass.)), Bst DNA 중합효소의 대형 단편 (New England Biolabs, Inc. (Beverly, Mass.)), KlenTaq DNA 중합효소 (AB Peptides, (St Louis, Mo.)), T5 DNA 중합효소 (미국 특허 제5,716,819호), 및 Pol III DNA 중합효소 (미국 특허 제6,555,349호)를 포함한다. 가닥-치환 활성을 보유하는 DNA 중합효소, 예컨대 엑소뉴클레아제-결핍 이. 콜라이 DNA 중합효소 I의 클레노우 단편, Bst DNA 중합효소 대형 단편, 및 시쿼나제가 헬리카제-의존적 증폭에 바람직하다. T7 중합효소는 Taq 중합효소에 비해 유의하게 낮은 3.5×105 의 오차율을 갖는 고충실도 중합효소이다 (Keohavong and Thilly, Proc. Natl. Acad. Sci. USA 86, 9253-9257 (1989)). 그러나 T7 중합효소는 열안정성이 아니므로 열순환을 요구하는 증폭 시스템에서 사용을 위해서는 최적이 아니다. 등온에서 수행될 수 있는 HDA에서, T7 시쿼나제는 DNA의 증폭에 바람직한 중합효소 중 하나이다.
특별한 구현예에서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택될 수 있다.
일정 구현예에서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, Gst 중합효소, Taq 중합효소, 이. 콜라이 DNA 중합효소 I의 클레노우 단편, KlenTaq, Pol III DNA 중합효소, T5 DNA 중합효소 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택된다. 표적 핵산의 증폭은 약 50℃-59℃, 약 60℃-72℃, 또는 약 37℃에서 수행될 수 있다. 일정 구현예에서, 표적 핵산의 증폭은 일정 온도에서 수행된다. 일정 구현예에서, 표적 핵산의 증폭은 온도 범위 내에서 수행된다.
일정 구현예에서, 표적 핵산 서열은 약 20-30개, 약 30-40개, 약 40-50개, 또는 약 50-100개 뉴클레오티드 길이일 수 있다. 일정 구현예에서, 표적 핵산 서열은 약 100-200개, 약 100-500개, 또는 약 100-1000개 뉴클레오티드 길이일 수 있다. 다른 구현예에서, 표적 핵산 서열은 약 1000-2000개, 약 2000-3000개, 약 3000-4000개, 또는 약 4000-5000개 뉴클레오티드 길이일 수 있다.
추가 구현예에서, 제1 또는 제2 프라이머는 RNA 중합효소 프로모터를 더 포함한다.
일정 구현예에서, 방법은 겔 전기영동, 인터컬레이팅 염료 검출, PCR, 실시간 PCR, 형광발광, 형광 공명 에너지 전이 (FRET), 질량 분석법, 측류 어세이, 비색 어세이 (HRP, ALP, 금 나노입자-기반 어세이) 및 CRISPR-SHERLOCK으로 이루어진 군으로부터 선택되는 방법에 의해 증폭된 핵산을 검출하는 단계를 더 포함할 수 있다. CRISPR-SHIRLOCK 방법은 Cas13-기반 CRISPR-SHERLOCK 방법일 수 있다. 표적 핵산은 아토몰라 감도, 또는 펨토몰라 감도에서 검출될 수 있다.
일정 구현예에서, 표적 핵산은 DNA 또는 RNA일 수 있다. DNA는 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA, 플라스미드 DNA, 순환성 세포 무함유 DNA, 환경 DNA 및 합성 이중 가닥 DNA로 이루어진 군으로부터 선택될 수 있다. 일정 구현예에서, 표적 핵산은 이중-가닥 핵산 또는 단일-가닥 핵산일 수 있다. 표적 핵산이 단일 가닥인 예에서, 이러한 단일-가닥 핵산은 단일 가닥 바이러스 DNA, 바이러스 RNA, 전령 RNA, 리보솜 RNA, 운반 RNA, 마이크로RNA, 짧은 간섭 RNA, 소형 핵 RNA, 합성 RNA, 또는 합성 단일 가닥 DNA를 포함할 수 있지만, 이에 반드시 제한되는 것이 아니다.
일 구현예에서, 샘플은 생물학적 샘플 또는 환경 샘플이다. 생물학적 샘플은 혈액, 혈장, 혈청, 소변, 대변, 객담, 점액, 림프액, 활액, 담즙, 복수, 흉막 삼출액, 혈청종, 타액, 뇌척수액, 수양액 또는 유리체액, 또는 임의의 신체 분비액, 여출액, 삼출액, 또는 관절로부터 수득된 유체, 또는 피부 또는 점막 표면의 면봉표본이다. 일정 구현예에서, 샘플은 인간 환자로부터 수득된 혈액, 혈장, 또는 혈청이다. 다른 구현예에서, 샘플은 식물 샘플이다. 추가 구현예에서, 샘플은 미정제 또는 정제 샘플일 수 있다.
다른 양상에서, 본 개시는 (a) 샘플 중 단일-가닥 핵산을 표적 이중-가닥 핵산으로 전환시키는 단계; 및 (b) 이전에 기술된 방법의 단계를 수행하는 단계를 포함하는, 표적 단일-가닥 핵산을 증폭 및/또는 검출하기 위한 방법을 제공한다. 표적 단일-가닥 핵산은 RNA 분자일 수 있다. RNA 분자는 역전사 및 증폭 단계를 통해서 이중-가닥 핵산으로 전환될 수 있다. 표적 단일-가닥 핵산은 단일 가닥 바이러스 DNA, 바이러스 RNA, 전령 RNA, 리보솜 RNA, 운반 RNA, 마이크로RNA, 짧은 간섭 RNA, 소형 핵 RNA, 합성 RNA, 장형 비코딩 NRA, 프리-마이크로 RNA, dsRNA, 및 합성 단일 가닥 DNA로 이루어진 군으로부터 선택될 수 있다.
다른 양상에서, 본 개시는 샘플에서 표적 이중-가닥 핵산을 증폭 및/또는 검출하기 위한 시스템을 제공하고, 시스템은 (a) 증폭 CRISPR 시스템으로서, 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템; (b) 중합효소; (c) 반응 혼합물에 대한 제1 및 제2 프라이머를 포함하는 프라이머 쌍으로서, 제1 프라이머는 표적 핵산의 제1 가닥과 상보적인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 제2 가닥과 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 프라이머 쌍; 및 임의로 (d) 표적 핵산의 증폭을 검출하기 위한 검출 시스템을 포함한다. Cas-기반 닉카제는 Cas9 닉카제, Cpf1 닉카제, C2c1 닉카제, Cas13a 닉카제, Cas13b 닉카제, Cas13c 닉카제, 및 Cas13d 닉카제로 이루어진 군으로부터 선택될 수 있다. 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, Gst 중합효소, Taq 중합효소, 이. 콜라이 DNA 중합효소 I의 클레노우 단편, KlenTaq, Pol III DNA 중합효소, T5 DNA 중합효소 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택될 수 있다. 일정 구현예에서, Cas-기반 닉카제 및 중합효소는 동일 온도 하에서 수행된다. 일정 구현예에서, Cas-기반 닉카제 및 중합효소는 상이한 온도 하에서 수행된다.
가닥-치환 활성을 보유하는 DNA 중합효소, 예컨대 엑소뉴클레아제-결핍 이. 콜라이 DNA 중합효소 I의 클레노우 단편, Bst DNA 중합효소 대형 단편, 및 시쿼나제는 헬리카제-의존적 증폭에 바람직하다. T7 중합효소는 Taq 중합효소에 비해 유의하게 낮은 3.5×105 의 오차율을 갖는 고충실도 중합효소이고 등온으로 수행될 때 사용될 수 있다 (Keohavong and Thilly, Proc. Natl. Acad. Sci. USA 86, 9253-9257 (1989)).
또 다른 양상에서, 본 개시는 샘플 중 표적 단일-가닥 핵산을 증폭 및/또는 검출하기 위한 시스템을 제공하고, 시스템은 (a) 표적 단일-가닥 핵산을 이중-가닥 핵산으로 전환시키기 위한 시약; 및 (b) 표적 이중-가닥 핵산을 증폭 및/또는 검출하기 위한 상기 기술된 시스템의 성분을 포함한다.
다른 양상에서, 본 개시는 표적 이중-가닥 핵산의 증폭 및/또는 검출을 위한 상기 기술된 시스템의 성분 및 사용 설명서 세트를 포함하는, 샘플 중 표적 이중-가닥 핵산의 증폭 및/또는 검출을 위한 키트를 제공한다. 키트는 샘플 중 이중-가닥 핵산을 정제하기 위한 시약을 더 포함할 수 있다.
다른 양상에서, 본 개시는 표적 단일-가닥 핵산의 증폭 및/또는 검출을 위한 상기 기술된 시스템의 성분 및 사용 설명서 세트를 포함하는, 샘플 중 표적 단일-가닥 핵산의 증폭 및/또는 검출을 위한 키트를 제공한다. 키트는 샘플 중 단일-가닥 핵산을 정제하기 위한 시약을 더 포함할 수 있다.
예로서 구현예의 이들 및 다른 양상, 목적, 특징, 및 장점은 예시적인 예의 구현예의 하기 상세한 설명을 고려하면 당업자에게 자명해질 것이다.
본 발명의 특징 및 장점의 이해는 본 발명의 원리를 이용할 수 있는 예시적인 구현예를 기재한 하기의 상세한 설명, 및 첨부된 도면을 참조하여 얻게 될 것이다:
도 1 - 일정 예의 구현예에 따른 프로그램가능한 닉카제-기반 증폭의 개략도이다.
도 2 - 닉카제 효소 증폭 반응의 최적화를 입증하는 겔 전기영동 이미지이다. 붉은색 화살표는 표적 증폭 밴드를 표시한다.
도 3A - Nt.A1w1 제한 효소와 20 nM 표적을 사용한 닉카제-기반 선형 증폭을 도시한 그래프이다. 도 3B - T7 미스매치된 Cpf1과 20 nM 표적을 사용한 닉카제-기반 선형 증폭을 도시한 그래프이다. 도 3C - 매치된 Cpf1과 20 nM 표적을 사용한 닉카제-기반 선형 증폭을 도시한 그래프이다. 도 3D - Nt.A1w1 제한 효소와 20 fM 표적을 사용한 닉카제-기반 선형 증폭을 도시한 그래프이다. 도 3E - T7 미스매치된 Cpf1과 20 fM 표적을 사용한 닉카제-기반 선형 증폭을 도시한 그래프이다. 도 3F - 매치된 Cpf1과 20 fM 표적을 사용한 닉카제-기반 선형 증폭을 도시한 그래프이다.
도 4A - SYTO 인터컬레이팅 염료를 사용한 Nt.A1w1 증폭 및 검출을 도시한 그래프이다. 도 4B - SYTO 인터컬레이팅 염료를 사용한 T7 미스매치된 Cpf1 증폭 및 검출을 도시한 그래프이다. 도 4C - SYTO 인터컬레이팅 염료를 사용한 매치된 Cpf1 증폭 및 검출을 도시한 그래프이다. 도 4D - 겔 기반 판독에 의한 Nt.A1w1 증폭 및 검출을 도시한 그래프이다. 도 4E - 겔 기반 판독에 의한 T7 미스매치된 Cpf1 증폭 및 검출을 도시한 그래프이다. 도 4F - 겔 기반 판독에 의한 매치된 Cpf1 증폭 및 검출을 도시한 그래프이다. 도 4G - CRISPR-SHERLOCK에 의한 Nt.A1w1 증폭 및 검출을 도시한 그래프이다. 도 4H - CRISPR-SHERLOCK에 의한 T7 미스매치된 Cpf1 증폭 및 검출을 도시한 그래프이다. 도 4I - CRISPR-SHERLOCK에 의한 매치된 Cpf1 증폭 및 검출을 도시한 그래프이다.
도 5 - 표적/무 표적의 비율에 따라 그래프화된 SYTO 또는 CRISPR-SHERLOCK 검출과 조합된 닉카제-기반 증폭의 결과를 도시한 그래프이다.
도 6A - 다양한 표적 농도에 따른 NEAR 증폭 단독의 결과를 도시한 그래프이다. 도 6B - 다양한 표적 농도에 따른 CRISPR-SHERLOCK 검출과 조합한 NEAR 증폭의 결과를 도시한 그래프이다.
도 7A - Bst 2.0 warmstart 중합효소를 사용해 60℃에서 수행된 NEAR 증폭의 결과를 도시한 겔 전기영동 이미지이다. 도 7B - 도 119A의 정량화를 도시한 그래프이다. 도 7C - Bst 2.0 warmstart 중합효소를 사용해 60℃에서 수행된 CRISPR-SHERLOCK과 조합된 NEAR의 결과를 도시한 그래프이다.
도 8A - 16분 시점에 시쿼나제 2.0을 사용하여 37℃에서 수행된 NEAR 증폭을 도시한 그래프이다. 도 8B - 종결점에 시쿼나제 2.0을 사용해 37℃에서 수행된 NEAR 증폭을 도시한 그래프이다.
도 9 - SHERLOCK 검출과 조합된 CRISPR-NEAR의 개략도이다.
본 명세서의 도면은 오직 예시의 목적이고 반드시 비율로 도시되지 않는다.
일반 정의
달리 정의하지 않으면, 본 명세서에서 사용되는 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 분자 생물학의 공통 용어 및 기술의 정의는 다음의 문헌에서 확인할 수 있다: [Molecular Cloning: A Laboratory Manual, 2nd edition (1989) (Sambrook, Fritsch, and Maniatis)]; [Molecular Cloning: A Laboratory Manual, 4th edition (2012) (Green and Sambrook)]; [Current Protocols in Molecular Biology (1987) (F.M. Ausubel et al. eds.)]; [the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (1995) (M.J. MacPherson, B.D. Hames, and G.R. Taylor eds.): Antibodies, A Laboratory Manual (1988) (Harlow and Lane, eds.): Antibodies A Laboraotry Manual, 2nd edition 2013 (E.A. Greenfield ed.)]; [Animal Cell Culture (1987) (R.I. Freshney, ed.)]; [Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223)]; [Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829)]; [Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710)]; [Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994), March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, N.Y. 1992)]; 및 [Marten H. Hofker and Jan van Deursen, Transgenic Mouse Methods and Protocols, 2nd edition (2011)].
본 명세서에서 사용되는 단수 용어 "한", "하나", 및 "그"는 달리 문맥에서 명확하게 명시하지 않으면 단수 및 복수 참조 둘 모두를 포함한다.
용어 "임의의" 또는 "임의로"는 후속 기술되는 사건, 상황, 또는 치환이 일어날 수 있거나 또는 일어나지 않을 수 있고, 설명이 사건 또는 상황이 일어난 예 및 일어나지 않은 예를 포함한다는 것을 의미한다.
종결점에 의한 수치 범위의 열거는 명시된 종결점뿐만 아니라, 개별 범위 내에 포괄되는 모든 수치 및 분율을 포함한다.
측정가능한 값 예컨대 매개변수, 양, 시간 기간 등을 언급할 때 본 명세서에서 사용되는 용어 "약" 또는 "대략"은 그러한 편차가 개시된 발명을 수행하는데 적절하다면, 명시된 값과 그의 편차, 예컨대 명시된 값에서 +/-10% 이하, +/-5% 이하, +/-1% 이하, 및 +/-0.1% 이하의 편차를 포괄하는 것을 의미한다. 수식어 "약" 또는 "대략"이 표시되는 값은 그 자체로 또한 특별히, 바람직하게, 개시된다는 것을 이해해야 한다.
본 명세서에서 사용되는 "생물학적 샘플"은 전체 세포 및/또는 생존 세포 및/또는 세포 찌꺼기를 함유할 수 있다. 생물학적 샘플은 "체액"을 함유할 수 있다 (또는 유래될 수 있다). 본 발명은 체액이 양수, 수양액, 유리체액, 담즙, 혈액 혈청, 유액, 뇌척수액, 이구 (귀지), 유미, 미즙, 내림프, 외림프, 삼출액, 대변, 여성 사출액, 위산, 위액, 림프, 점액 (비강 배액 및 점액질 포함), 심낭액, 복막액, 흉수, 고름, 점막분비물, 타액, 피지 (피부 유분), 정액, 객담, 활액, 땀, 눈물, 소변, 질 분비물, 토사물, 및 이의 하나 이상의 혼합물로부터 선택되는 구체예를 포괄한다. 생물학적 샘플은 세포 배양물, 체액, 체액 유래 세포 배양물을 포함한다. 체액은 예를 들어, 천자, 또는 다른 수집 또는 샘플 채취 과정을 통해 포유동물로부터 수득될 수 있다.
용어 "대상체", "개체", 및 "환자"는 척추동물, 바람직하게 포유동물, 보다 바람직하게 인간을 의미하고자 본 명세서에서 상호교환적으로 사용된다. 포유동물은 제한없이 쥣과동물, 유인원, 인간, 농장 동물, 스포츠 동물, 및 반려 동물을 포함한다. 생체 내에서 수득되거나 또는 시험관 내에서 배양된 생물학적 독립체의 조직, 세포 및 그들 자손이 또한 포괄된다.
"C2c2"는 이제 "Cas13a"라고 하며, 이 용어는 달리 표시하지 않으면 본 명세서에서 상호교환적으로 사용된다. 용어 "그룹 29", "그룹 30", 및 Cas13b는 본 명세서에서 상호교환적으로 사용된다. 용어 "Cpf1" 및 "Cas12a"는 본 명세서에서 상호교환적으로 사용된다. 용어 "C2c1" 및 "Cas12b"는 본 명세서에서 상호교환적으로 사용된다.
다양한 구현예가 이하 기술된다. 특별한 구현예는 본 명세서에 논의되는 보다 넓은 양상에 대한 제한으로서 또는 완전한 설명으로서 의도되는 것이 아님을 유의해야 한다. 특정한 구현예와 함께 기술된 일 양상은 반드시 그 구현예에 제한되는 것이 아니고 임의의 다른 구현예(들)와 함께 실시될 수 있다. "일 구현예", "하나의 구현예", "일례의 구현예"에 대한 본 명세서 전반에서의 언급은 구현예와 함께 기술된 특정한 특성, 구조, 또는 특징이 본 발명의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반에서 다양한 위치에서 "일 구현예에서", "하나의 구현예에서", 또는 "일례의 구현예에서"라는 어구의 출현은 만드시 모두 동일한 구현예를 의미하는 것은 아니지만, 그럴 수도 있다. 더 나아가서, 특정한 특성, 구조, 또는 특징은 하나 이상의 구현예에서, 본 개시로부터 당업자에게 자명하게 되는 바와 같이, 임의의 적합한 방식으로 조합될 수 있다. 더 나아가서, 본 명세서에 기술된 일부 구현예가 다른 구현예에 포함된 다른 특성이 아닌 일부를 포함하지만, 상이한 구현예의 특성의 조합이 본 발명의 범주 내에 있다는 것을 의미한다. 예를 들어, 첨부된 청구항에서, 임의의 청구된 구현예는 임의의 조합으로 사용될 수 있다.
본 명세서에서 인용되는 모든 출판물, 공개된 특허 문서, 및 특허 출원은 각각의 개별 출판물, 공개된 특허 문서, 또는 특허 출원이 참조로 편입된다고 특별히 개별적으로 표시된 바와 동일한 정도로 참조로 본 명세서에 편입된다.
개요
본 명세서에 개시된 구현예는 CRISPR-Cas 기반 닉킹 효소를 이용하여 등온 조건 하에서 표적 핵산을 증폭하는 방법을 제공한다.
다른 양상에서, 본 명세서에 개시된 구현예는 샘플 중 표적 이중 가닥 및 단일-가닥 핵산의 증폭 및/또는 검출을 위한 시스템에 관한 것이다. 일정 구현예에서, 시스템은 증폭 CRISPR 시스템, 중합효소, 프라이머 쌍, 및 임의로 표적 핵산의 증폭을 검출하기 위한 검출 시스템을 포함한다. 일정 예의 구현예에서, 시스템은 표적 단일-가닥 핵산을 이중-가닥 핵산으로 전환시키기 위한 시약을 더 포함할 수 있다.
또 다른 양상에서, 본 명세서에 개시된 구현예는 샘플 중 표적 이중 가닥 또는 단일-가닥 핵산의 증폭 및/또는 검출을 위한 키트에 관한 것이다. 일정 예의 구현예에서, 키트는 샘플에서 이중 가닥 또는 단일-가닥 핵산을 정제하기 위한 시약 및 사용 설명서 세트를 포함할 수 있다.
증폭 시스템
샘플 중 표적 이중-가닥 핵산의 증폭을 위한 시스템이 제공된다. 시스템은 증폭 CRISPR 시스템, 중합효소, 및 프라이머 쌍을 포함한다. 구현예에서, 시스템은 임의로 표적 핵산의 검출을 허용하는, 검출 시스템을 포함할 수 있다.
증폭 CRISPR 시스템은 제1 및 제2 CRISPR/Cas 복합체를 포함한다. 각각의 CRISPR/Cas 복합체는 Cas-기반 닉카제 및 CRISPR/Cas 복합체를 표적 핵산에 가이드하는 표적 분자에 우선적으로 결합하고, 그에 특이적인, 예를 들어 결합하기에 충분한 상보성을 갖는 가이드 분자를 포함한다. 증폭 시스템은 중합효소; 반응 혼합물에 대한 제1 및 제2 프라이머를 포함하는 프라이머 쌍으로서, 제1 프라이머는 제1 표적 위치와 상보성인 부분 및 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 제2 표적 핵산 위치와 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 프라이머 쌍; 및 임의로 표적 핵산의 증폭을 검출하기 위한 검출 시스템을 포함한다. 제1 및 제2 위치는 동일한 가닥 상에 존재할 수 있고, 이러한 예에서 Cas-기반 닉카제는 동일 가닥을 닉킹하거나, 또는 제1 및 제2 위치는 2종의 상이한 가닥 상에 존재할 수 있다.
CRISPR 시스템
본 명세서에서 제공하는 CRISPR 시스템은 제1 및 제2 CRISPR-Cas 복합체를 포함한다. 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 위치로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 위치로 가이드하는 제2 가이드 분자를 포함한다.
일 양상에서, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드하는 제2 가이드 분자를 포함한다. 한 양상에서, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥 상의 제1 위치에 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥 상의 제2 위치로 가이드하는 제2 가이드 분자를 포함한다.
일반적으로, 본 명세서 및 문헌, 예컨대 WO 2014/093622 (PCT/US2013/074667)에서 사용되는 CRISPR-Cas 또는 CRISPR 시스템은 이 용어가 본 명세서에서 사용되는 바와 같이 Cas 유전자를 코딩하는 서열, tracr (트랜스-활성화 CRISPR) 서열 (예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-mate 서열 (내생성 CRISPR 시스템의 경우에 "직접 반복부" 및 tracrRNA-프로세싱된 부분 직접 반복부 포괄), 가이드 서열 (내생성 CRISPR 시스템의 경우에 "스페이서"라고도 함), 또는 "RNA(들)" (예를 들어, Cas, 예컨대 Cas9를 가이드하기 위한 RNA(들), 예를 들어 CRISPR RNA 및 트랜스활성화 (tracr) RNA 또는 단일 가이드 RNA (sgRNA) (키메라 RNA)) 또는 CRISPR 유전자좌로부터의 다른 서열 및 전사물을 포함하여, CRISPR-연관 ("Cas") 유전자의 발현 또는 이의 활성의 유도에 관여되는 전사물 및 다른 엘리먼트를 집합적으로 의미한다. 일반적으로, CRISPR 시스템은 표적 서열 (내생성 CRISPR 시스템의 경우에 프로토스페이서라고도 함)의 부위에서 CRISPR 복합체의 형성을 촉진하는 엘리먼트를 특징으로 한다. CRISPR 단백질이 Cpf1 단백질일 때, tracrRNA는 요구되지 않는다.
본 명세서에서 사용되는 용어 "Cas"는 일반적으로 CRISPR/Cas 시스템 또는 복합체의 (변형된) 이펙터 단백질을 의미하고, 제한없이 (변형된) Cas9, (변형된) Cas12 (예를 들어, Cas12a "Cpf1", Cas12b "C2c1," Cas12c "C2c3"), (변형된) Cas13 (예를 들어, Cas13a "C2c2", Cas 13b "그룹 29/30", Cas13c, Cas13d)일 수 있다. 용어 "Cas"는 Cas9에 대한 특별하고 독점적인 언급과 같이, 달리 분명하지 않으면, 본 명세서에서 용어 "CRISPR" 단백질, "CRISPR/Cas 단백질", "CRISPR 이펙터", "CRISPR/Cas 이펙터", "CRISPR 효소", "CRISPR/Cas 효소" 등과 상호교환적으로 사용될 수 있다. 용어 "CRISPR 단백질"은 CRISPR 단백질이 야생형 CRISPR 단백질과 비교하여, 효소 활성이 변경, 예컨대 증가 또는 감소 (또는 전무)되는지 여부와 무관하게 "CRISPR 효소"와 상호교환적으로 사용될 수 있다는 것을 이해한다. 유사하게, 본 명세서에서 사용시, 적절하고 당업자에게 자명해지는, 일정 구현예에서, 용어 "뉴클레아제"는 변형된 뉴클레아제를 의미할 수 있고, 여기서 촉매 활성은 비변형 뉴클레아제에 대한 특별하고 독점적인 언급과 같이, 달리 분명하지 않으면, 본 명세서의 다른 곳에서 정의된 바와 같이 달리 변형된 뉴클레아제를 비롯하여, 닉카제 활성뿐만 아니라, 뉴클레아제 활성이 변경, 예컨대 증가 또는 감소되었거나, 또는 뉴클레아제 활성이 전혀 없다.
본 발명에 따른 일정 구현예에서, CRISPR-Cas 단백질은 바람직하게 상응하는 야생형 효소에 대해 돌연변이되어서 돌연변이된 CRISPR-Cas 단백질은 표적 서열을 함유하는 유전자좌의 한쪽 또는 양쪽 DNA 가닥을 절단하는 능력이 결여된다.
일정 구현예에서 CRISPR-Cas 단백질은 오직 한쪽 DNA 가닥만을 절단하는 돌연변이된 CRISPR-Cas 단백질, 즉 닉카제이다. 일정 구현예에서, 닉카제는 표적 서열의 반대 DNA 가닥 상에 존재하고 PAM 서열의 3'에 존재하는 서열 내에서 절단시킨다.
본 발명은 둘 이상의 닉카제를 사용하는 방법, 특히 듀얼 또는 이중 닉카제 접근법을 고려한다. 그 결과로 표적 DNA가 2종 Cas 닉카제에 의해 결합된다. 또한, 상이한 오솔로그, 예를 들어 DNA의 한쪽 가닥 (예를 들어, 코딩 가닥) 상에서 Cas 닉카제 및 비코딩 또는 반대 DNA 가닥, 또는 제2 DNA 표적 위치 상에서 오솔로그를 사용할 수 있다는 것을 고려한다. 오솔로그는 제한없이 Cas9 닉카제 예컨대 SaCas9 닉카제 또는 a SpCas9 닉카제일 수 있다. 상이한 PAM을 요구하고 또한 상이한 가이드 요건을 가져서, 사용자에게 훨씬 더 많은 제어를 허용하는 2종의 상이한 오솔로그를 사용하는 것이 유리할 수 있다.
CRISPR-Cas 단백질
CRISPR 이펙터 단백질을 코딩하는 핵산 분자는 유리하게 코돈 최적화된 CRISPR 이펙터 단백질이다. 코돈 최적화된 서열의 예는 진핵생물, 예를 들어 인간 (즉, 인간에서 발현을 위해 최적화), 또는 본 명세서에 기술된 다른 진핵생물, 동물, 또는 포유동물에서 발현을 위해 최적화된 서열이고; 예를 들어, WO 2014/093622 (PCT/US2013/074667)의 SaCas9 인간 코돈 최적화된 서열을 참조한다. 이것이 바람직하지만, 다른 예가 가능하고, 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 특별한 장기에 대한 코돈 최적화가 공지되어 있다는 것을 이해하게 될 것이다. 일부 구현예에서, CRISPR 이펙터 단백질을 코딩하는 효소 코딩 서열은 특정한 세포, 예컨대 진핵생물 세포에서 발현을 위해 코돈 최적화된다. 진핵생물 세포는 제한없이 인간, 또는 본 명세서에서 논의되는 바와 같은 비인간 진핵생물 또는 동물 또는 포유동물, 예를 들어 마우스, 래트, 토끼, 개, 가축, 또는 비인간 포유동물 또는 영장류를 포함하여, 포유동물 또는 식물과 같이, 특정한 유기체의 것일 수 있거나 또는 그로부터 유래될 수 있다. 일부 구현예에서, 인간의 배선 유전자 정체성을 변형시키기 위한 방법 및/또는 사람 또는 동물에게 임의의 실질적인 의학적 이득없이 그들에게 고통을 초래할 가능성이 있는 동물의 유전자 정체성을 변형시키기 위한 방법, 및 또한 이러한 방법으로 얻은 동물은 배제될 수 있다. 일반적으로, 코돈 최적화는 천연 아미노산 서열을 유지하면서 그 숙주 세포의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 천연 서열의 적어도 하나의 코돈 (예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 이상의 코돈)을 치환시켜서 관심 숙주 세포에서 증강된 발현을 위해 핵산 서열을 변형시키는 방법에 관한 것이다. 다양한 종은 특정 아미노산의 일정 코돈에 대한 특정한 편향성을 나타낸다. 코돈 편향성 (유기체 간 코돈 용법의 편차)은 특정 운반 RNA (tRNA) 분자의 이용률 및 번역되는 코돈의 성질에 의존적이라고 여겨지는, 전령 RNA (mRNA)의 번역의 효율성과 종종 상관있다. 세포에서 선택된 tRNA의 우세성은 일반적으로 펩티드 합성에서 가장 빈번하게 사용되는 코돈의 반영이다. 따라서, 유전자는 코돈 최적화를 기반으로 소정 유기체에서의 최적 유전자 발현을 위해 재단될 수 있다. 코돈 용법표는 예를 들어 kazusa.orjp/codon/에서 이용가능한 "코돈 용법 데이터베이스"에서 쉽게 이용가능하고 이들 표는 다수의 방식으로 적합화될 수 있다. [Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)]을 참조한다. 특정 숙주 세포에서 발현을 위해 특정 서열을 코돈 최적화하기 위한 컴퓨터 알고리즘이 또한 이용가능하고, 예컨대 Gene Forge (Aptagen; Jacobus, PA)가 또한 이용가능하다. 일부 구현예에서, Cas를 코딩하는 서열에서 하나 이상의 코돈 (예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 이상, 또는 모든 코돈)은 특정 아미노산에 대해 가장 빈번하게 사용되는 코돈에 상응한다.
일정 구현예에서, 본 명세서에 기술된 바와 같은 방법은 하나 이상의 가이드 RNA를 코딩하는 하나 이상의 핵산이 하나 이상의 관심 유전자의 프로모터를 포함하는 조절 엘리먼트와 세포에서 작동적으로 연결되어 도입되거나 또는 제공되는 Cas 유전자이식 세포를 제공하는 단계를 포함할 수 있다. 본 명세서에서 사용되는 용어 "Cas 유전자이식 세포"는 Cas 유전자가 게놈에 통합된 진핵생물 세포 같은, 세포를 의미한다. 세포의 속성, 유형, 또는 기원은 본 발명에 따라서 특별히 제한되지 않는다. 또한 Cas 이식유전자가 세포에 도입되는 방식은 다양할 수 있고 당분야에 공지된 바와 같은 임의의 방법일 수 있다. 일정 구현예에서, Cas 유전자이식 세포는 단리된 세포에서 Cas 이식유전자를 도입시켜서 수득된다. 일정한 다른 구현예에서, Cas 유전자이식 세포는 Cas 유전자이식 유기체로부터 세포를 단리하여 수득된다. 예로서, 제한없이, 본 명세서에서 지칭되는 Cas 유전자이식 세포는 Cas 녹-인 진핵생물 같은, Cas 유전자이식 진핵생물로부터 유래될 수 있다. 참조로 본 명세서에 편입되는 WO 2014/093622 (PCT/US13/74667)를 참조한다. Rosa 유전자좌의 표적화에 관한 Sangamo BioSciences, Inc.에게 양도된 미국 특허 출원 제20120017290호 및 제20110265198호의 방법은 본 발명의 CRISPR Cas 시스템을 이용하기 위해 변형될 수 있다. Rosa 유전자좌의 표적화에 관한 Cellectis에게 양도된 미국 특허 출원 제20130236946호의 방법은 또한 본 발명의 CRISPR Cas 시스템을 이용하도록 변형될 수 있다. Cas9 녹-인 마우스를 기술하는, [Platt et. al. (Cell; 159(2):440-455 (2014))]을 추가의 예로 참조하며, 이를 참조로 본 명세서에 편입시킨다. Cas 이식유전자는 Lox-Stop-polyA-Lox(LSL) 카세트를 더 포함할 수 있어서, Cre 리콤비나제에 의해 Cas 발현을 유도시킬 수 있다. 대안적으로, Cas 유전자이식 세포는 단리된 세포에 Cas 이식유전자를 도입시켜 수득될 수 있다. 이식유전자를 위한 전달 시스템은 당분야에 충분히 공지되어 있다. 예로서, Cas 이식유전자는 본 명세서의 다른 곳에도 기술된 바와 같이, 벡터 (예를 들어, AAV, 아데노바이러스, 렌티바이러스) 및/또는 입자 및/또는 나노입자 전달을 통해서 예를 들어 진핵생물 세포에 전달될 수 있다.
본 명세서에서 지칭되는 Cas 유전자이식 세포와 같은 세포는 유전자좌로 Cas를 가이드할 수 있는 RNA와 복합체 형성시 Cas의 서열 특이적 작용으로부터 발생된 돌연변이 또는 통합된 Cas 유전자를 갖는 것 이외에도 게놈 변경을 더 포함할 수 있다는 것은 당업자가 이해하게 될 것이다.
일정 양상에서 본 발명은 예를 들어 Cas를 유전자좌로 가이드할 수 있는 Cas 및/또는 RNA (즉, 가이드 RNA)를 세포에 전달 또는 도입시킬뿐만 아니라, 또한 이들 성분을 (예를 들어, 원핵생물 세포에서) 전파시키기 위한 벡터를 포함한다. 본 명세서에서 사용되는 "벡터"는 한 환경에서 다른 곳으로 독립체의 전달을 허용하거나 또는 촉진하는 도구이다. 이것은 다른 DNA 절편이 삽입된 절편의 복제를 일어나게 하도록 삽입될 수 있는, 플라스미드, 파지, 또는 코스미드와 같은 레플리콘이다. 일반적으로, 벡터는 적절한 제어 엘리먼트와 회합될 때 복제될 수 있다. 일반적으로, 용어 "벡터"는 이것이 연결된 다른 핵산을 수송할 수 있는 핵산 분자를 의미한다. 벡터는 제한없이, 단일 가닥, 이중 가닥, 또는 부분적 이중 가닥인 핵산 분자; 하나 이상의 유리 말단을 포함하거나, 유리 말단이 없는 (예를 들어, 원형), 핵산 분자; DNA, RNA, 또는 둘 모두를 포함하는 핵산 분자; 및 당분야에 공지된 다른 다양한 폴리뉴클레오티드를 포함한다. 한가지 유형의 벡터는 "플라스미드"로서, 예컨대 표준 분자 클로닝 기술을 통해서 추가의 DNA 절편이 삽입될 수 있는 원형 이중 가닥 DNA 루프를 의미한다. 다른 유형의 벡터는 바이러스 벡터인데, 바이러스-유래 DNA 또는 RNA 서열이 바이러스 (예를 들어, 레트로바이러스, 복제 결핍 레트로바이러스, 아데노바이러스, 복제 결핍 아데노바이러스, 및 아데노-연합 바이러스 (AAV))로 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포로 형질감염을 위해 바이러스에 의해 운반되는 폴리뉴클레오티드를 포함한다. 일정 벡터는 그들이 도입되는 숙주 세포에서 자가 복제될 수 있다 (예를 들어, 박테리아 복제 기원을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터 (예를 들어, 비-에피솜 포유동물 벡터)는 숙주 세포에 도입 시 숙주 세포의 게놈으로 통합되어서, 숙주 게놈과 함께 복제된다. 게다가, 일정 벡터는 그들이 작동적으로 연결된 유전자의 발현을 유도시킬 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"라고 한다. 재조합 DNA 기술에서 유용성이 있는 일반 발현 벡터는 종종 플라스미드의 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있고, 이것은 재조합 발현 벡터가 발현시키고자 하는 핵산 서열에 작동적으로 연결된, 발현에 사용하려는 숙주 세포를 기반으로 선택될 수 있는, 하나 이상의 조절 엘리먼트를 포함한다는 것을 의미한다. 재조합 발현 벡터에서, "작동적으로 연결된"은 관심 뉴클레오티드 서열이 뉴클레오티드 서열의 발현을 허용하는 방식으로 (예를 들어, 시험관내 전사/번역 시스템 또는 벡터가 숙주 세포에 도입된 경우 숙주 세포에서) 조절 엘리먼트(들)에 연결된다는 것을 의미한다. 재조합 및 클로닝 방법과 관련하여, 그 전문이 참조로 본 명세서에 편입되는, 2004년 9월 2일에 US 2004-0171156 A1로서 공개된, 미국 특허 출원 제10/815,730호를 참조한다. 따라서, 본 명세서에 개시된 구현예는 또한 CRISPR 이펙터 시스템을 포함하는 유전자이식 세포를 포함할 수 있다. 일정 예의 구현예에서, 유전자이식 세포는 개별 이산 부피로서 기능할 수 있다. 다른 말로, 차폐성 구성체를 포함하는 샘플은 예를 들어 적합한 전달 소포체로 세포에 전달될 수 있고 표적이 전달 소포체에 존재하면 CRISPR 이펙터는 활성화되고 검출가능한 신호를 생성시킨다.
벡터(들)는 조절 엘리먼트(들), 예를 들어 프로모터(들)를 포함할 수 있다. 벡터(들)는 Cas 코딩 서열을 포함할 수 있고, 있거나, 하나, 가능하게는 또한 적어도 3 또는 8 또는 16 또는 32 또는 48 또는 50 가이드 RNA(들) (예를 들어, sgRNA) 코딩 서열, 예컨대 1-2, 1-3, 1-4 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-8, 3-16, 3-30, 3-32, 3-48, 3-50 RNA(들) (예를 들어, sgRNA) 코딩 서열을 포함할 수 있다. 단일 벡터에는 유리하게 최대 약 16 RNA(들)가 존재하는 경우에, 각 RNA (예를 들어, sgRNA)에 대한 프로모터가 존재할 수 있고; 단일 벡터가 16 초과의 RNA(들)를 제공할 때, 하나 이상의 프로모터(들)가 하나 초과의 RNA(들)의 발현을 구동시킬 수 있으며, 예를 들어 32 RNA(들)가 존재할 때, 각각의 프로모터는 2 RNA(들)의 발현을 구동시킬 수 있고, 48 RNA(들)가 존재할 때, 각각의 프로모터는 3 RNA(들)의 발현을 구동시킬 수 있다. 단순한 산술 및 충분히 확립된 클로닝 프로토콜 및 본 개시의 교시를 통해서 당업자는 U6 프로모터와 같은 적합한 프로모터, 및 AAV와 같은 적합한 예시적인 벡터에 대해 RNA(들)에 관해 본 발명을 쉽게 실시할 수 있다. 예를 들어, AAV의 패키징 한계는 ∼4.7 kb이다. 단일 U6-gRNA의 길이 (클로닝용 제한효소 부위 더함)는 361 bp이다. 그러므로, 당업자는 단일 벡터에 약 12-16, 예를 들어 13 U6-gRNA 카세트를 쉽게 적합화시킬 수 있다. 이것은 TALE 어셈블리 (genome-engineering.org/taleffectors/)에서 사용되는 골든 게이트 전략 같은, 임의의 적합한 수단으로 어셈블리될 수 있다. 당업자는 또한 U6-gRNA의 수를 대략 1.5배까지, 증가시키고, 예를 들어, 12-16, 예를 들어, 13에서 대략 18-24, 예를 들어, 약 19의 U6-gRNA 까지 증가시키는 탠덤 가이드 전략을 사용할 수 있다. 그러므로, 당업자는 단일 벡터, 예를 들어 AAV 벡터 내에서 대략 18-24, 예를 들어, 약 19 프로모터-RNA, 예를 들어, U6-gRNA에 쉽게 도달할 수 있다. 벡터에서 RNA 및 프로모터의 수를 증가시키기 위한 추가 수단은 절단가능한 서열에 의해 이격된 RNA의 어레이를 발현시키기 위해 단일 프로모터 (예를 들어, U6)를 사용하는 것이다. 그리고 벡터에서 프로모터-RNA의 수를 증가시키기 위한 추가 수단은 코딩 서열 또는 유전자의 인트론에서 절단가능한 서열에 의해 이격된 프로모터-RNA의 어레이를 발현시키는 것이고; 이러한 예에서 조직 특이적 방식으로 긴 RNA의 전달을 가능하게 하고 발현을 증가시킬 수 있는 중합효소 II 프로모터를 사용하는 것이 유리하다 (예를 들어, nar.oxfordjournals.org/content/34/7/e53.short 및 nature.com/mt/journal/v16/n9/abs/mt2008144a.html 참조). 유리한 구현예에서, AAV는 최대 약 50 유전자를 표적화하는 U6 탠덤 gRNA를 패키징할 수 있다. 따라서, 당분야의 지식 및 본 개시의 교시로부터 당업자는 특히 임의의 과도한 실험없이, 본 명세서에서 논의되는 RNA 또는 가이드의 수에 대해서, 하나 이상의 프로모터에 작동적으로 또는 기능적으로 연결되거나 또는 그의 제어 하에서 다수의 RNA 또는 가이드를 발현하는 벡터(들), 예를 들어 단일 벡터를 쉽게 만들고 사용할 수 있다.
가이드 RNA(들) 코딩 서열 및/또는 Cas 코딩 서열은 조절 엘리먼트(들)에 기능적으로 또는 작동적으로 연결될 수 있고 그리하여 조절 엘리먼트(들)는 발현을 구동시킨다. 프로모터(들)는 항상성 프로모터(들) 및/또는 조건화 프로모터(들) 및/또는 유도성 프로모터(들) 및/또는 조직 특이적 프로모터(들)일 수 있다. 프로모터는 RNA 중합효소, pol I, pol II, pol III, T7, U6, H1, 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터, 사이토메갈로바이러스 (CMV) 프로모터, SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, 및 EF1α 프로모터로 이루어진 군으로부터 선택될 수 있다. 유리한 프로모터는 U6 프로모터이다.
CRISPR-Cas 단백질은 추가로 변형될 수 있다. CRISPR-Cas 단백질에 대해서 본 명세서에서 사용되는 용어 "변형된"은 일반적으로 이것이 유래된 야생형 Cas 단백질과 비교하여 하나 이상의 변형 또는 돌연변이 (점 돌연변이, 절두, 삽입, 결실, 키메라, 융합 단백질 등 포함)를 갖는 CRISPR-Cas 단백질을 의미한다. 유래된이란 유래된 효소가 높은 정도의 서열 상동성을 갖는다는 의미에서, 대체로 야생형 효소를 기반으로 하지만, 당분야에 공지된 바와 같이 또는 본 명세서에 기술된 바와 같이 일부 방식으로 돌연변이된 (변형된) 것을 의미한다.
CRISPR-Cas 단백질의 추가 변형은 변경된 기능성을 초래할 수도 있거나 또는 그렇지 않을 수도 있다. 예로서, 특히 CRISPR-Cas 단백질을 참조하여, 변경된 기능성을 야기시키지 않는 변형은 예를 들어 특정 숙주에서 발현을 위한 코돈 최적화, 또는 뉴클레아제에 특정 마커 (예를 들어, 가시화용)의 제공을 포함한다. 변경된 기능성을 야기시킬 수 있는 변형은 또한 키메라 뉴클레아제 (예를 들어, 상이한 오솔로그 또는 상동체 유래 도메인 포함) 또는 융합 단백질을 비롯하여, 점 돌연변이, 삽입, 결실, 절두 (분할 뉴클레아제 포함) 등을 포함한, 돌연변이를 포함할 수 있다. 융합 단백질은 제한없이 예를 들어 이종성 도메인 또는 기능성 도메인 (예를 들어, 국재화 신호, 촉매 도메인 등)과의 융합을 포함할 수 있다. 일정 구현예에서, 다양한 상이한 변형은 조합될 수 있다 (예를 들어, 촉매적으로 불활성이고, 예컨대 예를 들어 DNA 메틸화, 또는 예컨대 제한없이 파단 (예를 들어, 상이한 뉴클레아제 (도메인)에 의함), 돌연변이, 결실, 삽입, 치환, 결찰, 분해, 파단 또는 재조합을 포함한, 다른 핵산 변형을 유도하기 위해 기능성 도메인에 융합된 돌연변이된 뉴클레아제). 본 명세서에서 사용되는 "변경된 기능성"은 제한없이 변경된 특이성 (예를 들어, 변경된 표적 인식, 증가 (예를 들어, "증강된" Cas 단백질) 또는 감소된 특이성, 또는 변경된 PAM 인식), 변경된 활성 (예를 들어, 촉매적으로 불활성인 뉴클레아제 또는 닉카제를 포함하는 증가 또는 감소된 촉매 활성), 및/또는 변경된 안정성 (예를 들어, 탈안정화 도메인과 융합)을 포함한다. 적합한 이종성 도메인은 제한없이 뉴클레아제, 리가제, 복구 단백질, 메틸트랜스퍼라제, (바이러스) 인테그라제, 리콤비나제, 트랜스포사제, 아르고노트, 시티딘 디아미나제, 레트론, 그룹 II 인트론, 포스파타제, 포스포릴라제, 술프퓨릴라제, 키나제, 중합효소, 엑소뉴클레아제 등을 포함한다. 모든 이들 변형의 예는 당분야에 공지되어 있다. 본 명세서에 언급된 바와 같은 "변형된", 및 특히 "변형된" Cas 또는 "변형된" CRISPR-Cas 시스템 또는 복합체는 바람직하게 여전히 (예를 들어, 가이드 분자와의 복합체로) 폴리핵산과 상호작용 또는 결합하는 능력을 갖는다는 것을 이해할 것이다. 이러한 변형된 Cas 단백질은 본 명세서에 기술된 바와 같이 디아미나제 단백질 또는 이의 활성 도메인과 조합될 수 있다.
일정 구현예에서, CRISPR-Cas 단백질은 예컨대 표적 또는 비표적 가닥을 안정화시키는 돌연변이 잔기를 포함하여, 활성 및/또는 특이성을 증강시키는 하나 이상의 변형을 포함할 수 있다 (예를 들어, 그 전문이 참조로 본 명세서에 편입되는 [eCas9; "Rationally engineered Cas9 nucleases with improved specificity", Slaymaker et al. (2016), Science, 351(6268):84-88] 참조). 일정 구현예에서, 조작된 CRISPR 단백질의 변경되거나 또는 변형된 활성은 증가된 표적화 효율 또는 감소된 오프-표적 결합성을 포함한다. 일정 구현예에서, 조작된 CRISPR 단백질의 변경된 활성은 변형된 절단 활성을 포함한다. 일정 구현예에서, 변경된 활성은 표적 폴리뉴클레오티드 유전자좌에 대해 증가된 절단 활성을 포함한다. 일정 구현예에서, 변경된 활성은 표적 폴리뉴클레오티드 유전자좌에 대해 감소된 절단 활성을 포함한다. 일정 구현예에서, 변경된 활성은 오프-표적 폴리뉴클레오티드 유전자좌에 대해 감소된 절단 활성을 포함한다. 일정 구현예에서, 변형된 뉴클레아제의 변경되거나 또는 변형된 활성은 변경된 헬리카제 동역학을 포함한다. 일정 구현예에서, 변형된 뉴클레아제는 RNA (Cas 단백질의 경우), 또는 표적 폴리뉴클레오티드 유전자좌의 가닥, 또는 오프-표적 폴리뉴클레오티드 유전자좌의 가닥을 포함하는 핵산 분자와 단백질의 회합을 변경시키는 변형을 포함한다. 본 발명의 일 양상에서, 조작된 CRISPR 단백질은 CRISPR 복합체의 형성을 변경시키는 변형을 포함한다. 일정 구현예에서, 변경된 활성은 오프-표적 폴리뉴클레오티드 유전자좌에 대해 증가된 절단 활성을 포함한다. 따라서, 일정 구현예에서, 오프-표적 폴리뉴클레오티드 유전자좌와 비교하여 표적 폴리뉴클레오티드 유전자좌에 대해 증가된 특이성이 존재한다. 다른 구현예에서, 오프-표적 폴리뉴클레오티드 유전자좌에 비해서 표적 폴리뉴클레오티드 유전자좌에 대해 감소된 특이성이 존재한다. 일정 구현예에서, 돌연변이는 감소된 오프-표적 효과 (예를 들어, 절단 또는 결합 성질, 활성, 또는 동역학)를 야기하며, 예컨대 Cas 단백질의 경우에 예를 들어 표적과 가이드 RNA 간 미스매치에 대해 더 낮은 내성을 야기시킨다. 다른 돌연변이는 증가된 오프-표적 효과 (예를 들어, 절단 또는 결합 성질, 활성, 또는 동역학)를 야기시킬 수 있다. 다른 돌연변이는 증가되거나 또는 감소된 온-표적 효과 (예를 들어, 절단 또는 결합 성질, 활성, 또는 동역학)를 야기시킬 수 있다. 일정 구현예에서, 돌연변이는 변경된 (예를 들어, 증가 또는 감소된) 헬리카제 활성, 기능적 뉴클레아제 복합체 (예를 들어, CRISPR-Cas 복합체)의 회합 또는 형성을 야기시킨다. 일정 구현예에서, 돌연변이는 변경된 PAM 인식을 야기시키고, 즉 상이한 PAM은 (추가로 또는 대안으로) 비변형된 Cas 단백질과 비교하여, 인식될 수 있다 (예를 들어, 참조로 그 전문이 본 명세서에 편입되는 ["Engineered CRISPR-Cas9 nucleases with altered PAM specificities", Kleinstiver et al. (2015), Nature, 523(7561):481-485] 참조). 특히 바람직한 돌연변이는 특이성을 증강시키기 위해서, 보존된 양으로 하전된 잔기 같은, 양으로 하전된 잔기 및/또는 (진화적) 보존된 잔기를 포함한다. 일정 구현예에서, 이러한 잔기는 비하전된 잔기, 예컨대 알라닌으로 돌연변이될 수 있다.
Cas9 기반 닉카제
일정 구현예에서, CRISPR 닉카제는 Cas9 기반 닉카제이다. Cas9 유전자는 몇몇 다양한 박테리아 게놈, 특히 cas1, cas2, 및 cas4 유전자와 동일한 유전자좌 및 CRISPR 카세트에서 발견된다. 더 나아가서, Cas9 단백질은 트랜스포존ORF-B와 상동성인 쉽게 식별가능한 C-말단 영역을 함유하고 활성 RuvC-유사 뉴클레아제, 아르기닌-풍부 영역을 포함한다.
특정 구현예에서, 닉카제는 스트렙토코커스 (Streptococcus), 캄필로박터 (Campylobacter), 니트라티프락토르 (Nitratifractor), 스타필로코커스 (Staphylococcus), 파르비바큘럼 (Parvibaculum), 로세부리아 (Roseburia), 네이세리아 (Neisseria), 글루콘아세토박터 (Gluconacetobacter), 아조스피릴럼 (Azospirillum), 스파에로카에타 (Sphaerochaeta), 락토바실러스 (Lactobacillus), 유박테리움 (Eubacterium), 또는 코리네박터 (Corynebacte)를 포함하는 속으로부터의 유기체 유래의 Cas9 닉카제이다.
특정 구현예에서, 닉카제는 카르노박테리움 (Carnobacterium), 로도박터 (Rhodobacter), 리스테리아 (Listeria), 팔루디박터 (Paludibacter), 클로스트리듐 (Clostridium), 라크노스피라세아에 (Lachnospiraceae), 클로스트리디아리듐 (Clostridiaridium), 렙토트리키아 (Leptotrichia), 프란시셀라 (Francisella), 레지오넬라 (Legionella), 알리시클로바실러스 (Alicyclobacillus), 메타노메티오필러스 (Methanomethyophilus), 포르피로모나스 (Porphyromonas), 프레보텔라 (Prevotella), 박테로이데테스 (Bacteroidetes), 헬코코커스 (Helcococcus), 렙토스피라 (Letospira), 데술포비브리오 (Desulfovibrio), 데술포나트로넘 (Desulfonatronum), 오피투타세아에 (Opitutaceae), 투버리바실러스 (Tuberibacillus), 바실러스 (Bacillus), 브레비바실러스 (Brevibacilus), 메틸로박테리움 (Methylobacterium) 또는 악시다미노코커스 (Acidaminococcus)를 포함하는 속으로부터의 유기체 유래의 Cas9 닉카제이다.
추가의 특정 구현예에서, Cas9 닉카제는 에스. 뮤탄스, 에스. 아갈락티아에, 에스. 에퀴시밀리스, 에스. 산귀니스, 에스. 뉴모니아; 씨. 제주니, 씨. 콜라이; 엔. 살수기니스, 엔. 테르가르쿠스; 에스. 아우리쿨라리스, 에스. 카르노서스; 엔. 메닌지티데스, 엔. 고노로에아에; 엘. 모노시토게네스, 엘. 이바노비이; 씨. 보툴리넘, 씨. 디피실, 씨. 테타니, 씨. 소르델리이로부터 선택된 유기체에서 유래된다. 특정 구현예에서, 닉카제는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스, 또는 스트렙토코커스 써모필러스 유래의 유기체로부터의 Cas9 유래의 Cas9 닉카제이다.
닉카제는 제1 이펙터 단백질 (예를 들어, Cas9) 오솔로그 유래의 제1 단편 및 제2 이펙터 (예를 들어, Cas9) 단백질 오솔로그 유래의 제2 단편을 포함하는 키메라 단백질을 포함할 수 있고, 제1 및 제2 이펙터 단백질 오솔로그는 상이하다. 제1 및 제2 이펙터 단백질 (예를 들어, Cas9) 오솔로그 중 적어도 하나는 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바큘럼, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴럼, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리듐, 라크노스피라세아에, 클로스트리디아리듐, 렙토트리키아, 프란시셀라, 레지오넬라, 알리시클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 렙토스피라, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 악시다미노코커스를 포함하는 유기체로부터의 이펙터 단백질 (예를 들어, Cas9)을 포함할 수 있고; 예를 들어, 키메라 이펙터 단백질은 제1 단편 및 제2 단편을 포함하고, 여기서 제1 및 제2 단편의 각각은 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바큘럼, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴럼, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리듐, 라크노스피라세아에, 클로스트리디아리듐, 렙토트리키아, 프란시셀라, 레지오넬라, 알리시클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 렙토스피라, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 악시다미노코커스를 포함하는 유기체의 Cas9로부터 선택되고, 제1 및 제2 단편은 동일한 박테리아로부터의 것이 아니고; 예를 들어 키메라 이펙터 단백질은 제1 단편 및 제2 단편을 포함하고, 여기서 제1 및 제2 단편의 각각은 에스. 뮤탄스, 에스. 아갈락티아에, 에스. 에퀴시밀리스, 에스. 산귀니스, 에스. 뉴모니아; 씨. 제주니, 씨. 콜라이; 엔. 살수기니스, 엔. 테르가르쿠스; 에스. 아우리쿨라리스, 에스. 카르노서스; 엔. 메닌지티데스, 엔. 고노로에아에; 엘. 모노시토게네스, 엘. 이바노비이; 씨. 보툴리넘, 씨. 디피실, 씨. 테타니, 씨. 소르델리이; 프란시셀라 툴라렌시스 1, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 sp. SCADC, 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에의 Cas9로부터 선택되고, 제1 및 제2 단편은 동일한 박테리아로부터의 것이 아니다.
보다 바람직한 구현예에서, Cas9 닉카제는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스, 또는 스트렙토코커스 써모필러스 Cas9로부터 선택되는 박테리아로부터 유래된다. 일정 구현예에서, Cas9p는 프란시셀라 툴라렌시스 1, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 sp. SCADC, 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에로부터 선택되는 박테리아 종으로부터 유래된다. 일정 구현예에서, Cas9p는 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020로부터 선택되는 박테리아 종으로부터 유래된다. 일정 구현예에서, 이펙터 단백질은 제한없이 프란시셀라 툴라렌시스 subsp. 노비시다를 포함하는, 프란시셀라 툴라렌시스 1의 아종으로부터 유래된다.
특정 구현예에서, 본 명세서에서 언급되는 Cas9의 상동체 또는 오솔로그는 Cas9와 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 Cas9의 상동체 또는 오솔로그는 야생형 Cas9와 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다. Cas9가 하나 이상의 돌연변이를 갖는 (돌연변이된) 경우, 본 명세서에 언급된 상기 Cas9의 상동체 또는 오솔로그는 돌연변이된 Cas9와 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
일 구현예에서, Cas9 닉카제는 제한없이 스트렙토코커스 sp. 또는 스타필로코커스 sp.를 포함하는 속의 유기체의 오솔로그일 수 있고; 특정 구현예에서, Cas9 단백질은 제한없이 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스, 또는 스트렙토코커스 써모필러스 Cas9를 포함한 종의 유기체의 오솔로그일 수 있다. 특정 구현예에서, 본 명세서에서 언급되는 Cas9p의 상동체 또는 오솔로그는 본 명세서에 개시된 Cas9 서열 중 하나 이상과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 Cas9의 상동체 또는 오솔로그는 야생형 SpCas9, SaCas9 또는 StCas9와 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 본 발명의 Cas9 닉카제는 SpCas9, SaCas9 또는 StCas9와 적어도 60%, 보다 특히 적어도 70%, 예컨대 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 Cas9 단백질은 야생형 SpCas9, SaCas9 또는 StCas9와 적어도 60%, 예컨대 적어도 70%, 보다 특히 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다. 당업자는 이것이 Cas9 단백질의 절두된 형태를 포함하여서, 서열 동일성이 절두된 형태의 길이 상에서 결정된다는 것을 이해하게 될 것이다.
변형된 Cas9 단백질
특정 구현예에서, 본 명세서에 정의된 바와 같은 조작된 Cas9 단백질, 예컨대 Cas9를 만드는 것에 관심이 있고, 이 단백질은 RNA를 포함하는 핵산 분자와 복합체를 형성하여 CRISPR 복합체가 형성되고, CRISPR 복합체로 있을 때, 핵산 분자는 하나 이상의 표적 폴리뉴클레오티드 유전자를 표적화하고, 단백질은 비변형된 Cas9 단백질과 비교하여 적어도 하나의 변형을 포함하며, 변형된 단백질을 포함하는 CRISPR 복합체는 비변형된 Cas9 단백질을 포함하는 복합체와 비교하여 변경된 활성을 갖는다. 본 명세서에서 CRISPR "단백질"을 언급할 때, Cas9 단백질은 바람직하게 예컨대 제한없이 Cas9를 포함하여, 변형된 CRISPR-Cas 단백질 (예를 들어, 증가되거나 또는 감소되거나 (전무한) 효소 활성을 가짐)이라는 것을 이해한다. 용어 "CRISPR 단백질"은 CRISPR 단백질이 야생형 CRISPR 단백질과 비교하여 변경, 예컨대 증가 또는 감소된 (또는 전무한) 효소 활성을 갖는지 여부와 무관하게, "CRISPR-Cas 단백질"과 상호교환적으로 사용될 수 있다.
Cas9 1차 구조 내에서 몇가지 비구조화된 영역의 소형 스트레치가 예측된다. 용매에 노출되고 상이한 Cas9 오솔로그 내에서 보존되지 않은, 비구조화된 영역은 소형 단백질 서열의 삽입 및 분할을 위해 바람직한 측면이다. 또한, 이들 측면은 Cas9 오솔로그 간에 키메라 단백질을 생성시키는데 사용될 수 있다.
상기 정보를 기반으로, 효소의 불활성화를 야기시키거나 또는 이중 가닥 뉴클레아제를 닉카제 활성으로 변형시킨 돌연변이체를 생성시킬 수 있다. 대안적인 구현예에서, 이러한 정보는 (본 명세서의 다른 곳에 기술된) 감소된 오프-표적 효과를 갖는 효소를 개발하는데 사용된다.
특히 오프-표적 효과를 감소시켜서, 특이성을 증강시키는 적합한 Cas9 효소 변형은 예를 들어 그 전문이 참조로 본 명세서에 편입되는 PCT/US2016/038034에 기술된다. 특정 구현예에서, 오프-표적 절단의 감소는 가닥 분리를 탈안정화시켜서, 보다 특히 DNA 상호작용 영역 내에서 양전하를 감소시키는 돌연변이를 Cas9 효소에 도입시켜서 보장된다 (본 명세서에서 기술되고 [Slaymaker et al. 2016 (Science, 1;351(6268):84-8)]에서 Cas9에 의해 더욱 예시한 바와 같음). 추가 구현예에서, 오프-표적 절단의 감소는 표적 가닥과 가이드 RNA 서열 간 상호작용에 영향을 미치는 돌연변이를 Cas9 효소에 도입시켜서, 보다 특히 표적 특이적 활성은 유지하지만 오프-표적 활성은 감소시키는 방식으로 표적 DNA 가닥의 포스페이트 골격과 Cas9 사이의 상호작용을 파괴시킴으로써 보장된다 ([Kleinstiver et al. 2016, Nature, 28;529(7587):490-5]에서 Cas9에 대해 기술된 바와 같음). 특정 구현예에서, 오프-표적 활성은 변형된 Cas9에 의해 감소되고 여기서 표적 가닥 및 비-표적 가닥과의 상호작용 둘 모두는 야생형 Cas9와 비교하여 변형된다.
온-표적 대 오프-표적 활성의 특이성 및/또는 활성을 증가 또는 감소시키기 위해서, 또는 온-표적 대 오프-표적 결합의 특이성 및/또는 결합성을 증가 또는 감소시키기 위해서, 다양한 조합으로 적용될 수 있는 방법 및 돌연변이는 다른 효과를 촉진시키기 위해 만들어진 돌연변이 또는 변형을 보상하거나 또는 증강시키는데 사용될 수 있다. 다른 효과를 촉진시키기 위해 만들어진 이러한 돌연변이 또는 변형은 Cas9 이펙터 단백질에 대한 돌연변이 또는 변형 및 가이드 RNA에 대해 만들어진 돌연변이 또는 변형을 포함한다.
Cas9 특이성을 개선시키기 위해 사용되는 유사한 전략 (Slaymaker et al. 2015 "Rationally engineered Cas9 nucleases with improved specificity")을 사용하여, Cas9의 특이성은 비-표적화된 DNA 가닥을 안정화시키는 잔기를 돌연변이시켜서 더욱 개선시킬 수 있다. 이것은 1) Cas9의 어떠한 도메인이 DNA의 어떠한 가닥에 결합하고, 2) 이들 도메인 내 어떠한 잔기가 DNA와 접촉하는가를 예측하기 위해 선형 구조 정렬을 사용하여 결정 구조없이 수행될 수 있다.
그러나, 이러한 접근법은 기지의 단백질과 Cas9의 불충분한 보존성으로 인해서 제한적일 수 있다. 따라서, 모든 가능한 DNA 상호작용 아미노산 (리신, 히스티딘, 및 아르기닌)의 기능을 증명하는 것이 바람직할 수 있다.
촉매적 활성 Cas9 단백질은 블런트 절단부를 생성시키고, 그리하여 절단 부위는 전형적으로 표적 서열 내에 존재한다. 보다 특히, 블런트 절단부는 전형적으로 PAM의 상류의 2-3개 뉴클레오티드이다. 특정 구현예에서, 비-표적 가닥 상의 절단부는 PAM의 상류의 3개 뉴클레오티드 (즉, PAM의 상류에서 3번째 및 4번째 뉴클레오티드)이고, 표적 가닥 상의 절단부 (즉, 가이드 서열과 하이브리드화하는 가닥)는 상보성 가닥 상의 동일 위치에서 발생된다 (이것은 3' 가닥 상의 PAM의 상보체의 상류의 3개 뉴클레오티드 또는 PAM의 상보체의 상류의 뉴클레오티드 3 내지 4에 있음).
일정 구현예에서, Cas9 단백질의 하나 이상의 촉매 도메인 (예를 들어, Cas9 단백질의 RuvC I, RuvC II, 및 RuvC III 또는 HNH 도메인)은 표적 서열의 오직 하나의 DNA 가닥을 절단하는 돌연변이된 Cas 단백질을 생성시키도록 돌연변이된다.
추가의 지침을 통해서, 제한없이, 예를 들어, 에스. 피오게네스 (S. pyogenes) 유래 Cas9의 RuvC I 촉매 도메인에서 아스파테이트에서 알라닌으로의 치환 (D10A)은 Cas9를 양쪽 가닥을 절단시키는 뉴클레아제에서 닉카제 (단일 가닥 절단)로 전환시킨다. Cas9를 닉카제가 되게 하는 돌연변이의 다른 예는 제한없이, H840A, N854A, 및 N863A를 포함한다. 추가 지침으로서, 효소가 SpCas9가 아닌 경우에, 돌연변이는 (예를 들어 표준 서열 비교 도구를 통해서 확인할 수 있는) spCas9의 위치 10, 762, 840, 854, 863 및/또는 986에 상응하는 임의의 또는 모든 잔기에서 만들어질 수 있다. 특히, SpCas9에서 임의의 또는 모든 하기 돌연변이: D10A, E762A, H840A, N854A, N863A 및/또는 D986A가 바람직할 뿐만 아니라; 임의의 치환 아미노산에 대한 보존적 치환이 또한 고려된다.
제1의 바람직한 구현예에서, CRISPR-Cas 단백질은 촉매적 불활성 HNH 도메인을 갖는 SpCas9 닉카제 (예를 들어, N863A 돌연변이를 갖는 SpCas9 닉카제)이다. 제2의 바람직한 구현예에서, CRISPR-Cas 단백질은 촉매적 불활성 HNH 도메인을 갖는 SaCas9 (예를 들어, N580A 돌연변이를 갖는 SaCas9 닉카제)이다. 제3의 바람직한 구현예에서, CRISPR-Cas 단백질은 부분적으로 또는 완전히 제거된 HNH 도메인을 갖는 SpCas9 닉카제이다. 제4의 바람직한 구현예에서, CRISPR-Cas 단백질은 부분적으로 또는 완전히 제거된 HNH 도메인을 갖는 SaCas9이다.
상기 기술된 일정 Cas9 효소에서, 효소는 FnCas9 단백질 또는 임의의 상응하는 오솔로그에 따라서, 제한없이 위치 D917, E1006, E1028, D1227, D1255A, N1257을 포함하는 하나 이상의 잔기의 돌연변이에 의해 변형된다. 일 양상에서, 본 발명은 본 명세서에서 논의된 조성물을 제공하고, 여기서 Cas9 효소는 FnCas9 단백질에 따라서 D917A, E1006A, E1028A, D1227A, D1255A 및 N1257A 또는 Cas9 오솔로그 중 상응하는 위치로 이루어진 군으로부터 선택되는 하나 이상의 돌연변이를 포함하는 불활성화된 효소이다. 일 양상에서, 본 발명은 본 명세서에서 논의된 조성물을 제공하고, 여기서 CRISPR-Cas 단백질은 FnCas9 단백질에 따라서 D917, 또는 E1006 및 D917, 또는 D917 및 D1255, 또는 Cas9 오솔로그의 상응하는 위치를 포함한다.
일정 구현예에서, Cas9의 변형 또는 돌연변이는 RuvCI, RuvCIII, RuvCIII 또는 HNH 도메인 내 돌연변이를 포함한다. 일정 구현예에서, 변형 또는 돌연변이는 SpCas9의 아미노산 위치 번호매김에 대해서 위치 12, 13, 63, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311, 및 1325 중 하나 이상; 바람직하게 855; 810, 1003, 및 1060; 또는 848, 1003에서 아미노산 치환을 포함한다. 일정 구현예에서, 위치 63, 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311, 또는 1325; 바람직하게 855; 810, 1003, 및 1060; 848, 1003, 및 1060; 또는 497, 661, 695, 및 926에서 변형 또는 돌연변이는 알라닌 치환을 포함한다. 일정 구현예에서, 변형은 K855A; K810A, K1003A, 및 R1060A; 또는 K848A, K1003A (SpCas9에 대함), 및 R1060A를 포함한다. 일정 구현예에서, 일정 구현예에서, 변형은 N497A, R661A, Q695A, 및 Q926A (SpCas9에 대함)를 포함한다.
추가 예로서, Cas9의 둘 이상의 촉매 도메인 (RuvC I, RuvC II, 및 RuvC III 또는 HNH 도메인)은 모든 DNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas9를 생성시키도록 돌연변이될 수 있다. 일부 구현예에서, D10A 돌연변이는 모든 DNA 절단 활성이 실질적으로 결여된 Cas9 효소를 생성시키도록 H840A, N854A, 또는 N863A 돌연변이 중 하나 이상과 조합된다. 일부 구현예에서, CRISPR 효소는 돌연변이된 효소의 DNA 절단 활성이 이의 비돌연변이된 형태에 비해서 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하일 때 모든 DNA 절단 활성을 실질적으로 결여한 것으로 간주된다. 효소가 SpCas9가 아닌 경우, 돌연변이는 (예를 들어 표준 서열 비교 도구에 의해 확인할 수 있는) SpCas9의 위치 10, 762, 840, 854, 863 및/또는 986에 상응하는 임의의 또는 모든 잔기에서 만들어질 수 있다. 특히, SpCas9에서 임의의 또는 모든 하기 돌연변이: D10A, E762A, H840A, N854A, N863A 및/또는 D986A가 바람직하고; 뿐만 아니라 임의의 치환 아미노산에 대한 보존적 치환이 또한 고려된다. 다른 Cas9의 상응하는 위치에서 동일한 것 (또는 이들 돌연변이의 보존적 치환)이 또한 바람직하다. 특히 바람직한 것은 SpCas9의 D10 및 H840이다. 그러나, 다른 Cas9에서, SpCas9 D10 및 H840에 상응하는 잔기가 또한 바람직하다.
일정 구현예에서, 2종의 상이한 키메라 gRNA는 단일 키메라 gRNA를 사용하는 것과 유사한 효율성으로 표적 부위의 절단을 함께 도입시키게 되는 Cas9 닉카제와 함께 사용될 수 있다. 오프-표적 효과는 Cas9 닉카제가 야생형 Cas9처럼 이중 가닥 파단을 도입시키는 능력을 갖지 않기 때문에 이러한 방식으로 감소될 수 있다. 이러한 이중 닉킹 방법은 예를 들어 참조로 본 명세서에 편입되는, PCT 공개 번호 WO2014093622 및 WO2014204725에 기술되어 있다.
Cas12 단백질
일정 예의 구현예에서, 조성물, 시스템, 및 어세이는 하나 이상의 Cas9 오솔로그와 조합하여 다수의 Cas12 오솔로그 또는 하나 이상의 오솔로그를 포함할 수 있다. 일정 예의 구현예에서, Cas12 오솔로그는 Cpf1 오솔로그, C2c1오솔로그, 또는 C2c3 오솔로그이다.
Cpf1 오솔로그
본 발명은 아형 V-A로서 표시되는 Cpf1 유전자좌로부터 유래되는, 야생형 Cpf1 이펙터 단백질의 돌연변이된 형태를 기반으로 하는 닉카제의 사용을 포괄한다. 여기서 이러한 이펙터 단백질은 또한 "Cpf1p", 예를 들어, Cpf1 단백질이라고도 한다 (및 이러한 이펙터 단백질 또는 Cpf1 단백질 또는 Cpf1 유전자좌 유래 단백질은 "CRISPR 효소"라고도 함). 현재, 아형 V-A 유전자좌는 cas1, cas2, cpf1로 표시되는 별개 유전자 및 CRISPR 어레이를 포괄한다. Cpf1 (CRISPR-연관 단백질 Cpf1, 아형 PREFRAN)은 Cas9의 특징적인 아르기닌-풍부 클러스터에 대한 대응부와 함께 Cas9의 상응하는 도메인에 상동성인 RuvC-유사 뉴클레아제 도메인을 함유하는 대형 단백질 (약 1300개 아미노산)이다. 그러나, Cpf1은 모든 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여되고, HNH 도메인을 포함하는 긴 삽입부를 함유하는 Cas9와 대조적으로, RuvC-유사 도메인은 Cpf1 서열에서 인접한다. 따라서, 특정 구현예에서, CRISPR-Cas 효소는 오직 RuvC-유사 뉴클레아제 도메인만을 포함한다.
용어 "오솔로그" ("orthologue" 또는 "ortholog") 및 "상동체" ("homologue" 또는 "homolog")는 당분야에 충분히 공지되어 있다. 추가 지침으로, 본 명세서에서 사용되는 단백질의 "상동체"는 상동체인 단백질과 동일하거나 또는 유사한 기능을 수행하는 동일 종의 단백질이다. 그러나 상동성 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다. 본 명세서에서 사용되는 단백질의 "오솔로그"는 오솔로그인 단백질과 동일하거나 또는 상이한 기능을 수행하는 상이한 종의 단백질이다. 그러나 오솔로그 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다. 상동체 및 오솔로그는 상동성 모델링 (예를 들어, [Greer, Science vol. 228 (1985) 1055], 및 [Blundell et al. Eur J Biochem vol 172 (1988), 513] 참조) 또는 "구조적 BLAST" (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a "structural BLAST": using structural relationships to infer function. Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225.)로 확인될 수 있다. 또한 CRISPR-Cas 유전자좌 분야에서 적용을 위해 [Shmakov et al. (2015)]를 참조한다. 그러나 상동성 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다.
Cpf1 유전자는 몇몇 다양한 박테리아 게놈, 전형적으로 cas1, cas2, 및 cas4 유전자 및 CRISPR 카세트와 동일한 유전자좌 (예를 들어, 프란시셀라 cf. 노비시다 Fx1의 FNFX1_1431-FNFX1_1428)에서 발견된다. 따라서, 이러한 추정 신규 CRISPR-Cas 시스템의 레이아웃은 II-B형의 것과 유사하게 나타난다. 더 나아가서, Cas9와 유사하게, Cpf1 단백질은 트랜스포존 ORF-B와 상동성인 쉽게 식별가능한 C-말단 영역을 함유하고 활성 RuvC-유사 뉴클레아제, 아르기닌-풍부 영역, 및 Zn 핑거 (Cas9에는 부재)를 포함한다. 그러나, Cas9와 달리, Cpf1은 CRISPR-Cas 환경없이 몇몇 게놈에 존재하고 ORF-B와 이의 비교적 높은 유사성은 이것이 트랜스포존 성분일 수 있다는 것을 시사한다. 이것이 진짜 CRISPR-Cas 시스템이고 Cpf1이 Cas9의 기능적 유사체라면 이것이 신규한 CRISPR-Cas 유형, 즉 V형이라는 것을 시사하였다 (Annotation and Classification of CRISPR-Cas Systems. Makarova KS, Koonin EV. Methods Mol Biol. 2015;1311:47-75). 그러나, 본 명세서에 기술된 바와 같이, Cpf1은 동일한 도메인 구조를 갖지 않아서 V-B 아형이라고 표시되는 C2c1p와 구별하기 위해서 V-A 아형이라고 표시된다.
특정 구현예에서, 이펙터 단백질은 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바큘럼, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴럼, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리듐, 라크노스피라세아에, 클로스트리디아리듐, 렙토트리키아, 프란시셀라, 레지오넬라, 알리시클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 렙토스피라, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 악시다미노코커스를 포함하는 속으로부터의 유기체 유래의 Cpf1 이펙터 단백질이다.
추가의 특정 구현예에서, Cpf1 이펙터 단백질은 에스. 뮤탄스, 에스. 아갈락티아에, 에스. 에퀴시밀리스, 에스. 산귀니스, 에스. 뉴모니아; 씨. 제주니, 씨. 콜라이; 엔. 살수기니스, 엔. 테르가르쿠스; 에스. 아우리쿨라리스, 에스. 카르노서스; 엔. 메닌지티데스, 엔. 고노로에아에; 엘. 모노시토게네스, 엘. 이바노비이; 씨. 보툴리넘, 씨. 디피실, 씨. 테타니, 씨. 소르델리이로부터 선택된 유기체로부터의 것이다.
닉카제는 제1 이펙터 단백질 (예를 들어, Cpf1) 오솔로그 유래의 제1 단편 및 제2 이펙터 (예를 들어, Cpf1) 단백질 오솔로그 유래의 제2 단편을 포함하는 키메라 단백질을 포함할 수 있고, 제1 및 제2 이펙터 단백질 오솔로그는 상이하다. 제1 및 제2 이펙터 단백질 (예를 들어, Cpf1) 오솔로그 중 적어도 하나는 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바큘럼, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴럼, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리듐, 라크노스피라세아에, 클로스트리디아리듐, 렙토트리키아, 프란시셀라, 레지오넬라, 알리시클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 렙토스피라, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 악시다미노코커스를 포함하는 유기체로부터의 이펙터 단백질 (예를 들어, Cpf1)을 포함할 수 있고; 예를 들어, 키메라 이펙터 단백질은 제1 단편 및 제2 단편을 포함하고 여기서 제1 및 제2 단편의 각각은 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바큘럼, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴럼, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리듐, 라크노스피라세아에, 클로스트리디아리듐, 렙토트리키아, 프란시셀라, 레지오넬라, 알리시클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 렙토스피라, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 악시다미노코커스를 포함하는 유기체의 Cpf1로부터 선택되고, 여기서 제1 및 제2 단편은 동일한 박테리아로부터의 것이 아니고; 예를 들어 키메라 이펙터 단백질은 제1 단편 및 제2 단편을 포함하고, 여기서 제1 및 제2 단편의 각각은 에스. 뮤탄스, 에스. 아갈락티아에, 에스. 에퀴시밀리스, 에스. 산귀니스, 에스. 뉴모니아; 씨. 제주니, 씨. 콜라이; 엔. 살수기니스, 엔. 테르가르쿠스; 에스. 아우리쿨라리스, 에스. 카르노서스; 엔. 메닌지티데스, 엔. 고노로에아에; 엘. 모노시토게네스, 엘. 이바노비이; 씨. 보툴리넘, 씨. 디피실, 씨. 테타니, 씨. 소르델리이; 프란시셀라 툴라렌시스 1, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 sp. SCADC, 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에의 Cpf1로부터 선택되고, 제1 및 제2 단편은 동일한 박테리아로부터의 것이 아니다.
보다 바람직한 구현예에서, Cpf1p 닉카제는 프란시셀라 툴라렌시스 1, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 sp. SCADC, 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에로부터 선택되는 박테리아 종으로부터 유래된다. 일정 구현예에서, Cpf1p는 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020으로부터 선택되는 박테리아 종으로부터 유래된다. 일정 구현예에서, 이펙터 단백질은 제한없이 프란시셀라 툴라렌시스 subsp. 노비시다를 포함한, 프란시셀라 툴라렌시스 1의 아종으로부터 유래된다.
일부 구현예에서, Cpf1p 닉카제는 유박테리움 속으로부터의 유기체로부터 유래된다. 일부 구현예에서, CRISPR 닉카제는 유박테리움 렉탈레 (Eubacterium rectale)의 박테리아 종으로부터의 유기체로부터 유래된다. 일부 구현예에서, 야생형 Cpf1 이펙터 단백질의 아미노산 서열은 NCBI 참조 서열 WP_055225123.1, NCBI 참조 서열 WP_055237260.1, NCBI 참조 서열 WP_055272206.1, 또는 GenBank ID OLA16049.1에 상응한다. 일부 구현예에서, Cpf1 이펙터 단백질은 NCBI 참조 서열 WP_055225123.1, NCBI 참조 서열 WP_055237260.1, NCBI 참조 서열 WP_055272206.1, 또는 GenBank ID OLA16049.1과 적어도 60%, 보다 특히 적어도 70%, 예컨대 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 서열 동일성을 갖는다. 당업자는 이것이 Cpf1 단백질의 절두된 형태를 포함하고, 그리하여 서열 동일성은 절두된 형태의 길이 상에서 결정된다는 것을 이해할 것이다. 일부 구현예에서, Cpf1 이펙터는 TTTN 또는 CTTN의 PAM 서열을 인식한다.
특정 구현예에서, 본 명세서에서 언급되는 Cpf1의 상동체 또는 오솔로그는 Cpf1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 Cpf1의 상동체 또는 오솔로그는 야생형 Cpf1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다. Cpf1가 하나 이상의 돌연변이를 갖는 (돌연변이된) 경우에, 본 명세서에서 언급되는 상기 Cpf1의 상동체 또는 오솔로그는 돌연변이된 Cpf1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
일 구현예에서, Cpf1 단백질은 제한없이 악시다미노코커스 sp, 라크노스피라세아에 박테리움 또는 모락셀라 보보쿨리를 포함하는 속의 유기체의 오솔로그일 수 있고; 특정 구현예에서, V형 Cas 단백질은 제한없이 악시다미노코커스 sp. BV3L6; 라크노스피라세아에 박테리움 ND2006 (LbCpf1) 또는 모락셀라 보보쿨리 237을 포함하는 종의 유기체의 오솔로그일 수 있다. 특정 구현예에서, 본 명세서에서 언급되는 Cpf1의 상동체 또는 오솔로그는 본 명세서에 개시된 하나 이상의 Cpf1 서열과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 Cpf1의 상동체 또는 오솔로그는 야생형 FnCpf1, AsCpf1 또는 LbCpf1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 본 발명의 Cpf1 단백질은 FnCpf1, AsCpf1 또는 LbCpf1과 적어도 60%, 보다 특히 적어도 70%, 예컨대 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 Cpf1 단백질은 야생형 AsCpf1 또는 LbCpf1과 적어도 60%, 예컨대 적어도 70%, 보다 특히 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다. 특정 구현예에서, 본 발명의 Cpf1 단백질은 FnCpf1과 60% 미만의 서열 동일성을 갖는다. 당업자는 이것이 Cpf1 단백질의 절두된 형태를 포함하고, 그리하여 서열 동일성은 절두된 형태의 길이 상에서 결정된다는 것을 이해할 것이다.
일부 구현예에서, Cpf1 닉카제는 Nuc 도메인에 돌연변이를 포함한다. 일부 구현예에서, Cpf1 닉카제는 표적화된 DNA 가닥 및 가이드 분자 간의 헤테로듀플렉스의 형성으로 치환된 관심 유전자좌에서 비-표적화된 DNA 가닥을 닉킹시킬 수 있다. 일부 구현예에서, Cpf1 닉카제는 AsCpf1의 R1226A에 상응하는 돌연변이를 포함한다.
추가 지침으로, 제한없이, 악시다미노코커스 sp. 유래 Cpf1의 Nuc 도메인 중 아르기닌에서 알라닌으로의 치환 (R1226A)은 Cpf1을 양쪽 가닥을 절단하는 뉴클레아제에서 닉카제 (단일 가닥을 절단)로 전환시킨다. 효소가 AsCpf1이 아닌 경우에, 돌연변이는 상응하는 위치의 잔기에서 만들어질 수 있다는 것을 당업자는 이해하게 될 것이다. 특정 구현예에서, Cpf1은 FnCpf1이고 돌연변이는 위치 R1218의 아르기닌에 존재한다. 특정 구현예에서, Cpf1은 LbCpf1이고 돌연변이는 위치 R1138의 아르기닌에 존재한다. 특정 구현예에서, Cpf1은 MbCpf1이고 돌연변이는 위치 R1293의 아르기닌에 존재한다.
C2c1 오솔로그
본 발명은 V-B 아형으로 표시되는 C2c1 유전자좌로부터 유래된, C2c1 기반 닉카제의 사용을 포괄한다. 본 명세서에서 이러한 이펙터 단백질은 또한 "C2c1p", 예를 들어, C2c1 단백질 (및 이러한 이펙터 단백질 또는 C2c1 단백질 또는 C2c1 유전자좌로부터 유래된 단백질은 또한 "CRISPR 효소"라고도 함)이라고도 한다. 현재, V-B 아형 유전자좌는 cas1-Cas4 융합체, cas2, C2c1로 표시되는 별개 유전자, 및 CRISPR 어레이를 포괄한다. C2c1 (CRISPR-연관 단백질 C2c1)은 Cas9의 특징적인 아르기닌-풍부 클러스터에 대한 대응부와 함께 Cas9의 상응하는 도메인에 상동성인 RuvC-유사 뉴클레아제 도메인을 함유하는 대형 단백질 (약 1100 - 1300 아미노산)이다. 그러나, C2c1은 모든 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여되고, RuvC-유사 도메인은 HNH 도메인을 포함하는 긴 삽입부를 함유하는 Cas9와 대조적으로 C2c1 서열에 인접해 있다. 따라서, 특정 구현예에서, CRISPR-Cas 효소는 오직 RuvC-유사 뉴클레아제 도메인만을 포함한다.
C2c1 (Cas12b로도 공지됨) 단백질은 RNA 가이드된 뉴클레아제이다. 이의 절단은 가이드 서열 및 직접 반복부를 포함하는 가이드 RNA를 동원하기 위해서 tracr RNA에 의존하며, 여기서 가이드 서열은 표적 뉴클레오티드 서열과 하이브리드화하여 DNA/RNA 헤테로듀플렉스를 형성한다. 현재 연구들을 기반으로, C2c1 뉴클레아제 활성은 또한 PAM 서열의 인식에 의존을 요구한다. C2c1 PAM 서열은 T-풍부 서열이다. 일부 구현예에서, PAM 서열은 5' TTN 3' 또는 5' ATTN 3'이고, 여기서 N은 임의의 뉴클레오티드이다. 특정 구현예에서, PAM 서열은 5' TTC 3'이다. 특정 구현예에서, PAM은 플라스모듐 팔시파럼 (Plasmodium falciparum)의 서열에 존재한다.
C2c1은 5' 오버행을 갖는, 유전자좌에서의 엇갈림 절단 (staggered cut), 또는 표적 서열의 PAM 원위 측면에서 "점착성 말단부 (sticky end)"를 생성시킨다. 5' 오버행은 7 nt이다. [Lewis and Ke, Mol Cell. 2017 Feb 2;65(3):377-379]을 참조한다.
C2c1 유전자는 몇몇 다양한 박테리아 게놈에서, 전형적으로 cas1, cas2, 및 cas4 유전자 및 CRISPR 카세트와 동일한 유전자좌에서 발견된다. 따라서, 이러한 추정의 신규 CRISPR-Cas 시스템의 레이아웃은 II-B형의 것과 유사하게 나타난다. 더 나아가서, Cas9와 유사하게, C2c1 단백질은 활성 RuvC-유사 뉴클레아제, 아르기닌-풍부 영역, 및 Zn 핑거 (Cas9에는 부재)를 함유한다.
특정 구현예에서, CRISPR 닉카제는 알리시클로바실러스, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 칸디다투스, 데술파티라브디움, 시트로박터, 엘루시미크로비아, 메틸로박테리움, 옴니트로피카, 피시스파에라에, 플란크토마이세테스, 스피로카에테스, 및 베루코미크로비아세아에를 포함하는 속으로부터의 유기체 유래 C2c1 닉카제이다.
추가의 특정 구현예에서, C2c1 닉카제는 알리시클로바실러스 악시도테레스트리스 (예를 들어, ATCC 49025), 알리시클로바실러스 콘타미난스 (예를 들어, DSM 17975), 알리시클로바실러스 마크로스포란지이더스 (예를 들어, DSM 17980), 바실러스 히사시이 균주 C4, 칸디다투스 린도우박테리아 박테리움 RIFCSPLOWO2, 데술포비브리오 이노피나투스 (예를 들어, DSM 10711), 데술포나트로넘 티오디스무탄스 (예를 들어, 균주 MLF-1), 엘루시미크로비아 박테리움 RIFOXYA12, 옴니트로피카 WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 TAV5, 피시스파에라에 박테리움 ST-NAGAB-D1, 플란크토마이세테스 박테리움 RBG_13_46_10, 스피로카에테스 박테리움 GWB1_27_13, 베루코미크로비아세아에 박테리움 UBA2429, 투베리바실러스 칼리더스 (예를 들어, DSM 17572), 바실러스 써모아밀로보란스 (예를 들어, 균주 B4166), 브레비바실러스 sp. CF112, 바실러스 sp. NSP2.1, 데술파티라브디움 부티라티보란스 (예를 들어, DSM 18734), 알리시클로바실러스 허바리우스 (예를 들어, DSM 13609), 시트로박터 프레운디이 (예를 들어, ATCC 8090), 브레비바실러스 아그리 (예를 들어, BAB-2500), 메틸로박테리움 노둘란스 (예를 들어, ORS 2060)로부터 선택된 종으로부터의 것이다.
닉카제는 제1 이펙터 단백질 (예를 들어, C2c1) 오솔로그 유래의 제1 단편 및 제2 이펙터 (예를 들어, C2c1) 단백질 오솔로그 유래의 제2 단편을 포함하는 키메라 이펙터 단백질을 포함할 수 있고, 제1 및 제2 이펙터 단백질 오솔로그는 상이하다. 제1 및 제2 이펙터 단백질 (예를 들어, C2c1) 오솔로그 중 적어도 하나는 알리시클로바실러스, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 칸디다투스, 데술파티라브디움, 엘루시미크로비아, 시트로박터, 메틸로박테리움, 옴니트로피카이, 피시스파에라에, 플란크토마이세테스, 스피로카에테스, 및 베루코미크로비아세아에를 포함하는 유기체로부터의 이펙터 단백질 (예를 들어, C2c1)을 포함할 수 있고; 예를 들어, 키메라 이펙터 단백질은 제1 단편 및 제2 단편을 포함하고, 여기서 제1 및 제2 단편의 각각은 알리시클로바실러스, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 칸디다투스, 데술파티라브디움, 엘루시미크로비아, 시트로박터, 메틸로박테리움, 옴니트로피카이, 피시스파에라에, 플란크토마이세테스, 스피로카에테스, 및 베루코미크로비아세아에를 포함하는 유기체의 C2c1로부터 선택되고, 여기서 제1 및 제2 단편은 동일한 박테리아로부터의 것이 아니고; 예를 들어 키메라 이펙터 단백질은 제1 단편 및 제2 단편을 포함하고, 여기서 제1 및 제2 단편의 각각은 알리시클로바실러스 악시도테레스트리스 (예를 들어, ATCC 49025), 알리시클로바실러스 콘타미난스 (예를 들어, DSM 17975), 알리시클로바실러스 마크로스포란지이더스 (예를 들어, DSM 17980), 바실러스 히사시이 균주 C4, 칸디다투스 린도우박테리아 박테리움 RIFCSPLOWO2, 데술포비브리오 이노피나투스 (예를 들어, DSM 10711), 데술포나트로넘 티오디스무탄스 (예를 들어, 균주 MLF-1), 엘루시미크로비아 박테리움 RIFOXYA12, 옴니트로피카 WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 TAV5, 피시스파에라에 박테리움 ST-NAGAB-D1, 플란크토마이세테스 박테리움 RBG_13_46_10, 스피로카에테스 박테리움 GWB1_27_13, 베루코미크로비아세아에 박테리움 UBA2429, 투베리바실러스 칼리더스 (예를 들어, DSM 17572), 바실러스 써모아밀로보란스 (예를 들어, 균주 B4166), 브레비바실러스 sp. CF112, 바실러스 sp. NSP2.1, 데술파티라브디움 부티라티보란스 (예를 들어, DSM 18734), 알리시클로바실러스 허바리우스 (예를 들어, DSM 13609), 시트로박터 프레운디이 (예를 들어, ATCC 8090), 브레비바실러스 아그리 (예를 들어, BAB-2500), 메틸로박테리움 노둘란스 (예를 들어, ORS 2060)의 C2c1로부터 선택되고, 제1 및 제2 단편은 동일한 박테리아로부터의 것이 아니다.
보다 바람직한 구현예에서, C2c1p 닉카제는 알리시클로바실러스 악시도테레스트리스 (예를 들어, ATCC 49025), 알리시클로바실러스 콘타미난스 (예를 들어, DSM 17975), 알리시클로바실러스 마크로스포란지이더스 (예를 들어, DSM 17980), 바실러스 히사시이 균주 C4, 칸디다투스 린도우박테리아 박테리움 RIFCSPLOWO2, 데술포비브리오 이노피나투스 (예를 들어, DSM 10711), 데술포나트로넘 티오디스무탄스 (예를 들어, 균주 MLF-1), 엘루시미크로비아 박테리움 RIFOXYA12, 옴니트로피카 WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 TAV5, 피시스파에라에 박테리움 ST-NAGAB-D1, 플란크토마이세테스 박테리움 RBG_13_46_10, 스피로카에테스 박테리움 GWB1_27_13, 베루코미크로비아세아에 박테리움 UBA2429, 투베리바실러스 칼리더스 (예를 들어, DSM 17572), 바실러스 써모아밀로보란스 (예를 들어, 균주 B4166), 브레비바실러스 sp. CF112, 바실러스 sp. NSP2.1, 데술파티라브디움 부티라티보란스 (예를 들어, DSM 18734), 알리시클로바실러스 허바리우스 (예를 들어, DSM 13609), 시트로박터 프레운디이 (예를 들어, ATCC 8090), 브레비바실러스 아그리 (예를 들어, BAB-2500), 메틸로박테리움 노둘란스 (예를 들어, ORS 2060)로부터 선택되는 박테리아 종으로부터 유래된다. 일정 구현예에서, C2c1p는 알리시클로바실러스 악시도테레스트리스 (예를 들어, ATCC 49025), 알리시클로바실러스 콘타미난스 (예를 들어, DSM 17975)로부터 선택되는 박테리아 종으로부터 유래된다.
특정 구현예에서, 본 명세서에서 언급되는 C2c1의 상동체 또는 오솔로그는 C2c1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 C2c1의 상동체 또는 오솔로그는 야생형 C2c1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다. C2c1이 하나 이상의 돌연변이를 갖는 (돌연변이된) 경우에, 본 명세서에서 언급되는 상기 C2c1의 상동체 또는 오솔로그는 돌연변이된 C2c1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
일 구현예에서, C2c1 단백질은 제한없이, 알리시클로바실러스, 데술포비브리오, 데술포나트로넘, 오피투타세아에, 투버리바실러스, 바실러스, 브레비바실러스, 칸디다투스, 데술파티라브디움, 엘루시미크로비아, 시트로박터, 메틸로박테리움, 옴니트로피카이, 피시스파에라에, 플란크토마이세테스, 스피로카에테스, 및 베루코미크로비아세아에를 포함한 속의 유기체의 오솔로그일 수 있고; 특정 구현예에서, V형 Cas 단백질은 제한없이, 알리시클로바실러스 악시도테레스트리스 (예를 들어, ATCC 49025), 알리시클로바실러스 콘타미난스 (예를 들어, DSM 17975), 알리시클로바실러스 마크로스포란지이더스 (예를 들어, DSM 17980), 바실러스 히사시이 균주 C4, 칸디다투스 린도우박테리아 박테리움 RIFCSPLOWO2, 데술포비브리오 이노피나투스 (예를 들어, DSM 10711), 데술포나트로넘 티오디스무탄스 (예를 들어, 균주 MLF-1), 엘루시미크로비아 박테리움 RIFOXYA12, 옴니트로피카 WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 TAV5, 피시스파에라에 박테리움 ST-NAGAB-D1, 플란크토마이세테스 박테리움 RBG_13_46_10, 스피로카에테스 박테리움 GWB1_27_13, 베루코미크로비아세아에 박테리움 UBA2429, 투베리바실러스 칼리더스 (예를 들어, DSM 17572), 바실러스 써모아밀로보란스 (예를 들어, 균주 B4166), 브레비바실러스 sp. CF112, 바실러스 sp. NSP2.1, 데술파티라브디움 부티라티보란스 (예를 들어, DSM 18734), 알리시클로바실러스 허바리우스 (예를 들어, DSM 13609), 시트로박터 프레운디이 (예를 들어, ATCC 8090), 브레비바실러스 아그리 (예를 들어, BAB-2500), 메틸로박테리움 노둘란스 (예를 들어, ORS 2060)를 포함하는 종의 유기체의 오솔로그일 수 있다. 특정 구현예에서, 본 명세서에서 언급되는 C2c1의 상동체 또는 오솔로그는 본 명세서에 개시된 C2c1 서열 중 하나 이상과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 C2c1의 상동체 또는 오솔로그는 야생형 AacC2c1 또는 BthC2c1과 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 본 발명의 C2c1 닉카제는 AacC2c1 또는 BthC2c1과 적어도 60%, 보다 특히 적어도 70%, 예컨대 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, 본 명세서에서 언급되는 C2c1 단백질은 야생형 AacC2c1과 적어도 60%, 예컨대 적어도 70%, 보다 특히 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다. 특정 구현예에서, 본 발명의 C2c1 단백질은 AacC2c1과 60% 미만의 서열 동일성을 갖는다. 당업자는 이것이 C2c1 단백질의 절두된 형태를 포함하고, 그리하여 서열 동일성은 절두된 형태의 길이 상에서 결정된다는 것을 이해할 것이다.
일정 구현예에서, C2c1 닉카제는 일시적으로 또는 안정적으로, 세포 또는 시험관내 시스템에서 제공 또는 발현될 수 있고, 세포 핵산을 비특이적으로 절단하도록 표적화하거나 또는 촉발시킬 수 있다. 일 구현예에서, C2c1은 ssDNA, 예를 들어 바이러스 ssDNA를 녹다운시키도록 조작된다. 다른 구현예에서, C2c1은 RNA를 녹 다운시키도록 조작된다. 시스템은 녹다운이 시스템 또는 세포로 표적 핵산의 첨가에 의해 촉발되거나, 또는 세포 또는 시험관내 시스템에 존재하는 표적 DNA에 의존적이도록 고안될 수 있다.
일정 구현예에서, C2c1 단백질은 RuvC 도메인에 돌연변이를 포함하는 촉매적 불활성 C2c1이다. 일부 구현예에서, 촉매적 불활성 C2c1 단백질은 알리시클로바실러스 악시도테레스트리스 C2c1의 아미노산 위치 D570, E848, 또는 D977에 상응하는 돌연변이를 포함한다. 일부 구현예에서, 촉매적 불활성 C2c1 단백질은 알리시클로바실러스 악시도테레스트리스 C2c1의 D570A, E848A, 또는 D977A에 상응하는 돌연변이를 포함한다.
일정 구현예에서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 C2c1 닉카제이다. 일부 구현예에서, C2c1 닉카제는 알리시클로바실러스 악시도테레스트리스 C2c1의 아미노산 위치 R911, R1000, 또는 R1015에 상응하는 돌연변이를 포함한다. 일부 구현예에서, C2c1 닉카제는 알리시클로바실러스 악시도테레스트리스 C2c1의 R911A, R1000A, 또는 R1015A에 상응하는 돌연변이를 포함한다. 효소가 상기 열거된 CRISPR-Cas 효소가 아닌 경우에, 돌연변이는 상응하는 위치의 잔기에서 만들어질 수 있다는 것을 당업자는 이해할 것이다.
돌연변이는 또한 이웃 잔기, 예를 들어, 뉴클레아제 활성에 참여하는 상기 표시된 것 근처의 아미노산에서 만들어질 수 있다. 일부 구현예에서, 오직 RuvC 도메인이 불활성화되고, 다른 구현예에서, 다른 추정의 뉴클레아제 도메인이 불활성화되며, 여기서 이펙터 단백질 복합체는 닉카제로서 기능하여 오직 하나의 DNA 가닥만을 절단시킨다. 일부 구현예에서, 2종의 CRISPR-Cas 변이체 (각각 상이한 닉카제)는 특이성을 증가시키기 위해 사용되고, 2종의 닉카제 변이체는 표적에서 DNA를 절단시키는데 사용된다 (여기서 양쪽 닉카제는, 오직 하나의 DNA 가닥이 절단되고 이후에 복구되는 오프-표적 변형을 최소화시키거나 또는 제거시키면서 DNA 가닥을 절단시킴).
일정 구현예에서 C2c1 이펙터 단백질은 2종의 C2c1 이펙터 단백질 분자를 포함하는 동종이량체로서 관심 유전자좌에서 또는 이와 연관된 서열을 절단시킨다. 바람직한 구현예에서, 동종이량체는 그들 개별 RuvC 도메인에 상이한 돌연변이를 포함하는 2종의 C2c1 이펙터 단백질 분자를 포함할 수 있다.
가이드 서열
본 명세서에서 사용되는 용어 "가이드 서열", "crRNA", "가이드 RNA", 또는 "단일 가이드 RNA", 또는 "gRNA", 또는 "가이드 분자"는 표적 핵산 서열에 대해 가이드 서열 및 CRISPR 이펙터 단백질을 포함하는 RNA-표적화 복합체의 서열-특이적 결합을 유도시키고 표적 핵산 서열과의 하이브리드화를 위해 표적 핵산 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 의미한다. 일례의 구현예에서, 적합한 정렬 알고리즘을 사용해 최적으로 정렬했을 때, 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적 정렬은 서열을 정렬시키기 위한 임의의 적합한 알고리즘의 사용으로 결정될 수 있고, 이의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분취 (Needleman-Wunsch) 알고리즘, 버로우스-윌러 (Burrows-Wheeler) 변환 기반 알고리즘 (예를 들어, the Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; www.novocraft.com에서 이용가능), ELAND (Illumina, San Diego, CA), SOAP (soap.genomes.org.cn에서 이용가능), 및 Maq (maq.sourceforge.net에서 이용가능)을 포함한다. 표적 핵산 서열에 대해 핵산-표적화 복합체의 서열-특이적 결합을 유도하는 (핵산-표적화 가이드 RNA 내) 가이드 서열의 능력은 임의의 적합한 어세이를 통해 평가될 수 있다. 예를 들어, 시험하려는 가이드 서열을 포함하여, 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 CRISPR 시스템의 성분은 예컨대 핵산-표적화 복합체의 성분을 코딩하는 벡터에 의한 형질감염에 의해서, 상응하는 표적 핵산 서열을 갖는 숙주 세포에게 제공될 수 있고, 이어서 예컨대 본 명세서에 기술된 바와 같은 Surveyor 어세이를 통해서, 표적 핵산 서열 내에서 우선적인 표적화 (예를 들어, 절단)의 평가를 후속할 수 있다. 유사하게, 표적 핵산 서열의 절단은 표적 핵산 서열, 시험하려는 가이드 서열을 포함한 핵산-표적화 복합체의 성분, 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 제공하고, 시험 및 대조군 가이드 서열 반응 간에 표적 서열과의 결합 또는 표적 서열에서의 절단 속도를 비교하여, 시험관에서 평가될 수 있다. 다른 어세이가 가능하고, 당업자에게 일어날 수 있다. 가이드 서열, 및 그리하여 핵산-표적화 가이드는 임의의 표적 핵산 서열을 표적화하도록 선택될 수 있다. 표적 서열은 DNA일 수 있다. 표적 서열은 임의의 RNA 서열일 수 있다. 일부 구현예에서, 표적 서열은 전령 RNA (mRNA), 프리-mRNA, 리보솜 RNA (rRNA), 운반 RNA (tRNA), 마이크로-RNA (miRNA), 소형 간섭 RNA (siRNA), 소형 핵 RNA (snRNA), 소형 핵소체 RNA (snoRNA), 이중 가닥 RNA (dsRNA), 비코딩 RNA (ncRNA), 장형 비코딩 RNA (lncRNA), 및 소형 세포질 RNA (scRNA)로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 mRNA, 프리-mRNA, 및 rRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 ncRNA, 및 lncRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 보다 바람직한 구현예에서, 표적 서열은 mRNA 분자 또는 프리-mRNA 분자 내 서열일 수 있다.
일부 구현예에서, 핵산-표적화 가이드는 핵산-표적화 가이드 내 2차 구조 정도를 감소시키도록 선택된다. 일부 구현예에서, 핵산-표적화 가이드의 뉴클레오티드의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% 이하가 최적으로 폴딩될 때 자기-상보성 염기 쌍형성에 참여한다. 최적 폴딩은 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘을 통해서 결정될 수 있다. 일부 프로그램은 최소 깁스 자유 에너지의 계산을 기반으로 한다. 이러한 한 알고리즘의 일례는 [Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148)에 기술된 바와 같은 mFold이다. 다른 예의 폴딩 알고리즘은 중심 구조 예측 알고리즘을 사용하여, 비엔나 대학의 이론 화학 연구소 (Institute for Theoretical Chemistry at the University of Vienna)에서 개발된, 온라인 웹서버 RNAfold이다 (예를 들어, [A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조).
일정 구현예에서, 가이드 RNA 또는 crRNA는 직접 반복부 (DR) 서열 및 가이드 서열 또는 스페이서 서열을 포함할 수 있거나, 그로 본질적으로 이루어질 수 있거나, 또는 그로 이루어질 수 있다. 일정 구현예에서, 가이드 RNA 또는 crRNA는 가이드 서열 또는 스페이서 서열에 융합되거나 또는 연결된 직접 반복부 서열을 포함할 수 있거나, 그로 본질적으로 이루어질 수 있거나, 또는 그로 이루어질 수 있다. 일정 구현예에서, 직접 반복부 서열은 가이드 서열 또는 스페이서 서열로부터 상류 (즉, 5')에 위치될 수 있다. 다른 구현예에서, 직접 반복부 서열은 가이드 서열 또는 스페이서 서열로부터 하류 (즉, 3')에 위치될 수 있다.
일정 구현예에서, crRNA는 스템 루프, 바람직하게 단일 스템 루프를 포함한다. 일정 구현예에서, 직접 반복부 서열은 스템 루프, 바람직하게 단일 스템 루프를 형성한다.
일정 구현예에서, 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 15개 뉴클레오티드이다. 일정 구현예에서, 스페이서 길이는 15 내지 17 nt, 예를 들어, 15, 16, 또는 17 nt, 17 내지 20 nt, 예를 들어, 17, 18, 19, 또는 20 nt, 20 내지 24 nt, 예를 들어, 20, 21, 22, 23, 또는 24 nt, 23 내지 25 nt, 예를 들어, 23, 24, 또는 25 nt, 24 내지 27 nt, 예를 들어, 24, 25, 26, 또는 27 nt, 27-30 nt, 예를 들어, 27, 28, 29, 또는 30 nt, 30-35 nt, 예를 들어, 30, 31, 32, 33, 34, 또는 35 nt, 또는 35 nt 이상이다.
일반적으로, CRISPR-Cas, CRISPR-Cas9 또는 CRISPR 시스템은 전술한 문헌, 예컨대 WO 2014/093622 (PCT/US2013/074667)에서 사용되는 바와 같을 수 있고, Cas 유전자, 특히 CRISPR-Cas9의 경우에 Cas9 유전자를 코딩하는 서열, tracr (트랜스-활성화 CRISPR) 서열 (예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-mate 서열 (내생성 CRISPR 시스템의 경우에 "직접 반복부" 및 tracrRNA-프로세싱된 부분 직접 반복부 포괄), 가이드 서열 (내생성 CRISPR 시스템의 경우에 "스페이서"라고도 함), 또는 이 용어가 본 명세서에서 사용되는 바와 같은 "RNA(들)" (예를 들어, Cas9를 가이드하기 위한 RNA(들), 예를 들어 CRISPR RNA 및 트랜스활성화 (tracr) RNA 또는 단일 가이드 RNA (sgRNA) (키메라 RNA)) 또는 CRISPR 유전자좌로부터의 다른 서열 및 전사물을 포함하는, CRISPR-연관 ("Cas") 유전자의 발현에 관여하거나 또는 이의 활성을 유도시키는 전사물 및 다른 엘리먼트를 집합적으로 의미한다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 촉진하는 엘리먼트를 특징으로 한다 (내생성 CRISPR 시스템의 경우에 프로토스페이서라고도 함). CRISPR 복합체의 형성 경우에, "표적 서열"은 가이드 서열이 상보성을 갖도록 디자인되고, 여기서 표적 서열 및 가이드 서열 간 하이브리드화가 CRISPR 복합체의 형성을 촉진하는 것인 서열을 의미한다. 표적 서열에 대한 상보성이 절단 활성에 중요한 가이드 서열의 부분은 본 명세서에서 씨드 서열이라고 한다. 표적 서열은 임의의 폴리뉴클레오티드, 예컨대 DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질에 위치되고, 세포 내에 존재하는 미토콘드리아, 세포소기관, 소포체, 리포솜 또는 입자 내 또는 그로부터의 핵산을 포함할 수 있다. 일부 구현예에서, 특히 비-핵 용도의 경우에, NLS는 바람직하지 않다. 일부 구현예에서, CRISPR 시스템은 하나 이상의 핵 이출 신호 (NES)를 포함한다. 일부 구현예에서, CRISPR 시스템은 하나 이상의 NLS 및 하나 이상의 NES를 포함한다. 일부 구현예에서, 직접 반복부는 임의의 또는 모든 하기 기준을 충족하는 반복 모티프를 검색하여 인 실리코에서 확인될 수 있다: 1. II형 CRISPR 유전자좌에 측접하는 게놈 서열의 2 Kb 윈도우 내에 존재; 2. 20 내지 50 bp 범위; 및 3. 20 내지 50 bp 간격. 일부 구현예에서, 이들 기준 중 2 가지, 예를 들어 1 및 2, 2 및 3, 또는 1 및 3이 사용될 수 있다. 일부 구현예에서, 모든 3 기준이 사용될 수 있다.
본 발명의 구현예에서 용어 가이드 서열 및 가이드 RNA, 즉 표적 게놈 유전자좌로 Cas를 가이드할 수 있는 RNA는 상기 인용된 문헌 예컨대 WO 2014/093622 (PCT/US2013/074667)에서 처럼 상호교환적으로 사용된다. 일반적으로, 가이드 서열은 표적 서열과 하이브리드화하여 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하도록 표적 폴리뉴클레오티드 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬했을 때, 가이드 서열 및 이의 상응하는 표적 서열 간 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적 정렬은 서열을 정렬하기 위한 임의의 적합한 알고리즘의 사용으로 결정될 수 있고, 이의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분취 알고리즘, 버로우스-윌러 변환 기반 알고리즘 (예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; www.novocraft.com에서 이용가능), ELAND (Illumina, San Diego, CA), SOAP (soap.genomes.org.cn에서 이용가능), 및 Maq (maq.sourceforge.net에서 이용가능)을 포함한다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이이다. 바람직하게 가이드 서열은 10-30개 뉴클레오티드 길이이다. 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적합한 어세이를 통해 평가될 수 있다. 예를 들어, 시험하려는 가이드 서열을 포함한, CRISPR 복합체를 형성하는데 충분한 CRISPR 시스템의 성분은 예컨대 CRISPR 서열의 성분을 코딩하는 벡터로 형질감염에 의해, 상응하는 표적 서열을 갖는 숙주 세포에게 전달될 수 있고, 이어서 예컨대 본 명세서에 기술된 바와 같은 Surveyor 어세이를 통해서, 표적 서열 내 우선적 절단의 평가가 후속될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험하려는 가이드 서열을 포함하는 CRISPR 복합체의 성분, 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 제공하고, 시험 및 대조군 가이드 서열 반응 간에 표적 서열에서의 결합 또는 절단 속도를 비교하여 시험관에서 평가될 수 있다. 다른 어세이가 가능하고, 당업자에게 일어날 수 있다.
CRISPR-Cas 시스템의 일부 구현예에서, 가이드 서열 및 이의 상응하는 표적 서열 간 상보성의 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 100% 이상일 수 있고; 가이드 또는 RNA 또는 sgRNA는 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이일 수 있거나; 또는 가이드 또는 RNA 또는 sgRNA는 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이일 수 있고; tracr RNA는 30개 또는 50개 뉴클레오티드 길이이다. 그러나, 본 발명의 양상은 오프-표적 상호작용의 감소, 예를 들어 낮은 상보성을 갖는 표적 서열과 가이드의 상호작용을 감소시키는 것이다. 실제로, 예에서, 본 발명은 CRISPR-Cas 시스템이 80% 초과 내지 약 95% 상보성, 예를 들어, 83%-84% 또는 88-89% 또는 94-95% 상보성을 갖는 오프-표적 서열과 표적을 구별 (예를 들어, 18개 뉴클레오티드를 갖는 표적과 1, 2 또는 3 미스매치를 갖는 18개 뉴클레오티드의 오프-표적을 구별)할 수 있게 하는 돌연변이를 포함한다는 것을 보여준다. 따라서, 본 발명의 상황에서, 가이드 서열과 이의 상응하는 표적 서열 간 상보성 정도는 94.5% 또는 95% 또는 95.5% 또는 96% 또는 96.5% 또는 97% 또는 97.5% 또는 98% 또는 98.5% 또는 99% 또는 99.5% 또는 99.9%, 또는 100% 초과이다. 오프 표적은 서열과 가이드 간에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 또는 94% 또는 93% 또는 92% 또는 91% 또는 90% 또는 89% 또는 88% 또는 87% 또는 86% 또는 85% 또는 84% 또는 83% 또는 82% 또는 81% 또는 80% 미만의 상보성이고, 오프 표적이 서열과 가이드 간에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5%의 상보성인 것이 유리하다.
가이드 변형
일정 구현예에서, 본 발명의 가이드는 비천연 발생 핵산 및/또는 비천연 발생 뉴클레오티드 및/또는 뉴클레오티드 유사체, 및/또는 화학적 변형을 포함한다. 비천연 발생 핵산은 예를 들어 천연 및 비천연 발생 뉴클레오티드의 혼합물을 포함할 수 있다. 비천연 발생 뉴클레오티드 및/또는 뉴클레오티드 유사체는 리보스, 포스페이트, 및/또는 염기 모이어티에서 변형될 수 있다. 본 발명의 일 구현예에서, 가이드 핵산은 리보뉴클레오티드 및 비-리보뉴클레오티드를 포함한다. 일 구현예에서, 가이드는 하나 이상의 리보뉴클레오티드 및 하나 이상의 데옥시리보뉴클레오티드를 포함한다. 본 발명의 일 구현예에서, 가이드는 하나 이상의 비천연 발생 뉴클레오티드 또는 뉴클레오티드 유사체 예컨대 포스포로티오에이트 연결, 보라노포스페이트 연결을 갖는 뉴클레오티드, 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 잠김 핵산 (LNA) 뉴클레오티드, 또는 가교된 핵산 (BNA)을 포함한다. 변형된 뉴클레오티드의 다른 예는 2'-O-메틸 유사체, 2'-데옥시 유사체, 2-티오우리딘 유사체, N6-메틸아데노신 유사체, 또는 2'-플루오로 유사체를 포함한다. 변형된 염기의 추가 예는 제한없이 2-아미노푸린, 5-브로모-우리딘, 슈도우리딘 (Ψ), N1-메틸슈도우리딘 (me1Ψ), 5-메톡시우리딘(5moU), 이노신, 7-메틸구아노신을 포함한다. 가이드 RNA 화학적 변형의 예는 제한없이 하나 이상의 말단 뉴클레오티드에서 2'-O-메틸 (M), 2'-O-메틸-3'-포스포로티오에이트 (MS), 포스포로티오에이트 (PS), S-구속형 에틸(cEt), 또는 2'-O-메틸-3'-티오PACE (MSP)의 도입을 포함한다. 이러한 화학적으로 변형된 가이드는 온-표적 대 오프-표적 특이성이 예측불가하지만, 비변형된 가이드와 비교하여 증가된 안정성 및 증가된 활성을 포함할 수 있다 (Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, 2015년 6월 29일자로 온라인 공개; Ragdarm et al., 0215, PNAS, E7110-E7111; Allerson et al., J. Med. Chem. 2005, 48:901-904; ramsen et al., Front. Genet., 2012, 3:154; Deng et al., PNAS, 2015, 112:11870-11875; Sharma et al., MedChemComm., 2014, 5:1454-1471; Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989; Li et al., Nature Biomedical Engineering, 2017, 1, 0066 DOI:10.1038/s41551-017-0066). 일부 구현예에서, 가이드 RNA의 5' 및/또는 3' 말단은 형광성 염료, 폴리에틸렌 글리콜, 콜레스테롤, 단백질, 또는 검출 태그를 포함하는 다양한 기능성 모이어티에 의해 변형된다 (Kelly et al., 2016, J. Biotech. 233:74-83). 일정 구현예에서, 가이드는 표적 DNA에 결합하는 영역에서 리보뉴클레오티드 및 Cas9, Cpf1, 또는 C2c1에 결합하는 영역에서 하나 이상의 데옥시리보뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함한다. 본 발명의 일 구현예에서, 데옥시리보뉴클레오티드 및/또는 뉴클레오티드 유사체는 조작된 가이드 구조, 예컨대 제한없이, 5' 및/또는 3' 말단, 스템-루프 영역, 및 씨드 영역에 도입된다. 일정 구현예에서, 변형은 스템-루프 영역의 5'-핸들에 존재하지 않는다. 가이드의 스템-루프 영역의 5'-핸들의 화학적 변형은 이의 기능을 폐기시킬 수 있다 (Li, et al., Nature Biomedical Engineering, 2017, 1:0066). 일정 구현예에서, 가이드의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드는 화학적으로 변형된다. 일부 구현예에서, 가이드의 3' 또는 5' 말단에서 3-5개 뉴클레오티드가 화학적으로 변형된다. 일부 구현예에서, 오직 소수의 변형, 예컨대 2'-F 변형이 씨드 영역에 도입된다. 일부 구현예에서, 2'-F 변형이 가이드의 3' 말단에서 도입된다. 일정 구현예에서, 가이드의 5' 및/또는 3' 말단에서 3-5개 뉴클레오티드는 2'-O-메틸 (M), 2'-O-메틸-3'-포스포로티오에이트 (MS), S-구속형 에틸(cEt), 또는 2'-O-메틸-3'-티오PACE (MSP)에 의해 화학적으로 변형된다. 이러한 변형은 게놈 편집 효율을 증강시킬 수 있다 (Hendel et al., Nat. Biotechnol. (2015) 33(9): 985-989). 일정 구현예에서, 가이드의 모든 포스포디에스테르 결합은 유전자 파괴 수준을 증강시키기 위해서 포스포로티오에이트 (PS)로 치환된다. 일정 구현예에서, 가이드의 5' 및/또는 3' 말단에서 5개 초과의 뉴클레오티드가 2'-O-Me, 2'-F 또는 S-구속형 에틸(cEt)에 의해 화학적으로 변형된다. 이렇게 화학적으로 변형된 가이드는 증강된 유전자 파괴 수준을 매개할 수 있다 (Ragdarm et al., 0215, PNAS, E7110-E7111). 본 발명의 일 구현예에서, 가이드는 이의 3' 및/또는 5' 말단에 화학 모이어티를 포함하도록 변형된다. 이러한 모이어티는 제한없이 아민, 아지드, 알킨, 티오, 디벤조시클로옥틴 (DBCO), 또는 로다민을 포함한다. 일정 구현예에서, 화학 모이어티는 알킬 사슬과 같은 링커에 의해 가이드에 접합된다. 일정 구현예에서, 변형된 가이드의 화학 모이어티는 예컨대 DNA, RNA, 단백질, 또는 나노입자와 같은 다른 분자에 가이드를 부착시키기 위해 사용될 수 있다. 이러한 화학적으로 변형된 가이드는 CRISPR 시스템에 의해 포괄적으로 편집된 세포를 확인하거나 또는 농축시키는데 사용될 수 있다 (Lee et al., eLife, 2017, 6:e25312, DOI:10.7554).
일정 구현예에서, 본 명세서에서 제공되는 CRISPR 시스템은 crRNA 또는 가이드 서열을 포함하는 유사한 폴리뉴클레오티드를 사용할 수 있고, 여기서 폴리뉴클레오티드는 RNA, DNA 또는 RNA 및 DNA의 혼합물이고/이거나, 폴리뉴클레오티드는 하나 이상의 뉴클레오티드 유사체를 포함한다. 서열은 제한없이 천연 crRNA의 구조, 예컨대 벌지, 헤어핀 또는 스템 루프 구조를 포함한, 임의 구조를 포함할 수 있다. 일정 구현예에서, 가이드 서열을 포함하는 폴리뉴클레오티드는 RNA 또는 DNA 서열일 수 있는 제2 폴리뉴클레오티드 서열과 듀플렉스를 형성한다.
일정 구현예에서, 화학적으로 변형된 가이드 RNA가 이용된다. 가이드 RNA 화학적 변형의 예는 제한없이 하나 이상의 말단 뉴클레오티드에서 2'-O-메틸 (M), 2'-O-메틸 3' 포스포로티오에이트 (MS), 또는 2'-O-메틸 3' 티오PACE (MSP)의 도입을 포함한다. 이러한 화학적으로 변형된 가이드 RNA는 온-표적 대 오프-표적 특이성이 예측불가하지만, 비변형된 가이드 RNA와 비교하여 증가된 안정성 및 증가된 활성을 포함할 수 있다 (Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, 2015년 6월 29일 온라인 공개). 화학적으로 변형된 가이드 RNA는 제한없이 포스포로티오에이트 연결을 갖는 RNA 및 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 잠김 핵산 (LNA) 뉴클레오티드를 포함한다.
일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 서열는 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이이다. 바람직하게 가이드 서열은 10 내지 30개 뉴클레오티드 길이이다. 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적합한 어세이를 통해 평가될 수 있다. 예를 들어, 시험하려는 가이드 서열을 포함하여, CRISPR 복합체를 형성하는데 충분한 CRISPR 시스템의 성분은 예컨대 CRISPR 서열의 성분을 코딩하는 벡터에 의한 형질감염을 통해서, 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있고, 이어서 예컨대 Surveyor 어세이에 의해 표적 서열 내 우선적 절단의 평가를 후속할 수 있다. 유사하게, 표적 RNA의 절단은 표적 서열, 시험하려는 가이드 서열을 포함하는 CRISPR 복합체, 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 제공하고, 시험 및 대조군 가이드 서열 반응 간 표적 서열에서의 결합 또는 절단 속도를 비교하여 시험관에서 평가될 수 있다. 다른 어세이가 가능하고 당업자에게 일어날 수 있다.
일부 구현예에서, 가이드에 대한 변형은 화학적 변형, 삽입, 결실, 또는 분할이다. 일부 구현예에서, 화학적 변형은 제한없이 2'-O-메틸 (M) 유사체, 2'-데옥시 유사체, 2-티오우리딘 유사체, N6-메틸아데노신 유사체, 2'-플루오로 유사체, 2-아미노푸린, 5-브로모-우리딘, 슈도우리딘 (Ψ), N1-메틸슈도우리딘 (me1Ψ), 5-메톡시우리딘 (5moU), 이노신, 7-메틸구아노신, 2'-O-메틸-3'-포스포로티오에이트 (MS), S-구속형 에틸 (cEt), 포스포로티오에이트 (PS), 또는 2'-O-메틸-3'-티오PACE (MSP)의 도입을 포함한다. 일부 구현예에서, 가이드는 하나 이상의 포스포로티오에이트 변형을 포함한다. 일정 구현예에서, 가이드의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 25개 뉴클레오티드가 화학적으로 변형된다. 일정 구현예에서, 씨드 영역 내 하나 이상의 뉴클레오티드가 화학적으로 변형된다. 일정 구현예에서, 3'-말단 내 하나 이상의 뉴클레오티드가 화학적으로 변형된다. 일정 구현예에서, 5'-핸들 내 뉴클레오티드의 어떠한 것도 화학적으로 변형되지 않는다. 일부 구현예에서, 씨드 영역 내 화학적 변형은 소수 변형, 예컨대 2'-플루오로 유사체의 도입이다. 특별한 구현예에서, 씨드 영역의 하나의 뉴클레오티드는 2'-플루오로 유사체로 치환된다. 일부 구현예에서, 3'-말단 내 5개 또는 10개 뉴클레오티드가 화학적으로 변형된다. Cpf1 CrRNA의 3'-말단에서 이러한 화학적 변형은 유전자 절단 효율을 개선시킨다 (Li, et al., Nature Biomedical Engineering, 2017, 1:0066). 특별한 구현예에서, 3'-말단 내 5개 뉴클레오티드는 2'-플루오로 유사체로 치환된다. 특별한 구현예에서, 3'-말단 내 10개 뉴클레오티드는 2'-플루오로 유사체로 치환된다. 특별한 구현예에서, 3'-말단 내 5개 뉴클레오티드는 2'- O-메틸 (M) 유사체로 치환된다.
일부 구현예에서, 가이드의 5'-핸들의 루프는 변형된다. 일부 구현예에서, 가이드의 5'-핸들의 루프는 결실, 삽입, 분할, 또는 화학적 변형을 갖도록 변형된다. 일정 구현예에서, 루프는 3개, 4개, 또는 5개 뉴클레오티드를 포함한다. 일정 구현예에서, 루프는 UCUU, UUUU, UAUU, 또는 UGUU의 서열을 포함한다.
가이드 서열, 및 그리하여 핵산-표적화 가이드 RNA는 임의의 표적 핵산 서열을 표적화하도록 선택될 수 있다. CRISPR 복합체의 형성 경우에, "표적 서열"은 가이드 서열이 상보성을 갖도록 설계되는 것인 서열을 의미하고, 여기서 표적 서열과 가이드 서열 간 하이브리드화는 CRISPR 복합체의 형성을 촉진한다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 용어 "표적 RNA"는 표적 서열이거나 또는 그를 포함하는 RNA 폴리뉴클레오티드를 의미한다. 달리 말해서, 표적 RNA는 gRNA의 일부분, 즉 가이드 서열이 상보성을 갖도록 설계되고 CRISPR 이펙터 단백질 및 gRNA를 포함하는 복합체에 의해 매개되는 이펙터 기능이 유도되는 RNA 폴리뉴클레오티드 또는 RNA 폴리뉴클레오티드의 일부분일 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질에 위치된다. 표적 서열은 DNA일 수 있다. 표적 서열은 임의의 RNA 서열일 수 있다. 일부 구현예에서, 표적 서열은 전령 RNA (mRNA), 프리-mRNA, 리보솜 RNA (rRNA), 운반 RNA (tRNA), 마이크로-RNA (miRNA), 소형 간섭 RNA (siRNA), 소형 핵 RNA (snRNA), 소형 핵 RNA (snoRNA), 이중 가닥 RNA (dsRNA), 비코딩 RNA (ncRNA), 장형 비코딩 RNA (lncRNA), 및 소형 세포질 RNA (scRNA)로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 mRNA, 프리-mRNA, 및 rRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 ncRNA, 및 lncRNA로 이루어진 군으로부터 선택되는 RNA 분자 내 서열일 수 있다. 일부 보다 바람직한 구현예에서, 표적 서열은 mRNA 분자 또는 프리-mRNA 분자 내 서열일 수 있다.  
일정 구현예에서, 가이드 RNA의 스페이서 길이는 28개 뉴클레오티드 미만이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 18개 뉴클레오티드 및 28개 뉴클레오티드 미만이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 19개 내지 28개 뉴클레오티드이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 19개 내지 25개 뉴클레오티드이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 20개 뉴클레오티드이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 23개 뉴클레오티드이다. 일정 구현예에서, 가이드 RNA의 스페이서 길이는 25개 뉴클레오티드이다.
일정 구현예에서, 절단 효율의 조절은 스페이서/표적을 따른 미스매치의 위치를 포함하여, 스페이서 서열 및 표적 서열 사이에 미스매치, 예를 들어 1 이상의 미스매치, 예컨대 1 또는 2 미스매치의 도입을 통해서 이용될 수 있다. 중심 (즉, 3' 또는 5'이 아님)에 가깝게 예를 들어 이중 미스매치가 존재할 수록, 절단 효율이 더 영향받는다. 따라서, 스페이서를 따라서 미스매치 위치를 선택함으로써, 절단 효율이 조절될 수 있다. 예로서, (예를 들어, 세포 개체군 내에서) 100% 미만의 표적 절단이 바람직하다면, 스페이서 및 표적 서열 사이에 1 이상, 예컨대 바람직하게 2 미스매치가 스페이서 서열에 도입될 수 있다. 미스매치 위치의 스페이서에 따라서 중심에 가까울 수록, 절단 백분율은 낮아진다.
일정 예의 구현예에서, 절단 효율은 단일 뉴클레오티드, 예컨대 단일 뉴클레오티드 다형성 (SNP), 변이, 또는 (점) 돌연변이 만큼 가변적인 둘 이상의 표적을 구별할 수 있는 단일 가이드를 설계하는데 이용될 수 있다. CRISPR 이펙터는 SNP (또는 다른 단일 뉴클레오티드 변이)에 대해 감소된 감도를 가질 수 있고 일정 수준의 효율로 SNP 표적을 계속 절단할 수 있다. 따라서, 2개 표적, 또는 표적 세트의 경우에, 가이드 RNA는 표적 중 하나, 즉 온-표적 SNP에 상보성인 뉴클레오티드 서열로 설계될 수 있다. 가이드 RNA는 합성 미스매치를 갖도록 더욱 설계된다. 본 명세서에서 사용되는 "합성 미스매치"는 천연 발생 SNP의 상류 또는 하류, 예컨대 상류 또는 하류에 5개 뉴클레오티드, 예를 들어 상류 또는 하류에 4개, 3개, 2개, 또는 1개 뉴클레오티드, 바람직하게 상류 또는 하류에 3개 이하 뉴클레오티드, 보다 바람직하게 상류 또는 하류에 2개 이하 뉴클레오티드, 가장 바람직하게 상류 또는 하류에 1개 뉴클레오티드 (즉, SNP에 인접)가 도입된 비천연 발생 미스매치를 의미한다. CRISPR 이펙터가 온-표적 SNP에 결합할 때, 오직 하나의 미스매치가 합성 미스매치와 형성될 것이고 CRISPR 이펙터는 계속 활성화되어서 검출가능한 신호가 생성될 것이다. 가이드 RNA가 오프-표적 SNP와 하이브리드화할 때, 2개 미스매치, SNP 유래 미스매치 및 합성 미스매치가 형성될 것이고, 검출가능한 신호는 생성되지 않는다. 따라서, 본 명세서에 개시된 시스템은 개체군 내 SNP를 구별하도록 설계될 수 있다. 예를 들어, 시스템은 단일 SNP 만큼 상이하거나 또는 일정 질환 특이적 SNP, 예컨대 제한없이 질환 연관 SNP, 예컨대 제한없이 암 연관 SNP를 검출하는 것이 병원성 균주를 구별하는데 사용될 수 있다.
일정 구현예에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 또는 9에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 2, 3, 4, 5, 6, 또는 7에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 3, 4, 5, 또는 6에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 3에 위치되도록 설계된다.
일정 구현예에서, 가이드 RNA는 미스매치 (예를 들어, 합성 미스매치, 즉 SNP 이외의 추가 돌연변이)가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 1, 2, 3, 4, 5, 6, 7, 8, 또는 9에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 4, 5, 6, 또는 7에 위치되도록 설계된다. 일정 구현예에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 5에 위치되도록 설계된다.
일정 구현예에서, 가이드 RNA는 미스매치가 SNP 상류의 2개 뉴클레오티드 (즉, 1개의 개재 뉴클레오티드)에 위치되도록 설계된다.
일정 구현예에서, 가이드 RNA는 미스매치가 SNP 하류의 2개 뉴클레오티드 (즉, 1개의 개재 뉴클레오티드)에 위치되도록 설계된다.
일정 구현예에서, 가이드 RNA는 미스매치가 스페이서 서열의 (5' 말단에서 시작하여) 위치 5에 위치되고 SNP가 스페이서 서열의 (5' 말단에서 시작하여) 위치 3에 위치되도록 설계된다.
본 명세서에 기술된 구현예는 본 명세서에서 논의되는 바와 같은 벡터를 세포에 전달하는 단계를 포함하는 본 명세서에 논의된 바와 같은 진핵생물 세포에서 (시험관 내에서, 즉 단리된 진핵생물 세포에서) 하나 이상의 뉴클레오티드 변형을 유도시키는 것을 이해한다. 돌연변이(들)는 가이드(들) RNA(들)를 통해서 세포(들)의 각각의 표적 서열에서 하나 이상의 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각각의 표적 서열에서 1-75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각각의 표적 세포에서 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각각의 표적 서열에서 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각각의 표적 서열에서 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함한다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각각의 표적 서열에서 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해서 상기 세포(들)의 각각의 표적 서열에서 40, 45, 50, 75, 100, 200, 300, 400 또는 500개 뉴클레오티드의 도입, 결실, 또는 치환을 포함할 수 있다.
전형적으로 내생성 CRISPR 시스템의 상황에서, CRISPR 복합체의 형성 (표적 서열과 하이브리드화된 가이드 서열을 포함하고 하나 이상의 Cas 단백질과 복합체 형성)은 표적 서열 내 또는 그 근처 (예를 들어, 이로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 이상의 염기쌍 이내)에서 절단을 일으키지만, 예를 들어 특히 RNA 표적의 경우에, 2차 구조에 의존한다.
증폭 시약
일정 예의 구현예에서, 본 명세서에 개시된 시스템은 증폭 시약을 포함할 수 있다. 핵산의 증폭에 유용한 상이한 성분 또는 시약이 본 명세서에서 기술된다. 예를 들어, 본 명세서에 기술된 바와 같은 증폭 시약은 완충액, 예컨대 Tris 완충액을 포함할 수 있다. Tris 완충액은 예를 들어, 제한없이, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 11 mM, 12 mM, 13 mM, 14 mM, 15 mM, 25 mM, 50 mM, 75 mM, 1 M 등의 농도를 포함하여, 바람직한 적용 또는 용도에 적절한 임의 농도로 사용될 수 있다. 당업자는 본 발명에서 사용을 위해 적절한 완충액 예컨대 Tris의 농도를 결정할 수 있을 것이다.
염, 예컨대 마그네슘 클로라이드 (MgCl2), 포타슘 클로라이드 (KCl), 또는 소듐 클로라이드 (NaCl)가 핵산 단편의 증폭을 개선시키기 위해서, 증폭 반응, 예컨대 PCR에 포함될 수 있다. 염 농도가 특정 반응 및 적용에 의존할 것이지만, 일부 구현예에서, 특정 크기의 핵산 단편은 특정한 염 농도에서 최적 결과를 낳을 수 있다. 바람직한 결과를 생성시키기 위해서, 더 큰 생성물은 변경된 염 농도, 전형적으로 더 낮은 염을 요구할 수 있는 한편, 더 작은 생성물의 증폭은 더 높은 염 농도에서 더 양호한 결과를 생성시킬 수 있다. 당업자는 염 농도의 변경과 함께, 염의 존재 및/또는 농도가 생물학적 또는 화학적 반응의 엄격성을 변경시킬 수 있으므로, 임의의 염은 본 명세서에 기술된 바와 같이, 본 발명의 반응을 위해 적절한 조건을 제공하는 것이 사용될 수 있다는 것을 이해할 것이다.
생물학적 또는 화학적 반응의 다른 성분은 이의 재료의 분석을 위해서 세포를 파괴 또는 용해시키기 위해 세포 용해 성분을 포함할 수 있다. 세포 용해 성분은 제한없이, 세제, 상기 기술된 바와 같은 염, 예컨대 NaCl, KCl, 암모늄 술페이트 [(NH4)2SO4] 등을 포함할 수 있다. 본 발명에 적합할 수 있는 세제는 Triton X-100, 소듐 도데실 술페이트 (SDS), CHAPS (3-[(3-콜아미도프로필)디메틸암모니오]-1-프로판술포네이트), 에틸 트리메틸 암모늄 브로마이드, 노닐 페녹시폴리에톡실에탄올 (NP-40)을 포함할 수 있다. 세제의 농도는 특정 적용에 의존적일 수 있고, 일부 경우에 반응에 특이적일 수 있다. 증폭 반응은 본 명세서에 상술된 바와 같이, 임의 농도로 사용되는 dNTP 및 핵산 프라이머를 포함할 수 있다.
증폭 반응은 예컨대 제한없이, 100 nM, 150 nM, 200 nM, 250 nM, 300 nM, 350 nM, 400 nM, 450 nM, 500 nM, 550 nM, 600 nM, 650 nM, 700 nM, 750 nM, 800 nM, 850 nM, 900 nM, 950 nM, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 150 mM, 200 mM, 250 mM, 300 mM, 350 mM, 400 mM, 450 mM, 500 mM 등의 농도를 포함하는, 본 발명에 적절한 임의 농도로 사용되는 dNTP 및 핵산 프라이머를 포함할 수 있다. 유사하게, 본 발명에 따라서 유용한 중합효소는 Taq 중합효소, Q5 중합효소 등을 포함하여, 당분야에 공지되고 본 발명에서 유용한 임의의 특별하거나 또는 일반적인 중합효소일 수 있다.
일부 구현예에서, 본 명세서에 기술된 바와 같은 증폭 시약은 핫-스타트 증폭에서 사용에 적절할 수 있다. 핫 스타트 증폭은 일부 구현예에서 어댑터 분자 또는 올리고의 이량체화를 감소 또는 제거시키기 위해서, 또는 달리 원치않는 증폭 생성물 또는 아티팩트를 방지하고 바람직한 생성물의 최적 증폭을 수득하기 위해서 유리할 수 있다. 증폭에서 사용을 위한 본 명세서에 기술된 많은 성분이 또한 핫-스타트 증폭에서 사용될 수 있다. 일부 구현예에서, 핫-스타트 증폭과 사용을 위해 적절한 시약 또는 성분은 적절하다면 하나 이상의 조성물 성분 대신에 사용될 수 있다. 예를 들어, 중합효소 또는 다른 시약은 특정 온도 또는 다른 반응 조건에서 바람직한 활성을 나타내는 것이 사용될 수 있다. 일부 구현예에서, 시약은 핫-스타트 증폭에서 사용을 위해 설계되거나 또는 최적화된 것이 사용될 수 있고, 예를 들어, 중합효소는 전위 이후 또는 특정 온도에 도달한 이후에 활성화될 수 있다. 이러한 중합효소는 항체-기반 또는 압타머-기반일 수 있다. 본 명세서에 기술된 바와 같은 중합효소는 당분야에 공지되어 있다. 이러한 시약의 예는 제한없이 핫-스타트 중합효소, 핫-스타트 dNTP, 및 광-케이징된 dNTP를 포함할 수 있다. 이러한 시약은 당분야에 공지되어 있고 입수가능하다. 당업자는 개별 시약에 적절하게 최적 온도를 결정할 수 있을 것이다.
중합효소
본 명세서에서 시스템 및 방법은 표적 서열의 증폭을 위해 중합효소를 이용한다. 본 발명에 따라서 유용한 중합효소는 Taq 중합효소, Q5 중합효소 등을 포함하여, 당분야에 공지되고 당분야에서 유용한 임의의 특이적이거나 또는 일반적인 중합효소일 수 있다. 구현예에서, 증폭은 DNA의 닉킹된 조각을 닉킹 부위 사이의 표적을 기하급수적으로 증폭시키는 순환 반응에서 닉킹 및 연장시킬 수 있는 것이 이용될 수 있다. 구현예에서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, Gst 중합효소, Taq 중합효소, 이. 콜라이 DNA 중합효소 I의 클레노우 단편, KlenTaq, Pol III DNA 중합효소, T5 DNA 중합효소, Gst 중합효소, 및 시쿼나제 DNA 중합효소로부터 선택될 수 있다.
증폭은 등온일 수 있고 온도를 선택할 수 있다. 일 구현예에서, 증폭은 37℃에서 신속하게 진행된다. 다른 구현예에서, 등온 증폭의 온도는 상이한 온도에서 작동가능한 중합효소 (예를 들어, Bsu, Bst, Phi29, 클레노우 단편 등)를 선택하여 선택될 수 있다. 닉카제 기반 증폭은 온도 범위 내에서 또는 일정 온도에서 수행될 수 있다. 일정 구현예에서, 닉카제 기반 증폭은 약 50℃-59℃, 약 60℃-72℃, 또는 약 37℃에서 수행될 수 있다. Cas-기반 닉카제 및 중합효소는 동일한 온도 하에서 또는 상이한 온도 하에서 수행될 수 있다.
등온 반응은 일반적으로 급격한 온도 순환없이, 약 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃, 10℃, 11℃, 12℃, 13℃, 14℃, 15℃, 16℃, 17℃, 18℃, 19℃, 또는 20℃ 초과의 온도 변동, 또는 약 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃, 10℃, 11℃, 12℃, 13℃, 14℃, 15℃, 16℃, 17℃, 18℃, 19℃, 또는 20℃ 미만의 온도 변동없이, 수행되는 온도를 의미한다. 일정 구현예에서, 등온 반응은 중합 효소가 작동가능한 온도 범위에서 수행된다.
일부 구현예에서, 본 명세서에 기술된 바와 같은 증폭 시약은 핫-스타트 증폭에서 사용에 적절할 수 있다. 핫 스타트 증폭은 일부 구현예에서 어댑터 분자 또는 올리고의 이량체화를 감소 또는 제거시키거나, 또는 달리 원치 않는 증폭 생성물 또는 아티팩트를 방지하고 바람직한 생성물의 최적 증폭을 수득하기 위해서 유리할 수 있다. 증폭에서 사용을 위한 본 명세서에 기술된 많은 성분이 또한 핫-스타트 증폭에서 사용될 수 있다. 일부 구현예에서, 핫-스타트 증폭과 사용에 적절한 시약 또는 성분은 적절하면 조성물 성분 중 하나 이상 대신에 사용될 수 있다. 예를 들어, 중합효소 또는 다른 시약은 특정 온도 또는 다른 반응 조건에서 바람직한 활성을 나타내는 것이 사용될 수 있다. 일부 구현예에서, 시약은 핫-스타트 증폭에서 사용을 위해 설계되거나 또는 최적화된 것이 사용될 수 있고, 예를 들어, 중합효소는 전위 이후 또는 특정 온도에 도달 이후에 활성화될 수 있다. 이러한 중합효소는 항체-기반 또는 압타머-기반일 수 있다. 본 명세서에 기술된 바와 같은 중합효소는 당분야에 공지되어 있다. 이러한 시약의 예는 제한없이 핫-스타트 중합효소, 핫-스타트 dNTP, 및 광-케이징된 dNTP를 포함할 수 있다. 이러한 시약은 당분야에 공지되어 있고 입수가능하다. 당업자는 개별 시약에 적절한 최적 온도를 결정할 수 있을 것이다.
프라이머 쌍
프라이머 쌍은 본 명세서에 제공되는 시스템 및 방법의 구현예에서 이용된다. 프라이머 쌍은 제1 프라이머 및 제2 프라이머를 포함한다. 제1 프라이머는 표적 핵산 상의 제1 위치에 상보성인 부분을 포함하고 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함한다. 제2 프라이머는 표적 핵산 상의 제2 위치에 상보성인 부분을 포함하고 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함한다.
한 양상에서, 프라이머 쌍은 반응 혼합물에 대한 제1 및 제2 프라이머를 포함한 것이 제공되고, 제1 프라이머는 표적 핵산의 제1 가닥에 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 제2 가닥에 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함한다.
한 양상에서, 프라이머 쌍은 반응 혼합물에 대한 제1 및 제2 프라이머를 포함하는 것이 제공되고, 제1 프라이머는 표적 핵산의 가닥 상의 제1 위치에 상보성인 부분 및 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 가닥 상의 제2 위치에 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함한다.
특별한 구현예에서, 증폭 반응 혼합물은 표적 핵산 가닥과 하이브리드화할 수 있는 프라이머를 더 포함할 수 있다. 용어 "하이브리드화"는 프라이머가 주형의 다른 영역이 아닌, 오직 주형 가닥 중 하나에서 이의 상보성 서열에만 특이적으로 결합하는 조건 하에서 단일-가닥 핵산 주형의 영역에 올리고뉴클레오티드 프라이머가 결합하는 것을 의미한다. 하이브리드화의 특이성은 올리고뉴클레오티드 프라이머의 길이, 하이브리드화 반응이 수행되는 온도, 이온 강도, 및 pH에 의해 영향받을 수 있다. 용어 "프라이머"는 표적 핵산 가닥의 중합효소 의존적 복제를 촉진하기 위해서 표적 핵산 상의 단일 가닥 영역에 결합할 수 있는 단일 가닥 핵산을 의미한다. "상보성" 또는 "상보체(들)"인 핵산(들)은 표준 왓슨-크릭 (Watson-Crick), 후그스틴 (Hoogsteen) 또는 역 후그스틴 결합 상보성 규칙에 따라서 염기-쌍형성할 수 있는 것들이다.
일정 구현예에서, 프라이머는 연장된 가닥을 하이브리드화할 수 있는 반응에 포함되고 이어서 프라이머의 추가 중합효소 연장에 의해 2개 dsDNA 조각: 제1 가닥 CRISPR 가이드 부위 또는 제1 및 제2 가닥 둘 모두의 CRISPR 가이드 부위를 포함하는 제1 dsDNA, 및 CRISPR 가이드 부위 또는 제1 및 제2 가닥 둘 모두의 CRISPR 가이드 부위를 포함하는 제2 dsDNA를 재생시킬 수 있다. 이들 조각은 닉킹 부위 사이의 표적 영역을 기하급수적으로 증폭시키는 순환 반응에서 계속 닉킹되고 연장된다.
본 접근법은 표적의 말단에 닉킹 기질을 첨가하는 프라이머의 어닐링 및 연장을 허용하기 위해서 본래 dsDNA 표적의 변성을 요구하는, (예를 들어, 닉킹 효소 증폭 반응 또는 NEAR에서) 고정 서열 선호도의 닉킹 효소를 사용하는 이전의 닉킹 등온 증폭 기술에 비해서 장점을 갖는다. 닉킹 부위가 가이드 RNA를 통해 프로그램될 수 있는 CRISPR 닉카제를 사용하는 본 발명의 방법은 변성 단계를 필요로 하지 않아서, 전체 반응을 진짜로 등온이게 할 수 있다는 것을 의미한다. 닉킹 기질을 첨가한 프라이머가 이후 반응에서 사용되는 프라이머와 상이하기 때문에, 반응이 간소화되는데, CRISPR 닉킹 예컨대 Cpf1 닉킹 증폭이 오직 하나의 프라이머 세트 (즉, 2개 프라이머)를 필요로 하는데 반해서 NEAR은 2개 프라이머 세트 (즉, 4개 프라이머)를 필요로 한다는 것을 의미한다. 이것은 변성 및 등온 온도로 후속 냉각을 수행하기 위해 복잡한 기계 장비없이 수행하기 위해 CRISPR 닉킹 증폭을 훨씬 더 단순하고 쉽게 만들어서, 보다 단순하고, 보다 빠른 증폭 방법을 제공한다.
프라이머는 프로모터 서열을 포함할 수 있다. 일정 구현예에서, 프로모터 서열은 임의의 검출 단계에서 사용될 수 있는 서열이다. 구현예에서, 프라이머는 SHERLOCK 검출 방법에서 사용할 수 있는 T7 프로모터 서열을 포함한다. 다른 프로모터 서열은 당업자가 후속의 하류 시스템 및 방법에서 사용을 위해 선택할 수 있다.
핵산은 중합 단계가 수행될 수 있다. DNA 중합효소는 증폭시키고자 하는 핵산이 DNA라면 선택된다. 초기 표적이 RNA인 경우에, 역전사효소는 먼저 RNA 표적을 cDNA 분자로 복제시키는데 사용될 수 있고, cDNA는 그 다음에 더욱 증폭된다.
증폭 반응은 예컨대 제한없이, 100 nM, 150 nM, 200 nM, 250 nM, 300 nM, 350 nM, 400 nM, 450 nM, 500 nM, 550 nM, 600 nM, 650 nM, 700 nM, 750 nM, 800 nM, 850 nM, 900 nM, 950 nM, 1 mM, 2 mM, 3 mM, 4 mM, 5 mM, 6 mM, 7 mM, 8 mM, 9 mM, 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM, 100 mM, 150 mM, 200 mM, 250 mM, 300 mM, 350 mM, 400 mM, 450 mM, 500 mM 등의 농도를 포함하여, 본 발명에 적절한 임의 농도로 사용되는 핵산 프라이머 및 dNTP를 포함할 수 있다.
표적 핵산
CRISPR 복합체의 형성 경우에, "표적 서열"은 가이드 서열이 상보성을 갖도록 설계된 서열을 의미하고, 여기서 표적 서열과 가이드 서열 간에 하이브리드화는 CRISPR 복합체의 형성을 촉진한다. 표적 서열은 DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 용어 "표적 DNA 또는 RNA"는 표적 서열이거나 또는 그를 포함하는 DNA 또는 RNA 폴리뉴클레오티드를 의미한다. 달리 말해서, 표적 DNA 또는 RNA는 gRNA의 일부분, 즉 가이드 서열이 상보성을 갖도록 설계되고 CRISPR 이펙터 단백질 및 gRNA를 포함하는 복합체에 의해 매개되는 이펙터 기능을 유도시키는 DNA 또는 RNA 폴리뉴클레오티드 또는 DNA 또는 RNA 폴리뉴클레오티드의 일부분일 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질에 위치된다.
닉카제 기반 증폭은 다양한 길이로 표적 핵산 서열을 증폭시키는데 사용될 수 있다. 예를 들어, 표적 핵산 서열은 약 10-20개, 약 20-30개, 약 30-40개, 약 40-50개, 약 50-100개, 약 100-200개, 약 100-200개, 약 100-1000개, 약 1000-2000개, 약 2000-3000개, 약 3000-4000개, 또는 약 4000-5000개 뉴클레오티드 길이이다. 표적 핵산은 DNA, 예를 들어, 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA, 플라스미드 DNA, 순환성 세포 무함유 DNA, 환경 DNA 또는 합성 이중 가닥 DNA일 수 있다. 표적 핵산은 단일-가닥 핵산, 예를 들어, RNA 분자일 수 있다. 단일-가닥 핵산은 닉카제-기반 증폭 이전에 이중-가닥 핵산으로 전환될 수 있다. 예를 들어, RNA 분자는 증폭 이전에 역전사를 통해서 이중 가닥 DNA로 전환될 수 있다. 단일-가닥 핵산은 단일 가닥 바이러스 DNA, 바이러스 RNA, 전령 RNA, 리보솜 RNA, 운반 RNA, 마이크로RNA, 짧은 간섭 RNA, 소형 핵 RNA, 합성 RNA, 장형 비코딩 RNA, 프리-마이크로RNA, dsRNA, 및 합성 단일 가닥 DNA로 이루어진 군으로부터 선택될 수 있다.
샘플
본 명세서에서 기술되는, 본 발명에서 사용을 위한 샘플은 생물학적 또는 환경 샘플, 예컨대 식품 샘플 (신선 과일 또는 채소, 육류), 음료 샘플, 종이 표면, 패브릭 표면, 금속 표면, 목재 표면, 플라스틱 표면, 토양 샘플, 담수 샘플, 폐수 샘플, 염수 샘플, 주변 공기 또는 다른 가스 샘플에 노출, 또는 이의 조합일 수 있다. 예를 들어, 제한없이, 금속, 목재, 플라스틱, 고무 등을 포함한, 임의의 재료로 만들어진, 가정/상업/산업 표면을 면봉으로 닦아서 오염물에 대해 시험될 수 있다. 토양 샘플은 환경 목적 및/또는 인간, 동물, 또는 싱물 질환 검사 둘 모두를 위해서, 병원성 박테리아 또는 기생충, 또는 다른 미생물의 존재에 대해 시험될 수 있다. 물 샘플 예컨대 담수 샘플, 폐수 샘플, 또는 염수 샘플은 예를 들어, 크립토스포리듐 파르븀 (Cryptosporidium parvum), 지아르디아 람블리아 (Giardia lamblia), 또는 다른 미생물 오염의 존재를 검출하기 위해서, 청정도 및 안전성, 및/또는 휴대성에 대해 평가될 수 있다. 추가 구현예에서, 생물학적 샘플은 제한없이, 조직 샘플, 타액, 혈액, 혈장, 혈청, 대변, 소변, 객담, 점액, 림프, 활액, 뇌척수액, 복수, 흉막 삼출액, 혈청종, 고름, 또는 피부 또는 점막 표면의 면봉표본을 포함하는 공급원으로부터 수득될 수 있다. 일부 특정 구현예에서, 환경 샘플 또는 생물학적 샘플은 미정제 샘플일 수 있고/있거나 하나 이상의 표적 분자는 방법의 적용 이전에 샘플로부터 정제 또는 증폭되지 않을 수 있다. 미생물의 동정은 유용할 수 있고/있거나 많은 적용분야에 필요할 수 있으므로, 당업자가 적절하다고 여기는 임의 공급원으로부터의 임의 유형의 샘플이 본 발명에 따라서 사용될 수 있다.
일부 구현예에서, 생물학적 샘플은 혈액, 혈장, 혈청, 소변, 대변, 객담, 점액, 림프액, 활액, 담즙, 복수, 흉막 삼출액, 혈청종, 타액, 뇌척수액, 수양액 또는 유리체액, 또는 임의의 신체 분비액, 여출액, 삼출액, 또는 관절로부터 수득된 유체, 또는 피부 또는 점막 표면의 면봉표본을 포함할 수 있지만, 반드시 이에 제한되지 않는다.
특별한 구현예에서, 샘플은 인간 환자로부터 수득된 혈액, 혈장, 또는 혈청일 수 있다.
일부 구현예에서, 샘플은 식물 샘플일 수 있다. 일부 구현예에서, 샘플은미정제 샘플일 수 있다. 일부 구현예에서, 샘플은 정제된 샘플일 수 있다.
검출
본 명세서에 기술된 시스템은 검출을 위한 시스템을 더 포함할 수 있다. 닉카제 기반 증폭은 증폭된 핵산 생성물을 검출하기 위해 다양한 검출 방법과 조합될 수 있다. 예를 들어, 검출 시스템 및 방법은 겔 전기영동, 인터컬레이팅 염료 검출, PCR, 실시간 PCR, 형광발광, 형광 공명 에너지 전이 (FRET), 질량 분석법, 측류 어세이, 비색 어세이 (HRP, ALP, 금, 나노입자-기반 어세이) 및 CRISPR-SHERLOCK을 포함할 수 있다. 조합된 증폭 및 검출은 아토몰라 감도 또는 펨토몰라 감도를 획득할 수 있다. 일정 구현예에서, 본 발명의 방법 또는 시스템에 의한 DNA의 검출은 검출 이전에 (증폭된) DNA의 RNA로의 전사를 요구한다.
본 발명의 검출 방법은 다양한 조합으로 핵산 증폭 및 검출 절차를 포함할 수 있다는 것은 자명해 질 것이다. 검출하려는 핵산은 제한없이, 검출할 수 있는 중간 생성물을 제공하도록 임의의 적합한 방법을 통해 증폭시킬 수 있는 DNA 및 RNA를 포함하여, 임의의 천연 발생 또는 합성 핵산일 수 있다. 중간 생성물의 검출은 직접 또는 부차적 활성에 의해 검출가능한 신호 모이어티를 생성시키는, 제한없이, CRISPR 단백질의 결합 및 활성화를 포함하여 임의의 적합한 방법에 의할 수 있다.
특별한 구현예에서, 증폭된 핵산은 CRISPR Cas13-기반 시스템을 통해 검출할 수 있다. 특별한 구현예에서, 증폭된 핵산은 CRISPR Cas12-기반 시스템을 통해 검출할 수 있다 ([Chen et al. Science 360:436-439 (2018)] 및 [Gootenberg et al. Science 360:439-444 (2018)]). 특별한 구현예에서, 증폭된 핵산은 CRISPR Cas13-기반 및 CRISPR Cas12-기반 시스템의 조합을 통해 검출할 수 있다.
단일 뉴클레오티드 변이체를 포함하는 핵산의 검출, rRNA 서열 기반 검출, 약물 내성의 스크리닝, 미생물 발발의 모니터링, 유전자 섭동, 환경 샘플의 스크리닝은 예를 들어, 참조로 본 명세서에 편입되는, 2018년 10월 22일 출원된 WO/2019/07105의 [0183] - [0327]에 기술된 바와 같을 수 있다. WO 2017/219027, WO2018/107129, US20180298445, US 2018-0274017, US 2018-0305773, WO 2018/170340, 발명의 명칭 "Devices for CRISPR Effector System Based Diagnostics"로 2018년 3월 15일 출원된 미국 특허 출원 제15/922,837호, "Multi-Effector CRISPR Based Diagnostic Systems"로 2018년 9월 7일 출원된 PCT/US18/50091, 발명의 명칭 "CRISPR Effector System Based Multiplex Diagnostics"로 2018년 12월 20일 출원된 PCT/US18/66940, 발명의 명칭 "CRISPR Effector System Based Diagnostic"으로 2018년 10월 4일 출원된 PCT/US18/054472, 발명의 명칭 "CRISPR Effector System Based Diagnostics for Hemorrhagic Fever Detection"으로 2018년 10월 3일 출원된 미국 가출원 제62/740,728호, 발명의 명칭 "CRISPR Double Nickase Based Amplification, Compositions, Systems and Methods"로 2018년 6월 26일 출원된 미국 가출원 제62/690,278호 및 2018년 11월 14일 출원된 미국 가출원 제62/767,059호, 발명의 명칭 "CRISPR/CAS and Transposase Based Amplification, Compositions, Systems, And Methods"로 2018년 6월 26일 출원된 미국 가출원 제62/690,160호 및 2018년 11월 14일 출원된 미국 가출원 제62,767,077호, 발명의 명칭 "CRISPR Effector System Based Amplification Methods, Systems, And Diagnostics"로 2018년 6월 26일 출원된 미국 가출원 제62/690,257호 및 2018년 11월 14일 출원된 미국 가출원 제62/767,052호, 발명의 명칭 "Multiplexing Highly Evolving Viral Variants With SHERLOCK"으로 2018년 11월 14일 출원된 미국 가출원 제62/767,076호, 및 발명의 명칭 "Droplet SHERLOCK"으로 2018년 11월 14일 출원된 미국 가출원 제62/767,070호를 참조한다. 추가로 WO2017/127807, WO2017/184786, WO 2017/184768, WO 2017/189308, WO 2018/035388, WO 2018/170333, WO 2018/191388, WO 2018/213708, WO 2019/005866, 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2018년 12월 21일 출원된 PCT/US18/67328, 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2018년 12월 21일 출원된 PCT/US18/67225 및 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2018년 12월 21일 출원된 PCT/US18/67307, 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2018년 7월 31일 출원된 US 가출원 제62/712,809호, 발명의 명칭 "Novel Cas12b Enzymes and Systems"로 2018년 10월 10일 출원된 US 가출원 제62/744,080호 및 발명의 명칭 "Novel Cas12b Enzymes and Systems"로 2018년 10월 26일 출원된 US 가출원 제62/751,196호, 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2018년 8월 7일 출원된 U.S. 715,640, WO 2016/205711, U.S. 9,790,490, WO 2016/205749, WO 2016/205764, WO 2017/070605, WO 2017/106657, 및 WO 2016/149661, WO2018/035387, WO2018/194963, [Cox DBT, et al., RNA editing with CRISPR-Cas13, Science. 2017 Nov 24;358(6366):1019-1027]; [Gootenberg JS, et al., Multiplexed and portable nucleic acid detection platform with Cas13, Cas12a, and Csm6., Science. 2018 Apr 27;360(6387):439-444]; [Gootenberg JS, et al., Nucleic acid detection with CRISPR-Cas13a/C2c2., Science. 2017 Apr 28;356(6336):438-442]; [Abudayyeh OO, et al., RNA targeting with CRISPR-Cas13, Nature. 2017 Oct 12;550(7675):280-284]; [Smargon AA, et al., Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28. Mol Cell. 2017 Feb 16;65(4):618-630.e7]; [Abudayyeh OO, et al., C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector, Science. 2016 Aug 5;353(6299):aaf5573]; [Yang L, et al., Engineering and optimising deaminase fusions for genome editing. Nat Commun. 2016 Nov 2;7:13330], [Myrvhold et al., Field deployable viral diagnostics using CRISPR-Cas13, Science 2018 360, 444-448], [Shmakov et al. "Diversity and evolution of class 2 CRISPR-Cas systems", Nat Rev Microbiol. 2017 15(3):169-182]을 더욱 참조하고, 이들 각각은 그 전문이 참조로 본 명세서에 편입된다.
일부 특별한 구현에에서, RNA 표적화 이펙터는 강력한 CRISPR-기반 검출을 제공하기 위해 이용될 수 있다. 본 명세서에 개시된 구현예는 비슷한 수준의 감도로 DNA 및 RNA 둘 모두를 검출할 수 있고 개시된 HDA 방법 및 시스템과 함께 사용될 수 있다. 참조의 편이를 위해서, 본 명세서에 개시된 검출 구현예는 또한 SHERLOCK (Specific High-sensitivity Enzymatic Reporter unLOCKing)이라고 할 수 있고, 이것은 일부 구현예에서, 중온성 및 고온성 등온 조건을 포함하여, 본 명세서에 개시된 HDA 방법에 후속으로 수행된다.
일부 구현예에서, 핵산-표적화 검출 시스템의 하나 이상의 엘리먼트는 내생성 CRISPR RNA-표적화 시스템을 포함하는 특정 유기체로부터 유래된다. 일정 예의 구현예에서, 이펙터 단백질 CRISPR RNA-표적화 검출 시스템은 제한없이, 본 명세서에 기술된 HEPN 도메인, 당분야에 공지된 HEPN 도메인, 및 공통 서열 모티프와 비교하여 HEPN으로 인식되는 도메인을 포함하여, 적어도 하나의 HEPN 도메인을 포함한다. 몇몇 이러한 도메인이 본 명세서에서 제공된다. 비제한적인 일례에서, 공통 서열은 본 명세서에서 제공하는 C2c2 또는 Cas13b 오솔로그의 서열로부터 유래될 수 있다. 일정 예의 구현예에서, 이펙터 단백질은 단일 HEPN 도메인을 포함한다. 일정한 다른 예의 구현예에서, 이펙터 단백질은 2개의 HEPN 도메인을 포함한다.
일례의 구현예에서, 이펙터 단백질은 RxxxxH 모티프 서열을 포함하는 하나 이상의 HEPN 도메인을 포함한다. RxxxxH 모티프 서열은 제한없이, 본 명세서에 기술된 HEPN 도메인 또는 당분야에 공지된 HEPN 도메인으로부터 유래될 수 있다. RxxxxH 모티프 서열은 둘 이상의 HEPN 도메인의 부분들을 조합하여 생성된 모티프 서열을 더 포함한다. 언급한 바와 같이, 공통 서열은 발명의 명칭 "Novel Type VI CRISPR Orthologs and Systems"의 PCT/US2017/038154 중 예를 들어, 페이지 256-264 및 285-336, 발명의 명칭 "Novel CRISPR Enzymes and Systems"의 미국 가출원 제2/432,240호, 발명의 명칭 "Novel Type VI CRISPR Orthologs and Systems"로 2017년 3월 15일 출원된 미국 가출원 제62/471,710호, 및 발명의 명칭 "Novel Type VI CRISPR Orthologs and Systems"로 2017년 4월 12일 출원된 미국 가출원 제62/484,786호에 개시된 오솔로그의 서열로부터 유래될 수 있다.
본 발명의 일 구현예에서, HEPN 도메인은 R{N/H/K}X1X2X3H (SEQ ID NO:15)의 서열을 포함하는 적어도 하나의 RxxxxH 모티프를 포함한다. 본 발명의 일 구현예에서, HEPN 도메인은 R{N/H}X1X2X3H (SEQ ID NO:16)의 서열을 포함하는 RxxxxH 모티프를 포함한다. 본 발명의 일 구현예에서, HEPN 도메인은 R{N/K}X1X2X3H (SEQ ID NO:17)의 서열을 포함한다. 일정 구현예에서, X1은 R, S, D, E, Q, N, G, Y, 또는 H이다. 일정 구현예에서, X2는 I, S, T, V, 또는 L이다. 일정 구현예에서, X3은 L, F, N, Y, V, I, S, D, E, 또는 A이다.
본 발명에 따라 사용을 위한 추가의 이펙터는 cas1 유전자에 대한 그들의 근접성을 통해서, 예를 들어, 제한하는 것은 아니지만, cas1 유전자의 시작으로부터 20 kb 영역 및 cas1 유전자의 종료로부터 20 kb 영역 이내에서 확인할 수 있다. 일정 구현예에서, 이펙터 단백질은 적어도 하나의 HEPN 도메인 및 적어도 500개 아미노산을 포함하고, 여기서 C2c2 이펙터 단백질은 Cas 유전자 또는 CRISPR 어레이의 상류 또는 하류 20 kb 이내에서 원핵생물 게놈에 천연적으로 존재한다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로서도 공지됨), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체, 또는 이의 변형된 형태를 포함한다. 일정 예의 구현예에서, C2c2 이펙터 단백질은 Cas 1 유전자의 상류 또는 하류 20 kb 이내에서 원핵생물 게놈에 천연적으로 존재한다. 용어 "오솔로그" ("orthologue" 또는 "ortholog") 및 "상동체" ("homologue" 또는 "homolog")는 당분야에서 충분히 공지되어 있다. 추가 지침을 통해서, 본 명세서에서 사용되는 단백질의 "상동체"는 상동체인 단백질과 동일하거나 또는 유사한 기능을 수행하는 동일한 종의 단백질이다. 상동성 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다. 본 명세서에서 사용되는 단백질의 "오솔로그"는 오솔로그인 단백질과 동일하거나 또는 유사한 기능을 수행하는 상이한 종의 단백질이다. 오솔로그 단백질은 구조적으로 관련될 필요가 없거나, 또는 오직 부분적으로 구조적으로 관련된다.
특정 구현예에서, VI형 RNA-표적화 Cas 효소는 C2c2이다. 다른 예의 구현예에서, VI형 RNA-표적화 Cas 효소는 Cas 13b이다. 특정 구현예에서, 본 명세서에서 언급되는 VI형 단백질 예컨대 C2c2의 상동체 또는 오솔로그는 VI형 단백질 예컨대 C2c2 (예를 들어, 임의의 렙토트리키아 샤히이 (Leptotrichia shahii) C2c2, 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리듐 아미노필럼 (Clostridium aminophilum) (DSM 10710) C2c2, 카르노박테리움 갈리나럼 (Carnobacterium gallinarum) (DSM 4847) C2c2, 팔루디박터 프로피오니시게네스 (Paludibacter propionicigenes) (WB4) C2c2, 리스테리아 웨이헨스테파넨시스 (Listeria weihenstephanensis) (FSL R9-0317) C2c2, 리스테리아세아에 박테리움 (Listeriaceae bacterium) (FSL M6-0635) C2c2,  리스테리아 뉴요켄시스 (Listeria newyorkensis) (FSL M6-0635) C2c2, 렙토트리키아 웨이데이 (Leptotrichia wadei) (F0279) C2c2, 로도박터 캅슐라터스 (Rhodobacter capsulatus) (SB 1003) C2c2, 로도박터 캅슐라터스 (R121) C2c2, 로도박터 캅슐라터스 (DE442) C2c2, 렙토트리키아 웨이데이 (Lw2) C2c2, 또는 리스테리아 실리게리 (Listeria seeligeri) C2c2 중 임의의 야생형 서열 기반)와 적어도 30%, 또는 적어도 40%, 또는 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 상동성 또는 동일성을 갖는다. 추가 구현예에서, VI형 단백질 예컨대 C2c2의 상동체 또는 오솔로그는 야생형 C2c2 (예를 들어, 렙토트리키아 샤히이 C2c2, 라크노스피라세아에 박테리움 MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리듐 아미노필럼 (DSM 10710) C2c2, 카르노박테리움 갈리나럼 (DSM 4847) C2c2, 팔루디박터 프로피오니시게네스 (WB4) C2c2, 리스테리아 웨이헨스테파넨시스 (FSL R9-0317) C2c2, 리스테리아세아에 박테리움 (FSL M6-0635) C2c2,  리스테리아 뉴요켄시스 (FSL M6-0635) C2c2, 렙토트리키아 웨이데이 (F0279) C2c2, 로도박터 캅슐라터스 (SB 1003) C2c2, 로도박터 캅슐라터스 (R121) C2c2, 로도박터 캅슐라터스 (DE442) C2c2, 렙토트리키아 웨이데이 (Lw2) C2c2, 또는 리스테리아 실리게리 C2c2 중 임의의 야생형 서열 기반)와 적어도 30%, 또는 적어도 40%, 또는 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80%, 보다 바람직하게 적어도 85%, 보다 더 바람직하게 적어도 90%, 예컨대 예를 들어 적어도 95%의 서열 동일성을 갖는다.
일정한 다른 예의 구현예에서, CRISPR 시스템 이펙터 단백질은 C2c2 뉴클레아제이다. C2c2의 활성은 2개의 HEPN 도메인의 존재에 의존적일 수 있다. 이들은 RNase 도메인, 즉 RNA를 절단하는 뉴클레아제 (특히 엔도뉴클레아제)인 것으로 확인되었다. C2c2 HEPN은 또한 표적 DNA, 또는 잠재적으로 DNA 및/또는 RNA일 수 있다. C2c2의 HEPN 도메인이 적어도 결합할 수 있고, 그들 야생형 형태로, RNA를 절단할 수 있다는 것을 기반으로 하면, C2c2 이펙터 단백질이 RNase 기능을 갖는 것이 바람직하다. C2c2 CRISPR 시스템과 관련하여, 2016년 6월 17일 출원된 미국 가출원 제62/351,662호 및 2016년 8월 17일 출원된 미국 가출원 제62/376,377호를 참조한다. 또한 2016년 6월 17일 출원된 미국 가출원 제62/351,803호를 참조한다. 또한 Broad Institute 번호 10035.PA4 및 변호인 서류 번호 47627.03.2133을 보유하는 발명의 명칭 "Novel Crispr Enzymes and Systems"로 2016년 12월 8일 출원된 미국 가출원을 참조한다. 또한 [East-Seletsky et al. "Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection" Nature doi:10/1038/nature19802] 및 [Abudayyeh et al. "C2c2 is a single-component programmable RNA-guided RNA targeting CRISPR effector" bioRxiv doi:10.1101/054742]을 더욱 참조한다.
CRISPR 시스템에서 RNase 기능은 공지되어 있고, 예를 들어, mRNA 표적화는 일정한 III형 CRISPR-Cas 시스템에 대해서 보고되었었고 (Hale et al., 2014, Genes Dev, vol.  28, 2432-2443; Hale et al., 2009, Cell, vol. 139, 945-956; Peng et al., 2015, Nucleic acids research, vol. 43, 406-417) 상당한 장점을 제공한다. 스타필로코커스 에피더미스 (Staphylococcus epidermis) III-A형 시스템에서, 표적 전반에서의 전사는 Cas10-Csm 리보뉴클레오단백질 이펙터 단백질 복합체 내의 독립적인 활성 부위에 의해 매개되는, 표적 DNA 및 이의 전사물의 절단을 야기시킨다 (Samai et al., 2015, Cell, vol. 151, 1164-1174). 따라서, 본 발명의 이펙터 단백질을 통해서 RNA를 표적화하는, CRISPR-Cas 시스템, 조성물 또는 방법이 제공된다.
일 구현예에서, Cas 단백질은 제한없이 렙토트리키아 (Leptotrichia), 리스테리아 (Listeria), 코리네박터 (Corynebacter), 수테렐라 (Sutterella), 레지오넬라 (Legionella), 트레포네마 (Treponema), 필리팍토르 (Filifactor), 유박테리움 (Eubacterium), 스트렙토코커스 (Streptococcus), 락토바실러스 (Lactobacillus), 마이코플라스마 (Mycoplasma), 박테로이데스 (Bacteroides), 플라비이볼라 (Flaviivola), 플라보박테리움 (Flavobacterium), 스파에로카에타 (Sphaerochaeta), 아조스피릴럼 (Azospirillum), 글루콘아세토박터 (Gluconacetobacter), 네이세리아 (Neisseria), 로세부리아 (Roseburia), 파르비바큘럼 (Parvibaculum), 스타필로코커스 (Staphylococcus), 니트라티프락토르 (Nitratifractor), 마이코플라스마 (Mycoplasma), 캄필로박터 (Campylobacter), 및 라크노스피라 (Lachnospira)를 포함하는 속의 유기체의 C2c2 오솔로그일 수 있다. 이러한 속의 유기체의 종은 달리 본 명세서에 논의된 바와 같을 수 있다.
일정 예의 구현예에서, 본 발명의 C2c2 이펙터 단백질은 제한없이 하기 21종의 오솔로그 종을 포함한다 (다수 CRISPR 유전자좌 포함: 렙토트리키아 샤히이; 렙토트리키아 웨이데이 (Lw2); 리스테리아 실리게리; 라크노스피라세아에 박테리움 MA2020; 라크노스피라세아에 박테리움 NK4A179; [클로스트리듐] 아미노필럼 DSM 10710; 카르노박테리움 갈리나럼 DSM 4847; 카르노박테리움 갈리나럼 DSM 4847 (제2 CRISPR 유전자좌); 팔루디박터 프로피오니시게네스 WB4; 리스테리아 웨이헨스테파넨시스 FSL R9-0317; 리스테리아세아에 박테리움 FSL M6-0635; 렙토트리키아 웨이데이 F0279; 로도박터 캅슐라터스 SB 1003; 로도박터 캅슐라터스 R121; 로도박터 캅슐라터스 DE442; 렙토트리키아 부칼리스 (Leptotrichia buccalis) C-1013-b; 허비닉스 헤미셀룰로실리티카 (Herbinix hemicellulosilytica); [유박테리움] 렉탈레; 유박테리아세아에 박테리움 (Eubacteriaceae bacterium) CHKCI004; 블라우티아 (Blautia) sp. 마르세이유-P2398; 및 렙토트리키아 sp. 경구 분류군 879 str. F0557. 12종의 추가의 비제한적인 예는 다음과 같다: 라크노스피라세아에 박테리움 NK4A144; 클로로플렉서스 아그레간스 (Chloroflexus aggregans); 데메퀴나 아우란티아카 (Demequina aurantiaca); 탈라쏘스피라 (Thalassospira) sp. TSL5-1; 슈도부티리비브리오 sp. OR37; 부티리비브리오 sp. YAB3001; 블라우티아 sp. 마르세이유-P2398; 렙토트리키아 sp. 마르세이유-P3007; 박테로이데스 이후아에 (Bacteroides ihuae); 포르피로모나다세아에 박테리움 (Porphyromonadaceae bacterium) KH3CP3RA; 리스테리아 리파리아 (Listeria riparia); 및 인솔리티스피릴럼 페레그리넘 (Insolitispirillum peregrinum).
CRISPR-Cas 시스템 효소의 오솔로그를 확인하는 일부 방법은 관심 게놈에서 tracr 서열을 확인하는 단계를 포함한다. tracr 서열의 확인은 하기 단계들에 관한 것이다: CRISPR 효소를 포함하는 CRISPR 영역을 확인하기 위해서 데이터베이스에서 직접 반복부 또는 tracr mate 서열의 검색 단계. 센스 및 안티센스 방향 둘 모두에서 CRISPR 효소에 측접한 CRISPR 영역 내 상동성 서열의 검색 단계. 전사 종결인자 및 2차 구조의 조사 단계. 직접 반복부 또는 tracr mate 서열이 아니지만 잠재적 tracr 서열로서 직접 반복부 또는 tracr mate 서열과 50% 초과의 동일성을 갖는 임의 서열을 확인하는 단계. 잠재적 tracr 서열을 선택하고 그와 연관된 전사 종결인자 서열을 분석하는 단계.
본 명세서에 기술된 임의의 기능성은 다수의 오솔로그로부터의 단편을 포함하는 키메라 효소를 포함하여, 다른 오솔로그로부터의 CRISPR 효소에게로 조작될 수 있다는 것을 이해할 것이다. 이러한 오솔로그의 예는 본 명세서의 다른 곳에 기술된다. 따라서, 키메라 효소는 제한없이 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팍토르, 유박테리움, 스트렙토코커스, 락토바실러스, 마이코플라스마, 박테로이데스, 플라비이볼라, 플라보박테리움, 스파에로카에타, 아조스피릴럼, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바큘럼, 스타필로코커스, 니트라티프락토르, 마이코플라스마 및 캄필로박터를 포함하는 유기체의 CRISPR 효소 오솔로그의 단편을 포함할 수 있다. 키메라 효소는 제1 단편 및 제2 단편을 포함할 수 있고, 단편은 본 명세서에 언급된 속 또는 본 명세서에 언급된 종의 유기체의 CRISPR 효소 오솔로그의 것일 수 있고; 유리하게 단편은 상이한 종의 CRISPR 효소 오솔로그로부터의 것이다.
구현예에서, 본 명세서에서 언급된 C2c2 단백질은 C2c2의 기능성 변이체 또는 이의 상동체 또는 오솔로그를 포괄한다. 본 명세서에서 사용되는 단백질의 "기능성 변이체"는 그 단백질의 활성을 적어도 부분적으로 보유하는 이러한 단백질의 변이체를 의미한다. 기능성 변이체는 다형성 등을 포함하여, 돌연변이체 (삽입, 결실, 또는 치환 돌연변이체일 수 있음)를 포함할 수 있다. 또한 다른, 일반적으로 미관련된, 핵산, 단백질, 폴리펩티드 또는 펩티드와 이러한 단백질의 융합 생성물이 기능성 변이체에 포함된다. 기능성 변이체는 천연 발생일 수 있거나 또는 인간이 만든 것일 수 있다. 유리한 구현예는 조작되거나 또는 비천연 발생된 VI형 RNA-표적화 이펙터 단백질을 포함할 수 있다.
일 구현예에서, C2c2 또는 이의 오솔로그 또는 상동체를 코딩하는 핵산 분자(들)는 진핵생물 세포에서 발현을 위해 코돈-최적화될 수 있다. 진핵생물은 본 명세서에서 논의된 바와 같을 수 있다. 핵산 분자(들)는 조작될 수 있거나 또는 비천연 발생일 수 있다.
일 구현예에서, C2c2 또는 이의 오솔로그 또는 상동체는 하나 이상의 돌연변이를 포함할 수 있고 그리하여 이를 코딩하는 핵산 분자(들)가 돌연변이(들)를 가질 수 있다. 돌연변이는 인공적으로 도입된 돌연변이일 수 있고 촉매 도메인에 하나 이상의 돌연변이를 포함할 수 있지만 이에 제한되지 않는다. Cas9 효소에 대한 촉매 도메인의 예는 RuvC I, RuvC II, RuvC III 및 HNH 도메인을 포함할 수 있지만 이에 제한되지 않는다.
일 구현예에서, C2c2 또는 이의 오솔로그 또는 상동체는 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 인공적으로 도입된 돌연변이일 수 있고 촉매 도메인에 하나 이상의 돌연변이를 포함할 수 있지만 이에 제한되지 않는다. Cas 효소에 대한 촉매 도메인의 예는 HEPN 도메인을 포함할 수 있지만 이에 제한되지 않는다.
일 구현예에서, C2c2 또는 이의 오솔로그 또는 상동체는 기능성 도메인에 융합되거나 또는 그에 작동적으로 연결되는 일반 핵산 결합 단백질로서 사용될 수 있다. 예시적인 기능성 도메인은 번역 개시인자, 번역 활성인자, 번역 억제인자, 뉴클레아제, 특히 리보뉴클레아제, 스플라이시오솜, 비드, 광 유도성/제어성 도메인 또는 화학적 유도성/제어성 도메인을 포함할 수 있지만 이에 제한되지 않는다.
일정 예의 구현예에서, C2c2 이펙터 단백질은 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팍토르, 유박테리움, 스트렙토코커스, 락토바실러스, 마이코플라스마, 박테로이데스, 플라비이볼라, 플라보박테리움, 스파에로카에타, 아조스피릴럼, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바큘럼, 스타필로코커스, 니트라티프락토르, 마이코플라스마, 및 캄필로박터로 이룽럴진 군으로부터 선택된 유기체로부터의 것일 수 있다.
일정 구현예에서, 이펙터 단백질은 리스테리아 sp. C2c2p, 바람직하게 리스테리아 실리게리아 C2c2p, 보다 바람직하게 리스테리아 실리게리아 serovar 1/2b str. SLCC3954 C2c2p일 수 있고 crRNA 서열은 5' 29-nt 직접 반복부 (DR) 및 15-nt 내지 18-nt 스페이서를 갖는, 44 내지 47개 뉴클레오티드 길이일 수 있다.
일정 구현예에서, 이펙터 단백질은 렙토트리키아 sp. C2c2p, 바람직하게 렙토트리키아 샤히이 C2c2p, 보다 바람직하게 렙토트리키아 샤히이 DSM 19757 C2c2p일 수 있고 crRNA 서열은 적어도 24 nt의 5' 직접 반복부, 예컨대 5' 24-28-nt 직접 반복부 (DR) 및 적어도 14 nt의 스페이서, 예컨대 14-nt 내지 28-nt 스페이서, 또는 적어도 18 nt, 예컨대 19, 20, 21, 22 nt 이상, 예컨대 18-28, 19-28, 20-28, 21-28, 또는 22-28 nt의 스페이서를 갖는, 42 내지 58개 뉴클레오티드 길이일 수 있다.
일정 예의 구현예에서, 이펙터 단백질은 렙토트리키아 sp., 렙토트리키아 웨이데이 F0279, 또는 리스테리아 sp., 바람직하게 리스테리아 뉴요켄시스 FSL M6-0635일 수 있다.
일정 예의 구현예에서, 본 발명의 C2c2 이펙터 단백질은 제한없이 하기 21종의 오솔로그 종을 포함한다 (다수의 CRISPR 유전자좌 포함): 렙토트리키아 샤히이; 렙토트리키아 웨이데이 (Lw2); 리스테리아 실리게리; 라크노스피라세아에 박테리움 MA2020; 라크노스피라세아에 박테리움 NK4A179; [클로스트리듐] 아미노필럼 DSM 10710; 카르노박테리움 갈리나럼 DSM 4847; 카르노박테리움 갈리나럼 DSM 4847 (제2 CRISPR 유전자좌); 팔루디박터 프로피오니시게네스 WB4; 리스테리아 웨이헨스테파넨시스 FSL R9-0317; 리스테리아세아에 박테리움 FSL M6-0635; 렙토트리키아 웨이데이 F0279; 로도박터 캅슐라터스 SB 1003; 로도박터 캅슐라터스 R121; 로도박터 캅슐라터스 DE442; 렙토트리키아 부칼리스 C-1013-b; 허비닉스 헤미셀룰로실리티카; [유박테리움] 렉탈레; 유박테리아세아에 박테리움 CHKCI004; 블라우티아 sp. 마르세이유-P2398; 및 렙토트리키아 sp. 경구 분류군 879 str. F0557. 12종의 추가의 비제한적인 예는 다음과 같다: 라크노스피라세아에 박테리움 NK4A144; 클로로플렉서스 아그레간스; 데메퀴나 아우란티아카; 탈라쏘스피라 sp. TSL5-1; 슈도부티리비브리오 sp. OR37; 부티리비브리오 sp. YAB3001; 블라우티아 sp. 마르세이유-P2398; 렙토트리키아 sp. 마르세이유-P3007; 박테로이데스 이후아에; 포르피로모나다세아에 박테리움 KH3CP3RA; 리스테리아 리파릴아; 및 인솔리티스피릴럼 페레그리넘.
일정 구현예에서, 본 발명에 따른 C2c2 단백질은 오솔로그 중 하나이거나 또는 그로부터 유래되거나 또는 본 출원에서 기술된 바와 같은 둘 이상의 오솔로그의 키메라 단백질이거나, 또는 이종성/기능성 도메인과 융합하거나 또는 융합하지 않고, 본 명세서의 다른 곳에서 정의된 바와 같이, 데드 C2c2, 분할 C2c2, 탈안정화 C2c2 등을 포함한, 오솔로그 중 하나의 돌연변이체 또는 변이체 (또는 키메라 돌연변이체 또는 변이체)이다.
일정 예의 구현예에서, RNA-표적화 이펙터 단백질은 VI-B형 이펙터 단백질, 예컨대 Cas13b 및 그룹 29 또는 그룹 30 단백질이다. 일정 예의 구현예에서, RNA-표적화 이펙터 단백질은 하나 이상의 HEPN 도메인을 포함한다. 일정 예의 구현예에서, RNA-표적화 이펙터 단백질은 C-말단 HEPN 도메인, N-말단 HEPN 도메인, 또는 둘 모두를 포함한다. 본 발명의 상황에서 사용할 수 있는 예로서 VI-B형 이펙터 단백질에 관해서, 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2016년 10월 21일 출원된 미국 특허 출원 제15/331,792호, 발명의 명칭 "Novel CRISPR Enzymes and Systems"로 2016년 10월 21일 출원된 국제 특허 출원 번호 PCT/US2016/058302, 및 [Smargon et al. "Cas13b is a Type VI-B CRISPR-associated RNA-Guided RNase differentially regulated by accessory proteins Csx27 and Csx28" Molecular Cell, 65, 1-13 (2017); dx.doi.org/10.1016/j.molcel.2016.12.023], 및 발명의 명칭 "Novel Cas13b Orthologues CRISPR Enzymes and System"으로 2917년 3월 15일 출원되고 양도된 미국 가출원 번호를 참조한다. 바람직한 일 구현예에서, Cas 13 단백질은 LwaCas13이다.
차폐성 구성체
본 명세서에서 사용되는 "차폐성 구성체"는 본 명세서에 기술된 활성화된 CRISPR 시스템 이펙터 단백질에 의해 절단될 수 있거나 또는 달리 탈활성화될 수 있는 분자를 의미한다. 용어 "차폐성 구성체"는 또한 "검출 구성체"로서 대체하여 언급될 수도 있다. 일정 예의 구현예에서, 차폐성 구성체는 RNA-기반 차폐성 구성체이다. RNA-기반 차폐성 구성체는 CRISPR 이펙터 단백질에 의해 절단가능한 RNA 엘리먼트를 포함한다. RNA 엘리먼트의 절단은 작용제를 방출하거나 또는 검출가능한 신호를 생성시킬 수 있게 하는 입체형태 변화를 일으킨다. RNA 엘리먼트가 어떻게 사용되어서 검츨가능한 신호의 발생을 방지 또는 차폐할 수 있는지를 입증하는 예로서의 구성체는 하기에 기술되고 본 발명의 구현예는 이의 변이체를 포함한다. 절단 이전에, 또는 차폐성 구성체가 '활성' 상태일 때, 차폐성 구성체는 양성의 검출가능한 신호의 발생 또는 검출을 차단한다. 일정 예의 구현예에서 최소 배경 신호가 활성 RNA 차폐성 구성체의 존재 하에서 생성될 수 있다는 것을 이해할 것이다. 양성의 검출가능한 신호는 광학, 형광, 화학발광, 전기화학 또는 당분야에 공지된 다른 검출 방법을 사용하여 검출할 수 있는 임의의 신호일 수 있다. 용어 "양성의 검출가능한 신호"는 차폐성 구성체의 존재 하에서 검출가능할 수 있는 다른 검출가능한 신호와 구별하기 위해 사용된다. 예를 들어, 일정 구현예에서 제1 신호 (즉, 음성의 검출가능한 신호)는 차폐제가 존재할 때 검출될 수 있을 것이고, 이것은 이후 표적 분자의 검출 및 활성화된 CRISPR 이펙터 단백질에 의한 차폐제의 절단 또는 탈활성화 시에 제2 신호 (예를 들어, 양성의 검출가능한 신호)로 전환된다.
일정 예의 구현예에서, 차폐성 구성체는 유전자 생성물의 발생을 저해할 수 있다. 유전자 생성물은 샘플에 첨가된 리포터 구성체에 의해 코딩될 수 있다. 차폐성 구성체는 RNA 간섭 경로에 관여되는 간섭 RNA, 예컨대 짧은 헤어핀 RNA (shRNA) 또는 소형 간섭 RNA (siRNA)일 수 있다. 차폐성 구성체는 또한 마이크로RNA (miRNA)를 포함할 수 있다. 존재하면서, 차폐성 구성체는 유전자 생성물의 발현을 저해한다. 유전자 생성물은 형광 단백질 또는 다른 RNA 전사물일 수 있거나 또는 달리 표지된 프로브, 압타머, 또는 항체에 의해 검출가능하지만 차폐성 구성체의 존재를 위한 단백질일 수 있다. 이펙터 단백질의 활성화 시, 차폐성 구성체는 절단되거나 또는 달리 침묵화되어서 양성의 검출가능한 신호로서 유전자 생성물의 발현 및 검출을 허용한다.
일정 예의 구현예에서, 차폐성 구성체는 차폐성 구성체로부터의 하나 이상의 시약이 검출가능한 양성 신호의 발생을 일으키도록 검출가능한 양성 신호를 발생시키는데 필요한 하나 이상의 시약을 격리시킬 수 있다. 하나 이상의 시약은 비색 신호, 화학 발광 신호, 형광 신호, 또는 임의의 다른 검출가능한 신호를 생성시키도록 조합될 수 있고 이러한 목적에 적합한 것으로 공지된 임의 시약을 포함할 수 있다. 일정 예의 구현예에서, 하나 이상의 시약은 하나 이상의 시약에 결합하는 RNA 압타머에 의해 격리된다. 하나 이상의 시약은 표적 분자의 검출 시 이펙터 단백질이 활성화되고 RNA 압타머가 분해될 때 방출된다.
본 발명의 다른 구현예에서, RNA-기반 차폐성 구성체는 검출가능한 양성 신호의 발생을 저해하거나 또는 RNA-기반 차폐성 구성체는 검출가능한 양성 신호를 차폐하거나, 또는 대신에 검출가능한 음성 신호를 발생시켜 검출가능한 양성 신호의 발생을 저해하거나, 또는 RNA-기반 차폐성 구성체는 리포팅 구성체에 의해 코딩되는 유전자 생성물의 발생을 저해하는 침묵화 RNA를 포함하고, 여기서 유전자 생성물은 발현될 때 검출가능한 양성 신호를 발생시킨다.
추가 구현예에서, RNA-기반 차폐성 구성체는 음성의 검출가능한 신호를 발생시키는 리보자임이고, 여기서 양성의 검출가능한 신호는 리보자임이 탈활성화될 때 발생되거나, 또는 리보자임은 기질을 제1 색상으로 전환시키고, 여기서 기질은 리보자임이 탈활성화될 때 제2 색상으로 전환된다.
다른 구현예에서, RNA-기반 차폐제는 RNA 압타머이거나, 또는 압타머는 효소를 격리시키고, 여기서 효소는 기질에 대해 작용하여 압타머로부터 방출 시 검출가능한 신호를 발생시키거나, 또는 압타머는 압타머로부터 방출될 때 검출가능한 신호를 발생시키도록 조합되는 작용제의 쌍을 격리시킨다.
다른 구현예에서, RNA-기반 차폐성 구성체는 검출가능한 리간드 및 차폐성 성분이 부착되는 RNA 올리고뉴클레오티드를 포함한다. 다른 구현예에서, 검출가능한 리간드는 형광단이고 차폐성 성분은 소광제 분자이거나, 또는 예컨대 표적 RNA를 증폭시키기 위한 시약이다.
일정 예의 구현예에서, 차폐성 구성체는 개별 이산 부피 (이하에 더욱 정의됨)로 고형 기재 상에 고정될 수 있고 단일 시약을 격리시킨다. 예를 들어, 시약은 염료를 포함하는 비드일 수 있다. 고정된 시약에 의해 격리될 때, 개별 비드는 너무 분산되어서 검출가능한 신호를 발생시키지 않지만, 차폐성 구성체로부터 방출 시, 예를 들어 응집 또는 용액 농도의 단순 증가에 의해 검출가능한 신호를 발생시킬 수 있다. 일정 예의 구현예에서, 고정된 차폐제는 표적 분자의 검출 시 활성화된 이펙터 단백질에 의해 절단될 수 있는 RNA-기반 압타머이다.
일정한 다른 예의 구현예에서, 차폐성 구성체는 용액 중 고정된 시약에 결합하여서 용액 중에 유리된 별개의 표지된 결합 파트너에 결합하는 시약의 능력을 차단시킨다. 따라서, 샘플에 세척 단계의 적용 시, 표지된 결합 파트너는 표적 분자의 부재 하에서 샘플로부터 세척되어 질 수 있다. 그러나, 이펙터 단백질이 활성화되면, 차폐성 구성체는 시약에 결합하는 차폐성 구성체의 능력을 방해하기에 충분한 정도로 절단되어서 표지된 결합 파트너가 고정된 시약에 결합할 수 있게 한다. 따라서, 표지된 결합 파트너는 세척 단계 이후에 잔존하여 샘플 중 표적 분자의 존재를 의미한다. 일정 양상에서, 고정된 시약에 결합하는 차폐성 구성체는 RNA 압타머이다. 고정된 시약은 단백질일 수 있고 표지된 결합 파트너는 표지된 항체일 수 있다. 대안적으로, 고정된 시약은 스트렙타비딘일 수 있고 표지된 결합 파트너는 표지된 바이오틴일 수 있다. 상기 구현예에서 사용되는 결합 파트너 상의 표지는 당분야에 공지된 임의의 검출가능한 표지일 수 있다. 또한, 다른 공지된 결합 파트너가 본 명세서에 기술된 전체 설계에 따라서 사용될 수 있다.
일정 예의 구현예에서, 차폐성 구성체는 리보자임을 포함할 수 있다. 리보자임은 촉매 성질을 갖는 RNA 분자이다. 천연 및 조작 둘 모두의 리보자임은 본 명세서에 개시된 이펙터 단백질에 의해 표적화될 수 있는 RNA를 포함하거나 또는 그로 이루어진다. 리보자임은 음성의 검출가능한 신호를 발생시키거나 또는 양성의 대조군 신호의 발생을 방지하는 반응을 촉매하도록 선택될 수 있거나 또는 조작될 수 있다. 활성화된 이펙터 단백질에 의한 리보자임의 탈활성화 시 음성의 대조군 신호를 발생시키거나, 또는 양성의 검출가능한 신호의 발생을 방지하는 반응은 제거되고 그리하여 양성의 검출가능한 신호가 발생될 수 있게 한다. 하나의 예로서 구현예에서, 리보자임은 비색 반응을 촉매하여 용액이 제1 색상으로서 나타나게 할 수 있다. 리보자임이 탈활성화될 때 그러면 용액이 제2 색상으로 변하게 되며, 제2 색상은 검출가능한 양성 신호이다. 리보자임을 어떻게 사용하여 비색 반응을 촉매할 수 있는가의 예는 [Zhao et al. "Signal amplification of glucosamine-6-phosphate based on ribozyme glmS", Biosens Bioelectron. 2014; 16:337-42]에 기술되어 있고, 본 명세서에 개시된 구현예의 상황에서 어떻게 이러한 시스템이 작용하도록 변형될 수 있는가의 예를 제공한다. 대안적으로, 리보자임은 존재할 때 예를 들어, RNA 전사물의 절단 생성물을 발생시킬 수 있다. 따라서, 양성의 검출가능한 신호의 검출은 리보자임의 부재 하에서만 발생되는 비-절단된 RNA 전사물의 검출을 포함할 수 있다.
일정 예의 구현예에서, 하나 이상의 시약은 하나 이상의 RNA 압타머가 단백질에 결합하여서 단백질이 검출가능한 신호를 발생시킬 수 없도록 억제하거나 또는 격리시키는, 검출가능한 신호, 예컨대 비색, 화학발광, 또는 형광 신호의 발생을 촉진할 수 있는 단백질, 예컨대 효소이다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, RNA 압타머는 그들이 더 이상 검출가능한 신호를 발생시키는 단백질의 능력을 억제하지 않는 정도까지 절단 또는 분해된다. 일정 예의 구현예에서, 압타머는 트롬빈 억제제 압타머이다. 일정 예의 구현예에서, 트롬빈 억제제 압타머는 GGGAACAAAGCUGAAGUACUUACCC (SEQ ID NO: 18)의 서열을 갖는다. 이러한 압타머가 절단될 때, 트롬빈은 활성화될 것이고 펩티드 비색 또는 형광 기질을 절단할 것이다. 일정 예의 구현예에서, 비색 기질은 트롬빈에 대한 펩티드 기질에 공유 연결된 파라-니트로아닐리드 (pNA)이다. 트롬빈에 의해 절단 시, pNA가 방출되고 색상이 노란색이 되어서 육안으로 쉽게 볼 수 있게 된다. 일정 예의 구현예에서, 형광 기질은 7-아미노-4-메틸쿠마린으로서 형광 검출기를 사용해 검출할 수 있는 파란색 형광단이다. 억제성 압타머가 또한 홀스래디쉬 퍼옥시다제 (HRP), 베타-갈락토시다제, 또는 송아지 알칼리 포스파타제 (CAP)에 대해 사용될 수 있고 상기 제시된 일반 원리에 속한다.
일정 구현예에서, RNAse 활성은 효소-억제성 압타머의 절단을 통해 비색적으로 검출된다. 비색 신호로 RNAse 활성을 전환시키는 한가지 잠재적인 방식은 비색 출력을 생성시킬 수 있는 효소의 재활성화와 RNA 압타머의 절단을 커플링시키는 것이다. RNA 절단의 부재 하에서, 온전한 압타머는 효소 표적에 결합할 것이고 이의 활성을 억제할 것이다. 이러한 판독 시스템의 장점은 효소가 추가의 증폭 단계를 제공한다는 것이다: 부차적 활성 (예를 들어, Cas13a 부차적 활성)을 통해 압타머로부터 방출될 때, 비색 효소는 계속 비색 생성물을 생성시켜서, 신호의 증폭을 야기시키게 될 것이다.
일정 구현예에서, 비색 판독으로 효소를 억제하는 현행 압타머가 사용된다. 비색 판독에 의한 몇몇 압타머/효소 쌍, 예컨대 트롬빈, 단백질 C, 호중구 엘라스타제, 및 서브틸리신이 존재한다. 이들 프로테아제는 pNA를 기반으로 하는 비색 기질을 가지며 상업적으로 입수가능하다. 일정 구현예에서, 일반 비색 효소를 표적화하는 신규 압타머가 사용된다. 일반적인 강력한 효소, 예컨대 베타-갈락토시다제, 홀스래디쉬 퍼옥시다제, 또는 송아지 장 알칼리 포스파타제는 선택 전략 예컨대 SELEX를 통해 설계된 조작된 압타머에 의해 표적화될 수 있다. 이러한 전략은 나노몰라 결합 효율로 압타머의 신속한 선택을 가능하게 하고 비색 판독을 위한 추가의 효소/압타머 쌍의 개발에 사용될 수 있다.
일정 구현예에서, RNAse 활성은 RNA-속박된 억제제의 절단을 통해 비색적으로 검출된다. 많은 일반 비색 효소는 경쟁적, 가역적 억제제를 가지며, 예를 들어 베타-갈락토시다제는 갈락토스에 의해 억제될 수 있다. 많은 이들 억제제는 약하지만, 그들 효과는 국소 농도의 증가에 따라 증가될 수 있다. 억제제의 국소 농도를 RNAse 활성에 연결시킴으로써, 비색 효소 및 억제제 쌍은 RNAse 센서로 조작될 수 있다. 소형-분자 억제제를 기반으로 하는 비색 RNAse 센서는 3종의 성분: 비색 효소, 억제제, 및 효소에 억제제를 속박시키는, 효소 및 억제제 둘 모두에 공유 연결된 가교된 RNA를 포함한다. 미절단된 입체형태로, 효소는 소형 분자의 증가된 국소 농도에 의해 억제되고, RNA가 (예를 들어, Cas13a 부차적 절단에 의해) 절단될 때, 억제제는 방출될 것이고 비색 효소가 활성화될 것이다.
일정 구현예에서, RNAse 활성은 G-사중체의 형성 및/또는 활성화를 통해 비색적으로 검출된다. DNA의 G 사중체는 헴 (철 (III)-프로토포르피린 IX)과 복합체를 형성하여 퍼옥시다제 활성과 DNAzyme을 형성할 수 있다. 퍼옥시다제 기질 (예를 들어, ABTS: (2,2'-아지노비스 [3-에틸벤조티아졸린-6-술폰산]-디암모늄 염))이 공급될 때, 과산화수소의 존재 하에서 G-사중체-헴 복합체는 기질의 산화를 야기시킨 후에, 용액 중에서 녹색 색상을 형성한다. 예로서 G-사중체 형성 DNA 서열은 GGGTAGGGCGGGTTGGGA (SEQ ID NO: 19)이다. RNA 서열과 이러한 DNA 압타머의 하이브리드화에 의해서, G-사중체 구조의 형성은 제한될 것이다. RNAse 부차적 활성화 (예를 들어, C2c2-복합체 부차적 활성화) 시에, RNA 주요부는 절단되어 G 사중체를 형성할 수 있게 하고 헴이 결합할 수 있게 할 것이다. 이러한 전략은 색상 형성이 효소적이고, RNAse 활성화 이후 추가 증폭이 존재한다는 것을 의미하므로 특히 매력적이다.
일정 예의 구현예에서, 차폐성 구성체는 개별 이산 부피 (하기에 더욱 정의됨)로 고형 기재 상에 고정될 수 있고 단일 시약을 격리시킬 수 있다. 예를 들어, 시약은 염료를 포함하는 비드일 수 있다. 고정된 시약에 의해 격리될 때, 개별 비드는 너무 분산되어서 검출가능한 신호를 발생시키지 못하지만, 차폐성 구성체로부터 방출 시, 예를 들어 응집 또는 용액 농도의 단순 증가에 의해 검출가능한 신호를 발생시킬 수 있다. 일정 예의 구현예에서, 고정된 차폐제는 표적 분자의 검출 시 활성화된 이펙터 단백질에 의해 절단될 수 있는 RNA-기반 압타머이다.
하나의 예로서 구현예에서, 차폐성 구성체는 검출제가 용액 중에서 분산되거나 또는 응집되는지 여부에 따라서 색상을 변화시키는 검출제를 포함한다. 예를 들어, 일정 나노입자, 예컨대 콜로이드 금은 그들이 응집체에서 분산된 입자로 이동하면서 가시적인 보라색에서 붉은색으로 색상 이동을 겪는다. 따라서, 일정 예의 구현예에서, 이러한 검출제는 하나 이상의 가교 분자에 의해 응집체로 유지될 수 있다. 가교 분자의 적어도 일부분은 RNA를 포함한다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, 가교 분자의 RNA 부분은 절단되어 검출제가 분산될 수 있게 하고 색상의 상응하는 변화를 일으킨다. 일정 예의 구현예에서, 가교 분자는 RNA 분자이다. 일정 예의 구현예에서, 검출제는 콜로이드 금속이다. 콜로이드 금속 재료는 액체, 히드로졸, 또는 금속 졸에 분산된 수-불용성 금속 입자 또는 금속성 화합물을 포함할 수 있다. 콜로이드 금속은 주기율표의 IA, IB, IIB 및 IIIB 족의 금속을 비롯하여, 전이 금속, 특히 VIII 족의 것으로부터 선택될 수 있다. 바람직한 금속은 금, 은, 알루미늄, 루테늄, 아연, 철, 니켈, 및 칼슘을 포함한다. 다른 적합한 금속은 또한 모든 그들의 다양한 산화 상태로 다음의 것들을 포함한다: 리튬, 소듐, 마그네슘, 포타슘, 스칸듐, 티타늄, 바나듐, 크로뮴, 망간, 코발트, 구리, 갈륨, 스트론튬, 니오븀, 몰리브덴, 팔라듐, 인듐, 주석, 텅스텐, 레늄, 플래티늄, 및 가돌리늄. 금속은 바람직하게 적절한 금속 화합물로부터 유래된, 이온 형태, 예를 들어 A13+, Ru3+, Zn2+, Fe3+, Ni2+ 및 Ca2+ 이온으로 제공된다.
RNA 가교가 활성화된 CRISPR 이펙터에 의해 절단될 때, 상기 언급된 색상 이동이 관찰된다. 일정 예의 구현예에서, 입자는 콜로이드 금속이다. 다른 일정 예의 구현예에서, 콜로이드 금속은 콜로이드 금이다. 일정 예의 구현예에서, 콜로이드 나노입자는 15 nm 금 나노입자 (AuNP)이다. 콜로이드 금 나노입자의 고유한 표면 성질 덕분에, 용액에서 완전히 분산되고 육안으로 붉은 색상이 나타날 때 520 nm에서 최대 흡광도가 관찰된다. AuNP의 응집 시, 그들은 최대 흡광도에서 붉은색-이동을 나타내고 색상이 더 진하게 나타나며, 궁극적으로 용액으로부터 진한 보라색 응집체로 침전된다. 일정 예의 구현예에서, 나노입자는 나노입자의 표면으로부터 연장된 DNA 링커를 포함하도록 변형된다. 개별 입자는 RNA의 각 말단 상에서 DNA 링커의 적어도 일부분에 하이브리드화하는 단일 가닥 RNA (ssRNA) 가교를 통해 함께 연결된다. 따라서, 나노입자는 연결된 입자의 망을 형성하게 되고 응집하게 되어, 진한 침전물로서 나타나게 될 것이다. 본 명세서에 개시된 CRISPR 이펙터의 활성화 시, ssRNA 가교가 절단될 것이고, 연결된 메시로부터 AU NPS를 방출하여 가시적인 붉은 색상을 생성시키게 된다. 예시적인 DNA 링커 및 RNA 가교 서열은 하기에 열거된다. DNA 링커의 말단 상에 티올 링커는 AuNPS와 표면 접합을 위해 사용될 수 있다. 다른 형태의 접합이 사용될 수도 있다. 일정 예의 구현예에서, 각 DNA 링커에 대해 하나씩, 2개 집단의 AuNP가 발생될 수 있다. 이것은 적절한 배향으로 ssRNA 가교의 적절한 결합을 촉진하도록 돕게 될 것이다. 일정 예의 구현예에서, 제1 DNA 링커는 3' 말단으로 접합되는 반면 제2 DNA 링커는 5' 말단으로 접합된다.
Figure pct00001
일정한 다른 예의 구현예에서, 차폐성 구성체는 검출가능한 표지 및 검출가능한 표지의 차폐제가 부착된 RNA 올리고뉴클레오티드를 포함할 수 있다. 이러한 검출가능한 표지/차폐제 쌍의 예는 형광단 및 형광단의 소광제이다. 형광단의 소광은 형광단 및 다른 형광단 또는 비형광성 분자 간 비형광성 복합체의 형성 결과로서 발생될 수 있다. 이러한 기전은 바닥-상태 복합체 형성, 정적 소광, 또는 접촉 소광으로서 알려져 있다. 따라서, RNA 올리고뉴클레오티드는 형광단 및 소광제가 접촉 소광이 발생되기 위해 충분한 근접성으로 존재하도록 설계될 수 있다. 형광단 및 그들의 동족 소광제는 당분야에 공지되어 있고 당업자가 이러한 목적을 위해 선택할 수 있다. 특정한 형광단/소광제 쌍은 본 발명의 상황에서 중요하지 않고, 단지 형광단/소광제 쌍의 선택은 형광단의 차폐를 보장한다. 본 명세서에 개시된 이펙터 단백질의 활성화 시에, RNA 올리고뉴클레오티드는 절단되어서 접촉 소광 효과를 유지하는데 필요한 형광단 및 소광제 간 근접성을 단절시킨다. 따라서, 형광단의 검출은 샘플 중 표적 분자의 존재를 결정하는데 사용될 수 있다.
일정한 다른 예의 구현예에서, 차폐성 구성체는 하나 이상의 금속 나노입자, 예컨대 금 나노입자가 결합된 하나 이상의 RNA 올리고뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 차폐성 구성체는 닫힌 루프를 형성하는 다수의 RNA 올리고뉴클레오티드에 의해 교차결합된 다수의 금속 나노입자를 포함한다. 일 구현예에서, 차폐성 구성체는 닫힌 루프를 형성하는 3개의 RNA 올리고뉴클레오티드에 의해 교차결합된 3개의 금 나노입자를 포함한다. 일부 구현예에서, CRISPR 이펙터 단백질에 의한 RNA 올리고뉴클레오티드의 절단은 금속 나노입자에 의해 생성되는 검출가능한 신호를 야기시킨다.
일정한 다른 예의 구현예에서, 차폐성 구성체는 하나 이상의 퀀텀 도트가 부착된 하나 이상의 RNA 올리고뉴클레오티드를 포함할 수 있다. 일부 구현예에서, CRISPR 이펙터 단백질에 의한 RNA 올리고뉴클레오티드의 절단은 퀀텀 도트에 의해 생성된 검출가능한 신호를 야기한다.
하나의 예의 구현예에서, 차폐성 구성체는 퀀텀 도트를 포함할 수 있다. 퀀텀 도트는 표면에 부착된 다수의 링커를 가질 수 있다. 링커 분자의 적어도 일부분은 RNA를 포함한다. 링커 분자는 소광제가 퀀텀 도트의 소광이 일어나기에 충분한 근접성을 유지하도록 한쪽 말단에서 퀀텀 도트에 부착되고 링커의 길이를 따라서 또는 링커의 말단부에서 하나 이상의 소광제에 부착된다. 링커는 분지될 수 있다. 상기와 같이, 퀀텀 도트/소광제 쌍은 중요하지 않고, 오직 퀀텀 도트/소광제 쌍의 선택이 형광단의 차폐를 보장한다. 퀀텀 도트 및 그들 동족 소광제는 당분야에 공지되어 있고 당업자가 이러한 목적을 위해 선택할 수 있다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, 링커 분자의 RNA 부분은 절단되어서 소광 효과를 유지하는데 필요한 퀀텀 도트와 하나 이상의 소광제 간 근접성을 제거시킨다. 일정 예의 구현예에서 퀀텀 도트는 스트렙타비딘 접합된다. RNA는 바이오틴 링커를 통해서 부착되고 서열 /5Biosg/UCUCGUACGUUC/3IAbRQSp/ (SEQ ID NO. 23) 또는 /5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/ (SEQ ID NO. 24)을 갖는 소광 분자를 동원하며, 여기서 /5Biosg/ 는 바이오틴 태그이고 /3lAbRQSp/ 는 아이오와 블랙 소광제이다. 절단 시, 본 명세서에 개시된 활성화된 이펙터에 의해서 퀀텀 도트는 가시적으로 형광발광하게 될 것이다.
유사한 방식으로, 형광 에너지 전이 (FRET)가 검출가능한 양성 신호를 발생시키는데 사용될 수 있다. FRET은 에너지적으로 여기된 형광단 (즉, "도너 형광단")으로부터의 광자가 다른 분자 (즉, "억셉터")의 전자의 에너지 상태를 여기된 단일항 상태의 더 높은 진동 수준으로 상승시키는 비방사적 과정이다. 도너 형광단은 그 형광단의 특징적인 형광을 방출하지 않고 바닥 상태로 복귀된다. 억셉터는 다른 형광단 또는 비형광성 분자일 수 있다. 억셉터가 형광단이면, 전이된 에너지는 그 형광단에 특징적인 형광으로서 방출된다. 억셉터가 비형광성 분자이면 흡수된 에너지는 열로서 소실된다. 따라서, 본 명세서에 개시된 구현예의 상황에서, 형광단/소광제 쌍은 올리고뉴클레오티드 분자에 부착된 도너 형광단/억셉터 쌍으로 치환된다. 온전한 경우에, 차폐성 구성체는 억셉터로부터 방출되는 형광 또는 열에 의해 검출되는 제1 신호 (음성의 검출가능한 신호)를 발생시킨다. 본 명세서에 개시된 이펙터 단백질의 활성화 시 RNA 올리고뉴클레오티드는 절단되고 FRET는 도너 형광단의 형광 (양성의 검출가능한 신호)이 이제 검출되도록 파괴된다.
일정 예의 구현예에서, 차폐성 구성체는 긴 RNA의 짧은 뉴클레오티드로의 절단에 반응하여 그들 흡광도를 변화시키는 인터컬레이팅 염료의 사용을 포함한다. 몇가지 이러한 염료가 존재한다. 예를 들어, 파이로닌-Y는 RNA와 복합체를 형성하게 되고 572 nm에서 흡광도를 갖는 복합체를 형성하게 된다. RNA의 절단은 흡광도의 소실 및 색상 변화를 일으킨다. 메틸렌 블루는 유사한 방식으로 사용될 수 있는데, RNA 절단 시 688 nm에서 흡광도가 변화된다. 따라서, 일정 예의 구현예에서, 차폐성 구성체는 본 명세서에 개시된 이펙터 단백질에 의한 RNA의 절단 시 흡광도를 변화시키는 RNA 및 인터컬레이팅 염료 복합체를 포함한다.
일정 예의 구현예에서, 차폐성 구성체는 HCR 반응을 위한 개시제를 포함할 수 있다. 예를 들어, [Dirks and Pierce. PNAS 101, 15275-15728 (2004)]을 참조한다. HCR 반응은 2가지 헤어핀 종에서 위치 에너지를 이용한다. 헤어핀 중 하나의 상응하는 영역에 상보성인 부분을 갖는 단일 가닥 개시제가 이전에 안정된 혼합물로 방출될 때, 이것이 한 종의 헤어핀을 개방시킨다. 이어서 이 과정은 다른 종의 헤어핀을 개방시키는 단일 가닥 영역을 노출시킨다. 다음으로 이 과정은 본래 개시제와 동일한 단일 가닥 영역을 노출시킨다. 최종 연쇄 반응은 헤어핀 공급이 고갈될 때까지 성장하는 닉킹된 이중 나선의 형성을 일으킬 수 있다. 최종 생성물의 검출은 겔 상에서 또는 비색적으로 수행될 수 있다. 비색 검출 방법의 예는 예를 들어, [Lu et al. "Ultra-sensitive colorimetric assay system based on the hybridization chain reaction-triggered enzyme cascade amplificaiton ACS Appl Mater Interfaces, 2017, 9(1):167-175], [Wang et al. "An enzyme-free colorimetric assay using hybridization chain reaction amplificaiton and split aptamers" Analyst 2015, 150, 7657-7662], 및 [Song et al. "Non covalent fluorescent labeling of hairpin DNA probe coupled with hybridization chain reaction for sensitive DNA detection". Applied Spectroscopy, 70(4): 686-694 (2016)]에 개시된 것들을 포함한다.
일정 예의 구현예에서, 차폐성 구성체는 HCR 개시제 서열 및 개시제가 HCR 반응을 개시시키는 것을 방지하는 절단가능한 구조적 엘리먼트, 예컨대 루프 또는 헤어핀을 포함할 수 있다. 활성화된 CRISPR 이펙터 단백질에 의한 구조적 엘리먼트의 절단 시, 개시제는 방출되어 HCR 반응을 촉발시키고, 이의 검출은 샘플 중 하나 이상의 표적의 존재를 의미한다. 일정 예의 구현예에서, 차폐성 구성체는 RNA 루프와 헤어핀을 포함한다. 활성화된 CRISPR 이펙터 단백질이 RNA 루프를 절단할 때, 개시제는 방출되어 HCR 반응을 촉발시킬 수 있다.
특별한 구현예에서, 표적 핵산은 아토몰라 감도에서 검출될 수 있다. 특별한 구현예에서, 표적 핵산은 펨토몰라 감도에서 검출될 수 있다. 일부 특별한 구현예에서, 방법은 약 2시간 미만, 약 90분 미만, 약 60분 미만, 약 30분 미만 또는 약 15분 미만으로 수행된다. 일부 바람직한 구현예에서, 증폭 및 검출은 약 2시간 미만으로 2 fM 검출로 원-포트 방법에서 일어날 수 있다.
증폭 및 검출을 위한 키트
본 명세서는 또한 샘플에서 표적 이중-가닥 핵산을 증폭 및/또는 검출하기 위한 키트를 제공한다. 이러한 키트는 본 명세서에 기술된 바와 같은 증폭 CRISPR 시스템을 포함할 수 있지만, 반드시 이에 제한되는 것은 아니다.
일부 구현예에서, 키트는 샘플에서 이중-가닥 핵산을 정제하기 위한 시약을 포함할 수 있다.
일부 구현예에서, 키트는 샘플에서 표적 단일-가닥 핵산을 증폭 및/또는 검출하기 위한 키트일 수 있고 샘플에서 단일-가닥 핵산을 정제하기 위한 시약을 포함할 수 있다. 키트는 또한 사용 설명서 세트를 포함할 수 있다.
키트는 검출 시스템, 바람직한 구현예에서, CRISPR 검출 시스템을 더 포함할 수 있다. 검출 시스템은 예를 들어 모두 그들 전문이 참조로 본 명세서에 편입되는 2016년 12월 9일 출원된 미국 가출원 제62/432,553호; 2017년 2월 8일 출원된 미국 가출원 제62/456,645호; 2017년 3월 15일 출원된 미국 가출원 제62/471,930호; 2017년 4월 12일 출원된 미국 가출원 제62/484,869호; 2017년 10월 4일 출원된 미국 가출원 제62/568,268호에 기술된 바와 같을 수 있고, 또한 참조로 본 명세서에 편입되는, 발명의 명칭 "CRISPR Effector System Based Diagnostics"로 2017년 12월 8일 출원된 PCT/US2017/065477, 및 특히 [0142] - [0289]에서 검출을 위한 CRISPR 시스템의 성분을 설명하는 곳에 기술된 바와 같을 수 있다.
방법
증폭 및/또는 검출 방법이 제공되며, 본 명세서에서 개시된 바와 같은 시스템을 이용할 수 있다.
본 발명의 일 구현에에서, 닉카제-기반 증폭을 포함할 수 있다. 닉킹 효소는 CRISPR 단백질일 수 있다. 따라서, dsDNA로 닉의 도입은 프로그램가능할 수 있고 서열-특이적일 수 있다. 도 1은 dsDNA 표적의 반대 가닥을 표적화하도록 설계된 2개 가이드로 시작되는, 본 발명의 일 구현예를 도시한다. 본 발명에 따라서, 닉카제는 be Cpf1, C2c1, Cas9 또는 DNA 듀플렉스의 단일 가닥을 절단하거나 또는 절단하도록 조작된 임의의 오솔로그 또는 CRISPR 단백질일 수 있다. 다음으로 닉킹된 가닥이 중합효소에 의해 연장될 수 있다. 일 구현예에서, 닉의 위치는 중합효소에 의한 가닥의 연장이 닉 부위 사이의 표적 듀플렉스 DNA의 중심 부분을 향하도록 선택된다. 일정 구현예에서, 프라이머는 연장된 가닥과 하이브리드화할 수 있는 반응에 포함되고 이어서 프라이머의 추가 중합효소 연장으로 2개 dsDNA 조각: 제1 가닥 CRISPR 가이드 부위 또는 제1 및 제2 가닥 둘 모두의 CRISPR 가이드 부위를 포함하는 제1 dsDNA, 및 제2 가닥 CRISPR 가이드 부위 또는 제1 및 제2 가닥 둘 모두의 CRISPR 가이드 부위를 포함하는 제2 dsDNA를 재생시킬 수 있다. 이들 조각은 닉킹 부위 사이의 표적의 영역을 기하급수적으로 증폭시키는 순환 반응에서 계속 닉킹되고 연장된다.
일정 구현예에서, 증폭은 CRISPR-닉카제 기반 증폭, 프로그램가능한 CRISPR 닉킹 증폭이다. 증폭은 (a) 표적 이중-가닥 핵산을 포함하는 샘플을 증폭 반응 혼합물과 배합시키는 단계로서, 증폭 반응 혼합물은 (i) 증폭 CRISPR 시스템으로서 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템; 및 (ii) 중합효소를 포함하는 것인 단계; (b) 제1 및 제2 CRISPR/Cas 복합체를 사용하여 표적 핵산의 제1 및 제2 가닥을 닉킹시켜 표적 핵산을 증폭시키고 중합효소를 사용해 닉킹된 가닥을 치환 및 연장시켜서, 제1 및 제2 닉 부위 사이에 표적 핵산 서열을 포함하는 듀플렉스를 생성시키는 단계; (c) 반응 혼합물에 제1 및 제2 프라이머를 포함하는 프라이머 쌍을 첨가하는 단계로서, 제1 프라이머는 표적 핵산의 제1 가닥에 상보성인 부분 및 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 제2 가닥에 상보성인 부분 및 제2 가이드 부분에 대한 결합 부위를 포함하는 부분을 포함하는 것인 단계; 및 (d) 등온 조건 하에서 반복 연장 및 닉킹을 통해서 표적 핵산을 더 증폭시키는 단계를 포함할 수 있다. 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 동일할 수 있거나 또는 상이할 수 있다.
핵산의 증폭은 특별한 열순환 기계 또는 장비를 사용해 수행될 수 있고, 임의의 바람직한 수의 반응이 동시에 수행될 수 있도록, 대량으로 또는 단일 반응으로 수행될 수 있다. 일부 구현예에서, 증폭은 미세유체 또는 로봇식 장치를 사용해 수행될 수 있거나, 또는 바람직한 증폭을 획득하기 위해 온도의 수동 변경을 사용해 수행될 수 있다. 일부 구현예에서, 최적화는 특정한 적용 또는 재료를 위한 최적 반응 조건을 수득하기 위해 수행될 수 있다. 당업자는 충분한 증폭을 수득하기 위해서 반응 조건을 이해할 것이고 최적화시킬 수 있을 것이다.
일부 구현예에서, 표적 핵산의 증폭은 약 37℃-65℃에서 수행된다. 일부 구현예에서, 표적 핵산의 증폭은 약 50℃-59℃에서 수행된다. 일부 구현예에서, 표적 핵산의 증폭은 약 60℃-72℃에서 수행된다. 일부 구현예에서, 표적 핵산의 증폭은 약 37℃에서 수행된다. 일부 구현예에서, 표적 핵산의 증폭은 실온에서 수행된다.
추가 구현예는 하기 번호 매겨진 단락에 기재된다.
1. 표적 이중-가닥 핵산의 증폭 및/또는 검출 방법으로서,
a. 표적 이중-가닥 핵산을 포함하는 샘플을 증폭 반응 혼합물을 배합하는 단계로서, 증폭 반응 혼합물은
i. 증폭 CRISPR 시스템으로서, 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 제1 표적 핵산 위치로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 제2 표적 핵산 위치로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템; 및
ii. 중합효소
를 포함하는 것인 단계;
b. 표적 핵산을 증폭시키는 단계;
c. 제1 및 제2 프라이머를 포함하는 프라이머 쌍을 반응 혼합물에 첨가하는 단계로서, 제1 프라이머는 제1 위치에 상보성인 부분을 포함하고 제2 프라이머는 제2 위치에 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 단계; 및
d. 등온 조건 하에서 반복 연장 및 닉킹을 통해서 표적 핵산을 더 증폭시키는 단계를 포함한다.
2. 단락 1의 방법에 있어서, 제1 가이드 분자는 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하고 제2 가이드 분자는 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드한다.
3. 단락 1의 방법에 있어서, 제1 표적 핵산 위치 및 제2 표적 핵산 위치는 표적 핵산의 제1 가닥 상에 있고, 그리하여 제1 표적 핵산 위치 및 제2 표적 핵산 위치 사이에 표적 핵산의 제1 가닥의 서열을 포함하는 ssDNA를 생성시킨다.
4. 단락 2의 방법에 있어서, 제1 및 제2 CRISPR/Cas 복합체를 사용하여 표적 핵산의 제1 및 제2 가닥을 닉킹시키는 단계, 중합효소를 사용해 닉킹된 가닥을 치환 및 연장시키는 단계, 그리하여 제1 및 제2 닉 부위 사이에 표적 핵산 서열을 포함하는 듀플렉스를 생성시키는 단계에 의해 표적 핵산을 증폭시키는 단계를 포함한다.
5. 단락 1의 방법에 있어서, Cas-기반 닉카제는 Cas9 닉카제, Cpf1 닉카제, 및 C2c1 닉카제로 이루어진 군으로부터 선택된다.
6. 단락 2의 방법에 있어서, Cas-기반 닉카제는 HNH 도메인에 돌연변이를 포함하는 Cas9 닉카제 단백질이다.
7. 단락 2의 방법에 있어서, Cas-기반 닉카제는 SpCas9의 N863A 또는 SaCas9의 N580A에 상응하는 돌연변이를 포함하는 Cas9 닉카제 단백질이다.
8. 단락 3 또는 4의 방법에 있어서, Cas-기반 닉카제는 스트렙토코커스 피오게네스, 스타필로코커스 아우레우스, 스트렙토코커스 써모필러스, 에스. 뮤탄스, 에스. 아갈락티아에, 에스. 에퀴시밀리스, 에스. 산귀니스, 에스. 뉴모니아; 씨. 제주니, 씨. 콜라이; 엔. 살수기니스, 엔. 테르가르쿠스; 에스. 아우리쿨라리스, 에스. 카르노서스; 엔. 메닌지티데스, 엔. 고노로에아에; 엘. 모노시토게네스, 엘. 이바노비이; 씨. 보툴리넘, 씨. 디피실, 씨. 테타니, 씨. 소르델리이, 프란시셀라 툴라렌시스 1, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 sp. SCADC, 악시다미노코커스 sp. BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 Cas9 단백질이다.
9. 단락 2의 방법에 있어서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 Cpf1 닉카제 단백질이다.
10. 단락 6의 방법에 있어서, Cas-기반 닉카제는 AsCpf1의 R1226A에 상응하는 돌연변이를 포함하는 Cpf1 닉카제 단백질이다.
11. 단락 6 또는 7의 방법에 있어서, Cas-기반 닉카제는 프란시셀라 툴라렌시스, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움, 부티리비브리오 프로테오클라스티커스, 페레그리니박테리아 박테리움, 파르쿠박테리아 박테리움, 스미텔라 sp., 악시다미노코커스 sp., 라크노스피라세아에 박테리움, 칸디다투스 메타노플라스마 테르미텀, 유박테리움 엘리겐스, 모락셀라 보보쿨리, 렙토스피라 이나다이, 포르피로모나스 크레비오리카니스, 프레보텔라 디시엔스 및 포르피로모나스 마카카에, 숙시니비브리오 덱스트리노솔벤스, 프레보텔라 디시엔스, 플라보박테리움 브란키오필럼, 헬코코커스 쿤지, 유박테리움 sp., 미크로게노마테스 (로이즈만박테리아) 박테리움, 플라보박테리움 sp., 프레보텔라 브레비스, 모락셀라 카프라에, 경구 박테로이데테스, 포르피로모나스 칸술시, 시너지스테스 조네시이, 프레보텔라 브리안티이, 아나에로비브리오 sp., 부티리비브리오 피브리솔벤스, 칸디다투스 메타노메틸로필러스, 부티리비브리오 sp., 오리박테리움 sp., 슈도부티리비브리오 루미니스 및 프로테오카텔라 스페니시로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 Cpf1 단백질이다.
12. 단락 2의 방법에 있어서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 C2c1 닉카제 단백질이다.
13. 단락 9의 방법에 있어서, Cas-기반 닉카제는 AacC2c1의 D570A, E848A, 또는 D977A에 상응하는 돌연변이를 포함하는 C2c1 닉카제 단백질이다.
14. 단락 9 또는 10의 방법에 있어서, Cas-기반 닉카제는 알리시클로바실러스 악시도테레스트리스, 알리시클로바실러스 콘타미난스, 알리시클로바실러스 마크로스포란지이더스, 바실러스 히사시이, 칸디다투스 린도우박테리아, 데술포비브리오 이노피나투스, 데술포나트로넘 티오디스무탄스, 엘루시미크로비아 박테리움 RIFOXYA12, 옴니트로피카 WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 TAV5, 피시스파에라에 박테리움 ST-NAGAB-D1, 플란크토마이세테스 박테리움 RBG_13_46_10, 스피로카에테스 박테리움 GWB1_27_13, 베루코미크로비아세아에 박테리움 UBA2429, 투베리바실러스 칼리더스, 바실러스 써모아밀로보란스, 브레비바실러스 sp. CF112, 바실러스 sp. NSP2.1, 데술파티라브디움 부티라티보란스, 알리시클로바실러스 허바리우스, 시트로박터 프레운디이, 브레비바실러스 아그리 (예를 들어, BAB-2500), 및 메틸로박테리움 노둘란스로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 C2c1 단백질이다.
15. 전술한 단락 중 어느 하나의 방법에 있어서, 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 동일하다.
16. 단락 1-11 중 어느 하나에 따른 방법에 있어서, 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 상이하다.
17. 전술한 단락 중 어느 하나의 방법에 있어서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, Gst 중합효소, Taq 중합효소, 이. 콜라이 DNA 중합효소 I의 클레노우 단편, KlenTaq, Pol III DNA 중합효소, T5 DNA 중합효소, Gst 중합효소, 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택된다.
18. 전술한 단락 중 어느 하나의 방법에 있어서, 표적 핵산의 증폭은 약 50℃-59℃에서 수행된다.
19. 단락 1-14 중 어느 하나에 따른 방법에 있어서, 표적 핵산의 증폭은 약 60℃-72℃에서 수행된다.
20. 단락 1-14 중 어느 하나에 따른 방법에 있어서, 표적 핵산의 증폭은 약 37℃ 또는 약 65℃에서 수행된다.
21. 단락 1-14 중 어느 하나에 따른 방법에 있어서, 표적 핵산의 증폭은 일정 온도에서 수행된다.
22. 전술한 단락 중 어느 하나의 방법에 있어서, 전술한 단락 중 어느 하나의 방법에 있어서, 표적 핵산 서열은 약 20-30개, 약 30-40개, 약 40-50개, 또는 약 50-100개 뉴클레오티드 길이이다.
23. 단락 1-18 중 어느 하나의 방법에 있어서, 표적 핵산 서열은 약 100-200개, 약 100-500개, 또는 약 100-1000개 뉴클레오티드 길이이다.
24. 단락 1-18 중 어느 하나의 방법에 있어서, 표적 핵산 서열은 약 1000-2000개, 약 2000-3000개, 약 3000-4000개, 또는 약 4000-5000개 뉴클레오티드 길이이다.
25. 전술한 단락 중 어느 하나의 방법에 있어서, 제1 또는 제2 프라이머는 RNA 중합효소 프로모터를 포함한다.
26. 전술한 단락 중 어느 하나의 방법에 있어서, 겔 전기영동, 인터컬레이팅 염료 검출, PCR, 실시간 PCR, 형광발광, 형광 공명 에너지 전이 (FRET), 질량 분석법, 및 CRISPR-SHERLOCK으로 이루어진 군으로부터 선택된 방법을 통해서 증폭된 핵산을 검출하는 단계를 더 포함한다.
27. 단락 23의 방법에 있어서, 증폭된 핵산은 Cas13-기반 CRISPR-SHERLOCK 방법을 통해 검출된다.
28. 전술한 단락 중 어느 하나의 방법에 있어서, 표적 핵산은 아토몰라 감도에서 검출된다.
29. 단락 1-24 중 어느 하나의 방법에 있어서, 표적 핵산은 펨토몰라 감도에서 검출된다.
30. 전술한 단락 중 어느 하나의 방법에 있어서, 표적 핵산은 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA, 플라스미드 DNA, 및 합성 이중 가닥 DNA로 이루어진 군으로부터 선택된다.
31. 전술한 단락 중 어느 하나의 방법에 있어서, 샘플은 생물학적 샘플 또는 환경 샘플이다.
32. 단락 28의 방법에 있어서, 생물학적 샘플은 혈액, 혈장, 혈청, 소변, 대변, 가래, 점액, 림프액, 활액, 담즙, 복수, 흉막 삼출액, 혈청종, 타액, 뇌척수액, 수양액 또는 유리체액, 또는 임의의 신체 분비액, 여출액, 삼출액, 또는 관절로부터 수득된 유체, 또는 피부 또는 점막 표면의 면봉표본이다.
33. 단락 29의 방법에 있어서, 샘플은 인간 환자로부터 수득된 혈액, 혈장, 또는 혈청이다.
34. 단락 28의 방법에 있어서, 샘플은 식물 샘플이다.
35. 전술한 단락 중 어느 하나의 방법에 있어서, 샘플은 미정제 샘플이다.
36. 단락 1-31 중 어느 하나의 방법에 있어서, 샘플은 정제된 샘플이다.
37. 표적 단일-가닥 핵산의 증폭 및/또는 검출을 위한 방법으로서,
(a) 샘플 중 단일-가닥 핵산을 표적 이중-가닥 핵산으로 전환시키는 단계; 및
(b) 단락 1의 단계를 수행하는 단계를 포함한다.
38. 단락 34의 방법에 있어서, 표적 단일-가닥 핵산은 RNA 분자이다.
39. 단락 35의 방법에 있어서, RNA 분자는 역전사 및 증폭 단계를 통해서 이중-가닥 핵산으로 전환된다.
40. 단락 34의 방법에 있어서, 표적 단일-가닥 핵산은 단일 가닥 바이러스 DNA, 바이러스 RNA, 전령 RNA, 리보솜 RNA, 운반 RNA, 마이크로RNA, 짧은 간섭 RNA, 소형 핵 RNA, 합성 RNA, 및 합성 단일 가닥 DNA으로 이루어진 군으로부터 선택된다.
41. 샘플 중 표적 이중-가닥 핵산의 증폭 및/또는 검출을 위한 시스템으로서, 시스템은
a) 증폭 CRISPR 시스템으로서, 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템;
b) 중합효소;
c) 반응 혼합물에 대한 제1 및 제2 프라이머를 포함하는 프라이머 쌍으로서, 제1 프라이머는 표적 핵산의 제1 가닥과 상보성인 부분 및 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 제2 가닥과 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 프라이머 쌍; 및 임의로
d) 표적 핵산의 증폭을 검출하기 위한 검출 시스템을 포함한다.
42. 단락 38의 시스템에 있어서, Cas-기반 닉카제는 Cas9 닉카제, Cpf1 닉카제, 및 C2c1 닉카제로 이루어진 군으로부터 선택된다.
43. 단락 38 또는 39의 시스템에 있어서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택된다.
44. 단락 38-40 중 어느 하나의 시스템에 있어서, Cas-기반 닉카제 및 중합효소는 동일한 온도 하에서 수행된다.
45. 샘플 중 표적 단일-가닥 핵산을 증폭 및/또는 검출하기 위한 시스템으로서, 시스템은
a) 표적 단일-가닥 핵산을 이중-가닥 핵산으로 전환시키기 위한 시약;
b) 단락 38의 성분을 포함한다.
46. 샘플 중 표적 이중-가닥 핵산의 증폭 및/또는 검출을 위한 키트로서, 단락 38의 성분 및 사용 설명서 세트를 포함한다.
47. 단락 43의 키트로서, 샘플에서 이중-가닥 핵산을 정제하기 위한 시약을 더 포함한다.
48. 샘플 중 표적 단일-가닥 핵산의 증폭 및/또는 검출을 위한 키트로서, 단락 43의 성분 및 사용 설명서 세트를 포함한다.
49. 단락 4의 키트로서, 샘플에서 단일-가닥 핵산을 정제하기 위한 시약을 더 포함한다.
본 발명은 하기 실시예에서 더욱 설명하지만, 청구항에 기술된 본 발명의 범주를 제한하는 것이 아니다.
실시예
작업예
실시예 1 - CRISPR-닉카제-기반 증폭 (CRISPR-NEAR) 및 NEAR SHERLOCK 검출
이 실시예에서, 닉카제-기반 증폭은 CRISPR SHERLOCK 검출 방법과 조합하여, CRISPR-NEAR라고 하는, CRISPR-Cas 효소를 사용하여 시험되었다. 도 1은 CRISPR-Cas 효소를 사용한 닉카제-기반 증폭의 개략도를 도시한다.
CRISPR-NEAR은 DNA 또는 RNA 투입으로 수행할 수 있다. 증폭 프라이머에 T7 프로모터 서열을 도입시켜서, CRISPR-NEAR은 또한 하류 SHERLOCK 검출 방법과 호환가능하다. 도 9는 SHERLOCK 검출과 조합된 CRISPR-NEAR의 개략도를 도시한다. CRISPR-NEAR 사용의 핵심 장점 중 하나는 RPA 증폭에 비해 훨씬 더 빠를 수 있다는 것이다. 방법은 SHERLOCK 검출의 모든 단계를 하나의 반응으로 쉽게 조합할 수 있게 허용하는 매우 단순한 완충액을 사용한다. 다른 한편으로, RPA 증폭은 매우 점성이 있는 완충액을 사용하여 다른 시약과 함께 사용하는 것이 어렵다.
도 2는 닉카제 효소 증폭 반응의 최적화를 입증하는 겔 전기 영동 이미지이다. 결과는 NEAR 증폭이 닉카제 효소 및 중합효소 둘 모두에 의존적이라는 것을 보여준다. 프라이머 없이, 오직 선형 증폭이 발생된다. 프라이머 및 다른 PCR 첨가제 (예컨대 gp32 SSB 또는 트레할로스)는 증폭을 증가시킬 수 있고 비-특이적 생성물 형성을 조절할 수 있다.
도 3A - 3F는 닉카제-기반 선형 증폭이 최적 닉카제 농도에 의존적이라는 것을 입증한 일련의 실험을 도시한다. 이들 실험에서, 추가 프라이머가 반응에 포함되지 않았고, 그러므로 오직 닉킹 기반 선형 증폭이 발생된다. 이들 실험에서 사용된 닉카제는 Nt. A1w1 (양성 대조군으로서 사용), T7 미스매치된 nAsCpf1 또는 매치된 nAsCpf1이었다. 가이드 농도는 5 μM 투입에서 균일하게 유지시키는 한편 닉카제 농도는 아래로 적정하였다. nAsCpf1은 가닥-치환 중합효소에 의해 증폭된 이중 가닥 DNA를 닉킹할 수 있다. 이들 데이터는 nAsCpf1 증폭을 위한 최적 농도는 시험된 최고 농도 (1 μM)가 아닌, 500 nM이라는 것을 보여준다.
투입으로서 증폭된 NEAR 반응을 사용하여, 핵산 표적이 SYTO 인터컬레이팅 염료 (도 4A - 4C), 겔-기반 판독 (도 4D - 4F), 또는 Cas13-기반 SHERLOCK 검출 (도 4G - 4I)을 사용해 증폭되고 검출되는 연속 실험을 수행하였다. 이들 결과는 NEAR에 의한 증폭이 많은 비특이적 생성물을 생성시킬 수 있어서, SYTO 또는 겔-기반 판독과 호환가능하지 않다는 것을 시사한다. 그러나, CRISPR SHERLOCK 기반 검출은 문제를 피할 수 있고 관심 생성물의 특이적 검출을 허용한다. SYTO 또는 CRISPR SHERLOCK 기반 검출 (Cas13 또는 Cpf1 검출 사용)을 사용한 데이터는 표적/무 표적의 비율에 따라 더욱 그래프화하였다 (도 5). 그래프는 표적 부위에 대해 프로그램된 LwCas13a 및 Cpf1 가이드 복합체는 비특이적 증폭 대비 특이적 증폭을 구별할 수 있는 반면 SYTO 인터컬레이션 염료 검출은 표준 조건 하에서 그럴 수 없었다는 것을 보여준다.
도 6A 및 6B는 NEAR 단독 대 SHERLOCK 검출과 조합된 NEAR의 데이터를 도시한 2개 그래프이다. 이들 그래프로부터 몇가지 결론을 내릴 수 있다. 첫째로, LwCas13s SHERLOCK은 T7-증폭 및 강력한 부차적 RNAse 활성을 통한 검출 하한을 허용한다. 둘째로, 검출의 2 aM 한계는 Nt. A1w1 NEAR와 Cas13 검출을 사용해 획득될 수 있는 반면, 검출의 2 fM 한계는 nAsCpf1-NEAR과 Cas 13 검출을 사용해 획득될 수 있다. 마지막으로, 임의의 NEAR 반응과 조합된 AsCpf1 검출은 <20 fM에서 신뢰할만한 신호를 제공할 만큼 충분히 민감하지 않다.
NEAR SHERLOCK은 사용되는 중합효소에 의존하여 상이한 온도에서 수행될 수 있다. 도 7A - 7C는 NEAR이 60℃에서 Bst 2.0 warmstart 중합효소를 사용하여 수행될 수 있다는 것을 입증하고; 도 8A - 8B는 NEAR이 또한 37℃에서 시쿼나제 2.0 중합효소를 사용하여 수행될 수 있다는 것을 입증한다.
***
기술된 본 발명의 방법, 약학 조성물, 및 키트의 다양한 변형 및 변동은 본 발명의 범주 및 사조를 벗어나지 않고 당업자에게 자명하게 될 것이다. 본 발명은 특별한 구현예와 함께 기술되었지만, 추가로 변형될 수 있고 청구된 본 발명은 이러한 구현예에 과도하게 제한해서는 안된다는 것을 이해할 것이다. 실제로, 당업자에게 확실한 본 발명의 수행을 위해 기술된 방식의 다양한 변형은 본 발명의 범주 내에 속하고자 한다. 본 출원은 일반적으로 본 발명의 원리에 따라 본 발명의 임의의 변동, 용도, 또는 개조를 포괄하고자 하고 본 개시로부터 이러한 이탈의 포함은 본 발명이 속하는 분야의 기지의 관행 내에 있고 본 명세서에서 앞서 기재된 필수 특징에 적용할 수 있다.
SEQUENCE LISTING <110> The Broad Institute, Inc. Massachusetts Institute of Technology The President and Fellows of Harvard College Zhang, Feng Omar, Abbudayyeh Gootenberg, Jonathan Kellner, Max <120> CRISPR DOUBLE NICKASE BASED AMPLIFICATION COMPOSITIONS, SYSTEMS, AND METHODS <130> BROD-2550WP <140> PCT/US2019/039221 <141> 2019-06-26 <150> 62/690,278 <151> 2018-06-26 <150> 62/767,059 <151> 2018-11-14 <160> 10 <170> PatentIn version 3.5 <210> 1 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Peptide <220> <221> misc <222> (2)..(2) <223> Xaa = N, H, or K <220> <221> misc <222> (3)..(3) <223> Xaa = R, S, D, E, Q, N, G, Y, or H <220> <221> misc <222> (4)..(4) <223> Xaa = I, S, T, V, or L <220> <221> misc <222> (5)..(5) <223> Xaa = L, F, N, Y, V, I, S, D, E, or A <400> 1 Arg Xaa Xaa Xaa Xaa His 1 5 <210> 2 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Peptide <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa = N or H <220> <221> MISC_FEATURE <222> (3)..(3) <223> Xaa = R, S, D, E, Q, N, G, Y, or H <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa = I, S, T, V, or L <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = L, F, N, Y, V, I, S, D, E, or A <400> 2 Arg Xaa Xaa Xaa His 1 5 <210> 3 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Peptide <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa = N or K <220> <221> MISC_FEATURE <222> (3)..(3) <223> Xaa = R, S, D, E, Q, N, G, Y, or H <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa = I, S, T, V, or L <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = L, F, N, Y, V, I, S, D, E, or A <400> 3 Arg Xaa Xaa Xaa Xaa His 1 5 <210> 4 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 4 gggaacaaag cugaaguacu uaccc 25 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 5 gggtagggcg ggttggga 18 <210> 6 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_feature <222> (25)..(25) <223> 3 prime thiol modification <400> 6 ttataactat tcctaaaaaa aaaaa 25 <210> 7 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_feature <222> (1)..(1) <223> 5 prime thiol modification <400> 7 aaaaaaaaaa ctcccctaat aacaat 26 <210> 8 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <400> 8 ggguaggaau aguuauaauu ucccuuuccc auuguuauua gggag 45 <210> 9 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_feature <222> (1)..(1) <223> 5 prime biotin modification <220> <221> misc_feature <222> (12)..(12) <223> 3 prime fluorescent marker <400> 9 ucucguacgu uc 12 <210> 10 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Oligonucleotide <220> <221> misc_feature <222> (1)..(1) <223> 5 prime biotin modification <220> <221> misc_feature <222> (24)..(24) <223> 3 prime fluorescent tag <400> 10 ucucguacgu ucucucguac guuc 24

Claims (49)

  1. 표적 이중-가닥 핵산의 증폭 및/또는 검출 방법으로서,
    a. 표적 이중-가닥 핵산을 포함하는 샘플을 증폭 반응 혼합물과 배합하는 단 계로서, 증폭 반응 혼합물은
    i. 증폭 CRISPR 시스템으로서, 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 제1 표적 핵산 위치로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 제2 표적 핵산 위치로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템; 및
    ii. 중합효소
    를 포함하는 것인 단계;
    b. 표적 핵산을 증폭시키는 단계;
    c. 제1 및 제2 프라이머를 포함하는 프라이머 쌍을 반응 혼합물에 첨가하는 단계로서, 제1 프라이머는 제1 위치에 상보성인 부분을 포함하고 제2 프라이머는 제2 위치에 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 단계; 및
    d. 등온 조건 하에서 반복된 연장 및 닉킹을 통해서 표적 핵산을 더 증폭시키는 단계
    를 포함하는 것인, 증폭 및/또는 검출 방법.
  2. 제1항에 있어서, 제1 가이드 분자는 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하고, 제2 가이드 분자는 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드하는 것인, 증폭 및/또는 검출 방법.
  3. 제1항에 있어서, 제1 표적 핵산 위치 및 제2 표적 핵산 위치는 표적 핵산의 제1 가닥 상에 존재하고, 그리하여 제1 표적 핵산 위치 및 제2 표적 핵산 위치 사이에 표적 핵산의 제1 가닥의 서열을 포함하는 ssDNA를 생성시키는 것인, 증폭 및/또는 검출 방법.
  4. 제2항에 있어서, 제1 및 제2 CRISPR/Cas 복합체를 사용하여 표적 핵산의 제1 및 제2 가닥을 닉킹시키는 단계 및 중합효소를 사용하여 닉킹된 가닥을 치환 및 연장시키는 단계, 그리하여 제1 및 제2 닉 (nick) 부위 사이에 표적 핵산 서열을 포함하는 듀플렉스를 생성시키는 단계를 통해서 표적 핵산을 증폭시키는 단계를 포함하는 것인, 증폭 및/또는 검출 방법.
  5. 제1항에 있어서, Cas-기반 닉카제는 Cas9 닉카제, Cpf1 닉카제, 및 C2c1 닉카제로 이루어진 군으로부터 선택되는 것인, 증폭 및/또는 검출 방법.
  6. 제2항에 있어서, Cas-기반 닉카제는 HNH 도메인에 돌연변이를 포함하는 Cas9 닉카제 단백질인, 증폭 및/또는 검출 방법.
  7. 제2항에 있어서, Cas-기반 닉카제는 SpCas9의 N863A 또는 SaCas9의 N580A에 상응하는 돌연변이를 포함하는 Cas9 닉카제 단백질인, 증폭 및/또는 검출 방법.
  8. 제3항 또는 제4항에 있어서, Cas-기반 닉카제는 스트렙토코커스 피오게네스 (Streptococcus pyogenes), 스타필로코커스 아우레우스 (Staphylococcus aureus), 스트렙토코커스 써모필러스 (Streptococcus thermophilus), 에스. 뮤탄스 (S. mutans), 에스. 아갈락티아에 (S. agalactiae), 에스. 에퀴시밀리스 (S. equisimilis), 에스. 산귀니스 (S. sanguinis), 에스. 뉴모니아 (S. pneumonia); 씨. 제주니 (C. jejuni), 씨. 콜라이 (C. coli); 엔. 살수기니스 (N. salsuginis), 엔. 테르가르쿠스 (N. tergarcus); 에스. 아우리쿨라리스 (S. auricularis), 에스. 카르노서스 (S. carnosus); 엔. 메닌지티데스 (N. meningitides), 엔. 고노로에아에 (N. gonorrhoeae); 엘. 모노시토게네스 (L. monocytogenes), 엘. 이바노비이 (L. ivanovii); 씨. 보툴리넘 (C. botulinum), 씨. 디피실 (C. difficile), 씨. 테타니 (C. tetani), 씨. 소르델리이 (C. sordellii), 프란시셀라 툴라렌시스 (Francisella tularensis) 1, 프레보텔라 알벤시스 (Prevotella albensis), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MC2017 1, 부티리비브리오 프로테오클라스티커스 (Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움 (Peregrinibacteria bacterium) GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 (Parcubacteria bacterium) GW2011_GWC2_44_17, 스미텔라 (Smithella) sp. SCADC, 악시다미노코커스 (Acidaminococcus) sp. BV3L6, 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) MA2020, 칸디다투스 메타노플라스마 테르미텀 (Candidatus Methanoplasma termitum), 유박테리움 엘리겐스 (Eubacterium eligens), 모락셀라 보보쿨리 (Moraxella bovoculi) 237, 렙토스피라 이나다이 (Leptospira inadai), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium) ND2006, 포르피로모나스 크레비오리카니스 (Porphyromonas crevioricanis) 3, 프레보텔라 디시엔스 (Prevotella disiens) 및 포르피로모나스 마카카에 (Porphyromonas macacae)로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 Cas9 단백질인, 증폭 및/또는 검출 방법.
  9. 제2항에 있어서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 Cpf1 닉카제 단백질인, 증폭 및/또는 검출 방법.
  10. 제6항에 있어서, Cas-기반 닉카제는 AsCpf1의 R1226A에 상응하는 돌연변이를 포함하는 Cpf1 닉카제 단백질인, 증폭 및/또는 검출 방법.
  11. 제6항 또는 제7항에 있어서, Cas-기반 닉카제는 프란시셀라 툴라렌시스 (Francisella tularensis), 프레보텔라 알벤시스 (Prevotella albensis), 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium), 부티리비브리오 프로테오클라스티커스 (Butyrivibrio proteoclasticus), 페레그리니박테리아 박테리움 (Peregrinibacteria bacterium), 파르쿠박테리아 박테리움 (Parcubacteria bacterium), 스미텔라 (Smithella) sp., 악시다미노코커스 (Acidaminococcus) sp., 라크노스피라세아에 박테리움 (Lachnospiraceae bacterium), 칸디다투스 메타노플라스마 테르미텀 (Candidatus Methanoplasma termitum), 유박테리움 엘리겐스 (Eubacterium eligens), 모락셀라 보보쿨리 (Moraxella bovoculi), 렙토스피라 이나다이 (Leptospira inadai), 포르피로모나스 크레비오리카니스 (Porphyromonas crevioricanis), 프레보텔라 디시엔스 (Prevotella disiens) 및 포르피로모나스 마카카에 (Porphyromonas macacae), 숙시니비브리오 덱스트리노솔벤스 (Succinivibrio dextrinosolvens), 프레보텔라 디시엔스 (Prevotella disiens), 플라보박테리움 브란키오필럼 (Flavobacterium branchiophilum), 헬코코커스 쿤지 (Helcococcus kunzii), 유박테리움 (Eubacterium) sp., 미크로게노마테스 (Microgenomates)(로이즈만박테리아 (Roizmanbacteria)) 박테리움, 플라보박테리움 (Flavobacterium) sp., 프레보텔라 브레비스 (Prevotella brevis), 모락셀라 카프라에 (Moraxella caprae), 경구 박테로이데테스 (Bacteroidetes oral), 포르피로모나스 칸술시 (Porphyromonas cansulci), 시너지스테스 조네시이 (Synergistes jonesii), 프레보텔라 브리안티이 (Prevotella bryantii), 아나에로비브리오 (Anaerovibrio) sp., 부티리비브리오 피브리솔벤스 (Butyrivibrio fibrisolvens), 칸디다투스 메타노메틸로필러스 (Candidatus Methanomethylophilus), 부티리비브리오 (Butyrivibrio) sp., 오리박테리움 (Oribacterium) sp., 슈도부티리비브리오 루미니스 (Pseudobutyrivibrio ruminis) 및 프로테오카텔라 스페니시 (Proteocatella sphenisci)로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 Cpf1 단백질인, 증폭 및/또는 검출 방법.
  12. 제2항에 있어서, Cas-기반 닉카제는 Nuc 도메인에 돌연변이를 포함하는 C2c1 닉카제 단백질인, 증폭 및/또는 검출 방법.
  13. 제9항에 있어서, Cas-기반 닉카제는 AacC2c1의 D570A, E848A, 또는 D977A에 상응하는 돌연변이를 포함하는 C2c1 닉카제 단백질인, 증폭 및/또는 검출 방법.
  14. 제9항 또는 제10항에 있어서, Cas-기반 닉카제는 알리시클로바실러스 악시도테레스트리스 (Alicyclobacillus acidoterrestris), 알리시클로바실러스 콘타미난스 (Alicyclobacillus contaminans), 알리시클로바실러스 마크로스포란지이더스 (Alicyclobacillus macrosporangiidus), 바실러스 히사시이 (Bacillus hisashii), 칸디다투스 린도우박테리아 (Candidatus Lindowbacteria), 데술포비브리오 이노피나투스 (Desulfovibrio inopinatus), 데술포나트로넘 티오디스무탄스 (Desulfonatronum thiodismutans), 엘루시미크로비아 박테리움 (Elusimicrobia bacterium) RIFOXYA12, 옴니트로피카 (Omnitrophica) WOR_2 박테리움 RIFCSPHIGHO2, 오피투타세아에 박테리움 (Opitutaceae bacterium) TAV5, 피시스파에라에 박테리움 (Phycisphaerae bacterium) ST-NAGAB-D1, 플란크토마이세테스 박테리움 (Planctomycetes bacterium) RBG_13_46_10, 스피로카에테스 박테리움 (Spirochaetes bacterium) GWB1_27_13, 베루코미크로비아세아에 박테리움 (Verrucomicrobiaceae bacterium) UBA2429, 투베리바실러스 칼리더스 (Tuberibacillus calidus), 바실러스 써모아밀로보란스 (Bacillus thermoamylovorans), 브레비바실러스 (Brevibacillus) sp. CF112, 바실러스 (Bacillus) sp. NSP2.1, 데술파티라브디움 부티라티보란스 (Desulfatirhabdium butyrativorans), 알리시클로바실러스 허바리우스 (Alicyclobacillus herbarius), 시트로박터 프레운디이 (Citrobacter freundii), 브레비바실러스 아그리 (Brevibacillus agri) (예를 들어, BAB-2500), 및 메틸로박테리움 노둘란스 (Methylobacterium nodulans)로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 C2c1 단백질인, 증폭 및/또는 검출 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 동일한 것인, 증폭 및/또는 검출 방법.
  16. 제1항 내지 제11항 중 어느 한 항에 있어서, 제1 Cas-기반 닉카제 및 제2 Cas-기반 닉카제는 상이한 것인, 증폭 및/또는 검출 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, Gst 중합효소, Taq 중합효소, 이. 콜라이 (E.coli) DNA 중합효소 I의 클레노우 (Klenow) 단편, KlenTaq, Pol III DNA 중합효소, T5 DNA 중합효소, Gst 중합효소, 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택되는 것인, 증폭 및/또는 검출 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 표적 핵산의 증폭은 약 50℃-59℃에서 수행되는 것인, 증폭 및/또는 검출 방법.
  19. 제1항 내지 제14항 중 어느 한 항에 있어서, 표적 핵산의 증폭은 약 60℃-72℃에서 수행되는 것인, 증폭 및/또는 검출 방법.
  20. 제1항 내지 제14항 중 어느 한 항에 있어서, 표적 핵산의 증폭은 약 37℃ 또는 약 65℃에서 수행되는 것인, 증폭 및/또는 검출 방법.
  21. 제1항 내지 제14항 중 어느 한 항에 있어서, 표적 핵산의 증폭은 일정 온도에서 수행되는 것인, 증폭 및/또는 검출 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 표적 핵산 서열은 약 20-30개, 약 30-40개, 약 40-50개, 또는 약 50-100개 뉴클레오티드 길이인, 증폭 및/또는 검출 방법.
  23. 제1항 내지 제18항 중 어느 한 항에 있어서, 표적 핵산 서열은 약 100-200개, 약 100-500개, 또는 약 100-1000개 뉴클레오티드 길이인, 증폭 및/또는 검출 방법.
  24. 제1항 내지 제18항 중 어느 한 항에 있어서, 표적 핵산 서열은 약 1000-2000개, 약 2000-3000개, 약 3000-4000개, 또는 약 4000-5000개 뉴클레오티드 길이인, 증폭 및/또는 검출 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 제1 또는 제2 프라이머는 RNA 중합효소 프로모터를 포함하는 것인, 증폭 및/또는 검출 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 겔 전기영동, 인터컬레이팅 염료 검출, PCR, 실시간 PCR, 형광발광, 형광 공명 에너지 전이 (FRET), 질량 분석법, 및 CRISPR-SHERLOCK으로 이루어진 군으로부터 선택되는 방법을 통해 증폭된 핵산을 검출하는 단계를 더 포함하는 것인, 증폭 및/또는 검출 방법.
  27. 제23항에 있어서, 증폭된 핵산은 Cas13-기반 CRISPR-SHERLOCK 방법을 통해 검출되는 것인, 증폭 및/또는 검출 방법.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 표적 핵산은 아토몰라 감도에서 검출되는 것인, 증폭 및/또는 검출 방법.
  29. 제1항 내지 제24항 중 어느 한 항에 있어서, 표적 핵산은 펨토몰라 감도에서 검출되는 것인, 증폭 및/또는 검출 방법.
  30. 제1항 내지 제29항 중 어느 한 항에 있어서, 표적 핵산은 게놈 DNA, 미토콘드리아 DNA, 바이러스 DNA, 플라스미드 DNA, 및 합성 이중 가닥 DNA로 이루어진 군으로부터 선택되는 것인, 증폭 및/또는 검출 방법.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, 샘플은 생물학적 샘플 또는 환경 샘플인, 증폭 및/또는 검출 방법.
  32. 제28항에 있어서, 생물학적 샘플은 혈액, 혈장, 혈청, 소변, 대변, 객담, 점액, 림프액, 활액, 담즙, 복수, 흉막 삼출액, 혈청종, 타액, 뇌척수액, 수양액 또는 유리체액, 또는 임의의 신체 분비액, 여출액, 삼출액, 또는 관절로부터 수득된 유체, 또는 피부 또는 점막 표면의 면봉표본인, 증폭 및/또는 검출 방법.
  33. 제29항에 있어서, 샘플은 인간 환자로부터 수득된 혈액, 혈장, 또는 혈청인, 증폭 및/또는 검출 방법.
  34. 제28항에 있어서, 샘플은 식물 샘플인, 증폭 및/또는 검출 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 샘플은 미정제 샘플인, 증폭 및/또는 검출 방법.
  36. 제1항 내지 제31항 중 어느 한 항에 있어서, 샘플은 정제된 샘플인, 증폭 및/또는 검출 방법.
  37. 표적 단일-가닥 핵산의 증폭 및/또는 검출 방법으로서,
    (a) 샘플 중 단일-가닥 핵산을 표적 이중-가닥 핵산으로 전환시키는 단계; 및
    (b) 제1항의 단계를 수행하는 단계
    를 포함하는, 증폭 및/또는 검출 방법.
  38. 제34항에 있어서, 표적 단일-가닥 핵산은 RNA 분자인, 증폭 및/또는 검출 방법.
  39. 제35항에 있어서, RNA 분자는 역전사 및 증폭 단계를 통해서 이중-가닥 핵산으로 전환되는 것인, 증폭 및/또는 검출 방법.
  40. 제34항에 있어서, 표적 단일-가닥 핵산은 단일 가닥 바이러스 DNA, 바이러스 RNA, 전령 RNA, 리보솜 RNA, 운반 RNA, 마이크로RNA, 짧은 간섭 RNA, 소형 핵 RNA, 합성 RNA, 및 합성 단일 가닥 DNA로 이루어진 군으로부터 선택되는 것인, 증폭 및/또는 검출 방법.
  41. 샘플 중 표적 이중-가닥 핵산의 증폭 및/또는 검출을 위한 시스템으로서, 시스템은
    e) 증폭 CRISPR 시스템으로서, 제1 및 제2 CRISPR/Cas 복합체를 포함하고, 제1 CRISPR/Cas 복합체는 제1 Cas-기반 닉카제 및 제1 CRISPR/Cas 복합체를 표적 핵산의 제1 가닥으로 가이드하는 제1 가이드 분자를 포함하고, 제2 CRISPR/Cas 복합체는 제2 Cas-기반 닉카제 및 제2 CRISPR/Cas 복합체를 표적 핵산의 제2 가닥으로 가이드하는 제2 가이드 분자를 포함하는 것인 증폭 CRISPR 시스템;
    f) 중합효소;
    g) 반응 혼합물에 대한 제1 및 제2 프라이머를 포함하는 프라이머 쌍으로서, 제1 프라이머는 표적 핵산의 제1 가닥과 상보성인 부분 및 제1 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하고, 제2 프라이머는 표적 핵산의 제2 가닥과 상보성인 부분 및 제2 가이드 분자에 대한 결합 부위를 포함하는 부분을 포함하는 것인 프라이머 쌍; 및 임의로
    h) 표적 핵산의 증폭을 검출하기 위한 검출 시스템
    을 포함하는 것인, 시스템.
  42. 제38항에 있어서, Cas-기반 닉카제는 Cas9 닉카제, Cpf1 닉카제, 및 C2c1 닉카제로 이루어진 군으로부터 선택되는 것인, 시스템.
  43. 제38항 또는 제39항에 있어서, 중합효소는 Bst 2.0 DNA 중합효소, Bst 2.0 WarmStart DNA 중합효소, Bst 3.0 DNA 중합효소, 전체 길이 Bst DNA 중합효소, 대형 단편 Bst DNA 중합효소, 대형 단편 Bsu DNA 중합효소, phi29 DNA 중합효소, T7 DNA 중합효소, 및 시쿼나제 DNA 중합효소로 이루어진 군으로부터 선택되는 것인, 시스템.
  44. 제38항 내지 제40항 중 어느 한 항에 있어서, Cas-기반 닉카제 및 중합효소는 동일 온도 하에서 수행되는 것인, 시스템.
  45. 샘플 중 표적 단일-가닥 핵산을 증폭 및/또는 검출하기 위한 시스템으로서, 시스템은
    c) 표적 단일-가닥 핵산을 이중-가닥 핵산으로 전환시키기 위한 시약;
    d) 제38항의 성분
    을 포함하는 것인, 시스템.
  46. 샘플 중 표적 이중-가닥 핵산의 증폭 및/또는 검출을 위한 키트로서, 제38항의 성분 및 사용 설명서 세트를 포함하는 것인, 키트.
  47. 제43항에 있어서, 샘플 중 이중-가닥 핵산을 정제하기 위한 시약을 더 포함하는 것인, 키트.
  48. 샘플 중 표적 단일-가닥 핵산의 증폭 및/또는 검출을 위한 키트로서, 제43항의 성분 및 사용 설명서 세트를 포함하는 것인, 키트.
  49. 제4항에 있어서, 샘플 중 단일-가닥 핵산을 정제하기 위한 시약을 더 포함하는 것인, 키트.
KR1020217001478A 2018-06-26 2019-06-26 Crispr 이중 닉카제 기반 증폭 조성물, 시스템, 및 방법 KR20210024010A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862690278P 2018-06-26 2018-06-26
US62/690,278 2018-06-26
US201862767059P 2018-11-14 2018-11-14
US62/767,059 2018-11-14
PCT/US2019/039221 WO2020006067A1 (en) 2018-06-26 2019-06-26 Crispr double nickase based amplification compositions, systems, and methods

Publications (1)

Publication Number Publication Date
KR20210024010A true KR20210024010A (ko) 2021-03-04

Family

ID=67297327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217001478A KR20210024010A (ko) 2018-06-26 2019-06-26 Crispr 이중 닉카제 기반 증폭 조성물, 시스템, 및 방법

Country Status (12)

Country Link
US (1) US20210207203A1 (ko)
EP (1) EP3814520A1 (ko)
JP (1) JP2021528091A (ko)
KR (1) KR20210024010A (ko)
CN (1) CN112639121A (ko)
AU (1) AU2019291827A1 (ko)
BR (1) BR112020026246A2 (ko)
CA (1) CA3102211A1 (ko)
IL (1) IL278963A (ko)
MX (1) MX2020013461A (ko)
SG (1) SG11202012785VA (ko)
WO (1) WO2020006067A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021247870A1 (en) * 2020-06-03 2021-12-09 Siphox, Inc. Cascading amplification for chemical and biosensing
CN111733216B (zh) * 2020-06-22 2023-03-28 山东舜丰生物科技有限公司 一种提高目标核酸检测效率的方法
CN112831544B (zh) * 2020-12-31 2024-06-14 华南农业大学 一种基于CRISPR/Cas12a系统的生物检测方法和生物检测装置
CN113186253B (zh) * 2021-04-27 2022-06-21 福州大学 一种用于检测路易体病标志物的Cas12a-DNAzyme传感器及其制备方法
WO2023004391A2 (en) 2021-07-21 2023-01-26 Montana State University Nucleic acid detection using type iii crispr complex

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US715640A (en) 1902-09-10 1902-12-09 Whitney Mfg Company Clutch mechanism.
US5541099A (en) 1989-08-10 1996-07-30 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'-to-5' exonuclease activity
US6555349B1 (en) 1993-01-22 2003-04-29 Cornell Research Foundation, Inc. Methods for amplifying and sequencing nucleic acid molecules using a three component polymerase
IL135776A0 (en) 1997-10-24 2001-05-20 Life Technologies Inc Recombinational cloning using nucleic acids having recombination sites
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
US9689031B2 (en) * 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
CA2796600C (en) 2010-04-26 2019-08-13 Sangamo Biosciences, Inc. Genome editing of a rosa locus using zinc-finger nucleases
UA116205C2 (uk) * 2012-04-09 2018-02-26 Енвіролоджикс Інк. Спосіб кількісного визначення послідовності нуклеїнової кислоти в зразку
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
EP2971106B1 (en) * 2013-03-11 2020-02-26 ELITechGroup, Inc. Methods for true isothermal strand displacement amplification
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
CA2958292A1 (en) * 2014-08-19 2016-02-25 President And Fellows Of Harvard College Rna-guided systems for probing and mapping of nucleic acids
EP3271713B1 (en) 2015-03-18 2021-05-05 The Broad Institute, Inc. Massively parallel on-chip coalescence of microemulsions
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
AU2016279062A1 (en) * 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
EP3666895A1 (en) 2015-06-18 2020-06-17 The Broad Institute, Inc. Novel crispr enzymes and systems
KR20180133374A (ko) 2015-10-22 2018-12-14 더 브로드 인스티튜트, 인코퍼레이티드 타입 vi-b crispr 효소 및 시스템
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
US20190264186A1 (en) 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
AU2017257274B2 (en) 2016-04-19 2023-07-13 Massachusetts Institute Of Technology Novel CRISPR enzymes and systems
US11286478B2 (en) 2016-04-19 2022-03-29 The Broad Institute, Inc. Cpf1 complexes with reduced indel activity
KR102670601B1 (ko) 2016-04-19 2024-05-29 더 브로드 인스티튜트, 인코퍼레이티드 신규한 crispr 효소 및 시스템
RU2021106817A (ru) * 2016-05-20 2021-04-06 Регенерон Фармасьютикалс, Инк. Способы преодоления иммунологической толерантности с использованием множества направляющих рнк
JP7267013B2 (ja) 2016-06-17 2023-05-01 ザ・ブロード・インスティテュート・インコーポレイテッド Vi型crisprオルソログ及び系
CN110114461A (zh) 2016-08-17 2019-08-09 博德研究所 新型crispr酶和系统
WO2018035387A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
CA3049961A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr effector system based diagnostics
WO2018170340A1 (en) 2017-03-15 2018-09-20 The Broad Institute, Inc. Crispr effector system based diagnostics for virus detection
US11174515B2 (en) 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11104937B2 (en) 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
CA3056236A1 (en) 2017-03-15 2018-09-20 The Broad Institute, Inc. Novel cas13b orthologues crispr enzymes and systems
US11618928B2 (en) 2017-04-12 2023-04-04 The Broad Institute, Inc. CRISPR effector system based diagnostics for malaria detection
WO2018191388A1 (en) 2017-04-12 2018-10-18 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
US20210121280A1 (en) 2017-04-16 2021-04-29 Sanford Health Filter for Stent Retriever and Methods for Use Thereof
CA3063739A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
EP3645728A4 (en) 2017-06-26 2021-03-24 The Broad Institute, Inc. NEW CRISPR TYPE VI ORTHOLOGISTS AND RELATED SYSTEMS
CN109209763B (zh) 2017-07-06 2019-11-29 北京金风科创风电设备有限公司 风力发电机组叶片变桨装置、变桨方法及风力发电机组
CN107488710B (zh) * 2017-07-14 2020-09-22 上海吐露港生物科技有限公司 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒

Also Published As

Publication number Publication date
CN112639121A (zh) 2021-04-09
EP3814520A1 (en) 2021-05-05
MX2020013461A (es) 2021-04-28
CA3102211A1 (en) 2020-01-02
IL278963A (en) 2021-01-31
SG11202012785VA (en) 2021-01-28
US20210207203A1 (en) 2021-07-08
AU2019291827A1 (en) 2020-12-24
WO2020006067A1 (en) 2020-01-02
JP2021528091A (ja) 2021-10-21
BR112020026246A2 (pt) 2021-04-20

Similar Documents

Publication Publication Date Title
EP3814527B1 (en) Crispr effector system based amplification methods, systems, and diagnostics
KR20210024010A (ko) Crispr 이중 닉카제 기반 증폭 조성물, 시스템, 및 방법
KR20210104698A (ko) Crispr 시스템 기반 액적 진단 시스템 및 방법
CA3106035A1 (en) Cas12b enzymes and systems
CN111836903A (zh) 基于crispr效应系统的多重诊断
CN111448311A (zh) 基于多效应子crispr的诊断系统
CA3087362A1 (en) Crispr effector system based diagnostics
US20220333208A1 (en) Crispr effector system based multiplex cancer diagnostics
WO2020186231A2 (en) Crispr effector system based multiplex diagnostics
JP2019528743A (ja) 規定された配列および長さのdna1本鎖分子の拡大可能な生物工学的生成
US20220228150A1 (en) Crispr system high throughput diagnostic systems and methods
JP2021528975A (ja) Crispr/cas及びトランスポザーゼを利用した増幅用の組成物、システム、及び方法
Wu et al. G-triplex based molecular beacon with duplex-specific nuclease amplification for the specific detection of microRNA
US20210396756A1 (en) Crispr effector system based diagnostics for hemorrhagic fever detection
US20220002789A1 (en) Multiplexing highly evolving viral variants with sherlock detection method
WO2022061172A2 (en) Nucleic acid detection using a nuclease actuator

Legal Events

Date Code Title Description
WITB Written withdrawal of application