KR20220038668A - 유형 III CRISPR/Cas 기반 진단 - Google Patents

유형 III CRISPR/Cas 기반 진단 Download PDF

Info

Publication number
KR20220038668A
KR20220038668A KR1020227001546A KR20227001546A KR20220038668A KR 20220038668 A KR20220038668 A KR 20220038668A KR 1020227001546 A KR1020227001546 A KR 1020227001546A KR 20227001546 A KR20227001546 A KR 20227001546A KR 20220038668 A KR20220038668 A KR 20220038668A
Authority
KR
South Korea
Prior art keywords
coa
rna
cas
detection system
crispr
Prior art date
Application number
KR1020227001546A
Other languages
English (en)
Inventor
아이코 유레 스틴스
스티진 헨드리쿠스 페트루스 프린센
존 반 데르 오스트
레이몬드 휴버트 조세프 스탈스
Original Assignee
바게닝겐 유니버시테이트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바게닝겐 유니버시테이트 filed Critical 바게닝겐 유니버시테이트
Publication of KR20220038668A publication Critical patent/KR20220038668A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/42Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving phosphatase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/525Phosphatase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y306/00Hydrolases acting on acid anhydrides (3.6)
    • C12Y306/01Hydrolases acting on acid anhydrides (3.6) in phosphorus-containing anhydrides (3.6.1)
    • C12Y306/01001Inorganic diphosphatase (3.6.1.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 기반 리보핵산 검출 시스템에 관한 것이다. 본 발명은 또한 이러한 시스템을 사용하여 샘플 내의 표적 핵산 분자의 존재 또는 부재를 측정하는 방법, 및 본 발명에 따른 리보핵산 검출 시스템을 포함하는 장치에 관한 것이다.

Description

유형 III CRISPR/Cas 기반 진단
본원에 기술된 발명은 CRISPR/Cas-관련 핵산 검출 시스템 및 진단 응용 분야에서의 이의 광범위한 용도에 관한 것이다.
1. 소개
지난 10년 동안 분자생물학계는 자체 분야를 훨씬 뛰어넘는 결과를 가져온 몇 가지 획기적인 발견을 겪었다. 의심할 여지없이, CRISPR/Cas(클러스터링된 규칙적 간격의 짧은 회문 반복부(Clustered Regularly Interspaced Short Palindromic Repeats), CRISPR/연관 유전자)는 이러한 발견 중 하나로 간주될 수 있다. CRISPR/Cas 시스템은 박테리오파지 및 플라스미드와 같은 외래 유전 요소에 대한 서열 특이적 방어를 제공하는 원핵생물 적응 면역 시스템으로 식별되었다. 그러나 CRISPR/Cas 시스템은 전체는 아니지만 대부분의 유기체에서의 유전적 교란을 허용하며, 이는 모든 기술 분야에서 엄청난 결과를 초래한다.
CRISPR 방어는 적응, 발현, 간섭의 3단계로 구성된 과정으로 설명할 수 있다(문헌[Rath et al., 2015. Biochimie 117: 119-128]; 문헌[Makarova et al., 2011. Nat Rev Microbiol 9: 467-477]). 적응 단계 동안, 유전자 단편이 외부 침입 개체로부터 획득되어 CRISPR 기억 장치에 저장된다(문헌[Jackson et al., 2017. Science 356: eaal5056]). 이 기억 장치는 스페이서(spacer)로 명명되는 외래 DNA 서열들을 포함하며, 이들은 반복적인 DNA 서열(반복부)에 의해 분리된다. CRISPR 유전자좌의 발현(단계 II)은 긴 RNA 분자의 전사를 유도하며, 이 분자는 이후에 다수의 CRISPR RNA(crRNA)로 가공된다(문헌[Brouns et al., 2008. Science 321: 960-964]). 또한, 상기 세포는 CRISPR/Cas 시스템의 이펙터(effector)인 Cas 단백질을 발현하며, 이 단백질은 crRNA를 혼입함으로써 리보핵산 단백질(RNP: ribonucleoprotein) 복합체를 형성한다. crRNA에 대한 서열 상보성으로 인해 외래 유전 요소가 검출되고 나면, 연관 Cas 단백질은 침입 개체를 분해하는 뉴클레아제 활성을 사용하며, 이는 종종 CRISPR 방어 과정의 간섭 단계로 설명된다.
지난 10년 동안의 CRISPR/Cas에 대한 방대한 연구로 인해, 박테리아와 고세균류계 내에서 많은 시스템이 발견되었다(문헌[Fenner et al., 2007. J Biomol Screen 20: 1027-1039]; 문헌[van der Oost et al., 2009. Trends Biochem Sciences 34: 401-407]). CRISPR/Cas 시스템의 분류가 수행되었다. 클래스 I 시스템은 다수 서브유닛 Cas 복합체를 사용하는 반면, 클래스 II 시스템은 활성을 매개하기 위해 단일 Cas 단백질만을 사용한다. 다양한 유형들은 일반적으로, 시그니처 유전자(signature gene)의 존재에 기반하여 특성화된다(문헌[Wright et al., 2016. Cell 164: 29-44]).
상기의 많은 CRISPR/Cas 시스템을 구별할 수 있는 차이점과는 대조적으로, 대다수는 기능적 유사성을 공유한다. 거의 모든 CRISPR/Cas 유형은 RNP를 표적화하는 DNA로서 기능하며, 이는 많은 DNA 기반 침입 개체와 관련이 있을 수 있다. 대조적으로, RNA 기반 성질의 침입 요소는 원핵생물계에서 자주 접하지는 못한다. 따라서, 유형 III CRISPR/Cas 시스템이 표적 RNA 서열로 발달하였다는 것은 다소 놀라운 일이다(문헌[Wright et al., 2016. Cell 164: 29-44]; 문헌[Hale et al., 2009. Cell 139: 945-956]). 연구에 따르면, 이러한 일탈적인 활성은, 침입 박테리오파지에서 유래하는 전사체를 분해하여 세포 용해를 방지하는 것에 기인한다(문헌[Jiang et al., 2016. Cell 164: 710-721]; 문헌[Goldberg et al., 2014. Nature 514: 633-637]). 유형 III 시스템은 클래스 I에 속하며, 이는 RNP가 다수의 서브유닛으로 구성됨을 의미한다.
세 가지 상이한 유형의 뉴클레아제 활성으로, 유형 III 시스템은 고유한 것으로 간주될 수 있다. 더욱이, 메신저 분자인 사이클릭 올리고아데닐레이트(cOA: cyclic oligoadenylate)의 생산은 임의의 다른 CRISPR/Cas 시스템에 기인한 것이 아니었다. 이들 특성의 활용은 표적 인식을 시각화하는 새로운 방식을 유도할 수 있을 것이며, 따라서 유형 III 시스템은 신규한 진단 도구에서의 적용에 적합하다.
2. 발명의 내용
본 발명은, a) 유형 III CRISPR-연관 이펙터 단백질(Cas) 및 표적 핵산 분자에 결합하는 적어도 하나의 CRISPR RNA(crRNA)를 포함하는 이펙터 복합체; 및 b) 사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하기 위한 수단을 포함하는, 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 기반 리보핵산 검출 시스템을 제공한다. 상기 검출 시스템은 바람직하게는 유형 III Cas이고, 유형 IIIB Cas, 바람직하게는 유형 IIIB Cmr이다. 상기 유형 III Cas는 바람직하게는, 테르무스 테르모필루스( Thermus thermophilus )와 같은 호열성 유기체 (thermophylic organism)로부터 유래한다.
유형 III Cas는 바람직하게는, 예를 들어 Cmr4 서브유닛의 D26N 돌연변이, 또는 다른 서브유닛에서의 동등한 돌연변이에 의해, 절단 활성을 결여한다. 더 바람직한 절단-사멸 돌연변이(cleavage-dead mutation)는 Cmr4 D26A, Cmr4의 E227A 및 E228 이중 돌연변이체, 및 Cmr4 D86A를 포함한다(문헌[Ramia et al., 2014. Cell Reports 9: 1610-1617]; 문헌[Zhu and Ye, 2015. Nucleic Acids Res 43: 1257-1267]). 또한, Csm3 D32A는 절단-사멸 유형 IIIA Csm 돌연변이체에 대한 양호한 후보이다(문헌[Samai et al., 2015. Cell 161: 1164-1174]).
본 발명에 따른 바람직한 검출 시스템에서, cOA의 수준을 직접 또는 간접적으로 측정하기 위한 수단은 피로인산염(PPi: pyrophosphate)의 수준을 측정하기 위한 수단을 포함한다. 본 발명에 따른 바람직한 검출 시스템은 무기 피로포스파타제를 추가로 포함할 수 있다. 상기 무기 피로포스파타제는 바람직하게는, 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래하며, 이는 이를 상기 바람직한 유형 III CRISPR/Cas 시스템과 양립 가능하게 만들고 등온 검출을 허용한다.
본 발명에 따른 바람직한 검출 시스템은 Csx1과 같은 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제를 추가로 포함한다.
본 발명에 따른 바람직한 검출 시스템은 Csx1과 같은 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제, 및 상기 엔도리보뉴클레아제에 대한 검출 가능한 기질을 추가로 포함한다.
본 발명은 샘플 내의 표적 핵산 분자의 존재 또는 부재를 측정하는 방법을 추가로 제공하며, 상기 방법은 상기 샘플에 본 발명에 따른 리보핵산 검출 시스템을 제공하는 단계, crRNA와 이의 표적 핵산 분자의 결합을 허용하는 조건 하에 상기 샘플을 배양하는 단계, 및 사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하는 단계로서, 대조군과 비교하여, 측정된 cOA 수준의 증가가 상기 샘플 내의 상기 표적 분자의 존재를 나타내는 것인, 단계를 포함한다.
cOA의 수준은 피로인산염의 수준, 또는 무기 피로포스파타제가 상기 검출 시스템 내에 존재하는 경우 무기 인산염의 수준을 측정함으로써 측정될 수 있다. 피로인산염 또는 무기 인산염의 수준은 바람직하게는, 비색(colorimetric)-, 형광분석(fluorometric)-, 형광(fluorescent)- 또는 생물발광(bioluminescent)-기반 분석에 의해 측정된다.
cOA의 수준은, 상기 이펙터 엔도리보뉴클레아제에 대한 검출 가능한 기질을 검출함으로써 Csx1과 같은 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 수준을 측정함으로써 간접적으로 측정될 수 있다.
본 발명에 따른 바람직한 방법은, 상기 샘플을 37℃ 내지 85℃, 바람직하게는 약 65℃의 온도에서 상기 리보핵산 검출 시스템과 함께 배양하는 단계를 포함한다.
본 발명은 또한 본 발명에 따른 리보핵산 검출 시스템을 포함하는 장치를 추가로 제공한다. 상기 장치는 바람직하게는 본 발명에 따른 다중 배열(multiple arrayed) 리보핵산 검출 시스템을 포함한다. 상기 다중 배열 리보핵산 검출 시스템은 바람직하게는, 상이한 표적 핵산 분자들을 갖는다.
본 발명은, a) 유형 III CRISPR-연관 이펙터 단백질(Cas) 및 표적 핵산 분자에 결합하는 적어도 하나의 CRISPR RNA(crRNA)를 포함하는 이펙터 복합체; 및 b) 사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하기 위한 수단을 포함하는, 부품들의 키트를 추가로 제공한다.
3. 도면의 간단한 설명
도 1. IDT 코돈 최적화 도구(IDT Codon Optimization Tool) (eu.idtdna.com/codonopt에서 입수 가능함)을 사용하여 코돈 최적화된 Cmr Cas 단백질.
도 2. Cmr 및 Csm 서열의 정렬.
도 3. 내인성 TtCmr 복합체 및 재구성된 TtCmr 복합체를 사용한 시험관내 RNase 활성 분석. (A) 내인성 TtCmr 복합체와 함께 배양된 crRNA에 상보적인 5'-인-32 표지된 표적 RNA를 사용한 활성 분석의 변성 폴리아크릴아미드 겔 전기영동(PAGE: polyacrylamide gel electrophoresis) 분석. 단일 가닥 RNA 마커("M")가 좌측에 표시된 바와 같은 크기 표준으로 사용되었다. (B) 패널 A와 유사하지만, 재구성된 복합체를 사용한 활성 분석.
도 4. (A) TtCmr의 RNAse 활성은 crRNA의 첫 번째 가이드 뉴클레오타이드에서 미스매치를 갖는 표적의 영향을 받지 않는다. (B) cOA 생산은 뉴클레오타이드 위치 1, 2 및 5의 미스매치에 의해 상당히 영향을 받는다.
도 5. 표시된 뉴클레오타이드 위치에서 미스매치를 갖는 표적 RNA(표 4)와 함께 배양된, A) TtCmr40 및 B) TtCmr46을 사용한 cOA 생산 분석.
도 6. crRNA의 3' 말단에 위치한 유연한 시드(seed) 영역. 표시된 세그먼트에서 미스매치를 갖는 표적 RNA(표 4)와 함께 배양된, (A) 내인성 TtCmr("TtCmr) 또는 (B) 46개 뉴클레오타이드(nt) crRNA("TtCmr-46") 또는 (C) 40 nt crRNA("TtCmr-40")를 갖는 재구성된 TtCmr 복합체를 사용한 표적 RNA 분해 및 cOA 생산 분석.
도 7. 표적 RNA와 TtCmr-결합된 crRNA의 염기쌍 형성은 crRNA의 3' 말단에서 개시된다. (A) 각각 TtCmr-결합된 crRNA와 5 nt 미스매치하는 스트레치를 함유하는 상이한 표적 RNA들(표 4)과 함께 배양된 내인성 TtCmr 복합체의 전기영동 이동성 변화 분석(EMSA: electrophoretic mobility shift assay) 분석. (B) TtCmr-결합된 crRNA의 표시된 뉴클레오타이드에 상보적인 짧은 11 nt 표적 RNA들(표 4)과 함께 배양된 내인성 TtCmr 복합체의 EMSA 분석.
도 8. A) Pi 검출의 비색 출력의 흡광도는, 표시된 바와 같은 Cmr에 의한 다양한 첨가된 표적 RNA 농도에 대해 측정되었다. 반응 시간은 1시간, 발색 시간은 30분으로 설정되었다(말라카이트 그린 분석(Malachite Green Assay)을 사용한 직접적인 cOA 검출). B) 시간에 따른 Pi 수준의 배수 증가의 측정에 의한 표적 RNA의 검출의 비색 출력의 흡광도(말라카이트 그린 분석을 사용한 직접적인 cOA 검출). C) ssRNA 및 ssDNA 소광제-형광단 서열을 사용한 Csx1의 cOA 매개 RNAse 활성 검출(간접적인 cOA 검출).
도 9. 천연 표적 RNA 4.5에 대한 T. 테르모필루스 유형 IIIB Cmr 시스템의 민감도 범위. 간접적인 cOA 시각화 방법을 사용하여 표적 인식을 모니터링하였다. 유사한 길이의 무작위 RNA를 음성 비표적 대조군(negative off-target control)으로 사용하였다.
도 10. 천연 표적 RNA 4.5에 대한 Cmr4 돌연변이체 D26N을 함유하는 T. 테르모필루스 유형 IIIB Cmr 시스템의 민감도 범위. 간접적인 cOA 시각화 방법을 사용하여 표적 인식을 모니터링하였다. 유사한 길이의 무작위 RNA를 음성 비표적 대조군(negative off-target control)으로 사용하였다.
도 11. 야생형 Cmr 복합체 및 dCmr 복합체에 대한 노로바이러스 표적 RNA 검출 한계의 비교. 간접적인 cOA 시각화 방법을 사용하여 표적 인식을 모니터링하였다. 이 분석의 미가공 신호 출력을 제시하였다. 유사한 길이의 무작위 RNA를 음성 비표적 대조군(negative off-target control)으로 사용하였다.
도 12. 상보적 표적 RNA의 첨가 후 유형-IIIA CRISPR/Cas 복합체에 의한 cOA 생산.
도 13. 원-포트(one-pot) SARS-CoV-19 N-유전자 검출 분석 결과. 그래프는 65℃에서의 "신호 생성 배양"의 데이터를 나타낸다.
도 14. 밍크 샘플에 대한 원-포트 SARS-CoV-19 N-유전자 검출 분석 결과. 그래프는 65℃에서의 "신호 생성 배양"의 데이터를 나타낸다.
4. 발명을 실시하기 위한 구체적인 내용
4.1 정의
본원에서, 용어 "클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR)"는 원핵 미생물의 게놈 내의 DNA의 하나 이상의 특수화된 영역을 의미한다. 이들 영역은 침입 요소와의 이전의 만남으로부터 유래한, 유사한 길이의 고유한 스페이서 서열에 의해 분리된(문헌[Grissa et al., 2007]), 전형적으로 ~25 내지 ~38 bp 직접적인 DNA 반복부인, 스페이서 서열이 산재된 뉴클레오타이드 반복부의 존재를 특징으로 한다. 이들은 다음 감염 시 이들 침입자를 빠르게 공격하기 위한 기억 장치로서 기능한다. 게놈 영역은 CRISPR 유전자좌 부근에 위치한 하나 이상의 CRISPR-연관 이펙터 단백질(Cas)-암호화 유전자를 포함한다.
본원에서, 용어 "CRISPR crRNA"는 스페이서 서열 및 5 및 3 반복부-유래된 말단을 포함하는 CRISPR-유래된 RNA 분자를 의미한다. 바람직하게는, 상기 CRISPR crRNA는 적어도 30개의 뉴클레오타이드, 보다 바람직하게는 적어도 34개의 뉴클레오타이드, 보다 바람직하게는 적어도 40개의 뉴클레오타이드, 보다 바람직하게는 적어도 46개의 뉴클레오타이드 길이를 갖는다. 바람직하게는, 상기 CRISPR crRNA는 1000개 미만의 뉴클레오타이드, 바람직하게는 200개 미만의 뉴클레오타이드, 바람직하게는 100개 미만의 뉴클레오타이드이다. 상기 RNA 분자는 리보핵산 뉴클레오타이드 유사체, 예를 들어 이노신, 우리딘, 크산틴, 히포크산틴, 2,6-디아미노푸린, 및 6,8-디아미노푸린계 리보뉴클레오타이드 및 데속시리보뉴클레오타이드를 포함할 수 있다.
본원에서, 용어 "CRISPR-연관 이펙터 단백질(Cas)"은 CRISPR crRNA와 연관된 단백질을 의미한다. CRISPR/Cas 시스템은 현재 2개의 클래스로 분류된다. 클래스 I 시스템은 다수 서브유닛 Cas 복합체를 사용하는 반면, 클래스 II 시스템은 활성을 매개하기 위해 단일 Cas 단백질만을 사용한다. 클래스 I, 유형 III CRISPR-Cas 시스템은 특히 RNA 서열을 표적화하도록 발달하였다. 이들 시스템의 고유한 단백질은 클래스 I 시스템의 Cas3, 클래스 II 시스템의 Cas9, 및 클래스 I, 유형 III 시스템의 Cas10이다.
본원에서, 용어 "이펙터 복합체"는, 뉴클레아제 활성을 갖고 CRISPR crRNA의 스페이서 서열에 대한 상보적 서열을 포함하는 침입 핵산 서열을 절단 및 불활성화할 수 있는 CRISPR-Cas 리보핵산 단백질 복합체를 의미한다.
본원에서, 용어 "사이클릭 올리고아데닐레이트(cOA)"는 3 내지 6개의 아데노신 일인산(AMP: adenosine mono phosphate) 분자를 포함하는 고리 구조를 의미한다. cOA의 형성은 유형 III 이펙터 시스템의 일부인 Cas10의 사이클라제 도메인에 의해 촉매된다.
본원에서, 용어 "유형 III Cas"는 적어도 Cas10 단백질을 포함하는, RNA-표적화, 다수 서브유닛 CRISPR-연관 복합체를 의미한다.
본원에서, 용어 "유형 IIIA Cas"는 표적 RNA 분자에 결합 시 비특이적 DNase 활성을 갖는 RNA-표적화 유형 3 CRISPR/Cas 복합체를 의미한다. 유형 IIIA Cas는 예를 들어, 스타필로코커스 테르모필루스(Staphylococcus thermophilus ), 테르무스 테르모필루스(Thermus thermophilus ) 및 스타필로코커스 에피더미스(Staphylococcus epidermis)로부터의 유형 IIIA Csm 복합체를 포함한다.
본원에서, 용어 "유형 IIIB Cas"는 비특이적 DNase 활성을 결여한 RNA-표적화 유형 3 CRISPR-Cas 복합체를 의미한다. 상기 유형 IIIB Cas 복합체는 6 내지 7개의 단백질로 구성된다. 유형 IIIB Cas는 예를 들어, 파이로코커스 퓨리어서스(Pyrococcus furiosus), 테르무스 테르모필루스 및 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus)로부터의 유형 IIIB Cmr 복합체를 포함한다.
본원에서, 용어 "PPi" 또는 포스포나토 포스페이트는 피로인산의 염 또는 에스테르를 의미한다. 대안적인 명칭은 피로인산염, 이인산염 및 디폴리포스페이트이다.
본원에서, 용어 "무기 피로포스파타제" 또는 무기 디포스파타제는, 피로인산염의 하나의 이온의 2개의 인산염 이온으로의 전환을 촉매하는 효소를 의미한다. 상기 효소는 효소 클래스 EC 3.6.1.1을 갖는다.
본원에서 용어 "cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제"는 HEPN(고등 진핵생물 및 원핵생물 뉴클레오타이드 결합(Higher Eukaryotes and Prokaryotes, Nucleotide binding)) 활성 부위를 사용하여 RNA를 비특이적으로 분해하는 리보뉴클레아제를 의미한다. 이들 뉴클레아제는 CRISPR-연관 로스만 접힘(CARF: CRISPR-associated Rossmann fold) 도메인을 사용하여 cOA 메신저의 결합에 의해 활성화된다. 이러한 비특이적 이펙터 엔도리보뉴클레아제의 예는 Cas 부속 단백질 Csx1 및 Csm6이다.
본원에서, 용어 "바이오센서" 또는 "생물학적 센서"는 본 발명에 따른 CRISPR 기반 리보핵산 시스템을 포함하는 감지 장치를 의미한다. 상기 CRISPR 기반 리보핵산 시스템이 crRNA에 상보적인 RNA 분자와 상호작용할 때 생성되는 신호, 예를 들어 비색, 형광분석, 형광 또는 생물발광 신호는 상기 신호의 정량화를 허용하는 변환기에 결합될 수 있다. 상기 신호는 바람직하게는, 적절한 변환기에 의해 전류 또는 전압과 같은 측정 가능한 전기 매개변수로 변환된다.
4.2 CRISPR/Cas 기반 리보핵산 검출 시스템
일 양태에서, 본 발명은 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 기반 리보핵산(RNA: ribonucleic acid) 검출 시스템을 제공한다. 상기 시스템은, 유형 III CRISPR-연관 이펙터 단백질(Cas) 및 표적 핵산 분자에 결합하는 적어도 하나의 CRISPR RNA(crRNA)를 포함하는 이펙터 복합체, 및 사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하기 위한 방법 및 수단을 포함한다.
상기 CRISPR/Cas 기반 리보핵산 검출 시스템은 바람직하게는, 파이로코커스 퓨리어서스, 술폴로부스 솔파타리쿠스 또는 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래된다. 호열성 유기체로부터의 CRISPR/Cas 기반 리보핵산 검출 시스템의 이점은, 검출이 상승된 온도, 예를 들어 40℃ 내지 80℃, 바람직하게는 50℃ 내지 70℃, 예를 들어 55℃ 내지 65℃ 바람직하게는 약 65℃에서 수행될 수 있다는 것이다. 이 온도에서의 배양은 더 낮은 온도에서의 배양에 비해 cOA 합성 반응을 가속화할 수 있다. 또한, 상기 상승된 온도는 샘플 내에 존재하는 DNase 또는 RNase 또는 프로테아제와 같은 뉴클레아제를 불활성화할 수 있다.
또한, 호열성 유기체로부터의 CRISPR/Cas 기반 리보핵산 검출 시스템의 이점은, 중온성 유기체로부터의 CRISPR/Cas 기반 리보핵산 검출 시스템에 비해, 더 오랜 기간 동안 저장될 수 있는 것과 같은, 증가된 안정성을 상기 시스템에 제공할 수 있다는 것이다.
상기 리보핵산 검출 시스템은, 진핵생물 RNA 간섭(RNAi) 시스템과 유사한, 침입 바이러스 및 플라스미드로부터 원핵 세포를 보호하기 위한 획득 면역 시스템을 구성하는 원핵 CRISPR/Cas 시스템을 기반으로 한다(문헌[Makarova et al., 2006. Biol Direct 1: 1-7]). CRISPR-Cas 면역 반응은 하기의 3개의 별개의 단계로 구성된다: 1) 침입자의 표적 DNA의 일부가 절단되어 CRISPR 어레이에 삽입되는, 적응; 2) CRISPR(cr) RNA의 발현 및 성숙 및 CRISPR/Cas 복합체의 연관; 및 3) crRNA가 바이러스 또는 플라스미드의 침입 게놈 내의 성숙된 CRISPR 서열에 상보적인 서열을 인식하기 위한 가이드로 사용되고, 이어서 Cas 뉴클레아제에 의한 외래 핵산의 절단 및 불활성화가 수행되는, 간섭.
유형 III CRISPR/Cas 복합체의 일반적인 구조는, 이들이, Cas5 및 Cas10에 의해 한쪽이 막혀 있는, Cas7 및 Cas11의 다수의 서브유닛을 포함한다는 것이다(문헌[Staals et al., 2013. Mol. Cell 52: 135-145]; 문헌[Staals et al., 2014. Mol. Cell 56: 518-530]). 이들 중, Cas7은, 사전 탑재된 RNA 가이드에 의해 표적 RNA가 인식되면 RNase 활성을 제공한다.
표적 인식은 Cas10 손바닥(palm) 도메인에 의한 사이클릭 올리고아데닐레이트(cOA)의 생산을 촉진한다는 것이 입증되었다(문헌[Kazlauskiene et al., 2017. Science 357: 605-609]; 문헌[Niewoehner et al., 2017. Nature 548: 543-548]). cOA 종은 진핵생물 내의 공지된 신호전달 분자이지만, 원핵생물 숙주에서는 이러한 활성이 이전에 보고되지 않았다. 그러나, 연구는, cOA의 존재가 Csm6 또는 Csx1 패밀리 구성원에 의한 RNase 활성의 큰 증가를 유도함을 나타낸다. 이들 단백질은 종종 유형 III 유전자좌에서 암호화되지만, 리보핵산 단백질 복합체와 직접적으로 연관되지는 않는다. 대신, 침입자 RNA 전사체의 인식은 Cas7에 의한 표적화된 RNA 분해, 클래스 I, 유형 IIIA Cas10에 의한 비특이적 DNA 분해뿐만 아니라 Csm6 또는 Csx1의 활성화를 유도하는 cOA 생산을 유도할 수 있으며, 이에 따라 근처의 다른 단일 가닥 RNA 분자의 2차적인 절단을 유발할 수 있다.
cOA의 수준을 직접적으로 측정하는 방법은 바람직하게는, 피로인산염 또는 PPi의 수준을 측정하는 방법을 포함한다. 피로인산염의 형성은 Cas10과 같은 CRISPR/Cas 연관 단백질에 의한 ATP로부터의 cOA 형성과 연결된다. 3 내지 6개의 AMP 단위로 구성된 cOA의 형성은 3 내지 6개의 PPi 분자를 동시에 형성한다.
대안으로서, 본 발명에 따른 검출 시스템은 무기 피로포스파타제를 포함할 수 있으며, 이는 PPi의 분해 및 각각의 PPi 분자에 대한 2개의 무기 인산염 분자의 형성을 유도한다. 따라서, 무기 인산염의 수준을 측정함으로써, 검출 가능한 분자의 수는 1개의 cOA 분자에서 6 내지 12개의 Pi 분자로 증폭된다.
바람직한 무기 피로포스파타제는 상기 유형 III CRISPR/Cas 기반 RNA 검출 시스템과 동일하거나 유사한 온도에서 활성인 효소이다. 또한, 상기 무기 피로포스파타제는, 동일하거나 유사한 pH 및 동일하거나 유사한 염 농도를 비롯한, 상기 유형 III CRISPR/Cas 기반 RNA 검출 시스템과 동일하거나 유사한 조건 하에서 활성인 것이 바람직하다. 예를 들어, 상기 유형 III CRISPR/Cas 기반 RNA 검출 시스템이 50℃에서 최적의 활성을 갖는다면, 상기 무기 피로포스파타제는 이 온도에서 활성인 것이 바람직하다. 바람직하게는, 50℃에서의 상기 무기 피로포스파타제의 활성은, 본질적으로 모든 PPi 분자가 무기 인산염 분자로 분해되는 정도이다. 상기 분해는 바람직하게는 즉각적이다. 유사하게, 선택된 pH 및 염 농도에서의 상기 무기 피로포스파타제의 활성은, 본질적으로 모든 PPi 분자가 무기 인산염 분자로 분해되는 정도이다. 상기 분해는 바람직하게는 즉각적이다.
바람직한 무기 피로포스파타제는 파이로코커스 퓨리어서스, 술폴로부스 솔파타리쿠스 및 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래하여, 동시적인 등온 검출을 허용한다. 이러한 방식으로, Pi의 수준을 측정함으로써 cOA의 수준을 직접적으로 측정할 수 있다.
PPi 및 Pi는 비색-, 형광분석-, 형광- 또는 생물발광-기반 분석을 포함한 당업계에 공지된 방법을 사용하여 검출될 수 있다.
PPi의 수준을 측정하는 적절한 방법은 형광분석 및/또는 비색 피로인산염(PPi) 분석 키트(fluorometric and/or colorimetric pyrophosphate(PPi) Assay Kit) (Biovision Inc., 캘리포니아주 밀피타스 소재); 형광 EnzChek® 피로인산염 검출 키트(fluorescent EnzChek® Pyrophosphate Detection Kit) (ThermoFisher Scientific; 매사추세츠주 월섬 소재); 형광분석 피로인산염 분석 키트(fluorometric Pyrophosphate Assay Kit) (SigmaAldrich, 미주리주 세인트루이스 소재); 및 발광 PPiLight™ 분석(luminescent PPiLight™ assay) (Lonza Group A.G., 스위스 바젤 소재)을 포함한다.
무기 인산염 또는 Pi의 수준을 측정하는 적절한 방법은 비색 PiColorLock™ 분석(colorimetric PiColorLock™ assay) (Expedeon, 영국 캠브리지 소재); 비색 말라카이트 그린 인산염 분석 키트(colorimetric Malachite Green Phosphate Assay Kit) (SigmaAldrich, 미주리주 세인트루이스 소재); 형광 인산염 센서(fluorescent Phosphate Sensor) (ThermoFisher Scientific; 매사추세츠주 월섬 소재); ADP를 ATP로 전환한 후의 발광 판독(미국 특허출원 US20140273036A호); 형광 화학센서(문헌[Meng et al., 2015. RSC Advances 5: 53189-53197]); 및 유로퓸 이온과 조합된 광발광 그래핀 양자점(문헌[Bai et al., 2013. Chemistry 19: 3822-3826])을 포함한다.
사이클릭 올리고아데닐레이트(cOA)의 수준을 직접적으로 측정하기 위한 방법 및 수단은 바람직하게는 적어도 하나의 기질, 및 필요한 경우, PPi 또는 Pi에 대한 표시된 검출 방법 중 적어도 하나를 허용하는 효소를 포함한다.
바람직한 방법은 말라카이트 그린 인산염 분석 키트와 같은 비색 방법이며, 이는 cOA 수준의 직접적인 측정으로서 PPi 또는 Pi 수준의 빠른 측정을 허용한다.
cOA의 수준을 간접적으로 측정하는 방법은 바람직하게는, CRISPR 보조 뉴클레아제 1(Can1: CRISPR ancillary nuclease 1) 또는 Can2와 같은 cOA-의존성 비특이적 이펙터 뉴클레아제의 활성을 측정하는 방법, 및 바람직하게는, Csx1과 같은 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 활성을 측정하는 방법을 포함한다. 이를 위해, 본 발명에 따른 검출 시스템은 바람직하게는, Csx1과 같은 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제를 포함한다.
상기 cOA-의존성 비특이적 이펙터 뉴클레아제, 바람직하게는 엔도리보뉴클레아제는 바람직하게는, 유형 III CRISPR/Cas 기반 RNA 검출 시스템과 동일하거나 유사한 온도에서 활성인 효소이다. 또한, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제는, 동일하거나 유사한 pH 및 동일하거나 유사한 염 농도를 비롯한, 유형 III CRISPR/Cas 기반 RNA 검출 시스템과 동일하거나 유사한 조건 하에서 활성인 것이 바람직하다. 예를 들어, 유형 III CRISPR/Cas 기반 RNA 검출 시스템이 65℃에서 최적의 활성을 갖는다면, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제는 이 온도에서 활성인 것이 바람직하다. 바람직하게는, 65℃에서의 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 활성은, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 cOA-유도된 활성이 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 기질의 반응 생성물의 검출 가능한 양의 생산을 초래하는 정도이다. 유사하게, 선택된 pH 및 염 농도에서의 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 활성은, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 cOA-유도된 활성이 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 기질의 반응 생성물의 검출 가능한 양의 생산을 초래하는 정도이다.
cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제에 대한 기질은 바람직하게는, 절단이 검출될 수 있는 RNA 분자이다. 검출은 당업계에 공지된 임의의 방법에 의해 수행될 수 있다. 예를 들어, 검출은 질량 분석법, 예를 들어 양성 전자분무 이온화 모드에서 직렬 질량 분석법(LC-MS/MS)과 결합된 초고성능 액체 크로마토그래피(UHPLC: ultra-high performance liquid chromatography)에 의해 직접적으로 수행될 수 있다. 상기 LC-MS/MS 분석은 예를 들어, 삼중-사중극자 질량 분석기에 결합된 고급 UHPLC 크로마토그래피 시스템을 사용하여 수행될 수 있다.
검출은 액체-액체 상 분리(LLPS: liquid-liquid phase separation; 문헌[Spoelstra et al., 2018. BioRXiv, CSHL(doi.org/10.1101/471482)])에 의해 추가로 수행될 수 있다.
cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제에 대한 바람직한 기질은, 일 말단에 형광 리포터 분자가 태그되고 다른 말단에 소광제가 태그된 RNA 분자이다. 상기 소광제에 대한 상기 리포터의 근접은 이의 형광의 검출을 방지한다. 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 활성화에 의한 기질의 절단은, 상기 리포터-소광제 근접을 깨뜨리며, 따라서 레이저를 사용한 여기 후에 검출될 수 있는, 형광의 억제되지 않은 방출을 허용한다. 따라서, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 활성의 증가는, 상기 기질의 절단 및 상기 형광 리포터를 소광하는 소광제의 제거로 인해 형광의 비례적 증가를 유발한다.
상기 비특이적 이펙터 엔도리보뉴클레아제의 활성화와 별도로, 또는 이에 추가하여, 표적 인식 수준의 측정은, 상기 뉴클레아제에 대한 적절한 기질을 사용하여, 유형 IIIA CRISPR/Cas 이펙터 복합체 내에 존재하는 비특이적 이펙터 DNase 활성의 활성화를 측정함으로써 수행될 수도 있다. 상기 적절한 기질은 바람직하게는, 일 말단에 형광 리포터 분자가 태그되고 다른 말단에 소광제가 태그된 DNA 분자이다. 상기 소광제에 대한 상기 리포터의 근접은 이의 형광의 검출을 방지한다. 상기 cOA-의존성 비특이적 이펙터 DNase의 활성화에 의한 기질의 절단은, 상기 리포터-소광제 근접을 깨뜨리며, 따라서 레이저를 사용한 여기 후에 검출될 수 있는 형광의 억제되지 않은 방출을 허용한다. 따라서, 상기 cOA-의존성 비특이적 이펙터 DNase의 활성의 증가는, 상기 기질의 절단 및 상기 형광 리포터를 소광하는 소광제의 제거로 인해 형광의 비례적 증가를 유발한다. 상기 비특이적 이펙터 엔도리보뉴클레아제의 활성화와 상기 비특이적 이펙터 DNase의 활성화 둘 모두의 사용은, 2개의 독립적인 리보핵산 단백질 복합체가 사용되고, 그 중 하나가 상기 비특이적 이펙터 DNase를 특이적으로 활성화하는 반면 다른 하나는 cOA 수준의 간접적인 또는 직접적인 측정을 특이적으로 허용하는 경우, 단일 분석에서의 2개의 독립적인 표적 RNA 분자의 존재 또는 부재의 측정을 허용한다. 당업자는, 이를 위해, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제 및 상기 비특이적 이펙터 DNase의 활성화에 의해 기질 상에 존재하는 형광 표지들이, cOA의 수준을 측정하기 위한 척도로서의 각각의 활성의 수준의 측정을 허용할 만큼 충분히 상이해야 한다는 것을 이해할 것이다.
바람직한 형광 표지는 Atto425(ATTO-TEC GmbH, 독일 지겐 소재), Atto 647N(ATTO-TEC GmbH, 독일 지겐 소재), YakimaYellow(Epoch Biosciences Inc, 미국 워싱턴주 보셀 소재), Cal610(BioSearch Technologies, 미국 캘리포니아주 페탈루마 소재), Cal635(BioSearch Technologies, 미국 캘리포니아주 페탈루마 소재), FAM(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), TET(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), HEX((Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), Cy5, Cy5.5, Cy3, Cy3.5, Cy7와 같은 시아닌 염료(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), 알렉사 염료(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), Tamra(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), ROX(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), JOE(Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), 플루오레세인 이소티오시아네이트(FITC, Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재), Yakima Yellow®(YY; Epoch Biosciences, 워싱턴주 보셀 소재) 및 테트라메틸로다민(TRITC, Thermo Fisher Scientific Inc., 미국 매사추세츠주 월섬 소재)로부터 선택될 수 있다. 바람직하게는, 상기 기질은 검출 가능한 표지, 바람직하게는 형광 표지를 사용하여 5' 말단에 표지된다.
소광제, 예를 들어 테트라메틸로다민 TAMRA, 디하이드로사이클로피롤로인돌 트리펩타이드 마이너 그루브 바인더(minor groove binder)는 당업계에 공지되어 있다. 바람직한 소광제는 Black Hole Quencher®-1(BHQ1) 및 BHQ2(Biosearch Technologies, 미국 캘리포니아주 페날루마 소재)를 포함한다. BHQ1 dark 소광제는 480 nm 내지 580 nm에서 강한 흡수를 가지며, 이는 FAM, TET, CAL Fluor® Gold 540, JOE, HEX, CAL Fluor Orange 560, 및 Quasar® 570 염료와 같은, 이 범위에서 형광을 발하는 형광단의 소광을 제공한다. BHQ2 dark 소광제는 599 nm 내지 670 nm에서 강한 흡수를 가지며, 이는 Quasar® 570, TAMRA, CAL Fluor® Red 590, CAL Fluor Red 610, ROX, CAL Fluor Red 635, Pulsar® 650, Quasar 670 및 Quasar 705 염료와 같은, 이 범위에서 형광을 발하는 형광단의 소광을 제공한다. BHQ1 및 BHQ2는 FRET 및 정적 소광 메커니즘 둘 모두에 의해 형광을 소광할 수 있다.
적합한 상업적인 기질은 RNaseAlert® 실험실 시험 키트 v2(RNaseAlert® Lab Test Kit v2) (ThermoFisher Scientific; 매사추세츠주 월섬 소재)에 의해 제공된다.
바람직한 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제는 파이로코커스 퓨리어서스, 술폴로부스 솔파타리쿠스 및 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래하여, 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 활성의 동시적인 등온 검출을 허용한다.
사이클릭 올리고아데닐레이트(cOA)의 수준을 간접적으로 측정하기 위한 방법 및 수단은 바람직하게는, cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제 및 상기 cOA-의존성 비특이적 이펙터 엔도리보뉴클레아제의 기질을 포함한다.
4.3 단백질의 생산
본 발명에 따른 리보핵산 검출 시스템은 리보핵산 단백질 복합체, 바람직하게는 유형 IIIB 복합체의 시험관내 조립에 기반한다. 필요한 Cas 단백질은 바람직하게는, 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래한다. 상기 단백질은 바람직하게는 적합한 발현 시스템으로부터 발현 및 정제된다.
이종 단백질 생산을 위해 일반적으로 사용되는 발현 시스템은 대장균(E. coli), 바실러스 종(Bacillus spp.), 배큘로바이러스(baculovirus), 효모, 진균, 가장 바람직하게는 사상성 진균 또는 효모, 예를 들어 사카로마이세스 세레비지애( Saccharomyces cerevisiae ) 및 피히아 파스토리스(Pichia pastoris ), 진핵 세포, 예를 들어 중국 햄스터 난소 세포(CHO: Chinese hamster ovary cell), 인간 배아 신장(HEK: human embryonic kidney) 세포 및 PER.C6® 세포(Thermo Fisher Scientific, 미국 매사추세츠주 소재) 및 식물을 포함한다. 이종 시스템에서의 재조합 단백질의 발현 효율은 다양한 요인, 전사 수준과 번역 수준 둘 모두에 따라 결정된다.
바람직하게는, Cas 단백질은 원핵 세포, 바람직하게는 대장균을 사용하여 생산된다. 상기 Cas 단백질은 바람직하게는, 관심 원핵 세포, 바람직하게는 대장균으로의 상기 단백질의 발현 클로닝에 의해 생산된다. 상기 발현 구조체, 바람직하게는 DNA는 바람직하게는, 당업자에게 공지된 바와 같이, 중합 효소, 제한 효소 및 리가제의 사용을 포함한 재조합 기술에 의해 생산된다. 대안적으로, 상기 발현 구조체는, 당업자에게 공지된 바와 같이, 인공 유전자 합성에 의해, 예를 들어 부분적으로 또는 완전히 중첩하는 올리고뉴클레오타이드의 합성에 의해, 또는 유기 화학 및 재조합 기술의 조합에 의해 제공된다.
대안으로서 또는 추가로, Cas 단백질은 상기 호열성 유기체에서의 태그된 Cas 단백질의 발현, 및 상기 태그에 기반한 상기 Cas 단백질을 포함하는 리보핵산 단백질 복합체의 단리에 의해 호열성 유기체로부터 단리될 수 있다. 상기 단리된 리보핵산 단백질 복합체는 상기 태그된 Cas 단백질을 사용하여 단리될 수 있다.
바람직하게는, 상기 발현 구조체는 관심 원핵 세포, 바람직하게는 대장균에서의 Cas 단백질의 발현을 향상시키기 위해 코돈 최적화된다. 추가 최적화는 바람직하게는, 잠재 스플라이스 부위의 제거, 잠재 폴리A 꼬리의 제거 및/또는 mRNA의 불리한 접힘을 초래하는 서열의 제거를 포함한다. 또한, 상기 발현 구조체는 바람직하게는, 상기 Cas 단백질을 세포로부터 원핵생물의 주변 세포질로 분비시키기 위한 단백질 수출 신호를 암호화하여, 상기 Cas 단백질의 효율적인 정제를 허용한다.
Cas 단백질을 정제하는 방법은 당업계에 공지되어 있으며, 일반적으로, 친화성 크로마토그래피 및 이온 교환 크로마토그래피와 같은 크로마토그래피를 기반으로 하여 오염물을 제거한다. 오염물 외에도, 분해 산물 및 응집체와 같은 생성물 자체의 바람직하지 않은 파생물을 제거해야 할 수도 있다. 적절한 정제 공정 단계는 문헌[Berthold and Walter, 1994 (Berthold and Walter, 1994. Biologicals 22: 135- 150)]에 제공되어 있다.
대안으로서 또는 추가로, 재조합 Cas 단백질은, 상기 단백질이 태그에 특이적인 컬럼에 부착되도록 하여 불순물로부터 단리되도록, 유전 공학에 의해 하나 이상의 특이적인 태그로 태그될 수 있다. 그런 다음, 정제된 단백질은 분리 시약으로 친화성 컬럼으로부터 교환된다. 상기 방법은 재조합 단백질을 정제하기 위해 점점 더 많이 적용되고 있다. 히스티딘 태그와 같은 기존의 단백질 태그는 다른 불순물로부터 단백질을 단리하기 위해 태그를 특이적으로 포획하는 친화성 컬럼(예를 들어 히스티딘 태그용 Ni-IDA 컬럼)과 함께 사용된다. 그런 다음, 상기 단백질은 구체적인 태그에 따라 분리 시약을 사용하여(예를 들어 히스티딘 태그의 경우 이미다졸) 컬럼으로부터 교환된다. 이 방법은 전통적인 정제 방법에 비해 더 특이적이다.
적합한 추가 태그는, 문헌[Chatterjee, 2006 (Chatterjee, 2006. Cur Opin Biotech 17, 353-358)]에 제시된 바와 같이, c-myc 도메인(EQKLISEEDL), 혈구응집소 태그(YPYDVPDYA), 말토스-결합 단백질, 글루타티온-S-트랜스퍼라제, FLAG 태그 펩타이드, 비오틴 수용체 펩타이드, 스트렙타비딘-결합 펩타이드 및 칼모듈린-결합 펩타이드를 포함한다. 이들 태그를 사용하는 방법은 당업계에 공지되어 있으며, Cas 단백질을 정제하는 데 사용될 수 있다.
대장균에서 단백질을 발현시키는 방법은 당업계에 공지되어 있으며 상기 Cas-단백질의 발현 및 정제에 사용될 수 있다.
바람직한 방법에서, Cas 단백질은 코돈-최적화된 발현 구조체로부터 대장균에서 발현된다. 상기 구조체는 N-말단에 Strep-태그 및 아미노산 서열 Glu-Asn-Leu-Tyr-Phe-Gln-(Gly/Ser)를 함유하는 바이시스트로닉 발현 플라스미드(bicistronic expression plasmid)에 배치되며, 이 아미노산 서열은 담배 식각 바이러스(TEV: tobacco etch virus) 프로테아제에 의해 인식된다. 상기 발현 플라스미드는, 예를 들어 균주 Bl21(DE3)에서, 대장균으로 형질전환된다. 원하는 배양 부피에서 OD600이 약 0.6이 될 때까지 37℃에서 성장시킨 후, 배양물을 얼음 위에 1시간 동안 둔 다음, 이소프로필 β-D-1-티오갈락토피라노사이드를 최종 농도 0.1 mM로 첨가한다. 그런 다음, 배양물을 18℃에서 약 16시간 동안(밤새) 배양한다. 세포를 수확하고 초음파 처리에 의해 완충액 A(100 mM Tris-HCl, 150 mM NaCl)에 용해시킨 다음, 30.000 g에서 45분 동안 스핀 다운(spin down)시킨다. 정화된 용해물을 여과하고, 사전 평형화된 StrepTrap FPLC 컬럼(GE Healthcare, 일리노이주 시카고 소재)에서 실행한다. 통과액에 더 이상 단백질이 존재하지 않을 때까지 완충액 A로 컬럼을 세척한 후, 완충액 B(100 mM Tris-HCl, 150 mM NaCl 및 2.5 mM D-데스티오비오틴)를 사용하여 관심 단백질을 용출한다. TEV 프로테아제를 첨가하여 친화성 태그로부터 단백질을 절단하고 4℃에서 밤새 배양되도록 방치한다. HisTrap 및 StrepTrap 친화성 크로마토그래피 단계에 의해 혼합물로부터 관심 단백질을 분리하며, 통과액은 수집한다. 필요한 경우, 더 높은 순도를 달성하기 위해 추가적인 크기 배제 크로마토그래피가 추가된다.
바람직한 Cas 단백질은 Csm 또는 Cmr 단백질, 적어도 Cmr 1 및 Cmr 4, 바람직하게는 Cmr 1 내지 6, 또는 적어도 Csm 2 및 Cas10(Csm1), 바람직하게는 Csm 2 내지 5 및 Cas 10, 보다 바람직하게는 Csm 1 내지 6을 포함한다.
바람직한 단백질은 표 2에 언급된 아미노산 서열과 적어도 80%의 서열 동일성을 갖는 단백질, 바람직하게는 적어도 90%의 서열 동일성을 갖는 단백질을 포함하고, 바람직하게는 표 2에 언급된 아미노산 서열을 갖는 단백질이다. 그러나, 삽입 돌연변이체, 결실 돌연변이체, 키메라 단백질 및 아미노산 치환된 단백질을 포함한 상기 단백질의 돌연변이체도 본 발명에 따른 CRISPR 기반 리보핵산 시스템에 사용될 수 있다.
유형 III CRISPR/Cas 검출 방법의 민감도를 증가시키기 위해, 촉매적 사멸(catalytically dead) 돌연변이체 Cmr 및/또는 Csm 복합체가 바람직하게는 생성되고 본 발명의 검출 시스템에 사용된다. 용어 "촉매적 사멸"은 본 발명에 따른 CRISPR 기반 리보핵산 시스템의 표적 RNA-분해 활성을 의미한다. 이들 돌연변이체는 dCmr 및 dCsm로 지칭된다. 상기 돌연변이는, 표적 결합을 유지하면서, 표적 절단의 제거를 위해 선택되고 표적 결합 및 절단을 담당하는 Cmr4 및 Csm3 서브유닛에 도입된다. Cmr4 단백질의 다수의 돌연변이(H15A,D26A,E277A)가 설명되어 왔으며, 가장 강력한 촉매 손상은 Cmr4 D26A 및 D26N 돌연변이에서 관찰되었다(문헌[Benda et al., 2014. Molecular Cell 56: 43-54]; 문헌[Ramia et al., 2014. Cell Reports 9: 1610-1617]). 이 불활성화 돌연변이는 파이로코커스 퓨리어서스에서 작동하는 것으로 실험적으로 입증되었으며, Cmr4 오르소로그(ortholog)의 서열 정렬은 이 아미노산이 고도로 보존되어 있음을 보여준다(데이터 미도시). 또한, 결정학 데이터는 이 특정 아미노산이, 표적 RNA가 결합할 것으로 예상되는 복합체의 홈(groove)에 위치한다는 것을 보여준다(데이터 미도시). 이들 결과는 함께, D26 아미노산 잔기가 Cmr4의 촉매 활성에 중요함을 나타낸다. 이 잔기를 변경하면 테르무스 테르모필루스 dCmr4 돌연변이체가 생성된다. 다음으로, Pf_Cmr4 아미노산 서열과 Csm3의 오르소로그의 정렬은 또한, D26이 2개의 유형 III 시스템 간에 보존되는 몇 안 되는 아미노산 중 하나이며 따라서 dCsm3 돌연변이체를 생성하는 데에도 사용될 수 있음을 보여준다. 추가적인 절단-사멸 돌연변이는 Cmr4의 E227A 및 E228 이중 돌연변이체, 및 Cmr4 D86A를 포함한다(문헌[Ramia et al., 2014. Cell Reports 9: 1610-1617]; 문헌[Zhu and Ye, 2015. Nucleic Acids Res 43: 1257-1267]). 또한, Csm3 D32A는 절단-사멸 유형 IIIA Csm 돌연변이체에 대한 양호한 후보이다(문헌[Samai et al., 2015. Cell 161: 1164-1174]).
또한 Jia 등 및 Park 등은 D36A 치환에 의해 생성된 dCsm3 돌연변이체를 기술하고 있다(문헌[Jia et al., 2019. Mol Cell 73: 264-277]; 문헌[Park et al., 2017. EMBO reports 18: 826-840]). 이중 돌연변이인 K56A 및 R60A 또한 언급되었지만 Csm3에서의 표적 절단을 완전히 제거하지는 않았다.
추가적인 유형의 돌연변이는 천연 CRISPR/Cas 기반 방어 시스템에 의한 손상 제어를 기반으로 한다. Csx1/Csm6의 CRISPR-연관 로스만 접힘(CARF) 도메인에서의 cOA의 결합 후, 이의 고등 진핵생물 및 원핵생물 뉴클레오타이드 결합(HEPN) 도메인이 활성화되고, 상기 단백질이 무차별적으로 RNA를 절단하기 시작한다(문헌[Kazlauskiene et al., 2017. Science 357: 605-609]). 정상적인 생물학적 환경에서, cOA는 Csx1/Cms6 자체에 의해 분해되어 지속적인 활성화 및 따라서 지속적인 RNase 활성을 피한다(문헌[Athukoralage et al., 2019. J Mol Biol 431: 2894-2899], 문헌[Garcia-Doval et al., 2020. Nature Communications 11: 1-9]). 최근에, Csx1/Csm6 단백질의 돌연변이체 버전을 사용함으로써 이 cOA 분해 메커니즘이 해명되었다. T10A, T10A/T11A 또는 T11A Csx1/Csm6 돌연변이체는 cOA를 분해할 수 없고 연장된 RNase 활성을 유발한다는 것이 입증되었다(문헌[Athukoralage et al., 2019. J Mol Biol 431: 2894-2899]; 문헌[Garcia-Doval et al., 2020. Nature Communications 11: 1-9]). 예를 들어 T10A, T10A/T11A 또는 T11A Csx1/Csm6 돌연변이체 또는 이는 등가물을 사용함으로써, Csx1/Csm6에 의한 이러한 연장된 RNase 활성은 진단 목적을 위한 보다 민감하고 신속한 판독을 위해 사용될 수 있다.
4.4 리보핵산 단백질 복합체의 조립
상이한 유형 III 서브타입들(Cmr, Csm) 간에 차이가 있기는 하지만, Cas7 및 Cas11의 다수의 서브유닛으로 구성된 일반적인 구조는(문헌[Staals et al., 2013. Mol. Cell 52: 135-145]; 문헌[Staals et al., 2014. Mol. Cell 56: 518-530]) Cas5 및 Cas10에 의해 한쪽이 막혀 있다. 이들 중, Cas7은, 사전 탑재된 RNA 가이드에 의해 표적 RNA가 인식되면 RNase 활성을 제공한다. 더욱이, 이러한 인식은 또한 Cas10 HD 도메인에 의한 DNase 활성을 유발한다(문헌[Kazlauskiene et al., 2016. Mol Cell 62: 295-306]).
유형 III CRISPR/Cas 시스템은 유형 IIIA Csm 및 유형 IIIB Cmr을 포함한 다양한 서브타입으로 추가로 분화될 수 있다(문헌[Staals et al., 2013, 2014 (상기에 언급된 문헌임)]). 테르무스 테르모필루스 Cmr의 이펙터 복합체(ttCmr46)는 46 nt crRNA 및 Cmr112131445361(문헌[Staals et al., 2014 (상기에 언급된 문헌임)]; 문헌[Taylor et al., 2015. Science 348: 581-586])의 화학량론을 갖는 12개의 서브유닛으로 구성된다. Staals 등의 새로운 연구는 40 nt crRNA를 갖는 유사한 복합체를 밝혀냈다(표 1).
표 1.
Figure pct00001
유형 IIIA Csm 복합체는 Cmr(Csm1123354151)과 유사한 방식으로 구성된다(문헌[Tamulaitis et al., 2017. Trends Microbiol 25: 49-61]). 이 복합체는, 모든 서브유닛을 정확한 몰비로 첨가하고 반응 혼합물이 배양 온도, 예를 들어 60℃ 또는 65℃에서, 일정 기간, 예를 들어 30분 동안 배양되도록 함으로써 조립될 수 있다.
Csm 또는 Cmr 단백질과 같은 정제된 Cas 단백질이 적합한 crRNA에 조립된다. 일 실시형태에서, 상기 crRNA 및 상기 조립된 리보핵산 단백질 복합체는 수용액 내에 존재한다. cOA 수준의 후속적인 측정에 필요한 경우, 상기 Cas 단백질 중 하나, 예를 들어 Cmr 6과 같은 CAP Cas는, 예를 들어 히스티딘 태그 및/또는 strep 태그로 태그되고, 바람직하게는 표면 상의 정의된 위치에서, 표면에 부착될 수 있다. 상기 표면은 유리, 플라스틱 또는 규소와 같은 고체 표면일 수 있다. 상기 표면은 그릇, 예를 들어 컵, 예를 들어 에펜도르프 튜브 내에, 또는 마이크로플레이트의 웰 내에, 또는 장치 내에 존재할 수 있다.
Mogila 등의 최근 연구는 스트렙토코커스 테르모필루스(Streptococcus thermophilus) Csm(StCsm)의 개별 서브유닛의 역할을 밝혀냈다(문헌[Mogila et al., 2019. Cell Reports 26: 2753-2765]). 또한 Csm3, Csm4 및 Cas10(Cmr1) 서브유닛(및 crRNA)만을 함유하는 최소 Csm 복합체가 설계되었으며, 이는 여전히 세 가지 촉매 활성(RNase, ssDNase, cOA 합성 효소)을 모두 유지하였다.
여러 서브유닛을 제거하면서 모든 촉매 활성을 유지하는 것은 유형 III CRISPR/Cas 시스템의 실제 사용에서의 통합에 효과적이다. 가장 주목할만한 것은 cOA 생산이 영향을 받지 않는 것으로 보고되었다는 것이다(문헌[Mogila et al., 2019 (상기에 언급된 문헌임)]).
이들 최소 복합체는, Mogila 등이 기술한 바와 같이, 유형 IIIA CRISPR/Cas의 경우 Cmr1, 3 및 4, 유형 IIIB CRISPR/Cas의 경우 Cmr 2, 3 및 4를 포함할 수 있으며, 이들 서브유닛의 카피수(copy numbers)는 변화할 수 있다. cOA 생산을 증가시키고 표적 검출의 특이성과 민감도를 증가시키기 위해, Csm3/Cmr4 서브유닛의 수가 증가될 수 있다.
또한, 이들 서브유닛은 이들의 활동을 최적화하기 위해 돌연변이될 수 있다.
상기 Cmr 단백질은 바람직하게는, 1:1:4:1의 Cmr1:Cmr3:Cmr4:crRNA의 화학량론 및 1:1:1:4:3:1:1의 Cmr1:2:3:4:5:6:crRNA의 화학량론으로 적합한 crRNA에 제공된다.
핵단백질 복합체는 하기와 같이 TtCmr46 crRNA에 조립될 수 있다:
먼저 3.5 μL crRNA(700 ng)를 3.5 μL 1X Cmr 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl)에 첨가하였다. 이어서, 서브유닛들을 특정 순서(Cmr3, Cmr2, Cmr4, Cmr5, Cmr6, Cmr1)로 반응 혼합물에 첨가하여 각각 최종 농도 5 μM, 2.5 μM, 10 μM, 7.5 μM, 2.5 μM 및 2.5 μM이 되도록 하여, 20 μL의 총 반응 부피를 구성하였다. 반응 혼합물은 65℃에서 30분 동안 배양될 수 있다.
클래스 I, 유형 3A 복합체를 재구성하는 바람직한 방법은 3.5 μL crRNA(700 ng)를 3.5 μL 1X Cmr 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl)에 첨가한 후, 서브유닛들을 Csm4, Csm1, Csm3, Csm2, Csm5 순서로 첨가하여 각각 최종 농도 2.5 μM, 2.5 μM, 12.5 μM, 7.5 μM 및 2.5 μM이 되도록 하여, 20 μL의 총 반응 부피를 구성하는 것을 포함한다. 반응 혼합물은 60℃ 또는 65℃에서 30분 동안 배양될 수 있다.
표 2.
Figure pct00002
4.5 RNA를 검출하는 방법
진단 목적으로 사용되고 있는 기존의 CRISPR/Cas 시스템, 예를 들어 Cas12/Cas14(캘리포니아 대학교, 미국 캘리포니아주 소재) 및 Cas13 기반 시스템(Broad Institute, 미국 매사추세츠주 소재)은 표적 부위에 인접한 특정 모티프의 존재에 의존한다. 생물학적 환경에서, 이 메커니즘은 자기(self)와 비자기(non-self)를 구별하는 데 사용된다. 이 모티프가 없으면, 이들 Cas 단백질은 표적을 절단할 수 없으며 진단 시스템에서의 이들의 사용은 불가능하다. Cas12 및 Cas13의 경우, 이들 모티프는 각각 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 및 프로토스페이서 측접 부위(PFS: protospacer flanking site)로 명명된다(문헌[Westra et al., 2013. PLoS Genet 9: e1003742]; 문헌[Abudayyeh et al., 2016. Science 353: aaf5573]). 일부 Cas12/Cas14 단백질의 경우, 이러한 필요 PAM은 TTTN/TTTA이고, 이는 표적 서열의 선택을 크게 제한한다. Cas13의 경우, 필요한 모티프는 덜 제한적이며, 표적 서열에 인접한 H 뉴클레오타이드(A, C, U)를 선호한다.
유형-III(B) CRISPR 시스템은, crRNA의 5'-반복 태그와 상응하는 3'-프로토스페이서 측접 서열 사이의 상보성을 확인함으로써 자가 면역을 방지하는 상이한 자기 대 비자기(self versus non-self) 메커니즘을 사용한다(문헌[Guo et al., 2019. RNA Biol 16: 1513-1520]). 이들 두 영역 사이의 상보성은 상대적인 cOA 생산에 어느 정도 영향을 주지만, 유형-III가 원하는 대로 기능하기 위해 특정 PAM/PFS-유사 서열에 대한 요구 사항이 없으며, 이는 현재 사용되는 시스템보다 큰 이점을 제공한다(문헌[Guo et al., 2019. RNA Biol 16: 1513-1520]).
더욱이, Cas13 표적 선택의 사용은 또한, 표적 RNA에서 형성되는 잠재적인 2차 구조에 의해 제한된다(문헌[Smargon et al., 2017. Mol Cell 65: 618-630]). 현재 사용되고 있는 진단 응용 분야들은, 65℃에서 작동하는 테르무스 테르모필루스의 유형-IIIB 시스템과 대조적으로, 37℃에서 작동한다(문헌[Staals et al., 2013. Mol Cell, 52: 135-145]). 이러한 상승된 온도는 표적 RNA 서열에서 잠재적으로 형성되는 2차 RNA 구조의 양을 감소시킨다(문헌[Wan et al., 2012. Mol Cell 48: 169-181]).
특정 RNA 서열을 검출하는 본 발명의 방법은 인간 건강 관리, 수의학적 진단, 식물 병원균의 검출, 수질 오염물의 검출 및 식품 및 사료 오염물의 검출에 사용될 수 있다. 또한, 특정 RNA 서열을 검출하는 본 발명의 방법은 유익한 유기체를 검출하기 위해 사용될 수 있다. 일반적으로, 본 발명의 방법은 박테리아, 진균, 고세균, 원생생물(protest), 원생동물(protozoa), 진핵생물, 바이러스 및 바이로이드 병원균의 검출에 사용될 수 있다. 추가로, 본 발명의 방법은 또한 인간, 동물 및 식물에서 RNA 분자로 발현되는 유전적 변경 또는 특성의 검출 및 진단에 사용될 수 있다.
인간 건강 관리 및 수의학적 진단을 위해, 바람직하게는, RNA를 포함한 핵산 물질은 생물학적 유체, 바람직하게는 뇌척수액, 타액, 비인두 분비물, 구강인두 분비물, 땀, 소변 대변 또는 혈액으로부터 단리된다. 용어 "혈액"은, 예를 들어 원심분리에 의해, 적혈구 및 백혈구를 제거함으로써 제조된 혈장, 및 혈전을 형성하고, 예를 들어 원심분리기를 사용하여, 상기 혈전을 제거함으로써 제조된 혈청을 포함한다. 바람직한 생물학적 유체는 혈액이다. 생물학적 유체, 특히 혈액으로부터 핵산 물질을 단리하기 위한 방법 및 조성물은 바람직하게는, 유기 용매 및 카오트로픽 염(chaotropic salt)을 사용하지 않으면서 수성 용매를 사용한다.
필요한 경우, 예를 들어 물리적 및 화학적 방법의 조합을 사용하여, 샘플로부터 RNA를 포함한 핵산 물질이 정제될 수 있다. 바람직하게는, 핵산 단리를 위한 상업적으로 입수 가능한 시스템, 예를 들어 NucliSENS® easyMAG® 또는 NucliSENS® miniMAG® 핵산 추출 시스템(bioMerieux, 프랑스 마흑씨-레뚜왈르 소재), 또는 MagNA Pure 96 시스템(Roche Diagnostics, 네덜란드 알메르 소재)이 사용된다.
이를 위해, RNA는, Trizol(Invitrogen; 캘리포니아주 칼스배드 소재), RNAqueous®(Applied Biosystems/Ambion, 텍사스주 오스틴 소재), Qiazol®(Qiagen, 독일 힐덴 소재), Agilent 총 RNA 단리 키트(Agilent Total RNA Isolation Lits) (Agilent; 캘리포니아주 산타 클라라 소재), RNA-Bee®(Tel-Test. 텍사스주 프렌즈우드 소재), RNeasy 미니 키트(the RNeasy mini kit) (Qiagen, 네덜란드 펜로 소재), 및 Maxwell™ 16 총 RNA 정제 키트(Maxwell™ 16 Total RNA Purification Kit) (Promega; 위스콘신주 매디슨 소재)를 포함하는 적합한 상업적인 RNA 단리 키트를 포함하지만 이에 제한되지는 않는 당업계에 공지된 임의의 기술에 의해 샘플로부터 단리될 수 있다. 단리된 RNA, 바람직하게는 mRNA는 바람직하게는, RNA-의존성 DNA 중합 효소의 도움으로 단일 또는 이중 가닥 cDNA로 역전사된다.
진단 목적을 위한 본 발명에 따른 유형 III CRISPR/Cas의 용도는 의학적 진단, 예를 들어, 요로 감염, 특히 SARS-CoV-2 및 호흡기 세포융합 바이러스(RSV: respiratory syncytial virus)의 기도 감염, 혈액 감염(패혈증), 메티실린-내성 스타필로코커스 아우레우스(Staphylococcus aureus ) 마커 및 확장 스펙트럼 베타-락타마제 마커와 같은 항생제 내성 마커의 발현, 위장 감염, 피부 감염, 치성 감염, 칸디다증, 질편모충 및 가드네렐라(Gardnerella)와 같은 질 감염, 남성 생식계 감염, 말라리아, 트리파노소마, 뎅기열, 지카열, 치쿤구니야열과 같은 열대성 전염병의 검출, 클라미디아 종(Chlamydia spp.), 임질, 인간 면역결핍 바이러스, 헤르페스 종(Herpes spp.), 매독에 의한 성병, 및 암 및 자가면역 질환을 포함한 유전적 결함의 검출을 포함하지만 이에 제한되지는 않는다.
본 발명에 따른 유형 III CRISPR/Cas는 소 전염병, 예를 들어 유선염, 청설병, 구제역, 살모넬라 종(Salmonella spp.), 클레브시엘라 종(Klebsiella spp.), 캄필로박터 종(Campylobacter spp.), 돼지 전염병, 예를 들어 호흡기 질환, 피부염, 설사 및 돼지 파보바이러스 감염; 양 및 염소 전염병, 예를 들어 클로스트리디움 질환, 구내염, 폐렴 및 리프트 밸리 질환 바이러스(Rift Valley diseae virus) 감염; 가금류 전염병, 예를 들어 감염성 기관지염, 살모넬라 종; 고양이 전염병, 예를 들어 고양이 면역결핍 바이러스(FIV: feline immunodeficiency virus) 및 고양이 백혈병 바이러스(FeLV: feline leukaemia virus) 감염, 호흡기 감염; 개 전염병, 예를 들어 광견병, 및 보르데텔라( Bordetella ), 렙토스피라( Leptospira ) 보렐리아(Boriella) 감염의 검출을 포함한 수의학적 진단에 추가로 사용될 수 있다.
본 발명에 따른 유형 III CRISPR/Cas 검출 시스템은 식물 병원균의 검출, 예를 들어 자낭균 종 및 담자균 종과 같은 특정 진균, 난균 및 피토믹사강과 같은 특정 진균- 유사 유기체, 부르크홀데리아( Burkholderia ), 프로테오박테리아 및 슈도모나스(Pseudomonas) 종과 같은 특정 박테리아; 담배 모자이크 바이러스, 꽃양배추 모자이크 바이러스와 같은 바이러스, 바이로이드 및 바이러스-유사 유기체; 멜로이도긴 치트우디( Meloidogyne chitwoodi ) 및 M. 팔락스(M. fallax)와 같은 선충; 및 피토모나스(Phytomonas) 세팔레우로스(Cephaleuro)와 같은 원생동물 및 조류의 검출에 추가로 사용될 수 있다.
본 발명에 따른 유형 III CRISPR/Cas 검출 시스템은 콜레라균, 대장균, 시겔라 종(Shigella spp.), 레지오넬라 종(Legionella spp.), 살모넬라 종과 같은 박테리아 오염; A형 간염, E형 간염, 소아마비 바이러스와 같은 바이러스 오염; 데스모데스무스 종(Desmodesmus spp.)의 존재와 같은 조류 오염; 및 드라쿤룰루스 종(Dracunculiasis spp.)의 존재와 같은 기생충 오염의 검출을 포함한 물 오염물의 검출에 추가로 사용될 수 있다.
본 발명에 따른 유형 III CRISPR/Cas 검출 시스템은 클로스트리디움 보툴리눔(Clostridium botulinum ), 대장균, 리스테리아 종( Listeria spp .), 살모넬라 종, 콜레라균의 존재와 같은 박테리아 오염; 엔테로바이러스 종(Enterovirus spp.), A형 간염, 노로바이러스 종(norovirus spp.) 및 로타바이러스 종(rotavirus spp.)과 같은 바이러스 오염; 지아르디아 종(Giardia spp.) 및 트리키넬라 종(Trichinella spp.)의 존재와 같은 기생충 오염; 및 진균 오염을 포함한 식품 및 사료 오염물의 검출에 추가로 사용될 수 있다.
보다 구체적으로, 모든 유기체는 감염 동안 RNA를 생성하기 때문에, 본 발명에 따른 유형 III CRISPR/Cas 검출 시스템은 임의의 유기체의 검출에 추가로 사용될 수 있다. 상기 유기체는 바실러스 종, 클로스트리디움 종, 엔테로박터 종, 대장균 종, 엔테로코커스 종, 클레브시엘라 종, 리스테리아 종, 레지오넬라 종, 살모넬라 종, 스타필로코커스 종, 스트렙토코커스 종, 및 이들의 조합과 같은 박테리아; B형 간염 바이러스, 아데노바이러스, 인간 유두종 바이러스와 같은 DNA 바이러스를 포함한 바이러스; 인플루엔자 바이러스, A/C/D/E형 간염, 소아마비 바이러스, 담배 모자이크 바이러스, 코로나바이러스 및 HIV와 같은 RNA 바이러스; 바이로이드; 고세균; 아스페르길루스( Aspergillus ) 종, 자낭균 종, 칸디다( Candida ) 종과 같은 진균; 원생동물; 및 트리파노소마(Trypanosoma) 종과 같은 기생충을 포함한다.
RNA의 검출을 위한 본 발명에 따른 유형 III CRISPR/Cas 검출 시스템의 용도는 진단 환경에서 명백한 이점을 발견한다. 두 가지의 이러한 진단 환경이 하기에 자세히 설명된다. 그러나, 당업자는 의심의 여지 없이, RNA 검출을 위한 본 발명에 따른 유형 III CRISPR/Cas 검출 시스템으로부터 이익을 얻는 추가적인 진단 환경을 찾을 수 있을 것이다.
첫 번째 예는 최근의 세계적인 개발로 설명된다. 정밀 현장 진단(PoC: point-of-care) 검출은 COVID-19 대유행병에서 많은 이점을 제공할 것이다. COVID-19 대유행병을 초래한 최근의 SARS-CoV-2 발병은 발견 후 수개월 만에 전 세계로 퍼졌다. 질환의 확산을 늦추기 위해, 많은 국가에서 인구의 이동과 여행을 제한하는 예방 조치를 취하였다. 이러한 제한은 궁극적으로는, 국가 보건 시스템에 대한 압력을 관리 가능한 수준으로 유지하고 가능한 한 많은 생명을 구하려는 의도로 "곡선을 평평하게"하기 위한 것이다. 그러나, 일부 국가는 다른 국가들보다 훨씬 더 효과적으로 감염 증가를 관리할 수 있었던 것으로 보인다. 예를 들어, 싱가포르, 대한민국 및 대만에서의 제한된 수의 감염 및 후속적인 사망은 이들의 신속한 대응의 성공을 반영하는 것으로 보이다. 이 성공의 주요 요인은 다른 국가들이 하지 않았거나 할 수 없었던, 대량 시험 및 후속적인 자가 격리에 대한 초기의 광범위한 전개였다. 이 진단 스크리닝 프로그램은 감염된 사람을 식별하고 격리하는 데 도움을 주었으며, 그 결과 바이러스의 확산을 상당히 더 느리게 만들어서, 감염의 감소 및 사망률 감소를 유도하였다. 이 외에도, WHO는 최근 생겨난 대유행병에 신속하게 대응할 수 있도록 하기 위한 광범위한 탈중앙화(decentralized) 시험의 필요성을 표명하였다. COVID-19 시험에 사용되는 가장 중요한 진단 도구는 바이러스 유전 물질(RNA)을 검출하는 (RT)-PCR을 기반으로 한다. 이 시험은 4 내지 6시간 안에 신뢰할 수 있는 결과를 얻을 수 있지만, 중앙 실험실만이 시험을 수행할 자격이 있으며, 따라서 샘플 배송, 및 적어도 24시간의, 시험 당 예상 총처리 시간을 필요로 한다. 선진국에서조차, 최근 증가된 검사 능력으로도 수요를 충족하지 못하고 있다. 사용 가능한 PoC 시험은 면역 측정법뿐이며, 이는 과거의 감염과 현재의 감염을 구별하지 않으며 급성기 진단에 사용될 수 없다.
CRISPR-Cas 핵산 검출 진단은 탈중앙화 스크리닝 플랫폼을 설정하기 위한 솔루션을 제공한다. CRISPR-Cas 기반 진단은 PCR보다 빠르고 현장에서 수행하기에 더 저렴한 것으로 주장되었다(문헌[Sheridan, 2020. Nat Biotechnol 38: 382-384]). 본 발명자들은 혁신적이고 독점적인 CRISPR-Cas 기반 PoC COVID-19 진단 접근법을 개발하고 있는 중이며, 이는 바이러스 모니터링 능력을 개선하여 COVID-19 및 다른 바이러스의 확산을 제한하는 데 기여할 것이다.
두 번째 예는 요로 감염(UTI: urinary tract infection)의 검출에 의해 제공된다. 현재의 UTI 진단은 아직 만족스럽지 못하다. 특히 일선 의료 서비스에서, 일반 의사는 단지 61%의 양성 예측치를 갖는 신뢰할 수 없는 딥스틱(dipstick) 결과에 의존해야 한다. 이는 질환-음성 환자의 많은 치료와 불필요한 항생제 처방을 유발한다(문헌[Eriksen and Bing-Jonsson, 2016. Forskning 1-42]; sykepleien.no/forskning/2016/09/kan-ikke-stole-blindt-pa-urinstiks에서 입수 가능함).
상기 유형 III CRISPR/Cas 검출 시스템을 사용한 정밀 현장 진단은 현재의 방법에 비해 주요 이점을 제공한다. 특이적인 RNA 검출 능력으로 인해, 상기 유형 III CRISPR/Cas 검출 시스템은 신속한 종 식별 및 항생제 내성 마커 검출을 허용한다.
UTI의 대부분의(70 내지 90%) 경우는 요로병원성 대장균에 의해 발생하지만 다양한 다른 병원균에 의해서도 발생할 수 있다(문헌[Flores-Mireles et al., 2015. Nat Rev Microbiol 13: 269-284]). 감염을 유발하는 특정 병원균의 식별은 항생제의 올바른 투여의 가능성을 높이는 추가적인 정보를 제공한다.
예를 들어, 특정 병원균의 식별은 특정 16S 리보솜 RNA 종의 발현을 기반으로 할 수 있다. Van der Zee 등(문헌[van der Zee et al., 2016. PLOS ONE 11: e0150755])은 7개의 UTI-유발 병원균 간의 구별이 16S 기반 qPCR을 기반으로 할 수 있음을 입증하였다. 사용된 프라이머의 일부 예를 표 3에 제공하였다(문헌[Van der Zee et al., 2016] (상기에 제공된 문헌임)). 이들 프라이머의 표적은 유형 III CRISPR/Cas 가이드 서열에 적응될 수 있다. 유사하게, 항생제 내성 마커의 검출을 위한 PCR 프라이머 영역 또한 유형 III CRISPR/Cas 기반 검출에 맞게 적응될 수 있다.
다른 예는 미가공 유제품에서 리스테리아를 검출하는 것에 의해 제공된다. 리스테리아 모노사이토제니스( Listeria monocytogenes )는 치명적인 리스테리아증을 일으킬 수 있는 공지된 식품 매개 병원균이다. 리스테리아는 야채, 유제품 및 육류 제품과 같은 식품을 오염시키는 것으로 밝혀졌다. 유럽에서는 모든 원유의 1 내지 4.4%에 리스테리아가 존재하는 것으로 보고되었으며, 저온 살균되지 않은 특정 치즈에서는 1.1 내지 65%가 보고되었다(문헌[Lunden et al., 2004. J Dairy Science 87, E6 - E12]). 리스테리아의 유형 III CRISPR/Cas 기반 유전자 검출은 대장균, 살모넬라 타이피뮤리움(Salmonella typhimurium ) 및 캄필로박터 제주니(Campylobacter jejuni)와 같은 다른 잠재적 병원균의 검출과 조합될 수 있다.
신속한 진단을 사용하여 식품 매개 병원균을 신속하게 검출하면, 오염된 유제품의 사용 및 소비를 잠재적으로 방지할 수 있다. 농장에서 이러한 검출을 가능하게 하면, 오염된 우유가 낙농 가공 공장으로 운송되는 것을 방지하고 오염의 잠재적 확산을 방지하여 리스테리아증의 가능성을 줄일 수 있다.
첫 번째 예에서와 같이, 유형 III CRISPR/Cas 기반 RNA 검출은 유사한 PCR 표적 서열을 기반으로 설계될 수 있다. 잠재적으로 필요한 우유 전처리뿐만 아니라 필요할 수 있는 낮은 검출 한계에서 복잡한 문제가 발생할 수 있다.
필요한 경우, 예를 들어 검출 수준을 증가시키기 위해, 표적 서열의 증폭이 특정 RNA 서열을 검출하는 본 발명의 방법에 선행할 수 있다. 증폭은, 예를 들어 리가제 연쇄 반응(LCR: ligase chain reaction), 등온 리보핵산 증폭 시스템, 예를 들어 핵산 서열-기반 증폭(NASBA: nucleic acid sequence-based amplification) 및 RNA의 절단-기반 신호 증폭, 전사 매개 증폭, 가닥 치환 증폭 및 중합 효소 연쇄 반응(PCR: polymerase chain reaction)을 포함한 임의의 적합한 증폭 시스템에 의해 수행될 수 있다. 당업자에게 공지된 바와 같이, RNA는 바람직하게는, 증폭 반응 전 또는 동안 역전사된다.
바람직한 증폭 반응은 단일 튜브 등온 반응, 예를 들어 NASBA, 루프 매개 등온 증폭(LAMP: loop-mediated isothermal amplification), 헬리카제-의존성 증폭(HDA: helicase-dependent amplification), 재조합 효소 중합 효소 증폭(RPA: recombinase polymerase amplification) 반응 및 절단 효소 증폭 반응(NEAR: nicking enzyme amplification reaction)이다. 바람직한 단일 튜브 등온 반응은 RPA 반응(TwistDx Ltd., 영국 캠브리지 소재)이다.
상기 단일 튜브 등온 반응, 예를 들어 RPA는 바람직하게는, "원-포트" 반응 시스템으로서 본 발명의 CRISPR 기반 리보핵산 검출 시스템과 통합된다. 이러한 원-포트 또는 단일 튜브 시스템의 이점은 샘플의 오염 또는 상이한 샘플들의 교차 오염에 대한 위험이 감소된다는 것이다.
직접적인 cOA 검출 방법을 사용한 cOA 검출의 경우, 샘플은 내인성 수준의 PPi 및 Pi를 포함할 수 있다. 특히 생물학적 유체, 예를 들어 혈장, 혈청, 소변 및 활액은, 각각 0.16 내지 3.42 microM 및 0.31 mM(혈장); 각각 3.5 microM 및 1 내지 1.5 mM(혈청); 1.5 mM Pi(소변) 및 각각 0.1 microM 및 0.3 mM(활액)의 PPi 및 Pi의 양을 함유할 수 있다(문헌[Russell et al., 1970. Lancet 296: 899-902]; 문헌[Silcox and McCarty, 1973. J Clin Invest 52: 1863-1870]; 문헌[Bansal, 1990. Serum Inorganic Phosphorus. In: Clinical Methods: The History, Physical, and Laboratory Examinations (Butterworths)]; 문헌[Le, 2008. First aid for the USMLE step 1 2018]). 이들 수준은 시간과 질환의 경과에 따라 변화할 수 있다(문헌[Armstrong et al., 1975. Clin Chem 21: 104-108]).
내인성 PPi 또는 Pi 수준이 높은 샘플의 전처리는, 특정 RNA 서열의 검출 전에 Pi 및 PPi와 같은 소분자를 제거함으로써 수행될 수 있다. 내인성 PPi 또는 Pi 수준에 의한 판독 간섭을 방지하기 위해 하기에 나열된 방법을 포함하지만 이에 제한되지는 않는 여러 방법이 사용될 수 있으며, 화학적 침전, 투석 및 양이온 교환 컬럼의 사용을 포함한다.
Pi 및 PPi와 같은 소분자의 제거는, 예를 들어, 1,000 미만, 바람직하게는 500 미만의 분자량 컷오프(cut-off)를 갖는 필터를 통해 샘플을 여과함으로써, 수행될 수 있다. 분자량 컷오프는, 공지된 분자량을 갖는 용질의 90% 초과가 멤브레인에 유지되는 최저 분자량(돌턴 단위)으로 정의된다.
시험 결과에 대한 내인성 인 종의 영향은 또한, 환자 샘플로부터의 유전 물질(그 중, 표적 서열)의 단리 및 PPi/Pi 무포함 배지 내로의/상으로의 후속적인 적용에 의해 무효화될 수 있다. 핵산 물질을 단리하는 방법은 유기 추출, 켈렉스 추출(chelex extraction), 고체상 추출, 자기 비드 및/또는 음이온 교환을 포함하지만 이에 제한되지는 않는다.
내인성 Pi 수준의 감소 외에도, 환자 샘플의 프로테아제, 염 농도 및 pH를 포함하지만 이에 제한되지는 않는 다른 요인에 의한 판독 간섭을 해결하기 위해 샘플 제조 단계가 필요하다.
표 3.
Figure pct00003
4.6 적합한 장치
본 발명에 따른 CRISPR/Cas 기반 리보핵산 검출 시스템은 바람직하게는 장치 내에 존재한다. 상기 장치는 바람직하게는 하나 이상의 특정 RNA 서열을 표적화하는 하나 이상의 검출 시스템을 포함한다. 상기 장치는 상기 장치 내로의 및 상기 장치로부터의 유체의 도입 및 추출을 위한, 유입구 및 유출구 포트와 같은 개구를 포함할 수 있다. 상기 개구는 밸브, 튜브, 채널, 챔버, 주사기 및/또는 펌프에 연결될 수 있다. 상기 장치는 미세유체 장치 내에서의 유체의 지향성 운동을 허용하는 유체 흐름 작동기에 연결될 수 있다. 예시적인 작동기는 주사기 펌프, 기계적으로 작동되는 재순환 펌프, 전기삼투 펌프, 벌브, 풀무, 다이어프램(diaphragm) 또는 유체의 이동을 강제하기 위한 기포를 포함하지만 이에 제한되지는 않는다. 특정 예시적인 실시형태에서, 상기 장치는 상기 장치를 통해 유체를 이동시키기 위해 함께 작동하는 프로그래밍 가능한 밸브를 갖는 제어기에 연결된다. 추가로, 가열 메커니즘은 원하는 온도에서의 반응 혼합물의 배양을 위한 것일 수 있다.
바람직하게는, 상기 CRISPR/Cas 기반 리보핵산 검출 시스템은, 바람직하게는 일회용 카트리지를 사용함으로써, 바이오센서 내에 존재한다. 바람직한 바이오센서는 표적 핵산과 상기 CRISPR/Cas 기반 리보핵산 검출 시스템의 상호작용을 검출하기 위한 방법 및 수단을 제공한다. 바람직한 바이오센서는, 샘플의 자동화된 분석을 위한 간단한 푸시 버튼(push-button) 작동이 가능한, 재사용 가능한, 손에 들고 쓰는 판독기, 및 다수의 임상적으로 관련된 물질, 예를 들어 병원균의 최적의 검출 및/또는 정량화를 제공하도록 기능화된 비용 효율적인 일회용 카트리지, 바람직하게는 일회용 미세유체 센서 카트리지를 포함한다. 가능한 바이오센서는, 예를 들어 자성 입자와 같은 정량 가능한 물질의 축적을 기반으로 하는, 측면 유동 시험 장치이다.
일 실시형태에서, 상기 장치 또는 바이오센서는 현장 진단(POC) 시험 장치이며, 이는, 필요에 따라 치료 계획이 조정될 수 있도록 매우 짧은 시간에 환자의 위치에서 또는 근처에서 샘플을 수집하고 결과를 획득하도록 허용하는 수송 가능한, 휴대용인, 손에 들고 쓰는 기기 또는 시험 키트이다. 상기 장치는 바람직하게는, 표적 핵산의 존재 또는 부재에 대한 신속하고 저비용이며 신뢰할 수 있는 측정, 및 바람직하게는 또한, 상기 표적 핵산의 정량화를 허용하는 수단을 포함한다.
바람직하게는, CRISPR/Cas 기반 리보핵산 검출 시스템을 포함하는 POC는, 5개 이하의 표적 핵산 분자, 4개 이하의 표적 핵산 분자, 3개 이하의 표적 핵산, 예를 들어 2개의 표적 핵산 분자 및 1개의 표적 핵산 분자를 포함한 제한된 수의 표적 핵산 분자를 검출하는 것에 관한 것이다. 이를 위해, 상기 crRNA 리보핵산 단백질 복합체는 바람직하게는 별개의 위치 리보핵산 검출 시스템에 존재하여, 개별적인 crRNA 리보핵산 단백질 복합체 각각에 대한 cOA 수준을 측정하도록 허용한다.
바람직하게는, CRISPR/Cas 기반 리보핵산 검출 시스템을 포함하는 어레이는 적어도 5개의 상이한 표적 핵산 분자, 바람직하게는 적어도 10개의 상이한 표적 핵산 분자, 바람직하게는 적어도 20개의 상이한 표적 핵산 분자, 바람직하게는 적어도 50개의 상이한 표적 핵산 분자, 바람직하게는 적어도 100개의 상이한 표적 핵산 분자를 표적화한다. CRISPR/Cas 기반 리보핵산 검출 시스템을 포함하는 어레이는 바람직하게는, 2 내지 12.000개의 별개의 표적 핵산 분자를 표적화한다.
당업자에게 명백한 바와 같이, 상기 상이한 표적 핵산 분자들은 모두, 각각의 crRNA 분자가 상이한 표적 유기체, 예를 들어 상이한 박테리아, 바이러스, 진균, 원생동물 및/또는 기생충으로부터 유래되고 이를 검출하기 위해 사용되도록, 상이한 표적 유기체들에 대해 지시될 수 있다. 상기 상이한 crRNA 분자들은 또한, 상기 상이한 crRNA 분자들의 서브세트가 동일한 유기체에 대해 지시되도록 선택될 수 있다. 상기 서브세트는 2개의 상이한 crRNA 분자, 3개의 상이한 crRNA 분자, 4개의 상이한 crRNA 분자, 5개의 상이한 crRNA 분자를 포함할 수 있다. 동일한 유기체에 대해 지시되는 상이한 crRNA 분자의 수는 바람직하게는 최대 10으로 제한된다. 모든 상이한 crRNA 분자들에 의한 표적 유기체의 검출은 표적 유기체의 식별이 정확하다는 확인을 제공한다는 것이 분명할 것이다.
또한, 특정 crRNA 분자는, 본 발명에 따른 CRISPR/Cas 기반 리보핵산 검출 시스템 내에, 예를 들어, 48웰 플레이트, 96웰 플레이트, 192웰 플레이트, 384웰 플레이트 또는 768 웰 플레이트와 같은 마이크로티터 플레이트의 다수의 웰 내에, 다수의 카피로 존재할 수 있다. 다수의 카피의 crRNA 분자에 의한 표적 유기체의 검출은 표적 유기체의 식별이 정확하다는 확인을 제공한다.
5. 실시예
실시예 1
물질 및 방법
Cmr 복합체의 정제 및 재조합 Cmr 단백질의 발현 및 정제에 대한 상세한 설명
Cas 단백질 및 Cas 복합체는 문헌[Staals et al., 2013 (Staals et al., 2013. Mol Cell 52: 135-145)]에 기술된 바와 같이 정제하였다.
시험관내 활성 분석
RNA 기질(표 4)은 T4 폴리뉴클레오타이드 키나제(NEB) 및 5' 32P-γ-ATP에 의해 5' 표지하였고, 그 후 RNA 겔 용출 완충액(0.5 M 아세트산 나트륨, 10 mM MgCl2, 1mM EDTA 및 0.1% SDS)을 사용하여 변성 PAGE로부터 정제하였다. 표지된 RNA 기질 및 400 nM TtCmr을 사용하여 TtCmr 활성 분석 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl, 10 mM DTT, 1 mM ATP, 및 2 mM MgCl2)에서 시험관내 활성 분석을 수행하였다. 달리 명시되지 않는 한, 65℃에서 1시간 동안 반응을 배양하였다. 95°에서 5분 동안 끓인 배양 후 RNA 로딩 염료(95% 포름아미드 함유)를 샘플에 첨가하였다. 15 mA에서 약 3 내지 4시간 동안 또는 4 mA의 상수에서 밤새, 20% 변성 폴리아크릴아미드 겔(7 M 요소 함유)에서 샘플을 실행하였다. 포스포이미징(phosphorimaging)을 사용하여 이미지를 시각화하였다.
Cmr46 Cmr40의 복합체 재구성
먼저 3.5 μL crRNA(700 ng)를 3.5 μL 1X Cmr 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl)에 첨가하였다. 이어서, Cmr46에 대해, 서브유닛들을 특정 순서(Cmr3, Cmr2, Cmr4, Cmr5, Cmr6, Cmr1)로 반응 혼합물에 첨가하여 각각 최종 농도 2.5 μM, 2.5 μM, 2.5 μM, 10 μM, 7.5 μM 및 2.5 μM이 되도록 하여, 20 μL의 총 반응 부피를 구성하였다. 65℃에서 30분 동안 반응 혼합물을 배양하였다. Cmr40에 대해서도 유사하게 수행하였으며, 서브유닛(Cmr3, Cmr2, Cmr4, Cmr5, Cmr6, Cmr1)의 최종 농도가 각각 2.5 μM, 2.5 μM, 1.875 μM, 6.66 μM, 7.5 μM 및 2.5 μM였다.
직접적인 cOA 검출 분석
Cmr40- 또는 Cmr46-복합체(62.5 nM)뿐만 아니라 RNA 기질(200 nM, 표 4에 나열됨)이 첨가된 TtCmr 활성 분석 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl, 10 mM DTT, 1 mM ATP, 및 0.5 mM MgCl2)에서 시험관내 cOA 검출 분석을 수행하였다. 65℃에서 1시간 동안 반응을 배양한 후, 0.05 단위의 피로포스파타제(ThermoFisher EF0221)를 첨가한 다음, 25℃에서 30분 동안 배양하였다. Sigma-Aldrich(MAK307)의 말라카이트 그린 인산염 분석 키트를 사용하여 신호를 시각화하였다.
전기 영동 이동성 변화 분석(EMSA)
Cmr 결합 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl)에서 표지된 표적 RNA(표 4)와 함께 400 nM 내인성 TtCmr 복합체를 배양함으로써 EMSA를 수행하였다. 15 mA에서 2.5시간 동안 또는 4 mA의 상수에서 밤새, 천연 5%(w/v) 폴리아크릴아미드 겔(PAGE) 상에서의 전기 영동 전에, 모든 반응은 65℃에서 1시간 동안 배양되었다. 포스포이미징을 통해 이미지를 시각화하였다.
결과
상이한 크기의 TtCmr 복합체들의 RNA 절단 활성
본 발명자들의 이전 연구는, T. 테르모필루스 HB8로부터 정제된 네이티브 Cmr 복합체에 다양한 길이의 다양한 성숙한 crRNA 가이드가 탑재되었으며 crRNA-4.5(T. 테르모필루스 CRISPR 어레이 4, 스페이서 5)가 가장 풍부하다는 것을 입증하였다(문헌[Staals et al., 2013. Mol. Cell 52: 135-145]). 내인성 Cmr 복합체는 6 nt 간격으로 상보적인 5' 표지된 표적 RNA(4.5 표적 RNA)를 특이적으로 절단하여, 대부분 21, 27, 33 및 39개 뉴클레오타이드인 5' 표지된 분해 단편을 생성한다(도 3a). 그러나, 내인성 Cmr 복합체의 crRNA 함량의 이종 특성(문헌[Staals et al., 2013 (상기에 언급된 문헌임)], 문헌[Taylor et al., 2015. Science 348: 581-586])은 이러한 결과의 해석을 복잡하게 만든다. 따라서, 표적 RNA 절단의 메커니즘을 추가로 조사하기 위해, 본 발명자들은 내인성 Cmr 복합체를 다양한 길이의 단일 crRNA(crRNA-4.5)에 결합된 재구성된 Cmr 복합체로 교체하였다.
표 4.
Figure pct00004
Figure pct00005
Figure pct00006
본 발명자들은 본 발명자들의 풍부한 이전의 RNA 시퀀싱 데이터를 기반으로 34(TtCmr-34), 40(TtCmr-40) 및 46 nt(TtCmr-46)의 crRNA 길이를 포함하기로 선택하였다(문헌[Staals et al., 2013 (상기에 언급된 문헌임)]). 내인성 복합체에서 관찰된 5' 표지된 분해 산물의 혼합물과 반대로, 재구성된 복합체 각각은 대부분 하나의 크기인 정의된 분해 산물을 생성하였다(도 3b). 이는, 복합체의 길이가 crRNA의 길이에 의해 결정되며 더 큰 복합체(예를 들어 TtCmr-46)는 표적 RNA의 5'(표지된) 말단에 더 가깝게 절단한다는 개념과 일치한다. 더 작은 복합체(즉, TtCmr-40 및 TtCmr-34)는 각각 하나 또는 2개의 Cas7-Cas11(Cmr4-Cmr5) 골격 세그먼트를 결여하고, 따라서 표적 RNA를 더 원위 위치(5' 표지에서 더 멀리 떨어져 있음)에서 절단하여, 결과적으로 더 큰 분해 산물을 생성한다. 이러한 결과는 내인성 TtCmr 복합체의 집단이, 다양한 위치에서 동족 표적 RNA를 절단하는 더 큰 복합체와 더 작은 복합체의 이종 혼합물임을 입증한다.
TtCmr의 시드 서열
다양한 화학량론을 갖는 이러한 유형 III 복합체들의 유의성을 조사하기 위해, 표적화 및 시드 요구 사항의 차이를 조사하기 위한 활성 분석을 설정하였다. 구조적으로 유사한 유형 I 이펙터 복합체(즉, 캐스케이드 복합체) 표적화는 2개의 요인, 즉, PAM(프로토스페이서 인접 모티프) 및 시드에 의해 지배된다(문헌[Mojica et al., 2009. Microbiol 155: 733-740]; 문헌[Semenova et al., 2011. Proc Natl Acad Sci U S A 108: 10098-10103]; 문헌[Wiedenheft et al., 2011. Proc Natl Acad Sci U S A 108: 10092-10097]). 그러나 유형 III 시스템에서, 자기 식별은, crRNA의 8 nt 5' 핸들(뉴클레오타이드 -8 내지 -1로 지칭됨)과 프로토스페이서에 측접하는 상응하는 3' 영역 사이의 상보성을 확인하는, 소위 rPAM에 의해 부여된다(문헌[Elmore et al., 2016. Genes Dev 2016. 30: 447-459]; 문헌[Kazlauskiene et al., 2016. Mol Cell 62: 295-306]; 문헌[Marraffini and Sontheimer, 2010. Nature 463: 568-571]). 상보성의 경우, Cas10의 DNase 활성이 제거된다. TtCmr은 HD 도메인을 결여하는 N-말단 절단 Cas10 단백질로 인해 DNase 활성을 갖지 않기 때문에(문헌[Staals et al., 2013 (상기에 언급된 문헌임)]), 본 발명자들은 RNase 활성이 crRNA의 5' 핸들과 매치되는 표적 RNA에 의해 영향을 받는지 여부를 시험하였다. 그러나, 활성 분석은 이들 기질이 RNA 절단 활성에 대해 식별 가능한 효과를 갖지 않음을 보여주었으며, 이는 TtCmr에 의한 RNA 표적화가, 다른 유형 III 시스템과 유사하게, 자기 RNA(예를 들어, CRISPR 어레이로부터의 안티센스 전사체)의 표적화를 확인하지 않음을 시사한다(문헌[Tamulaitis et al., 2014. Mol Cell 56: 506-517]; 문헌[Samai et al., 2015. Cell 161: 1164-1174]).
다음으로, 본 발명자들은 crRNA의 가이드 부분(프로토스페이서와 염기쌍을 이루는 crRNA의 비반복 세그먼트)의 처음 8 nt에서의 돌연변이에 대해 활성 분석을 설정함으로써 TtCmr이 유형 I 시스템과 유사한 시드를 사용하는지 여부를 시험하였다. 결과는, 누락된 39 nt 분해 산물에 의해 입증된 바와 같이, 위치 5에서의 미스매치가 인접 절단 부위를 제거했지만 RNA 표적화는 이들 돌연변이의 영향을 받지 않았다는 것을 보여주었다(도 4a, 도 4b). 도 4a에서 입증된 바와 같이, crRNA의 가이드 부분의 처음 8 nt에서의 돌연변이는 표적 RNA 분해에 영향을 미치지 않는다. 그러나, cOA 생산 및 후속적인 비특이적 RNA 분해에 대한 이의 영향은 아직 밝혀지지 않았다. 신규 분석을 사용함으로써, 단일 뉴클레오타이드 미스매치가 cOA의 생산에 미치는 영향에 대한 더 많은 이해를 달성하였다.
내인성 TtCmr 복합체뿐만 아니라 2개의 재구성된 Cmr-복합체(46 nt 및 40 nt, 도 5)의 경우, 결과는 cOA의 생산을 위해 nt 위치 1, 2 및 5에서 상보성을 갖는 것이 중요함을 분명히 입증한다(도 3). nt 위치 1, 2 및 5와 비교할 때, nt 위치 4에서의 미스매치가 cOA 생산에 덜 영향을 미친다. 놀랍게도, nt 위치 3, 6 및 7에서의 미스매치는 2차 메신저 분자의 생산에 거의 영향을 미치지 않는 것으로 보인다.
이러한 결과는, 이 영역에서는 완전한 상보성이 필요하지 않으며 시드가 상이한 영역에 대신 위치할 수 있음을 시사한다. 실제로, 술폴로부스 이슬란디쿠스(Sulfolobus islandicus )로부터의 유형 IIIB Cmr 복합체에 대한 이전의 연구(문헌[Peng et al., 2015. Nucleic Acids Res 43: 406-417])는 crRNA의 3' 말단에서의 엄격한 염기쌍 형성 요구 사항을 보여주었다.
이 가능성을 조사하기 위해, 본 발명자들은 내인성 TtCmr 복합체 및 다양한 미스매치 세그먼트를 갖는 RNA 표적을 사용한 활성 분석을 수행하였다(도 6a). 이전의 발견과 일치하게도, 첫 번째 세그먼트(뉴클레오타이드 1 내지 5)에서 미스매치를 갖는 RNA 표적은, 미스매치된 세그먼트의 하류에서 하나의 절단 부위를 건너뛰었음에도 불구하고, 표적 분해를 방해하지 않았다. 그러나, cOA 생산에 미치는 영향은 매우 상당해서, 이를 거의 완전히 제거한다(도 6). 두 번째 및 세 번째 미스매치된 세그먼트(뉴클레오타이드 7 내지 12 및 13 내지 17)의 경우, 상류 및 하류 절단 부위 둘 모두는 건너뛰었지만 다른 절단 부위는 영향을 받지 않았다. 두 번째 세그먼트 미스매치는 cOA의 생산을 완전히 제거했지만, 여전히 상당한 양의 cOA 생산이 세 번째 세그먼트 미스매치에서 관찰되었다. 그러나, 네 번째 및 다섯 번째 세그먼트(뉴클레오타이드 19 내지 23 및 25 내지 29)에 미스매치가 도입된 경우, RNA 분해는 완전히 제거된 반면 cOA 생산은 네 번째 세그먼트 미스매치에서만 영향을 받았다. 마지막 세그먼트(뉴클레오타이드 31 내지 35)의 미스매치는, 상류 절단 부위를 건너뛰는 것 외에는 RNA 분해 또는 cOA 생산에 영향을 미치지 않았다. 이는, 네 번째 및 다섯 번째 세그먼트에 걸쳐 있는 영역의 염기쌍 형성이 표적 인식 및 분해에 중요함과 동시에, cOA 생산 개시에 일조한다는 것을 나타낸다.
내인성 복합체는 더 긴 복합체와 더 짧은 복합체의 혼합물이기 때문에, 본 발명자들은 이 중요한 영역을 보다 정확하게 찾아내기 위해 46(TtCmr-46) 또는 40 nt crRNA(TtCmr-40)를 갖는 재구성된 복합체를 사용하도록 전환하였다. TtCmr-46 복합체는 내인성 복합체에서 얻은 결과를 거의 완벽하게 반영하였으며, 네 번째 및 다섯 번째 세그먼트 내의 미스매치에 대한 RNA 분해의 민감도와 첫 번째, 두 번째 및 네 번째 세그먼트에서의 cOA 생산에 대한 상당한 영향을 보여주었다(도 5b). 그러나 이 필수 영역은 TtCmr-40 컴플렉스 내의 1개 세그먼트를 바꾼 것으로 보였으며, 세 번째 및 네 번째 세그먼트에서는 엄격한 염기쌍 형성 요구 사항이 있었다(도 5a). 종합하면, 이러한 결과는, 더 작은 crRNA(따라서 복합체) 크기를 갖는 가이드의 5' 말단 쪽으로 현저하게 이동하는 TtCmr 내의 3'에 위치한 시드 영역을 강력하게 시사한다. 본 발명자들은 이들 영역이 함께 또는 독립적으로 TtCmr에서 시드 서열로 작용함을 제안한다.
본 발명자들은, 상보적 RNA 표적을 인식하는 동안 이 시드 서열이 결합을 개시하는 역할을 한다고 가정하였다. 이러한 이유로, 본 발명자들은 내인성 TtCmr 복합체를 사용하여 EMSA에서 동일한 미스매치된 RNA 표적의 결합 친화성을 시험하였다(도 6a). 활성 분석에 따라, 본 발명자들은, 처음 3개의 세그먼트(뉴클레오타이드 1 내지 5, 7 내지 11 및 13 내지 17)에서 미스매치를 갖는 표적은 TtCmr 복합체에 대한 결합을 방해하지 않았으며 완전히 상보적인 RNA 표적 대조군과 유사하게 이동하였음을 관찰하였다. 그러나, 네 번째 및 다섯 번째 세그먼트(뉴클레오타이드 19 내지 23 및 25 내지 29)에서의 미스매치는 겔 상에서의 TtCmr-표적 RNA 3차 복합체의 이동에 상당히 영향을 미쳤다. 상기 이동은 결합되지 않은 상태와 상이하기는 하지만, 본 발명자들은 이것이 표적 RNA의 다른 다운스트림(상보적) 부분에 대한 부분적 결합을 나타낼 수 있다고 예상한다.
염기쌍 형성이 crRNA의 3' 말단에서 개시된다는 점을 추가로 확립하기 위해, 본 발명자들은 EMSA에서 짧은 11 nt 표적 RNA를 설계하였다. crRNA의 5' 부분에 상보적인 표적은 crRNA와 염기쌍을 형성하지 못한 반면, 제안된 3' 시드 영역과 염기쌍을 형성하는 표적은 결합할 수 있었다(도 6b). 이러한 결과는 가이드의 5' 말단이 동족 표적 RNA와의 염기쌍 형성 상호작용으로부터 어떻게든 보호됨을 나타낸다. 오히려, crRNA:표적 이중체 형성은 5' 말단으로 증식하기 전에 가이드의 3' 말단에서 개시된 것으로 보인다.
본 발명자들은 이전에, 상이한 크기의 apo- 및 ssRNA 표적 결합된 TtCmr 복합체의 cryo-EM 구조를 풀어냈다(문헌[Taylor et al., 2015. Science 348: 581-585]). 본 발명자들은 상기 복합체가 표적 RNA 결합 시 서브유닛들의 일치된 재배열을 겪는다는 것을 관찰하였다. 가장 주목할 만한 것은, Cas11(Cmr5) 필라멘트가 복합체의 중심에서 멀어져 회전하여, crRNA:표적 RNA 이중체의 추가 증식을 허용하는 채널에서 crRNA의 5'에 위치한 부분을 더 많이 노출시킨다는 것이다. 이러한 관찰은 이 연구에서 식별된 시드 영역과 잘 일치한다. 예를 들어, 제안된 시드는 접근성이 더 높은 영역에 존재하며, Cmr1, Cmr6 및 Cmr4 엄지(thumb)와 상호작용한다. 이는 또한 위쪽으로부터 Cmr5에 인접한 crRNA의 첫 번째 세그먼트이다. 이는, 초기 표적 결합은 Cmr1 헤드의 가장 접근 가능한 '열린(open)' 영역에서 시작될 수 있지만, 중요한 시드 서열 잔기는, '닫힌(closed)' 주요(Cmr4) 및 소수(Cmr5) 골격 사이에 삽입함으로써 복합체 내에서 형태적 변화를 개시하는 데 필요하다는 것을 시사한다. 일단 시드 영역이 결합되면, TtCmr의 채널이 열릴 수 있고, 나머지 기질은 염기쌍을 형성할 수 있으므로 일치된 형태적 변화를 증식시킬 수 있다.
실시예 2
물질 및 방법
Cmr46-복합체 재구성
먼저 3.5 μL crRNA(700 ng)를 3.5 μL 1X Cmr 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl)에 첨가하였다. 이어서, 서브유닛들을 특정 순서(Cmr3, Cmr2, Cmr4, Cmr5, Cmr6, Cmr1)로 반응 혼합물에 첨가하여 각각 최종 농도 2.5 μM, 2.5 μM, 10 μM, 7.5 μM, 2.5 μM 및 2.5 μM이 되도록 하여, 20 μL의 총 반응 부피를 구성하였다. 65℃에서 30분 동안 반응 혼합물을 배양하였다.
분석에 사용된 표적 RNA 서열은 하기 서열을 포함한다:
(GAACUGCGCCUUGA)C(GUGGU)C(GUCCC)C(GGGCG)C(CUUAU)C(UACGGCCAUCG), 여기서 밑줄친 뉴클레오타이드는 데속시 기반 뉴클레오타이드이다. 이 표적 RNA는 Cmr-복합체에 의해 절단될 수 없다.
Pi 검출 분석
Cmr-복합체(62.5 nM)뿐만 아니라 RNA 기질(달리 명시되지 않는 한 200 nM)이 첨가된 TtCmr 활성 분석 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl, 10 mM DTT, 1 mM ATP, 및 0.5 mM MgCl2, 2 단위의 열안정성 무기 피로포스파타제(NEB#M0296S))에서 시험관내 cOA 검출 분석을 수행하였다. 달리 명시되지 않는 한, 반응을 65℃에서 1시간 동안 배양하였다. Sigma-Aldrich(MAK307)의 말라카이트 그린 인산염 분석 키트를 사용하여 신호를 시각화하였다.
Csx1 원리 증명 실험
Csx1 원리 증명 실험을 위해, 65℃에서 1시간 동안 배양한 후 95℃에서 10분 동안 샘플을 열 불활성화한 것을 제외하고는, "Pi 검출 분석"에 기술된 바와 같이 cOA 검출 분석을 수행하였다. 열 불활성화 후, 10분 동안 13.000 g에서 샘플을 스핀 다운시키고, 이후 상청액을 -20℃에서 저장하였다. TtCmr 활성 완충액(20mM Tris-HCl pH 8.0, 150mM NaCl, 10mM DTT, 1 mM ATP, 및 0.5 mM MgCl2, 2단위 열안정성 무기 피로포스파타제(NEB#M0296S)) 및 약 1.5 ug Csx1(TTHB144)의 반응 혼합물에, 2 uL의, 이전에 획득한 상청액을 첨가하고 65℃에서 10분 동안 배양하였다. 배양 후, 제공된 설명서에 따라 RNase alert(IDT#11-04-03-03) 또는 DNase alert(IDT#11-04-03-04) 시약을 첨가하였다. 형광을 측정한 후, 30분 동안 37℃에서 이 반응을 배양하였다.
결과
민감도 실험
시스템의 감도를 알아보기 위해, 반응시간(A)은 1시간, 발색 시간은 30분으로 설정하였다. 도 8a에 도시된 바와 같이, 500 pM 내지 1 nM 표적 RNA 범위에서 측정 가능한 판독값(비표적에 비해 약 2배 증가)을 얻었다. 효과적인 민감도를 증가시키기 위해 표적 RNA를 절단하는 능력을 결여한 돌연변이체 서브유닛을 제조하는 전략은, 복합체가 절단할 수 없는 표적 RNA를 사용함으로써 모방되었다.
시계열 실험
실험은 지정된 시점에서 측정 가능한 신호(블랭크 샘플에 대한 배수 증가로 표시됨)를 측정하도록 설정되었다. 총 반응 시간은 하기의 두 부분으로 구성되었다: A) 표적 RNA 첨가 시 Pi 생산 반응 및 B) 색 시약 첨가 후 비색 반응. 최종 출력은 조합된 두 반응 시간의 끝에 흡광도로 측정된 배수 증가였다. 최종 적용에서의 총 반응 시간의 지속 기간은 원하는 측정 가능한 임계값(블랭크 샘플, 음성 대조군에 대비한 배수 증가)에 의해 설정되었다. 도 8b에서, 데이터 세트는 15분의 설정된 색상 반응 시간(B)과 가변 Pi 생산 반응 시간(A)으로 선택되었다. 이것은 시스템에 대한 개념을 제공하기 위해 임의적으로 선택되었다.
Csx1 매개 원리 증명 실험
도 8c에 나타낸 이 원리 증명 실험은, 표적 RNA가 유도한 Csx1의 활성화를 증명하기 위해 수행되었다. cOA가 생성되도록 표적 RNA의 존재 하에 배양된 반응 혼합물의 일부를, Csx1 및 ssRNA 또는 ssDNA 소광제-형광단 서열을 함유하는 새로운 반응에 첨가하였다. 막대 그래프에 표시된 결과는 cOA 함유 혼합물의 첨가 시의 ssRNA 분해를 명확하게 보여준다. 이것은 Csx1이 표적 RNA의 인식 시 유형 III CRISPR Cas 시스템에 의해 간접적으로 활성화될 수 있음을 나타낸다.
실시예 3
물질 및 방법
Cas 단백질 및 Cas 복합체
표적화된 돌연변이 생성에 의해 Cmr4 D26N 절단-사멸 돌연변이체를 생성하였다. 모든 Cas 단백질 암호화 서열은, 이종 발현 숙주 대장균과의 상용성을 위한 코돈 최적화 후 합성 gBlocks(Integrated DNA Technologies (IDT))로서 생성되었다. 모든 암호화 서열은 당업자에게 공지된 표준 클로닝 방법을 사용하여 발현 벡터로 클로닝되었다. 또한, Cmr4 gBlock의 표적화된 돌연변이 생성에 의해 Cmr4 D26N 절단-사멸 돌연변이체를 생성하였다. 발현 벡터는 N- 또는 C-말단 Strep-태그, 선택적으로, TEV 절단 부위, 바이시스트로닉 설계 요소, T7 프로모터 서열, 터미네이터 서열, p15A 저카피 복제 기점, 및 카나마이신 내성 마커를 함유하였다. 발현 벡터 자체는 p15A 클로닝 벡터(Addgene 플라스미드 #41187)로부터 유래하였다. 모든 발현 벡터는 단백질 발현을 위해 대장균 BL21(DE3)으로 형질전환된다.
재조합 균주를 2 L 리소제니 브로스(LB: Lysogeny Broth) 배지에서 배양하였고, OD600이 약 0.6에 도달할 때까지 성장시켰다. 배양물을 1시간 동안 얼음 위에 놓은 후, 이소프로필 β-D-1-티오갈락토피라노사이드를 0.2 mM의 최종 농도로 첨가하였다. 이후, 배양물을 18℃에서 약 16시간 동안(밤새) 배양하였다. 세포를 수확하고(10분 동안 5.000 g) 초음파 처리에 의해 완충액 A(100 mM Tris-HCl, 150 mM NaCl, pH 8.0)에 용해시킨 다음, 30.000 g에서 45분 동안 스핀 다운시켰다. 정화된 용해물을 여과하고, 완충액 A 사전 평형화된 StrepTrap FPLC 컬럼(GE Healthcare, 일리노이주 시카고 소재)에서 실행하였다. 통과액에 더 이상 단백질이 존재하지 않을 때까지 완충액 A로 컬럼을 세척한 후, 완충액 B(100 mM Tris-HCl, 150 mM NaCl 및 2.5 mM D-데스티오비오틴)를 사용하여 관심 단백질을 용출시켰다. 필요한 경우, TEV 프로테아제(Genscript 카탈로그 번호 Z03030)를 첨가하여 친화성 태그로부터 단백질을 절단하고 4℃에서 밤새 배양되도록 방치하였다. HisTrap 친화성 크로마토그래피 단계에 의해 혼합물로부터 관심 단백질을 분리하였고, 통과액을 수집하였다. 필요한 경우, 더 높은 순도를 달성하기 위해 추가적인 크기 배제 크로마토그래피를 추가하였다.
Cmr46-복합체 및 dCmr46-복합체 재구성
먼저, 3.5 μL crRNA(700 ng)를 3.5 μL 1X Cmr 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl)에 첨가하였다. 이어서, 서브유닛들을 특정 순서(Cmr3, Cmr2, Cmr4 또는 Cmr4 D26N, Cmr5, Cmr6, Cmr1)로 반응 혼합물에 첨가하여 각각 최종 농도 2.5 μM, 2.5 μM, 10 μM, 7.5 μM, 2.5 μM 및 2.5 μM이 되도록 하여, 20 μL의 총 반응 부피를 구성하였다. 65℃에서 30분 동안 반응 혼합물을 배양하였다.
간접적인 cOA 검출 분석
재구성된 Cmr46-복합체(62.5 nM), 다양한 농도의 RNA 기질(표 4 또는 표 5에 나열됨), Csx1(1 uM) 및 0.5 uL RNaseAlert QC 시스템(Thermo Scientific, 설명서에 따라 제조됨)이 첨가된 TtCmr 활성 분석 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl, 10 mM DTT, 1 mM ATP, 및 0.5 mM MgCl2)에서 시험관내 cOA 검출 분석을 수행하였다. qPCR 유전자증폭기에서 65℃에서 반응을 배양하여, 2분 간격으로 형광 출력을 측정하거나(495/520 nm 여기/소광), 또는 Genie III(Optigene)에서 65℃에서 배양하여, 15초 간격으로 형광 출력을 측정하였다(495/520 nm 여기/소광). 다양한 농도의 표적 RNA에서의 측정을 사용하여 시스템의 민감도 범위를 측정하였다.
결과
dCmr46에 대한 표적 RNA 결합 능력 및 후속적인 Cmr2/Cas10 활성화의 확인
Cmr4 D26N 돌연변이체를 생성하였으며, 이는, 이것이 복합체의 절단 능력에만 영향을 미치고 이의 결합 능력 또는 Cmr2/Cas10 서브유닛의 후속적인 활성화에는 영향을 미치지 않는 것으로 가정되었기 때문이다. 이를 증명하기 위해, 이전에 기술된 간접적인 cOA 시각화 방법을 사용하여 표적 결합 능력을 측정하였다. 실제로, 돌연변이된 단백질은 전장 유형 IIIB 복합체(Cmr46)의 표적 결합을 제거하지 않았다(도 9, 도 10).
더욱이, 전장 촉매적 사멸 유형 IIIB 복합체(dCmr46)는 야생형 유형 IIIB 복합체와 비교할 때 표적 RNA 민감도를 증가시키는 것으로 밝혀졌다(도 9, 도 10). 또한, 상기 분석의 신호 출력은, 야생형 Cmr46과 비교할 때, dCmr46이 동일한 기간에 더 많은 cOA를 생산했음을 나타낸다(도 11). 본 발명자들은 진단 목적으로 Cmr4 D26N의 이러한 특성을 활용하는 것을 목표로 하며, 여기서 본 발명자들은 더 높은 표적 감도를 위한 시험관내 분석에서 이 돌연변이를 적용한다. 이는 분석 샘플에서 더 낮은 농도의 표적 물질을 검출하거나 또는 검출 한계에 도달하기 위해 필요한 사전 증폭 수준을 낮추는 이점을 제공한다.
표 5.
Figure pct00007
실시예 4. 테르무스 테르모필루스로부터의 유형- IIIA 시스템 ( Csm )
물질 및 방법
cOA 검출 분석
내인성 Csm-복합체(약 2 μg; 문헌[Staals et al., 2014. Mol Cell 56: 518-530])뿐만 아니라 RNA 기질(200 nM, 표 4에 나열됨)이 첨가된 TtCmr 활성 분석 완충액(20 mM Tris-HCl pH 8.0, 150 mM NaCl, 10 mM DTT, 1 mM ATP, 및 0.5 mM MgCl2)에서 시험관내 cOA 검출 분석을 수행하였다. 65℃에서 1시간 동안 반응을 배양한 후, 0.05 단위의 피로포스파타제(ThermoFisher EF0221)를 첨가한 다음, 25℃에서 30분 동안 배양하였다. Sigma-Aldrich(MAK307)의 말라카이트 그린 인산염 분석 키트를 사용하여 신호를 시각화하였다. 표 6에 표시된 레이아웃에 따라 실험을 수행하였다.
표 6.
Figure pct00008
결과
도 12는 유형 IIIa Csm cOA 생산 분석 결과를 보여준다. 이 유형-III CRISPR/Cas 복합체는 또한, 상보적 표적 RNA를 첨가한 후의 cOA 생산을 보여준다.
실시예 5. 원-포트 SARS-CoV-2 검출
물질 및 방법
유형 IIIB Cmr crRNA 및 RPA 프라이머의 설계
세계보건기구(WHO: World Health Organization)와 미국 질환 통제 예방 센터(CDC: Centers for Disease Control and Prevention)의 보고에 따르면, N 유전자가 SARS-CoV-2 검출에 적합한 표적으로 식별되었다. crRNA는 코로나바이러스와 같은 다수의 SARS-CoV-2에 보존되어 있는, CDC에 의해 N3로 지칭되는 N 유전자의 영역을 위해 설계되었다:
crRNA_N3: 5'-AUUGCGACGCAGCATTGTTAGCAGGATTGCGGGTGCCAATGTGATC 3'
N3 영역을 증폭시키기 위해, TwistAmp Liquid Basic 키트(TwistDx Ltd, 영국 메이든헤드 소재)에 의해 제안된 매개변수에 따라 RPA용 DNA 프라이머를 설계하였다. 또한, 시험관내 전사를 위한 정방향 프라이머의 5'에 T7 프로모터 서열을 첨가하였다. 성공적인 증폭을 위해 다수의 후보를 스크리닝함으로써, 본 발명자들은 가장 성능이 좋은 프라이머 쌍을 식별하였다.
nCOV_N3_RPA_F1: 5' GGCATAATACGACTCACTATAGGGTCTGATAATGGACCCCAAAATCAGCGAAAT 3'
nCOV_N3_RPA_R1: 5' CTCCATTCTGGTTACTGCCAGTTGAATCTG 3'
Cmr46 복합체는 crRNA_N3를 사용하여 이전에 기술한 바와 같이 재구성되었다.
SARS-CoV-2 검출 분석은 단일 반응에서 RPA 및 유형 IIIB Cmr 검출을 조합한다. 합성 SARS-CoV-2 게놈을 표적 RNA로 사용하였다. 이 게놈은 Twist Biosciences(캘리포니아주 사우스 샌프란시스코 소재)에 의해 마이크로리터 당 대략 106 카피로 6개의 비중첩 5kb RNA 단편으로 제공되었다. 참조 게놈은 분리물 Wuhan-Hu-1(GenBank ID: MN908947.3)을 기반으로 생성되었다.
TwistAmp Liquid Basic 키트(TwistDx)는 RPA에 의한 증폭용 시약을 제공하였다. 소량의 샘플로 작업할 수 있도록, 공급업체에서 제공한 모든 RPA 반응 혼합물을 4개의 동일한 부분으로 나누었다. 추가로, 올리고뉴클레오타이드 프라이머, 역전사 효소를 위한 성분 및 T7 시험관내 전사를 이들 혼합물에 통합하였다: 1.5 μL 프라이머 혼합물(10 mM; Integrated DNA Technologies), 0.5 μL M-MLV RT(100 U/μL; Invitrogen), 0.5 μL DTT(50 mM; Invitrogen), 0.25 μL 뮤린 RNase 억제제(40 U/μL, New England Biolabs(NEB)), 0.5 μL T7 중합 효소(50 U/μL, NEB), 2.25 μL dNTP 용액 믹스(10 mM; NEB) 및 2.25 μL NTP 용액 믹스(20 mM; NEB). RPA 혼합물 다음에, 0.125 μL RNaseAlert QC 시스템(Thermo Scientific, 1 mL 대신 100 μL에 재현탁된 제조업체에 의해 제공된 건조 펠렛), 1 μL Csx1(10 μM), 약 60 nM의 최종 반응 혼합물 농도의 Cmr46 복합체, 및 1 mM의 최종 반응 혼합물 농도의 ATP를 조합함으로써 SARS-CoV-2 Cmr 혼합물을 생성하였다. 두 반응 용액을 혼합한 후, 16.5 μL RPA 혼합물을 4.25μL SARS-CoV-2 Cmr 혼합물 및 1μL의 SARS-CoV-2 합성 게놈 템플릿과 조합하였다. 100,000 카피/μL 내지 10 카피/μL 범위의 게놈 템플릿을 함유하는 다수의 혼합물을 생성하였다. Genie III(OptiGene)에서 37℃에서 30분 및 65℃에서 45분 동안 반응을 배양하였다. 기기는 495/520 nm(여기/방출)에서 30분째부터 형광 판독을 수행하였다.
결과
SARS-CoV-2 검출 분석은 단일 반응에서 표적 유전 물질의 증폭과 검출을 조합한다. 이 원-포트 반응 혼합물을 37℃에서 45분 동안 배양(사전 증폭)한 후, 온도를 65℃로 증가시켰다(신호 생성). 도 13에는, SARS-CoV-2 합성 게놈의 배양 기간으로부터의 데이터가 도시되어 있다. 결과는, 65℃에서의 배양 몇 분 이내에, 음성 대조군(NC: negative control)에 비해 신호가 상당히 증가함을 보여준다. 신호 생성은 일반적으로 65℃에서 5분 동안 배양한 후에 이미 관찰될 수 있기 때문에, 사전 증폭 시간을 더 줄일 수 있는 것으로 추정된다.
실시예 6. 원-포트 SARS-CoV-2 검출의 검증
물질 및 방법
Wageningen Bioveterinary Research(WBVR)와 협력하여, 밍크 샘플에서 SARS-CoV-2에 대한 원-포트 유형 III 검출 분석을 검증하기 위해 소규모 시험을 수행하였다. Direct Zol RNA 미니프렙 키트(Direct Zol RNA miniprep kit) (Zymo Research)를 사용하여 4개의 COVID-양성 밍크(GenBank ID: MT396266, MT457390 및 MT457399)의 직장 면봉 샘플에서 RNA 추출을 수행하였다. 100 μL RNase 유리수에서 샘플을 용출시켰으며, 그 중 5 μL을 검출 분석을 위한 템플릿으로 사용하였다. TwistAmp™ nfo 키트(TwistDx)는 RPA에 의한 증폭용 시약을 제공하였다. 소량의 샘플로 작업할 수 있도록, 공급업체에서 제공한 모든 RPA 반응 혼합물을 4개의 동일한 부분으로 나누었다. 제공된 프라이머 무포함 재수화 완충액을 반응 당 1.05 μL의 프라이머 혼합물(5 mM 정방향 및 역방향; Integrated DNA Technologies)과 조합한 후, 제공된 RPA 펠렛을 재수화하는 데 사용하였다. 또한, 4.5 μL 재구성된 Cmr46 복합체(최종 반응 혼합물 농도 약 60 nM, N3 유전자 crRNA 탑재됨), 0.125 μL RNaseAlert QC 시스템(Thermo Scientific, 1 mL 대신 100 μL에 재현탁된 제조업체에 의해 제공된 건조 펠렛), 0.25 μL ATP(80 mM; Sigma Aldrich), 1 μL Csx1(10 μM), 0.5 μL M-MLV RT(100 U/μL; Invitrogen), 0.5 μL DTT(50 mM; Invitrogen), 0.25 μL 뮤린 RNase 억제제(40 U/μL, New England Biolabs (NEB)), 0.5 μL T7 중합 효소(50U/μL; NEB) 및 2 μL NTP 용액 믹스(20 mM; NEB)를 조합함으로써 유형 IIIB Cmr 혼합물을 생성하였다. 각각의 분석 반응에 대해, 8.425 μL RPA 혼합물을 5.625 μL Cmr 혼합물, 0.625 μL MgOAc(280 mM, TwistDx), 및 5μL 템플릿 또는 RNase 무포함 MQ와 조합하여, 총 19.675 μL를 구성하였다. 양성 대조군으로서, 5 μL의, 100 카피/μL의 SARS-CoV-2 합성 게놈(실시예 5 참조)을 사용하였다. 반응 혼합물을 Genie III(OptiGene) 분광광도계에서 37℃에서 45분 동안 배양한 후, 65℃에서 30분 동안 배양하였다. 65℃ 배양 기간 동안 데이터 수집을 수행하며, 15초 간격으로 495 nm/520 nm(여기/방출)에서 형광을 측정한다.
결과
2020년 4월말에 네덜란드 밍크 농장에서 SARS-CoV-2가 처음 발생한 이후로, WBVR은 네덜란드에서의 밍크에 대한 모든 진단 시험을 담당하였다. 추출된 RNA 샘플이 제공되었고, 후속적으로, 단일 반응에서의 표적 유전 물질의 증폭과 검출을 조합한 진단 분석에 사용되었다. 이 원-포트 반응 혼합물을 37℃에서 45분 동안 배양(사전 증폭)한 후, 온도를 65℃로 증가시켰다(신호 생성). 밍크 SARS-CoV-2 샘플의 배양 기간으로부터의 데이터를 도 14에 도시하였다. 이 결과는 65℃에서 배양 후 30분 이내에 SARS-CoV-2의 검출이 가능함을 분명히 보여주며, 실제의 복잡한 샘플 매트릭스에 대한 이 기술의 적용 가능성을 보여준다.
SEQUENCE LISTING <110> WAGENINGEN UNIVERSITEIT <120> TYPE III CRISPR/CAS-BASED DIAGNOSTICS <130> IF21P268/NL <140> PCT/NL2020/050400 <141> 2020-06-19 <150> EP 19181371.6 <151> 2019-06-19 <150> EP 20168487.5 <151> 2020-04-07 <160> 86 <170> PatentIn version 3.5 <210> 1 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> c-myc domain tag <400> 1 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 2 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> hemagglutinin tag <400> 2 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 3 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> FW primer RfaH <400> 3 tacgcccgcc gttgac 16 <210> 4 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Rv primer RfaH <400> 4 agccagcagg cgcaaa 16 <210> 5 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> CY5 oligo RfaH <400> 5 aacaggacga atactgacgc gcca 24 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Fw primer CopG <400> 6 cgaagaagac ggcatggaat 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Rv primer CopG <400> 7 cgcagatccg gaggtcatta 20 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> YY oligo CopG <400> 8 tcaacgtcag ctacgcaagg agtg 24 <210> 9 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 3 Pgi <400> 9 gaaggtgaag atgttcataa tcacg 25 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 2 Pgi <400> 10 cgtgaaatca cgccgttcag 20 <210> 11 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 3 Pgi <400> 11 gcgtgaaatt aagccgttca g 21 <210> 12 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> YY oligo Pgi <400> 12 catacagggc aatcagcgcg cc 22 <210> 13 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 1 MrkC <400> 13 atgtgtatac caatggtgag tggaa 25 <210> 14 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 1 MrkC <400> 14 gcccattttg ccgtctttt 19 <210> 15 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> FAM oligo MrkC <400> 15 ccgctacgac ctgaatatca cccgtg 26 <210> 16 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 1 Cfa <400> 16 cctggtggcc gggatt 16 <210> 17 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 1 Cfa <400> 17 gtccagcgca ttcagatgag t 21 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 3 Cfa <400> 18 ggcatcaagc gcattaagat gtat 24 <210> 19 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> FAM oligo Cfa <400> 19 ccgcaaccct ttccgatctg gag 23 <210> 20 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 1 Xx <400> 20 acaaaggagt cgggatgagt tc 22 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 1 Xx <400> 21 cgaccattgc tcgtaaggct 20 <210> 22 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> FAM oligo Xx <400> 22 caatcccagg ccaaatcacc gg 22 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 2 Omp <400> 23 cccatgcttc agctttgtca 20 <210> 24 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Rv primer 2 Omp <400> 24 ctgcaggtta cgctaactcc aa 22 <210> 25 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> FAM oligo Omp <400> 25 cgttgccgtc acgtttctgg tcaa 24 <210> 26 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 1 OprL <400> 26 gcgtcgagct gaagaagtaa gaag 24 <210> 27 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Rv primer OprL <400> 27 ggctgagcgc gaggaa 16 <210> 28 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> CY5 oligo OprL <400> 28 cccaagcacc tgcgtgtcct gac 23 <210> 29 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Fw primer 2 RecG <400> 29 gcgaaatgga tgtatcaatc attg 24 <210> 30 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Rv primer RecG <400> 30 tttccatcca ttctaaaaca gtatctaact 30 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YY oligo RecG <400> 31 acacgttgga ttcggccgcc 20 <210> 32 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Fw primer Hns <400> 32 gcacgtttag cacgaccagt t 21 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Rv primer Hns <400> 33 tgccgatggt attgatccaa 20 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> FAM oligo Hns <400> 34 cgccagcagc ttcaagcagg tca 23 <210> 35 <211> 53 <212> RNA <213> Artificial Sequence <220> <223> crRNA 4.5, 46nts <400> 35 auugcgaccc guagauaagg cgcccgggga cgaccacguc aaggcgcagu ugc 53 <210> 36 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> crRNA 4.5, 34nts <400> 36 auugcgaccc guagauaagg cgcccgggga cgac 34 <210> 37 <211> 40 <212> RNA <213> Artificial Sequence <220> <223> crRNA 4.5, 40nts <400> 37 auugcgaccc guagauaagg cgcccgggga cgaccacguc 40 <210> 38 <211> 46 <212> RNA <213> Artificial Sequence <220> <223> crRNA 4.5, 46nts <400> 38 auugcgaccc guagauaagg cgcccgggga cgaccacguc aaggcg 46 <210> 39 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Target RNA 1 <400> 39 gaacugcgcc uugacguggu cguccccggg cgccuuaucu acggccaucg 50 <210> 40 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Matched -3/-1 target RNA <400> 40 guugugcgcc uugacguggu cguccccggg cgccuuaucu acggguccgu 50 <210> 41 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Matched -4/-2 target RNA <400> 41 guugugcgcc uugacguggu cguccccggg cgccuuaucu acggcucggu 50 <210> 42 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Matched -5/-3 target RNA <400> 42 guugugcgcc uugacguggu cguccccggg cgccuuaucu acggcacgcu 50 <210> 43 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +1 RNA target <400> 43 gaacugcgcc uugacguggu cguccccggg cgccuuaucu acgcccaucg 50 <210> 44 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +2 RNA target <400> 44 gaacugcgcc uugacguggu cguccccggg cgccuuaucu accgccaucg 50 <210> 45 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +3 RNA target <400> 45 gaacugcgcc uugacguggu cguccccggg cgccuuaucu agggccaucg 50 <210> 46 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +4 RNA target <400> 46 gaacugcgcc uugacguggu cguccccggg cgccuuaucu ucggccaucg 50 <210> 47 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +5 RNA target <400> 47 gaacugcgcc uugacguggu cguccccggg cgccuuauca acggccaucg 50 <210> 48 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +6 RNA target <400> 48 gaacugcgcc uugacguggu cguccccggg cgccuuaugu acggccaucg 50 <210> 49 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +7 RNA target <400> 49 gaacugcgcc uugacguggu cguccccggg cgccuuaacu acggccaucg 50 <210> 50 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +1-5 RNA target <400> 50 gaacugcgcc uugacguggu cguccccggg cgccuuauca ugccccaucg 50 <210> 51 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +7-11 RNA target <400> 51 gaacugcgcc uugacguggu cguccccggg cgcgaauacu acggccaucg 50 <210> 52 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +13-17 RNA target <400> 52 gaacugcgcc uugacguggu cguccccccc gcccuuaucu acggccaucg 50 <210> 53 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +19-23 RNA target <400> 53 gaacugcgcc uugacguggu ccagggcggg cgccuuaucu acggccaucg 50 <210> 54 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +25-29 RNA target <400> 54 gaacugcgcc uugaccacca cguccccggg cgccuuaucu acggccaucg 50 <210> 55 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +31-35 RNA target <400> 55 gaacugcgcg aacucguggu cguccccggg cgccuuaucu acggccaucg 50 <210> 56 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Target RNA 2 <400> 56 gaacugcgcc uugacguggu cguccccggg cgccuuaucu acggccaucg 50 <210> 57 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +11 RNA target <400> 57 guugugcgcc uugacguggu cguccccggg cgcguuaucu acggcagcgu 50 <210> 58 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +17 RNA target <400> 58 guugugcgcc uugacguggu cgucccccgg cgccuuaucu acggcagcgu 50 <210> 59 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +23 RNA target <400> 59 guugugcgcc uugacguggu ccuccccggg cgccuuaucu acggcagcgu 50 <210> 60 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +29 RNA target <400> 60 guugugcgcc uugaccuggu cguccccggg cgccuuaucu acggcagcgu 50 <210> 61 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Mismatched +35 RNA target <400> 61 guugugcgcg uugacguggu cguccccggg cgccuuaucu acggcagcgu 50 <210> 62 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> target RNA <220> <221> misc_feature <222> (15)..(15) <223> desoxy-based nucleotide <220> <221> misc_feature <222> (21)..(21) <223> desoxy-based nucleotide <220> <221> misc_feature <222> (27)..(27) <223> desoxy-based nucleotide <220> <221> misc_feature <222> (33)..(33) <223> desoxy-based nucleotide <220> <221> misc_feature <222> (39)..(39) <223> desoxy-based nucleotide <400> 62 gaacugcgcc uugacguggu cguccccggg cgccuuaucu acggccaucg 50 <210> 63 <211> 46 <212> RNA <213> Artificial Sequence <220> <223> crRNA 4.5, 46nts <400> 63 auugcgaccc guagauaagg cgcccgggga cgaccacguc aaggcg 46 <210> 64 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Target RNA 1. This RNA was also used as off-target in the norovirus assays. <400> 64 gaacugcgcc uugacguggu cguccccggg cgccuuaucu acggccaucg 50 <210> 65 <211> 46 <212> RNA <213> Artificial Sequence <220> <223> crRNA norovirus, 46nts <400> 65 auugcgacac uuaagccuuc aguuggaaaa uuugguggga cugcug 46 <210> 66 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> Target RNA norovirus <400> 66 gcaaguaauu cucgcgggga acgcguucac cgccgggaag aucauauuug cagcaguccc 60 accaaauuuu ccaacugaag gcuuaagucc uagccagguc acuauguucc cccaua 116 <210> 67 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Off-target RNA <400> 67 cguaaacgac ggccagugcc aagcuuacua uacaaccuac uaccucauca 50 <210> 68 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> crRNA_N3 <400> 68 auugcgacgc agcattgtta gcaggattgc gggtgccaat gtgatc 46 <210> 69 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> nCOV_N3_RPA_F1 <400> 69 ggcataatac gactcactat agggtctgat aatggacccc aaaatcagcg aaat 54 <210> 70 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> nCOV_N3_RPA_R1 <400> 70 ctccattctg gttactgcca gttgaatctg 30 <210> 71 <211> 1755 <212> DNA <213> Artificial Sequence <220> <223> tthb160 optimized <400> 71 atggaacact tgctggcgat cgccttgggt ccggtccaag aatttatcgc gacagcccgt 60 cgcacacgtg atttgtatgc ggggtcacgt ttgttgagtg aggcagccgc gcgtgcagct 120 aaagcattgg cgcgtgaagt aggggcaaaa aaccttatct tccccgctcc cgaggatgag 180 gctgggctgg agcgtttagc gggggctggg attccgaacg ttttgcttgt tcgtgtcccg 240 gaaggtaaag atccgcgtgg gttgggcgag caggcacttg gggcggcacg tgactattta 300 cgcgaacgcg ctgaggaagt cttaggtccc cgtcgcgatc ttttattctg gcgtgaggct 360 ttagcacaag tggaggacct gttagaaggc tattacgcgt atcttccttt agaaggcgac 420 tatcctcgcg cgcgcgagcg tctgatggcc cttttggcgg cccgcaagaa cacacgcgat 480 tttgccccgg tttcttgggg ctcccccgct tataagtctt cccttgacgg tgcacgcgag 540 agcgtattgc gtttaccaga aaaggaagcg gaccatcttc gcgttcgtct ggggttacgc 600 cccggggaat acctggccgg gccggacctg ttaaagcgtt ggtggaaggc aggtcatggg 660 ttcttaagta ctacccacat ggcagcactg ccattttggg aaggggttcg ccgcgcaggg 720 cttgaagccg tgcttaaaga ggcgctggag gaacttgggg gtttagttgg cgaggaggcc 780 cgtgcggagg ttcgtcatcc agttctgcgt gatactccat ttggcgaatg ggacgtacgt 840 cttttgtacg aaagccgttt agaggagttt ccgtcattag ccgaagaccc cgggttattg 900 gagaaagctc gcgatcgcct gcgtgcgtta tggcgtcgct tgtttcccaa ggttcgcgta 960 ccaccagggg catactatgc gctgttgcac gccgatggcg atcgcatggg agaaacattg 1020 gacggattgc cttcaccaga agctcatcgc cgcttttcaa atgcgcttgc attagggttt 1080 gccgcgcagg tcaaggacat tgtggaagct catggtggag ggttagtata ttcaggcggg 1140 gacgatgtgt tagccctgct tccactgcac acagccttaa tggcggcacg tgctttagca 1200 gatcgcttcc gcgaagctat ggcacctttt gggcgcgaag gccgcgcgcc ctctttatcc 1260 gtagggcttg cagtagtaca ccacttggag cctctgcaag acgcattgga tcttgcgcgc 1320 cgcgcggaaa agtgggctaa agaaggtgaa ccaaagcgta atgcattgtg cgttgcctat 1380 tccccgcgta gtggagcaga acgtttagta cgtggccgtt gggacgagaa tccgccactg 1440 actcgccgct tgctgcgtta cgccgacctg ttacgcgccg gggaggtgcc tagtcgcgcc 1500 gcatacgagt tgttagcact ggtccgcgaa gctggcgagg ccttgtcagg ggaagccctg 1560 gtagctgagg ccttacgtat cttgggtcgc aaagaaatga aacgtgctta ccgtgaagag 1620 ttggaagcct ggctgcgcac tggcgaagat gttcgtcgcc tggcagagga attaattctt 1680 gctcgccctt tcgcagaggc cctggaccaa gctggcgtgc ccgtcgagag tcgtgaagtg 1740 tgggacgcgc attaa 1755 <210> 72 <211> 1086 <212> DNA <213> Artificial Sequence <220> <223> tthb161 optimized <400> 72 atgctcatcg agcctcgcga tccgctgatt gtgcgcgacg gacgcccctt tactaacagt 60 cctggtgcgc gcgcgaaatc gttaccattt ccgctgccgc agacattggc tggtgcctac 120 cgtacccgcc gcgcgctttt ggaggggttg ccacttccgg aacgtgcgga ggaggtctta 180 cgctggggtc ttcgtggccc gctgttggcc gaagagggtg aggggggttg gcgtctgtta 240 gcacctcgcc cgttggatgc gctgaagctt ggcgaggcac tgtatccctt gcgccctctt 300 gagttgccgc aaggtgcggg taccaacctg cccgaggggt tatctcccgt tggcctgcca 360 agcccggcgc ttaaagaaaa gccggccccg ttgccggcat tttggtactg ggagtctttc 420 cttgagtggt tgcttcaaga tgcccctgca ggttttgcgc cccgtggaca tgaaggtcct 480 gtgcctgaga cacgtacaca tgtcgcactt gacccagcag cacaaaccgc gcgtgaggga 540 ttcttattcc aaacatcggg gcttgaattt gttcgtggac gccgtcgtct tgctctggtg 600 ttgtggcccg aagggcccga gccagaagga gttttcccac ttggtggaga acgccgctta 660 gctttttggc aaaaaggggg cccgggggtg cctcctttac cagaggaagt cgttgctggc 720 ctgttacgtc atcgtgcagc gcgtcttgta tttcttacac ccgcgtttct gggcgaggct 780 taccttccaa agggtcgcgc cttccaaggc gctagcgtgg tggcggccgt cgtaggccgt 840 ccattagccg tgtccggatg gaatttgaag gaaggtaaac cgaaaccttc ccgtcgcgcc 900 gtgcctgctg ggagcgtgta cttcgtccgt cttccggaag cgtggggtga aggagaggta 960 cgtgactggg cggagaaagt ctggttccaa aacctttccg aggaggaaca ggatcgtcgt 1020 gacgggttcg ggcttgccgc gttaggcctt tgggatggga aacttcgtcg ctgggaagag 1080 gcctga 1086 <210> 73 <211> 1188 <212> DNA <213> Artificial Sequence <220> <223> tthb162 optimized <400> 73 atgagacgcg catttcgcga ggcattctcc ccccgtcgca aggaagaggg tggtgttctt 60 gtgcgccgcg atggcgctcg tgtgctggct tgggaacgta cgtatactct tttgacaccg 120 ttgtttggcg gaggtgttga accacgtgaa gcggacccag tgtcagtggt gcgcgcaacc 180 gcagtccgcg ggcacttacg tttctggtgg cgtgctgttc gcggctggcg tgcaggagga 240 tctcttgaac gcttgtggga gcttgagtcc gcattgtttg ggtcagctgg agaagggggg 300 gcatcaccgc tgtcggttga agttgaggtc ttacgtgagg gggaaaaggt gggtattgct 360 caatacgggc gtgcggttca atggtacctg ggtttcccac ttcgtggcga caaagagtgg 420 gcaccagtaa aagagggggt agcgtttcgt cttcgcctgc gctttcccga gaaagtgggg 480 gagcttaatt tctgggagga attggaggcg gcactttggg cttgggaaac atttgggggc 540 attggtgcgc gtacgcgccg tggattcggc gcattattac cgcaaggggc tggtgttccc 600 ggggaagaag aaattcgtga gaaacttcgc caatatggac aaaaagcggg gtggccggaa 660 ggcgttccgc acttgacgcc aaaaagcttt gtgcgtgtgg tgcctttatc gtggcgtgag 720 ctggccgagc gctatcaggc ttttcgtcag gctcgcccgg gcggagatcc gcgcagtccc 780 ggtcgcagct actggccgga acctgatggc gtacgtcgct tgacagggcg tcacgcacct 840 catcatttgc cacgccatcc agtacataaa tttccccgcg ctcatttcgg cctgccaatc 900 attttccatt tcaaagaccg tggtgatccc ccagatacta ccttgcgcct taaagaagct 960 gaccgccgcg cctctccgtt gttatttcgc ccattgggcg agggtcaaaa accctgcgtt 1020 gtggccgtct tggagggggc ccgctttccc ggggagaaat tggttttgga aggaaaggat 1080 ggtcgtacat gggatgtgga tccctggttg acccccgaag aggcacagaa gattcccgta 1140 ttgggtggcg aagtggatcc tgttttagca tttgttaagt ctctgtag 1188 <210> 74 <211> 861 <212> DNA <213> Artificial Sequence <220> <223> tthb163 optimized <400> 74 atgagccatg tcgcattgtt attcttacat gcgttatctc ccctgcatgc cgggactggc 60 caaggcatcg gtgccattga cttgcctatc gcacgtgaga aggcaactgg gattccctac 120 ttacccggaa gttcgcttaa aggcgtgttg cgcgaccgcg ccagtgcctg ggaccgcgat 180 accttgttcg cagtatttgg tccagatacg gagaacgcta gcgagcacgc aggcgccgtt 240 caggtcggtg acgccaagtt attattatta ccggtgcgta gtttatacgg tgtattcgct 300 ttagttgcgt ctccgtactt gctggagcgt ttccgccgcg aggccttgat ggctggtctt 360 caaccgcctg gggttcctgg tttacaagat cctactcgcg ttctgttggc accaggatca 420 cgcttacttg gagatgggga gaaagtgtac ttagaggacc tggacttaaa agcgcagggg 480 gaggaaggag ttgccgcctg ggagcgttgg ctggcagaac gtactgaggc gccagttttg 540 ggacgcctgg ctgtagtaca tgatgacctt atgggttttc ttcttgagac agccaccgaa 600 gtagtagccc gtatccgtct ggacgatgaa accaaaacag tcgccaaagg cgctttgtgg 660 tatgaggaat cccttcccgc cgaatcgttg ctttacgcat tagtccgtgc tgaccgctcg 720 ttccgcaagg gcaaggaatt gccaccagag ggagtgtggg cactttttcg cggtgtcctt 780 gaagagggtg ggggtgtgtt gcagcttgga ggcaaggcta cggtagggcg tggcctgtgt 840 cgcatcgtag tcgggcgtta g 861 <210> 75 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> tthb164 optimized <400> 75 atgcgcacac gtagtcaagt ctgggcccaa aaggcctatg agaaggtacg tgaagctgcc 60 aagggagagg gccgcgggga ataccgtgac atggccctga agttgcctgt tcttgtgcgt 120 caggcaggtc tgtcccaggc attggcgttc gtcgatagtc gtggcaagga ggcacataag 180 gcccttggta atgatttagc gcaggtgtta ggataccgcg atctgcgcga attggcggag 240 gcggctcgtg aagcggagct tctgcaatac cttcgtttga cgcgcgaagt gcttgctgcc 300 gcggagtggt tcaaacgttt cgcccaagcg ttgatcgaag agtag 345 <210> 76 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> tthb165 optimized <400> 76 atgggccgtc gttccgcctt ggagggagta cgcttgcctc aaggcaagga accgcatcgt 60 ggcctttggc tggacaaatt cttacgttcg gcacgccgcg aagatacaga ggctaaacgc 120 gtccttgttc gtgaagcggc gggtattccg gagcctggtg aatatcgcgc cttcttcaag 180 cgctatcgtg gtgcgctgga agctttgggt gcggaaattc gcgaagcccg cactctttct 240 cgcttggtgg tcggtttagg aggcgaaggg gttcttgaga ctgctttaac cctgcatcgt 300 gcttatgggg tgccctatat tcctggcagc gcacttaagg gcttagctag ccgctacgct 360 cacctgtact tggagggtga agcctggcgt cgcgatctgg cgcgttttca ccgcggggag 420 gcgcaggctg gcctgttcgg gacaacggag gaacaaggtt tggttgtctt ttgggatgcc 480 cttccccttc cagggaaatg gaagctgcat cctgatattc ttaatccgca tcacccagat 540 tactacgggt cagttaaagc tccacccgcc gactgggacg gtcccaaacc tgttcctttc 600 ttgagcgcaa ccggaacgtt cttattggcg ttatctccag ctcccggtgt gtcaccggag 660 gaagccgggc catggcttcg cgctgcttgg cgtatcttag cttgggccct tcgtgaggaa 720 ggagtcgggg caaaaacatc ctccggatac ggccgtatgg cattagaaga acccgcctct 780 cagggggaaa agccattagc cccaggtcct tcgcctgtcc tgcaagactt actgacttgg 840 gctcgcgcgt taagttaccg tgaggttccg cgctttttag ccagccaagc ggaggcgatc 900 ttgggcttgt cggttgagga agctcaagca cttcgccgcg cacttgagga gcgcggtttc 960 ttacgtaacc cgcaggatct taaacgctgg cgtaaggagc acccgggact tgagggggta 1020 ttagcgaagc ttggtcttag tgcatag 1047 <210> 77 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> Pf_Cmr4 <400> 77 Met Lys Ala Tyr Leu Val Gly Leu Tyr Thr Leu Thr Pro Thr His Pro 1 5 10 15 Gly Ser Gly Thr Glu Leu Gly Val Val Asp Gln Pro Ile Gln Arg Glu 20 25 30 Arg His Thr Gly Phe Pro Val Ile Trp Gly Gln Ile Asn Ala Glu Thr 35 40 45 Gly Thr Val Glu Thr Gly Gly Leu Trp Tyr Glu Glu Tyr Ile Pro Ser 50 55 60 Asp Thr Leu Phe Tyr Ser Leu Ile 65 70 <210> 78 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Tm_Cmr4 <400> 78 Met Ser His Val Ala Leu Leu Phe Leu His Ala Leu Ser Pro Leu His 1 5 10 15 Ala Gly Thr Gly Gln Gly Ile Gly Ala Ile Asp Leu Pro Ile Ala Arg 20 25 30 Glu Lys Ala Thr Gly Ile Pro Tyr Leu Pro Gly Ser Ser Leu Asp Asp 35 40 45 Glu Thr Lys Thr Val Ala Lys Gly Ala Leu Trp Tyr Glu Glu Ser Leu 50 55 60 Pro Ala Glu Ser Leu Leu Tyr Ala Leu Val 65 70 <210> 79 <211> 70 <212> PRT <213> Artificial Sequence <220> <223> Tt_Cmr4 <400> 79 Met Glu Gly Arg Val Phe Leu Leu Tyr Ala Glu Thr Gln Val His Ala 1 5 10 15 Gly Thr Gly Phe Glu Ile Gly Val Val Asp Leu Pro Ile Gln Arg Glu 20 25 30 Arg Thr Thr Lys Phe Pro Ile Ile His Gly Asn Arg Glu Lys Lys Thr 35 40 45 Val Glu Glu Gly Gly Leu Trp Tyr Glu Glu Tyr Leu Pro Gln Asp Thr 50 55 60 Val Met Tyr Phe Val Val 65 70 <210> 80 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> SSo_Cmr4 <400> 80 Met Ile Ile Met Thr Tyr Tyr Thr Phe Val Lys Pro Phe Phe Ile Lys 1 5 10 15 Ala Val Thr His Leu His Val Ser Ser Gly Thr Ser Val Glu Glu Glu 20 25 30 Val Asp Leu Pro Phe Gln Arg Asp Glu Leu Asn Tyr Pro Thr Ile Phe 35 40 45 Ala Ser Ser Leu Lys Arg Ser Ser Lys Thr Val Glu Glu Gly Gly Leu 50 55 60 Trp Ser Glu Glu Tyr Val Pro Val Asn Ser Leu Phe Phe Ser Ser Phe 65 70 75 80 <210> 81 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Pf_Cmr4 <400> 81 Met Lys Ala Tyr Leu Val Gly Leu Tyr Thr Leu Thr Pro Thr His Pro 1 5 10 15 Gly Ser Gly Thr Glu Leu Gly Val Val Asp Gln Pro Ile Gln Glu Leu 20 25 30 Ser Thr Glu Ile Val Ala Arg Ile Arg Ile Asn Ala Glu Thr Gly Thr 35 40 45 Val Glu Thr Gly Gly Leu Trp Tyr Glu Glu Tyr Ile Pro Ser Asp Thr 50 55 60 Leu Phe Tyr 65 <210> 82 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Mk_Csm3 <400> 82 Met Val Gly Ile Gly Gly Thr Ile Thr Leu Val Gly Glu Ile Arg Leu 1 5 10 15 Arg Thr Gly Thr Arg Ile Gly Thr Ser Glu Glu Glu Ile Glu Ile Gly 20 25 30 Gly Leu Asp Asn Pro Val Ile Gly Glu Pro Thr Glu Val Lys His Glu 35 40 45 Asn Ala Ile Asn Arg Val Ser Gly Glu Ala Asn Pro Arg Ser Met Glu 50 55 60 Arg Val Pro Lys Gly Ser Arg Phe Gly Leu 65 70 <210> 83 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Ph_Csm3 <400> 83 Met Asn Arg Glu Phe Tyr Gly Lys Ile Ile Ile Ser Gly Glu Ile Glu 1 5 10 15 Ala Val Thr Gly Leu His Ile Gly Ser Gln Arg Glu Val Ser Glu Ile 20 25 30 Gly Gly Ile Asp Asn Pro Val Ile Ala Ile Thr Glu Ala Lys Ile Glu 35 40 45 Val Gly Ile Asp Arg Val Thr Ser Gln Ala Asn Pro Arg Thr Thr Glu 50 55 60 Arg Val Val Ala Gly Thr Arg Phe Asp Phe 65 70 <210> 84 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Tt_Csm3 <400> 84 Met Lys Leu Lys Lys Val Ile Arg Ile Arg Ser Val Leu Leu Ala Lys 1 5 10 15 Thr Gly Leu Arg Ile Gly Met Ser Arg Asp Gln Met Ala Ile Gly Asp 20 25 30 Leu Asp Asn Pro Val Val Gly Leu Tyr Thr Glu Ile Lys Gln Glu Val 35 40 45 Phe Ile Pro Arg Leu Gly Gly Asn Ala Asn Pro Arg Thr Thr Glu Arg 50 55 60 Val Pro Ala Gly Ala Arg Phe Arg Val 65 70 <210> 85 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Tm_Csm3 <400> 85 Met Glu Arg Pro Ile Leu Gly Lys Tyr Ile Ile Lys Gly Lys Ile Ile 1 5 10 15 Leu Glu Thr Gly Leu Arg Ile Gly Gly Gln Glu Leu Gly Val Asn Ile 20 25 30 Gly Gly Ile Asp Asn Pro Val Ile Pro Tyr Thr Glu Trp Lys Thr Glu 35 40 45 Asn Ala Leu Asp Arg Val Thr Cys Lys Ala Asp Pro Arg Ser Phe Glu 50 55 60 Arg Ile Pro Ala Gly Ala Glu Phe Glu Phe 65 70 <210> 86 <211> 81 <212> PRT <213> Artificial Sequence <220> <223> Si_Csm3 <400> 86 Met Ser Ser Gln Pro Ser Ile Ser Leu Lys Leu Glu Lys Ile Ile Arg 1 5 10 15 Phe Lys Val Tyr Leu Gln Thr Ile Thr Gly Leu Leu Ile Ser Ala Gly 20 25 30 Lys Ala Leu Gly Arg Ile Gly Gly Ala Asp Thr Glu Pro Met Ser Asp 35 40 45 Phe Ile Glu Asp Lys Asn Glu Asn Arg Ile Asp Arg Val Thr Ser Ala 50 55 60 Ala Asp His Arg Thr Ile Gly Arg Val Lys Pro Gly Val Thr Phe Thr 65 70 75 80 Gly

Claims (17)

  1. 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 기반 리보핵산 검출 시스템으로서,
    a) 유형 III CRISPR-연관 이펙터 단백질(Cas) 및 표적 핵산 분자에 결합하는 적어도 하나의 CRISPR RNA(crRNA)를 포함하는 이펙터 복합체;
    b) 사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하기 위한 수단을 포함하는, 클러스터링된 규칙적 간격의 짧은 회문 반복부(CRISPR) 기반 리보핵산 검출 시스템.
  2. 제1항에 있어서, 상기 유형 III Cas는 유형 IIIB Cas, 바람직하게는 유형 IIIB Cmr인, 검출 시스템.
  3. 제1항 또는 제2항에 있어서, 상기 유형 III Cas는 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래하는, 검출 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 유형 III Cas는 절단 활성이 없는, 검출 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, cOA의 수준을 직접 또는 간접적으로 측정하기 위한 상기 수단은 피로인산염(PPi)의 수준을 측정하기 위한 수단을 포함하는, 검출 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 무기 피로포스파타제를 추가로 포함하는, 검출 시스템.
  7. 제6항에 있어서, 상기 무기 피로포스파타제는 테르무스 테르모필루스와 같은 호열성 유기체로부터 유래하여, 등온 검출을 가능하게 하는, 검출 시스템.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, Csx1과 같은 cOA-의존성, 비특이적 이펙터 엔도리보뉴클레아제를 추가로 포함하는, 검출 시스템.
  9. 제8항에 있어서, Csx1과 같은 cOA-의존성, 비특이적 이펙터 엔도리보뉴클레아제, 및 상기 엔도리보뉴클레아제에 대해 검출 가능한 기질을 추가로 포함하는, 검출 시스템.
  10. 샘플 내의 표적 핵산 분자의 존재 또는 부재를 측정하는 방법으로서,
    상기 샘플에 제1항 내지 제9항 중 어느 한 항에 따른 리보핵산 검출 시스템을 제공하는 단계;
    crRNA와 이의 표적 핵산 분자의 결합을 허용하는 조건 하에 상기 샘플을 배양하는 단계; 및
    사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하는 단계로서, 대조군과 비교하여, 측정된 cOA 수준의 증가가 상기 샘플 내의 상기 표적 분자의 존재를 나타내는 것인, 단계를 포함하는, 샘플 내의 표적 핵산 분자의 존재 또는 부재를 측정하는 방법.
  11. 제10항에 있어서, cOA의 수준은 피로인산염의 수준, 또는 무기 피로포스파타제가 상기 검출 시스템 내에 존재하는 경우 무기 인산염의 수준을 측정함으로써 측정되는, 방법.
  12. 제10항 또는 제11항에 있어서, 피로인산염 또는 무기 인산염의 수준이 비색-, 형광분석-, 형광- 또는 생물발광-기반 분석에 의해 측정되는, 방법.
  13. 제10항에 있어서, cOA의 활성 수준은 제8항 내지 제9항 중 어느 한 항에 따른 검출 시스템을 사용하여 상기 이펙터 엔도리보뉴클레아제에 대해 검출 가능한 기질을 검출함으로써 Csx1과 같은 cOA-의존성, 비특이적 이펙터 엔도리보뉴클레아제의 수준을 측정함으로써 간접적으로 측정되는, 방법.
  14. 제10항 내지 제13항 중 어느 한 항에 있어서, 상기 샘플은 37℃ 내지 85℃, 바람직하게는 약 65℃의 온도에서 상기 리보핵산 검출 시스템을 이용하여 배양되는, 방법.
  15. 장치로서, 제1항 내지 제9항 중 어느 한 항에 따른 리보핵산 검출 시스템을 포함하는, 장치.
  16. 제15항에 있어서, 상이한 표적 핵산 분자들을 갖는, 제1항 내지 제8항 중 어느 한 항에 따른 다중 배열 리보핵산 검출 시스템을 포함하는, 장치.
  17. 부품들의 키트로서,
    a) 유형 III CRISPR-연관 이펙터 단백질(Cas) 및 표적 핵산 분자에 결합하는 적어도 하나의 CRISPR RNA(crRNA)를 포함하는 이펙터 복합체;
    b) 사이클릭 올리고아데닐레이트(cOA)의 수준을 직접 또는 간접적으로 측정하기 위한 수단을 포함하는, 부품들의 키트.
KR1020227001546A 2019-06-19 2020-06-19 유형 III CRISPR/Cas 기반 진단 KR20220038668A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19181371.6 2019-06-19
EP19181371 2019-06-19
EP20168487 2020-04-07
EP20168487.5 2020-04-07
PCT/NL2020/050400 WO2020256553A1 (en) 2019-06-19 2020-06-19 Type iii crispr/cas-based diagnostics

Publications (1)

Publication Number Publication Date
KR20220038668A true KR20220038668A (ko) 2022-03-29

Family

ID=71741854

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227001546A KR20220038668A (ko) 2019-06-19 2020-06-19 유형 III CRISPR/Cas 기반 진단

Country Status (6)

Country Link
US (1) US20220325328A1 (ko)
EP (1) EP3987058A1 (ko)
JP (1) JP2022538010A (ko)
KR (1) KR20220038668A (ko)
CN (1) CN114207145A (ko)
WO (1) WO2020256553A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112553378B (zh) * 2020-12-29 2022-02-18 广州白云山拜迪生物医药有限公司 检测2019-nCoV的试剂、试剂盒及应用
CN113061650A (zh) * 2021-02-19 2021-07-02 中国科学院深圳先进技术研究院 一种病原体核酸的即时检测系统及方法
EP4326895A1 (en) * 2021-04-20 2024-02-28 University Court of The University of St Andrews Cas10-based assay for nucleic acid detection
CN113355459B (zh) * 2021-06-10 2022-04-01 安徽医科大学 一种检测筛查新冠病毒n501y突变的方法及试剂盒
WO2023004391A2 (en) 2021-07-21 2023-01-26 Montana State University Nucleic acid detection using type iii crispr complex
WO2023140731A1 (en) * 2022-01-20 2023-07-27 Wageningen Universiteit Thermostable rna polymerase
CN115058493B (zh) * 2022-06-07 2023-09-19 浙江大学 一种用于多重核酸检测的dna探针、crispr-反向点杂交核酸检测系统及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014165007A1 (en) 2013-03-12 2014-10-09 Promega Corporation Luminescent detection of inorganic phosphate and coupled reactions
EP3630966A1 (en) * 2017-05-31 2020-04-08 Vilnius University Production of cyclic adenylates and their use as allosteric regulators
CN108220400A (zh) * 2018-01-02 2018-06-29 武汉启丰生物技术有限公司 一种基于CRISPR-Cas10核酸蛋白复合物的快捷核酸检测定量法

Also Published As

Publication number Publication date
WO2020256553A1 (en) 2020-12-24
EP3987058A1 (en) 2022-04-27
CN114207145A (zh) 2022-03-18
US20220325328A1 (en) 2022-10-13
JP2022538010A (ja) 2022-08-31

Similar Documents

Publication Publication Date Title
KR20220038668A (ko) 유형 III CRISPR/Cas 기반 진단
AU2015246059B2 (en) Compositions and methods for quantifying a nucleic acid sequence in a sample
CN112543812A (zh) 基于crispr效应系统的扩增方法、系统和诊断
US20080176293A1 (en) RNA-Dependent RNA Polymerase, Methods And Kits For The Amplification And/Or Labelling Of RNA
EP2310527B1 (en) Improved lysis and reverse transcription for mrna quantification
JP2002536981A (ja) 核酸標的配列の存在を測定する方法およびその応用
US11746389B2 (en) Method and kit of detecting the absence of micro-organisms
CN113801917B (zh) 基于crispr技术进行多重核酸检测的方法
JP6126381B2 (ja) 標的核酸の検出方法及びキット
JP6316505B2 (ja) 易熱性エキソヌクレアーゼ
CN114391046A (zh) 一种检测非洲猪瘟病毒的方法和试剂盒
JP2012080871A (ja) Rnaの直接検出法
JP2010532986A (ja) 改良された微生物の検出
JP6583796B2 (ja) 核酸の増幅方法
EP2385119B1 (en) Respiratory syncytial virus (RSV) viral load detection assay
EP3387149B1 (en) Isothermal amplification for the detection of influenza viruses in a sample.
JP2020065488A (ja) 重症熱性血小板減少症候群(sfts)ウイルス検出用プライマーセット
WO2022177842A1 (en) Composition and method for nucleic acid detection
JP2022501073A (ja) 水痘帯状疱疹ウイルスを増幅または検出するための組成物および方法
EP4310195A1 (en) Method for nucleic acid detection using signal-mediated amplification of rna technology and rna aptamers
CN112608913B (zh) 一种基于C2c2的基因表达调控系统及其应用
CN114836548B (zh) tRNA氨酰化水平定量qPCR检测方法及试剂盒
US20230287364A1 (en) Bst polymerase variants
WO2023140731A1 (en) Thermostable rna polymerase
WO2023014222A1 (en) Argonaute-based nucleic acid detection system