KR20230117057A - EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas시스템 및 이의 용도 - Google Patents

EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas시스템 및 이의 용도 Download PDF

Info

Publication number
KR20230117057A
KR20230117057A KR1020230012153A KR20230012153A KR20230117057A KR 20230117057 A KR20230117057 A KR 20230117057A KR 1020230012153 A KR1020230012153 A KR 1020230012153A KR 20230012153 A KR20230012153 A KR 20230012153A KR 20230117057 A KR20230117057 A KR 20230117057A
Authority
KR
South Korea
Prior art keywords
mutation
crispr
egfr
sequence
dna
Prior art date
Application number
KR1020230012153A
Other languages
English (en)
Inventor
배태근
이재준
이효민
강승훈
Original Assignee
주식회사 페로카
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 페로카 filed Critical 주식회사 페로카
Publication of KR20230117057A publication Critical patent/KR20230117057A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1135Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against oncogenes or tumor suppressor genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas 시스템 및 이의 암 진단 용도에 관한 것으로, CRISPR/Cas12a 증폭 시스템을 이용하여 혈액 시료에서 유래한 변이 DNA를 특이적이고 효과적으로 증폭시켜 시퀀싱 오류로 혼동될 수 있는 0.5% 미만의 비율을 갖는 돌연변이를 확인할 수 있다.

Description

EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas시스템 및 이의 용도 {CRISPR/Cas system capable of specifically amplifying EGFR mutant DNA and use thereof}
EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas 시스템 및 이의 암 진단 용도에 관한 것이다.
다른 암에 비해 사망률이 높은 것으로 알려진 비소폐암(non-small lung cancer, NSCLC) 환자는 효과적인 치료를 위해 조기 진단이 요구된다. 비소폐암(non-small lung cancer, NSCLC)의 표적 암 치료제인 티로신 키나아제 억제제가 EGFR 돌연변이 양성 비소세포폐암에 강력한 치료 효과가 있는 것으로 나타났음을 감안할 때, 비소세포폐암(NSCLC)의 주요 바이오마커인 L858R 및 엑손19 결실의 EGFR 돌연변이를 조기에 안정적으로 검출하는 것이 효과적인 치료를 위해 매우 중요하다.
최근 종양 조직에서 방출되는 세포유리 순환 DNA(cell-free circulating DNA, cfDNA)의 DNA 돌연변이 검출을 통한 암 진단 가능성이 입증되었는데, 혈액 샘플을 사용하는 액체 생검 기반 진단은 조직 생검보다 훨씬 덜 침습적이고 빠르고 간단한 장점이 있다.
그러나 cfDNA(cell-free circulating DNA)에서 암을 진단하는 데는 몇 가지 장애물이 있다.
첫번째로 혈액 내 소량의 cfDNA는 정확한 진단을 방해하므로 PCR과 같은 추가 절차가 필요하는 것이고, 두번째로 차세대 시퀀싱(Next Generation Sequencing, NGS)은 여전히 0.5%의 오류율을 보여 희귀 돌연변이 DNA와 구별할 수 없다는 것이다. 특히, 혈액 샘플에서 정상 DNA의 우세한 농도는 희귀 돌연변이 DNA를 민감하게 검출하는 데 주요 장애물이다.
이러한 문제를 해결하기 위해 CRISPR(Clustered regular interspaced short palindromic repeats) 및 CRISPR 관련 단백질(CRISPR Associated Protein,Cas) 시스템을 사용하여 발암성 돌연변이 진단의 민감도를 향상시키려는 여러 연구가 시도되었다.
기존의 방법은 PAM 모티프 서열 내에서 점 돌연변이를 찾아 PAM을 파괴하는 전략을 기반으로 하나, 점 돌연변이가 PAM 모티프 서열에 위치해야 하며, 돌연변이 근처에 PAM 서열(NGG)이 없는 EGFR L858R 돌연변이와 같은 일부 돌연변이에 적용하는 데 방해가 된다는 한계를 가지고 있다.
이에, 돌연변이를 타겟 DNA에 해당하는 프로토스페이서에 위치시켜 돌연변이 DNA를 고민감도로 검출할 수 있는 CRISPR 시스템에 대한 기술 개발이 필요한 실정이다.
일 양상은 표적 서열에 혼성화할 수 있는 가이드 폴리뉴클레오티드로서, 정상(wild type) EGFR(Epidermal growth factor receptor) 유전자 서열 중 일부와 상보적인 연속적인 염기를 포함하고, 정상(wild type) EGFR 유전자 서열과 일치하거나 적어도 하나 이상의 미스매치(mis-match) 염기를 포함하는, 가이드 폴리뉴클레오티드를 제공하는 것이다.
다른 양상은 표적 서열에 혼성화할 수 있는 가이드 폴리뉴클레오티드로서, 정상(wild type) EGFR(Epidermal growth factor receptor) 유전자 서열에 상보적인 연속적인 10 개 이상의 염기를 포함하고, 정상(wild type) EGFR 유전자 서열과 적어도 하나 이상의 미스매치(mis-match) 염기를 포함하는, 가이드 폴리뉴클레오티드; 및 Cas 단백질 또는 이를 암호화하는 폴리뉴클레오티드를 포함하는 정상(wild type) EGFR 유전자 서열을 포함하는 핵산을 절단(cleavage)할 수 있는 CRISPR/Cas 복합체를 제공하는 것이다.
또 다른 양상은 상기 CRISPR/Cas 복합체를 포함하는, EGFR 돌연변이 검출을 위한 조성물을 제공하는 것이다.
또 다른 양상은 상기 CRISPR/Cas 복합체를 포함하는, EGFR 돌연변이 검출을 위한 키트(kit)를 제공하는 것이다.
또 다른 양상은 상기 CRISPR/Cas 복합체를 분리된 환자의 시료 내 타겟 핵산과 접촉하는 단계를 포함하는, EGFR돌연변이를 검출하는 방법을 제공하는 것이다.
또 다른 양상은 상기 CRISPR/Cas 복합체를 포함하는 암 진단 키트를 제공하는 것이다.
또 다른 양상은 상기 CRISPR/Cas 복합체를 분리된 환자의 시료 내 타겟 핵산과 접촉하는 단계를 포함하는, 암을 진단하는 방법을 제공하는 것이다.
또 다른 양상은 상기 CRISPR/Cas 복합체를 분리된 환자의 시료 내 타겟 핵산과 접촉하는 단계를 포함하는, 암 진단에 관한 정보를 제공하는 방법을 제공하는 것이다.
공지된 CRISPR(Clustered regular interspaced short palindromic repeats) 및 CRISPR 관련 단백질(CRISPR Associated Protein, Cas) 시스템을 사용하여 발암성 돌연변이 진단의 민감도를 향상시키는 방법은 PAM 모티프 서열 내에서 점 돌연변이를 찾아 PAM을 파괴하는 전략을 기반으로 한다. 그러나 점 돌연변이가 PAM 모티프 서열에 위치해야 하며, 돌연변이 근처에 PAM 서열(NGG)이 없는 EGFR L858R 돌연변이와 같은 일부 돌연변이에 적용할 수 없다는 한계를 가지고 있다.
본 출원인은 돌연변이를 타겟 DNA을 포함하는 프로토스페이서에 위치시킨 가이드 RNA를 사용하여 환자의 혈액 속의 극미량의 돌연변이 DNA를 특이적으로 증폭하여 검출할 수 있음을 확인하였다.
본 발명의 일 양상은 표적 서열에 혼성화할 수 있는 가이드 폴리뉴클레오티드로서, 정상(wild type) EGFR(Epidermal growth factor receptor) 유전자 서열 중 일부와 상보적인 연속적인 10 개 이상의 염기를 포함하는, 가이드 폴리뉴클레오티드를 제공한다. 구체적으로, 상기 가이드 폴리뉴클레오티드는 정상(wild type) EGFR 유전자 서열과 일치하거나 적어도 하나 이상의 미스매치(mis-match) 염기를 포함하는 것일 수 있다.
본 명세서에서 용어 “프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)”는 CRISPR/Cas 시스템의 Cas 단백질이 인식하는 서열이다. 상기 프로토스페이서 서열은 PAM 서열의 5’ 말단 또는 3’ 말단에 위치하는 서열로, PAM 이펙터 단백질 복합체가 관심이 있는 표적 유전자좌에 결합하는 것을 지시한다. 구체적으로 상기 PAM은 5' T-풍부 모티프를 포함할 수 있다. 상기 PAM은 2 내지 10 bp DNA 서열로 이루어질 수 있고, 바람직하게는 2내지 6 bp DNA서열로 이루어질 수 있다.
본 명세서에서 용어 “가이드 뉴클레오티드”는 CRISPR 시스템 기반 게놈 편집에 사용되는 짧은 합성 RNA 분자이다. 표적 DNA 서열에 결합하는 약 15 내지 50 bp 길이의 뉴클레오티드 서열로서, 타겟 DNA에 결합하는 스페이서 시퀀스. gRNA 분자는 Cas의 결합을 위한 스캐 폴드 서열, endonuclease로 구성된다.
상기 가이드 뉴클레오티드에는 가이드 RNA, gRNA, 또는 guide RNA를 포함한다. 또한 상기 가이드 폴리뉴클레오티드는 crRNA를 포함한다. 상기 crRNA는 tracrRNA 및/또는 이펙터 단백질과 결합 및/또는 상호작용하는 crRNA 내에 존재하는 일부 서열이다. 상기 crRNA는 야생형 crRNA 또는 엔지니어링된 crRNA 일 수 있다. 이때, 상기 crRNA은 직접반복부서열(direct repeat sequence) 및 스페이서를 포함할 수 있고, 직접반복부서열은 스페이서의 5’말단에 위치할 수 있다. 또한, 상기 crRNA는 tracrRNA의 3’ 말단에 위치할 수 있다. 상기 가이드 폴리뉴클레오티드는 tracrRNA을 포함한다. 상기 tracrRNA 스캐폴드 서열은 crRNA 및/또는 이펙터 단백질과 결합 및/또는 상호작용하는 tracrRNA 전체 또는 일부 서열이다.
상기 tracrRNA은 야생형 tracrRNA 또는 엔지니어링된 tracrRNA일 수 있다. 상기 엔지니어링된 crRNA 또는 tracrRNA은 상기 야생형 crRNA 또는 tracrRNA의 일부 뉴클레오티드 서열이 인위적으로 변형(치환, 결실 또는 삽입)되거나, 야생형 crRNA 또는 tracrRNA 서열보다 길이가 짧도록 변형된 서열일 수 있다. 상기 가이드 폴리뉴클레오티드는 링커를 더 포함할 수 있다. 상기 링커는 상기 tracrRNA 및 crRNA을 연결하는 역할을 하는 서열이다. 상기 링커는 1 내지 30개의 뉴클레오티드 서열일 수 있다. 일 구현예로서, 상기 linker는 1 내지 5개, 5 내지 10개, 10 내지 15개, 15 내지 20개, 20개 내지 25개 또는 25 내지 30개의 뉴클레오티드 서열일 수 있다. 예를 들어, 상기 링커는 5’-GAAA-3’ 서열일 수 있으나, 이에 제한된 것은 아니다. 상기 가이드 폴리뉴클레오티드는 야생형 가이드 폴리뉴클레오티드에서 하나 이상의 뉴클레오티드 서열이 삭제, 치환 또는 추가된 엔지니어링된 가이드 RNA(engineered guide RNA)인 것일 수 있다.
가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 지시하기에, 표적 폴리뉴클레오티드 서열과의 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열일 수 있다. 상기 gRNA는 Cas 단백질과 복합체를 형성하여 프로토스페이서(protospacer) 인접 모티브("protospacer adjacent motif, PAM") 및 프로토스페이서를 갖는 표적 폴리뉴클레오티드 서열(상기 gRNA의 일부에 상보성인 서열)에 결합한다. 가이드 RNA (gRNA)는 gRNA:Cas 단백질 복합체의 표적 특이성을 부여하는 요소이다.
본 명세서에서 용어 "EGFR "은 Epidermal Growth Factor Receptor의 약어로써 상피세포 성장인자 수용체와 상호 교환적으로 사용할 수 있다. EGFR은 HER 또는 erbB family라고도 불리는 티로신 키나아제 수용체 그룹의 일부로, erbB family에는 EGFR (HER1/ErbB1), HER2 (ErbB2), HER3 (ErbB3) 그리고 HER4 (ErbB4)가 포함된다.
일 구체예에 있어서, 상기 정상(wild type) EGFR 유전자 서열은 프로토스페이서 인접 모티프(PAM)의 3' 말단에 연결된 것인 가이드 폴리뉴클레오티드일 수 있다.
다른 구체예에 있어서, 상기 정상(wild type) EGFR 유전자 서열은 프로토스페이서 인접 모티프(PAM)의 3' 말단에 연결된 것인 가이드 폴리뉴클레오티드일 수 있다. 더욱 구체적으로 상기 프로토스페이서 인접 모티프(PAM)는 5' T-풍부 모티프를 포함하는 것일 수 있다.
일 양상은 정상(wild type) EGFR(Epidermal growth factor receptor) 유전자 서열에 상보적으로 결합하는 연속적인 10 개 이상의 염기를 포함하는 가이드 뉴클레오티드는 EGFR 돌연변이 유전자 서열과 적어도 하나 이상의 미스매치(mis-match) 염기를 포함하는 것일 수 있다. 더욱 구체적으로는 상기 EGFR 돌연변이 유전자 서열과 미스매치되는 염기는 정상(wild type) EGFR 유전자 서열과 상보적으로 결합하는 것일 수 있다.
본 명세서의 용어 “돌연변이”는 기존 유전자의 염기 순서에 영구적인 변화가 있는 경우를 의미한다. 돌연변이는 유전물질의 구조에 미치는 영향에 따라 염색체 구조나 수에 이상이 있는 경우(염색체 이상) 및 유전자의 염기서열에 작은 규모로 변화가 일어나는 경우가 있다. 염색체의 구조에 이상이 있는 경우로는 결실(deletion), 중복(duplication), 역위(inversion), 전좌(translocation)가 있다. 본 명세서의 용어 “결실 돌연변이 (deletion mutation)”는 염색체의 일부가 손실된 경우를 말한다. 본 명세서의 용어 “점 돌연변이 (point mutation)”는 유전자자리를 구성하는 뉴클레오티드 배열이 1쌍 이상 수천 쌍에 걸쳐 결실되어 일어나는 것을 말한다.
본 명세서의 용어 “EGFR 돌연변이”는 G719S 돌연변이, G179C 돌연변이, G719A 돌연변이, S720F 돌연변이, T790M 돌연변이, D761Y 돌연변이, exon 19 결실 돌연변이, D770_N771 삽입 돌연변이, V765A 돌연변이, T783A 돌연변이, S761I 돌연변이, T790M 돌연변이, V769L 돌연변이, N771I 돌연변이, L858R 돌연변이, L861Q 돌연변이, L861R 돌연변이를 포함한다. 대표적인 EGFR 변이인 L858R은 858번째 아미노산을 루이신(Leusine,L)에서 아르기닌 (Arginine,R)으로 바뀐 점 돌연변이 형태로서, 엑손 21번에 속하는 변이이다. 또한 비소세포폐암의 대표적인 바이오마커로서, EGFR Exon 19 결실 돌연변이는 EGFR을 암호화하는 유전자의 exon 19가 결실(deletion)된 것을 의미한다. EGFR Exon19 결실 돌연변이는 L858R 점 돌연변이와 달리 exon19의 9bp~18bp 등 다양한 결실 크기로 나타난다.
일 구체예에 있어서, 암은 EGFR 돌연변이를 갖는 것일 수 있다. 상기 암은 고형암일 수 있다. 상기 고형암은 기관에서 유래하는 비정상적인 조직 덩어리를 의미한다. 고형암은 악성일 수 있다. 상이한 유형의 고형암은 이를 형성하는 세포 유형에 따라 명명된다. 고형암의 유형에는 육종, 암종 및 림프종이 포함된다. 고형암의 예로는 부신암, 항문암, 역형성 대세포 림프종, 혈관면역모세포 T 세포 림프종, B 세포 림프종, 담관암, 방광암, 뇌/CNS 종양, 유방암, 자궁경부암, 결장 암, 자궁 내막암, 식도암, 유잉(ewing) 계열의 종양, 안암, 담낭암, 위장 유암종, 위장관 간질 종양(gist), 임신 영양모세포 질환, 간비장 T 세포 림프종, 호지킨 림 프종, 혈관내 거대 B 세포 림프종, 신장 암, 후두암 및 하인두암, 간암, 폐암(비소 세포 및 소세포), 폐 유암종 림프종 육아종증, 악성 중피종, 비강 및 부비동 암, 비인두암, 신경모세포종, 결절 변연부 B 세포 림프종, 비-호지킨 림프종, 구강 및 구인두암, 골육종, 난소암, 췌장암, 음경암, 뇌하수체 종양, 일차 삼출 림프종, 전 립선 암, 망막모세포종, 횡문근육종, 타액선 암, 육종, 피부암(기저 및 편평 세포, 흑색종 및 머켈 세포), 소장암, 위암, 고환암, 흉선암, 갑상선암, 자궁육종, 질암, 외음부 암, 발텐스트롬 마크로글로불린혈증(Waldenstrom macroglobulinemia) 및 빌 름스(Wilms) 종양 등이 있다. EGFR 돌연변이는 특히 결장직장암, 췌장암, 신경교종, 두경부암 및 폐암, 특히 비소세포 폐암(NSCLC)을 일으킬 수 있다. 본 발명의 일 구현예에 따르면, 결장직장암, 췌장암, 신경교종, 두경부암 및 폐암으로 이루어진 그룹으로부터 선택되는 고형암의 진단에, 더욱 더 비소세포 폐암(NSCLC)의 진단에 특히 효과적이다.
일 구체예에 있어서, 상기 미스매치 염기의 위치는 프로토스페이서 인접 모티프(PAM)로부터 3'말단 방향으로 1 내지 14 bp(base pair)에 위치하는 가이드 폴리뉴클레오티드일 수 있다. 바람직하게는 프로토스페이서 인접 모티프(PAM)로부터 3'말단 방향으로 1 내지 7 bp(base pair)에 위치할 수 있고, 더욱 바람직하게는 프로토스페이서 인접 모티프(PAM)로부터 3'말단 방향으로 3 내지 7 bp(base pair)에 위치할 수 있다.
일 구체예에 있어서, 상기 미스매치 염기는 정상(wild type) EGFR 유전자 서열과 상보적으로 결합하지 않는 세 가지 염기 중 어느 하나 및/또는 EGFR 돌연변이 유전자 서열과 상보적으로 결합하지 않는 세 가지 염기 중 어느 하나인 것인 것일 수 있다.
일 구체예에 있어서, 상기 가이드 폴리뉴클레오티드는 5' 말단에서 3' 말단 순서로, 스캐폴드 서열, 표적서열로 구성되는 20 bp 내지 50bp 길이인 것인, 가이드 폴리뉴클레오티드일 수 있다. 일부 구현예에서, 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 bp 이상이거나 이를 초과한다. 일부 구현예에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드 미만이다. 바람직하게 가이드 뉴클레오티드 서열은 길이가 20 bp 내지 50 bp, 더욱 바람직하게는 30 bp 내지 50 bp의 염기를 가진다.
일 구체예에 있어서, 상기 가이드 폴리뉴클레오티드는 cleavage 효율을 높이는 서열을 더 포함할 수 있다. 일부 구현예에서, 상기 cleavage 효율을 높이는 서열은 T-풍부 테일링(T-rich tailing) 서열일 수 있다.
일 구체예에 있어서, 상기 가이드 폴리뉴클레오티드는 서열번호 1 내지 20 및 27 중 어느 하나로 표시되는 뉴클레오티드 서열을 포함하는 것일 수 있다. 서열번호 1 내지 20 및 27 중 어느 하나로 표시되는 뉴클레오티드에서 T(Thymine)은 U(Uracil)인 것일 수 있다.
일 양상은 상기 가이드 폴리뉴클레오티드를 암호화하는 벡터를 제공한다.
명세서의 용어 “벡터”는 유전자를 편리하게 활용할 수 있도록 확보, 증식(증폭)하거나, 단백질을 발현시키는 데 이용하는 유전자 재조합 기술(recombinant DNA technology)에 필수적으로 필요한 DNA 전달체이다. 상기 벡터는 바이러스 벡터 또는 비-바이러스 벡터일 수 있다. 예를 들어, 상기 바이러스 벡터는 레트로바이러스 벡터(retroviral(retrovirus) vector), 렌티바이러스 벡터(lentiviral(lentivirus) vector), 아데노바이러스 벡터(adenoviral(adenovirus vector), 아데노-연관 바이러스 벡터(adeno-associated viral (adeno-associated virus; AAV) vector), 백시니아바이러스 벡터(vaccinia viral(vaccinia virus) vector), 폭스바이러스 벡터(poxviral(poxvirus) vector) 및 단순포진 바이러스 벡터(herpes simplex viral(herpes simplex virus) vector)로 구성된 군에서 선택되는 하나 이상의 바이러스 벡터일 수 있다.
상기 비-바이러스 벡터는 플라스미드, 파지, 네이키드 DNA, DNA 복합체, mRNA(전사물), PCR 앰플리콘(amplicon) 또는 LNP(Lipid Nano Particle)일 수 있다. 예를 들어, 상기 플라스미드는 pcDNA 시리즈, pSC101, pGV1106, pACYC177, ColE1, pKT230, pME290, pBR322, pUC8/9, pUC6, pBD9, pHC79, pIJ61, pLAFR1, pHV14, pGEX 시리즈, pET 시리즈, 및 pUC19으로 이뤄진 군에서 선택된 것일 수 있다. 예를 들어, 상기 파지는 λgt4λB, λ-Charon, λΔz1, 및 M13으로 이뤄진 군에서 선택된 것일 수 있다.
상기 벡터는 선택적으로 조절/제어 구성요소, 프로모터 및/또는 부가 발현 요소를 추가로 포함할 수 있다. 상기 조절/제어 구성요소는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, 가이드 RNA를 암호화하는 핵산 및/또는 이펙터 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 조절/제어 구성요소는 인핸서, 인트론, 종결 신호, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(IRES, Internal Ribosome Entry Site), 스플라이스 억셉터, 2A 서열 및/또는 복제원점(replication origin)일 수 있으나, 이에 제한되는 것은 아니다. 상기 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점, 및/또는 BBV 복제원점일 수 있다. 상기 벡터는 선택적으로 프로모터를 포함할 수 있다. 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, 가이드 RNA를 암호화하는 핵산 및/또는 이펙터 단백질을 암호화하는 핵산)에 작동 가능하게 연결될 수 있다. 상기 프로모터는 벡터에 포함된 각 구성요소를 암호화하는 서열(즉, 가이드 RNA를 암호화하는 핵산 및/또는 이펙터 단백질을 암호화하는 핵산)을 적절히 발현시킬 수 있는 것이라면 제한되지 않는다. 일 구현예로서, 상기 프로모터 서열은 RNA 중합효소(예를 들어, pol I, pol II, 또는 pol III)의 전사를 촉진시키는 프로모터일 수 있다. 예를 들어, 상기 프로모터는 SV40 초기 프로모터, mouse mammary tumor virus long terminal repeat(LTR) 프로모터, adenovirus major late 프로모터 (Ad MLP), herpes simplex virus (HSV) 프로모터, CMV immediate early promoter region (CMVIE)와 같은 cytomegalovirus (CMV) 프로모터, Chicken b-actin (CBA) 프로모터, rous sarcoma virus (RSV) 프로모터, human U6 small nuclear 프로모터 (U6) (Miyagishi et al., Nature Biotechnology 20, 497 - 500 (2002)), enhanced U6 프로모터 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)), human H1 프로모터 (H1) 및 7SK 프로모터 (7SK) 중 하나일 수 있다.
상기 벡터는 선택적으로 부가 발현 요소를 포함할 수 있다. 상기 벡터는 가이드 RNA를 암호화하는 핵산 외에 통상의 기술자가 필요에 의해 발현시키고자 하는 부가 발현 요소를 암호화하는 핵산 서열을 포함하고 있을 수 있다. 예를 들어, 상기 부가 발현 요소는, 글리포세이트(glyphosate), 글루포시네이트암모늄 (glufosinate ammonium) 또는 포스피노트리신(phosphinothricin)과 같은 제초제 저항성 유전자; 또는 암피실린(ampicillin), 카나마이신(kanamycin), G418, 블레오마이신(Bleomycin), 하이그로마이신(hygromycin) 또는 클로람페니콜(chloramphenicol)과 같은 항생제 내성 유전자일 수 있다.
일 양상은 상기 가이드 폴리뉴클레오티드; 및 Cas 단백질 또는 이를 암호화하는 폴리뉴클레오티드를 포함하고, 정상(wild type) EGFR 유전자 서열을 포함하는 핵산을 절단(cleavage)할 수 있는 CRISPR/Cas 복합체를 제공한다.
본 명세서의 용어 “CRISPR/Cas 시스템”은 박테리오파지에 대한 박테리아 적응 면역 시스템에서 파생된 것으로, 특히 DNA 절단을 위한 강력한 도구로 사용된다. 모든 CRISPR-Cas 시스템은 CRISPR RNA (crRNA)를 통해 타겟에 대한 특이성을 가지는데, 실험적으로 사용되는 경우에는 가이드 RNA (guide RNA, gRNA)로 약간 변형되어 사용될 수 있다. crRNA의 스페이서(spacer)가 타겟 서열을 인지하고 결합하는데, 이때 타겟 서열은 Protospacer Adjacent Motif (PAM) 라는 서열에 인접하여 존재해야 한다. crRNA와 타겟의 결합 이후, Cas 단백질이 타겟 DNA를 절단한다. 따라서 crRNA 또는 gRNA의 스페이서 부분의 서열을 바꾸는 것만으로 원하는 타겟에 Cas 단백질이 작동하도록 조작할 수 있다.
CRISPR/Cas 시스템은 클래스 1 과 클래스 2로 분리된다. 클래스 I CRISPR-Cas 시스템은 I형, III형, 및 IV형을 포함한다. 클래스 I 시스템의 특징은 단일 단백질 대신 효과기 엔도뉴클레아제 복합체가 존재한다는 점이다. 캐스케이드 복합체는 다양한 RAMP(반복부-관련 미스테리 단백질(Repeat-Associated Mysterious Protein)) 단백질 슈퍼패밀리의 핵심 폴드인 RNA 인식 모티프(RRM) 및 핵산-결합 도메인을 포함한다. RAMP 단백질 서브유닛은 Cas5 및 Cas7을 포함하되(crRNA-효과기 복합체의 골격을 포함함), Cas5 서브유닛은 crRNA의 5' 핸들에 결합하고, 거대 서브유닛과 상호작용하며, 효과기 복합체와 헐겁게 결합되고 전형적으로 프리-crRNA 가공에서 반복부-특이적 RNase로서 작용하는 Cas6을 종종 포함한다. I형CRISPR-Cas 시스템은 최소 Cas5 및 Cas7을 포함하는 캐스케이드(항바이러스 방어를 위한 CRISPR-연합 복합체)로 지칭되는 효과기 단백질의 복합체를 포함한다. 효과기 복합체는 단일 CRISPR RNA(crRNA) 및 Cas3과 함께 작용하여 침입 바이러스 DNA에 대해 방어한다. I형 CRISPR-Cas 좌위는 이중가닥 DNA(dsDNA) 및 RNA-DNA 이중나선을 푸는 입증된 능력을 갖는 단일-가닥 DNA(ssDNA)-자극 슈퍼패밀리 2 헬리카제를 갖는 금속-의존적 뉴클레아제를 암호화하는 서명 유전자 cas3(또는 변이체 cas3' 또는 cas3")을 포함한다. 표적 인식 후에, Cas3 엔도뉴클레아제는 DNA 표적을 절단 및 분해하기 위해 캐스케이드-crRNA-표적 DNA 복합체에 보충된다. 일부 I형 시스템에서, Cas6은 crRNA 가공을 담당하는 활성 엔도뉴클레아제일 수 있으며, Cas5 및 Cas7은 비촉매적 RNA-결합 단백질로서 작용하지만; I-C형 시스템에서, crRNA 가공은 Cas5에 의해 촉매될 수 있다. I형 시스템은 7가지 아형으로 나누어진다. 적어도 단백질 서브유닛 Cas7, Cas5 및 Cas6을 포함하는 적응 항바이러스 방어(캐스케이드)에 대한 변형된 I형 CRISPR-연합 복합체가 기재되되, 이들 서브유닛 중 하나는 Cas3 엔도뉴클레아제 또는 변형된 제한 엔도뉴클레아제인 FokI에 합성에 의해 융합된다.
복수의 cas7 유전자를 포함하는 III형 CRISPR-Cas 시스템은 ssRNA 또는 ssDNA 중 하나를 표적화하고, RNase뿐만 아니라 표적 RNA-활성화된 DNA 뉴클레아제 중 하나로서 작용한다. Csm(III-A형) 및 Cmr(III-B형) 복합체는 표적 RNA 결합/절단을 ssDNA 분해와 결부시키는 RNA-활성화된 단일-가닥(ss) DNase로서 작용한다. 외래 DNA 감염 시, 출현한 전사체에 대한 Csm 또는 Cmr 복합체의 CRISPR RNA(crRNA)-가이드된 결합은 활발하게 전사되는 파지 DNA에 Cas10 DNase를 보충하여, 전사체와 파지 DNA의 분해를 초래하지만, 숙주 DNA의 분해는 초래하지 않는다. Cas10 HD-도메인은 ssDNase 활성화를 담당하며, Csm3/Cmr4 서브유닛은 Csm/Cmr 복합체의 엔도리보뉴클레아제 활성을 담당한다. 표적 RNA의 3'-측접 서열은 Csm/Cmr의 ssDNase 활성에 중요하며: crRNA의 5'-핸들과의 염기 짝짓기는 숙주 DNA를 분해로부터 보호한다. IV형 시스템은, cas8-유사 도메인에 추가로 전형적인 I형 cas5 및 cas7 도메인을 포함한다고 해도, 대부분의 다른 CRISPR-Cas 시스템의 특징인 CRISPR 어레이를 결여할 수 있다.
클래스 II CRISPR-Cas 시스템은 II형, V형, 및 VI형을 포함한다. 클래스 2 시스템의 특징은 효과기 복합체 대신 단일 Cas 효과기 단백질이 존재한다는 점이다. II형 및 V형 Cas 단백질은 RNase H 폴드를 채택하는 RuvC 엔도뉴클레아제 도메인을 포함한다. II형 CRISPR/Cas 시스템은 crRNA 및 tracrRNA(트랜스-활성화 CRISPR RNA)를 사용하여 Cas 엔도뉴클레아제를 이의 DNA 표적으로 유도한다. crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보성인 스페이서 영역 및 tracrRNA(트랜스-활성화 CRISPR RNA)와 염기 쌍을 이루어 Cas 엔도뉴클레아제가 DNA 표적을 절단하도록 유도하는 RNA 이중나선을 형성하는 영역을 포함하여, 평활 말단을 남긴다. 스페이서는 Cas1 및 Cas2 단백질을 수반하는 완전히 이해되지 않은 과정을 통해 획득된다. II형 CRISPR/Cas 좌위는 전형적으로 cas9 유전자 외에 cas1 및 cas2 유전자를 포함한다. II형 CRISPR-Cas 좌위는 각각의 CRISPR 배열 내 반복 서열에 부분적으로 상보성인 tracrRNA를 암호화할 수 있고, Csn1 및 Csn2와 같은 다른 단백질을 포함할 수 있다. cas1 및 cas2 유전자 부근에 cas9이 존재하는 것은 II형 좌위의 특징이다. V형 CRISPR/Cas 시스템은 Cas9와 달리 표적 절단을 위한 추가적인 트랜스-활성화 CRISPR(tracr) RNA를 반드시 필요로 하지는 않는 활성 RNA-가이드 엔도뉴클레아제인, Cpf1(Cas12)를 포함하는 단일 Cas 엔도뉴클레아제를 포함한다. VI형 CRISPR-Cas 시스템은 2개의 HEPN(보다 고등의 진핵생물 및 원핵생물 뉴클레오티드-결합(Higher Eukaryotes and Prokaryotes Nucleotide-binding)) 도메인을 갖지만 HNH 또는 RuvC 도메인이 없는 뉴클레아제를 암호화하는 cas13 유전자를 포함하고, tracrRNA 활성에 의존하지 않는다. 대다수의 HEPN 도메인은 금속-독립적 endoRNase 활성 부위를 구성하는 보존된 모티프를 포함한다. 이 특징 때문에, VI형 시스템은 다른 CRISPR-Cas 시스템과 공통인 DNA 표적 대신에 RNA 표적 상에서 작용하는 것으로 생각된다.
구체적으로, class 2 타입 V의 Cas12a는 Cpf1으로도 알려졌다. 타입 V 시스템은 cas12 유전자 및 cas1 및 cas2 유전자를 갖는다. Cas12 유전자는 Cas9의 각각의 영역에 상동성인 RuvC-유사 뉴클레아제 도메인을 갖지만 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여된 단백질 Cas12을 코딩한다. 타입 V 시스템에서, Cas12의 RuvC-유사 뉴클레아제 도메인은 표적 핵산의 양쪽 가닥을 엇갈린 구성으로 절단하여 5' 오버행을 생성하고, 이것은 Cas9 절단에 의해 생성된 평활 말단과는 대조적이다. 이러한 5' 오버행은 비-상동성 말단 연결 방법을 통한 DNA 삽입을 용이하게 할 수 있다. 타입 V 시스템의 Cas12 절단 활성은 또한 듀플렉스를 형성하기 위해 tracrRNA에 대한 crRNA의 혼성화를 필요로 하지 않고, 타입 V 시스템의 crRNA는 내부 듀플렉스를 형성하는 스템 루프 구조를 갖는 단일 crRNA를 사용한다. 상기 타입 V 시스템은 표적 서열의 위치에서 단일 또는 이중 가닥 파손을 유도한다. 가닥 파손은 5' 오버행을 이용한 엇갈린 절단일 수 있다. 타입 V 시스템에 속하는 Cas12는 이중 가닥 DNA를 표적으로 한다. Cas12는 5’-(T)TTN-3’의 PAM 서열을 가지는 이중가닥 구조의 서열을 특이적으로 인식한다. 표적이 단일가닥 DNA인 경우에는 PAM의 서열이 100% 일치하지 않고, 변화가 있더라도 효소적 절단을 하는 것으로 알려져 있다. 타겟 사이트에 5’ 오버행을 만들어 끝 부분이 어긋난 형태로 DNA를 절단한다. 따라서 평평한 말단을 만드는 Cas9과 달리 정확한 방향으로 원하는 DNA 서열을 삽입하는데 사용될 수 있다. 또한 Cas12는 프로토스페이서의 인식에 따른 표적 유전자 절단 외에도 표적이 아닌 주변의 단일가닥 DNA(single stranded, ssDNA)의 부수적 절단을 유발한다. Cas12는 부수적인 절단 기능을 이용하여 다양한 휴대용 진단 기술의 개발에 활용될 수 있다. CRISPR/Cas12a 시스템은 Cas1 및 Cas2 단백질이 작은 DNA 조각이 CRISPR 배열에 적응하는 것을 용이하게 하고, pre-crRNA의 처리하여crRNA의 형성한 후, Cas12a가 crRNA에 결합하여 이원 복합체를 형성하여 표적 DNA 서열을 식별하고 절단하는 기작으로 이루어진다. 1bp 불일치에 대한 높은 내성을 이용하여 gRNA디자인 하는 경우 정상 DNA를 특이적으로 절단하여 극미량의 돌연변이 DNA를 검출할 수 있는 시스템을 구축할 수 있다.
본 명세서에서 용어 "Cas 단백질"은 Cas 효소, CRISPR 효소, CRISPR 단백질, Cas 뉴클레아제, CRISPR Cas 및 CRISPR 뉴클레아제로 일반적으로 상호교환적으로 사용될 수 있다. 본 명세서에서 용어 "Cas 단백질"은 Cas 효소, CRISPR 효소, CRISPR 단백질, Cas 뉴클레아제, CRISPR Cas 및 CRISPR 뉴클레아제로 일반적으로 상호교환적으로 사용될 수 있다. 크리스터 연관 단백질의 비제한적 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 공지됨), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, Cpf1, C2c1, Cas13a, C2c2, C2c3, 이들의 동족체, 또는 이의 변형된 형태를 포함한다. Cas 단백질은 표적 DNA(target DNA)에 상보적인 짧은 가이드 RNA 단편과 복합체를 형성하고, 표적 DNA의 하류(downstream) 또는 상류(upstream)에 위치한 프로토스페이서 인접 모티프(the protospacer-adjacent motif, PAM)를 인식하여 표적 DNA를 촉매적으로 절단한다. Cas 단백질의 다양성은 포유류 세포의 게놈 편집 등을 포함하여 DNA 절단이 필요한 다양한 분야에 강력한 도구를 제공한다. 특히 Cas 단백질의 종류에 따라 염기 불일치에 대한 내성(tolerance)이 다르다. 이러한 특성을 이용하여 정상 DNA와 돌연변이 DNA를 구별하여 특이적으로 절단할 수 있다.
또한, 본 명세서에서 상기 Cas단백질 또는 Cas 뉴클레아제는 유전자 편집 시스템 또는 유전자 편집 핵산 구조물(construct)을 구성하는 효과기(effector) 단백질을 지칭한다. 여기서 효과기(effector) 단백질은 가이드 RNA(gRNA)에 결합할 수 있는 핵산분해 단백질이나, 표적 핵산 또는 표적 유전자에 결합할 수 있는 펩티드 단편일 수 있다.
일 구체예에 있어서, 상기 Cas 단백질은 Class 2에 해당하는 것 일 수 있다. 구체적으로, 상기 Class 2에 해당하는 Cas 단백질은 type Ⅴ에 해당할 수 있다. 더욱 구체적으로, 상기 type Ⅴ에 해당하는 Cas 단백질은 Cas12a, mgCas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, 및 Cas12i로 이루어진 군으로부터 선택된 어느 하나인 이펙터 단백질(effector protein)일 수 있다. 일 구현예에 있어서, 상기 이펙터 단백질(effector protein)은 프란시셀라 툴라렌시스 1, 프란시셀라 툴라렌시스 아종 노비시다, 프레보텔라 알벤시스, 라크노스피라세아에 박테리움 MC2017 1, 부티리비브리오 프로테오클라스티쿠스, 페레그리니박테리아 박테리움 GW2011_GWA2_33_10, 파르쿠박테리아 박테리움 GW2011_GWC2_44_17, 스미텔라 종 SCADC, 아시다미노코커스 종 BV3L6, 라크노스피라세아에 박테리움 MA2020, 칸디다투스 메타노플라즈마 테르미툼, 유박테리움 엘리겐스, 모락셀라 보보쿨리 237, 렙토스피라 이나다이, 라크노스피라세아에 박테리움 ND2006, 포르피로모나스 크레비오리카니스 3, 프레보텔라 디시엔스 및 포르피로모나스 마카카에로 이루어진 군으로부터 선택되는 박테리아 종으로부터 유래된 것 일 수 있다.
일 양상은 상기 CRISPR/Cas 복합체를 포함하는, EGFR 돌연변이를 검출하기 위한 CRISPR/Cas 시스템을 제공한다.
다른 일 양상은 상기 CRISPR/Cas 복합체를 분리된 환자의 시료 내 타겟 핵산과 접촉하는 단계를 포함하는, EGFR돌연변이를 검출하는 방법을 제공한다.
일 구현예에 있어서, 상기 분리된 환자 시료는 cfDNA(cell free DNA)를 포함할 수 있다.
본 명세서의 용어 “cfDNA”는 Circulating free DNA의 약어로 세포핵 안에 존재하지 않고 혈액속에 부유하는 DNA의 조각을 의미한다. “순환 자유 DNA” 또는 “세포 유리 DNA” 등과 상호 교환하여 사용할 수 있다. 순환 자유 DNA (cfDNA)는 혈장으로 방출된 DNA 단편 (50-200 bp)이다. cfDNA는 순환 종양 DNA(ctDNA), 무세포 미토콘드리아 DNA(ccf mtDNA) 및 무세포 태아 DNA(cffDNA)등을 포함하며, 혈류에서 자유롭게 순환하는 다양한 형태의 DNA를 설명하는 데 사용할 수 있다. cfDNA의 상승된 수준은 암이 진행된 경우 관찰된다. cfDNA의 분석을 통하여 암 환자의 혈장 DNA에 종양 관련 돌연변이가 포함되어 있는지 여부를 확인하여 암 진단 및 후속 조치에 사용될 수 있다.
일 구체예에 있어서, 상기 EGFR돌연변이를 검출하는 방법은 분리된 환자의 시료 내 타겟 돌연변이 DNA를 증폭하는 단계를 포함한다. 일 구현예에 있어서 상기 타겟 돌연변이 DNA를 증폭하는 단계는 적어도 1회 이상 수행할 수 있고, 바람직하게는 1 내지 7회, 더욱 바람직하게는 2 내지 3회 수행할 수 있다.
본 명세서의 용어 “DNA 증폭”이란, 인위적으로 유전자를 증폭하는 모든 방법을 사용하는 것을 의미한다. 일 구현예에 있어서, 상기 타겟 돌연변이 DNA를 증폭하는 단계는 중합효소 연쇄 반응(PCR), 역전사 PCR(RT-PCR), 정량적 PCR(qPCR), 역전사 qPCR(RT-qPCR), 네스티드(nested) PCR, 다중(multiplex) PCR, 비대칭(asymmetric) PCR, 터치다운(touchdown) PCR, 무작위 프라이머(random primer) PCR, 헤미-네스티드(hemi-nested) PCR, 중합효소 사이클링 어셈블리(polymerase cycling assembly, PCA), 콜로니 PCR, 리가제 연쇄 반응(ligase chain reaction, LCR), 디지털 PCR, 메틸화 특이적-PCR(MSP), COLD-PCR(co-amplification at lower denaturation temperature-PCR), 대립유전자 특이적 PCR, 서열간 특이적 PCR(ISS-PCR), 전장 게놈 증폭(whole genome amplification, WGA), 역 PCR 및 열 비대칭 엇갈림 PCR(thermal asymmetric interlaced PCR, TAIL-PCR)로 이루어지는 군으로부터 선택되는 것을 사용할 수 있다.
혈액 시료에서 유래한 변이 DNA를 일 양상에 따른 Cas 뉴클레아제를 이용한 CRISPR/Cas 시스템을 이용하여 in-vitro 절단 및 PCR 증폭을 통해 돌연변이 DNA를 특이적으로 증폭시켜 시퀀싱 오류로 혼동될 수 있는 0.5% 미만의 비율을 갖는 돌연변이를 확인할 수 있는 효과가 있다.
도 1은 일 구체예에 따른 CRISPR/Cas12a 증폭 절차를 나타낸 모식도이다.
도 2는 L858R DNA와 일치하는 crRNA에 1개의 mis-match 염기를 도입하여 정상 DNA는 절단하고, L858R 돌연변이 DNA는 절단하지 않는 crRNA 설계 원리를 설명하는 그림이다.
도 3은 정상 DNA는 절단하나, EGFR L858R 돌연변이 DNA를 절단하지 않는 crRNA를 설계하기 위한 mis-match 서열 도입 위치를 나타낸 모식도이다.
도 4는 LbCas12a가 정상 DNA를 특이적으로 절단할 수 있는지 여부를 나타낸 사진이다: 도 4a는 EGFR L858R 돌연변이와 상보적으로 결합하는 crRNA를 사용한 경우, 정상 DNA와 L858R 돌연변이 DNA를 큰 차이 없이 절단한 결과를 나타낸 사진이고; 도 4b는 EGFR L858 유전자좌 내에서 증폭된 PCR 생성물을 L858R 돌연변이 DNA로 희석한 DNA 혼합물을 각 위치에 도입한 mis-match 염기에 따라 설계된 crRNA 및 LbCas12a를 이용하여 절단한 결과를 나타낸 사진이며; 및 도 4c는 PAM 모티프의 위치 7에서 해당 DNA 서열은 G 인데 RNA 서열은 U 인 (dG-rU) 가이드 RNA에 T-풍부 테일링을 3' 말단에 추가한 있는 crRNA(7-U(TTT))를 사용하여 in-vitro 절단 분석을 수행한 결과를 나타낸 사진이다.
도 5는 L858R 돌연변이 DNA와 염기서열이 변형된 crRNA의 증폭 효율을 평가결과 그래프이다: 도 5a는 L858R DNA와 일치하는 crRNA에 1개의 mis-match 염기 도입 위치에 따라 crRNA의 농축 효율을 평가결과 그래프이고; 및 도 5b는 crRNA 3` 말단의 T-tailing 연장을 통한 농축 효율 증가결과를 나타낸 그래프이다.
도 6은 인공 합성된L858R 돌연변이 DNA를 정상 DNA로 1/100,000까지 연속 희석한 DNA 혼합물에 대해 CRISPR/Cas12a 증폭을 각각 3회 수행한 결과를 나타낸 그래프이다.
도 7은 조직 생검을 통한 L858R 돌연변이 여부를 확인한 검체 중 CRISPR/Cas12a 증폭을 통해 L858R 돌연변이를 검출한 결과를 나타낸 그래프이다.
도 8은 정상 DNA와 일치하는crRNA을 통해 exon19 결실 돌연변이 DNA를 구별할 수 있음을 설명하는 모식도이다.
도 9는 정상적인 DNA와 일치하는 crRNA 및 LbCas12a를 사용하여 정상 DNA와 Exon 19 결손 DNA를 in vitro 절단 분석한 결과 사진이다.
도 10은 Exon19 결실 돌연변이 DNA를 정상 DNA에 1/100,000까지 연속 희석한 DNA혼합물에 대해 CRISPR/Cas12a 증폭을 각각 3회씩 수행한 결과를 나타낸 그래프이다.
도 11은 조직 생검을 통해 결실된 Exon19 결실 여부가 확인된 검체 중 CRISPR/Cas12a 증폭을 통해 Exon19 결실 여부 돌연변이를 확인한 결과를 나타낸 그래프이다.
이하에서는 실시예를 들어 본 발명을 더욱 구체적으로 설명하고자 하나, 이는 예시적인 것에 불과할 뿐 본 발명의 범위를 제한하고자 함이 아니다. 아래 기재된 실시예들은 발명의 본질적인 요지를 벗어나지 않는 범위에서 변형될 수 있음은 당 업자들에게 있어 자명하다.
참조예 1. LbCas12a 재조합 단백질의 정제 및 확인
LbCas12a 재조합 단백질을 발현하기 위해 대장균 BL21(DE3) 세포를 pET28a-LbCas12a(addgene No. #114070) 박테리아 발현 벡터로 형질전환시켰다. 배양액이 0.6의 O.D에 도달할 때까지 세포를 37°C에서 Luria Broth(LB)에서 배양하고 재조합 단백질은 isopropyl β-D-thiogalactoside (IPTG, GenDEPOT, Texas, USA)를 최종 농도 1mM로 첨가하여 18℃에서 18시간 동안 유도하였다. 세포 배양물을 원심분리(4000rpm, 30분)하여 배지를 제거하고, 펠릿화된 세포를 용해 완충액(20mM Tris-HCl(pH 8.0), 300mM NaCl, 10mM β-메르캅토에탄올(BioRad, California, U.S.A), 1% Triton X-100(Sigma) 및 1mM phenylmethylsulfonyl fluoride(Sigma, St. Louis, U.S.A) 초음파 처리(Qsonica, Newtown, U.S.A)에 의해 용해(lysis)하였다.
상기 초음파 처리에 의한 세포 용해물을 20,000 x g에서 10분 동안 원심분리하여 세포 파편을 제거하고, 수확한 가용성 분획을 Ni-NTA 수지(Takara, Nojihigashi, Japan)와 혼합하여 정제하였다. 혼합물을 결합 완충액(20mM Tris-HCl(pH 8.0), 300nM NaCl)에서 1시간 동안 4℃에서 교반하면서 인큐베이션하였다. 인큐베이션 후, Ni-NTA 수지를 10 부피의 세척 완충액으로 세척하였다. 다음으로, Ni-NTA 수지에 결합된 단백질을 용출 완충액(20mM Tris-HCl(pH 8.0), 300nM NaCl 및 200mM 이미다졸)으로 용출(elution)시켰다.
용출된 단백질은 Centricon 필터(Amicon Ultra , 밀리포어, 벌링턴, 미국). 재조합 단백질의 순도는 SDS-PAGE(10%, Biorad, California, U.S.A) 및 Coomassie blue 염색(Biorad, California, U.S.A)으로 확인하였다.
참조예 2. crRNA의 시험관 내 전사
crRNA의 시험관 내(in vitro) 전사(transcription)를 위해, 표적 DNA에 해당하는 crRNA와 T7 프로모터 서열을 포함하는 DNA 올리고(DNA oligo)는 COSMO Genentech에서 구입하였다.
DNA oligo는 T7 RNA polymerase (NEB, Massachusetts, U.S.A), 50mM MgCl2, 100mM NTPs (ATP, GTP, UTP, CTP), 10X RNA polymerase reaction buffer, Murine RNase inhibitor, 100mM DTT 및 DEPC와 37℃에서8시간 동안 혼합하였다. DNA 올리고를 완전히 제거하기 위하여 상기 혼합물을 DNase와 함께 37°C에서 1시간 동안 배양하고, RNA 정제 키트(RBC, New Taipei City, Taipei)를 사용하여 RNA를 정제하였다. 정제된 RNA의 순도(purity)와 농도(concentration)는 Nanodrop™ 2000 Spectrophotometer(Thermo-Fisher, Massachusetts, U.S.A.)로 측정하였다. 정제된 RNA를 분취하여 -80°C에 보관하였다.
참조예 3. PCR 앰플리콘 및 시험관 내 절단의 준비
HEK293T의 genomic DNA 로부터 돌연변이를 포함하는 DNA 프라이머(primer)를 사용한 중첩 PCR(overlap PCR)에 의해 L858R이 삽입되거나 및 엑손 19 (exon 19)에 일부 서열이 삭제된 PCR 앰플리콘(PCR amplicon) 돌연변이 얻었다.
정제된 recombinant Cas12a와 돌연변이 DNA 이외의 DNA를 제거하도록 디자인된 crRNA를 미리 혼합하고 PCR 앰플리콘과 함께 37°C에서 1시간 동안 배양하였다. 이후 90°C에서 1분 동안 Cas12a/crRNA 리보핵단백질 복합체(ribonucleoprotein complex)를 비활성화(inactivation)시켰다.
PCR 앰플리콘의 절단(cleavage)은 아가로스 겔 전기영동(agarose gel electrophoresis)(2%)에 의해 확인하였다.
참조예 4. CRISPR/Cas12a 증폭을 통한 돌연변이 DNA 농축
돌연변이 DNA(mutant DNA)를 특이적으로 증폭(specifically amplify)하기 위해 정제된 재조합 LbCas12a 단백질과 인위적으로 합성된 crRNA를 미리 혼합하고, PCR 앰플리콘(PCR amplicon)과 함께 37°C에서 1시간 동안 배양하였다. 이후, 90°C에서 1분 동안 배양하여 Cas12a/crRNA 리보핵단백질 복합체를 비활성화하였다.
상기 과정을 통해 정상 DNA(normal DNA)를 절단(cleavage)한 후, 절단된 혼합물(the cleaved mixture)을 PCR 증폭을 통해 절단되지 않은 돌연변이 DNA를 증폭시켰다(98°C에서 30초 동안 변성(denaturation), 58°C에서 30초 동안 프라이머 어닐링(primer annealing), 72°C에서 30초 동안 신장(extension), 30 cycles).
높은 처리량 시퀀싱(High throughput sequencing)을 위해 nested PCR(98°C에서 30초 동안 변성(denaturation), 58°C에서 30초 동안 프라이머 어닐링(primer annealing) 및 72°C에서 30초 동안 신장(extension), 35 cycles)을 사용하여 enriched PCR production을 바코드 서열(barcode sequence)과 연결하였다. 높은 처리량 시퀀싱(High throughput sequencing)은 Illumina I-seq 100 시퀀싱 기기(Illumine, California, USA)로 수행하였다.
CRISPR 분석기 웹 도구(CRISPR analyzer web tool)를 통해 시퀀싱 원시 데이터(sequencing raw data)를 분석하여 돌연변이 DNA 비율(rate)을 계산하였다.
상기 과정의 모식도는 도 1에 나타내었다.
도 1을 참조하여 설명하면, 무세포 순환 DNA(cfDNA)는 폐암 환자의 혈장에서 추출였고, 추출된 cfDNA를 돌연변이 DNA(mutant DNA)를 특이적으로 증폭(specifically amplify)하기 위해 정제된 재조합 LbCas12a 단백질과 인위적으로 합성된 crRNA를 혼합하여 정상 DNA(norlmal DNA)를 절단(cleavage) 하였다. 절단된 혼합물(the cleaved mixture)을 PCR 증폭을 통해 절단되지 않은 돌연변이 DNA를 증폭시켰다. 높은 처리량 시퀀싱(High throughput sequencing)을 수행하고, CRISPR 분석기 웹 도구(CRISPR analyzer web tool)를 통해 시퀀싱 원시 데이터(sequencing raw data)를 분석하였다.
실시예 1. EGFR L858R 점 돌연변이를 특이적으로 증폭하기 위한 crRNA의 설계 및 활성 확인
실시예 1.1. EGFR L858R 점 돌연변이를 특이적으로 증폭하기 위한 crRNA의 설계
EGFR L858R 점 돌연변이를 특이적으로 증폭하기 위해 20nt 표적 서열의 L858R 점 돌연변이와 5` 업스트림의 TTTN PAM 모티프를 모두 포함하는 crRNA를 설계하였다. crRNA가 정상 DNA와 돌연변이 DNA를 구별할 수 있도록 정상 DNA와 완벽하게 일치하는 crRNA에 점 돌연변이가 형성되는 염기 근처에 추가적으로 잘못된 페어링(misparing)을 도입하였다.
구체적으로 도2에서 보는 바와 같이 정상 DNA와 2개의 mis-match된 염기가 존재하고, L858R 돌연변이 DNA와는 1개의 mis-match된 염기가 존재하는 crRNA의 경우 정상 DNA만을 특이적으로 절단할 수 있다. 도 2에서 밝은 녹색 영역은 상보적 결합을 나타내고, 빨간색 영역은 mis-paring 결합을 나타낸다. 이를 바탕으로 도3에 나타낸 바와 같이 EGFR L858R 돌연변이 부위(TTTN PAM 모티프에서 4bp떨어진 곳) 근처의 7개 위치를 선택하여 mis-pairing을 도입하였다.
각 위치 별로 3개의 mis-pairing 포함하도록 설계한crRNA의 염기서열은 표1에 나타내었다. 예를 들면, 표 1의 7-1의 경우, 도4의 7번 위치에 C(사이토신) 대신 U(우라실)을 포함하는 crRNA를 의미한다.
Target crRNA sequence 서열번호
L858 1-1 5` AATTTCTACTAAGTGTAGAT TCCAG CCCAA AATCT GTGAT 3` 1
L858 1-2 5` AATTTCTACTAAGTGTAGAT ACCAG CCCAA AATCT GTGAT 3` 2
L858 1-3 5` AATTTCTACTAAGTGTAGAT CCCAG CCCAA AATCT GTGAT 3` 3
L858 2-1 5` AATTTCTACTAAGTGTAGAT GTCAG CCCAA AATCT GTGAT 3` 4
L858 2-2 5` AATTTCTACTAAGTGTAGAT GACAG CCCAA AATCT GTGAT 3` 5
L858 2-3 5` AATTTCTACTAAGTGTAGAT GGCAG CCCAA AATCT GTGAT 3` 6
L858 3-1 5` AATTTCTACTAAGTGTAGAT GCTAG CCCAA AATCT GTGAT 3` 7
L858 3-2 5` AATTTCTACTAAGTGTAGAT GCAAG CCCAA AATCT GTGAT 3` 8
L858 3-3 5` AATTTCTACTAAGTGTAGAT GCGAG CCCAA AATCT GTGAT 3` 9
L858 5-1 5` AATTTCTACTAAGTGTAGAT GCCAT CCCAA AATCT GTGAT 3` 10
L858 5-2 5` AATTTCTACTAAGTGTAGAT GCCAA CCCAA AATCT GTGAT 3` 11
L858 5-3 5` AATTTCTACTAAGTGTAGAT GCCAC CCCAA AATCT GTGAT 3` 12
L858 6-1 5` AATTTCTACTAAGTGTAGAT GCCAG TCCAA AATCT GTGAT 3` 13
L858 6-2 5` AATTTCTACTAAGTGTAGAT GCCAG ACCAA AATCT GTGAT 3` 14
L858 6-3 5` AATTTCTACTAAGTGTAGAT GCCAG GCCAA AATCT GTGAT 3` 15
L858 7-1 5` AATTTCTACTAAGTGTAGAT GCCAG CTCAA AATCT GTGAT 3` 16
L858 7-2 5` AATTTCTACTAAGTGTAGAT GCCAG CACAA AATCT GTGAT 3` 17
L858 7-3 5` AATTTCTACTAAGTGTAGAT GCCAG CGCAA AATCT GTGAT 3` 18
L858 7-1
(TTT)
5` AATTTCTACTAAGTGTAGAT GCCAG CTCAA AATCT GTGAT TTT 3` 19
Exon19
wild type
5` AATTTCTACTAAGTGTAGAT GGAGA TGTTG CTTCT CTTAA 3` 20
Exon19 deletionmutation 5` AATTTCTACTAAGTGTAGAT GGAGA TGTCT TGATA GCGAC 3` 21
Exon19pattern_1
deletion
5` AATTTCTACTAAGTGTAGAT GATTC CTTGA TAGCG ACGGG 3` 22
Exon19pattern_4
deletion
5` AATTTCTACTAAGTGTAGAT GGAGA TGTTT TGATA GCGAC 3` 23
Exon19pattern_5
deletion
5` AATTTCTACTAAGTGTAGAT GGAAT CTTGA TAGCG ACGGG 3` 24
Exon19pattern_6
deletion
5` AATTTCTACTAAGTGTAGAT GGAGA TGTTG GTTCC TTGAT 3` 25
실시예 1.2. crRNA 구조에 따른 in vitro에서의 절단 활성 확인
참조예 1의 방법으로 합성된 LbCas12a을 이용하여 in-vitro 절단 분석을 통해 LbCas12a가 L858R 돌연변이 DNA와 정상 DNA를 구별할 수 있는지 확인하였다. 20nt 표적 서열의 EGFR L858R 점 돌연변이와 5` 업스트림의 TTTN PAM 모티프를 모두 포함하는 crRNA를 설계하였다.
도 4a에서 보는 바와 같이, EGFR L858R 점 돌연변이를 타겟으로 하는 crRNA를 사용한 경우, LbCas12a는 1bp 불일치에 대한 높은 내성(tolerance)으로 인해 정상 DNA와 L858R 돌연변이 DNA를 큰 차이 없이 절단하는 것으로 확인되었다.
실시예 1.1에서 설계한 일 구체예에 따른 sequence-modified crRNA의 정상 DNA특이적 절단여부를 확인하기 위해, 인위적으로 합성된 L858R 돌연변이 DNA를 사용하여 염기서열이 변형된 crRNA의 증폭 효율을 평가하였다.
구체적으로 EGFR L858 유전자좌 내에서 증폭된 PCR 생성물을 L858R 돌연변이 DNA로 희석하였다. 희석된 DNA 혼합물을 실시예 1.1의 일 구체예와 같이 설계된 crRNA와 참조예 1의 방법으로 합성된 LbCas12a와 함께 배양하고, 절단된 PCR 산물을 전기영동하였다. 전기영동 결과는 도 4b에 나타내었다. 도 4b에서 보는 바와 같이, L858R 돌연변이 DNA로 희석한 PCR 생성물이 실시예 1.1의 일 구체예와 같이 설계된 crRNA로 절단된 것을 확인할 수 있다.
특히 도 4c에서 보는 바와 같이, PAM 모티프의 위치 7에서 해당 DNA 서열은 G 인데 RNA 서열은 U 인 (dG-rU) 가이드 RNA에 T-풍부 테일링을 3' 말단에 추가한 있는 crRNA(7-U(TTT))를 사용하여 in-vitro 절단 분석을 수행한 결과, 정상 DNA를 명확하게 절단하는 반면, 변이된 DNA는 절단되지 않는 것을 확인하였다.
상기의 결과는 일 구체예에 따른 crRNA를 사용하는 경우 LbCas12a가 L858R 돌연변이 DNA와 정상 DNA를 구별하여 정상 DNA만을 절단할 수 있음을 의미한다.
실시예 2. EGFR L858R돌연변이 DNA를 특이적으로 증폭하도록 설계된 CRISPR/Cas 시스템 및 EGFR L858R 돌연변이 검출 감도 확인
실시예 2.1. EGFR L858R돌연변이 DNA를 특이적으로 증폭하도록 설계된 CRISPR/Cas 시스템
본 발명의 CRISPR/cas 시스템을 이용하여 L858R 돌연변이 DNA의 특이적 증폭 효과를 확인하기 위해, 돌연변이 DNA를 정상 DNA로 희석한 DNA 혼합물에 실시예 1.1의 L858R 점 돌연변이 주변 7개의 염기 위치에 다양한 mis-pairing을 갖는 crRNA와 LbCas12a를 넣어 in-vitro 절단을 수행하고, PCR에 의해 L858R 돌연변이 DNA 증폭 효율을 비교하였다.
구체적으로 L858R 돌연변이 빈도는 높은 처리량 시퀀싱을 통해 평가하고, 농축 배수는 L858R 돌연변이의 빈도를 증가시켜 계산하였다. 상기 결과는 도 5에 나타내었다.
도 5a에서 보는 바와 같이, 일 구체예에 따른 crRNA의 돌연변이 농축 효율을 확인하였으며, 특히 7번 위치에서 rU-dG mis-pairing을 갖는 crRNA는 돌연변이 DNA의 양을 3.6배 증가시켜 가장 높은 농축 효율을 보였다. 또한 도 5b에서 보는 바와 같이 7번 위치에서 rU-dG mis-pairing을 갖는 crRNA 3' 말단에 T-풍부 테일링(T-rich tailing)을 추가하면 돌연변이 DNA의 양을 5.9배 증가시킴을 확인하였다. 7번 위치에서 rU-dG mis-pairing을 및 crRNA 3' 말단에 T-풍부 테일링(T-rich tailing)을 갖는 crRNA의 구성은 표 2에 나타내었다.
WT specific dual-mismatch crRNA 구성 (서열번호 19)
AA TTTCT ACTAA GTGTA GAT GCCaG CtCAA AATCT GTGAT TTT
AA TTTCT ACTAA GTGTA GAT 직접반복부(direct repeat) 서열
GCCaG CtCAA AATCT GTGAT 표적 서열에 해당(소문자는 mismatch)
TTT 절단(cleavage) 효율을 높이는 서열
WT(wild type) EGFR 유전자 서열 (서열번호 26)
GCCAG CCCAA AATCT GTGAT
실시예 2.2. CRISPR/Cas12a 증폭을 통한 EGFR L858R 돌연변이 검출 감도 확인
실시예 2.2.1. 폐암환자의 cfDNA에서 CRISPR/Cas12a 증폭을 통한 EGFR L858R 돌연변이 검출
EGFR L858R 돌연변이 DNA를 선택적으로 증폭시키는 crRNA를 이용한 CRISPR/Cas시스템의 고감도를 평가하기 위해 돌연변이 DNA를 정상 DNA로 연속적으로 1/100,000까지 희석한 DNA 혼합물을 LbCas12a로 절단하고 PCR 반응을 통해 증폭하였다. L858 돌연변이 DNA에 대한 증폭 효율은 표적화된 딥 시퀀싱을 통해 측정하였다.
도6에서 보는 바와 같이, 증폭 전 1:100,000 혼합물에서는 L858R 돌연변이 DNA가 검출되지 않았지만, 3차 증폭으로 L858R 돌연변이 DNA 비율이 13.8%로 증가하여 CRISPR/Cas12a 증폭을 여러 차례 반복하여 0.001% 돌연변이를 증폭할 수 있음을 확인하였다.
이러한 결과는 본 발명의 CRISPR/Cas12a 증폭 시스템으로 기존의 NGS 방식의 특정 한계(0.1%)를 100배 이상 향상시켜 0.001% 미만의 돌연변이DNA 검출 가능함을 의미한다.
실시예 2.2.2. NSCLC 환자의 액체 생검에서 CRISPR/Cas12a 증폭을 통한 L858R 돌연변이 검출
본 발명의 시스템이 NSCLC 환자의 액체 생검에서 매우 적은 양의 L858R 돌연변이 DNA를 증폭할 수 있는지 알아보기 위해 조직 생검으로 확인된 7명의 L858R(+) 및 41명의 L858R(-) 사례를 포함한 48명의 환자의 혈액에서 cfDNA를 추출하고, LbCas12a 농축 과정을 통해 L858R 돌연변이 DNA를 증폭하였다.
도 7에서 보는 바와 같이, CRISPR/Cas12a 증폭 전에 L858R(+) 사례 7개 중 1개가 4.9%로 검출되었지만 L858R(+) 사례 6개 중 6개에서 돌연변이가 검출되지 않았다. CRISPR/Cas12a 증폭 절차를 거친 후, 증폭 전에 검출되지 않았던 6개의 L858R(+) 샘플(P1, P2, P4, P5, P6 및 P7)에서 L858R 돌연변이 DNA를 1%에서 97.4%로 증폭시켰고, 특히 P6 샘플은 97.4%의 가장 높은 증폭률을 보였다.
이러한 결과는 본 발명의 CRISPR/Cas12a 증폭 시스템이 L858R 돌연변이 DNA를 조직 생검의 민감도 수준(7/7)으로 증폭할 수 있는 반면 전통적인 액체 생검은 할 수 없음(1/7)을 시사한다. 또한 조직 생검에서 검출되지 않은 7개 L858R(-) 중 7개에서 어떠한 돌연변이도 검출하지 않았으며, 이는 본 발명이 낮은 위양성(false positive)으로 매우 민감한 검증 도구임을 의미한다.
실시예 3. EGFR exon19 결실 돌연변이를 특이적으로 증폭하기 위한 crRNA 설계 및 활성 확인
실시예 3.1. EGFR exon19 결실 돌연변이를 특이적으로 증폭하기 위한 crRNA 설계
EGFR exon19 결실 돌연변이를 특이적으로 증폭하기 위한crRNA를 설계하였다.
구체적으로, L858R 점 돌연변이와 달리 exon19 결실 패턴은 9bp~18bp 등 다양한 결실 크기로 나타난다. 따라서 도 8에서 보는 바와 같이, EGFR exon19 결실 돌연변이의 경우 추가적으로 잘못된 페어링을 도입하지 않고도 효과적으로 정상 DNA와 exon19 결실 돌연변이 DNA를 구별할 수 있다. EGFR exon19 결실 돌연변이를 특이적으로 증폭하기 위한crRNA의 구성은 표 3에 기재하였다.
WT crRNA 구성 (서열번호 27)
AA TTTCT ACTAA GTGTA GAT GGAGA TGTTG CTTCT CTTAA TTT
AA TTTCT ACTAA GTGTA GAT 직접반복부(direct repeat) 서열
GGAGA TGTTG CTTCT CTTAA 표적 서열
TTT 절단(cleavage) 효율을 높이는 서열
WT(wild type) EGFR 유전자 서열 (서열번호 28)
GGAGA TGTTG CTTCT CTTAA
실시예 3.2. EGFR exon19 결실 돌연변이 특이적 증폭을 위한crRNA의 in vitro 절단 활성 확인
EGFR Exon19 유전자좌에서 15 bp로 결실된 DNA 단편을 합성하고 정상 DNA 서열과 완벽하게 일치하는 crRNA 및 LbCas12a으로 시험관 내 절단 분석을 수행하였다. 상기 결과는 도 9에 나타내었다.
도 9에서 보는 바와 같이, 정상 DNA 특이적 crRNA는 정상 DNA를 상당히 절단하였으나, 15bp 결실을 포함하는 돌연변이 DNA는 전혀 절단되지 않았다.
상기 결과는 L858R point mutated DNA와 달리 crRNA에 mis-pairing을 도입하지 않고도 정상 DNA와 Exon19 결실 돌연변이 DNA를 구별하여 정상 DNA만을 절단할 수 있음을 의미한다.
실시예 4. EGFR exon19 결실 돌연변이를 특이적으로 증폭하도록 설계된 CRISPR/Cas시스템 및 EGFR exon19 결실 돌연변이 검출 감도 확인
실시예 4.1 EGFR exon19 결실 돌연변이를 특이적으로 증폭하도록 설계된 CRISPR/Cas시스템
매우 적은 양의 EGFR exon19 결실 돌연변이 DNA를 특이적으로 증폭할 수 있는지 확인하기 위해 실시예 3의 crRNA와 LbCas12a를 이용하여 참조예 3과 같은 방법으로 정상 DNA를 특이적으로 절단한 후 PCR을 돌연변이 DNA를 증폭시켰다.
구체적으로 15bp의 exon 19결실 DNA 단편을 정상 DNA 단편과 1:100,000이 되도록 희석하였다. 시험관 절단 및 PCR 증폭을 포함하는 CRISPR/Cas12a 증폭을 희석된 DNA 혼합물에 대해 각각 3회씩 수행하였다. Exon19 결실 돌연변이 빈도는 높은 처리량 시퀀싱으로 계산하였다. 상기 결과는 도 10에 나타내었다.
도 10에서 보는 바와 같이, 1:100,000 희석된 돌연변이 DNA는 일반적인 액체 생검을 사용하여 검출되지 않았다. 반면, 본 발명의 일 실시예에 따른 CRISPR/Cas 시스템을 통한 3회 증폭을 통해 Exon19 결실 돌연변이 DNA를 최대 12.6%까지 증폭할 수 있음을 확인하였다.
상기 결과는 일반적인 액체 생검(No amplification, N/A)을 사용하여서는 측정할 수 없는 돌연변이 DNA를 본 발명의 일실시예에 따른 CRISPR/Cas12a 시스템을 통하여 측정 민감도 확보할 수 있음을 의미한다.
실시예 4.2. 폐암환자의 cfDNA에서 CRISPR/Cas12a 증폭을 통한 Exon19 결실 돌연변이 검출
임상 샘플에서 Exon19 결실 돌연변이 DNA 검출 효과를 확인하기 위하여 폐암환자의 cfDNA에서 Exon19 결실 돌연변이 DNA의 CRISPR/Cas12a 증폭을 수행하였다.
구체적으로 조직 생검으로 확인된 Exon 19 결실(+) 환자 11명과 Exon 19 결실(-) 환자 11명의 혈액에서 cfDNA를 추출하고, CRISPR/Cas12a 증폭을 수행하였다. 상기 결과는 도 11에 나타내었다.
도 11에서 보는 바와 같이, CRISPR/Cas12a 증폭은 조직 생검(P1, P4, P8, P9, P10 및 P11)을 통해 확인된 6개의 Exon 19 결실(+) 샘플에서 결실된 돌연변이 DNA를 99.1%로 크게 증폭함을 확인하였다. 이들 샘플 중 2개(P4 및 P9)는 증폭 전에는 1% 미만의 결실률을 보였지만, CRISPR/Cas12a 증폭을 통해 각각 91.4% 및 93.4%로 증폭되었다.
상기 결과는 본 발명의 구체적 실시예에 해당하는 CRISPR/Cas12a 증폭 시스템이 혈액 시료에서 유래한 변이 DNA를 효과적으로 증폭할 수 있어 EGFR 돌연변이 DNA 검출에 유용한 도구로 활용될 수 있음을 의미한다.

Claims (23)

  1. 표적 서열에 혼성화할 수 있는 가이드 폴리뉴클레오티드로서, 정상(wild type) EGFR(Epidermal growth factor receptor) 유전자 서열 중 일부와 상보적인 연속적인 염기를 포함하고, 정상(wild type) EGFR 유전자 서열과 일치하거나 적어도 하나 이상의 미스매치(mis-match) 염기를 포함하는, 가이드 폴리뉴클레오티드.
  2. 제1항에 있어서, 상기 정상(wild type) EGFR 유전자 서열은 프로토스페이서 인접 모티프(PAM)의 3' 말단에 연결된 것인, 가이드 폴리뉴클레오티드.
  3. 제2항에 있어서, 상기 프로토스페이서 인접 모티프(PAM)는 5' T-풍부 모티프를 포함하는 것인, 가이드 폴리뉴클레오티드.
  4. 제1항에 있어서, 상기 가이드 뉴클레오티드는 EGFR 돌연변이 위치에서 적어도 하나 이상의 미스매치(mis-match) 염기를 포함하는, 가이드 폴리뉴클레오티드.
  5. 제4항에 있어서, 상기 EGFR 돌연변이 위치에서 적어도 하나 이상의 미스매치되는 염기는 정상(wild type) EGFR 유전자 서열과 상보적인 것인, 가이드 폴리뉴클레오티드.
  6. 제4항에 있어서, 상기 EGFR 돌연변이는 G719S 돌연변이, G179C 돌연변이, G719A 돌연변이, S720F 돌연변이, T790M 돌연변이, D761Y 돌연변이, exon 19 결실 돌연변이, D770_N771 삽입 돌연변이, V765A 돌연변이, T783A 돌연변이, S761I 돌연변이, T790M 돌연변이, V769L 돌연변이, N771I 돌연변이, L858R 돌연변이, L861Q 돌연변이 및 L861R 돌연변이 중 어느 하나인 것인, 가이드 폴리뉴클레오티드.
  7. 제1항에 있어서, 상기 정상(wild type) EGFR 유전자 서열과 적어도 하나 이상의 미스매치(mis-match) 염기의 위치는 프로토스페이서 인접 모티프(PAM)로부터 3'말단 방향으로 1 내지 14 bp(base pair)에 위치한 것인, 가이드 폴리뉴클레오티드.
  8. 제1항에 있어서, 상기 가이드 폴리뉴클레오티드는 5' 말단에서 3' 말단 순서로, 직접 반복부 서열, 표적 서열에 혼성화할 수 있는 가이드 폴리뉴클레오티드를 포함하는20 bp 내지 50bp 길이인 것인, 가이드 폴리뉴클레오티드.
  9. 제8항에 있어서, 상기 가이드 폴리뉴클레오티드는 3’말단에 절단 효율을 높이는 서열을 더 포함하는 것인, 가이드 폴리뉴클레오티드.
  10. 제9항에 있어서, 상기 절단 효율을 높이는 서열은 T-풍부 테일링(T-rich tailing) 서열인 것인, 가이드 폴리뉴클레오티드.
  11. 제1항에 있어서, 상기 가이드 폴리뉴클레오티드는 서열번호 1 내지 20 및 27 중 어느 하나로 표시되는 뉴클레오티드 서열을 포함하는 것인, 가이드 폴리뉴클레오티드.
  12. 제1항 내지 제11항 중 어느 하나의 가이드 폴리뉴클레오티드를 암호화하는 벡터.
  13. 다음을 포함하는, 정상(wild type) EGFR 유전자 서열을 포함하는 핵산을 절단(cleavage) 할 수 있는 CRISPR/Cas 시스템:
    제1항 내지 제11항 중 어느 하나의 가이드 폴리뉴클레오티드 또는 이를 암호화하는 폴리뉴클레오티드; 및
    Cas 단백질 또는 이를 암호화하는 폴리뉴클레오티드.
  14. 제13항에 있어서, 상기 CRISPR/Cas 복합체는 돌연변이 EGFR 유전자 서열을 포함하는 핵산을 절단하지 않는 것인, CRISPR/Cas 시스템.
  15. 제13항에 있어서, 상기 Cas 단백질은 Class 2에 속하는 단백질인 것인, CRISPR/Cas 시스템.
  16. 제15항에 있어서, 상기 Class 2에 속하는 Cas 단백질은 type Ⅴ Cas 단백질인 것인, CRISPR/Cas 시스템.
  17. 제16항에 있어서, 상기 type Ⅴ Cas 단백질은 Cas12a, mgCas12a, Cas12b, Cas12c, Cas12d, Cas12e, Cas12g, Cas12h, 및 Cas12i로 이루어진 군으로부터 선택된 어느 하나인 이펙터 단백질(effector protein)인 것인, CRISPR/Cas 시스템.
  18. 제13항의 CRISPR/Cas 시스템을 포함하는, EGFR 돌연변이 검출을 위한 조성물.
  19. 제18항에 있어서, 상기 EGFR 돌연변이는 G719S 돌연변이, G179C 돌연변이, G719A 돌연변이, S720F 돌연변이, T790M 돌연변이, D761Y 돌연변이, exon 19 결실 돌연변이, D770_N771 삽입 돌연변이, V765A 돌연변이, T783A 돌연변이, S761I 돌연변이, T790M 돌연변이, V769L 돌연변이, N771I 돌연변이, L858R 돌연변이, L861Q 돌연변이 및 L861R 돌연변이 중 어느 하나인 것인, EGFR 돌연변이 검출을 위한 조성물.
  20. 제13항의 CRISPR/Cas 시스템을 분리된 환자의 시료 내 타겟 핵산과 접촉하는 단계를 포함하는, EGFR돌연변이를 검출하는 방법.
  21. 제20항에 있어서, 상기 분리된 환자 시료는 cfDNA(cell free DNA)를 포함하는 것인, EGFR돌연변이를 검출하는 방법.
  22. 제20항에 있어서, 상기 EGFR 돌연변이는 G719S 돌연변이, G179C 돌연변이, G719A 돌연변이, S720F 돌연변이, T790M 돌연변이, D761Y 돌연변이, exon 19 결실 돌연변이, D770_N771 삽입 돌연변이, V765A 돌연변이, T783A 돌연변이, S761I 돌연변이, T790M 돌연변이, V769L 돌연변이, N771I 돌연변이, L858R 돌연변이, L861Q 돌연변이 및 L861R 돌연변이 중 어느 하나인 것인, EGFR돌연변이를 검출하는 방법.
  23. 제20항에 있어서, 상기 분리된 환자의 시료 내 타겟 돌연변이 DNA를 증폭하는 단계를 포함하는, EGFR돌연변이를 검출하는 방법.
KR1020230012153A 2022-01-28 2023-01-30 EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas시스템 및 이의 용도 KR20230117057A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20220013525 2022-01-28
KR1020220013525 2022-01-28

Publications (1)

Publication Number Publication Date
KR20230117057A true KR20230117057A (ko) 2023-08-07

Family

ID=87472301

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230012153A KR20230117057A (ko) 2022-01-28 2023-01-30 EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas시스템 및 이의 용도

Country Status (2)

Country Link
KR (1) KR20230117057A (ko)
WO (1) WO2023146366A1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102086689B1 (ko) * 2018-02-06 2020-03-09 주식회사 진씨커 돌연변이 세포 유리 유전자 분리 키트 및 이를 이용한 돌연변이 세포 유리 유전자 분리 방법

Also Published As

Publication number Publication date
WO2023146366A1 (ko) 2023-08-03

Similar Documents

Publication Publication Date Title
US8679788B2 (en) Methods for the detection of nucleic acid differences
EP0738779B1 (en) Direct cloning of PCR amplified nucleic acids
US20130149695A1 (en) Method for detecting genetic mutation by using a blocking primer
US11725211B2 (en) TNT cloning system
KR102313470B1 (ko) Dna의 에러-프리 염기서열 분석
US9850528B2 (en) Determination of the normalized degree of DNA methylation
KR102270892B1 (ko) 공조 프라이머, 프로브 그리고 이의 용도
AU2007231546B2 (en) Amplification of DNA fragments
WO1998001562A1 (en) Thermostable mutl genes and proteins and uses therefor
WO2012118802A9 (en) Kit and method for sequencing a target dna in a mixed population
WO2016152812A1 (ja) 標的核酸の高感度検出方法
CN105189746A (zh) 用于使用耐热的错配内切核酸酶的方法
CN106755451A (zh) 核酸制备及分析
WO2021075555A1 (ja) 標的核酸の検出方法、核酸結合分子の検出方法、及び核酸結合能の評価方法
JP4891764B2 (ja) Dna中におけるアルキル化シトシンの検出方法
US20220325362A1 (en) Virus detection via programable type iii-a crispr-cas systems and methods
Song et al. A novel method to detect mutation in DNA by utilizing exponential amplification reaction triggered by the CRISPR-Cas9 system
Bouzidi et al. APOBEC3DE antagonizes hepatitis B virus restriction factors APOBEC3F and APOBEC3G
CN113201586B (zh) 一种基于Cas蛋白的检测方法
KR102089640B1 (ko) 야생형 및/또는 돌연변이화된 표적 dna 서열을 검출하기 위한 방법 및 키트
KR20230117057A (ko) EGFR 돌연변이 DNA를 특이적으로 증폭할 수 있는 CRISPR/Cas시스템 및 이의 용도
Caval et al. Mouse APOBEC1 cytidine deaminase can induce somatic mutations in chromosomal DNA
JP6164590B2 (ja) ウシ白血病ウイルス検出用プライマーセット、及びその利用
KR102551876B1 (ko) Cpf1 및 키메릭 DNA-RNA 가이드를 포함하는 유전체 교정 또는 발현 억제용 조성물
JP6964900B2 (ja) 核酸増幅の特異的抑制方法