KR20220061889A - 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법 - Google Patents

비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법 Download PDF

Info

Publication number
KR20220061889A
KR20220061889A KR1020210150739A KR20210150739A KR20220061889A KR 20220061889 A KR20220061889 A KR 20220061889A KR 1020210150739 A KR1020210150739 A KR 1020210150739A KR 20210150739 A KR20210150739 A KR 20210150739A KR 20220061889 A KR20220061889 A KR 20220061889A
Authority
KR
South Korea
Prior art keywords
lys
leu
glu
asp
ile
Prior art date
Application number
KR1020210150739A
Other languages
English (en)
Inventor
정현정
양승주
임산해
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to PCT/KR2021/015996 priority Critical patent/WO2022098141A1/ko
Publication of KR20220061889A publication Critical patent/KR20220061889A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

일 양상은 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법에 관한 것이다. 구체적으로, 일 양상에 따르면 유전자 편집 단백질에 도입된 생직교반응기 도입 수를 조절할 수 있으며, 유전자 편집 단백질을 세포 내에 전달하는 과정에서 다른 생리활성물질과 in situ로 선택적 화학반응을 일으켜 고효율, 고선택적 전달 및 CRISPR 유전자 교정을 일으킬 수 있는 바, in vivo 및 ex vivo 세포교정 치료제로 유용하게 활용될 수 있다.

Description

비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법{A GENE EDITING PROTEIN RESIDUE-SPECIFICALLY INCORPORATED WITH UNNATURAL AMINO ACID AND A METHOD FOR EDITING OF GENE USING THE SAME}
비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법에 관한 것이다.
유전자치료제는 질병 표적 유전자를 정밀하게 조절할 수 있고, 범용성 기술로 기존의 단백질이나 저분자 약물에 비해 큰 장점을 지니며, 암 B질환, 희귀유전질환, 신경질환, 심혈관 질환, 전염병 등을 대상으로 활발히 연구되고 있다. 유전자치료제 시장은 2016년 5.84억달러(약 6,584억원)에서 연평균('17-'23) 33.3%로 성장해 2023년 44.02억달러(약 5조원) 규모를 보일 전망이다. 암 질환과 희귀질환에 대한 유전자치료제가 전체시장의 60% 이상을 차지하며, 뒤이어 신경질환, 심혈관 질환, 전염병 순으로 시장을 형성하고 있다.
유전자치료에 사용하는 전달방법 중 레트로바이러스 (retrovirus), 아데노 부속 바이러스 (adeno-associated virus, AAV), 렌티바이러스 (lentiviruses) 등 바이러스 기반 전달방법의 경우 높은 전달효율을 나타내어 다양한 질병을 표적으로 개발이 활발히 이루어져 왔다. 예컨대, 미국 Editas사는 in vivo 유전자 치료 기술에 중점적으로 투자하여, 안과질환을 타겟으로 Allergan Pharmaceuticals사와 파트너십을 맺고 치료제를 개발하였다. 특히 10형 레버 선천성 흑암시(LCA: Leber congenital amaurosis type 10)라는 희귀 선천성 망막질환 환자들을 대상으로 개발된 바이러스 기반 in vivo 유전체 교정 기술에 기반한다. 본 기술은 CEP290 유전자의 splicing error를 교정하기 위해 아데노부속바이러스(AAV)를 안구에 직접 주입함으로써 적용하는 것이다. 이 프로그램은 AAV 제작 과정에서 어려움을 겪어 지연됐으나, 2018년 말에 FDA로부터 1/2상 용량 상승 임상시험을 허가받았다. AAV는 작은 크기로 인해 다른 바이러스에 비해 상대적으로 안전하게 적용할 수 있다고 보고되지만 CRISPR 발현 벡터의 크게 때문에 AAV에 패키징 효율이 매우 낮아 개발에 어려움을 겪고 있다. 또한, 바이러스 기반 전달방법은 인체 내 면역 부작용, 발암성 등의 한계점을 지녀, 비바이러스성 전달 방법이 선호되고 있다.
비바이러스성 전달방법은 생체 투여시 안전성에 있어 큰 장점을 지니나, 표적세포 및 세포내로 낮은 전달효율을 보여, 전달을 촉진하기 위한 캐리어 물질을 사용해야 한다. 캐리어 물질로 양이온성 고분자, 지질 물질, 무기 나노입자, 세포 침투성 펩티드, 덴드리머(dendrimer) 등에 의한 전달기술이 활발히 연구되었으나, 세포독성 및 낮은 탑재 효율로 해결해야 하는 문제점이 많이 남아있다.
최근에는 CRISPR 기반 유전자 편집 도구를 활용한 유전자 치료제 연구가 활발해지고 있다. CRISPR 시스템의 경우 플라스미드, 리보핵산단백질, messenger RNA 등에 기반한 방법으로 전달이 가능하며, 이 중 리보핵산단백질의 경우 Cas9 단백질과 single guide RNA (sgRNA)로 구성된다. 글로벌 유전자 편집 시장은 2018년 36억2000만 달러(약 4조860억 원)에서 연평균 14.5%씩 성장, 오는 2023년에는 71억2000만 달러(약 8조370억 원) 규모에 달할 것으로 전망되고 있다. 이 중 CRISPR/Cas9 기술은 2018년 19억5000만 달러로 53.8%를 점유해 가장 큰 규모를 형성하고 있고, 2023년까지 14.7%씩 성장해 38억7000만 달러 규모를 형성해 유전자 편집 시장 54.2%를 차지할 것으로 기대되고 있다.
리보핵산단백질은 가장 직접적인 전달 방법으로 transient 효과로 인해 치료제로써 개발 가능성이 가장 높으며, 기존에 개발된 유전자 전달용 캐리어로 세포 내에 전달하는 방법이 연구되고 있다.
예컨대, 미국 Intellia사는 siRNA 전달을 위해 오랜 기간 연구되어 왔던 지질나노입자(LNP: lipid nanoparticle)를 이용하여 Cas9과 가이드 RNA의 리보핵산단백질 전달에 기반한 치료 기술을 중점적으로 연구하고 있다. Intellia사는 독자적인 LNP 기술을 이용하여 트랜스티레틴 유전분증(transthyretin amyloidosis)이라는 희귀 간질환을 대상으로 Regeneron사와 치료제를 공동개발 중이며, 영장류에서 전임상 결과를 발표하였다.
국내에서는 툴젠 사가 AAV에 의한 in vivo 전달로 혈우병, 샤르코마리투스(Charcot-Marie-Tooth)라는 말초신경질환, 10형 레버 선천성 흑암시 질환을 대상으로 한 치료제 개발에 투자가 많이 이루어지고 있다. 최근 툴젠 사는 서울대학교와 협력으로 CRISPR 발현 AAV 전달로 레버 선천성 흑암시 질환의 마우스 모델에서 HDR에 의한 편집 효과도 나타난 것으로 보고되었다. 또한 삼성서울병원과 툴젠의 협력으로 샤르코마리투스 치료를 위해 CRISPR RNP를 투여하여 마우스 모델에서 indel에 의한 편집 및 치료 효능을 보인 결과를 2019년 발표하였다.
하지만 Cas9 단백질의 분자량이 크고 구조가 불안정하여 캐리어에 탑재가 어려워 세포내 전달 및 교정 효율이 낮고, 캐리어 독성 문제가 있어 큰 어려움이 있다.
이에, 기존의 캐리어 기반 전달방법 대신 유전자 편집 도구의 구성요소인 Cas9 단백질을 화학적으로 개질하는 방법을 사용할 수 있다. 이의 경우 캐리어 또는 생체물질을 화학적으로 컨쥬게이션하여 캐리어가 비표적 부위로 전달되어 독성을 일으키는 문제를 최소화할 수 있고, 생산 과정에 있어 재조합 단백질 제작에 비해 과정이 매우 용이하고 단백질의 구조적인 안정성을 높게 유지할 수 있어 플랫폼 기술로써 큰 장점을 지닌다.
또한, 비천연 아미노산을 단백질에 도입하는 기술을 이용하면 대상 단백질에 생직교반응기를 부여할 수 있어, 전달용 캐리어, 리간드 등 다양한 생체분자물질을 자유자재로 접합할 수 있다. 생직교반응을 이용할 경우 원래 단백질의 lysine, cysteine의 기능기를 이용하는 방법과 비교하여 in situ에서 반응이 가능하기 때문에 표적 세포 내로 전달함에 있어 활용 가치가 높다.
이에, 본 발명은 유전자 편집 단백질인 Cas9에 비천연 아미노산을 잔기-선택적으로 도입함으로써, 생직교반응기를 부여하여 in situ에서 생체물질을 접합하고 세포내에 전달함으로써 고효율, 고선택적 유전자교정이 가능한 기술로 응용할 수 있다.
한국공개특허 제10-2021-0123237호
일 양상은 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질을 제공한다.
다른 양상은 상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 포함하는 유전자 편집용 조성물을 제공한다.
또 다른 양상은 유전자 편집 단백질에 비천연 아미노산을 잔기-선택적으로 도입하는 단계;
상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 개체로부터 분리된 세포에 처리하거나 개체에 투여하는 단계를 포함하는 유전자 편집 방법을 제공한다.
그러나, 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
일 양상은 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질에 관한 것이다.
일 양상에 있어서, 상기 비천연 아미노산은 azide기를 가진 아미노산일 수 있고, 구체적으로, AHA(4-Azido-homoalanine) 또는 이의 염일 수 있다. 상기 AHA(4-Azido-homoalanine) 또는 이의 염은 천연으로부터 유래될 수도 있고, 공지의 유기 합성 방법을 이용하여 합성될 수도 있다.
또한, 상기 AHA(4-Azido-homoalanine) 또는 이의 염은 비단백질 화합물, 펩티드, 식물 유래 조직이나 세포의 추출물, 미생물(예를 들어 세균류 또는 진균류, 그리고 특히 효모)의 배양으로 얻어진 생산물일 수 있다.
상기 용어 "염"은 일 양상에 따른 특정 화합물과 비교적 무독성인 산 또는 염기를 이용해서 조제되는 염을 의미한다.
또한, 일 양상에 있어서, 상기 "염"은 "약학적으로 허용 가능한 염"일 수 있다.
용어 "약학적으로 허용 가능한"이란 상기 화합물에 노출되는 세포나 인간에게 독성이 없는 특성을 나타내는 것을 의미한다.
용어 "약학적으로 허용 가능한 염"이란, 일 양상에 따른 특정 화합물과 비교적 무독성인 산 또는 염기를 이용해서 조제되는 염을 의미한다. 상기 화합물이 상대적으로 산성 관능기를 포함할 때, 순수 용액 또는 적합한 불활성 용매 중에서 충분한 양의 염기를 이러한 화합물의 중성 형태와 접촉시킴으로써 염기 부가염을 얻을 수 있다. 약학적으로 허용 가능한 염기 부가염은 나트륨, 칼륨, 칼슘, 암모늄, 유기 아민, 혹은 마그네슘의 염 또는 유사한 염이 포함된다. 상기 화합물이 상대적으로 염기성 관능기를 포함할 때, 순수 용액 또는 적합한 불활성 용매 중에서 충분한 양의 산을 이러한 화합물의 중성 형태와 접촉시킴으로써 산 부가염을 얻을 수 있다. 약학적으로 허용 가능한 산 부가염은 염산, 브롬화 수소산, 질산, 탄산, 탄산 수소 이온, 인산, 인산 1수소 이온, 인산 2수소 이온, 황산, 황산 수소 이온, 요오드화 수소산 또는 아인산 등의 무기산의 염, 그리고 아세트산, 프로피온산, 이소부티르산, 말레산, 말론산, 안식향산, 숙신산, 수베르산, 푸마르산, 락트산, 만델산, 프탈산, 벤젠술폰산, p-톨릴술폰산, 구연산, 주석산, 메탄술폰산 등의 유기산의 염을 들 수 있고, 나아가 아미노산(예를 들면 아르기닌 등)의 염 및 글루쿠론산 등의 유기산의 염도 포함된다.
상기 약학적으로 허용 가능한 염은 산성 또는 염기성 부분을 포함하는 모체 화합물로부터 통상적인 화학적 방법으로 합성할 수 있다. 일반적으로 이러한 염은 수중 또는 유기 용매 중 또는 이 2종의 혼합물 중에서, 이들 화합물의 유리산 또는 염기의 형태를 화학량론적으로 적량인 염기 또는 산과 반응시켜서 조제된다. 일반적으로 에테르, 아세트산에틸, 에탄올, 이소프로판올 또는 아세토니트릴 등의 비수성 매질이 바람직하다.
상기 "잔기-선택적(residue-specific)으로 도입"은 대상 단백질 또는 폴리펩티드의 아미노산 서열 중 특정 종류의 잔기가 선택적으로 변형되는 것을 의미할 수 있다. 상기 변형은 예를 들어, 치환, 결실, 삽입으로 이루어진 군에서 선택되는 적어도 하나일 수 있다.
용어 "단백질(Protein)"는 아마이드 결합 (또는 펩티드 결합)으로 연결된 2개 이상의 아미노산으로 이루어진 폴리머를 의미한다.
일 양상에 있어서, 상기 유전자 편집 단백질은 야생형 단백질의 아미노산 서열 중 Met(Methionine)이 변형된 것일 수 있고, 구체적으로, 야생형 단백질의 아미노산 서열 중 Met(Methionine)이 AHA(4-Azido-homoalanine)로 치환된 것일 수 있다.
또한, 일 양상에 있어서, 상기 유전자 편집 단백질은 CRISPR/Cas9 시스템에 이용되는 것일 수 있고, 구체적으로, Cas 단백질일 수 있고, 보다 구체적으로는 Cas9 단백질일 수 있다. 상기 유전자 편집 단백질은 상기 유전자 편집 단백질의 아미노산 서열과 각각 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85%이상, 약 90% 이상, 약 92% 이상, 약 95% 이상, 약 97% 이상, 약 98% 이상, 또는 약 99% 이상의 서열 상동성을 갖는 단백질을 포함할 수 있다.
용어 "상동성(Homology)"은 야생형 아미노산 서열과의 유사한 정도를 나타내기 위한 것으로서, 이러한 상동성의 비교는 당업계에서 널리 알려진 비교 프로그램을 이용하여 수행할 수 있으며, 2개 이상의 서열간 상동성을 백분율(%)로 계산할 수 있다.
또한, 보다 나은 화학적 안정성, 강화된 약리 특성(반감기, 흡수성, 역가, 효능 등), 변경된 특이성(예를 들어, 광범위한 생물학적 활성 스펙트럼), 감소된 항원성을 획득하기 위하여, 상기 유전자 편집 단백질의 N- 또는 C-말단에 보호기가 결합되어 있을 수 있다. 상기 보호기는 아세틸기, 플루오레닐 메톡시 카르보닐기, 포르밀기, 팔미토일기, 미리스틸기, 스테아릴기 또는 폴리에틸렌글리콜(PEG)일 수 있으나, 상기 유전자 편집 단백질의 개질, 특히 유전자 편집 단백질의 안정성을 증진시킬 수 있는 성분이라면, 제한없이 포함될 수 있다.
상기 용어 "안정성"은 생체 내 단백질 절단효소의 공격으로부터 본 발명의 폴리펩티드를 보호하는 인 비보(in vivo) 안정성뿐만 아니라, 저장 안정성(예컨대, 상온 저장 안정성)도 의미하는 것일 수 있다.
아울러, 상기 유전자 편집 단백질은 표적화 서열, 태그 (tag), 표지된 잔기를 위한 특정 목적으로 제조된 아미노산 서열도 추가적으로 포함할 수 있다.
일반적으로, 널리 알려진 유전자 편집 수단인 "CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 시스템"은 집합적으로 Cas 유전자를 코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭), 가이드 RNA 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련(CRISPR-associated; 이하 Cas) 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 일부 구현 예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현 예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피요게네스(Streptococcus pyogenes)로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열" 또는 "표적 유전자"는 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 본질적으로 완전한 상보성이 필요하지 않지만, 혼성화를 야기하고, CRISPR 복합체의 형성을 증진시키는 충분한 상보성이 존재한다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현 예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다. 일부 구현 예에서, 표적 서열은 진핵 세포의 세포기관, 예를 들어, 미토콘드리아 또는 엽록체 내에 존재할 수 있다.
상기 Cas 단백질은 CRISPR RNA(crRNA) 및 트랜스-활성화 crRNA(trans-activating crRNA, tracrRNA)로 불리는 두 RNA와 복합체를 형성할 때, 활성 엔도뉴클레아제 또는 니카아제(nickase)를 형성한다. 상기 Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 효소가 알려져 있으며; 예를 들어, 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 수탁 번호 Q99ZW2 하에 스위스프로트(SwissProt) 데이터베이스에서 얻을 수 있다. 일부 구현 예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다.
일부 구현 예에서, CRISPR 효소 또는 유전자 편집 단백질은 Cas9 단백질이며, 상기 Cas9 단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래 Cas9 단백질, 캄필로박터 제주니(Campylobacter jejuni) 유래 Cas9 단백질, 스트렙토코커스 써모필러스(Streptococcus thermophiles) 유래 Cas9 단백질, 스트렙토코커스 아우레우스(Streptocuccus aureus) 유래 Cas9 단백질 및 네이세리아 메닝기디티스(Neisseria meningitidis) 유래 Cas9 단백질로 이루어진 군에서 선택되는 적어도 하나의 Cas9 단백질일 수 있고, 구체적으로 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래 Cas9 단백질일 수 있고, 보다 구체적으로는 서열번호 1의 아미노산 서열로 이루어진 단백질이 변형된 단백질일 수 있고, 예를 들어, 서열번호 1의 아미노산 서열로 이루어진 단백질이 변형된 서열번호 2의 아미노산 서열로 이루어진 단백질일 수 있다. 일부 구현 예에서, Cas9 단백질은 진핵 세포에서의 발현을 위해 코돈-최적화될 수 있다.
일부 구현 예에서, Cas9 단백질은 진핵 세포 내의 핵 내에 위치하기 위하여 Cas9 단백질의 5'- 또는 3'-, 또는 양 말단 부분에 NLS(nuclear localization sequence or signal)를 포함하는 것일 수 있으며, 상기 NLS는 하나 또는 그 이상일 수 있다.
본 명세서에서 용어 “핵 위치화 서열 또는 신호(Nuclear localization sequence or signal, NLS)"는 특정물질(예컨대, 단백질)을 세포 핵 내로 운반하는 역할을 하는 아미노산 서열을 의미하며, 대체적으로 핵공(Nuclear Pore)을 통하여 세포 핵 내로 운반하는 작용을 한다. 상기 핵 위치화 서열은 진핵생물에서 CRISPR 복합체 활성에 필요하지 않지만, 이러한 서열을 포함하여, 시스템의 활성을 증진시켜, 특히 핵 내의 핵산 분자를 표적화하는 것으로 여겨진다.
또한 RNA 유전자 가위(RNA-guided CRISPR)(clustered regularly interspaced short palindrome repeats)-연관된 뉴클레아제 Cas9는 표적 유전자의 넉아웃, 전사 활성화 및 single guide RNA(sgRNA)(즉, crRNA-tracrRNA 융합 전사체)를 이용한 억제에 대한 획기적인 기술을 제공하며, 이 기술은 수많은 유전자 위치를 타겟팅하는 것으로 알려져 있다.
Cas9 (또는 Cpf1) 단백질은 CRISPR/Cas9 시스템에서 필수적인 단백질 요소를 의미하고, 상기 Cas9 (또는 Cpf1) 유전자 및 단백질의 정보는 국립생명공학정보센터(national center for biotechnology information, NCBI)의 GenBank에서 구할 수 있으나, 이에 제한되지 않는다. Cas (또는 Cpf1)단백질을 암호화하는 CRISPR-연관 유전자는 약 40 개 이상의 서로 다른 Cas (또는 Cpf1) 단백질 패밀리가 존재하는 것으로 알려져 있으며, cas 유전자 및 반복 구조(repeat structure)의 특정 조합에 따라 8개의 CRISPR 하위 유형 (Ecoli, Ypest, Nmeni, Dvulg, Tneap, Hmari, Apern, 및 Mtube)을 정의할 수 있다. 따라서 상기 각 CRISPR 하위 유형이 반복단위를 이루어 폴리리보뉴클레오티드-단백질 복합체를 형성할 수 있다.
상기 Cas9가 DNA로 암호화되어 개체 또는 세포로 전달되는 경우, 상기 DNA는 일반적으로 (그러나 필수적이지는 않음) 타겟 세포에서 작동 가능한 조절 요소 (예컨대, 프로모터)를 포함할 수 있다. 상기 Cas9 발현을 위한 프로모터는, 예컨대, CMV, EF-l a, EFS, MSCV, PGK, 또는 CAG 프로모터일 수 있다. gRNA 발현을 위한 프로모터는, 예컨대, HI, EF-la, tRNA 또는 U6 프로모터일 수 있다. Cas9를 코딩하는 유전자의 서열은 nuclear localization signal(NLS) (e.g., SV40 NLS)를 포함할 수 있다. 일 예에서, 상기 프로모터는 조직 특이성 또는 세포 특이성을 갖는 것일 수 있다.
용어 "키메라 RNA", "키메라 가이드 RNA", "가이드 RNA", "단일의 가이드 RNA(single guide RNA, sgRNA)" 및 "합성 가이드 RNA"는 상호교환가능하게 사용되며, 가이드 서열, tracr 서열 및/또는 tracr 메이트 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 용어 "가이드 서열"은 표적 부위를 지정하는 가이드 RNA 내의 약 20bp 서열을 지칭하며, 용어 "가이드" 또는 "스페이서"와 상호교환가능하게 사용될 수 있다. 또한, 용어 "tracr 메이트 서열"은 용어 "직접 반복부(들)"와 상호교환가능하게 사용될 수 있다. 상기 가이드 RNA는 두 개의 RNA, 즉, CRISPR RNA (crRNA) 및 트랜스 활성화 crRNA (transactivating crRNA, tracrRNA)로 이루어져 있는 것일 수 있으며, 또는 crRNA 및 tracrRNA의 부분을 포함하고 상기 표적 DNA와 혼성화하는 단일 사슬 RNA (single-chain RNA, sgRNA)일 수 있다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다.
또한 상기 가이드 RNA의 기능을 변형/증진시키기 위하여 가이드 RNA 염기 서열의 일부분을 변형할 수 있다. 또한 일부 구현 예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인(Novoalign)(노보크라프트 테크놀로지즈(Novocraft Technologies), ELAND(일루미나(Illumina), 미국 캘리포니아주 샌디에고), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다. 일부 구현 예에서, 가이드 서열은 예컨대 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75개 이상의 뉴클레오티드 길이이다. 일부 구현 예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12개 이하의 뉴클레오티드 길이이다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적절한 검정에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은 예를 들어, CRISPR 서열의 성분을 인코딩하는 벡터로의 트랜스펙션 후에, 예를 들어, 본원에 기술된 바와 같은 서베이어 검정에 의한 표적 서열 내의 우선적인 절단의 평가에 의해서와 같이, 상응하는 표적 서열을 갖는 숙주 세포로 제공될 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다. 다른 검정이 가능하며, 당업자에게 용이하게 사용될 수 있을 것이다.
가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현 예에서, 표적 서열은 세포의 게놈 내의 서열이다. 예시적인 표적 서열은 표적 게놈에서 독특한 것들을 포함한다. 예를 들어, 스트렙토코커스 피오게네스 유래 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGG (N은 A, G, T 또는 C이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGG (N은 A, G, T 또는 C 이며; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 써모필러스 CRISPR1 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXXAGAAW의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXXAGAAW (N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXXAGAAW의 스트렙토코커스 써모필러스 CRISPR1 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXXAGAAW(N은 A, G, T 또는 C이고; X는 임의의 것일 수 있으며; W는 A 또는 T임)는 게놈 내에 단일의 존재를 갖는다. 스트렙토코커스 피오게네스 Cas9에 대하여, 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMNNNNNNNNNNNNXGGXG의 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNNXGGXG (N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 게놈 내의 독특한 표적 서열은 형태 MMMMMMMMMNNNNNNNNNNNXGGXG의 스트렙토코커스 피오게네스 Cas9 표적 부위를 포함할 수 있으며, 여기서, NNNNNNNNNNNXGGXG (N은 A, G, T 또는 C이고; X는 임의의 것일 수 있음)는 게놈 내에 단일의 존재를 갖는다. 이들 서열 각각에서, "M"은 A, G, T 또는 C일 수 있다.
일 양상에 있어서, 상기 유전자 편집 단백질은 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염와 접합(conjugation)을 통해 개질될 수 있다.
상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 상기 유전자 편집 단백질 내 azide기와 클릭화학반응이 가능한 것일 수 있고, 구체적으로, DBCO(Dibenzylcyclooctyne)기를 갖는 화합물 또는 이의 염일 수 있다. 또한, 예를 들어, 상기 알카인 또는 사이클로알카인기를 갖는 화합물은 하기 화학식 2로 표시되는 화합물일 수 있다:
[화학식 2]
Figure pat00001
.
상기 용어 "염"은 "약학적으로 허용 가능한 염"일 수 있으며, 구체적으로는 전술한 범위 내일 수 있다.
또한, 일 양상에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 압타머, 항체 또는 이들의 단편과 결합된 것일 수 있다.
상기 압타머, 항체 또는 이들의 단편은 특정 표적(항원을 포함)을 위하여 결합된 것으로서, 이를 통해 상기 유전자 편집 단백질은 특정 세포 내 특정 유전자에 대한 정교한 편집을 하는 데 사용될 수 있다. 구체적으로, 상기 알카일 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 특정 세포를 표적화하는 압타머, 항체 또는 이들의 단편과 결합되어 있을 수 있고, 상기 압타머, 항체 또는 이들의 단편이 표적화하는 특정 세포에서 내포 작용(endocytosis)를 통해 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염에 접합된 유전자 편집 단백질이 세포 내로 함입되어, 특정 유전자를 편집할 수 있다.
다른 양상은 상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 포함하는 유전자 편집용 조성물에 관한 것이다.
상기 "알카인 또는 사이클로알카인기를 갖는 화합물", "염", "유전자 편집" 등은 전술한 범위 내일 수 있고, 예를 들어, 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 상기 유전자 편집 단백질 내 azide기와 클릭화학반응이 가능한 것일 수 있다. 또한, 상기 알카인 또는 사이클로알카인기를 갖는 화합물은, 예를 들어 DBCO(Dibenzylcyclooctyne)기를 갖는 화합물일 수 있고, 하기 화학식 2로 표시되는 화합물일 수 있다:
[화학식 2]
Figure pat00002
.
나아가, 상기 "알카인 또는 사이클로알카인기를 갖는 화합물"은 압타머, 항체 또는 이들의 단편과 결합된 것일 수 있다.
또한, 일 양상에 있어서, 상기 유전자 편집 단백질 및 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 접합(conjugation)될 수 있고, 상기 조성물 내에서 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 사전-접합(pre-conjugation)된 것일 수도 있다.
상기 알카일 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 특정 세포를 표적화하는 압타머, 항체 또는 이들의 단편과 결합되어 있을 수 있고, 상기 압타머, 항체 또는 이들의 단편이 표적화하는 특정 세포에서 내포 작용(endocytosis)를 통해 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염에 접합된 유전자 편집 단백질이 세포 내로 함입되어, 특정 유전자를 편집할 수 있다.
또 다른 양상은 유전자 편집 단백질에 비천연 아미노산을 잔기-선택적으로 도입하는 단계;
상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 개체로부터 분리된 세포에 처리하거나 개체에 투여하는 단계를 포함하는 유전자 편집 방법에 관한 것이다.
상기 "유전자 편집 단백질", "비천연 아미노산", "잔기-선택적으로 도입", "알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염" 등은 전술한 범위 내일 수 있다.
구체적으로, 예를 들어, 상기 비천연 아미노산은 AHA(4-Azido-homoalanine)일 수 있고, 상기 유전자 편집 단백질은 Cas9 단백질일 수 있고, 상기 알카인 또는 사이클로알카인기를 갖는 화합물은 DBCO(Dibenzylcyclooctyne)기를 갖는 화합물일 수 있으며, 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 압타머, 항체 또는 이들의 단편과 결합된 것일 수 있다.
일 양상에 있어서, 상기 유전자 편집 방법은 개체로부터 분리된 세포에 처리하거나 개체에 투여하는 단계 이전에 상기 유전자 편집 단백질과 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 접합(conjugation)시키는 단계를 더 포함할 수 있다.
또한, 일 양상에 있어서, 상기 비천연 아미노산을 잔기-선택적으로 도입하는 단계는 야생형 단백질의 아미노산 서열 중 Met(Methionine)을 AHA(4-Azido-homoalanine)로 치환하는 단계일 수 있다.
용어 "투여"란 적절한 방법으로 개체에게 소정의 물질을 도입하는 것을 의미하며, "개체"란 편집하고자 하는 유전자를 보유하는 인간을 포함한 쥐, 생쥐, 가축 등의 모든 생물을 의미한다. 구체적인 예로, 인간을 포함한 포유동물일 수 있다.
또한, 상기 "개체로부터 분리된 세포"는 개체로부터 분리된 세포 뿐만 아니라, 개체로부터 분리된 세포를 공지의 배양 방법 등으로 계대배양한 세포일 수 있고, 개체로부터 분리된 세포로부터 유전적, 화학적 또는 물리적으로 조작 또는 변형된 세포일 수 있고, 새로이 인공적으로 합성 또는 제작된 세포일 수 있다.
일 양상에 있어서, 상기 투여 경로는 이들로 한정되는 것은 아니지만 구강, 정맥내, 근육내, 동맥내, 골수내, 경막내, 심장내, 경피, 피하, 복강내, 비강내, 장관, 국소, 설하 또는 직장이 포함된다.
상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 약학적으로 유효한 양으로 투여한다. 용어, "약학적으로 유효한 양"은 의학적 치료에 적용 가능한 합리적인 수혜/위험 비율로 질환을 치료하기에 충분한 양을 의미하며, 유효 용량 수준은 환자의 질환의 종류, 중증도, 약물의 활성, 약물에 대한 민감도, 투여 시간, 투여 경로 및 배출 비율, 치료기간, 동시 사용되는 약물을 포함한 요소 및 기타 의학 분야에 잘 알려진 요소에 따라 결정될 수 있다. 구체적으로, 상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 0.001 내지 1000 mg/kg/day로, 보다 구체적으로 0.1 내지 100 ㎎/kg/day로 투여될 수 있다. 상기 투여는 하루에 한 번 투여되는 것일 수도 있고, 수 회 나누어 투여되는 것일 수도 있으나, 구체적으로, 상기 상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염의 유효량은 환자의 연령, 성별, 상태, 체중, 체내에 활성 성분의 흡수도, 불활성율, 배설 속도, 질병 종류, 병용되는 약물에 따라 달라질 수 있으며, 투여 경로, 비만의 중증도, 성별, 체중, 연령 등에 따라 증감될 수 있다.
상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 유효성분을 단독으로 포함하거나, 하나 이상의 약학적으로 허용 가능한 담체, 부형제 또는 희석제를 포함하여 제공될 수 있다.
구체적으로, 상기 담체는 예를 들어, 콜로이드 현탁액, 분말, 식염수, 지질, 리포좀, 미소구체(microspheres) 또는 나노 구형 입자일 수 있다. 이들은 운반 수단과 복합체를 형성하거나 관련될 수 있고, 지질, 리포좀, 미세입자, 금, 나노입자, 폴리머, 축합 반응제, 다당류, 폴리아미노산, 덴드리머, 사포닌, 흡착 증진 물질 또는 지방산과 같은 당업계에 공지된 운반 시스템을 사용하여 생체 내 운반될 수 있다.
상기 상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염이 제제화될 경우에는 통상적으로 사용하는 윤활제, 감미제, 향미제, 유화제, 현탁제, 보존제, 충진제, 증량제, 결합제, 습윤제, 붕해제, 계면활성제 등의 희석제 또는 부형제를 사용하여 조제될 수 있다. 경구투여를 위한 고형 제제에는 정제, 환제, 산제, 과립제, 캡슐제 등이 포함될 수 있고, 이러한 고형제제는 상기 조성물에 적어도 하나 이상의 부형제 예를 들면, 전분, 칼슘카보네이트(calciumcarbonate), 수크로스(sucrose) 또는 락토오스(lactose), 젤라틴 등을 섞어 조제될 수 있다. 또한 단순한 부형제 이외에 마그네슘 스테아레이트, 탈크 같은 윤활제들도 사용될 수 있다. 경구를 위한 액상 제제로는 현탁제, 내용액제, 유제, 시럽제 등이 있으며, 흔히 사용되는 단순희석제인 물, 리퀴드 파라핀 이외에 여러 가지 부형제, 예를 들면 습윤제, 감미제, 방향제, 보존제 등이 포함될 수 있다. 비경구 투여를 위한 제제에는 멸균된 수용액, 비수성용제, 현탁제, 유제, 동결건조 제제, 좌제가 포함될 수 있다. 비수성용제, 현탁제로는 프로필렌글리콜 (propyleneglycol), 폴리에틸렌글리콜, 올리브 오일과 같은 식물성 기름, 에틸올레이트와 같은 주사 가능한 에스테르 등이 사용될 수 있다. 좌제의 기제로는 위텝솔 (witepsol), 마크로골, 트윈(tween) 61, 카카오지, 라우린지, 글리세로 제라틴 등이 사용될 수 있고, 점안제 형태로 제조 시 공지의 희석제 또는 부형제 등이 사용될 수 있다.
상기 알카일 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 특정 세포를 표적화하는 압타머, 항체 또는 이들의 단편과 결합되어 있을 수 있고, 상기 압타머, 항체 또는 이들의 단편이 표적화하는 특정 세포에서 내포 작용(endocytosis)를 통해 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염에 접합된 유전자 편집 단백질이 세포 내로 함입되어, 특정 유전자를 편집할 수 있다.
일 양상은 비천연 아미노산을 유전자 편집 단백질에 잔기-선택적으로 도입하여 선택적인 클릭 화학 반응을 통해 생체물질을 컨쥬게이션하고 복합체를 형성하여 세포 내에 전달할 수 있는 기술을 제공한다. 일 양상에 따르면, 유전자 편집 단백질에 도입된 생직교반응기 도입 수를 조절할 수 있으며, 유전자 편집 단백질을 세포 내에 전달하는 과정에서 다른 생리활성물질과 in situ로 선택적 화학반응을 일으켜 고효율, 고선택적 전달 및 CRISPR 유전자 교정을 일으킬 수 있는 바, in vivo 및 ex vivo 세포교정 치료제로 유용하게 활용될 수 있다.
도 1은 비천연 아미노산이 잔기-선택적 도입된 Cas9복합체 제작 및 전달에 대한 모식도를 나타낸 것이다.
도 2는 B834에서 Cas9-AHA 생산 후 lysate에서 생직교화학반응성을 분석한 결과이다.
도 3은 Cas9-AHA을 정제한 후 생직교화학반응성을 분석한 결과이다.
도 4는 Cas9-AHA의 뉴클레아제 효소 활성을 분석한 결과이다.
도 5는 Cas9-AHA와 DBCO로 개질된 리간드 물질을 co-delivery함으로써 암세포 내로 표적 특이적 전달이 가능함을 확인한 결과이다.
도 6은 SKBR3 (HER2 양성) 및 MCF7 (HER2 음성) 내 세포 내 섭취 테스트를 나타낸 결과이다(Ab: anti-HER2 단일클론항체, Blue: 핵, Red: Cas9 / Cas9(AHA)).
도 7은 표적된 딥 시퀀싱에 의해 결정된 Ab-SS-DBCO 공동 처리 또는 사전 컨쥬게이션을 통하여 Cas9-AHA 처리 시 PLK1 유전자의 편집 효능을 나타낸 것이다.
일 양상에 따라, 실시예에서는 Cas9에 비천연 아미노산인 Azdiohomoalanine (AHA)을 잔기-선택적으로 도입하여, 생직교반응이 가능한 유전자 편집 단백질을 제작하였고, 이에 고선택적 화학반응을 통해 생체물질(예컨대, 전달촉진 물질, 표적 리간드, 핵산 등)을 접합 또는 혼합(co-treat) 하거나, 리간드 물질과의 co-delivery에 의해 세포 내 전달을 촉진할 수 있음을 확인하였다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
[실시예]
실시예 1. 비천연 아미노산이 잔기-선택적 도입된 Cas9 제작
AHA(4-Azido-homoalanine)는 20개의 필수 아미노산 중 Methionine (Met)과 유사한 구조로, Met side chain의 methylsulfide group 대신 azide group이 도입된 구조를 가지고 있으며, 하기 화학식 1로 표시되는 화합물이다:
[화학식 1]
Figure pat00003
.
이러한 특징의 AHA를 박테리아나 세포 배양 시 첨가함으로써, tRNAMet와 amino acyl tRNA synthetase에 의해 합성되는 단백질의 아미노산 서열에 Met 대신 AHA가 잔기-선택적으로 도입된다.
Cas9 단백질에 도입된 AHA에는 azide 기능기가 존재하여 선택적 화학 반응(chemoselective reaction)에 의해 다양한 생체물질을 접합할 수 있다. 즉, azide기는 ‘클릭 화학 반응’이 가능한 작용기로, 알카인 혹은 사이클로알카인과 매우 빠르고 비가역적인 반응을 일으킨다. 이 반응은 복잡한 생체내 환경에서 특이적으로 일어나기 때문에 in situ에서 생체분자와 반응시키는데 이용된다.
본 발명에서는 Cas9 단백질(서열번호 1)에 AHA를 효과적으로 도입하기 위해 Met 합성효소 결핍 균주인 B834-(DE3) E. coli를 사용하였다. 배양한 B834-(DE3) E. coli (OD600 ~ 0.8)에 0.5 mM 이소프로필 β-D-1-티오갈락토피라노사이드(IPTG)를 첨가하기 전, 50 mg/L의 AHA를 배양액에 첨가해주고 18℃에서 배양하여 Cas9-AHA 발현을 유도하였다. 이후 Affinity chromatography 및 size exclusion chromatography에 의해 Cas9-AHA 단백질(서열번호 2)을 정제하였고, 그 결과 획득 수율은 리터당 ~1 mg으로 나타났고 90% 이상의 순도를 보였다.
실시예 2. Cas9-AHA의 반응성 및 활성 분석
Cas9 단백질 내 AHA의 도입 여부를 확인하기 위해 Cas9-AHA 및 대조군으로 native Cas9 단백질과 DBCO-PEG4-BODIPY-FL(하기 화학식 2로 표시되는 화합물)을 1시간 동안 상온에서 반응시킨 후, SDS-PAGE와 형광 이미징을 통해 분석하였다. Dibenzylcyclooctyne (DBCO)는 사이클로알카인으로 azide group과 촉매 없이 상온에서 효율적으로 반응한다:
[화학식 2]
Figure pat00004
.
B834-(DE3) 에 Met 또는 AHA 를 첨가하여 배양하고, 이를 용해하여 얻은 용해물을 DBCO-PEG4-BODIPY-FL 과 1시간동안 상온에서 반응시킨 후, SDS-PAGE 를 통해 확인한 결과, 도 2A와 같았으며, 이를 형광이미징을 통해 분석한 결과, 도 2B와 같았다. 이를 통하여 AHA 를 첨가하여 얻은 용해물만이 형광이 나타난 것을 통하여, B834-(DE3) 가 AHA를 도입하여 단백질을 생산할 수 있고, 도입된 단백질들은 클릭 화학반응으로 컨쥬게이션이 가능하다는 것을 알 수 있었다.
또한, 동일 양의 native Cas9 단백질과 Cas9(AHA) 단백질을 DBCO-PEG4-BODIPY-FL와 1:2, 1:5, 1:10, 1:20 몰비율로 각각 1시간동안 상온에서 반응시킨 후, SDS-PAGE 및 형광이미징을 통해 분석한 결과, 도 3과 같았다. Native Cas9 단백질은 몰비율에 관계없이 형광이 나타나지 않지만, Cas9(AHA) 단백질은 몰비율이 증가할수록 형광의 세기가 강하게 나타나는 것으로 보인다. 이를 통해 Cas9 단백질에 AHA 가 도입되어 클릭 화학반응을 일으킬 수 있고, 단일 화학반응으로 빠르게 가능화할 수 있다는 것을 알 수 있었다.
결과적으로 도 2 및 도 3을 통해, Cas9-AHA만 특이적으로 DBCO-PEG4-BODIPY-FL와 반응하여 형광이 나타나는 바, Cas9 단백질에 AHA가 도입됨을 알 수 있었고, 단일 화학반응으로 빠르게 기능화할 수 있다는 것을 알 수 있었다.
다음으로, Cas9-AHA의 효소 활성을 검증하기 위해 합성 DNA template 및 sgRNA들을 이용하여 cleavage activity를 분석하였다. 구체적으로, PLK1(polo-like kinase 1) 유전자의 일부분을 PCR을 통해 증폭하여 PLK1 유전자 서열과 동일한 서로 다른 합성 DNA template 를 준비하였고, 이 합성 DNA template를 표적하는 sgRNA (sgRNA-1: 서열번호 3; sgRNA-2: 서열번호 4; sgRNA-1이 표적하는 DNA template: 서열번호 5; sgRNA-2가 표적하는 DNA template: 서열번호 6)를 합성하였다. 준비한 합성 DNA template와 sgRNA를 이용하여 Cas9(AHA) 단백질 및 대조군으로 native Cas9 이 효과적으로 합성 DNA template을 절단할 수 있는지 분석하였다(서열번호 3: 5' - GAAATTAATACGACTCACTATAGGTACCTACGGCAAATTGTGCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT - 3'; 서열번호 4: 5' - GAAATTAATACGACTCACTATAGGCGTGGAATCCTACGACGTGCGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT - 3'; 상기 각 볼드체는 DNA template 타겟 서열(스페이서)임).
그 결과, 도 4에 나타난 바와 같이 sgRNA-1와 복합체를 이룬 Cas9 단백질은 표적 DNA를 97.8%의 효율로 절단하였고, Cas9(AHA) 단백질은 95.5%의 효율로 절단하여 비슷한 활성을 보였다. sgRNA-2의 경우, Cas9 단백질은 표적 DNA를 86.7%의 효율로 절단하였고, Cas9(AHA) 단백질은 87.0%의 효율로 절단하였다. 이를 통해 AHA의 도입이 Cas9 단백질의 효소 기능을 저하시키지 않는다는 것을 알 수 있다.
실시예 3. Cas9-AHA 생직교반응에 의한 표적형 세포 전달
또한, Cas9-AHA가 표적 세포에 전달이 잘 되는 지 확인하였다. 구체적으로, HER2 antibody (SANTACRUZ, Neu (9G6): sc-08)에 DBCO를 개질하기 위하여, HER2 antibody의 노출된 NH2 group과 DBCO-sulfo-NHS ester를 반응시켜 DBCO 개질된 HER2 antibody (Ab-DBCO)를 합성하였다. 또한 Cas9 단백질 및 Cas9(AHA) 단백질을 AF647-NHS ester와 1:1 몰 비율로 반응시켜, 이미징 분석에 용이하게 하였다. 합성한 Ab-DBCO를 SKBR3 (HER2 양성) 및 HEK293T (HER2 음성) 에 처리하고 10분동안 배양한 후, Cas9(AHA) 및 대조군으로 Cas9을 처리하여 4시간을 추가로 배양하였다. 배양한 후, 이미징 분석을 위해 세포고정 및 actin 과 핵을 염색한 후, confocal microscopy 를 통해 분석하였다.
분석한 결과, SKBR3에 Ab-DBCO와 Cas9(AHA)를 처리한 경우에만 plasma membrane 및 cytosol에 Cas9(AHA)가 위치해 있는 것을 확인할 수 있었다. 이는 세포 처리 과정에서 in situ에서 Cas9(AHA)와 Ab-DBCO가 생직교반응을 일으키고, endocytosis(내포 작용)에 의해 표적 특이적으로 세포 전달이 촉진됨을 알 수 있다(도 5). 즉, Cas9-AHA와 DBCO로 개질된 리간드 물질을 co-delivery 함으로써 암세포 내로 표적 특이적 전달이 가능함으로 확인하였다. 이 결과를 통해 세포 처리 과정에서 in situ에서 Cas9-AHA와 DBCO 개질된 리간드 물질이 생직교반응을 일으키고, endocytosis(내포 작용)에 의해 세포 전달이 촉진됨을 알 수 있었다. 또, Cas9-AHA와 DBCO 개질된 리간드 물질을 세포 처리 이전에 먼저 반응시킬 경우에도, 생직교반응에 의해 접합되어 Cas9의 다기능화가 가능함을 알 수 있었다.
나아가, 항체가 컨쥬게이트된 Cas9(AHA)가 표적 세포 내 내재화될 수 있는지 확인하였다. 구체적으로, HER2 Ab (SANTACRUZ, Neu (9G6): sc-08)에 DBCO로 개질하기 위하여, HER2 Ab의 노출된 NH2 group 와 DBCO-SS-NHS ester를 반응시켜 DBCO 개질된 antibody (HER2-SS-DBCO)를 합성하였다. 또한 Cas9 단백질 및 Cas9(AHA) 단백질을 AF647-NHS ester와 1:1 몰비율로 반응시켜, 이미징 분석에 용이하게 하였다. 이 때, -SS- 는 disulfide bond로 glutathione 같은 환원제에 의해 절단가능한 결합이다. 암은 강한 reducing environment를 조성하는 것으로 알려져 있고, 이로 인해 표적세포 내 내재화된 HER2 Ab-SS-Cas9(AHA)의 -SS- 결합이 끊어지게 되어 Cas9(AHA)가 분리되고, 결국 자유로운 Cas9(AHA)는 핵으로 전달되게 된다. 합성한 HER2 Ab-SS-DBCO를 SKBR3 (HER2 양성) 및 MCF7 (HER2 음성) 에 처리하고 10분동안 배양한 후, Cas9(AHA) 및 대조군으로 Cas9을 처리하여 4시간을 추가로 배양하였다. 나아가, 항체가 컨쥬게이트된 Cas9(AHA)도 표적세포 내 내재화될 수 있는지 확인하기 위하여, HER2-SS-DBCO 와 Cas9(AHA) 및 Cas9을 상온에서 1시간동안 반응시킨 후, 세포에 처리하여 4시간동안 배양하였다. 배양한 후, 이미징 분석을 위해 세포고정 및 actin 과 핵을 염색한 후, confocal microscopy 를 통해 분석하였다.
그 결과, Cas9(AHA)가 두 가지 처리 모두에서 SKBR3 내 핵 근처에 성공적으로 국소화됨을 확인하였으나, Cas9만 또는 Cas9(AHA)만을 처리한 경우에는 그렇지 못 하였다. 또한, 세포 안에 내재화 된 Cas9 및 Cas9(AHA) 단백질의 양을 형광물질의 intensity를 통해 정량적으로 분석한 결과, SKBR3에 Cas9(AHA)가 두 가지 처리 모두에서 높은 값을 나타내는 것을 확인할 수 있었다. 따라서, Cas9(AHA)이 항체-매개 내포작용을 통해 표적 세포 내 내재화될 수 있음을 확인하였다(도 6).
실시예 4. Cas9-AHA 생직교반응에 의한 유전자교정 효과 분석
표적 세포에서 유전자 편집을 검증하기 위해, HER2 Ab-SS-DBCO (Ab-SS-DBCO)를 SKBR3 (HER2 양성) 및 MCF7 (HER2 음성)에 처리하고 10분동안 배양한 후, PLK1 유전자를 표적하는 sgRNA(sgPLK1: 서열번호 7; 5' - GAAATTAATACGACTCACTATAGGTACCTACGGCAAATTGTGCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTT - 3'; 상기 볼드체는 스페이서 서열임)와 복합체를 이룬 Cas9(AHA)를 처리하여 48시간동안 배양하였다. 또한, 클릭 화학 반응에 의해 Cas9(AHA) 복합체 및 Ab-SS-DBCO를 사전 컨쥬케이트시키고(Cas9(AHA)-SS-Ab) 표적 세포에 처리하여 48시간동안 배양하였다. 대조군으로 동일 양의 Cas9 복합체 및 Cas9(AHA) 복합체만 표적세포에 처리하여 48시간동안 배양하였다. 배양 이후, NGS 분석을 위하여 표적 세포로부터 genomic DNA를 분리한 후 시료화하여 NGS 분석을 진행하였다.
그 결과, NGS 분석 시, Cas9 복합체 및 Cas9(AHA) 복합체만 처리된 경우, PLK1 locus에서 삽입 및 결실이 이루어지지 않았지만, 공동 처리된 경우(Cas9(AHA)+Ab-SS-DBCO, 0.2%) 및 컨쥬게이션 처리된 경우(Cas9(AHA)-SS-Ab, 0.5%) 모두 표적 된 오직 SKBR3 내 PLK1 locus에서 삽입 및 결실이 이루어진 것을 확인하였다(도 7).
결론적으로, Cas9(AHA) 및 DBCO가 도입된 항체는 in situ in vitro 모두에서 한 단계로 성공적으로 컨쥬게이트될 수 있고, 항체-매개 내포 작용에 의해 표적 세포에 전달되며, 결국 유전자 편집을 유발하는 것을 확인하였다.
상기 실시예 결과를 통해, 본 발명의 Cas9-AHA 단백질은 간단한 방법으로 높은 수득율과 순도로 정제가 가능하고, 생체 내 환경에서 빠르고 특이적으로 생체분자를 결합시킬 수 있으며, Cas9-AHA 단백질은 표적 DNA를 효과적으로 절단할 수 있음을 확인하였다. 본 Cas9-AHA는 다양한 생체분자를 손쉽게 결합할 수 있고 이를 이용해 효율적이고 효과적인 Cas9 단백질 복합체 합성, 세포 내 전달 및 표적 DNA의 유전자 편집을 기대할 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해되어야 한다.
<110> Korea Advanced Institute of Science and Technology <120> A GENE EDITING PROTEIN RESIDUE-SPECIFICALLY INCORPORATED WITH UNNATURAL AMINO ACID AND A METHOD FOR EDITING OF GENE USING THE SAME <130> P-19553 <150> KR 10-2020-0147708 <151> 2020-11-06 <160> 7 <170> KoPatentIn 3.0 <210> 1 <211> 1368 <212> PRT <213> Streptococcus pyogenes <220> <221> MISC_FEATURE <222> (1)..(1368) <223> Cas9 protein <400> 1 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp 1365 <210> 2 <211> 2497 <212> PRT <213> Artificial Sequence <220> <223> Cas9-AHA protein <220> <221> VARIANT <222> (1) <223> X is AHA <220> <221> VARIANT <222> (90) <223> X is AHA <220> <221> VARIANT <222> (161) <223> X is AHA <220> <221> VARIANT <222> (321) <223> X is AHA <220> <221> VARIANT <222> (383) <223> X is AHA <220> <221> VARIANT <222> (465) <223> X is AHA <220> <221> VARIANT <222> (495) <223> X is AHA <220> <221> VARIANT <222> (534) <223> X is AHA <220> <221> VARIANT <222> (631) <223> X is AHA <220> <221> VARIANT <222> (648) <223> X is AHA <220> <221> VARIANT <222> (694) <223> X is AHA <220> <221> VARIANT <222> (751) <223> X is AHA <220> <221> VARIANT <222> (763) <223> X is AHA <220> <221> VARIANT <222> (781) <223> X is AHA <220> <221> VARIANT <222> (822) <223> X is AHA <220> <221> VARIANT <222> (879) <223> X is AHA <220> <221> VARIANT <222> (939) <223> X is AHA <220> <221> VARIANT <222> (1021) <223> X is AHA <220> <221> VARIANT <222> (1043) <223> X is AHA <220> <221> VARIANT <222> (1089) <223> X is AHA <220> <221> VARIANT <222> (2298) <223> X is AHA <220> <221> VARIANT <222> (2342) <223> X is AHA <400> 2 Xaa Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Xaa Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Xaa Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Xaa Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Xaa Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Xaa Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Xaa Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Xaa Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Xaa Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Xaa Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Xaa Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Xaa Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Xaa Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Xaa Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Xaa Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Xaa Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Xaa Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Xaa Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Xaa Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Xaa Ala His Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr 1090 1095 1100 Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser 1105 1110 1115 1120 Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys 1125 1130 1135 Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala 1140 1145 1150 Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn 1155 1160 1165 Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Ala His Ala Ala 1170 1175 1180 Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val 1185 1190 1195 1200 Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val 1205 1210 1215 Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg 1220 1225 1230 Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr 1235 1240 1245 Leu Ala Leu Ala His Ala His Ala Ile Lys Phe Arg Gly His Phe Leu 1250 1255 1260 Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe 1265 1270 1275 1280 Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile 1285 1290 1295 Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser 1300 1305 1310 Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys 1315 1320 1325 Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr 1330 1335 1340 Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln 1345 1350 1355 1360 Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln 1365 1370 1375 Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser 1380 1385 1390 Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr 1395 1400 1405 Lys Ala Pro Leu Ser Ala Ser Ala His Ala Ile Lys Arg Tyr Asp Glu 1410 1415 1420 His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu 1425 1430 1435 1440 Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr 1445 1450 1455 Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe 1460 1465 1470 Ile Lys Pro Ile Leu Glu Lys Ala His Ala Asp Gly Thr Glu Glu Leu 1475 1480 1485 Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe 1490 1495 1500 Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala 1505 1510 1515 1520 Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg 1525 1530 1535 Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly 1540 1545 1550 Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Ala His Ala Thr Arg 1555 1560 1565 Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp 1570 1575 1580 Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Ala His Ala Thr Asn 1585 1590 1595 1600 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 1605 1610 1615 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 1620 1625 1630 Val Thr Glu Gly Ala His Ala Arg Lys Pro Ala Phe Leu Ser Gly Glu 1635 1640 1645 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 1650 1655 1660 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 1665 1670 1675 1680 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 1685 1690 1695 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 1700 1705 1710 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 1715 1720 1725 Thr Leu Phe Glu Asp Arg Glu Ala His Ala Ile Glu Glu Arg Leu Lys 1730 1735 1740 Thr Tyr Ala His Leu Phe Asp Asp Lys Val Ala His Ala Lys Gln Leu 1745 1750 1755 1760 Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile 1765 1770 1775 Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu 1780 1785 1790 Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Ala His Ala Gln Leu Ile 1795 1800 1805 His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val 1810 1815 1820 Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly 1825 1830 1835 1840 Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp 1845 1850 1855 Glu Leu Val Lys Val Ala His Ala Gly Arg His Lys Pro Glu Asn Ile 1860 1865 1870 Val Ile Glu Ala His Ala Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly 1875 1880 1885 Gln Lys Asn Ser Arg Glu Arg Ala His Ala Lys Arg Ile Glu Glu Gly 1890 1895 1900 Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn 1905 1910 1915 1920 Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly 1925 1930 1935 Arg Asp Ala His Ala Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 1940 1945 1950 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 1955 1960 1965 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 1970 1975 1980 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Ala His Ala 1985 1990 1995 2000 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 2005 2010 2015 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 2020 2025 2030 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 2035 2040 2045 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Ala His Ala Asn Thr 2050 2055 2060 Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 2065 2070 2075 2080 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr 2085 2090 2095 Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu 2100 2105 2110 Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 2115 2120 2125 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Ala 2130 2135 2140 His Ala Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 2145 2150 2155 2160 Tyr Phe Phe Tyr Ser Asn Ile Ala His Ala Asn Phe Phe Lys Thr Glu 2165 2170 2175 Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 2180 2185 2190 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 2195 2200 2205 Thr Val Arg Lys Val Leu Ser Ala His Ala Pro Gln Val Asn Ile Val 2210 2215 2220 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 2225 2230 2235 2240 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 2245 2250 2255 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 2260 2265 2270 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 2275 2280 2285 Val Lys Glu Leu Leu Gly Ile Thr Ile Xaa Glu Arg Ser Ser Phe Glu 2290 2295 2300 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys 2305 2310 2315 2320 Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu 2325 2330 2335 Asn Gly Arg Lys Arg Xaa Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly 2340 2345 2350 Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala 2355 2360 2365 Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys 2370 2375 2380 Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu 2385 2390 2395 2400 Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 2405 2410 2415 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg 2420 2425 2430 Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly 2435 2440 2445 Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 2450 2455 2460 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 2465 2470 2475 2480 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 2485 2490 2495 Asp <210> 3 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-1 <400> 3 gaaattaata cgactcacta taggtaccta cggcaaattg tgctgtttta gagctagaaa 60 tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc 120 tttttt 126 <210> 4 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> sgRNA-2 <400> 4 gaaattaata cgactcacta taggcgtgga atcctacgac gtgcgtttta gagctagaaa 60 tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc 120 tttttt 126 <210> 5 <211> 890 <212> DNA <213> Artificial Sequence <220> <223> DNA template targeted by sgRNA-1 <400> 5 ggagtaccca gggaggagtc ccaggttagt gatgccgcgc cctgggagct tctggggtgg 60 agctgggtca gtgggggggt agttggagcc agacttcggg ccttccgggg gagatacgag 120 tcaggaaagg gatctggtgc tggggactcg gagcttccgg agtggggctg agagaggacc 180 cccaggtaag gggggaagct agtaggagaa ggggtgctgc gaatggttgt ggacagtgtt 240 aaggcagggt ccagatgccg ctgtgctgga gaaggaatgg ggtgggggca tagggaagga 300 gagaaaccca ccaagacccc tctttcatcc cttgggagtc cagagtccag tcctgtgctt 360 cctttgcctg gtaaccctct cccttcccca ccggcctcaa tccacctccc catccctcct 420 gccctctcct tcccacccac agtctctcct ggagctgcac aagaggagga aagccctgac 480 tgagcctgag gcccgatact acctacggca aattgtgctt ggctgccagt acctgcaccg 540 aaaccgagtt attcatcgag acctcaagct gggcaacctt ttcctgaatg aagatctgga 600 ggtgaaaata ggtgagttgc tgagcctgca ggggtgcttg acatcactac aagaggctgg 660 aatttggagg aggctgggag aaaggaagga gacaacccac aagtcagtat cttgcctaca 720 gatgcattat ttttttgtgc cccaatgcaa tatttttttt ttacaaagaa tttgaatttg 780 tttttatttt ttaaattgga aggtttgatt gaacaaaaag tttgattcag aactcctttt 840 aaacaggtga aagcttcagt aatacgagga cagcattttc ttagggcagc 890 <210> 6 <211> 983 <212> DNA <213> Artificial Sequence <220> <223> DNA template targeted by sgRNA-2 <400> 6 aagagatccc ggaggtccta gtggacccac gcagccggcg gcgctatgtg cggggccgct 60 ttttgggcaa gggcggcttt gccaagtgct tcgagatctc ggacgcggac accaaggagg 120 tgttcgcggg caagattgtg cctaagtctc tgctgctcaa gccgcaccag agggagaaga 180 tgtccatgga aataccattc accgcagcct cgcccaccag cacgtcgtag gattccacgg 240 ctttttcgag gacaacgact tcgtgttcgt ggtgttggag ctctgccgcc ggagggtgag 300 tgtcgctgct ggggaactgg aactgcctgc ggggcagttg gagcgcccag acctggagct 360 gctggaaaga gtacccagca agggagagcc tgggacttgg agctgctaga gaagggtgct 420 gggagcctcc cgcttacgta tggaaagtgt ctttggtaag ggcttcttgg ctctgggagc 480 tgctagagga gggggttcca gtgaagtgga gtctgagtca tgttgctgat agggaagtca 540 gcttctggac gcgaggtgct ggggggaggg gtgctggtaa tggacgctag ggccctggag 600 tacccaggga ggagtcccag gttagtgatg ccgcgccctg ggagcttctg gggtggagct 660 gggtcagtgg gggggtagtt ggagccagac ttcgggcctt ccgggggaga tacgagtcag 720 gaaagggatc tggtgctggg gactcggagc ttccggagtg gggctgagag aggaccccca 780 ggtaaggggg gaagctagta ggagaagggg tgctgcgaat ggttgtggac agtgttaagg 840 cagggtccag atgccgctgt gctggagaag gaatggggtg ggggcatagg gaaggagaga 900 aacccaccaa gacccctctt tcatcccttg ggagtccaga gtccagtcct gtgcttcctt 960 tgcctggtaa ccctctccct tcc 983 <210> 7 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> PLK1 targeting sgRNA <400> 7 gaaattaata cgactcacta taggtaccta cggcaaattg tgctgtttta gagctagaaa 60 tagcaagtta aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc 120 tttttt 126

Claims (18)

  1. 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질.
  2. 청구항 1에 있어서, 상기 비천연 아미노산은 AHA(4-Azido-homoalanine)인, 유전자 편집 단백질.
  3. 청구항 1에 있어서, 상기 유전자 편집 단백질은 야생형 단백질의 아미노산 서열 중 Met(Methionine)이 AHA(4-Azido-homoalanine)로 치환된 것인, 유전자 편집 단백질.
  4. 청구항 1에 있어서, 상기 유전자 편집 단백질은 CRISPR/Cas9 시스템에 이용되는 것인, 유전자 편집 단백질.
  5. 청구항 1에 있어서, 상기 유전자 편집 단백질은 Cas9 단백질인, 유전자 편집 단백질.
  6. 청구항 1 내지 5 중 어느 한 항의 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 포함하는 유전자 편집용 조성물.
  7. 청구항 6에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 상기 유전자 편집 단백질 내 azide기와 클릭화학반응이 가능한 것인, 유전자 편집용 조성물.
  8. 청구항 6에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물은 DBCO(Dibenzylcyclooctyne)기를 갖는 화합물인, 유전자 편집용 조성물.
  9. 청구항 6에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물은 하기 화학식 2로 표시되는 화합물인, 유전자 편집용 조성물:
    [화학식 2]
    Figure pat00005
    .
  10. 청구항 6에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 압타머, 항체 또는 이들의 단편과 결합된 것인, 유전자 편집용 조성물.
  11. 청구항 6에 있어서, 상기 조성물 내 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 사전-접합(pre-conjugation)된 것인, 유전자 편집용 조성물.
  12. 유전자 편집 단백질에 비천연 아미노산을 잔기-선택적으로 도입하는 단계;
    상기 유전자 편집 단백질 및 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 개체로부터 분리된 세포에 처리하거나 개체에 투여하는 단계를 포함하는 유전자 편집 방법.
  13. 청구항 12에 있어서, 개체로부터 분리된 세포에 처리하거나 개체에 투여하는 단계 이전에 상기 유전자 편집 단백질과 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염을 접합(conjugation)시키는 단계를 더 포함하는 유전자 편집 방법.
  14. 청구항 12에 있어서, 상기 비천연 아미노산은 AHA(4-Azido-homoalanine)인, 유전자 편집 방법.
  15. 청구항 12에 있어서, 상기 비천연 아미노산을 잔기-선택적으로 도입하는 단계는 야생형 단백질의 아미노산 서열 중 Met(Methionine)을 AHA(4-Azido-homoalanine)로 치환하는 단계인 것인, 유전자 편집 방법.
  16. 청구항 12에 있어서, 상기 유전자 편집 단백질은 Cas9 단백질인, 유전자 편집 방법.
  17. 청구항 12에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물은 DBCO(Dibenzylcyclooctyne)기를 갖는 화합물인, 유전자 편집 방법.
  18. 청구항 12에 있어서, 상기 알카인 또는 사이클로알카인기를 갖는 화합물 또는 이의 염은 압타머, 항체 또는 이들의 단편과 결합된 것인, 유전자 편집 방법.
KR1020210150739A 2020-11-06 2021-11-04 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법 KR20220061889A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2021/015996 WO2022098141A1 (ko) 2020-11-06 2021-11-05 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20200147708 2020-11-06
KR1020200147708 2020-11-06

Publications (1)

Publication Number Publication Date
KR20220061889A true KR20220061889A (ko) 2022-05-13

Family

ID=81583365

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210150739A KR20220061889A (ko) 2020-11-06 2021-11-04 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법

Country Status (1)

Country Link
KR (1) KR20220061889A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210123237A (ko) 2020-04-02 2021-10-13 중앙대학교 산학협력단 CRISPR/Cas9 시스템을 기반으로 한 유전체 편집 방법 및 이의 용도

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210123237A (ko) 2020-04-02 2021-10-13 중앙대학교 산학협력단 CRISPR/Cas9 시스템을 기반으로 한 유전체 편집 방법 및 이의 용도

Similar Documents

Publication Publication Date Title
US11999947B2 (en) Adenosine nucleobase editors and uses thereof
JP2023113627A (ja) シトシンからグアニンへの塩基編集因子
US20230111575A1 (en) Synthetic guide molecules, compositions and methods relating thereto
CN109475646A (zh) 用于crispr/cas成分的脂质纳米颗粒制剂
US11344609B2 (en) Compositions and methods for treating hemoglobinopathies
EP3697912A1 (en) Novel artificial nucleic acid molecules
CA3026112A1 (en) Cpf1 complexes with reduced indel activity
CN107208096A (zh) 基于crispr的组合物和使用方法
BR112019021009A2 (pt) peptídeo ligase e uso do mesmo
KR20230016175A (ko) Angptl3의 염기 편집 및 질환 치료를 위한 이의 사용 방법
KR20220061889A (ko) 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법
US20210269799A1 (en) Synthetic guide molecules, compositions and methods relating thereto
US9777274B2 (en) Antisense molecules for treatment of staphylococcus aureus infection
WO2022098141A1 (ko) 비천연 아미노산이 잔기-선택적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법
US9909123B2 (en) Antisense molecules for treatment of Staphylococcus aureus infection
KR20220061891A (ko) 비천연 아미노산이 위치-특이적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법
US20210246470A1 (en) Complex for the delivery of cas9 proteins and guide rna to cells
WO2022098160A1 (ko) 비천연 아미노산이 위치-특이적으로 도입된 유전자 편집 단백질 및 이를 이용한 유전자 편집 방법
CN105473717B (zh) 反义寡核苷酸组合物
CA3230869A1 (en) Rna-guided genome recombineering at kilobase scale
WO2024059811A2 (en) Retron directed gene editing
WO2023222114A1 (en) Methods of making circular rna
WO2024074676A1 (en) Artificial polynucleotides for expressing proteins
Dhiman et al. An Epoch of Gene Therapy from Preclinical Research to Clinical Use
NZ795956A (en) Synthetic guide molecules, compositions and methods relating thereto

Legal Events

Date Code Title Description
E902 Notification of reason for refusal