WO2022215978A1

WO2022215978A1 - Pdcd-1 유전자에 상보적인 가이드 rna 및 이의 용도

Info

Publication number: WO2022215978A1
Application number: PCT/KR2022/004794
Authority: WO
Inventors: 안재형; 한나경; 김동희
Original assignee: 주식회사 셀렌진
Priority date: 2021-04-05
Filing date: 2022-04-04
Publication date: 2022-10-13

Abstract

PDCD-1 유전자에 상보적인 가이드 RNA 및 이의 용도에 관한 것이다. 일 양상에 따른 가이드 RNA, 이를 포함하는 벡터, 상기 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체를 포함하는 PDCD-1 유전자 편집용 조성물은 세포 또는 개체의 유전체에서 PDCD-1 유전자를 효과적으로 제거(knockout)할 수 있고, 이를 통해 맞춤의료 또는 정밀의료로서 암을 예방 또는 치료하는데 유용하게 사용될 수 있다.

Description

PDCD-1 유전자에 상보적인 가이드 RNA 및 이의 용도

PDCD-1 유전자에 상보적인 가이드 RNA 및 이의 용도에 관한 것이다.

유전자 가위는 유전자에 결합하여 특정 DNA 부위를 절단하여 사용하는 효소 또는 이를 이용한 유전체 편집(genome editing) 기법을 말한다. 유전자 가위를 이용하여 줄기세포 또는 체세포에서 유전병의 원인이 되는 돌연변이 교정, 항암 세포 치료제와 같이 다양한 분야에서 활용할 수 있다. 유전자 가위 기술은 1세대 ZFN(zinc finger nuclease), 2세대 TALEN(transcription activator-like effector nuclease) 및 3세대 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9으로 발전해왔다.

크리스퍼 유전자 가위(CRISPR/Cas9)는 표적으로 정한 DNA의 특정 염기 서열 정보를 갖는 가이드(Guide) RNA와 Cas9 뉴클레아제로 구성되며, 이를 세포 내로 전달하여 유전자를 원하는 위치에서 절단하거나 기존 유전자를 제거하고 새로운 유전자를 삽입할 수 있다. 유전자 가위를 이용하여 특정 DNA를 절단할 때, Cas9 뉴클레아제는 가이드 RNA의 서열에 의해 특정된 DNA 표적 서열을 절단한다. 유전자 가위를 이용하여 유전체를 편집하는 방법은 한국 공개 번호 10-2015-0101478 등 다수의 문헌을 통해 알려져 있다. 최근에는 표적 이외의 지점을 절단하는 표적이탈(off-target) 발생 확률을 줄이기 위해 정확성을 높인 Cas9 변이체들이 개발되었다. 이러한 고-정확도(high-fidelity) 변이체로는 HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1, xCas9 등이 있다.

PDCD-1(Programmed cell death protein-1)은 면역세포인 T 세포나 B 세포의 표면에 분포하는 PD-1 단백질을 발현하는 유전자로, 사람에서는 2번 염색체의 2q37.3 위치에 존재한다. PD-1 단백질은 면역관문수용체로, 이의 리간드인, 일부 암세포에 다량으로 존재하는 PD-L1(Programmed death-ligand 1)과 결합하게 되면 T 세포의 활성이 크게 억제되어 암세포는 T 세포의 공격을 회피하게 된다. 이러한 암세포의 방어 기전을 억제하면 면역세포의 항암 효능을 높일 수 있기 때문에, PDCD-1 유전자는 중요한 치료적 표적이다.

따라서, PDCD-1 유전자를 표적으로 하는 가이드 RNA를 개발할 필요가 있다.

일 양상은 서열번호 1 내지 5로 이루어진 군으로부터 선택된 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA를 제공하는 것이다.

다른 양상은 상기 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체를 포함하는 CRISPR/Cas9 시스템 및 이를 포함하는 재조합 벡터를 제공하는 것이다.

또 다른 양상은 상기 가이드 RNA, CRISPR/Cas9 시스템 및 이들을 포함하는 재조합 벡터를 포함하는 PDCD-1 유전자 편집용 조성물을 제공하는 것이다.

본 출원의 다른 목적 및 이점은 첨부한 청구범위 및 도면과 함께 하기의 상세한 설명에 의해 보다 명확해질 것이다. 본 명세서에 기재되지 않은 내용은 본 출원의 기술 분야 또는 유사한 기술 분야 내 숙련된 자이면 충분히 인식하고 유추할 수 있는 것이므로 그 설명을 생략한다.

본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.

일 양상은 서열번호 1 내지 5 로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA를 제공한다.

본 명세서에서, 용어 "가이드(guide) RNA"는 RNA 편집(editing)을 통해 세포내에서 표적 DNA를 절단, 삽입, 또는 연결시키는 폴리뉴클레오티드를 말한다. 상기 가이드 RNA는 단일-사슬 가이드 RNA(single-chain guide RNA, sgRNA)일 수 있다. 상기 가이드 RNA는 표적 핵산 서열에 특이적인 crRNA(CRISPR RNA)일 수 있다. 상기 가이드 RNA는 Cas9 뉴클레아제와 상호작용하는 tracrRNA(trans-activating crRNA)를 더 포함할 수 있다. 상기 tracrRNA는 루프(loop) 구조를 형성하는 폴리뉴클레오티드를 포함할 수 있다.

일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다.

PDCD-1 유전자(Programmed cell death protein-1)는 면역세포인 T 세포나 B 세포의 표면에 분포하는 PD-1 단백질을 발현하는 유전자로, 사람에서는 2번 염색체의 2q37.3 위치에 존재한다. 상기 PDCD-1 유전자는 예를 들어, 각각 NCBI GenBank에 현재 등록된 NCBI Accession No. NG_012110.1에 해당할 수 있다. 통상의 기술자라면 시퀀스 ID 등록번호를 이용하여 서열을 용이하게 확인할 수 있을 것이다. UCSC genome browser 또는 GenBank에 등록되어 있는 상기 Sequence ID 번호에 해당하는 구체적인 서열은 시간이 지남에 따라 다소 변경될 수 있다. 본 발명의 범위가 상기 변경된 서열에도 미치는 것은 통상의 기술자에게 자명할 것이다.

또한 PDCD-1 유전자 또는 PDCD-1 유전자가 발현하는 단백질의 발현 또는 활성을 감소시키기 위한 유전자 조작에 이용할 수 있는 염기 서열이라면 제한 없이 가이드 RNA로 이용할 수 있으며, 예컨대 상기 염기 서열은 PDCD-1 유전자와 혼성화할 수 있는 서열일 수 있고, 예를 들면 서열번호 1 내지 5로 이루어진 폴리뉴클레오티드 또는 이와 상보적인 핵산서열을 포함하는 것일 수 있다. 또한 상기 가이드 RNA의 기능을 변형/증진시키기 위하여 가이드 RNA 염기 서열의 일부분을 변형할 수 있다. 또한 일부 구현 예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분쉬 (Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인 (Novocraft Technologies), ELAND(Illumina), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다.

상기 가이드 RNA는 길이가 10 뉴클레오티드 내지 30 뉴클레오티드일 수 있다. 상기 가이드 RNA는 길이가 예를 들어, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30 뉴클레오티드일 수 있다.

상기 가이드 RNA는 서열번호 1 내지 5로 이루어진 군으로부터 선택된 핵산 서열에서 2개 이상의 연속 폴리뉴클레오티드와 동일하거나 상보적인 핵산 서열을 포함할 수 있다. 상기 가이드 RNA는 서열번호 1 내지 5로 이루어진 군으로부터 선택된 표적 핵산 서열 중 PAM 서열을 제외한 나머지 핵산 서열에 상보적인 2 이상 연속 폴리뉴클레오티드를 포함할 수 있다. 상기 가이드 RNA는 1 내지 5로 이루어진 군으로부터 선택된 표적 핵산 서열 중 PAM 서열을 제외한 나머지 핵산 서열에 상보적인 폴리뉴클레오티드를 포함할 수 있다.

또한 상기 가이드 RNA에 있어서 상보적인 핵산 서열은 서열번호 1 내지 5로 이루어진 군으로부터 선택된 표적 핵산 서열 선택된 1종의 폴리뉴클레오티드가 전사된 폴리뉴클레오티드를 포함하는 것일 수 있다.

상기 가이드 RNA는 RNA, DNA, PNA, 또는 이들의 조합을 포함할 수 있다. 상기 가이드 RNA는 화학적으로 변형된 것일 수 있다.

상기 가이드 RNA는 PDCD-1 유전자와 혼성화하는 것일 수 있고, 구체적으로 상기 가이드 RNA는 PDCD-1 유전자의 엑손(exon) 1 내지 엑손 2로 이루어진 부위에서 적어도 하나의 부위를 타겟으로하여 혼성화하거나 결합되는 것일 수 있다.

상기 가이드 RNA는 프로그램 가능한 유전자 가위(programmable nuclease)의 구성요소일 수 있다. 유전자 가위는 유전체 상의 특정 위치를 인식하여 절단할 수 있는 모든 형태의 뉴클레아제를 의미한다. 상기 유전자 가위는 예를 들어, TALEN(transcription activator-like effector nuclease), 징크 핑거 뉴클레아제(zinc finger nuclease), 메가 뉴클레아제(meganuclease), RGEN(RNA-guided endonuclease), Cpf1 및 아고 상동체(Ago homolog, DNA guided endonuclease)이다. 상기 RGEN은 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 구성요소로 포함하는 뉴클레아제를 말한다. 상기 폴리뉴클레오티드는 예를 들어 RGEN의 구성요소이다.

또한 가이드 RNA는 PDCD-1 유전자의 핵산 서열 내 변형을 유도하는 것일 수 있다. 상기 가이드 RNA는 세포의 유전체에서 비상동성 말단-접합(non-homologous end-joining, NHEJ)에 의해 PDCD-1 단백질을 암호화하는 핵산 서열을 제거할 수 있다. 구체적으로 상기 핵산 서열 내 변형은 1) PDCD-1 유전자의 전부 또는 연속하는 1bp 내지 15bp의 염기서열 부위의 결실(deletion), 2) PDCD-1 유전자의 1 내지 15개의 뉴클레오티드의 야생형 유전자와 상이한 뉴클레오티드로의 치환, 3) 각각 독립적으로 A, T, C 및 G 중에서 선택된 1 내지 15개의 뉴클레오티드의 PDCD-1 로의 삽입(insertion), 또는 4) 상기 1) 내지 3) 중에서 선택된 2 가지 이상의 조합일 수 있다. 구체적으로 상기 결실은 PDCD-1 유전자의 연속하는 약 4 bp, 8 bp, 11 bp, 및/또는 13 bp의 염기서열 부위의 결실일 수 있으며, 상기 삽입은 1 bp, 4 bp, 8 bp, 11 bp, 및/또는 13 bp, 또는 15 bp 부위의 삽입일 수 있다.

일 양상은 서열번호 1 내지 5 로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열; 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 CRISPR/Cas9 시스템을 제공한다.

일반적으로, "CRISPR 시스템"은 집합적으로 Cas 유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭), 가이드 RNA 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련("Cas") 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피오게네스로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열" 또는 "표적 유전자"는 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 본질적으로 완전한 상보성이 필요하지 않지만, 혼성화를 야기하고, CRISPR 복합체의 형성을 증진시키는 충분한 상보성이 존재한다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다.

상기 Cas 단백질은 CRISPR RNA (crRNA) 및 트랜스-활성화 crRNA (trans-activating crRNA, tracrRNA)로 불리는 두 RNA와 복합체를 형성할 때, 활성 엔도뉴클레아제 또는 니카아제 (nickase)를 형성한다. 상기 Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 효소가 알려져 있으며; 예를 들어, 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 수탁 번호 Q99ZW2 하에 스위스프로트(SwissProt) 데이터베이스에서 얻을 수 있다. 일부 구현예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다. 일부 구현예에서, CRISPR 효소는 Cas9이며, 스트렙토코커스 피오게네스 또는 스트렙토코커스 뉴모니애로부터의 Cas9일 수 있다. 일부 구현예에서, Cas 단백질은 진핵 세포에서의 발현을 위해 코돈-최적화된다.

상기 Cas 단백질은 CRISPR/Cas 시스템의 단백질 구성 요소 중 하나로서, 활성화된 엔도뉴클레아제 또는 닉(nick) 형성 효소일 수 있다. 상기 Cas 단백질은 crRNA(CRISPR RNA) 및 tracrRNA(trans-activating crRNA)와 복합체를 형성하여 그의 활성을 나타낼 수 있다.

상기 Cas 단백질은 예를 들어 스트렙토코커스 속(예, Streptococcus pyogens), 네이세리아 속(예, Neisseria meningitidis), 파스테우렐라 속(예, Pasteurella multocida), 프란시셀라 속(예, Francisella novicida), 또는 캄필로박터 속(예, Campylobacter jejuni)의 세균으로부터 유래된 폴리뉴클레오티드일 수 있다. 상기 Cas 단백질은 GenBank Accession No. Q99ZW2.1의 아미노산 서열을 포함할 수 있다

상기 Cas 단백질은 야생형 Cas 단백질 또는 돌연변이 Cas 단백질일 수 있다. 상기 돌연변이 Cas 단백질은 예를 들어 촉매적 아스파라긴산 잔기(catalytic aspartate residue)가 다른 아미노산(예, 알라닌)으로 변경된 단백질일 수 있다. 상기 Cas 단백질은 재조합 단백질일 수 있다.

상기 Cas 단백질은 Cas9 단백질은 또는 Cpf1 단백질일 수 있다.

상기 Cas9 단백질은 Cas9 단백질 변이체(variant)일 수 있다. 예를 들어, 상기 변이체로는 이에 제한되지는 않으나 HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1 및 xCas9로 이루어진 군으로부터 선택되는 하나 이상일 수 있다. 상기 Cas 9 단백질 변이체 중 eSpCas9는 서열번호 8로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, evoCas9는 서열번호 9로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, HypaCas9은 서열번호 10으로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, Sniper-Cas9은 서열번호 11로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, SpCas9은 서열번호 12로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, SpCas9-HF1은 서열번호 13으로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, xCas9은 서열번호 14로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있다.

다른 양상은 서열번호 1 내지 5 로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열; 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 재조합 벡터를 제공한다. 상기 벡터는 세포 또는 개체에 도입되어 가이드 RNA를 생성하는 것일 수 있다. 상기 벡터는 세포 또는 개체에 도입되어 PDCD-1 가이드 RNA 및/또는 Cas 단백질을 발현하여, 세포 또는 개체 내에서 PD-1 단백질을 암호화하는 핵산 서열에 삽입/결실 부위를 형성하여 돌연변이를 유발할 수 있다.

용어 "폴리뉴클레오티드(polynucleotide)"는 단일가닥 또는 이중가닥 형태로 존재하는 디옥시리보뉴클레오티드 또는 리보뉴클레오티드의 중합체이다. RNA 게놈 서열, DNA(gDNA 및 cDNA) 및 이로부터 전사되는 RNA 서열을 포괄하며, 특별하게 다른 언급이 없는 한 천연의 폴리뉴클레오티드의 유사체를 포함한다.

상기 폴리뉴클레오티드는 상기 융합 단백질의 아미노산 서열을 코딩하는 뉴클레오티드 서열뿐만 아니라, 그 서열에 상보적인(complementary) 서열도 포함한다. 상기 상보적인 서열은 완벽하게 상보적인 서열뿐만 아니라, 실질적으로 상보적인 서열도 포함하며, 이는 당업계에 공지된 엄격 조건(stringent conditions) 하에서, 예를 들어, 상기 융합 단백질의 아미노산 서열을 코딩하는 뉴클레오티드 서열의 뉴클레오티드 서열과 혼성화될 수 있는 서열을 의미한다.

상기 벡터는 당업계에 공지된 다양한 방법을 통해 구축될 수 있다.

상기 벡터는 클로닝을 위한 벡터 또는 발현을 위한 벡터인 것일 수 있다. 상기 벡터는 바이러스 벡터, 플라스미드 벡터 또는 아그로박테리움 (agrobacterium) 벡터인 것일 수 있다.

상기 벡터는 원핵 세포 또는 진핵 세포를 숙주로 하여 구축될 수 있다. 상기 벡터가 발현 벡터이고, 원핵 세포를 숙주로 하는 경우에는, 전사를 진행시킬 수 있는 강력한 프로모터 (예를 들면, tac 프로모터, lac 프로모터, lacUV5 프로모터, lpp 프로모터, pLλ프로모터, pRλ프로모터, rac5 프로모터, amp 프로모터, recA 프로모터, SP6 프로모터, trp 프로모터 및 T7 프로모터 등), 해독의 개시를 위한 리보좀 결합 자리 및 전사/해독 종결 서열을 포함하는 것일 수 있다. 상기 벡터가 발현을 위한 벡터이고, 진핵 세포를 숙주로 하는 경우에는, 포유동물 세포의 게놈으로부터 유래된 프로모터 (예를 들면, 메탈로티오닌 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터 (예를 들면, 아데노바이러스 후기 프로모터, 백시니아 바이러스 7.5K 프로모터, SV40 프로모터, 사이토메갈로바이러스 프로모터 및 HSV의 tk 프로모터)가 이용될 수 있으며, 전사 종결 서열로서 폴리아데닐화 서열을 갖을 수 있다. 한편, 상기 벡터는 당업계에서 종종 사용되는 플라스미드 (예를 들면 pSC101, ColE1, pBR322, pUC, pUC8/9, pHC79, pUC19 및 pET 등), 파지 (예를 들면 λgt4·λB, λ-Charon, λ△z1 및 M13 등) 또는 바이러스 (예를 들면 SV40 등)을 조작하여 제작될 수 있다. 상기 벡터는 CBh 프로모터, U6 프로모터, CMV 프로모터, EF-1α 프로모터 또는 이들의 조합을 포함하는 것일 수 있다.

상기 재조합 벡터는 원핵 세포 또는 진핵 세포를 숙주로 하여 구축될 수 있다. 예를 들어, 본 발명의 벡터가 발현 벡터이고, 원핵 세포를 숙주로 하는 경우에는, 전사를 진행시킬 수 있는 강력한 프로모터 (예를 들어, pL프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터 등), 해독의 개시를 위한 리보좀 결합 자리 및 전사/해독 종결 서열을 포함하는 것이 일반적이다. 진핵 세포를 숙주로 하는 경우에는, 벡터에 포함되는 진핵 세포에서 작동하는 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점 및 BBV 복제원점 등을 포함하나, 이에 한정되는 것은 아니다. 또한, 포유동물 세포의 게놈으로부터 유래된 프로모터 (예를 들어, 메탈로티오닌 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터 (예를 들어, 아데노바이러스 후기 프로모터, 백시니아 바이러스 7.5K 프로모터, SV40 프로모터, 사이토메갈로바이러스 프로모터 및 HSV의 tk프로모터)가 이용될 수 있으며, 전사 종결 서열로서 폴리아데닐화 서열을 일반적으로 갖는다.

상기 벡터는 항생제 저항성 유전자를 포함하는 것일 수 있다. 상기 항생제 저항성 유전자는 암피실린 저항성 유전자, 퓨로마이신 저항성 유전자, 클로람페니콜, 블라스티시딘 저항성 유전자, 또는 이들의 조합을 포함하는 것일 수 있다.

또 다른 양상은 서열번호 1 내지 5 로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 PDCD-1 유전자 편집용 조성물을 제공한다.

상기 가이드 RNA, 벡터, PDCD-1 단백질, 및 PDCD-1 단백질을 암호화하는 핵산 서열은 전술한 바와 같다.

상기 조성물은 상기 조성물은 시험관 내(in vitro) 또는 생체 내(in vivo) 투여용일 수 있다.

상기 조성물을 시험관 내 세포 또는 생체 내에 투여하는 경우 세포 또는 개체의 측정된 PDCD-1 유전자 또는 PDCD-1 유전자에 의해 코딩되는 단백질의 발현 또는 활성 수준보다 낮은 정도로 발현 또는 활성이 나타내거나 발현 또는 활성을 감소시킬 수 있거나 불활성화시킬 수 있도록 PDCD-1 유전자를 편집할 수 있다. 이는 시험관 내 세포 또는 투여된 개체의 PDCD-1 유전자에 의해 코딩되는 단백질의 발현 또는 활성 수준보다 낮은 정도로 발현 또는 활성이 나타내거나 발현 또는 활성이 없앨 수 있는 것을 의미한다. 즉, 세포에 있어서 상기 조성물에 의한 유전자 편집은 PDCD-1 유전자 또는 PDCD-1 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 본래 조작되지 않은 모세포의 발현 또는 활성보다 약 20% 이 상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100% 감소시킬 수 있는 것일 수 있다.

상기 조성물은 세포의 유전체에서 PDCD-1 단백질을 암호화하는 핵산 서열이 변경됨으로써 PDCD-1 단백질의 기능이 없어지거나 감소되는 모든 변형을 유도하도록 유전체를 편집할 수 있고, 즉 결실, 치환, 삽입, 또는 프레임 시프트 돌연변이를 유도하여 PDCD-1 유전자를 효과적으로 제거(knockout)할 수 있다.

상기 세포는 암세포, 줄기세포, 혈관내피 세포, 백혈구, 면역 세포, 상피 세포, 생식 세포, 섬유아세포, 근육세포, 골수 세포, 표피 세포, 골아세포 및 신경세포로 이루어진 군으로부터 선택될 수 있다.

PDCD-1 유전자 또는 PDCD-1 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 유전적으로 조작 또는 편집된 세포는 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 용어 "불활성화 (inactivation)"는 전혀 발현이 되지 않는 유전자 또는 발현이 되더라도 그 활성이 없는 단백질이 생성되는 것을 의미할 수 있다. 용어 "감소 (depression)"는 PDCD-1 유전자가 조작되지 않은 세포에 비하여 낮은 수준으로 발현되거나, 또는 PDCD-1 유전자에 의해 코딩되는 단백질이 발현이 되더라도 그 활성이 낮거나 활성이 제거된 것을 의미할 수 있다.

상기 "제거"는 세포의 유전체에서 PDCD-1 단백질을 암호화하는 핵산 서열이 변경됨으로써 PDCD-1 단백질의 기능이 없어지거나 감소되는 모든 변형을 말한다. 용어 "제거"는 "돌연변이"와 상호 교환적으로 사용될 수 있다. 상기 제거 또는 돌연변이는 예를 들어 결실, 치환, 삽입, 또는 프레임 시프트 돌연변이일 수 있다.

상기 유전자 편집용 조성물은 PDCD-1 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소시키도록 유전적으로 조작 또는 편집할 수 있어, 이를 투여한 개체의 암의 예방 및/또는 치료 용도로 사용될 수 있다.

일 양상에 따른 가이드 RNA, 이를 포함하는 벡터, 상기 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체를 포함하는 PDCD-1 유전자 편집용 조성물은 세포 또는 개체의 유전체에서 PDCD-1 유전자를 효과적으로 제거(knockout)할 수 있고, 이를 통해 맞춤의료 또는 정밀의료로서 암을 예방 또는 치료하는데 유용하게 사용될 수 있다.

도 1은 Cas 9 또는 이의 변이체를 암호화하는 핵산서열을 포함하는 플라스미드인 pcDNA 3.1 플라스미드를 나타낸 도이다.

도 2는 실시예에서 사용한 spCas9 유전자 편집체 에디터 단백질(HypaCas9, SpCas9-HP1, evoCas9 및 eSpCas9(1.1))의 변이체의 벡터맵을 간단히 모식화하여 나타낸 도이다.

도 3A는 실험에 사용한 가이드 RNA를 포함한 플라스미드를 나타낸 도이며, 도 3B는 spCas9 유전자 편집체 에디터 단백질과 가이드 RNA를 All-in-One 백터 시스템으로 변환한 경우의 벡터맵을 나타낸 도이다(이 경우 도 3A의 U6 promoter-guide RNA-scaffold sequence 부분을 Cas9 plasmid의 CMV/EF-1α promoter 앞부분에 삽입하여 구성된다).

도 4는 HEK293T 세포에 PDCD-1 가이드 RNA를 암호화하는 플라스미드를 형질주입(transfection)시키고, 발현 정도를 eGFP(enhanced Green Fluorescent Protein) 형광을 통해 확인한 도이다.

도 5는 PDCD-1 가이드 2(서열번호 2)와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9 및 eSpCas9로의 유전자 편집을 확인하고, 메인 패턴을 나타낸 도이다.

도 6은 PDCD-1 가이드 2와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9 및 eSpCas9로의 유전자 편집을 확인하고, 서브 패턴을 나타낸 도이다.

도 7은 PDCD-1 가이드 4(서열번호 4)와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 HypaCas9 및 eSpCas9로의 유전자 편집 패턴을 확인하고, 메인 패턴을 나타낸 도이다.

도 8은 PDCD-1 가이드 4와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 HypaCas9 및 eSpCas9로의 유전자 편집 패턴을 확인하고, 서브 패턴을 나타낸 도이다.

도 9는 PDCD-1 가이드 5(서열번호 5)와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1 및 eSpCas9로의 유전자 편집 패턴을 확인한 도이다.

이하 일 양상을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 일 양상을 예시적으로 설명하기 위한 것으로 일 양상의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니며, 일 양상의 실시예 및 실험예는 당업계에서 평균적인 지식을 가진 자에게 일 양상을 보다 완전하게 설명하기 위해서 제공되는 것이다.

실시예 1: High-fidelity CRISPR/Cas9 플라스미드 클로닝

정확성을 높인 High-fidelity Cas9 변이체 4종 HypaCas9, SpCas9-HP1, evoCas9, eSpCas9(1.1)(연세대학교 의과대학 김형범 교수 연구실)을 pcDNA 3.1 벡터(Thermofisher)에 클로닝하였다. 상기 High-fidelity Cas9 변이체는 DNA-RNA 이형이중가닥(heteroduplex)와 상호작용하여 표적 부위에 결합하는 REC3 도메인을 변형시키거나, 상보적인 DNA 가닥을 절단하는 HNH 도메인 또는 비상보적인 DNA 가닥을 절단하여 DNA 이중가닥 절단(double-strand breaks, DSBs)을 생성하는 RuvC ²도메인을 변형시켜, 표적 효율성(on-target efficiency)을 유지하면서 표적이탈(off-target effect) 확률을 낮춘 Cas9 변이체를 사용하였다.

HEK293T에서 빠르게 가이드 RNA의 효율을 확인하기 위하여 CMV 프로모터를 사용하였다. CMV는 가장 널리 사용되고 있는 프로모터로 대부분의 세포주(cell line)에서 강한 발현을 보이며, pcDNA3.1 플라스미드에 기본적으로 CMV가 구성되어 있어, 프로모터로는 상기 Cas9 변이체에 작동가능하게 연결된 CMV 프로모터 또는 EF-1α 프로모터를 사용하였다. 또한, P2A보다 IRES가 더 안정적이기 때문에 Cas9과 EGFP사이에 IRES sequence를 활용하여, Cas9-IRES-eGFP의 형태로 발현되도록 벡터를 구성하였다. 구체적으로 사용한 IRES-eGFP 발현 벡터의 모식도를 도 1에 나타내었고, Cas9 변이체 4종 HypaCas9, SpCas9-HP1, evoCas9, eSpCas9(1.1)의 벡터맵을 도 2에 각각 나타내었다.

실시예 2: 가이드 RNA 플라스미드 클로닝

2-1: 가이드 RNA 설계

PDCD-1 유전자를 표적으로 하는 5종의 가이드 RNA를 합성하였다. 인간 PDCD-1 유전자 isoform 1의 엑손 2 및 isoform 2의 엑손 1의 공통된 부분을 가이드 RNA의 표적 후보로 선정하여 PDCD-1의 두가지 isoform을 모두 넉아웃(knockout)할 수 있는 가이드 RNA를 설계하였다. 상기 5종 가이드 RNA 후보 서열의 위치 및 서열을 하기 표 1에 나타내었다.

PDCD-1	위치	표적 후보 서열 (5'-3')	서열번호
Guide1	151:180	CAAGCTGGCCGCCTTCCCCG	1
Guide2	280:309	GGAGATGGCCCCACAGAGGT	2
Guide3	269:298	GACAGCGGCACCTACCTCTG	3
Guide4	316:345	GCAGATCAAAGAGAGCCTGC	4
Guide5	127:156	CATGAGCCCCAGCAACCAGA	5

2-2: 가이드 RNA 플라스미드 클로닝

실시예 2-1에서 설계한 가이드 RNA를 발현하는 플라스미드로 GX19 벡터를 이용하였다. 프로모터로는 U6 프로모터를 사용하였고, Cas9와 결합하는 가이드 RNA 스캐폴드 서열을 삽입하고 U6 프로모터 및 상기 스캐폴드 서열 사이에 20 bp 크기의 가이드 RNA 표적 서열이 위치하도록 하였다. 상기 표 1의 올리고뉴클레오티드 서열을 각각 합성하고, 정방향/역방향 프라이머, T4 폴리뉴클레오티드 키나아제 및 NEB 어닐링(annealing) 버퍼를 이용하여 어닐링하였다. 어닐링 조건은 95℃에서 5분, 이어서 25℃로 램핑(ramping)하는 단계(초당 0.1℃)로 설정하였다. 어닐링된 올리고뉴클레오티드를 T4 리가아제를 이용하여 Bsa Ⅰ제한효소로 절단된 GX19 벡터에 라이게이션하였다. 이러한 가이드 RNA 플라스미드를 도 3A에, 플라스미드 벡터 맵을 모식화하여 도 3B에 나타내었다.

실시예 3: PDCD-1 가이드 RNA의 세포 내 도입

설계한 가이드 RNA의 효율을 측정하기 위한 실험을 수행하였다. 인간 배아 신장 세포주인 HEK293T 세포를 PDCD-1 가이드 RNA를 암호화하는 플라스미드로 형질주입(transfection)시키고, 발현 정도를 eGFP(enhanced Green Fluorescent Protein) 형광을 통해 확인하였다. 구체적으로, Neon 형질주입 시스템(Thermofisher)을 이용하여 1300 v, 20 ms, 1 pulse 조건으로 5 x 10⁶ 개의 HEK293T 세포에 Cas9 플라스미드 3μg, 가이드 RNA 플라스미드 1μg(Cas9과 가이드의 비율은 3:1) 및 형질주입된 HEK293T 세포만을 선택하기 위한 퓨로마이신 플라스미드 400ng을 첨가하여 HEK293T 세포를 형질주입시켰다. 형질주입의 효율을 측정하기 위하여, 형질주입 5일 후 eGFP 발현 정도를 확인하여 도 4에 나타내었고 이후 형질주입된 세포를 선별하였다.

도 4에서 확인한 바와 같이, HEK293T 세포가 상기 실시예 1 및 2-1에서 설계한 PDCD-1 가이드 RNA 및 high-fidelity Cas9 변이체를 발현함을 확인하고, 형질주입된 세포를 선별하였다.

실시예 4: 인델 빈도의 측정 및 최적 가이드 RNA의 선별

차세대염기서열분석(Next Generation Sequencing, NGS)을 수행하여 최적 가이드 RNA 및 사용한 Cas9 변이체를 확인하기 위한 실험을 수행하였다. 구체적으로 실시예 3에서 준비된 세포에서 유전체 중 인델(insertion/deletion, indel) 빈도를 측정하기 위해 차세대염기서열분석을 수행하였다. 인델 빈도는 하기 수학식에 따라 산출하였다.

[수학식 1]

구체적으로 NGS는 가이드 RNA 타겟 시퀀스의 PAM(-NGG) 시퀀스의 다운 스트림 50~100bp, 총 200~250bp 시퀀싱이 가능하도록 하기와 같은 프라이머를 제작하고 이를 사용하였다.

어댑터 시퀀스(Adapter sequence) : (5'-3')

정방향 5'-CTACACGACGCTCTTCCGATCT (서열번호 6)

역방향 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (서열번호 7)

구체적으로 이후 웹 기반 NSG analyzer 알고리즘을 이용하여 NGS 결과 분석하였고, NGS 결과를 입력하여 삽입(insertion), 삭제(deletion) ratio와 사이즈, 시퀀스 정보를 비교하고, 전체 세포에서 인델로 인한 돌연변이 비율을 확인하였다.

총 5종의 가이드 RNA와 4 종의 Cas9 변이체(eSpCas9, evoCas9, HypaCas9, SpCas9-HF1)로 실험을 진행하였고, 가장 높은 인델 빈도를 보인 가이드 RNA와 Cas9 조합을 선정하기 위한 실험을 진행하였으며, NGS 분석을 통하여 가이드 RNA의 인델 빈도를 확인한 결과를 하기 표 2에 나타내었다. evoCas9을 활용한 인델빈도 확인 결과를 표 3에, HypaCas9을 활용한 인델빈도 확인 결과를 표 4에, SpCas9을 활용한 인델빈도 확인 결과를 표 5에, eSpCas9을 활용한 인델빈도 확인 결과를 표 6에 나타내었다.

PDCD1	Target Seq	Background
PDCD1	Target Seq	Indel	Total	Indel Freq (%)
Guide1	CAAGCTGGCCGCCTTCCCCG	383	23823	1.61
Guide2	GGAGATGGCCCCACAGAGGT	0	24306	0.00
Guide3	GACAGCGGCACCTACCTCTG	0	24329	0.00
Guide4	GCAGATCAAAGAGAGCCTGC	5	24984	0.02
Guide5	CATGAGCCCCAGCAACCAGA	379	23722	1.60

evoCas9	score	Indel freq (%)
Guide 2	Top 1	54.97
Guide 3	Top 2	50.80

HypaCas9	score	Indel freq (%)
Guide 4	Top 1	60.27
Guide 1	Top 2	42.11

SpCas9-HF1	score	Indel freq (%)
Guide 2	Top 1	62.44
Guide 5	Top 2	63.57
Guide 1	Top 3	47.45

eSpCas9	score	Indel freq (%)
Guide 2	Top 1	60.13
Guide 4	Top 2	66.14
Guide 5	Top 3	61.38

상기 표 2는 타겟 부위 20bp를 포함한 200~300bp 부위를 PCR 후 NGS 분석을 통하여 야생형 서열과 비교하여 상이한 시퀀스가 확인되면 인델 빈도로 나타내었고, 이는 CRIPSR/Cas9에 의한 인델 빈도가 아닌 PCR 오류 등으로 인하여 생기는 오차인 것으로 확인되었다. 이에, 상기 표 2는 실제 실험 데이터가 아닌 실제 데이터인 표 3 내지 표 6에서 오차를 제외시켜 주기 위한 데이터로서, 표 2의 인델 빈도는 오차범위를 나타내는 결과인 것을 확인하였다.

또한 상기 표 3 내지 6에서 확인한 바와 같이, PDCD-1 가이드 2(서열번호 2)와 Cas9 변이체 evoCas9, SpCas9-HF1 및 eSpCas9의 조합을 사용하는 경우 인델 빈도가 높은 것을 확인할 수 있었다. 아울러 PDCD-1 가이드 4(서열번호 4)와 Cas9 변이체 HypaCas9에서 인델 빈도가 가장 높았으며, PDCD-1 가이드 4(서열번호 4)와 eSpCas9(1.1)의 조합 역시도 인델 빈도가 높게 나타남을 확인하였다. 또한 PDCD-1 가이드 5(서열번호 5)와 SpCas9-HF1 및 eSpCas9의 조합을 사용하는 경우 각각의 인델 빈도가 60%를 넘어서는 것을 확인하여 높게 나타나는 것을 확인하였다.

실시예 5: 선별된 가이드 RNA을 통한 유전자 편집 효율과 유전자 편집 패턴의 확인

PDCD-1에 대한 가이드 RNA의 유전자 편집 효율과 이의 유전자 편집이 일어나는 경우 이의 메인 편집패턴이 있는지를 상기 실시예 4의 방법으로 확인하는 실험을 수행하였다. 구체적으로 PDCD-1에 대한 가이드 RNA 5종 중에서 PDCD-1 가이드 2, 4 및 5가 인델 빈도가 높은 것을 확인하였으므로 이들 3종을 가이드 RNA로 선별하고 이의 유전자 편집 효율과 함께 이들의 유전자 편집 패턴을 확인하는 실험을 수행하였다.

가이드 RNA 간 인델 빈도를 분석하여, 각각 evoCas9 및 HypaCas9 Cas9 변이체는 인델빈도가 가장 높은 가이드 2종을 확인하였고, SpCas9-HF1 및 eSpCas9는 인델빈도가 가장 높은 가이드 3종의 인델 빈도를 확인하였고, 이의 결과를 차례대로 표 7 내지 표 10에 나타내었다.

evoCas9	score	Indel freq (%)
Guide 2	Top 1	39.0
Guide 3	Top 2	37.0

HypaCas9	Score	Indel freq (%)
Guide 4	Top 1	53.6
Guide 1	Top 2	39.8

SpCas9-HF1	score	Indel freq (%)
Guide 2	Top 1	51.3
Guide 5	Top 2	57.9
Guide 1	Top 3	45.3

eSpCas9	score	Indel freq (%)
Guide 2	Top 1	46.9
Guide 4	Top 2	58.1
Guide 5	Top 3	56.0

아울러, 상기 가이드 RNA로 확인한 유전자 편집 중에서 가장 메인으로 나타나는 패턴을 확인하였고, 이를 확인한 결과를 evoCas9 및 HypaCas9 Cas9 변이체의 결과를 각각 표 11 및 12에 나타내었고, SpCas9-HF1 및 eSpCas9는 차례대로 표 13 내지 표 14에 나타내었다.

evoCas9	Of total indel freq (%)	Of total insertion freq (%)
Guide 2	28	65
Guide 3	31	62

HypaCas9	Of total indel freq (%)	Of total insertion freq (%)
Guide 4	26	68
Guide 1	28	75

SpCas9-HF1	Of total indel freq (%)	Of total insertion freq (%)
Guide 2	34	66
Guide 5	26	76
Guide 1	31	76

eSpCas9	Of total indel freq (%)	Of total insertion freq (%)
Guide 2	31	67
Guide 4	18	58
Guide 5	29	75

이중, 가이드 2, 4 및 5의 유전자 편집 패턴을 확인하는 실험을 수행하였다. 먼저 PDCD-1 가이드 2번과 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9 및 eSpCas9로의 유전자 편집 패턴을 확인하였고, 메인 패턴으로 확인된 결과를 도 5에, 서브 패턴으로 확인된 결과를 도 6에 나타내었다.

도 5에 나타난 유전자 편집 패턴으로서 SpCas9-HF1와 PDCD-1 가이드 2에서 확인된 총 인델빈도 중 34% 및 총 삽입 빈도의 66%가 도 5와 같이 나타났으며, 또한 evoCas9-HF1와 PDCD-1 가이드 2의 총 인델빈도 중 28%, 총 삽입 빈도 중 65%가 도 5와 같이 나타난 것으로 확인되었다. 또한 eSpCas9와 PDCD-1 가이드 2로 유도된 유전자 편집 중 총 인델빈도의 31%, 총 삽입 빈도의 67%가 도 5와 같이 나타나는 것을 확인하였다. 따라서, 이를 종합해보면 PDCD-1 가이드 2의 유전자 편집은 수치 상으로도 결실(deletion)도 다수 나타나면서 이의 패턴도 다양한 것으로 나타났으나, 가장 주된 패턴은 삽입으로서 Cas9 종류에 상관없이 PDCD-1 가이드 2의 경우에 TACCTCTGTG 시퀀스 사이에 TACCTTCTGTG로 T 1bp 삽입 패턴이 가장 많이 나타나는 것을 확인하였다.

도 6에서 확인한 바와 같이, 서브 패턴은 Cas9 변이체 종류에 상관없이 PDCD-1 가이드 2의 경우에는 TACCTCTGTGGGGCCA 시퀀스에서 CCTCTGTGGGG 11bp 결실 패턴이 가장 많이 나타나는 것을 확인하였다.

또한 PDCD-1 가이드 4번과 상기 PDCD-1 가이드 RNA와 인델효율이 높은 것으로 확인된 HypaCas9 및 eSpCas9로의 유전자 편집 패턴을 확인하였고, 메인 패턴으로 확인된 결과를 도 7에, 서브 패턴으로 확인된 결과를 도 8에 나타내었다.

도 7에 나타난 유전자 편집 패턴으로서 HypaCas9와 PDCD-1 가이드 4에서 확인된 총 인델빈도 중 26%, 총 삽입 빈도의 68%가 도 7과 같이 나타났고, 또한 eSpCas9와 PDCD-1 가이드 4의 총 인델 빈도 중 18%, 총 삽입 빈도 중 58% 가 도 7와 같이 나타난 것으로 확인되었다. 이에 메인 패턴은 삽입이 가장 많았으며, Cas9 종류에 상관없이 PDCD-1 가이드 4의 경우에는 AGAGAGCCTGCG 시퀀스 사이에 AGAGAGCCCTGCG로 C 삽입 패턴이 가장 많이 나타나는 것을 확인하였다. 도 8에서 확인한 바와 같이, PDCD-1 가이드 4의 서브 패턴은 GAGAGCCTGCGGGCA 시퀀스에서 GCCTGCGG 8bp 결실 패턴이 가장 많았고, 그 다음으로는 GCCT 4bp 결실, AGAGCCTGCGGGC 13bp 결실 패턴이 많은 것으로 확인되었다.

또한 PDCD-1 가이드 5와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1 및 eSpCas9로의 유전자 편집 패턴을 확인하였고, 이의 결과를 도 9에 나타내었다.

도 9에 나타난 유전자 편집 패턴으로서 SpCas9-HF1와 PDCD-1 가이드 5에서 확인된 총 인델빈도 중 26%, 총 삽입 빈도 중 76%가 도 9와 같이 나타나는 것을 확인하였다. 이에, 메인 패턴은 삽입이 많았고, 메인 패턴 이외에 서브패턴이 적은 빈도로 다양하게 나타나는 것을 확인하였다. 종합적으로, Cas9 변이체 종류에 상관없이 PDCD-1 가이드 5의 경우는 CAGCAACCAGACG 시퀀스 사이에 CAGCAACCCAGACG로 C 삽입 패턴이 가장 많이 나타나는 것을 확인하였다.

종합하여, 표 11 내지 표 14에서 확인한 바와 같이, NGS 결과 분석을 통하여 확인한 결과 PDCD-1 가이드 2가 총 인델 빈도에서 메인 패턴의 비율이 가장 높게 나타난 것을 확인하였고, 총 삽입 빈도에서는 PDCD-1 가이드 5의 메인 삽입 패턴이 이 가장 높게 나타나는 것을 확인하였다. PDCD-1 가이드 1 및 PDCD-1 가이드 5번이 가이드 4에 비해 총 삽입 빈도에서 더 높은 메인 패턴이 나타나는 것을 확인하였다. 이에 PDCD-1 가이드 RNA는 대부분의 가이드 RNA에서 1bp 삽입이 메인으로 확인되는 것을 확인하였다. 구체적인 수치상으로는 결실의 경우 높게 보이지만 여러 패턴이 포함되어 있어서 메인 패턴끼리 비교할 경우 1bp 삽입이 가장 많이 발생되는 것으로 확인하였다.

최종적으로 PDCD-1 가이드 2는 evoCas9, SpCas9-HF1 Cas9 변이체와의 조합에서 가이드에 의하여 유도된 인델이 가장 높은 빈도로 나타났고, PDCD-1 가이드 4는 HypaCas9, eSpCas9과의 조합에서 가장 높게 가이드에 의하여 유도된 인델이 가장 높은 빈도로 나타난 것을 확인하였다.

전술한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.

Claims

서열번호 1 내지 5로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA.
청구항 1에 있어서, 상기 상보적인 핵산 서열은 선택된 1종의 폴리뉴클레오티드가 전사된 폴리뉴클레오티드인 것인 가이드 RNA.
청구항 1에 있어서, 상기 가이드 RNA는 PDCD-1 유전자와 혼성화하는 것인 가이드 RNA.
청구항 1에 있어서, 상기 가이드 RNA는 PDCD-1 유전자의 엑손 1 내지 2로 이루어진 부위에서 적어도 하나의 부위에 결합되는 것인 가이드 RNA.
청구항 1에 있어서, 상기 가이드 RNA는 PDCD-1 유전자의 핵산 서열 내 변형을 유도하는 것인 가이드 RNA.
청구항 5에 있어서, 상기 핵산 서열 내 변형은

1) PDCD-1 유전자의 전부 또는 연속하는 1bp 내지 15bp의 염기서열 부위의 결실,

2) PDCD-1 유전자의 1 내지 15개의 뉴클레오티드의 야생형 유전자와 상이한 뉴클레오티드로의 치환,

3) 각각 독립적으로 A, T, C 및 G 중에서 선택된 1 내지 15개의 뉴클레오티드의 PDCD-1 로의 삽입, 또는

4) 상기 1) 내지 3) 중에서 선택된 2 가지 이상의 조합

에 의한 것인 가이드 RNA.
서열번호 1 내지 5로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열; 및

Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 CRISPR/Cas9 시스템.
청구항 7에 있어서, 상기 Cas9 에디터 단백질의 변이체는 HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1 및 xCas9로 이루어진 군으로부터 선택되는 하나 이상인 것인 CRISPR/Cas9 시스템.
서열번호 1 내지 5로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열; 및

Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 재조합 벡터.
서열번호 1 내지 5로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 PDCD-1 유전자 편집용 조성물.