WO2020022802A1

WO2020022802A1 - 인위적인 유전자 조작을 통한 자가면역질환 치료

Info

Publication number: WO2020022802A1
Application number: PCT/KR2019/009237
Authority: WO
Inventors: 송동우; 조동현; 김정훈; 이정민; 이규준; 김운기
Original assignee: 주식회사 툴젠; 서울대학교산학협력단; 서울대학교병원
Priority date: 2018-07-25
Filing date: 2019-07-25
Publication date: 2020-01-30
Also published as: KR20200011899A

Abstract

본 발명은 인위적인 면역 기능조절을 위해 세포의 게놈 내 존재하는 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 면역 참여 유전자를 표적화할 수 있는 가이드핵산 및 에디터 단백질을 포함하는 유전자 조작용 조성물에 관한 것이다. 또한 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 면역 기능이상 질환을 치료 또는 개선하는 방법에 관한 것이다.

Description

[규칙 제26조에 의한 보정 26.08.2019]　인위적인 유전자 조작을 통한 자가면역질환 치료

본 발명은 면역 기능조절을 위한, 면역 참여 유전자의 인위적 조작 또는 변형에 관한 것이다. 보다 구체적으로, 면역 반응을 조절하기 위한 면역 참여 유전자를 인위적으로 조작할 수 있는 조성물을 포함하는, 인위적으로 면역 반응 또는 기능을 조절할 수 있는 시스템에 관한 것이다.

자가면역질환(autoimmune disease)은 인체 내부의 면역계가 외부 항원이 아닌 내부의 정상세포를 공격하여 생기는 질병으로, 그 원인은 아직 명확하게 밝혀지지 않았다. 선천성으로 유전 질환일 가능성이 많다. 스트레스나 생활습관 같은 환경적인 요인에 의해 악화된다고 하나 확실하진 않다. 성인 여성에게 가장 흔하다고는 하나 사실상 남녀노소 불문하고 나타난다.

자가면역질환은 원인이 밝혀지지 않은 만큼 완치법 없이 대증치료가 발달했으며 당연히 이론상 예방법도 없다. 그저 추측상 스트레스나 호르몬 또는 잘못된 생활습관이 원인일 것으로 여겨지고 있다. 자가면연질환은 그 종류만 해도 100가지가 넘는다고 알려져 있고, 가장 대표적인 자가면역질환의 예는 류마티스 관절염이 있으며, 안구에서 발생하는 자가면역질환으로는 포도막염, 베체트병, 쇼그렌 증후군 등이 있다.

그 중에서 포도막염(Uveitis)은 1000~5000명당 1명꼴로 환자가 발생되며 치료 후에도 환자 중 10%이상이 실명의 위험이 있고, 전체 실명환자의 원인 중에서 3번째(약 20%)에 해당할 만큼 위험성이 큰 질환임에도 불구하고 항염증제인 corticosteroid 외에는 특별한 치료제가 전무한 상태이다.

따라서, 유전자 교정을 이용해 염증유발 유전자의 발현을 근본적으로 녹아웃 시킬 수 있는, 한 번의 처치로 장기적 또는 영구적인 효과를 기대할 수 있는 치료제 개발이 필요한 실정이다.

본 발명의 일 구체예로서 유전자 조작용 조성물을 제공하고자 한다.

본 발명의 일 구체예로서 면역 참여 유전자를 표적할 수 있는 가이드핵산을 제공하고자 한다.

본 발명의 일 구체예로서 면역 기능이상 질환을 치료하는 방법을 제공하고자 한다.

상기 과제를 해결하기 위하여, 본 발명은 인위적인 면역 기능조절을 위해 세포의 게놈 내 존재하는 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 면역 참여 유전자를 표적화할 수 있는 가이드핵산 및 에디터 단백질을 포함하는 유전자 조작용 조성물에 관한 것이다. 또한 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 면역 기능이상 질환을 치료 또는 개선하는 방법에 관한 것이다.

본 발명은 특정 목적을 위해 유전자 조작용 조성물을 제공한다.

구현예에서, 상기 유전자 조작용 조성물은

면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및

에디터단백질 또는 이를 암호화하는 핵산 서열

을 포함할 수 있다.

상기 면역 참여 유전자는 Death 도메인을 포함하는 단백질을 암호화하는 유전자일 수 있다.

이때, 상기 Death 도메인을 포함하는 단백질은 TNF receptor, ankyrin, MyD88 또는 IRAK family 단백질일 수 있다.

상기 면역 참여 유전자는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 단백질을 암호화하는 유전자일 수 있다.

이때, 상기 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 단백질은 MyD88, interleukin-1 receptor, Toll receptor 또는 Toll like receptor 단백질일 수 있다.

상기 면역 참여 유전자는 Complement component 단백질을 암호화하는 유전자일 수 있다.

이때, 상기 Complement component 단백질은 C1, C2, C3, C4, C5, C6, C7, C8 또는 C9 단백질일 수 있다.

일 구체예에서, 상기 면역 참여 유전자는 MYD88 유전자일 수 있다.

일 구체예에서, 상기 면역 참여 유전자는 C3 유전자일 수 있다.

상기 표적 서열은 면역 참여 유전자의 exon에 위치할 수 있다.

상기 표적 서열은 SEQ ID NO: 19 내지 SEQ ID NO: 416 중 선택된 하나 이상의 서열일 수 있다.

상기 표적 서열은 SEQ ID NO: 21, 22, 25, 26, 29, 35, 36, 37, 38, 39, 40, 155, 157, 158, 159, 161, 171, 172, 177, 178, 181, 183, 184, 185, 186 및 188 중 선택된 하나 이상의 서열일 수 있다.

상기 표적 서열은 SEQ ID NO: 49, 51, 52, 64, 65, 71, 78, 90, 95, 96, 100, 102, 103, 105, 109, 112, 114, 115, 116, 117, 118, 119, 120, 121, 211, 212, 243, 244, 245, 262, 263, 264, 274, 284, 285, 286, 312, 313, 314, 315 및 316 중 선택된 하나 이상의 서열일 수 있다.

상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814 중 선택된 하나 이상의 서열일 수 있다.

상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열일 수 있다.

상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열일 수 있다.

상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.

상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.

상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.

상기 가이드핵산은 가이드 도메인은 포함할 수 있다.

이때, 상기 가이드 서열은 상기 가이드 도메인에 포함될 수 있다.

상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함할 수 있다.

상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다.

일 구체예에서, 상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.

상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 플라스미드 또는 1 이상의 바이러스 벡터에 존재할 수 있다.

이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상일 수 있다.

상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태일 수 있다.

이때, 상기 가이드핵산은 guide RNA(gRNA)일 수 있다.

또한, 본 발명은 특정 목적을 위해 면역 참여 유전자를 표적할 수 있는 가이드핵산을 제공한다.

일 구현예에서, 상기 가이드핵산은 면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함할 수 있다.

상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자일 수 있다.

상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성되 서열들 중 선택된 하나 이상의 서열일 수 있다.

상기 가이드핵산은 에디터단백질과 복합체를 형성할 수 있다.

일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열일 수 있다.

일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열일 수 있다.

상기 가이드핵산은 가이드 도메인은 포함할 수 있다.

본 발명은 포도막염(Uveitis)을 치료하기 위해 치료 대상에 유전자 조작용 조성물을 투여(도입)하는 단계를 포함하는, 포도막염(Uveitis)을 치료하는 방법을 제공한다.

일 구현예에서, 포도막염(Uveitis)을 치료하는 방법은 유전자 조작용 조성물을 치료 대상에 도입(투여)하는 단계를 포함할 수 있다.

상기 유전자 조작용 조성물은

에디터단백질 또는 이를 암호화하는 핵산 서열

을 포함할 수 있다.

상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열일 수 있다.

일 구체예에서, 상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.

상기 유전자 조작용 조성물은 플라스미드 또는 바이러스 벡터 형태일 수 있다.

상기 가이드 핵산 및 에디터 단백질은 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.

이때, 상기 가이드핵산은 guide RNA(gRNA)일 수 있다.

이때, 상기 가이드핵산-에디터단백질 복합체는 가이드핵산의 일부 뉴클레오타이드 서열과 에디터단백질의 일부 아미노산이 상호작용하여 형성된 것일 수 있다.

상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.

상기 가이드 핵산 및 에디터 단백질, 및/또는 도너는, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.

이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 잇다.

이때, 상기 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.

상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.

상기 유전자 조작용 조성물은 치료 대상에 투여(도입)될 수 있다.

상기 유전자 조작용 조성물은 치료 대상의 특정 신체 위치에 투여(도입)될 수 있다.

상기 특정 신체 위치는 기능이 비정상적인 홍채, 모양체, 맥락막, 망막 또는 이와 상호작용할 수 있는 및/또는 근접한 조직(위치)일 수 있다. 예를 들어, 홍채, 모양체, 맥락막 및/또는 안구일 수 있다.

상기 투여(도입)는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.

상기 투여(도입)는 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneally)에서 선택된 투여 경로로 수행될 수 있다.

본 발명은 유전자 조작용 조성물을 통해 면역 참여 유전자의 기능 및/또는 발현을 조절할 수 있다. 보다 구체적으로, 면역 참여 유전자를 표적화하는 가이드핵산 및 에디터단백질을 포함하는 유전자 조작용 조성물을 이용해 면역 참여 유전자를 인위적으로 조작 및/또는 변형하여 면역 참여 유전자의 기능 및/또는 발현을 조절하여 인위적으로 면역 기능조절을 할 수 있도록 한다. 또한, 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 면역 기능이상 질환을 개선 또는 치료할 수 있다.

도 1은 C3 유전자를 표적하는 gRNA 및 Cas9에 의한 Retina cell 및 RPE cell에서 온-타겟 및 오프-타겟의 인델(%)을 확인한 그래프로, Cas9의 종류에 따라 Cj(CjCas9) 또는 Sp(SpCas9)로 표시하였다.

도 2는 Myd88 유전자를 표적하는 gRNA 및 Cas9에 의한 Retina cell 및 RPE cell에서 온-타겟 및 오프-타겟의 인델(%)을 확인한 그래프로, Cas9의 종류에 따라 Cj(CjCas9) 또는 Sp(SpCas9)로 표시하였다.

달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.

본 명세서에 의해 개시되는 내용의 일 태양은 가이드핵산에 관한 것이다.

“가이드핵산”은 표적 핵산, 유전자 또는 염색체를 인지하고, 및 에디터단백질과 상호작용할 수 있는 뉴클레오타이드 서열을 의미한다. 이때, 상기 가이드핵산은 표적 핵산, 유전자 또는 염색체 내의 일부 뉴클레오타이드 서열과 상보적인 결합할 수 있다. 또한 상기 가이드핵산의 일부 뉴클레오타이드 서열은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성할 수 있다.

상기 가이드핵산은 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체의 표적 영역에 위치할 수 있도록 유도하는 기능을 수행할 수 있다.

상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.

상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.

예를 들어, 하나의 연속된 핵산 서열은 (N)_m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.

상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.

예를 들어, 두 개 이상의 연속된 핵산서열은 (N)_m과 (N)_o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.

상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.

상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리도메인 등의 기능적 도메인일 수 있으며, 이에 제한되지 않는다.

이때, 하나의 가이드핵산은 2 이상의 기능적 도메인을 가질 수 있다. 이때, 상기 2 이상의 기능적 도메인은 서로 상이할 수 있다. 또는 하나의 가이드핵산에 포함된 2 이상의 기능적 도메인은 서로 동일할 수도 있다. 예를 들어, 하나의 가이드핵산은 2 이상의 근위 도메인을 가질 수 있고, 다른 예를 들어, 하나의 가이드핵산은 2 이상의 꼬리도메인을 가질 수 있다. 다만, 하나의 가이드핵산에 포함되어 있는 기능적 도메인이 서로 동일한 도메인이라는 말은 두 기능적 도메인의 시퀀스가 동일하다는 의미는 아니며, 시퀀스가 상이하여도 기능적으로 동일한 기능을 수행하고 있으면 동일한 도메인이라고 할 수 있다.

기능적 도메인에 대해서 이하에서 구체적으로 설명한다.

i) 가이드 도메인

"가이드 도메인"은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 결합을 할 수 있는 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위해 역할한다. 예를 들어, 가이드 도메인은 표적 유전자 또는 핵산의 특정 뉴클레오타이드 서열을 가지는 위치로 가이드핵산-에디터단백질 복합체를 유도하는 기능을 수행할 수 있다.

상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로, 상기 가이드 도메인은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

상기 가이드 도메인은 가이드 서열을 포함할 수 있다.

“가이드 서열”은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열이며, 이때 상기 가이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열, 15 내지 25개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로, 상기 가이드 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.

또한, 상기 가이드 도메인은 추가 뉴클레오타이드 서열을 더 포함할 수 있다.

상기 추가 뉴클레오타이드 서열은 가이드 도메인의 기능 향상 또는 저하를 위한 것일 수 있다.

상기 추가 뉴클레오타이드 서열은 가이드 서열의 기능 향상 또는 저하를 위한 것일 수 있다.

상기 추가 뉴클레오타이드 서열은 1 내지 10개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 추가 뉴클레오타이드 서열은 2내지 10개의 뉴클레오타이드 서열, 4 내지 10개의 뉴클레오타이드 서열, 6 내지 10개의 뉴클레오타이드 서열 또는 8 내지 10개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로, 상기 추가 뉴클레오타이드 서열은 1 내지 3개의 뉴클레오타이드 서열, 3 내지 6개의 뉴클레오타이드 서열 또는 7 내지 10개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 상기 추가 뉴클레오타이드 서열은 1개의 뉴클레오타이드 서열, 2개의 뉴클레오타이드 서열, 3개의 뉴클레오타이드 서열, 4개의 뉴클레오타이드 서열, 5개의 뉴클레오타이드 서열, 6개의 뉴클레오타이드 서열, 7개의 뉴클레오타이드 서열, 8개의 뉴클레오타이드 서열, 9개의 뉴클레오타이드 서열 또는 10개의 뉴클레오타이드 서열일 수 있다.

예를 들어, 상기 추가 뉴클레오타이드 서열은 1개의 뉴클레오타이드 서열 G(구아닌)일 수 있으며, 또는 2개의 뉴클레오타이드 서열 GG일 수 있다.

상기 추가 뉴클레오타이드 서열은 상기 가이드 서열의 5' 말단에 위치할 수 있다.

상기 추가 뉴클레오타이드 서열은 상기 가이드 서열의 3' 말단에 위치할 수 있다.

ii) 제 1 상보적 도메인

"제 1 상보적 도메인"은 이하에서 설명하는 제 2 상보적 도메인에 대해 상보적 뉴클레오타이드 서열을 포함하는 도메인으로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 1 상보적 도메인은 제 2 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.

상기 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드 서열, 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로서, 상기 제 1 상보적 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

iii) 연결 도메인

"연결 도메인"은 두 개 이상의 도메인을 연결하는 뉴클레오타이드 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.

상기 연결 도메인은 1 내지 30개의 뉴클레오타이드 서열일 수 있다.

일 예로서, 상기 연결 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로서, 상기 연결 도메인은 1 내지 30개의 뉴클레오타이드 서열, 5 내지 30개의 뉴클레오타이드 서열, 10 내지 30개의 뉴클레오타이드 서열, 15 내지 30개의 뉴클레오타이드 서열, 20 내지 30개의 뉴클레오타이드 서열 또는 25 내지 30개의 뉴클레오타이드 서열일 수 있다.

iv) 제 2 상보적 도메인

"제 2 상보적 도메인"은 전술한 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 뉴클레오타이드 서열을 포함하는 도메인으로, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 2 상보적 도메인은 제 1 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.

제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 뉴클레오타이드 서열 및 제 1 상보적 도메인과의 상보성이 없는 뉴클레오타이드 서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 뉴클레오타이드 서열을 포함할 수 있으며, 제 1 상보적 도메인보다 뉴클레오타이드 서열의 길이가 길 수 있다.

상기 제 2 상보적 도메인은 5 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 제 2 상보적 도메인은 1 내지 35개의 뉴클레오타이드 서열, 5 내지 35개의 뉴클레오타이드 서열, 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35 뉴클레오타이드 서열일 수 있다.

다른 일 예로, 상기 제 2 상보적 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

v) 근위 도메인(proximal domain)

"근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 뉴클레오타이드 서열이다.

근위 도메인은 근위 도메인 내의 상보적인 뉴클레오타이드 서열을 포함할 수 있으며, 상보적인 뉴클레오타이드 서열에 의해 이중가닥을 형성할 수 있다.

상기 근위 도메인은 1 내지 20개의 뉴클레오타이드 서열일 수 있다.

일 예로서, 상기 근위 도메인은 1 내지 20개의 뉴클레오타이드 서열, 5 내지 20개의 뉴클레오타이드 서열, 10 내지 20개의 뉴클레오타이드 서열 또는 15 내지 20개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로서, 상기 근위 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열 또는 15 내지 20개의 뉴클레오타이드 서열일 수 있다.

vi) 꼬리 도메인

"꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 뉴클레오타이드 서열이다.

꼬리 도메인은 꼬리 도메인 내의 상보적인 뉴클레오타이드 서열을 포함할 수 있으며, 상보적인 뉴클레오타이드 서열에 의해 이중가닥을 형성할 수 있다.

상기 꼬리 도메인은 1 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 꼬리 도메인은 5 내지 50개의 뉴클레오타이드 서열, 10 내지 50개의 뉴클레오타이드 서열, 15 내지 50개의 뉴클레오타이드 서열, 20 내지 50개의 뉴클레오타이드 서열, 25 내지 50개의 뉴클레오타이드 서열, 30 내지 50개의 뉴클레오타이드 서열, 35 내지 50개의 뉴클레오타이드 서열, 40 내지 50개의 뉴클레오타이드 서열 또는 45 내지 50개의 뉴클레오타이드 서열일 수 있다.

다른 일 예로, 상기 꼬리 도메인은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열, 30 내지 35개의 뉴클레오타이드 서열, 35 내지 40개의 뉴클레오타이드 서열, 40 내지 45개의 뉴클레오타이드 서열 또는 45 내지 50개의 뉴클레오타이드 서열일 수 있다.

한편, 상기 도메인들, 즉, 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인이 포함하는 핵산 서열의 일부 또는 전부는 선택적 또는 추가적으로 화학적 변형을 포함할 수 있다.

상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.

가이드핵산은 하나 이상의 도메인을 포함한다.

상기 가이드핵산은 가이드 도메인을 포함할 수 있다.

상기 가이드핵산은 제 1 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 연결 도메인을 포함할 수 있다.

상기 가이드핵산은 제 2 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 근위 도메인을 포함할 수 있다.

상기 가이드핵산은 꼬리 도메인을 포함할 수 있다.

이때, 상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상일 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 1 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 연결 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 2 상보적 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 근위 도메인을 포함할 수 있다.

상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 꼬리 도메인을 포함할 수 있다.

이때, 상기 가이드핵산은 하나의 도메인이 중복되어 포함될 수 있다.

상기 가이드핵산은 여러 도메인을 중복 또는 중복시키지 않고 포함할 수 있다.

상기 가이드핵산은 같은 종류의 도메인을 포함할 수 있으며, 이때, 같은 종류의 도메인은 동일한 핵산서열을 가지거나 또는 서로 다른 핵산서열을 가질 수 있다.

상기 가이드핵산은 두 종류의 도메인을 포함할 수 있으며, 이때, 다른 두 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 세 종류의 도메인을 포함할 수 있으며, 이때, 다른 세 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 네 종류의 도메인을 포함할 수 있으며, 이때, 다른 네 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 다섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 다섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

상기 가이드핵산은 여섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 여섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.

예를 들면, 가이드핵산은 [가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[연결 도메인]-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]으로 구성될 수 있으며, 이때, 두 개의 가이드 도메인은 서로 다른 또는 동일한 표적을 위한 가이드 서열을 포함할 수 있으며, 상기 두 개의 제 1 상보적 도메인과 두 개의 제 2 상보적 도메인 동일한 핵산서열을 가지거나 다른 핵산서열을 가질 수 있다. 가이드 도메인이 서로 다른 표적을 위한 가이드 서열을 포함하는 경우, 상기 가이드핵산은 두 개의 표적에 특이적으로 결합할 수 있으며, 이때, 특이적 결합을 동시에 일어나거나 순차적으로 일어날 수 있다. 또한, 상기 연결 도메인은 특정 효소에 의해 절단될 수 있으며, 특정 효소의 존재 하에서 상기 가이드핵산은 두 부분 또는 세 부분으로 나누어질 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예로서, 가이드핵산은 gRNA일 수 있다.

gRNA

“gRNA”는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적 표적화할 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.

상기 gRNA는 다수의 도메인을 포함할 수 있다. 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.

gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.

일 구체예에서, 단일가닥 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 연결 도메인; 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인; 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함할 수 있다.

다른 일 구체예로서, 이중 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인 및 제 1 상보적 도메인을 포함하는 제 1가닥; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인, 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함하는 제 2 가닥을 포함할 수 있다.

이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다. 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.

또 다른 일 구체예로서, 단일가닥 gRNA는 3'으로부터 5' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인을 포함할 수 있다.

이때, 상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)_n을 포함, 즉, 5'-GUUUUAGAGCUA(X)_n-3'(SEQ ID NO: 1), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)_n을 포함, 즉, 5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)_n-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU(X)_n-3'(SEQ ID NO: 3), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-UUUGUAGAU-3'(SEQ ID NO: 4) 일 수 있고, 또는 5'-UUUGUAGAU-3'(SEQ ID NO: 4)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)_n을 포함, 즉, 5'-(X)_nUUUGUAGAU-3'(SEQ ID NO: 4), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 5의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 역할을 하는 뉴클레오타이드 서열일 수 있다.

상기 연결 도메인은 제 1 상보적 도메인 및 제 2 상보적 도메인과 각각 공유결합 또는 비공유결합을 할 수 있다.

상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.

상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다.

상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.

이때, 상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)_n또는/및 (X)_m을 포함, 즉, 5'-(X)_n UAGCAAGUUAAAAU(X)_m-3'(SEQ ID NO: 5), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드 서열의 개수로, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)_m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.

또 다른 예를 들어, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)_n또는/및 (X)_m을 포함, 즉, 5'-(X)_n AAGAAAUUUAAAAAGGGACUAAAAU(X)_m-3'(SEQ ID NO: 6) 또는 5'-(X)_n AAGGGACUAAAAU(X)_m-3'(SEQ ID NO: 7), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)_m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 상기 제 2 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAAUUUCUACU-3'(SEQ ID NO: 8) 일 수 있고, 또는 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드 서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)_n또는/및 (X)_m을 포함, 즉, 5'-(X)_nAAAUUUCUACU (X)_m-3'(SEQ ID NO: 8), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드 서열의 개수로, 상기 n은 1 내지 10의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다. 또한 (X)_m은 동일한 뉴클레오타이드 서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상보적 결합을 할 수 있다.

상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상기 상보적 결합을 통해 이중가닥을 형성할 수 있다.

상기 형성된 이중가닥은 CRISPR 효소와 상호작용할 수 있다.

선택적으로, 상기 제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 하지않는 추가 뉴클레오타이드 서열을 포함할 수 있다.

이때, 상기 추가 뉴클레오타이드 서열은 1 내지 15개의 뉴클레오타이드 서열일 수 있다. 예를 들어, 상기 추가 뉴클레오타이드 서열은 1 내지 5개의 뉴클레오타이드 서열, 5 내지 10개의 뉴클레오타이드 서열, 또는 10 내지 15개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 근위 도메인은 제 2 상보적 도메인의 3' 방향에 위치하는 도메인일 수 있다.

상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)_n을 포함, 즉, 5'-AAGGCUAGUCCG(X)_n-3'(SEQ ID NO: 9), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

또 다른 예를 들어, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)_n을 포함, 즉, 5'-AAAGAGUUUGC(X)_n-3'(SEQ ID NO: 10), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 40의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 꼬리 도메인은 단일가닥 gRNA 또는 이중 gRNA의 제 1 가닥 또는 제 2 가닥의 3' 말단에 선택적으로 추가될 수 있다.

상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 뉴클레오타이드 서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.

일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.

예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)_n을 포함, 즉, 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)_n-3'(SEQ ID NO: 11), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

또 다른 예를 들어, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)_n을 포함, 즉, 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)_n-3'(SEQ ID NO: 12), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드 서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)_n은 동일한 뉴클레오타이드 서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예에서, 상기 꼬리 도메인은 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.

예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드 서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.

gRNA는 상기에 기재된 바와 같이 다수의 도메인을 포함할 수 있어, gRNA가 포함하는 도메인의 종류 및 개수에 따라 핵산 서열의 길이를 조절할 수 있으며, 각각의 도메인에 의해 3차원 형태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.

이중 gRNA

이중 gRNA는 제 1 가닥 및 제 2 가닥으로 구성된다.

이때, 상기 제 1 가닥은

5'-[가이드 도메인]-[제 1 상보적 도메인]-3'으로 구성될 수 있고,

상기 제 2 가닥은

5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는

5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.

이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다.

이때, 상기 제 1가닥 및 제 2가닥은 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.

일 구체예로서, 상기 제 1 가닥은

5'-(N_target)-(Q)_m-3'; 또는

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-3'일 수 있다.

이때, 상기 N_target은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열로서, 상기 N_target은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드 서열 부위이다.

이때, 상기 (Q)_m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)_m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (X)_a, (X)_b 및 (X)_c는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.

일 구체예로서, 상기 제 2 가닥은

5'-(Z)_h-(P)_k-3'; 또는

5'-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-3' 일 수 있다.

다른 일 구체예로서, 상기 제 2 가닥은

5'-(Z)_h-(P)_k-(F)_i-3'; 또는

5'-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-(F)_i-3' 일 수 있다.

이때, 상기 (Z)_h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)_h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 (P)_k는 근위 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 뉴클레오타이드 서열의 개수로, 1 내지 20의 정수일 수 있다.

예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)_k는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)_k는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)_k는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

상기 (F)_i는 꼬리 도메인을 포함하는 뉴클레오타이드 서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 뉴클레오타이드 서열의 개수로, 1 내지 50의 정수일 수 있다.

예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)_i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)_i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)_i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (F)_i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드 서열을 포함할 수 있다.

또한, 상기 (X)_d, (X)_e 및 (X)_f는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 d, e 및 f는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.

단일가닥 gRNA

단일가닥 gRNA는 제 1 단일가닥 gRNA 및 제 2 단일가닥 gRNA로 나뉠 수 있다.

제 1 단일가닥 gRNA

제 1 단일가닥 gRNA는 상기 이중 gRNA의 제 1 가닥과 제 2 가닥을 연결 도메인으로 연결한 단일가닥 gRNA이다.

구체적으로, 상기 단일가닥 gRNA는

5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-3',

5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는

5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.

상기 제 1 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.

일 구체예로서, 상기 제 1 단일가닥 gRNA는

5'-(N_target)-(Q)_m-(L)_j-(Z)_h-3';

5'-(N_target)-(Q)_m-(L)_j-(Z)_h-(P)_k-3'; 또는

5'-(N_target)-(Q)_m-(L)_j-(Z)_h-(P)_k-(F)_i-3'일 수 있다.

다른 일 구체예로서, 상기 단일가닥 gRNA는

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-(L)_j-(X)_d-(Z)_h-(X)_e-3';

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-(L)_j-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-3'; 또는

5'-(X)_a-(N_target)-(X)_b-(Q)_m-(X)_c-(L)_j-(X)_d-(Z)_h-(X)_e-(P)_k-(X)_f-(F)_i-3'일 수 있다.

상기 (Q)_m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Q)_m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드 서열의 개수로, 5 내지 35의 정수일 수 있다.

다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3) 일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (L)_j는 연결 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 뉴클레오타이드 서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드 서열의 개수로, 1 내지 30의 정수일 수 있다.

상기 (Z)_h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드 서열을 포함한다. 상기 (Z)_h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드 서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드 서열의 개수로, 5 내지 50의 정수일 수 있다.

또한, 상기 (X)_a, (X)_b, (X)_c, (X)_d, (X)_e 및 (X)_f는 선택적으로 추가할 수 있는 뉴클레오타이드 서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b, c, d, e 및 f는 뉴클레오타이드 서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.

제 2 단일가닥 gRNA

제 2 단일가닥 gRNA는 가이드 도메인, 제 1 상보적 도메인 및 제 2 상보적 도메인으로 구성되는 단일가닥 gRNA일 수 있다.

이때, 상기 제 2 단일가닥 gRNA는

5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'; 또는

5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.

상기 제 2 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드 서열을 포함할 수 있다.

일 구체예로서, 상기 제 2 단일가닥 gRNA는

5'-(Z)_h-(Q)_m-(N_target)-3'; 또는

5'-(X)_a-(Z)_h-(X)_b-(Q)_m-(X)_c-(N_target)-3'일 수 있다.

다른 일 구체예로서, 상기 단일가닥 gRNA는

5'-(Z)_h-(L)_j-(Q)_m-(N_target)-3'; 또는

5'-(X)_a-(Z)_h-(L)_j-(Q)_m-(X)_c-(N_target)-3'일 수 있다.

예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)_m은 5'-UUUGUAGAU-3'(SEQ ID NO: 4)일 수 있고, 또는 5'-UUUGUAGAU-3'(SEQ ID NO: 4)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)_h은 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)일 수 있고, 또는 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드 서열일 수 있다.

또한, 상기 (L)_j는 연결 도메인을 포함하는 뉴클레오타이드 서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 뉴클레오타이드 서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드 서열의 개수로, 1 내지 30의 정수일 수 있다.

본 명세서에 의해 개시되는 내용의 일 태양으로서, 가이드핵산은 면역 참여 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.

“면역 참여 유전자(immune participation gene)”는 면역 기능조절(immune function regulation)에 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 유전자를 의미한다.

상기 면역 참여 유전자는 선천 면역(innate immunity) 조절할 수 있다.

상기 면역 참여 유전자는 후천 면역(acquired immunity) 조절할 수 있다.

상기 면역 참여 유전자는 식세포(phagocyte)의 기능 조절할 수 있다.

상기 면역 참여 유전자는 사이토카인(cytokine)의 발현을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 사이토카인(cytokine)의 발현을 억제하거나 저해시킬 수 있다.

상기 면역 참여 유전자는 전염증성 사이토카인(proinflammatory cytokine)의 발현을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 전염증성 사이토카인(proinflammatory cytokine)의 발현을 억제하거나 저해시킬 수 있다.

상기 면역 참여 유전자는 염증성 사이토카인(inflammatory cytokine)의 발현을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 염증성 사이토카인(inflammatory cytokine)의 발현을 억제하거나 저해시킬 수 있다.

상기 면역 참여 유전자는 세포 내 및/또는 외의 Toll/interleukin-1 receptor(TIR) 도메인 간의 상호작용을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 세포 내 및/또는 외의 Toll/interleukin-1 receptor(TIR) 도메인 간의 상호작용을 억제하거나 저해할 수 있다.

상기 면역 참여 유전자는 Toll/interleukin-1 receptor(TIR) 도메인과 상호작용할 수 있다.

상기 면역 참여 유전자는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 폴리펩타이드 또는 단백질이거나 또는 이를 암호화하는 유전자 일 수 있다.

상기 면역 참여 유전자는 Toll receptor 또는 Toll like receptor에 의해 매개되는 세포 내 신호전달을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 Toll receptor 또는 Toll like receptor에 의해 매개되는 세포 내 신호전달을 억제시키거나 저해할 수 있다.

상기 면역 참여 유전자는 Toll receptor 또는 Toll like receptor와 상호작용할 수 있다.

상기 면역 참여 유전자는 interleukin-1 receptor에 의해 매개되는 세포 내 신호전달을 촉진시키거나 증가시킬 수 있다.

상기 면역 참여 유전자는 interleukin-1 receptor에 의해 매개되는 세포 내 신호전달을 억제시키거나 저해시킬 수 있다.

상기 면역 참여 유전자는 interleukin-1 receptor와 상호작용할 수 있다.

상기 면역 참여 유전자는 세포 내 및/또는 외의 Death 도메인 간의 상호작용을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 세포 내 및/또는 외의 Death 도메인 간의 상호작용을 억제하거나 저해할 수 있다.

상기 면역 참여 유전자는 Death 도메인과 상호작용할 수 있다.

상기 면역 참여 유전자는 Death 도메인을 포함하는 폴리펩타이드 또는 단백질이거나 또는 이를 암호화하는 유전자 일 수 있다.

상기 면역 참여 유전자는 IRAK(interleukin-1 receptor-associated kinase) family 중 하나 이상에 의해 매개되는 세포 내 신호전달을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 IRAK(interleukin-1 receptor-associated kinase) family 중 하나 이상에 의해 매개되는 세포 내 신호전달을 억제하거나 저해할 수 있다.

상기 면역 참여 유전자는 IRAK(interleukin-1 receptor-associated kinase) family 중 하나 이상과 상호작용할 수 있다.

이때, 상기 IRAK(interleukin-1 receptor-associated kinase) family는 IRAK1, IRAK2, IRAK3 및 IRAK4로 구성된다.

상기 면역 참여 유전자는 Complement system 조절할 수 있다.

상기 면역 참여 유전자는 Complement system 중 classical pathway를 조절할 수 있다.

상기 면역 참여 유전자는 Complement system 중 lectin pathway를 조절할 수 있다.

상기 면역 참여 유전자는 Complement system 중 alternative pathway를 조절할 수 있다.

상기 면역 참여 유전자는 Complement system 매개 염증반응을 조절할 수 있다.

상기 면역 참여 유전자는 Complement system 매개 세포 용해(lysis)를 조절할 수 있다.

상기 면역 참여 유전자는 Complement system 매개 옵소닌작용(opsonization)을 조절할 수 있다.

상기 면역 참여 유전자는 Complement system을 조절하는 complement component 간의 상호작용을 촉진하거나 증가시킬 수 있다.

상기 면역 참여 유전자는 Complement system을 조절하는 complement component 간의 상호작용을 억제시키거나 저해시킬 수 있다.

상기 면역 참여 유전자는 항체 생성에 관한 기능 조절할 수 있다.

구현예에서,

본 명세서에 의해 개시되는 면역 참여 유전자는 Death 도메인 및/또는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 폴리펩타이드 또는 단백질을 암호화하는 유전자일 수 있다.

Death 도메인은 주로 apoptosis와 inflammation을 조절하는 단백질에서 발견되는 단백질 모티프(motif) 중 하나로, death 도메인을 포함하는 단백질로는 TNF receptor, ankyrin, MyD88, IRAK family 등이 있다.

Toll/interleukin-1 receptor(TIR) 도메인은 세포 내 신호전달 도메인으로, MyD88, interleukin-1 receptor, Toll receptor, Toll like receptor 및 plant R 단백질에서 주로 발견되며, TIR 도메인을 포함하는 단백질로는 IL18R1, IL18RAP, IL1R1, IL1RAP, IL1RAPL1, IL1RAPL2, IL1RL1, IL1RL2, MYD88, SIGIRR, TLR1, TLR10, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9 등이 있다.

상기 면역 참여 유전자는 MYD88 유전자일 수 있다.

MYD88(Myeloid differentiation primary response 88) 유전자는 296개의 아미노산으로 구성되며 Death 도메인 및 Toll/interleukin-1 receptor(TIR) 도메인을 가지는 단백질로서 MYD88D로도 칭해지는 단백질을 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, MYD88 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 MYD88 (e.g., NCBI Accession No. NP_001166037, NP_001166038, NP_001166039, NP_001166040, NP_002459 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001172566, NM_001172567, NM_001172568, NM_001172569, NM_002468 등으로 표현되는 MYD88 유전자.

상기 면역 참여 인자는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.

유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.

구현예에서,

본 명세서에 의해 개시되는 면역 참여 유전자는 Complement component 단백질을 암호화하는 유전자일 수 있다.

Complement component는 Complement system을 조절하는 단백질로서, C1, C2, C3, C4, C5, C6, C7, C8, C9 등이 있다.

상기 면역 참여 유전자는 C3 유전자일 수 있다.

C3(Complement component 3) 유전자는 1663개의 아미노산으로 구성된 단백질로서 complement C3, C3a, C3b, ASP, AHUS5, ARMD9, CPAMD1 또는 HEL-S-62p로도 칭해지는 단백질을 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, C3 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 C3 (e.g., NCBI Accession No. NP_000055 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000064 등으로 표현되는 C3 유전자.

구현예에서,

본 명세서에 의해 개시되는 면역 참여 유전자는 Death 도메인 및/또는 Toll/interleukin-1 receptor(TIR) 도메인을 포함하는 폴리펩타이드 또는 단백질을 암호화하는 유전자이거나 및/또는 Complement component 단백질을 암호화하는 유전자일 수 있다.

상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.

본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 MYD88 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.

본 명세서에 의해 개시되는 내용의 다른 구현예에서, 가이드핵산은 C3 유전자의 표적 서열에 상보적으로 결합하는 gRNA일 수 있다.

“표적 서열”은 표적 유전자 또는 핵산 내에 존재하는 뉴클레오타이드 서열로, 구체적으로는 표적 유전자 또는 핵산 내에 표적 영역의 일부 뉴클레오타이드 서열이며, 이때 “표적 영역”은 표적 유전자 또는 핵산 내에 가이드핵산-에디터단백질에 의해 변형될 수 있는 부위이다.

본 명세서에 의해 개시되는 표적 유전자는 면역 참여 유전자일 수 있다.

본 명세서에 의해 개시되는 표적 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.

이하에서, 표적 서열이라 함은 두 가지의 뉴클레오타이드 서열 정보 모두를 의미하는 용어로 사용될 수 있다. 예를 들어, 표적 유전자의 경우, 표적 서열은 표적 유전자 DNA의 transcribed strand의 서열 정보를 의미하는 것일 수도 있고, 또는 non-transcribed strand의 뉴클레오타이드 서열 정보를 의미하는 것일 수도 있다.

예를 들어, 표적 서열은 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드 서열(transcribed strand)인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)을 의미할 수도 있으며, 이에 상보적인 뉴클레오타이드 서열(non-transcribed strand)인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 의미할 수도 있다.

표적 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서 상기 표적 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.

표적 서열은 가이드핵산 결합 서열 혹은 가이드핵산 비결합 서열을 포함한다.

“가이드핵산 결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 표적 서열 및 가이드핵산 결합 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드 서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.

“가이드핵산 비결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상동성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 없다. 또한, 가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산 결합 서열과 상보적인 결합을 할 수 있다.

가이드핵산 결합 서열은 표적 서열 중 일부 뉴클레오타이드 서열로, 표적 서열의 두 가지 서로 다른 서열순서를 가지는 뉴클레오타이드 서열, 즉, 서로 상보적인 결합을 할 수 있는 두 가지의 뉴클레오타이드 서열 중 한 가지 뉴클레오타이드 서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.

예를 들면, 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드 서열인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)과 이에 상보적인 뉴클레오타이드 서열인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 표적 서열로 할 때, 가이드핵산 결합 서열은 두 개의 표적 서열 중 하나, 즉, 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17) 또는 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있다. 이때, 가이드핵산 비결합 서열은, 가이드핵산 결합 서열이 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)인 경우, 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있고, 또는 가이드핵산 결합 서열이 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)인 경우 가이드핵산 비결합 서열은 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)일 수 있다.

가이드핵산 결합 서열은 표적 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열, 즉, transcribed strand와 동일한 뉴클레오타이드 서열 및 non-transcribed strand와 동일한 뉴클레오타이드 서열 중 선택된 하나의 뉴클레오타이드 서열을 제외한 나머지 뉴클레오타이드 서열일 수 있다.

가이드핵산 결합 서열은 표적 서열의 길이와 동일할 수 있다.

가이드핵산 비결합 서열은 표적 서열 또는 가이드핵산 결합 서열의 길이와 동일할 수 있다.

가이드핵산 결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서 상기 가이드핵산 결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.

가이드핵산 비결합 서열은 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서 상기 가이드핵산 비결합 서열은 16개의 뉴클레오타이드 서열, 17개의 뉴클레오타이드 서열, 18개의 뉴클레오타이드 서열, 19개의 뉴클레오타이드 서열, 20개의 뉴클레오타이드 서열, 21개의 뉴클레오타이드 서열, 22개의 뉴클레오타이드 서열, 23개의 뉴클레오타이드 서열, 24개의 뉴클레오타이드 서열 또는 25개의 뉴클레오타이드 서열일 수 있다.

가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 상보적인 결합을 할 수 있으며, 상기 가이드핵산 결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.

상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.

가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 상동성을 가질 수 있으며, 상기 가이드핵산 비결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.

상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동성을 가진 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성이거나 또는 완전하게 상동성인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동적이 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.

가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보적 결합을 할 수 있으며, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열의 길이와 동일할 수 있다.

상기 가이드핵산 비결합 서열은 가이드핵산 결합서열에 상보적인 뉴클레오타이드 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 포함할 수 있다.

또한, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 위치한 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

또한, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열에 근접한 위치에 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드 서열일 수 있다.

구현예에서,

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드 서열, 15 내지 35개의 뉴클레오타이드 서열, 20 내지 35개의 뉴클레오타이드 서열, 25 내지 35개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열, 20 내지 25개의 뉴클레오타이드 서열, 25 내지 30개의 뉴클레오타이드 서열 또는 30 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 표적 서열은 MYD88 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

본 명세서에 의해 개시되는 표적 서열은 면역 참여 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.

“PAM(proto-spacer-adjacent Motif) 서열”은 에디터단백질이 인식할 수 있는 뉴클레오타이드 서열이다. 이때, PAM 서열은 에디터단백질의 종류 및 유래된 종에 따라 뉴클레오타이드 서열에 차이가 있을 수 있다.

이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).

NGG(N은 A, T, C 또는 G임);

NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);

NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);

NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);

NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및

TTN(N은 A, T, C 또는 G임).

일 예로, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 MYD88 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 예로, 상기 표적 서열은 C3 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 C3 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.

이하, 본 발명의 일 구체예에서 사용할 수 있는 표적 서열들의 일 예들을 표로 나타내며, 표에 기재된 표적 서열은 가이드핵산 비결합 서열로, 기재한 서열을 통해 상보적인 서열, 즉, 가이드핵산 결합 서열은 예측될 수 있다:

CjCas9을 위한 MYD88 유전자의 표적 서열(Target sequences of MYD88 gene for CjCas9)

Loci.(Exon)	Target(w/o PAM) (SEQ ID NO)	PAM
E01	GTTCAAGAACAGAGACAGGCGG (SEQ ID NO: 19)	CGCCGCAC
E01	GCCTGTCTCTGTTCTTGAACGT (SEQ ID NO: 20)	GCGGACAC
E01	GGTCCAGTCGGCCGCCACCTGT (SEQ ID NO: 21)	GTCCGCAC
E01	GCGCTGGCGGAGGAGATGGACT (SEQ ID NO: 22)	TTGAGTAC
E01	TGTGTCTCCAGTTGCCGGATCT (SEQ ID NO: 23)	CCAAGTAC
E01	AGTACTTGGAGATCCGGCAACT (SEQ ID NO: 24)	GGAGACAC
E01	ACCAATGCTGGGTCCCAGCTCC (SEQ ID NO: 25)	AGCAGCAC
E02	GCCTCCTCCTGCTGCTGCTTCA (SEQ ID NO: 26)	AGATATAC
E02	TGCCCGCCAGCTCTGCTGTCCG (SEQ ID NO: 27)	TGGGACAC
E02	GGACAGCAGAGCTGGCGGGCAT (SEQ ID NO: 28)	CACCACAC
E03	CTGTTCCAGTTGCCGGATCATC (SEQ ID NO: 29)	TCCTGCAC
E03	CCAGGCAGGACATCGCGGTCAG (SEQ ID NO: 30)	ACACACAC
E03	TGCCAGGCAGGACATCGCGGTC (SEQ ID NO: 31)	AGACACAC
E03	GGTGCCAGGCAGGACATCGCGG (SEQ ID NO: 32)	TCAGACAC
E03	TGTGTCTGACCGCGATGTCCTG (SEQ ID NO: 33)	CCTGGCAC
E03	CGATGAGCTCACTAGCAATAGA (SEQ ID NO: 34)	CCAGACAC
E04	TCAGAGACAACCACCACCATCC (SEQ ID NO: 35)	GGCGGCAC
E04	AGGAATGTGACTTCCAGACCAA (SEQ ID NO: 36)	ATTTGCAC
E05	TGATGGGGATCAGTCGCTTCTG (SEQ ID NO: 37)	ATGGGCAC
E05	CATCAGAAGCGACTGATCCCCA (SEQ ID NO: 38)	TCAAGTAC
E05	CTGGGGAACTCTTTCTTCATTG (SEQ ID NO: 39)	CCTTGTAC
E05	CCTGAGGTTCATCACTGTCTGC (SEQ ID NO: 40)	GACTACAC
E05	CACTGTCTGCGACTACACCAAC (SEQ ID NO: 41)	CCCTGCAC

CjCas9을 위한 C3 유전자의 표적 서열(Target sequences of C3 gene for CjCas9)

Loci.(Exon)	Target (w/o PAM) (SEQ ID NO)	PAM
E02	CGCAAGATGTTGGGGGTGATGA (SEQ ID NO: 42)	TAGAGTAC
E02	ATCCCCTTGCGCGTCGTGGGCC (SEQ ID NO: 43)	TCCAGCAC
E02	GGTCAGCACAGTCTTCTCACTG (SEQ ID NO: 44)	GACAGCAC
E02	GCCCATGTGGTTGGTGGCAGGG (SEQ ID NO: 45)	GTCAGCAC
E03	CACCACTTGGGTCCCGAAGGTG (SEQ ID NO: 46)	GCCTGCAC
E03	GAGGTACCCGCTCTGCAGGCTG (SEQ ID NO: 47)	ACCAGCAC
E03	GTGGTGCTGGTCAGCCTGCAGA (SEQ ID NO: 48)	GCGGGTAC
E03	ATGGTCTTGTCTGTCTGGATGA (SEQ ID NO: 49)	AGAGGTAC
E03	CTTCATCCAGACAGACAAGACC (SEQ ID NO: 50)	ATCTACAC
E06	TTCTCCACTGAGTTTGAGGTGA (SEQ ID NO: 51)	AGGAGTAC
E07	CTCCACTATGACCTCGAAACTG (SEQ ID NO: 52)	GGCAGCAC
E08	TGCCTGAATCCCTCAAGCGCAT (SEQ ID NO: 53)	TCCGGTAC
E09	CGGGGGAGGTTGTGCTGAGCCG (SEQ ID NO: 54)	GAAGGTAC
E09	CCCGTCCAGCAGTACCTTCCGG (SEQ ID NO: 55)	CTCAGCAC
E09	TCGGGGGTTCTGCACCCCGTCC (SEQ ID NO: 56)	AGCAGTAC
E09	CACCAGGTCTTCTGCTCGGGGG (SEQ ID NO: 57)	TTCTGCAC
E09	GCAGAAGACCTGGTGGGGAAGT (SEQ ID NO: 58)	CTTTGTAC
E09	GAGTGCAAGATGACGGTGGCAG (SEQ ID NO: 59)	ACACGTAC
E09	ACCTGAGTGCAAGATGACGGTG (SEQ ID NO: 60)	GCAGACAC
E09	TTGTACGTGTCTGCCACCGTCA (SEQ ID NO: 61)	TCTTGCAC
E10	GATGGGGATCCCGCTGCGCTCT (SEQ ID NO: 62)	GCCTGCAC
E10	CTCCCTACCAGATCCACTTCAC (SEQ ID NO: 63)	CAAGACAC
E10	CAGATCCACTTCACCAAGACAC (SEQ ID NO: 64)	CCAAGTAC
E10	AGGTCAAAGGGCATTCCTGGTT (SEQ ID NO: 65)	TGAAGTAC
E11	TGGAGAGCCATCAGGGTTCGTC (SEQ ID NO: 66)	ACGAACAC
E11	AGTCCCCGTGGCAGTCCAGGGC (SEQ ID NO: 67)	GAGGACAC
E11	CACGCCATCTCCCTGGGTTAGA (SEQ ID NO: 68)	GACTGCAC
E11	AGATGGCGTGGCCAAACTCAGC (SEQ ID NO: 69)	ATCAACAC
E11	ATGGCGTGGCCAAACTCAGCAT (SEQ ID NO: 70)	CAACACAC
E11	GGCGTGGCCAAACTCAGCATCA (SEQ ID NO: 71)	ACACACAC
E12	CTCCGAGAGCTCCTGCTTCTTC (SEQ ID NO: 72)	GTGCGCAC
E12	CAGGACCATGCAGGCTCTGCCC (SEQ ID NO: 73)	TACAGCAC
E12	CAATTACCTGCATCTCTCAGTG (SEQ ID NO: 74)	CTACGTAC
E12	CTCCCCGGGTCTGAGCTCTGTA (SEQ ID NO: 75)	CGTAGCAC
E12	TGAGGGTCTCCCCGGGTCTGAG (SEQ ID NO: 76)	CTCTGTAC
E12	CGCCCACGAGGCCAAGATCCGC (SEQ ID NO: 77)	TACTACAC
E13	GAAGTCGGTGGTGATGGACAGG (SEQ ID NO: 78)	GGCAGCAC
E13	TTCATCCCTTCCTTCCGCCTGG (SEQ ID NO: 79)	TGGCGTAC
E13	CCCTTCCTTCCGCCTGGTGGCG (SEQ ID NO: 80)	TACTACAC
E13	TGGCCGCTGGCACCGATCAGCG (SEQ ID NO: 81)	TGTAGTAC
E13	CGGCCACCACCTCCCTCTGGCC (SEQ ID NO: 82)	GCTGGCAC
E13	CACGCAGGAGTCCTTGACGTCC (SEQ ID NO: 83)	ACCCACAC
E14	GCGGCCAGTCAGAAGACCGGCA (SEQ ID NO: 84)	GCCTGTAC
E14	TATCTTCAGGGTCATCTGCTGC (SEQ ID NO: 85)	CCAGGTAC
E14	TAGAGGGTGACCACGGGGCCCG (SEQ ID NO: 86)	GGTGGTAC
E14	GAACACGCCCTTGTCCACGGCC (SEQ ID NO: 87)	ACCAGTAC
E14	CAGTTTGTTCTTCTTATTCAGC (SEQ ID NO: 88)	ACGAACAC
E14	CTGCGTCAGTTTGTTCTTCTTA (SEQ ID NO: 89)	TTCAGCAC
E15	CGTGGTGGAGAAGGCAGACATC (SEQ ID NO: 90)	GGCTGCAC
E15	TGAAGGTCAGCCCTGCGTCGGA (SEQ ID NO: 91)	GAAGACAC
E16	CGGCGTCGGCGGGCGGCTGGCT (SEQ ID NO: 92)	GCGGGCAC
E16	TTTGTCCATTCGCTTCTCCGTG (SEQ ID NO: 93)	AGCTGCAC
E17	GGAACACGTGCTCCCGCAGTCG (SEQ ID NO: 94)	GCAAGTAC
E17	TCGCAGCACTTGCGCAGCTCCT (SEQ ID NO: 95)	TGGGGTAC
E17	GGGTTCTCCCGCATGCCGTCCT (SEQ ID NO: 96)	CGCAGCAC
E17	AGGGAGATGAAACGGGTCCGGC (SEQ ID NO: 97)	GCTGGCAC
E17	TTGCAGCAGTCCAGGAAGACCT (SEQ ID NO: 98)	TCTTGCAC
E17	AACTACATCACAGAGCTGCGGC (SEQ ID NO: 99)	GGCAGCAC
E20	TTACTGTGACCTCGAAGGGGTC (SEQ ID NO: 100)	TGCCACAC
E21	CACTTCCTGCAGGCCGGTCTTT (SEQ ID NO: 101)	AGCGGCAC
E21	TCACCACGACCTTCAGGGACTT (SEQ ID NO: 102)	CCTGACAC
E22	CAGAATGAACAAAACTGTGGCT (SEQ ID NO: 103)	GTTCGCAC
E23	GTCTGCAGGTGGGATGTCCTCT (SEQ ID NO: 104)	TTCTGCAC
E23	TGCAGACCTCAGTGACCAAGTC (SEQ ID NO: 105)	CCGGACAC
E23	AGACCAGAATTCTCCTGCAAGG (SEQ ID NO: 106)	TGAGACAC
E24	GATGCCGTCGACGCGGAACGGC (SEQ ID NO: 107)	TGAAGCAC
E24	CCACTGCTCCGTTTCATCCAGG (SEQ ID NO: 108)	TAATGCAC
E25	GGTTGTCTGAAGGCCAGCTGCT (SEQ ID NO: 109)	GGGTGTAC
E25	CTGCCTTTGCGGCCTTCGTGAA (SEQ ID NO: 110)	ACGGGCAC
E25	TGCGGCCTTCGTGAAACGGGCA (SEQ ID NO: 111)	CCCAGCAC
E26	GGGTCTTCCAGGAGGATGCGCC (SEQ ID NO: 112)	CGTGATAC
E26	GTCTTCCAGGAGGATGCGCCCG (SEQ ID NO: 113)	TGATACAC
E28	CAACTACATGAACCTACAGAGA (SEQ ID NO: 114)	TCCTACAC
E29	TTCATTGAGCCAACGCACGACG (SEQ ID NO: 115)	GGAGGCAC
E29	GTCGTGCGTTGGCTCAATGAAC (SEQ ID NO: 116)	AGAGATAC
E29	GTAGTATCTCTGTTCATTGAGC (SEQ ID NO: 117)	CAACGCAC
E30	CTTTTGGTATTGAGCCAAGGCT (SEQ ID NO: 118)	TGGAACAC
E30	TTCATGGTGTTCCAAGCCTTGG (SEQ ID NO: 119)	CTCAATAC
E30	GCAGGAGGCTGGCAGATTCCCA (SEQ ID NO: 120)	GTGGATAC
E30	CTGCCAGCCTCCTGCGATCAGA (SEQ ID NO: 121)	AGAGGTAC
E31	AGTCACAGCTGAAGGAAAAGGC (SEQ ID NO: 122)	CAAGGCAC
E32	CTCCCATCTTACCAGGTGGTGA (SEQ ID NO: 123)	CAATGTAC
E32	GTGAGTTGATCTTTGGCCTTAG (SEQ ID NO: 124)	CATGGTAC
E32	TCGACCTCAAGGTCACCATAAA (SEQ ID NO: 125)	ACCAGCAC
E33	GGCATCCTGAGGCCTCTTTTCT (SEQ ID NO: 126)	AGAAACAC
E33	AGAAAAGAGGCCTCAGGATGCC (SEQ ID NO: 127)	AAGAACAC
E33	CAAGAACACTATGATCCTTGAG (SEQ ID NO: 128)	ATCTGTAC
E34	GACATAGTGGCATCCTGGTCTC (SEQ ID NO: 129)	CCCGGTAC
E34	ATCCATGATGACTGGCTTTGCT (SEQ ID NO: 130)	CCAGACAC
E35	CCCCAGCTGGCCAATGGTGTTG (SEQ ID NO: 131)	ACAGATAC
E35	GCTCATACTTGGAGATGTATCT (SEQ ID NO: 132)	GTCAACAC
E35	CTATCGGAGAAGGCTTTGTCCA (SEQ ID NO: 133)	GCTCATAC
E35	GCTGGACAAAGCCTTCTCCGAT (SEQ ID NO: 134)	AGGAACAC
E36	GACTGTCTAGCTTTCAAAGTTC (SEQ ID NO: 135)	ACCAATAC
E37	ATCACATCTGCCCGCAGAGGAA (SEQ ID NO: 136)	AGCTGTAC
E37	CCTCCTTTTCCGGATGGTAGAA (SEQ ID NO: 137)	CCGGGTAC
E37	CCAGGGAACTCACCCTCAGCAC (SEQ ID NO: 138)	AGCGGCAC
E38	CACCCCACCCTGCAGAGAATTG (SEQ ID NO: 139)	CTTCATAC
E39	CTGAACCTTGACCAGTCGGGTC (SEQ ID NO: 140)	TTGTACAC
E39	AGCTGAACCTTGACCAGTCGGG (SEQ ID NO: 141)	TCTTGTAC
E39	GTTCAGCTGTCCAATGACTTTG (SEQ ID NO: 142)	ACGAGTAC
E39	TTGATGGTCTGCTCAATGGCCA (SEQ ID NO: 143)	TGATGTAC
E40	GATGAACGTGCGCTGCTGTCCA (SEQ ID NO: 144)	ACCTGCAC
E40	TTCTCCTCCAGCTTCAGGGCTT (SEQ ID NO: 145)	CTCTGCAC
E40	GAAGCCCTGAAGCTGGAGGAGA (SEQ ID NO: 146)	AGAAACAC
E41	CAGCCTCAGCTACATCATCGGG (SEQ ID NO: 147)	AAGGACAC
E41	ATCATCGGGAAGGACACTTGGG (SEQ ID NO: 148)	TGGAGCAC
E41	GTTGTCTTTGGGTGCCCCAACT (SEQ ID NO: 149)	GACCACAC
E41	GGGGAATGGGGGTGTGGTCAGT (SEQ ID NO: 150)	TGGGGCAC

SpCas9을 위한 MYD88 유전자의 표적 서열(Target sequences of MYD88 gene for SpCas9)

Loci.(Exon)	Target (w/o PAM) (SEQ ID NO)	PAM
E01	TCCTGGAGCCTCAGCGCGGT (SEQ ID NO: 151)	CGG
E01	GGCTCCAGGACCGCCCGCCA (SEQ ID NO: 152)	TGG
E01	GCAGCCATGGCGGGCGGTCC (SEQ ID NO: 153)	TGG
E01	GGACCGCCCGCCATGGCTGC (SEQ ID NO: 154)	AGG
E01	GTTCTTGAACGTGCGGACAC (SEQ ID NO: 155)	AGG
E01	GGCGGCCGACTGGACCGCGC (SEQ ID NO: 156)	TGG
E01	CTCCGCCAGCGCGGTCCAGT (SEQ ID NO: 157)	CGG
E01	GTCCATCTCCTCCGCCAGCG (SEQ ID NO: 158)	CGG
E01	GGCCGACTGGACCGCGCTGG (SEQ ID NO: 159)	CGG
E01	CGACTGGACCGCGCTGGCGG (SEQ ID NO: 160)	AGG
E01	GTACTTGGAGATCCGGCAAC (SEQ ID NO: 161)	TGG
E01	CCGCTTGTGTCTCCAGTTGC (SEQ ID NO: 162)	CGG
E01	GAGACACAAGCGGACCCCAC (SEQ ID NO: 163)	TGG
E01	GGACGCCCTGGCGCCTCTGT (SEQ ID NO: 164)	AGG
E01	GTCGGCCTACAGAGGCGCCA (SEQ ID NO: 165)	GGG
E01	AGTCGGCCTACAGAGGCGCC (SEQ ID NO: 166)	AGG
E01	CTCGAGCAGTCGGCCTACAG (SEQ ID NO: 167)	AGG
E01	TGGTAAGCAGCTCGAGCAGT (SEQ ID NO: 168)	CGG
E01	GCTCGAGCTGCTTACCAAGC (SEQ ID NO: 169)	TGG
E01	CTCGAGCTGCTTACCAAGCT (SEQ ID NO: 170)	GGG
E01	CACGTCGTCGCGGCCCAGCT (SEQ ID NO: 171)	TGG
E01	GCTCCAGCAGCACGTCGTCG (SEQ ID NO: 172)	CGG
E01	CGACGACGTGCTGCTGGAGC (SEQ ID NO: 173)	TGG
E01	GGAGGCTGAGAAGCCTTTAC (SEQ ID NO: 174)	AGG
E02	TCTACAGCGGCCACCTGTAA (SEQ ID NO: 175)	AGG
E02	CACCACACTTGATGACCCCC (SEQ ID NO: 176)	TGG
E03	ATGAAGGCATCGAAACGCTC (SEQ ID NO: 177)	AGG
E03	GCACAAACTGGATGTCGCTG (SEQ ID NO: 178)	GGG
E03	TGCACAAACTGGATGTCGCT (SEQ ID NO: 179)	GGG
E03	GGATCATCTCCTGCACAAAC (SEQ ID NO: 180)	TGG
E03	GCAGGAGATGATCCGGCAAC (SEQ ID NO: 181)	TGG
E03	TCTGACCGCGATGTCCTGCC (SEQ ID NO: 182)	TGG
E04	TGATGATTACCTGCAGAGCA (SEQ ID NO: 183)	AGG
E05	GGGGATCAGTCGCTTCTGAT (SEQ ID NO: 184)	GGG
E05	TGGGGATCAGTCGCTTCTGA (SEQ ID NO: 185)	TGG
E05	CGCAGACAGTGATGAACCTC (SEQ ID NO: 186)	AGG
E05	CCAAGATTTGGTGCAGGGGT (SEQ ID NO: 187)	TGG
E05	GCGAGTCCAGAACCAAGATT (SEQ ID NO: 188)	TGG
E05	GTTCTGGACTCGCCTTGCCA (SEQ ID NO: 189)	AGG

SpCas9을 위한 C3 유전자의 표적 서열(Target sequences of C3 gene for SpCas9)

Loci.(Exon)	Target (w/o PAM) (SEQ ID NO)	PAM
E01	GCTACTAACCCACCTCCCCC (SEQ ID NO: 190)	TGG
E02	CACCCCCAACATCTTGCGGC (SEQ ID NO: 191)	TGG
E02	CTCCAGCCGCAAGATGTTGG (SEQ ID NO: 192)	GGG
E02	GAGCGAGGAGACCATGGTGC (SEQ ID NO: 193)	TGG
E02	CTGGAGGCCCACGACGCGCA (SEQ ID NO: 194)	AGG
E02	TGGAGGCCCACGACGCGCAA (SEQ ID NO: 195)	GGG
E02	GGAGGCCCACGACGCGCAAG (SEQ ID NO: 196)	GGG
E02	AACATCCCCTTGCGCGTCGT (SEQ ID NO: 197)	GGG
E02	GAACATCCCCTTGCGCGTCG (SEQ ID NO: 198)	TGG
E02	GTTTTTTGCCTGGGAAGTCG (SEQ ID NO: 199)	TGG
E02	ACAGCACTAGTTTTTTGCCT (SEQ ID NO: 200)	GGG
E02	GACAGCACTAGTTTTTTGCC (SEQ ID NO: 201)	TGG
E02	GGTCAGCACAGTCTTCTCAC (SEQ ID NO: 202)	TGG
E03	TTCTGACTTGAACTCCCTGT (SEQ ID NO: 203)	TGG
E03	CAACAAGTTCGTGACCGTGC (SEQ ID NO: 204)	AGG
E03	CACCACTTGGGTCCCGAAGG (SEQ ID NO: 205)	TGG
E03	CTCCACCACTTGGGTCCCGA (SEQ ID NO: 206)	AGG
E03	TGAAGAGGTACCCGCTCTGC (SEQ ID NO: 207)	AGG
E04	GGGTAGCAGCTTGTGGTTGA (SEQ ID NO: 208)	CGG
E04	AACCACAAGCTGCTACCCGT (SEQ ID NO: 209)	GGG
E04	GGCCCACGGGTAGCAGCTTG (SEQ ID NO: 210)	TGG
E04	ACAAGCTGCTACCCGTGGGC (SEQ ID NO: 211)	CGG
E04	GCTGCTACCCGTGGGCCGGA (SEQ ID NO: 212)	CGG
E04	ACCCGTGGGCCGGACGGTCA (SEQ ID NO: 213)	TGG
E04	ACCATGACCGTCCGGCCCAC (SEQ ID NO: 214)	GGG
E04	GACCATGACCGTCCGGCCCA (SEQ ID NO: 215)	CGG
E04	CAATGTTGACCATGACCGTC (SEQ ID NO: 216)	CGG
E05	TGCTTGACCGGGATGCCTTC (SEQ ID NO: 217)	CGG
E05	GGAAGGCATCCCGGTCAAGC (SEQ ID NO: 218)	AGG
E05	ACAAGGAGTCCTGCTTGACC (SEQ ID NO: 219)	GGG
E05	TGGCGTCTTGCCCTTGTCTT (SEQ ID NO: 220)	GGG
E07	GCCCAGTTTCGAGGTCATAG (SEQ ID NO: 221)	TGG
E07	CTCCACTATGACCTCGAAAC (SEQ ID NO: 222)	TGG
E07	ATGTAGTAGAATTTCTCTGT (SEQ ID NO: 223)	AGG
E07	CTACTACATCTATAACGAGA (SEQ ID NO: 224)	AGG
E07	CATCTATAACGAGAAGGGCC (SEQ ID NO: 225)	TGG
E07	CTATAACGAGAAGGGCCTGG (SEQ ID NO: 226)	AGG
E08	CTTTGTCATCTTCGGGATCC (SEQ ID NO: 227)	AGG
E08	GTCATCTTCGGGATCCAGGA (SEQ ID NO: 228)	TGG
E08	AAATCCTCTGTTCGCCATCC (SEQ ID NO: 229)	TGG
E08	GGAATGCGCTTGAGGGATTC (SEQ ID NO: 230)	AGG
E09	CGGGGGAGGTTGTGCTGAGC (SEQ ID NO: 231)	CGG
E09	AGCCGGAAGGTACTGCTGGA (SEQ ID NO: 232)	CGG
E09	GCCGGAAGGTACTGCTGGAC (SEQ ID NO: 233)	GGG
E09	CCGGAAGGTACTGCTGGACG (SEQ ID NO: 234)	GGG
E09	CCCCGTCCAGCAGTACCTTC (SEQ ID NO: 235)	CGG
E09	CCACCAGGTCTTCTGCTCGG (SEQ ID NO: 236)	GGG
E09	CCCACCAGGTCTTCTGCTCG (SEQ ID NO: 237)	GGG
E09	CGTACAAAGACTTCCCCACC (SEQ ID NO: 238)	AGG
E10	TGGTAGGGAGAGGTCACGAT (SEQ ID NO: 239)	GGG
E10	CTGGTAGGGAGAGGTCACGA (SEQ ID NO: 240)	TGG
E10	ATTCCTGGTTTGAAGTACTT (SEQ ID NO: 241)	GGG
E11	GTGTTCGTGACGAACCCTGA (SEQ ID NO: 242)	TGG
E11	GACTGCCACGGGGACTCGGT (SEQ ID NO: 243)	AGG
E11	TCCAGCCTACCGAGTCCCCG (SEQ ID NO: 244)	TGG
E11	CGAGTCCCCGTGGCAGTCCA (SEQ ID NO: 245)	GGG
E11	CCCCGTGGCAGTCCAGGGCG (SEQ ID NO: 246)	AGG
E11	TCTAACCCAGGGAGATGGCG (SEQ ID NO: 247)	TGG
E13	GAACAAGGGCAGGCTGTTGA (SEQ ID NO: 248)	AGG
E13	GCTGTTGAAGGCGGGACGCC (SEQ ID NO: 249)	AGG
E13	GGACGCCAGGTGCGAGAGCC (SEQ ID NO: 250)	CGG
E13	GGGGCAGCACCACCAGGTCC (SEQ ID NO: 251)	TGG
E13	AAGTCGGTGGTGATGGACAG (SEQ ID NO: 252)	GGG
E13	TACGCCACCAGGCGGAAGGA (SEQ ID NO: 253)	AGG
E13	GTAGTACGCCACCAGGCGGA (SEQ ID NO: 254)	AGG
E13	GCGTGTAGTACGCCACCAGG (SEQ ID NO: 255)	CGG
E13	TCAGCGTGTAGTACGCCACC (SEQ ID NO: 256)	AGG
E13	GTGGCGTACTACACGCTGAT (SEQ ID NO: 257)	CGG
E13	TACACGCTGATCGGTGCCAG (SEQ ID NO: 258)	CGG
E13	TGATCGGTGCCAGCGGCCAG (SEQ ID NO: 259)	AGG
E13	CGGTGCCAGCGGCCAGAGGG (SEQ ID NO: 260)	AGG
E13	GGTGGTGGCCGACTCCGTGT (SEQ ID NO: 261)	GGG
E13	GACGTCCACCCACACGGAGT (SEQ ID NO: 262)	CGG
E13	GGTGGCCGACTCCGTGTGGG (SEQ ID NO: 263)	TGG
E13	CTCCGTGTGGGTGGACGTCA (SEQ ID NO: 264)	AGG
E13	GACGTCAAGGACTCCTGCGT (SEQ ID NO: 265)	GGG
E14	CAGGCTGCCGGTCTTCTGAC (SEQ ID NO: 266)	TGG
E14	AAGACCGGCAGCCTGTACCT (SEQ ID NO: 267)	GGG
E14	TGAAGATAGAGGGTGACCAC (SEQ ID NO: 268)	GGG
E14	CCGGGTGGTACTGGTGGCCG (SEQ ID NO: 269)	TGG
E14	GGTACTGGTGGCCGTGGACA (SEQ ID NO: 270)	AGG
E14	GTACTGGTGGCCGTGGACAA (SEQ ID NO: 271)	GGG
E15	GGCAGACATCGGCTGCACCC (SEQ ID NO: 272)	CGG
E15	GTAATCCTTCCCACTGCCCG (SEQ ID NO: 273)	GGG
E15	GCGTAATCCTTCCCACTGCC (SEQ ID NO: 274)	CGG
E15	ATCGGCTGCACCCCGGGCAG (SEQ ID NO: 275)	TGG
E15	TCGGCTGCACCCCGGGCAGT (SEQ ID NO: 276)	GGG
E15	GGCAGTGGGAAGGATTACGC (SEQ ID NO: 277)	CGG
E15	GCCGGTGTCTTCTCCGACGC (SEQ ID NO: 278)	AGG
E15	CCGGTGTCTTCTCCGACGCA (SEQ ID NO: 279)	GGG
E15	CCCTGCGTCGGAGAAGACAC (SEQ ID NO: 280)	CGG
E15	CGTGAAGGTCAGCCCTGCGT (SEQ ID NO: 281)	CGG
E15	CTGGCCACTGCTGCTCGTGA (SEQ ID NO: 282)	AGG
E16	GAACGGCGTCGGCGGGCGGC (SEQ ID NO: 283)	TGG
E16	CACGGAACGGCGTCGGCGGG (SEQ ID NO: 284)	CGG
E16	CTGCACGGAACGGCGTCGGC (SEQ ID NO: 285)	GGG
E16	GCTGCACGGAACGGCGTCGG (SEQ ID NO: 286)	CGG
E16	TGAGCTGCACGGAACGGCGT (SEQ ID NO: 287)	CGG
E16	ACGCCGTTCCGTGCAGCTCA (SEQ ID NO: 288)	CGG
E16	TCTCCGTGAGCTGCACGGAA (SEQ ID NO: 289)	CGG
E16	TCGCTTCTCCGTGAGCTGCA (SEQ ID NO: 290)	CGG
E16	GCAGCTCACGGAGAAGCGAA (SEQ ID NO: 291)	TGG
E17	GGAGCTGCGCAAGTGCTGCG (SEQ ID NO: 292)	AGG
E17	CTGCGCAAGTGCTGCGAGGA (SEQ ID NO: 293)	CGG
E17	GTGCTGCGAGGACGGCATGC (SEQ ID NO: 294)	GGG
E17	GCATGCGGGAGAACCCCATG (SEQ ID NO: 295)	AGG
E17	GCGCTGGCACGAGAACCTCA (SEQ ID NO: 296)	TGG
E17	AGATGAAACGGGTCCGGCGC (SEQ ID NO: 297)	TGG
E17	CCAGGGAGATGAAACGGGTC (SEQ ID NO: 298)	CGG
E17	CTCGCCCAGGGAGATGAAAC (SEQ ID NO: 299)	GGG
E17	CTTCTTGCACGCCTCGCCCA (SEQ ID NO: 300)	GGG
E17	CCTGGGCGAGGCGTGCAAGA (SEQ ID NO: 301)	AGG
E17	CCTTCTTGCACGCCTCGCCC (SEQ ID NO: 302)	AGG
E17	GGCGTGCAAGAAGGTCTTCC (SEQ ID NO: 303)	TGG
E17	ACTACATCACAGAGCTGCGG (SEQ ID NO: 304)	CGG
E17	GCACGCGCGGGCCAGCCACC (SEQ ID NO: 305)	TGG
E17	CACGCGCGGGCCAGCCACCT (SEQ ID NO: 306)	GGG
E18	GAGCTGGCTGTGGAACGTTG (SEQ ID NO: 307)	AGG
E19	GAAAGACTCCATCACCACGT (SEQ ID NO: 308)	GGG
E19	CAGAATCTCCCACGTGGTGA (SEQ ID NO: 309)	TGG
E20	CTGTGTGGCAGACCCCTTCG (SEQ ID NO: 310)	AGG
E20	TGCATTACTGTGACCTCGAA (SEQ ID NO: 311)	GGG
E20	CTGCATTACTGTGACCTCGA (SEQ ID NO: 312)	AGG
E20	AGGACTTCTTCATCGACCTG (SEQ ID NO: 313)	CGG
E20	TCGTTTCGAACAACAGAGTA (SEQ ID NO: 314)	GGG
E20	CTCTGTTGTTCGAAACGAGC (SEQ ID NO: 315)	AGG
E20	TGTTGTTCGAAACGAGCAGG (SEQ ID NO: 316)	TGG
E20	GGTAATTGTAGAGAACGGCT (SEQ ID NO: 317)	CGG
E20	GAGCCGTTCTCTACAATTAC (SEQ ID NO: 318)	CGG
E20	CTGCCGGTAATTGTAGAGAA (SEQ ID NO: 319)	CGG
E21	GACGCCTCTTGGTGGTGGCC (SEQ ID NO: 320)	AGG
E21	CTGCTGGTGACGCCTCTTGG (SEQ ID NO: 321)	TGG
E21	GGTCTGCTGGTGACGCCTCT (SEQ ID NO: 322)	TGG
E21	GGGGGATGGTTACGGTCTGC (SEQ ID NO: 323)	TGG
E21	CAACGAGGACTTGGGGGGGA (SEQ ID NO: 324)	TGG
E21	GAACGGACAACGAGGACTTG (SEQ ID NO: 325)	GGG
E21	GGAACGGACAACGAGGACTT (SEQ ID NO: 326)	GGG
E21	TGGAACGGACAACGAGGACT (SEQ ID NO: 327)	TGG
E21	GACATATGGAACGGACAACG (SEQ ID NO: 328)	AGG
E21	CGGCACGATGACATATGGAA (SEQ ID NO: 329)	CGG
E21	TTTAGCGGCACGATGACATA (SEQ ID NO: 330)	TGG
E21	GTCATCGTGCCGCTAAAGAC (SEQ ID NO: 331)	CGG
E21	TCCTGCAGGCCGGTCTTTAG (SEQ ID NO: 332)	CGG
E21	GACTTCCACTTCCTGCAGGC (SEQ ID NO: 333)	CGG
E23	TGTCCGGGACTTGGTCACTG (SEQ ID NO: 334)	AGG
E23	CAGACTCGGTGTCCGGGACT (SEQ ID NO: 335)	TGG
E24	CGACGGCATCCTCTGTCATC (SEQ ID NO: 336)	TGG
E24	GACAGAGGATGCCGTCGACG (SEQ ID NO: 337)	CGG
E24	AGGATGCCGTCGACGCGGAA (SEQ ID NO: 338)	CGG
E24	CTTCAGCCGTTCCGCGTCGA (SEQ ID NO: 339)	CGG
E24	AGCCCGAGGGGGTCACAATG (SEQ ID NO: 340)	AGG
E24	TGTGACCCCCTCGGGCTGCG (SEQ ID NO: 341)	GGG
E24	CATGATCGGCATGACGCCCA (SEQ ID NO: 342)	CGG
E24	TAATGCACAGCGATGACCGT (SEQ ID NO: 343)	GGG
E24	GTAATGCACAGCGATGACCG (SEQ ID NO: 344)	TGG
E24	GGTCATCGCTGTGCATTACC (SEQ ID NO: 345)	TGG
E24	TGTGCATTACCTGGATGAAA (SEQ ID NO: 346)	CGG
E24	TTCGGCCTAGAGAAGCGGCA (SEQ ID NO: 347)	GGG
E24	AGGCCCCCTGCCGCTTCTCT (SEQ ID NO: 348)	AGG
E25	GTTGTCTGAAGGCCAGCTGC (SEQ ID NO: 349)	TGG
E25	CCTTTGCGGCCTTCGTGAAA (SEQ ID NO: 350)	CGG
E25	CCGTTTCACGAAGGCCGCAA (SEQ ID NO: 351)	AGG
E25	CTTTGCGGCCTTCGTGAAAC (SEQ ID NO: 352)	GGG
E25	GCTGGGTGCCCGTTTCACGA (SEQ ID NO: 353)	AGG
E26	GCTGACCGCCTACGTGGTCA (SEQ ID NO: 354)	AGG
E26	ATCGACTCCCAAGTCCTCTG (SEQ ID NO: 355)	CGG
E26	CGACTCCCAAGTCCTCTGCG (SEQ ID NO: 356)	GGG
E26	TCCTCTGCGGGGCTGTTAAA (SEQ ID NO: 357)	TGG
E26	GGAGAAGCAGAAGCCCGACG (SEQ ID NO: 358)	GGG
E26	ATCCTCCTGGAAGACCCCGT (SEQ ID NO: 359)	CGG
E26	GTATCACGGGCGCATCCTCC (SEQ ID NO: 360)	TGG
E26	ATCATTTCTTGGTGTATCAC (SEQ ID NO: 361)	GGG
E27	CGAGAAAGACATGGCCCTCA (SEQ ID NO: 362)	CGG
E28	CGAGAAAGACATGGCCCTCA (SEQ ID NO: 363)	CGG
E29	AAGAACCGCTGGGAGGACCC (SEQ ID NO: 364)	TGG
E29	CGTTGTAGAGCTGCTTACCA (SEQ ID NO: 365)	GGG
E29	ACGTTGTAGAGCTGCTTACC (SEQ ID NO: 366)	AGG
E29	TGGTAAGCAGCTCTACAACG (SEQ ID NO: 367)	TGG
E29	GGCCACATCCTATGCCCTCT (SEQ ID NO: 368)	TGG
E29	TAGCTGCAGTAGGGCCAAGA (SEQ ID NO: 369)	GGG
E29	TTAGCTGCAGTAGGGCCAAG (SEQ ID NO: 370)	AGG
E29	TTGTGCCTCCCGTCGTGCGT (SEQ ID NO: 371)	TGG
E29	TTGAGCCAACGCACGACGGG (SEQ ID NO: 372)	AGG
E29	TTCATTGAGCCAACGCACGA (SEQ ID NO: 373)	CGG
E29	AATGAACAGAGATACTACGG (SEQ ID NO: 374)	TGG
E29	GAACAGAGATACTACGGTGG (SEQ ID NO: 375)	TGG
E29	AGATACTACGGTGGTGGCTA (SEQ ID NO: 376)	TGG
E30	AGCCTTGGCTCAATACCAAA (SEQ ID NO: 377)	AGG
E30	GTCCTTTTGGTATTGAGCCA (SEQ ID NO: 378)	AGG
E30	AAAGGACGCCCCTGACCACC (SEQ ID NO: 379)	AGG
E30	CATCAAGGTTCAGTTCCTGG (SEQ ID NO: 380)	TGG
E30	GGTGATCTTGGAGCTGCGGC (SEQ ID NO: 381)	TGG
E30	AGATCACCCACCGTATCCAC (SEQ ID NO: 382)	TGG
E30	GATCACCCACCGTATCCACT (SEQ ID NO: 383)	GGG
E30	AGATTCCCAGTGGATACGGT (SEQ ID NO: 384)	GGG
E32	CTTGAGGTCGAATTTATTAC (SEQ ID NO: 385)	AGG
E32	TGTTTCCGGTGCTGGTTTTA (SEQ ID NO: 386)	TGG
E34	ATATAGACATAGTGGCATCC (SEQ ID NO: 387)	TGG
E34	GGATGCCACTATGTCTATAT (SEQ ID NO: 388)	TGG
E35	GATGTATCTGTCAACACCAT (SEQ ID NO: 389)	TGG
E35	GGCTTTGTCCAGCTCATACT (SEQ ID NO: 390)	TGG
E36	AATGTAGAGCTTATCCAGCC (SEQ ID NO: 391)	TGG
E36	TATCCAGCCTGGAGCAGTCA (SEQ ID NO: 392)	AGG
E36	AGACCTTGACTGCTCCAGGC (SEQ ID NO: 393)	TGG
E36	GCGTAGACCTTGACTGCTCC (SEQ ID NO: 394)	AGG
E36	GGTCTACGCCTATTACAACC (SEQ ID NO: 395)	TGG
E37	CTGTACCCGGTTCTACCATC (SEQ ID NO: 396)	CGG
E37	CTTTTCCGGATGGTAGAACC (SEQ ID NO: 397)	GGG
E38	CATACAAAAGTCGGATGACA (SEQ ID NO: 398)	AGG
E38	GTCGGATGACAAGGTCACCC (SEQ ID NO: 399)	TGG
E38	GGTCACCCTGGAAGAACGGC (SEQ ID NO: 400)	TGG
E39	GATGTACTCGTCAAAGTCAT (SEQ ID NO: 401)	TGG
E39	TGACTTTGACGAGTACATCA (SEQ ID NO: 402)	TGG
E39	TGACTTGATGGTCTGCTCAA (SEQ ID NO: 403)	TGG
E40	GAAGAAACACTACCTCATGT (SEQ ID NO: 404)	GGG
E40	AAGAAACACTACCTCATGTG (SEQ ID NO: 405)	GGG
E40	CGGAGGAGAGACCCCACATG (SEQ ID NO: 406)	AGG
E41	CCTCAGCTACATCATCGGGA (SEQ ID NO: 407)	AGG
E41	CATCATCGGGAAGGACACTT (SEQ ID NO: 408)	GGG
E41	TCTTGGCATTCGTCCTCCTC (SEQ ID NO: 409)	GGG
E41	CGAGGTCCTGGCATTGTTTC (SEQ ID NO: 410)	TGG
E41	CGGTGAAGGCGCCGAGGTCC (SEQ ID NO: 411)	TGG
E41	TGCTCTCGGTGAAGGCGCCG (SEQ ID NO: 412)	AGG
E41	CGGCGCCTTCACCGAGAGCA (SEQ ID NO: 413)	TGG
E41	GACAACCATGCTCTCGGTGA (SEQ ID NO: 414)	AGG
E41	ACCGAGAGCATGGTTGTCTT (SEQ ID NO: 415)	TGG
E41	CCGAGAGCATGGTTGTCTTT (SEQ ID NO: 416)	GGG

본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 MYD88 유전자의 표적 서열에 상보적으로 결합하는 가이드 서열을 포함하는 gRNA일 수 있다.

본 명세서에 의해 개시되는 내용의 다른 구현예에서, 가이드핵산은 C3 유전자의 표적 서열에 상보적으로 결합하는 가이드 서열을 포함하는 gRNA일 수 있다.

상기 가이드 서열은 표적 서열과 상보적인 결합을 형성할 수 있다.

상기 표적 서열은 가이드핵산 결합 서열일 수 있다.

상기 표적 서열 및 가이드핵산 결합 서열 관련 설명은 상기 기술한 바와 같다.

상기 가이드핵산 결합 서열은 가이드 서열의 길이와 동일할 수 있다.

상기 가이드핵산 결합 서열은 가이드 서열의 길이보다 짧은 서열일 수 있다.

상기 가이드핵산 결합 서열은 가이드 서열의 길이보다 긴 서열일 수 있다.

상기 가이드 서열은 가이드핵산 결합 서열과 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.

일 예로, 상기 가이드 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.

구현예에서,

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 예로, 상기 가이드 서열은 MYD88 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

본 명세서에 의해 개시되는 가이드 서열은 면역 참여 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

NGG(N은 A, T, C 또는 G임);

NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);

TTN(N은 A, T, C 또는 G임).

일 예로, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 MYD88 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 예로, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 C3 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.

이하, 본 발명의 일 구체예에서 사용할 수 있는 가이드 서열들의 일 예들을 표로 나타낸다. 표에 기재된 가이드 서열은 MYD88 유전자 또는 C3 유전자를 표적할 수 있는 가이드 서열로, MYD88 유전자 또는 C3 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다. 표 5 내지 표 8에 기재된 가이드 서열은 표 1 내지 표 4의 표적 서열을 각각 표적할 수 있는 가이드 서열이다.

CjCas9을 위한 MYD88 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting MYD88 gene for CjCas9)

Loci.(Exon)	Guide sequence	SEQ ID NO
E01	GUUCAAGAACAGAGACAGGCGG	SEQ ID NO: 417
E01	GCCUGUCUCUGUUCUUGAACGU	SEQ ID NO: 418
E01	GGUCCAGUCGGCCGCCACCUGU	SEQ ID NO: 419
E01	GCGCUGGCGGAGGAGAUGGACU	SEQ ID NO: 420
E01	UGUGUCUCCAGUUGCCGGAUCU	SEQ ID NO: 421
E01	AGUACUUGGAGAUCCGGCAACU	SEQ ID NO: 422
E01	ACCAAUGCUGGGUCCCAGCUCC	SEQ ID NO: 423
E02	GCCUCCUCCUGCUGCUGCUUCA	SEQ ID NO: 424
E02	UGCCCGCCAGCUCUGCUGUCCG	SEQ ID NO: 425
E02	GGACAGCAGAGCUGGCGGGCAU	SEQ ID NO: 426
E03	CUGUUCCAGUUGCCGGAUCAUC	SEQ ID NO: 427
E03	CCAGGCAGGACAUCGCGGUCAG	SEQ ID NO: 428
E03	UGCCAGGCAGGACAUCGCGGUC	SEQ ID NO: 429
E03	GGUGCCAGGCAGGACAUCGCGG	SEQ ID NO: 430
E03	UGUGUCUGACCGCGAUGUCCUG	SEQ ID NO: 431
E03	CGAUGAGCUCACUAGCAAUAGA	SEQ ID NO: 432
E04	UCAGAGACAACCACCACCAUCC	SEQ ID NO: 433
E04	AGGAAUGUGACUUCCAGACCAA	SEQ ID NO: 434
E05	UGAUGGGGAUCAGUCGCUUCUG	SEQ ID NO: 435
E05	CAUCAGAAGCGACUGAUCCCCA	SEQ ID NO: 436
E05	CUGGGGAACUCUUUCUUCAUUG	SEQ ID NO: 437
E05	CCUGAGGUUCAUCACUGUCUGC	SEQ ID NO: 438
E05	CACUGUCUGCGACUACACCAAC	SEQ ID NO: 439

CjCas9을 위한 C3 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting C3 gene for CjCas9)

Loci.(Exon)	Guide sequence	SEQ ID NO
E02	CGCAAGAUGUUGGGGGUGAUGA	SEQ ID NO: 440
E02	AUCCCCUUGCGCGUCGUGGGCC	SEQ ID NO: 441
E02	GGUCAGCACAGUCUUCUCACUG	SEQ ID NO: 442
E02	GCCCAUGUGGUUGGUGGCAGGG	SEQ ID NO: 443
E03	CACCACUUGGGUCCCGAAGGUG	SEQ ID NO: 444
E03	GAGGUACCCGCUCUGCAGGCUG	SEQ ID NO: 445
E03	GUGGUGCUGGUCAGCCUGCAGA	SEQ ID NO: 446
E03	AUGGUCUUGUCUGUCUGGAUGA	SEQ ID NO: 447
E03	CUUCAUCCAGACAGACAAGACC	SEQ ID NO: 448
E06	UUCUCCACUGAGUUUGAGGUGA	SEQ ID NO: 449
E07	CUCCACUAUGACCUCGAAACUG	SEQ ID NO: 450
E08	UGCCUGAAUCCCUCAAGCGCAU	SEQ ID NO: 451
E09	CGGGGGAGGUUGUGCUGAGCCG	SEQ ID NO: 452
E09	CCCGUCCAGCAGUACCUUCCGG	SEQ ID NO: 453
E09	UCGGGGGUUCUGCACCCCGUCC	SEQ ID NO: 454
E09	CACCAGGUCUUCUGCUCGGGGG	SEQ ID NO: 455
E09	GCAGAAGACCUGGUGGGGAAGU	SEQ ID NO: 456
E09	GAGUGCAAGAUGACGGUGGCAG	SEQ ID NO: 457
E09	ACCUGAGUGCAAGAUGACGGUG	SEQ ID NO: 458
E09	UUGUACGUGUCUGCCACCGUCA	SEQ ID NO: 459
E10	GAUGGGGAUCCCGCUGCGCUCU	SEQ ID NO: 460
E10	CUCCCUACCAGAUCCACUUCAC	SEQ ID NO: 461
E10	CAGAUCCACUUCACCAAGACAC	SEQ ID NO: 462
E10	AGGUCAAAGGGCAUUCCUGGUU	SEQ ID NO: 463
E11	UGGAGAGCCAUCAGGGUUCGUC	SEQ ID NO: 464
E11	AGUCCCCGUGGCAGUCCAGGGC	SEQ ID NO: 465
E11	CACGCCAUCUCCCUGGGUUAGA	SEQ ID NO: 466
E11	AGAUGGCGUGGCCAAACUCAGC	SEQ ID NO: 467
E11	AUGGCGUGGCCAAACUCAGCAU	SEQ ID NO: 468
E11	GGCGUGGCCAAACUCAGCAUCA	SEQ ID NO: 469
E12	CUCCGAGAGCUCCUGCUUCUUC	SEQ ID NO: 470
E12	CAGGACCAUGCAGGCUCUGCCC	SEQ ID NO: 471
E12	CAAUUACCUGCAUCUCUCAGUG	SEQ ID NO: 472
E12	CUCCCCGGGUCUGAGCUCUGUA	SEQ ID NO: 473
E12	UGAGGGUCUCCCCGGGUCUGAG	SEQ ID NO: 474
E12	CGCCCACGAGGCCAAGAUCCGC	SEQ ID NO: 475
E13	GAAGUCGGUGGUGAUGGACAGG	SEQ ID NO: 476
E13	UUCAUCCCUUCCUUCCGCCUGG	SEQ ID NO: 477
E13	CCCUUCCUUCCGCCUGGUGGCG	SEQ ID NO: 478
E13	UGGCCGCUGGCACCGAUCAGCG	SEQ ID NO: 479
E13	CGGCCACCACCUCCCUCUGGCC	SEQ ID NO: 480
E13	CACGCAGGAGUCCUUGACGUCC	SEQ ID NO: 481
E14	GCGGCCAGUCAGAAGACCGGCA	SEQ ID NO: 482
E14	UAUCUUCAGGGUCAUCUGCUGC	SEQ ID NO: 483
E14	UAGAGGGUGACCACGGGGCCCG	SEQ ID NO: 484
E14	GAACACGCCCUUGUCCACGGCC	SEQ ID NO: 485
E14	CAGUUUGUUCUUCUUAUUCAGC	SEQ ID NO: 486
E14	CUGCGUCAGUUUGUUCUUCUUA	SEQ ID NO: 487
E15	CGUGGUGGAGAAGGCAGACAUC	SEQ ID NO: 488
E15	UGAAGGUCAGCCCUGCGUCGGA	SEQ ID NO: 489
E16	CGGCGUCGGCGGGCGGCUGGCU	SEQ ID NO: 490
E16	UUUGUCCAUUCGCUUCUCCGUG	SEQ ID NO: 491
E17	GGAACACGUGCUCCCGCAGUCG	SEQ ID NO: 492
E17	UCGCAGCACUUGCGCAGCUCCU	SEQ ID NO: 493
E17	GGGUUCUCCCGCAUGCCGUCCU	SEQ ID NO: 494
E17	AGGGAGAUGAAACGGGUCCGGC	SEQ ID NO: 495
E17	UUGCAGCAGUCCAGGAAGACCU	SEQ ID NO: 496
E17	AACUACAUCACAGAGCUGCGGC	SEQ ID NO: 497
E20	UUACUGUGACCUCGAAGGGGUC	SEQ ID NO: 498
E21	CACUUCCUGCAGGCCGGUCUUU	SEQ ID NO: 499
E21	UCACCACGACCUUCAGGGACUU	SEQ ID NO: 500
E22	CAGAAUGAACAAAACUGUGGCU	SEQ ID NO: 501
E23	GUCUGCAGGUGGGAUGUCCUCU	SEQ ID NO: 502
E23	UGCAGACCUCAGUGACCAAGUC	SEQ ID NO: 503
E23	AGACCAGAAUUCUCCUGCAAGG	SEQ ID NO: 504
E24	GAUGCCGUCGACGCGGAACGGC	SEQ ID NO: 505
E24	CCACUGCUCCGUUUCAUCCAGG	SEQ ID NO: 506
E25	GGUUGUCUGAAGGCCAGCUGCU	SEQ ID NO: 507
E25	CUGCCUUUGCGGCCUUCGUGAA	SEQ ID NO: 508
E25	UGCGGCCUUCGUGAAACGGGCA	SEQ ID NO: 509
E26	GGGUCUUCCAGGAGGAUGCGCC	SEQ ID NO: 510
E26	GUCUUCCAGGAGGAUGCGCCCG	SEQ ID NO: 511
E28	CAACUACAUGAACCUACAGAGA	SEQ ID NO: 512
E29	UUCAUUGAGCCAACGCACGACG	SEQ ID NO: 513
E29	GUCGUGCGUUGGCUCAAUGAAC	SEQ ID NO: 514
E29	GUAGUAUCUCUGUUCAUUGAGC	SEQ ID NO: 515
E30	CUUUUGGUAUUGAGCCAAGGCU	SEQ ID NO: 516
E30	UUCAUGGUGUUCCAAGCCUUGG	SEQ ID NO: 517
E30	GCAGGAGGCUGGCAGAUUCCCA	SEQ ID NO: 518
E30	CUGCCAGCCUCCUGCGAUCAGA	SEQ ID NO: 519
E31	AGUCACAGCUGAAGGAAAAGGC	SEQ ID NO: 520
E32	CUCCCAUCUUACCAGGUGGUGA	SEQ ID NO: 521
E32	GUGAGUUGAUCUUUGGCCUUAG	SEQ ID NO: 522
E32	UCGACCUCAAGGUCACCAUAAA	SEQ ID NO: 523
E33	GGCAUCCUGAGGCCUCUUUUCU	SEQ ID NO: 524
E33	AGAAAAGAGGCCUCAGGAUGCC	SEQ ID NO: 525
E33	CAAGAACACUAUGAUCCUUGAG	SEQ ID NO: 526
E34	GACAUAGUGGCAUCCUGGUCUC	SEQ ID NO: 527
E34	AUCCAUGAUGACUGGCUUUGCU	SEQ ID NO: 528
E35	CCCCAGCUGGCCAAUGGUGUUG	SEQ ID NO: 529
E35	GCUCAUACUUGGAGAUGUAUCU	SEQ ID NO: 530
E35	CUAUCGGAGAAGGCUUUGUCCA	SEQ ID NO: 531
E35	GCUGGACAAAGCCUUCUCCGAU	SEQ ID NO: 532
E36	GACUGUCUAGCUUUCAAAGUUC	SEQ ID NO: 533
E37	AUCACAUCUGCCCGCAGAGGAA	SEQ ID NO: 534
E37	CCUCCUUUUCCGGAUGGUAGAA	SEQ ID NO: 535
E37	CCAGGGAACUCACCCUCAGCAC	SEQ ID NO: 536
E38	CACCCCACCCUGCAGAGAAUUG	SEQ ID NO: 537
E39	CUGAACCUUGACCAGUCGGGUC	SEQ ID NO: 538
E39	AGCUGAACCUUGACCAGUCGGG	SEQ ID NO: 539
E39	GUUCAGCUGUCCAAUGACUUUG	SEQ ID NO: 540
E39	UUGAUGGUCUGCUCAAUGGCCA	SEQ ID NO: 541
E40	GAUGAACGUGCGCUGCUGUCCA	SEQ ID NO: 542
E40	UUCUCCUCCAGCUUCAGGGCUU	SEQ ID NO: 543
E40	GAAGCCCUGAAGCUGGAGGAGA	SEQ ID NO: 544
E41	CAGCCUCAGCUACAUCAUCGGG	SEQ ID NO: 545
E41	AUCAUCGGGAAGGACACUUGGG	SEQ ID NO: 546
E41	GUUGUCUUUGGGUGCCCCAACU	SEQ ID NO: 547
E41	GGGGAAUGGGGGUGUGGUCAGU	SEQ ID NO: 548

SpCas9을 위한 MYD88 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting MYD88 gene for SpCas9)

Loci.(Exon)	Guide sequence	SEQ ID NO
E01	UCCUGGAGCCUCAGCGCGGU	SEQ ID NO: 549
E01	GGCUCCAGGACCGCCCGCCA	SEQ ID NO: 550
E01	GCAGCCAUGGCGGGCGGUCC	SEQ ID NO: 551
E01	GGACCGCCCGCCAUGGCUGC	SEQ ID NO: 552
E01	GUUCUUGAACGUGCGGACAC	SEQ ID NO: 553
E01	GGCGGCCGACUGGACCGCGC	SEQ ID NO: 554
E01	CUCCGCCAGCGCGGUCCAGU	SEQ ID NO: 555
E01	GUCCAUCUCCUCCGCCAGCG	SEQ ID NO: 556
E01	GGCCGACUGGACCGCGCUGG	SEQ ID NO: 557
E01	CGACUGGACCGCGCUGGCGG	SEQ ID NO: 558
E01	GUACUUGGAGAUCCGGCAAC	SEQ ID NO: 559
E01	CCGCUUGUGUCUCCAGUUGC	SEQ ID NO: 560
E01	GAGACACAAGCGGACCCCAC	SEQ ID NO: 561
E01	GGACGCCCUGGCGCCUCUGU	SEQ ID NO: 562
E01	GUCGGCCUACAGAGGCGCCA	SEQ ID NO: 563
E01	AGUCGGCCUACAGAGGCGCC	SEQ ID NO: 564
E01	CUCGAGCAGUCGGCCUACAG	SEQ ID NO: 565
E01	UGGUAAGCAGCUCGAGCAGU	SEQ ID NO: 566
E01	GCUCGAGCUGCUUACCAAGC	SEQ ID NO: 567
E01	CUCGAGCUGCUUACCAAGCU	SEQ ID NO: 568
E01	CACGUCGUCGCGGCCCAGCU	SEQ ID NO: 569
E01	GCUCCAGCAGCACGUCGUCG	SEQ ID NO: 570
E01	CGACGACGUGCUGCUGGAGC	SEQ ID NO: 571
E01	GGAGGCUGAGAAGCCUUUAC	SEQ ID NO: 572
E02	UCUACAGCGGCCACCUGUAA	SEQ ID NO: 573
E02	CACCACACUUGAUGACCCCC	SEQ ID NO: 574
E03	AUGAAGGCAUCGAAACGCUC	SEQ ID NO: 575
E03	GCACAAACUGGAUGUCGCUG	SEQ ID NO: 576
E03	UGCACAAACUGGAUGUCGCU	SEQ ID NO: 577
E03	GGAUCAUCUCCUGCACAAAC	SEQ ID NO: 578
E03	GCAGGAGAUGAUCCGGCAAC	SEQ ID NO: 579
E03	UCUGACCGCGAUGUCCUGCC	SEQ ID NO: 580
E04	UGAUGAUUACCUGCAGAGCA	SEQ ID NO: 581
E05	GGGGAUCAGUCGCUUCUGAU	SEQ ID NO: 582
E05	UGGGGAUCAGUCGCUUCUGA	SEQ ID NO: 583
E05	CGCAGACAGUGAUGAACCUC	SEQ ID NO: 584
E05	CCAAGAUUUGGUGCAGGGGU	SEQ ID NO: 585
E05	GCGAGUCCAGAACCAAGAUU	SEQ ID NO: 586
E05	GUUCUGGACUCGCCUUGCCA	SEQ ID NO: 587

SpCas9을 위한 C3 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting C3 gene for SpCas9)

Loci.(Exon)	Guide sequence	SEQ ID NO
E01	GCUACUAACCCACCUCCCCC	SEQ ID NO: 588
E02	CACCCCCAACAUCUUGCGGC	SEQ ID NO: 589
E02	CUCCAGCCGCAAGAUGUUGG	SEQ ID NO: 590
E02	GAGCGAGGAGACCAUGGUGC	SEQ ID NO: 591
E02	CUGGAGGCCCACGACGCGCA	SEQ ID NO: 592
E02	UGGAGGCCCACGACGCGCAA	SEQ ID NO: 593
E02	GGAGGCCCACGACGCGCAAG	SEQ ID NO: 594
E02	AACAUCCCCUUGCGCGUCGU	SEQ ID NO: 595
E02	GAACAUCCCCUUGCGCGUCG	SEQ ID NO: 596
E02	GUUUUUUGCCUGGGAAGUCG	SEQ ID NO: 597
E02	ACAGCACUAGUUUUUUGCCU	SEQ ID NO: 598
E02	GACAGCACUAGUUUUUUGCC	SEQ ID NO: 599
E02	GGUCAGCACAGUCUUCUCAC	SEQ ID NO: 600
E03	UUCUGACUUGAACUCCCUGU	SEQ ID NO: 601
E03	CAACAAGUUCGUGACCGUGC	SEQ ID NO: 602
E03	CACCACUUGGGUCCCGAAGG	SEQ ID NO: 603
E03	CUCCACCACUUGGGUCCCGA	SEQ ID NO: 604
E03	UGAAGAGGUACCCGCUCUGC	SEQ ID NO: 605
E04	GGGUAGCAGCUUGUGGUUGA	SEQ ID NO: 606
E04	AACCACAAGCUGCUACCCGU	SEQ ID NO: 607
E04	GGCCCACGGGUAGCAGCUUG	SEQ ID NO: 608
E04	ACAAGCUGCUACCCGUGGGC	SEQ ID NO: 609
E04	GCUGCUACCCGUGGGCCGGA	SEQ ID NO: 610
E04	ACCCGUGGGCCGGACGGUCA	SEQ ID NO: 611
E04	ACCAUGACCGUCCGGCCCAC	SEQ ID NO: 612
E04	GACCAUGACCGUCCGGCCCA	SEQ ID NO: 613
E04	CAAUGUUGACCAUGACCGUC	SEQ ID NO: 614
E05	UGCUUGACCGGGAUGCCUUC	SEQ ID NO: 615
E05	GGAAGGCAUCCCGGUCAAGC	SEQ ID NO: 616
E05	ACAAGGAGUCCUGCUUGACC	SEQ ID NO: 617
E05	UGGCGUCUUGCCCUUGUCUU	SEQ ID NO: 618
E07	GCCCAGUUUCGAGGUCAUAG	SEQ ID NO: 619
E07	CUCCACUAUGACCUCGAAAC	SEQ ID NO: 620
E07	AUGUAGUAGAAUUUCUCUGU	SEQ ID NO: 621
E07	CUACUACAUCUAUAACGAGA	SEQ ID NO: 622
E07	CAUCUAUAACGAGAAGGGCC	SEQ ID NO: 623
E07	CUAUAACGAGAAGGGCCUGG	SEQ ID NO: 624
E08	CUUUGUCAUCUUCGGGAUCC	SEQ ID NO: 625
E08	GUCAUCUUCGGGAUCCAGGA	SEQ ID NO: 626
E08	AAAUCCUCUGUUCGCCAUCC	SEQ ID NO: 627
E08	GGAAUGCGCUUGAGGGAUUC	SEQ ID NO: 628
E09	CGGGGGAGGUUGUGCUGAGC	SEQ ID NO: 629
E09	AGCCGGAAGGUACUGCUGGA	SEQ ID NO: 630
E09	GCCGGAAGGUACUGCUGGAC	SEQ ID NO: 631
E09	CCGGAAGGUACUGCUGGACG	SEQ ID NO: 632
E09	CCCCGUCCAGCAGUACCUUC	SEQ ID NO: 633
E09	CCACCAGGUCUUCUGCUCGG	SEQ ID NO: 634
E09	CCCACCAGGUCUUCUGCUCG	SEQ ID NO: 635
E09	CGUACAAAGACUUCCCCACC	SEQ ID NO: 636
E10	UGGUAGGGAGAGGUCACGAU	SEQ ID NO: 637
E10	CUGGUAGGGAGAGGUCACGA	SEQ ID NO: 638
E10	AUUCCUGGUUUGAAGUACUU	SEQ ID NO: 639
E11	GUGUUCGUGACGAACCCUGA	SEQ ID NO: 640
E11	GACUGCCACGGGGACUCGGU	SEQ ID NO: 641
E11	UCCAGCCUACCGAGUCCCCG	SEQ ID NO: 642
E11	CGAGUCCCCGUGGCAGUCCA	SEQ ID NO: 643
E11	CCCCGUGGCAGUCCAGGGCG	SEQ ID NO: 644
E11	UCUAACCCAGGGAGAUGGCG	SEQ ID NO: 645
E13	GAACAAGGGCAGGCUGUUGA	SEQ ID NO: 646
E13	GCUGUUGAAGGCGGGACGCC	SEQ ID NO: 647
E13	GGACGCCAGGUGCGAGAGCC	SEQ ID NO: 648
E13	GGGGCAGCACCACCAGGUCC	SEQ ID NO: 649
E13	AAGUCGGUGGUGAUGGACAG	SEQ ID NO: 650
E13	UACGCCACCAGGCGGAAGGA	SEQ ID NO: 651
E13	GUAGUACGCCACCAGGCGGA	SEQ ID NO: 652
E13	GCGUGUAGUACGCCACCAGG	SEQ ID NO: 653
E13	UCAGCGUGUAGUACGCCACC	SEQ ID NO: 654
E13	GUGGCGUACUACACGCUGAU	SEQ ID NO: 655
E13	UACACGCUGAUCGGUGCCAG	SEQ ID NO: 656
E13	UGAUCGGUGCCAGCGGCCAG	SEQ ID NO: 657
E13	CGGUGCCAGCGGCCAGAGGG	SEQ ID NO: 658
E13	GGUGGUGGCCGACUCCGUGU	SEQ ID NO: 659
E13	GACGUCCACCCACACGGAGU	SEQ ID NO: 660
E13	GGUGGCCGACUCCGUGUGGG	SEQ ID NO: 661
E13	CUCCGUGUGGGUGGACGUCA	SEQ ID NO: 662
E13	GACGUCAAGGACUCCUGCGU	SEQ ID NO: 663
E14	CAGGCUGCCGGUCUUCUGAC	SEQ ID NO: 664
E14	AAGACCGGCAGCCUGUACCU	SEQ ID NO: 665
E14	UGAAGAUAGAGGGUGACCAC	SEQ ID NO: 666
E14	CCGGGUGGUACUGGUGGCCG	SEQ ID NO: 667
E14	GGUACUGGUGGCCGUGGACA	SEQ ID NO: 668
E14	GUACUGGUGGCCGUGGACAA	SEQ ID NO: 669
E15	GGCAGACAUCGGCUGCACCC	SEQ ID NO: 670
E15	GUAAUCCUUCCCACUGCCCG	SEQ ID NO: 671
E15	GCGUAAUCCUUCCCACUGCC	SEQ ID NO: 672
E15	AUCGGCUGCACCCCGGGCAG	SEQ ID NO: 673
E15	UCGGCUGCACCCCGGGCAGU	SEQ ID NO: 674
E15	GGCAGUGGGAAGGAUUACGC	SEQ ID NO: 675
E15	GCCGGUGUCUUCUCCGACGC	SEQ ID NO: 676
E15	CCGGUGUCUUCUCCGACGCA	SEQ ID NO: 677
E15	CCCUGCGUCGGAGAAGACAC	SEQ ID NO: 678
E15	CGUGAAGGUCAGCCCUGCGU	SEQ ID NO: 679
E15	CUGGCCACUGCUGCUCGUGA	SEQ ID NO: 680
E16	GAACGGCGUCGGCGGGCGGC	SEQ ID NO: 681
E16	CACGGAACGGCGUCGGCGGG	SEQ ID NO: 682
E16	CUGCACGGAACGGCGUCGGC	SEQ ID NO: 683
E16	GCUGCACGGAACGGCGUCGG	SEQ ID NO: 684
E16	UGAGCUGCACGGAACGGCGU	SEQ ID NO: 685
E16	ACGCCGUUCCGUGCAGCUCA	SEQ ID NO: 686
E16	UCUCCGUGAGCUGCACGGAA	SEQ ID NO: 687
E16	UCGCUUCUCCGUGAGCUGCA	SEQ ID NO: 688
E16	GCAGCUCACGGAGAAGCGAA	SEQ ID NO: 689
E17	GGAGCUGCGCAAGUGCUGCG	SEQ ID NO: 690
E17	CUGCGCAAGUGCUGCGAGGA	SEQ ID NO: 691
E17	GUGCUGCGAGGACGGCAUGC	SEQ ID NO: 692
E17	GCAUGCGGGAGAACCCCAUG	SEQ ID NO: 693
E17	GCGCUGGCACGAGAACCUCA	SEQ ID NO: 694
E17	AGAUGAAACGGGUCCGGCGC	SEQ ID NO: 695
E17	CCAGGGAGAUGAAACGGGUC	SEQ ID NO: 696
E17	CUCGCCCAGGGAGAUGAAAC	SEQ ID NO: 697
E17	CUUCUUGCACGCCUCGCCCA	SEQ ID NO: 698
E17	CCUGGGCGAGGCGUGCAAGA	SEQ ID NO: 699
E17	CCUUCUUGCACGCCUCGCCC	SEQ ID NO: 700
E17	GGCGUGCAAGAAGGUCUUCC	SEQ ID NO: 701
E17	ACUACAUCACAGAGCUGCGG	SEQ ID NO: 702
E17	GCACGCGCGGGCCAGCCACC	SEQ ID NO: 703
E17	CACGCGCGGGCCAGCCACCU	SEQ ID NO: 704
E18	GAGCUGGCUGUGGAACGUUG	SEQ ID NO: 705
E19	GAAAGACUCCAUCACCACGU	SEQ ID NO: 706
E19	CAGAAUCUCCCACGUGGUGA	SEQ ID NO: 707
E20	CUGUGUGGCAGACCCCUUCG	SEQ ID NO: 708
E20	UGCAUUACUGUGACCUCGAA	SEQ ID NO: 709
E20	CUGCAUUACUGUGACCUCGA	SEQ ID NO: 710
E20	AGGACUUCUUCAUCGACCUG	SEQ ID NO: 711
E20	UCGUUUCGAACAACAGAGUA	SEQ ID NO: 712
E20	CUCUGUUGUUCGAAACGAGC	SEQ ID NO: 713
E20	UGUUGUUCGAAACGAGCAGG	SEQ ID NO: 714
E20	GGUAAUUGUAGAGAACGGCU	SEQ ID NO: 715
E20	GAGCCGUUCUCUACAAUUAC	SEQ ID NO: 716
E20	CUGCCGGUAAUUGUAGAGAA	SEQ ID NO: 717
E21	GACGCCUCUUGGUGGUGGCC	SEQ ID NO: 718
E21	CUGCUGGUGACGCCUCUUGG	SEQ ID NO: 719
E21	GGUCUGCUGGUGACGCCUCU	SEQ ID NO: 720
E21	GGGGGAUGGUUACGGUCUGC	SEQ ID NO: 721
E21	CAACGAGGACUUGGGGGGGA	SEQ ID NO: 722
E21	GAACGGACAACGAGGACUUG	SEQ ID NO: 723
E21	GGAACGGACAACGAGGACUU	SEQ ID NO: 724
E21	UGGAACGGACAACGAGGACU	SEQ ID NO: 725
E21	GACAUAUGGAACGGACAACG	SEQ ID NO: 726
E21	CGGCACGAUGACAUAUGGAA	SEQ ID NO: 727
E21	UUUAGCGGCACGAUGACAUA	SEQ ID NO: 728
E21	GUCAUCGUGCCGCUAAAGAC	SEQ ID NO: 729
E21	UCCUGCAGGCCGGUCUUUAG	SEQ ID NO: 730
E21	GACUUCCACUUCCUGCAGGC	SEQ ID NO: 731
E23	UGUCCGGGACUUGGUCACUG	SEQ ID NO: 732
E23	CAGACUCGGUGUCCGGGACU	SEQ ID NO: 733
E24	CGACGGCAUCCUCUGUCAUC	SEQ ID NO: 734
E24	GACAGAGGAUGCCGUCGACG	SEQ ID NO: 735
E24	AGGAUGCCGUCGACGCGGAA	SEQ ID NO: 736
E24	CUUCAGCCGUUCCGCGUCGA	SEQ ID NO: 737
E24	AGCCCGAGGGGGUCACAAUG	SEQ ID NO: 738
E24	UGUGACCCCCUCGGGCUGCG	SEQ ID NO: 739
E24	CAUGAUCGGCAUGACGCCCA	SEQ ID NO: 740
E24	UAAUGCACAGCGAUGACCGU	SEQ ID NO: 741
E24	GUAAUGCACAGCGAUGACCG	SEQ ID NO: 742
E24	GGUCAUCGCUGUGCAUUACC	SEQ ID NO: 743
E24	UGUGCAUUACCUGGAUGAAA	SEQ ID NO: 744
E24	UUCGGCCUAGAGAAGCGGCA	SEQ ID NO: 745
E24	AGGCCCCCUGCCGCUUCUCU	SEQ ID NO: 746
E25	GUUGUCUGAAGGCCAGCUGC	SEQ ID NO: 747
E25	CCUUUGCGGCCUUCGUGAAA	SEQ ID NO: 748
E25	CCGUUUCACGAAGGCCGCAA	SEQ ID NO: 749
E25	CUUUGCGGCCUUCGUGAAAC	SEQ ID NO: 750
E25	GCUGGGUGCCCGUUUCACGA	SEQ ID NO: 751
E26	GCUGACCGCCUACGUGGUCA	SEQ ID NO: 752
E26	AUCGACUCCCAAGUCCUCUG	SEQ ID NO: 753
E26	CGACUCCCAAGUCCUCUGCG	SEQ ID NO: 754
E26	UCCUCUGCGGGGCUGUUAAA	SEQ ID NO: 755
E26	GGAGAAGCAGAAGCCCGACG	SEQ ID NO: 756
E26	AUCCUCCUGGAAGACCCCGU	SEQ ID NO: 757
E26	GUAUCACGGGCGCAUCCUCC	SEQ ID NO: 758
E26	AUCAUUUCUUGGUGUAUCAC	SEQ ID NO: 759
E27	CGAGAAAGACAUGGCCCUCA	SEQ ID NO: 760
E28	CGAGAAAGACAUGGCCCUCA	SEQ ID NO: 761
E29	AAGAACCGCUGGGAGGACCC	SEQ ID NO: 762
E29	CGUUGUAGAGCUGCUUACCA	SEQ ID NO: 763
E29	ACGUUGUAGAGCUGCUUACC	SEQ ID NO: 764
E29	UGGUAAGCAGCUCUACAACG	SEQ ID NO: 765
E29	GGCCACAUCCUAUGCCCUCU	SEQ ID NO: 766
E29	UAGCUGCAGUAGGGCCAAGA	SEQ ID NO: 767
E29	UUAGCUGCAGUAGGGCCAAG	SEQ ID NO: 768
E29	UUGUGCCUCCCGUCGUGCGU	SEQ ID NO: 769
E29	UUGAGCCAACGCACGACGGG	SEQ ID NO: 770
E29	UUCAUUGAGCCAACGCACGA	SEQ ID NO: 771
E29	AAUGAACAGAGAUACUACGG	SEQ ID NO: 772
E29	GAACAGAGAUACUACGGUGG	SEQ ID NO: 773
E29	AGAUACUACGGUGGUGGCUA	SEQ ID NO: 774
E30	AGCCUUGGCUCAAUACCAAA	SEQ ID NO: 775
E30	GUCCUUUUGGUAUUGAGCCA	SEQ ID NO: 776
E30	AAAGGACGCCCCUGACCACC	SEQ ID NO: 777
E30	CAUCAAGGUUCAGUUCCUGG	SEQ ID NO: 778
E30	GGUGAUCUUGGAGCUGCGGC	SEQ ID NO: 779
E30	AGAUCACCCACCGUAUCCAC	SEQ ID NO: 780
E30	GAUCACCCACCGUAUCCACU	SEQ ID NO: 781
E30	AGAUUCCCAGUGGAUACGGU	SEQ ID NO: 782
E32	CUUGAGGUCGAAUUUAUUAC	SEQ ID NO: 783
E32	UGUUUCCGGUGCUGGUUUUA	SEQ ID NO: 784
E34	AUAUAGACAUAGUGGCAUCC	SEQ ID NO: 785
E34	GGAUGCCACUAUGUCUAUAU	SEQ ID NO: 786
E35	GAUGUAUCUGUCAACACCAU	SEQ ID NO: 787
E35	GGCUUUGUCCAGCUCAUACU	SEQ ID NO: 788
E36	AAUGUAGAGCUUAUCCAGCC	SEQ ID NO: 789
E36	UAUCCAGCCUGGAGCAGUCA	SEQ ID NO: 790
E36	AGACCUUGACUGCUCCAGGC	SEQ ID NO: 791
E36	GCGUAGACCUUGACUGCUCC	SEQ ID NO: 792
E36	GGUCUACGCCUAUUACAACC	SEQ ID NO: 793
E37	CUGUACCCGGUUCUACCAUC	SEQ ID NO: 794
E37	CUUUUCCGGAUGGUAGAACC	SEQ ID NO: 795
E38	CAUACAAAAGUCGGAUGACA	SEQ ID NO: 796
E38	GUCGGAUGACAAGGUCACCC	SEQ ID NO: 797
E38	GGUCACCCUGGAAGAACGGC	SEQ ID NO: 798
E39	GAUGUACUCGUCAAAGUCAU	SEQ ID NO: 799
E39	UGACUUUGACGAGUACAUCA	SEQ ID NO: 800
E39	UGACUUGAUGGUCUGCUCAA	SEQ ID NO: 801
E40	GAAGAAACACUACCUCAUGU	SEQ ID NO: 802
E40	AAGAAACACUACCUCAUGUG	SEQ ID NO: 803
E40	CGGAGGAGAGACCCCACAUG	SEQ ID NO: 804
E41	CCUCAGCUACAUCAUCGGGA	SEQ ID NO: 805
E41	CAUCAUCGGGAAGGACACUU	SEQ ID NO: 806
E41	UCUUGGCAUUCGUCCUCCUC	SEQ ID NO: 807
E41	CGAGGUCCUGGCAUUGUUUC	SEQ ID NO: 808
E41	CGGUGAAGGCGCCGAGGUCC	SEQ ID NO: 809
E41	UGCUCUCGGUGAAGGCGCCG	SEQ ID NO: 810
E41	CGGCGCCUUCACCGAGAGCA	SEQ ID NO: 811
E41	GACAACCAUGCUCUCGGUGA	SEQ ID NO: 812
E41	ACCGAGAGCAUGGUUGUCUU	SEQ ID NO: 813
E41	CCGAGAGCAUGGUUGUCUUU	SEQ ID NO: 814

본 명세서에 의해 개시되는 내용의 일 태양은 면역 참여 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다.

상기 유전자 조작용 조성물은 인위적으로 조작된 면역 참여 유전자의 생성에 이용될 수 있다. 또한, 상기 유전자 조작용 조성물에 의해 인위적으로 조작된 면역 참여 유전자는 인위적인 면역 기능조절을 유도할 수 있다.

“인위적으로 조작된(artificially modified or engineered or artificially engineered)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다. 이하에서, 비자연적인 인위적으로 조작된 또는 변형된 면역 참여 유전자는 인위적인 면역 참여 유전자라는 용어와 혼용하여 사용할 수 있다.

"인위적인 면역 기능조절"은 대상체(세포, 조직, 기관, 개체)의 면역 기능이 비정상적인 상태에 놓여 있는 경우, 그 비정상적인 면역 기능이 정상적인 상태로 돌아갈 수 있도록 하고 또는 그 정상적인 상태를 지속하여 유지할 수 있도록 하는 것을 의미한다.

유전자 조작은 유전자 발현 조절 과정을 고려하여 이루어질 수 있다.

구현예에서, 전사조절, RNA 가공 조절, RNA 수송 조절, RNA 분해 조절, 번역 조절 또는 단백질 변형 조절 단계에서 각 단계에 적합한 조작수단을 선택하여 이루어질 수 있다.

예를 들어, RNAi (RNA 간섭 or RNA silencing)을 이용하여, small RNA(sRNA)가 mRNA를 방해하거나 안정성을 저하시키며, 경우에 따라서는 파괴하여 단백질 합성정보가 중간에서 전달되지 못하게 함으로써 유전정보의 발현을 제어할 수 있다.

구현예에서, 유전자 조작은 DNA 또는 RNA 분자, 바람직하게는 DNA 분자 내 핵산들 사이의 결합들(bonds)의 가수분해(절단(cleavage))을 촉매화할 수 있는 야생형 또는 변종(variant) 효소를 이용할 수 있다. 가이드핵산-에디터단백질 복합체를 이용할 수 있다.

예를 들어, 메가뉴클레아제(meganuclease), 징크핑거(Zinc finger) 뉴클레아제, CRISPR/Cas9(Cas9 단백질), CRISPR-Cpf1(Cpf1 단백질) 및 TALE-뉴클레아제로 이루어진 군에서 선택된 하나 이상의 뉴클레아제를 이용하여 유전자를 조작하여 유전정보의 발현을 제어할 수 있다.

본 명세서에 의해 개시되는 유전자 조작용 조성물은 가이드핵산 및 에디터단백질을 포함할 수 있다.

유전자 조작용 조성물은

(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및

(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열

을 포함할 수 있다.

상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.

상기 표적 서열 관련 설명은 상기 기술한 바와 같다.

유전자 조작용 조성물은

(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및

을 포함할 수 있다.

상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.

상기 표적 서열 관련 설명은 상기 기술한 바와 같다.

상기 가이드서열 관련 설명은 상기 기술한 바와 같다.

유전자 조작용 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.

“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미한다.

상기 가이드핵산 관련 설명은 상기 기술한 바와 같다.

상기 “에디터단백질”은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.

이때, 상기 핵산은 표적 핵산, 유전자 또는 염색체에 포함된 핵산일 수 있다.

이때, 상기 핵산은 가이드핵산일 수 있다.

상기 에디터단백질은 효소일 수 있다.

이때, 상기 “효소”는 핵산, 유전자 또는 염색체를 절단할 수 있는 도메인을 포함하는 폴리펩타이드 또는 단백질을 의미한다.

상기 효소는 뉴클레아제 또는 제한효소일 수 있다.

상기 에디터단백질은 완전 활성 효소를 포함할 수 있다.

이때, 상기 “완전 활성 효소”는 야생형(wild type) 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능과 동일한 기능을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소는 DNA 이중 가닥을 모두 절단하는 완전한 활성 효소일 수 있다. 또 다른 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소가 인위적인 조작에 의해 아미노산 서열 중 일부 서열이 삭제(deletion) 또는 치환(substitution)된 경우, 인위적으로 조작된 효소 변이체가 야생형 효소와 동일하게 DNA의 이중 가닥을 절단한다면, 상기 인위적으로 조작된 효소 변이체는 완전 활성 효소일 수 있다.

또한, 상기 완전 활성 효소는 야생형의 효소의 기능보다 향상 된 기능을 가지고 있는 효소를 포함할 수 있다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 야생형 효소보다 증가된 완전한 효소 활성, 즉, 증가된 DNA 이중 가닥을 절단하는 활성을 가질 수 있다.

상기 에디터단백질은 불완전 또는 부분 활성 효소를 포함할 수 있다.

이때, 상기 "불완전 또는 부분 활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능의 일부만을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능을 가지는 형태 또는 제2 기능을 가지는 형태일 수 있다. 이때, 제1 기능은 DNA의 이중 가닥 중 제1 가닥을 절단하는 기능이고, 제2 기능은 DNA의 이중 가닥 중 제2 가닥을 절단하는 기능일 수 있다. 이때, 상기 제1 기능을 가지는 효소 또는 제2 기능을 가지는 효소는 불완전 또는 부분 활성 효소일 수 있다.

상기 에디터단백질은 불활성 효소를 포함할 수 있다.

이때, 상기 "불활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능이 모두 불활성화 된 효소를 의미한다. 예를 들면, 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능 및 제2 기능이 모두 상실된 형태, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 제2 가닥을 절단하는 제2 기능이 모두 상실된 형태일 수 있다. 이때, 상기 제1 기능 및 제2 기능이 모두 상실된 효소는 불활성 효소일 수 있다.

상기 에디터단백질은 융합단백질일 수 있다.

이때, 상기 “융합 단백질”은 효소에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.

상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소에 포함된 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.

상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.

이때, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드, 폴리펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.

상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.

상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.

또한, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.

상기 NLS는 아미노산 서열 PKKKRKV(SEQ ID NO: 815)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 816)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(SEQ ID NO: 817) 또는 RQRRNELKRSP(SEQ ID NO: 818)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 819)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 820); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 821) 및 PPKKARED(SEQ ID NO: 822); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 823); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 824); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 825) 및 PKQKKRK(SEQ ID NO: 826); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 827); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: 828); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 829); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 830)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.

상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 특정 기능을 수행하지 않는 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다. 이때, 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소의 기능에 영향을 주지 않는 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.

상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.

상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질일 수 있다.

상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.

상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질일 수 있다.

상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.

이때, 상기 변형은 에디터단백질에 포함된 아미노산의 치환, 제거, 부가 또는 이의 혼합일 수 있다.

또는 상기 변형은 에디터단백질을 암호화하는 뉴클레오타이드 서열 중 일부 뉴클레오타이드의 치환, 제거, 부가 또는 이의 혼합일 수 있다.

또한, 상기 유전자 조작용 조성물은 삽입을 원하는 특정 뉴클레오타이드 서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.

이때, 상기 삽입은 원하는 핵산서열은 면역 참여 유전자의 일부 뉴클레오타이드 서열일 수 있다.

이때, 상기 삽입은 원하는 핵산서열은 조작하고자 하는 면역 참여 유전자의 돌연변이를 교정하거나 돌연변이를 도입하기 위한 핵산 서열일 수 있다.

상기 "도너(donor)"는 손상된 유전자 또는 핵산의 상동성 재조합에 의한 수복을 돕는 뉴클레오타이드 서열을 의미한다.

상기 도너는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.

상기 도너는 선형 또는 원형일 수 있다.

상기 도너는 표적 유전자 또는 핵산에 상동성을 가지는 뉴클레오타이드 서열을 포함할 수 있다.

예를 들어, 도너는 특정 뉴클레오타이드 서열을 삽입하고자 하는 위치, 예를 들어, 손상된 핵산의 왼쪽(upstream)및 오른쪽(downstream)의 뉴클레오타이드 서열과 각각 상동성을 가지는 뉴클레오타이드 서열을 포함할 수 있다. 이때, 삽입하고자 하는 특정 뉴클레오타이드 서열은 손상된 핵산의 오른쪽 뉴클레오타이드 서열에 대해 상동성을 가지는 뉴클레오타이드 서열과 손상된 핵산의 왼쪽 뉴클레오타이드 서열에 대해 상동성을 가지는 뉴클레오타이드 서열 사이에 위치할 수 있다. 이때, 상기 상동성을 가지는 뉴클레오타이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.

상기 도너는 선택적으로 부수적인 뉴클레오타이드 서열을 포함할 수 있다. 이때, 부수적인 핵산서열은 도너의 안정성, 표적 내 삽입 효율 또는 상동성 재조합 효율을 높이는 역할을 하는 것일 수 있다.

예를 들어, 상기 부수적인 뉴클레오타이드 서열은 뉴클레오타이드 A, T가 풍부한 핵산서열, 즉, A-T 풍부 도메인(A-T rich domain)일 수 있다. 예를 들면, 상기 부수적인 뉴클레오타이드 서열은 SMAR(scaffold/matrix attachment region)일 수 있다.

본 명세서에 의해 개시되는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.

이때, "대상"은 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되는 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 작동하는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.

상기 대상은 가이드핵산-에디터단백질 복합체의 표적 유전자 또는 염색체를 포함하는 유기체일 수 있다.

상기 유기체는 동물, 동물의 조직 또는 동물 세포일 수 있다.

상기 유기체는 인간, 인간의 조직 또는 인간 세포일 수 있다.

상기 조직은 안구, 피부, 간, 신장, 심장, 폐, 뇌, 근육 또는 혈액일 수 있다.

상기 세포는 안구세포, 신경세포, 대식세포, T 세포 또는 B 세포일 수 있다.

상기 검체 또는 시료는 침, 혈액, 간조직, 뇌조직, 간세포, 신경세포, 식세포, 대식세포, T 세포, B 세포, 성상교세포, 암세포 또는 줄기세포 등 표적 유전자 또는 염색체를 포함하는 유기체에서 획득한 것 일 수 있다.

바람직하게는, 상기 대상은 면역 참여 유전자를 포함하는 유기체일 수 있다.

상기 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 DNA, RNA 또는 이의 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.

이때, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.

또는, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 벡터, 비벡터 또는 이들의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.

상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.

일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.

일 예로, 상기 벡터는 가이드핵산과 에디터단백질을 암호화하는 핵산서열을 동시에 포함할 수 있다.

다른 일 예로, 상기 벡터는 가이드핵산 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 가이드핵산에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.

다른 일 예로, 상기 벡터는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 에디터단백질의 경우, 에디터단백질을 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 에디터단백질을 암호화하는 핵산서열이 분할되어 여러 개의 벡터에 포함될 수 있다.

상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.

이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.

상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.

상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.

상기 프로모터는 유도성 프로모터일 수 있다.

상기 프로모터는 대상 특이적 프로모터일 수 있다.

상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.

상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질을 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.

예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.

벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.

상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.

이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.

이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.

상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.

일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드핵산 및/또는 에디터단백질을 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.

바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드핵산 또는 에디터단백질을 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드핵산 및 에디터단백질을 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드핵산, 에디터단백질 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.

일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.

다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.

또 다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.

다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.

다른 일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 비벡터로 대상 내로 전달 또는 도입될 수 있다.

비벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.

상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.

상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.

다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.

임의의 구체예로, 지질 외피를 이용하여 전달할 수 있다.

임의의 구체예로, 엑소좀을 이용하여 전달할 수 있다. 엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 수송하는 내인성 나노-소낭이다.

임의의 구체예로, 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는데 인지질이 가장 통상적으로 사용된다.

또한, 비벡터의 전달을 위한 조성물은 기타 몇몇 다른 첨가제를 포함할 수 있다.

상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 펩타이드, 폴리펩타이드 또는 단백질의 형태는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

상기 펩타이드, 폴리펩타이드 또는 단백질의 전달은 가이드핵산을 암호화하는 핵산서열과 함께 전달될 수 있다.

일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 가이드핵산와 함께 또는 가이드핵산 없이 에디터단백질을 도입시킬 세포와 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.

상기 가이드핵산 및 에디터단백질은 핵산-단백질 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.

예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.

일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.

본 명세서에 의해 개시되는 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체를 변형시킬 수 있다.

예를 들어, 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체의 서열에 변형(modification)을 유도한다. 그 결과, 상기 표적 핵산, 유전자 또는 염색체에 의해 발현되는 단백질은 그 구조 및/또는 기능이 변형되거나, 그 단백질의 발현이 조절되거나, 그 단백질의 발현이 제거될 수 있다.

상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.

일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자를 조작 또는 변형하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.

상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.

일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 전사를 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.

다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 번역을 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예로서, 유전자 조작용 조성물은 gRNA 및 CRISPR 효소를 포함할 수 있다.

유전자 조작용 조성물은

(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 gRNA 또는 이를 암호화하는 핵산서열; 및

(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열

을 포함할 수 있다.

상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.

상기 표적 서열 관련 설명은 상기 기술한 바와 같다.

유전자 조작용 조성물은

(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 gRNA 또는 이를 암호화하는 핵산서열; 및

(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열

을 포함할 수 있다.

상기 면역 참여 유전자 관련 설명은 상기 기술한 바와 같다.

상기 표적 서열 관련 설명은 상기 기술한 바와 같다.

상기 가이드 서열 관련 설명은 상기 기술한 바와 같다.

유전자 조작용 조성물은 gRNA-CRISPR 효소 복합체를 포함할 수 있다.

“gRNA-CRISPR 효소 복합체”는 gRNA과 CRISPR 효소의 상호작용을 통해 형성된 복합체를 의미한다.

상기 gRNA 관련 설명은 상기 기술한 바와 같다.

상기 “CRISPR 효소”는 CRISPR-Cas 시스템의 주요 단백질 구성 요소로, gRNA와 복합체를 형성하여 CRISPR-Cas 시스템을 형성한다.

상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 가지는 핵산 또는 폴리펩타이드(또는 단백질)일 수 있다.

상기 CRISPR 효소는 Type II CRISPR 효소일 수 있다.

Type II CRISPR 효소의 결정 구조는 2종 이상의 자연유래 미생물 Type II CRISPR 효소 분자에 대한 연구(Jinek et al., Science, 343(6176):1247997, 2014) 및 gRNA와 함께 복합체를 이루는 스트렙토코커스 피오게네스 Cas9(SpCas9)에 대한 연구(Nishimasu et al., Cell, 156:935-949, 2014; 및 Anders et al., Nature, 2014, doi: 10.1038/nature13579)를 통해 결정되었다.

Type II CRISPR 효소는 2개의 로브, 즉, 인식(REC) 및 뉴클레아제(NUC) 로브를 포함하며, 각각의 로브는 여러 개의 도메인을 포함한다.

상기 REC 로브는 아르기닌-풍부 브릿지 나선(BH), REC1 도메인 및 REC2 도메인을 포함한다.

이때, 상기 BH 도메인은 긴 α-나선 및 아르기닌 풍부 영역이며, 상기 REC1 및 REC2 도메인은 gRNA 내의 형성되는 이중가닥의, 예를 들어, 단일가닥 gRNA, 이중 gRNA 또는 tracrRNA의 인식에 중요한 역할을 한다.

상기 NUC 로브는 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. 이때, 상기 RuvC 도메인은 RuvC-유사 도메인을 포괄하는 의미로 사용되고, 또한 상기 HNH 도메인은 HNH-유사 도메인을 포괄하는 의미로 사용된다.

이때, 상기 RuvC 도메인은 Type II CRISPR 효소를 포함하는 자연상태에 존재하는 미생물의 구성원에 대해 구조적으로 유사성을 공유하며, 단일가닥, 예를 들어 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단한다. 상기 RuvC 도메인은 종종 당업계에서 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인으로서, 통상적으로 RuvC I, RuvCII 및 RuvCIII로 지칭된다.

상기 HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어 표적 핵산 분자의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 위치한다.

상기 PI 도메인은 표적 유전자 또는 핵산 내의 특정 뉴클레오타이드 서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다. 이때, 상기 PAM은 Type II CRISPR 효소의 유래(origin)에 따라 다를 수 있다. 예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기티디스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNVRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.

상기 Type II CRISPR 효소는 Cas9일 수 있다.

상기 Cas9은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 황색포도상구균(Staphylococcus aureus), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9일 수 있다.

상기 Cas9은 gRNA와 결합하여 표적 유전자 또는 핵산 상에서 표적 서열 또는 위치를 절단 또는 변형시키는 효소로서, gRNA가 상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 HNH 도메인, gRNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 표적, 즉, 타겟과 상호작용하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.

상기 Cas9은 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.

또한, 상기 CRISPR 효소는 Type V CRISPR 효소일 수 있다.

Type V CRISPR 효소는 Type II CRISPR 효소의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Type II CRISPR 효소의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 표적과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Type V CRISPR 효소의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.

Type V CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 Type V CRISPR 효소의 능력은 PAM 서열에 의존적이다.

상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, Type V CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 Type V CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다. 예를 들어, Cpf1이 인식하는 PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.

상기 Type V CRISPR 효소는 Cpf1일 수 있다.

상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다.

상기 Cpf1은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.

상기 Cpf1는 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.

상기 CRISPR 효소는 표적 유전자 또는 핵산의 이중가닥을 절단하는 기능을 가지는 뉴클레아제 또는 제한효소일 수 있다.

상기 CRISPR 효소는 완전 활성 CRISPR 효소일 수 있다.

"완전 활성"는 야생형(wild type) CRISPR 효소의 기능과 동일한 기능을 가지고 있는 상태를 의미하며, 이러한 상태의 CRISPR 효소를 완전 활성 CRISPR 효소로 명칭한다. 이때, “야생형(wild type) CRISPR 효소의 기능”은 DNA의 이중 가닥을 절단하는 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 모두 가지는 상태를 말한다.

상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소일 수 있다.

상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소를 변형 또는 조작시킨 CRISPR 효소 변이체일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 하나 이상의 아미노산이 다른 아미노산으로 치환되거나 또는 하나 이상의 아미노산이 제거된 효소일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열에 하나 이상의 아미노산이 부가된 효소일 수 있다. 이때, 부가되는 아미노산의 위치는 야생형 효소의 N 말단, C 말단 또는 아미노산 서열 내일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 향상된 완전 활성 효소일 수 있다.

예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 결합하지 않거나 또는 일정한 거리 간격을 유지한 상태에서 DNA 이중 가닥을 절단할 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 향상된 완전 활성 CRISPR 효소일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 감소된 완전 활성 CRISPR 효소일 수 있다.

예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 일정 거리이상으로 근접한 상태 또는 특정 결합이 형성된 상태에서 DNA 이중 가닥을 절단할 수 있다. 이때, 특정 결합은, 예를 들어, 효소의 특정 위치의 아미노산과 절단 위치의 DNA 뉴클레오타이드 서열과의 결합일 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 감소된 완전 활성 CRISPR 효소일 수 있다.

상기 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소일 수 있다.

“불완전 또는 부분 활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능 중 선택된 하나의 기능을 가지는 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소로 명칭한다. 또한 상기 불완전 또는 부분 활성 CRISPR 효소는 니카아제(nickase)로 지칭될 수 있다.

“니카아제(nickase)”는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 2개의 니카아제의 뉴클레아제 활성이 필요하다.

상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 HNH 도메인은 조작 또는 변경될 수 있다.

일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.

예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.

또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.

또한, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.

일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 RuvC 도메인을 포함하는 Type II CRISPR 효소일 수 있다.

예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.

또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.

상기 CRISPR 효소는 불활성 CRISPR 효소일 수 있다.

“불활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능이 모두 상실된 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불활성 CRISPR 효소로 명칭한다.

상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가질 수 있다.

상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 변이로 인한 뉴클레아제 불화성을 가질 수 있다. 즉, 상기 불활성 CRISPR 효소는 CRISPR 효소의 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인 및 HNH 도메인은 조작 또는 변경될 수 있다.

일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 불활성 CRISPR 효소는 변형된 RuvC 도메인 및 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.

예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, SpCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.

또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, CjCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.

상기 CRISPR 효소는 상기 기재된 뉴클레아제 활성 외에도 헬리카제 활성, 즉, 이중가닥 핵산의 나선 구조를 푸는 기능을 가질 수 있다.

또한, 상기 CRISPR 효소는 CRISPR 효소의 헬리카제 활성에 대해 완전 활성, 불완전 또는 부분 활성, 또는 불활성이 되도록 CRISPR 효소를 변형시킬 수 있다.

상기 CRISPR 효소는 야생형 CRISPR 효소를 인위적으로 조작 또는 변형시킨 CRISPR 효소 변이체일 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및/또는 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제1 기능이 상실된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제2 기능이 상실된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, 제1 기능 및 제2 기능이 모두 상실된 형태일 수 있다.

상기 CRISPR 효소 변이체는 gRNA와 상호작용을 통한 gRNA-CRISPR 효소 복합체 형성할 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 gRNA와 상호작용하는 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA의 상호작용이 증가된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.

예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 감소된 형태일 수 있다.

또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 증가된 형태일 수 있다.

이때, gRNA와 CRISPR 효소 변이체의 상호작용 세기에 따라 다양한 gRNA-CRISPR 효소 복합체가 형성될 수 있고, CRISPR 효소 변이체에 따라 표적 서열에 접근 또는 절단하는 기능에 차이가 생길 수 있다.

예를 들어, gRNA와의 상호작용이 감소된 CRISPR 효소 변이체에 의해 형성된 gRNA-CRISPR 효소 복합체는 gRNA와 완전히 상보적 결합을 하는 표적 서열에 근접 또는 국소화되는 경우에만 오직 표적 서열의 이중가닥 또는 단일가닥을 절단할 수 있다.

상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다.

일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환된 것일 수 있다.

다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다.

또 다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 내에 적어도 하나 이상의 아미노산이 부가된 것일 수 있다.

일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환, 제거 및/또는 부가된 것일 수 있다.

또한, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능, 이외에 선택적으로 기능적(functional) 도메인을 추가로 포함할 수 있다. 이때, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능 이외에 부가적인 기능을 가질 수 있다.

상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.

상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.

상기 기능적 도메인은 디아미네이즈(deaminase)일 수 있다.

예를 들어, 불완전 또는 부분 CRISPR 효소에 시티딘 디아미네이즈(cytidine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 시티딘 디아미네이즈, 예를 들면, APOBEC1(apolipoprotein B editing complex 1)를 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[APOBEC1]은 뉴클레오타이드 C를 T 또는 U로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 G를 A로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.

또 다른 예를 들어, 불완전 또는 부분 CRISPR 효소에 아데닌 디아미네이즈(adenine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 아데닌 디아미네이즈, 예를 들면, TadA variants, ADAR2 variants, ADAT2 variants 등을 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[TadA variant], [SpCas9 니카아제]-[ADAR2 variant] 또는 [SpCas9 니카아제]-[ADAT2 variant]는 뉴클레오타이드 A를 inosine으로 변형시키며, 변형된 inosine은 polymerase에 의해 뉴클레오타이드 G로 인식되어 실질적으로 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집되는 효과를 보이므로, 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 T를 C로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.

상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.

일 예로, CRISPR 효소는 하나 이상의 NLS를 포함할 수 있다. 이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV(SEQ ID NO: 815)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 816)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(SEQ ID NO: 817) 또는 RQRRNELKRSP(SEQ ID NO: 818)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 819)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 820); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 821) 및 PPKKARED(SEQ ID NO: 822); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 823); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 824); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 825) 및 PKQKKRK(SEQ ID NO: 826); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 827); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: 828); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 829); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 830).

또한, 상기 CRISPR 효소 변이체는 CRISPR 효소를 분할하여 두 개 이상의 부분으로 나눈 스플릿(split) 형태의 CRISPR 효소를 포함할 수 있다. “스플릿(split)”은 단백질을 기능적으로 또는 구조적으로 또는 임의로 두 개 이상으로 분할하는 것을 의미한다.

상기 스플릿(split) 형태의 CRISPR 효소는 완전 활성 효소, 불완전 또는 부분 활성 효소 또는 불활성 효소일 수 있다.

예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 656번 타이로신과 657번 트레오닌 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9을 생성할 수 있다.

상기 스플릿(split) 형태의 CRISPR 효소는 선택적으로 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.

상기 재구성을 위한 추가 도메인, 펩타이드 폴리펩타이드 또는 단백질은 스플릿(split) 형태의 CRISPR 효소가 구조적으로 야생형 CRISPR 효소와 동일하거나 유사하도록 조립될 수 있다.

상기 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 FRB 및 FKBP dimerization domains; 인테인(intein); ERT 및 VPR domains 또는 특정 조건에서 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.

예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 713번 세린과 714번 글라이신 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9에 두 부분 중 하나에 FRB 도메인을 연결하고, 나머지 하나에 FKBP 도메인을 연결할 수 있다. 이렇게 생성된 스플릿 SpCas9은 라파마이신이 존재하는 환경에서 FRB 도메인과 FKBP 도메인이 다이머를 형성하여 재구성된 CRISPR 효소를 생성할 수 있다.

본 명세서에 의해 개시되는 CRISPR 효소 또는 CRISPR 효소 변이체는 폴리펩타이드, 단백질 또는 이를 암호화하는 서열을 가지는 핵산일 수 있으며, 상기 CRISPR 효소 또는 CRISPR 효소 변이체를 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.

“코돈 최적화”는 고유 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노상 서열을 유지함으로써 관심 숙주 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것을 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.

본 명세서에 의해 개시되는 gRNA, CRISPR 효소 또는 gRNA-CRISPR 효소 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 대상 관련 설명은 상기 기술한 바와 같다.

일 구현예로서, gRNA 및/또는 CRISPR 효소는 각각을 암호화하는 핵산서열을 포함하는 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.

벡터는 gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.

일 예로, 상기 벡터는 gRNA 및 CRISPR 효소를 암호화하는 핵산서열을 동시에 포함할 수 있다.

다른 일 예로, 상기 벡터는 gRNA 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 gRNA에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.

다른 일 예로, 상기 벡터는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.

예를 들어, 상기 CRISPR 효소의 경우, CRISPR 효소를 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 CRISPR 효소를 암호화하는 핵산서열은 분할되어 여러 개의 벡터에 포함될 수 있다.

상기 프로모터는 유도성 프로모터일 수 있다.

상기 프로모터는 대상 특이적 프로모터일 수 있다.

상기 프로모터는 제어 영역(즉, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.

예를 들어, gRNA를 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, CRISPR 효소를 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.

상기 벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.

상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.

일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.

다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.

또 다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.

다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.

일 구현예로서, gRNA-CRISPR 효소 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.

예를 들어, 상기 gRNA는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 CRISPR 효소는 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.

일 예로, gRNA 및 CRISPR 효소는 RNA 형태의 gRNA와 단백질 형태의 CRISPR gRNA-CRISPR 효소 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.

상기 CRISPR gRNA-CRISPR 효소 복합체는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.

본 명세서에 의해 개시되는 gRNA-CRISPR 효소 복합체는 표적 유전자, 즉, 면역 참여 유전자를 인위적으로 조작 또는 변형시키는데 이용될 수 있다.

표적 유전자는 앞서 기재한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 조작 또는 변형할 수 있다. 이때, 표적 유전자의 조작 또는 변형은 i) 표적 유전자의 절단 또는 손상과 ii) 손상된 표적 유전자의 수선 또는 수복하는 단계를 모두 포함한다.

상기 i) 표적 유전자의 절단 또는 손상은 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상일 수 있으며, 구체적으로는 표적 유전자 내의 표적 서열의 절단 손상일 수 있다.

상기 표적 서열은 gRNA-CRISPR 효소 복합체의 타겟이 될 수 있고, 상기 표적 서열은 CRISPR 효소가 인식하는 PAM 서열을 포함하거나 또는 포함하지 않을 수 있다. 이러한 표적 서열은 실시자에게 gRNA 설계 단계에서 중요한 기준을 제공할 수 있다.

상기 표적 서열은 gRNA-CRISPR 효소 복합체의 gRNA에 의해 특이적으로 인식될 수 있으며, 이로 인해 gRNA-CRISPR 효소 복합체는 인식된 표적 서열에 근접하게 위치할 수 있다.

표적 부위의 "절단(cleavage)"은 폴리뉴클레오타이드의 공유결합(covalent backbone)의 파손(breakage)을 의미한다. 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일가닥의 절단 및 이중가닥의 절단 모두 가능하며, 이중가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end(또는 sticky end)를 생성할 수 있다.

일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상은 표적 서열의 이중가닥이 모두 절단 또는 손상되는 것일 수 있다.

일 구체예로서, CRISPR 효소가 야생형의 SpCas9인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 모두 절단시킬 수 있다.

다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)인 경우, 각각의 CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 두 개의 단일가닥을 각각 절단시킬 수 있다. 즉, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.

다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열의 이중가닥 중 단일가닥만 절단 또는 손상되는 것일 수 있다. 이때, 단일가닥은 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥일 수 있고, 또는 gRNA와 상보적 결합을 하지 않는 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥일 수 있다.

일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 절단되지 않을 수 있다.

다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(H840A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 절단되지 않을 수 있다.

또 다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 일부 핵산 조각(fragment)를 제거하는 것일 수 있다.

일 구체예로서, 상기 CRISPR 복합체가 서로 다른 표적 서열에 상보적 결합을 하는 두 개의 gRNA와 야생형 SpCas9에 의해 구성되는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하여 제 1 gRNA와 제 2 gRNA 및 SpCas9에 의해 핵산 조각을 제거할 수 있다.

상기 ii) 손상된 표적 유전자의 수선 또는 수복은 비-상동성 말단-결합 (NHEJ) 및 상동 재조합 수리(HDR)을 통해 수선 또는 수복될 수 있다.

상기 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)은 절단된 이중가닥 또는 단일가닥의 양 말단이 함께 결합함으로써 DNA 내 이중가닥 파손을 수복 또는 수선하는 방법으로, 일반적으로, 이중가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 2개의 말단이 완전히 결합되는 경우 파손된 이중가닥이 복구된다. NHEJ는 모든 세포주기에서 가능한 수복 방식으로, 주로 G1 시기와 같이 세포 내에 주형으로 쓸 상동유전체가 없을 때 발생한다.

NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에서 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래하며, 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 또는 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이를 초래해 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 비중요 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 좌위 의존적이다.

NHEJ에 의해 생성된 삽입결실 돌연변이는 자연 상태에서 예측 불가능하지만, 주어진 파손 부위에서 특정 삽입 결실 서열이 선호되며, 이는 마이크로상동성의 작은 영역에 기인할 가능성이 있다. 통상적으로 결실 길이는 1 bp 내지 50 bp 범위이며, 삽입은 더 짧게 되는 경향이 있고, 종종 파손 부위를 바로 둘러싸는 짧은 중복 서열을 포함한다.

또한, NHEJ는 돌연변이를 유발하는 과정으로, 특이적 최종 서열의 생성이 필요하지 않은 경우, 작은 서열의 모티프를 결실시키는데 사용될 수 있다.

이러한 NHEJ를 이용하면, CRISPR 복합체에 의해 표적되는 유전자의 특이적 넉아웃(knockout)할 수 있다. CRISPR 효소, 예를 들어, Cas9 또는 Cpf1을 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥의 절단하고, 파손된 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다. 이때, 상기 CRISPR 효소에 의해 절단되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있으며, 더불어 NHEJ에 의해 수복되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있다.

일 예로, CRISPR 복합체를 이용하여 표적 유전자의 이중가닥을 절단하고 NHEJ에 의해 수복되는 과정을 통해 수복 부위에 다양한 인델 (indel; insertion and deletion)이 발생할 수 있다.

"인델(indel)"은 DNA의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 삽입 (insertion)되거나 결실 (deletion) 된 변이를 총칭한다. 인델은 상술한 바와 같이 gRNA-CRISPR 효소 복합체가 면역 참여 인자의 핵산(DNA, RNA)를 절단하는 경우, HDR 또는 NHEJ 기작에 의해 수선되는 과정에서 표적 서열에 도입되는 것일 수 있다.

상기 상동 재조합 수리(homology directed repairing, HDR)는 손상된 유전자 또는 핵산을 수선 또는 수복하기 위해 상동성을 가진 서열을 주형으로 이용하는 방식으로 오류 없이 교정할 수 있는 방법으로, 일반적으로, 파손된 DNA을 수선 또는 수복하기 위해, 즉 세포가 가지고 있는 원래의 정보를 복원하기 위해, 변형이 이루어지지 않은 상보적인 뉴클레오타이드 서열의 정보를 이용하거나 자매 염색분체의 정보를 이용하여 파손된 DNA를 수선 또는 수복한다. HDR의 가장 일반적인 형태는 상동성 재조합(homologous recombination, HR)이다. HDR은 통상적으로 활발하게 분열하는 세포의 S나 G2/M 시기에 주로 발생하는 수선 또는 수복 방식이다.

HDR을 이용한 손상된 DNA 수선 또는 수복을 위해, 세포가 본래 가지는 상보적인 뉴클레오타이드 서열 또는 자매 염색분체를 이용하는 대신에, 상보적인 뉴클레오타이드 서열 또는 상동성 뉴클레오타이드 서열 정보를 이용한 인공적으로 합성한 DNA 주형, 즉, 상보적인 뉴클레오타이드 서열 또는 상동성 뉴클레오타이드 서열을 포함하는 핵산 주형을 세포에 제공하여 파손된 DNA를 수선 또는 수복할 수 있다. 이때, 상기 핵산 주형에 추가로 핵산 서열 또는 핵산 조각을 포함시켜 파손된 DNA를 수선 또는 수복 할 때, 파손된 DNA에 추가로 포함시킨 핵산 서열 또는 핵산 조작을 삽입(Knock-In)할 수 있다. 추가로 포함시킨 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있으나, 이에 제한되지 않는다.

일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드 서열과 상보적인 뉴클레오타이드 서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드 서열을 HDR 방법으로 수선 또는 수복할 수 있다.

이때, 상기 상보적인 뉴클레오타이드 서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상보적인 뉴클레오타이드 서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상보적인 뉴클레오타이드 서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상보적인 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드 서열과 상보적인 결합을 하는 뉴클레오타이드 서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상보적인 결합을 하는 뉴클레오타이드 서열일 수 있다. 상기 상보적인 뉴클레오타이드 서열은 15 내지 3000개의 뉴클레오타이드 서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상보적인 뉴클레오타이드 서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.

다른 일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드 서열과 상동성 뉴클레오타이드 서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드 서열을 HDR 방법으로 수선 또는 수복할 수 있다.

이때, 상기 상동성 뉴클레오타이드 서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상동성 뉴클레오타이드 서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상동성 뉴클레오타이드 서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상동성 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드 서열과 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드 서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상동성을 가지는 뉴클레오타이드 서열일 수 있다. 상기 상동성 뉴클레오타이드 서열은 15 내지 3000개의 뉴클레오타이드 서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상동성 뉴클레오타이드 서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.

상기 NHEJ와 HDR 외에도 손상된 표적 유전자를 수선 또는 수복하는 다양한 방법이 존재한다. 예를 들어, 손상된 표적 유전자의 수선 또는 수복 방법은 단일가닥 어닐링, 단일가닥 파손 수선, 미스매치 수선, 뉴클레오타이드 절단 수선 또는 뉴클레오타이드 절단 수선을 이용한 방법일 수 있다.

상기 단일가닥 어닐링(Single-strand annealing, SSA)은 표적 핵산 중에 존재하는 2개의 반복부 서열 사이의 이중가닥 파손을 수선하는 방법으로, 일반적으로 30개 초과의 뉴클레오타이드 서열의 반복부 서열을 이용할 수 있다. 파손 말단에서 표적 핵산의 이중가닥에 대해 반복부 서열을 각각의 단일가닥이 가지도록 절단(Sticky end가 되도록)되며, 절단 후 반복부 서열을 함유하는 단일가닥 돌출부는 반복체 서열이 자체적으로 부적절하게 어닐링되는 것을 방지하기 위해 RPA 단백질로 코팅된다. RAD52는 돌출부 상의 각각의 반복부 서열에 결합하고, 상보성 반복부 서열의 어닐링을 가능하게 하는 서열을 정렬한다. 어닐링 후에, 돌출부의 단일가닥 플랩(flap)은 절단되고, 새로운 DNA 합성이 임의의 갭을 채우면서 DNA 이중가닥을 복원한다. 이러한 수복 또는 수선의 결과로, 2개의 반복체 사이의 DNA 서열이 결실되며, 결실 길이는 이용되는 2개의 반복체의 위치를 포함하는 다수의 인자 및 절단 경로 또는 진행도에 의존될 수 있다.

SSA는 HDR 방식과 유사하게는 상보성 서열, 즉 상보성 반복부 서열을 이용하고, 대조적으로는 표적 핵산 서열을 변경 또는 수정하기 위한 핵산 주형을 필요로 하지 않는다.

게놈 내 단일가닥 파손은 상기 논의된 수선 메커니즘과는 별도의 메커니즘인 단일가닥 파손 수선(Single-strand break repair, SSBA)을 통해 수선 또는 수복될 수 있다. DNA 파손의 형태가 단일가닥 파손일 때, PARP1 및/또는 PARP2는 파손을 인식하고 수선 기작을 동원한다. DAN 파손에서 PARP1의 결합 및 활성을 일시적이며, 손상부에 SSBR 단백질 복합체의 안정성을 촉진함으로써 SSBR을 촉진시킨다. SSBR 복합체에서 가장 중요한 단백질은 XRCC1으로, 이는 DNA의 3' 및 5' 말단 가공을 촉진하는 단백질과 상호작용하며, 안정화시킨다. 말단 가공은 일반적을 손상된 3' 말단을 하이드록실화 된 상태 및/또는 5' 말단을 인산염 모이어티로 복구하는 것을 수반하며, 말단이 가공되면, DNA 갭 채우기가 일어난다. DNA 갭 채우기에는 2가지 방법, 즉, 짧은 패치 수선 및 긴 패치 수선이 있으며, 이때 짧은 패치 수선은 빠져있는 단일 뉴클레오타이드의 삽입을 수반한다. DNA 갭 채우기 후, DNA 리가아제는 말단의 결합을 촉진한다.

상기 미스매치 수선(Mismatch repair, MMR)은 잘못 짝지어진 DNA 뉴클레오타이드상에서 작용할 수 있다. MSH2/6 또는 MSH2/3 복합체는 둘 다 미스매치 인식 및 수선의 개시에서 중요한 역할을 하는 ATP 분해효소 활성을 가지며, MSH2/6는 뉴클레오타이드-뉴클레오타이드 미스매치를 우선적으로 인식하고, 1개 또는 2개의 뉴클레오타이드의 미스매치를 동정하는 반면, MSH2/3는 더 큰 미스매치를 우선적으로 인식한다.

상기 뉴클레오타이드 절단 수선(Base excision repair, BER)은 세포주기 전체에서 활성이며, 게놈으로부터 작은 비-나선-뒤틀림 뉴클레오타이드 손상부를 제거하는데 이용되는 수선 방식이다. 손상된 DNA는 당 인산화 백본에 뉴클레오타이드를 연결하는 N-글리코사이드 결합을 절단하여 손상된 뉴클레오타이드를 절단하고, 이어서 포스포디에스테르 백본을 절단하여 DNA 단일가닥 파손을 생성한다. 이렇게 형성된 파손된 단일가닥 말단을 제거하고, 제거된 단일가닥에 의해 발생된 갭을 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.

상기 뉴클레오타이드 절단 수선(Nucleotide excision repair, NER)은 DNA로부터 큰 나선-뒤틀림 손상을 제거하는 중요한 절단 메커니즘으로, 손상이 인식되면, 손상부를 함유하는 짧은 단일가닥 DNA 세그먼트를 제거하여, 22개 내지 30개 뉴클레오타이드의 단일가닥 갭을 생성한다. 생성된 갭은 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.

상기 gRNA-CRISPR 효소 복합체에 의한 표적 유전자, 즉, 면역 참여 유전자의 인위적인 조작 효과는 크게 넉아웃(knockout), 넉다운(knockdown), 넉인(knockin)일 수 있다.

"넉아웃(knockout)"은 표적 유전자 또는 핵산을 불활성화시키는 것을 의미하며, “표적 유전자 또는 핵산의 불활성화”는 표적 유전자 또는 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 넉아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다.

예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.

다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너을 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 이때, 도너는 상동성 뉴클레오타이드 서열 및 삽입시키길 원하는 뉴클레오타이드 서열을 포함한다. 이때, 삽입시키길 원하는 뉴클레오타이드 서열은 개수는 삽입 위치 또는 목적에 따라 다양하게 조절될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드 서열 부위에 삽입시키길 원하는 뉴클레오타이드 서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.

"넉다운(knockdown)"은 표적 유전자 또는 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 넉다운을 통해 과발현되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.

예를 들어, gRNA- CRISPR 불활성 효소-전사 저해 활성 도메인 복합체, 즉, 전사 저해 활성 도메인을 포함하는 CRISPR 불활성 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, 상기 CRISPR 불활성 복합체가 표적 유전자 또는 염색체에 특이적으로 결합하고, CRISPR 불활성 복합체에 포함된 전사 저해 활성 도메인에 의해 표적 유전자 또는 염색체의 전사가 저해되어 해당 유전자 또는 염색체의 발현이 저해되는 넉다운을 유도할 수 있다.

다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, 상기 CRISPR 복합체가 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위를 절단할 수 있다. 이때, 상기 gRNA는 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위의 일부 뉴클레오타이드 서열을 표적 서열로 인식할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다. 또는 선택적으로 도너를 이용하는 경우, CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드 서열 부위에 삽입시키길 원하는 뉴클레오타이드 서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다.

"넉인(knockin)"은 표적 유전자 또는 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"은 삽입하고자 하는 또는 발현시키기 원하는 핵산 또는 유전자를 의미한다. 넉인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.

더불어, 넉인은 추가적으로 도너(donor)를 필요로 할 수 있다.

예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 이때, 도너는 특정 핵산 또는 유전자를 포함하며, 이를 이용하여 손상된 유전자 또는 염색체에 특정 핵산 또는 유전자를 삽입할 수 있다. 이때, 삽입된 특정 핵산 또는 유전자는 단밸질도의 발현이 유도할 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예로서, gRNA-CRISPR 효소 복합체는 MYD88 유전자 및/또는 C3 유전자에 인위적인 조작 또는 변형을 가할 수 있다.

상기 gRNA-CRISPR 효소 복합체는 MYD88 유전자 및/또는 C3 유전자의 표적 서열을 특이적으로 인식할 수 있다.

상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자에 인위적인 변형이 일어나는 부위 또는 영역일 수 있다.

상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 프로모터 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 인트론 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 엑손 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 인핸서 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

상기 표적 서열은 MYD88 유전자 및/또는 C3 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.

NGG(N은 A, T, C 또는 G임);

NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);

TTN(N은 A, T, C 또는 G임).

일구체예에서, 상기 표적 서열은 표 1, 표 2, 표 3 및 표 4에 기재된 뉴클레오타이드 서열 중 선택된 하나 이상의 뉴클레오타이드 서열일 수 있다.

상기 gRNA-CRISPR 효소 복합체는 gRNA와 CRISPR 효소로 구성될 수 있다.

상기 gRNA는 MYD88 유전자 및/또는 C3 유전자의 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 할 수 있는 가이드 도메인을 포함할 수 있다.

상기 가이드 도메인은 가이드핵산 결합 서열에 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성이거나 또는 완전하게 상보성일 수 있다.

상기 가이드 도메인은 MYD88 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드 서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드 서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 가이드 도메인은 C3 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드 서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드 서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.

상기 gRNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 포함할 수 있다.

상기 CRISPR 효소는 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다. 일 예에서, 상기 에디터단백질은 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질 또는 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질일 수 있다.

상기 gRNA-CRISPR 효소 복합체는 gRNA 및 CRISPR 효소의 종류에 따라 MYD88 유전자 및/또는 C3 유전자에 다양한 인위적인 조작 또는 변형을 가할 수 있다.

상기 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

예를 들어, 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 연속되는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 또다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 2 이상의 뉴클레오타이드 조각은 뉴클레오타이드 서열이 연속되지 않는, 즉, 하나 이상의 뉴클레오타이드 서열 간격을 가지는 각각의 뉴클레오타이드 조각일 수 있으며, 결실된 2 이상의 뉴클레오타이드 조각에 의해 2 이상의 결실 부위가 발생할 수 있다.

또는, 예를 들어, 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 삽입을 포함할 수 있다. 일 예로, 삽입되는 뉴클레오타이드는 연속된 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 삽입되는 뉴클레오타이드는 연속되는 5bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 또 다른 일 예로, 삽입되는 뉴클레오타이드는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있다. 이때, 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다.

또는, 예를 들어, 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실 및 삽입을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 이때, 삽입되는 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 이때, 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 MYD88 유전자 및/또는 C3 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 결실되는 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또 다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또한, 상기 삽입은 결실된 2 이상의 부위에 일부 또는 전체 부위에서 발생할 수 있다.

상기 인위적으로 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

일 예로, 상기 CRISPR 효소가 SpCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NGG-3' (N은 A, T, G, 또는 C임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

다른 일 예로, 상기 CRISPR 효소가 CjCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

또 다른 일 예로, 상기 CRISPR 효소가 StCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNAGAAW-3'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

일 예로, 상기 CRISPR 효소가 NmCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

다른 일 예로, 상기 CRISPR 효소가 SaCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

또 다른 일 예로, 상기 CRISPR 효소가 Cpf1 단백질인 경우, 상기 인위적인 조작 또는 변형된 MYD88 유전자 및/또는 C3 유전자는 5'-TTN-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 또는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:

i) 하나 이상의 뉴클레오타이드의 결실,

iii) 하나 이상의 뉴클레오타이드의 삽입, 또는

iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.

상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 넉아웃(knockout)일 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 MYD88 유전자 및/또는 C3 유전자에 의해 각각 암호화되는 단백질의 발현이 억제될 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 넉다운(knockdown)일 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 MYD88 유전자 및/또는 C3 유전자에 의해 각각 암호화되는 단백질의 발현이 감소될 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 넉인(knockin)일 수 있다.

이때, 상기 넉인 효과는 gRNA-CRISPR 효소 복합체 및 추가적으로 외부 유래 뉴클레오타이드 서열 또는 유전자를 포함하는 도너에 의해 유도된 것일 수 있다.

상기 gRNA-CRISPR 효소 복합체에 의한 MYD88 유전자 및/또는 C3 유전자의 인위적인 조작 효과는 외부 유래 뉴클레오타이드 서열 또는 유전자에 의해 암호화되는 펩타이드 또는 단백질이 발현될 수 있다.

본 명세서에 의해 개시되는 일 태양은 면역 기능이상 질환을 치료하기 위한 유전자 조작용 조성물을 이용한 면역 기능이상 질환 치료방법에 관한 것이다.

본 명세서에 의해 개시되는 일 구체예는 치료 대상에 면역 참여 인자를 인위적으로 조작하기 위한 유전자 조작용 조성물의 투여를 포함하는 방법을 이용하는 면역 기능이상 질환 치료 용도이다.

이때, 상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.

“면역 기능이상”은 면역 반응 과정 중 특정 또는 전체적 과정의 일시적 또는 영구적인 장애, 과정 불활성화, 활성 저해, 과활성 등의 전체적인 면역 반응의 기능 저하 또는 과활성으로 인한 정상적인 기능 또는 역할을 하지 못 하는 모든 형태, 과정 및/또는 이로 인한 결과물 또는 면역 반응에 참여하는 물질, 예를 들면, 면역 참여 인자 등의 이상을 통해 발생되는 비정상적인 모든 상태 및/또는 이로 인한 결과물 등을 포함하는 모든 상태를 의미한다. 따라서, “면역 기능이상 질환”은 상기와 같은 상태로 인해 발생하는 질병을 모두 포함하는 모든 상태를 의미한다.

이때, 면역 기능이상 질환은 면역 기능장애 질환 및 면역 참여 인자 유발 질환을 모두 포함한다.

상기 “면역 참여 인자 유발 질환”은 면역 참여 인자의 비정상적인 형태, 예를 들면, 돌연변이 등 또는 비정상적인 발현으로 인해 발생하는 질병을 모두 포함하는 모든 상태를 의미한다.

면역 기능이상 질환은 안구에서 발생하는 비정상적인 면역 질환으로, 감염성 질환, 비감염성 질환 또는 자가면역 질환일 수 있으며, 또한 그로 인해 발생하는 안구 합병증인 백내장, 녹내장, 망막변성, 망막박리, 시신경위축 등도 포함할 수 있다.

일 실시예에서, 면역 기능이상 질환은 안구 내 자가면역질환, 포도막염, 베체트병, 쇼그렌 증후군 또는 보그트-고야나기-하라다 병일 수 있다.

자가면역질환(autoimmune disease)은 자가면역에 의해 나타나는 질병으로, 정상적인 화학 물질과 신체의 일부 세포들에 대해 면역계가 잘못된 반응을 일으키는 것으로 비정상적인 면역 반응에 의해 건강한 세포를 공격하여 발생하는 질환이다. 자가면역질환은 다양한 림프구 중에 체내 자기자신의 분자와 반응하는 수용체를 가지는 림프구에 의해 나타나기도 한다. 이러한 자기반응성 림프구들이 제거되거나 불활성되지 않으면 면역계는 결국 자신의 세포 또는 조직을 공격하게 된다. 하지만 정상의 경우 림프구들이 골수에서 성숙되는 동안 자기반응성이 점검되며 이러한 과정 동안 자기 분자에 특이적인 수용체를 가진 림프구들은 세포자상(apoptosis)에 의해 죽거나 무반응세포로 변하게 된다. 결과적으로 비자기분자와 반응하는 림프구만 남게 되고 이러한 과정을 자기관용기작(self-tolerance)이라고 한다. 만약 자기관용기작이 정상적이지 못할 경우에는 류마티스 관절염과 같은 자가면역질환을 유발하게 된다. 자가면역질환에는 류마티스 관절염뿐만 아니라 1형 당뇨병(인슐린 의존성), 전신성 루푸스, 크론병, 건선 등이 있고, 안구에 발생하는 자가면역질환으로는 포도막염, 베체트병, 쇼그렌 증후군, 보고트-고야나기-하라다 병 등이 있다.

포도막염은 안구의 중간층을 형성하는 홍채, 모양체 및 맥락막으로 이루어진 포도막에 염증이 생기는 것으로, 포도막은 혈관이 풍부하고 결합조직이 많아 염증이 생기기 쉽고, 홍채, 모양체, 맥락막에 각각 따로 염증이 발생하기도 하지만, 홍채모양체염과 같이 동시에 발생하기도 한다.

포도막염의 원인은 크게 감염성과 비감염성으로 나뉘고, 비감염성에는 자가면역과 종양에 의한 경우가 있다. 감염성 포도막염은 외상에 의하여 다친 경우가 아니라면 면역력이 정상인 일반 사람들에게서는 흔히 볼 수 없는데, 원인으로는 세균, 진균 그리고 바이러스가 있다.

자가면역이란 내 몸의 세포를 적으로 간주하고 공격하는 염증반응이 생기는 것으로 과로, 스트레스, 유전적 요인 등이 영향을 주기도 한다. 자가면역에 의한 포도막염은 특별히 다치거나 감염 질환을 앓은 적이 없으면서 안구 내 염증이 발생하는 것으로, 눈에만 염증이 있는 경우도 있지만, 관절염, 혈관염 등의 몸 속 다른 염증질환과 동반하여 나타나는 경우도 있다. 종양에 의한 포도막염은 다른 원인의 포도막염과 증상이 비슷하기 때문에 진단이 쉽지 않아 종양 치료를 위해서 반드시 정확한 감별진단이 필요하다.

포도막염(Uveitis)은 다른 안구 질환과 달리 초기에 원인을 찾아내기 어려운 경우가 많다. 이는 한가지 원인이 다양한 염증형태로 나타낼 수 있고, 질환의 초기에는 진단에 필요한 전형적인 증상들 중에서 일부만이 나타나기도 하며, 또한 대부분의 포도막염이 자가면역반응에 의하여 발생하는데 이런 경우 감염성 질환처럼 한두 가지 검사로 원인 균을 바로 확인할 수 있는 것이 아니기 때문이다. 따라서, 포도막염의 최종진단은 수개월 이상이 걸리는 경우도 흔하고, 다른 어떤 안구 질환보다도 많은 노력이 필요한 경우가 많다.

포도막염은 염증이 안구 속에 주로 어느 부위에 발생하였는지에 따라 크게 전포도막염, 중간포도막염, 후포도막염, 그리고 전체포도막염으로 분류된다.

전체포도막염이란 위치가 어느 한 부위에 국한되지 않고 눈 전체에 염증이 발생한 경우를 말한다. 전포도막염, 중간포도막염, 후포도막염, 전체포도막염 각각은 다시 염증의 형태 또는 원인에 따라 분류된다. 예를 들어, 안구에서 사진기의 조리개 역할을 하는 홍채에 염증이 발생한 경우에는 홍채염이라고 말하는데, 홍채는 안구의 앞부분에 위치하기 때문에 전포도막염의 한 종류이다.

홍채염은 일으키는 원인은 매우 다양한데, 자가면역반응에 의하여 발생하는 경우가 가장 많지만, 세균, 진균, 바이러스 감염에 의하여 발생하는 경우도 있고, 종양이나 다른 안구 질환에서도 발생할 수 있다. 예를 들어, 헤르페스 바이러스(herpes virus)에 의한 각막염에 의하여 이차적으로 홍채염이 발생할 수 있으며, 이런 경우 헤르페스 바이러스에 의한 각막 포도막염(각막 홍채염)이 된다.

중간포도막염은 염증이 주로 유리체 및 주변 망막에 발생한 경우를 말하며, 후포도막염은 망막, 맥락막 및 시신경에 염증이 있을 경우를 말한다.

포도막염은 다양한 원인과 염증 정도에 따라 증상도 다양하게 나타나지만, 대표적인 증상으로 시력저하, 날파리증, 통증, 충혈, 눌물흘림, 눈부심 등이 있다. 안구의 앞쪽 포도막에 생기는 염증인 전포도막염은 시력장애보다는 충혈과 눈부심, 통증이 심하고, 안구의 뒤쪽에 포도막에 생기는 염증인 후포도막염은 시력저하와 날파리증이 주 증상으로 눈부심, 변시증(사물이 찌그러져 보이는 현상)이 생길 수 있다.

심하지 않은 포도막염의 경우 치료로 낫게 되지만, 원인을 알 수 없고 치료가 잘 되지 않는 경우는 염증이 진행되면서 황반부종, 삼출망막박리, 맥락망막위축 등으로 인해 시력감소가 심해지며, 이런 경우 적극적인 치료로도 시력회복이 어려울 수 있다.

최근에는 AIDS에 따른 기회성감염증으로서 세포거대바이러스 망막염이 급증하고 있다. 포도막염은 반복, 혹은 지연화하는 경우가 많아, 여러 가지 눈합병증(백내장, 녹내장, 망막변성, 망막박리, 시신경위축 등)이 생겨 실명의 원인이 되기도 한다.

베체트병(Behcet's disease)은 구강궤양이나 음부궤양 등의 증상을 나타내는 자가면역질환으로 만성 염증성 질환이다. 베체트병이 발생하는 원인은 정확히 밝혀지지 않았지만 오래 전부터 유전적인 소인이 있는 환자에게서 환경적인 요인이 더해지면서 면역반응이 활성화되고 그 결과 여러가지 증상이 나타난다고 여겨지고 있다. 특히 HLA-B51이라는 유전자 베체트병에 가장 중요한 유전인자로 알려져 있고 지역에 따른 차이가 큰 것으로 알려져 있다. 또한 일부 바이러스와 세균에 대한 면역반응이 베체트병의 염증방응과 관련이 있을 가능성이 있다고 알려져 있다.

이러한 베체트병과 안구 질환의 연관성은 우리나라의 베체트병 환자가 외국에 비해 안구에 침범되는 빈도가 적긴 하지만 20 ~ 30%에서 안구 증상이 나타난다. 병적인 증상은 포도막과 망막에 발생하며 적극적인 치료를 하지 않을 경우 시력에 장애를 주는 합병증이 생기거나 심할 경우 실명할 수 있다.

쇼그렌 증후군(Sjogren's syndrome)은 타액선, 눈물샘 등에 림프구가 침입해 만성 염증이 생겨 분비 장애를 일으켜 입이 마르고 눈이 건조해지는 증상을 보이는 자가면역성 전신 질환이다. 원인은 잘 알려져 있지 않지만, 유전적인 원인이나, 바이러스 감염, 호르몬 이상 등이 관여되어 나타나는 자가면역질환으로 생각되고 있다. 체내의 방어기전이 눈물, 침 등을 분비하는 분비샘을 파괴하여 병을 일으키게 된다.

보그트-고야나기-하라다(Vogt-Kayanagi-Harada disease, VKH) 병은 삼출 망막 박리와 육아종 범포도막염과 함께 신경계와 피부 증상을 나타내는 다발적 전신 질환이다. VKH 병은 주로 아시아, 중동, 스페인계와 아메리칸 인디언에게서 잘 발생한다. 일본에서는 VKH병이 Behcet's 병 다음으로 흔한 포도막염의 원인질환이다. 자가면역계의 이상 및 유전적 영향에 기인한다고 알려져 있으며, HLA-DR4, HLA-DR53, 그리고 HLA-DQ4와 관련되어 있는 것으로 알려졌다. Vogt, Koyanagi 와 Harada 가 각각 20년 동안 양측 포도막염, 삼출 망막박리, 신경이상과 외피질환을 가진 환자들을 보고하였다.

병의 발현양상이 다양하고, 전형적인 증상을 나타내지 않는 경우도 있다. 따라서 증상유무에 따라 완전 VKH, 불완전 VKH, 가능한 VKH로 나누어 진단하며 다음 3가지 조건을 다 충족한 경우 진단할 수 있다. (1) 이전에 눈의 외상력이나 수술력이 없는 경우 (2) 임상적이나 검사 결과에 따라 다른 눈의 질환을 가진 증거가 없는 경우 (3) 양측 눈에서 모두 증상이 나타난 경우.

완전 VKH 병은 초기에는 삼출 망막 박리나 국소 망막하액을 가지는 광범위한 맥락막염을 보인다. 이러한 증상이 없는 환자는 혈관 조영술 상에서 지연된 맥락막 관류, 다발성의 극소 유출, 판모양비닐 과다형광부위, 망막하액의 저류와 시신경 염색 등의 형광물질에 의한 이상 소견이 관찰되며, 초음파상 광범위하게 맥락막의 비후가 관찰된다. 후기에는 눈의 탈색소, 동전형 맥락망막흉터, 망막색소상피(RPE) 응괴와 이동, 또는 전방 포도막염이 관찰된다. 또한 뇌막자극 증상, 뇌척수액 세포증가증 등의 신경증상과 귀울림 등의 청력이상 및 탈모, 백모증, 백반증 등의 외피증상이 동반된다.

불완전 VKH 병은 완전 VKH 병과 비슷하나 신경계와 청력 증상이나 외피증상 두 가지가 모두 보이지 않고 이중 한가지만 나타난다. 가능한 VKH 병은 눈의 증상만 가지고 있는 경우이다.

정확한 원인은 아직 모른지만, 자가면역계의 이상과 연관이 있다고 생각되고 있으며 유전적인 영향이 있다는 사실은 인종과 민족에 따라 특이적으로 HLA형 결정을 가지고 있는 것으로 확인할 수 있다. 일본 환자들에서는 HLA-DR4, HLA-DR53과 HLA-DQ4가 관련되어 있으며 중국 환자들은 HLA-DR4, HLA-DR53과 HLA-DQ7 이 관련되어 있다. 미국에서는 HLA-DR4와 HLA-DR53과 연관이 있으며 남부캘리포니아에 살고 있는 스페인계통의 사람에서는 HLA-DR1과 HLA-DR4와 연관이 있다고 보고되고 있다.

leptin이라는 지방세포에서 유래된 면역기전에 관여하는 물질이 면역반응을 촉진시킴으로써 VKH의 발병에 관여한다고 보고 된 바 있고, 또한 최근의 연구에서는 T-도움 세포가 멜라닌세포를 공격해서 발생한다는 설명도 있다.

본 명세서에 의해 개시되는 내용의 일 구체예는 면역 참여 인자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 포함하는 약학적 조성물이다.

상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.

일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.

(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.

이때, 상기 면역 참여 유전자는 MYD88 유전자 및/또는 C3 유전자일 수 있다.

이때, 상기 유전자 조작용 조성물은 가이드핵산 및/또는 에디터단백질은 각각을 암호화하는 핵산서열을 포함하는 벡터를 포함할 수 있다.

이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.

다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.

(a) 면역 참여 유전자의 표적 서열에 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열;

(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열; 및

(c) 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열.

이때, 삽입을 원하는 핵산서열은 면역 참여 인자의 일부 서열일 수 있다.

또는 삽입을 원하는 핵산서열은 조작하고자 하는 면역 참여 인자의 돌연변이를 교정하기 위한 핵산서열일 수 있다.

이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 에디터단백질을 암호화하는 핵산서열; 및 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.

상기 약학적 조성물은 부가적 요소를 추가로 더 포함할 수 있다.

상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.

또 다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.

(a) 면역 참여 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및

(a) 면역 참여 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열;

본 명세서에 의해 개시되는 내용의 일 구체예는 면역 기능이상 질환을 치료하기 위해 면역 기능이상 유기체에 유전자 조작용 조성물을 투여하는 단계를 포함하는, 면역 이상 질환의 치료방법이다.

상기 치료방법은 생체의 유전자를 조작하여 면역 기능을 조절하는 치료방법일 수 있다. 이러한 치료방법은 생체의 유전자를 조작하기 위한 유전자 조작용 조성물을 체내에 직접 주입하여 이루어질 수 있다.

일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:

다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다:

상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.

상기 면역 기능이상 질환 관련 설명은 상기 기술한 바와 같다.

상기 면역 기능이상 질환은 안구 내 자가면역질환, 포도막염, 베체트병, 쇼그렌 증후군 또는 보그트-고야나기-하라다 병일 수 있다.

상기 유전자 조작용 조성물은 면역 기능이상을 보이는 치료 대상에 투여될 수 있다.

상기 유전자 조작용 조성물은 치료 대상의 특정 신체 위치에 투여될 수 있다.

상기 투여는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.

상기 투여는 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneally)에서 선택된 투여 경로로 수행될 수 있다.

유전자 조작용 조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 체중 kg 당 10⁴-10⁹ 세포, 예컨대, 10⁵ 내지 10⁶ 세포/kg(체중) 정도로 상기 수치 범위들 내의 모든 정수값들 중에서 선택될 수 있으나, 이에 제한되는 것은 아니고, 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.

본 명세서에 의해 개시되는 몇몇 구현예들의 방법, 조성물에 의해 면역 참여 인자를 인위적으로 조작할 경우, 면역 기능의 정상화가 가능하게 되고, 이를 통해 비정상적인 또는 질병을 유발하는 면역 기능이상을 억제시키거나 개선시키는 등의 효과를 얻을 수 있다.

본 명세서에 의해 개시되는 내용의 일 구체예는 진핵 세포에서 면역 참여 유전자를 변형하는 방법에 관한 것으로, 이것은 생체 내, 생체 외 또는 시험관내에서 이루어질 수 있다.

일부 실시형태에서, 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 시료추출하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다.

상기 방법은 진핵세포에 유전자 조작용 조성물을 도입시키는 단계를 포함하는, 진핵세포를 인위적으로 조작하는 방법일 수 있다.

상기 도입 단계는 생체 내 또는 생체 외에서 수행될 수 있다.

예를 들어, 도입 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.

예를 들어, 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.

이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.

이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.

실험방법

1. sgRNA 설계

CRISPR RGEN Tools (Institute for Basic Science, Korea)을 사용하여 인간의 C3 및 Myd88 유전자에 대한 CRISPR/SpCas9 또는 CRISPR/CjCas9 표적 부위들 중에서 2-base-mismatch까지의 off-target이 예측되지 않는 것들을 선별하였다. 실험에 이용된 sgRNA는 표 5 내지 표 8에 기재된 가이드 서열들 중 적어도 하나 이상을 포함하도록 설계하였다.

2. Guide RNA의 활성 검증 및 off-target 분석

HEK293 세포주에 각각의 guide RNA 서열이 cloning된 sgRNA발현용 벡터를 Cas9 발현용 벡터와 함께 Lipofectamine 2000 또는 Electroporation을 통해 transfection 하였다. 약 2 ~ 3일 후 genomic DNA를 추출하고 PCR로 on-target위치를 증폭시킨 후, Next-Generation Sequencing을 위한 sequencing primer에 특이적인 adaptor 및 TruSeq HT 이중 지표 프라이머(TruSeq HT Dual Index primers)를 붙이는 추가적인 PCR을 진행하였다. 이후 paired sequencing을 통하여 나온 read들을 분석하여 on-target 유전체 위치에서의 insertion 또는 deletion (Indels) 확인을 통해 guide RNA들의 활성을 평가하였다.

선별된 guide RNA의 off-target 분석을 위해서는 첫 번째, CRISPR RGEN Tools의 Cas-Offinder를 사용한 in-silico 방법으로 3-base mismatch가 있는 off-target list들을 선별하고, 각각의 off-target에 해당하는 유전체상의 특정 부분에 대한 targeted-deep sequencing을 통한 방법으로 검증하였다. 두 번째 방법으로는, guide RNA와 Cas9 단백질을 37℃에서 overnight로 처리한 인간의 전체 genomic DNA를 Whole Genome Sequencing을 하고, 이후 Digenome-seq 분석을 통해서 잠재적인 list들을 확보하였다. 이후 off-target 후보들 각각의 유전체상의 특정 부분에 대한 targeted-deep sequencing을 통한 방법으로 off-target 위치에서의 indel 도입 여부를 검증하였다.

3. AAV 제작

SpCas9의 유전자교정 도구 전달은 dual AAV system을 사용하였다. 즉, AAV2의 역위 말단 반복(Inverted Tandem Repeat, ITR)사이에 Mammalian 발현용 promoter인 EFS, C- 또는 N-말단에 NLS와 HA태그를 가지는 human codon 최적화된 Cas9, BGHA를 포함하는 벡터 (pAAV-EFS-SpCas9) 및 U6 promoter sgRNA서열을 포함하는 벡터 (pAAV-U6-sgRNA)를 각각 합성하여 제작하였다. CjCas9의 유전자교정 도구 전달은 single AAV system을 사용하였다. 즉, AAV2 ITR사이에 EFS promoter C- 또는 N-말단에 NLS와 HA태그를 가지는 human codon 최적화된 Cas9, BGHA, U6 promoter와 sgRNA 서열을 포함하는 벡터(pAAV-EFS-CjCas9-U6-sgRNA)를 합성하여 제작하였다. AAV 생산은, AAV capsid의 위형(pseudotype)에 대한 벡터, 제작된 pAAV 벡터(pAAV-EFS-SpCas9 또는 pAAV-U6-sgRNA 또는 pAAV-EFS-CjCas9-U6-sgRNA), pHelper vector를 1:1:1의 몰농도로 HEK293세포에 동시에 transfection하였다. 72시간 후, 세포를 융해한 후 얻은 virus particle을 iodixanol(Sigma-aldrich)을 이용해 step-gradient 초원심분리기로 분리정제하고, AAV의 정량적인 확인은 qPCR을 이용한 titration 방법으로 측정하였다.

4. 망막하 주사

2~3주령의 생쥐의 복강에 2.25 mg/kg의 틸레타민(tiletamine)/졸라제팜(zolazepam) 및 0.7 mg/kg의 자일라진 하이드로클로라이드(xylazine hydrochloride) 혼합물을 주사하여 마취시켰다. 수술용 현미경(Leica Microsystems Ltd.) 하에서 33 gauge 블런트 니들이 있는 Nanofil 주사기(World Precision Instruments Inc.)를 사용하여 2 ㎕의 AAV(2 × 10¹⁰ ~ 2 × 10¹¹ 바이러스 게놈)를 망막하로 주사하였다(subretinal injection).

5. In vivo indel 분석

망막색소상피-맥락막-공막 조직 및 망막 조직을 PBS로 세척하고, 망막색소상피는 용해 버퍼(NucleoSpin Tissue, Macherey-Nagel)에 담은 후 30초 간 볼텍싱(vortexing)하여 맥락막 및 공막으로부터 분리하였다. 게놈 DNA는 PCR 및 Next-Generation-Sequencing을 통해 on-target 및 off-target에 대한 indel 분석에 사용되었다.

6. 내독소 유발 포도막염 모델 평가

내독소 유발 포도막염(Endotoxin-induced uveitis) 모델은, 마우스의 유리체내로 250ng의 E.coli 055:B5 유래 lipopolysaccharide를 주사하여 유발하였고, 48시간 후에 iris hyperemia, pupil, exudate in anterior chamber, hypopyon 항목 등의 반응평가를 실시하였다.

7. 자가면역 포도막염 모델 평가

자가면역 포도막염(experimental autoimmune uveitis) 모델은 마우스의 피부하로 300㎍ IRBP1-20을 complete Freund’s adjuvant 200㎕에 녹여 주사하고, 200ng의 pertussis toxin을 복강내 주사하여 유발하고 이틀 간격으로 안저검사를 통해 반응 평가를 실시하였다. 또한 IRBP1-20 및 pertussis 주사 4주 후 마우스를 sacrifice하여 안구를 적출하고, papaffin block제작/section을 통해 hematoxylin and eosin 염색 후 조직학적 평가를 시행하였다.

실험결과

1. gRNA 선별을 위한 indel 확인

각 gRNA 별 indel(%)는 activity(Indel induction level)로 기재하였고, 이때, indel이 10% 미만은 activity ++; 20% 미만은 activity +++; 30% 미만은 activity ++++; 30% 이상은 activity +++++; 및 50% 이상은 activity ++++++로 나타냈다.

① MYD88 유전자를 위한 gRNA 선별

CjCas9을 위한 MYD88 유전자를 표적하는 gRNA 선별(gRNA selection to target MYD88 gene for CjCas9)

Name	Target(w/o PAM)(SEQ ID NO)	Mismatch(0b, 1b, 2b)	GC content (%)	Activity (Indel induction level)
Cj22-hMyd88-E01-#03	GGTCCAGTCGGCCGCCACCTGT(SEQ ID NO: 21)	1, 0, 0	72.7	++
Cj22-hMyd88-E01-#04	GCGCTGGCGGAGGAGATGGACT(SEQ ID NO: 22)	1, 0, 0	68.2	++
Cj22-hMyd88-E01-#07	ACCAATGCTGGGTCCCAGCTCC(SEQ ID NO: 25)	1, 0, 0	63.6	++
Cj22-hMyd88-E02-#01	GCCTCCTCCTGCTGCTGCTTCA(SEQ ID NO: 26)	1, 0, 0	63.6	++
Cj22-hMyd88-E03-#01	CTGTTCCAGTTGCCGGATCATC(SEQ ID NO: 29)	1, 0, 0	54.5	++
Cj22-hMyd88-E04-#01	TCAGAGACAACCACCACCATCC(SEQ ID NO: 35)	1, 0, 0	54.5	++
Cj22-hMyd88-E04-#02	AGGAATGTGACTTCCAGACCAA(SEQ ID NO: 36)	1, 0, 0	45.5	++
Cj22-hMyd88-E05-#01	TGATGGGGATCAGTCGCTTCTG(SEQ ID NO: 37)	1, 0, 0	54.5	++
Cj22-hMyd88-E05-#02	CATCAGAAGCGACTGATCCCCA(SEQ ID NO: 38)	1, 0, 0	54.5	++
Cj22-hMyd88-E05-#03	CTGGGGAACTCTTTCTTCATTG(SEQ ID NO: 39)	1, 0, 0	45.5	++
Cj22-hMyd88-E05-#04	CCTGAGGTTCATCACTGTCTGC(SEQ ID NO: 40)	1, 0, 0	54.5	++

SpCas9을 위한 MYD88 유전자를 표적하는 gRNA 선별(gRNA selection to target MYD88 gene for SpCas9)

Name	Target(w/o PAM)(SEQ ID NO)	Mismatch(0b, 1b, 2b)	GC content (%)	Activity (Indel induction level)
Sp20-hMyd88-E01-#05	GTTCTTGAACGTGCGGACAC(SEQ ID NO: 155)	1, 0, 0	55.0	++++++
Sp20-hMyd88-E01-#07	CTCCGCCAGCGCGGTCCAGT(SEQ ID NO: 157)	1, 0, 0	75.0	++++++
Sp20-hMyd88-E01-#08	GTCCATCTCCTCCGCCAGCG(SEQ ID NO: 158)	1, 0, 0	70.0	++++++
Sp20-hMyd88-E01-#09	GGCCGACTGGACCGCGCTGG(SEQ ID NO: 159)	1, 0, 0	80.0	++++++
Sp20-hMyd88-E01-#11	GTACTTGGAGATCCGGCAAC(SEQ ID NO: 161)	1, 0, 0	55.0	++++++
Sp20-hMyd88-E01-#21	CACGTCGTCGCGGCCCAGCT(SEQ ID NO: 171)	1, 0, 0	75.0	+++++
Sp20-hMyd88-E01-#22	GCTCCAGCAGCACGTCGTCG(SEQ ID NO: 172)	1, 0, 0	70.0	++++++
Sp20-hMyd88-E03-#01	ATGAAGGCATCGAAACGCTC(SEQ ID NO: 177)	1, 0, 0	50.0	++++++
Sp20-hMyd88-E03-#02	GCACAAACTGGATGTCGCTG(SEQ ID NO: 178)	1, 0, 0	55.0	++++++
Sp20-hMyd88-E03-#05	GCAGGAGATGATCCGGCAAC(SEQ ID NO: 181)	1, 0, 0	60.0	++++++
Sp20-hMyd88-E04-#01	TGATGATTACCTGCAGAGCA(SEQ ID NO: 183)	1, 0, 0	45.0	++++
Sp20-hMyd88-E05-#01	GGGGATCAGTCGCTTCTGAT(SEQ ID NO: 184)	1, 0, 0	55.0	++++++
Sp20-hMyd88-E05-#02	TGGGGATCAGTCGCTTCTGA(SEQ ID NO: 185)	1, 0, 0	55.0	++++++
Sp20-hMyd88-E05-#03	CGCAGACAGTGATGAACCTC(SEQ ID NO: 186)	1, 0, 0	55.0	++++++
Sp20-hMyd88-E05-#05	GCGAGTCCAGAACCAAGATT(SEQ ID NO: 188)	1, 0, 0	50.0	++++++

② C3 유전자를 위한 gRNA 선별

CjCas9을 위한 C3 유전자를 표적하는 gRNA 선별(gRNA selection to target C3 gene for CjCas9)

Name	Target(w/o PAM)(SEQ ID NO)	Mismatch(0b, 1b, 2b)	GC content (%)	Activity (Indel induction level)
Cj22-hC3-E03-#04	ATGGTCTTGTCTGTCTGGATGA(SEQ ID NO: 49)	1, 0, 0	45.5	++++
Cj22-hC3-E06-#01	TTCTCCACTGAGTTTGAGGTGA(SEQ ID NO: 51)	1, 0, 0	45.5	++
Cj22-hC3-E07-#01	CTCCACTATGACCTCGAAACTG(SEQ ID NO: 52)	1, 0, 0	50.0	++
Cj22-hC3-E10-#03	CAGATCCACTTCACCAAGACAC(SEQ ID NO: 64)	1, 0, 0	50.0	++++
Cj22-hC3-E10-#04	AGGTCAAAGGGCATTCCTGGTT(SEQ ID NO: 65)	1, 0, 0	50.0	++
Cj22-hC3-E11-#06	GGCGTGGCCAAACTCAGCATCA(SEQ ID NO: 71)	1, 0, 0	59.1	++
Cj22-hC3-E13-#01	GAAGTCGGTGGTGATGGACAGG(SEQ ID NO: 78)	1, 0, 0	59.1	++
Cj22-hC3-E15-#01	CGTGGTGGAGAAGGCAGACATC(SEQ ID NO: 90)	1, 0, 0	59.1	++
Cj22-hC3-E17-#02	TCGCAGCACTTGCGCAGCTCCT(SEQ ID NO: 95)	1, 0, 0	63.6	++
Cj22-hC3-E17-#03	GGGTTCTCCCGCATGCCGTCCT(SEQ ID NO: 96)	1, 0, 0	68.2	++
Cj22-hC3-E20-#01	TTACTGTGACCTCGAAGGGGTC(SEQ ID NO: 100)	1, 0, 0	54.5	++
Cj22-hC3-E21-#02	TCACCACGACCTTCAGGGACTT(SEQ ID NO: 102)	1, 0, 0	54.5	++
Cj22-hC3-E22-#01	CAGAATGAACAAAACTGTGGCT(SEQ ID NO: 103)	1, 0, 0	40.9	++
Cj22-hC3-E23-#02	TGCAGACCTCAGTGACCAAGTC(SEQ ID NO: 105)	1, 0, 0	54.5	++
Cj22-hC3-E25-#01	GGTTGTCTGAAGGCCAGCTGCT(SEQ ID NO: 109)	1, 0, 0	59.1	++
Cj22-hC3-E26-#01	GGGTCTTCCAGGAGGATGCGCC(SEQ ID NO: 112)	1, 0, 0	68.2	++++
Cj22-hC3-E28-#01	CAACTACATGAACCTACAGAGA(SEQ ID NO: 114)	1, 0, 0	40.9	++
Cj22-hC3-E29-#01	TTCATTGAGCCAACGCACGACG(SEQ ID NO: 115)	1, 0, 0	54.5	++
Cj22-hC3-E29-#02	GTCGTGCGTTGGCTCAATGAAC(SEQ ID NO: 116)	1, 0, 0	54.5	++
Cj22-hC3-E29-#03	GTAGTATCTCTGTTCATTGAGC(SEQ ID NO: 117)	1, 0, 0	40.9	++
Cj22-hC3-E30-#01	CTTTTGGTATTGAGCCAAGGCT(SEQ ID NO: 118)	1, 0, 0	45.5	++
Cj22-hC3-E30-#02	TTCATGGTGTTCCAAGCCTTGG(SEQ ID NO: 119)	1, 0, 0	50.0	++
Cj22-hC3-E30-#03	GCAGGAGGCTGGCAGATTCCCA(SEQ ID NO: 120)	1, 0, 0	63.6	++
Cj22-hC3-E30-#04	CTGCCAGCCTCCTGCGATCAGA(SEQ ID NO: 121)	1, 0, 0	63.6	++

SpCas9을 위한 C3 유전자를 표적하는 gRNA 선별(gRNA selection to target C3 gene for SpCas9)

Name	Target(w/o PAM)(SEQ ID NO)	Mismatch(0b, 1b, 2b)	GC content	Activity (Indel induction level)
Sp20-hC3-E04-#04	ACAAGCTGCTACCCGTGGGC(SEQ ID NO: 211)	1, 0, 0	65.0	++++++
Sp20-hC3-E04-#05	GCTGCTACCCGTGGGCCGGA(SEQ ID NO: 212)	1, 0, 0	75.0	++++++
Sp20-hC3-E11-#02	GACTGCCACGGGGACTCGGT(SEQ ID NO: 243)	1, 0, 0	70.0	++++++
Sp20-hC3-E11-#03	TCCAGCCTACCGAGTCCCCG(SEQ ID NO: 244)	1, 0, 0	70.0	++++++
Sp20-hC3-E11-#04	CGAGTCCCCGTGGCAGTCCA(SEQ ID NO: 245)	1, 0, 0	70.0	++++++
Sp20-hC3-E13-#15	GACGTCCACCCACACGGAGT(SEQ ID NO: 262)	1, 0, 0	65.0	++++++
Sp20-hC3-E13-#16	GGTGGCCGACTCCGTGTGGG(SEQ ID NO: 263)	1, 0, 0	75.0	+++
Sp20-hC3-E13-#17	CTCCGTGTGGGTGGACGTCA(SEQ ID NO: 264)	1, 0, 0	65.0	++++++
Sp20-hC3-E15-#03	GCGTAATCCTTCCCACTGCC(SEQ ID NO: 274)	1, 0, 0	60.0	++++
Sp20-hC3-E16-#02	CACGGAACGGCGTCGGCGGG(SEQ ID NO: 284)	1, 0, 0	80.0	++
Sp20-hC3-E16-#03	CTGCACGGAACGGCGTCGGC(SEQ ID NO: 285)	1, 0, 0	75.0	+++++
Sp20-hC3-E16-#04	GCTGCACGGAACGGCGTCGG(SEQ ID NO: 286)	1, 0, 0	75.0	+++++
Sp20-hC3-E20-#03	CTGCATTACTGTGACCTCGA(SEQ ID NO: 312)	1, 0, 0	50.0	++++
Sp20-hC3-E20-#04	AGGACTTCTTCATCGACCTG(SEQ ID NO: 313)	1, 0, 0	50.0	+++++
Sp20-hC3-E20-#05	TCGTTTCGAACAACAGAGTA(SEQ ID NO: 314)	1, 0, 0	40.0	++
Sp20-hC3-E20-#06	CTCTGTTGTTCGAAACGAGC(SEQ ID NO: 315)	1, 0, 0	50.0	++
Sp20-hC3-E20-#07	TGTTGTTCGAAACGAGCAGG(SEQ ID NO: 316)	1, 0, 0	50.0	++

2. 마우스의 안구에서 온-타겟 및 오프-타겟 효과 확인

Myd88 유전자 또는 C3 유전자를 표적하는 gRNA 및 Cas9를 포함하는 AAV를 마우스의 망막하에 주사하였고, 전달된 gRNA 및 Cas9에 의한 Myd88 유전자 및 C3 유전자의 각각 온-타겟 및 오프-타겟 효과를 망막(Retina) 세포 및 망막 색소 상피세포(retinal pigment epithelial(RPE) cells)에서 확인하였다.

각각의 온-타겟과 오프-타겟의 서열은 다음의 표13 및 표 14와 같다. 각각의 온-타겟과 오프-타겟의 서열은 Cas9의 종류에 따라 Cj(CjCas9) 또는 Sp(SpCas9)로 구분하여 표시하였고, 오프-타겟의 경우, 미스매치되는 서열을 소문자로 나타냈으며, PAM 서열은 기울임꼴로 표시하였다.

C3 유전자를 위한 온-타겟 및 오프-타겟

C3-Sp	DNA(5' to 3')(SEQ ID NO)	Chromosome	Mismatches
on-target	GACAACAACCTACTGCCCGT-GGG(SEQ ID NO: 831)	chr17	0
off1	GACAAgAACCTACTGCaCaT-CAG(SEQ ID NO: 832)	chr3	3
off2	GcCAACcACCTACTGCCCtT-CAG(SEQ ID NO: 833)	chr7	3
off3	GAaAACAAgCTACTGCCCtT-GAG(SEQ ID NO: 834)	chr9	3

C3-Cj	DNA(5' to 3')(SEQ ID NO)	Chromosome	Mismatches
on-target	GAGTGCAGGATGACAGTGACGG-AGACATAC(SEQ ID NO: 835)	chr17	0
off1	GAcaGCAGGgTGACAGTGACtG-TGCTGCAC(SEQ ID NO: 836)	chr1	4
off2	GttTGCAGGATGcCAGTGAtGG-GATGACAC(SEQ ID NO: 837)	chr13	4
off3	GgGTGgAGGATGACAGTGAgGt-GTGTACAC(SEQ ID NO: 838)	chr14	4

Myd88 유전자를 위한 온-타겟 및 오프-타겟

Myd88-Sp	DNA(5' to 3')(SEQ ID NO)	Chromosome	Mismatches
on-target	GAGGGTTCAAGAACAGCGAT-AGG(SEQ ID NO: 839)	chr9	0
off1	GAtGGTTCAAGAACAttGAT-CAG(SEQ ID NO: 840)	chr3	3
off2	GAGGGTTCAAGAgaAGgGAT-GGG(SEQ ID NO: 841)	chr4	3
off3	cAGGtTTCAAGAcCAGCGAT-GAG(SEQ ID NO: 842)	chr5	3
off4	GAGGGTTgAgGAACgGCGAT-CGG(SEQ ID NO: 843)	chr16	3
off5	GAGGGTTCcAGAACAGCcAg-GGG(SEQ ID NO: 844)	chr16	3
off6	GAGGGTTCAAGAACAGgGtc-CGG(SEQ ID NO: 845)	chr16	3
off7	GAGGGacCAAGAcCAGCGAT-CAG(SEQ ID NO: 846)	chr16	3
off8	GAaGGTTCAAGAACAGgGAg-AAG(SEQ ID NO: 847)	chr13	3
off9	GAGGGTTaAAGAACAGCcgT-GAG(SEQ ID NO: 848)	chr2	3
off10	cAGGGTTgAAGAACAGgGAT-TGG(SEQ ID NO: 849)	chr2	3
off11	GAGaGTTgAAGAACAGCcAT-GAG(SEQ ID NO: 850)	chr19	3
off12	GAGaGTTtAAGAACAGtGAT-AGG(SEQ ID NO: 851)	chr15	3
off13	GAGGGTTaAAGAACAGaGgT-GGG(SEQ ID NO: 852)	chr10	3
off14	GAGGGTTCAAGAtCAGaGgT-TAG(SEQ ID NO: 853)	chrX	3

Myd88-Cj	DNA(5' to 3')(SEQ ID NO)	Chromosome	Mismatches
on-target	GGTGCCCGGCAGGACGTCACGG-TCGGACAC(SEQ ID NO: 854)	chr9	0
off1	GGTtCCtGGCAGGtCtTCAgGG-AGAAACAC(SEQ ID NO: 855)	chr8	5
off2	GGTGCCCGGCcGGgCGcCgCGc-CTTTGTAC(SEQ ID NO: 856)	chr3	5
off3	GtaGCCCtGCAGGAaGTCAaGG-CAGAACAC(SEQ ID NO: 857)	chr7	5
off4	GGTGCCgGGCAGGAaGTgggGG-GAAGATAC(SEQ ID NO: 858)	chr7	5

그 결과, Retina cell 및 RPE cell에서 각각 Myd88 유전자 및 C3 유전자의 온-타겟에서 인델이 나타나는 것을 확인하였다. 또한, 오프-타겟에서는 인델이 발생하지 않는 것을 확인하여 gRNA 및 Cas9이 표적 특이적으로 작동함을 확인하였다(도 1 및 도 2). 따라서, 본 연구에서 제시한 MYD88 유전자 및 C3 유전자를 위한 AAV 또는 그의 변이체는 망막하 주입을 통해 Uveitis 치료를 위해 사용될 수 있을 것으로 기대된다.

본 발명은 면역 참여 유전자를 표적화하는 가이드핵산 및 에디터단백질을 포함하는 유전자 조작용 조성물을 이용해 면역 참여 유전자를 인위적으로 조작 및/또는 변형하여 면역 참여 유전자의 기능 및/또는 발현을 조절하여 인위적으로 면역 기능조절하도록 하므로, 이를 이용하여 면역 기능이상 질환의 개선 또는 치료에 이용할 수 있다.

MYD88 유전자 및 C3 유전자의 표적 서열, 및 이를 표적할 수 있는 가이드 서열

Claims

유전자 조작용 조성물을 치료 대상에 도입(투여)하는 단계를 포함하는 포도막염(Uveitis)을 치료하는 방법으로,

상기 유전자 조작용 조성물은

면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및

에디터단백질 또는 이를 암호화하는 핵산 서열을 포함하며,

상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자이고,

상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합인,

포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제2항에 있어서,

상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제2항에 대해서,

상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 플라스미드 또는 1 이상의 바이러스 벡터에 존재하는 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제8항에 있어서,

상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태이며, 상기 가이드핵산은 guide RNA(gRNA)인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 도입(투여)은 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행되는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 도입(투여)은 망막하(subretinal), 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic) 및 복막내(intraperitoneally) 중에서 선택된 투여 경로로 수행되는 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
제1항에 있어서,

상기 치료 대상은 인간, 원숭이, 마우스, 래트를 포함하는 포유동물인 것을 특징으로 하는 포도막염(Uveitis)을 치료하는 방법.
면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및

에디터단백질 또는 이를 암호화하는 핵산 서열

을 포함하는 유전자 조작용 조성물로,

상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자이고,

상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열이며,

상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합인,

유전자 조작용 조성물.
제14항에 있어서,

상기 표적 서열은 면역 참여 유전자의 exon에 위치하는 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 표적 서열은 SEQ ID NO: 19 내지 SEQ ID NO: 416 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
제16항에 있어서,

상기 표적 서열은 SEQ ID NO: 21, 22, 25, 26, 29, 35, 36, 37, 38, 39, 40, 155, 157, 158, 159, 161, 171, 172, 177, 178, 181, 183, 184, 185, 186 및 188 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
제16항에 있어서,

상기 표적 서열은 SEQ ID NO: 49, 51, 52, 64, 65, 71, 78, 90, 95, 96, 100, 102, 103, 105, 109, 112, 114, 115, 116, 117, 118, 119, 120, 121, 211, 212, 243, 244, 245, 262, 263, 264, 274, 284, 285, 286, 312, 313, 314, 315 및 316 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 가이드핵산은 가이드 도메인은 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
제23항에 있어서,

상기 가이드 서열은 상기 가이드 도메인에 포함되는 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 플라스미드 또는 1 이상의 바이러스 벡터에 존재하는 것을 특징으로 하는 유전자 조작용 조성물.
제27항에 있어서,

상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것을 특징으로 하는 유전자 조작용 조성물.
제14항에 있어서,

상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태이며, 상기 가이드핵산은 guide RNA(gRNA)인 것을 특징으로 하는 유전자 조작용 조성물.
면역 참여 유전자(immune participation gene) 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산으로,

상기 면역 참여 유전자는 MYD88 유전자 또는 C3 유전자이며,

상기 가이드 서열은 SEQ ID NO: 417 내지 SEQ ID NO: 814로 구성된 서열들 중 선택된 하나 이상의 서열이고,

상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합이며,

상기 가이드핵산은 에디터단백질과 복합체를 형성할 수 있는 가이드핵산.
제30항에 대해서,

상기 가이드 서열은 SEQ ID NO: 419, 420, 423, 424, 427, 433, 434, 435, 436, 437, 438, 553, 555, 556, 557, 559, 569, 570, 575, 576, 579, 581, 582, 583, 584 및 586 중 선택된 하나 이상의 서열인 것을 특징으로 하는 가이드핵산.
제30항에 대해서,

상기 가이드 서열은 SEQ ID NO: 447, 449, 450, 462, 463, 469, 476, 488, 493, 494, 498, 500, 501, 503, 507, 510, 512, 513, 514, 515, 516, 517, 518, 519, 609, 610, 641, 642, 643, 660, 661, 662, 672, 682, 683, 684, 710, 711, 712, 713 및 714 중 선택된 하나 이상의 서열인 것을 특징으로 하는 가이드핵산.
제30항에 있어서,

상기 가이드 서열은 MYD88 유전자의 exon 1, exon 2, exon 3, exon 4 또는 exon 5에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 가이드핵산.
제30항에 있어서,

상기 가이드 서열은 C3 유전자의 exon 3, exon 4, exon 6, exon 7, exon 10, exon 11, exon 13, exon 15, exon 16, exon 17, exon 20, exon 21, exon 22, exon 23, exon 25, exon 26, exon 28, exon 29 또는 exon 30에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 가이드핵산.
제30항에 있어서,

상기 가이드핵산은 가이드 도메인은 포함하는 것을 특징으로 하는 가이드핵산.
제35항에 있어서,

상기 가이드 서열은 상기 가이드 도메인에 포함되는 것을 특징으로 하는 가이드핵산.
제30항에 있어서,

상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함하는 것을 특징으로 하는 가이드핵산.