KR20220138341A

KR20220138341A - Guide RNA complementary to TRAC gene and use thereof

Info

Publication number: KR20220138341A
Application number: KR1020220041232A
Authority: KR
Inventors: 안재형; 한나경; 김동희
Original assignee: 주식회사 셀렌진
Priority date: 2021-04-05
Filing date: 2022-04-01
Publication date: 2022-10-12

Abstract

The present invention relates to a guide RNA complementary to a TRAC gene and uses thereof. The guide RNA, a vector containing the same, and a TRAC gene editing composition comprising the guide RNA, and Cas9 editor protein or a variant thereof according to one aspect can effectively eliminate the TRAC gene from the genome of a cell or organism, and through the same, the TRAC gene editing composition can be usefully used to prevent or treat cancer as personalized medicine or precision medicine.

Description

Guide RNA complementary to TRAC gene and use thereof

TRAC 유전자에 상보적인 가이드 RNA 및 이의 용도에 관한 것이다.It relates to a guide RNA complementary to a TRAC gene and uses thereof.

유전자 가위는 유전자에 결합하여 특정 DNA 부위를 절단하여 사용하는 효소 또는 이를 이용한 유전체 편집(genome editing) 기법을 말한다. 유전자 가위를 이용하여 줄기세포 또는 체세포에서 유전병의 원인이 되는 돌연변이 교정, 항암 세포 치료제와 같이 다양한 분야에서 활용할 수 있다. 유전자 가위 기술은 1세대 ZFN(zinc finger nuclease), 2세대 TALEN(transcription activator-like effector nuclease) 및 3세대 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9으로 발전해왔다.Gene scissors refers to an enzyme that binds to a gene and cuts a specific DNA region, or a genome editing technique using the same. Using gene scissors, it can be used in various fields such as correction of mutations that cause genetic diseases in stem cells or somatic cells, and anticancer cell therapy. The gene editing technology has evolved into the first generation zinc finger nuclease (ZFN), the second generation TALEN (transcription activator-like effector nuclease), and the third generation CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9.

크리스퍼 유전자 가위(CRISPR/Cas9)는 표적으로 정한 DNA의 특정 염기 서열 정보를 갖는 가이드(Guide) RNA와 Cas9 뉴클레아제로 구성되며, 이를 세포 내로 전달하여 유전자를 원하는 위치에서 절단하거나 기존 유전자를 제거하고 새로운 유전자를 삽입할 수 있다. 유전자 가위를 이용하여 특정 DNA를 절단할 때, Cas9 뉴클레아제는 가이드 RNA의 서열에 의해 특정된 DNA 표적 서열을 절단한다. 유전자 가위를 이용하여 유전체를 편집하는 방법은 한국 공개 번호 10-2015-0101478 등 다수의 문헌을 통해 알려져 있다. 최근에는 표적 이외의 지점을 절단하는 표적이탈(off-target) 발생 확률을 줄이기 위해 정확성을 높인 Cas9 변이체들이 개발되었다. 이러한 고-정확도(high-fidelity) 변이체로는 HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1, xCas9 등이 있다.CRISPR gene scissors (CRISPR/Cas9) consists of a guide RNA and Cas9 nuclease having specific nucleotide sequence information of the targeted DNA, and delivers it into the cell to cut a gene at a desired location or remove an existing gene. and insert new genes. When cleaving specific DNA using gene scissors, Cas9 nuclease cleaves the DNA target sequence specified by the sequence of the guide RNA. A method of editing a genome using gene scissors is known through a number of documents such as Korean Publication No. 10-2015-0101478. Recently, Cas9 variants with increased accuracy have been developed to reduce the probability of off-target that cuts off-target points. Such high-fidelity variants include HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1, xCas9, and the like.

TRAC(T Cell Receptor Alpha Constant)은 면역세포인 T 세포 표면에 분포하며, 멤브레인 단백질 복합체로 항원에 대한 T 세포의 자연 반응에 필수적인 역할을 하는 TCR(T Cell Receptor)을 발현하는 유전자이다. TCR은 주조직 적합성 복합체(Major Histocompatibility Complex, MHC)라는 분자를 통해 암 세포 항원을 인식하는데, MHC는 사람마다 다른 특정한 조합을 갖고 있기 때문에 TCR이 항원을 인식하기 위해서는 MHC 분자와 정확히 들어맞아야 한다. MHC가 다를수록 격렬한 거부반응이 나타나므로, 동종유래(allogeneic) 치료제의 개발에 있어 이식편대숙주병(Graft-versus-Host Disease, GvHD)의 발생을 억제하는 것이 핵심이며, 따라서 TRAC 유전자는 중요한 치료적 표적이다. TRAC (T Cell Receptor Alpha Constant) is a gene that expresses TCR (T Cell Receptor), which is distributed on the surface of T cells, which are immune cells, and plays an essential role in the natural response of T cells to antigens as a membrane protein complex. TCR recognizes cancer cell antigens through a molecule called Major Histocompatibility Complex (MHC). Since MHC has a specific combination that differs from person to person, the TCR must precisely match the MHC molecule in order to recognize the antigen. Suppression of the occurrence of Graft-versus-Host Disease (GvHD) is the key in the development of allogeneic therapeutics, since the more different MHCs are, the more intense the rejection reaction. Therefore, the TRAC gene is an important treatment enemy target.

따라서, TRAC 유전자를 표적으로 하는 가이드 RNA를 개발할 필요가 있다.Therefore, there is a need to develop guide RNAs targeting the TRAC gene.

일 양상은 서열번호 1 내지 4로 이루어진 군으로부터 선택된 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA를 제공하는 것이다.One aspect is to provide a guide RNA comprising a nucleic acid sequence identical to or complementary to a polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4.

다른 양상은 상기 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체를 포함하는 CRISPR/Cas9 시스템 및 이를 포함하는 재조합 벡터를 제공하는 것이다.Another aspect is to provide a CRISPR/Cas9 system comprising the guide RNA and the Cas9 editor protein or a variant thereof, and a recombinant vector comprising the same.

또 다른 양상은 상기 가이드 RNA, CRISPR/Cas9 시스템 및 이들을 포함하는 재조합 벡터를 포함하는 TRAC 유전자 편집용 조성물을 제공하는 것이다.Another aspect is to provide a composition for TRAC gene editing comprising the guide RNA, the CRISPR / Cas9 system, and a recombinant vector comprising them.

본 출원의 다른 목적 및 이점은 첨부한 청구범위 및 도면과 함께 하기의 상세한 설명에 의해 보다 명확해질 것이다. 본 명세서에 기재되지 않은 내용은 본 출원의 기술 분야 또는 유사한 기술 분야 내 숙련된 자이면 충분히 인식하고 유추할 수 있는 것이므로 그 설명을 생략한다.Other objects and advantages of the present application will become more apparent from the following detailed description in conjunction with the appended claims and drawings. Content not described in this specification will be omitted because it can be sufficiently recognized and inferred by those skilled in the technical field or similar technical field of the present application.

본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.Each description and embodiment disclosed in this application is also applicable to each other description and embodiment. That is, all combinations of the various elements disclosed in this application fall within the scope of this application. In addition, it cannot be seen that the scope of the present application is limited by the detailed description described below.

일 양상은 서열번호 1 내지 4로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA를 제공한다.One aspect provides a guide RNA comprising a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4.

본 명세서에서, 용어 "가이드(guide) RNA"는 RNA 편집(editing)을 통해 세포내에서 표적 DNA를 절단, 삽입, 또는 연결시키는 폴리뉴클레오티드를 말한다. 상기 가이드 RNA는 단일-사슬 가이드 RNA(single-chain guide RNA, sgRNA)일 수 있다. 상기 가이드 RNA는 표적 핵산 서열에 특이적인 crRNA(CRISPR RNA)일 수 있다. 상기 가이드 RNA는 Cas9 뉴클레아제와 상호작용하는 tracrRNA(trans-activating crRNA)를 더 포함할 수 있다. 상기 tracrRNA는 루프(loop) 구조를 형성하는 폴리뉴클레오티드를 포함할 수 있다. As used herein, the term "guide RNA" refers to a polynucleotide that cuts, inserts, or connects a target DNA in a cell through RNA editing. The guide RNA may be a single-chain guide RNA (sgRNA). The guide RNA may be a crRNA (CRISPR RNA) specific for a target nucleic acid sequence. The guide RNA may further include a trans-activating crRNA (tracrRNA) that interacts with the Cas9 nuclease. The tracrRNA may include a polynucleotide forming a loop structure.

일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하기에 충분한, 표적 폴리뉴클레오티드 서열과의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. In general, a guide sequence is any polynucleotide sequence having sufficient complementarity with a target polynucleotide sequence to hybridize to the target sequence and induce sequence-specific binding of the CRISPR complex to the target sequence.

TRAC 유전자(T Cell Receptor Alpha Constant)는 면역세포인 T 세포 표면에 분포하며, 멤브레인 단백질 복합체로 항원에 대한 T 세포의 자연 반응에 필수적인 역할을 하는 TCR(T Cell Receptor)을 발현하는 유전자이다. TCR은 주조직 적합성 복합체(Major Histocompatibility Complex, MHC)라는 분자를 통해 암 세포 항원을 인식하는데, MHC는 사람마다 다른 특정한 조합을 갖고 있기 때문에 TCR이 항원을 인식하기 위해서는 MHC 분자와 정확히 들어맞아야 한다. MHC가 다를수록 격렬한 거부반응이 나타나므로, 동종유래(allogeneic) 치료제의 개발에 있어 이식편대숙주병(Graft-versus-Host Disease, GvHD)의 발생을 억제하는 것이 핵심이며, 따라서 TRAC 유전자는 중요한 치료적 표적으로 알려져있다. 상기 TRAC 유전자는 예를 들어, 각각 NCBI GenBank에 현재 등록된 NCBI Accession No. NG_001332.3 에 해당할 수 있다. 통상의 기술자라면 시퀀스 ID 등록번호를 이용하여 서열을 용이하게 확인할 수 있을 것이다. UCSC genome browser 또는 GenBank에 등록되어 있는 상기 Sequence ID 번호에 해당하는 구체적인 서열은 시간이 지남에 따라 다소 변경될 수 있다. 본 발명의 범위가 상기 변경된 서열에도 미치는 것은 통상의 기술자에게 자명할 것이다.TRAC gene (T Cell Receptor Alpha Constant) is a gene that expresses TCR (T Cell Receptor), which is distributed on the surface of T cells, which are immune cells, and plays an essential role in the natural response of T cells to antigens as a membrane protein complex. TCR recognizes cancer cell antigens through a molecule called Major Histocompatibility Complex (MHC). Since MHC has a specific combination that differs from person to person, the TCR must precisely match the MHC molecule in order to recognize the antigen. Suppression of the occurrence of Graft-versus-Host Disease (GvHD) is the key in the development of allogeneic therapeutics, since the more different MHCs are, the more intense the rejection reaction. Therefore, the TRAC gene is an important treatment known as an enemy target. The TRAC gene is, for example, NCBI Accession No. currently registered in NCBI GenBank, respectively. It may correspond to NG_001332.3. Those skilled in the art will be able to easily identify the sequence using the sequence ID accession number. The specific sequence corresponding to the Sequence ID number registered in the UCSC genome browser or GenBank may be slightly changed over time. It will be apparent to those skilled in the art that the scope of the present invention also extends to such altered sequences.

또한 TRAC 유전자 또는 TRAC 유전자가 발현하는 단백질의 발현 또는 활성을 감소시키기 위한 유전자 조작에 이용할 수 있는 염기 서열이라면 제한 없이 가이드 RNA로 이용할 수 있으며, 예컨대 상기 염기 서열은 TRAC 유전자와 혼성화할 수 있는 서열일 수 있고, 예를 들면 서열번호 1 내지 4로 이루어진 폴리뉴클레오티드 또는 이와 상보적인 핵산서열을 포함하는 것일 수 있다. 또한 상기 가이드 RNA의 기능을 변형/증진시키기 위하여 가이드 RNA 염기 서열의 일부분을 변형할 수 있다. 또한 일부 구현 예에서, 가이드 서열과 그의 상응하는 표적 서열 간의 상보성의 정도는 적절한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상이다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 (Smith-Waterman) 알고리즘, 니들만-분쉬 (Needleman-Wunsch) 알고리즘, 버로우즈-휠러 트랜스폼(Burrows-Wheeler Transform)에 기초한 알고리즘(예를 들어, 버로우즈 휠러 얼라이너(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, 노보얼라인 (Novocraft Technologies), ELAND(Illumina), SOAP(soap.genomics.org.cn에서 이용가능) 및 Maq(maq.sourceforge.net에서 이용가능)를 포함한다.In addition, any nucleotide sequence that can be used for genetic manipulation to reduce the expression or activity of the TRAC gene or the protein expressed by the TRAC gene can be used as a guide RNA without limitation, for example, the nucleotide sequence is a sequence capable of hybridizing with the TRAC gene. It may be, for example, one comprising a polynucleotide consisting of SEQ ID NOs: 1 to 4 or a nucleic acid sequence complementary thereto. In addition, a portion of the guide RNA nucleotide sequence may be modified in order to modify/enhance the function of the guide RNA. Also in some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence, when optimally aligned using an appropriate alignment algorithm, is about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% or more. Optimal alignment can be determined using any algorithm suitable for aligning sequences, non-limiting examples of which include the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, the Burroughs- Algorithms based on the Burrows-Wheeler Transform (eg Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novocraft Technologies, ELAND (Illumina), SOAP ( available at soap.genomics.org.cn) and Maq (available at maq.sourceforge.net).

상기 가이드 RNA는 길이가 10 뉴클레오티드 내지 30 뉴클레오티드일 수 있다. 상기 가이드 RNA는 길이가 예를 들어, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30 뉴클레오티드일 수 있다.The guide RNA may be 10 nucleotides to 30 nucleotides in length. The guide RNA has a length of, for example, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, or 30 nucleotides.

상기 가이드 RNA는 서열번호 1 내지 4로 이루어진 군으로부터 선택된 핵산 서열에서 2개 이상의 연속 폴리뉴클레오티드와 동일하거나 상보적인 핵산 서열을 포함할 수 있다. 상기 가이드 RNA는 서열번호 1 내지 4로 이루어진 군으로부터 선택된 표적 핵산 서열 중 PAM 서열을 제외한 나머지 핵산 서열에 상보적인 2 이상 연속 폴리뉴클레오티드를 포함할 수 있다. 상기 가이드 RNA는 1 내지 4로 이루어진 군으로부터 선택된 표적 핵산 서열 중 PAM 서열을 제외한 나머지 핵산 서열에 상보적인 폴리뉴클레오티드를 포함할 수 있다.The guide RNA may include a nucleic acid sequence identical to or complementary to two or more consecutive polynucleotides in a nucleic acid sequence selected from the group consisting of SEQ ID NOs: 1 to 4. The guide RNA may include two or more consecutive polynucleotides complementary to the remaining nucleic acid sequences except for the PAM sequence among the target nucleic acid sequences selected from the group consisting of SEQ ID NOs: 1 to 4. The guide RNA may include a polynucleotide complementary to the remaining nucleic acid sequences except for the PAM sequence among the target nucleic acid sequences selected from the group consisting of 1 to 4.

또한 상기 가이드 RNA에 있어서 상보적인 핵산 서열은 서열번호 1 내지 4로 이루어진 군으로부터 선택된 표적 핵산 서열 선택된 1종의 폴리뉴클레오티드가 전사된 폴리뉴클레오티드를 포함한 것일 수 있다. In addition, in the guide RNA, the complementary nucleic acid sequence may include a polynucleotide into which one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4 is transcribed.

상기 가이드 RNA는 RNA, DNA, PNA, 또는 이들의 조합을 포함할 수 있다. 상기 가이드 RNA는 화학적으로 변형된 것일 수 있다.The guide RNA may include RNA, DNA, PNA, or a combination thereof. The guide RNA may be chemically modified.

상기 가이드 RNA는 TRAC 유전자와 혼성화하는 것일 수 있고, 구체적으로 상기 가이드 RNA는 TRAC 유전자의 엑손(exon) 1 로 이루어진 부위에서 적어도 하나의 부위를 타겟으로하여 혼성화하거나 결합되는 것일 수 있다. The guide RNA may hybridize with the TRAC gene, and specifically, the guide RNA may hybridize or bind to at least one site in the region consisting of exon 1 of the TRAC gene.

상기 가이드 RNA는 프로그램 가능한 유전자 가위(programmable nuclease)의 구성요소일 수 있다. 유전자 가위는 유전체 상의 특정 위치를 인식하여 절단할 수 있는 모든 형태의 뉴클레아제를 의미한다. 상기 유전자 가위는 예를 들어, TALEN(transcription activator-like effector nuclease), 징크 핑거 뉴클레아제(zinc finger nuclease), 메가 뉴클레아제(meganuclease), RGEN(RNA-guided endonuclease), Cpf1 및 아고 상동체(Ago homolog, DNA guided endonuclease)이다. 상기 RGEN은 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 구성요소로 포함하는 뉴클레아제를 말한다. 상기 폴리뉴클레오티드는 예를 들어 RGEN의 구성요소이다.The guide RNA may be a component of a programmable nuclease. Genetic scissors refer to any type of nuclease that can cut by recognizing a specific position on the genome. The gene scissors are, for example, transcription activator-like effector nuclease (TALEN), zinc finger nuclease, meganuclease, RNA-guided endonuclease (RGEN), Cpf1 and allologs. (Ago homolog, DNA guided endonuclease). The RGEN refers to a nuclease comprising a guide RNA specific for a target DNA and a Cas protein as components. Said polynucleotide is, for example, a component of an RGEN.

또한 가이드 RNA는 TRAC 유전자의 핵산 서열 내 변형을 유도하는 것일 수 있다. 상기 가이드 RNA는 세포의 유전체에서 비상동성 말단-접합(non-homologous end-joining, NHEJ)에 의해 TRAC 단백질을 암호화하는 핵산 서열을 제거할 수 있다. 구체적으로 상기 핵산 서열 내 변형은 1) TRAC 유전자의 전부 또는 연속하는 1bp 내지 15bp의 염기서열 부위의 결실(deletion), 2) TRAC 유전자의 1 내지 15개의 뉴클레오티드의 야생형 유전자와 상이한 뉴클레오티드로의 치환, 3) 각각 독립적으로 A, T, C 및 G 중에서 선택된 1 내지 15개의 뉴클레오티드의 TRAC 로의 삽입(insertion), 또는 4) 상기 1) 내지 3) 중에서 선택된 2 가지 이상의 조합일 수 있다. 구체적으로 상기 결실은 TRAC 유전자의 연속하는 약 6 bp, 8 bp, 11 bp, 및/또는 13 bp의 염기서열 부위의 결실일 수 있으며, 상기 삽입은 1 bp, 4 bp, 6 bp, 8 bp, 11 bp, 또는 13 bp, 및/또는 15 bp 부위의 삽입일 수 있다. Also, the guide RNA may induce modification in the nucleic acid sequence of the TRAC gene. The guide RNA may remove the nucleic acid sequence encoding the TRAC protein by non-homologous end-joining (NHEJ) from the genome of the cell. Specifically, the modification in the nucleic acid sequence includes 1) deletion of all or a continuous 1bp to 15bp nucleotide sequence region of the TRAC gene, 2) substitution of 1 to 15 nucleotides of the TRAC gene with nucleotides different from those of the wild-type gene, 3) each independently insertion into TRAC of 1 to 15 nucleotides selected from A, T, C and G, or 4) a combination of two or more selected from 1) to 3) above. Specifically, the deletion may be a deletion of a nucleotide sequence region of about 6 bp, 8 bp, 11 bp, and/or 13 bp of the TRAC gene, and the insertion is 1 bp, 4 bp, 6 bp, 8 bp, It may be an insertion of an 11 bp, or 13 bp, and/or 15 bp site.

일 양상은 서열번호 1 내지 4 로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열; 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 CRISPR/Cas9 시스템을 제공한다. One aspect is a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4; and a Cas9 editor protein or variant thereof; or a CRISPR/Cas9 system comprising a nucleic acid sequence encoding the same.

일반적으로, "CRISPR 시스템"은 집합적으로 Cas 유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복부" 및 tracrRNA-가공 부분 직접 반복부 포함), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭), 가이드 RNA 또는 CRISPR 유전자좌로부터의 기타 서열 및 전사물을 포함하는 CRISPR-관련("Cas") 유전자의 발현에 수반되거나, 그의 활성을 유도하는 전사물 및 다른 요소를 지칭한다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 I형, II형 또는 III형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, CRISPR 시스템의 하나 이상의 요소는 내인성 CRISPR 시스템을 포함하는 특정 유기체, 예를 들어, 스트렙토코커스 피오게네스로부터 유래된다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 증진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서로도 지칭)를 특징으로 한다. CRISPR 복합체의 형성의 맥락에서, "표적 서열" 또는 "표적 유전자"는 가이드 서열이 상보성을 갖도록 설계된 서열을 지칭하며, 여기서, 표적 서열과 가이드 서열 간의 혼성화는 CRISPR 복합체의 형성을 증진시킨다. 본질적으로 완전한 상보성이 필요하지 않지만, 혼성화를 야기하고, CRISPR 복합체의 형성을 증진시키는 충분한 상보성이 존재한다. 표적 서열은 임의의 폴리뉴클레오티드, 예를 들어, DNA 또는 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질 내에 위치한다. In general, a “CRISPR system” refers to a sequence that collectively encodes a Cas gene, a tracr (trans-activating CRISPR) sequence (eg, tracrRNA or active moiety tracrRNA), a tracr-mate sequence (in the context of an endogenous CRISPR system, “ CRISPR-related (including direct repeats” and tracrRNA-processing portion direct repeats), guide sequences (also referred to as “spacers” in the context of endogenous CRISPR systems), guide RNAs or other sequences and transcripts from the CRISPR locus "Cas") refers to transcripts and other elements involved in the expression of or inducing its activity. In some embodiments, one or more elements of the CRISPR system are derived from a type I, type II, or type III CRISPR system. In some embodiments, one or more elements of the CRISPR system are derived from a particular organism comprising an endogenous CRISPR system, eg, Streptococcus pyogenes. In general, CRISPR systems are characterized by elements that promote the formation of CRISPR complexes at the site of the target sequence (also referred to as protospacers in the context of endogenous CRISPR systems). In the context of the formation of a CRISPR complex, a "target sequence" or "target gene" refers to a sequence to which a guide sequence is designed to have complementarity, wherein hybridization between the target sequence and the guide sequence enhances the formation of the CRISPR complex. Although essentially perfect complementarity is not required, there is sufficient complementarity to cause hybridization and promote formation of the CRISPR complex. The target sequence may comprise any polynucleotide, eg, a DNA or RNA polynucleotide. In some embodiments, the target sequence is located in the nucleus or cytoplasm of the cell.

상기 Cas 단백질은 CRISPR RNA (crRNA) 및 트랜스-활성화 crRNA (trans-activating crRNA, tracrRNA)로 불리는 두 RNA와 복합체를 형성할 때, 활성 엔도뉴클레아제 또는 니카아제 (nickase)를 형성한다. 상기 Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 그의 상동체 또는 그의 변형된 버전을 포함한다. 이들 효소가 알려져 있으며; 예를 들어, 스트렙토코커스 피오게네스 Cas9 단백질의 아미노산 서열은 수탁 번호 Q99ZW2 하에 스위스프로트(SwissProt) 데이터베이스에서 얻을 수 있다. 일부 구현예에서, 비변형 CRISPR 효소, 예를 들어, Cas9는 DNA 절단 활성을 갖는다. 일부 구현예에서, CRISPR 효소는 Cas9이며, 스트렙토코커스 피오게네스 또는 스트렙토코커스 뉴모니애로부터의 Cas9일 수 있다. 일부 구현예에서, Cas 단백질은 진핵 세포에서의 발현을 위해 코돈-최적화된다. When the Cas protein forms a complex with two RNAs called CRISPR RNA (crRNA) and trans-activating crRNA (tracrRNA), it forms an active endonuclease or nickase. Non-limiting examples of such Cas proteins include Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx16, CsX, Csx3, Csx10, Csx, Csx Csf2, Csf3, Csf4, homologues thereof or modified versions thereof. These enzymes are known; For example, the amino acid sequence of the Streptococcus pyogenes Cas9 protein can be obtained from the SwissProt database under accession number Q99ZW2. In some embodiments, the unmodified CRISPR enzyme, eg, Cas9, has DNA cleavage activity. In some embodiments, the CRISPR enzyme is Cas9, which may be Cas9 from Streptococcus pyogenes or Streptococcus pneumoniae. In some embodiments, the Cas protein is codon-optimized for expression in a eukaryotic cell.

상기 Cas 단백질은 CRISPR/Cas 시스템의 단백질 구성 요소 중 하나로서, 활성화된 엔도뉴클레아제 또는 닉(nick) 형성 효소일 수 있다. 상기 Cas 단백질은 crRNA(CRISPR RNA) 및 tracrRNA(trans-activating crRNA)와 복합체를 형성하여 그의 활성을 나타낼 수 있다.The Cas protein is one of the protein components of the CRISPR/Cas system, and may be an activated endonuclease or a nick forming enzyme. The Cas protein may form a complex with crRNA (CRISPR RNA) and tracrRNA (trans-activating crRNA) to exhibit its activity.

상기 Cas 단백질은 예를 들어 스트렙토코커스 속(예, Streptococcus pyogens), 네이세리아 속(예, Neisseria meningitidis), 파스테우렐라 속(예, Pasteurella multocida), 프란시셀라 속(예, Francisella novicida), 또는 캄필로박터 속(예, Campylobacter jejuni)의 세균으로부터 유래된 폴리뉴클레오티드일 수 있다. 상기 Cas 단백질은 GenBank Accession No. Q99ZW2.1의 아미노산 서열을 포함할 수 있다The Cas protein may be, for example, from the genus Streptococcus (eg, Streptococcus pyogens), from the genus Neisseria (eg, Neisseria meningitidis), from the genus Pasteurella (eg, Pasteurella multocida), from the genus Francisella (eg, Francisella novicida), or It may be a polynucleotide derived from a bacterium of the genus Campylobacter (eg, Campylobacter jejuni). The Cas protein is GenBank Accession No. and the amino acid sequence of Q99ZW2.1.

상기 Cas 단백질은 야생형 Cas 단백질 또는 돌연변이 Cas 단백질일 수 있다. 상기 돌연변이 Cas 단백질은 예를 들어 촉매적 아스파라긴산 잔기(catalytic aspartate residue)가 다른 아미노산(예, 알라닌)으로 변경된 단백질일 수 있다. 상기 Cas 단백질은 재조합 단백질일 수 있다.The Cas protein may be a wild-type Cas protein or a mutant Cas protein. The mutant Cas protein may be, for example, a protein in which a catalytic aspartate residue is changed to another amino acid (eg, alanine). The Cas protein may be a recombinant protein.

상기 Cas 단백질은 Cas9 단백질은 또는 Cpf1 단백질일 수 있다.The Cas protein may be a Cas9 protein or a Cpf1 protein.

상기 Cas9 단백질은 Cas9 단백질 변이체(variant)일 수 있다. 예를 들어, 상기 변이체로는 이에 제한되지는 않으나 HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1 및 xCas9로 이루어진 군으로부터 선택되는 하나 이상일 수 있다. 상기 Cas 9 단백질 변이체 중 eSpCas9는 서열번호 7로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, evoCas9는 서열번호 8로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, HypaCas9은 서열번호 9로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, Sniper-Cas9은 서열번호 10으로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, SpCas9은 서열번호 11로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, SpCas9-HF1은 서열번호 12로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있고, xCas9은 서열번호 13으로 이루어진 폴리뉴클레오티드의 서열로부터 번역되는 것일 수 있다.The Cas9 protein may be a Cas9 protein variant. For example, although not limited thereto, the variant may be one or more selected from the group consisting of HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1 and xCas9. Among the Cas 9 protein variants, eSpCas9 may be translated from the sequence of the polynucleotide consisting of SEQ ID NO: 7, evoCas9 may be translated from the sequence of the polynucleotide consisting of SEQ ID NO: 8, HypaCas9 is the polynucleotide consisting of SEQ ID NO: 9 It may be translated from the sequence of nucleotides, Sniper-Cas9 may be translated from the sequence of the polynucleotide consisting of SEQ ID NO: 10, SpCas9 may be translated from the sequence of the polynucleotide consisting of SEQ ID NO: 11, SpCas9- HF1 may be translated from the sequence of the polynucleotide consisting of SEQ ID NO: 12, and xCas9 may be translated from the sequence of the polynucleotide consisting of SEQ ID NO: 13.

다른 양상은 서열번호 1 내지 4로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열; 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 재조합 벡터를 제공한다. 상기 벡터는 세포 또는 개체에 도입되어 가이드 RNA를 생성하는 것일 수 있다. 상기 벡터는 세포 또는 개체에 도입되어 TRAC 가이드 RNA 및/또는 Cas 단백질을 발현하여, 세포 또는 개체 내에서 TRAC 단백질을 암호화하는 핵산 서열에 삽입/결실 부위를 형성하여 돌연변이를 유발할 수 있다.Another aspect is a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4; and a Cas9 editor protein or variant thereof; Or it provides a recombinant vector comprising a nucleic acid sequence encoding the same. The vector may be introduced into a cell or subject to generate a guide RNA. The vector may be introduced into a cell or subject to express TRAC guide RNA and/or Cas protein to form an insertion/deletion site in a nucleic acid sequence encoding the TRAC protein in the cell or subject to induce mutation.

용어 "폴리뉴클레오티드(polynucleotide)"는 단일가닥 또는 이중가닥 형태로 존재하는 디옥시리보뉴클레오티드 또는 리보뉴클레오티드의 중합체이다. RNA 게놈 서열, DNA(gDNA 및 cDNA) 및 이로부터 전사되는 RNA 서열을 포괄하며, 특별하게 다른 언급이 없는 한 천연의 폴리뉴클레오티드의 유사체를 포함한다.The term "polynucleotide" is a polymer of deoxyribonucleotides or ribonucleotides that exist in single-stranded or double-stranded form. It encompasses RNA genomic sequences, DNA (gDNA and cDNA) and RNA sequences transcribed therefrom, and includes analogs of natural polynucleotides, unless otherwise specified.

상기 폴리뉴클레오티드는 상기 융합 단백질의 아미노산 서열을 코딩하는 뉴클레오티드 서열뿐만 아니라, 그 서열에 상보적인(complementary) 서열도 포함한다. 상기 상보적인 서열은 완벽하게 상보적인 서열뿐만 아니라, 실질적으로 상보적인 서열도 포함하며, 이는 당업계에 공지된 엄격 조건(stringent conditions) 하에서, 예를 들어, 상기 융합 단백질의 아미노산 서열을 코딩하는 뉴클레오티드 서열의 뉴클레오티드 서열과 혼성화될 수 있는 서열을 의미한다.The polynucleotide includes not only a nucleotide sequence encoding the amino acid sequence of the fusion protein, but also a sequence complementary to the sequence. The complementary sequence includes not only perfectly complementary sequences, but also substantially complementary sequences, which under stringent conditions known in the art, for example, nucleotides encoding the amino acid sequence of the fusion protein. It refers to a sequence capable of hybridizing with the nucleotide sequence of the sequence.

상기 벡터는 당업계에 공지된 다양한 방법을 통해 구축될 수 있다.The vector can be constructed through various methods known in the art.

상기 벡터는 클로닝을 위한 벡터 또는 발현을 위한 벡터인 것일 수 있다. 상기 벡터는 바이러스 벡터, 플라스미드 벡터 또는 아그로박테리움 (agrobacterium) 벡터인 것일 수 있다.The vector may be a vector for cloning or a vector for expression. The vector may be a viral vector, a plasmid vector, or an agrobacterium vector.

상기 벡터는 원핵 세포 또는 진핵 세포를 숙주로 하여 구축될 수 있다. 상기 벡터가 발현 벡터이고, 원핵 세포를 숙주로 하는 경우에는, 전사를 진행시킬 수 있는 강력한 프로모터 (예를 들면, tac 프로모터, lac 프로모터, lacUV5 프로모터, lpp 프로모터, pLλ프로모터, pRλ프로모터, rac5 프로모터, amp 프로모터, recA 프로모터, SP6 프로모터, trp 프로모터 및 T7 프로모터 등), 해독의 개시를 위한 리보좀 결합 자리 및 전사/해독 종결 서열을 포함하는 것일 수 있다. 상기 벡터가 발현을 위한 벡터이고, 진핵 세포를 숙주로 하는 경우에는, 포유동물 세포의 게놈으로부터 유래된 프로모터 (예를 들면, 메탈로티오닌 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터 (예를 들면, 아데노바이러스 후기 프로모터, 백시니아 바이러스 7.5K 프로모터, SV40 프로모터, 사이토메갈로바이러스 프로모터 및 HSV의 tk 프로모터)가 이용될 수 있으며, 전사 종결 서열로서 폴리아데닐화 서열을 갖을 수 있다. 한편, 상기 벡터는 당업계에서 종종 사용되는 플라스미드 (예를 들면 pSC101, ColE1, pBR322, pUC, pUC8/9, pHC79, pUC19 및 pET 등), 파지 (예를 들면 λgt4·λB, λ-Charon, λ△z1 및 M13 등) 또는 바이러스 (예를 들면 SV40 등)을 조작하여 제작될 수 있다. 상기 벡터는 CBh 프로모터, U6 프로모터, CMV 프로모터, EF-1α 프로모터 또는 이들의 조합을 포함하는 것일 수 있다.The vector can be constructed using a prokaryotic cell or a eukaryotic cell as a host. When the vector is an expression vector and a prokaryotic cell is used as a host, a strong promoter capable of propagating transcription (eg, tac promoter, lac promoter, lacUV5 promoter, lpp promoter, pLλ promoter, pRλ promoter, rac5 promoter, amp promoter, recA promoter, SP6 promoter, trp promoter and T7 promoter), a ribosome binding site for initiation of translation, and a transcription/translation termination sequence. When the vector is a vector for expression and the host is a eukaryotic cell, a promoter derived from the genome of a mammalian cell (eg, metallotionine promoter) or a promoter derived from a mammalian virus (eg, , adenovirus late promoter, vaccinia virus 7.5K promoter, SV40 promoter, cytomegalovirus promoter, and tk promoter of HSV) may be used, and may have a polyadenylation sequence as a transcription termination sequence. On the other hand, the vector is a plasmid often used in the art (eg pSC101, ColE1, pBR322, pUC, pUC8/9, pHC79, pUC19 and pET, etc.), phage (eg λgt4 λB, λ-Charon, λ Δz1 and M13) or viruses (eg, SV40, etc.). The vector may include a CBh promoter, a U6 promoter, a CMV promoter, an EF-1α promoter, or a combination thereof.

상기 재조합 벡터는 원핵 세포 또는 진핵 세포를 숙주로 하여 구축될 수 있다. 예를 들어, 본 발명의 벡터가 발현 벡터이고, 원핵 세포를 숙주로 하는 경우에는, 전사를 진행시킬 수 있는 강력한 프로모터 (예를 들어, pLλ프로모터, trp 프로모터, lac 프로모터, tac 프로모터, T7 프로모터 등), 해독의 개시를 위한 리보좀 결합 자리 및 전사/해독 종결 서열을 포함하는 것이 일반적이다. 진핵 세포를 숙주로 하는 경우에는, 벡터에 포함되는 진핵 세포에서 작동하는 복제원점은 f1 복제원점, SV40 복제원점, pMB1 복제원점, 아데노 복제원점, AAV 복제원점 및 BBV 복제원점 등을 포함하나, 이에 한정되는 것은 아니다. 또한, 포유동물 세포의 게놈으로부터 유래된 프로모터 (예를 들어, 메탈로티오닌 프로모터) 또는 포유동물 바이러스로부터 유래된 프로모터 (예를 들어, 아데노바이러스 후기 프로모터, 백시니아 바이러스 7.5K 프로모터, SV40 프로모터, 사이토메갈로바이러스 프로모터 및 HSV의 tk프로모터)가 이용될 수 있으며, 전사 종결 서열로서 폴리아데닐화 서열을 일반적으로 갖는다.The recombinant vector can be constructed using a prokaryotic cell or a eukaryotic cell as a host. For example, when the vector of the present invention is an expression vector and a prokaryotic cell is used as a host, a strong promoter capable of propagating transcription (eg, pLλ promoter, trp promoter, lac promoter, tac promoter, T7 promoter, etc.) ), a ribosome binding site for initiation of translation and a transcription/translation termination sequence. In the case of a eukaryotic cell as a host, the replication origin operating in the eukaryotic cell contained in the vector includes the f1 origin of replication, the SV40 origin of replication, the pMB1 origin of replication, the adeno origin of replication, the AAV origin of replication and the BBV origin of replication. It is not limited. In addition, promoters derived from the genome of mammalian cells (eg, metallotionine promoter) or from mammalian viruses (eg, adenovirus late promoter, vaccinia virus 7.5K promoter, SV40 promoter, cytomegalovirus promoter and tk promoter of HSV) can be used, and generally have a polyadenylation sequence as a transcription termination sequence.

상기 벡터는 항생제 저항성 유전자를 포함하는 것일 수 있다. 상기 항생제 저항성 유전자는 암피실린 저항성 유전자, 퓨로마이신 저항성 유전자, 클로람페니콜, 블라스티시딘 저항성 유전자, 또는 이들의 조합을 포함하는 것일 수 있다.The vector may include an antibiotic resistance gene. The antibiotic resistance gene may include an ampicillin resistance gene, a puromycin resistance gene, chloramphenicol, a blasticidin resistance gene, or a combination thereof.

또 다른 양상은 서열번호 1 내지 4로 이루어진 군으로부터 선택된 1종의 폴리뉴클레오티드와 동일하거나 이와 상보적인 핵산 서열을 포함하는 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체; 또는 이를 암호화하는 핵산 서열을 포함하는 TRAC 유전자 편집용 조성물을 제공한다.Another aspect is a guide RNA and a Cas9 editor protein or a variant thereof comprising a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4; Or it provides a composition for TRAC gene editing comprising a nucleic acid sequence encoding the same.

상기 가이드 RNA, 벡터, TRAC 단백질, 및 TRAC 단백질을 암호화하는 핵산 서열은 전술한 바와 같다.The guide RNA, vector, TRAC protein, and nucleic acid sequences encoding the TRAC protein are as described above.

상기 조성물은 상기 조성물은 시험관 내(in vitro) 또는 생체 내(in vivo) 투여용일 수 있다.The composition may be for administration in vitro or in vivo .

상기 조성물을 시험관 내 세포 또는 생체 내에 투여하는 경우 세포 또는 개체의 측정된 TRAC 유전자 또는 TRAC 유전자에 의해 코딩되는 단백질의 발현 또는 활성 수준보다 낮은 정도로 발현 또는 활성이 나타내거나 발현 또는 활성을 감소시킬 수 있거나 불활성화시킬 수 있도록 TRAC 유전자를 편집할 수 있다. 이는 시험관 내 세포 또는 투여된 개체의 TRAC 유전자에 의해 코딩되는 단백질의 발현 또는 활성 수준보다 낮은 정도로 발현 또는 활성이 나타내거나 발현 또는 활성이 없앨 수 있는 것을 의미한다. 즉, 세포에 있어서 상기 조성물에 의한 유전자 편집은 TRAC 유전자 또는 TRAC 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 본래 조작되지 않은 모세포의 발현 또는 활성보다 약 20% 이 상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100% 감소시킬 수 있는 것일 수 있다.When the composition is administered to cells in vitro or in vivo, expression or activity may be exhibited or reduced to a degree lower than the measured TRAC gene or expression or activity level of a protein encoded by the TRAC gene of the cell or individual, or The TRAC gene can be edited to inactivate it. This means that the expression or activity can be exhibited to a lower degree than the expression or activity level of the protein encoded by the TRAC gene of the cells or administered subject in vitro, or the expression or activity can be abolished. That is, in the cell, the gene editing by the composition shows that the expression or activity of the TRAC gene or the protein encoded by the TRAC gene is about 20% or more, about 30% or more, about 40% or more than that of the original non-engineered parent cell. % or more, about 50% or more, about 55% or more, about 60% or more, about 70% or more, about 75% or more, about 80% or more, about 85% or more, about 90% or more, about 95% or more, or about It may be something that can be reduced by 100%.

상기 조성물은 세포의 유전체에서 TRAC 단백질을 암호화하는 핵산 서열이 변경됨으로써 TRAC 단백질의 기능이 없어지거나 감소되는 모든 변형을 유도하도록 유전체를 편집할 수 있고, 즉 결실, 치환, 삽입, 또는 프레임 시프트 돌연변이를 유도하여 TRAC 유전자를 효과적으로 제거(knockout)할 수 있다.The composition is capable of editing the genome such that the nucleic acid sequence encoding the TRAC protein is altered in the genome of a cell, thereby inducing any modification that eliminates or reduces the function of the TRAC protein, i.e., deletion, substitution, insertion, or frameshift mutation. By inducing the TRAC gene can be effectively knocked out (knockout).

상기 세포는 암세포, 줄기세포, 혈관내피 세포, 백혈구, 면역 세포, 상피 세포, 생식 세포, 섬유아세포, 근육세포, 골수 세포, 표피 세포, 골아세포 및 신경세포로 이루어진 군으로부터 선택될 수 있다.The cells may be selected from the group consisting of cancer cells, stem cells, vascular endothelial cells, leukocytes, immune cells, epithelial cells, germ cells, fibroblasts, myocytes, bone marrow cells, epidermal cells, osteoblasts and neurons.

TRAC 유전자 또는 TRAC 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소된 유전적으로 조작 또는 편집된 세포는 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 용어 "불활성화 (inactivation)"는 전혀 발현이 되지 않는 유전자 또는 발현이 되더라도 그 활성이 없는 단백질이 생성되는 것을 의미할 수 있다. 용어 "감소 (depression)"는 TRAC 유전자가 조작되지 않은 세포에 비하여 낮은 수준으로 발현되거나, 또는 TRAC 유전자에 의해 코딩되는 단백질이 발현이 되더라도 그 활성이 낮거나 활성이 제거된 것을 의미할 수 있다.Genetically engineered or edited cells with reduced expression or activity of the TRAC gene or the protein encoded by the TRAC gene can be identified using any method known in the art. The term “inactivation” may mean that a gene that is not expressed at all or a protein that has no activity even if it is expressed is generated. The term "depression" may mean that the TRAC gene is expressed at a low level compared to the non-engineered cells, or that the activity is low or the activity is removed even if the protein encoded by the TRAC gene is expressed.

상기 "제거"는 세포의 유전체에서 TRAC 단백질을 암호화하는 핵산 서열이 변경됨으로써 TRAC 단백질의 기능이 없어지거나 감소되는 모든 변형을 말한다. 용어 "제거"는 "돌연변이"와 상호 교환적으로 사용될 수 있다. 상기 제거 또는 돌연변이는 예를 들어 결실, 치환, 삽입, 또는 프레임 시프트 돌연변이일 수 있다.The "removal" refers to any modification in which the function of the TRAC protein is eliminated or reduced by altering the nucleic acid sequence encoding the TRAC protein in the genome of a cell. The term “removal” may be used interchangeably with “mutation”. The deletion or mutation may be, for example, a deletion, substitution, insertion, or frameshift mutation.

상기 유전자 편집용 조성물은 TRAC 유전자에 의해 코딩되는 단백질의 발현 또는 활성이 감소시키도록 유전적으로 조작 또는 편집할 수 있어, 이를 투여한 개체의 암의 예방 및/또는 치료 용도로 사용될 수 있다.The composition for gene editing can be genetically manipulated or edited to reduce the expression or activity of a protein encoded by the TRAC gene, and thus can be used for the prevention and/or treatment of cancer of an individual administered the composition.

일 양상에 따른 가이드 RNA, 이를 포함하는 벡터, 상기 가이드 RNA 및 Cas9 에디터 단백질 또는 이의 변이체를 포함하는 TRAC 유전자 편집용 조성물은 세포 또는 개체의 유전체에서 TRAC 유전자를 효과적으로 제거(knockout)할 수 있고, 이를 통해 맞춤의료 또는 정밀의료로서 암을 예방 또는 치료하는데 유용하게 사용될 수 있다.A composition for TRAC gene editing comprising a guide RNA, a vector comprising the same, the guide RNA and Cas9 editor protein or a variant thereof according to an aspect can effectively knockout the TRAC gene from the genome of a cell or individual, It can be usefully used to prevent or treat cancer as personalized medicine or precision medicine.

도 1은 Cas 9 또는 이의 변이체를 암호화하는 핵산서열을 포함하는 플라스미드인 pcDNA 3.1 플라스미드를 나타낸 도이다.
도 2는 실시예에서 사용한 spCas9 유전자 편집체 에디터 단백질(HypaCas9, SpCas9-HP1, evoCas9 및 eSpCas9(1.1))의 변이체의 벡터맵을 간단히 모식화하여 나타낸 도이다.
도 3A는 실험에 사용한 가이드 RNA를 포함한 플라스미드를 나타낸 도이며, 도 3B는 spCas9 유전자 편집체 에디터 단백질과 가이드 RNA를 All-in-One 백터 시스템으로 변환한 경우의 벡터맵을 나타낸 도이다(이 경우 도 3A의 U6 promoter-guide RNA-scaffold sequence 부분을 Cas9 plasmid의 CMV/EF-1α promoter 앞부분에 삽입하여 구성된다).
도 4는 HEK293T 세포에 TRAC 가이드 RNA를 암호화하는 플라스미드를 형질주입(transfection)시키고, 발현 정도를 eGFP(enhanced Green Fluorescent Protein) 형광을 통해 확인한 도이다.
도 5는 TRAC 가이드 1(서열번호 1)과 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9-HF1, eSpCas9 및 HypaCas9 로의 유전자 편집을 확인하고, 메인 패턴을 나타낸 도이다.
도 6은 TRAC 가이드 2(서열번호 2)와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9-HF1, eSpCas9 및 HypaCas9 로의 유전자 편집 패턴을 확인하고, 메인 패턴을 나타낸 도이다.
도 7은 TRAC 가이드 3(서열번호 3)과 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1 및 evoCas9-HF1로의 유전자 편집 패턴을 확인한 도이다.
도 8은 TRAC 가이드 4(서열번호 4)와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 eSpCas9 및 HypaCas9 로의 유전자 편집 패턴을 확인한 도이다.1 is a diagram illustrating a pcDNA 3.1 plasmid, which is a plasmid containing a nucleic acid sequence encoding Cas 9 or a variant thereof.
2 is a diagram schematically schematically illustrating a vector map of a mutant of the spCas9 gene editor protein (HypaCas9, SpCas9-HP1, evoCas9 and eSpCas9(1.1)) used in Examples.
3A is a diagram showing a plasmid including a guide RNA used in the experiment, and FIG. 3B is a diagram showing a vector map when the spCas9 gene editor protein and guide RNA are converted into an All-in-One vector system (in this case) It is constructed by inserting the U6 promoter-guide RNA-scaffold sequence portion of FIG. 3A in front of the CMV/EF-1α promoter of the Cas9 plasmid).
4 is a diagram illustrating HEK293T cells by transfection with a plasmid encoding TRAC guide RNA, and confirming the expression level through enhanced Green Fluorescent Protein (eGFP) fluorescence.
5 is a view showing the main pattern, confirming the gene editing with TRAC guide 1 (SEQ ID NO: 1) and the guide RNA and SpCas9-HF1, evoCas9-HF1, eSpCas9 and HypaCas9 confirmed to have high indel efficiency.
6 is a view showing the main pattern, confirming the gene editing pattern of TRAC guide 2 (SEQ ID NO: 2) and the guide RNA and SpCas9-HF1, evoCas9-HF1, eSpCas9 and HypaCas9 confirmed to have high indel efficiency.
7 is a diagram confirming the gene editing pattern of TRAC guide 3 (SEQ ID NO: 3) and the guide RNA and SpCas9-HF1 and evoCas9-HF1 confirmed to have high indel efficiency.
8 is a diagram confirming the gene editing pattern of TRAC guide 4 (SEQ ID NO: 4) and the guide RNA and eSpCas9 and HypaCas9 confirmed to have high indel efficiency.

이하 일 양상을 실시예 및 실험예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예 및 실험예는 일 양상을 예시적으로 설명하기 위한 것으로 일 양상의 범위가 이들 실시예 및 실험예에 한정되는 것은 아니며, 일 양상의 실시예 및 실험예는 당업계에서 평균적인 지식을 가진 자에게 일 양상을 보다 완전하게 설명하기 위해서 제공되는 것이다.Hereinafter, an aspect will be described in more detail through Examples and Experimental Examples. However, these Examples and Experimental Examples are for illustratively describing an aspect, and the scope of an aspect is not limited to these Examples and Experimental Examples, and the Examples and Experimental Examples of an aspect are average knowledge in the art. It is provided to more completely explain an aspect to those with

실시예 1: High-fidelity CRISPR/Cas9 플라스미드 클로닝Example 1: High-fidelity CRISPR/Cas9 plasmid cloning

정확성을 높인 High-fidelity Cas9 변이체 4종 HypaCas9, SpCas9-HP1, evoCas9, eSpCas9(1.1)(연세대학교 의과대학 김형범 교수 연구실)을 pcDNA 3.1 벡터(Thermofisher)에 클로닝하였다. 상기 High-fidelity Cas9 변이체는 DNA-RNA 이형이중가닥(heteroduplex)와 상호작용하여 표적 부위에 결합하는 REC3 도메인을 변형시키거나, 상보적인 DNA 가닥을 절단하는 HNH 도메인 또는 비상보적인 DNA 가닥을 절단하여 DNA 이중가닥 절단(double-strand breaks, DSBs)을 생성하는 RuvC Ⅲ 도메인을 변형시켜, 표적 효율성(on-target efficiency)을 유지하면서 표적이탈(off-target effect) 확률을 낮춘 Cas9 변이체를 사용하였다.HypaCas9, SpCas9-HP1, evoCas9, and eSpCas9(1.1) (HypaCas9, SpCas9-HP1, evoCas9, eSpCas9(1.1) (Professor Hyung-Beom Kim's laboratory, Yonsei University College of Medicine) were cloned into pcDNA 3.1 vector (Thermofisher) with improved accuracy. The high-fidelity Cas9 variant interacts with the DNA-RNA heteroduplex to modify the REC3 domain that binds to the target site, or cuts the HNH domain that cuts the complementary DNA strand or the non-complementary DNA strand. We used a Cas9 variant that reduced the probability of off-target effect while maintaining on-target efficiency by modifying the RuvC III domain that generates DNA double-strand breaks (DSBs).

HEK293T에서 빠르게 가이드 RNA의 효율을 확인하기 위하여 CMV 프로모터를 사용하였다. CMV는 가장 널리 사용되고 있는 프로모터로 대부분의 세포주(cell line)에서 강한 발현을 보이며, pcDNA3.1 플라스미드에 기본적으로 CMV가 구성되어 있어, 프로모터로는 상기 Cas9 변이체에 작동가능하게 연결된 CMV 프로모터 또는 EF-1α 프로모터를 사용하였다. 또한, P2A보다 IRES가 더 안정적이기 때문에 Cas9과 EGFP사이에 IRES sequence를 활용하여, Cas9-IRES-eGFP의 형태로 발현되도록 벡터를 구성하였다. 구체적으로 사용한 IRES-eGFP 발현 벡터의 모식도를 도 1에 나타내었고, Cas9 변이체 4종 HypaCas9, SpCas9-HP1, evoCas9, eSpCas9(1.1)의 벡터맵을 도 2에 각각 나타내었다. In order to quickly check the efficiency of guide RNA in HEK293T, the CMV promoter was used. CMV is the most widely used promoter and shows strong expression in most cell lines, and CMV is basically configured in pcDNA3.1 plasmid. As a promoter, the CMV promoter or EF- operably linked to the Cas9 mutant The 1α promoter was used. In addition, since IRES is more stable than P2A, the vector was constructed to be expressed in the form of Cas9-IRES-eGFP by utilizing the IRES sequence between Cas9 and EGFP. A schematic diagram of the specifically used IRES-eGFP expression vector is shown in FIG. 1, and vector maps of four Cas9 variants HypaCas9, SpCas9-HP1, evoCas9, and eSpCas9(1.1) are shown in FIG. 2, respectively.

실시예 2: 가이드 RNA 플라스미드 클로닝Example 2: Guide RNA plasmid cloning

2-1: 가이드 RNA 설계2-1: Guide RNA design

TRAC 유전자를 표적으로 하는 4종의 가이드 RNA를 합성하였다. 인간 TRAC 유전자의 엑손 1에서 TRAC을 넉아웃(knockout)할 수 있는 가이드 RNA를 설계하였다. 상기 4종 가이드 RNA 후보 서열의 위치 및 서열을 하기 표 1에 나타내었다.Four guide RNAs targeting the TRAC gene were synthesized. A guide RNA capable of knocking out TRAC in exon 1 of the human TRAC gene was designed. The positions and sequences of the four guide RNA candidate sequences are shown in Table 1 below.

TRACTRAC 위치location 표적 후보 서열 (5'-3')Target candidate sequence (5'-3') 서열번호SEQ ID NO: Guide1Guide1 19:4819:48 AGAGTCTCTCAGCTGGTACAAGAGTCTCTCAGCTGGTACA 1One Guide2Guide2 08:3708:37 GCTGGTACACGGCAGGGTCAGCTGGTACACGGCAGGGTCA 22 Guide3Guide3 02:3102:31 ACACGGCAGGGTCAGGGTTCACACGGCAGGGTCAGGGTTC 33 Guide4Guide4 139:168139:168 TGTGCTAGACATGAGGTCTATGTGCTAGACATGAGGTCTA 44

2-2: 가이드 RNA 플라스미드 클로닝2-2: Guide RNA plasmid cloning

실시예 2-1에서 설계한 가이드 RNA를 발현하는 플라스미드로 GX19 벡터를 이용하였다. 프로모터로는 U6 프로모터를 사용하였고, Cas9와 결합하는 가이드 RNA 스캐폴드 서열을 삽입하고 U6 프로모터 및 상기 스캐폴드 서열 사이에 20 bp 크기의 가이드 RNA 표적 서열이 위치하도록 하였다. 상기 표 1의 올리고뉴클레오티드 서열을 각각 합성하고, 정방향/역방향 프라이머, T4 폴리뉴클레오티드 키나아제 및 NEB 어닐링(annealing) 버퍼를 이용하여 어닐링하였다. 어닐링 조건은 95℃에서 5분, 이어서 25℃로 램핑(ramping)하는 단계(초당 0.1℃)로 설정하였다. 어닐링된 올리고뉴클레오티드를 T4 리가아제를 이용하여 BsaⅠ제한효소로 절단된 GX19 벡터에 라이게이션하였다. 이러한 가이드 RNA 플라스미드를 도 3A에, 플라스미드 벡터 맵을 모식화하여 도 3B에 나타내었다. GX19 vector was used as a plasmid expressing the guide RNA designed in Example 2-1. The U6 promoter was used as the promoter, and a guide RNA scaffold sequence binding to Cas9 was inserted, and a guide RNA target sequence of 20 bp in size was positioned between the U6 promoter and the scaffold sequence. The oligonucleotide sequences of Table 1 were synthesized, respectively, and annealed using forward/reverse primers, T4 polynucleotide kinase, and NEB annealing buffer. Annealing conditions were set at 95° C. for 5 minutes, followed by ramping to 25° C. (0.1° C. per second). The annealed oligonucleotides were ligated to the GX19 vector digested with BsaI restriction enzyme using T4 ligase. This guide RNA plasmid is shown in FIG. 3A, and a schematic plasmid vector map is shown in FIG. 3B.

실시예 3: TRAC 가이드 RNA의 세포 내 도입 Example 3: Transduction of TRAC guide RNA into cells

설계한 가이드 RNA의 효율을 측정하기 위한 실험을 수행하였다. 인간 배아 신장 세포주인 HEK293T 세포를 TRAC 가이드 RNA를 암호화하는 플라스미드로 형질주입(transfection)시키고, 발현 정도를 eGFP(enhanced Green Fluorescent Protein) 형광을 통해 확인하였다. 구체적으로, Neon 형질주입 시스템(Thermofisher)을 이용하여 1300 v, 20 ms, 1 pulse 조건으로 5 x 10⁶ 개의 HEK293T 세포에 Cas9 플라스미드 3μg, 가이드 RNA 플라스미드 1μg(Cas9과 가이드의 비율은 3:1) 및 형질주입된 HEK293T 세포만을 선택하기 위한 퓨로마이신 플라스미드 400ng을 첨가하여 HEK293T 세포를 형질주입시켰다. 형질주입의 효율을 측정하기 위하여, 형질주입 5일 후 eGFP 발현 정도를 확인하여 도 4에 나타내었고 이후 형질주입된 세포를 선별하였다. An experiment was performed to measure the efficiency of the designed guide RNA. HEK293T cells, a human embryonic kidney cell line, were transfected with a plasmid encoding TRAC guide RNA, and the expression level was confirmed by eGFP (enhanced Green Fluorescent Protein) fluorescence. Specifically, Cas9 plasmid 3μg, guide RNA plasmid 1μg (Cas9 to guide ratio is 3:1) in 5 x 10 ⁶ HEK293T cells under the conditions of 1300 v, 20 ms, and 1 pulse using the Neon transfection system (Thermofisher). And 400ng of puromycin plasmid for selecting only the transfected HEK293T cells was added to transfect HEK293T cells. In order to measure the transfection efficiency, the expression level of eGFP was confirmed 5 days after the transfection and shown in FIG. 4 , and then the transfected cells were selected.

도 4에서 확인한 바와 같이, HEK293T 세포가 상기 실시예 1 및 2-1에서 설계한 TRAC 가이드 RNA 및 high-fidelity Cas9 변이체를 발현함을 확인하고, 형질주입된 세포를 선별하였다.As confirmed in FIG. 4 , it was confirmed that HEK293T cells expressed the TRAC guide RNA and high-fidelity Cas9 mutant designed in Examples 1 and 2-1, and the transfected cells were selected.

실시예 4: 인델 빈도의 측정 및 최적 가이드 RNA의 선별Example 4: Measurement of indel frequency and selection of optimal guide RNA

차세대염기서열분석(Next Generation Sequencing, NGS)을 수행하여 최적 가이드 RNA 및 사용한 Cas9 변이체를 확인하기 위한 실험을 수행하였다. 구체적으로 실시예 3에서 준비된 세포에서 유전체 중 인델(insertion/deletion, indel) 빈도를 측정하기 위해 차세대염기서열분석을 수행하였다. 인델 빈도는 하기 수학식에 따라 산출하였다. Next generation sequencing (NGS) was performed to confirm the optimal guide RNA and the Cas9 variant used. Specifically, next-generation sequencing was performed to measure the frequency of indels (insertion/deletion, indel) in the genome in the cells prepared in Example 3. The indel frequency was calculated according to the following equation.

구체적으로 NGS는 가이드 RNA 타겟 시퀀스의 PAM(-NGG) 시퀀스의 다운 스트림 50~100bp, 총 200~250bp 시퀀싱이 가능하도록 하기와 같은 프라이머를 제작하고 이를 사용하였다. Specifically, NGS prepared and used the primers as follows to enable sequencing of 50-100 bp downstream of the PAM (-NGG) sequence of the guide RNA target sequence, a total of 200-250 bp.

어댑터 시퀀스(Adapter sequence) : (5'-3')Adapter sequence: (5'-3')

정방향 5'-CTACACGACGCTCTTCCGATCT (서열번호 5) Forward 5'-CTACACGACGCTCTTCCGATCT (SEQ ID NO: 5)

역방향 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (서열번호 6)Reverse 5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQ ID NO: 6)

구체적으로 이후 웹 기반 NSG analyzer 알고리즘을 이용하여 NGS 결과 분석하였고, NGS 결과를 입력하여 삽입(insertion), 삭제(deletion) ratio와 사이즈, 시퀀스 정보를 비교하고, 전체 세포에서 인델로 인한 돌연변이 비율을 확인하였다. Specifically, the NGS result was analyzed using the web-based NSG analyzer algorithm afterwards, and the NGS result was input to compare the insertion and deletion ratios, size, and sequence information, and the mutation rate due to indels in all cells was confirmed. did.

총 5종의 가이드 RNA와 4 종의 Cas9 variants (eSpCas9, evoCas9, HypaCas9, SpCas9-HF1)로 실험을 진행하였고, 가장 높은 인델 빈도를 보인 가이드 RNA와 Cas9 조합을 선정하기 위한 실험을 진행하였으며, evoCas9을 활용한 인델빈도 확인 결과를 표 2에, HypaCas9을 활용한 인델빈도 확인 결과를 표 3에, SpCas9을 활용한 인델빈도 확인 결과를 표 4에, eSpCas9을 활용한 인델빈도 확인 결과를 표 5에 나타내었다. Experiments were conducted with a total of 5 guide RNAs and 4 types of Cas9 variants (eSpCas9, evoCas9, HypaCas9, SpCas9-HF1). Table 2 shows the results of checking indel frequency using is shown in Table 5.

evoCas9evoCas9 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 40.3340.33 Guide 2Guide 2 Top 2Top 2 40.0040.00 Guide 3Guide 3 Top 3Top 3 20.6520.65

HypaCas9HypaCas9 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 74.3674.36 Guide 2Guide 2 Top 2Top 2 62.5762.57 Guide 4Guide 4 Top 3Top 3 44.9544.95

SpCas9-HF1SpCas9-HF1 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 69.7369.73 Guide 2Guide 2 Top 2Top 2 56.7456.74 Guide 3Guide 3 Top 3Top 3 50.1250.12

eSpCas9eSpCas9 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 73.7173.71 Guide 2Guide 2 Top 2Top 2 66.3366.33 Guide 4Guide 4 Top 3Top 3 57.7457.74

상기 표 2 내지 5에서 나타난 바와 같이, 가이드 RNA 중 가장 높은 인델 효율을 보인 TRAC 가이드 RNA는 Cas9 변이체 SpCas9-HF1, evoCas9, eSpCas9 및 HypaCas9 모두에서 TRAC 가이드 1(서열번호 1)이었고, 이어서 TRAC 가이드 2(서열번호 2)인 것을 확인하였다. As shown in Tables 2 to 5, the TRAC guide RNA showing the highest indel efficiency among guide RNAs was TRAC guide 1 (SEQ ID NO: 1) in all of the Cas9 variants SpCas9-HF1, evoCas9, eSpCas9 and HypaCas9, followed by TRAC guide 2 (SEQ ID NO: 2) was confirmed.

실시예 5: 선별된 가이드 RNA을 통한 유전자 편집 효율과 유전자 편집 패턴의 확인Example 5: Confirmation of gene editing efficiency and gene editing pattern through the selected guide RNA

TRAC에 대한 가이드 RNA의 유전자 편집 효율과 이의 유전자 편집이 일어나는 경우 이의 메인 편집패턴이 있는지를 상기 실시예 4의 방법으로 확인하는 실험을 수행하였다. 구체적으로 TRAC에 대한 가이드 RNA 4종의 유전자 편집 효율과 함께 이들의 유전자 편집 패턴을 확인하는 실험을 수행하였다. An experiment was performed by the method of Example 4 to check the gene editing efficiency of the guide RNA for TRAC and whether there is a main editing pattern thereof when gene editing occurs. Specifically, an experiment was performed to confirm the gene editing efficiency of four types of guide RNAs for TRAC and their gene editing patterns.

각각 Cas9 변이체, evoCas9, HypaCas9, SpCas9-HF1 및 eSpCas9와 가이드 RNA 간 인델 빈도를 분석하여, 인델빈도가 가장 높은 가이드 3종의 인델 빈도를 확인하였고, 이의 결과를 차례대로 표 6 내지 표 9에 나타내었다.By analyzing the indel frequencies between the Cas9 mutant, evoCas9, HypaCas9, SpCas9-HF1 and eSpCas9 and guide RNA, respectively, the indel frequencies of the three guides with the highest indel frequency were identified, and the results are shown in Tables 6 to 9 in turn. It was.

evoCas9evoCas9 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 40.640.6 Guide 2Guide 2 Top 2Top 2 38.738.7 Guide 3Guide 3 Top 3Top 3 0.20.2

HypaCas9HypaCas9 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 69.769.7 Guide 2Guide 2 Top 2Top 2 55.055.0 Guide 4Guide 4 Top 3Top 3 49.849.8

SpCas9-HF1SpCas9-HF1 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 74.374.3 Guide 2Guide 2 Top 2Top 2 60.660.6 Guide 3Guide 3 Top 3Top 3 0.60.6

eSpCas9eSpCas9 scorescore Indel freq (%)Indel freq (%) Guide 1Guide 1 Top 1Top 1 73.473.4 Guide 2Guide 2 Top 2Top 2 64.864.8 Guide 4Guide 4 Top 3Top 3 57.457.4

아울러, 상기 가이드 RNA로 확인한 유전자 편집 중에서 가장 메인으로 나타나는 패턴을 확인하였고, 이를 확인한 결과를 evoCas9 및 HypaCas9 Cas9 변이체의 결과를 각각 표 10 및 11에 나타내었고, SpCas9-HF1 및 eSpCas9는 차례대로 표 12 내지 표 13에 나타내었다.In addition, the pattern showing the most main among the gene editing identified with the guide RNA was confirmed, and the results of the confirmation are shown in Tables 10 and 11, respectively, of evoCas9 and HypaCas9 Cas9 mutants, and SpCas9-HF1 and eSpCas9 are sequentially shown in Table 12 to Table 13.

evoCas9evoCas9 Of total indel freq (%)Of total indel freq (%) Of total in/del freq (%)Of total in/del freq (%) Guide 1Guide 1 3131 7878 Guide 2Guide 2 6666 6767 Guide 3Guide 3 6363 6363

HypaCas9HypaCas9 Of total indel freq (%)Of total indel freq (%) Of total in/del freq (%)Of total in/del freq (%) Guide 1Guide 1 3131 7878 Guide 2Guide 2 5858 6262 Guide 4Guide 4 2525 7474

SpCas9-HF1SpCas9-HF1 Of total indel freq (%)Of total indel freq (%) Of total in/del freq (%)Of total in/del freq (%) Guide 1Guide 1 2828 7979 Guide 2Guide 2 6060 6363 Guide 3Guide 3 7979 7979

eSpCas9eSpCas9 Of total indel freq (%)Of total indel freq (%) Of total in/del freq (%)Of total in/del freq (%) Guide 1Guide 1 2828 7878 Guide 2Guide 2 5858 6161 Guide 4Guide 4 1717 7171

TRAC 가이드 1 내지 4의 유전자 편집 패턴을 확인하는 실험을 수행하였다. 먼저 TRAC 가이드 1번과 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 evoCas9, HypaCas9, SpCas9-HF1 및 eSpCas9로의 유전자 편집 패턴을 확인하였고, 메인 패턴으로 확인된 결과를 도 5에 나타내었다.An experiment was performed to confirm the gene editing pattern of TRAC guides 1 to 4. First, the gene editing patterns of evoCas9, HypaCas9, SpCas9-HF1 and eSpCas9, which were confirmed to have high indel efficiency with TRAC guide No. 1 and the guide RNA, were confirmed, and the results confirmed as the main pattern are shown in FIG. 5 .

도 5에서 확인한 바와 같이, 수치상으로는 결실이 많았으나 메인 패턴으로 1bp의 삽입 빈도가 가장 높게 확인되었고, Cas9 변이체 종류에 상관없이 TRAC 가이드 1의 경우에 CCGTGTACCAGCTG 시퀀스 사이에 AACTCTAACCAGCTG로 A 1bp 삽입 패턴이 가장 많이 나타나는 것으로 확인되었다.As confirmed in FIG. 5, although there were many deletions numerically, the 1bp insertion frequency was the highest as the main pattern, and in the case of TRAC guide 1, regardless of the type of Cas9 mutant, the A 1bp insertion pattern was the most with AACTCTAACCAGCTG between the CCGTGTACCAGCTG sequences. It was found that many

이후 TRAC 가이드 2와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9-HF1, eSpCas9, HypaCas9로의 유전자 편집 패턴을 확인하였고, 메인 패턴으로 확인된 결과를 도 6에 나타내었다.Thereafter, the gene editing patterns of SpCas9-HF1, evoCas9-HF1, eSpCas9, and HypaCas9, which were confirmed to have high indel efficiency with TRAC guide 2 and the guide RNA, were confirmed, and the results confirmed as the main pattern are shown in FIG. 6 .

도 6에서 확인한 바와 같이, 가이드 2는 메인 패턴으로 결실이 많은 것을 확인하였고, 특히 CAGAACCCTGACCCT 시퀀스에서 ACCCTG 6bp 결실 패턴이 가장 많이 나타나는 것을 확인할 수 있었다. As confirmed in FIG. 6 , it was confirmed that guide 2 had a large number of deletions as the main pattern, and in particular, it was confirmed that the 6bp deletion pattern of ACCCTG appeared the most in the CAGAACCCTGACCCT sequence.

이후 TRAC 가이드 3과 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 SpCas9-HF1, evoCas9-HF1 로의 유전자 편집 패턴을 확인하였고, 확인된 결과를 도 7에 나타내었다.Thereafter, the gene editing patterns of TRAC guide 3 and the guide RNA and SpCas9-HF1 and evoCas9-HF1, which were confirmed to have high indel efficiency, were confirmed, and the confirmed results are shown in FIG. 7 .

도 7에서 확인한 바와 같이, 가이드 3은 수치상으로 결실이 많은 것을 확인하였고, 특히 AACCCTGACCCTGCC 시퀀스에서 CCCTGACCCTG 11bp 결실 패턴이 가장 많이 나타나는 것을 확인할 수 있었다.As confirmed in FIG. 7 , it was confirmed that guide 3 had many numerical deletions, and in particular, it was confirmed that the CCCTGACCCTG 11bp deletion pattern appeared most in the AACCCTGACCCTGCC sequence.

이후 TRAC 가이드 4와 상기 가이드 RNA와 인델효율이 높은 것으로 확인된 eSpCas9, HypaCas9로의 유전자 편집 패턴을 확인하였고, 확인된 결과를 도 8에 나타내었다.Thereafter, the gene editing patterns of TRAC guide 4 and the guide RNA and eSpCas9 and HypaCas9 confirmed to have high indel efficiency were confirmed, and the confirmed results are shown in FIG. 8 .

도 8에서 확인한 바와 같이, 가이드 4는 수치상으로 결실이 많은 것을 확인하였으나, 가장 주된 편집패턴은 ATGAGGTCTATGGA 시퀀스 사이에 ATGAGGTTCTATGGA로 T 1bp 삽입 패턴을 가장 많이 나타나는 것을 확인할 수 있었다.As confirmed in FIG. 8 , it was confirmed that guide 4 had many numerical deletions, but the most major editing pattern was ATGAGGTCTATGGA between the ATGAGGTCTATGGA sequences, and it was confirmed that the T 1bp insertion pattern was the most frequent.

종합하여, 표 10 내지 표 13에서 확인한 바와 같이, NGS 결과 분석을 통하여 확인한 결과 TRAC 가이드 1이 총 인델 빈도에서 메인 패턴의 비율이 가장 높게 나타난 것을 확인하였고, 총 삽입 빈도에서는 TRAC 가이드 2의 메인 삽입 패턴이 가장 높게 나타나는 것을 확인하였다. 메인 패턴을 확인한 결과 TRAC 가이드 1은 A 삽입, 가이드 2는 ACCCTG 6bp 결실이 가장 많이 확인되었으며, 총 삽입 빈도는 가이드 1이 가장 높았고, 총 인델 빈도에서 메인 패턴의 비율은 가이드 2가 더 높게 확인되는 것을 확인하였다. 유전자 편집 효율은 전반적으로 가이드 1이 높았지만 메일 패턴을 고려할 때 가이드 2 역시도 충분히 우수한 편집능을 나타내는 것을 확인하였다. In summary, as confirmed in Tables 10 to 13, it was confirmed through NGS result analysis that TRAC guide 1 showed the highest ratio of main patterns in total indel frequency, and main insertion of TRAC guide 2 in total insertion frequency. It was confirmed that the pattern appeared the highest. As a result of checking the main pattern, TRAC guide 1 had A insertion and guide 2 had the most ACCCTG 6bp deletion, guide 1 had the highest total insertion frequency, and guide 2 showed a higher ratio of main pattern to total indel frequency. confirmed that. In general, the gene editing efficiency of Guide 1 was high, but it was confirmed that Guide 2 also exhibited sufficiently excellent editing ability when considering the mail pattern.

TRAC 가이드 RNA의 경우 TRAC 가이드 1이 모든 Cas9 변이체인 evoCas9, SpCas9-HF1, HypaCas9, eSpCas9 (1.1)과의 조합에서 가장 높은 인델 빈도를 나타내는 것을 확인하였고, 그 다음으로 가이드 2가 높은 인델 빈도를 나타내 유전자 편집 효율이 우수한 것을 확인하였다. In the case of TRAC guide RNA, it was confirmed that TRAC guide 1 exhibited the highest indel frequency in combination with all Cas9 variants evoCas9, SpCas9-HF1, HypaCas9, and eSpCas9 (1.1), followed by guide 2 with the highest indel frequency. It was confirmed that the gene editing efficiency was excellent.

전술한 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.The above description is for illustration, and those of ordinary skill in the art to which the present invention pertains will understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive.

SEQUENCE LISTING <110> Cellengene Inc <120> Guide RNA complementary to TRAC gene and use thereof <130> PN139183 <150> KR 10-2021-0044309 <151> 2021-04-05 <160> 13 <170> PatentIn version 3.2 <210> 1 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 1 <400> 1 agagtctctc agctggtaca 20 <210> 2 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 2 <400> 2 gctggtacac ggcagggtca 20 <210> 3 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 3 <400> 3 acacggcagg gtcagggttc 20 <210> 4 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 4 <400> 4 tgtgctagac atgaggtcta 20 <210> 5 <211> 22 <212> DNA <213> Artificial <220> <223> nucleotide sequence of forward adapter sequence <400> 5 ctacacgacg ctcttccgat ct 22 <210> 6 <211> 34 <212> DNA <213> Artificial <220> <223> nucleotide sequence of reverse adapter sequence <400> 6 gtgactggag ttcagacgtg tgctcttccg atct 34 <210> 7 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of eSpCas9 <400> 7 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct ggccgacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctgcgc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaaggcg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 8 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of evoCas9 <400> 8 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc gggtgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgaacgagta cttcaccgtg 1560 tataacgagc tgaccgaggt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 cagctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 9 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of HypaCas9 <400> 9 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agagccttcg ccgccctgat cgccgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 10 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of Sniper-Cas9 <400> 10 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccagcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatcg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaac ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 11 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of SpCas9 <400> 11 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 12 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of SpCas9-HF1 <400> 12 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccgc cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 gccctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tggccctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccgggccat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 13 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of xCas9 <400> 13 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gataccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaagc tgtacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcatcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgagaaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgacc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tccagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgtgctg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 SEQUENCE LISTING <110> Cellengene Inc <120> Guide RNA complementary to TRAC gene and use thereof <130> PN139183 <150> KR 10-2021-0044309 <151> 2021-04-05 <160> 13 <170> PatentIn version 3.2 <210> 1 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 1 <400> 1 agagtctctc agctggtaca 20 <210> 2 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 2 <400> 2 gctggtacac ggcagggtca 20 <210> 3 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 3 <400 > 3 acacggcagg gtcagggttc 20 <210> 4 <211> 20 <212> DNA <213> Artificial <220> <223> nucleotide sequence of guide RNA 4 <400> 4 tgtgctagac atgaggtcta 20 <210> 5 <211> 22 <212 > DNA <213> Artificial <220> <223> nucleotide sequence of forward adapter sequence <400> 5 ctacacgacg ctcttccgat ct 22 <210> 6 <211> 34 <212> DNA <213> Artificial <220> <223> nucleotide sequence of reverse adapter sequence <400> 6 gtgactggag ttcagacgtg tgctcttccg atct 34 <210> 7 <211> 4104 <2 12> DNA <213> Artificial <220> <223> nucleotide sequence of eSpCas9 <400> 7 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgca gctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc ca tcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggaca tc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct ggccgacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctgcgc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaaggcg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctg cccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 8 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of evoCas9 <400> 8 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagat cggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc gggtgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgaacgagta cttcaccgtg 1560 tataacgagc tgaccgaggt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tg aaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 cagctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagcttt ct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccc taagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 9 <211> 4104 <212> DNA <213 > Artificial <220> <223> nucleotide sequence of HypaCas9 <400> 9 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccat c 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 t ccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agagccttcg ccgccctgat cgccgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaaga acc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tg gtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 10 <211> 4104 <212> DNA <213> Artificial <220> < 223> nucleotide sequence of Sniper-Cas9 <400> 10 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccag caag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacgga acctagactaga ccgctg 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggca ccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccagcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat c aacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatcg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaac ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctg atc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aa atatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 11 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of SpCas9 <400> 11 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattggcaagt agacaccagccg 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaggag ttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagca gcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatt tccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg c tcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 12 <211 > 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of SpCas9-HF1 <400> 12 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggacggtgg aacagctaccgga accggacggtgg aacagctacc ccatctacca cctgagaaag 420 aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagc tgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440 gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccgc cttcgataag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 gccctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tggccctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccgggccat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 t accaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcaca agc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080 gacctgtctc agctgggagg cgac 4104 <210> 13 <211> 4104 <212> DNA <213> Artificial <220> <223> nucleotide sequence of xCas9 <400> 13 atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120 cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180 gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240 tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatagctagacca acctgagaaag 420 acc c tgcggctga tctatctggc cctggcccac 480 atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660 cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720 ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gataccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960 atgatcaagc tgtacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020 cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140 gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200 aagcagcgga ccttcgacaa cggcatcatc ccccaccaga tccacctggg agagctgcac 1260 gccattctgc ggcggcagga agatttttac ccattcctga aggac aaccg ggaaaagatc 1320 gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380 agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcg tggacaa agga gtg tggatgacaa 1440 gct ggtggaa cttcg tggacac agga gct aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620 agcggcgacc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680 gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740 tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800 atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860 ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920 cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980 aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040 gatttcctga agtccgacgg cttcgccaac agaaacttca tccagctgat ccacgacgac 2100 agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160 cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220 gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280 atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340 atgaag cgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400 gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460 gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520 atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580 gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640 aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700 accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760 ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820 actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880 aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000 taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060 atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120 aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180 cctctgatcg a gacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240 gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300 cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360 gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420 tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480 aaagagctac tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540 tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600 tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgtgctg 3660 cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720 cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840 atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900 cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960 cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020 gaggtgctgg acgccac cct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080gacctgtctc agctgggagg cgac 4104

Claims

A guide RNA comprising a nucleic acid sequence identical to or complementary to one type of polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4.

The guide RNA according to claim 1, wherein the complementary nucleic acid sequence is a polynucleotide into which one selected polynucleotide is transcribed.

The guide RNA according to claim 1, wherein the guide RNA hybridizes with the TRAC gene.

The guide RNA according to claim 1, wherein the guide RNA is bound to at least one site in the region consisting of exon 1 of the TRAC gene.

The guide RNA according to claim 1, wherein the guide RNA induces modifications in the nucleic acid sequence of the TRAC gene.

6. The method of claim 5, wherein the modification in the nucleic acid sequence is
1) Deletion of the entire or consecutive 1bp to 15bp nucleotide sequence region of the TRAC gene;
2) substitution of 1 to 15 nucleotides of the TRAC gene with nucleotides different from those of the wild-type gene;
3) insertion of 1 to 15 nucleotides each independently selected from A, T, C and G into TRAC, or
4) A combination of two or more selected from 1) to 3) above
Guide RNA by.

a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4; and
Cas9 editor protein or variant thereof; or a CRISPR/Cas9 system comprising a nucleic acid sequence encoding the same.

The CRISPR/Cas9 system of claim 7, wherein the variant of the Cas9 editor protein is at least one selected from the group consisting of HypaCas9, SpCas9, evoCas9, eSpCas9, Sniper-Cas9, SpCas9-HF1 and xCas9.

a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4; and
Cas9 editor protein or variant thereof; Or a recombinant vector comprising a nucleic acid sequence encoding the same.

a guide RNA and a Cas9 editor protein comprising a nucleic acid sequence identical to or complementary to one polynucleotide selected from the group consisting of SEQ ID NOs: 1 to 4, or a variant thereof; Or a composition for TRAC gene editing comprising a nucleic acid sequence encoding the same.