KR102287880B1

KR102287880B1 - 세포에서 이중 가닥 dna의 표적 부위를 변형시키기 위한 방법

Info

Publication number: KR102287880B1
Application number: KR1020207029183A
Authority: KR
Inventors: 케이지 니시다
Original assignee: 고쿠리츠다이가쿠호진 고베다이가쿠
Priority date: 2018-03-26
Filing date: 2019-03-26
Publication date: 2021-08-09
Also published as: CN111148833A; CN111148833B; JP6727680B2; CA3095291A1; KR20200123255A; JP7250349B2; SG11202009319YA; EP3660152A1; EP3660152A4; CA3095291C; US11041169B2; JPWO2019189147A1; JP2020191879A; BR112020019301A2; JP2023063448A; US20200270631A1; WO2019189147A1

Abstract

본 발명은 세포에서 이중 가닥 DNA의 표적 부위를 변형시키기 위한 방법을 제공하고, 상기 방법은 표적 부위 내의 상기 이중 가닥 DNA 중 적어도 하나의 가닥의 절단 없이 표적 부위를 삽입 서열로 치환하거나, 삽입 서열을 상기 표적 부위 내로 삽입하기 위해, 이중 가닥 DNA 내의 선택된 표적 뉴클레오타이드 서열에 특이적으로 결합하는 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 또는 DNA 글리코실라제가 연결된 복합체, 및 삽입 서열을 포함하는 공여체 DNA를 상기 이중 가닥 DNA와 접촉시키는 단계를 포함한다.

Description

세포에서 이중 가닥 DNA의 표적 부위를 변형시키기 위한 방법

본 발명은 이중 가닥 DNA를 변형시키기 위한 방법으로서, 이중 가닥 DNA의 절단 없이 (절단 또는 단일 가닥 절단 없이) 상동성 재조합을 사용하여 세포가 갖는 이중 가닥 DNA의 특정 영역에서 표적 부위를 변형시킬 수 있는 방법에 관한 것이다.

CRISPR (일정한 간격의 규칙적 구조로 배열된 짧은 회문 반복) 및 CRISPR 연관 (Cas) 단백질은 단일 가이드 RNA (sgRNA) 및 프로토스페이서 (protospacer) 인접 모티프 (PAM)에 따른 방식으로 표적 DNA를 절단하여 박테리아 적응 면역 시스템으로 작동하는 것으로 공지되어 있다. 스트렙토코쿠스 피오제네스 (Streptococcus pyogenes)로부터의 Cas9 뉴클레아제는 이중 가닥 DNA 파손 (DSB) 수선 경로를 가진 진핵생물에서 강력한 게놈 편집 툴로 광범위하게 사용된다 (예를 들어, 비 특허 문헌 1, 2). 비상동성 말단 결합 (NHEJ) 경로에 의한 DSB 수선 동안, 작은 삽입 및/또는 결실 (indel)이 표적 DNA에 도입되고, 부위 특이적 돌연변이 또는 유전자 파괴가 발생한다. 효율은 숙주 세포에 따라 다르지만, 더욱 정확한 편집을 위해 상동성 아암 (arm)을 포함하는 공여체 DNA를 표적 영역에 제공함으로써 상동성 재조합 수선 (HDR)을 용이하게 할 수 있다. 그러나, 전술한 종래의 방법은 이중 가닥 DNA의 절단 동안 예상치 못한 게놈 변형을 수반하기 때문에, 강한 세포독성, 염색체 재배열 등과 같은 부작용이 발생하고, 유전자 치료의 신뢰성 손상, 뉴클레오타이드 변형에 의한 극히 소수의 세포의 생존 등의 일반적인 문제가 발생한다. Cas9 니카제 (nCas9)를 사용한 상동성 재조합이 또한 보고되었지만 (비 특허 문헌 1, 2), 재조합 유도 효율은 Cas9 뉴클레아제와 비교하여 때때로 매우 낮다 (비 특허 문헌 3). 본 발명자들이 아는 한, 뉴클레아제 활성 둘 모두가 불활성화된 Cas9 (dCas9)를 사용한 상동성 재조합은 보고되지 않았다.

최근, 표적 영역에 대한 상동성 아암을 포함하는 공여체 DNA를 사용하지 않고 표적 유전자 좌위에서 뉴클레오타이드를 직접 편집하는 탈아미노효소 매개 표적 염기 편집이 보고되었다 (예를 들어, 특허 문헌 1, 비 특허 문헌 4 내지 6). 이 기술은 뉴클레아제 매개 DNA 절단 대신 DNA 탈아미노화를 사용하기 때문에, 세포독성이 낮고, 정확한 돌연변이를 도입할 수 있다.

[인용 목록]

[특허 문헌]

특허 문헌 1: WO 2015/133554

[비 특허 문헌]

비 특허 문헌 1: 문헌[Mali, P. et al., Science 339:823-827 (2013)]

비 특허 문헌 2: 문헌[Cong, L. et al., Science 339:819-823 (2013)]

비 특허 문헌 3: 문헌[Ran, F.A. et al., Nat Protoc, 8:2281-2308 (2013)]

비 특허 문헌 4: 문헌[Komor, A. C. et al., Nature 61:5985-91 (2016)]

비 특허 문헌 5: 문헌[Nishida, K. et al., Science 102:553-563 (2016)]

비 특허 문헌 6: 문헌[Ma, Y. et al., Nat. Methods 1-9 (2016) doi:10.1038/nmeth.4027]

그러나, 이 기술은 탈아미노효소를 사용하기 때문에, 도입 가능한 돌연변이의 유형 또는 돌연변이 부위에 제한이 있으며, 유전자의 방향 및 조합의 전환 또는 유전자 절편 녹인 (knock-in)이 불가능하였다. 따라서, 본 발명의 과제는 핵산 염기 전환 효소, 예컨대 탈아미노효소 등, 또는 DNA 글리코실라제를 사용한 신규한 DNA 변형 기술을 제공하는 것이고, 이 기술은 도입 가능한 돌연변이의 유형 또는 돌연변이 부위에 의해 제한되지 않고, 유전자의 방향 및 조합을 전환시킬 수 있으며, 유전자 절편을 녹인시킬 수 있다.

분열 세포의 경우, 특히 심각한 형태의 DNA 손상은 DNA 이중 가닥 중 두 가닥 모두가 절단되는 장애이다. 이 장애를 수선하는 메커니즘으로 상동성 재조합 및 비 상동성 말단 결합이 공지되어 있다. 한편, DNA 이중 가닥 중 한 가닥이 손상된 경우에는 주로 알킬화 또는 탈아미노화로 인한 손상을 수선하는 메커니즘인 염기 절제 수선 또는 이중 가닥을 변형하는 수십개의 염기쌍에서의 상대적으로 대규모 손상을 수선하는 메커니즘인 뉴클레오타이드 절제 수선 (NER)에 의해 수선된다. 비율 등은 확인되지 않았지만, 또한, DNA 이중 가닥 중 하나가 손상되어도 상보적 가닥의 수선이 유도되는 것으로 공지되어 있다.

그러나, 염기 절제 수선에 대한 상보적 가닥 수선의 활성 정도는 충분히 확인되지 않았고, 염기 절제 수선을 사용한 상동성 재조합에 의한 DNA 편집이 활발히 수행되지 않고 있다. 본 발명자들이 아는 한, 이러한 DNA 편집에 대해 보고된 바가 없다. 이러한 상황에서 본 발명자들은 핵산 염기 전환 효소를 사용하여 세포 내 DNA의 탈아미노화 또는 염기 절제를 유발하여 상보적 가닥 수선을 유도할 수 있으며, 그 동안 DNA를 공여체 DNA와 접촉시켜, 상동성 재조합을 사용하여, DNA를 재조합할 수 있다는 아이디어를 내놓았다. 이 아이디어를 바탕으로 본 발명자들은 추가 연구를 수행하였다. 그 결과, 본 발명자들은 핵산 서열 인식 모듈 및 핵산 염기 전환 효소가 연결된 복합체 및 삽입 서열을 포함하는 공여체 DNA를 표적 DNA와 접촉시킴으로써, 세포독성을 억제하면서 DNA의 상동성 재조합이 가능하고, 바람직한 실시형태에서 놀랍게도 표적 부위에서 대략 100%의 상동성 재조합 활성이 이루어짐을 발견하였다. 본 발명자들은 이러한 결과를 기반으로 하여 추가 연구를 수행하여 본 발명을 완성하였다.

구체적으로, 본 발명은 다음을 제공한다.

세포의 이중 가닥 DNA의 표적 부위를 변형시키기 위한 방법으로서, 표적 부위 내의 상기 이중 가닥 DNA 중 적어도 하나의 가닥의 절단 없이 표적 부위를 삽입 서열로 치환하거나, 삽입 서열을 상기 표적 부위 내로 삽입하기 위해, 이중 가닥 DNA 내의 선택된 표적 뉴클레오타이드 서열에 특이적으로 결합하는 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 또는 DNA 글리코실라제가 연결된 복합체, 및 삽입 서열을 포함하는 공여체 DNA를 상기 이중 가닥 DNA와 접촉시키는 단계를 포함하는, 방법.

[2] [1]에 있어서, 공여체 DNA는 표적 부위에 인접한 영역에 서열 상동체를 포함하는, 방법.

[3] [1] 또는 [2]에 있어서, 핵산 서열 인식 모듈은 Cas 효과기 단백질의 적어도 하나의 DNA 절단 능력이 불활성화된 CRISPR-Cas 시스템, 아연 핑거 모티프, TAL 효과기 및 PPR 모티프로 이루어진 군으로부터 선택되는, 방법.

[4] [1] 내지 [3] 중 어느 한 항에 있어서, 핵산 서열 인식 모듈은 Cas 효과기 단백질의 2개의 DNA 절단 능력 중 단지 하나만이 불활성화된 CRISPR-Cas 시스템인, 방법.

[5] [1] 내지 [3] 중 어느 한 항에 있어서, 핵산 서열 인식 모듈은 Cas 효과기 단백질의 DNA 절단 능력 둘 모두가 불활성화된 CRISPR-Cas 시스템인, 방법.

[6] [1] 내지 [5] 중 어느 한 항에 있어서, 핵산 염기 전환 효소는 탈아미노효소인, 방법.

[7] [6]에 있어서, 탈아미노효소는 시티딘 탈아미노효소인, 방법.

[8] [7]에 있어서, 시티딘 탈아미노효소는 PmCDA1인, 방법.

[9] [1] 내지 [8] 중 어느 한 항에 있어서, 이중 가닥 DNA는 복합체를 인코딩하는 핵산을 세포 내에 도입시킴으로써, 복합체와 접촉되는 것인, 방법.

[10] [1] 내지 [9] 중 어느 한 항에 있어서, 세포는 원핵 세포 또는 진핵 세포인, 방법.

[11] [10]에 있어서, 세포는 미생물 세포인, 방법.

[12] [10]에 있어서, 세포는 식물 세포, 곤충 세포 또는 동물 세포인, 방법.

[13] [12]에 있어서, 동물 세포는 척추동물 세포인, 방법.

[14] [13]에 있어서, 척추동물 세포는 포유류 세포인, 방법.

본 발명에 따르면, 핵산 염기 전환 효소, 예컨대 탈아미노효소 등 또는 DNA 글리코실라제를 사용한 신규한 DNA 변형 기술로서, 이 기술은 도입 가능한 돌연변이의 유형 또는 돌연변이 부위에 의해 제한되지 않고, 유전자의 방향 및 조합을 전환시킬 수 있으며, 유전자 절편을 녹인할 수 있는 기술이 제공된다. 본 발명의 DNA 변형 기술은 이중 가닥 DNA의 절단 없이, 표적 부위를 변형시킬 수 있기 때문에, 절단에 수반되는 예기치 않은 재배열 및 독성이 억제되고, 종래 방법과 비교하여 표적 부위를 훨씬 더욱 효율적으로 변형시킬 수 있다.

도 1은 상보적 가닥 변형에 의한 게놈 변형 메커니즘의 개략도를 보여준다. 세포 내로의 재조합을 위한 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 또는 DNA 글리코실라제가 연결된 복합체, 및 공여체 DNA의 도입은 삽입 서열의 고효율 녹인을 가능하게 한다.
도 2는 dCas9-CDA 또는 nCas9-CDA 및 공여체 DNA를 사용하여 표적 부위에 돌연변이를 성공적으로 도입한 것을 보여준다. 벡터 1525:pRS415_dCas9-CDA+CAN(mut); 벡터 1526: pRS415_nCas9-CDA+CAN(mut); 벡터 1059:pRS426_SNR52-Can7R-sgRNA; 벡터 1149: pRS426_SNR52-Can10R-sgRNA
도 3은 Ade1 및 Ade1의 프로모터 영역 사이에 마커 스위치가 미리 도입된 발아 효모 (BY4741 균주)를 사용한 재조합 평가 시스템을 보여준다. 상동성 영역에서 재결합에 의해 마커 스위치가 반대로 전환되면, Ade1의 기능이 회복되고, 콜로니의 색이 적색에서 백색으로 바뀐다.
도 4는 도 3의 재조합 평가 시스템을 사용한 재조합 반응의 실증 실험 결과를 보여준다. 플라스미드 벡터 (이하 또한 경우에 따라 "벡터"로 약칭됨) 1553: nCas9-CDA_UraAde 표적 2 (표적 뉴클레오타이드 서열: cctttagcggcttaactgtg (SEQ ID NO: 9)); 벡터 1557: nCas9-CDA_UraAde 표적 6 (표적 뉴클레오타이드 서열: ggcccaggtattgttagcgg (SEQ ID NO: 10)), 벡터 1559: nCas9-CDA_UraAde 표적 8 (표적 뉴클레오타이드 서열: ttggcggataatgcctttag (SEQ ID NO: 11)); 벡터 1560: nCas9-CDA_UraAde 표적 9 (표적 뉴클레오타이드 서열: tgcagttgggttaagaatac (SEQ ID NO: 12)), 벡터 1562: nCas9-CDA_UraAde 표적 11 (표적 뉴클레오타이드 서열: gctaacatcaaaaggcctct (SEQ ID NO: 13)); 벡터 1565: dCas9-CDA_UraAde 표적 3 (표적 뉴클레오타이드 서열: ttggcggataatgcctttag (SEQ ID NO: 14)). 전술한 벡터 (1553, 1557, 1559, 1560, 1562, 1565)는 벡터 1059 (SEQ ID NO: 5)의 서열에서 3890번부터 3909번까지 위치의 뉴클레오타이드 서열이 전술한 표적 뉴클레오타이드 서열로 치환된 벡터에 해당한다. 벡터 번호의 마지막 두 자리는 도 4의 표적 부위의 번호에 해당한다.
도 5는 본 발명의 DNA 변형 방법을 사용한 녹인 또는 녹아웃 (knock-out) 방법의 개략도이다.
도 6은 도 5의 방법을 사용한 녹인 또는 녹아웃 실증 실험 결과를 보여준다.
도 7은 실시예 5에서 동물 세포를 사용해 수행된 재조합 평가 시스템의 개략도 및 실험 조건을 보여준다.
도 8은 도 7의 재조합 평가 시스템을 사용한 재조합 반응의 실증 실험 결과를 보여준다. 그래프의 가로 축은 상동성 재조합률 (%)을 나타낸다.
도 9는 실시예 6에서 동물 세포를 사용해 수행된 재조합 평가 시스템의 개략도 및 실험 조건을 보여준다.
도 10은 도 9의 재조합 평가 시스템을 사용한 재조합 반응의 실증 실험 결과를 보여준다. 그래프의 세로 축은 상동성 재조합률 (%)을 나타낸다.
도 11은 실시예 7에서 동물 세포를 사용하여 수행된 재조합 평가 시스템의 개략도 및 실험 조건을 보여준다.
도 12는 도 11의 재조합 평가 시스템을 사용한 재조합 반응의 실증 실험 결과를 보여준다. 그래프의 가로 축은 상동성 재조합률 (%)을 나타낸다.

본 발명은 이중 가닥 DNA (예를 들어, 염색체 DNA, 미토콘드리아 DNA, 엽록체 DNA; 이하 이는 또한 "게놈 DNA"로 총칭됨) 중 적어도 하나의 가닥의 절단 없이, 이중 가닥 DNA의 표적 부위를 외인성 공여체 DNA에 포함된 삽입 서열로 치환하거나, 삽입 서열을 표적 부위에 삽입함으로써, 이중 가닥 DNA의 표적 부위를 변형시키기 위한 방법을 제공한다 (이하 또한 경우에 따라 "본 발명의 방법"으로 약칭됨). 본 방법은 이중 가닥 DNA의 표적 뉴클레오타이드 서열에 특이적으로 결합하는 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 또는 DNA 글리코실라제 (이하, 때때로 "핵산 염기 전환 효소 등"으로 약칭됨)의 복합체 및 삽입 서열을 포함하는 공여체 DNA를 이중 가닥 DNA와 접촉시키는 단계를 특징으로 한다.

본 발명에서 이중 가닥 DNA의 "변형"은 DNA 가닥의 뉴클레오타이드 (예를 들어, dA, dC, dG 또는 dT) 또는 뉴클레오타이드 서열이 다른 뉴클레오타이드 또는 뉴클레오타이드 서열로 치환되거나, 다른 뉴클레오타이드 또는 뉴클레오타이드 서열이 DNA 가닥의 특정 뉴클레오타이드 사이에 삽입된 것을 의미한다. 변형되는 이중 가닥 DNA는 특별히 제한되지 않지만, 바람직하게는 게놈 DNA이다.

본 발명에서, "공여체 DNA"는 외인성 삽입 서열을 포함하는 DNA를 의미하고, 일반적으로 공여체 DNA는 표적 부위에 인접한 표적 부위의 상류 부분 및 하류 부분의 2개의 영역 (이하 또한 "인접 영역"으로 지칭됨)의 서열에 상동인(homologous) 2개의 종류의 서열 (이하 또한 경우에 따라 "상동성 아암"으로 지칭됨)을 포함한다. 각각의 상동성 아암이 구별되는 경우, "5'상동성 아암" 및 "3' 상동성 아암"으로 지칭될 수 있다. 이중 가닥 DNA의 "표적 부위"는 공여체 DNA에 포함된 삽입 서열로 치환될 영역 또는 삽입 서열이 삽입되는 뉴클레오타이드 사이의 영역을 의미하며, 표적 부위는 전술한 인접 서열을 포함하지 않는다.

표적 부위에 인접한 영역에 상동인 서열은 완전히 동일한 서열일 뿐만 아니라, 바람직하게는 상동성 재조합이 세포에서 발생할 수 있는 한 완전히 동일한 서열과 80% 이상 (예를 들어, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상) 동일성을 갖는 서열이다.

삽입 서열은 필요한 경우 약물 내성 유전자 (예를 들어, 카나마이신 (kanamycin) 내성 유전자, 암피실린 (ampicillin) 내성 유전자, 퓨로마이신 (puromycin) 내성 유전자 등), 선택 마커 서열, 예컨대 티미딘 키나제 (thymidine kinase) 유전자, 디프테리아 (diphtheria) 독소 유전자, 리포터 유전자 서열, 예컨대 녹색 형광 단백질 (GFP), 적색 형광 단백질, β-글루쿠로니다제 (glucuronidase) (GUS), FLAG 등을 포함할 수 있다. 더욱이, LoxP 서열, FRT 서열 또는 트랜스포손 특이적 말단 삽입 서열 (PiggyBac 말단 반복)을 유전자 전 및 후에 제공하여, 이들 유전자가 세포 분류 등이 완료된 후에 절제될 수 있도록 할 수 있다. 바람직한 트랜스포손 (transposon)의 예로는 나비목 곤충에서 유래된 트랜스포손인 piggyBac 등이 포함된다 (문헌[Kaji, K. et al., Nature, 458: 771-775 (2009), Woltjen et al., Nature, 458: 766-770 (2009)], WO 2010/012077). 대안적으로, 문헌[Oji A et al., Sci Rep, 6: 31666 (2016)] 등에 기재된 바와 같이, 전술한 약물 내성 유전자를 포함하는 발현 벡터를 공동 형질감염시키고, 일시적 (약 수일) 약물 선택을 수행할 수 있다. 서열을 디코딩 (decoding)하고, 서던 혼성화 (Southern hybridization) 또는 PCR 방법 등을 통해 세포로부터 분리 및 추출된 염색체 DNA를 스크리닝하여 삽입 서열이 표적 부위에 삽입되었는지 또는 표적 부위로 치환되었는지를 확인할 수 있다. 공여체 DNA에 전술한 약물 내성 유전자 등이 존재하는 경우에는 또한 그 발현을 지표로 하여 확인 단계를 수행할 수 있다.

공여체 DNA는 선형 (예를 들어, 합성 이중 가닥 DNA), 원형 (예를 들어, 플라스미드 DNA) 또는 단일 가닥 DNA (예를 들어, 단일 가닥 올리고데옥시 뉴클레오타이드) (ssODN)) 또는 이중 가닥 DNA일 수 있다. 공여체 DNA는 삽입 서열의 염기 길이, 숙주 세포의 상동성 재조합 활성 등에 따라 적절하게 설계될 수 있다. 예를 들어, 삽입 염기 서열이 100개 이하의 염기 길이인 경우에는 일반적으로 ssODN 또는 합성 이중 가닥 DNA를 사용하고, 그 보다 긴 경우에는 일반적으로 합성 이중 가닥 DNA 또는 플라스미드 DNA를 사용한다. 또한, 공여체 DNA의 길이는 특별히 제한되지 않으며, 삽입 서열의 길이 등에 따라 적절히 설계될 수 있다. 삽입 서열의 길이는 특별히 제한되지 않으며, 목적에 따라, 일반적으로 1 내지 수만개의 염기 길이 범위 내에서 적절하게 설계될 수 있다 (예를 들어, ssODN의 경우, 100개 이하의 염기 길이 (예를 들어, 70개 이하, 50개 이하)). 또한, 각 상동성 아암의 길이는 특별히 제한되지 않는다. 공여체 DNA가 ssODN인 경우, 일반적으로 10개의 염기 내지 150개의 염기 길이의 DNA가 사용된다. 공여체 DNA가 합성 이중 가닥 DNA인 경우, 10개의 염기 내지 5000개의 염기 길이의 DNA가 일반적으로 사용되고, 공여체 DNA가 플라스미드 DNA인 경우, 100개의 염기 내지 5000개의 염기, 바람직하게는 500개의 염기 내지 1000개의 염기 길이의 DNA가 일반적으로 사용된다. 이러한 공여체 DNA는 공개 문헌을 참조하여 설계될 수 있다 (예를 들어, 문헌[Ochiai H, Int J Mol Sci, 16:21128-21137 (2015), Hockemeyer D et al., Nat Biotefchnol, 27:851-857 (2009)]).

본 발명에서 "핵산 서열 인식 모듈"은 DNA 가닥 상의 특정 뉴클레오타이드 서열 (즉, 표적 뉴클레오타이드 서열)을 특이적으로 인식하여 그에 결합하는 능력을 갖는 분자 또는 분자 복합체를 의미한다. 핵산 서열 인식 모듈과 표적 뉴클레오타이드 서열의 결합에 의해, 모듈에 연결된 핵산 염기 전환 효소 등이, 이중 가닥 DNA의 핵산 염기 전환 효소 등에 의해 표적화되는 부위 (즉, 표적 뉴클레오타이드 서열 및 그 부근의 뉴클레오타이드)에 특이적으로 작용할 수 있다.

후술하는 실시예에 제시된 바와 같이, 핵산 염기 전환 효소 및 핵산 서열 인식 모듈의 복합체 및 공여체 DNA를 세포에 도입하여 표적 부위를 변형시킬 수 있음이 입증되었다. 임의의 이론에 결부시키고자 하는 것은 아니나, 이러한 방법에 의한 표적 부위 변형 메커니즘은 다음과 같다고 가정된다. 핵산 염기 전환 효소에 의해 표적화되는 부위에 존재하는 염기는 다른 염기로 전환되고, 전환된 염기는 DNA 글리코실라제에 의해 제거되며, 효소에 의한 염기 절제 반응으로 인한 무염기 부위 (무퓨린/무피리미딘 (AP) 부위)는 AP 엔도뉴클레아제, DNA 중합효소, DNA 리가제 등과 같은 염기 절제 수선 (BER) 경로의 하류의 효소에 의해 처리된다. 다른 한편으로, BER 완료 없이 비정상적인 뉴클레오타이드 또는 비매칭 구조의 존재는 또한 상보적 가닥 수선 경로를 활성화하고, 표적 부위와 공여체 DNA 에 포함된 영역 사이에 상동성 재조합을 유발함으로써, 표적 부위의 변형이 발생한다. 따라서, DNA 글리코실라제를 사용하는 경우에도, 효소에 의해 표적화되는 부위에서 염기 절제를 유발함으로써 동일한 변형이 발생한다고 가정된다. 따라서, 핵산 염기 전환 효소뿐만 아니라, DNA 글리코실라제가 본 발명의 방법에 적용될 수 있다.

본 발명에서, "핵산 염기 전환 효소"는 DNA 가닥의 절단 없이, DNA 염기의 퓨린 또는 피리미딘 고리의 치환기를 다른 기 또는 원자로 전환시키는 반응을 촉매하여, 표적 뉴클레오타이드를 다른 뉴클레오타이드로 전환시킬 수 있는 효소를 의미한다.

본 발명에서, "DNA 글리코실라제"는 DNA의 N-글리코사이드 결합을 가수분해하는 효소를 의미한다. DNA 글리코실라제는 본래 BER에서 DNA로부터 손상된 염기를 제거하는 역할을 한다. 본 발명에서는 DNA의 정상 염기 (즉, dC, dT, dA 또는 dG 또는 후성적 변형이 이루어진 것)에 작용할 수 있는 것이 바람직하다. 또한, 본래 정상 염기와 반응하지 않거나 반응성이 낮지만, 돌연변이로 인해 정상 염기와 반응성을 획득하거나, 반응성이 개선된 돌연변이 DNA 글리코실라제가 본 발명의 DNA 글리코실라제에 포함되며, 바람직하게 사용될 수 있다. 효소에 의한 염기 절제 반응의 결과로 생성된 무염기 부위 (무퓨린/무피리미딘 (AP) 부위)는 AP 엔도뉴클레아제, DNA 중합효소, DNA 리가제 등과 같은 BER 경로 하류의 효소로 처리된다.

또한, "변형되지 않은 이중 나선 구조를 갖는 DNA와의 충분히 낮은 반응성"은 변형되지 않은 이중 나선 구조를 갖는 DNA가 형성되는 영역에서, 세포 생존율에 영향을 미치지 않는 수준으로 세포독성을 억제하는 빈도에서만 염기 절제 반응이 이루어짐을 의미한다. 본 명세서에서 사용되는 바와 같이, "변형되지 않은 이중 나선 구조를 갖는 DNA"는 강한 이중 나선 구조 (즉, 비해리 이중 나선 DNA (또는 간단하게, 비해리 DNA로 지칭됨))가 형성되는 것을 의미하며, 쌍 형성 염기가 완전히 분리된 단일 가닥 DNA의 상태뿐만 아니라, 염기쌍이 형성되나, 이중 나선 구조가 풀린 분리된 이중 가닥 DNA의 상태는 포함하지 않는다. 변형되지 않은 이중 나선 구조를 갖는 DNA와의 반응성이 충분히 낮은 DNA 글리코실라제의 예는 변형되지 않은 이중 나선 구조를 갖는 DNA와의 반응성이 필수적으로 충분히 낮은 DNA 글리코실라제, 야생형과 비교하여, 변형되지 않은 이중 나선 구조를 갖는 DNA와의 반응성을 저하시키는 돌연변이가 도입된 돌연변이 DNA 글리코실라제를 포함한다. 또한, 각 절편이 2개의 분할 핵산 서열 인식 모듈 중 하나에 결합되어, 2개의 복합체를 형성하고, 복합체 둘 모두가 다시 접히는 경우, 핵산 서열 인식 모듈이 표적 뉴클레오타이드 서열에 특이적으로 결합할 수 있으며, 특이적 결합에 의해 염기 절제 반응을 촉매할 수 있도록 설계된 2개의 절편으로 분할된 분할 효소인 DNA 글리코실라제가 또한, 본 발명의 "변형되지 않은 이중 나선 구조를 갖는 DNA와의 반응성이 충분히 낮은 DNA 글리코실라제"에 포함된다.

본 발명에서, "핵산 변형 효소 복합체"는 전술한 핵산 서열 인식 모듈을 포함하는 복합체 및 핵산 염기 전환 효소 또는 DNA 글리코실라제가 연결되고, 핵산 염기 전환 반응 또는 염기 절제 반응의 촉매 기능을 가지며, 특정 뉴클레오타이드 서열 인식 능력을 부여하는 분자 복합체를 의미한다. 본 명세서에서, "복합체"에는 다중 분자로 구성된 것뿐만 아니라, 융합 단백질과 같이 단일 분자 내에 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등을 갖는 것이 또한 포함된다.

본 발명에서 사용되는 핵산 염기 전환 효소는 전술한 반응을 촉매할 수 있는 한 특별히 제한되지 않으며, 그 예로는 아미노기를 카보닐기로 전환하는 탈아미노화 반응을 촉매하고, 핵산/ 뉴클레오타이드 탈아미노효소 슈퍼패밀리에 속하는 탈아미노효소를 포함한다. 바람직한 예로는 시토신 또는 5-메틸시토신을 각각 우라실 또는 티민으로 전환할 수 있는 시티딘 탈아미노효소, 아데닌을 하이폭산틴으로 전환할 수 있는 아데노신 탈아미노효소, 구아닌을 크산틴으로 전환할 수 있는 구아노신 탈아미노효소가 포함된다. 시티딘 탈아미노효소로서는 척추동물 등의 후천성 면역에서 면역글로불린 유전자에 돌연변이를 도입하는 효소인 활성화 유도 시티딘 탈아미노효소 (이하 또한 AID로 지칭됨)가 더욱 바람직하다.

핵산 염기 전환 효소의 유도는 특별히 제한되지 않지만, 예를 들어 칠성 장어 유래 PmCDA1 (칠성 장어 시토신 탈아미노효소 1) 또는 포유류 (예를 들어, 인간, 돼지, 소, 말, 원숭이 등) 유래 AID (활성화 유도 시티딘 탈아미노효소; AICDA)가 사용될 수 있다. 예를 들어, PmCDA1의 cDNA의 염기 서열 및 아미노산 서열의 경우 GenBank 수탁 번호 EF094822 및 ABO15149가 언급될 수 있으며, 인간 AID의 cDNA의 염기 서열 및 아미노산 서열의 경우에는 GenBank 수탁 번호 NM_020661 및 NP_065712가 언급될 수 있다. 효소 활성의 측면에서 PmCDA1이 바람직하다.

본 발명에 사용되는 DNA 글리코실라제는 DNA의 N-글리코사이드 결합을 가수분해하고 염기를 제거하는 반응을 촉매할 수 있는 한 특별히 제한되지 않는다. 게놈 편집 기술로서 광범위한 유용성을 향상시키기 위해, 정상 염기 (즉, dC, dT, dA 또는 dG 또는 후성적 변형에 의해 획득되는 것, 예를 들어 5-메틸시토신 등)에 작용할 수 있는 것이 바람직하다. 이러한 효소의 예로는 시토신 제거 반응을 촉매하는 CDG 활성을 갖는 효소, 티민 제거 반응을 촉매하는 TDG 활성을 갖는 효소, 5-메틸시토신 제거 활성 (5-mCDG 활성)을 갖는 효소 등이 포함된다. 구체적으로는 티민 DNA 글리코실라제, 옥소구아닌 글리코실라제, 알킬아데닌 DNA 글리코실라제 (예를 들어, 효모 3-메틸아데닌-DNA 글리코실라제 (MAG1) 등) 등이 언급될 수 있다. 본 발명자들은 DNA 글리코실라제로서 변형되지 않은 이중 나선 구조를 갖는 DNA (비해리 DNA)와의 반응성이 충분히 낮은 DNA 글리코실라제를 사용하는 경우, 세포독성을 감소시키고, 표적 서열을 효율적으로 변형시킬 수 있다고 이전에 보고하였다 (WO 2016/072399). 따라서, DNA 글리코실라제로는 변형되지 않은 이중 나선 구조를 갖는 DNA와의 반응성이 충분히 낮은 DNA 글리코실라제를 사용하는 것이 바람직하다. 이러한 DNA 글리코실라제의 예에는 시토신-DNA 글리코실라제 (CDG) 활성 및/또는 티민-DNA 글리코실라제 (TDG) 활성을 갖는 UNG의 돌연변이 (우라실-DNA 글리코실라제) 및 우두 바이러스로부터의 UDG 돌연변이가 포함되며, 이는 WO 2016/072399에 기재되어 있다.

전술한 UNG 돌연변이의 구체적인 예에는 UNG1 N222D/L304A 이중 돌연변이, N222D/R308E 이중 돌연변이, N222D/R308C 이중 돌연변이, Y164A/ L304A 이중 돌연변이, Y164A/R308E 이중 돌연변이, Y164A/R308C 이중 돌연변이, Y164G/ L304A 이중 돌연변이, Y164G/R308E 이중 돌연변이, Y164G/R308C 이중 돌연변이, N222D/Y164A/L304A 삼중 돌연변이, N222D/Y164A/R308E 삼중 돌연변이, N222D/Y164A/R308C 삼중 돌연변이, N222D/Y164G/L304A 삼중 돌연변이, N222D/Y164G/R308E 삼중 돌연변이, N222D/Y164G/R308C 삼중 돌연변이 등이 포함된다. 효모 UNG1 대신 다른 UNG를 사용하는 경우, 전술한 각 돌연변이에 해당하는 아미노산에 유사한 돌연변이가 도입된 돌연변이를 사용할 수 있다. 예를 들어, TDG 활성을 부여하는 돌연변이인 효모 UNG1의 Y164A 또는 Y164G 돌연변이에 해당하는 E. 콜라이 (E. coli) UNG의 돌연변이로 Y66A 또는 Y66G를 언급할 수 있으며, 인간 UNG의 돌연변이로서는 Y147A 또는 Y147G를 언급할 수 있다. CDG 활성을 부여하는 돌연변이인 효모 UNG1의 N222D 돌연변이에 해당하는 에세리키아 콜라이 (Escherichia coli) UNG의 돌연변이로는 N123D를 언급할 수 있고, 인간 UNG의 돌연변이로는 N204D를 언급할 수 있다. 변형되지 않은 이중 나선 구조를 갖는 DNA와의 반응성을 감소시키는 효모 UNG1의 L304A, R308E 또는 R308C 돌연변이에 해당하는 에세리키아 콜라이 UNG의 돌연변이로서, L191A, R195E 또는 R195C를 언급할 수 있으며, 인간 UNG의 돌연변이로서 L272A, R276E 또는 R276C를 언급할 수 있다. 우두 바이러스로부터의 UDG 돌연변이로서 N120D 돌연변이 (CDG 활성이 부여됨), Y70G 돌연변이 (TDG 활성이 부여됨), Y70A 돌연변이 (TDG 활성이 부여됨), N120D/Y70G 이중 돌연변이, N120D/Y70A 이중 돌연변이 등이 언급될 수 있다. 대안적으로, 이는 각 절편이 2개의 분할 핵산 서열 인식 모듈 중 하나에 결합되어, 2개의 복합체를 형성하고, 복합체 둘 모두가 다시 접히는 경우, 핵산 서열 인식 모듈이 표적 뉴클레오타이드 서열에 특이적으로 결합할 수 있으며, DNA 글리코실라제가 특이적 결합에 의해 염기 절제 반응을 촉매할 수 있도록 설계된 2개의 절편으로 분할된 분할 효소인 DNA 글리코실라제일 수 있다. 분할 효소는 예를 들어 WO 2016/072399, 문헌[Nat Biotechnol. 33(2): 139-142 (2015), PNAS 112(10): 2984-2989 (2015)]의 기재내용을 참조하여 설계 및 생성할 수 있다.

UNG의 유래는 특별히 제한되지 않지만, 예를 들어 에세리키아 콜라이로부터의 ung (문헌[Varshney, U. et al. (1988) J. Biol. Chem., 263, 7776-7784]), 효모, 포유류 (예를 들어, 인간, 마우스, 돼지, 소, 말, 원숭이 등) 유래의 UNG1 또는 UNG2 등 또는 바이러스 (예를 들어, 폭스바이러스과 (우두 바이러스 등), 헤르페스바이러스과 등)로부터 유래된 UDG가 사용될 수 있다.

본 발명의 핵산 변형 효소 복합체에서 핵산 서열 인식 모듈에 의해 인식되는 이중 가닥 DNA의 표적 뉴클레오타이드 서열은 모듈이 이중 가닥 DNA의 임의의 서열에 특이적으로 결합하고, 이중 가닥 DNA의 임의의 서열일 수 있는 한 특별히 제한되지 않는다. 표적 뉴클레오타이드 서열의 길이는 핵산 서열 인식 모듈의 특이적 결합을 위해 충분한 것이면 된다. 예를 들어, 포유류의 게놈 DNA의 특정 부위에 돌연변이가 도입되는 경우, 그 게놈 크기에 따라 12개 이상의 뉴클레오타이드, 바람직하게는 15개 이상의 뉴클레오타이드, 더욱 바람직하게는 17개 이상의 뉴클레오타이드이다. 길이의 상한은 특별히 제한되지 않지만, 바람직하게는 25개 이하의 뉴클레오타이드, 더욱 바람직하게는 22개 이하의 뉴클레오타이드이다. 하기의 실시예에 제시된 바와 같이, 표적 뉴클레오타이드 서열이 표적 부위, 상동성 아암에 상동인 서열 및 상동성 아암에 상동인 일부 서열을 포함하는 영역에 존재하는 일부 실험 시스템에서 입증되었다. 따라서, 표적 뉴클레오타이드 서열은 표적 부위에 존재할 수 있거나, 상동성 아암에 상동인 서열 영역의 적어도 일부에 존재할 수 있거나, 상동성 아암에 상동인 서열 부근의 영역에 존재할 수 있다.

본 발명의 핵산 변형 효소 복합체의 핵산 서열 인식 모듈로서, Cas 효과기 단백질 (이하 또한 Cas 뉴클레아제로 지칭됨)의 적어도 하나의 DNA 절단 능력이 불활성화된 CRISPR-Cas 시스템 (이하 또한 "CRISPR 돌연변이 Cas"로 지칭됨), 아연 핑거 모티프, TAL (전사 활성화 인자 유사) 효과기 및 PPR (펜타트리코펩타이드 반복) 모티프 등뿐만 아니라, DNA 이중 가닥 절단 능력이 없고, 제한 효소, 전사 인자, RNA 중합효소 등과 같이, DNA에 특이적으로 결합하는 단백질의 DNA 결합 도메인을 포함하는 단편이 사용될 수 있으나, 이러한 모듈에 제한되는 것은 아니다. 바람직하게는 CRISPR 돌연변이 Cas, 아연 핑거 모티프, TAL 효과기, PPR 모티프 등이 언급될 수 있다. 본 명세서에서는 적어도 하나의 DNA 절단 능력이 불활성화된 전술한 Cas 효과기 단백질이 또한 Cas 효과기 단백질 돌연변이로 지칭된다.

아연 핑거 모티프는 3 내지 6개의 Cys2His2 유형 아연 핑거 단위의 연결로 구성되며 (1개의 핑거는 약 3개의 염기를 인식함), 9 내지 18개의 염기의 표적 뉴클레오타이드 서열을 인식할 수 있다. 아연 핑거 모티프는 모듈 조립 방법 (문헌[Nat Biotechnol (2002) 20: 135-141]), OPEN 방법 (문헌[Mol Cell (2008) 31: 294-301]), CoDA 방법 (문헌[Nat Methods ( 2011) 8: 67-69]), 에세리키아 콜라이 1-혼성체 방법 (문헌[Nat Biotechnol (2008) 26: 695-701]) 등과 같은 공지 방법에 의해 생성될 수 있다. 아연 핑거 모티프 생성의 세부사항을 위해 JP-B-4968498을 참조할 수 있다.

TAL 효과기는 단위로 약 34개의 아미노산을 포함하는 모듈 반복 구조를 가지며, 하나의 모듈의 12번 및 13번 아미노산 잔기 (RVD라고 함)가 결합 안정성 및 염기 특이성을 결정한다. 각 모듈은 매우 독립적이므로, 단순히 모듈을 연결함으로써, 표적 뉴클레오타이드 서열에 특이적인 TAL 효과기를 생성할 수 있다. TAL 효과기의 경우, 공개 리소스 (REAL 방법 (문헌[Curr Protoc Mol Biol (2012) Chapter 12: Unit 12.15]), FLASH 방법 (문헌[Nat Biotechnol (2012) 30: 460-465]), 및 Golden Gate 방법 (문헌[Nucleic Acids Res (2011) 39: e82]) 등)을 사용하는 생성 방법이 확립되었으며, 표적 뉴클레오타이드 서열에 대한 TAL 효과기를 비교적 간편하게 설계할 수 있다. TAL 효과기 생성에 대한 세부사항은 국제 특허 출원 국제 공개 제 2013-513389호를 참조할 수 있다.

PPR 모티프는 각각 35개의 아미노산으로 구성된 일련의 PPR 모티프에 의해 특정 뉴클레오타이드 서열을 인식하고, 하나의 핵산 염기를 인식하며, 단지 각 모티프의 1, 4 및 ii(-2) 아미노산에 의해서 표적 염기를 인식하도록 구성된다. 모티프 구성에는 의존성이 없고, 양쪽 모티프의 간섭이 없다. 따라서 TAL 효과기와 마찬가지로 단순히 PPR 모티프를 연결하여, 표적 뉴클레오타이드 서열에 특이적인 PPR 단백질을 생성할 수 있다. JP-A-2013-128413을 PPR 모티프 생성의 세부사항으로 참조할 수 있다.

제한 효소의 단편, 전사 인자, RNA 중합효소 등을 사용하는 경우, 이들 단백질의 DNA 결합 도메인이 잘 공지되어 있기 때문에, 그 도메인을 포함하고, DNA 이중 가닥 절단 능력이 없는 단편을 용이하게 설계 및 작제할 수 있다.

전술한 임의의 핵산 서열 인식 모듈은 전술한 핵산 염기 전환 효소 등과의 융합 단백질로서 제공될 수 있거나, 단백질 결합 도메인, 예컨대 SH3 도메인, PDZ 도메인, GK 도메인, GB 도메인 등 및 그 결합 상대는 각각 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등과 융합될 수 있으며, 도메인 및 그 결합 상대의 상호작용을 통해 단백질 복합체로 제공될 수 있다. 대안적으로, 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등은 각각 인테인과 융합될 수 있으며, 이는 단백질 합성 후 결찰에 의해 연결될 수 있다.

핵산 서열 인식 모듈 및 핵산 염기 전환 효소가 연결된 복합체 (융합 단백질 포함)를 포함하는 본 발명의 핵산 변형 효소 복합체는, 대상 이중 가닥 DNA (예를 들어, 게놈 DNA)를 갖는 세포 내에 복합체를 인코딩하는 핵산을 도입시킴으로써, 이중 가닥 DNA와 적절하게 접촉된다. 본 명세서에서, 핵산 변형 효소 복합체를 인코딩하는 핵산은 핵산 서열 인식 모듈을 인코딩하는 염기 서열 및 핵산 염기 전환 효소 또는 DNA 글리코실라제를 인코딩하는 염기 서열을 포함한다. 핵산 서열 인식 모듈이 CRISPR-Cas 시스템인 경우, 이는 가이드 RNA를 인코딩하는 서열을 추가로 포함한다.

따라서, 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등은 바람직하게는 그 융합 단백질을 인코딩하는 핵산으로서, 또는 결합 도메인, 인테인 등을 사용하여, 단백질로 번역 후 숙주 세포에서 복합체를 형성할 수 있는 형태로 또는 이들 각각을 인코딩하는 핵산으로서 제조된다. 본 명세서에서 핵산은 DNA 또는 RNA일 수 있다. DNA인 경우, 이는 바람직하게는 이중 가닥 DNA이고, 숙주 세포에서 기능적 프로모터의 조절 하에 배치된 발현 벡터의 형태로 제공된다. RNA인 경우, 이는 단일 가닥 RNA가 바람직하다.

핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등이 연결된 본 발명의 복합체는 이중 가닥 DNA 파손 (DSB)을 수반하지 않기 때문에, 독성이 낮은 게놈 편집이 가능하며, 본 발명의 방법은 광범위한 생물학적 물질에 적용될 수 있다. 따라서, 핵산 서열 인식 모듈 및/또는 핵산 염기 전환 효소 등을 인코딩하는 핵산이 도입되는 세포는 원핵생물인 에세리키아 콜라이 등의 박테리아, 하등 진핵생물인 효모와 같은 미생물 세포로부터 고등 진핵생물, 예컨대 인간 등과 같은 포유류를 포함하는 척추동물, 곤충, 식물 등의 세포에 이르는 임의의 종의 세포를 포함할 수 있다.

아연 핑거 모티프, TAL 효과기, PPR 모티프 등과 같은 핵산 서열 인식 모듈을 인코딩하는 DNA는 각 모듈에서 전술한 임의의 방법에 의해 획득될 수 있다. 예를 들어, 그 cDNA 서열 정보를 기반으로 적절한 단백질 부분 (DNA 결합 도메인을 포함하는 부분)을 인코딩하는 영역을 포괄하는 올리고DNA 프라이머를 합성하고, 단백질 생성 세포로부터 제조된 전체 RNA 또는 mRNA 분획을 주형으로서 사용하여 RT-PCR 방법에 의해 증폭시켜 제한 효소, 전사 인자, RNA 중합효소 등의 서열 인식 모듈을 인코딩하는 DNA를 클로닝할 수 있다.

또한, 그 cDNA 서열 정보를 기반으로 하여 올리고DNA 프라이머를 합성하고, 효소 생성 세포로부터 제조된 전체 RNA 또는 mRNA 분획을 주형으로서 사용하여 RT-PCR 방법에 의해 증폭시켜, 핵산 염기 전환 효소 등을 인코딩하는 DNA (즉, 핵산 염기 전환 효소를 인코딩하는 DNA 또는 DNA 글리코실라제를 인코딩하는 DNA)를 유사하게 클로닝할 수 있다. 예를 들어, NCBI 데이터베이스에 등록된 cDNA 서열 (수탁 번호 EF094822)을 기반으로 CDS의 상류 및 하류에 적합한 프라이머를 설계하고, 칠성 장어의 mRNA로부터 클로닝하여, 칠성 장어의 PmCDA1을 인코딩하는 DNA를 클로닝할 수 있다. NCBI 데이터베이스에 등록된 cDNA 서열 (수탁 번호 AB040431)을 기반으로 CDS의 상류 및 하류에 적합한 프라이머를 설계하고, RT-PCR 방법에 의해, 예를 들어 인간 림프절의 mRNA로부터 클로닝하여 인간 AID를 인코딩하는 DNA를 클로닝할 수 있다. 또한, 표적 부위의 서열 정보 등을 기반으로 전술한 바와 같은 방법으로 공여체 DNA를 클로닝할 수 있다.

클로닝된 DNA를 핵산 서열 인식 모듈을 인코딩하는 DNA와 직접 또는 적절한 경우, 제한 효소에 의한 분해 후 또는 적합한 링커 및/또는 핵 국소화 신호 (대상 이중 가닥 DNA가 미토콘드리아 또는 엽록체 DNA인 경우, 각 세포 기관 전달 신호)의 첨가 후 결찰시켜, 융합 단백질을 인코딩하는 DNA를 제조할 수 있다. 대안적으로, 핵산 서열 인식 모듈을 인코딩하는 DNA 및 핵산 염기 전환 효소를 인코딩하는 DNA 등을 각각 결합 도메인 또는 그 결합 상대를 인코딩하는 DNA와 융합시키거나, DNA 둘 모두를 분리 인테인을 인코딩하는 DNA와 융합시킴으로써, 핵산 서열 인식 전환 모듈 및 핵산 염기 전환 효소 등을 숙주 세포에서 번역시켜, 복합체를 형성한다. 이러한 경우, 링커 및/또는 핵 국소화 신호를 적절한 경우 DNA 중 하나 또는 둘 모두의 적절한 위치에 연결할 수 있다. 공여체 DNA는 단일 DNA로 제조될 수 있거나, 핵산 서열 인식 모듈 및/또는 핵산 염기 전환 효소 등을 인코딩하는 핵산에 의해 단일 DNA로 제공될 수 있다.

DNA 가닥을 화학적으로 합성하거나, 일부 중첩된 합성 올리고DNA의 짧은 가닥을 PCR 방법 및 Gibson 조립 방법을 사용하여 연결하여, 그 전장을 인코딩하는 DNA를 작제함으로써, 핵산 서열 인식 모듈을 인코딩하는 DNA, 핵산 염기 전환 효소를 인코딩하는 DNA 등, 및 공여체 DNA를 획득할 수 있다. 공여체 DNA가 단일 가닥 핵산인 경우, 예를 들어 DNA 가닥을 화학적으로 합성하는 것 이외의 방법으로, DNA를 포함하는 플라스미드 DNA를 제한 효소로 단일 가닥으로 분해하고, RNA 중합효소에 의해 RNA를 합성하고, 그 후 cDNA를 역전사 효소로 합성하고, RNA 가닥을 RNaseH로 분화시킨다. 대안적으로, 공여체 DNA를 포함하는 플라스미드를 니카제 유형 제한 효소로 분해하고, 전기영동으로 분리 및 정제하여 이를 제조할 수 있다. 화학적 합성 또는 PCR 방법 또는 Gibson 조립 방법의 조합으로 전장의 DNA를 작제하는 과정의 장점은 DNA가 도입되는 숙주에 따라 사용되는 코돈을 CDS 전장으로 설계할 수 있다는 것이다. 이종 DNA의 발현시, 그 DNA 서열을 숙주 유기체에서 매우 빈번하게 사용되는 코돈으로 전환시킴으로써, 단백질 발현 수준이 증가할 것으로 예상된다. 예를 들어, 사용되는 숙주에서 코돈 사용 빈도 데이터로서, Kazusa DNA 연구소 홈페이지 (http://www.kazusa.or.jp/codon/index.html)에 개시된 유전자 코드 사용 빈도 데이터베이스를 사용하거나, 각 숙주에서 코돈 사용 빈도가 제시된 문헌을 참조할 수 있다. 획득된 데이터 및 도입될 DNA 서열을 참조하여, DNA 서열에 사용된 것들 중 숙주에서 사용 빈도가 낮은 것으로 나타난 코돈을 동일한 아미노산을 코딩하고 높은 사용 빈도를 나타내는 코돈으로 전환시킬 수 있다.

PAM 서열 및 표적 뉴클레오타이드 서열 이외의 부위를 표적 부위로 사용하는 경우, 이들 서열은 변형 후에도 잔류할 수 있으며, 핵산 변형 효소에 의해 핵산 염기 전환 반응 또는 염기 절제 반응이 발생할 수 있다. 따라서, 이들 서열이 제거되거나, 상동성 아암 상의 표적 뉴클레오타이드 서열 또는 PAM 서열에 침묵 돌연변이가 도입되도록 공여체 DNA를 설계하는 것이 바람직하다.

핵산 서열 인식 모듈 및/또는 핵산 염기 전환 효소 등을 인코딩하는 DNA를 포함하는 발현 벡터는, 예를 들어 적절한 발현 벡터에서 DNA를 프로모터의 하류에 연결함으로써 생성될 수 있다.

발현 벡터로서 에세리키아 콜라이 (예를 들어, pBR322, pBR325, pUC12, pUC13)의 플라스미드; 바실러스 서브틸리스 (Bacillus subtilis)로부터의 플라스미드 (예를 들어, pUB110, pTP5, pC194); 효모로부터의 플라스미드 (예를 들어, pSH19, pSH15); 곤충 세포 발현 플라스미드 (예를 들어, pFast-Bac); 동물 세포 발현 플라스미드 (예를 들어, pA1-11, pXT1, pRc/CMV, pRc/RSV, pcDNAI/Neo); λ 파지 등과 같은 박테리오파지; 바큘로바이러스 등과 같은 곤충 바이러스 벡터 (예를 들어, BmNPV, AcNPV); 레트로바이러스, 우두 바이러스, 아데노바이러스 등과 같은 동물 바이러스 벡터가 사용된다.

프로모터로서는 유전자 발현에 사용되는 숙주에 적합한 임의의 프로모터를 사용할 수 있다. DSB를 사용한 종래의 방법에서는 독성으로 인해 숙주 세포의 생존율이 현저히 감소하는 경우가 있기 때문에, 유도성 프로모터를 사용하여 유도 개시까지 세포 수를 증가시키는 것이 바람직하다. 그러나, 본 발명의 핵산-변형 효소 복합체를 발현시킴으로써, 충분한 세포 증식이 가능하기 때문에, 항시적 프로모터를 또한 제한 없이 사용할 수 있다.

예를 들어 숙주가 동물 세포인 경우, SRα 프로모터, SV40 프로모터, LTR 프로모터, CMV (사이토메갈로 바이러스) 프로모터, RSV (라우스 육종 바이러스) 프로모터, MoMuLV (몰로니 마우스 백혈병 바이러스) LTR, HSV-TK (단순 헤르페스 바이러스 티미딘 키나제) 프로모터 등이 사용된다. 이들 중 CMV 프로모터, SRα 프로모터 등이 바람직하다.

숙주가 에세리키아 콜라이인 경우, trp 프로모터, lac 프로모터, recA 프로모터, λP_L 프로모터, lpp 프로모터, T7 프로모터 등이 바람직하다.

숙주가 바실러스 속인 경우, SPO1 프로모터, SPO2 프로모터, penP 프로모터 등이 바람직하다. 숙주가 효모인 경우에는 Gal1/10 프로모터, PHO5 프로모터, PGK 프로모터, GAP 프로모터, ADH 프로모터 등이 바람직하다.

숙주가 곤충 세포인 경우, 폴리헤드린 (polyhedrin) 프로모터, P10 프로모터 등이 바람직하다.

숙주가 식물 세포인 경우, CaMV35S 프로모터, CaMV19S 프로모터, NOS 프로모터 등이 바람직하다.

발현 벡터로는 전술한 것 외에 인핸서, 스플라이싱 신호 (splicing signal), 종결인자, 폴리A 첨가 신호, 선택 마커, 예컨대 약물 내성 유전자, 영양 요구성 상보적 유전자 등, 복제 기점 등 요구되는 것을 포함하는 것을 사용할 수 있다.

핵산 서열 인식 모듈을 코딩하는 RNA 및/또는 핵산 염기 전환 효소 등을 인코딩하는 RNA는, 예를 들어, 주형으로서 상기를 언급된 핵산 서열 인식 모듈 및/또는 핵산 염기 전환 효소를 인코딩하는 DNA를 인코딩하는 벡터를 사용하여 그 자체로 공지된 시험관내 전사 시스템에서 mRNA로의 전사에 의해 제조될 수 있다.

핵산 서열 인식 모듈 및/또는 핵산 염기 전환 효소 등을 인코딩하는 DNA를 포함하는 발현 벡터를 숙주 세포 내로 도입시키고, 숙주 세포를 배양함으로써, 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등의 복합체를 세포 내에서 발현시킬 수 있다.

숙주로서는 에세리키아 속, 바실러스 속, 효모, 곤충 세포, 곤충, 동물 세포 등이 사용된다.

에세리키아 속으로는, 에세리키아 콜라이 K12·DH1 [문헌[Proc. Natl. Acad. Sci. USA, 60, 160 (1968)]], 에세리키아 콜라이 JM103 [문헌[Nucleic Acids Research, 9, 309 (1981)]], 에세리키아 콜라이 JA221 [문헌[Molecular Biology, 120, 517 (1978)]], 에세리키아 콜라이 HB101 [문헌[Molecular Biology, 41, 459 (1969)]], 에세리키아 콜라이 C600 [문헌[Genetics, 39, 440 (1954)]] 등이 사용된다.

바실러스 속으로는 바실러스 서브틸리스 MI114 [문헌[Gene, 24, 255 (1983)]], 바실러스 서브틸리스 207-21 [문헌[Biochemistry, 95, 87 (1984)]] 등이 사용된다.

효모로는 사카로마이세스 세레비시아에 (Saccharomyces cerevisiae) AH22, AH22R^-, NA87-11A, DKD-5D, 20B-12, 시조사카로마이세스 폼베 (Schizosaccharomyces pombe) NCYC1913, NCYC2036, 피키아 파스토리스 (Pichia pastoris) KM71 등이 사용된다.

곤충 세포로서, 바이러스가 AcNPV인 경우, 배추 도둑나방 유충 (스포도프테라 프루기페르다 (Spodoptera frugiperda) 세포; Sf 세포)로부터 확립된 세포주의 세포, 트리코프루시아니 (Trichoplusia ni)의 중장으로부터의 MG1 세포, 트리코프루시아니의 난으로부터의 High Five™ 세포, 마메스트라 브라시카에 (Mamestra brassicae)로부터의 세포, 에스티그메나 아크레아 (Estigmena acrea)로부터의 세포 등이 사용된다. 바이러스가 BmNPV인 경우, 누에나방 (누에나방 N 세포; BmN 세포)로부터 확립된 세포주의 세포 등이 곤충 세포로 사용된다. Sf 세포로는, 예를 들어 Sf9 세포 (ATCC CRL1711), Sf21 세포 [모두 상기의 문헌[In Vivo, 13, 213-217 (1977)]] 등이 사용된다.

곤충으로는 예를 들어 누에나방, 초파리, 귀뚜라미 등의 유충이 사용된다 [문헌[Nature, 315, 592 (1985)]].

동물 세포로는, 세포주, 예컨대 원숭이 COS-7 세포, 원숭이 Vero 세포, 차이니즈 햄스터 난소 (CHO) 세포, dhfr 유전자 결핍 CHO 세포, 마우스 L 세포, 마우스 AtT-20 세포, 마우스 골수종 세포, 랫트 GH3 세포, 인간 태아 신장 세포 (예를 들어, HEK293 세포), 인간 간암 세포 (예를 들어, HepG2), 인간 FL 세포 등, 인간 및 기타 포유류의 iPS 세포, ES 세포 등과 같은 다능성 줄기세포, 다양한 조직으로부터 제조된 일차 배양 세포가 사용된다. 또한, 제브라피쉬 (zebrafish ) 배아, 제노푸스 (Xenopus) 난모세포 등이 또한 사용될 수 있다.

식물 세포로는 다양한 식물 (예를 들어, 벼, 밀, 옥수수 등의 곡물, 토마토, 오이, 난 식물 등의 농작물, 카네이션, 유스토마 루셀리아눔 (Eustoma russellianum) 등과 같은 정원 식물, 담배, 아라비돕시스 탈리아나 (arabidopsis thaliana) 등과 같은 실험 식물 등))로부터 제조된 부유 배양 세포, 캘러스 (callus), 원형질체, 잎사귀 절편, 뿌리 절편 등이 사용된다.

발현 벡터는 숙주의 유형에 따라 공지된 방법 (예를 들어, 라이소자임 (lysozyme) 방법, 컴피턴트 방법 (competent method), PEG 방법, CaCl₂ 공침법, 전기천공법, 미세주입법, 입자 총법, 리포펙션법 (lipofection method), 아그로박테리움 법 (Agrobacterium method) 등)에 의해 도입될 수 있다. 또한 공여체 DNA는 유사한 방법에 의해 세포 내에 도입될 수 있다. 발현 벡터 및 공여체 DNA를 다른 분자로 도입하는 경우, 발현 벡터 및 공여체 DNA의 도입은 동시에 또는 다른 시기에 수행될 수 있다.

에세리키아 콜라이은 예를 들어, 문헌[Proc. Natl. Acad. Sci. USA, 69, 2110 (1972), Gene, 17, 107 (1982)]에 기재된 방법 등에 따라 형질전환될 수 있다.

바실러스 속은 예를 들어 문헌[Molecular & General Genetics, 168, 111 (1979)]에 기재된 방법 등에 따라 벡터 내에 도입될 수 있다.

효모는 예를 들어 문헌[Methods in Enzymology, 194, 182-187 (1991), Proc. Natl. Acad. Sci. USA, 75, 1929 (1978)]에 기재된 방법 등에 따라 벡터 내에 도입될 수 있다.

곤충 세포 및 곤충은 예를 들어 문헌[Bio/Technology, 6, 47-55 (1988)]에 기재된 방법 등에 따라 벡터 내에 도입될 수 있다.

동물 세포는 예를 들어 문헌[Cell Engineering additional volume 8, New Cell Engineering Experiment Protocol, 263-267 (1995) (Shujunsha 공개) 및 Virology, 52, 456 (1973)]에 기재된 방법 등에 따라 벡터 내에 도입될 수 있다.

벡터 및 공여체 DNA가 도입된 세포는 숙주의 유형에 따라 공지된 방법에 따라 배양될 수 있다.

예를 들어, 에세리키아 콜라이 또는 바실러스 속을 배양하는 경우, 액체 배지가 배양에 사용되는 바람직한 배지이다. 배지는 바람직하게는 형질전환체의 성장에 필요한 탄소원, 질소원, 무기 물질 등을 포함한다. 탄소원의 예로는 글루코스, 덱스트린, 가용성 전분, 수크로스 등이 포함되고; 질소원의 예로는 암모늄염, 질산염, 옥수수 침지 액, 펩톤 (peptone), 카제인 (casein), 육류 추출물, 대두 케이크, 감자 추출물 등과 같은 무기 또는 유기 물질이 포함되며; 무기 물질의 예로는 염화칼슘, 인산이수소나트륨, 염화마그네슘 등이 포함된다. 배지는 효모 추출물, 비타민, 성장 촉진 인자 등을 포함할 수 있다. 배지의 pH는 바람직하게는 약 5 내지 약 8이다.

에세리키아 콜라이 배양용 배지로는, 예를 들어 글루코스, 카사미노산을 포함하는 M9 배지 [문헌[Experiments in Molecular Genetics, 431-433, Cold Spring Harbor Laboratory, New York 1972]]가 바람직하다. 필요한 경우, 예를 들어 3β-인돌릴아크릴산과 같은 제제를 배지에 첨가하여, 프로모터의 효율적인 기능을 보장할 수 있다. 에세리키아 콜라이는 일반적으로 약 15 내지 약 43℃에서 배양된다. 필요한 경우 폭기 및 교반을 수행할 수 있다.

바실러스 속을 일반적으로 약 30 내지 약 40℃에서 배양한다. 필요한 경우 폭기 및 교반을 수행할 수 있다.

효모 배양용 배지의 예는 Burkholder 최소 배지 [문헌[Proc. Natl. Acad. Sci. USA, 77, 4505 (1980)]], 0.5% 카사미노산을 포함하는 SD 배지 [문헌[Proc. Natl. Acad. Sci. USA, 81, 5330 (1984)]] 등을 포함한다. 배지의 pH는 바람직하게는 약 5 내지 약 8이다. 배양은 일반적으로 약 20℃ 내지 약 35℃에서 수행된다. 필요한 경우 폭기 및 교반을 수행할 수 있다.

곤충 세포 또는 곤충 배양용 배지로는, 예를 들어 불활성화된 10% 소 혈청 등의 첨가제를 적절히 포함하는 Grace's Insect Medium [문헌[Nature, 195, 788 (1962)]] 등이 사용된다. 배지의 pH는 바람직하게는 약 6.2 내지 약 6.4이다. 배양은 일반적으로 약 27℃에서 수행된다. 필요한 경우 폭기 및 교반을 수행할 수 있다.

동물 세포 배양용 배지로는 약 5 내지 약 20%의 소 태아 혈청을 포함하는 최소 필수 배지 (MEM) [문헌[Science, 122, 501 (1952)]], 둘베코 변형 이글 배지 (Dulbecco's modified Eagle medium) (DMEM) [문헌[Virology, 8, 396 (1959)]], RPMI 1640 배지 [문헌[the American Medical Association, 199, 519 (1967)]], 199 배지 [문헌[Proceeding of the Society for the Biological Medicine, 73, 1 (1950)]] 등이 사용된다. 배지의 pH는 바람직하게는 약 6 내지 약 8이다. 배양은 일반적으로 약 30℃ 내지 약 40℃에서 수행된다. 필요한 경우 폭기 및 교반을 수행할 수 있다.

식물 세포 배양용 배지로는 예를 들어 MS 배지, LS 배지, B5 배지 등이 사용된다. 배지의 pH는 바람직하게는 약 5 내지 약 8이다. 배양은 일반적으로 약 20℃ 내지 약 30℃에서 수행된다. 필요한 경우 폭기 및 교반을 수행할 수 있다.

상기에 언급된 바와 같이, 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등의 복합체, 즉 핵산 변형 효소 복합체는 세포 내에서 발현될 수 있다.

핵산 서열 인식 모듈 및/또는 핵산 염기 전환 효소 등을 인코딩하는 RNA는 미세주입법, 리포펙션법 등에 의해 숙주 세포 내에 도입될 수 있다. RNA 도입은 적절한 간격으로 1회 또는 수회 (예를 들어, 2 내지 5회) 반복 수행될 수 있다.

아연 핑거 모티프는 표적 뉴클레오타이드 서열에 특이적으로 결합하는 아연 핑거의 생성 효율이 높지 않고, 결합 특이성이 높은 아연 핑거의 선택이 복잡하기 때문에, 실제로 기능할 수 있는 다수의 아연 핑거 모티프의 생성이 용이하지 않다. TAL 효과기 및 PPR 모티프는 아연 핑거 모티프와 비교하여, 표적 핵산 서열 인식의 자유도가 높지만, 표적 뉴클레오타이드 서열에 따라 매번 대형 단백질을 설계하고 작제해야 하므로, 효율성에 문제가 남아 있다.

이와 달리, CRISPR-Cas 시스템은 표적 뉴클레오타이드 서열에 상보적인 가이드 RNA로 대상 이중 가닥 DNA 서열을 인식하기 때문에, 표적 뉴클레오타이드 서열과 특이적으로 혼성화할 수 있는 올리고DNA를 간단히 합성하여 임의의 서열을 표적화할 수 있다.

따라서, 본 발명의 더욱 바람직한 실시형태에서는 핵산 서열 인식 모듈로 Cas 효과기 단백질 중 하나만 또는 둘 모두의 DNA 절단 능력이 불활성화된 CRISPR-Cas 시스템 (CRISPR-돌연변이 Cas)이 사용된다.

CRISPR 돌연변이 Cas를 사용하는 본 발명의 핵산 서열 인식 모듈은 표적 뉴클레오타이드 서열에 상보적인 서열을 포함하는 CRISPR-RNA (crRNA) 및 필요한 경우, 돌연변이 Cas 효과기 단백질의 집합에 필요한 경우 트랜스 활성화 RNA (tracrRNA) (tracrRNA가 필요한 경우, 가능하게는 crRNA와의 키메라 RNA로 제공됨) 및 돌연변이 Cas 효과기 단백질의 복합체로 제공된다. crRNA 단독으로 구성된 RNA 분자 또는 돌연변이 Cas 효과기 단백질과 조합하여 핵산 서열 인식 모듈을 구성하는 crRNA 및 tracrRNA의 키메라 RNA는 "가이드 RNA"로 총칭된다. 돌연변이가 도입되지 않은 CRISPR/Cas 시스템을 사용하는 경우에도 동일하게 적용된다.

본 발명에서 사용되는 Cas 효과기 단백질은 가이드 RNA와 복합체를 형성하고, 대상 유전자의 표적 뉴클레오타이드 서열 및 그에 인접하는 프로토스페이서 인접 모티프 (PAM)를 인식 및 결합할 수 있는 한, 특별히 제한되지 않지만, 이는 바람직하게는 Cas9 (또한 Cas9 뉴클레아제로 지칭됨) 또는 Cpf1 (또한 Cpf1 뉴클레아제로 지칭됨)이 바람직하다. Cas9의 예로는 다음에 제한되는 것은 아니나, 스트렙토코쿠스 피오제네스로부터 유래된 Cas9 (SpCas9; PAM 서열 NGG (N은 A, G, T 또는 C이며, 이하 동일함)), 스트렙토코쿠스 터모필루스 (Streptococcus thermophilus)로부터 유래된 Cas9 (StCas9; PAM 서열 NNAGAAW), 네이세리아 메닝지티디스 (Neisseria meningitidis)로부터 유래된 Cas9 (MmCas9; PAM 서열 NNNNGATT) 등이 포함된다. PAM에 의한 제한이 적은 SpCas9 (실질적으로 2개의 염기이며, 이론적으로 게놈의 임의의 부위를 표적화할 수 있음)가 바람직하다. Cpf1의 예로는 다음에 제한되는 것은 아니나, 프란시셀라 노비시다 (Francisella novicida) (FnCpf1; PAM 서열 NTT)로부터 유래된 Cpf1, 아시다미노코쿠스 종 (Acidaminococcus sp.)으로부터 유래된 Cpf1 (AsCpf1; PAM 서열 NTTT), 라크노스피라세아에 박테리움(Lachnospiraceae bacterium)으로부터 유래된 Cpf1 (LbCpf1; PAM 서열 NTTT) 등이 포함된다. 본 발명에 사용되는 돌연변이 Cas 효과기 단백질 (때때로 돌연변이 Cas로 약칭됨)으로서, 이중 가닥 DNA의 양 가닥의 절단 능력이 불활성화된 임의의 Cas 효과기 단백질 및 니카제 활성을 갖고, 하나의 가닥 단독의 적어도 하나의 절단 능력이 불활성화된 것이 사용될 수 있다. 예를 들어, SpCas9의 경우, 10번 Asp 잔기가 Ala 잔기로 전환되고, 가이드 RNA와 상보적 가닥을 형성하는 가닥 반대편 가닥의 절단 능력이 부재하는 (따라서 가이드 RNA와 상보적 가닥을 형성하는 가닥이 니카제 활성을 가짐) D10A 돌연변이 또는 80번 His 잔기가 Ala 잔기로 전환되고, 가이드 RNA와 상보적 가닥을 형성하는 가닥의 절단 능력이 부재하는 (따라서 가이드 RNA 또는 그 이중 돌연변이 (dCas9)와 상보적 가닥을 형성하는 가닥이 니카제 활성을 가짐) H840A 돌연변이가 사용될 수 있다. FnCpf1의 경우, 917번 Asp 잔기가 Ala 잔기로 전환되거나 (D917A), 1006번 Glu 잔기가 Ala 잔기로 전환되고 (E1006A), 두 가닥 모두의 절단 능력이 부재하는 돌연변이가 사용될 수 있다. 이중 가닥 DNA의 가닥 중 적어도 하나의 절단 능력이 부재하는 한, 다른 돌연변이 Cas가 또한 유사하게 사용될 수 있다.

Cas 효과기 단백질 (돌연변이 Cas 포함, 이하 동일함)을 인코딩하는 DNA는 상기 효소를 생성하는 세포로부터 염기 절제 수선 억제제를 인코딩하는 DNA에 대해 전술한 방법과 유사한 방법으로 클로닝될 수 있다. 그 자체로 공지된 부위 특이적 돌연변이 유도 방법에 의해, DNA 절단 활성에 중요한 부위의 아미노산 잔기 (예를 들어, 다음에 제한되는 것은 아니나, SpCas9의 경우 10번 Asp 잔기 및 840번 His 잔기, FnCpf1의 경우 917번 Asp 잔기 및 1006번 Glu 잔기 등)를 다른 아미노산으로 전환하는 돌연변이를 클로닝된 Cas를 인코딩하는 DNA에 도입하여 돌연변이 Cas를 획득할 수 있다.

대안적으로, Cas 효과기 단백질을 인코딩하는 DNA는 또한 핵산 서열 인식 모듈을 인코딩하는 DNA 및 핵산 염기 전환 효소를 인코딩하는 DNA에 대해 전술한 것과 유사한 방법 및 화학 합성 또는 PCR 방법 또는 Gibson 조립 방법의 조합에 의해 사용될 숙주 세포에서 발현에 적합한 코돈을 사용하여 DNA로 작제될 수 있다.

Cas 효과기 단백질 및/또는 핵산 변형 효소 및/또는 염기 절제 수선 억제제를 인코딩하는 획득 DNA는 표적 세포에 따라 전술한 것과 유사한 발현 벡터의 프로모터의 하류에 삽입될 수 있다.

한편, 표적 뉴클레오타이드 서열 (본 명세서에서 또한 "표적화 서열"로 지칭됨)에 상보적인 뉴클레오타이드 서열을 포함하는 crRNA 서열의 코딩 서열 (예를 들어, FnCpf1이 Cas 효과기 단백질로 집합되는 경우, 표적화 서열의 5' 쪽에 SEQ ID NO: 1; AAUUUCUACUGUUGUAGAU를 포함하는 crRNA가 사용될 수 있고, 밑줄이 그어진 서열은 염기쌍을 형성하여, 줄기-루프 구조를 형성함) 또는 crRNA 코딩 서열 및 필요한 경우, 공지된 tracrRNA 코딩 서열 (예를 들어, Cas가 Cas9 효과기 단백질로서 집합되는 경우, tracrRNA 코딩 서열로서, gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt; SEQ ID NO: 2, 또는 gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt; SEQ ID NO: 3)을 연결하는 올리고DNA 서열을 설계하고, DNA/RNA 합성기를 사용하여 화학적으로 합성하여, 가이드 RNA를 인코딩하는 DNA를 획득할 수 있다.

본 명세서에서 "표적 가닥"은 표적 뉴클레오타이드 서열의 crRNA와 혼성체를 형성하는 가닥을 의미하고, 표적 가닥 및 crRNA의 혼성화 후에 단일 가닥이 되는 반대쪽 가닥은 "비 표적 가닥"으로 지칭된다. 표적 뉴클레오타이드 서열이 가닥 중 하나에 의해 발현되어야 하는 경우 (예를 들어, PAM 서열이 표시되는 경우, 표적 뉴클레오타이드 서열 및 PAM의 위치 관계가 표시되는 경우 등), 비 표적 가닥의 서열로 표시된다.

표적화 서열의 길이는 표적 뉴클레오타이드 서열에 특이적으로 결합할 수 있는 한 특별히 제한되지 않지만, 예를 들어 15 내지 30개의 뉴클레오타이드, 바람직하게는 18 내지 25개의 뉴클레오타이드이다.

Cas9가 Cas 효과기 단백질로 사용되는 경우, 예를 들어 대상 유전자의 CDS 서열로부터 3' 쪽에 인접하는 PAM (예를 들어, SpCas9의 경우, NGG)이있는 20량체 서열을 나열하고, C가 그의 5' 말단으로부터 그의 3' 방향으로의 7개의 뉴클레오타이드 내의 C가 T로 전환된 경우, 표적 유전자에 의해 인코딩되는 단백질에서 아미노산 변화를 야기하는 서열을 선택함으로써, 공개된 가이드 RNA 설계 웹사이트 (CRISPR Design Tool, CRISPRdirect 등)를 사용하여 표적화 서열을 설계할 수 있다. 20량체 이외의 길이의 표적화 서열을 사용하는 경우에도 적절한 서열을 선택할 수 있다. 대상 숙주 게놈에서 소수의 표적외 부위를 갖는 후보 서열이 표적화 서열로 사용될 수 있다. 사용되는 가이드 RNA 설계 소프트웨어에 숙주의 게놈에서 표적외 부위를 검색하는 기능이 없는 경우, 예를 들어 숙주의 게놈에 대해 Blast 검색을 적용하여 표적외 부위, 예를 들어, 후보 서열의 3' 쪽에 8 내지 12개의 뉴클레오타이드 (표적 뉴클레오타이드 서열의 식별 능력이 높은 시드 서열)를 검색할 수 있다.

DNA 인코딩 가이드 RNA를 또한 상기에 언급한 것과 유사한 발현 벡터에 삽입할 수 있다. 프로모터로는 pol III 시스템 프로모터 (예를 들어, SNR6, SNR52, SCR1, RPR1, U3, U6, H1 프로모터 등) 및 종결인자 (예를 들어, 폴리T 서열 (T₆ 서열 등))가 바람직하게 사용된다.

표적 뉴클레오타이드 서열의 표적 가닥에 상보적인 서열 및 공지된 tracrRNA 서열 (Cas9가 집합되는 경우) 또는 crRNA의 직접 반복 서열 (Cpf1이 집합되는 경우)을 연결하는 올리고RNA 서열을 설계하고, DNA/RNA 합성기를 사용하여 화학적으로 합성함으로써, DNA 인코딩 가이드 RNA (crRNA 또는 crRNA-tracrRNA 키메라)를 획득할 수 있다.

돌연변이 Cas 및/또는 핵산 염기 전환 효소 등을 인코딩하는 DNA 또는 RNA, 가이드 RNA-tracrRNA 또는 이를 인코딩하는 DNA를 숙주에 따라 상기와 유사한 방법에 의해 숙주 세포 내에 도입시킬 수 있다.

종래의 인공 뉴클레아제는 이중 가닥 DNA 절단 (DSB)을 포함하기 때문에, 게놈의 서열을 표적화하여 염색체의 무작위 절단 (표적외 절단)에 의해 야기되는 것으로 추정되는 성장의 억제 및 세포 사멸이 발생하였다. 본 발명에서 표적 부위는 DNA 절단에 의해 변형되는 것이 아니라, DNA 염기 상의 치환기의 전환 반응 (특히 탈아미노화 반응) 또는 염기 절제 반응 및 그 후 수선 메커니즘을 사용하여 변형된다. 따라서 독성의 대폭 감소를 구현할 수 있다.

본 발명의 방법에서, 상이한 위치의 다중 표적 뉴클레오타이드 서열을 사용하여 표적 부위를 변형하는 것이 또한 가능하다. 따라서, 본 발명의 바람직한 일 실시형태에서는 상이한 표적 뉴클레오타이드 서열에 특이적으로 결합하는 2개 이상의 핵산 서열 인식 모듈 유형을 사용할 수 있다. 이 경우, 각각의 이들 핵산 서열 인식 모듈 및 핵산 염기 전환 효소 등은 핵산 변형 효소 복합체를 형성한다. 본 명세서에서, 일반적인 핵산 염기 전환 효소 등을 사용할 수 있다. 예를 들어, 핵산 서열 인식 모듈로 CRISPR-Cas 시스템을 사용하는 경우, Cas 효과기 단백질 및 핵산 염기 전환 효소 등의 공통 복합체 (융합 단백질 포함)를 사용하고, 상이한 표적 뉴클레오타이드 서열과 상보적 가닥을 각각 형성하는 2개 이상의 crRNA 각각 또는 2개 이상의 tracrRNA의 2개 이상의 키메라 RNA 유형을 생성하여, 가이드 RNA (crRNA 또는 crRNA-tracrRNA 키메라)로 사용한다. 한편, 아연 핑거 모티프, TAL 효과기 등을 핵산 서열 인식 모듈로 사용하는 경우, 예를 들어 핵산 염기 전환 효소 등을 상이한 표적 뉴클레오타이드에 특이적으로 결합하는 핵산 서열 인식 모듈과 융합시킬 수 있다.

숙주 세포에서 본 발명의 핵산 변형 효소 복합체를 발현시키기 위해, 상기에 언급된 바와 같이, 핵산 변형 효소 복합체를 인코딩하는 DNA를 포함하는 발현 벡터를 숙주 세포에 도입시킨다. 돌연변이의 효율적인 도입을 위해 소정의 기간 이상 소정의 수준 이상의 핵산-변형 효소 복합체의 발현을 유지시키는 것이 바람직하다. 이러한 관점에서 발현 벡터가 숙주 게놈 내에 포함되는 것이 확실하다. 핵산 변형 효소 복합체의 지속적인 발현은 표적외 절단의 위험을 증가시키므로, 표적 부위의 변형을 달성한 직후에 이를 제거하는 것이 바람직하다. 숙주 게놈에 혼입된 DNA를 제거하는 수단의 예는 Cre-loxP 시스템 또는 FLP-FRT 시스템을 사용하는 방법, 트랜스포손을 사용하는 방법 등을 포함한다.

대안적으로, 숙주 게놈의 편집은 적절한 단계에서 핵산 반응을 야기하고, 숙주 세포에서 표적 부위의 변형 안정화에 필요한 기간 동안 본 발명의 핵산 변형 효소 복합체를 일시적으로 발현함으로써 표적외 절단의 위험을 방지하면서 효율적으로 구현될 수 있다. 당업자는 사용되는 배양 조건 등에 따라 바람직한 발현 유도 기간을 적절하게 결정할 수 있다. 본 발명의 핵산-변형 효소 복합체를 인코딩하는 핵산의 발현 유도 기간은 숙주 세포에 부작용이 없는 한 전술한 "표적 부위의 변형 안정화에 필요한 기간" 이상으로 연장될 수 있다.

본 발명의 핵산 변형 효소 복합체를 적절한 단계에서 적절한 기간 동안 일시적으로 발현시키는 수단으로서, 발현 기간을 제어할 수 있는 형태로 핵산 변형 효소 복합체를 인코딩하는 핵산 (돌연변이 CRISPR-Cas 시스템에서 가이드 RNA를 인코딩하는 DNA 및 Cas 효과기 단백질 및 핵산 변형 효소 등을 인코딩하는 DNA)을 포함하는 작제물 (발현 벡터)을 생성하는 단계, 숙주 내로 상기 작제물을 도입시키는 단계를 포함하는 방법이 언급될 수 있다. "발현 기간을 제어할 수 있는 형태"는 구체적으로, 예를 들어 유도성 조절 영역의 조절 하에 배치된 본 발명의 핵산 변형 효소 복합체를 인코딩하는 핵산이다. "유도성 조절 영역"은 특별히 제한되지 않지만, 예를 들어 온도 민감성 (ts) 돌연변이 억제인자 및 이에 의해 조절되는 오퍼레이터 (operator)의 오페론 (operon)이다. ts 돌연변이 억제인자의 예는 다음에 제한되는 것은 아니나, λ파지로부터 cI 억제인자의 ts 돌연변이를 포함한다. λ파지 cI 억제인자 (ts)의 경우, 30℃ 이하 (예를 들어, 28℃)에서 하류의 유전자 발현을 억제하는 오퍼레이터와 연결된다. 37℃ 이상 (예를 들어, 42℃)의 고온에서 유전자 발현을 유도하기 위해 오퍼레이터로부터 분리된다. 따라서, 적절한 단계에서, 온도를 37℃ 이하로 상승시키고, 상동성 재조합을 수행하기 위해 소정의 기간 동안 배양을 수행하고, 표적 유전자에 돌연변이를 도입한 후 온도를 30℃ 이하로 급속 하강시켜, 일반적으로 30℃ 이하에서 켜 핵산 변형 효소 복합체를 인코딩하는 핵산이 도입된 숙주 세포를 배양함으로써, 표적 유전자의 발현이 억제되는 기간을 최소화할 수 있다. 따라서 숙주 세포의 필수 유전자를 표적화하는 경우에도 부작용을 억제하면서 효율적으로 편집할 수 있다.

예를 들어, 온도 민감성 돌연변이를 사용하는 경우, 벡터의 자가 복제에 필요한 단백질의 온도 민감성 돌연변이를 본 발명의 핵산 변형 효소 복합체를 인코딩하는 DNA를 포함하는 벡터에 포함시킨다. 결과적으로 핵산 변형 효소 복합체의 발현 후 자가 복제가 급속히 불가능해지고, 세포 분열 중에 벡터가 자연적으로 분리된다. 온도 민감성 돌연변이 단백질의 예는 다음에 제한되는 것은 아니나, pSC101 ori의 복제에 필요한 Rep101 ori의 온도 민감성 돌연변이를 포함한다. Rep101 ori (ts)는 pSC101 ori에 작용하여, 30℃ 이하 (예를 들어, 28℃)에서 플라스미드의 자가 복제를 가능하게 하지만, 37℃ 이상 (예를 들어, 42℃)에서는 기능성을 상실하여, 플라스미드가 자가 복제할 수 없다. 따라서, 전술한 λ파지의 cI 억제인자 (ts)와 조합하면 본 발명의 핵산 변형 효소 복합체의 일시적 발현 및 플라스미드 제거가 동시에 가능해진다.

또한, 본 발명의 핵산 변형 효소 복합체를 인코딩하는 DNA를 유도성 프로모터 (예를 들어, lac 프로모터 (IPTG에 의해 유도됨), cspA 프로모터 (저온 쇼크에 의해 유도됨), araBAD 프로모터 (아라비노스에 의해 유도됨) 등)의 조절 하에 숙주 세포 내에 도입하고, 핵산 변형 효소 복합체의 발현을 유도하기 위해, 유도 물질을 적절한 단계에서 배지에 첨가 (또는 배지로부터 제거)하며, 핵산 변형 반응 및 표적 유전자로의 돌연변이 도입 수행을 위한 소정의 기간 동안 배양을 수행하여, 핵산 변형 효소 복합체의 일시적 발현을 구현할 수 있다.

본 발명은 실시예를 참조하여 하기에서 설명되며, 이는 제한적으로 해석되어서는 안된다.

[실시예]

<발아 효모의 세포주, 배양, 형질전환 및 발현 유도>

발아 효모 사카로마이세스 세레비시아에 BY4741 균주 (류신 및 우라실 요구)를 영양 요구성을 충족하는 Dropout 조성물을 사용하여 표준 YPDA 배지 또는 SD 배지에서 배양하였다. 한천 플레이트에서 정적 배양으로 또는 25℃ 내지 30℃의 액체 배지에서 교반 배양으로 배양을 수행하였다. 형질전환을 아세트산리튬 방법으로 수행하였으며, 적절한 영양 요구성을 나타내는 SD 배지에서 선택 단계를 수행하였다. 갈락토스에 의한 발현 유도를 위해, 적절한 SD 배지에서 밤새 사전 배양한 후, 탄소원을 2% 글루코스로부터 2% 라피노스로 교체한 SR 배지에서 밤새 배양하고, 탄소원을 0.2% 갈락토스로 교체하여 3시간 내지 약 2일 밤 동안 SGal 배지에서 추가 배양을 발현 유도를 위해 수행하였다.

생존 세포 수 및 Can1 돌연변이율 측정을 위해, 세포 현탁액을 적절하게 희석하여, SD 플레이트 배지 및 SD-Arg+60 mg/l 카나바닌 (Canavanine) 플레이트 배지 또는 SD+300 mg/l 카나바닌 플레이트 배지에 적용하고, 3일 후 출현한 콜로니의 수를 생존 세포 수로 계수하였다. SD 플레이트의 생존 콜로니 수를 총 세포 수로, 카나바닌 플레이트에 생존 콜로니 수를 내성 돌연변이 균주 수로 사용하여, 돌연변이율을 계산 및 평가하였다. 각 균주의 표적 유전자 영역을 포함하는 DNA 단편을 콜로니 PCR 법으로 증폭하여 돌연변이 부위를 확인한 후, 사카로마이세스 게놈 데이터베이스 (http://www.yeastgenome.org/)의 서열을 기반으로 DNA 시퀀싱 (sequencing) 및 정렬 분석을 수행하였다.

<동물 세포의 세포주, 배양, 발현 유도>

인간 태아 신장의 세포 (HEK293T 세포)를 10 μg/mL 퓨로마이신 (Life Technologies) 및 10% 소 태아 혈청 (FBS) (Biosera, Nuaille, France)이 첨가된 DME-글루타맥스 배지 (Thermo Fisher Scientific)에서 37℃, 5% CO₂ 조건 하에 배양하였다. 5% 트립신을 사용하여 세포를 회수하였다. 초저온 냉동고에 보관된 HEK293T 세포를 37℃의 수조에 용해시키고, 5x10⁶개의 세포로 75 T-플라스크에 시딩 (seeding)하였다. 1 내지 3일 동안 배양한 후, 세포를 회수하고, 0.5x10⁵ 세포/웰로 24웰 플레이트의 각 웰에 시딩하였다. 1 내지 3일 동안 배양한 후, 각 웰의 60 내지 80% 컴플루언스 (confluence) 세포를 다음 플라스미드 (효과기 플라스미드 및 리포터 플라스미드) (총 1μg/웰), 200 nM 공여체 DNA, 1.5 μl FugeneHD (Promega)로 형질감염시켰다. 각 실시예에서 사용된 공여체 DNA는 표 1에 제시되어 있다. 72시간 동안 형질감염 후, 세포를 회수하고, FACS를 사용하여 iRFP 및 EGFP의 형광을 검출하였다. 재조합 효율 (%)을 다음 식에 의해 검출된 세포 수로부터 계산하였다.

	올리고 서열 (5'-3')	SEQ ID NO:	실시예 5 에서의 명칭	실시예 6에서의 명칭	실시예 7에서의 명칭
Fw1 (70 b)	gcgCTACCGGACTCAGATCTACCggcccagttggaatgtaggTGGTGAGCAAGGGCGAGGaGCTGTTCAC	32	Fw1
Fw2 (70 b)	gcgCTACCGGACTCAGATCTACCggcccagttggaatgtagaTGGTGAGCAAGGGCGAGGaGCTGTTCAC	33	Fw2
Fw3 (70 b)	gcgCTACCGGACTCAGATCTACgggcccagttggaatgtagaTGGTGAGCAAGGGCGAGGaGCTGTTCAC	34	Fw3		Fw1
Rv1 (70 b)	GTGAACAGCtCCTCGCCCTTGCTCACCAcctacattccaactgggccGGTAGATCTGAGTCCGGTAGcgc	35
Rv2 (70 b)	GTGAACAGCtCCTCGCCCTTGCTCACCAtctacattccaactgggccGGTAGATCTGAGTCCGGTAGcgc	36
Rv3 (70 b)	GTGAACAGCtCCTCGCCCTTGCTCACCAtctacattccaactgggcccGTAGATCTGAGTCCGGTAGcgc	37
15b 좌측으로 이동된 Fw70b	CCGTCAGATCCGCTAGCGCTACCGGACTCAGATCTACCggcccagttggaatgtagaTGGTGAGCAAGGG	38			Fw2
15b 우측으로 이동된 Fw70b	GATCTACCggcccagttggaatgtagaTGGTGAGCAAGGGCGAGGaGCTGTTCACCGGGGTGGTGCCCAT	39			Fw3
Fw50b 중심	ACTCAGATCTACCggcccagttggaatgtagaTGGTGAGCAAGGGCGAGG	40		Fw	Fw4
Rv50b 중심	CCTCGCCCTTGCTCACCAtctacattccaactgggccGGTAGATCTGAGT	41		Rv

<핵산 조작>

PCR 방법, 제한 효소 처리, 결찰, Gibson 조립 방법, 인공 화학 합성 중 어느 하나에 의해 DNA를 처리 또는 작제하였다. 플라스미드의 경우 효모-에세리키아 콜라이 셔틀 벡터로 류신 선택을 위한 pRS415 및 우라실 선택을 위한 pRS426을 백본으로 사용하였다. 플라스미드를 에세리키아 콜라이 세포주 XL-10 gold 또는 DH5α에 의해 증폭하고, 아세트산리튬 방법으로 효모에 도입시켰다.

<발아 효모 작제물의 작제>

상동성 아암, 가이드 RNA, 삽입 서열 등의 서열을 효모 게놈 데이터베이스 (https://www.yeastgenome.org/)를 참조하여 설계하였다. 벡터를 문헌[Nishida K. et al., Science 16:353(6305) (2016) doi: 10.1126/science.aaf8729]에 기재된 방법에 따라 작제하였다. 1 x gRNA 벡터는 SEQ ID NO: 15에 제시된 서열의 5871번 내지 5890번 염기 서열이 L86 또는 M4 표적 뉴클레오타이드 서열의 상보적 서열로 치환된 벡터에 해당한다. 2 x gRNA 벡터는 SEQ ID NO: 16에 제시된 서열의 2638번 내지 2657번 염기 서열이 L86, L87, L88, L93 및 R90 중 어느 하나의 표적 뉴클레오타이드 서열의 상보적 서열로 치환되며, SEQ ID NO: 16의 6293번 내지 6312번 염기 서열은 L87, R89, R90, R91 및 R92 중 어느 하나의 표적 뉴클레오타이드 서열의 상보적 서열로 치환된 벡터에 해당한다. 전술한 표적 뉴클레오타이드는 다음과 같다.

L86: CGAACAGAGTAAACCGAATC (SEQ ID NO: 17)

L87: AGCACTATCAAGGCTAATAA (SEQ ID NO: 18)

L88: GCGAACTTGAAGAATAACCA (SEQ ID NO: 19)

R89: TCACCTAACTCAGACATTAT (SEQ ID NO: 20)

R90: TTGCTGATTCTATTTACAAA (SEQ ID NO: 21)

R91: GCAAACTCTATTCTTGGTGC (SEQ ID NO: 22)

R92: ACCAGAGTATCATCCATGTC (SEQ ID NO: 23)

L93: AATTCGGACACTTTAGGGTT (SEQ ID NO: 24)

M4: AGATATTATACCTGGACCCC (SEQ ID NO: 25)

<동물 세포 작제물의 작제>

pcDNA3.1 벡터 백본 및 CMV, PmCDA1, Cas9, H1, sgRNA의 각 서열은 문헌[Nishida et al. 2016]의 논문으로부터 발췌한 것이다. 각 돌연변이를 PCR 방법에 의해 도입시켰다. EF1, iRFP 및 mEGFP 절편을 인공 유전자 합성에 의해 생성하였다. 절편을 Gibson 조립 또는 결찰 반응으로 삽입 및 치환하였다.

생성된 벡터 SY4 (H1_sgRNA, CMV_mEGFP) (리포터 플라스미드), 벡터 SY45 (CMV_Cas9-PmCDA1, EF1_iRFP) 및 벡터 SY45 (CMV_Cas9, EF1_iRFP)의 서열은 각각 SEQ ID NO: 42 내지 44에 제시되어 있다. 벡터 SY45 (CMV_nCas9(D10A)-PmCDA1, EF1_iRFP)는 서열 번호 43의 770번 내지 772번 염기가 gct로 치환된 것에 해당한다. 벡터 SY45 (CMV_nCas9 (H840A)-PmCDA1, EF1_iRFP)는 서열 번호 43의 3260번 내지 3262번 염기가 gct로 치환된 것에 해당한다. 벡터 SY45 (CMV_dCas9-PmCDA1, EF1_iRFP)는 서열 번호 43의 770번 내지 772번 염기가 gct로 치환되고, 3260번 내지 3262번 염기가 gct로 치환된 것에 해당한다. 벡터 SY45 (CMV_nCas9 (D10A), EF1_iRFP)는 서열 번호 44의 3724번 내지 3726번 염기가 gct로 치환된 것에 해당한다. 벡터 SY45 (CMV_nCas9 (H840A), EF1_iRFP)는 서열 번호 44의 6214번 내지 6216번 염기가 gct로 치환된 것에 해당한다. 벡터 SY45 (CMV_dCas9, EF1_iRFP)는 서열 번호 44의 3724번 내지 3726번 염기가 gct로 치환되고, 6214번 내지 6216번 염기가 gct로 치환된 것에 해당한다.

<세포 내 DNA의 시퀀싱>

iRFP 양성 세포를 FACS로 분리하고, 게놈 DNA 및 도입된 플라스미드 DNA를 추출한 후, 다음 샘플을 제조하여, 다음 조건에서 PCR을 수행하여 표적 부위를 증폭시켰다.

샘플 제조:

gDNA 1 μL

프라이머 각각 1 μL

rTaq 10x 완충액 5 μL

25 mM MgCl₂ 3 μL

2 mM dNTP 5 μL

rTaq (TOYOBO) 0.5 μL

ddH ₂ O 33.5 μL

총 50 μL

PCR 조건: 94℃에서 2분 동안 유지하고, 94℃에서 45초, 55℃에서 45초, 72℃에서 1분 30초의 사이클을 33회 수행하고, 마지막으로 72℃에서 5분 동안 유지하였다.

증폭 프라이머로는 다음의 SY157 및 SY182를 사용하였다. 증폭 산물의 크기는 1554 bp였다.

SY157: TTCTGCTTGTCGGCCATGAT (SEQ ID NO: 47)

SY182: AGGCAAGGCTTGACCGACAATT (SEQ ID NO: 48)

증폭된 산물을 절단하고, Fastgene을 사용하여 정제하였다. 이후 pGEM-t easy 벡터를 사용하여 정제된 각 산물을 TA 클로닝하여, 에세리키아 콜라이 (JM109)를 벡터로 형질전환시켰다. 이후, 각 샘플로부터 24개의 콜로니를 선택하고 (청백색 선택), 플라스미드 DNA를 미니 프렙 (Mini prep) (Fastgene 사용)으로 정제하였다.

그 후 다음 시퀀싱 혼합물을 제조하고, Genewiz에 위탁하여, 서열 정보를 획득하였다.

각 샘플 2.5 μL

프라이머 SY157 (10 pmol/μL) 2.5 μL

ddH ₂ O 10 μL

총 15 μL

마지막으로 Snapgene을 사용하여 획득된 서열 정보를 정렬하였다.

실시예 1: dCas9-CDA 또는 nCas9-CDA 및 공여체 DNA를 사용한 표적 부위에의 삽입 서열의 삽입

발아 효모 균주 BY4741을 플라스미드 벡터 1525 (SEQ ID NO: 4에서 6036번 염기는 g, 6037번 염기는 c임) 또는 1526 (SEQ ID NO: 4에서 6036번 염기는 c, 6037번 염기는 a임) 및 1059 (SEQ ID NO: 5) 또는 1149 (SEQ ID NO: 5의 3890번 내지 3909번 염기 서열이 TCCAATAACGGAATCCAACT (SEQ ID NO: 6)로 치환된 벡터에 해당)의 이중 형질전환에 적용하고, 균주를 영양 요구성 배지 (SD-Leu-Ura)를 사용하여 선택하였다. 세포를 S-Leu-Ura 2% 라피노스 배지에서 밤새 배양하였다. S-Leu-Ura 2% 라피노스+0.02% 갈락토스 배지에서 이를 1/32로 희석하고, 30℃에서 밤새 배양하였다. SD-Ura-Leu 및 SD-Ura-Leu+카나바닌 플레이트에서 10배 희석으로 이를 국소 적용하였다. 2일 후, 카나바닌 내성 콜로니를 서열 분석에 적용하였다. 그 결과 표적 부위로의 돌연변이 삽입이 확인되었다 (도 2).

실시예 2: 재조합 평가 시스템의 작제

플라스미드 벡터 1548 (SEQ ID NO: 7)을 SmaI/HpaI로 처리하여, DNA 단편을 생성하고, BY4741 균주를 상기 단편으로 형질전환하고, SD-Ura 배지에서 선택하였다. 서열 분석에 의해 Ade1 영역으로의 혼입을 확인하였다.

실시예 3: 재조합 평가 시스템을 사용한 재조합 반응 실증 실험

상기에 언급된 플라스미드 벡터 중 어느 하나를 실증 실험 균주로 형질전환하고, SD-Leu-Ura 배지를 사용하여 선택하였다. 세포를 S-Leu-Ura 2% 라피노스 배지에서 밤새 배양하였다. 이를 S-Leu 2% 라피노스+0.02% (또는 0.2%) 갈락토스 배지로 1/32 희석하고, 30℃에서 밤새 배양하여 5회 계대배양하였다. 20회의 계대배양을 위해, 1/32 희석을 총 4회 반복하였다. 이를 10배 희석으로 SD-Leu 플레이트에 국소 적용하고, 2일 후, 콜로니의 수 및 색상을 평가하였다. 그 결과, Ade1 기능이 회복되고 백색으로 나타나는 콜로니가 빈번하게 나타났으며, 이는 본 발명의 방법에 의해 표적 부위에서 상동성 재조합이 유도되었음을 시사한다 (도 4).

실시예 4: 본 발명에 의한 녹인 또는 녹아웃의 실증 실험

발아 효모 균주 BY4741을 플라스미드 벡터 1251 (SEQ ID NO: 8) 및 2x gRNA 벡터로 이중 형질전환시키고, 영양 요구성 배지 (SD-Leu-Ura)를 사용하여 선택하였다. 세포를 S-Leu-Ura 2% 라피노스 배지에서 밤새 배양하였다. 세포를 S-Leu-Ura 2% 라피노스+0.2% 갈락토오스 배지로 1/32 희석하고, 30℃에서 밤새 배양하였다. 이를 SD-Ura-Leu 및 SD-Ura-Leu (+카나바닌) 플레이트에서 10배 희석으로 국소 적용하였다. 2일 후, 카나바닌 내성 콜로니를 서열 분석하였다. 그 결과, 본 발명의 방법에 의해 고효율로 녹인이 구현되었다 (도 6).

실시예 5: 동물 세포에서의 재조합 반응의 실증 실험

단일 가닥 올리고DNA (70개의 염기 길이) (표 1)를 공여체 DNA로 사용하여, 동물 세포 (HEK293T 세포)에서 재조합 반응이 일어났는지를 확인하였다. 실험의 개략도는 도 7에 도시되어 있다. 벡터 SY4 (H1_sgRNA, CMV_mEGFP)를 리포터 플라스미드로 사용하고, 벡터 SY45 (CMV_Cas9-PmCDA1, EF1_iRFP), 벡터 SY45 (CMV_nCas9(D10A)-PmCDA1, EF1_iRFP), 벡터 SY45 (CMV_nCas9(H840A)-PmCDA1, EF1_iRFP), 벡터 SY45 (CMV_dCas9-PmCDA1, EF1_iRFP), 벡터 SY45 (CMV_Cas9, EF1_iRFP), 벡터 SY45 (CMV_nCas9(D10A), EF1_iRFP), 벡터 SY45 (CMV_nCas9(H840A), EF1_iRFP) 또는 벡터 SY45 (CMV_dCas9, EF1_iRFP)를 효과기 플라스미드로 사용하였다. Fw2 또는 Fw3을 공여체 DNA로 사용하고, 상동성 재조합이 성공적으로 수행된 경우, EGFP를 인코딩하는 서열에서 개시 코돈이 생성되어 EGFP가 발현된다. Fw1은 상동성 재조합이 발생하더라도 EGFP를 인코딩하는 서열에서 개시 코돈의 발생을 방지하기 위해 설계된 공여체 DNA이며, 음성 대조군으로 사용되었다. Fw3는 하나의 염기가 치환 (c→g)된 Fw2의 상동성 아암이며, 상동성 아암이 표적 부위의 인접 영역과 완전히 상동성이지 않은 경우에도 상동성 재조합이 발생하는지 및 복수의 상이한 위치에서 돌연변이가 도입될 수 있는지를 확인하는 데 사용되었다.

그 결과를 도 8에 도시하였다. nCas9-pmCDA1을 사용한 경우 nCas9를 사용한 경우보다 상동성 재조합 효율이 높고, Cas9를 사용한 경우보다 상동성 재조합 효율이 같거나 높음을 알 수 있다. 또한 dCas9-pmCDA1을 사용한 경우에도 유의한 상동성 재조합이 관찰되었다. Fw2를 공여체 DNA로 사용한 경우 및 Fw3를 공여체 DNA로 사용한 경우의 상동성 재조합률에는 유의한 차이가 없었다.

실시예 6: 상동성 재조합 반응에 대한 공여체 DNA의 염기 수 및 상보적 가닥의 유형 (정방향 (Fw) 또는 역방향 (Rv))의 영향의 확인

단일 가닥 올리고DNA (50개의 염기 길이) (표 1)를 공여체 DNA로 사용하여, 동물 세포 (HEK293T 세포)에서 재조합 반응이 발생하는지를 확인하였다. 실험의 개략도는 도 9에 도시되어 있다. 벡터 SY4 (H1_sgRNA, CMV_mEGFP)를 리포터 플라스미드로 사용하고, 벡터 SY45 (CMV_nCas9(D10A))-PmCDA1, EF1_iRFP) 또는 벡터 SY45 (CMV_nCas9(H840A))-PmCDA1을 효과기 플라스미드로 사용하였다.

그 결과를 도 10에 도시하였다. 50개의 염기 길이의 단일 가닥 올리고DNA로도 상동성 재조합이 가능하고, 상보적 가닥 Fw 및 Rv 둘 모두 상동성 재조합이 가능하며, nCas9 (D10A) 및 nCas9 (H840A)의 nCas9 버전 둘 모두 상동성 재조합이 가능함을 알 수 있다.

실시예 7: 공여체 DNA의 상동성 아암의 확인

상동성 영역이 상이한 상동성 아암을 갖는 공여체 DNA (표 1)를 사용하여, 상동성 영역에 따른 상동성 재조합 반응의 효율 변화를 확인하였다. 실험의 개략도는 도 11에 도시되어 있다. 벡터 SY4 (H1_sgRNA, CMV_mEGFP)를 리포터 플라스미드로 사용하고, 벡터 SY45 (CMV_nCas9(D10A))-PmCDA1, EF1_iRFP) 또는 벡터 SY45 (CMV_nCas9(H840A))-PmCDA1을 효과기 플라스미드로 사용하였다.

그 결과를 도 12에 도시하였다. 상동성 영역에서 PmCDA1의 탈아미노효소 부위 또는 닉 (nick)이 발생한 부위를 중심으로 하여, 영역의 3' 쪽의 상동성 아암은 5' 쪽의 상동성 아암보다 긴 공여체 DNA를 설계함으로써, 상동성 재조합의 효율이 향상되는 것을 확인하였다.

실시예 8: 포유류 세포의 DNA 변형의 확인

실시예 5의 Fw2를 사용한 실험에서와 동일한 gRNA 및 공여체 DNA를 사용하여, DNA의 변형을 확인하였다. 그 결과를 하기 표 2에 제시하였다. nCas9(D10A)-PmCDA1 및 nCas9(H840A)-PmCDA1 사용시, Cas9 사용과 비교하여, 부산물인 Indel 발생이 현저히 억제되며, 즉, 세포독성이 감소한 것으로 나타났다. 이 실시예에서 사용된 용어 "DNA"는 게놈 DNA 및 플라스미드 DNA를 둘 모두 포함한다.

상기에서 nCas9-CDA를 사용한 경우, 상동성 재조합의 효율이 적어도 Cas9를 사용한 경우만큼 높으며, Cas9 사용시 발생하는 높은 세포독성 및 부산물로 Indel의 생성이 방지된다. 따라서 nCas9-CDA를 사용하는 방법은 종래 방법보다 더 유리하고 유용할 수 있다. 또한, nCas9-CDA는 Cas9 사용시 발생하는 전술한 문제를 방지하기 위해 nCas9보다 더 높은 효율을 달성할 수 있다.

본 출원은 일본에 출원된 일본 특허 출원 제 2018-059073 호 (출원일: 2018년 3월 26일)에 기초하며, 그 전문은 본 명세서에 포함된다.

[산업상 이용가능성]

본 발명은 핵산 염기 전환 효소, 예컨대 탈아미노효소 등 또는 DNA 글리코실라제를 사용한 신규한 DNA 변형 기술을 제공하고, 이 기술은 도입 가능한 돌연변이의 유형 또는 돌연변이 부위에 의해 제한되지 않고, 유전자의 방향 및 조합을 전환할 수 있으며, 유전자 절편을 녹인할 수 있다. 본 발명의 DNA 변형 기술은 이중 가닥 DNA의 절단 없이, 표적 부위를 변형시킬 수 있기 때문에, 절단에 수반되는 예기치 않은 재배열 및 독성이 억제되고, 표적 부위를 종래 방법과 비교하여 훨씬 더 효율적으로 변형시킬 수 있으며, 매우 유용하다.

<110> NATIONAL UNIVERSITY CORPORATION KOBE UNIVERSITY <120> Method for modifying a target site in a double stranded DNA of cell <130> 092857 <150> JP 2018-059073 <151> 2018-03-26 <160> 48 <170> PatentIn version 3.5 <210> 1 <211> 19 <212> RNA <213> Francisella novicida <220> <221> misc_structure <222> (1)..(19) <223> crRNA direct repeat sequence <400> 1 aauuucuacu guuguagau 19 <210> 2 <211> 83 <212> DNA <213> Streptococcus pyogenes <220> <221> misc_structure <222> (1)..(83) <223> tracrRNA <400> 2 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgctttt ttt 83 <210> 3 <211> 83 <212> DNA <213> Streptococcus pyogenes <220> <221> misc_structure <222> (1)..(83) <223> tracrRNA <400> 3 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtggtgct ttt 83 <210> 4 <211> 12344 <212> DNA <213> Artificial Sequence <220> <223> Plasmid Vector 1525(dCas9/nCas9-CDA) <220> <221> misc_structure <222> (70)..(573) <223> CEN/ARS <220> <221> promoter <222> (610)..(714) <223> AmpR pro <220> <221> rep_origin <222> (1746)..(2334) <223> ori <220> <221> promoter <222> (2852)..(3516) <223> GAL1,10 promoter <220> <221> misc_feature <222> (3068)..(3185) <223> Gal4 UAS <220> <221> gene <222> (3519)..(7655) <223> dCas9(D10A, H840A)/nCas9(D10A) <220> <221> mutation <222> (3546)..(3548) <223> D10A <220> <221> mutation <222> (6036)..(6038) <223> H840A or Wild Type <220> <221> misc_feature <222> (7635)..(7655) <223> SV40 NLS <220> <221> misc_feature <222> (7686)..(7856) <223> dead SH3 <220> <221> misc_feature <222> (7863)..(7928) <223> 3xFLAG <220> <221> gene <222> (7935)..(8558) <223> PmCDA1 <220> <221> terminator <222> (8589)..(8776) <223> ADH1 terminator <220> <221> misc_feature <222> (8862)..(9209) <223> CAN1(mut) fragment <220> <221> mutation <222> (8875) <223> Mutation 1 <220> <221> mutation <222> (8911) <223> Mutation 2 <220> <221> promoter <222> (10171)..(10575) <223> S. cerevisiae LEU2 LEU2 prom <220> <221> gene <222> (10588)..(11682) <223> S. cerevisiae LEU2 <400> 4 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120 atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180 aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240 atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300 gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360 tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420 aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480 attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540 atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140 ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320 caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500 ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560 attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620 cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680 atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740 tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800 ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860 ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920 cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980 gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040 gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100 acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160 gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220 agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280 tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340 agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400 cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460 gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520 ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580 aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 2640 cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 2700 agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcgaaatt 2760 aaccctcact aaagggaaca aaagctggta ccgggcccga attctctcct tctcttaggt 2820 ggcagagcag gtggagggtc gaccatacta gtttcaaaaa ttcttacttt ttttttggat 2880 ggacgcaaag aagtttaata atcatattac atggcattac caccatatac atatccatat 2940 acatatccat atctaatctt acttatatgt tgtggaaatg taaagagccc cattatctta 3000 gcctaaaaaa accttctctt tggaactttc agtaatacgc ttaactgctc attgctatat 3060 tgaagtacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 3120 gtgcgtcctc gtcttcaccg gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg 3180 ctccgaacaa taaagattct acaatactag cttttatggt tatgaagagg aaaaattggc 3240 agtaacctgg ccccacaaac cttcaaatga acgaatcaaa ttaacaacca taggatgata 3300 atgcgattag ttttttagcc ttatttctgg ggtaattaat cagcgaagcg atgatttttg 3360 atctattaac agatatataa atgcaaaaac tgcataacca ctttaactaa tactttcaac 3420 attttcggtt tgtattactt cttattcaaa tgtaataaaa gtatcaacaa aaaattgtta 3480 atatacctct atactttaac gtcaaggaga aaaaacccat ggacaagaag tactccattg 3540 ggctcgctat cggcacaaac agcgtcggtt gggccgtcat tacggacgag tacaaggtgc 3600 cgagcaaaaa attcaaagtt ctgggcaata ccgatcgcca cagcataaag aagaacctca 3660 ttggcgccct cctgttcgac tccggggaga cggccgaagc cacgcggctc aaaagaacag 3720 cacggcgcag atatacccgc agaaagaatc ggatctgcta cctgcaggag atctttagta 3780 atgagatggc taaggtggat gactctttct tccataggct ggaggagtcc tttttggtgg 3840 aggaggataa aaagcacgag cgccacccaa tctttggcaa tatcgtggac gaggtggcgt 3900 accatgaaaa gtacccaacc atatatcatc tgaggaagaa gcttgtagac agtactgata 3960 aggctgactt gcggttgatc tatctcgcgc tggcgcatat gatcaaattt cggggacact 4020 tcctcatcga gggggacctg aacccagaca acagcgatgt cgacaaactc tttatccaac 4080 tggttcagac ttacaatcag cttttcgaag agaacccgat caacgcatcc ggagttgacg 4140 ccaaagcaat cctgagcgct aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac 4200 agctccctgg ggagaagaag aacggcctgt ttggtaatct tatcgccctg tcactcgggc 4260 tgacccccaa ctttaaatct aacttcgacc tggccgaaga tgccaagctt caactgagca 4320 aagacaccta cgatgatgat ctcgacaatc tgctggccca gatcggcgac cagtacgcag 4380 accttttttt ggcggcaaag aacctgtcag acgccattct gctgagtgat attctgcgag 4440 tgaacacgga gatcaccaaa gctccgctga gcgctagtat gatcaagcgc tatgatgagc 4500 accaccaaga cttgactttg ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca 4560 aggaaatttt cttcgatcag tctaaaaatg gctacgccgg atacattgac ggcggagcaa 4620 gccaggagga attttacaaa tttattaagc ccatcttgga aaaaatggac ggcaccgagg 4680 agctgctggt aaagcttaac agagaagatc tgttgcgcaa acagcgcact ttcgacaatg 4740 gaagcatccc ccaccagatt cacctgggcg aactgcacgc tatcctcagg cggcaagagg 4800 atttctaccc ctttttgaaa gataacaggg aaaagattga gaaaatcctc acatttcgga 4860 taccctacta tgtaggcccc ctcgcccggg gaaattccag attcgcgtgg atgactcgca 4920 aatcagaaga gaccatcact ccctggaact tcgaggaagt cgtggataag ggggcctctg 4980 cccagtcctt catcgaaagg atgactaact ttgataaaaa tctgcctaac gaaaaggtgc 5040 ttcctaaaca ctctctgctg tacgagtact tcacagttta taacgagctc accaaggtca 5100 aatacgtcac agaagggatg agaaagccag cattcctgtc tggagagcag aagaaagcta 5160 tcgtggacct cctcttcaag acgaaccgga aagttaccgt gaaacagctc aaagaagact 5220 atttcaaaaa gattgaatgt ttcgactctg ttgaaatcag cggagtggag gatcgcttca 5280 acgcatccct gggaacgtat cacgatctcc tgaaaatcat taaagacaag gacttcctgg 5340 acaatgagga gaacgaggac attcttgagg acattgtcct cacccttacg ttgtttgaag 5400 atagggagat gattgaagaa cgcttgaaaa cttacgctca tctcttcgac gacaaagtca 5460 tgaaacagct caagaggcgc cgatatacag gatgggggcg gctgtcaaga aaactgatca 5520 atgggatccg agacaagcag agtggaaaga caatcctgga ttttcttaag tccgatggat 5580 ttgccaaccg gaacttcatg cagttgatcc atgatgactc tctcaccttt aaggaggaca 5640 tccagaaagc acaagtttct ggccaggggg acagtcttca cgagcacatc gctaatcttg 5700 caggtagccc agctatcaaa aagggaatac tgcagaccgt taaggtcgtg gatgaactcg 5760 tcaaagtaat gggaaggcat aagcccgaga atatcgttat cgagatggcc cgagagaacc 5820 aaactaccca gaagggacag aagaacagta gggaaaggat gaagaggatt gaagagggta 5880 taaaagaact ggggtcccaa atccttaagg aacacccagt tgaaaacacc cagcttcaga 5940 atgagaagct ctacctgtac tacctgcaga acggcaggga catgtacgtg gatcaggaac 6000 tggacatcaa tcggctctcc gactacgacg tggatsmtat cgtgccccag tcttttctca 6060 aagatgattc tattgataat aaagtgttga caagatccga taaaaataga gggaagagtg 6120 ataacgtccc ctcagaagaa gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga 6180 acgccaaact gatcacacaa cggaagttcg ataatctgac taaggctgaa cgaggtggcc 6240 tgtctgagtt ggataaagcc ggcttcatca aaaggcagct tgttgagaca cgccagatca 6300 ccaagcacgt ggcccaaatt ctcgattcac gcatgaacac caagtacgat gaaaatgaca 6360 aactgattcg agaggtgaaa gttattactc tgaagtctaa gctggtctca gatttcagaa 6420 aggactttca gttttataag gtgagagaga tcaacaatta ccaccatgcg catgatgcct 6480 acctgaatgc agtggtaggc actgcactta tcaaaaaata tcccaagctt gaatctgaat 6540 ttgtttacgg agactataaa gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg 6600 aaataggcaa ggccaccgct aagtacttct tttacagcaa tattatgaat tttttcaaga 6660 ccgagattac actggccaat ggagagattc ggaagcgacc acttatcgaa acaaacggag 6720 aaacaggaga aatcgtgtgg gacaagggta gggatttcgc gacagtccgg aaggtcctgt 6780 ccatgccgca ggtgaacatc gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg 6840 aaagtatcct cccgaaaagg aacagcgaca agctgatcgc acgcaaaaaa gattgggacc 6900 ccaagaaata cggcggattc gattctccta cagtcgctta cagtgtactg gttgtggcca 6960 aagtggagaa agggaagtct aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa 7020 tcatggagcg atcaagcttc gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata 7080 aagaggtcaa aaaagacctc atcattaagc ttcccaagta ctctctcttt gagcttgaaa 7140 acggccggaa acgaatgctc gctagtgcgg gcgagctgca gaaaggtaac gagctggcac 7200 tgccctctaa atacgttaat ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt 7260 ctcccgaaga taatgagcag aagcagctgt tcgtggaaca acacaaacac taccttgatg 7320 agatcatcga gcaaataagc gaattctcca aaagagtgat cctcgccgac gctaacctcg 7380 ataaggtgct ttctgcttac aataagcaca gggataagcc catcagggag caggcagaaa 7440 acattatcca cttgtttact ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg 7500 acaccaccat agacagaaag cggtacacct ctacaaagga ggtcctggac gccacactga 7560 ttcatcagtc aattacgggg ctctatgaaa caagaatcga cctctctcag ctcggtggag 7620 acagcagggc tgaccccaag aagaagagga aggtgggtgg aggaggttct ggaggtggag 7680 gttctgcaga gtatgtgcgg gccctctttg actttaatgg gaatgatgaa gaagatcttc 7740 cctttaagaa aggagacatc ctgagaatcc gggataagcc tgaagagcag tggtggaatg 7800 cagaggacag cgaaggaaag agggggatga ttcttgtccc ttacgtggag aagtattccg 7860 gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7920 acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7980 acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 8040 tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8100 aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8160 aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8220 cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8280 gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8340 ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8400 accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8460 ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8520 aggtaaaaat actccacacc actaagagtc ctgctgtttc tagaggctcc ggataaggat 8580 cctaataagc gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa 8640 taagtgtata caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga 8700 gtaactcttt cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctcttattg 8760 accacacctc taccggcatg ccgagcaaat gcctgcaaat cgctcccggg caaaaaaccc 8820 cctcaagacc cgtttagagg ccccaagggg ttatgctatg cattccgtta ttggtgaaac 8880 ccaggtgcct ggggtccagg tataatatct taggataaaa acgaagggag gttcttaggt 8940 tgggtttcct ctttgattaa cgctgccttc acatttcaag gtactgaact agttggtatc 9000 actgctggtg aagctgcaaa ccccagaaaa tccgttccaa gagccatcaa aaaagttgtt 9060 ttccgtatct taaccttcta cattggctct ctattattca ttggactttt agttccatac 9120 aatgacccta aactaacaca atctacttcc tacgtttcta cttctccctt tattattgct 9180 attgagaact ctggtacaaa ggttttgccg cggtggagct ccaattcgcc ctatagtgag 9240 tcgtattaca attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 9300 acccaactta atcgccttgc agcacatccc cccttcgcca gctggcgtaa tagcgaagag 9360 gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgcgacgcg 9420 ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 9480 cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 9540 gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 9600 ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 9660 ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 9720 ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 9780 attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 9840 aattttaaca aaatattaac gtttacaatt tcctgatgcg gtattttctc cttacgcatc 9900 tgtgcggtat ttcacaccgc atatcgaccc tcgaggagaa cttctagtat atccacatac 9960 ctaatattat tgccttatta aaaatggaat cggaacaatt acatcaaaat ccacattctc 10020 ttcaaaatca attgtcctgt acttccttgt tcatgtgtgt tcaaaaacgt tatatttata 10080 ggataattat actctatttc tcaacaagta attggttgtt tggccgagcg gtctaaggcg 10140 cctgattcaa gaaatatctt gaccgcagtt aactgtggga atactcaggt atcgtaagat 10200 gcaagagttc gaatctctta gcaaccatta tttttttcct caacataacg agaacacaca 10260 ggggcgctat cgcacagaat caaattcgat gactggaaat tttttgttaa tttcagaggt 10320 cgcctgacgc atataccttt ttcaactgaa aaattgggag aaaaaggaaa ggtgagaggc 10380 cggaaccggc ttttcatata gaatagagaa gcgttcatga ctaaatgctt gcatcacaat 10440 acttgaagtt gacaatatta tttaaggacc tattgttttt tccaataggt ggttagcaat 10500 cgtcttactt tctaactttt cttacctttt acatttcagc aatatatata tatatttcaa 10560 ggatatacca ttctaatgtc tgcccctatg tctgccccta agaagatcgt cgttttgcca 10620 ggtgaccacg ttggtcaaga aatcacagcc gaagccatta aggttcttaa agctatttct 10680 gatgttcgtt ccaatgtcaa gttcgatttc gaaaatcatt taattggtgg tgctgctatc 10740 gatgctacag gtgtcccact tccagatgag gcgctggaag cctccaagaa ggttgatgcc 10800 gttttgttag gtgctgtggg tggtcctaaa tggggtaccg gtagtgttag acctgaacaa 10860 ggtttactaa aaatccgtaa agaacttcaa ttgtacgcca acttaagacc atgtaacttt 10920 gcatccgact ctcttttaga cttatctcca atcaagccac aatttgctaa aggtactgac 10980 ttcgttgttg tcagagaatt agtgggaggt atttactttg gtaagagaaa ggaagacgat 11040 ggtgatggtg tcgcttggga tagtgaacaa tacaccgttc cagaagtgca aagaatcaca 11100 agaatggccg ctttcatggc cctacaacat gagccaccat tgcctatttg gtccttggat 11160 aaagctaatg ttttggcctc ttcaagatta tggagaaaaa ctgtggagga aaccatcaag 11220 aacgaattcc ctacattgaa ggttcaacat caattgattg attctgccgc catgatccta 11280 gttaagaacc caacccacct aaatggtatt ataatcacca gcaacatgtt tggtgatatc 11340 atctccgatg aagcctccgt tatcccaggt tccttgggtt tgttgccatc tgcgtccttg 11400 gcctctttgc cagacaagaa caccgcattt ggtttgtacg aaccatgcca cggttctgct 11460 ccagatttgc caaagaataa ggttgaccct atcgccacta tcttgtctgc tgcaatgatg 11520 ttgaaattgt cattgaactt gcctgaagaa ggtaaggcca ttgaagatgc agttaaaaag 11580 gttttggatg caggtatcag aactggtgat ttaggtggtt ccaacagtac caccgaagtc 11640 ggtgatgctg tcgccgaaga agttaagaaa atccttgctt aaaaagattc tcttttttta 11700 tgatatttgt acataaactt tataaatgaa attcataata gaaacgacac gaaattacaa 11760 aatggaatat gttcataggg tagacgaaac tatatacgca atctacatac atttatcaag 11820 aaggagaaaa aggaggatag taaaggaata caggtaagca aattgatact aatggctcaa 11880 cgtgataagg aaaaagaatt gcactttaac attaatattg acaaggagga gggcaccaca 11940 caaaaagtta ggtgtaacag aaaatcatga aactacgatt cctaatttga tattggagga 12000 ttttctctaa aaaaaaaaaa atacaacaaa taaaaaacac tcaatgacct gaccatttga 12060 tggagtttaa gtcaatacct tcttgaacca tttcccataa tggtgaaagt tccctcaaga 12120 attttactct gtcagaaacg gccttacgac gtagtcgata tggtgcactc tcagtacaat 12180 ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 12240 ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 12300 ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcga 12344 <210> 5 <211> 6274 <212> DNA <213> Artificial Sequence <220> <223> Plasmid Vector 1059(Can1-7R) <220> <221> rep_origin <222> (69)..(1411) <223> 2 micro ori <220> <221> promoter <222> (1438)..(1542) <223> AmpR promoter <220> <221> gene <222> (1543)..(2403) <220> <221> rep_origin <222> (2574)..(3162) <223> ori <220> <221> promoter <222> (3621)..(3889) <223> SNR52 promoter <220> <221> misc_feature <222> (3890)..(3909) <223> Can1-7R <220> <221> misc_structure <222> (3910)..(3992) <223> tracrRNA <220> <221> terminator <222> (3995)..(4008) <223> Sup4 term <220> <221> terminator <222> (4014)..(4261) <223> CYC1 terminator <220> <221> promoter <222> (4280)..(4298) <223> T7 promoter <220> <221> rep_origin <222> (4469)..(4924) <223> f1 ori <220> <221> gene <222> (5055)..(5858) <223> URA3 <220> <221> promoter <222> (5859)..(6074) <223> URA3 promoter <400> 5 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttagtatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 120 aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 180 catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 240 gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 300 tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 360 gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 420 cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 480 gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 540 ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 600 ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 660 acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta gtaagaacta 720 ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 780 agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 840 actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 900 ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 960 caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 1020 acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 1080 gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 1140 aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt ctgttctgta 1200 aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgtttt 1260 acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg catttctgtt 1320 ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 1380 gttctacaaa atgaagcaca gatgcttcgt tcaggtggca cttttcgggg aaatgtgcgc 1440 ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 1500 taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 1560 cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 1620 acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 1680 ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 1740 atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 1800 gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 1860 acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 1920 atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 1980 accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 2040 ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2100 acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2160 gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 2220 tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 2280 ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 2340 actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 2400 taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 2460 tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 2520 gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 2580 cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 2640 gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 2700 gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 2760 tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 2820 ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 2880 cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 2940 gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 3000 gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 3060 gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 3120 cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 3180 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 3240 cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 3300 cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 3360 ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 3420 tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt acctcactca ttaggcaccc 3480 caggctttac actttatgct tccggctcct atgttgtgtg gaattgtgag cggataacaa 3540 tttcacacag gaaacagcta tgaccatgat tacgccaagc gcgcaattaa ccctcactaa 3600 agggaacaaa agctggagct tctttgaaaa gataatgtat gattatgctt tcactcatat 3660 ttatacagaa acttgatgtt ttctttcgag tatatacaag gtgattacat gtacgtttga 3720 agtacaactc tagattttgt agtgccctct tgggctagcg gtaaaggtgc gcattttttc 3780 acaccctaca atgttctgtt caaaagattt tggtcaaacg ctgtagaagt gaaagttggt 3840 gcgcatgttt cggcgttcga aacttctccg cagtgaaaga taaatgatct tatccttaga 3900 tattataccg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3960 tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt ttatgtcttc gagtcatgta 4020 attagttatg tcacgcttac gttcacgccc tccccccaca tccgctctaa ccgaaaagga 4080 aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt 4140 aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg 4200 taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg ctttaatttg 4260 cggccggtac ccaattcgcc ctatagtgag tcgtattacg cgcgctcact ggccgtcgtt 4320 ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 4380 ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 4440 ttgcgcagcc tgaatggcga atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg 4500 ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 4560 ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 4620 cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 4680 gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 4740 acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 4800 cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta 4860 aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttaca 4920 atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatagggt 4980 aataactgat ataattaaat tgaagctcta atttgtgagt ttagtataca tgcatttact 5040 tataatacag ttttttagtt ttgctggccg catcttctca aatatgcttc ccagcctgct 5100 tttctgtaac gttcaccctc taccttagca tcccttccct ttgcaaatag tcctcttcca 5160 acaataataa tgtcagatcc tgtagagacc acatcatcca cggttctata ctgttgaccc 5220 aatgcgtctc ccttgtcatc taaacccaca ccgggtgtca taatcaacca atcgtaacct 5280 tcatctcttc cacccatgtc tctttgagca ataaagccga taacaaaatc tttgtcgctc 5340 ttcgcaatgt caacagtacc cttagtatat tctccagtag atagggagcc cttgcatgac 5400 aattctgcta acatcaaaag gcctctaggt tcctttgtta cttcttctgc cgcctgcttc 5460 aaaccgctaa caatacctgg gcccaccaca ccgtgtgcat tcgtaatgtc tgcccattct 5520 gctattctgt atacacccgc agagtactgc aatttgactg tattaccaat gtcagcaaat 5580 tttctgtctt cgaagagtaa aaaattgtac ttggcggata atgcctttag cggcttaact 5640 gtgccctcca tggaaaaatc agtcaagata tccacatgtg tttttagtaa acaaattttg 5700 ggacctaatg cttcaactaa ctccagtaat tccttggtgg tacgaacatc caatgaagca 5760 cacaagtttg tttgcttttc gtgcatgata ttaaatagct tggcagcaac aggactagga 5820 tgagtagcag cacgttcctt atatgtagct ttcgacatga tttatcttcg tttcctgcag 5880 gtttttgttc tgtgcagttg ggttaagaat actgggcaat ttcatgtttc ttcaacacta 5940 catatgcgta tatataccaa tctaagtctg tgctccttcc ttcgttcttc cttctgttcg 6000 gagattaccg aatcaaaaaa atttcaagga aaccgaaatc aaaaaaaaga ataaaaaaaa 6060 aatgatgaat tgaattgaaa agctgtggta tggtgcactc tcagtacaat ctgctctgat 6120 gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 6180 tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 6240 cagaggtttt caccgtcatc accgaaacgc gcga 6274 <210> 6 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 6 tccaataacg gaatccaact 20 <210> 7 <211> 3648 <212> DNA <213> Artificial Sequence <220> <223> Plasmid Vector 1548 <220> <221> promoter <222> (1)..(8) <223> AmpR promoter <220> <221> misc_feature <222> (97)..(182) <223> ade1 pro homology <220> <221> gene <222> (288)..(1091) <223> URA3 <220> <221> promoter <222> (1092)..(1307) <223> URA3 promoter <220> <221> misc_feature <222> (1359)..(1538) <223> URA3 switch homology <220> <221> misc_feature <222> (1544)..(1633) <223> Ade ORF start homology <220> <221> rep_origin <222> (1932)..(2520) <223> ori <220> <221> gene <222> (2691)..(3551) <223> AmpR <220> <221> promoter <222> (3552)..(3648) <223> AmpR promoter <400> 7 gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 60 acattaacct ataaaaatag gcgtatcacg aggcccgggt tttatctttt gcagttggta 120 ctattaagaa caatcgaatc ataagcattg cttacaaaga atacacatac gaaatattaa 180 cgcatctgtg cggtatttca caccgcatag ggtaataact gatataatta aattgaagct 240 ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta gttttgctgg 300 ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc ctctacctta 360 gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga tcctgtagag 420 accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc atctaaaccc 480 acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat gtctctttga 540 gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt acccttagta 600 tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa aaggcctcta 660 ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc tgggcccacc 720 acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc cgcagagtac 780 tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag taaaaaattg 840 tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa atcagtcaag 900 atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac taactccagt 960 aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg 1020 atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc cttatatgta 1080 gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag ttgggttaag 1140 aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac caatctaagt 1200 ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa aaaatttcaa 1260 agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg aaaagctgtg 1320 gtatggtgca ctctcagtac aatctgctct gatgccgcac agttaagccg ctaaaggcat 1380 tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 1440 cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 1500 atgcacacgg tgtggtgggc ccaggtattg ttagcggtgg agggtcaatt acgaagactg 1560 aactggacgg tatattgcca ttggtggcca gaggtaaagt tagagacata tatgaggtag 1620 acgctggtac gttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1680 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1740 attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 1800 cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 1860 gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 1920 ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 1980 agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2040 tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2100 ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2160 gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2220 ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2280 gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2340 aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2400 aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 2460 ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 2520 gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 2580 gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 2640 tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 2700 ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 2760 ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 2820 atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 2880 ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 2940 tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 3000 attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 3060 tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 3120 ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 3180 gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 3240 gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 3300 gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 3360 aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 3420 taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 3480 tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 3540 tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 3600 atgagcggat acatatttga atgtatttag aaaaataaac aaataggg 3648 <210> 8 <211> 12060 <212> DNA <213> Artificial Sequence <220> <223> Plasmid Vector 1251 <220> <221> misc_feature <222> (70)..(573) <223> CEN/ARS <220> <221> rep_origin <222> (1746)..(2334) <223> ori <220> <221> promoter <222> (2852)..(3516) <223> GAL1 and GAL10 genes of S. cerevisiae promoter <220> <221> gene <222> (3519)..(7655) <223> Cas9 <220> <221> misc_feature <222> (7635)..(7655) <223> NLS of SV40 <220> <221> misc_feature <222> (7686)..(7856) <223> dead SH3 <220> <221> misc_feature <222> (7863)..(7928) <223> three tandem FLAG <220> <221> gene <222> (7935)..(8558) <223> PmCDA1 <220> <221> terminator <222> (8589)..(8776) <223> S. cerevisiae ADH1 terminator <220> <221> rep_origin <222> (9132)..(9587) <223> f1 ori <220> <221> promoter <222> (9887)..(10291) <223> S. cerevisiae LEU2 prom <220> <221> gene <222> (10304)..(11398) <223> S. cerevisiae LEU2 <400> 8 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120 atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180 aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240 atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300 gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360 tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420 aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480 attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540 atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140 ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320 caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500 ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560 attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620 cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680 atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740 tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800 ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860 ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920 cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980 gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040 gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100 acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160 gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220 agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280 tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340 agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400 cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460 gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520 ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580 aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 2640 cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 2700 agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcgaaatt 2760 aaccctcact aaagggaaca aaagctggta ccgggcccga attctctcct tctcttaggt 2820 ggcagagcag gtggagggtc gaccatacta gtttcaaaaa ttcttacttt ttttttggat 2880 ggacgcaaag aagtttaata atcatattac atggcattac caccatatac atatccatat 2940 acatatccat atctaatctt acttatatgt tgtggaaatg taaagagccc cattatctta 3000 gcctaaaaaa accttctctt tggaactttc agtaatacgc ttaactgctc attgctatat 3060 tgaagtacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 3120 gtgcgtcctc gtcttcaccg gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg 3180 ctccgaacaa taaagattct acaatactag cttttatggt tatgaagagg aaaaattggc 3240 agtaacctgg ccccacaaac cttcaaatga acgaatcaaa ttaacaacca taggatgata 3300 atgcgattag ttttttagcc ttatttctgg ggtaattaat cagcgaagcg atgatttttg 3360 atctattaac agatatataa atgcaaaaac tgcataacca ctttaactaa tactttcaac 3420 attttcggtt tgtattactt cttattcaaa tgtaataaaa gtatcaacaa aaaattgtta 3480 atatacctct atactttaac gtcaaggaga aaaaacccat ggacaagaag tactccattg 3540 ggctcgctat cggcacaaac agcgtcggtt gggccgtcat tacggacgag tacaaggtgc 3600 cgagcaaaaa attcaaagtt ctgggcaata ccgatcgcca cagcataaag aagaacctca 3660 ttggcgccct cctgttcgac tccggggaga cggccgaagc cacgcggctc aaaagaacag 3720 cacggcgcag atatacccgc agaaagaatc ggatctgcta cctgcaggag atctttagta 3780 atgagatggc taaggtggat gactctttct tccataggct ggaggagtcc tttttggtgg 3840 aggaggataa aaagcacgag cgccacccaa tctttggcaa tatcgtggac gaggtggcgt 3900 accatgaaaa gtacccaacc atatatcatc tgaggaagaa gcttgtagac agtactgata 3960 aggctgactt gcggttgatc tatctcgcgc tggcgcatat gatcaaattt cggggacact 4020 tcctcatcga gggggacctg aacccagaca acagcgatgt cgacaaactc tttatccaac 4080 tggttcagac ttacaatcag cttttcgaag agaacccgat caacgcatcc ggagttgacg 4140 ccaaagcaat cctgagcgct aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac 4200 agctccctgg ggagaagaag aacggcctgt ttggtaatct tatcgccctg tcactcgggc 4260 tgacccccaa ctttaaatct aacttcgacc tggccgaaga tgccaagctt caactgagca 4320 aagacaccta cgatgatgat ctcgacaatc tgctggccca gatcggcgac cagtacgcag 4380 accttttttt ggcggcaaag aacctgtcag acgccattct gctgagtgat attctgcgag 4440 tgaacacgga gatcaccaaa gctccgctga gcgctagtat gatcaagcgc tatgatgagc 4500 accaccaaga cttgactttg ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca 4560 aggaaatttt cttcgatcag tctaaaaatg gctacgccgg atacattgac ggcggagcaa 4620 gccaggagga attttacaaa tttattaagc ccatcttgga aaaaatggac ggcaccgagg 4680 agctgctggt aaagcttaac agagaagatc tgttgcgcaa acagcgcact ttcgacaatg 4740 gaagcatccc ccaccagatt cacctgggcg aactgcacgc tatcctcagg cggcaagagg 4800 atttctaccc ctttttgaaa gataacaggg aaaagattga gaaaatcctc acatttcgga 4860 taccctacta tgtaggcccc ctcgcccggg gaaattccag attcgcgtgg atgactcgca 4920 aatcagaaga gaccatcact ccctggaact tcgaggaagt cgtggataag ggggcctctg 4980 cccagtcctt catcgaaagg atgactaact ttgataaaaa tctgcctaac gaaaaggtgc 5040 ttcctaaaca ctctctgctg tacgagtact tcacagttta taacgagctc accaaggtca 5100 aatacgtcac agaagggatg agaaagccag cattcctgtc tggagagcag aagaaagcta 5160 tcgtggacct cctcttcaag acgaaccgga aagttaccgt gaaacagctc aaagaagact 5220 atttcaaaaa gattgaatgt ttcgactctg ttgaaatcag cggagtggag gatcgcttca 5280 acgcatccct gggaacgtat cacgatctcc tgaaaatcat taaagacaag gacttcctgg 5340 acaatgagga gaacgaggac attcttgagg acattgtcct cacccttacg ttgtttgaag 5400 atagggagat gattgaagaa cgcttgaaaa cttacgctca tctcttcgac gacaaagtca 5460 tgaaacagct caagaggcgc cgatatacag gatgggggcg gctgtcaaga aaactgatca 5520 atgggatccg agacaagcag agtggaaaga caatcctgga ttttcttaag tccgatggat 5580 ttgccaaccg gaacttcatg cagttgatcc atgatgactc tctcaccttt aaggaggaca 5640 tccagaaagc acaagtttct ggccaggggg acagtcttca cgagcacatc gctaatcttg 5700 caggtagccc agctatcaaa aagggaatac tgcagaccgt taaggtcgtg gatgaactcg 5760 tcaaagtaat gggaaggcat aagcccgaga atatcgttat cgagatggcc cgagagaacc 5820 aaactaccca gaagggacag aagaacagta gggaaaggat gaagaggatt gaagagggta 5880 taaaagaact ggggtcccaa atccttaagg aacacccagt tgaaaacacc cagcttcaga 5940 atgagaagct ctacctgtac tacctgcaga acggcaggga catgtacgtg gatcaggaac 6000 tggacatcaa tcggctctcc gactacgacg tggatgctat cgtgccccag tcttttctca 6060 aagatgattc tattgataat aaagtgttga caagatccga taaaaataga gggaagagtg 6120 ataacgtccc ctcagaagaa gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga 6180 acgccaaact gatcacacaa cggaagttcg ataatctgac taaggctgaa cgaggtggcc 6240 tgtctgagtt ggataaagcc ggcttcatca aaaggcagct tgttgagaca cgccagatca 6300 ccaagcacgt ggcccaaatt ctcgattcac gcatgaacac caagtacgat gaaaatgaca 6360 aactgattcg agaggtgaaa gttattactc tgaagtctaa gctggtctca gatttcagaa 6420 aggactttca gttttataag gtgagagaga tcaacaatta ccaccatgcg catgatgcct 6480 acctgaatgc agtggtaggc actgcactta tcaaaaaata tcccaagctt gaatctgaat 6540 ttgtttacgg agactataaa gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg 6600 aaataggcaa ggccaccgct aagtacttct tttacagcaa tattatgaat tttttcaaga 6660 ccgagattac actggccaat ggagagattc ggaagcgacc acttatcgaa acaaacggag 6720 aaacaggaga aatcgtgtgg gacaagggta gggatttcgc gacagtccgg aaggtcctgt 6780 ccatgccgca ggtgaacatc gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg 6840 aaagtatcct cccgaaaagg aacagcgaca agctgatcgc acgcaaaaaa gattgggacc 6900 ccaagaaata cggcggattc gattctccta cagtcgctta cagtgtactg gttgtggcca 6960 aagtggagaa agggaagtct aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa 7020 tcatggagcg atcaagcttc gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata 7080 aagaggtcaa aaaagacctc atcattaagc ttcccaagta ctctctcttt gagcttgaaa 7140 acggccggaa acgaatgctc gctagtgcgg gcgagctgca gaaaggtaac gagctggcac 7200 tgccctctaa atacgttaat ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt 7260 ctcccgaaga taatgagcag aagcagctgt tcgtggaaca acacaaacac taccttgatg 7320 agatcatcga gcaaataagc gaattctcca aaagagtgat cctcgccgac gctaacctcg 7380 ataaggtgct ttctgcttac aataagcaca gggataagcc catcagggag caggcagaaa 7440 acattatcca cttgtttact ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg 7500 acaccaccat agacagaaag cggtacacct ctacaaagga ggtcctggac gccacactga 7560 ttcatcagtc aattacgggg ctctatgaaa caagaatcga cctctctcag ctcggtggag 7620 acagcagggc tgaccccaag aagaagagga aggtgggtgg aggaggttct ggaggtggag 7680 gttctgcaga gtatgtgcgg gccctctttg actttaatgg gaatgatgaa gaagatcttc 7740 cctttaagaa aggagacatc ctgagaatcc gggataagcc tgaagagcag tggtggaatg 7800 cagaggacag cgaaggaaag agggggatga ttcttgtccc ttacgtggag aagtattccg 7860 gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7920 acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7980 acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 8040 tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8100 aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8160 aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8220 cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8280 gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8340 ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8400 accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8460 ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8520 aggtaaaaat actccacacc actaagagtc ctgctgtttc tagaggctcc ggataaggat 8580 cctaataagc gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa 8640 taagtgtata caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga 8700 gtaactcttt cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctcttattg 8760 accacacctc taccggcatg ccgagcaaat gcctgcaaat cgctcccggg caaaaaaccc 8820 cctcaagacc cgtttagagg ccccaagggg ttatgctatg catactgata taattaaatt 8880 gaagctctaa tttgtgagtt tagtatacat gcataccaag cttccgcggt ggagctccaa 8940 ttcgccctat agtgagtcgt attacaattc actggccgtc gttttacaac gtcgtgactg 9000 ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catcccccct tcgccagctg 9060 gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 9120 cgaatggcgc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 9180 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 9240 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 9300 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 9360 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 9420 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 9480 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 9540 acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcct gatgcggtat 9600 tttctcctta cgcatctgtg cggtatttca caccgcatat cgaccctcga ggagaacttc 9660 tagtatatcc acatacctaa tattattgcc ttattaaaaa tggaatcgga acaattacat 9720 caaaatccac attctcttca aaatcaattg tcctgtactt ccttgttcat gtgtgttcaa 9780 aaacgttata tttataggat aattatactc tatttctcaa caagtaattg gttgtttggc 9840 cgagcggtct aaggcgcctg attcaagaaa tatcttgacc gcagttaact gtgggaatac 9900 tcaggtatcg taagatgcaa gagttcgaat ctcttagcaa ccattatttt tttcctcaac 9960 ataacgagaa cacacagggg cgctatcgca cagaatcaaa ttcgatgact ggaaattttt 10020 tgttaatttc agaggtcgcc tgacgcatat acctttttca actgaaaaat tgggagaaaa 10080 aggaaaggtg agaggccgga accggctttt catatagaat agagaagcgt tcatgactaa 10140 atgcttgcat cacaatactt gaagttgaca atattattta aggacctatt gttttttcca 10200 ataggtggtt agcaatcgtc ttactttcta acttttctta ccttttacat ttcagcaata 10260 tatatatata tttcaaggat ataccattct aatgtctgcc cctatgtctg cccctaagaa 10320 gatcgtcgtt ttgccaggtg accacgttgg tcaagaaatc acagccgaag ccattaaggt 10380 tcttaaagct atttctgatg ttcgttccaa tgtcaagttc gatttcgaaa atcatttaat 10440 tggtggtgct gctatcgatg ctacaggtgt cccacttcca gatgaggcgc tggaagcctc 10500 caagaaggtt gatgccgttt tgttaggtgc tgtgggtggt cctaaatggg gtaccggtag 10560 tgttagacct gaacaaggtt tactaaaaat ccgtaaagaa cttcaattgt acgccaactt 10620 aagaccatgt aactttgcat ccgactctct tttagactta tctccaatca agccacaatt 10680 tgctaaaggt actgacttcg ttgttgtcag agaattagtg ggaggtattt actttggtaa 10740 gagaaaggaa gacgatggtg atggtgtcgc ttgggatagt gaacaataca ccgttccaga 10800 agtgcaaaga atcacaagaa tggccgcttt catggcccta caacatgagc caccattgcc 10860 tatttggtcc ttggataaag ctaatgtttt ggcctcttca agattatgga gaaaaactgt 10920 ggaggaaacc atcaagaacg aattccctac attgaaggtt caacatcaat tgattgattc 10980 tgccgccatg atcctagtta agaacccaac ccacctaaat ggtattataa tcaccagcaa 11040 catgtttggt gatatcatct ccgatgaagc ctccgttatc ccaggttcct tgggtttgtt 11100 gccatctgcg tccttggcct ctttgccaga caagaacacc gcatttggtt tgtacgaacc 11160 atgccacggt tctgctccag atttgccaaa gaataaggtt gaccctatcg ccactatctt 11220 gtctgctgca atgatgttga aattgtcatt gaacttgcct gaagaaggta aggccattga 11280 agatgcagtt aaaaaggttt tggatgcagg tatcagaact ggtgatttag gtggttccaa 11340 cagtaccacc gaagtcggtg atgctgtcgc cgaagaagtt aagaaaatcc ttgcttaaaa 11400 agattctctt tttttatgat atttgtacat aaactttata aatgaaattc ataatagaaa 11460 cgacacgaaa ttacaaaatg gaatatgttc atagggtaga cgaaactata tacgcaatct 11520 acatacattt atcaagaagg agaaaaagga ggatagtaaa ggaatacagg taagcaaatt 11580 gatactaatg gctcaacgtg ataaggaaaa agaattgcac tttaacatta atattgacaa 11640 ggaggagggc accacacaaa aagttaggtg taacagaaaa tcatgaaact acgattccta 11700 atttgatatt ggaggatttt ctctaaaaaa aaaaaaatac aacaaataaa aaacactcaa 11760 tgacctgacc atttgatgga gtttaagtca ataccttctt gaaccatttc ccataatggt 11820 gaaagttccc tcaagaattt tactctgtca gaaacggcct tacgacgtag tcgatatggt 11880 gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 11940 cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 12000 tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 12060 12060 <210> 9 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 9 cctttagcgg cttaactgtg 20 <210> 10 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 10 ggcccaggta ttgttagcgg 20 <210> 11 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 11 ttggcggata atgcctttag 20 <210> 12 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 12 tgcagttggg ttaagaatac 20 <210> 13 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 13 gctaacatca aaaggcctct 20 <210> 14 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 14 ttggcggata atgcctttag 20 <210> 15 <211> 7250 <212> DNA <213> Artificial Sequence <220> <223> Plasmid Vector 1xgRNA Can cross <220> <221> gene <222> (133)..(993) <223> AmpR <220> <221> promoter <222> (994)..(1098) <223> AmpR promoter <220> <221> rep_origin <222> (1125)..(2467) <223> 2 micro ori <220> <221> misc_feature <222> (2521)..(2994) <223> Can1_Left arm <220> <221> promoter <222> (3231)..(3446) <223> URA3 promoter <220> <221> gene <222> (3447)..(4250) <223> URA3 <220> <221> rep_origin <222> (4381)..(4836) <223> f1 ori <220> <221> misc_feature <222> (5054)..(5507) <223> Can1_Right Arm <220> <221> terminator <222> (5519)..(5766) <223> CYC1 terminator <220> <221> terminator <222> (5772)..(5785) <223> Sup4 term <220> <221> misc_structure <222> (5788)..(5870) <223> tracrRNA <220> <221> misc_feature <222> (5871)..(5890) <223> target1R <220> <221> promoter <222> (5891)..(6159) <223> SNR52 promoter <220> <221> misc_feature <222> (6222)..(6238) <223> M13 rev <220> <221> misc_feature <222> (6246)..(6262) <223> lac operator <220> <221> promoter <222> (6270)..(6300) <223> lac promoter <220> <221> rep_origin <222> (6624)..(7212) <223> ori <400> 15 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 60 ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 120 ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 180 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 240 accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 300 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 360 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 420 tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 480 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 540 gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 600 agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 660 aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 720 gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 780 tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 840 gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 900 tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 960 aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 1020 catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 1080 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa gcatctgtgc 1140 ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 1200 gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 1260 gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa 1320 tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt accaacaaag 1380 aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt tttctaacaa 1440 agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct cttgataact 1500 ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta ttttctcttc 1560 cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag ctgcgggtgc 1620 attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat tgcgcatact 1680 ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt atgaacggtt 1740 tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg tattgttttc 1800 gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa tactagagat 1860 aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 1920 gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgagcaatgt 1980 ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc gtttttggtt 2040 ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa gttcctatac 2100 tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa acgagcgctt 2160 ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca cctatatctg 2220 cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt tatgcttaaa 2280 tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc tcctgtgata 2340 ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt agctgttcta 2400 tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt tcctttgata 2460 ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat aggcgcatgc 2520 ttattagcct tgatagtgct gaaaaaaaga aaaaaaacaa aaaaaagaaa taaaataacg 2580 gcaaacagca aaggccacag aaccgtattc atgttacttc tgcaatatca atcacttact 2640 ggcaagtgcg tataaattaa acctatttct ttatcatcat atttacttat atctttaaca 2700 gattccaaac cctaaagtgt ccgaattttc aatagggcga acttgaagaa taaccaaggt 2760 caataatata tcttttagta taaccctgaa atttgcccta tagaaatcta gggtttctgt 2820 gtggtttccg ggtgagtcat acggcttttt tgaatttctt tttttgcagt tgtctctatc 2880 aatgaaaatt tcgaggaaga cgataaggtt aagataagta gataagagaa tgatacgaga 2940 taaagcacaa attagcagaa agaagagtgg ttgcgaacag agtaaaccga atcagacgtc 3000 agacctaggt catgccgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc 3060 tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 3120 gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 3180 cggcatcaga gcagattgta ctgagagtgc accataccac agcttttcaa ttcaattcat 3240 catttttttt ttattctttt ttttgatttc ggtttccttg aaattttttt gattcggtaa 3300 tctccgaaca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 3360 tatgtagtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 3420 aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 3480 ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 3540 tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 3600 gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 3660 gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 3720 gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 3780 tagcagaatg ggcagacatt acgaatgcac acggtgtggt gggcccaggt attgttagcg 3840 gtttgaagca ggcggcagaa gaagtaacaa aggaacctag aggccttttg atgttagcag 3900 aattgtcatg caagggctcc ctatctactg gagaatatac taagggtact gttgacattg 3960 cgaagagcga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 4020 atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 4080 cattgggtca acagtataga accgtggatg atgtggtctc tacaggatct gacattatta 4140 ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 4200 gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 4260 tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 4320 tattacccta tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 4380 aaattgtaaa cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 4440 tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga 4500 tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 4560 acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct 4620 aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 4680 cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 4740 cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 4800 cacccgccgc gcttaatgcg ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc 4860 gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 4920 ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 4980 gtaaaacgac ggccagtgag cgcgcgtaat acgactcact atagggcgaa ttgggtactc 5040 ctaggttaat taagataatg tctgagttag gtgagtattc taaattagaa aacaaagagc 5100 ttagaacgga gtttgaattg acaaattttc cttttccagg cacaactgat aacgactccg 5160 atgacggaag ccaagggcag aactctttga atatcattac tcctgacatg gatgatactc 5220 tggttaatga tgtacttcga gaaaacgata aaaagtctag tatgagaatg gcttttatga 5280 atctagcaaa ctctattctt ggtgccggaa taattactca gccgttcgcg atcaaaaatg 5340 ctggtatatt aggcgggcta ttatcatacg tagccctcgg atttatagtt gattggacgt 5400 taagacttat tgtcattaac ttgactcttg ctggcaagag aacataccag ggtacggtcg 5460 aacatgtaat gggtaaaaaa gggaaattgc tgattctatt tacaaactgg taccggccgc 5520 aaattaaagc cttcgagcgt cccaaaacct tctcaagcaa ggttttcagt ataatgttac 5580 atgcgtacac gcgtctgtac agaaaaaaaa gaaaaatttg aaatataaat aacgttctta 5640 atactaacat aactataaaa aaataaatag ggacctagac ttcaggttgt ctaactcctt 5700 ccttttcggt tagagcggat gtggggggag ggcgtgaacg taagcgtgac ataactaatt 5760 acatgactcg aagacataaa aaacaaaaaa agcaccaccg actcggtgcc actttttcaa 5820 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac gaaaagggga 5880 tcctattgac gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 5940 ccaactttca cttctacagc gtttgaccaa aatcttttga acagaacatt gtagggtgtg 6000 aaaaaatgcg cacctttacc gctagcccaa gagggcacta caaaatctag agttgtactt 6060 caaacgtaca tgtaatcacc ttgtatatac tcgaaagaaa acatcaagtt tctgtataaa 6120 tatgagtgaa agcataatca tacattatct tttcaaagaa gctccagctt ttgttccctt 6180 tagtgatcac gtccggattg cggccgcttg gcgtaatcat ggtcatagct gtttcctgtg 6240 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 6300 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 6360 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 6420 ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 6480 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 6540 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 6600 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 6660 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 6720 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 6780 tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 6840 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 6900 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 6960 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 7020 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 7080 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 7140 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 7200 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7250 <210> 16 <211> 7672 <212> DNA <213> Artificial Sequence <220> <223> Plasmid Vector 2xgRNA Can cross <220> <221> gene <222> (133)..(993) <223> AmpR <220> <221> promoter <222> (994)..(1098) <223> AmpR promoter <220> <221> rep_origin <222> (1125)..(2467) <223> 2 micro ori <220> <221> terminator <222> (2539)..(2552) <223> Sup4 term <220> <221> misc_structure <222> (2555)..(2637) <223> tracrRNA <220> <221> misc_feature <222> (2638)..(2657) <223> target1R <220> <221> promoter <222> (2658)..(2926) <223> SNR52 promoter <220> <221> misc_feature <222> (2943)..(3416) <223> Can1_Left arm <220> <221> promoter <222> (3653)..(3868) <223> URA3 promoter <220> <221> gene <222> (3869)..(4672) <223> URA3 <220> <221> rep_origin <222> (4803)..(5258) <223> f1 ori <220> <221> misc_feature <222> (5476)..(5929) <223> Can1_Right Arm <220> <221> terminator <222> (5941)..(6188) <223> CYC1 terminator <220> <221> terminator <222> (6194)..(6207) <223> Sup4 term <220> <221> misc_structure <222> (6210)..(6292) <223> tracrRNA <220> <221> misc_feature <222> (6293)..(6312) <223> target2R <220> <221> promoter <222> (6313)..(6581) <223> SNR52 promoter <220> <221> rep_origin <222> (7046)..(7634) <223> ori <400> 16 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 60 ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 120 ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 180 tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 240 accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 300 atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 360 cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 420 tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 480 tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 540 gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 600 agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 660 aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 720 gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 780 tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 840 gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 900 tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 960 aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 1020 catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 1080 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa gcatctgtgc 1140 ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 1200 gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 1260 gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa 1320 tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt accaacaaag 1380 aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt tttctaacaa 1440 agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct cttgataact 1500 ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta ttttctcttc 1560 cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag ctgcgggtgc 1620 attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat tgcgcatact 1680 ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt atgaacggtt 1740 tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg tattgttttc 1800 gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa tactagagat 1860 aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 1920 gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgagcaatgt 1980 ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc gtttttggtt 2040 ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa gttcctatac 2100 tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa acgagcgctt 2160 ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca cctatatctg 2220 cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt tatgcttaaa 2280 tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc tcctgtgata 2340 ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt agctgttcta 2400 tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt tcctttgata 2460 ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat aggcgcatgt 2520 cgactacccg ggaactcgag acataaaaaa caaaaaaagc accaccgact cggtgccact 2580 ttttcaagtt gataacggac tagccttatt ttaacttgct atttctagct ctaaaacgaa 2640 aaggggatcc tattgacgat catttatctt tcactgcgga gaagtttcga acgccgaaac 2700 atgcgcacca actttcactt ctacagcgtt tgaccaaaat cttttgaaca gaacattgta 2760 gggtgtgaaa aaatgcgcac ctttaccgct agcccaagag ggcactacaa aatctagagt 2820 tgtacttcaa acgtacatgt aatcaccttg tatatactcg aaagaaaaca tcaagtttct 2880 gtataaatat gagtgaaagc ataatcatac attatctttt caaagaattc accggtgcat 2940 gcttattagc cttgatagtg ctgaaaaaaa gaaaaaaaac aaaaaaaaga aataaaataa 3000 cggcaaacag caaaggccac agaaccgtat tcatgttact tctgcaatat caatcactta 3060 ctggcaagtg cgtataaatt aaacctattt ctttatcatc atatttactt atatctttaa 3120 cagattccaa accctaaagt gtccgaattt tcaatagggc gaacttgaag aataaccaag 3180 gtcaataata tatcttttag tataaccctg aaatttgccc tatagaaatc tagggtttct 3240 gtgtggtttc cgggtgagtc atacggcttt tttgaatttc tttttttgca gttgtctcta 3300 tcaatgaaaa tttcgaggaa gacgataagg ttaagataag tagataagag aatgatacga 3360 gataaagcac aaattagcag aaagaagagt ggttgcgaac agagtaaacc gaatcagacg 3420 tcagacctag gtcatgccga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa 3480 cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 3540 cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta 3600 tgcggcatca gagcagattg tactgagagt gcaccatacc acagcttttc aattcaattc 3660 atcatttttt ttttattctt ttttttgatt tcggtttcct tgaaattttt ttgattcggt 3720 aatctccgaa cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg 3780 catatgtagt gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac 3840 aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc 3900 tactcatcct agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa 3960 cttgtgtgct tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt 4020 aggtcccaaa atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga 4080 gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga 4140 cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag 4200 aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag 4260 cggtttgaag caggcggcag aagaagtaac aaaggaacct agaggccttt tgatgttagc 4320 agaattgtca tgcaagggct ccctatctac tggagaatat actaagggta ctgttgacat 4380 tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag 4440 agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg acaagggaga 4500 cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat ctgacattat 4560 tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta 4620 cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact aaaaaactgt 4680 attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt aattatatca 4740 gttattaccc tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca 4800 ggaaattgta aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 4860 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 4920 gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 4980 caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 5040 ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 5100 cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 5160 agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 5220 cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg cgccattcgc cattcaggct 5280 gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 5340 agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 5400 ttgtaaaacg acggccagtg agcgcgcgta atacgactca ctatagggcg aattgggtac 5460 tcctaggtta attaagataa tgtctgagtt aggtgagtat tctaaattag aaaacaaaga 5520 gcttagaacg gagtttgaat tgacaaattt tccttttcca ggcacaactg ataacgactc 5580 cgatgacgga agccaagggc agaactcttt gaatatcatt actcctgaca tggatgatac 5640 tctggttaat gatgtacttc gagaaaacga taaaaagtct agtatgagaa tggcttttat 5700 gaatctagca aactctattc ttggtgccgg aataattact cagccgttcg cgatcaaaaa 5760 tgctggtata ttaggcgggc tattatcata cgtagccctc ggatttatag ttgattggac 5820 gttaagactt attgtcatta acttgactct tgctggcaag agaacatacc agggtacggt 5880 cgaacatgta atgggtaaaa aagggaaatt gctgattcta tttacaaact ggtaccggcc 5940 gcaaattaaa gccttcgagc gtcccaaaac cttctcaagc aaggttttca gtataatgtt 6000 acatgcgtac acgcgtctgt acagaaaaaa aagaaaaatt tgaaatataa ataacgttct 6060 taatactaac ataactataa aaaaataaat agggacctag acttcaggtt gtctaactcc 6120 ttccttttcg gttagagcgg atgtgggggg agggcgtgaa cgtaagcgtg acataactaa 6180 ttacatgact cgaagacata aaaaacaaaa aaagcaccac cgactcggtg ccactttttc 6240 aagttgataa cggactagcc ttattttaac ttgctatttc tagctctaaa acgaaaaggg 6300 gatcctattg acgatcattt atctttcact gcggagaagt ttcgaacgcc gaaacatgcg 6360 caccaacttt cacttctaca gcgtttgacc aaaatctttt gaacagaaca ttgtagggtg 6420 tgaaaaaatg cgcaccttta ccgctagccc aagagggcac tacaaaatct agagttgtac 6480 ttcaaacgta catgtaatca ccttgtatat actcgaaaga aaacatcaag tttctgtata 6540 aatatgagtg aaagcataat catacattat cttttcaaag aagctccagc ttttgttccc 6600 tttagtgatc acgtccggat tgcggccgct tggcgtaatc atggtcatag ctgtttcctg 6660 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6720 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6780 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6840 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6900 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6960 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 7020 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 7080 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 7140 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 7200 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 7260 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 7320 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 7380 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 7440 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 7500 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7560 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7620 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct ca 7672 <210> 17 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 17 cgaacagagt aaaccgaatc 20 <210> 18 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 18 agcactatca aggctaataa 20 <210> 19 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 19 gcgaacttga agaataacca 20 <210> 20 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 20 tcacctaact cagacattat 20 <210> 21 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 21 ttgctgattc tatttacaaa 20 <210> 22 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 22 gcaaactcta ttcttggtgc 20 <210> 23 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 23 accagagtat catccatgtc 20 <210> 24 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 24 aattcggaca ctttagggtt 20 <210> 25 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <400> 25 agatattata cctggacccc 20 <210> 26 <211> 23 <212> DNA <213> Saccharomyces cerevisiae <400> 26 cccagttgga ttccgttatt gga 23 <210> 27 <211> 23 <212> DNA <213> Saccharomyces cerevisiae <400> 27 ccaggtataa tatctaagga taa 23 <210> 28 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Part of Plasmid Vector 1059(Can1-7R) or Plasmid Vector 1148(Can1-11R) <400> 28 ggttatgcta tgcattccgt tattggtgaa acccaggtgc ctggggtcca ggtataatat 60 cttaggataa aaacgaaggg aggttcttag gttg 94 <210> 29 <211> 94 <212> DNA <213> Saccharomyces cerevisiae <400> 29 ccggcccagt tggattccgt tattggagaa acccaggtgc ctggggtcca ggtataatat 60 ctaaggataa aaacgaaggg aggttcttag gttg 94 <210> 30 <211> 23 <212> DNA <213> Saccharomyces cerevisiae <400> 30 ccaggtataa tatctaagga taa 23 <210> 31 <211> 23 <212> DNA <213> Saccharomyces cerevisiae <400> 31 ccgttattgg agaaacccag gtg 23 <210> 32 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 32 gcgctaccgg actcagatct accggcccag ttggaatgta ggtggtgagc aagggcgagg 60 agctgttcac 70 <210> 33 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 33 gcgctaccgg actcagatct accggcccag ttggaatgta gatggtgagc aagggcgagg 60 agctgttcac 70 <210> 34 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 34 gcgctaccgg actcagatct acgggcccag ttggaatgta gatggtgagc aagggcgagg 60 agctgttcac 70 <210> 35 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 35 gtgaacagct cctcgccctt gctcaccacc tacattccaa ctgggccggt agatctgagt 60 ccggtagcgc 70 <210> 36 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 36 gtgaacagct cctcgccctt gctcaccatc tacattccaa ctgggccggt agatctgagt 60 ccggtagcgc 70 <210> 37 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 37 gtgaacagct cctcgccctt gctcaccatc tacattccaa ctgggcccgt agatctgagt 60 ccggtagcgc 70 <210> 38 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 38 ccgtcagatc cgctagcgct accggactca gatctaccgg cccagttgga atgtagatgg 60 tgagcaaggg 70 <210> 39 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 39 gatctaccgg cccagttgga atgtagatgg tgagcaaggg cgaggagctg ttcaccgggg 60 tggtgcccat 70 <210> 40 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 40 actcagatct accggcccag ttggaatgta gatggtgagc aagggcgagg 50 <210> 41 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> donor DNA <400> 41 cctcgccctt gctcaccatc tacattccaa ctgggccggt agatctgagt 50 <210> 42 <211> 6189 <212> DNA <213> Artificial Sequence <220> <223> Vector SY4(H1_sgRNA,CMV_mEGFP)(Reporter plasmid) <220> <221> promoter <222> (263)..(491) <223> H1 promoter <220> <221> misc_structure <222> (512)..(587) <223> gRNA scaffold <220> <221> enhancer <222> (602)..(981) <223> CMV enhancer <220> <221> promoter <222> (982)..(1185) <223> CMV promoter <220> <221> misc_feature <222> (1231)..(1250) <223> KI_target2 <220> <221> misc_feature <222> (1236)..(1255) <223> eGFP switch target <220> <221> misc_feature <222> (1247)..(1249) <223> Start codon <220> <221> gene <222> (1254)..(1969) <223> EGFP <220> <221> polyA_signal <222> (2012)..(2236) <223> bGH poly(A) <220> <221> rep_origin <222> (2282)..(2710) <223> f1 ori <220> <221> promoter <222> (2724)..(3053) <223> SV40 promoter <220> <221> rep_origin <222> (2904)..(3039) <223> SV40 ori <220> <221> gene <222> (3070)..(3669) <223> PuroR <220> <221> misc_structure <222> (3683)..(4271) <223> WPRE <220> <221> rep_origin <222> (4468)..(5053) <223> ori <220> <221> gene <222> (5224)..(6084) <223> AmpR <220> <221> promoter <222> (6085)..(6189) <223> AmpR promoter <400> 42 cacatttccc cgaaaagtgc cacctgacgt cgacggatcg ggagatctcc cgatccccta 60 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tctgctccct 120 gcttgtgtgt tggaggtcgc tgagtagtgc gcgagcaaaa tttaagctac aacaaggcaa 180 ggcttgaccg acaattgcat gaagaatctg cttagggtta ggcgttttgc gctgcttcgc 240 gatgtacggg ccagatatac gcaattcgaa cgctgacgtc atcaacccgc tccaaggaat 300 cgcgggccca gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg 360 gctgtgaggg acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga 420 aatcaccata aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac 480 cacagatccc ccacctacat tccaactggg cgttttagag ctagaaatag caagttaaaa 540 taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt 600 tgacattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc 660 ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 720 aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 780 actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 840 caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 900 tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 960 ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 1020 cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 1080 tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 1140 atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt 1200 cagatccgct agcgctaccg gactcagatc taccggccca gttggaatgt aggtggtgag 1260 caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 1320 aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 1380 gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 1440 caccttcacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 1500 cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 1560 cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 1620 catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 1680 gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 1740 ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 1800 ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 1860 cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 1920 gttcgtgacc gccgccggga tcactcacgg catggacgag ctgtacaagg ctcgagctca 1980 agcttaagtt taaaccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 2040 gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 2100 taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 2160 ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 2220 gcggtgggct ctatggcttc tgaggcggaa agaaccagct ggggctctag ggggtatccc 2280 cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2340 gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2400 acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2460 agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2520 ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2580 ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2640 taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2700 aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc 2760 cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 2820 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 2880 tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc 2940 cgccccatgg ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg 3000 agctattcca gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc 3060 cggtctagaa tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 3120 cgggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 3180 gacccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 3240 gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 3300 acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 3360 ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 3420 cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 3480 ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 3540 gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 3600 gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 3660 ggtgcctaga cgcgtctgga acaatcaacc tctggattac aaaatttgtg aaagattgac 3720 tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 3780 gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 3840 gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 3900 gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 3960 gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 4020 ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaagct 4080 gacgtccttt ccatggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 4140 ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 4200 tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 4260 cgcctccccg cctggaatta attctgcggc cgcttcctcg ctcactgact cgctgcgctc 4320 ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 4380 agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 4440 ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 4500 caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 4560 gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 4620 cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 4680 tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 4740 gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 4800 cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 4860 tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 4920 tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 4980 caaacaaacc accgctggta gcggtttttt tgtttgcaag cagcagatta cgcgcagaaa 5040 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 5100 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 5160 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 5220 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 5280 catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 5340 ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 5400 aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 5460 ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 5520 caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 5580 attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 5640 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 5700 actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 5760 ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 5820 ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 5880 gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 5940 atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 6000 cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 6060 gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 6120 gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 6180 ggttccgcg 6189 <210> 43 <211> 10648 <212> DNA <213> Artificial Sequence <220> <223> Vector SY45(CMV_Cas9-PmCDA1,EF1_iRFP)(Effector plasmid) <220> <221> enhancer <222> (23)..(402) <223> CMV enhancer <220> <221> promoter <222> (403)..(606) <223> CMV promoter <220> <221> promoter <222> (651)..(669) <223> T7 promoter <220> <221> misc_feature <222> (689)..(691) <223> Kozak sequence <220> <221> misc_signal <222> (692)..(742) <223> NLS unit <220> <221> misc_signal <222> (698)..(718) <223> SV40 NLS <220> <221> gene <222> (743)..(4879) <223> Cas9 <220> <221> misc_signal <222> (4859)..(4879) <223> SV40 NLS <220> <221> misc_structure <222> (4910)..(5080) <223> dead SH3 hs <220> <221> misc_signal <222> (5087)..(5152) <223> 3xFLAG hs <220> <221> gene <222> (5159)..(5782) <223> HsPmCDA1 <220> <221> polyA_signal <222> (5799)..(5920) <223> SV40 poly(A) signal <220> <221> rep_origin <222> (6026)..(6614) <223> ori <220> <221> gene <222> (6788)..(7645) <223> AmpR <220> <221> promoter <222> (7646)..(7750) <223> AmpR promoter <220> <221> promoter <222> (8145)..(9322) <223> EF-1alpha promoter <220> <221> intron <222> (8376)..(9313) <223> EF-1alpha intron A <220> <221> gene <222> (9349)..(10284) <223> iRFP670 <220> <221> misc_feature <222> (9349)..(9352) <223> Kozak sequence <220> <221> polyA_signal <222> (10314)..(10538) <223> bGH poly(A) <400> 43 gggtaacgcc agggtacgcg ttgacattga ttattgacta gttattaata gtaatcaatt 60 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 120 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 180 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 240 actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 300 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 360 acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 420 tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 480 gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 540 aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 600 agagctctct ggctaactag agaacccact gcttactggc ttatcgaaat taatacgact 660 cactataggg agacccaagc tggctagcga aatggcaccg aagaagaagc gtaaagtcgg 720 aatccacgga gttcctgcgg caatggacaa gaagtactcc attgggctcg atatcggcac 780 aaacagcgtc ggttgggccg tcattacgga cgagtacaag gtgccgagca aaaaattcaa 840 agttctgggc aataccgatc gccacagcat aaagaagaac ctcattggcg ccctcctgtt 900 cgactccggg gagacggccg aagccacgcg gctcaaaaga acagcacggc gcagatatac 960 ccgcagaaag aatcggatct gctacctgca ggagatcttt agtaatgaga tggctaaggt 1020 ggatgactct ttcttccata ggctggagga gtcctttttg gtggaggagg ataaaaagca 1080 cgagcgccac ccaatctttg gcaatatcgt ggacgaggtg gcgtaccatg aaaagtaccc 1140 aaccatatat catctgagga agaagcttgt agacagtact gataaggctg acttgcggtt 1200 gatctatctc gcgctggcgc atatgatcaa atttcgggga cacttcctca tcgaggggga 1260 cctgaaccca gacaacagcg atgtcgacaa actctttatc caactggttc agacttacaa 1320 tcagcttttc gaagagaacc cgatcaacgc atccggagtt gacgccaaag caatcctgag 1380 cgctaggctg tccaaatccc ggcggctcga aaacctcatc gcacagctcc ctggggagaa 1440 gaagaacggc ctgtttggta atcttatcgc cctgtcactc gggctgaccc ccaactttaa 1500 atctaacttc gacctggccg aagatgccaa gcttcaactg agcaaagaca cctacgatga 1560 tgatctcgac aatctgctgg cccagatcgg cgaccagtac gcagaccttt ttttggcggc 1620 aaagaacctg tcagacgcca ttctgctgag tgatattctg cgagtgaaca cggagatcac 1680 caaagctccg ctgagcgcta gtatgatcaa gcgctatgat gagcaccacc aagacttgac 1740 tttgctgaag gcccttgtca gacagcaact gcctgagaag tacaaggaaa ttttcttcga 1800 tcagtctaaa aatggctacg ccggatacat tgacggcgga gcaagccagg aggaatttta 1860 caaatttatt aagcccatct tggaaaaaat ggacggcacc gaggagctgc tggtaaagct 1920 taacagagaa gatctgttgc gcaaacagcg cactttcgac aatggaagca tcccccacca 1980 gattcacctg ggcgaactgc acgctatcct caggcggcaa gaggatttct accccttttt 2040 gaaagataac agggaaaaga ttgagaaaat cctcacattt cggataccct actatgtagg 2100 ccccctcgcc cggggaaatt ccagattcgc gtggatgact cgcaaatcag aagagaccat 2160 cactccctgg aacttcgagg aagtcgtgga taagggggcc tctgcccagt ccttcatcga 2220 aaggatgact aactttgata aaaatctgcc taacgaaaag gtgcttccta aacactctct 2280 gctgtacgag tacttcacag tttataacga gctcaccaag gtcaaatacg tcacagaagg 2340 gatgagaaag ccagcattcc tgtctggaga gcagaagaaa gctatcgtgg acctcctctt 2400 caagacgaac cggaaagtta ccgtgaaaca gctcaaagaa gactatttca aaaagattga 2460 atgtttcgac tctgttgaaa tcagcggagt ggaggatcgc ttcaacgcat ccctgggaac 2520 gtatcacgat ctcctgaaaa tcattaaaga caaggacttc ctggacaatg aggagaacga 2580 ggacattctt gaggacattg tcctcaccct tacgttgttt gaagataggg agatgattga 2640 agaacgcttg aaaacttacg ctcatctctt cgacgacaaa gtcatgaaac agctcaagag 2700 gcgccgatat acaggatggg ggcggctgtc aagaaaactg atcaatggga tccgagacaa 2760 gcagagtgga aagacaatcc tggattttct taagtccgat ggatttgcca accggaactt 2820 catgcagttg atccatgatg actctctcac ctttaaggag gacatccaga aagcacaagt 2880 ttctggccag ggggacagtc ttcacgagca catcgctaat cttgcaggta gcccagctat 2940 caaaaaggga atactgcaga ccgttaaggt cgtggatgaa ctcgtcaaag taatgggaag 3000 gcataagccc gagaatatcg ttatcgagat ggcccgagag aaccaaacta cccagaaggg 3060 acagaagaac agtagggaaa ggatgaagag gattgaagag ggtataaaag aactggggtc 3120 ccaaatcctt aaggaacacc cagttgaaaa cacccagctt cagaatgaga agctctacct 3180 gtactacctg cagaacggca gggacatgta cgtggatcag gaactggaca tcaatcggct 3240 ctccgactac gacgtggatc atatcgtgcc ccagtctttt ctcaaagatg attctattga 3300 taataaagtg ttgacaagat ccgataaaaa tagagggaag agtgataacg tcccctcaga 3360 agaagttgtc aagaaaatga aaaattattg gcggcagctg ctgaacgcca aactgatcac 3420 acaacggaag ttcgataatc tgactaaggc tgaacgaggt ggcctgtctg agttggataa 3480 agccggcttc atcaaaaggc agcttgttga gacacgccag atcaccaagc acgtggccca 3540 aattctcgat tcacgcatga acaccaagta cgatgaaaat gacaaactga ttcgagaggt 3600 gaaagttatt actctgaagt ctaagctggt ctcagatttc agaaaggact ttcagtttta 3660 taaggtgaga gagatcaaca attaccacca tgcgcatgat gcctacctga atgcagtggt 3720 aggcactgca cttatcaaaa aatatcccaa gcttgaatct gaatttgttt acggagacta 3780 taaagtgtac gatgttagga aaatgatcgc aaagtctgag caggaaatag gcaaggccac 3840 cgctaagtac ttcttttaca gcaatattat gaattttttc aagaccgaga ttacactggc 3900 caatggagag attcggaagc gaccacttat cgaaacaaac ggagaaacag gagaaatcgt 3960 gtgggacaag ggtagggatt tcgcgacagt ccggaaggtc ctgtccatgc cgcaggtgaa 4020 catcgttaaa aagaccgaag tacagaccgg aggcttctcc aaggaaagta tcctcccgaa 4080 aaggaacagc gacaagctga tcgcacgcaa aaaagattgg gaccccaaga aatacggcgg 4140 attcgattct cctacagtcg cttacagtgt actggttgtg gccaaagtgg agaaagggaa 4200 gtctaaaaaa ctcaaaagcg tcaaggaact gctgggcatc acaatcatgg agcgatcaag 4260 cttcgaaaaa aaccccatcg actttctcga ggcgaaagga tataaagagg tcaaaaaaga 4320 cctcatcatt aagcttccca agtactctct ctttgagctt gaaaacggcc ggaaacgaat 4380 gctcgctagt gcgggcgagc tgcagaaagg taacgagctg gcactgccct ctaaatacgt 4440 taatttcttg tatctggcca gccactatga aaagctcaaa gggtctcccg aagataatga 4500 gcagaagcag ctgttcgtgg aacaacacaa acactacctt gatgagatca tcgagcaaat 4560 aagcgaattc tccaaaagag tgatcctcgc cgacgctaac ctcgataagg tgctttctgc 4620 ttacaataag cacagggata agcccatcag ggagcaggca gaaaacatta tccacttgtt 4680 tactctgacc aacttgggcg cgcctgcagc cttcaagtac ttcgacacca ccatagacag 4740 aaagcggtac acctctacaa aggaggtcct ggacgccaca ctgattcatc agtcaattac 4800 ggggctctat gaaacaagaa tcgacctctc tcagctcggt ggagacagca gggctgaccc 4860 caagaagaag aggaaggtgg gtggaggagg taccggcggt ggaggctcag cagaatacgt 4920 acgagctctg tttgacttca atgggaatga cgaggaggat ctccccttta agaagggcga 4980 tattctccgc atcagagata agcccgaaga acaatggtgg aatgccgagg atagcgaagg 5040 gaaaaggggc atgattctgg tgccatatgt ggagaaatat tccggtgact acaaagacca 5100 tgatggggat tacaaagacc acgacatcga ctacaaagac gacgacgata aatcagggat 5160 gacagacgcc gagtacgtgc gcattcatga gaaactggat atttacacct tcaagaagca 5220 gttcttcaac aacaagaaat ctgtgtcaca ccgctgctac gtgctgtttg agttgaagcg 5280 aaggggcgaa agaagggctt gcttttgggg ctatgccgtc aacaagcccc aaagtggcac 5340 cgagagagga atacacgctg agatattcag tatccgaaag gtggaagagt atcttcggga 5400 taatcctggg cagtttacga tcaactggta ttccagctgg agtccttgcg ctgattgtgc 5460 cgagaaaatt ctggaatggt ataatcagga acttcgggga aacgggcaca cattgaaaat 5520 ctgggcctgc aagctgtact acgagaagaa tgcccggaac cagataggac tctggaatct 5580 gagggacaat ggtgtaggcc tgaacgtgat ggtttccgag cactatcagt gttgtcggaa 5640 gattttcatc caaagctctc ataaccagct caatgaaaac cgctggttgg agaaaacact 5700 gaaacgtgcg gagaagcgga gatccgagct gagcatcatg atccaggtca agattctgca 5760 taccactaag tctccagccg tttagcttcg cccaccccaa cttgtttatt gcagcttata 5820 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 5880 attctagttg tggtttgtcc aaactcatca atgtatctta gcggccgcca ccgcggtgga 5940 gctccagctt ttgttccctt tagtgagggt taattgcgcg ccagcaaaag gccaggaacc 6000 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6060 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6120 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6180 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6240 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6300 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6360 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6420 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6480 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6540 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6600 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6660 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6720 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6780 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6840 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 6900 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 6960 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7020 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7080 gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7140 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7200 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7260 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7320 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7380 gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7440 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7500 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7560 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7620 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7680 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7740 gggttccgcg cacatttccc cgaaaagtgc cacctaaatt gtaagcgtta atattttgtt 7800 aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 7860 caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg 7920 gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta 7980 tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg 8040 ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 8100 gccgcagcta atggaccttc taggtcttga aaggagtggg aattggctcc ggtgcccgtc 8160 agtgggcaga gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt 8220 gaaccggtgc ctagagaagg tggcgcgggg taaactggga aagtgatgtc gtgtactggc 8280 tccgcctttt tcccgagggt gggggagaac cgtatataag tgcagtagtc gccgtgaacg 8340 ttctttttcg caacgggttt gccgccagaa cacaggtaag tgccgtgtgt ggttcccgcg 8400 ggcctggcct ctttacgggt tatggccctt gcgtgccttg aattacttcc actggctgca 8460 gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt cgaggccttg 8520 cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg 8580 ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata agtctctagc 8640 catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata gtcttgtaaa 8700 tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg gcgacggggc 8760 ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc caccgagaat 8820 cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg cgccgccgtg 8880 tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt gagcggaaag 8940 atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga 9000 gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc 9060 atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct cgagcttttg 9120 gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc cccacactga 9180 gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct tggaatttgc 9240 cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc aaagtttttt 9300 tcttccattt caggtgtcgt gaggaatttc gacccggatc cggccaccat ggcgcgtaag 9360 gtcgatctca cctcctgcga tcgcgagccg atccacatcc ccggcagcat tcagccgtgc 9420 ggctgcctgc tagcctgcga cgcgcaggcg gtgcggatca cgcgcattac ggaaaatgcc 9480 ggcgcgttct ttggacgcga aactccgcgg gtcggtgagc tactcgccga ttacttcggc 9540 gagaccgaag cccatgcgct gcgcaacgca ctggcgcagt cctccgatcc aaagcgaccg 9600 gcgctgatct tcggttggcg cgacggcctg accggccgca ccttcgacat ctcactgcat 9660 cgccatgacg gtacatcgat catcgagttc gagcctgcgg cggccgaaca ggccgacaat 9720 ccgctgcggc tgacgcggca gatcatcgcg cgcaccaaag aactgaagtc gctcgaagag 9780 atggccgcac gggtgccgcg ctatctgcag gcgatgctcg gctatcaccg cgtgatgttg 9840 taccgcttcg cggacgacgg ctccgggatg gtgatcggcg aggcgaagcg cagcgacctc 9900 gagagctttc tcggtcagca ctttccggcg tcgctggtcc cgcagcaggc gcggctactg 9960 tacttgaaga acgcgatccg cgtggtctcg gattcgcgcg gcatcagcag ccggatcgtg 10020 cccgagcacg acgcctccgg cgccgcgctc gatctgtcgt tcgcgcacct gcgcagcatc 10080 tcgccctgcc atctcgaatt tctgcggaac atgggcgtca gcgcctcgat gtcgctgtcg 10140 atcatcattg acggcacgct atggggattg atcatctgtc atcattacga gccgcgtgcc 10200 gtgccgatgg cgcagcgcgt cgcggccgaa atgttcgccg acttcttatc gctgcacttc 10260 accgccgccc accaccaacg ctaagcggcc gcgactctaa ccggtctcag aagccataga 10320 gcccaccgca tccccagcat gcctgctatt gtcttcccaa tcctccccct tgctgtcctg 10380 ccccacccca ccccccagaa tagaatgaca cctactcaga caatgcgatg caatttcctc 10440 attttattag gaaaggacag tgggagtggc accttccagg gtcaaggaag gcacggggga 10500 ggggcaaaca acagatggct ggcaactaga aggcacagtc gaggctgatc attcaggctg 10560 cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 10620 gggggatgtg ctgcaaggcg attaagtt 10648 <210> 44 <211> 10120 <212> DNA <213> Artificial Sequence <220> <223> Vector SY45(CMV_Cas9,EF1_iRFP)(Effector plasmid) <220> <221> promoter <222> (76)..(1253) <223> EF-1alpha promoter <220> <221> intron <222> (307)..(1244) <223> EF-1alpha intron A <220> <221> gene <222> (1280)..(2215) <223> iRFP670 <220> <221> misc_feature <222> (1280)..(1283) <223> Kozak sequence <220> <221> polyA_signal <222> (2245)..(2469) <223> bGH poly(A) <220> <221> promoter <222> (2677)..(2905) <223> H1 promoter <220> <221> misc_feature <222> (2925) <223> target1 <220> <221> misc_structure <222> (2926)..(3001) <223> gRNA scaffold <220> <221> enhancer <222> (3016)..(3395) <223> CMV enhancer <220> <221> promoter <222> (3396)..(3599) <223> CMV promoter <220> <221> misc_signal <222> (3646)..(3696) <223> NLS unit <220> <221> misc_signal <222> (3652)..(3672) <223> SV40 NLS <220> <221> gene <222> (3697)..(7836) <223> Cas9 <220> <221> misc_signal <222> (7813)..(7833) <223> SV40 NLS <220> <221> polyA_signal <222> (7850)..(7971) <223> SV40 poly(A) signal <220> <221> rep_origin <222> (8077)..(8665) <223> ori <220> <221> gene <222> (8839)..(9696) <223> AmpR <220> <221> promoter <222> (9697)..(9801) <223> AmpR promoter <400> 44 ggagcccccg atttagagct tgacggggaa agccgcagct aatggacctt ctaggtcttg 60 aaaggagtgg gaattggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 120 cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 180 gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 240 ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 300 acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 360 tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 420 ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 480 gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 540 cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 600 cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 660 cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 720 ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 780 ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 840 cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 900 gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 960 aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1020 ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1080 ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1140 ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1200 tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaggaattt 1260 cgacccggat ccggccacca tggcgcgtaa ggtcgatctc acctcctgcg atcgcgagcc 1320 gatccacatc cccggcagca ttcagccgtg cggctgcctg ctagcctgcg acgcgcaggc 1380 ggtgcggatc acgcgcatta cggaaaatgc cggcgcgttc tttggacgcg aaactccgcg 1440 ggtcggtgag ctactcgccg attacttcgg cgagaccgaa gcccatgcgc tgcgcaacgc 1500 actggcgcag tcctccgatc caaagcgacc ggcgctgatc ttcggttggc gcgacggcct 1560 gaccggccgc accttcgaca tctcactgca tcgccatgac ggtacatcga tcatcgagtt 1620 cgagcctgcg gcggccgaac aggccgacaa tccgctgcgg ctgacgcggc agatcatcgc 1680 gcgcaccaaa gaactgaagt cgctcgaaga gatggccgca cgggtgccgc gctatctgca 1740 ggcgatgctc ggctatcacc gcgtgatgtt gtaccgcttc gcggacgacg gctccgggat 1800 ggtgatcggc gaggcgaagc gcagcgacct cgagagcttt ctcggtcagc actttccggc 1860 gtcgctggtc ccgcagcagg cgcggctact gtacttgaag aacgcgatcc gcgtggtctc 1920 ggattcgcgc ggcatcagca gccggatcgt gcccgagcac gacgcctccg gcgccgcgct 1980 cgatctgtcg ttcgcgcacc tgcgcagcat ctcgccctgc catctcgaat ttctgcggaa 2040 catgggcgtc agcgcctcga tgtcgctgtc gatcatcatt gacggcacgc tatggggatt 2100 gatcatctgt catcattacg agccgcgtgc cgtgccgatg gcgcagcgcg tcgcggccga 2160 aatgttcgcc gacttcttat cgctgcactt caccgccgcc caccaccaac gctaagcggc 2220 cgcgactcta accggtctca gaagccatag agcccaccgc atccccagca tgcctgctat 2280 tgtcttccca atcctccccc ttgctgtcct gccccacccc accccccaga atagaatgac 2340 acctactcag acaatgcgat gcaatttcct cattttatta ggaaaggaca gtgggagtgg 2400 caccttccag ggtcaaggaa ggcacggggg aggggcaaac aacagatggc tggcaactag 2460 aaggcacagt cgaggctgat cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 2520 ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg 2580 ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg agcgcgcgta 2640 atacgactca ctatagggcg aattgggtac cgggccaatt cgaacgctga cgtcatcaac 2700 ccgctccaag gaatcgcggg cccagtgtca ctaggcggga acacccagcg cgcgtgcgcc 2760 ctggcaggaa gatggctgtg agggacaggg gagtggcgcc ctgcaatatt tgcatgtcgc 2820 tatgtgttct gggaaatcac cataaacgtg aaatgtcttt ggatttggga atcttataag 2880 ttctgtatga ggaccacaga tccccagaag agccggcgct cttcagtttt agagctagaa 2940 atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 3000 ctttttttac gcgttgacat tgattattga ctagttatta atagtaatca attacggggt 3060 cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 3120 ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 3180 taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 3240 acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 3300 gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 3360 agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 3420 atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 3480 atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 3540 ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc 3600 tctggctaac tagagaaccc actgcttact ggcttatcgg ccaccatggc accgaagaag 3660 aagcgtaaag tcggaatcca cggagttcct gcggcaatgg acaagaagta ctccattggg 3720 ctcgatatcg gcacaaacag cgtcggttgg gccgtcatta cggacgagta caaggtgccg 3780 agcaaaaaat tcaaagttct gggcaatacc gatcgccaca gcataaagaa gaacctcatt 3840 ggcgccctcc tgttcgactc cggggagacg gccgaagcca cgcggctcaa aagaacagca 3900 cggcgcagat atacccgcag aaagaatcgg atctgctacc tgcaggagat ctttagtaat 3960 gagatggcta aggtggatga ctctttcttc cataggctgg aggagtcctt tttggtggag 4020 gaggataaaa agcacgagcg ccacccaatc tttggcaata tcgtggacga ggtggcgtac 4080 catgaaaagt acccaaccat atatcatctg aggaagaagc ttgtagacag tactgataag 4140 gctgacttgc ggttgatcta tctcgcgctg gcgcatatga tcaaatttcg gggacacttc 4200 ctcatcgagg gggacctgaa cccagacaac agcgatgtcg acaaactctt tatccaactg 4260 gttcagactt acaatcagct tttcgaagag aacccgatca acgcatccgg agttgacgcc 4320 aaagcaatcc tgagcgctag gctgtccaaa tcccggcggc tcgaaaacct catcgcacag 4380 ctccctgggg agaagaagaa cggcctgttt ggtaatctta tcgccctgtc actcgggctg 4440 acccccaact ttaaatctaa cttcgacctg gccgaagatg ccaagcttca actgagcaaa 4500 gacacctacg atgatgatct cgacaatctg ctggcccaga tcggcgacca gtacgcagac 4560 ctttttttgg cggcaaagaa cctgtcagac gccattctgc tgagtgatat tctgcgagtg 4620 aacacggaga tcaccaaagc tccgctgagc gctagtatga tcaagcgcta tgatgagcac 4680 caccaagact tgactttgct gaaggccctt gtcagacagc aactgcctga gaagtacaag 4740 gaaattttct tcgatcagtc taaaaatggc tacgccggat acattgacgg cggagcaagc 4800 caggaggaat tttacaaatt tattaagccc atcttggaaa aaatggacgg caccgaggag 4860 ctgctggtaa agcttaacag agaagatctg ttgcgcaaac agcgcacttt cgacaatgga 4920 agcatccccc accagattca cctgggcgaa ctgcacgcta tcctcaggcg gcaagaggat 4980 ttctacccct ttttgaaaga taacagggaa aagattgaga aaatcctcac atttcggata 5040 ccctactatg taggccccct cgcccgggga aattccagat tcgcgtggat gactcgcaaa 5100 tcagaagaga ccatcactcc ctggaacttc gaggaagtcg tggataaggg ggcctctgcc 5160 cagtccttca tcgaaaggat gactaacttt gataaaaatc tgcctaacga aaaggtgctt 5220 cctaaacact ctctgctgta cgagtacttc acagtttata acgagctcac caaggtcaaa 5280 tacgtcacag aagggatgag aaagccagca ttcctgtctg gagagcagaa gaaagctatc 5340 gtggacctcc tcttcaagac gaaccggaaa gttaccgtga aacagctcaa agaagactat 5400 ttcaaaaaga ttgaatgttt cgactctgtt gaaatcagcg gagtggagga tcgcttcaac 5460 gcatccctgg gaacgtatca cgatctcctg aaaatcatta aagacaagga cttcctggac 5520 aatgaggaga acgaggacat tcttgaggac attgtcctca cccttacgtt gtttgaagat 5580 agggagatga ttgaagaacg cttgaaaact tacgctcatc tcttcgacga caaagtcatg 5640 aaacagctca agaggcgccg atatacagga tgggggcggc tgtcaagaaa actgatcaat 5700 gggatccgag acaagcagag tggaaagaca atcctggatt ttcttaagtc cgatggattt 5760 gccaaccgga acttcatgca gttgatccat gatgactctc tcacctttaa ggaggacatc 5820 cagaaagcac aagtttctgg ccagggggac agtcttcacg agcacatcgc taatcttgca 5880 ggtagcccag ctatcaaaaa gggaatactg cagaccgtta aggtcgtgga tgaactcgtc 5940 aaagtaatgg gaaggcataa gcccgagaat atcgttatcg agatggcccg agagaaccaa 6000 actacccaga agggacagaa gaacagtagg gaaaggatga agaggattga agagggtata 6060 aaagaactgg ggtcccaaat ccttaaggaa cacccagttg aaaacaccca gcttcagaat 6120 gagaagctct acctgtacta cctgcagaac ggcagggaca tgtacgtgga tcaggaactg 6180 gacatcaatc ggctctccga ctacgacgtg gatcatatcg tgccccagtc ttttctcaaa 6240 gatgattcta ttgataataa agtgttgaca agatccgata aaaatagagg gaagagtgat 6300 aacgtcccct cagaagaagt tgtcaagaaa atgaaaaatt attggcggca gctgctgaac 6360 gccaaactga tcacacaacg gaagttcgat aatctgacta aggctgaacg aggtggcctg 6420 tctgagttgg ataaagccgg cttcatcaaa aggcagcttg ttgagacacg ccagatcacc 6480 aagcacgtgg cccaaattct cgattcacgc atgaacacca agtacgatga aaatgacaaa 6540 ctgattcgag aggtgaaagt tattactctg aagtctaagc tggtctcaga tttcagaaag 6600 gactttcagt tttataaggt gagagagatc aacaattacc accatgcgca tgatgcctac 6660 ctgaatgcag tggtaggcac tgcacttatc aaaaaatatc ccaagcttga atctgaattt 6720 gtttacggag actataaagt gtacgatgtt aggaaaatga tcgcaaagtc tgagcaggaa 6780 ataggcaagg ccaccgctaa gtacttcttt tacagcaata ttatgaattt tttcaagacc 6840 gagattacac tggccaatgg agagattcgg aagcgaccac ttatcgaaac aaacggagaa 6900 acaggagaaa tcgtgtggga caagggtagg gatttcgcga cagtccggaa ggtcctgtcc 6960 atgccgcagg tgaacatcgt taaaaagacc gaagtacaga ccggaggctt ctccaaggaa 7020 agtatcctcc cgaaaaggaa cagcgacaag ctgatcgcac gcaaaaaaga ttgggacccc 7080 aagaaatacg gcggattcga ttctcctaca gtcgcttaca gtgtactggt tgtggccaaa 7140 gtggagaaag ggaagtctaa aaaactcaaa agcgtcaagg aactgctggg catcacaatc 7200 atggagcgat caagcttcga aaaaaacccc atcgactttc tcgaggcgaa aggatataaa 7260 gaggtcaaaa aagacctcat cattaagctt cccaagtact ctctctttga gcttgaaaac 7320 ggccggaaac gaatgctcgc tagtgcgggc gagctgcaga aaggtaacga gctggcactg 7380 ccctctaaat acgttaattt cttgtatctg gccagccact atgaaaagct caaagggtct 7440 cccgaagata atgagcagaa gcagctgttc gtggaacaac acaaacacta ccttgatgag 7500 atcatcgagc aaataagcga attctccaaa agagtgatcc tcgccgacgc taacctcgat 7560 aaggtgcttt ctgcttacaa taagcacagg gataagccca tcagggagca ggcagaaaac 7620 attatccact tgtttactct gaccaacttg ggcgcgcctg cagccttcaa gtacttcgac 7680 accaccatag acagaaagcg gtacacctct acaaaggagg tcctggacgc cacactgatt 7740 catcagtcaa ttacggggct ctatgaaaca agaatcgacc tctctcagct cggtggagac 7800 agcagggctg accccaagaa gaagaggaag gtgtagcttc gcccacccca acttgtttat 7860 tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 7920 tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt agcggccgcc 7980 accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gccagcaaaa 8040 ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8100 cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8160 ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8220 taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8280 ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8340 ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8400 aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8460 tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8520 agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8580 ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8640 tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 8700 tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 8760 cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 8820 aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 8880 atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 8940 cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9000 tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9060 atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9120 taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9180 tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9240 gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9300 cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9360 cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9420 gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9480 aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9540 accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9600 ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9660 gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 9720 aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 9780 taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctaaat tgtaagcgtt 9840 aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 9900 gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 9960 gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 10020 aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 10080 gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 10120 <210> 45 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> eGFP switch target <400> 45 taccggccca gttggaatgt aggtggtg 28 <210> 46 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> eGFP switch target <400> 46 taccggccca gttggaatgt agatggtg 28 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer <400> 47 ttctgcttgt cggccatgat 20 <210> 48 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer <400> 48 aggcaaggct tgaccgacaa tt 22

Claims

세포의 이중 가닥 DNA의 표적 부위(targeted site)를 변형시키기 위한 방법으로서, 표적 부위 내의 상기 이중 가닥 DNA 중 적어도 하나의 가닥의 절단 없이, 표적 부위를 삽입 서열로 치환하거나, 삽입 서열을 상기 표적 부위 내로 삽입하기 위해, 이중 가닥 DNA 내의 선택된 표적 뉴클레오타이드 서열에 특이적으로 결합하는 핵산 서열 인식 모듈(nucleic acid sequence-recognizing module) 및 핵산 염기 전환 효소 또는 DNA 글리코실라제가 연결된 복합체, 및 삽입 서열을 포함하는 공여체 DNA를 상기 이중 가닥 DNA와 접촉시키는 단계를 포함하고, 상기 세포가 원핵 세포 또는 인간 세포를 제외한 진핵 세포인, 방법.
시험관 내에서, 단리된 인간 세포의 이중 가닥 DNA의 표적 부위(targeted site)를 변형시키기 위한 방법으로서, 표적 부위 내의 상기 이중 가닥 DNA 중 적어도 하나의 가닥의 절단 없이, 표적 부위를 삽입 서열로 치환하거나, 삽입 서열을 상기 표적 부위 내로 삽입하기 위해, 이중 가닥 DNA 내의 선택된 표적 뉴클레오타이드 서열에 특이적으로 결합하는 핵산 서열 인식 모듈(nucleic acid sequence-recognizing module) 및 핵산 염기 전환 효소 또는 DNA 글리코실라제가 연결된 복합체, 및 삽입 서열을 포함하는 공여체 DNA를 상기 이중 가닥 DNA와 접촉시키는 단계를 포함하는 방법.
제1항 또는 제2항에 있어서, 공여체 DNA는 표적 부위에 인접한 영역에 상동인(homologous) 서열을 포함하는, 방법.
제1항 또는 제2항에 있어서, 핵산 서열 인식 모듈은 Cas 효과기 단백질의 적어도 하나의 DNA 절단 능력이 불활성화된 CRISPR-Cas 시스템, 아연 핑거 모티프(zinc finger motif), TAL 효과기 및 PPR 모티프로 이루어진 군으로부터 선택되는, 방법.
제1항 또는 제2항에 있어서, 핵산 서열 인식 모듈은 Cas 효과기 단백질의 2개의 DNA 절단 능력 중 단지 하나만이 불활성화된 CRISPR-Cas 시스템인, 방법.
제1항 또는 제2항에 있어서, 핵산 서열 인식 모듈은 Cas 효과기 단백질의 DNA 절단 능력 둘 모두가 불활성화된 CRISPR-Cas 시스템인, 방법.
제1항 또는 제2항에 있어서, 핵산 염기 전환 효소는 탈아미노효소(deaminase)인, 방법.
제7항에 있어서, 탈아미노효소는 시티딘(cytidine) 탈아미노효소인, 방법.
제8항에 있어서, 시티딘 탈아미노효소는 PmCDA1인, 방법.
제1항 또는 제2항에 있어서, 이중 가닥 DNA는 복합체를 인코딩(encoding)하는 핵산을 세포 내에 도입시킴으로써, 복합체와 접촉되는 것인, 방법.
제1항에 있어서, 세포는 미생물 세포인, 방법.
제1항에 있어서, 세포는 식물 세포, 곤충 세포 또는 비-인간 동물 세포인, 방법.
제12항에 있어서, 동물 세포는 척추동물 세포인, 방법.
제13항에 있어서, 척추동물 세포는 포유류 세포인, 방법.