KR20180069832A

KR20180069832A - 유도 cas 시스템을 통한 비기능성 유전자 산물에 대한 기능 회복 및 이용 방법

Info

Publication number: KR20180069832A
Application number: KR1020187012259A
Authority: KR
Inventors: 앤드류 마크 시간; 세르게이 스비타세브
Original assignee: 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드
Priority date: 2015-10-20
Filing date: 2016-10-17
Publication date: 2018-06-25
Also published as: AU2016341041A1; CA2996329A1; EP3365440A1; ZA201801578B; MX2018004809A; JP2018531024A; CN108138156A; ZA201801576B; EP3365439A1; BR112018008109A2; WO2017070032A1; JP2021151275A; US20180327785A1; CN108138155A; BR112018008134A2; AU2016341044B2; KR20180059535A; EP3365440B1; MX2018004808A; AU2016341044A1

Abstract

세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하기 위한 조성물 및 방법이 제공된다. 상기 방법 및 조성물은 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 이용하여 비기능성 유전자 산물에 대한 기능을 복원하고, 식물, 식물 세포 또는 종자의 게놈 내 표적 부위를 변형하거나 변경하기 위한 효과적인 시스템을 제공한다. 본 발명은 또한, 복원된 기능성 선택 마커를 이용하여 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법뿐만 아니라, 세포에 폴리뉴클레오티드 변형 주형을 도입하지 않고 상기 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법을 기술한다. Cas 엔도뉴클레아제, sgRNA 및 가이드 RNA/Cas 복합체를 DNA 없이 전달하기 위한 조성물 및 방법이 또한 제공된다.

Description

유도 CAS 시스템을 통한 비기능성 유전자 산물에 대한 기능 회복 및 이용 방법

본 출원은 2015년 10월 20일 출원된 미국 가출원 62/243719호, 2016년 3월 16일 출원된 미국 가출원 62/309033호 및 2016년 7월 7일 출원된 미국 가출원 62/359254호의 이익을 주장하며, 이들은 그 전체가 본원에 참조로 포함된다.

기술분야

본 발명은 분자 생물학 분야에 관한 것으로서, 특히 세포의 게놈을 변경하는 방법에 관한 것이다.

전자적으로 제출된 서열 목록에 대한 참조

본 서열 목록의 공식 사본은 2016년 10월 11일 작성되고 크기가 185 킬로바이트이며 본 명세서와 동시에 제출된 파일명 20161011_BB2533PCT_SeqLst.txt의 ASCII 형식의 서열 목록으로서 EFS-웹을 통해 전자적으로 제출되었다. 이러한 ASCII 형식의 서류에 포함된 서열 목록은 본 명세서의 일부이며, 그 전체가 본원에 참조로 포함된다.

재조합 DNA 기술은 표적화된 게놈 위치에서의 DNA 서열 삽입 및/또는 특정 내인성 염색체 서열의 변형(편집)을 가능하게 함으로써 생물의 표현형을 변화시킬 수 있었다. 부위 특이적 재조합 시스템을 이용한 부위 특이적 통합 기술뿐만 아니라 다른 방식의 재조합 기술이 다양한 생물에서 관심 유전자의 표적화된 삽입을 생성하는 데 이용되어 왔다. 게놈 편집 기술, 예컨대, 디자이너 징크 핑거 뉴클레아제(ZFN) 또는 전사 활성물질 유사 이펙터 뉴클레아제(TALEN), 또는 호밍 메가뉴클레아제가 표적화된 게놈 섭동을 생성하는 데 이용 가능하지만, 이들 시스템은 특이성이 낮고 각각의 표적 부위에 대해 재설계되어야 하는 설계된 뉴클레아제를 사용하는 경향이 있어, 제조에 많은 비용과 시간이 소요된다.

생물의 게놈에서 변형을 위한 특정 부위를 표적화 하기 위해 여러 접근법이 개발되었지만, 저렴하고, 설정이 용이하고, 확장 가능하며, 생물의 게놈 내 여러 위치를 표적화할 수 있는 새로운 게놈 조작 기술이 여전히 필요하다.

세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하기 위한 조성물 및 방법이 제공된다. 상기 방법 및 조성물은 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 이용하여 비기능성 유전자 산물에 대한 기능을 복원하고, 식물, 식물 세포 또는 종자의 게놈 내 표적 부위를 변형하거나 변경하기 위한 효과적인 시스템을 제공한다. 본 발명은 또한, 복원된 기능성 선택 마커를 이용하여 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법뿐만 아니라, 세포에 폴리뉴클레오티드 변형 주형을 도입하지 않고 상기 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법을 기술한다. mRNA 분자(가이드 RNA, Cas 엔도뉴클레아제) 또는 단백질 분자(Cas 엔도뉴클레아제)를 통해 복합체의 성분을 도입하거나, 가이드 RNA/Cas 리보뉴클레오티드-단백질 복합체(RGEN) 자체를 직접 도입함으로써, Cas 엔도뉴클레아제, 가이드 RNA 및 가이드 RNA/Cas 복합체를 DNA 없이 세포 내에 전달하기 위한 조성물 및 방법이 또한 제공된다.

본 발명의 일 구현예에서, 상기 방법은 세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하는 방법으로서, 게놈 내 파괴된 유전자를 포함하는 세포에 가이드 RNA/Cas 엔도뉴클레아제 복합체를 도입하는 단계를 포함하되, 상기 복합체는 이중 가닥 절단을 생성하고, 상기 파괴된 유전자는 기능성 유전자 산물을 암호화하지 않고, 상기 파괴된 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 상기 기능성 유전자 산물을 암호화할 수 있는 비파괴 유전자로 복원되는 방법을 포함한다. 파괴된 유전자는 해당 비파괴 유전자와 비교할 때 PAM 서열의 상류(5') 네 번째 뉴클레오티드의 염기쌍 결실을 포함하고, 상기 염기쌍 결실은 파괴된 유전자의 유전자 산물에서 아미노산 프레임이동을 생성함으로써, 파괴된 유전자의 유전자 산물을 비기능적 상태로 만든다. 염기쌍 결실은 코돈 서열의 제1, 제2 또는 제3 뉴클레오티드에 위치할 수 있다. 복원은 이중 가닥 절단 부위에 단일 염기를 삽입시키는 비상동 말단 연결(NHEJ)에 의해 달성될 수 있거나, 상동 재조합 또는 상동성 유도 복구를 이용하지 않고 이중 가닥 절단 부위에 단일 염기를 삽입하여 달성될 수 있다.

본 발명의 일 구현예에서, 상기 방법은 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서, 표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 마커 단백질에 의해 선택하는 단계를 포함하는 방법을 포함한다. 도입 및 선택 단계는 선택 마커 유전자를 포함하는 재조합 DNA 작제물과 같은 선택 마커 유전자의 도입을 포함하지 않는다. 파괴된 선택 마커 유전자는 파괴된 시각적 마커 유전자를 비롯한 임의의 파괴된 마커 유전자일 수 있다. 표적 뉴클레오티드 서열의 변형은 상기 표적 부위에서의 적어도 하나의 뉴클레오티드의 삽입, 적어도 하나의 뉴클레오티드의 결실, 또는 적어도 하나의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택될 수 있다. 상기 방법은 상기 세포에 폴리뉴클레오티드 변형 주형 또는 공여 DNA를 도입하는 단계를 더 포함할 수 있으며, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하고, 상기 공여 DNA는 상기 표적 부위에 삽입될 적어도 하나의 관심 폴리뉴클레오티드를 포함한다.

본 발명의 일 구현예에서, 상기 방법은 폴리뉴클레오티드 변형 주형을 사용하지 않고 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법으로서, a) 적어도 하나의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있는 단계; b) 상기 뉴클레오티드 서열에 적어도 하나의 단일 뉴클레오티드 결실을 포함하는 세포를 (a)로부터 선택하되, 상기 뉴클레오티드 결실은 편집될 위치에 위치하는 단계; 및 c) (b)의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있고, 폴리뉴클레오티드 변형 주형을 사용하지 않고 (b)의 뉴클레오티드 결실과 동일한 위치에 단일 뉴클레오티드를 삽입할 수 있는 단계를 포함하는 방법을 포함한다.

본 발명의 일 구현예에서, 상기 방법은 폴리뉴클레오티드 변형 주형 또는 공여 DNA를 사용하지 않고 식물의 게놈 내 뉴클레오티드 서열을 편집하는 방법으로서, a) 적어도 하나의 식물 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있는 단계; b) 상기 뉴클레오티드 서열에 적어도 하나의 단일 뉴클레오티드 결실을 포함하는 식물 세포를 (a)로부터 선택하되, 상기 뉴클레오티드 결실은 편집될 위치에 위치하는 단계; c) (b)의 식물 세포로부터 식물을 재생시키는 단계; d) (c)의 식물로부터의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있고, 폴리뉴클레오티드 변형 주형을 사용하지 않고 (b)의 뉴클레오티드 결실과 동일한 위치에 단일 뉴클레오티드를 삽입할 수 있는 복합체를 형성할 수 있는 단계; 및 e) 최적으로는, (d)의 뉴클레오티드 삽입을 포함하는 세포를 선택하는 단계를 포함하는 방법을 포함한다.

가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 Cas 엔도뉴클레아제 단백질은 각각 RNA 및 단백질로서 직접 세포에 도입되거나, 리보뉴클레오티드-단백질 복합체로서 세포에 도입될 수 있다. 가이드 RNA/Cas 엔도뉴클레아제 복합체의 성분은 Cas 엔도뉴클레아제 단백질을 암호화하는 mRNA 분자로서, 그리고 가이드 RNA를 포함하는 RNA로서 도입되거나, 가이드 RNA 및 Cas 엔도뉴클레아제 단백질을 암호화하는 재조합 DNA 분자로서 도입될 수 있다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 DNA 프리 방법으로서, 적어도 하나의 가이드 RNA 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하는 단계 및 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 상기 세포에 도입하는 단계를 포함하는 방법을 포함한다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 성분을 세포 내에 전달하는 DNA 프리 방법으로서, 적어도 하나의 가이드 RNA 분자 및 적어도 하나의 Cas 엔도뉴클레아제 단백질을 세포에 도입하는 단계, 및 상기 가이드 RNA 및 상기 Cas 엔도뉴클레아제 단백질이 상기 세포 내에 복합체를 형성할 수 있도록 적절한 조건 하에서 상기 세포를 성장시키는 단계를 포함하는 방법을 포함한다.

DNA 프리 방법은 폴리뉴클레오티드 주형을 도입하는 단계를 더 포함할 수 있고, 상기 폴리뉴클레오티드 변형 주형은 상기 세포의 게놈 내 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하며, 상기 폴리뉴클레오티드 변형 주형의 상기 적어도 하나의 뉴클레오티드 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다. DNA 프리 방법은 또한 공여 DNA를 도입하는 단계를 더 포함할 수 있고, 상기 공여 DNA는 적어도 하나의 관심 폴리뉴클레오티드를 포함한다. 세포 내로의 도입은 입자 매개 전달, 휘스커 매개 전달, 세포 침투성 펩티드 매개 전달, 전기천공, PEP 매개 형질감염 및 나노입자 매개 전달로 이루어진 군으로부터 선택되는 전달 시스템을 통해 이루어질 수 있다.

세포는 인간, 비인간, 동물, 고세균, 박테리아, 진균, 곤충, 효모, 비통상적 효모, 및 식물 세포를 포함한다.

또한, 본원에 기술된 방법에 의해 제조된 핵산 작제물, 세포, 식물, 자손 식물, 미생물, 외식편, 종자 및 곡물이 제공된다. 본 발명의 방법 및 조성물의 추가적인 구현예가 본원에 제시된다.

도면의 간단한 설명 및 서열 목록
본 발명은 본 출원의 일부를 구성하는 첨부 도면 및 서열 목록 및 다음의 상세한 설명으로부터 더욱 완전하게 이해될 수 있다. 본원에 첨부된 서열 설명 및 서열 목록은 37 C.F.R. §§1.821-1.825에 명시된 바와 같이 특허 출원에서 뉴클레오티드 및 아미노산 서열 공개를 규율하는 규칙을 따른다. 서열 설명은 본원에 참조로 포함되는 37 C.F.R. §§ 1.821-1.825에 정의된 아미노산에 대한 세 문자의 코드를 포함한다.
도면
도 1은 본원에 기술된 옥수수 최적화된 가이드 RNA/Cas 엔도뉴클레아제 시스템에 의해 유도된 상위 10개의 가장 빈번한 NHEJ 돌연변이의 배열 및 개수를 나타낸다. 돌연변이는 심층 시퀀싱에 의해 동정되었다. 기준 서열(SEQ ID NO: 48)은 변형되지 않은 유전자좌를 각각의 표적 부위를 볼드체로 표시하여 나타낸다. PAM 서열(회색) 및 예상 절단 부위(화살표)도 표시되어 있다. 불완전한 NHEJ 결과로 인한 결실 또는 삽입은 "-" 또는 밑줄 친 이탤릭체 뉴클레오티드로 각각 표시된다. 기준 및 표적 부위의 돌연변이 1 내지 10은 각각 SEQ ID NO: 49 내지 58에 해당한다. 옥수수에서, 대부분의 표적 부위의 경우, Cas9-gRNA 시스템에 의해 생성된 가장 일반적인 유형의 돌연변이는 단일 뉴클레오티드 삽입(60% 이상)(개수는 16,861로 표시됨)이다.
도 2는 ALS2 유전자 및 2개의 편집 복구 주형(Oligo1 및 Oligo2)의 부분적 뉴클레오티드 서열(SEQ ID NO: 59, 61, 63) 및 부분적 아미노산 서열(SEQ ID NO: 60, 62, 64)을 나타내며; 변형된 뉴클레오티드는 밑줄 처리되어 있고 (Pro에서 Ser로의) 유전자 편집 대상 코돈 서열은 박스 처리되어 있다.
도 3은 클로르설푸론에 대한 저항성을 위해 편집된 ALS2 대립 유전자를 갖는 옥수수 식물(좌) 및 야생형 식물(우)을 나타낸다. 4주령의 식물에 클로르설푸론(100 mg/L)을 살포했다. 처치 3주 후의 식물이 표시된다.
도 4a 내지 4c는 변형을 위해 선택된 ALS2 유전자(SEQ ID NO: 65, 67, 69) 단편의 개략도 및 선택 마커로서 ALS2의 사용을 나타낸다. 암호화된 아미노산 서열은 각각의 뉴클레오티드 서열 아래에 표시되어 있다(SEQ ID NO: 66, 68). 도 4a: 위치 165의 단일 뉴클레오티드 (G)(밑줄 친 볼드체)는 클로르설푸론 저항성을 위해 편집된 ALS2 유전자의 특정 녹아웃 버전을 생성하기 위해 제거될 수 있다. 도 4b는 단일 뉴클레오티드 결실(G 제거)로 인해 번역 프레임이 이동되고 ALS2 유전자가 녹아웃된 새로운 뉴클레오티드 서열을 나타낸다. 도 4c: ALS2 유전자 기능 및 클로르설푸론 저항성은 NHEJ 경로를 통한 DSB 복구 과정 중에 단일 뉴클레오티드(N, 밑줄 친 볼드체)의 삽입을 통해 복원된다.
도 5a 내지 5b. 불활성화된 ALS2P 165S의 선택 마커로서의 재활성화. 도 5a(SEQ ID NO: 70). PAM의 5' 3개의 뉴클레오티드에 위치한 상류의 아웃 오브 프레임 번역 개시 코돈을 함유하는 ALS 2P165S 유전자의 설계. 첫 AUG에서의 번역의 개시(서열 아래에 화살표로 표시)는 ALS2의 번역 개시 코돈의 개시를 방지하는 4개 아미노산의 폴리펩티드를 암호화한다(회색 문자). 도 5b(SEQ ID NO: 71). 상류 AUG의 손실을 초래하는 단일 뉴클레오티드 삽입(C, A 또는 T) 또는 결실(또는 임의의 조합)은 ALS2의 개시 코돈에서의 번역의 개시(서열 아래에 화살표로 표시)를 가능하게 하여 전체 길이의 ALS2P165S 제초제 저항성 유전자의 번역을 복원한다.
도 6a 내지 6c는 변형을 위해 선택된 내인성 표적 부위를 포함하는 관심 폴리뉴클레오티드(SEQ ID NO: 72) 단편의 개략도를 나타낸다. 암호화된 아미노산 서열은 각각의 뉴클레오티드 서열 아래에 표시되어 있다(SEQ ID NO: 73, 75, 77). 도 6a는 엔도뉴클레아제 절단 부위(화살표로 표시) 다음에 위치한 단일 뉴클레오티드(이 예에서는 밑줄 친 볼드체로 표시한 C)가 NHEJ를 통해 제거될 수 있음을 나타낸다. 도 6b는 단일 염기가 결실됨으로 인해 새로운 절단 부위가 생성되고(화살표로 표시) 번역 프레임이 이동된 결과적인 관심 폴리뉴클레오티드(SEQ ID NO: 74)를 나타낸다. 도 4c: 엔도뉴클레아제 절단 부위 다음에 위치한 단일 뉴클레오티드(이 예에서는 밑줄 친 볼드체로 표시한 T)는 폴리뉴클레오티드 변형(복구) 주형을 사용하지 않고 NHEJ를 통해 삽입되어, 관심 폴리뉴클레오티드(SEQ ID NO: 76)의 단일 뉴클레오티드 편집 결과를 가져올 수 있다. PAM 서열은 회색으로 강조 표시되어 있다.
도 7. 위: UBI:Cas9을 옥수수 게놈 내에 안정적으로 통합하기 위한 아그로박테리움 벡터. 아래: MDH:Cas9을 옥수수 게놈 내에 안정적으로 통합하기 위한 아그로박테리움 벡터. MDH는 Cas9의 발현을 조절하는 온도 조절된 프로모터이다. 이들 벡터는 또한 시각적 마커 유전자(END2:AmCYAN)를 포함하며, 이는 안정적으로 형질전환된 캘러스 섹터의 선택에 사용되었다. 포함된 적색 형광 단백질(DsRED)의 서열은 343-bp 스페이서에 의해 분리된 정방향 369 bp 단편에 복제되었고, 이는 2개의 gRNA 및 LIG3:4 메가뉴클레아제에 의한 인식 및 표적화를 위한 서열을 포함하였다. H2B는 히스톤 H2B 유전자 프로모터를 지칭한다.

서열

핵산 및 단백질 서열 번호의 요약

설명	핵산 SEQ ID NO.	단백질 SEQ ID NO.
Cas9 코딩 서열	1
감자 ST-LS1 인트론	2
SV40 NLS		3
VirD2 NLS	4
옥수수 최적화된 Cas9 발현 카세트	5
Lig-CR3 가이드 RNA 발현 벡터	6
옥수수 게놈 표적 부위 MS26Cas-1 및 PAM 서열	7
옥수수 게놈 표적 부위 MS26Cas-2 및 PAM 서열	8
옥수수 게놈 표적 부위 MS26Cas-3 및 PAM 서열	9
옥수수 게놈 표적 부위 LIGCas-1 및 PAM 서열	10
옥수수 게놈 표적 부위 LIGCas-2 및 PAM 서열	11
옥수수 게놈 표적 부위 LIGCas-3 및 PAM 서열	12
옥수수 게놈 표적 부위 MS45Cas-1 및 PAM 서열	13
옥수수 게놈 표적 부위 MS45Cas-2 및 PAM 서열	14
옥수수 게놈 표적 부위 MS45Cas-3 및 PAM 서열	15
옥수수 게놈 표적 부위 ALSCas-1 및 PAM 서열	16
옥수수 게놈 표적 부위 ALSCas-2 및 PAM 서열	17
옥수수 게놈 표적 부위 ALSCas-3 및 PAM 서열	18
프라이머 서열	19~38
ALS1-DNA 서열	39
ALS2-DNA 서열	40
전체 길이 Zm-ALS2 단백질		41
옥수수 게놈 표적 부위 ALSCas-4 및 PAM 서열	42
794 bp 폴리뉴클레오티드 변형 주형	43
127 bp 폴리뉴클레오티드 변형 주형, oligo1	44
127 bp 폴리뉴클레오티드 변형 주형, oligo2	45
옥수수 코돈 최적화된 Cas9 및 옥수수 UBI 프로모터를 포함하는 아그로박테리움 벡터	46
옥수수 코돈 최적화된 Cas9 및 옥수수 MDH 프로모터를 포함하는 아그로박테리움 벡터	47
도 1에 표시된 서열	48~58
도 2에 표시된 서열	59, 61, 63	60, 62, 64
도 4a 내지 4c에 표시된 서열	65, 67, 69	66,68
도 5a 내지 5b에 표시된 서열	70~71
도 6a 내지 6c에 표시된 서열	72, 74, 76	73, 75,77
IN2 프로모터	78
ALSCas7 표적 부위	79
변형된 ALSCas7 표적 부위인 ALSCas7-1 표적 부위	80
옥수수 표적 이탈 부위	81

세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하기 위한 조성물 및 방법이 제공된다. 상기 방법 및 조성물은 가이드 RNA/Cas 엔도뉴클레아제 시스템을 이용하여 비기능성 유전자 산물에 대한 기능을 복원하고, 식물, 식물 세포 또는 종자의 게놈 내 표적 부위를 변형하거나 변경하기 위한 효과적인 시스템을 제공한다. 본 발명은 또한, 복원된 기능성 선택 마커를 이용하여 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법뿐만 아니라, 세포에 폴리뉴클레오티드 변형 주형을 도입하지 않고 상기 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법을 기술한다. mRNA 분자(가이드 RNA, Cas 엔도뉴클레아제) 또는 단백질 분자(Cas 엔도뉴클레아제)를 통해 복합체의 성분(가이드 RNA 및 Cas 엔도뉴클레아제)을 도입하거나, 가이드 RNA/Cas 리보뉴클레오티드-단백질 복합체(RGEN) 자체를 직접 도입함으로써, 뉴클레오티드-단백질 복합체를 직접 도입함으로써, Cas9 엔도뉴클레아제, sgRNA 및 가이드 RNA/Cas 복합체를 DNA 없이 세포 내에 전달하기 위한 조성물 및 방법이 또한 제공된다.

CRISPR 유전자좌(규칙적으로 사이 간격을 두고 분포하는 짧은 회문구조 반복 서열)(SPIDR(SPacer Interspersed Direct Repeat)로도 알려짐)는 DNA 유전자좌의 군을 구성한다. CRISPR 유전자좌는 부분적으로 회문구조인 짧고 고도로 보존된 DNA 반복 서열(일반적으로 24 내지 40 bp, 1~140회 반복됨, CRISPR 반복 서열이라고도 함)로 구성된다. (일반적으로 종에 특이적인) 반복된 서열이 일정한 길이(CRISPR 유전자좌에 따라 일반적으로 20 내지 58)의 가변 서열을 사이에 두고 분포된다(2007년 3월 1일 공개된 WO2007/025097). 박테리아 및 고세균은, 짧은 RNA를 이용하여 외래 핵산의 분해를 유도하는, 규칙적으로 사이 간격을 두고 분포하는 짧은 회문구조 반복 서열(CRISPR)/CRISPR-결합(Cas) 시스템이라고 하는 적응 면역 방어를 진화시켰다(2007년 3월 1일 공개된 WO2007/025097). 멀티서브유닛 이펙터 복합체를 가진 클래스 1 시스템, 및 단일 단백질 이펙터(예컨대, 이에 한정되는 것은 아니지만, Cas9, Cpf1, C2c1, C2c2, C2c3)를 가진 클래스 2 시스템을 포함하여 여러 CRISPR-Cas 시스템이 기술되었다(Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15, 2013년 11월 23일 공개되고 그 전체가 본원에 참조로 포함되는 WO 2013/176772 A1).

박테리아로부터의 II형 CRISPR/Cas 시스템은 crRNA(CRISPR RNA) 및 tracrRNA(트랜스-활성화 CRISPR RNA)를 사용하여 Cas 엔도뉴클레아제를 DNA 표적으로 유도한다. crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보적인 스페이서 영역 및 Cas 엔도뉴클레아제가 DNA 표적을 절단하도록 유도하는 RNA 듀플렉스를 형성하는 tracrRNA(트랜스-활성화 CRISPR RNA)와 염기쌍을 이루는 영역을 포함한다. 스페이서는 Cas1 및 Cas2 단백질과 관련된 완전히 이해되지 않은 프로세스를 통해 획득된다. 모든 II형 CRISPR-Cas 유전자좌는 cas9 유전자 이외에 cas1 및 cas2 유전자를 포함한다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). Cas 유전자는 일반적으로 플랭킹 CRISPR 유전자좌에 커플링되거나 결합되거나 가까이 있거나, 또는 그 부근에 있는 유전자를 포함한다. 용어 "Cas 유전자", "CRISPR-결합(Cas) 유전자"는 본원에서 상호교환적으로 사용된다. Cas 단백질 군에 대한 포괄적인 리뷰는 문헌[Haft et al. (2005) Computational Biology, PLoS Comput Biol 1(6): e60. doi:10.1371/journal.pcbi.0010060]에 제공된다. 거기에 기술된 바와 같이, 4개의 이전에 알려진 유전자 군 이외에, 41개의 CRISPR-결합(Cas) 유전자 군이 기술되어 있다. 이는 CRISPR 시스템이 상이한 반복 패턴, 유전자 세트, 및 종 범위를 갖는 상이한 클래스에 속함을 나타낸다. 주어진 CRISPR 유전자좌에서 Cas 유전자의 수는 종들 사이에 다를 수 있다(Haft et al., 2005, Computational Biology, PLoS Comput Biol 1(6): e60. doi:10.1371/journal.pcbi.0010060; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13 :1-15; 2013년 11월 23일 공개되고 그 전체가 본원에 참조로 포함되는 WO 2013/176772 A1).

본원의 용어 "Cas 엔도뉴클레아제"는 Cas(CRISPR-결합) 유전자에 의해 암호화되는 단백질을 지칭한다. Cas 엔도뉴클레아제는, 적합한 폴리뉴클레오티드 성분과의 복합체인 경우, 특정 DNA 표적 서열의 전부 또는 일부를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단할 수 있다. 본원에 기술된 Cas 엔도뉴클레아제는 하나 이상의 뉴클레아제 도메인을 포함한다. 본 발명의 Cas 엔도뉴클레아제는 HNH 또는 HNH 유사 뉴클레아제 도메인 및/또는 RuvC 또는 RuvC 유사 뉴클레아제 도메인을 갖는 것들을 포함한다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). Cas는 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas5, Cas7, Cas8, Cas10, 또는 이들의 복합체를 포함한다.

본원에 사용된 용어 "가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체", "가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템", "가이드 폴리뉴클레오티드/Cas 복합체", "가이드 폴리뉴클레오티드/Cas 시스템", "유도 Cas 시스템", "PGEN"은 본원에서 상호교환적으로 사용되고, 폴리뉴클레오티드-단백질 복합체를 형성할 수 있는 적어도 하나의 가이드 폴리뉴클레오티드 및 적어도 하나의 Cas 엔도뉴클레아제 단백질을 지칭하며, 상기 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 유도하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)할 수 있게 할 수 있다. 본원의 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 4개의 알려진 CRISPR 시스템(Horvath and Barrangou, Science 327:167-170), 예컨대, I형, II형 또는 III형 CRISPR 시스템 중 임의의 것의 적합한 폴리뉴클레오티드 성분(들) 및 Cas 단백질(들)을 포함할 수 있다. Cas 엔도뉴클레아제는 표적 서열에서 DNA 듀플렉스를 풀고, Cas 단백질과의 복합체인 폴리뉴클레오티드(예컨대, 이에 한정되는 것은 아니지만, crRNA 또는 가이드 RNA)에 의한 표적 서열의 인식에 의해 매개되는 바와 같이, 적어도 하나의 DNA 가닥을 선택적으로 절단한다. 일반적으로 Cas 엔도뉴클레아제에 의한 이러한 표적 서열의 인식 및 절단은 정확한 프로토스페이서-인접 모티프(PAM)가 DNA 표적 서열의 3' 말단에 위치하거나 인접한 경우 발생한다. 대안적으로, 본원에서 Cas 단백질은 DNA 절단 또는 닉킹 활성이 부족할 수 있지만, 적합한 RNA 성분과 복합체를 형성한 경우 여전히 DNA 표적 서열에 특이적으로 결합할 수 있다(그 전체가 본원에 참조로 포함되는, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1 및 2015년 2월 26일 공개된 US 2015-0059010 A1을 또한 참조.)

가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 DNA 표적 서열의 한 가닥 또는 두 가닥을 절단할 수 있다. DNA 표적 서열의 두 가닥을 절단할 수 있는 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 일반적으로 이의 엔도뉴클레아제 도메인 모두를 기능적 상태(functional state)로 가지는 Cas 단백질을 포함한다(예를 들어, 야생형 엔도뉴클레아제 도메인 또는 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 보유하는 이들의 변이체). 따라서, 야생형 Cas 단백질(예를 들어, 본원에 개시된 Cas9 단백질) 또는 Cas 단백질의 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 보유하는 이의 변이체는 DNA 표적 서열의 두 가닥을 절단할 수 있는 Cas 엔도뉴클레아제의 적절한 예이다. 기능적 RuvC 및 HNH 뉴클레아제 도메인을 포함하는 Cas9 단백질은 DNA 표적 서열의 두 가닥을 절단할 수 있는 Cas 단백질의 예이다. DNA 표적 서열의 한 가닥을 절단할 수 있는 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 본원에서 닉카아제 활성(예를 들어, 부분 절단 능력)을 갖는 것을 특징으로 할 수 있다. Cas 닉카아제는 일반적으로, Cas가 DNA 표적 서열 중 한 가닥만 절단하도록 하는(즉, 닉을 형성하도록 하는) 하나의 기능적 엔도뉴클레아제 도메인을 포함한다. 예를 들어, Cas9 닉카아제는 (i) 돌연변이 기능장애 RuvC 도메인 및 (ii) 기능적 HNH 도메인(예를 들어, 야생형 HNH 도메인)을 포함할 수 있다. 다른 예로서, Cas9 닉카아제는 (i) 기능적 RuvC 도메인(예를 들어, 야생형 RuvC 도메인) 및 (ii) 돌연변이 기능장애 HNH 도메인을 포함할 수 있다. 본원에서 사용하기에 적합한 Cas9 닉카아제의 비제한적인 예는 본원에 참조로 포함되는 Gasiunas et al. (Proc. Natl. Acad. Sci. U.S.A. 109:E2579-E2586), Jinek et al. (Science 337:816-821), Sapranauskas et al. (Nucleic Acids Res. 39:9275-9282) 및 미국 특허 출원 공개 2014/0189896호에 개시되어 있다.

DNA 표적화의 특이성을 증가시키기 위해 한 쌍의 Cas9 닉카아제가 사용될 수 있다. 일반적으로, 이는, 상이한 가이드 서열을 갖는 RNA 성분들과 결합되어 있기 때문에, 원하는 표적화를 위한 영역에서 반대 가닥 상의 가까운 DNA 서열을 표적화하고 닉을 형성하는 2개의 Cas9 닉카아제를 도입함으로써 수행될 수 있다. 각각의 DNA 가닥의 이러한 가까운 절단은 이중 가닥 절단(즉, 단일-가닥 돌출부를 갖는 DSB)를 생성하고, 이는 이어서 비상동 말단 연결, NHEJ(돌연변이로 이어지는 불완전한 복구 경향이 있음) 또는 상동 재결합, HR을 위한 기질로서 인정된다. 이러한 구현예에서 각각의 닉은, 예를 들어, 서로 적어도 약 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 또는 100(또는 5와 100 사이의 임의의 정수)개의 염기만큼 이격될 수 있다. 본원의 하나 또는 두 개의 Cas9 닉카아제 단백질이 Cas9 닉카아제 쌍에서 사용될 수 있다. 예를 들어, 돌연변이 RuvC 도메인을 가지나 작동 HNH 도메인을 갖는 Cas9 닉카아제(즉, Cas9 HNH+/RuvC-)(예를 들어, 스트렙토코커스 피오게네스 Cas9 HNH+/RuvC-)가 사용될 수 있다. 각각의 Cas9 닉카아제(예를 들어, Cas9 HNH+/RuvC-)는 각각의 닉카아제를 각각의 특정 DNA 부위로 표적화하는 가이드 RNA 서열을 갖는 본원의 적합한 RNA 성분들을 사용하여, 서로 가까운(100개 이하의 염기쌍만큼 이격된) 특정 DNA 부위로 유도될 것이다.

Cas 단백질은 하나 이상의 이종 단백질 도메인(예를 들어, Cas 단백질 외에도 1개, 2개, 3개 이상의 도메인)을 포함하는 융합 단백질의 일부일 수 있다. 이러한 융합 단백질은 임의의 추가적인 단백질 서열, 및 선택적으로 임의의 두 도메인 사이, 예컨대, Cas와 제1 이종 도메인 사이의 링커 서열을 포함할 수 있다. 본원의 Cas 단백질에 융합될 수 있는 단백질 도메인의 예는 에피토프 태그(예를 들어, 히스티딘 [His], V5, FLAG, 인플루엔자 혈구응집소 [HA], myc, VSV-G, 티오레독신 [Trx]), 리포터(예를 들어, 글루타티온-5-트랜스퍼라아제 [GST], 홀스래디쉬 퍼옥시다아제 [HRP], 클로람페니콜 아세틸트랜스퍼라아제 [CAT], 베타-갈락토시다아제, 베타-글루쿠로니다아제 [GUS], 루시퍼라아제, 녹색 형광 단백질 [GFP], HcRed, DsRed, 청록색 형광 단백질[CFP], 황색 형광 단백질 [YFP], 청색 형광 단백질 [BFP]) 및 메틸라아제 활성, 디메틸라아제 활성, 전사 활성화 활성(예를 들어, VP16 또는 VP64), 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성 중 하나 이상을 갖는 도메인을 제한 없이 포함한다. Cas 단백질은 DNA 분자 또는 다른 분자, 예컨대, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD), GAL4A DNA 결합 도메인 및 단순 헤르페스 바이러스(HSV) VP16에 결합하는 단백질과 융합될 수도 있다.

본원의 Cas 단백질은 다음 속들 중 임의의 것으로부터 유래될 수 있다: 아에로피룸(Aeropyrum), 피로바쿨룸(Pyrobaculum), 술폴로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로아르쿨라(Haloarcula), 메타노박테리움(Methanobacteriumn), 메타노코커스(Methanococcus), 메타노사르시나(Methanosarcina), 메타노피러스(Methanopyrus), 피로코커스(Pyrococcus), 피크로필러스(Picrophilus), 써니오플라스니아(Thernioplasnia), 코리네박테리움(Corynebacterium), 마이코박테리움(Mycobacterium), 스트렙토마이세스(Streptomyces), 아퀴펙스(Aquifex), 포르피로모나스(Porphyromonas), 클로로비움(Chlorobium), 써머스(Thermus), 바실러스(Bacillus), 리스테리아(Listeria), 스타필로코커스(Staphylococcus), 클로스트리디움(Clostridium), 써모아나에로박터(Thermoanaerobacter), 마이코플라스마(Mycoplasma), 푸소박테리움(Fusobacterium), 아자쿠스(Azarcus), 크로모박테리움(Chromobacterium), 네이세리아(Neisseria), 니트로소모나스(Nitrosomonas), 디설포비브리오(Desulfovibrio), 게오박터(Geobacter), 미로코커스(Myrococcus), 캄필로박터(Campylobacter), 볼리넬라(Wolinella), 아시네토박터(Acinetobacter), 에르위니아(Erwinia), 에스케리챠(Escherichia), 레지오넬라(Legionella), 메틸로코커스(Methylococcus), 파스퇴렐라(Pasteurella), 포토박테리움(Photobacterium), 살모넬라(Salmonella), 잔토모나스(Xanthomonas), 예시니아(Yersinia), 스트렙토코커스(Streptococcus), 트레포네마(Treponema), 프란시셀라(Francisella) 또는 써모토가(Thermotoga). 대안적으로, 본원의 Cas 단백질은, 예를 들어, 본원에 참조로 포함되는 미국 출원 공개 2010/0093617호에 개시된 바와 같이, SEQ ID NO: 462 내지 465, 467 내지 472, 474 내지 477, 479 내지 487, 489 내지 492, 494 내지 497, 499 내지 503, 505 내지 508, 510 내지 516 또는 517 내지 521 중 임의의 것에 의해 암호화될 수 있다.

특정 구현예에서 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 임의의 가닥을 절단하지 않는다. 이러한 복합체는 모든 뉴클레아제 도메인이 돌연변이 기능장애인 Cas 단백질을 포함할 수 있다. 예를 들어, DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 임의의 가닥을 절단하지 않는 본원의 Cas9 단백질은 돌연변이 기능장애 RuvC 도메인 및 돌연변이 기능장애 HNH 도메인을 모두 포함할 수 있다. 표적 DNA 서열에 결합하지만 절단하지 않는 본원의 Cas 단백질은 유전자 발현을 조절하는 데 사용될 수 있으며, 예를 들어, 이 경우 Cas 단백질은 전사 인자(또는 이의 일부)(예를 들어, 억제물질 또는 활성물질, 예컨대, 본원에 개시된 것들 중 임의의 것)와 융합될 수 있다.

Cas 엔도뉴클레아제 유전자는 II형 Cas9 엔도뉴클레아제 예컨대, 2007년 3월 1일 공개되고 본원에 참조로 포함되는 WO2007/025097의 SEQ ID NO: 462, 474, 489, 494, 499, 505, 및 518에 열거된 Cas9 유전자일 수 있으나, 이에 한정되는 것은 아니다. 다른 구현예에서, Cas 엔도뉴클레아제 유전자는 식물, 옥수수 또는 대두 최적화된 Cas9 엔도뉴클레아제 유전자이다. 본원의 Cas 엔도뉴클레아제 유전자는 식물 또는 미생물 코돈 최적화된 Cas9 엔도뉴클레아제 유전자일 수 있다. Cas 엔도뉴클레아제 유전자는 Cas 코돈 영역 상류의 SV40 핵 표적화 신호 및 Cas 코돈 영역 하류의 2부분 VirD2 핵 국재화 신호(Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89:7442-6)에 작동 가능하게 연결될 수 있다.

본원의 "Cas9" (이전에는 Cas5, Csn1 또는 Csx12로 지칭됨)는 DNA 표적 서열의 전부 또는 일부를 특이적으로 인식하고 절단하기 위해, cr뉴클레오티드 및 tracr뉴클레오티드와, 또는 단일 가이드 폴리뉴클레오티드와 복합체를 형성하는 II형 CRISPR 시스템의 Cas 엔도뉴클레아제를 지칭한다. Cas9 단백질은 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인을 포함하며, 이들 각각은 표적 서열에서 단일 DNA 가닥을 절단할 수 있다(두 도메인의 공동 작용은 DNA 이중 가닥 절단을 유도하는 반면, 하나의 도메인의 활성은 닉을 유도함). 일반적으로, RuvC 도메인은 서브도메인 I, II 및 III을 포함하며, 여기서 도메인 I은 Cas9의 N 말단 근처에 위치하고, 서브도메인 II 및 III은 HNH 도메인에 플랭킹한 단백질의 중간에 위치한다(Hsu et al, Cell 157:1262-1278). II형 CIRSPR 시스템은 적어도 하나의 폴리뉴클레오티드 성분과의 복합체로 Cas9 엔도뉴클레아제를 활용하는 DNA 절단 시스템을 포함한다. 예를 들어, Cas9는 CRISPR RNA(crRNA) 및 트랜스-활성화 CRISPR RNA(tracrRNA)와의 복합체일 수 있다. 다른 예에서, Cas9는 단일 가이드 RNA와의 복합체일 수 있다.

본원에 기술된 Cas9 단백질뿐만 아니라 본원의 기타 특정 Cas 단백질의 아미노산 서열은 예를 들어, 스트렙토코커스(예를 들어, S. 피오게네스(pyogenes), S. 뉴모니애(pneumoniae), S. 써모필러스(thermophilus), S. 아갈락티아(agalactiae), S. 파라상귀니스(parasanguinis), S. 오랄리스(oralis), S. 살리바리우스(salivarius), S. 마카카(macacae), S. 디스갈락티애(dysgalactiae), S. 안지노서스(anginosus), S. 콘스텔라투스(constellatus), S. 슈도포르시누스(pseudoporcinus), S. 뮤탄스(mutans)), 리스테리아(예를 들어, L. 인노쿠아(innocua)), 스피로플라즈마(Spiroplasma) (예를 들어, S. 아피스(apis), S. 시르피디콜라(syrphidicola)), 펩토스트렙토코카세(Peptostreptococcaceae), 아토포비움(Atopobium), 포르피로모나스(Porphyromonas) (예를 들어, P. 카토니아(catoniae)), 프레보텔라(Prevotella) (예를 들어, P. 인테르메디아(intermedia)), 베일로넬라(Veillonella), 트레포네마(Treponema)(예를 들어, T. 소크란스키(socranskii), T. 덴티콜라(denticola)), 카프노사이토파가(Capnocytophaga), 피네골디아(Finegoldia)(예를 들어, F. 마그나(magna)), 코리오박테리아세아에(Coriobacteriaceae)(예를 들어, C. 박테리움(bacterium)), 올스넬라(Olsenella)(예를 들어, O. 프로푸사(profusa)), 헤모필루스(Haemophilus)(예를 들어, H. 스푸토룸(sputorum), H. 피트마니아에(pittmaniae)), 파스퇴렐라(Pasteurella)(예를 들어, P. 베티아에(bettyae)), 올리비박터(Olivibacter)(예를 들어, O. 시티엔시스(sitiensis)), 에필리토니모나스(Epilithonimonas)(예를 들어, E. 테낙스(tenax)), 메소니아(Mesonia)(예를 들어, M. 모빌리스(mobilis)), 락토바실루스(Lactobacillus)(예를 들어, L. 플란타룸(plantarum)), 바실루스(예를 들어, B. 세레우스(cereus)), 아퀴마리나(Aquimarina)(예를 들어, A. 무엘레리(muelleri)), 크리세오박테리움(Chryseobacterium)(예를 들어, C. 파루스트레(palustre)), 박테로이데스(Bacteroides)(예를 들어, B. 그라미니솔벤스(graminisolvens)), 네이세리아(예를 들어, N. 메닝기티디스(meningitidis)), 프란시셀라(Francisella)(예를 들어, F. 노비시다(novicida)) 또는 플라보박테리움(Flavobacterium)(예를 들어, F. 프리기다리움(frigidarium), F. 솔리(soli)) 종으로부터 유래될 수 있다. 다른 예로서, Cas9 단백질은 본원에 참조로 포함되는 문헌[Chylinski et al. (RNA Biology 10:726-737 및 2015년 5월 15일 출원된 미국 특허 출원 62/162377)]에 개시된 Cas9 단백질 중 임의의 것일 수 있다.

따라서, 본원의 Cas9 단백질의 서열은, 예를 들어, 참조로 포함되는 진뱅크(GenBank) 등록번호 G3ECR1 (S. 써모필러스), WP_026709422, WP_027202655, WP_027318179, WP_027347504, WP_027376815, WP_027414302, WP_027821588, WP_027886314, WP_027963583, WP_028123848, WP_028298935, Q03JI6 (S. 써모필러스), EGP66723, EGS38969, EGV05092, EHI65578 (S. 슈도포르시누스), EIC75614 (S. 오랄리스), EID22027 (S. 콘스텔라투스), EIJ69711, EJP22331 (S. 오랄리스), EJP26004 (S. 안지노서스), EJP30321, EPZ44001 (S. 피오게네스), EPZ46028 (S. 피오게네스), EQL78043 (S. 피오게네스), EQL78548 (S. 피오게네스), ERL10511, ERL12345, ERL19088 (S. 피오게네스), ESA57807 (S. 피오게네스), ESA59254 (S. 피오게네스), ESU85303 (S. 피오게네스), ETS96804, UC75522, EGR87316 (S. 디스갈락티애), EGS33732, EGV01468 (S. 오랄리스), EHJ52063 (S. 마카카), EID26207 (S. 오랄리스), EID33364, EIG27013 (S. 파라상귀니스), EJF37476, EJO19166 (스트렙토코커스 종 BS35b), EJU16049, EJU32481, YP_006298249, ERF61304, ERK04546, ETJ95568 (S. 아갈락티아), TS89875, ETS90967 (스트렙토코커스 종 SR4), ETS92439, EUB27844 (스트렙토코커스 종 BS21), AFJ08616, EUC82735 (스트렙토코커스 종 CM6), EWC92088, EWC94390, EJP25691, YP_008027038, YP_008868573, AGM26527, AHK22391, AHB36273, Q927P4, G3ECR1 또는 Q99ZW2 (S. 피오게네스)에 개시된 Cas9 아미노산 서열 중 임의의 것을 포함할 수 있다. 이들 Cas9 단백질 서열 중 임의의 것의 변이체가 사용될 수 있지만, 본원의 RNA 성분과 결합할 경우 DNA에 대한 특이적 결합 활성 및 선택적으로 엔도뉴클레오리틱 활성을 가져야 한다. 이러한 변이체는 기준 Cas9의 아미노산 서열과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함할 수 있다.

대안적으로, 본원의 Cas9 단백질은, 예를 들어, (본원에 참조로 포함되는) 미국 출원 공개 2010/0093617호에 개시된 바와 같은 SEQ ID NO: 462(S. 써모필러스), 474(S. 써모필러스), 489(S. 아갈락티아), 494(S. 아갈락티아), 499(S. 뮤탄스), 505(S. 피오게네스) 또는 518(S. 피오게네스) 중 임의의 것에 의해 암호화될 수 있다. 또한, 대안적으로, Cas9 단백질은, 예를 들어, 전술한 아미노산 서열 중 임의의 것과 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함할 수 있다. 이러한 변이체인 Cas9 단백질은 본원의 RNA 성분과 결합할 경우 DNA에 대한 특이적 결합 활성, 및 선택적으로 절단 또는 닉킹 활성을 가져야 한다.

본원의 Cas 단백질, 예컨대, Cas9은 이종 핵 국재화 서열(NLS)을 포함할 수 있다. 본원의 이종 NLS 아미노산 서열은, 예를 들어, 본원의 효모 세포의 핵에서 검출 가능한 양으로 Cas 단백질의 축적을 유도하기에 충분한 강도를 나타낼 수 있다. NLS는 염기성의, 양으로 하전된 잔기(예를 들어, 라이신 및/또는 아르기닌)의 하나(1부분(monopartite)) 이상(예를 들어, 2부분(bipartite))의 짧은 서열(예를 들어, 2 내지 20개의 잔기)을 포함할 수 있으며, Cas 아미노산 서열 중 어디에도 위치할 수 있지만 단백질 표면 상에 노출되어야 한다. NLS는, 예를 들어, 본원의 Cas 단백질의 N 말단 또는 C 말단에 작동 가능하게 연결될 수 있다. 둘 이상의 NLS 서열이, 예를 들어, Cas 단백질에 연결될 수 있는데, 예를 들어, Cas 단백질의 N 말단과 C 말단 모두에 연결될 수 있다. 본원의 적합한 NLS 서열의 비제한적인 예는 본원에 참조로 포함되는 미국 특허 6660830호 및 7309576호(예를 들어 해당 문헌의 표 1)에 개시된 것들을 포함한다.

Cas 엔도뉴클레아제는 Cas9 폴리펩티드의 변형된 형태를 포함할 수 있다. Cas9 폴리펩티드의 변형된 형태는 Cas9 단백질의 자연 발생적인 뉴클레아제 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입, 또는 치환)를 포함할 수 있다. 예를 들어, 일부 경우, Cas9 단백질의 변형된 형태는 해당 야생형 Cas9 폴리펩티드의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만을 갖는다(2014년 3월 6일 공개된 미국 특허 출원 US20140068797 A1). 일부 경우, Cas9 폴리펩티드의 변형된 형태는 실질적인 뉴클레아제 활성을 갖지 않으며, 촉매적으로 "불활성된 Cas9" 또는 "비활성된 cas9 (dCas9)"으로 지칭된다. 촉매적으로 불활성화된 Cas9 변이체는 HNH 및 RuvC 뉴클레아제 도메인에 돌연변이를 포함하는 Cas9 변이체를 포함한다. 이러한 촉매적으로 불활성화된 Cas9 변이체는 sgRNA와 상호작용할 수 있고 생체내에서 표적 부위에 결합할 수 있지만, 표적 DNA의 어느 가닥도 절단할 수 없다.

촉매적으로 불활성인 Cas9는 이종 서열에 융합될 수 있다(2014년 3월 6일 공개된 미국 특허 출원 US20140068797 A1). 적합한 융합 상대는 표적 DNA 상에 또는 표적 DNA와 결합된 폴리펩티드(예를 들어, 히스톤 또는 다른 DNA-결합 단백질) 상에 직접 작용하여 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩티드를 포함하나, 이에 한정되는 것은 아니다. 추가적인 적합한 융합 상대는 메틸트랜스퍼라아제 활성, 디메틸라아제 활성, 아세틸트랜스퍼라아제 활성, 디아세틸라아제 활성, 키나아제 활성, 포스파타아제 활성, 유비퀴틴 리가아제 활성, 디유비퀴틴화 활성, 아데닐화 활성, 디아데닐화 활성, SUMO화 활성, 디SUMO화 활성, 리보실화 활성, 디리보실화 활성, 미리스토일화 활성, 또는 디미리스토일화 활성을 제공하는 폴리펩티드를 포함하나, 이에 한정되는 것은 아니다. 또한 적합한 융합 상대는 표적 핵산의 증가된 전사를 직접적으로 제공하는 폴리펩티드(예를 들어, 전사 활성물질 또는 이의 단편, 전사 활성물질을 구성하는 단백질 또는 이의 단편, 작은 분자/약물 반응성 전사 조절물질 등)를 포함하나, 이에 한정되는 것은 아니다. 촉매적으로 불활성인 Cas9는 FokI 뉴클레아제에 융합되어 이중 가닥 절단을 생성할 수도 있다(Guilinger et al. Nature biotechnology, 32권, 6호, 2014년 6월).

용어 Cas 엔도뉴클레아제의 "기능적 단편", "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호교환적으로 사용되며, 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)하는 능력이 유지되는 Cas 엔도뉴클레아제 서열의 일부 또는 하위서열을 지칭한다.

용어 Cas 엔도뉴클레아제의 "기능적 변이체", "기능적으로 동등한 변이체" 및 "기능적 동등 변이체"는 본원에서 상호교환적으로 사용되며, 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)하는 능력이 유지되는 Cas 엔도뉴클레아제의 변이체를 지칭한다. 단편 및 변이체는 부위 특이적 돌연변이유발 및 합성 제조와 같은 방법을 통해 얻을 수 있다.

Cas 엔도뉴클레아제 유전자는 원칙적으로 표적화될 수 있는 N(12~30)NGG 형태의 임의의 게놈 서열을 인식할 수 있는 식물 코돈 최적화된 스트렙토코커스 피오게네스 Cas9 유전자, 또는 브레비바실루스 라테로스포루스, 락토바실루스 루테리 Mlc3, 락토바실루스 로시애 DSM 15814, 페디오코커스 펜토사세우스 SL4, 락토바실루스 노덴시스 JCM 14932, 설푸로스피릴룸 종 SCADC, 비피도박테리움 써모필룸 DSM 20210, 록타넬라 베스트폴덴시스, 스핑고모나스 산자니게넨스 NX02, 에필리토니모나스 테낙스 DSM 16811, 스포로사이토파가 믹소코코이데스 및 사이크로플렉수스 토르퀴스 ATCC 700755로 이루어진 군으로부터 선택되는 생물로부터 유래된 Cas9 엔도뉴클레아제를 포함하며, 상기 Cas9 엔도뉴클레아제는 DNA 표적 서열의 전부 또는 일부를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성할 수 있다. 다른 Cas 엔도뉴클레아제 시스템은 2015년 5월 15일 출원된 미국 특허 출원 62/162,377 및 2015년 5월 15일 출원된 62/162,353에 기술되었으며, 두 출원은 모두 본원에 참조로 포함된다.

Cas9 엔도뉴클레아제는 (단일 및 복합 이중 가닥 절단 및 닉킹을 통한) 표적화된 게놈 편집 및 (Cas9 또는 sgRNA로의 후성 이펙터 도메인의 테더링을 통한) 표적화된 게놈 조절에 이용될 수 있다. Cas9은 RNA-유도 재조합효소로서 기능하도록 유전자 조작될 수도 있으며, RNA 테더를 통해 다중 단백질과 핵산 복합체의 조립을 위한 스캐폴드의 역할을 할 수 있다(Mali et al. 2013 Nature Methods Vol. 10 : 957-963).

본원에 사용된 용어 "가이드 폴리뉴클레오티드"는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있고, Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고 거기에 결합하고, 선택적으로 절단할 수 있게 하는 폴리뉴클레오티드 서열에 관한 것이다. 가이드 폴리뉴클레오티드는 단일 분자 또는 이중 분자일 수 있다. 가이드 폴리뉴클레오티드 서열은 RNA 서열(가이드 RNA, gRNA라고 함), DNA 서열, 또는 이의 조합(RNA-DNA 조합 서열)일 수 있다. 선택적으로, 가이드 폴리뉴클레오티드는 적어도 하나의 뉴클레오티드, 포스포디에스테르 결합 또는 연결 변형, 예컨대, 고정 핵산(LNA), 5-메틸 dC, 2,6-디아미노퓨린, 2'-플루오로 A, 2'-플루오로 U, 2'-O-메틸 RNA, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18(헥사에틸렌 글리콜 사슬) 분자에 대한 연결, 또는 고리화를 초래하는 5'에서 3'으로의 공유 연결을 포함할 수 있으나, 이에 한정되는 것은 아니다. 단독으로 리보핵산을 포함하는 가이드 폴리뉴클레오티드는 "가이드 RNA" 또는 "gRNA"라고도 지칭된다(그 전체가 본원에 참조로 포함되는, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1 및 2015년 2월 26일 공개된 US 2015-0059010 A1을 또한 참조).

가이드 폴리뉴클레오티드는 cr뉴클레오티드 서열 및 tracr뉴클레오티드 서열을 포함하는 이중 분자(듀플렉스 가이드 폴리뉴클레오티드라고도 함)일 수 있다. cr뉴클레오티드는 표적 DNA의 뉴클레오티드 서열에 혼성화될 수 있는 제1 뉴클레오티드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 함) 및 Cas 엔도뉴클레아제 인식(CER) 도메인의 일부인 제2 뉴클레오티드 서열(tracr 메이트 서열이라고도 함)을 포함한다. tracr 메이트 서열은 상보성 영역을 따라 tracr뉴클레오티드에 혼성화될 수 있고, 함께 Cas 엔도뉴클레아제 인식 도메인 또는 CER 도메인을 형성할 수 있다. CER 도메인은 Cas 엔도뉴클레아제 폴리펩티드와 상호작용할 수 있다. 듀플렉스 가이드 폴리뉴클레오티드의 cr뉴클레오티드 및 tracr뉴클레오티드는 RNA, DNA, 및/또는 RNA-DNA-조합 서열일 수 있다. 일부 구현예에서, 듀플렉스 가이드 폴리뉴클레오티드의 cr뉴클레오티드 분자는 "crDNA"(연속된 DNA 뉴클레오티드들로 구성되는 경우) 또는 "crRNA"(연속된 RNA 뉴클레오티드들로 구성되는 경우) 또는 "crDNA-RNA"(DNA와 RNA 뉴클레오티드의 조합으로 구성되는 경우)로 지칭된다. cr뉴클레오티드는 박테리아 및 고세균에서 자연적으로 발생하는 crRNA의 단편을 포함할 수 있다. 박테리아 및 고세균에서 자연적으로 발생하고 본원에 개시된 cr뉴클레오티드에 존재할 수 있는 crRNA의 단편의 크기는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 뉴클레오티드 범위를 가질 수 있지만, 이들 범위에 제한되는 것은 아니다. 일부 구현예에서, tracr뉴클레오티드는 "tracrRNA"(연속된 RNA 뉴클레오티드들로 구성되는 경우) 또는 "tracrDNA"(연속된 DNA 뉴클레오티드들로 구성되는 경우) 또는 "tracrDNA-RNA"(DNA와 RNA 뉴클레오티드의 조합으로 구성되는 경우)로 지칭된다. 일 구현예에서, RNA/Cas9 엔도뉴클레아제 복합체를 가이드하는 RNA는 듀플렉스 crRNA-tracrRNA를 포함하는 듀플렉스 RNA이다. tracrRNA(트랜스-활성화 CRISPR RNA)는 5'에서 3' 방향으로 (i) CRISPR II형 crRNA의 반복 영역과 어닐링하는 서열 및 (ii) 스템 루프 수용부를 포함한다(Deltcheva et al., Nature 471:602-607). 듀플렉스 가이드 폴리뉴클레오티드는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있으며, 상기 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체(가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템이라고도 함)는 Cas 엔도뉴클레아제를 게놈 표적 부위로 유도하여 Cas 엔도뉴클레아제가 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)할 수 있게 할 수 있다(그 전체가 본원에 참조로 포함되는, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1 및 2015년 2월 26일 공개된 US 2015-0059010 A1을 또한 참조).

가이드 폴리뉴클레오티드는 tracr뉴클레오티드 서열에 연결된 cr뉴클레오티드 서열을 포함하는 단일 분자(단일 가이드 폴리뉴클레오티드라고도 함)일 수도 있다. 단일 가이드 폴리뉴클레오티드는 표적 DNA의 뉴클레오티드 서열에 혼성화될 수 있는 제1 뉴클레오티드 서열 도메인(가변 표적화 도메인 또는 VT 도메인이라고 함) 및 Cas 엔도뉴클레아제 폴리펩티드와 상호작용하는 Cas 엔도뉴클레아제 인식 도메인(CER 도메인)을 포함한다. "도메인"은 RNA, DNA, 및/또는 RNA-DNA 조합 서열일 수 있는 뉴클레오티드들이 연속되어 있는 것을 의미한다. 단일 가이드 폴리뉴클레오티드의 VT 도메인 및/또는 CER 도메인은 RNA 서열, DNA 서열, 또는 RNA-DNA-조합 서열을 포함할 수 있다. cr뉴클레오티드 및 tracr뉴클레오티드로부터의 서열들로 구성되는 단일 가이드 폴리뉴클레오티드는 "단일 가이드 RNA"(연속된 RNA 뉴클레오티드들로 구성되는 경우) 또는 "단일 가이드 DNA"(연속된 DNA 뉴클레오티드들로 구성되는 경우) 또는 "단일 가이드 RNA-DNA"(RNA와 DNA 뉴클레오티드의 조합으로 구성되는 경우)로 지칭될 수 있다. 단일 가이드 폴리뉴클레오티드는 Cas 엔도뉴클레아제와 복합체를 형성할 수 있으며, 상기 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체(가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템이라고도 함)는 Cas 엔도뉴클레아제를 게놈 표적 부위로 유도하여 Cas 엔도뉴클레아제가 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)할 수 있게 할 수 있다(그 전체가 본원에 참조로 포함되는, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1 및 2015년 2월 26일 공개된 US 2015-0059010 A1을 또한 참조).

용어 "가변 표적화 도메인" 또는 "VT 도메인"은 본원에서 상호교환적으로 사용되며, 이중 가닥 DNA 표적 부위의 한 가닥(뉴클레오티드 서열)에 혼성화될 수 있는(상보적인) 뉴클레오티드 서열을 포함한다. 제1 뉴클레오티드 서열 도메인(VT 도메인)과 표적 서열 사이의 백분율 상보성은 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 63%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%일 수 있다. 가변 표적화 도메인은 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개 또는 30개 뉴클레오티드의 길이일 수 있다. 일부 구현예에서, 이러한 가변 표적화 도메인은 연속된 12개 내지 30개의 뉴클레오티드를 포함한다. 가변 표적화 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열, 또는 이들의 임의의 조합으로 구성될 수 있다.

용어 (가이드 폴리뉴클레오티드의) "Cas 엔도뉴클레아제 인식 도메인" 또는 "CER 도메인"은 본원에서 상호교환적으로 사용되며, Cas 엔도뉴클레아제 폴리펩티드와 상호작용하는 뉴클레오티드 서열을 포함한다. CER 도메인은 tracr뉴클레오티드 메이트 서열 다음에 tracr뉴클레오티드 서열을 포함한다. CER 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열(예를 들어, 그 전체가 본원에 참조로 포함되는, 2015년 2월 26일 공개된 US 2015-0059010 A1 참조), 또는 이의 임의의 조합으로 구성될 수 있다.

단일 가이드 폴리뉴클레오티드의 cr뉴클레오티드 및 tracr뉴클레오티드를 연결하는 뉴클레오티드 서열은 RNA 서열, DNA 서열, 또는 RNA-DNA 조합 서열을 포함할 수 있다. 일 구현예에서, 단일 가이드 폴리뉴클레오티드의 cr뉴클레오티드 및 tracr뉴클레오티드를 연결하는 뉴클레오티드 서열은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100개 뉴클레오티드의 길이일 수 있다. 다른 구현예에서, 단일 가이드 폴리뉴클레오티드의 cr뉴클레오티드 및 tracr뉴클레오티드를 연결하는 뉴클레오티드 서열은 테트라루프 서열, 예컨대, GAAA 테트라루프 서열을 포함할 수 있지만, 이에 한정되는 것은 아니다.

가이드 폴리뉴클레오티드, VT 도메인 및/또는 CER 도메인의 뉴클레오티드 서열 변형은 5' 캡, 3' 폴리아데닐화 테일, 리보스위치 서열, 안정성 조절 서열, dsRNA 듀플렉스를 형성하는 서열, 가이드 폴리뉴클레오티드를 세포내 위치에 표적화하는 변형 또는 서열, 트랙킹을 제공하는 변형 또는 서열, 단백질을 위한 결합 부위를 제공하는 변형 또는 서열, 잠김 핵산(Locked Nucleic Acid, LNA), 5-메틸 dC 뉴클레오티드, 2,6-디아미노퓨린 뉴클레오티드, 2'-플루오로 A 뉴클레오티드, 2'-플루오로 U 뉴클레오티드; 2'-O-메틸 RNA 뉴클레오티드, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18 분자에 대한 연결, 5'에서 3'으로의 공유 연결, 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택될 수 있지만, 이에 한정되는 것은 아니다. 이러한 변형은 적어도 하나의 추가적인 유익한 특징을 가져올 수 있고, 여기서 추가적인 유익한 특징은 변형 또는 조절된 안정성, 세포 내 표적화, 추적, 형광 표지, 단백질 또는 단백질 복합체에 대한 결합 부위, 상보적인 표적 서열에 대한 변형된 결합 친화도, 세포 분해에 대한 변형된 저항성, 및 증가된 세포 투과성의 군으로부터 선택된다.

용어 가이드 RNA, crRNA 또는 tracrRNA의 "기능적 단편", "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호교환적으로 사용되며, 각각 가이드 RNA, crRNA 또는 tracrRNA로서 기능하는 능력이 유지되는 가이드 RNA, crRNA 또는 tracrRNA의 일부 또는 하위서열을 각각 지칭한다.

용어 가이드 RNA, crRNA 또는 tracrRNA의 "기능적 변이체", "기능적으로 동등한 변이체" 및 "기능적 동등 변이체"는 (각각) 본원에서 상호교환적으로 사용되며, 각각 가이드 RNA, crRNA 또는 tracrRNA로서 기능하는 능력이 유지되는 가이드 RNA, crRNA 또는 tracrRNA의 변이체를 각각 지칭한다.

용어 "단일 가이드 RNA", "gRNA" 및 "sgRNA"는 본원에서 상호교환적으로 사용되며, tracrRNA(트랜스-활성화 CRISPR RNA)에 융합된, (tracrRNA에 혼성화하는 tracr 메이트 서열에 연결된) 가변 표적화 도메인을 포함하는 crRNA(CRISPR RNA)인, 2개의 RNA 분자의 합성 융합에 관한 것이다. 단일 가이드 RNA는 II형 Cas 엔도뉴클레아제와 복합체를 형성할 수 있는 II형 CRISPR/Cas 시스템의 crRNA 또는 crRNA 단편 및 tracrRNA 또는 tracrRNA 단편을 포함할 수 있고, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 유도하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)할 수 있게 할 수 있다.

용어 "가이드 RNA/Cas 엔도뉴클레아제 복합체", "가이드 RNA/Cas 엔도뉴클레아제 시스템", "가이드 RNA/Cas 복합체", "가이드 RNA/Cas 시스템", "gRNA/Cas 복합체", "gRNA/Cas 시스템", "RNA-유도 엔도뉴클레아제", "RGEN"은 본원에서 상호교환적으로 사용되고, 복합체를 형성할 수 있는 적어도 하나의 RNA 성분 및 적어도 하나의 Cas 엔도뉴클레아제 단백질을 지칭하며, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 유도하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고 거기에 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단의 도입)할 수 있게 할 수 있다. 본원의 가이드 RNA/Cas 엔도뉴클레아제 복합체는 알려진 CRISPR 시스템(Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15; Horvath and Barrangou, Science 327:167-170), 예컨대 I형, II형, 또는 III형 CRISPR 시스템 중 임의의 것의 적합한 RNA 성분(들) 및 Cas 단백질(들)을 포함할 수 있다. 가이드 RNA/Cas 엔도뉴클레아제 복합체는 II형 Cas9 엔도뉴클레아제 및 적어도 하나의 RNA 성분(예컨대, crRNA 및 tracrRNA, 또는 gRNA)을 포함할 수 있다(그 전체가 본원에 참조로 포함되는, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1 및 2015년 2월 26일 공개된 US 2015-0059010 A1을 또한 참조).

Cas 엔도뉴클레아제는 당업계에 공지된 임의의 방법, 예를 들어, 이에 한정되는 것은 아니지만, 일시적 도입 방법, 형질감염, 미세주입, 및/또는 국소 처리법에 의해 또는 재조합효소를 통해 간접적으로 세포에 도입(제공)될 수 있다. 식물 세포는 식물 세포로의 Cas9 엔도뉴클레아제의 직접 전달에 대한 장벽으로 작용할 수 있는 식물 세포벽을 포함한다는 점에서 인간 및 동물 세포와 다르다. Cas9 엔도뉴클레아제를 암호화하는 재조합 DNA 작제물은 식물 세포에 성공적으로 도입되어(Svitashev et al., Plant Physiology, 2015, Vol. 169, pp. 931-945) 표적 부위에서의 게놈 편집을 가능하게 하였다. 식물 세포에 재조합 DNA 작제물을 안정적으로 도입하는 데 있어 하나의 가능한 단점은 Cas9 엔도뉴클레아제의 지속적인 존재가 표적 이탈 효과를 증가시킬 수 있다는 점이다.

본원에 기술된 바와 같이, 식물 세포로의 Cas 엔도뉴클레아제의 직접 전달은 입자 매개 전달을 통해 달성될 수 있다. 본원에 기술된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대, 이에 한정되는 것은 아니지만, 폴리에틸렌 글리콜(PEG) 매개 원형질체로의 형질감염, 휘스커 매개 전달, 전기천공, 유전자총, 세포 침투성 펩티드, 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 식물 세포에서 Cas9 엔도뉴클레아제를 전달하기 위해 성공적으로 이용될 수 있음을 구상할 수 있다.

Cas 엔도뉴클레아제의 직접 전달(Cas 엔도뉴클레아제의 DNA 프리 전달이라고도 함)은 당업계에 공지된 임의의 방법을 이용하여 Cas 단백질, Cas 엔도뉴클레아제를 암호화하는 mRNA, 및/또는 (리보뉴클레오티드-단백질 복합체로서) RNA 유도 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체(RGEN) 자체를 세포에 도입함으로써 달성될 수 있다. Cas 엔도뉴클레아제를 암호화하는 mRNA를 통한 또는 폴리펩티드 분자를 통한 Cas 엔도뉴클레아제의 직접 전달은 어떤 DNA 분자도 Cas 엔도뉴클레아제 단백질의 생산에 관여하지 않기 때문에 본원에서 Cas 엔도뉴클레아제의 DNA 프리 전달로도 지칭된다. 마찬가지로, RNA 분자로서 가이드 RNA의 직접 전달은 본원에서 가이드 RNA의 DNA 프리 전달로도 지칭된다. 마찬가지로, 리보뉴클레오티드-단백질 복합체로서 가이드 RNA/엔도뉴클레아제 복합체 자체(RGEN)의 직접 전달은 본원에서 RGEN의 DNA 프리 전달로도 지칭된다.

단백질로서, 또는 gRNA와 함께 mRNA 분자로서, 또는 RGEN 리보뉴클레오티드-단백질 자체로서 Cas 엔도뉴클레아제를 직접 도입하는 것은 표적 부위에서의 게놈 편집 후 RGEN 복합체가 빠르게 분해되고, 복합체가 세포에 일시적으로만 존재할 수 있게 하며, 이는 (실시예 12에 기술된 바와 같이) 표적 이탈 효과의 감소로 이어진다.

이러한 성분들의 직접 전달은 RGEN 성분을 수용하는 세포의 강화 및/또는 시각화를 촉진할 수 있는 다른 mRNA의 직접 전달(공동 전달)에 의해 달성될 수 있다. 예를 들어, 형광 단백질(예를 들어, 이에 한정되는 것은 아니지만, 적색, 녹색, 황색, 청색 또는 이들의 조합)과 같은 선별 가능한 시각적 마커를 암호화하는 mRNA의 전달은 파괴된 비기능성 유전자의 복구 산물의 직접 선택 대신에, 또는 그와 결합하여 사용될 수도 있다.

복원된 뉴클레오티드 서열이 기능성 유전자 산물을 암호화하도록 파괴 유전자의 뉴클레오티드 서열을 복원하여 비기능성 유전자 산물의 기능을 복원하는 방법이 본원에 기술된다.

파괴된 유전자는 그 유전자 산물이 그 기능을 상실하도록(비기능성 유전자 산물이라고 함) 또는 파괴되지 않은 해당 유전자(비파괴 유전자라고도 함)의 산물에 비해 감소된 기능을 갖도록 변형(파괴)된 유전자를 지칭한다. 예를 들어, 기능성 폴리펩티드 또는 단백질을 위해 암호화하는 유전자는 파괴된 유전자의 번역 산물이 그 기능을 상실했거나 감소된 기능을 갖는 폴리펩티드를 생성하도록 파괴(변형)될 수 있다.

기능성 유전자 산물은 생물학적 또는 비생물학적 기능을 갖는 기능성 단백질 또는 폴리펩티드를 포함한다.

비기능성 유전자 산물은 파괴된 유전자의 유전자 산물에 대한 언급을 포함한다. 비기능성 유전자 산물은 그 기능을 상실했거나(기능의 부재) 해당 비파괴 유전자의 유전자 산물에 비해 감소된 기능을 갖는 폴리펩티드를 포함한다.

본 발명의 일 구현예에서, 상기 방법은 세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하는 방법으로서, 게놈 내 파괴된 유전자를 포함하는 세포에 가이드 RNA/Cas 엔도뉴클레아제 복합체를 도입하는 단계를 포함하되, 상기 복합체는 이중 가닥 절단을 생성하고, 상기 파괴된 유전자는 기능성 유전자 산물을 암호화하지 않고, 상기 파괴된 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 상기 기능성 유전자 산물을 암호화할 수 있는 비파괴 유전자로 복원되는 방법을 포함한다. 파괴된 유전자는 해당 비파괴 유전자와 비교할 때 PAM 서열의 상류(5') 네 번째 뉴클레오티드의 염기쌍 결실을 포함하고, 상기 염기쌍 결실은 파괴된 유전자의 유전자 산물에서 아미노산 프레임이동을 생성함으로써, 파괴된 유전자의 유전자 산물을 비기능적 상태로 만든다. 염기쌍 결실은 코돈 서열의 제1, 제2 또는 제3 뉴클레오티드일 수 있다. 복원은 이중 가닥 절단 부위에 단일 염기를 삽입시키는 비상동 말단 연결(NHEJ)에 의해 달성될 수 있거나, 상동 재조합 또는 상동성 유도 복구를 이용하지 않고 이중 가닥 절단 부위에 단일 염기를 삽입하여 달성될 수 있다.

(예를 들어, RGEN 성분 또는 RGEN 복합체 자체를 세포에 전달함으로써) NHEJ에 의해 유전자 기능을 복원하는 것과 동시에, 다른 가이드-폴리뉴클레오티드를 동시 첨가함으로써 다른 표적의 변형이 달성될 수 있다. (NHEJ에 의한 유전자 기능의 복원을 위한 표적 외에) 이러한 다른 표적은 유전자이식 유전자좌를 포함하는 게놈 내 임의의 표적일 수 있다. 하나의 gRNA가 (예컨대, 이에 한정되는 것은 아니지만, 제초제 내성을 부여하는) NHEJ를 통해 선택 마커를 표적화 및 활성화하고, 다른 gRNA(들)가 표적화된 돌연변이유발, 결실, 유전자 편집, 또는 부위 특이적 형질 유전자 삽입을 용이하게 할 수 있고 선택 마커와 다른 표적 부위(들)에서 DSB(들)를 촉진할 경우, 둘 이상의 gRNA의 동시 전달 접근법은 다른 모든 필요한 성분(Cas9, gRNA)이 단백질 및/또는 시험관내 전사 RNA 분자의 형태로 전달될 수 있기 때문에 완전히 일시적인 표적화 게놈 변형을 가능하게 할 수 있다.

파괴된 유전자는 그 유전자 산물이 그 기능을 상실하도록(예를 들어, 제초제 파괴 선택 마커 유전자의 경우, 파괴된 유전자는 더 이상 제초제 저항성을 부여하지 않음) 변형(파괴)된 마커 유전자(예컨대, 이에 한정되는 것은 아니지만, 표현형 마커 유전자 및 선택 마커 유전자)에 대한 언급을 포함한다.

선택 마커 또는 선별 마커는 본원에서 상호교환적으로 사용되며, 종종 특정 조건 하에서, 이를 포함하는 분자 또는 세포를 동정할 수 있게 하거나, 그 분자 또는 세포를 선택할 수 있게 하거나, 그 분자 또는 세포에 대해 선택할 수 있게 하는 DNA 분절(예컨대, 선택 마커 유전자)에 대한 언급을 포함한다. 이들 마커는 활성, 예컨대, RNA, 펩티드, 또는 단백질의 생산(그러나 이에 한정되는 것은 아님)을 인코딩할 수 있거나, RNA, 펩티드, 단백질, 무기 및 유기 화합물 또는 조성물 등에 대한 결합 부위를 제공할 수 있다. 선택 마커는, 유전자가 변형되거나 녹아웃되었을 때 세포에 속성을 생성하여 해당 속성을 포함하는 세포를 동정하거나, 그 세포를(또는 그 세포에 대해) 선택할 수 있게 하는 유전자를 더 포함한다.

일 양태에서, 선택 마커는, 예를 들어, 선택 마커를 포함하지 않는 세포 또는 조직을 억제하거나 죽이기 위해 선택적 제제(예컨대, 이에 한정되는 것은 아니지만, 항생제 또는 제초제)가 사용되고, 선택 마커 유전자를 포함하는 세포 또는 조직이 선택 마커 유전자의 발현으로 인해 계속 성장하는, 선택 설계를 적용함으로써 세포의 선택을 가능하게 한다.

일 양태에서, 선택 마커는, 예를 들어, 시각적 마커를 포함하는 세포를 선택하기 위해 시각적 마커(예컨대, 형광 분자)가 사용되는 선택 설계를 적용함으로써 세포의 시각적 선택을 가능하게 한다.

선택 마커 유전자는 클로르설푸론 저항성 유전자, 포스포만노오스 이소머라아제 유전자(PMI), 비알라포스 저항성 유전자(BAR), 포스피노트리신 아세틸트랜스퍼라아제(PAT) 유전자, 히그로마이신 저항성 유전자(NPTII), 글리포세이트 저항성 유전자, 제한 효소 부위를 포함하는 DNA 분절; 스펙티노마이신, 암피실린, 카나마이신, 테트라사이클린, 바스타, 네오마이신 포스포트랜스퍼라아제 II(NEO) 및 히그로마이신 포스포트랜스퍼라아제(HPT)와 같은 항생제를 포함하는 독성 화합물에 대해 저항성을 제공하는 생성물을 암호화하는 DNA 분절; 수용 세포에서 결여되어 있는 생성물을 암호화하는 DNA 분절(예를 들어, tRNA 유전자, 영양요구성 마커); 용이하게 동정될 수 있는 생성물을 암호화하는 DNA 분절(시각적 마커 유전자라고 함. 시각적 마커 유전자는 형광 마커 유전자, 예컨대, 적색 형광 마커 유전자, 청색 형광 마커 유전자, 녹색 형광 마커 유전자, 황색 형광 마커 유전자에 대한 언급을 포함함), DsRED, RFP, 적색 형광 단백질, CFP, GFP, 녹색 형광 단백질을 암호화하는 유전자, 및 β-갈락토시다아제, GUS와 같은 표현형 마커; 녹색 형광 단백질(GFP), 시안(CFP), 황색(YFP), 적색(RFP), 및 세포 표면 단백질과 같은 형광 단백질을 암호화하는 유전자를 포함하나 이에 제한되지 않는다. 선택 마커 유전자는 PCR을 위한 새로운 프라이머 부위의 생성(예컨대, 이전에는 나란히 놓여있지 않았던 두 DNA 서열의 병치), 제한 엔도뉴클레아제 또는 기타 DNA 변형 효소, 화학물질 등에 의해 영향 받지 않거나 영향 받는 DNA 서열의 포함; 및 동정을 가능하게 하는 특이적인 변형(예컨대, 메틸화)에 필요한 DNA 서열의 포함을 더 포함한다.

추가적인 선택 마커는 제초제 화합물, 예컨대, 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대해 저항성을 부여하는 유전자를 포함한다. 예를 들어, Yarranton, (1992) Curr Opin Biotech 3:506-11; Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8; Yao et al., (1992) Cell 71:63-72; Reznikoff, (1992) Mol Microbiol 6:2419-22; Hu et al., (1987) Cell 48:555-66; Brown et al., (1987) Cell 49:603-12; Figge et al., (1988) Cell 52:713-22; Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4; Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53; Deuschle et al., (1990) Science 248:480-3; Gossen, (1993) Ph.D. Thesis, University of Heidelberg; Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21; Labow et al., (1990) Mol Cell Biol 10:3343-56; Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6; Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6; Wyborski et al., (1991) Nucleic Acids Res 19:4647-53; Hillen and Wissman, (1989) Topics Mol Struc Biol 10:143-62; Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5; Kleinschnidt et al., (1988) Biochemistry 27:1094-104; Bonin, (1993) Ph.D. Thesis, University of Heidelberg; Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51; Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9; Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin); Gill et al., (1988) Nature 334:721-4 참조.

표현형 마커 유전자는, 양성의 선택 마커든 음성의 선택 마커든 시각적 마커를 포함하는 선별 또는 선택 마커를 암호화하는 유전자를 포함한다. 임의의 표현형 마커가 사용될 수 있다.

본원에 기술된 바와 같이, 표현형 및 선택 마커 유전자는 비기능성 유전자 산물을 암호화하는 파괴된 유전자로서 식물 세포에 도입되도록 변형될 수 있고, 가이드 RNA 도입 및 DNA 복구에 의해, 기능성 유전자 산물을 암호화하는 비파괴 유전자로 복원하기 위한 엔도뉴클레아제를 유도하는 이중 가닥 절단에 의해 표적으로서 이용될 수 있다.

파괴될 표현형 또는 선택 마커 유전자는 이전에 세포에 도입되어 세포의 게놈에 안정적으로 통합된 마커 유전자일 수 있다. 이러한 미리 통합된 선택 마커 유전자는 다른 유전자, 예를 들어, 세포 발육 강화 유전자(ZmODP2 및 ZmWUS, 예를 들어, 본원에 참조로 포함되는, 2016년 8월 26일 출원된 PCT/US16/49144 및 2016년 8월 26일 출원된 PCT/US16/49128 참조)로 보완될 수도 있다.

본원에 기술된 바와 같이, 표현형 및 선택 마커 유전자는 식물 세포에 파괴된 유전자(불활성 형태)로서 도입되도록 변형될 수 있고, 가이드 RNA 도입 및 복구에 의한 복원(재활성화)을 위해 엔도뉴클레아제를 도입하는 이중 가닥 절단에 의해 표적으로서 사용될 수 있다.

화합물에 대한 저항성을 부여하거나, 내인성 또는 이전에 통합된 마커 유전자 또는 그 유전자 산물이 마커로서 사용되도록 할 수 있는 표현 마커 유전자(예컨대, 이에 한정되는 것은 아니지만 ALS, EPSPS, BAR)가 본원에 기술되고, 이는 본원에 기술된 바와 같이 불활성 형태로 변형된 다음 가이드 RNA 도입 및 복구에 의한 재활성화를 위한 표적으로서 사용될 수 있다.

본 발명의 일 구현예에서, 상기 방법은 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서, 표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 마커 단백질에 의해 또는 그에 기초하여 선택하는 단계를 포함하는 방법을 포함한다. 선택은 상기 기능성 선택 마커 단백질을 발현하는 세포(예컨대, 식물 세포, 또는 상기 식물 세포로부터 유래된 식물)에 화학물질을 제공하는 것을 포함할 수 있고, 상기 기능성 선택 마커 단백질은 세포(예컨대 식물 세포, 또는 상기 식물 세포로부터 유래된 식물)가 상기 화학물질에 대해 저항성을 갖도록 한다. 게놈 내 원하는 변형을 포함하는 세포 또는 생물을 선택하기 위해 화학물질은 세포의 임의의 발육 단계 동안(식물 세포의 경우, 식물 세포 또는 식물의 발육의 임의의 단계 동안) 제공될 수 있다. 또한, 선택은 상기 기능성 선택 마커 단백질의 발현으로부터 유래하는 시각적 마커의 존재에 대한 세포(예컨대, 식물 세포, 또는 상기 식물 세포로부터 유래된 식물)의 선별을 포함한다.

예를 들어, 본원에 기술된 바와 같이, 상기 방법은 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서, 표적 부위 및 파괴된 저항성 ALS 마커 유전자를 포함하는 적어도 하나의 세포에 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 저항성 ALS 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 저항성 ALS 마커 유전는 폴리뉴클레오티드 변형 주형을 사용하지 않고 클로르설푸론에 대한 저항성을 부여하는 기능적 저항성 ALS 단백질 단백질을 암호화할 수 있는 비파괴 저항성 ALS 마커 유전자로 복원되고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 상기 뉴클레오티드 서열의 변형을 갖는 세포를 클로르설푸론에 대한 저항성을 부여하는 상기 저항성 ALS 단백질에 의해 또는 그에 기초하여 선택하는 단계를 포함하는 방법일 수 있다. 게놈 내 원하는 변형을 포함하는 식물 세포 또는 식물을 선택하기 위해 선택 단계는 식물 세포 또는 식물의 발육 중의 임의의 단계에 식물 세포 또는 상기 식물 세포로부터 유래된 식물에 클로르설푸론을 제공하는 단계를 포함할 수 있다.

도입 및 선택 단계는 선택 마커 유전자를 포함하는 재조합 DNA 작제물과 같은 선택 마커 유전자의 도입을 포함하지 않는다. 파괴된 선택 마커 유전자는 파괴된 시각적 마커 유전자를 비롯한 임의의 파괴된 마커 유전자일 수 있다. 표적 뉴클레오티드 서열의 변형은 상기 표적 부위에서의 적어도 하나의 뉴클레오티드의 삽입, 적어도 하나의 뉴클레오티드의 결실, 또는 적어도 하나의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택될 수 있다. 상기 방법은 상기 세포에 폴리뉴클레오티드 변형 주형 또는 공여 DNA를 도입하는 단계를 더 포함할 수 있으며, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하고, 상기 공여 DNA는 상기 표적 부위에 삽입될 적어도 하나의 관심 폴리뉴클레오티드를 포함한다.

임의의 유도 엔도뉴클레아제가 본원에 개시된 방법에 이용될 수 있다. 이러한 엔도뉴클레아제는 Cas 및 Cpf1 엔도뉴클레아제를 포함하나, 이에 한정되는 것은 아니다. 특정 PAM 서열을 인식할 수 있고(예를 들어, 2015년 5월 15일 출원된 미국 특허 출원 62/162377 및 2015년 5월 15일 출원된 62/162353 및 Zetsche B et al. 2015. Cell 163, 1013 참조), 특정 위치에서 표적 DNA를 절단할 수 있는 많은 엔도뉴클레아제가 지금까지 기술되었다. 유도 Cas 시스템을 활용하는 본원에 기술된 방법 및 구현예를 기초로, 이제는 임의의 유도 엔도뉴클레아제 시스템을 활용할 수 있도록 이들 방법을 조정할 수 있다는 것이 이해된다. 예를 들어, 본원에 기술된 세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하는 방법을, 유도 Cas 엔도뉴클레아제 복합체 대신 유도 Cpf1 엔도뉴클레아제 복합체를 도입하여 파괴된 유전자를 복원하는 단계 및 기능성 유전자 산물을 생성하는 단계를 포함하는 방법에 응용하는 것을 구상할 수 있다. 본원에 개시된 방법에 사용되는 다른 유도 엔도뉴클레아제 및 뉴클레오티드-단백질 복합체는 WO 2013/088446에 기술된 것들을 포함한다.

엔도뉴클레아제는 폴리뉴클레오티드 사슬 내 포스포디에스테르 결합을 절단하는 효소로서, 염기를 손상시키지 않고 특정 부위에서 DNA를 절단하는 제한 엔도뉴클레아제를 포함한다. 제한 엔도뉴클레아제는 I형, II형, III형, 및 IV형 엔도뉴클레아제를 포함하고, 이들은 하위유형을 더 포함한다. I형 및 III형 시스템에서는, 메틸라아제 활성과 제한 활성 모두 단일 복합체에 포함된다. 엔도뉴클레아제는 호밍 엔도뉴클레아제(HEase)로도 알려진 메가뉴클레아제도 포함하는데, 이는 제한 엔도뉴클레아제처럼 특정 인식 부위에서 결합하고 절단하지만, 메가뉴클레아제에 대한 인식 부위는 약 18 bp 이상으로 일반적으로 더 길다(2012년 3월 22일 출원된 특허 출원 WO-PCT PCT/US12/30061). 메가뉴클레아제는 보존된 서열 모티프에 기초하여 4개의 계열로 분류되었는데, 그 계열은 LAGLIDADG, GIY-YIG, H-N-H, 및 His-Cys 박스 계열이다. 이들 모티프는 금속 이온의 조정 및 포스포디에스테르 결합의 가수분해에 관여한다. HEase는 긴 인식 부위, 및 DNA 기질에서 일부 서열 다형성에 내성이 있는 것으로 유명하다. 메가뉴클레아제에 대한 명명 규칙은 다른 제한 엔도뉴클레아제에 대한 규칙과 유사하다. 메가뉴클레아제는 또한, 독립형 ORF, 인트론, 및 인테인에 의해 각각 암호화되는 효소에 대한 접두사 F-, I-, 또는 PI-를 특징으로 한다. 재조합 프로세스에서 하나의 단계는 인식 부위 또는 그 근처에서의 폴리뉴클레오티드 절단을 포함한다. 이 절단 활성은 이중 가닥 절단을 생성하는 데 이용될 수 있다. 부위 특이적 재조합효소 및 그 인식 부위에 대한 검토를 위해서는 Sauer (1994) Curr Op Biotechnol 5:521-7; 및 Sadowski (1993) FASEB 7:760-7을 참조. 일부 예에서, 재조합효소는 인테그라아제 또는 레솔바아제 계열에 속한다.

TAL 이펙터 뉴클레아제는 식물 또는 다른 생물의 게놈 내 특정 표적 서열에서 이중 가닥 절단을 만들기 위해 사용될 수 있는 새로운 클래스의 서열 특이적 뉴클레아제이다(Miller et al. (2011) Nature Biotechnology 29:143-148). 징크 핑거 뉴클레아제(ZFN)는 징크 핑거 DNA 결합 도메인 및 이중 가닥 절단 유도제 도메인으로 이루어진 유전자 조작된 이중 가닥 절단 유도제이다. 인식 부위 특이성은 징크 핑커 도메인에 의해 부여되며, 이는 일반적으로 2, 3, 또는 4개의 징크 핑거를 포함하고, 예를 들어, C2H2 구조를 갖지만, 다른 징크 핑거 구조는 알려져 있고 유전자 조작되었다. 징크 핑거 도메인은 선택된 폴리뉴클레오티드 인식 서열에 특이적으로 결합하는 폴리펩티드를 설계할 수 있다. ZFN은 비특이적 엔도뉴클레아제 도메인, 예를 들어, FokI와 같은 II형 엔도뉴클레아제로부터의 뉴클레아제 도메인에 연결된 유전자 조작된 DNA-결합 징크 핑거 도메인을 포함한다. 전사 활성물질 도메인, 전사 억제물질 도메인, 및 메틸라아제를 포함하여, 추가 기능이 징크 핑거 결합 도메인에 융합될 수 있다. 일부 예에서, 절단 활성을 위해 뉴클레아제 도메인의 이합체화가 요구된다. 각각의 징크 핑거는 표적 DNA에서 3개의 연속 염기쌍을 인식한다. 예를 들어, 뉴클레아제의 이합체화 요건 하에, 3-핑거 도메인은 9개 연속 뉴클레오티드의 서열을 인식하고, 18-뉴클레오티드 인식 서열을 결합시키는 데 두 세트의 징크 핑거 트리플렛이 사용된다.

DNA 이중 가닥 절단(DSB) 기술(ZFN, TALEN 및 CRISPR-Cas)은 학술 연구, 유전자 치료, 및 동물 및 식물 육종 프로그램에 폭넓게 응용된다. 이러한 기술은 옥수수, 밀, 대두 및 벼와 같은 주요 작물을 비롯한, 여러 식물 종에서 게놈 변형을 도입하는 데 성공적으로 이용되어 왔다. 식물 게놈 편집은 현재의 형질전환 및 게놈 변형 방법, DNA 전달 효율, 및 낮은 빈도의 식물 재생에 의해 제한된다. 인간 및 동물 시스템과 달리, 모든 식물 세포를 둘러싼 두꺼운 벽의 존재는 근본적으로 식물 형질전환 및 식물 유전자 변형 프로토콜에 영향을 미친다. 이 세포벽은 포유류 게놈 편집 실험에서 핵산 및/또는 단백질 전달에 광범위하게 사용되는 형질감염 또는 전기천공을 사용할 수 없게 한다. 이러한 이유로 인해, 식물 형질전환 및 식물 게놈 변형은 주로 DNA 벡터 상의 가이드 RNA/Cas 엔도뉴클레아제 시약의 아그로박테리움 매개 전달 및 바이올리스틱 전달(탄도 전달)에 의존한다. 그 결과, gRNA 및 Cas9 발현 카세트는 종종 게놈에 통합되고, 잠재적으로 유전자 파괴, 식물 모자이크 현상, 및 잠재적인 부위 이탈 절단으로 이어진다. 이러한 원치 않는 2차 변화는 야생형 모체 식물에 대한 몇 차례의 여교배(backcrossing)에 의해 분리될 수 있지만, 이 과정은 특히, 배수체 게놈이 복잡하고 번식 주기가 긴, 예컨대, 이에 한정되는 것은 아니지만, 대두 및 밀과 같은 작물의 경우 시간 소모적일 수 있다. 본원에 기술된 바와 같이, Cas 엔도뉴클레아제 및 gRNA를 RGEN 복합체 형태로 식물 세포 내에 전달하면 이러한 부작용들을 많이 완화할 수 있다(실시예 11 내지 12). 식물에서 RGEN 복합체의 전달에 의해 촉진되는 예기치 않은 높은 빈도의 NHEJ 매개 돌연변이유발은 실시예 10에 기술되어 있다. RGEN 복합체를 이용한 이러한 높은 빈도의 돌연변이유발을 감안할 때, DNA-프리 및 선택 마커-프리 유전자 변형은 유전자 녹아웃을 생성하는 실용적인 접근법이 될 수 있다. 이러한 DNA-프리 및 선택 마커-프리 접근법은 식물 체세포에서의 낮은 빈도의 HDR 경로로 인해, (NHEJ에 의한 유전자 돌연변이에 비해) 유전자 편집 및 유전자 삽입에 덜 실용적일 수 있다. 또한, DNA 분자는 종종 표적 DSB 부위에 통합되어, 유전자 편집, 특히 유전자 삽입의 효율을 감소시킨다. 식물 세포 내에 전달된 유전자(예를 들어, Cas9, gRNA, 선택 마커 유전자 및 형질 유전자)를 암호화하는 DNA 벡터는 동일한 DSB 부위에 공동으로 통합되는 경향이 있어, 부위 특이적 형질 유전자 삽입을 가진 이용 가능한 사건의 빈도를 급격히 줄이는 것으로 입증되었다. 전달 DNA 분자를 공여 DNA(예를 들어, 상동성 암을 가진 형질 유전자)로 제한하면 바람직한 유전자형을 가진 사건의 확률을 증가시킬 수 있다. 따라서, RGEN 전달시 활성화될 수 있는 파괴된(불활성) 내인성 또는 미리 통합된 선택 마커 유전자의 본원에 기술된 개념은 유전자 편집 및 유전자 삽입을 위한 DNA-프리 및 선택 마커-프리 접근법을 매우 실용적이 되도록 할 수 있다.

가이드 폴리뉴클레오티드는 당업계에 알려진 임의의 방법, 예컨대, 이에 한정되는 것은 아니지만, 유전자총, 휘스커 매개 형질전환, 아그로박테리움 형질전환 또는 국소 처리법을 이용하여 단일 가닥 폴리뉴클레오티드 또는 이중 가닥 폴리뉴클레오티드로서 세포에 직접 도입될 수 있다. 가이드 RNA는 세포에서 가이드 RNA를 전사시킬 수 있는 특정 프로모터에 작동 가능하게 연결된, 가이드 RNA를 암호화하는 이종 핵산 단편을 포함하는 재조합 DNA 분자를 (이에 한정되는 것은 아니지만, 유전자총 또는 아그로박테리움 형질전환과 같은 방법을 통해) 도입함으로써 세포에 간접적으로 도입될 수도 있다. 특정 프로모터는 정확하게 정의된 변형되지 않은 5'-말단 및 3'-말단을 갖는 RNA의 전사를 가능하게 하는 RNA 중합효소 III 프로모터일 수 있으나, 이에 한정되는 것은 아니다(DiCarlo et al., Nucleic Acids Res. 41: 4336-4343; Ma et al., Mol. Ther. Nucleic Acids 3:e161). 본원에 기술된 바와 같이, 식물 세포로의 sgRNA의 직접 전달은 입자 매개 전달을 통해 달성될 수 있다. 본원에 기술된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대, 이에 한정되는 것은 아니지만, 폴리에틸렌 글리콜(PEG) 매개 원형질체로의 형질감염, 휘스커 매개 형질전환, 전기천공, 유전자총, 세포 침투성 펩티드, 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 식물 세포에서 gRNA를 전달하기 위해 성공적으로 이용될 수 있음을 구상할 수 있다.

가이드 폴리뉴클레오티드는 가이드 폴리뉴클레오티드의 화학적 합성(예컨대, 이에 한정되는 것은 아니지만, Hendel et al. 2015, Nature Biotechnology 33, 985-989), 시험관내 생성 가이드 폴리뉴클레오티드, 및/또는 자가 스플라이싱 가이드 RNA(예컨대, 이에 한정되는 것은 아니지만, Xie et al. 2015, PNAS 112:3570-3575)를 비롯하여, 당업계에 공지된 임의의 방법에 의해 생성될 수 있다.

용어 "표적 부위", "표적 서열", "표적 부위 서열", "표적 DNA", "표적 유전자좌", "게놈 표적 부위", "게놈 표적 서열", "게놈 표적 유전자좌" 및 "프로토스페이서"는 본원에서 상호교환적으로 사용되며, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체가 인식하고 결합하고 선택적으로 닉킹 또는 절단할 수 있는 세포 게놈 내 폴리뉴클레오티드 서열, 예컨대, 이에 한정되는 것은 아니지만, 염색체, 에피솜, 유전자이식 유전자좌, 또는 임의의 다른 DNA 분자(염색체 DNA, 엽록체 DNA, 미토콘드리아 DNA, 플라스미드 DNA를 포함) 상의 뉴클레오티드 서열을 지칭한다. 표적 부위는 세포 게놈 내의 내인성 부위일 수 있거나, 또는 대안적으로, 표적 부위가 세포에 이종이어서 세포의 게놈에서 자연 발생하지 않을 수 있거나, 또는 자연에서 일어나는 경우에 비해 이종 게놈 위치에서 표적 부위가 발견될 수 있다. 본원에 사용된 용어 "내인성 표적 서열" 및 "고유 표적 서열"은 세포의 게놈에 내인성이거나 고유한 표적 서열로서, 세포 게놈 내 표적 서열의 내인성 또는 고유 위치에 있는 표적 서열을 지칭하기 위해 본원에서 상호교환적으로 사용된다. 세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적 효모 및 식물의 세포뿐만 아니라 본원에 기술된 방법에 의해 제조된 식물 및 종자를 포함하나, 이에 한정되는 것은 아니다. "인공 표적 부위" 또는 "인공 표적 서열"은 본원에서 상호교환적으로 사용되며, 세포 게놈에 도입된 표적 서열을 지칭한다. 이러한 인공 표적 서열은 세포 게놈 내의 내인성 또는 고유 표적 서열과 동일한 서열일 수 있지만, 세포 게놈에서 상이한 위치(즉, 비내인성 또는 비고유한 위치)에 위치할 수 있다.

"변경된 표적 부위", "변경된 표적 서열", "변형된 표적 부위", "변형된 표적 서열"은 본원에서 상호교환적으로 사용되며, 변경되지 않은 표적 서열에 비해 적어도 하나의 변경을 포함하는 본원에 개시된 바와 같은 표적 서열을 지칭한다. 이러한 "변경"은, 예를 들어, (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.

표적 DNA 서열(표적 부위)의 길이는 변할 수 있으며, 예를 들어, 길이가 적어도 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상 뉴클레오티드인 표적 부위를 포함한다. 표적 부위는 회문구조(palindromic)일 수도 있다. 즉, 한 가닥 상에 있는 서열은 상보적 가닥에서 반대 방향으로 동일하게 해독된다. 닉/절단 부위는 표적 서열 내에 존재할 수 있거나, 닉/절단 부위가 표적 서열 외부에 존재할 수 있다. 다른 변형예에서, 절단은 서로 바로 마주 보는 뉴클레오티드 위치에서 발생하여 블런트 엔드 컷을 생성할 수 있거나, 또는 다른 경우, 절개가 틀어져 5' 오버행 또는 3' 오버행일 수 있는, "접착성 말단"(sticky ends)이라고도 불리는, 단일 가닥 오버행을 생성할 수 있다. 게놈 표적 부위의 활성 변이체가 사용될 수도 있다. 이러한 활성 변이체는 주어진 표적 부위와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있고, 활성 변이체는 생물학적 활성을 보유함으로써 Cas 엔도뉴클레아제에 의해 인식되고 절단될 수 있다. 엔도뉴클레아제에 의한 표적 부위의 단일 또는 이중 가닥 절단을 측정하기 위한 분석법은 당업계에 공지되어 있으며, 일반적으로 인식 부위를 포함하는 DNA 기질 상에서 작용제의 전체 활성 및 특이성을 측정한다.

본원의 "프로토스페이서 인접 모티프"(PAM)는 본원에 기술된 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템에 의해 인식(표적화)되는 표적 서열(프로토스페이서)에 인접한 짧은 뉴클레오티드 서열을 지칭한다. 표적 DNA 서열 다음에 PAM 서열이 없는 경우 Cas 엔도뉴클레아제는 표적 DNA 서열을 성공적으로 인식하지 않을 수 있다. 본원의 PAM의 서열과 길이는 사용되는 Cas 단백질 또는 Cas 단백질 복합체에 따라 다를 수 있다. PAM 서열은 임의의 길이일 수 있지만, 일반적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드의 길이이다.

용어 "표적화", "유전자 표적화" 및 "DNA 표적화"는 본원에서 상호교환적으로 사용된다. 본원의 DNA 표적화는 세포의 염색체 또는 플라스미드에서와 같은 특정 DNA 서열에서의 녹아웃, 편집, 또는 녹인의 특이적 도입일 수 있다. 일반적으로, DNA 표적화는 본원에서 Cas 단백질이 적합한 폴리뉴클레오티드 성분과 결합된 세포의 특정 DNA 서열에서 하나 또는 두 가닥을 절단함으로써 수행될 수 있다. 이러한 DNA 절단은, 이중 가닥 절단(DSB)의 경우 표적 부위에서 변형을 초래할 수 있는 NHEJ 또는 HDR 프로세스를 유도할 수 있다.

용어 "녹아웃", "유전자 녹아웃" 및 "유전적 녹아웃"은 본원에서 상호교환적으로 사용된다. 녹아웃은 Cas 단백질로 표적화함으로써 부분적으로 또는 완전히 작동하지 않게 된 세포의 DNA 서열을 나타내며, 녹아웃 이전의 이러한 DNA 서열은, 예를 들어, 아미노산 서열을 암호화할 수 있었거나 조절 기능(예를 들어, 프로모터)을 가졌을 수 있다. 녹아웃은 삽입-결실(NHEJ를 통한 표적 DNA 서열에서의 뉴클레오티드 염기의 삽입 또는 결실)에 의해, 또는 표적화 부위 또는 그 근처에서 서열의 기능을 감소시키거나 완전히 파괴하는 서열의 특이적 제거에 의해 생성될 수 있다.

가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템은 공동으로 전달된 폴리뉴클레오티드 변형 주형과 조합하여 사용되어 관심 게놈 뉴클레오티드 서열의 편집(변형)을 가능하게 한다(그 전체가 본원에 참조로 포함되는, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1 및 2015년 2월 26일 공개된 WO2015/026886 A1을 또한 참조).

"변형된 뉴클레오티드" 또는 "편집된 뉴클레오티드"는 변형되지 않은 뉴클레오티드 서열에 비해 적어도 하나의 변경을 포함하는 관심 뉴클레오티드 서열을 지칭한다. 이러한 "변경"은, 예를 들어, (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.

용어 "폴리뉴클레오티드 변형 주형"은 편집될 뉴클레오티드 서열에 비해 적어도 하나의 뉴클레오티드 변형을 포함하는 폴리뉴클레오티드를 포함한다. 뉴클레오티드 변형은 적어도 하나의 뉴클레오티드 치환, 추가 또는 결실일 수 있다. 선택적으로, 폴리뉴클레오티드 변형 주형은 적어도 하나의 뉴클레오티드 변형에 플랭킹한 상동 뉴클레오티드 서열을 더 포함할 수 있고, 플랭킹한 상동 뉴클레오티드 서열은 편집될 원하는 뉴클레오티드 서열에 충분한 상동성을 제공한다.

폴리뉴클레오티드 변형 주형은 당업계에 공지된 임의의 방법, 예컨대, 이에 한정되는 것은 아니지만, 일시적 도입 방법, 형질감염, 전기천공, 미세주입, 입자 매개 전달, 국소 처리법, 휘스커 매개 전달, 세포 침투성 펩티드를 통한 전달, 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 전달에 의해 세포에 도입될 수 있다.

폴리뉴클레오티드 변형 주형은 단일 가닥 폴리뉴클레오티드 분자로서, 이중 가닥 폴리뉴클레오티드 분자로서, 또는 원형 DNA(벡터 DNA)의 일부로서 세포에 도입될 수 있다. 폴리뉴클레오티드 변형 주형은 또한 가이드 RNA 및/또는 Cas 엔도뉴클레아제에 테더링될 수 있다. 테더링된 DNA는, 게놈 편집 및 표적화된 게놈 조절에 유용한, 표적과 주형 DNA의 공동 국재화를 가능하게 할 수 있고, 내인성 HR 기구의 기능이 매우 약해질 것으로 예상되는 유사분열후 세포를 표적화하는 데에도 유용할 수 있다(Mali et al. 2013 Nature Methods Vol. 10 : 957-963). 폴리뉴클레오티드 변형 주형은 세포에 일시적으로 존재할 수 있거나, 바이러스성 레플리콘을 통해 도입될 수 있다.

편집될 뉴클레오티드는 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위 내에 또는 외부에 위치할 수 있다. 일 구현예에서, 적어도 하나의 뉴클레오티드 변형은 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위에서의 변형이 아니다. 다른 구현예에서, 편집될 적어도 하나의 뉴클레오티드와 게놈 표적 부위 사이에는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 900 또는 1000개의 뉴클레오티드가 존재한다.

게놈 편집은 이용 가능한 임의의 유전자 편집 방법을 이용하여 수행될 수 있다. 예를 들어, 유전자 편집은 숙주 세포의 게놈 내 유전자에 표적화된 변형을 포함하는 폴리뉴클레오티드 변형 주형(때로는 유전자 복구 올리고뉴클레오티드라고도 함)을 숙주 세포에 도입함으로써 수행될 수 있다. 이러한 방법에 사용하기 위한 폴리뉴클레오티드 변형 주형은 단일 가닥 또는 이중 가닥일 수 있다. 이러한 방법의 예는, 예를 들어, US 공개 2013/0019349호에 일반적으로 기술되어 있다.

본 발명의 일 구현예에서, 상기 방법은 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서, 표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 적어도 하나의 폴리뉴클레오티드 변형 주형, 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 마커 단백질에 의해 선택하는 단계를 포함하는 방법을 포함한다. 도입 및 선택 단계는 선택 마커 유전자를 포함하는 재조합 DNA 작제물과 같은 선택 마커 유전자의 도입을 포함하지 않는다. 파괴된 선택 마커 유전자는 파괴된 시각적 마커 유전자를 비롯한 임의의 파괴된 마커 유전자일 수 있다.

본원에 기술된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대, 이에 한정되는 것은 아니지만, 폴리에틸렌 글리콜(PEG) 매개 원형질체로의 형질감염, 휘스커 매개 형질전환, 전기천공, 유전자총, 세포 침투성 펩티드, 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 식물 세포에서 폴리뉴클레오티드 변형 주형을 전달하기 위해 성공적으로 이용될 수 있음을 구상할 수 있다.

일부 구현예에서, 유전자 편집은 원하는 변경에 가까운 게놈 내 정의된 위치에서 이중 가닥 절단(DSB)을 유도함으로써 용이하게 될 수 있다. DSB는, 이에 한정되는 것은 아니지만, TALEN, 메가뉴클레아제, 징크 핑거 뉴클레아제, 핵산 유도-엔도뉴클레아제 시스템, 예를 들어, Cas9-gRNA 시스템(박테리아 CRISPR-Cas 시스템 기반) 등을 포함하여 이용 가능한 임의의 DSB 유도제를 사용하여 유도될 수 있다. 일부 구현예에서, DSB의 도입은 폴리뉴클레오티드 변형 주형의 도입과 결합될 수 있다.

DSB와 변형 주형을 결합한 게놈 서열 편집 방법은 일반적으로, 염색체 서열 내 표적 서열을 인식하고 게놈 서열에서 DSB를 유도할 수 있는 DSB 유도제, 또는 DSB 유도제를 암호화하는 핵산, 및 편집될 뉴클레오티드 서열에 비해 적어도 하나의 뉴클레오티드 변경을 포함하는 적어도 하나의 폴리뉴클레오티드 변형 주형을 숙주 세포에 도입하는 단계를 포함한다. 폴리뉴클레오티드 변형 주형은 적어도 하나의 뉴클레오티드 변경에 플랭킹한 뉴클레오티드 서열을 더 포함할 수 있고, 플랭킹한 서열은 DSB에 플랭킹한 염색체 영역과 실질적으로 상동성이다. Cas9-gRNA 복합체와 같은 DSB 유도제를 이용한 게놈 편집은, 예를 들어, 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1, 2015년 2월 26일 공개된 WO2015/026886 A1, 2014년 7월 7일 출원된 미국 출원 62/023246, 및 2014년 8월 13일 출원된 미국 출원 62/036,652에 기술되었으며, 이들 모두는 본원에 참조로 포함된다.

폴리뉴클레오티드 변형 주형을 사용하지 않고 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법이 본원에 기술된다.

유도 Cas 엔도뉴클레아제 시스템 및 폴리뉴클레오티드 변형 주형을 이용해 표적 서열 또는 표적 서열 근처의 관심 뉴클레오티드를 변형하는 유전자 편집은 비상동 말단 연결(NHEJ)의 빈도에 비해 식물 세포에서 더 낮은 빈도로 일어나는 상동 재조합/상동성 유도 복구(HDR) 메커니즘에 의존한다. HDR 유형의 메커니즘에 의존할 필요 없이 유전자 편집의 빈도를 증가시키는 것이 바람직할 것이다. 파괴된 유전자의 복원에 의존함으로써 폴리뉴클레오티드 변형 주형을 사용하지 않고 유전자 편집을 가능하게 하는 방법으로서, 이중 가닥 절단 부위에 적어도 단일 염기를 삽입시키는 비상동 말단 연결(NHEJ)에 의해 복원이 달성되거나, 상동 재조합 또는 상동성 유도 복구를 이용하지 않고 이중 가닥 절단 부위에 적어도 단일 염기를 삽입하여 복원이 달성되는 방법이 본원에 기술된다.

용어 "녹인", "유전자 녹인" 및 "유전적 삽입" 및 "유전적 녹인"은 본원에서 상호교환적으로 사용된다. 녹인은 (적절한 공여 DNA 폴리뉴클레오티드도 사용되는 경우, HR에 의해) Cas 단백질로 표적화함으로써 세포의 특정 DNA 서열에서 DNA 서열을 치환하거나 삽입하는 것을 나타낸다. 녹인의 예는 유전자의 암호화 영역에 이종 아미노산 코딩 서열의 특이적 삽입, 또는 유전자좌에 전사 조절 요소의 특이적 삽입이다.

Cas 엔도뉴클레아제에 대한 표적 부위에 삽입되는 관심 폴리뉴클레오티드를 갖는 세포 또는 생물을 얻기 위해 다양한 방법 및 조성을 이용할 수 있다. 이러한 방법은 상동 재조합을 이용하여 표적 부위에서 관심 폴리뉴클레오티드의 통합을 제공할 수 있다. 제공되는 하나의 방법에서, 관심 폴리뉴클레오티드는 공여 DNA 작제물로 생물 세포에 제공된다.

본원에 사용된 "공여 DNA"는 Cas 엔도뉴클레아제의 표적 부위에 삽입될 관심 폴리뉴클레오티드를 포함하는 DNA 작제물에 대한 언급을 포함한다. 공여 DNA 작제물은 관심 폴리뉴클레오티드에 플랭킹한 제1 상동 영역 및 제2 상동 영역을 더 포함할 수 있다. 공여 DNA의 제1 상동 영역 및 제2 상동 영역은 세포 또는 생물 게놈의 표적 부위에 존재하거나 거기에 플랭킹한 제1 게놈 영역 및 제2 게놈 영역에 대해 각각 상동성을 공유한다. 공여 DNA는 가이드 폴리뉴클레오티드 및/또는 Cas 엔도뉴클레아제에 테더링될 수 있다. 테더링된 공여 DNA는, 게놈 편집 및 표적화된 게놈 조절에 유용한, 표적과 공여 DNA의 공동 국재화를 가능하게 할 수 있고, 내인성 HR 기구의 기능이 매우 약해질 것으로 예상되는 유사분열후 세포를 표적화하는 데에도 유용할 수 있다(Mali et al. 2013 Nature Methods Vol. 10 : 957-963).

"상동성"이란 유사한 DNA 서열을 의미한다. 예를 들어, 공여 DNA에서 발견되는 "게놈 영역에 대한 상동 영역"은 세포 또는 생물 게놈의 주어진 "게놈 영역"과 유사한 서열을 갖는 DNA 영역이다. 상동 영역은 절단된 표적 부위에서 상동 재조합을 촉진시키기에 충분한 임의의 길이일 수 있다. 예를 들어, 상동 영역이 해당 게놈 영역과 상동 재조합을 겪기에 충분한 상동성을 갖도록, 상동 영역은 적어도 5~10, 5~15, 5~20, 5~25, 5~30, 5~35, 5~40, 5~45, 5~50, 5~55, 5~60, 5~65, 5~70, 5~75, 5~80, 5~85, 5~90, 5~95, 5~100, 5~200, 5~300, 5~400, 5~500, 5~600, 5~700, 5~800, 5~900, 5~1000, 5~1100, 5~1200, 5~1300, 5~1400, 5~1500, 5~1600, 5~1700, 5~1800, 5~1900, 5~2000, 5~2100, 5~2200, 5~2300, 5~2400, 5~2500, 5~2600, 5~2700, 5~2800, 5~2900, 5~3000, 5~3100개 이상 염기의 길이를 포함할 수 있다. "충분한 상동성"은 2개의 폴리뉴클레오티드 서열이 상동 재조합 반응을 위한 기질로서 작용하기에 충분한 구조적 유사성을 갖는다는 것을 나타낸다. 구조적 유사성은 각 폴리뉴클레오티드 단편의 전체 길이뿐만 아니라 폴리뉴클레오티드의 서열 유사성을 포함한다. 서열 유사성은, 서열의 전체 길이에 걸친 백분율 서열 동일성, 및/또는 100% 서열 동일성을 갖는 연속된 뉴클레오티드와 같은 국부적 유사성을 포함하는 보존 영역, 및 서열의 일부 길이에 걸친 백분율 서열 동일성에 의해 설명될 수 있다.

표적 및 공여 폴리뉴클레오티드가 공유하는 상동성 또는 서열 동일성의 양은 변할 수 있으며, 약 1~20 bp, 20~50 bp, 50~100 bp, 75~150 bp, 100~250 bp, 150~300 bp, 200~400 bp, 250~500 bp, 300~600 bp, 350~750 bp, 400~800 bp, 450~900 bp, 500~1000 bp, 600~1250 bp, 700~1500 bp, 800~1750 bp, 900~2000 bp, 1~2.5 kb, 1.5~3 kb, 2~4 kb, 2.5~5 kb, 3~6 kb, 3.5~7 kb, 4~8 kb, 5~10 kb, 또는 표적 부위의 전체 길이까지를 포함하는 범위의 단위 적분 값을 갖는 총 길이 및/또는 영역을 포함한다. 이 범위에는 범위 내의 모든 정수가 포함되고, 예를 들어, 1~20 bp 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 bp를 포함한다. 상동성의 양은 2개의 폴리뉴클레오티드의 전체 정렬 길이에 걸친 백분율 서열 동일성에 의해 설명될 수도 있는데, 이는 약 적어도 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 백분율 서열 동일성을 포함한다. 충분한 상동성은 폴리뉴클레오티드 길이, 전체 백분율 서열 동일성, 및 선택적으로, 연속된 뉴클레오티드의 보존 영역 또는 국소 백분율 서열 동일성의 임의의 조합을 포함하며, 예를 들어, 충분한 상동성은 표적 유전자좌의 영역과 적어도 80% 서열 동일성을 갖는 75~150 bp의 영역으로써 설명될 수 있다. 충분한 상동성은 매우 엄격한 조건 하에서 2개의 폴리뉴클레오티드의 특이적 혼성화 능력 예측에 의해 설명될 수도 있다(예를 들어, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. 및 John Wiley & Sons, Inc.); 및 Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, New York) 참조).

본원에서 사용된 "게놈 영역"은 표적 부위의 어느 한 면에 존재하거나 대안적으로 표적 부위의 일부도 포함하는 세포 게놈 내 염색체의 분절이다. 게놈 영역이 해당 상동 영역과 상동 재조합을 겪기에 충분한 상동성을 갖도록, 게놈 영역은 적어도 5~10, 5~15, 5~20, 5~25, 5~30, 5~35, 5~40, 5~45, 5~50, 5~55, 5~60, 5~65, 5~70, 5~75, 5~80, 5~85, 5~90, 5~95, 5~100, 5~200, 5~300, 5~400, 5~500, 5~600, 5~700, 5~800, 5~900, 5~1000, 5~1100, 5~1200, 5~1300, 5~1400, 5~1500, 5~1600, 5~1700, 5~1800, 5~1900, 5~2000, 5~2100, 5~2200, 5~2300, 5~2400, 5~2500, 5~2600, 5~2700, 5~2800, 5~2900, 5~3000, 5~3100 이상의 염기를 포함할 수 있다.

관심 폴리뉴클레오티드 및/또는 형질은, 본원에 참조로 포함되는 2013년 10월 3일 공개된 US-2013-0263324-A1 및 2013년 1월 24일 공개된 PCT/US13/22891에 기재된 바와 같이, 복합 형질 유전자좌에 함께 쌓일 수 있다. 본원에 기술된 가이드 폴리뉴클레오티드/Cas9 엔도뉴클레아제 시스템은 이중 가닥 절단을 생성하는 데 효율적인 시스템을 제공하고, 복합 형질 유전자좌에 형질이 쌓이도록 할 수 있다.

가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템은 하나 이상의 가이드 폴리뉴클레오티드, 하나의 Cas 엔도뉴클레아제, 및 선택적으로 하나 이상의 공여 DNA를 식물 세포에 도입함으로써, 하나 이상의 관심 폴리뉴클레오티드 또는 하나 이상의 관심 형질을 하나 이상의 표적 부위에 도입하는 데 사용될 수 있다(본원에 참조로 포함되는 2015년 3월 19일 공개된 미국 특허 출원 US-2015-0082478-A1에 기재된 바와 같음). 상기 하나 이상의 표적 부위에서 변경을 포함하는 식물 세포로부터 가임성 식물이 생성될 수 있고, 변경은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다. 이러한 변경된 표적 부위를 포함하는 식물은 동일한 복합 형질 유전자좌에 적어도 하나의 관심 유전자 또는 형질을 포함하는 식물과 교배됨으로써 상기 복합 형질 유전자좌에 형질을 더 쌓을 수 있다(본원에 참조로 포함되는, 2013년 10월 3일 공개된 US-2013-0263324-A1 및 2013년 1월 24일 공개된 PCT/US13/22891을 또한 참조).

주어진 게놈 영역과 공여 DNA에서 발견되는 해당 상동 영역 사이의 구조적 유사성은 상동 재조합이 일어날 수 있게 하는 임의의 서열 동일성의 정도가 될 수 있다. 예를 들어, 공여 DNA의 "상동 영역"과 생물 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 서열이 상동 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성을 가질 수 있다.

공여 DNA상의 상동 영역은 표적 부위에 플랭킹한 임의 서열과 상동성을 가질 수 있다. 일부 구현예에서 상동 영역들은 표적 부위 바로 옆의 게놈 서열과 상당한 서열 상동성을 공유하지만, 상동 영역은 표적 부위에 추가로 5' 또는 3'일 수 있는 영역에 충분한 상동성을 갖도록 설계될 수 있는 것으로 인정된다. 또 다른 구현예에서, 상동 영역은 하류 게놈 영역과 함께 표적 부위의 단편과 상동성을 가질 수도 있다. 하나의 구현예에서, 제1 상동 영역은 표적 부위의 제1 단편을 추가로 포함하고, 제2 상동 영역은 표적 부위의 제2 단편을 포함하며, 제1 단편 및 제 2 단편은 상이하다.

이중 가닥 절단이 DNA에 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 절단을 복구한다. 비상동 말단 연결(NHEJ) 경로는 절단 말단을 합치는 가장 일반적인 복구 메커니즘이다(Bleuyard et al., (2006) DNA Repair 5:1-12). 염색체의 구조적 완전성은 복구에 의해 일반적으로 보존되지만, 결실, 삽입, 또는 다른 재배열이 일어날 수 있다. 하나의 이중 가닥 절단의 두 말단이 NHEJ의 가장 일반적인 기질이지만(Kirik et al., (2000) EMBO J 19:5562-6), 두 개의 상이한 이중 가닥 절단이 발생하는 경우, 상이한 절단의 자유 말단이 연결되어 염색체 결실(Siebert and Puchta, (2002) Plant Cell 14:1121-31), 또는 상이한 염색체 간의 염색체 전좌(Pacher et al., (2007) Genetics 175:21-9)초래할 수 있다. 오류가 발생하기 쉬운 DNA 복구 메커니즘은 이중 가닥 절단 부위에서 돌연변이를 일으킬 수 있다. 비상동 말단 연결(NHEJ) 경로는 절단 말단을 합치는 가장 일반적인 복구 메커니즘이다(Bleuyard et al., (2006) DNA Repair 5:1-12).

대안적으로, 이중 가닥 절단은 상동 DNA 서열들 간의 상동 재조합(HR)에 의해 복구될 수 있다. 예를 들어, 이중 가닥 절단의 성숙과 관련된 엑소뉴클레아제 활성에 의해 이중 가닥 절단 주위의 서열이 일단 변경되면, 비분열 체세포에서의 상동 염색체, 또는 DNA 복제 후 자매 염색분체와 같은 상동 서열이 이용 가능하다면 유전자 전환 경로는 원래의 구조를 복원할 수 있다(Molinier et al., (2004) Plant Cell 16:342-52). 이소성 및/또는 후성적 DNA 서열이 상동 재조합을 위한 DNA 복구 주형으로서 작용할 수도 있다(Puchta, (1999) Genetics 152:1173-81). 에피솜 DNA 분자가 이중 가닥 절단에 연결될 수도 있다(예컨대, 염색체 이중 가닥 절단에의 T-DNA의 통합)(Chilton and Que, (2003) Plant Physiol 133:956-65; Salomon and Puchta, (1998) EMBO J 17:6086-95).

본원에 사용된 "상동 재조합(HR)"은 상동 부위에서 2개의 DNA 분자 간의 DNA 단편의 교체를 포함한다. 상동 재조합의 빈도는 여러 인자에 영향을 받는다. 서로 다른 생물은 상동 재조합의 양 및 상동 재조합과 비상동 재조합의 상대 비율이 다르다. 일반적으로, 상동 영역의 길이는 상동 재조합 사건의 빈도에 영향을 미친다: 상동 영역이 길수록 빈도는 더 커진다. 상동 재조합을 관찰하는 데 필요한 상동 영역의 길이도 종에 따라 다르다. 많은 경우에, 적어도 5 kb의 상동성이 이용되었지만, 상동 재조합은 25~50 bp만큼의 적은 상동성으로 관찰되었다. 예를 들어, Singer et al., (1982) Cell 31:25-33; Shen and Huang, (1986) Genetics 112:441-57; Watt et al., (1985) Proc. Natl. Acad. Sci. USA 82:4768-72, Sugawara and Haber, (1992) Mol Cell Biol 12:563-75, Rubnitz and Subramani, (1984) Mol Cell Biol 4:2253-8; Ayares et al., (1986) Proc. Natl. Acad. Sci. USA 83:5199-203; Liskay et al., (1987) Genetics 115:161-7 참조.

상동성-유도 복구(homology-directed repair, HDR)는 이중 가닥 및 단일 가닥 DNA 절단을 복구하는 세포의 메커니즘이다. 상동성-유도 복구는 상동 재조합(HR) 및 단일 가닥 어닐링(SSA)을 포함한다(Lieber. 2010 Annu. Rev. Biochem. 79:181-211). 가장 일반적인 형태의 HDR은 상동 재조합(HR)이라고 하며, 공여 DNA와 수용 DNA 간의 가장 긴 서열 상동성 요건을 갖는다. 다른 형태의 HDR은 단일 가닥 어닐링(SSA) 및 절단 유도 복제를 포함하며, 이들은 HR에 비해 더 짧은 서열 상동성을 필요로 한다. 닉(단일 가닥 절단)에서의 상동성-유도 복구는 이중 가닥 절단에서의 HDR과 구별되는 메커니즘을 통해 일어날 수 있다(Davis and Maizels. PNAS (0027-8424), 111 (10), p. E924-E932).

예를 들어, 상동-유도 복구(HDR)을 통한 식물 세포 게놈의 변경은 유전자 조작을 위한 강력한 도구이다. 고등 식물에서 상동 재조합 빈도가 낮음에도 불구하고, 식물 내인성 유전자의 성공적인 상동 재조합의 몇 가지 예가 있다. 식물에서의 상동 재조합에 대한 파라미터는 도입된 절단된 선택 마커 유전자를 구조하여 주로 조사되었다. 이 실험들에서, 상동 DNA 단편은 일반적으로 0.3 kb 내지 2 kb이었다. 관찰된 상동 재조합 빈도는 10^-4 내지 10^-5 정도였다. 예를 들어, Halfter et al., (1992) Mol Gen Genet 231:186-93; Offringa et al., (1990) EMBO J 9:3077-84; Offringa et al., (1993) Proc. Natl. Acad. Sci. USA 90:7346-50; Paszkowski et al., (1988) EMBO J 7:4021-6; Hourda and Paszkowski, (1994) Mol Gen Genet 243:106-11; 및 Risseeuw et al., (1995) Plant J 7:109-19 참조.

DNA 이중 가닥 절단은 상동 재조합 경로를 활발하게 하는 효과적인 인자일 것으로 보인다(Puchta et al., (1995) Plant Mol Biol 28:281-92; Tzfira and White, (2005) Trends Biotechnol 23:567-9; Puchta, (2005) J Exp Bot 56:1-14). DNA 절단제를 사용하여, 식물의 인공 작제 상동 DNA 반복 서열들 사이에서 상동 재조합의 2배 내지 9배 증가가 관찰되었다(Puchta et al., (1995) Plant Mol Biol 28:281-92). 옥수수 원형질체에서, 선형 DNA 분자를 이용한 실험을 통해 플라스미드들 간의 향상된 상동 재조합이 입증되었다(Lyznik et al., (1991) Mol Gen Genet 230:209-18).

공여 DNA는 당업계에 알려진 임의의 수단에 의해 도입될 수 있다. 예를 들어, 표적 부위를 가진 식물이 제공된다. 공여 DNA는, 예를 들어, 아그로박테리움 매개 형질전환, 휘스커 매개 형질전환, 또는 바이올리스틱 유전자총을 포함하여, 당업계에 알려진 임의의 전달 방법에 의해 제공될 수 있다. 공여 DNA는 세포에 일시적으로 존재할 수 있거나, 바이러스성 레플리콘을 통해 도입될 수 있다. Cas 엔도뉴클레아제 및 표적 부위의 존재 하에, 공여 DNA가 식물의 게놈에 삽입된다.

본원에 기술된 바와 같이, 식물 세포로의 공여 DNA의 직접 전달은 입자 매개 전달을 통해 달성될 수 있다. 본원에 기술된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대, 이에 한정되는 것은 아니지만, 폴리에틸렌 글리콜(PEG) 매개 원형질체로의 형질감염, 전기천공, 유전자총, 휘스커 매개 전달, 세포 침투성 펩티드, 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 식물 세포에서 공여 DNA를 전달하기 위해 성공적으로 이용될 수 있음을 구상할 수 있다.

본 발명의 일 구현예에서, 상기 방법은 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서, 표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 적어도 하나의 공여 DNA, 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 공여 DNA는 상기 표적 부위에 삽입될 적어도 하나의 관심 폴리뉴클레오티드를 포함하고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 마커 단백질에 의해 선택하는 단계를 포함하는 방법을 포함한다. 도입 및 선택 단계는 선택 마커 유전자를 포함하는 재조합 DNA 작제물과 같은 선택 마커 유전자의 도입을 포함하지 않는다. 파괴된 선택 마커 유전자는 파괴된 시각적 마커 유전자를 비롯한 임의의 파괴된 마커 유전자일 수 있다.

가이드 RNA/Cas 엔도뉴클레아제 시스템에 대한 추가 용도는 기술되어 있고(본원에 참조로 포함되는 2015년 3월 19일 공개된 미국 특허 출원 US 2015-0082478 A1, 2015년 2월 26일 공개된 WO2015/026886 A1, 2015년 2월 26일 공개된 US 2015-0059010 A1, 2014년 7월 7일 출원된 미국 출원 62/023246, 및 2014년 8월 13일 출원된 미국 출원 62/036,652 참조), 관심 뉴클레오티드 서열(예컨대, 조절 요소)의 변형 또는 치환, 관심 폴리뉴클레오티드의 삽입, 유전자 녹아웃, 유전자 녹인, 스플라이싱 부위의 변형 및/또는 대체 스플라이싱 부위의 도입, 관심 단백질, 아미노산 및/또는 단백질 융합체를 암호화하는 뉴클레오티드 서열의 변형, 및 관심 유전자 내 역위 반복 서열 발현에 의한 유전자 침묵화를 포함하나, 이에 한정되는 것은 아니다.

관심 폴리뉴클레오티드는 본원에 더 기술되어 있으며, 상업 시장 및 작물 개발에 관여하는 자들의 이익을 반영하는 폴리뉴클레오티드를 포함한다. 관심 작물 및 시장은 변화하며, 개발 도상국이 세계 시장을 개방함에 따라 새로운 작물과 기술 또한 등장할 것이다. 또한, 수확량과 잡종 강세와 같은 작물학적 형질 및 특성에 대한 이해가 높아짐에 따라 유전자 조작을 위한 유전자의 선택은 그에 따라 변할 것이다.

또한, 표적 부위에 통합된 관심 폴리뉴클레오티드를 게놈에 포함하는 하나 이상의 식물 세포를 동정하는 방법이 제공된다. 선별 마커 표현형을 사용하지 않고 표적 부위 또는 그 근처에서 게놈 내 삽입을 가진 식물 세포를 동정하기 위해 다양한 방법을 이용할 수 있다. 이러한 방법은 PCR 방법, 시퀀싱 방법, 뉴클레아제 분해, 서던 블롯, 및 이들의 임의의 조합을 비제한적으로 포함하여, 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 감지하는 것으로 볼 수 있다. 예를 들어, 본원에 기술된 방법에 필요한 정도로 본원에 참조로 포함되는 미국 특허 출원 12/147,834를 참조. 상기 방법은 또한, 게놈에 통합된 관심 폴리뉴클레오티드를 포함하는 식물 세포로부터 식물을 복원하는 단계를 포함한다. 식물은 불임성 또는 가임성일 수 있다. 표적 부위에서 식물 게놈에 통합되고 식물에서 발현되는 임의의 관심 폴리뉴클레오티드가 제공될 수 있는 것으로 인정된다.

관심 폴리뉴클레오티드/폴리펩티드는 제초제 저항성 코딩 서열, 살충 코딩 서열, 살선충 코딩 서열, 항균 코딩 서열, 항진균 코딩 서열, 항바이러스성 코딩 서열, 무생물적 및 생물적 스트레스 내성 코딩 서열, 또는 수확량, 곡물 품질, 양분 함량, 전분 품질 및 양, 질소 고정 및/또는 활용, 지방산, 및 기름 함량 및/또는 조성과 같은 식물 형질을 변형하는 서열을 포함하나, 이에 한정되는 것은 아니다. 보다 구체적인 관심 폴리뉴클레오티드는 작물 수확량을 개선하는 유전자, 작물의 바람직성을 개선하는 폴리펩티드, 가뭄, 질소, 온도, 염분, 독성 금속 또는 미량 원소와 같은 무생물적 스트레스에 대한 저항성을 부여하는 단백질을 암호화하는 유전자, 살충제 및 제초제와 같은 독소에 대한 저항성, 또는 진균, 바이러스, 박테리아, 곤충 및 선충에 의한 공격, 이러한 생물과 관련된 질병의 발달과 같은 생물적 스트레스에 대한 저항성을 부여하는 단백질을 암호화하는 유전자를 포함하나, 이에 한정되는 것은 아니다. 관심 유전자의 일반적인 범주는, 예를 들어, 징크 핑거와 같은 정보 관련 유전자, 키나아제와 같은 전달 관련 유전자, 및 열충격 단백질과 같은 하우스키핑 관련 유전자를 포함한다. 보다 구체적인 이식유전자의 범주는, 예를 들어, 작물학적 특성, 곤충 저항성, 질병 저항성, 제초제 저항성, 가임성 또는 불임성, 곡물 특성 및 상업적 제품에 대한 중요한 형질을 암호화하는 유전자를 포함한다. 관심 유전자는 일반적으로, 기름, 전분, 탄수화물 또는 영양 물질 대사 관련 유전자뿐만 아니라 본원에 기재된 다른 형질, 예컨대, 이에 한정되는 것은 아니지만, 제초제 저항성과 조합하여 쌓이거나 사용될 수 있는 커널 크기, 수크로오스 로딩 등에 영향을 미치는 유전자를 포함한다.

기름, 전분, 및 단백질 함량과 같은 작물학적으로 중요한 형질은 전통적인 육종 방법을 이용하는 것 외에도 유전적으로 변형될 수 있다. 변형은 올레산, 포화 및 불포화 기름 함량 증가, 라이신과 황 수준 증가, 필수 아미노산 도입, 및 전분의 변형도 포함한다. 호르도티오닌 단백질 변형은 본원에 참조로 포함되는 미국 특허 5,703,049호, 5,885,801호, 5,885,802호, 및 5,990,389호에 기재되어 있다.

관심 폴리뉴클레오티드 서열은 질병 저항성 또는 해충 저항성 도입에 관여하는 단백질을 암호화할 수 있다. "질병 저항성" 또는 "해충 저항성"은 식물이 식물 병원균 상호작용의 결과인 유해한 증상을 피한다는 의미이다. 해충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 암호화할 수 있다. 질병 저항성 및 곤충 저항성 유전자, 예컨대, 항균성 보호를 위한 리소자임 또는 세크로핀, 또는 항진균성 보호를 위한 디펜신, 글루카나아제 또는 키티나아제와 같은 단백질, 또는 선충류 또는 곤충 방제를 위한 바실러스 튜링겐시스 내독소, 프로테아제 저해제, 콜라게나아제, 렉틴, 또는 글리코시다아제는 모두 유용한 유전자 산물의 예이다. 질병 저항성 형질을 암호화하는 유전자는, 예컨대, 후모니신에 대한 독소제거 유전자(미국 특허 5,792,931호); 약독성(avr) 및 질병 저항성(R) 유전자(Jones et al. (1994) Science 266:789; Martin et al. (1993) Science 262:1432; 및 Mindrinos et al. (1994) Cell 78:1089) 등을 포함한다. 곤충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 암호화할 수 있다. 이러한 유전자는, 예를 들어, 바실러스 튜링겐시스 독성 단백질 유전자(미국 특허 5,366,892호; 5,747,450호; 5,736,514호; 5,723,756호; 5,593,881호; 및 Geiser et al. (1986) Gene 48:109) 등을 포함한다.

"제초제 저항성 단백질" 또는 "제초제 저항성 암호화 핵산 분자"의 발현으로 생성되는 단백질은 이러한 단백질을 발현하지 않는 세포보다 더 높은 농도의 제초제를 견디는 능력, 또는 이러한 단백질을 발현하지 않는 세포보다 더 오랜 기간 동안 특정 농도의 제초제를 견디는 능력을 세포에 부여하는 단백질을 포함한다. 아세토락테이트 합성효소(ALS, AHAS라고도 함)의 작용을 저해하는 작용을 하는 제초제, 특히 설포닐우레아형(영국: sulphonylurea) 제초제에 대한 저항성을 코딩하는 유전자, 글루타민 합성효소의 작용을 저해하는 작용을 하는 제초제에 대한 저항성을 코딩하는 유전자, 예컨대, 포스피노트리신 또는 바스타(예컨대, 바 유전자), 글리포세이트(예컨대, EPSP 합성효소 유전자 및 GAT 유전자), HPPD 저해제(예컨대, HPPD 유전자) 또는 당업계에 알려진 다른 이러한 유전자에 의해 식물에 도입될 수 있다. 예를 들어, 본원에 각각 참조로 포함되는, 미국 특허 7,626,077호, 5,310,667호, 5,866,775호, 6,225,114호, 6,248,876호, 7,169,970호, 6,867,293호, 및 미국 가출원 61/401,456호 참조. 바 유전자는 제초제 바스타에 대한 저항성을 암호화하고, nptII 유전자는 항생제 카나마이신 및 제네티신에 대한 저항성을 암호화하고, ALS 유전자 돌연변이는 제초제 클로르설푸론에 대한 저항성을 암호화한다.

본원에 사용된 "설포닐우레아 내성 폴리펩티드"는 식물에서 발현될 때 적어도 하나의 설포닐우레아에 대한 내성을 부여하는 임의의 폴리펩티드를 포함한다. 설포닐우레아 제초제는 아세토하이드록시산 합성효소(AHAS)로도 알려진 아세토락테이트 합성효소(ALS)를 차단함으로써 고등 식물의 성장을 억제한다. ALS에 특정 돌연변이(예를 들어, S4 및/또는 HRA 돌연변이)가 있는 식물은 설포닐우레아 제초제에 내성이 있다. 설포닐우레아 내성 식물의 제조는, 모든 목적을 위해 그 전체가 본원에 참조로 포함되는, 미국 특허 5,605,011호; 5,013,659호; 5,141,870호; 5,767,361호; 5,731,180호; 5,304,732호; 4,761,373호; 5,331,107호; 5,928,937호; 및 5,378,824호; 및 국제 공개 WO 96/33270, 및 Tan et al. 2005. Imidazolinone-tolerant crops: history, current status and future. Pest Manag Sci 61:246-257에 보다 상세히 설명되어 있다. 설포닐우레아 저항성 폴리펩티드는, 예를 들어 ALS의 SuRA 또는 SuRB 유전자좌에 의해 암호화될 수 있다. 특정 구현예에서, ALS 저해제 저항성 폴리펩티드는 C3 ALS 돌연변이, HRA ALS 돌연변이, S4 돌연변이 또는 S4/HRA 돌연변이 또는 이들의 임의의 조합을 포함한다. ALS에서의 상이한 돌연변이는 상이한 제초제 및 제초제의 군(및/또는 하위군)에 내성을 부여하는 것으로 알려져 있다; 예를 들어, Tranel and Wright (2002) Weed Science 50:700-712 참조. 또한, 각각 그 전체가 본원에 참조로 포함되는 미국 특허 5,605,011호, 5,378,824호, 5,141,870호, 5,013,659호 참조. ALS에서의 HRA 돌연변이는 일 구현예에서 특정 용도를 갖는다. 돌연변이는 적어도 하나의 설포닐우레아 화합물에 저항성이 있는 아세토락테이트 합성효소 폴리펩티드의 생성을 야기한다.

설포닐우레아 내성 폴리펩티드를 암호화하는 유전자를 설포닐 내성 유전자 또는 설포닐 저항성 유전자라고 한다. 용어 설포닐 내성 유전자 또는 설포닐 저항성 유전자는 본원에서 상호교환적으로 사용된다.

파괴된 설포닐우레아 저항성(ALS) 유전자는 그 해당 비파괴 유전자가 설포닐우레아 내성 폴리펩티드를 암호화하는 파괴 유전자로서, 그 유전자 산물이 기능성 설포닐우레아 내성 폴리펩티드를 더 이상 암호화하지 않도록 변형된 파괴 유전자를 지칭한다.

일 구현예에서, 상기 방법은 변형된 표적 부위를 포함하는 설포닐우레아 저항성 식물을 생산하는 방법으로서, a) 파괴된 설포닐우레아 저항성(ALS) 유전자를 포함하는 식물 세포에 제1 가이드 RNA, Cas9 엔도뉴클레아제, 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas9 엔도뉴클레아제는 상기 파괴된 설포닐우레아 저항성(ALS) 유전자에 이중 가닥을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 제2 가이드 RNA 및 Cas9 엔도뉴클레아제는 상기 표적 부위에 이중 가닥 절단을 도입할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 b) 상기 식물 세포로부터 설포닐우레아 저항성 식물을 얻되, 상기 설포닐우레아 저항성 식물은 상기 표적에 변형을 포함하고, 상기 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 단계를 포함하는 방법을 포함한다.

(2012년 9월 4일 발행된 US 8,257,956에 기술된 바와 같은) 설포닐우레아 반응성 억제물질 시스템의 성분이 또한 식물 게놈에 도입되어 상기 식물 내에 폴리펩티드가 작동물질에 특이적으로 결합할 수 있는 억제물질/작동물질/유도물질 시스템을 생성할 수 있고, 특이적 결합은 설포닐우레아 화합물에 의해 조절된다.

불임성 유전자는 발현 카세트에서 암호화될 수도 있고, 물리적 제웅(detasseling)에 대한 대안을 제공한다. 이러한 방식에 사용되는 유전자의 예는 웅성 가임성 유전자, 예컨대, MS26(예를 들어, 미국 특허 7,098,388, 7,517,975, 7,612,251 참조), MS45(예를 들어, 미국 특허 5,478,369, 6,265,640 참조) 또는 MSCA1(예를 들어, 미국 특허 7,919,676 참조)을 포함한다. 옥수수 식물(Zea mays L.)은 자가 수분 및 타가 수분 기술에 의해 자랄 수 있다. 옥수수는 동일 식물에서, 수술에 위치한 수꽃 및 이삭에 위치한 암꽃을 가지고 있다. 옥수수는 자가 수분("자가생식") 하거나 타가 수분할 수 있다. 옥수수에서 자연 수분은 수술의 꽃가루가 바람에 의해 초기 이삭의 맨 위에 튀어 나온 수염으로 날릴 때 일어난다. 수분은 당업자에게 알려진 기술에 의해 용이하게 제어될 수 있다. 옥수수 잡종의 개발은 동형접합 근친교배 계통의 개발, 이러한 계통의 교배, 및 교배의 평가를 필요로 한다. 계통 육종 및 순환 선발은 개체군으로부터 근친교배 계통을 개발하는 데 이용되는 두 가지 육종 방법이다. 육종 프로그램은 자가생식 및 원하는 표현형의 선택에 의해 새로운 근친교배 계통이 개발되는 육종 풀(breeding pool)에 둘 이상의 근친교배 계통 또는 다양한 광범위한 공급원으로부터의 원하는 형질을 결합한다. 잡종 옥수수 품종은 이러한 두 가지 근친교배 계통의 교배이며, 각각의 근친교배 계통은 다른 하나에 부족한 하나 이상의 바람직한 특성을 갖거나 다른 하나를 보완할 수 있다. 새로운 근친교배종은 다른 근친교배 계통과 교배되고, 이들 교배로부터의 잡종을 평가하여 어느 것이 상업성이 있는지 판단한다. 제1 세대의 잡종 자손은 F1으로 지정된다. F1 잡종은 근친교배된 모체보다 더 잘 자란다. 이러한 잡종 활력 또는 잡종 강세는 식물 성장의 증가 및 수확량 증가를 포함하여 여러 방식으로 증명될 수 있다.

잡종 옥수수 종자는 수동 제웅을 포함하는 웅성 불임성 시스템에 의해 생산될 수 있다. 잡종 종자를 생산하기 위해, 성장하는 자성 근친교배 모체로부터 웅성 수술이 제거되고, 웅성 근친교배 모체와 함께 다양한 교대 행 패턴으로 심을 수 있다. 결과적으로, 외래의 옥수수 꽃가루 공급원으로부터 충분히 단리되어 있다면, 자성 근친교배종의 이삭은 웅성 근친교배종으로부터의 꽃가루로만 수정될 것이다. 따라서, 얻어진 종자는 잡종(F1)이고, 잡종 식물을 형성할 것이다.

식물 발육에 영향을 미치는 필드 변화는 자성 모체의 수동 제웅이 완료된 후 식물 태슬링을 초래할 수 있다. 또는, 제웅 과정 동안 자성 근친교배 식물 수술이 완전히 제거되지 않을 수 있다. 어느 경우든, 결과적으로 자성 식물은 성공적으로 꽃가루를 뿌릴 것이고, 일부 자성 식물은 자가 수분될 것이다. 이는 결과적으로 정상적으로 생산되는 잡종 종자와 함께 자성 근친교배종의 종자가 수확되도록 할 것이다. 자성 근친교배 종자는 잡종 강세를 나타내지 않으므로 F1 종자만큼 생산적이지 않다. 또한, 자성 근친교배 종자의 존재는 잡종을 생산하는 회사에 대한 생식질 보안 위험을 나타낼 수 있다.

대안적으로, 자성 근친교배종은 기계에 의해 기계적으로 제웅될 수 있다. 기계적 제웅은 대략 수동 제웅만큼 신뢰할 수 있지만 더 빠르고 비용이 적게 든다. 그러나, 대부분의 제웅 기계는 수동 제웅보다 식물에 더 많은 피해를 준다. 따라서, 현재 어떠한 형태의 제웅도 완전히 만족스럽지는 않고, 생산 비용을 더 낮추고 잡종 종자의 생산에서 자성 모체의 자가 수분을 제거할 필요성이 계속 존재한다.

식물에서 웅성 불임성을 야기하는 돌연변이는 옥수수와 같은 경작 식물에 대한 잡종 종자 생산 방법에 유용할 잠재력을 가지고 있으며, 잡종 모체로서 사용되는 모계 모체 식물로부터 많은 노동력을 요하는 수꽃 제거(제웅으로도 알려짐)의 필요성을 제거함으로써 생산 비용을 낮출 수 있다. 옥수수에서 웅성 불임성을 야기하는 돌연변이는 X선 또는 자외선 조사, 화학 처리 또는 전이 요소 삽입과 같은 다양한 방법에 의해 생산되었다(ms23, ms25, ms26, ms32) (Chaubal et al. (2000) Am J Bot 87:1193-1201). 가임성/불임성 "분자 스위치"를 통한 가임성 유전자의 조건부 조절은 작물 개선을 위한 새로운 웅성 불임성 시스템 설계 옵션을 향상시킬 수 있다(Unger et al. (2002) Transgenic Res 11:455-465).

또한, 관심 폴리뉴클레오티드는 표적화된 관심 유전자 서열에 대한 전령 RNA(mRNA)의 적어도 일부에 상보적인 안티센스 서열을 포함할 수도 있는 것으로 인정된다. 안티센스 뉴클레오티드는 해당 mRNA와 혼성화되도록 구성된다. 안티센스 서열의 변형은 서열이 해당 mRNA와 혼성화되고 그 발현을 방해하는 한 이루어질 수 있다. 이러한 방식으로, 해당 안티센스 서열과 70%, 80%, 또는 85%의 서열 동일성을 갖는 안티센스 작제물이 사용될 수 있다. 또한, 안티센스 뉴클레오티드의 일부는 표적 유전자의 발현을 방해하는 데 사용될 수 있다. 일반적으로, 적어도 50개 뉴클레오티드, 100개 뉴클레오티드, 200개 뉴클레오티드 이상의 서열이 사용될 수 있다.

또한, 관심 폴리뉴클레오티드는 식물의 내인성 유전자 발현을 억제하기 위해 센스 방향으로 사용될 수도 있다. 폴리뉴클레오티드를 센스 방향으로 사용하여 식물의 유전자 발현을 억제하는 방법은 당업계에 알려져 있다. 이 방법은 일반적으로 내인성 유전자의 전사체에 해당하는 뉴클레오티드 서열의 적어도 일부에 작동 가능하게 연결되어 식물에서 발현을 유도하는 프로모터를 포함하는 DNA 작제물로 식물을 형질전환시키는 단계를 포함한다. 일반적으로, 이러한 뉴클레오티드 서열은 내인성 유전자의 전사체의 서열에 대해 일반적으로 약 65% 서열 동일성, 약 85% 서열 동일성보다 크거나, 약 95% 서열 동일성보다 큰 실질적인 서열 동일성을 갖는다. 본원에 참조로 포함되는 미국 특허 5,283,184호 및 5,034,323호 참조.

관심 폴리뉴클레오티드는 표현형 마커일 수도 있다.

재조합 DNA 분자, 관심 DNA 서열, 및 관심 폴리뉴클레오티드는 유전자 침묵을 위한 하나 이상의 DNA 서열을 포함할 수 있다. 식물에서 DNA 서열의 발현을 포함하는 유전자 침묵 방법은 당업계에 알려져 있으며, 공동억제, 안티센스 억제, 이중 가닥 RNA(dsRNA) 간섭, 헤어핀 RNA(hpRNA) 간섭, 인트론 함유 헤어핀 RNA(ihp RNA) 간섭, 전사 유전자 침묵, 및 마이크로 RNA(miRNA) 간섭을 포함하나, 이에 한정되는 것은 아니다.

본원에 사용된 "핵산"은 폴리뉴클레오티드를 의미하고 디옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 가닥 폴리머 또는 이중 가닥 폴리머를 포함한다. 핵산은 단편 및 변형된 뉴클레오티드를 포함할 수도 있다. 따라서, 용어 "폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 및 "핵산 단편"은 단일 또는 이중 가닥인 RNA 및/또는 DNA의 폴리머를 나타내기 위해 상호교환적으로 사용되며, 선택적으로 합성, 비천연 또는 변경된 뉴클레오티드 염기를 포함한다. (보통 5'-모노포스페이트 형태로 발견되는) 뉴클레오티드는 다음과 같이 단일 문자 표시에 의해 지칭된다: "A"는 (RNA 또는 DNA에 대해 각각) 아데노신 또는 디옥시아데노신, "C"는 시토신 또는 디옥시시토신, "G"는 구아노신 또는 디옥시구아노신, "U"는 우리딘, "T"는 디옥시티미딘, "R"은 푸린 (A 또는 G), "Y"는 피리미딘 (C 또는 T), "K"는 G 또는 T, "H"는 A 또는 C 또는 T, "I"는 이노신, 및 "N"은 임의의 뉴클레오티드.

"오픈 리딩 프레임"은 ORF로 약칭된다.

용어 "기능적으로 동등한 하위단편" 및 "기능적 동등 하위 단편"은 본원에서 상호교환적으로 사용된다. 이들 용어는 단편 또는 하위단편이 활성 효소를 암호화하는지 여부에 관계없이 유전자 발현을 변경하거나 특정 표현형을 생성하는 능력이 유지되는 단리된 핵산 단편의 일부 또는 하위서열을 지칭한다. 예를 들어, 단편 또는 하위단편은 형질전환된 식물에서 원하는 표현형을 생성하기 위한 유전자 설계에 사용될 수 있다. 유전자는 활성 효소를 암호화하는지에 관계없이 그 핵산 단편 또는 하위단편을 식물 프로모터 서열에 대해 센스 방향 또는 안티센스 방향으로 연결함으로써 억제에 사용하도록 설계될 수 있다.

용어 "보존 도메인" 또는 "모티프"는 진화론적 관련 단백질의 정렬된 서열을 따라 특정 위치에 보존된 아미노산 세트를 의미한다. 다른 위치의 아미노산은 상동 단백질 간에 다양할 수 있는 반면, 특정 위치에 고도로 보존된 아미노산은 단백질의 구조, 안정성, 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체 군의 정렬된 서열에서 높은 보존 정도에 의해 동정되기 때문에, 새로 결정된 서열을 가진 단백질이 이전에 동정된 단백질 군에 속하는지를 판단하기 위해 식별자, 또는 "서명"으로서 사용될 수 있다.

폴리뉴클레오티드 및 폴리펩티드 서열, 이들의 변이체, 및 이 서열들의 구조적 관계는 본원에서 상호교환적으로 사용되는 "상동성", "상동", "실질적으로 동일한", "실질적으로 유사한" 및 "실질적으로 대응하는"이란 용어에 의해 기술될 수 있다. 이들은 하나 이상의 아미노산 또는 뉴클레오티드 염기에서의 변화가 분자의 기능, 예컨대, 유전자 발현을 매개하거나 특정 표현형을 생성하는 능력에 영향을 미치지 않는 폴리펩티드 또는 핵산 단편을 지칭한다. 이들 용어는 또한, 초기의 변형되지 않은 단편에 비해 얻어진 핵산 단편의 기능적 특성을 실질적으로 변경하지 않는 핵산 단편의 변형(들)을 지칭한다. 이들 변형은 핵산 단편에서의 하나 이상의 뉴클레오티드의 결실, 치환, 및/또는 삽입을 포함한다.

포함되는 실질적으로 유사한 핵산 서열은 (적당히 엄격한 조건, 예컨대, 0.5X SSC, 0.1% SDS, 60℃에서) 본원에 예시된 서열과 혼성화하는 능력, 또는 본원에 개시된 뉴클레오티드 서열의 임의의 일부에 혼성화하는 능력에 의해 정의될 수 있고, 본원에 개시된 임의의 핵산 서열과 기능적으로 동등하다. 엄격 조건은 원연(distantly-related) 생물로부터의 상동 서열과 같은 적당히 유사한 단편을 매우 유사한 단편, 예컨대, 근연(closely-related) 생물로부터 기능적 효소를 복제하는 유전자로 선별하도록 조정될 수 있다. 혼성화 후 세척은 엄격 조건을 결정한다.

"선택적으로 혼성화한다"라는 용어는 엄격한 혼성화 조건 하에서, 비표적 핵산 서열에의 혼성화보다 감지 가능하게 더 큰 정도(예를 들어, 백그라운드에 비해 적어도 2배)의 핵산 서열의 특정 핵산 표적 서열에의 혼성화 및 비표적 핵산의 실질적 배제에 대한 언급을 포함한다. 선택적으로 혼성화하는 서열은 일반적으로 서로 약 적어도 80% 서열 동일성, 또는 90% 서열 동일성을 가지며, 100% 서열 동일성(즉, 완전히 상보적)까지를 포함한다.

용어 "엄격한 조건" 또는 "엄격한 혼성화 조건"은 시험관내 혼성화 분석에서 프로브가 그 표적 서열에 선택적으로 혼성화될 조건에 대한 언급을 포함한다. 엄격한 조건은 서열에 의존적이며 상황에 따라 다를 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 프로브에 100% 상보적인 표적 서열을 동정할 수 있다(상동성 프로빙). 대안적으로, 엄격 조건은 서열에서 일부 불일치를 허용하여 더 낮은 정도의 유사도가 검출되도록 조정될 수 있다(이종 프로빙). 일반적으로 프로브는 약 1000개 뉴클레오티드 미만의 길이, 선택적으로 500개 뉴클레오티드 미만의 길이이다.

일반적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 그리고 짧은 프로브(예컨대, 10 내지 50개 뉴클레오티드)의 경우 적어도 약 30℃에서, 긴 프로브(예컨대, 50개 뉴클레오티드 초과)의 경우 적어도 약 60℃에서 염 농도가 약 1.5 M Na 이온 미만, 일반적으로는 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염(들))인 조건일 것이다. 엄격한 조건은 포름아미드와 같은 불안정화제의 첨가로 달성될 수도 있다. 예시적인 낮은 엄격 조건은 37℃에서 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS(나트륨 도데실 설페이트)의 완충액을 이용한 혼성화, 및 50 내지 55℃에서 1X 내지 2X SSC(20X SSC = 3.0 M NaCl/0.3 M 시트르산삼나트륨)에서의 세척을 포함한다. 예시적인 적당한 엄격 조건은 37℃에서 40 내지 45% 포름아미드, 1 M NaCl, 1% SDS에서의 혼성화, 및 55 내지 60℃에서 0.5X 내지 1X SSC에서의 세척을 포함한다. 예시적인 높은 엄격 조건은 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS에서의 혼성화, 및 60 내지 65℃에서 0.1X SSC에서의 세척을 포함한다.

핵산 또는 폴리펩티드 서열의 문맥에서 "서열 동일성" 또는 "동일성"은, 특정 비교창에 걸쳐 최대 일치를 위해 정렬될 때, 동일한 두 서열 내의 핵산 염기 또는 아미노산 잔기를 지칭한다.

용어 "서열 동일성 백분율"은 비교창에서 최적으로 정렬된 2개의 서열을 비교하여 결정된 값을 지칭하며, 이때, 비교창 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 2개의 서열의 최적 정렬을 위한 (삽입 또는 결실을 포함하지 않는) 기준 서열과 비교하여 삽입 또는 결실(즉, 갭)을 포함할 수 있다. 백분율은, 두 서열에서 동일한 핵산 염기 또는 아미노산 잔기가 나타나는 위치의 개수를 결정하여 일치하는 위치의 개수를 산출하고, 일치하는 위치의 개수를 비교창 내의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산한다. 백분율 서열 동일성의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의 정수 백분율을 포함하지만 이에 한정되는 것은 아니다. 이들 동일성은 본원에 기재된 프로그램 중 임의의 것을 사용하여 결정될 수 있다.

서열 정렬 및 백분율 동일성 또는 유사성 계산은 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc., Madison, WI)의 MegAlign^TM 프로그램을 비제한적으로 포함하는 상동 서열을 검출하도록 설계된 다양한 비교 방법을 사용하여 결정될 수 있다. 본 출원의 문맥 내에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 달리 명시되지 않는 한, 분석 결과는 언급된 프로그램의 "디폴트 값"에 기초할 것이라는 것을 이해할 것이다. 본원에서 사용된 "디폴트 값"은 최초로 초기화 될 때, 원래 소프트웨어와 함께 로딩되는 임의 세트의 값 또는 파라미터를 의미할 것이다.

"클러스탈 V 정렬 방법"은 클러스탈 V(Higgins and Sharp, (1989) CABIOS 5:151-153; Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기재)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc., Madison, WI)의 MegAlign^TM 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬의 경우, 디폴트 값은 GAP PENALTY=10 및 GAP LENGTH PENALTY=10에 해당한다. 클러스탈 방법을 사용하는 단백질 서열의 백분율 동일성의 계산 및 쌍 정렬을 위한 디폴트 파라미터는 KTUPLE=1, GAP PENALTY=3, WINDOW=5 및 DIAGONALS SAVED=5이다. 핵산의 경우, 이들 파라미터는 KTUPLE=2, GAP PENALTY=5, WINDOW=4 및 DIAGONALS SAVED=4이다. 클러스탈 V 프로그램을 사용하여 서열을 정렬한 후에는, 동일한 프로그램에서 "서열 거리"표를 보고 "백분율 동일성"을 얻을 수 있다.

"클러스탈 W 정렬 방법"은 클러스탈 W(Higgins and Sharp, (1989) CABIOS 5 : 151-153, Higgins 등, (1992) Comput Appl Biosci 8 : 189-191에 기재)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc., Madison, WI)의 MegAlign^TM v6.1 프로그램에서 발견되는 정렬 방법에 해당한다. 다중 정렬을 위한 디폴트 파라미터(GAP PENALTY=10, GAP LENGTH PENALTY=0.2, 지연 발산 서열(%)=30, DNA 전이 가중치=0.5, 단백질 가중치 매트릭스=Gonnet 시리즈, DNA 가중치 매트릭스=IUB). 클러스탈 W 프로그램을 사용하여 서열을 정렬한 후에는, 동일한 프로그램에서 "서열 거리"표를 보고 "백분율 동일성"을 얻을 수 있다.

달리 명시되지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하여, GAP 버전 10(GCG, Accelrys, San Diego, CA)을 사용하여 얻은 값을 지칭한다: 뉴클레오티드 서열에 대한 % 동일성 및 % 유사성은 갭 생성 페널티 가중치 50 및 갭 길이 연장 페널티 가중치 3, 및 nwsgapdna.cmp 점수 매트릭스를 사용; 아미노산 서열에 대한 % 동일성 및 % 유사성은 GAP 생성 페널티 가중치 8 및 갭 길이 연장 페널티 2, 및 BLOSUM62 점수 매트릭스를 사용(Henikoff and Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89:10915). GAP는 Needleman and Wunsch, (1970) J Mol Biol 48:443-53의 알고리즘을 사용하여 일치의 수를 최대화하고 갭의 수를 최소화하는 두 개의 완전한 서열의 정렬을 찾는다. GAP는 가능한 모든 정렬 및 갭 위치를 고려하고, 일치 염기 단위로 갭 생성 페널티 및 갭 연장 페널티를 사용하여 가장 많은 수의 일치 염기와 가장 적은 갭으로 정렬을 생성한다.

"BLAST"는 미국 국립생물공학정보센터(NCBI)에서 제공하는, 생물학적 서열 간의 유사성 영역을 찾는 데 사용되는 검색 알고리즘이다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하고 일치의 통계적 유의성을 계산하여 유사성이 무작위로 발생한 것으로 예측되지 않도록 쿼리 서열과 충분한 유사성을 갖는 서열을 동정한다. BLAST는 동정된 서열 및 이들의 쿼리 서열에 대한 로컬 정렬을 보고한다.

여러 수준의 서열 동일성은 다른 종 또는 천연적 또는 합성적으로 변형된 종으로부터 폴리펩티드를 동정하는 데 유용하고, 이러한 폴리펩티드는 동일하거나 유사한 기능 또는 활성을 갖는다는 것은 당업자가 잘 이해한다. 백분율 동일성의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의 정수 백분율을 포함하지만 이에 한정되는 것은 아니다. 실제로, 50% 내지 100%, 예컨대, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 임의 정수의 아미노산 동일성은 본 발명을 설명하는 데 유용할 수 있다.

"유전자"는 코딩 서열 앞의 조절 서열(5' 비코딩 서열) 및 뒤의 코딩 서열(3' 비코딩 서열)을 포함하여, 이에 한정되는 것은 아니지만, 특이 단백질과 같은 기능성 분자를 발현하는 핵산 단편을 포함한다. "고유 유전자"는 자신의 조절 서열과 함께 자연에서 발견되는 유전자를 지칭한다.

"돌연변이 유전자"는 인간 개입을 통해 변경된 유전자이다. 이러한 "돌연변이 유전자"는 적어도 하나의 뉴클레오티드 삽입, 결실, 또는 치환에 의해 해당 비돌연변이 유전자의 서열과 다른 서열을 갖는다. 본 발명의 특정 구현예에서, 돌연변이 유전자는 본원에 개시된 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템에 기인하는 변경을 포함한다. 돌연변이 식물은 돌연변이 유전자를 포함하는 식물이다.

본원에 사용된 "표적 돌연변이"는, 본원에 개시되거나 당업계에 공지된 바와 같이, 표적 서열의 DNA에서 이중 가닥 절단을 유도할 수 있는 이중 가닥 절단 유도제를 포함하는 방법을 사용하여 고유 유전자 내에서 표적 서열을 변경함으로써 만들어진 고유 유전자의 돌연변이이다.

가이드 RNA/Cas 엔도뉴클레아제 유도 표적 돌연변이는 Cas 엔도뉴클레아제에 의해 인식되고 절단되는 게놈 표적 부위 내에 또는 외부에 위치하는 뉴클레오티드 서열에서 발생할 수 있다.

식물 세포에 적용시 용어 "게놈"은 핵 내에서 발견되는 염색체 DNA뿐만 아니라 세포의 세포내 성분(예컨대, 미토콘드리아, 또는 색소체) 내에서 발견되는 세포소기관 DNA를 포함한다.

"코돈 변형 유전자" 또는 "코돈 선호 유전자" 또는 "코돈 최적화 유전자"는 숙주 세포의 선호되는 코돈 사용의 빈도를 모방하도록 설계된 코돈 사용의 빈도를 갖는 유전자이다.

"대립 유전자"는 염색체 상의 주어진 유전자좌를 차지하는 유전자의 몇 가지 다른 형태 중 하나이다. 염색체 상의 주어진 유전자좌에 존재하는 모든 대립 유전자가 동일한 경우, 그 식물은 그 유전자좌에서 동형접합적이다. 염색체 상의 주어진 유전자좌에 존재하는 대립 유전자가 상이한 경우, 그 식물은 그 유전자좌에서 이형접합적이다.

"코딩 서열"은 특정 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 지칭한다. "조절 서열"은 코딩 서열의 상류에(5' 비코딩 서열), 내에, 또는 하류(3' 비코딩 서열)에 위치하여 관련 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 주는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, 5' 미번역 서열, 3' 미번역 서열, 인트론, 폴리아데닐화 표적 서열, RNA 가공 부위, 이펙터 결합 부위, 및 스템-루프(stem-loop) 구조를 포함할 수 있지만, 이에 한정되는 것은 아니다.

"식물 최적화된 뉴클레오티드 서열"은 식물에서 증가된 발현에 최적화된 뉴클레오티드 서열이다. 예를 들어, 식물 최적화된 뉴클레오티드 서열은 개선된 발현을 위한 하나 이상의 식물 선호 코돈을 사용하여, 예를 들어, 본원에 개시된 이중 가닥 절단 유도제(예컨대, 엔도뉴클레아제)와 같은 단백질을 암호화하는 뉴클레오티드 서열을 변형시켜 합성될 수 있다. 예를 들어, 숙주 선호 코돈 사용에 대한 논의를 위해서는 Campbell and Gowri (1990) Plant Physiol. 92:1-11 참조.

식물 선호 유전자를 합성하는 방법들은 당업계에서 이용 가능하다. 예를 들어, 본원에 참조로 포함되는 미국 특허 5,380,831호, 및 5,436,391호, 및 Murray et al. (1989) Nucleic Acids Res. 17:477-498 참조. 추가적인 서열 변형은 식물 숙주에서 유전자 발현을 향상시키는 것으로 알려져 있다. 이들은, 예를 들어, 가짜 폴리아데닐화 신호를 암호화하는 하나 이상의 서열, 하나 이상의 엑손-인트론 스플라이스 부위 신호, 하나 이상의 전이인자 유사 반복서열, 및 유전자 발현에 유해할 수 있는 기타 이러한 잘 특성화된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 식물 세포에서 발현되는 공지된 유전자를 참조하여 계산되는 주어진 식물 숙주에 대한 평균을 고르게 하도록 조정될 수 있다. 가능한 경우, 서열은 하나 이상의 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다. 따라서, 본 발명의 "식물 최적화된 뉴클레오티드 서열"은 하나 이상의 이러한 서열 변형을 포함한다.

프로모터는 RNA 중합효소 및 기타 전사 개시 단백질의 인식 및 결합에 관여하는 DNA의 영역이다. 프로모터 서열은 근위 상류 요소 및 더 원위의 상류 요소로 구성되고, 후자는 종종 인헨서(enhancer)로 지칭된다. "인헨서"는 프로모터 활성을 자극할 수 있는 DNA 서열이고, 프로모터 고유의 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종 요소일 수 있다. 프로모터는 고유 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터들로부터 유래된 상이한 요소들로 구성될 수 있고/있거나, 합성 DNA 분절을 포함할 수 있다. 상이한 프로모터가 상이한 조직 또는 세포 유형으로, 또는 발육의 상이한 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 유도할 수 있음은 당업자가 이해한다. 또한, 대부분의 경우, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 일부 변이체의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 인정된다. 대부분의 시점에 대부분의 세포 유형에서 유전자가 발현되게 하는 프로모터는 일반적으로 "항시성 프로모터"(constitutive promoter)로 지칭된다.

특정 프로모터는 다른 것들보다 더 빠른 속도로 RNA 합성을 유도할 수 있는 것으로 밝혀졌다. 이들은 "강력한 프로모터"라고 한다. 일부 다른 프로모터는 특정 유형의 세포 또는 조직에서만 높은 수준으로 RNA 합성을 유도하는 것으로 밝혀졌고, 프로모터가 바람직하게는 특정 조직에서 RNA 합성을 유도할 뿐만 아니라 다른 조직에서 감소된 수준으로 RNA 합성을 유도할 경우 종종 "조직 특이적 프로모터" 또는 "조직 선호 프로모터"라고 한다. 식물에 도입된 키메라 유전자(또는 유전자들)의 발현 패턴은 프로모터를 사용하여 제어되므로, 특정 조직 유형에서 또는 특정 식물 발육 단계에서 특정 수준으로 키메라 유전자(또는 유전자들)의 발현을 제어할 수 있는 신규 프로모터의 단리에 대한 관심이 지속되고 있다.

식물 프로모터는 식물 세포에서 전사를 개시할 수 있는 프로모터를 포함할 수 있다(식물 프로모터에 대한 검토는 Potenza et al., (2004) In Vitro Cell Dev Biol 40:1-22를 참조). 항시성 프로모터는, 예를 들어, Rsyn7 프로모터의 코어 프로모터 및 WO99/43838 및 미국 특허 6,072,050호에 개시된 기타 항시성 프로모터; 코어 CaMV 35S 프로모터 (Odell et al., (1985) Nature 313:810-2); 벼 액틴(McElroy et al., (1990) Plant Cell 2:163-71); 유비퀴틴(Christensen et al., (1989) Plant Mol Biol 12:619-32; Christensen et al., (1992) Plant Mol Biol 18:675-89); pEMU(Last et al., (1991) Theor Appl Genet 81:581-8); MAS(Velten et al., (1984) EMBO J 3:2723-30); ALS 프로모터(미국 특허 5,659,026호) 등을 포함한다. 기타 항시성 프로모터는, 예를 들어, 미국 특허 5,608,149호; 5,608,144호; 5,604,121호; 5,569,597호; 5,466,785호; 5,399,680호; 5,268,463호; 5,608,142호 및 6,177,611호에 기술되어 있다. 일부 예에서는 유도성 프로모터가 사용될 수 있다. 병원균에 의한 감염 후에 유도되는 병원균 유도성 프로모터는 PR 단백질, SAR 단백질, 베타-1,3-글루카나아제, 키티나아제 등의 발현을 조절하는 것들을 포함하나, 이에 한정되는 것은 아니다.

화학적으로 조절되는 프로모터는 외인성 화학적 조절자의 적용을 통해 식물에서 유전자의 발현을 조절하는 데 이용될 수 있다. 이러한 프로모터는 화학물질의 적용이 유전자 발현을 유도하는 화학물질 유도성 프로모터, 또는 화학물질의 적용이 유전자 발현을 억제하는 화학물질 억제성 프로모터일 수 있다. 화학물질 유도성 프로모터는 벤젠 설폰아미드 제초제 약해경감제에 의해 활성화되는 옥수수 In2-2 프로모터(De Veylder et al., (1997) Plant Cell Physiol 38:568-77), 잡초 발아 전에 사용하는 제초제로서 사용되는 소수성 친전자성 화합물에 의해 활성화되는 옥수수 GST 프로모터(GST-II-27, WO93/01294) 및 살리실산에 의해 활성화되는 담배 PR-1a 프로모터(Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7)를 포함하나, 이에 한정되는 것은 아니다. 기타 화학적으로 조절되는 프로모터는 스테로이드 반응성 프로모터(예를 들어, 글루코코르티코이드 유도성 프로모터(Schena et al., (1991) Proc. Natl. Acad. Sci. USA 88:10421-5; McNellis et al., (1998) Plant J 14:247-257); 테트라사이클린 유도성 및 테트라사이클린 억제성 프로모터(Gatz et al., (1991) Mol Gen Genet 227:229-37; 미국 특허 5,814,618호 및 5,789,156호 참조)를 포함한다.

조직 선호 프로모터는 특정 식물 조직 내에서 발현 증진을 목표로 하는 데 활용될 수 있다. 조직 선호 프로모터로는, 예를 들어, Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Hansen et al., (1997) Mol Gen Genet 254:337-43; Russell et al., (1997) Transgenic Res 6:157-68; Rinehart et al., (1996) Plant Physiol 112:1331-41; Van Camp et al., (1996) Plant Physiol 112:525-35; Canevascini et al., (1996) Plant Physiol 112:513-524; Lam, (1994) Results Probl Cell Differ 20:181-96; 및 Guevara-Garcia et al., (1993) Plant J 4:495-505를 들 수 있다. 잎 선호 프로모터로는, 예를 들어, Yamamoto et al., (1997) Plant J 12:255-65; Kwon et al., (1994) Plant Physiol 105:357-67; Yamamoto et al., (1994) Plant Cell Physiol 35:773-8; Gotor et al., (1993) Plant J 3:509-18; Orozco et al., (1993) Plant Mol Biol 23:1129-38; Matsuoka et al., (1993) Proc. Natl. Acad. Sci. USA 90:9586-90; Simpson et al., (1958) EMBO J 4:2723-9; Timko et al., (1988) Nature 318:57-8을 들 수 있다. 뿌리 선호 프로모터로는, 예를 들어, Hire et al., (1992) Plant Mol Biol 20:207-18(대두 뿌리 특이적 글루타민 합성효소 유전자); Miao et al., (1991) Plant Cell 3:11-22(시토졸 글루타민 합성효소(GS)); Keller 및 Baumgartner, (1991) Plant Cell 3:1051-61(강낭콩의 GRP 1.8 유전자의 뿌리 특이적 조절 요소); Sanger et al., (1990) Plant Mol Biol 14:433-43(A. 투메파시엔스(tumefaciens) 만노파인(mannopine) 합성효소(MAS)의 뿌리 특이적 프로모터); Bogusz et al., (1990) Plant Cell 2:633-41 (파라스포니아 안데르소니(Parasponia andersonii) 및 트레마 토멘토사(Trema tomentosa)로부터 단리된 뿌리 특이적 프로모터); Leach 및 Aoyagi, (1991) Plant Sci 79:69-76 (A. 리조게네스(rhizogenes) rolC 및 rolD 뿌리 유도 유전자); Teeri et al., (1989) EMBO J 8:343-50(아그로박테리움(Agrobacterium) 상처 유도 TR1' 및 TR2' 유전자); VfENOD-GRP3 유전자 프로모터(Kuster et al., (1995) Plant Mol Biol 29:759-72); 및 rolB 프로모터(Capana et al., (1994) Plant Mol Biol 25:681-91; 파세올린 유전자(Murai et al., (1983) Science 23:476-82; Sengopta-Gopalen et al., (1988) Proc. Natl. Acad. Sci. USA 82:3320-4)를 들 수 있다. 또한, 미국 특허 5,837,876호; 5,750,386호; 5,633,363호; 5,459,252호; 5,401,836호; 5,110,732호 및 5,023,179호 참조.

종자 선호 프로모터는 종자 발육 중에 활성을 나타내는 종자 특이적 프로모터뿐만 아니라, 종자 발아 중에 활성을 나타내는 종자 발아 프로모터를 포함한다. Thompson et al., (1989) BioEssays 10:108 참조. 종자 선호 프로모터는 Cim1(사이토키닌 유도 메세지); cZ19B1(옥수수 19 kDa 제인); 및 milps(미오-이노시톨-1-포스페이트 합성효소); (WO00/11177; 및 미국 특허 6,225,529)를 포함하나, 이에 한정되는 것은 아니다. 쌍떡잎식물의 경우, 종자 선호 프로모터는 콩류 β-파세올린, 나핀, β-콘글리시닌, 대두 렉틴, 크루시페린 등을 포함하나, 이에 한정되는 것은 아니다. 외떡잎식물의 경우, 종자 선호 프로모터는 옥수수 15 kDa 제인, 22 kDa 제인, 27 kDa 감마 제인, 왁시, 슈렁큰(shrunken) 1, 슈렁큰 2, 글로불린 1, 올레오신, 및 nuc1을 포함하나, 이에 한정되는 것은 아니다. 또한, END1 및 END2 유전자로부터의 종자 선호 프로모터가 개시된 WO00/12733 참조.

용어 "유도성 프로모터"는, 예를 들어, 화학적 화합물(화학적 유도물질)에 의해 내인성 또는 외인성 자극의 존재에 반응하여, 또는 환경, 호르몬, 화학물질, 및/또는 발육 신호에 반응하여 코딩 서열 또는 기능성 RNA를 선택적으로 발현시키는 프로모터를 지칭한다. 유도성 또는 조절 프로모터는, 예를 들어, 빛, 열, 스트레스, 홍수 또는 가뭄, 염 스트레스, 삼투압 스트레스, 식물 호르몬, 상처, 또는 화학물질, 예컨대, 에탄올, 아브시스산(ABA), 자스모네이트, 살리실산, 또는 약해경감제에 의해 유도되거나 조절되는 프로모터를 포함한다.

스트레스 유도성의 예로는 RD29A 프로모터(Kasuga et al. (1999) Nature Biotechnol. 17:287-91)가 있다. 당업자는 가뭄 조건을 시뮬레이션하고 모의 또는 자연 발생 가뭄 조건에 노출되었던 식물의 가뭄 내성을 평가하기 위한 프로토콜을 잘 알고 있다. 예를 들어, 당업자는 일정 기간에 걸쳐 식물에 정상적으로 필요한 것보다 적은 물을 주거나 물을 주지 않음으로써 가뭄 조건을 시뮬레이션할 수 있고, 활력, 성장, 크기, 또는 뿌리 길이, 또는 특히, 잎 색깔 또는 잎 면적 크기를 포함한(이에 한정되는 것은 아님) 생리 및/또는 건강 상태의 차이를 조사하여 가뭄 내성을 평가할 수 있다. 가뭄 내성을 평가하기 위한 다른 기술은 엽록소 형광, 광합성 속도 및 가스 교환율의 측정을 포함한다. 또한, 당업자는 삼투압 스트레스, 염 스트레스 및 온도 스트레스와 같은 스트레스 조건을 시뮬레이션하고 모의 또는 자연 발생 스트레스 조건에 노출되었던 식물의 스트레스 내성을 평가하기 위한 프로토콜을 잘 알고 있다.

식물 세포에 유용한 유도성 프로모터의 다른 예는 본원에 참조로 포함되는, 2013년 11월 21일 공개된 미국 특허 출원 US 2013-0312137A1에 기술되어 있다. 미국 특허 출원 US 2013-0312137A1에는 옥수수로부터의 만니톨 탈수소효소를 암호화하는 CBSU-Anther_Subtraction 라이브러리(CAS1) 유전자로부터의 ZmCAS1 프로모터, 및 이의 기능적 단편이 기술되어 있다. ZmCAS1 프로모터("CAS1 프로모터", "만니톨 탈수소효소 프로모터", "mdh 프로모터"라고도 함)는 화학물질 또는 스트레스 처리에 의해 유도될 수 있다. 화학물질은, 이에 한정되는 것은 아니지만, N-(아미노카보닐)-2-클로로벤젠설폰아미드(2-CBSU)와 같은 약해경감제일 수 있다. 스트레스 처리는, 이에 한정되는 것은 아니지만, 열충격 처리와 같은 열처리일 수 있다(또한, 본원에 참조로 포함되고, 2015년 2월 25일 출원된 미국 가특허출원 62/120421 참조).

식물 세포에 유용한 여러 유형의 새로운 프로모터가 지속적으로 발견되고 있고; 많은 예들을 The Biochemistry of Plants, Vol. 115, Stumpf and Conn, eds (New York, NY: Academic Press), pp. 1-82에 있는 Okamuro and Goldberg(1989)에 의한 편집에서 찾을 수 있다.

"번역 리더 서열"은 유전자의 프로모터 서열과 코딩 서열 사이에 위치한 폴리뉴클레오티드 서열을 지칭한다. 번역 리더 서열은 번역 시작 서열의 상류 mRNA에 존재한다. 번역 리더 서열은 mRNA에 대한 1차 전사체의 가공, mRNA 안정성 또는 번역 효율에 영향을 미칠 수 있다. 번역 리더 서열의 예는 기술되어 있다(예를 들어, Turner and Foster, (1995) Mol Biotechnol 3:225-236).

"3' 비코딩 서열", "전사 종결자" 또는 "종결 서열"은 코딩 서열의 하류에 위치한 DNA 서열을 지칭하며, 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 다른 서열을 포함한다. 폴리아데닐화 신호는 일반적으로, mRNA 전구체 3' 말단에의 폴리아데닐산 영역 추가에 영향을 주는 것을 특징으로 한다. 다른 3' 비코딩 서열의 사용은 Ingelbrecht et al., (1989) Plant Cell 1:671-680에 예시되어 있다.

"RNA 전사체"는 DNA 서열의 RNA 중합효소-촉매화 전사로부터 만들어지는 생성물을 지칭한다. RNA 전사체가 DNA 서열의 완전한 상보적인 카피인 경우, 이를 1차 전사체 또는 pre-mRNA라고 한다. RNA 전사체가 1차 전사체 pre mRNA의 전사후 가공으로부터 유래된 RNA 서열인 경우, 이를 성숙 RNA 또는 mRNA라고 한다. "전령 RNA" 또는 "mRNA"는, 인트론이 없고 세포에 의해 단백질로 번역될 수 있는 RNA를 지칭한다. "crDNA"는 효소 역전사효소를 이용하는 mRNA 주형에 상보적이고 그로부터 합성되는 DNA를 지칭한다. cDNA는 단일 가닥이거나 DNA 중합효소 I의 클레노브(Klenow) 단편을 사용하여 이중 가닥 형태로 변환될 수 있다. "센스" RNA는, mRNA를 포함하고 세포내에서 또는 시험관내에서 단백질로 번역될 수 있는 RNA 전사체를 지칭한다. "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부에 상보적이고 표적 유전자의 발현을 차단하는 RNA 전사체를 지칭한다(예를 들어, 미국 특허 5,107,065호 참조). 안티센스 RNA의 상보성은 특정 유전자 전사체의 임의의 부분, 즉 5' 비코딩 서열, 3' 비코딩 서열, 인트론 또는 코딩 서열과 함께 있을 수 있다. "기능성 RNA"는 번역되지 않을 수 있지만 세포 프로세스에 영향을 미치는 안티센스 RNA, 리보자임 RNA 또는 기타 RNA를 지칭한다. 용어 "보체"(complement) 및 "역보체"(reverse complement)는 mRNA 전사체에 대하여 본원에서 상호교환적으로 사용되며, 메시지의 안티센스 RNA를 정의하기 위한 것이다.

"작동 가능하게 연결된"이라는 용어는 하나의 기능이 다른 하나에 의해 조절되도록 된 단일 핵산 단편 상에서의 핵산 서열들의 결합을 나타낸다. 예를 들어, 프로모터는, 코딩 서열의 발현을 조절할 수 있는 경우(즉, 코딩 서열이 프로모터의 전사 조절 하에 있을 때), 코딩 서열과 작동 가능하게 연결된다. 코딩 서열은 센스 또는 안티센스 방향으로 조절 서열에 작동 가능하게 연결될 수 있다. 다른 예에서, 상보적 RNA 영역은 표적 mRNA의 5', 또는 표적 mRNA의 3', 또는 표적 mRNA 내에, 직접 또는 간접적으로, 작동 가능하게 연결될 수 있거나, 제1 상보적 영역은 표적 mRNA의 5'이고 그 보체는 표적 mRNA의 3'이다.

본원에서 사용된 표준 재조합 DNA 및 분자 복제 기술은 당업계에 잘 알려져 있으며, Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)에 더 자세히 기술되어 있다. 형질전환 방법은 당업자에게 잘 알려져 있고 아래에 설명된다.

"PCR" 또는 "중합효소 연쇄 반응"(polymerase chain reaction)은 특정 DNA 분절의 합성을 위한 기술이며, 일련의 반복적인 변성, 어닐링 및 확장 사이클로 구성된다. 일반적으로, 이중 가닥 DNA는 열 변성되고, 표적 분절의 3' 경계에 상보적인 두 개의 프라이머는 저온에서 DNA에 어닐링된 후 중간 온도에서 확장된다. 이러한 3개의 연속 단계의 한 세트를 "사이클"이라고 한다.

용어 "재조합"은, 예를 들어, 유전자 조작 기술에 의해 단리된 핵산 분절의 조작, 또는 화학적 합성에 의한, 그렇지 않았다면 분리된 2개의 서열 분절의 인공 조합을 지칭한다.

용어 "플라스미드", "벡터" 및 "카세트"는 세포의 중심 물질대사의 일부가 아닌 유전자를 종종 운반하는, 일반적으로 이중 가닥 DNA 형태의 염색체외 요소를 지칭한다. 이러한 요소는 임의의 공급원으로부터 유래된 단일 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형 형태의, 자율적 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있고, 다수의 뉴클레오티드 서열은 세포에 관심 폴리뉴클레오티드를 도입할 수 있는 고유의 구조로 결합되거나 재조합되어 있다. "형질전환 카세트"는 유전자를 포함하면서 유전자 이외에 특정 숙주 세포의 형질전환을 촉진하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 유전자를 포함하면서 유전자 이외에 숙주에서 그 유전자의 발현을 가능하게 하는 요소를 갖는 특정 벡터를 지칭한다.

용어 "재조합 DNA 분자", "재조합 작제물", "발현 작제물", "작제물", "작제물", 및 "재조합 DNA 작제물"은 본원에서 상호교환적으로 사용된다. 재조합 작제물은 핵산 단편, 예를 들어, 자연계에서 모두가 함께 발견되지는 않는 조절 서열 및 코딩 서열의 인공 조합을 포함한다. 예를 들어, 작제물은 상이한 공급원으로부터 유래된 조절 서열과 코딩 서열, 또는 동일한 공급원으로부터 유래되었지만 자연계에서 발견되는 것과는 다른 방식으로 배열된 조절 서열과 코딩 서열을 포함할 수 있다. 이러한 작제물은 단독으로 사용되거나 벡터와 함께 사용될 수 있다. 벡터가 사용되는 경우, 벡터의 선택은 당업자에게 잘 알려진 바와 같이 숙주 세포를 형질전환시키는 데 사용될 방법에 의존한다. 예를 들어, 플라스미드 벡터가 사용될 수 있다. 당업자는 숙주 세포를 성공적으로 형질전환시키고 선택하고 증식시키기 위해 벡터에 존재해야 하는 유전 요소를 잘 알고 있다. 당업자는 또한, 서로 다른 독립적인 형질전환 사건이 상이한 발현 수준 및 패턴을 초래할 수 있으므로(Jones et al., (1985) EMBO J 4:2411-2418; De Almeida et al., (1989) Mol Gen Genetics 218:78-86), 원하는 발현 수준 및 패턴을 나타내는 계통을 얻기 위해 일반적으로 여러 사건이 스크리닝된다는 것을 인식할 것이다. 이러한 스크리닝은 표준 분자 생물학적, 생화학적 분석, 및 DNA의 서던 분석, mRNA 발현의 노던 분석, PCR, 실시간 정량 PCR(qPCR), 역전사 PCR(RT-PCR), 단백질 발현의 면역블로팅 분석, 효소 또는 활성 분석, 및/또는 표현형 분석을 비롯한 기타 분석법에 의해 달성될 수 있다.

본원에 사용된 용어 "발현"은 전구체 또는 성숙한 형태의 기능적 최종 생성물(예컨대, mRNA, 가이드 RNA 또는 단백질)의 생산을 지칭한다.

용어 "도입"은 화합물, 예컨대, 이에 한정되는 것은 아니지만, 핵산(예를 들어, 발현 작제물) 또는 펩티드, 폴리펩티드 또는 단백질을 세포에 도입, 제공, 접촉하는 것에 대한 언급을 포함한다. 도입은 폴리뉴클레오티드(예컨대, RNA, DNA, RNA-DNA 하이브리드, 단일 또는 이중 가닥 올리고뉴클레오티드, 선형 또는 원형 폴리뉴클레오티드)의 직접 전달 및/또는 단백질(폴리펩티드)의 직접 전달을 포함한다. 도입은 핵산이 세포의 게놈에 혼입될 수 있는 진핵 또는 원핵 세포 내로의 핵산 또는 폴리펩티드의 혼입에 대한 언급을 포함하며, 핵산 또는 단백질을 세포에 일시적으로 도입하는 것에 대한 언급을 포함한다. 도입은 안정적이거나 일시적인 형질전환 방법, 형질감염, 형질도입, 미세주입, 전기천공, 바이러스성 방법, 아그로박테리움 매개 형질전환, 탄도 입자 가속, 휘스커 매개 형질전환, 뿐만 아니라 유성 교배에 대한 언급을 포함한다. 따라서, 핵산 단편(예를 들어, 재조합 DNA 작제물/발현 작제물, 가이드 RNA, 가이드 DNA, 주형 DNA, 공여 DNA)을 세포에 삽입하는 맥락에서의 "도입"은 "형질감염" 또는 "형질전환" 또는 "형질도입"을 포함하며, 핵산 단편이 세포의 게놈(예를 들어, 염색체, 플라스미드, 색소체, 또는 미토콘드리아 DNA)에 혼입되거나, 자율적 레플리콘으로 변환되거나, 또는 일시적으로 발현될 수 있는(예를 들어, 형질감염된 mRNA) 진핵 또는 원핵 세포 내로의 핵산 단편의 혼입에 대한 언급을 포함한다.

안정적 형질전환 방법, 일시적 형질전환 방법, 바이러스 매개 방법, 유성 교배 및 유성 번식을 비롯하여, 조성물을 생물에 도입, 접촉 및/또는 제공하는 다양한 방법이 공지되어 있다. 안정적 형질전환은 도입된 폴리뉴클레오티드가 생물의 게놈에 통합되고 그의 자손에 의해 유전될 수 있음을 나타낸다. 일시적 형질전환은 도입된 조성물이 단지 일시적으로 생물에서 발현되거나 존재함을 나타낸다.

폴리뉴클레오티드 및 폴리펩티드를 세포 또는 생물에 접촉, 제공, 도입하기 위한 프로토콜은 알려져 있으며, 미세주입(Crossway et al., (1986) Biotechniques 4:320-34 및 미국 특허. 6,300,543호), 분열조직 형질전환(미국 특허 5,736,369호), 전기천공(Riggs et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602-6, 아그로박테리움 매개 형질전환(미국 특허 5,563,055호 및 5,981,840호), 휘스커 매개 형질전환(Ainley et al. 2013, Plant Biotechnology Journal 11:1126-1134; Shaheen A. and M. Arshad 2011 Properties and Applications of Silicon Carbide (2011), 345-358 Editor(s): Gerhardt, Rosario. Publisher: InTech, Rijeka, Croatia. CODEN: 69PQBP; ISBN: 978-953-307-201-2), 직접 유전자 전달(Paszkowski et al., (1984) EMBO J 3:2717-22), 및 탄도 입자 가속(미국 특허 4,945,050호; 5,879,918호; 5,886,244호; 5,932,782호; Tomes et al., (1995) "Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment" in Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg & Phillips (Springer-Verlag, Berlin); McCabe et al., (1988) Biotechnology 6:923-6; Weissinger et al., (1988) Ann Rev Genet 22:421-77; Sanford et al., (1987) Particulate Science and Technology 5:27-37 (양파); Christou et al., (1988) Plant Physiol 87:671-4 (대두); Finer and McMullen, (1991) In Vitro Cell Dev Biol 27P:175-82 (대두); Singh et al., (1998) Theor Appl Genet 96:319-24 (대두); Datta et al., (1990) Biotechnology 8:736-40 (벼); Klein et al., (1988) Proc. Natl. Acad. Sci. USA 85:4305-9 (옥수수); Klein et al., (1988) Biotechnology 6:559-63 (옥수수); 미국 특허 5,240,855호; 5,322,783호 및 5,324,646호; Klein et al., (1988) Plant Physiol 91:440-4 (옥수수); Fromm et al., (1990) Biotechnology 8:833-9 (옥수수); Hooykaas-Van Slogteren et al., (1984) Nature 311:763-4; 미국 특허 5,736,369호 (곡물); Bytebier et al., (1987) Proc. Natl. Acad. Sci. USA 84:5345-9 (백합과); De Wet et al., (1985) in The Experimental Manipulation of Ovule Tissues, ed. Chapman et al., (Longman, New York), pp. 197-209 (꽃가루); Kaeppler et al., (1990) Plant Cell Rep 9:415-8) 및 Kaeppler et al., (1992) Theor Appl Genet 84:560-6 (휘스커 매개 형질전환); D'Halluin et al., (1992) Plant Cell 4:1495-505 (전기천공); Li et al., (1993) Plant Cell Rep 12:250-5; Christou and Ford (1995) Annals Botany 75:407-13 (벼) 및 Osjoda et al., (1996) Nat Biotechnol 14:745-50 (아그로박테리움 투메파시엔스를 통한 옥수수)를 포함한다.

대안적으로, 폴리뉴클레오티드는 세포 또는 생물을 바이러스 또는 바이러스성 핵산과 접촉시켜 세포 또는 생물에 도입될 수 있다. 일반적으로, 이러한 방법은 바이러스성 DNA 또는 RNA 분자 내에 폴리뉴클레오티드를 혼입시키는 것을 포함한다. 일부 예에서, 관심 폴리펩티드는 처음에 바이러스성 폴리단백질의 일부로서 합성될 수 있고, 후에 생체내 또는 시험관내에서 단백질분해에 의해 처리되어 원하는 재조합 단백질을 생성한다. 바이러스성 DNA 또는 RNA 분자를 포함하는 폴리뉴클레오티드를 식물에 도입하고 거기에서 암호화된 단백질을 발현시키는 방법은 공지되어 있다(예를 들어, 미국 특허 5,889,191호, 5,889,190호, 5,866,785호, 5,589,367호 및 5,316,931호를 참조). 일시적 형질전환 방법은 이중 가닥 절단 유도제와 같은 폴리펩티드를 생물에 직접 도입하는 것, 생물에 DNA 및/또는 RNA 폴리뉴클레오티드와 같은 폴리뉴클레오티드를 도입하는 것, 및 이중 가닥 절단 유도제를 암호화하는 mRNA와 같은 RNA 전사체를 도입하는 것을 포함하나, 이에 한정되는 것은 아니다. 이러한 방법은, 예를 들어, 미세주입 또는 유전자총을 포함한다. 예를 들어, Crossway et al., (1986) Mol Gen Genet 202:179-85; Nomura et al., (1986) Plant Sci 44:53-8; Hepler et al., (1994) Proc. Natl. Acad. Sci. USA 91:2176-80; 및, Hush et al., (1994) J Cell Sci 107:775-84 참조.

핵산 및 단백질은 유도 Cas 시스템의 어느 한 성분 또는 모든 성분(단백질 및/또는 핵산)의 흡수를 촉진하기 위해 분자, 예컨대 세포 침투성 펩티드 및 나노캐리어를 이용하는 방법을 비롯한 임의의 방법에 의해 세포에 제공될 수 있다. 또한, 본원에 참조로 포함되는, US20110035836 Nanocarier based plant transfection and transduction, 및 EP 2821486 A1 Method of introducing nucleic acid into plant cells를 참조.

가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포에 도입하는 것은 상기 복합체의 개별 성분을 개별적으로 또는 결합하여, 직접(가이드를 위한 RNA 및 Cas 엔도뉴클레아제를 위한 단백질로서 직접 전달) 또는 그 성분(가이드 RNA, Cas 엔도뉴클레아제)을 발현하는 재조합 작제물을 통해 세포에 도입하는 것을 포함한다. 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포에 도입하는 것은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 리보뉴클레오티드-단백질로서 세포에 도입하는 것을 포함한다. 리보뉴클레오티드-단백질은 본원에 기술된 바와 같이 세포에 도입되기 전에 조립될 수 있다.

식물 세포는 RGEN 리보핵산단백질의 직접 전달 및/또는 RGEN 성분의 직접 전달에 대한 장벽으로 작용할 수 있는 식물 세포벽을 포함한다는 점에서 인간 및 동물 세포와 다르다.

본원에 기술된 바와 같이, 식물 세포로의 RGEN 리보핵산단백질의 직접 전달은 입자 매개 전달(유전자총)을 통해 달성될 수 있다. 본원에 기술된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대, 이에 한정되는 것은 아니지만, 폴리에틸렌 글리콜(PEG) 매개 원형질체로의 형질감염, 전기천공, 세포 침투성 펩티드, 또는 메조포러스 실리카 나노입자(MSN) 매개 직접 단백질 전달이 식물 세포에 RGEN 리보핵산단백질을 전달하기 위해 성공적으로 이용될 수 있음을 구상할 수 있다.

본원에 기술된 바와 같이, RGEN 리보핵산단백질의 직접 전달은 세포의 게놈 내 표적 부위에서의 게놈 편집 후 복합체가 빠르게 분해되고, 복합체가 세포에 일시적으로만 존재할 수 있게 한다. 이러한 RGEN 복합체의 일시적 존재는 표적 이탈 효과의 감소로 이어질 수 있다. 반면, 플라스미드 DNA 서열을 통한 RGEN 성분(가이드 RNA, Cas9 엔도뉴클레아제)의 전달은 표적 이탈 효과를 가중시킬 수 있는 이러한 플라스미드로부터 RGEN의 일정한 발현을 초래할 수 있다(Cradick, T. J. et al (2013) Nucleic Acids Res 41:9584-9592; Fu, Y et al (2014) Nat. Biotechnol. 31:822-826).

직접 전달은, RNA 유도 엔도뉴클레아제(가이드 RNA, Cas 단백질, gRNA 또는 Cas 엔도뉴클레아제를 암호화하는 mRNA)의 어느 한 성분 또는 RGEN 복합체 자체를 미립자, 예컨대, 이에 한정되는 것은 아니지만, 금 입자, 텅스텐 입자, 및 탄화규소 휘스커 입자를 포함하는 입자 전달 매트릭스와 결합시킴으로써 달성될 수 있다. 미립자를 플라스미드 DNA 및 관심 DNA에 결합시키는 본원에 기술된 결합 방법의 예는 미립자에 가이드 RNA 분자, mRNA 분자, Cas 단백질 및 RGEN 복합체를 코팅하는 데 이용될 수도 있다.

이러한 코팅된 미립자는 실시예 8에 기술된 유전자총 방법과 같이 당업계에 공지된 임의의 직접적인 방법에 의해 세포에 도입될 수 있다. RGEN 성분을 미립자에 코팅할 수 있도록 하기 위해 미립자 및 RGEN 성분 또는 RGEN 복합체는 임의의 물질로 결합(혼합)될 수 있다. 예를 들어, RGEN 성분은 임의의 적절한 완충액(예컨대, 이에 한정되는 것은 아니지만, 수용성 양이온성 지질, 예컨대, 이에 한정되는 것은 아니지만 TransIT-2020 형질감염 시약(Cat# MIR 5404, Mirus, USA))을 사용하여 적어도 0.1 ㎛, 0.2 ㎛, 0.3 ㎛, 0.4 ㎛, 0.5 ㎛, 0.6 ㎛, 0.7 ㎛, 0.8 ㎛, 0.9 ㎛ 또는 1.0 ㎛ 직경 범위의 직경을 갖는 금 펠렛 상에 침전될 수 있다. RGEN 성분 용액은 적어도 0.1 ㎍, 0.2 ㎍, 0.3 ㎍, 0.4 ㎍, 0.5 ㎍, 0.6 ㎍, 0.7 ㎍, 0.8 ㎍, 0.9 ㎍, 1.0 ㎍, 2.0 ㎍, 3.0 ㎍, 4.0 ㎍, 5.0 ㎍, 6.0 ㎍, 7.0 ㎍, 8.0 ㎍, 9.0 ㎍ 또는 10 ㎍의 RNA(유도 RNA 또는 mRNA) 또는 Cas 엔도뉴클레아제 단백질을 사용하여 얼음 위에서(또는 미립자 결합을 가능하게 하는 데 적합한 임의의 온도에서) 제조될 수 있다. RGEN 복합체의 미리 혼합된 RGEN 성분에, 적어도 1 ㎕ 내지 20 ㎕의 제조된 미립자를 조심스럽게 첨가하고 혼합할 수 있다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하는 단계 및 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 상기 세포에 도입하는 단계를 포함하는 방법을 포함한다. 입자 전달 매트릭스는 양이온성 지질과 결합된 미립자를 포함할 수 있다.

용어 "양이온성 지질"은 수용성 양이온성 지질, 예컨대, 이에 한정되는 것은 아니지만, TransIT-2020, 또는 양이온성 지질 용액, 예컨대, 이에 한정되는 것은 아니지만, N,N,N',N'-테트라메틸-N, N'-비스(2-하이드록시에틸)-2,3-디(올레오일옥시)-1,4-부탄디암모늄 요오드화물, 및 L-디올레오일 포스파티딜에탄올아민(DOPE)을 포함하는 양이온성 지질 용액에 대한 언급을 포함한다(또한, 본원에 참조로 포함되는, 2007년 8월 2일 공개된 US2007/0178593 참조).

입자 전달 매트릭스는 금 입자, 텅스텐 입자, 및 탄화규소 휘스커 입자로 이루어진 군으로부터 선택되는 미립자를 포함할 수 있다.

입자 전달 매트릭스는 Tfx-10™, Tfx-20™, Tfx-50™, Lipofectin™, Lipofectamine™, Cellfectin™, Effectene™, Cytofectin GSV™, Perfect Lipids™, DOTAP™, DMRIE-C™, FuGENE-6™, Superfect™, Polyfeet™, 폴리에틸렌이민, 키토산, 프로타민 Cl, 히스톤 H1, 히스톤 CENH3, 폴리-L 라이신, 및 DMSA로 이루어진 군으로부터 선택되는 화합물을 더 포함할 수 있다(본원에 참조로 포함되는, 2007년 8월 2일 공개된 US2007/0178593).

RGEN 성분들은 또한, 복합체를 형성할 수 있는 임의의 온도, 예컨대 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃ ,10℃, 11℃, 12℃, 13℃, 14℃, 15℃, 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23.0℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33.0℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 및 40℃ 범위의 온도에서, 복합체 형성을 가능하게 하는 데 적합한 용액(예컨대, 이에 한정되는 것은 아니지만, Cas9 완충액(NEB))에서, 적어도 0.1 ㎍, 0.2 ㎍, 0.3 ㎍, 0.4 ㎍, 0.5 ㎍, 0.6 ㎍, 0.7 ㎍, 0.8 ㎍, 0.9 ㎍, 1.0 ㎍, 2.0 ㎍, 3.0 ㎍, 4.0 ㎍, 5.0 ㎍, 6.0 ㎍, 7.0 ㎍, 8.0 ㎍, 9.0 ㎍ 또는 10 ㎍의 가이드 RNA를 적어도 0.1 ㎍, 0.2 ㎍, 0.3 ㎍, 0.4 ㎍, 0.5 ㎍, 0.6 ㎍, 0.7 ㎍, 0.8 ㎍, 0.9 ㎍, 1.0 ㎍, 2.0 ㎍, 3.0 ㎍, 4.0 ㎍, 5.0 ㎍, 6.0 ㎍, 7.0 ㎍, 8.0 ㎍, 9.0 ㎍ 또는 10 ㎍의 Cas 엔도뉴클레아제와 결합함으로써 미립자에 코팅되기 전에 결합될 수 있다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 성분을 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자 및 적어도 하나의 Cas 엔도뉴클레아제 단백질을 세포에 도입하는 단계, 및 상기 가이드 RNA 및 상기 Cas 엔도뉴클레아제 단백질이 상기 세포 내에 복합체를 형성할 수 있도록 적절한 조건 하에서 상기 세포를 성장시키는 단계를 포함하는 방법을 포함한다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 성분을 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자 및 Cas 엔도뉴클레아제 단백질을 암호화하는 적어도 하나의 mRNA를 세포에 도입하는 단계, 및 상기 mRNA가 상기 Cas 엔도뉴클레아제 단백질을 번역하고 상기 가이드 RNA와 복합체를 형성할 수 있도록 적절한 조건 하에서 상기 세포를 성장시키는 단계를 포함하는 방법을 포함한다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하고, 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 적어도 하나의 폴리뉴클레오티드 주형과 함께 상기 세포에 도입하되, 상기 폴리뉴클레오티드 변형 주형은 상기 세포의 게놈 내 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하고, 상기 폴리뉴클레오티드 변형 주형의 상기 적어도 하나의 뉴클레오티드 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 단계를 포함하는 방법을 포함한다.

본 발명의 일 구현예에서, 상기 방법은 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하고, 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 공여 DNA와 함께 상기 세포에 도입하되, 상기 공여 DNA는 적어도 하나의 관심 폴리뉴클레오티드를 포함하는 단계를 포함하는 방법을 포함한다.

세포 성장에 적합한 조건은 당업계에 잘 알려져 있고, 당업자는 세포의 유형에 기초하여 임의의 성장 조건(예컨대, 식물 세포에 적합한 조건)을 사용할 수 있다. 실시예 8에 기술된 바와 같이, 식물 배아 또는 세포는 당업계에 공지된 임의의 식물 유지 배지(예컨대, 이에 한정되는 것은 아니지만, 560P, 실시예 8)에서 26℃ 내지 37℃ 범위의 온도에서 12 내지 48시간 동안 배양되고 나서, 26℃에 배치될 수 있다. 5 내지 7일 후, 배아/세포는 당업계에 공지된 임의의 선택 배지(예컨대, 이에 한정되는 것은 아니지만, 560R, 실시예 8)로 옮겨지고, 그 후에 계대배양된다.

RGEN 성분(가이드 RNA, Cas 엔도뉴클레아제 단백질 포함)은, 복합체를 형성할 수 있는 임의의 온도, 예컨대 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃ ,10℃, 11℃, 12℃, 13℃, 14℃, 15℃, 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 및 40℃ 범위의 온도에서, 복합체 형성을 가능하게 하는 데 적합한 용액(예컨대, 이에 한정되는 것은 아니지만, Cas9 완충액(NEB))에서, 적어도 0.1 ㎍, 0.2 ㎍, 0.3 ㎍, 0.4 ㎍, 0.5 ㎍, 0.6 ㎍, 0.7 ㎍, 0.8 ㎍, 0.9 ㎍, 1.0 ㎍, 2.0 ㎍, 3.0 ㎍, 4.0 ㎍, 5.0 ㎍, 6.0 ㎍, 7.0 ㎍, 8.0 ㎍, 9.0 ㎍ 또는 10 ㎍의 가이드 RNA를 적어도 0.1 ㎍, 0.2 ㎍, 0.3 ㎍, 0.4 ㎍, 0.5 ㎍, 0.6 ㎍, 0.7 ㎍, 0.8 ㎍, 0.9 ㎍, 1.0 ㎍, 2.0 ㎍, 3.0 ㎍, 4.0 ㎍, 5.0 ㎍, 6.0 ㎍, 7.0 ㎍, 8.0 ㎍, 9.0 ㎍ 또는 10 ㎍의 Cas 엔도뉴클레아제와 결합함으로써 미립자에 코팅되기 전(미립자와 결합되기 전)에 결합되어 리보뉴클레오티드-단백질 복합체(RNP)를 형성할 수 있다.

"성숙" 단백질은 번역후 가공된 폴리펩티드(즉, 1차 번역 생성물에 존재하는 임의의 프리펩티드 또는 프로펩티드가 제거된 것)를 지칭한다. "전구체" 단백질은 mRNA 번역의 1차 생성물(즉, 프리펩티드 및 프로펩티드가 여전히 존재함)을 지칭한다. 프리펩티드 및 프로펩티드는 세포내 국재화 신호일 수 있지만, 이에 한정되는 것은 아니다.

"안정적 형질전환"은 핵 및 세포소기관 게놈을 비롯한 숙주 생물의 게놈 내로 핵산 단편이 전달되어 유전적으로 안정한 유전(inheritance)을 야기하는 것을 지칭한다. 한편, "일시적 형질전환"은 숙주 생물의 핵 또는 기타 DNA 함유 세포소기관 내에 핵산 단편이 전달되어 통합 또는 안정적 유전 없이 유전자 발현을 야기하는 것을 지칭한다. 형질전환된 핵산 단편을 포함하는 숙주 생물은 "유전자이식 생물"로 지칭된다.

유전적으로 개선된 생식질의 상업적 개발은 또한, 종종 유전자 스태킹 접근법이라고 하는, 경작 식물에 다양한 형질을 도입하는 단계까지 진전되었다. 이러한 접근법에서, 상이한 관심 특성을 부여하는 다양한 유전자가 식물에 도입될 수 있다. 유전자 스태킹은 동시 형질전환, 재형질전환, 및 관심 유전자가 상이한 세포주 교차를 비제한적으로 포함하는 많은 수단에 의해 달성될 수 있다.

세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모 및 식물의 세포뿐만 아니라 본원에 기술된 방법에 의해 제조된 식물 및 종자를 포함하나, 이에 한정되는 것은 아니다. 식물 세포는 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 세포를 포함한다.

"식물"은 전체 식물, 식물 기관, 식물 조직, 종자, 및 식물 세포, 및 그 자손에 대한 언급을 포함한다. 식물 세포는 종자로부터의 세포, 현탁액 배양물, 배아, 분열부, 캘러스 조직, 잎, 뿌리, 어린 싹, 배우체, 포자체, 꽃가루 및 미포자를 제한 없이 포함한다. 식물 부분은 뿌리, 줄기, 어린 싹, 잎, 꽃가루, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물(예컨대, 단일 세포, 원형질체, 배아 및 캘러스 조직)을 비제한적으로 포함하는 분화 및 미분화 조직을 포함한다. 식물 조직은 식물에, 또는 식물 기관, 조직, 또는 세포 배양물에 있을 수 있다. 용어 "식물 기관"은 형태학적 및 기능적으로 구별되는 식물의 부분을 구성하는 식물 조직 또는 조직들의 집합을 지칭한다. 용어 "게놈"은 생물 또는 바이러스의 각각의 세포 또는 세포소기관에 존재하는 유전 물질(유전자 및 비코딩 서열)의 전체 보체; 및/또는 한쪽 모체로부터 (반수체) 단위로서 유전된 완전한 염색체 세트를 지칭한다. "자손"은 식물의 임의의 후속 세대를 포함한다.

유전자이식 식물은, 예를 들어, 형질전환 단계에 의해 도입된 이종 폴리뉴클레오티드를 게놈 내에 포함하는 식물을 포함한다. 이종 폴리뉴클레오티드는 폴리뉴클레오티드가 대대로 전달되도록 게놈에 안정적으로 통합될 수 있다. 이종 폴리뉴클레오티드는 단독으로 또는 재조합 DNA 작제물의 일부로서 게놈에 통합될 수 있다. 유전자이식 식물은 게놈 내에 하나보다 많은 이종 폴리뉴클레오티드를 포함할 수도 있다. 각각의 이종 폴리뉴클레오티드는 유전자이식 식물에 상이한 형질을 부여할 수 있다. 이종 폴리뉴클레오티드는 외래종으로부터 유래하는 서열, 또는 동일 종으로부터 유래하는 경우, 고유의 형태로부터 실질적으로 변형될 수 있는 서열을 포함할 수 있다. 유전자이식체는 초기에 그렇게 변경된 유전자이식체뿐만 아니라 초기의 유전자이식체로부터 유성 교배 또는 무성 번식에 의해 생성된 것들을 비롯하여, 이종 핵산의 존재에 의해 유전형이 변경된 임의의 세포, 세포주, 캘러스, 조직, 식물 부분 또는 식물을 포함할 수 있다. 종래의 식물 육종법, 외래 폴리뉴클레오티드의 삽입을 초래하지 않는 본원에 기술된 게놈 편집 절차, 또는 자연적으로 발생하는 사건, 예컨대, 무작위 타가 수정, 비재조합 바이러스 감염, 비재조합 박테리아 형질변형, 비재조합 전위, 또는 자연 돌연변이에 의한 (염색체 또는 염색체외) 게놈의 변경은 유전자이식체로 간주되지 않는다.

본 발명의 특정 구현예에서, 가임성 식물은 생존 가능한 웅성 및 자성 생식세포를 생산하는 식물이며, 자가 수정한다. 이러한 자가 수정 식물은 임의의 다른 생식세포 식물 및 그 안에 포함된 유전 물질의 기여 없이 자손 식물을 생산할 수 있다. 본 발명의 다른 구현예는 식물이 생존 가능하거나 달리 수정할 수 있는 웅성 생식세포, 또는 자성 생식세포, 또는 둘 다를 생산하지 않기 때문에 자가 수정하지 않는 식물의 사용을 포함할 수 있다. 본원에 사용된 "웅성 불임성 식물"은 생존 가능하거나 달리 수정할 수 있는 웅성 생식세포를 생산하지 않는 식물이다. 본원에 사용된 "자성 불임성 식물"은 생존 가능하거나 달리 수정할 수 있는 자성 생식세포를 생산하지 않는 식물이다. 웅성 불임성 및 자성 불임성 식물은 각각 자성 가임성 및 웅성 가임성일 수 있는 것으로 인정된다. 또한, 웅성 가임성(이지만, 자성 불임성) 식물은 자성 가임성 식물과 교배될 때 생존 가능한 자손을 생산할 수 있고, 자성 가임성(이지만, 웅성 불임성) 식물은 웅성 가임성 식물과 교배될 때 생존 가능한 자손을 생산할 수 있는 것으로 인정된다.

본원에서 "비통상적 효모"는 사카로마이세스(예컨대, S. 세레비시애) 또는 스키조사카로마이세스 효모 종이 아닌 임의의 효모를 지칭한다. 비통상적 효모는, 본원에 참조로 포함되는 Non-Conventional Yeasts in Genetics, Biochemistry and Biotechnology: Practical Protocols (K. Wolf, K.D. Breunig, G. Barth, Eds., Springer-Verlag, Berlin, Germany, 2003)에 기술되어 있다. 특정 구현예에서 비통상적인 효모는 추가적으로(또는 대안적으로) 상동 재조합(HR)에 의해 매개되는 복구 프로세스보다 비상동 말단 연결(NHEJ) DNA 복구 프로세스를 선호하는 효모일 수 있다. 이러한 맥락에서(HR보다 NHEJ를 선호) 비통상적인 효모의 정의는 본원에 참조로 포함되는 Chen et al. (PLoS ONE 8:e57952)에 더 개시되어 있다. 본원에서 바람직한 비통상적인 효모는 야로위아 속(예를 들어, 야로위아 리폴리티카)의 것들이다. 본원의 용어 "효모"는 주로 단세포 형태로 존재하는 진균 종을 지칭한다. 효모는 본원에서 선택적으로 "효모 세포"로 지칭될 수 있다(또한, 본원에 참조로 포함되는, 2014년 8월 13일 출원된 미국 가출원 62/036,652 참조).

"센티모건" (cM) 또는 "지도 단위"는 두 개의 연결된 유전자, 마커, 표적 부위, 유전자좌, 또는 이들의 임의의 쌍 간의 거리이고, 감수분열 생성물의 1%는 재조합이다. 따라서, 센티모건은 두 개의 연결된 유전자, 마커, 표적 부위, 유전자좌, 또는 이들의 임의의 쌍 간의 1% 평균 재조합 빈도와 동일한 거리에 해당한다.

본 발명은 하나 이상의 도입된 형질을 포함하는 식물의 육종에 유용하다. 가장 일반적으로, 유전자이식 형질은 아그로박테리움, 바이올리스틱, 또는 기타 일반적으로 사용되는 절차를 기반으로 한 형질전환 시스템의 결과로서 식물 게놈 전체에 무작위로 삽입된다. 최근에는, 유도된 이식유전자 삽입이 가능한 유전자 표적화 프로토콜이 개발되었다. 하나의 중요한 기술인 부위 특이적 통합(SSI)은 이전에 삽입된 이식유전자와 동일한 염색체 위치에 이식유전자를 표적화할 수 있다. 맞춤 설계된 메가뉴클레아제 및 맞춤 설계된 징크 핑거 메가뉴클레아제로 인해 연구자들은 특정 염색체 위치를 표적화하도록 뉴클레아제를 설계할 수 있으며, 이들 시약은 이러한 뉴클레아제에 의해 절단된 염색체 위치에 이식유전자를 표적화할 수 있도록 한다.

진핵 게놈, 예컨대, 식물 게놈의 정밀 유전자 조작을 위해 현재 사용되는 시스템은 호밍 엔도뉴클레아제, 메가뉴클레아제, 징크 핑거 뉴클레아제, 및 전사 활성물질-유사 이펙터 뉴클레아제(TALEN)에 의존하며, 이들은 모든 새로운 표적 유전자좌에 대해 다시 새로운 단백질 조작을 필요로 한다. 본원에 기술된 매우 특이적인, RNA-유도 DNA 뉴클레아제, 가이드 RNA/Cas9 엔도뉴클레아제 시스템은 보다 용이하게 맞춤 설계될 수 있으므로, 많은 상이한 표적 서열의 변형이 목표인 경우 더욱 유용하다.

본원에 기술된 가이드 RNA/Cas 시스템은 뉴클레아제 표적 이탈 절단이 표적 세포에 독성을 나타낼 수 있는 환경에서 게놈 조작, 특히 식물 게놈 조작에 특히 유용하다. 본원에 기술된 가이드 RNA/Cas 시스템의 일 구현예에서, 발현 최적화된 Cas9 유전자는 표적 게놈, 예를 들어, 식물 게놈에 안정적으로 통합된다. Cas9 유전자의 발현은 프로모터, 예를 들어, 항시성 프로모터, 조직 특이적 프로모터 또는 유도성 프로모터, 예를 들어, 온도 유도성, 스트레스 유도성, 발육 단계 유도성, 또는 화학적 유도성 프로모터일 수 있는 식물 프로모터의 제어 하에 있다. 가이드 RNA 또는 crRNA의 부재시, Cas9 단백질은 DNA를 자를 수 없으므로 식물 세포에서 그 존재는 거의 또는 전혀 영향을 미치지 않을 것이다. 따라서, 본원에 기술된 가이드 RNA/Cas 시스템의 주요 장점은 세포 생존력에 거의 또는 전혀 영향을 미치지 않는 Cas9 단백질을 효율적으로 발현시킬 수 있는 세포주 또는 유전자이식 생물을 생성하고 유지하는 능력이다. 원하는 게놈 부위에서 절단을 유도하여 표적화된 유전자 변형을 달성하기 위해, 가이드 RNA 또는 crRNA는 안정적으로 통합되고 발현된 cas9 유전자를 포함하는 세포에 다양한 방법으로 도입될 수 있다. 예를 들어, 가이드 RNA 또는 crRNA는 화학적 또는 효소적으로 합성되어, 유전자총 또는 전기천공과 같은 직접 전달 방법을 통해 Cas9 발현 세포에 도입될 수 있다. 대안적으로, 표적 세포에서 가이드 RNA 또는 crRNA를 효율적으로 발현시킬 수 있는 유전자가 화학적으로, 효소적으로, 또는 생물학적 시스템에서 합성될 수 있고, 이러한 유전자는 유전자총, 전기천공과 같은 직접 전달 방법 또는 아그로박테리움 매개 DNA 전달과 같은 생물학적 전달 방법을 통해 Cas9 발현 세포에 도입될 수 있다.

가이드 RNA/Cas 시스템 매개 유전자 표적화는 관심 유전자를 도입하기 위해 이중 가닥 절단 유도제를 사용하는 대신, 본원에 개시된 것과 같은 가이드 RNA/Cas 시스템을 사용하는 WO2013/0198888(2013년 8월 1일 공개)에 개시된 것과 유사한 방식으로 이식유전자 삽입을 유도하는 방법 및/또는 여러 이식유전자를 포함하는 복잡한 유전자이식 형질 유전자좌를 생성하는 방법에 사용될 수 있다. 복잡한 형질 유전자좌는 유전자적으로 서로 연결된 여러 이식유전자를 갖는 게놈 유전자좌를 포함한다. 서로로부터 0.1, 0.2, 0.3, 0.4, 0.5, 1.0, 2, 또는 심지어 5 센티모건(cM) 내에 독립적 이식유전자를 삽입함으로써, 이식유전자들은 단일 유전자좌로서 증식될 수 있다(예를 들어, 미국 특허 출원 13/427,138 또는 PCT 출원 PCT/US2012/030061 참조). 이식유전자를 포함하는 식물을 선택한 후, (적어도) 하나의 이식유전자를 포함하는 식물들을 교배하여 양쪽 이식유전자를 모두 포함하는 F1을 형성할 수 있다. 이러한 F1으로부터의 자손(F2 또는 BC1)에서, 1/500의 자손이 동일한 염색체에 재조합된 두 개의 서로 다른 이식유전자를 가질 것이다. 이후, 복잡한 유전자좌는 양쪽 이식유전자 형질을 갖는 단일 유전자좌로 증식될 수 있다. 이 프로세스를 반복하여 원하는 만큼 많은 형질을 쌓을 수 있다.

관심 표현형 또는 형질과 상관 관계가 있는 염색체 간격은 동정될 수 있다. 염색체 간격을 동정하기 위해 당업계에 잘 알려진 다양한 방법을 이용할 수 있다. 이러한 염색체 간격의 경계는 관심 형질을 제어하는 유전자에 연결될 마커를 포함하도록 정해진다. 다시 말해, 염색체 간격은 그 간격 내에 있는 임의의 마커(간격의 경계를 정의하는 말단 마커를 포함)가 노던 잎마름병 저항성을 위한 마커로서 사용될 수 있도록 정해진다. 일 구현예에서, 염색체 간격은 적어도 하나의 QTL을 포함하고, 또한 실제로 하나보다 많은 QTL을 포함할 수 있다. 하나의 마커는 하나보다 많은 QTL에 연결될 수 있으므로, 동일한 간격에서 여러 QTL의 근접성은 특정 마커와 특정 QTL과의 상관 관계를 모호하게 할 수 있다. 반대로, 예를 들어, 근접한 두 개의 마커가 원하는 표현형 형질과 공동 분리를 보이는 경우, 이들 각각의 마커가 동일한 QTL을 동정하는지 두 개의 서로 다른 QTL을 동정하는지 때로는 불분명하다. 용어 "양적 형질 유전자좌" 또는 "QTL"은 적어도 하나의 유전적 배경, 예를 들어, 적어도 하나의 육종 개체군에서 양적 표현형 형질의 차별적 발현과 관련된 DNA의 영역을 지칭한다. QTL의 영역은 문제의 형질에 영향을 미치는 유전자 또는 유전자들을 포함하거나 이들에 밀접하게 연결되어 있다. "QTL의 대립 유전자"는 일배체형과 같은 연속된 게놈 영역 또는 연결 그룹 내에 여러 유전자 또는 기타 유전적 인자를 포함할 수 있다. QTL의 대립 유전자는 특정 창 내의 일배체형을 나타낼 수 있으며, 상기 창은 하나 이상의 다형성 마커의 세트로 정의되고 추적될 수 있는 연속된 게놈 영역이다. 일배체형은 특정 창 내 각각의 마커에서 대립 유전자의 고유의 지문에 의해 정의될 수 있다.

선별 마커 표현형을 사용하지 않고 표적 부위 또는 그 근처에서 변경된 게놈을 가진 세포를 동정하기 위해 다양한 방법을 이용할 수 있다. 이러한 방법은 PCR 방법, 시퀀싱 방법, 뉴클레아제 분해, 서던 블롯, 및 이들의 임의의 조합을 비제한적으로 포함하여, 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 감지하는 것으로 볼 수 있다.

단백질은 아미노산 치환, 결실, 절단, 및 삽입을 비롯한 다양한 방식으로 변경될 수 있다. 이러한 조작 방법은 일반적으로 알려져 있다. 예를 들어, 단백질(들)의 아미노산 서열 변이체는 DNA의 돌연변이에 의해 제조될 수 있다. 돌연변이유발 및 뉴클레오티드 서열 변경 방법으로는, 예를 들어, Kunkel, (1985) Proc. Natl. Acad. Sci. USA 82:488-92; Kunkel et al., (1987) Meth Enzymol 154:367-82; 미국 특허 4,873,192호; Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York) 및 거기에 인용된 참고문헌을 들 수 있다. 단백질의 생물학적 활성에 영향을 미치지 않을 것 같은 아미노산 치환에 관한 지침은, 예를 들어, Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl Biomed Res Found, Washington, D.C.)의 모델에서 찾을 수 있다. 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산과 교환하는 것과 같은 보존적 치환이 바람직할 수 있다. 보존적 결실, 삽입 및 아미노산 치환은 단백질의 특성에 근본적인 변화를 일으킬 것으로 예상되지 않으며, 임의의 치환, 결실, 삽입, 또는 이들의 조합의 효과는 통상적인 스크리닝 분석법에 의해 평가될 수 있다. 이중 가닥 절단 유도 활성에 대한 분석법은 알려져 있고, 일반적으로 표적 부위를 포함하는 DNA 기질 상에서 작용제의 전체 활성 및 특이성을 측정한다.

용어 "쌍떡잎 식물"(dicot)은 "dicotyledoneae"로도 알려진 속씨 식물의 하위강을 지칭하며, 전체 식물, 식물 기관(예컨대, 잎, 줄기, 뿌리 등), 종자, 식물 세포, 및 그 자손에 대한 언급을 포함한다. 식물 세포는, 본원에 사용된 바와 같이, 종자, 현탁액 배양물, 배아, 분열부, 캘러스 조직, 잎, 뿌리, 어린 싹, 배우체, 포자체, 꽃가루 및 미포자를 제한 없이 포함한다.

본 명세서의 문맥에서 용어 "교배"(crossed, cross, 또는 crossing)는 자손(즉, 세포, 종자, 또는 식물)을 생산하기 위한 수분을 통한 생식세포의 융합을 의미한다. 이 용어는 유성 교배(다른 식물에 의한 식물의 수분) 및 자가생식(자기 수분, 즉, 꽃가루 및 밑씨(또는 소포자 및 대포자)가 동일 식물 또는 유전적으로 동일한 식물로부터 유래된 경우)을 모두 포함한다.

용어 "이입"(introgression)은 유전자좌의 원하는 대립 유전자가 하나의 유전적 배경으로부터 다른 유전적 배경으로 유전되는 것을 의미한다. 예를 들어, 특정 유전자좌에서의 원하는 대립 유전자의 이입은, 적어도 하나의 모체 식물이 그 게놈 내에 원하는 대립 유전자를 갖는 두 모체 식물 간의 유성 교배를 통해 적어도 하나의 자손 식물에 유전될 수 있다. 대안적으로, 예를 들어, 대립 유전자의 유전은, 예를 들어, 적어도 하나의 공여 원형질체가 그 게놈 내에 원하는 대립 유전자를 갖는 융합된 원형질체에서, 두 공여 게놈 간의 재조합에 의해 일어날 수 있다. 원하는 대립 유전자는, 예를 들어, 이식유전자, 변형된(돌연변이되거나 편집된) 고유의 대립 유전자, 또는 마커 또는 QTL의 선택된 대립 유전자일 수 있다.

표준 DNA 단리, 정제, 분자 복제, 벡터 작제 및 검증/특성화 방법은 잘 확립되어 있다(예를 들어, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY) 참조). 벡터 및 작제물은 원형 플라스미드, 및 관심 폴리뉴클레오티드와 선택적으로 링커, 어댑터, 조절 또는 분석을 비롯한 다른 성분을 포함하는 선형 폴리뉴클레오티드를 포함한다. 일부 예에서, 인식 부위 및/또는 표적 부위는 인트론, 코딩 서열, 5' UTR, 3' UTR, 및/또는 조절 영역 내에 포함될 수 있다.

본 발명은 또한, 표적 부위 내 이중 가닥 절단에 결합할 수 있고 이를 생성할 수 있는 가이드 RNA/Cas 시스템을 식물, 식물 세포, 또는 식물 부분에서 발현시키기 위한 발현 작제물을 제공한다. 일 구현예에서, 본 발명의 발현 작제물은 Cas 유전자를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터 및 본 발명의 가이드 RNA에 작동 가능하게 연결된 프로모터를 포함한다. 프로모터는 식물 세포에서 작동 가능하게 연결된 뉴클레오티드 서열의 발현을 유도할 수 있다.

외떡잎 식물 및 쌍떡잎 식물을 비롯한 임의의 식물이 사용될 수 있다. 사용될 수 있는 외떡잎 식물의 예는 옥수수(제아 메이스(Zea mays)), 벼(오리자 사티바(Oryza sativa)), 호밀(세칼레 세레알레(Secale cereale)), 수수(소르검 비칼라(Sorghum bicolor), 소르검 불가레(Sorghum vulgare)), 밀렛(예컨대, 펄 밀렛(페니세툼 글라쿰(Pennisetum glaucum)), 프로소 밀렛(파니쿰 밀리아세움(Panicum miliaceum)), 조(세타리아 이탈리카(Setaria italica)), 손가락조(엘류신 코라카나(Eleusine coracana))), 밀(트리티쿰 아에스티붐(Triticum aestivum), 사탕수수(사카룸(Saccharum) 종), 귀리(아베나(Avena)), 보리(호르데움(Hordeum)), 스위치그래스(파니쿰 비르가툼(Panicum virgatum), 파인애플(아나나스 코모수스(Ananas comosus)), 바나나(무사(Musa) 종), 야자, 관상용 식물, 잔디, 및 기타 풀을 포함하나, 이에 한정되는 것은 아니다. 사용될 수 있는 쌍떡잎 식물의 예는 대두(글리신 맥스(Glycine max)), 카놀라(브라시카 나푸스(Brassica napus) 및 브라시카 캠페스트리스(B. campestris)), 알팔파(메디카고 사티바(Medicago sativa)), 담배(니코티아나 타바쿰(Nicotiana tabacum)), 아라비돕시스(아라비돕시스 탈리아나(Arabidopsis thaliana)), 해바라기(헬리안투스 안누스(Helianthus annuus)), 목화(고시피움 아르보레움(Gossypium arboreum)), 땅콩(아라키스 하이포개아(Arachis hypogaea)), 토마토(솔라눔 리코페르시쿰(Solanum lycopersicum)) 및 감자(솔라눔 투베로숨(Solanum tuberosum)) 등을 포함하나, 이에 한정되는 것은 아니다.

약어의 의미는 다음과 같다: "sec"는 초, "min"은 분, "h"는 시간, "d"는 일, "μL"는 마이크로리터, "mL"은 밀리리터, "L"은 리터, "μM"은 마이크로몰, "mM"은 밀리몰, "M"은 몰, "mmol"은 밀리몰, "μmole"은 마이크로몰, "g"는 그램, "㎍"는 마이크로그램, "ng"는 나노그램, "U"는 단위, "bp"는 염기쌍, "kb"는 킬로염기를 의미한다.

본원에 개시된 조성물 및 방법의 비제한적인 예는 다음과 같다:

1. 세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하는 방법으로서, 게놈 내 파괴된 유전자를 포함하는 세포에 가이드 RNA/Cas 엔도뉴클레아제 복합체를 도입하는 단계를 포함하되, 상기 복합체는 이중 가닥 절단을 생성하고, 상기 파괴된 유전자는 기능성 유전자 산물을 암호화하지 않고, 상기 파괴된 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 상기 기능성 유전자 산물을 암호화할 수 있는 비파괴 유전자로 복원되는 방법.

2. 구현예 1에 있어서, 상기 파괴된 유전자는 해당 비파괴 유전자와 비교할 때 PAM 서열의 상류(5') 네 번째 뉴클레오티드의 염기쌍 결실을 포함하고, 상기 염기쌍 결실은 파괴된 유전자의 유전자 산물에서 아미노산 프레임이동을 생성함으로써, 파괴된 유전자의 유전자 산물을 비기능적 상태로 만드는 방법.

3. 구현예 2에 있어서, 염기쌍 결실은 코돈 서열의 첫 번째 뉴클레오티드인 방법.

4. 제2항에 있어서, 염기쌍 결실은 코돈 서열의 두 번째 뉴클레오티드인 방법.

5. 구현예 2에 있어서, 염기쌍 결실은 코돈 서열의 세 번째 뉴클레오티드인 방법.

6. 구현예 1에 있어서, 복원은 이중 가닥 절단 부위에 단일 염기를 삽입시키는 비상동 말단 연결(NHEJ)에 의해 달성되는 방법.

7. 구현예 1에 있어서, 복원은 상동 재조합 또는 상동성 유도 복구를 이용하지 않고 이중 가닥 절단 부위에 단일 염기를 삽입하여 달성되는 방법.

8. 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서,

표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및

상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 단백질에 의해 선택하는 단계를 포함하는 방법.

9. 구현예 8에 있어서, 변형은 상기 표적 부위에서의 적어도 하나의 뉴클레오티드의 삽입, 적어도 하나의 뉴클레오티드의 결실, 또는 적어도 하나의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택되는 방법.

10. 구현예 8에 있어서, 상기 세포에 폴리뉴클레오티드 변형 주형을 도입하는 단계를 더 포함하되, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 방법.

11. 구현예 8에 있어서, 상기 폴리뉴클레오티드 변형 주형의 적어도 하나의 뉴클레오티드 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.

12. 구현예 8에 있어서, 세포에 공여 DNA를 도입하는 단계를 더 포함하되, 상기 공여 DNA는 상기 표적 부위에 삽입될 적어도 하나의 관심 폴리뉴클레오티드를 포함하는 방법.

13. 구현예 8에 있어서, 세포는 인간, 비인간, 동물, 고세균, 박테리아, 진균, 곤충, 효모, 비통상적 효모, 및 식물 세포로 이루어진 군으로부터 선택되는 방법.

14. 구현예 13에 있어서, 식물 세포는 외떡잎식물 및 쌍떡잎식물 세포로 이루어진 군으로부터 선택되는 방법.

15. 구현예 14에 있어서, 식물 세포는 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 토마토, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 방법.

16. 구현예 13에 있어서, 상기 식물 세포로부터 식물 또는 자손 식물을 생산하는 단계를 더 포함하는 방법.

17. 임의의 하나의 가이드 RNA 및 Cas 엔도뉴클레아제가 결여된, 구현예 16의 방법에 의해 생산된 식물 또는 자손 식물.

18. 구현예 8에 있어서, 파괴된 선택 마커 유전자는 파괴된 ALS-저항성 유전자인 방법.

19. 폴리뉴클레오티드 변형 주형을 사용하지 않고 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법으로서,

a) 적어도 하나의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있는 단계;

b) 상기 뉴클레오티드 서열에 적어도 하나의 단일 뉴클레오티드 결실을 포함하는 세포를 (a)로부터 선택하되, 상기 뉴클레오티드 결실은 편집될 위치에 위치하는 단계; 및

c) (b)의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있고, 폴리뉴클레오티드 변형 주형을 사용하지 않고 (b)의 뉴클레오티드 결실과 동일한 위치에 단일 뉴클레오티드를 삽입할 수 있는 단계를 포함하는 방법.

20. 폴리뉴클레오티드 변형 주형 또는 공여 DNA를 사용하지 않고 식물의 게놈 내 뉴클레오티드 서열을 편집하는 방법으로서,

a) 적어도 하나의 식물 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있는 단계;

b) 상기 뉴클레오티드 서열에 적어도 하나의 단일 뉴클레오티드 결실을 포함하는 식물 세포를 (a)로부터 선택하되, 상기 뉴클레오티드 결실은 편집될 위치에 위치하는 단계;

c) (b)의 식물 세포로부터 식물을 재생시키는 단계;

d) (c)의 식물로부터의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있고, 폴리뉴클레오티드 변형 주형을 사용하지 않고 (b)의 뉴클레오티드 결실과 동일한 위치에 단일 뉴클레오티드를 삽입할 수 있는 복합체를 형성할 수 있는 단계; 및

e) 최적으로는, (d)의 뉴클레오티드 삽입을 포함하는 세포를 선택하는 단계를 포함하는 방법.

21. 구현예 1, 8, 18 내지 20 중 어느 하나에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 Cas 엔도뉴클레아제 단백질은 각각 RNA 및 단백질로서 세포에 도입되는 방법.

22. 구현예 1, 8, 18 내지 20 중 어느 하나에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 식물 세포에 도입되기 전에 시험관내 조립되어 리보뉴클레오티드-단백질 복합체로서 세포에 도입되는 방법.

23. 구현예 1, 8, 18 내지 20 중 어느 하나에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체의 성분은 Cas 엔도뉴클레아제 단백질을 암호화하는 mRNA로서, 그리고 가이드 RNA를 포함하는 RNA로서 도입되는 방법.

24. 구현예 1, 8, 18 내지 19 중 어느 하나에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체의 성분은 가이드 분자 및 Cas 엔도뉴클레아제 단백질을 암호화하는 재조합 DNA 분자로서 도입되는 방법.

25. 구현예 1, 8, 18 내지 19 중 어느 하나에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 세포 내에서 조립되는 방법.

26. 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하는 단계 및 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 상기 세포에 도입하는 단계를 포함하는 방법.

27. 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자 및 적어도 하나의 Cas 엔도뉴클레아제 단백질을 세포에 도입하는 단계, 및 상기 가이드 RNA 및 상기 Cas 엔도뉴클레아제 단백질이 상기 세포 내에 복합체를 형성할 수 있도록 적절한 조건 하에서 상기 세포를 성장시키는 단계를 포함하는 방법.

28. 가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 RNA 분자 및 Cas 엔도뉴클레아제 단백질을 암호화하는 적어도 하나의 mRNA를 세포에 도입하는 단계, 및 상기 mRNA가 상기 Cas 엔도뉴클레아제 단백질을 번역하고 상기 가이드 RNA와 복합체를 형성할 수 있도록 적절한 조건 하에서 상기 세포를 성장시키는 단계를 포함하는 방법.

29. 구현예 26 내지 28에 있어서, 폴리뉴클레오티드 주형을 도입하는 단계를 더 포함하되, 상기 폴리뉴클레오티드 변형 주형은 상기 세포의 게놈 내 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하며, 상기 폴리뉴클레오티드 변형 주형의 상기 적어도 하나의 뉴클레오티드 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.

30. 구현예 26 내지 28에 있어서, 공여 DNA를 도입하는 단계를 더 포함하되, 상기 공여 DNA는 적어도 하나의 관심 폴리뉴클레오티드를 포함하는 방법.

31. 구현예 26 내지 28에 있어서, 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체는 상기 세포의 게놈 내 표적 부위에 이중 가닥 절단을 도입하는 방법.

32. 구현예 1 내지 31에 있어서, 상기 Cas 엔도뉴클레아제는 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-H, Cas5, Cas7, Cas8, Cas10, 또는 이들의 복합체로 이루어진 군으로부터 선택되는 방법.

33. 구현예 26 내지 28에 있어서, 도입은 입자 매개 전달, 휘스커 매개 전달, 세포 침투성 펩티드 매개 전달, 전기천공, PEP 매개 형질감염 및 나노입자 매개 전달로 이루어진 군으로부터 선택되는 전달 시스템을 통한 것인 방법.

34. 구현예 29에 있어서, 폴리뉴클레오티드 변형 주형은 단일 가닥 또는 이중 가닥 분자인 방법.

35. 구현예 30에 있어서, 공여 DNA는 단일 가닥 또는 이중 가닥 분자인 방법.

36. 구현예 26 내지 28에 있어서, 세포는 세포 발육을 자극할 수 있는 미리 통합된 발육 유전자를 포함하는 식물 세포인 방법.

37. 구현예 26 내지 28에 있어서, 세포는 인간, 비인간, 동물, 고세균, 박테리아, 진균, 곤충, 효모, 비통상적 효모, 및 식물 세포로 이루어진 군으로부터 선택되는 방법.

38. 구현예 37에 있어서, 식물 세포는 외떡잎식물 및 쌍떡잎식물 세포로 이루어진 군으로부터 선택되는 방법.

39. 구현예 38에 있어서, 식물 세포는 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 토마토, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 방법.

40. 구현예 36에 있어서, 상기 식물은 상기 식물 세포의 게놈 내 상기 적어도 하나의 뉴클레오티드 변형을 포함하고, 상기 식물은 상기 가이드 RNA/Cas 엔도뉴클레아제 복합체 또는 이의 임의의 조합을 포함하지 않는 방법.

41. 구현예 37의 식물 세포로부터 생산된 식물로서, 그 게놈에 통합된 적어도 하나의 관심 폴리뉴클레오티드를 포함하는 식물.

42. 구현예 26에 있어서, 상기 입자 전달 매트릭스는 미립자를 포함하는 방법.

43. 구현예 42에 있어서, 상기 미립자는 금 입자, 텅스텐 입자, 및 탄화규소 휘스커 입자로 이루어진 군으로부터 선택되는 방법.

44. 구현예 26에 있어서, 입자 전달 매트릭스는 양이온성 지질과 결합된 미립자를 포함하는 방법.

45. 구현예 44에 있어서, 양이온성 지질은 수용성 양이온성 지질인 방법.

46. 구현예 45에 있어서, 수용성 양이온성 지질은 TransIT-2020인 방법.

47. 변형된 표적 부위를 포함하는 설포닐우레아 저항성 식물을 생산하는 방법으로서, a) 파괴된 설포닐우레아 저항성(ALS) 유전자를 포함하는 식물 세포에 제1 가이드 RNA, Cas9 엔도뉴클레아제, 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas9 엔도뉴클레아제는 상기 파괴된 설포닐우레아 저항성(ALS) 유전자에 위치한 코돈 서열의 제2 뉴클레오티드의 바로 하류(3')에서 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 제2 가이드 RNA 및 Cas9 엔도뉴클레아제는 상기 표적 부위에 이중 가닥 절단을 도입할 수 있는 제2 복합체를 형성할 수 있는 단계; 및 b) 상기 식물 세포로부터 설포닐우레아 저항성 식물을 얻되, 상기 설포닐우레아 저항성 식물은 상기 표적에 변형을 포함하고, 상기 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 단계를 포함하는 방법.

48. 세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하는 방법으로서, 게놈 내 파괴된 유전자를 포함하는 세포에 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체를 도입하는 단계를 포함하되, 상기 복합체는 이중 가닥 절단을 생성하고, 상기 파괴된 유전자는 기능성 유전자 산물을 암호화하지 않고, 상기 파괴된 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 상기 기능성 유전자 산물을 암호화할 수 있는 비파괴 유전자로 복원되는 방법.

49. 구현예 46에 있어서, 상기 파괴된 유전자는 해당 비파괴 유전자와 비교할 때 PAM 서열의 상류(5') 네 번째 뉴클레오티드의 염기쌍 결실을 포함하고, 상기 염기쌍 결실은 파괴된 유전자의 유전자 산물에서 아미노산 프레임이동을 생성함으로써, 파괴된 유전자의 유전자 산물을 비기능적 상태로 만드는 방법.

48. 식물 세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서,

표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 제1 가이드 폴리뉴클레오티드, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 폴리뉴클레오티드를 도입하되, 상기 제1 가이드 폴리뉴클레오티드 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 제2 가이드 폴리뉴클레오티드 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및

상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 마커 단백질에 의해 선택하는 단계를 포함하는 방법.

50. 폴리뉴클레오티드 변형 주형을 사용하지 않고 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법으로서,

a) 적어도 하나의 세포에 적어도 하나의 가이드 폴리뉴클레오티드 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 폴리뉴클레오티드 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있는 단계;

c) (b)의 세포에 적어도 하나의 가이드 폴리뉴클레오티드 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 폴리뉴클레오티드 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있고, 폴리뉴클레오티드 변형 주형을 사용하지 않고 (b)의 뉴클레오티드 결실과 동일한 위치에 단일 뉴클레오티드를 삽입할 수 있는 단계를 포함하는 방법.

51. 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서, 적어도 하나의 가이드 폴리뉴클레오티드 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하는 단계 및 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 상기 세포에 도입하는 단계를 포함하는 방법.

실시예

다음 실시예들에서, 달리 언급되지 않는 한, 부(parts) 및 백분율은 중량 기준이고 도(degree)는 섭씨이다. 이 실시예들은 본 발명의 구현예들을 나타내면서 단지 예시로 제공되는 것임을 이해해야 한다. 상기 논의 및 이들 실시예로부터, 당업자는 다양한 용도 및 조건에 맞도록 본 발명을 다양하게 변경하고 변형할 수 있다. 이러한 변형은 또한, 첨부된 청구범위의 범위 내에 속하는 것으로 의도된다.

실시예 1

Cas9 엔도뉴클레아제 및 가이드 RNA 발현 카세트의 전달에 의한 식물 세포의 게놈 내 표적 DNA 서열의 변형

스트렙토코커스 피오게네스 M1 GAS(SF370)로부터의 Cas9 유전자(SEQ ID NO: 1)를 당업계에 공지된 표준 기술을 이용하여 옥수수 코돈 최적화하고, 대장균 및 아그로박테리움에서의 발현을 제거하기 위해 감자 ST-LS1 인트론(SEQ ID NO: 2)을 도입하였다. 옥수수 세포에서 Cas9 단백질의 핵 국재화를 용이하게 하기 위해, 유인원 바이러스 40(SV40) 1부분 아미노 말단 핵 국재화 신호(MAPKKKRKV, SEQ ID NO: 3) 및 아그로박테리움 투메파시엔스 2부분 VirD2 T-DNA 경계 엔도뉴클레아제 카복실 말단 핵 국재화 신호(KRPRDRHDGELGGRKRAR, SEQ ID NO: 4)를 Cas9 오픈 리딩 프레임의 아미노 말단 및 카복실 말단에 각각 포함시켰다. 옥수수 최적화된 Cas9 유전자를 표준 분자 생물학 기술에 의해 옥수수 항시성 프로모터(유비퀴틴)에 작동 가능하게 연결하였다. 전사는 감자 프로테이나아제 저해제 II 유전자(PinII)로부터의 3' 서열의 첨가에 의해 종결되어 UBI:Cas9:PinII 벡터를 생성한다. 유비퀴틴에 의해 유도된 옥수수 최적화된 Cas9 발현 카세트의 서열을 SEQ ID NO: 5에 나타내었다.

문헌[Mali et al., 2013 (Science 339:823-26)]에 기술된 방법을 이용하여 단일 가이드 RNA(gRNA)를 설계하였다. 옥수수 U6 중합효소 III 프로모터 및 종결자를 분리하여 gRNA의 개시 및 종결을 지시하는 데 각각 사용하였다. 문헌[Cong et al., 2013 (Science 339:819-23)]에 기술된 바와 같이 절단이 바깥 방향으로 배향된 역 탠덤 배향으로 2개의 BbsI 제한 엔도뉴클레아제 부위를 도입하여 옥수수 게놈 DNA 표적 서열을 gRNA 발현 작제물에 빠르게 도입하는 것을 용이하게 하였다. G 뉴클레오티드로 시작하는 표적 서열만을 사용하여 gRNA의 바람직한 중합효소 III 발현을 촉진시켰다. gRNA 발현 카세트를 Bluescript SK 벡터(SEQ ID NO: 6)에 서브클로닝하였다.

옥수수 최적화된 Cas9-gRNA 복합체가 비상동 말단 연결(NHEJ) 복구 경로를 통해 옥수수 염색체 DNA에서 표적 돌연변이를 인식, 절단, 및 촉진할 수 있는지를 검정하기 위해, 5개 옥수수 유전자좌(각각의 유전자좌에서 3개의 상이한 게놈 서열)를 절단 표적으로 하고(표 2 참조), 돌연변이의 존재에 대해 앰플리콘 심층 시퀀싱으로 조사하였다.

특정 옥수수 가변 표적화 도메인을 포함하는 옥수수 최적화된 Cas9 엔도뉴클레아제 및 gRNA 발현 카세트를 시각적 선택 마커(UBI:MoPAT:DsRED 융합) 및 발육 유전자 ZmODP-2(BBM) 및 ZmWUS2(WUS)(실시예 9 참조)와 함께 유전자총에 의해(실시예 8 참조) 60-90 Hi-II 미성숙 옥수수 배아에 공동으로 전달하였다. Cas9 또는 gRNA 발현 카세트만으로 형질전환된 Hi-II 옥수수 배아는 음성 대조군으로서 사용되었다. 7일 후, 각각의 처리로부터 가장 균일하게 형질전환된 20~30개 배아(DsRED 형광 단백질의 일시적 발현에 기초)를 모으고 전체 게놈 DNA를 추출하였다. 의도된 표적 부위를 둘러싼 영역을, 두 차례의 PCR을 통해 "꼬리"(tailed) 프라이머를 사용해 앰플리콘 특이적 바코드 및 일루미나 시퀀싱에 필요한 서열을 추가하는 Phusion® High Fidelity PCR Master Mix(New England Biolabs, M0531L)로 PCR 증폭시켰다. 1차 PCR 반응에 사용된 프라이머를 표 3에 나타내었다.

PCR 프라이머 서열

표적 부위	프라이머	1차 PCR 프라이머 서열	SEQ ID NO:
MS26Cas-1	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGACCGGAAGCTCGCCGCGT	19
MS26Cas-1	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTTCCTGGAGGACGACGTGCTG	20
MS26Cas-2	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGGTCCTGGAGGACGACGTGCTG	21
MS26Cas-2	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTCCGGAAGCTCGCCGCGT	22
MS26Cas-3	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTTCCTCCGGAAGCTCGCCGCGT	23
MS26Cas-3	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTTCCTGGAGGACGACGTGCTG	20
LIGCas-1	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGACTGTAACGATTTACGCACCTGCTG	24
LIGCas-1	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCAAATGAGTAGCAGCGCACGTAT	25
LIGCas-2	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTTCCTCTGTAACGATTTACGCACCTGCTG	26
LIGCas-2	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCAAATGAGTAGCAGCGCACGTAT	25
LIGCas-3	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGGCGCAAATGAGTAGCAGCGCAC	27
LIGCas-3	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTCACCTGCTGGGAATTGTACCGTA	28
MS45Cas-1	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGAGGACCCGTTCGGCCTCAGT	29
MS45Cas-1	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCCGGCTGGCATTGTCTCTG	30
MS45Cas-2	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTTCCTGGACCCGTTCGGCCTCAGT	31
MS45Cas-2	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCCGGCTGGCATTGTCTCTG	30
MS45Cas-3	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTGAAGGGACCCGTTCGGCCTCAGT	32
MS45Cas-3	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCCGGCTGGCATTGTCTCTG	30
ALSCas-1	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTAAGGCGACGATGGGCGTCTCCTG	33
ALSCas-1	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCGTCTGCATCGCCACCTC	34
ALSCas-2	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTCCCGACGATGGGCGTCTCCTG	35
ALSCas-2	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCGTCTGCATCGCCACCTC	34
ALSCas-3	포워드	CTACACTCTTTCCCTACACGACGCTCTTCCGATCTGGAACGACGATGGGCGTCTCCTG	36
ALSCas-3	리버스	CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGCGTCTGCATCGCCACCTC	34

2차 PCR 반응에 사용된 프라이머는 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG(포워드, SEQ ID NO: 37) 및 CAAGCAGAAGACGGCATA(리버스, SEQ ID NO: 38)였다.

얻어진 PCR 증폭을 Qiagen PCR 정제 스핀 컬럼으로 정제하고, Hoechst 염료계 형광 분석법으로 농도를 측정하고, 등몰 비로 합치고, 30~40% (v/v) 스파이크의 PhiX 제어 v3(일루미나, FC-110-3001)로 일루미나의 MiSeq Personal Sequencer에서 단일 해독 100개 뉴클레오티드 길이의 심층 시퀀싱을 수행하여 서열 바이어스를 상쇄시켰다. 음성 대조군에서 유사한 수준으로 발견되지 않고 예상 절단 부위를 중심으로 10 뉴클레오티드 윈도우 내에서 발생한 1개 이상의 뉴클레오티드 삽입-결실을 가진 해독만을 돌연변이로 분류하였다. 동일한 돌연변이를 가진 돌연변이 해독을 계수하고 하나의 군으로 분리하였고, 상위 10개의 가장 일반적인 돌연변이는 예상 절단 부위 내에서 발생하는 것으로 시각적으로 확인되었다. 이어서, 돌연변이의 총 수를 사용하여 바코드 및 포워드 프라이머와의 완벽한 일치를 포함하는 적절한 길이의 총 해독 수를 기초로 돌연변이 해독의 백분율을 계산하였다.

모든 15개 부위를 표적화하는 Cas9-gRNA 시스템에 대한 앰플리콘 심층 시퀀싱에 의해 밝혀진 돌연변이 빈도를 표 4에 나타내었다.

5개의 표적 유전자좌(15개 표적 부위)에서 돌연변이 해독의 백분율

표적	DSB 시약	총 해독 수	돌연변이 표적 유전자 해독의 수	표적 유전자에서 돌연변이 해독의 백분율
LIG (Chr. 2)	LIG-CR1 gRNA+Cas9	716,854	33,050	4.61%
	LIG-CR2 gRNA+Cas9	711,047	16,675	2.35%
	LIG-CR3 gRNA+Cas9	713,183	27,959	3.92%
MS26 (Chr. 1)	MS26-CR1 gRNA+Cas9	575,671	10,073	1.75%
	MS26-CR2 gRNA+Cas9	543,856	16,930	3.11%
	MS26-CR3 gRNA+Cas9	538,141	13,879	2.58%
MS45 (Chr. 9)	MS45-CR1 gRNA+Cas9	812,644	3,795	0.47%
	MS45-CR2 gRNA+Cas9	785,183	14,704	1.87%
	MS45-CR3 gRNA+Cas9	728,023	9,203	1.26%
ALS1 (Chr. 4) 및 ALS2 (Chr. 5)	ALS-CR1 gRNA+Cas9	434,452	9,669	2.23%
	ALS-CR2 gRNA+Cas9	472,351	6,352	1.35%
	ALS-CR3 gRNA+Cas9	497,786	8,535	1.72%
대조군	Cas9만	640,063	1	0.00%
대조군	LIG-CR1 gRNA만	646,774	1	0.00%

추가 분석 결과, Cas9-gRNA 시스템에 의해 촉진된 가장 일반적인 유형의 돌연변이는 단일 뉴클레오티드 삽입인 것으로 나타났다(예를 들어, 도 1, SEQ ID NO: 49 내지 58 참조). 검정된 대부분의 gRNA에서 유사한 결과가 관찰되었다(표 5).

본 실시예는 RNA 유도 Cas9이 돌연변이의 빈도가 높은 이중 가닥 절단을 생성함을 보여준다. 여러 표적 부위에서의 돌연변이 분석 결과, 다양한 크기의 결실 및/또는 삽입이 관찰되었지만, 단일 뉴클레오티드 삽입 및 단일 뉴클레오티드 결실이 옥수수에서 검정된 대부분의 표적 부위에 있어서 Cas9-gRNA 기술에 의해 생성되는 가장 일반적인 유형의 돌연변이인 것으로 나타났다.

실시예 2

편집된 아세토락테이트 합성효소 유전자는 클로르설푸론에 대한 저항성을 부여함

본 실시예는 천연 옥수수 아세토락테이트 합성효소(ALS) 유전자의 뉴클레오티드 서열에 도입된 특이적 변화(들)가 설포닐우레아계 제초제, 특히 클로르설푸론에 대한 저항성을 유발함을 보여준다.

옥수수에는 DNA 수준에서 94% 서열 동일성을 갖는, 염색체 4 및 5에 각각 위치한 2개의 ALS 유전자, ALS1(SEQ ID NO: 39) 및 ALS2(SEQ ID NO: 40)가 존재한다.

ALS 단백질은 N 말단 운반체를 포함하며, 성숙 단백질은 엽록체로의 운반에 이어 운반 펩티드의 절단 후에 형성된다. 성숙 단백질은 잔기 S41에서 시작하여, 예측 분자량이 65 kDa인 598개 아미노산의 성숙 단백질(SEQ ID NO: 41)을 생성한다.

내인성 옥수수 아세토락테이트 합성효소 단백질과 비교하여 단일 아미노산 잔기(P165A 또는 P165S, 회색 박스) 변화를 야기하는 ALS1 또는 ALS2의 뉴클레오티드 서열의 변형은 옥수수에서 제초제에 대한 저항성을 제공한다.

아세토락테이트 합성효소는 식물의 세포 기능에 매우 중요한 효소이므로, ALS1 및 ALS2 유전자의 동시 이대립유전자(bi-allelic) 녹아웃은 생존할 것으로 기대되지 않는다. 따라서, ALS1 뉴클레오티드 서열과 ALS2 뉴클레오티드 서열 간의 다형성에 기초하여, ALS2 특이적 ALSCas-4 표적 부위를 동정하고 검정하였다. ALS1 및 ALS2 유전자를 모두 표적화하는 ALSCas-1 가이드 RNA 발현 작제물을 대조군으로서 사용하였다. 표 6은 ALSCas-1 및 ALSCas-4 표적 부위에 대한 정보를 보여준다.

실시예 1에 기술되고 표 7에 나타낸 바와 같이 앰플리콘 심층 시퀀싱에 의해 ALSCas-1 및 ALSCas-4에서의 돌연변이 빈도를 결정하였다.

이 결과들은 ALSCas-4 gRNA/Cas9 시스템이 ALS1 유전자보다 약 90배 높은 효율로 ALS2 유전자를 돌연변이시켰음을 입증하였다. 따라서, ALS 유전자 편집 실험을 위해 ALSCas-4 표적 부위 및 해당 ALS-CR4 gRNA를 선택하였다.

ALS2 편집된 대립 유전자를 생성하기 위해, 상동성의 단편을 포함하는 794 bp 폴리뉴클레오티드 변형 주형(SEQ ID NO: 43)을 플라스미드 벡터에 복제하였고, 2개의 127 nt 단일 가닥 폴리뉴클레오티드 변형 주형(DNA 올리고라고도 함, Oligo1, SEQ ID NO: 44, 및 Oligo2, SEQ ID NO: 45)을 폴리뉴클레오티드 변형 주형으로서 검정하였다(도 2). 794 bp 단편은 Oligo 1과 동일한 서열 변형을 가졌다. 폴리뉴클레오티드 변형 주형(복구 주형)은 고유 서열과 비교하여 몇 가지 뉴클레오티드 변화를 포함하였다. 단일 가닥 Oligo1 및 794 bp 복구 주형은 아미노산 위치 165의 프롤린에 해당하는 DNA 서열을 세린으로 편집하도록 할 단일 뉴클레오티드 변화(P165S), 뿐만 아니라 ALS-CR4 표적 부위 및 PAM 서열 내 3개의 추가 변화를 포함하였다. 복구 주형 내 PAM 서열의 변형은 메티오닌 코돈(AUG)을 이소류신(AUU)으로 변경하였고, 이는 ALS1 유전자에서 자연적으로 발생한다. 제2 127 nt 단일 가닥 올리고 복구 주형(Oligo2)도 검정하였는데, 이는 위치 157의 메티오닌을 보존하였지만, ALS-CR4 gRNA와의 염기 짝짓기에 영향을 미칠 서열 내 3개의 추가 단일 뉴클레오티드 변화를 포함하였다(도 2).

처리당 약 1,000개의 미성숙 배아를 DNA 발현 카세트에서 2개의 올리고 또는 단일 플라스마 복구 주형, Cas9, ALS-CR4 gRNA, 및 MoPAT-DsRED로 입자 충돌시켰고, PAT가 부여하는 비알라포스 저항성을 선택하기 위해 배지에 두었다. 형질전환 5주 후, 선택 배지에서 성장하는 (처리당) 2백개의 무작위로 선택된 독립적인 신생 캘러스 섹터를 배아로부터 분리하여 새로운 비알라포스 플레이트로 옮겼다. 발육 중인 캘러스 사건을 가진 나머지 배아(처리당 800개 초과)를 편집된 ALS2 유전자의 직접 선택으로서 100 ppm의 클로르설푸론을 함유한 플레이트로 옮겼다. 1개월 후, 비알라포스에서 성장하는 총 384개의 무작위로 고른 캘러스 섹터(각각의 복구 주형에 대해 약 130 사건) 및 클로르설푸론이 있는 배지에서 계속 성장한 7개의 캘러스 섹터를 PCR 증폭 및 시퀀싱으로 분석하였다. 편집된 ALS2 대립 유전자는 9개의 캘러스 섹터에서 검출되었다: 2개는 비알라포스에서 성장하는 캘러스 섹터로부터 파생되었고 794 bp 복구 DNA 주형을 사용하여 생성되었으며, 나머지 7개는 127 nt 단일 가닥 올리고를 사용하여(3개는 Oligo1에 의해, 4개는 Oligo2에 의해) 편집된 클로르설푸론 저항성 캘러스 섹터로부터 파생되었다. 이들 캘러스 섹터의 제2 ALS2 대립 유전자를 NHEJ 복구의 결과로서 돌연변이시켰다. ALS1 유전자 분석 결과, 야생형 서열만이 ALS-CR4 gRNA의 높은 특이성을 확인시켜 주는 것으로 밝혀졌다.

추가 분자 분석 및 후대 검정을 위해, 편집된 ALS2 대립 유전자를 포함하는 9개의 캘러스 섹터 중 7개에서 식물을 재생하였다. ALS2 대립 유전자의 DNA 서열 분석 결과, P165S 변형(ALS2-P165S)의 존재, 뿐만 아니라 각각의 복구 주형과 관련된 다른 뉴클레오티드 변화가 확인되었다. 편집된 ALS2 대립 유전자의 유전(inheritance)을 평가하기 위해, 상이한 캘러스 사건(794 bp 복구 DNA 및 Oligo2)으로부터 생성된 2개의 T0 식물의 T1 및 T2 자손을 분석하였다. 야생형 Hi-II 식물의 꽃가루를 이용한 교배로부터 유래된 자손 식물을 시퀀싱으로 분석하였고, 이들은 예상 분리 비율이 1:1(각각 57:56 및 47:49)인 모체 식물에서 관찰된 편집된 대립 유전자의 유성 유전을 보여주었다. 편집된 ALS 서열이 제초제 저항성을 부여하는지를 검정하기 위해, 편집된 야생형 ALS2 대립 유전자를 가진 선택된 4주령의 분리 T1 식물에 네 가지 다른 농도의 클로르설푸론(50, 100 (1x), 200, 및 400 mg/리터)을 살포하였다. 처리 3주 후, 편집된 대립 유전자를 가진 식물은 정상적인 표현형을 나타낸 반면(도 3, 좌), 야생형 대립 유전자만을 가진 식물은 세포노화 징후가 강하게 나타났다(도 3, 우).

설포닐우레아계 제초제(구체적으로, 클로르설푸론)에 대한 저항성 외에도, ALS 유전자는 트리아졸로피리미딘, 피리미디닐티오-벤조에이트, 및 이미다졸리논 제초제를 비롯한 다른 종류의 AHAS 저해제에 대한 저항성을 부여하도록 변형될 수 있다(Tan S, Evans RR, Dahmer ML, Singh BK, Shaner DL (2005) Imidazolinone-tolerant crops: history, current status and future. Pest Management Science 61: 246-257). 따라서, ALS 유전자에 대한 변형은 본원에 기술된 변화 및 클로르설푸론 저항성을 부여하는 변화에 국한되어서는 안 된다.

이들 실험은 Cas9-gRNA가 옥수수에서 HDR-의존적 표적 서열 변형을 자극하여, 후대에 적절히 유전되는 편집된 내인성 유전자를 갖는 식물을 생성할 수 있음을 입증한다. 데이터는 또한, 내인성 프로모터 하에서 편집된 단일 ALS2 대립 유전자가 옥수수에서 제초제 저항성을 제공함을 나타낸다.

실시예 3

내인성 선택 마커 유전자로서의 ALS2

본 실시예는 특이적으로 편집된 ALS2 유전자가 현재 식물 형질전환에 이용되는 외인성 마커 유전자의 전달을 대체하는 세포 내 선택 마커를 생성하기 위해 어떻게 이용될 수 있는지를 보여준다.

식물 형질전환(유전자이식 사건 복원)의 빈도가 비교적 낮기 때문에, 다양한 제초제에 대한 저항성을 제공하는 선택 마커 유전자는 통상적으로 형질 유전자와 함께 공동으로 전달된다. 저항성을 부여하기 위해, 이러한 선택 마커 유전자는 식물 게놈에 안정적으로 통합될 필요가 있고 연속 세대에서 절제되거나 품종 개량을 통해 제거되어야 한다. 일부 고유의 식물 유전자는 특이적으로 변형(편집)되어 제초제에 대한 저항성을 부여할 수 있다. 실시예 2에 기술된 바와 같이, 단일 아미노산 변화가 있는 ALS2 유전자는 클로르설푸론에 대한 저항성을 제공한다. 따라서, 유전자 돌연변이유발, 유전자 편집 또는 형질 유전자의 공동 전달, 및 동시 ALS2 유전자 편집은 외인성으로 공급된 마커 유전자 없이 이용될 수 있을 것으로 예상될 수 있다. Cas9-gRNA 시스템에 의해 생성된 DSB의 NHEJ 복구 결과로서 높은 돌연변이 빈도를 고려할 때(실시예 1), 이 접근법은 유전자 돌연변이유발에 유용할 수 있다. 이 경우, 돌연변이 사건의 빈도는 HDR 매개 ALS 유전자 편집에 의존할 것으로 예상된다. 유전자 편집과 관련하여, 식물 세포에서 2개의 낮은 빈도 HDR-의존적 게놈 편집 과정(하나는 선택을 위한 ALS 유전자 복구를 위한 것이고 다른 하나는 내인성 유전자 편집 또는 형질 유전자 통합을 위한 것임)의 조합은 동시 ALS2 유전자 편집을 이용한 접근법을 다소 비현실적으로 만들 가능성이 높다.

다음의 예는 이러한 낮은 효율(및 비현실성)을 극복하고 선택적 제제에 저항성이 있는 식물 세포를 선택할 가능성을 향상시킬 수 있는 방법을 기술한다. 이 방법은 HDR-의존적 유전자 편집에 의존하는 것이 아니라 식물 체세포에서 (HDR보다) 더 일반적인 NHEJ DNA 복구를 통한 표적 돌연변이유발에 의한 유전자 기능의 복원에 의존한다. 실시예 2에 기술된 바와 같이, 옥수수에는 염색체 4 및 5에 각각 위치한 2개의 ALS 유전자, ALS1 및 ALS2가 존재한다. 2개의 ALS 유전자 중 어느 하나의 특이적 편집은 제초제 저항성을 부여할 것이다. 이 유전자들은 식물 대사에 필수적인 역할을 하여, 결과적으로, 두 유전자를 모두 표적화하고 돌연변이시키면 세포 사멸을 초래한다. 따라서, 본 실시예에서, 변형은 ALS1 유전자를 표적화하지 않는 ALS2 특이적 gRNA를 이용하여 ALS2 유전자만을 포함하므로, ALS1은 야생형으로 남아있다. 구체적으로, ALS2 유전자에 두 가지 변형이 도입된다; 첫째, 클로르설푸론에 대한 저항성을 부여하는 특이적 뉴클레오티드(들) 변화, 예를 들어, 아미노산 위치 165에서 프롤린을 세린으로 변환하기 위한(ALS2-P165S라고 함) 뉴클레오티드 위치 493에서 C에서 T로의 변화(도 2, oligo1) 또는 뉴클레오티드 위치 493 및 495에서 각각 C에서 T로의 변화 및 C에서 G로의 변화(도 2, oligo2)(자세한 내용은 실시예 2 참조). 둘째, 단일 뉴클레오티드의 제거, 예를 들어 뉴클레오티드 위치 165에서 G의 제거(도 4a 내지 4b)로 인한 번역 프레임이동(도 4b), 및 그에 따른 ALS2 매개 클로르설푸론 저항성의 상실(ALS2-P165S-CCΔ라고 함). 많은 설계가 예상되지만, 가장 높은 빈도의 ALS2 유전자 복구의 경우, 단일 뉴클레오티드 위치(도 4a 내지 4c에 도시된 예)는 바람직하게 i) gRNA/Cas 엔도뉴클레아제 표적 부위에서 PAM 서열로부터 상류(5') 네 번째 뉴클레오티드, 및 ii) 코돈에서 세 번째 뉴클레오티드(도 4a)이어야 한다. 이 세 번째 위치는 대부분의 아미노산에 대해 유연하며, 20개 아미노산 중 8개 아미노산에서 4개의 뉴클레오티드 중 어느 것에 의해 점유될 수 있다(표 8). 이러한 유연성을 고려할 때, 첫 번째 또는 두 번째 위치에 비해, 세 번째 위치에서 더 높은 빈도의 적절한 복구가 예상된다.

상기 기준을 만족하는 4개의 상이한 표적 부위 및 해당 gRNA를 선택하였다. 전술한 바람직한 단일 뉴클레오티드 위치 외에도, 해당 gRNA는 절단 부위에서 단일 뉴클레오티드 삽입을 나타내는 돌연변이 비율이 높은 돌연변이의 빈도를 높여야 한다. 설명된 모든 선호도를 만족하고, 따라서 본 실험에 적합했던 검정된 4개의 표적 부위 중 하나만을 동정하였다(ALSCas-7이라 함; 표 9).

이어서, 클로르설푸론에 대한 저항성을 부여하는 ALS2-P165S 유전자를 더 변형시켰다(파괴된 유전자를 생성): 동요 위치(코돈의 세 번째 뉴클레오티드 위치)에서 G 뉴클레오티드를 제거하여 ALSCas-7 표적 부위에서 (표 9에서 밑줄 친) CCG에 의해 암호화된 프롤린 코돈을 변경함으로써 번역 프레임이동 및 파괴된 유전자를 생성하였다(ALS2-P165S-CCΔ라고 함; 도 4a 내지 4b). 실시예 1에서 입증된 바와 같이, 옥수수에서 Cas9-gRNA 시스템에 의해 생성되고 NHEJ를 통해 복구된 DSB의 복구는 대개 절단 부위에서 단일 뉴클레오티드 삽입을 야기한다. 따라서, ALSCas-7-1(GCTCCCCCGGCCACCCCCTC; SEQ ID NO: 80)이라고 하는, 변형된 ALSCas-7 부위에서의 이중 가닥 절단(DSB)의 생성 및 NHEJ를 통한 그 복구에 의해 ALS2-P165S-CCΔ 유전자의 기능, 및 연속적으로, 클로르설푸론에 대한 세포 저항성이 복원될 수 있다(도 4b 내지 4c 참조).

본 발명에 기초하여, 하나의 gRNA가 NHEJ를 통해 파괴된 ALS2-P165S-CCΔ 유전자를 표적화 및 활성화(따라서 제초제 저항성을 부여)하고, 다른 gRNA(들)가 ALS2와 다른 부위(들)에서 DSB(들)를 촉진하고 원하는 게놈 변형, 예를 들어, 표적화된 돌연변이유발, 결실, 유전자 편집, 또는 부위 특이적 형질 유전자 삽입을 용이하게 할 경우, 둘 이상의 gRNA의 동시 전달을 구상할 수 있다. 이 접근법은 다른 모든 필요한 성분(Cas9, gRNA)이 단백질 및/또는 시험관내 전사 RNA 분자의 형태로 전달될 수 있기 때문에 완전히 일시적인 표적화 게놈 변형을 가능하게 할 수 있다.

이 접근법을 검정하기 위해, 전술한 ALS2 유전자가 특이적으로 변형된 옥수수 식물(Hi-II 유전자형)을 생성시켰다. 우선, 실시예 2에 기술한 바와 같이 클로르설푸론에 대한 저항성을 부여하기 위해 아미노산 위치 165에서 ALS2 서열을 변형시켰다. 이어서, 편집에 대해 동형접합인 식물로부터의 미성숙 배아를 ALSCas-7 표적 부위를 표적화하는 Cas9 및 ALS-CR7 gRNA, 선택 마커(UBI:MoPAT-DSRED 융합) 및 세포 발육 강화 유전자로 입자 충돌시켰다(자세한 내용은 실시예 8 및 9 참조). 비알라포스 저항성 캘러스 섹터로부터의 재생제를 시퀀싱으로 분석하였다. 단일 뉴클레오티드(뉴클레오티드 위치 165의 G) 결실을 가진 여러 T0 식물을 동정하였다(도 4a 내지 4b). 이 결실은 번역 프레임이동(도 4b) 및 ALS2-P165S 매개 클로르설푸론 저항성의 상실을 초래하였다. 두 편집(ALS2-P165S-CCΔ) 모두에 대해 동형접합인 식물을 재생시키고, 시퀀싱으로 확인하고, 클로르설푸론으로 살포하여 제초제 저항성의 상실에 대해 검정하였다.

특이적으로 변형된 내인성 ALS2 유전자(ALS2-P165S-CCΔ)를 가진 동형접합 식물로부터의 배아를 개념 검증 실험에 사용했다. 편집된 파괴 ALS2-P165S-CCΔ 유전자가 전술한 바와 같이 복구될 수 있고(따라서 기능성 단백질을 암호화함) 선택 마커로서 작동할 수 있음을 입증하기 위해, Cas9을 암호화하는 DNA 벡터, ALSCas-7-1 부위를 표적화하는 gRNA(ALS-CR7-1이라고 함), 세포 발육 강화 유전자(ZmODP2 및 ZmWUS), 및 MS45-CR2 gRNA를 옥수수(Hi-II) 미성숙 배아 세포 내에 공동으로 전달하였다. 입자 충돌 1주일 후, 선택을 위해 100 ppm의 클로르설푸론이 있는 배지로 배아를 옮겼다. 약 30%의 배아(290개 중 84개)에서 제초제 저항성 캘러스 사건이 발생되었고, 이는 시퀀싱으로 분석되었다. 대다수의 사건(79 사건)이 예상 ALSCas-7-1 DSB 부위에서의 단일 뉴클레오티드 삽입(도 4c) 및 ALS2-P165S 유전자의 완전한 복원을 보였다. 4개의 사건은 삽입이 없었지만 2 또는 5 bp의 결실이 있어 프레임에서 유전자를 다시 제자리에 두었고, 하나의 사건은 야생화된 것처럼 보였다. 83개의 사건 중 50개(60%)는 또한 MS45Cas-2 표적 부위에서 돌연변이를 보여주었다.

본 실시예는 유도 Cas 엔도뉴클레아제 시스템의 사용에 의한 특이적으로 변형된 불활성 ALS2의 내인성 선택 마커 유전자로서의 유용성 및 개념 검증을 보여준다. 본원에 기술된 결과에 기초하여, 당업자는 기술된 접근법을 현재 식물 게놈 편집 실험에 이용되는 선택 마커 유전자의 공동 전달을 대체하는 임의의 유사하게 변형된 내인성 또는 미리 통합된 외인성 유전자(들)에 대해 사용하고 확장할 수 있다.

실시예 4

파괴된 유전자에 의해 암호화된 비기능성 단백질에 기능을 복원하는 대안적 설계

이전 실시예에서, 서열 변경은 코딩 영역 또는 ALS2-P165S 내에 통합되었다. (기능성 단백질을 암호화하지 않는) 파괴된 유전자를 생성하는 다른 서열 변화도 재활성화 서열로서 사용되도록 설계될 수 있을 것으로 예상된다. 본 실시예는 코딩 서열 내 코돈의 복원에 의존하는 것이 아니라 ALS2-P165S의 1차 번역 개시 코돈의 상류의 아웃 오브 프레임인 개시 코돈의 제거에 의존하는 재활성화 서열의 생성을 기술한다.

진핵 번역 개시의 스캐닝 모델에 따르면, mRNA의 5' 캡에 대한 제1 AUG 코돈이 단백질 합성을 시작하는 데 사용된다(Kozak M. 1989. The scanning model for translation: an update. The Journal of Cell Biology 108: 229-241). 따라서, 15개 RNA 전사체의 비코딩 리더 내 AUG 코돈이 1차 개시 코돈의 상류의 아웃 오브 프레임인 경우, mRNA에 의해 암호화된 폴리펩티드의 단백질 합성은 파괴된다. 이 규칙을 이용하고 유전자 발현 또는 기능의 재활성화 전략에 적용하기 위해, 내인성 ALS2-P165S 대립 유전자가 상류의 아웃 오브 프레임 번역 개시 코돈을 포함하도록 생성될 수 있다(도 5a 내지 5b). 이 대립 유전자는 Cas9 PAM 인식 부위 및 ALS-CRX 표적화 스페이서를 포함한다. 본 실시예에서 PAM 부위의 5'에 위치한 뉴클레오티드 3과 4 사이의 Cas9에 의한 절단은 ATG 코돈의 손실을 초래할 수 있는 뉴클레오티드 결실(들) 또는 삽입(들)을 촉진할 수 있다. NHEJ 복구로 인한 결실 또는 삽입의 임의의 조합에 의한 이러한 상류의 아웃 오브 프레임 ATG의 손실은 제초제 저항성을 부여하는 1차 ALS2-P165S 개시 코돈에서의 번역 개시를 야기할 수 있다.

상류의 아웃 오브 프레임 ATG를 이용한 재활성화 전략은 도 5a 내지 5b의 설계에 국한되지 않을 것으로 예상된다. Cas9에 의한 표적화된 절단이 이러한 개시 코돈의 손실을 초래하는 한, PAM 및 표적화 스페이서는 상류의 아웃 오브 프레임 ATG에 대해 다양한 위치에 배치될 수도 있다. 예를 들어, PAM은 개시 코돈의 5', 안티센스 가닥에 존재할 수 있다. 다른 설계가 고려될 수 있는데; 아웃 오브 프레임 ATG 개시 코돈은 5' 리더 서열 내 다른 위치에 배치될 수도 있다. PAM 서열은 nGG PAM 또는 비-nGG PAM 서열을 인식하는 스트렙토코커스 피오게네스와 같은 다른 Cas9 단백질, 예를 들어 스트렙토코커스 써모필러스 CR1(PAM 서열 인식 nnAGAAn) 및 PAM 서열을 갖는 다른 것들에 의해 인식될 수 있다. 다른 Cas9 단백질의 유용성은 본 실시예뿐만 아니라 전술한 실시예 3의 재활성화 설계를 만족할 것이다.

유전자 활성화를 위한 다른 설계가 예상된다. 앞서 언급한 바와 같이, 클로르설푸론 저항성 외에도, 다른 제초제에 대한 저항성을 부여하는 ALS 유전자에 대한 변형이 재활성화에 이용될 수 있다. 또한, 포스포만노오스 이소머라아제 유전자(PMI), 비알라포스 저항성 유전자(BAR), 포스피노트리신 아세틸트랜스퍼라아제(PAT), 히그로마이신 저항성 유전자(NPTII), 선택 마커 유전자, 형광 마커 유전자(예컨대, 이에 한정되는 것은 아니지만, RFP, 적색 형광 단백질, CFP, GFP, 녹색 형광 단백질) 및 글리포세이트 저항성 유전자가 실시예 3에 기술된 바와 같이 불활성 형태로 식물 세포에 도입되도록 변형되어 가이드 RNA 도입에 의한 재활성화 및 NHEJ에 의한 복구를 위한 표적으로서 사용될 수 있다. 또한 다수의 불활성 유전자를 갖는 것이 표적 역할을 할 수 있을 것으로 예상된다. 예를 들어, 가이드 RNA 멀티플렉싱은 단일 실험에서 여러 유전자를 동시에 변형시키는 것으로 입증되었으므로, 이 유전자들에 한정되는 것은 아니지만, 클로르설푸론 및 비알라포스 저항성 유전자의 표적화된 재활성화가 이러한 접근법을 위해 추가로 설계될 수 있다. 전술한 바와 같이, NHEJ에 의해 유전자 기능을 복원하는 것과 동시에, 다른 가이드-폴리뉴클레오티드를 첨가함으로써 다른 표적의 변형이 동시에 달성될 것이다.

또한, 유사한 접근법이 임의의 고유의 또는 도입된 유전자 서열에 적용될 수 있고 효율적인 유전자 스위칭 메커니즘으로서 이용될 수 있다.

실시예 5

상동성 유도 복구를 위한 폴리뉴클레오티드 변형 주형을 도입하지 않고 특이적 유전자 편집

실시예 2는 특별히 설계된 폴리뉴클레오티드 변형 주형(복구 주형)을 이용한 ALS2 유전자의 코딩 영역 내 서열 변경(P165S)을 기술하였다. 이하 실시예는 HDR 메커니즘에 의존하는 것이 아니라 NHEJ에 의존하는 관심있는 편집된 유전자를 생성하는 다른 접근법을 기술한다.

실시예 1에 기술된 바와 같이, Cas9 뉴클레아제에 의해 생성된 DSB의 NHEJ 복구에 의해 촉진되는 가장 일반적인 돌연변이 유형의 두 가지는 1 bp 삽입 및 1 bp 결실이다(표 4). 본원에 기술된 이러한 관찰들에 기초하여, 이하 기술되는 바와 같이, 2개의 연속 단계 또는 단일 단계로 달성될 수 있는 유전자 편집을 위한 방법이 개발되었다.

제1 단계는 본원에 기술된 RNA 유도 Cas 뉴클레아제 시스템을 이용하여, Cas 엔도뉴클레아제에 의해 인식되는 표적 부위를 포함하는 관심 유전자 또는 폴리뉴클레오티드를 표적화하여, (도 6a에 도시된) 절단된 DNA의 NHEJ 복구로 인한 특정 뉴클레오티드 결실을 가진 세포 또는 생물을 생성하는 것을 포함한다. 제2 단계는 돌연변이된 부위를 재표적화하고, (폴리뉴클레오티드 변형 주형(복구 주형)을 사용하지 않고) 원하는 뉴클레오티드의 삽입이 있는 사건을 선택하여, 해당 아미노산 및 유전자 기능을 특이적으로 변경하는 것을 필요로 한다. 일반적으로, 아이디어는 도 6a 내지 6c에 도시되어 있다. 이 방법은 비코딩 DNA 단편을 편집하는 데 이용될 수도 있다.

대안적으로, 두 단계가 하나의 단계로 결합될 수 있다. 하나는 원래의 표적 부위를 인식하고 두 번째 것은 동일한 부위이지만 1 bp 결실이 있는 부위를 인식하는 2개의 상이한 gRNA가 사용될 수 있다. 이 경우, 1 bp 결실 후 변경 부위를 절단하고 1 bp 삽입으로 이를 복구하는 내인성 부위의 연속적인 절단 및 복구를 구상할 수 있다. 이어서, 원하는 뉴클레오티드의 삽입이 있는 사건이 선택될 수 있다. 코딩 DNA 서열을 편집하는 경우, 이 과정은 두 가지 목표(번역 해독 프레임의 복원 및 관심 아미노산의 치환)를 달성한다. 상이한 엔도뉴클레아제의 조합이 이러한 2단계 또는 1단계 시스템에 사용될 수 있을 것으로 예상된다. 예를 들어, 관심 폴리뉴클레오티드의 단일 염기 결실을 유도하는 제1 이중 가닥 절단의 도입이 제1 엔도뉴클레아제에 의해 달성될 수 있는 한편, 단일 염기 삽입을 유도하는 제2 이중 가닥 절단의 도입(및 관심 폴리뉴클레오티드의 편집)이 제1 엔도뉴클레아제와 다른 제2 엔도뉴클레아제에 의해 달성될 수 있다. 엔도뉴클레아제 간의 차이는 상이한 생물로부터 유래하는, 상이한 PAM 인식 서열, 상이한 표적 인식 서열, 상이한 절단 활성(평활 말단, 5' 또는 3' 오버행, 단일 가닥, 이중 가닥), 상이한 DNA 또는 아미노산 서열, 또는 이들의 임의의 한 조합을 포함할 수 있으나, 이에 한정되는 것은 아니다.

관심 게놈 내 특정 뉴클레오티드를 편집하는 능력은 선택의 엔도뉴클레아제 시스템 및 특정한 표적 부위를 인식하고 절단하는 능력에 의존할 수 있다. 신규 유도 엔도뉴클레아제의 발견(예를 들어 2015년 5월 15일 출원된 미국 특허 출원 62/162377 참조), 및/또는 다양한 PAM 서열을 갖는 유도 엔도뉴클레아제의 변형은 이러한 엔도뉴클레아제에 의해 인식 및/또는 절단될 수 있는 표적 부위의 밀도를 더 증가시켜, 궁극적으로 본원에 기술된 방법을 이용하여 게놈 내 임의의 주어진 뉴클레오티드 위치를 표적화하는 능력을 갖게 할 것이다.

실시예 6

안정적으로 통합된 Cas9 엔도뉴클레아제를 가진 옥수수 계통

본 실시예는 안정적으로 통합된 Cas9 발현 카세트를 가진 옥수수 계통의 생성 및 검증을 기술한다.

항시성(옥수수 UBI, SEQ ID NO: 46) 또는 온도 조절(옥수수 MDH, SEQ ID NO: 47) 프로모터의 전사 제어 하에 옥수수 코돈 최적화된 Cas9을 포함하는 2개의 아그로박테리움 벡터(도 7)를 Hi-II 배아 세포에 도입하여 Cas9 엔도뉴클레아제의 미리 통합된 게놈 카피를 포함하는 계통을 확립하였다. 또한 이 벡터들은 시각적 마커로서 청색 형광 유전자(AmCYAN)의 발현을 조절하는 배아 선호 END2 프로모터 및 옥수수 히스톤 2B 프로모터에 의해 전사 조절되는 DsRED 유전자의 불연속 카피를 포함하였다. DsRED 서열의 일부는 정방향으로 복제되었고(369 bp 단편), gRNA에 의해 표적화될 수 있는 347 bp 스페이서에 의해 분리된 DsRED(RF-FP) 유전자의 2개의 단편으로 구성되었다. 스페이서 영역 내 DSB는 적색 형광 세포를 생성하는 파괴된 DsRED 유전자에 기능을 복원하는 분자내 재조합을 촉진한다. UBI:Cas9 또는 MDH:Cas9를 포함하는 단일 카피 T-DNA 인서트를 가진 옥수수 식물을 미성숙 배아의 공급원으로서 사용하였다. 미리 통합된 Cas9을 포함하는 청색 형광 배아를 절제하고 28℃(UBI:Cas9) 또는 37℃(MDH:Cas9)에서 24시간 동안 배양하였다. 입자 충돌 후, MDH:Cas9을 가진 배아를 37℃에서 24시간 동안 배양한 다음 28℃로 옮겼다. 대조군(gRNA 없음)과 달리, 347 bp 스페이서 내 서열을 표적화하는 2개의 DNA 발현 gRNA로 입자 충돌시킨 배아를 포함하는 UBI:Cas9 및 MDH:Cas9은 용이하게 적색 형광 응집을 생성하였다.

이 결과들은 전술한 옥수수 계통이 기능성 Cas9 엔도뉴클레아제의 단일 카피를 가짐을 입증한다.

실시예 7

미리 통합된 Cas9을 가진 배아 세포 내 일시적 gRNA 전달은 옥수수에서 돌연변이를 생성함

본 실시예는 미리 통합된 Cas9을 가진 옥수수 미성숙 배아 세포 내에 시험관내 전사 RNA 분자 형태의 gRNA를 전달하면 표적 부위에서 돌연변이를 생성함을 보여준다.

UBI:Cas9 또는 MDH:Cas9을 포함하는 실시예 6에 기술된 옥수수 식물을 대조군으로서의 DNA 발현 카세트로서 또는 시험관내 전사 RNA로서의 gRNA를 전달하기 위한 미성숙 배아의 공급원으로서 사용하였다. LIG 및 MS26 내인성 표적 부위에서의 돌연변이 빈도를 측정하기 위해, 실시예 6에 기술된 온도 처리로 배아 세포를 포함하는 UBI:Cas9 및 MDH:Cas9 내에 RNA 분자로서(100 ng/shot) 또는 DNA 벡터로서(25 ng/shot) LIG-CR3 및 MS26-CR2 gRNA를 전달하였다. 이들 실험에서, 입자 충돌 2일 후 배아를 회수하여 앰플리콘 심층 시퀀싱으로 분석하였다. 특히 유비퀴틴 프로모터에 의해 조절된 Cas9의 경우, DNA 벡터로서 그리고 RNA 분자로서 전달된 gRNA에 대해 유사한 빈도가 발견되었다(표 10).

항시성(UBI) 또는 조절된(MDH) 프로모터 하에서 미리 통합된 Cas9을 가진 배아 내 일시적 gRNA의 전달에 의해 생성된 옥수수 LIG 및 MS26 표적 부위에서 돌연변이 해독의 백분율

표적 부위	배아	형질전환	돌연변이 해독의 백분율 (입자 충돌 2일 후)
LIG	UBI:Cas9	gRNA (DNA)	1.22%
	UBI:Cas9	gRNA (RNA)	1.86%
	MDH:Cas9 사건 1	gRNA (DNA)	0.25%
	MDH:Cas9 사건 1	gRNA (RNA)	0.12%
	MDH:Cas9 사건 2	gRNA (DNA)	0.57%
	MDH:Cas9 사건 2	gRNA (RNA)	0.26%
	MDH:Cas9 사건 3	gRNA (DNA)	0.46%
	MDH:Cas9 사건 3	gRNA (RNA)	0.35%
MS26	MDH:Cas9 사건 2	gRNA (DNA)	0.58%
MS26	MDH:Cas9 사건 2	gRNA (RNA)	0.17%

종합하여, 이 데이터들은 미리 통합된 Cas9을 포함하는 옥수수 세포 내에 직접 RNA 형태로 gRNA를 전달하는 것이 식물 세포에서 돌연변이를 생성하기 위한 DNA 전달에 대한 실행 가능한 대안임을 보여준다.

실시예 8

옥수수 미성숙 배아의 형질전환

형질전환은 입자 매개 전달, 아그로박테리움 매개 형질전환, PEG 매개 전달, 및 전기천공을 비롯하여, 식물에 효과적이라고 알려진 다양한 방법에 의해 달성될 수 있다.

a. 입자 매개 전달

입자 전달을 이용한 옥수수 미성숙 배아의 형질전환은 다음과 같이 수행된다. 배지 제조법은 다음과 같다.

귀를 껍질을 벗기고 30% Clorox 표백제와 0.5% Micro 세제로 20분간 표면 살균하고 멸균수로 2회 헹군다. 미성숙 배아를 분리하고, 560Y 배지에서 4시간 동안 플레이트당 25개 배아를 배아 축 측을 아래로(배반 측을 위로) 두고 나서 입자 충돌을 준비하기 위해 2.5 cm 표적 구역 내에 정렬시킨다. 대안적으로, 분리된 배아를 560L(개시 배지)에 두고, 전술한 바와 같이 입자 충돌 전 26℃에서 560Y에 4시간 동안 두기 전에 26℃ 내지 37℃ 범위의 온도에서 8 내지 24시간 동안 암실에 둔다.

이중 가닥 절단 유도제 및 주형 또는 공여 DNA를 포함하는 플라스미드를 표준 분자 생물학 기술을 이용하여 작제하고, 발육 유전자 ODP2(AP2 도메인 전사 인자 ODP2(밑씨 발육 단백질 2); US20090328252 A1) 및 WUSCHEL(US2011/0167516)을 포함하는 플라스미드와 공동으로 입자 충돌시킨다.

플라스미드 및 관심 DNA를 다음과 같이 수용성 양이온성 지질 TransIT-2020 형질감염 시약(Cat# MIR 5404, Mirus, USA)을 사용하여 0.6 ㎛(평균 직경) 금 펠렛 상에 침전시킨다. 총 1 ㎍의 DNA 및/또는 RNA 작제물(10 shot)을 사용하여 얼음 위에서 DNA 또는 DNA와 RNA 용액을 제조한다. 미리 혼합된 DNA에, 20 ㎕의 제조된 금 입자(15 mg/ml) 및 1 ㎕의 TransIT-2020을 조심스럽게 첨가하고 혼합한다. 금 입자를 마이크로 원심분리기에서 10,000 rpm으로 1분 동안 펠렛화하고 상청액을 제거한다. 100% EtOH를 105 ㎕ 첨가하고 짧은 시간 동안 초음파로 재현탁시킨다. 이어서, 각각의 매크로캐리어의 중앙에 10 ㎕를 묻히고 입자 충돌 전에 건조시킨다. Biorad Helium Gun(shelf #3)을 이용해 425 PSI에서 샘플 플레이트를 입자 충돌시킨다.

입자 충돌 후, 배아를 26℃ 내지 37℃ 범위의 온도에서 12 내지 48시간 동안 560P(유지 배지)에서 배양한 다음 26℃에 둔다. 5 내지 7일 후, 배아를 3 mg/리터의 비알라포스를 함유한 560R 선택 배지로 옮기고, 26℃에서 2주마다 계대배양한다. 선택하고 약 10주 후, 선택 저항성 캘러스 클론을 288J 배지로 옮겨 식물 재생을 개시한다. 체세포 배아 성숙(2~4주) 후, 잘 발육된 체세포 배아를 발아용 배지로 옮기고 조명이 있는 배양실로 옮긴다. 약 7~10일 후, 발육 중인 식물체를 식물체가 잘 정착될 때까지 7~10일 동안 튜브 내 호르몬 없는 배지 272V로 옮긴다. 이어서, 식물을 화분용 영양토를 함유한 (2.5" 화분에 해당하는) 플랫의 인서트로 옮기고, 성장 챔버에서 1주일 동안 성장시킨 후 온실에서 추가로 1~2주 더 성장시킨 다음, 클래식 600 화분(1.6 갤런)으로 옮기고 성장 성숙시킨다. 식물을 모니터링하고 형질전환 효율, 및/또는 재생 능력의 변경에 대해 점수를 매긴다.

개시 배지(560L)는 4.0 g/l의 N6 기저염(SIGMA C-1416), 1.0 ml/l의 Eriksson’s Vitamin Mix(1000X SIGMA-1511), 0.5 mg/l의 티아민 HCl, 20.0 g/l의 수크로오스, 1.0 mg/l의 2,4-D, 및 2.88 g/l의 L-프롤린(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 2.0 g/l의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 8.5 mg/l의 질산은(배지를 멸균하고 실온까지 냉각한 후 첨가)을 포함한다.

유지 배지(560P)는 4.0 g/l의 N6 기저염(SIGMA C-1416), 1.0 ml/l의 Eriksson’s Vitamin Mix(1000X SIGMA-1511), 0.5 mg/l의 티아민 HCl, 30.0 g/l의 수크로오스, 2.0 mg/l의 2,4-D, 및 0.69 g/l의 L-프롤린(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 3.0 g/l의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 0.85 mg/l의 질산은(배지를 멸균하고 실온까지 냉각한 후 첨가)을 포함한다.

입자 충돌 배지(560Y)는 4.0 g/l의 N6 기저염(SIGMA C-1416), 1.0 ml/l의 Eriksson’s Vitamin Mix(1000X SIGMA-1511), 0.5 mg/l의 티아민 HCl, 120.0 g/l의 수크로오스, 1.0 mg/l의 2,4-D, 및 2.88 g/l의 L-프롤린(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 2.0 g/l의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 8.5 mg/l의 질산은(배지를 멸균하고 실온까지 냉각한 후 첨가)을 포함한다.

선택 배지(560R)는 4.0 g/l의 N6 기저염(SIGMA C-1416), 1.0 ml/l의 Eriksson’s Vitamin Mix(1000X SIGMA-1511), 0.5 mg/l의 티아민 HCl, 30.0 g/l의 수크로오스, 및 2.0 mg/l의 2,4-D(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 3.0 g/l의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 0.85 mg/l의 질산은 및 3.0 mg/l의 비알라포스(질산은과 비알라포스는 배지를 멸균하고 실온까지 냉각한 후 첨가)를 포함한다.

식물 재생 배지(288J)는 4.3 g/l의 MS염(GIBCO 11117-074), 5.0 ml/l의 MS 비타민 원액(정제된 D-I H2O로 부피를 맞춘 0.100 g 니코틴산, 0.02 g/l 티아민 HCL, 0.10 g/l 피리독신 HCL, 및 0.40 g/l 글리신)(Murashige and Skoog (1962) Physiol. Plant. 15:473), 100 mg/l의 미오-이노시톨, 0.5 mg/l의 제아틴, 60 g/l의 수크로오스, 및 0.1 mM 아브시스산 1.0 ml/l(pH 5.6으로 조절 후 정제된 D-I H2O로 부피를 맞춤); 3.0 g/l의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 1.0 mg/l의 인돌아세트산 및 3.0 mg/l의 비알라포스(인돌아세트산과 비알라포스는 배지를 멸균하고 60℃까지 냉각한 후 첨가)를 포함한다.

호르몬 없는 배지(272V)는 4.3 g/l의 MS염(GIBCO 11117-074), 5.0 ml/l의 MS 비타민 원액(정제된 D-I H2O로 부피를 맞춘 0.100 g/l 니코틴산, 0.02 g/l 티아민 HCL, 0.10 g/l 피리독신 HCL, 및 0.40 g/l 글리신), 0.1 g/l의 미오-이노시톨, 및 40.0 g/l의 수크로오스(pH를 5.6으로 조절한 후 정제된 D-I H2O로 부피를 맞춤); 및 6 g/l의 박토 한천(정제된 D-I H2O로 부피를 맞춘 후 첨가되고, 멸균되고, 60℃까지 냉각됨)을 포함한다.

b. 아그로박테리움 매개 형질전환

본질적으로 Djukanovic et al. (2006) Plant Biotech J 4:345-57에 기술된 바와 같이 아그로박테리움 매개 형질전환을 수행하였다. 간단히 말해, 10~12일 지난 미성숙 배아(0.8~2.5 mm의 크기)를 멸균 커널에서 절개하고 액체 배지(4.0 g/L의 N6 기저염(Sigma C-1416), 1.0 ml/L의 Eriksson's Vitamin Mix(Sigma E-1511), 1.0 mg/L의 티아민 HCl, 1.5 mg/L의 2,4-D, 0.690 g/L의 L-프롤린, 68.5 g/L의 수크로오스, 36.0 g/L의 글루코오스, pH 5.2)에 넣었다. 배아를 모은 후, 배지를 0.35~0.45 OD550의 농도에서 1 ml의 아그로박테리움으로 대체하였다. 옥수수 배아를 아그로박테리움으로 실온에서 5분 동안 배양한 다음, 혼합물을 배지 플레이트(4.0 g/L의 N6 기저염(Sigma C-1416), 1.0 ml/L의 Eriksson's Vitamin Mix(Sigma E-1511), 1.0 mg/L의 티아민 HCl, 1.5 mg/L의 2,4-D, 0.690 g/L의 L-프롤린, 30.0 g/L의 수크로오스, 0.85 mg/L의 질산은, 0.1 nM 아세토시린곤, 및 3.0 g/L의 겔라이트를 함유, pH 5.8)에 부었다. 배아를 축을 아래로 하여 20℃ 암실에서 3일 동안 배양하고 나서, 28℃ 암실에서 4일 배양한 다음, 4.0 g/L의 N6 기저염(Sigma C-1416), 1.0 ml/L의 Eriksson's Vitamin Mix(Sigma E-1511), 1.0 mg/L의 티아민 HCl, 1.5 mg/L의 2,4-D, 0.69 g/L의 L-프롤린, 30.0 g/L의 수크로오스, 0.5 g/L의 MES 완충액, 0.85 mg/L의 질산은, 3.0 mg/L의 비알라포스, 100 mg/L의 카베니실린, 및 6.0 g/L의 한천을 함유한 pH 5.8의 새로운 배지 플레이트로 옮겼다. 유전자이식 사건이 확인될 때까지 배아를 3주마다 계대배양한다. 소량의 조직을 재생 배지(4.3 g/L의 MS염(Gibco 11117), 5.0 ml/L의 MS 비타민 원액, 100 mg/L의 미오-이노시톨, 0.1 μM의 ABA, 1 mg/L의 IAA, 0.5 mg/L의 제아틴, 60.0 g/L의 수크로오스, 1.5 mg/L의 비알라포스, 100 mg/L의 카베니실린, 3.0 g/L의 겔라이트, pH 5.6)로 옮기고 28℃ 암실에서 2주 동안 배양하여 체세포 배아발생을 유도하였다. 싹과 뿌리가 보이는 모든 물질을 4.3 g/L의 MS염(Gibco 11117), 5.0 ml/L의 MS 비타민 원액, 100 mg/L의 미오-이노시톨, 40.0 g/L의 수크로오스, 1.5 g/L의 겔라이트를 함유한 pH 5.6의 배지로 옮기고, 28℃의 인공 조명 하에서 배양하였다. 1주일 후, 식물체를 동일한 배지를 포함하는 유리 튜브로 옮기고, 식물체를 샘플링하고/하거나 토양에 이식할 때까지 성장시켰다.

실시예 9

ZmODP-2 및 ZmWUS의 일시적 발현은 형질전환을 강화함

형질전환 프로토콜의 파라미터는 BBM 활성이 일시적인지 확인하기 위해 수정될 수 있다. 이러한 한 가지 방법은, 예를 들어 화학적 PEI를 사용하여, 전사와 발현을 허용하지만 DNA의 후속적인 방출을 배제하는 방식으로 BBM 함유 플라스미드를 침전시키는 것을 포함한다.

일례로, PEI가 있는 금 입자 위에 BBM 플라스미드가 침전되는 반면, 통합될 유전자이식 발현 카세트(UBI:MoPAT-GFPm:PinII; MoPAT는 옥수수 최적화된 PAT 유전자임)는 표준 염화칼슘 방법을 이용하여 금 입자 위에 침전된다.

간단히 말해, 금 입자를 다음과 같이 PEI로 코팅하였다. 우선, 금 입자를 세척하였다. 평균 직경이 1.0(A.S.I. #162-0010)인 금 입자 35 mg을 마이크로 원심분리기 튜브에서 칭량하고, 1.2 ml의 무수 EtOH를 첨가하고 1분 동안 볼텍싱하였다. 튜브를 실온에서 15분 동안 배양한 다음, 마이크로 원심분리기를 이용하여 4℃에서 15분 동안 고속으로 원심분리하였다. 상청액을 버리고, 새로운 1.2 ml의 에탄올(EtOH) 분액을 첨가하고, 1분 동안 볼텍싱하고, 1분 동안 원심분리하고, 상청액을 다시 버렸다(이를 2회 반복함). 새로운 1.2 ml의 EtOH 분액을 첨가하고, 이 현탁액(EtOH 중 금 입자)을 -20℃에서 1주일 동안 보관하였다. 입자를 폴리에틸이민(PEI; Sigma #P3143)으로 코팅하기 위해, 세척된 금 입자/EtOH 혼합물 250 ㎕를 원심분리하고 EtOH를 버렸다. 입자를 100 ㎕의 ddH2O에서 1회 세척하여 잔류 에탄올을 제거하고, 250 ㎕의 PEI(0.25 mM)를 첨가한 후, 펄스 초음파 처리하여 입자를 현탁시키고 나서, 튜브를 드라이아이스/EtOH 조에 넣어 현탁액을 급속 냉각한 다음, 이를 밤새 동결 건조하였다. 이 시점에서, 건조되고 코팅된 입자는 -80℃에서 적어도 3주 동안 보관될 수 있다. 사용하기 전에, 입자를 pH 7.1의 2.5 mM HEPES 완충액의 분액 250 ㎕로 3회 세정하고, 1x 펄스 초음파 처리한 다음, 각각의 원심분리 전에 빠르게 볼텍싱하였다. 이어서, 입자를 최종 부피 250 ㎕의 HEPES 완충액에 현탁시켰다. DNA를 부착하기 전에 입자의 분액 25 ㎕를 새로운 튜브에 첨가하였다. 코팅되지 않은 DNA를 부착하기 위해, 입자를 펄스 초음파 처리하고 나서, (5 ㎕ 물 중의) 1 ㎍의 DNA를 첨가한 후 피펫맨(Pipetteman)으로 몇 차례 위아래로 피펫팅하여 혼합하고, 10분 동안 배양하였다. 입자를 잠깐(즉, 10초) 회전시키고, 상청액을 제거하고, 60 ㎕의 EtOH를 첨가하였다. PEI-침전된 DNA-1을 가진 입자를 60 ㎕의 EtOH에서 2회 세척하였다. 입자를 원심분리하고, 상청액을 버리고, 입자를 45 ㎕의 물에 재현탁시켰다. 제2 DNA(DNA-2)를 부착하기 위해, TransIT-2020을 이용한 침전을 사용하였다. 입자/DNA-1 현탁액 45 ㎕를 짧게 초음파 처리한 다음, 5 ㎕의 DNA-2(100 ng/㎕) 및 1 ㎕의 TransIT-2020을 첨가하였다. 용액을 회전 진탕기에 10분 동안 두고, 1분 동안 10,000g로 원심분리하였다. 상청액을 제거하고, 입자를 60 ㎕의 EtOH에 재현탁시켰다. 용액을 매크로캐리어 위에 묻히고, DNA-1 및 DNA-2가 순차적으로 부착된 금 입자를 PDS-1000의 표준 프로토콜을 사용하여 10개 DAP Hi-II 미성숙 배아의 배반 세포 내에 전달하였다. 이 실험에 있어서, DAN-1플라스미드는 UBI:RFP:PinII 발현 카세트를 포함하였고, DNA-2는 UBI:CFP:PinII 발현 카세트를 포함하였다. 입자 충돌 2일 후, CFP 및 RFP 형광 마커 모두의 일시적 발현이 미성숙 배아 표면의 수많은 적색 및 청색 세포로서 관찰되었다. 이어서, 배아를 비선택 배양 배지에 두고, 안정된 콜로니에 대해 점수를 매기기 전에 3주 동안 성장시켰다. 이 3주의 기간 후, 단 하나의 적색 콜로니와 비교하여, 10개의 안정적으로 발현하는 다세포 청색 콜로니가 관찰되었다. 이는 PEI-침전이 PEI-도입 DNA의 통합을 현저히 감소시키고 이에 따라 RFP-발현 유전자이식 사건의 복원을 감소시키면서 일시적 발현을 위한 DNA를 효과적으로 도입하는 데 사용될 수 있음을 보여주었다. 이러한 방식으로, PEI-침전은 BBM 및/또는 WUS2의 일시적 발현을 전달하는 데 이용될 수 있다.

예를 들어, 입자를 우선 PEI를 사용하여 UBI:BBM:PinII로 코팅하고 나서, TransIT-2020을 사용하여 UBI:MoPAT-YFP로 코팅한 다음, 미성숙 배아 표면의 배반 세포 내에 입자 충돌시킬 수 있다. PEI 매개 침전은 (TransIT-2020 방법에 비해) 미성숙 배아 표면에서의 일시적 발현 세포의 빈도를 높이고, 안정된 형질전환체의 복원 빈도를 매우 낮춘다. 따라서, PEI-침전 BBM 카세트는 일시적으로 발현하여 입자 충돌된 조직 표면(즉, 배반 표면)에서의 폭발적인 배발생 성장을 자극하지만, 이 플라스미드는 통합되지 않을 것으로 예상된다. Ca++/금 입자로부터 방출된 MoPAT-GFP 플라스미드는 유전자이식 사건의 복원을 실질적으로 향상시키는 빈도로 선택 마커를 통합하고 발현할 것으로 예상된다. 대조군 처리로서, (BBM 대신) UBI:GUS:PinII를 함유한 PEI-침전 입자를 MoPAT-GFP/Ca++ 입자와 혼합한다. 두 처리로부터의 미성숙 배아를 3 mg/l의 비알라포스를 함유한 배양 배지로 옮긴다. 6~8주 후, PEI/BBM 처리에서 대조군 처리(PEI/GUS)에 비해 훨씬 더 높은 빈도로 GFP+, 비알라포스 저항성 캘러스가 관찰될 것으로 예상된다.

대안적 방법으로서, BBM 플라스미드가 PEI가 있는 금 입자 위에 침전되고 나서, 미성숙 배아 표면의 배반 세포에 도입되고, 이후 BBM 유전자의 일시적인 발현이 배발생 성장의 급속한 증식을 유도한다. 이러한 유도 성장 기간 동안, 외식편이 옥수수에 대한 표준 방법을 이용하여 아그로박테리움으로 처리되고(실시예 1 참조), 세포 내로의 T-DNA 전달이 UBI:MoPAT-GFPm:PinII와 같은 유전자이식 발현 카세트를 도입한다. 공동 배양 후, 외식편을 정상 배양 배지에서 복원시킨 다음, 3 mg/l의 비알라포스를 함유한 배양 배지로 옮긴다. 6~8주 후, PEI/BBM 처리에서 대조군 처리(PEI/GUS)에 비해 훨씬 더 높은 빈도로 GFP+, 비알라포스 저항성 캘러스가 관찰될 것으로 예상된다.

BBM 및/또는 WUS2 폴리뉴클레오티드 생성물을 일시적으로 발현시킴으로써 캘러스 성장을 "시작"하는 것이 바람직할 수 있다. 이는 BBM 및 WUS2 5'-캡핑된 폴리아데닐화 RNA, BBM 및 WUS2 DNA를 포함하는 발현 카세트, 또는 BBM 및/또는 WUS2 단백질을 전달함으로써 이루어질 수 있다. 이러한 분자는 모두 바이올리스틱 입자 총을 사용하여 전달될 수 있다. 예를 들어, 5'-캡핑된 폴리아데닐화 BBM 및/또는 WUS2 RNA는 Ambion’s mMessage mMachine 키트를 이용하여 시험관 내에서 쉽게 제조될 수 있다. RNA는 UBI:MoPAT-GFPm:PinII와 같은 선택/선별에 사용되는 마커 및 관심 폴리뉴클레오티드를 포함하는 DNA와 함께 공동으로 전달된다. RNA를 수용하는 세포는 즉시 더 빠르게 분열되기 시작할 것이고 이들 중 많은 부분이 통합된 작물학적 유전자를 가질 것으로 예상된다. 이러한 사건들은 PAT~GFP 융합 단백질을 또한 발현할 (이에 따라 적절한 조명 하에서 녹색 형광을 나타낼) 것이기 때문에 유전자이식 클론 콜로니인 것으로 추가로 확인될 수 있다. 이어서, 이러한 배아로부터 재생된 식물을 관심 폴리뉴클레오티드의 존재에 대해 검사할 수 있다.

실시예 10

가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체(RGEN)로서 gRNA 및 Cas9을 배아 세포 내에 직접 전달하면 옥수수에서 돌연변이를 생성함

본 실시예는 단백질 형태의 Cas9 및 시험관내 전사되거나 화학적 합성된 RNA 분자 형태의 gRNA를 옥수수 미성숙 배아 세포 내에 직접 전달하면 해당 표적 부위에서 돌연변이를 생성함을 보여준다.

RNA 분자 형태의 gRNA를 생성하기 위해, 옥수수 최적화된 U6 중합효소 III gRNA 발현 카세트를, 유전자에 대한 스페이서의 정확히 5'에 전사 개시 신호 및 T7 중합효소 프로모터의 서열을 또한 포함하는 5' 올리고뉴클레오티드 프라이머를 사용하여 PCR로 증폭시켰다. 제조사의 권고에 따라 AmpliScribe T7-Flash 키트(Epicenter)로 T7 시험관내 전사를 수행하였고, 생성물을 NucAway Spin Columns(Invitrogen; Life Technologies Inc)을 이용한 후 에탄올 침전으로 정제하였다.

가이드 RNA/Cas9 엔도뉴클레아제 단백질 복합체(RGEN)(가이드 RNA/Cas9 엔도뉴클레아제 리보뉴클레오티드-단백질이라고도 함)를 생성하기 위해, 7 ㎍의 Cas9(스트렙토코커스 피오게네스 Cas9) 단백질과 3 ㎍의 gRNA 분자(1:2 몰비)를 1x Cas9 완충액(NEB)에서 총 20 ㎕의 부피로 혼합하고 실온에서 15분 동안 배양하였다. RGEN과 함께, 유비퀴틴 프로모터 조절 시각적 선택 마커(MoPAT-DsRed 융합), 유비퀴틴 프로모터 조절 메이스 밑씨 발육 단백질 2, ZmODP2(2009년 12월 31일 공개된US20090328252 참조) 및 옥수수 IN2 프로모터(Hershey et al. 1991, Plant Mol. Biol 17:679-690) 조절 WUSCHEL, ZmWUS(2011년 7월 7일 공개된 US20110167516 참조)를 포함하는 플라스미드를, 상업적으로 입수 가능한 금 입자(0.6 ㎛, Bio-Rad) 및 수용성 양이온성 지질 TransIT-2020(Mirus, USA)을 포함하는 입자 전달 매트릭스와 혼합하였다. 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체를 포함하는 입자 전달 매트릭스를 입자 매개 전달(실시예 8에 기술된 입자 매개 전달 참조)을 약간 수정하여 이용해서 옥수수 배아 세포 내에 전달하였다. 구체적으로, 금 입자를 마이크로 원심분리기에서 10,000 rpm으로 1분 동안 펠렛화하고 상청액을 제거한 후, 입자를 100% 에탄올 대신 105 ㎕의 멸균수에 재현탁시켰다. 이어서, 각각의 매크로캐리어의 중앙에 10 ㎕를 묻히고 입자 충돌 전에 건조시켰다.

시각적 선택 마커(UBI:MoPAT-DsRED) 및 발육 유전자(UBI:ZmODP2 및 IN2:ZmWUS)와 함께 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체(RGEN)의 형태로 Cas9 및 gRNA를 공동으로 전달하기 위한 미성숙 배아의 공급원으로서 야생형 옥수수 식물을 사용하였다. LIGCas-3, MS26Cas-2, MS45Cas-2 및 ALSCas-4 내인성 표적 부위에서의 돌연변이 빈도를 측정하기 위해, 입자 충돌 2일 후 배아를 회수하여 앰플리콘 심층 시퀀싱으로 분석하였다. 미처리 배아 및 Cas9 단백질만으로 입자 충돌시킨 배아를 음성 대조군으로 사용한 한편, Cas9 및 gRNA를 발현하는 DNA 벡터로 입자 충돌시킨 배아를 양성 대조군으로 사용하였다. DNA 벡터로서 전달된 Cas9-gRNA 성분 및 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체로서 전달된 Cas9-gRNA 성분에 대해 유사한 빈도가 발견되었다(표 11).

RGEN 복합체를 옥수수 배아 세포 내에 직접 전달하여 생성된 LIG, MS26, MS45, 및 ALS 표적 부위에서의 돌연변이 해독의 백분율

표적 부위	전달된 분자	총 해독 수	돌연변이 해독 수	돌연변이 해독의 백분율
LIGCas-3 (Chr. 2)	미처리 배아(대조군 1)	915,198	38	0.004%
	Cas9 단백질만(대조군 2)	408,348	17	0.004%
	Cas9-Lig-CR3 RGEN	439,827	2,510	0.57%
	Cas9 (DNA)+Lig-CR3 (DNA)	369,443	2,058	0.56%
MS26Cas-2 (Chr. 1)	미처리 배아(대조군 1)	245,476	8	0.003%
	Cas9 단백질만(대조군 2)	429,388	20	0.004%
	Cas9-MS26-CR2 RGEN	252,519	533	0.21%
	Cas9 (DNA)+MS26-CR2 (DNA)	186,857	812	0.43%
MS45Cas-2 (Chr. 9)	미처리 배아(대조군 1)	255,877	12	0.005%
	Cas9 단백질만(대조군 2)	487,876	12	0.002%
	Cas9-MS45-CR2 RGEN	241,287	2,075	0.86%
	Cas9 (DNA)+MS45-CR2 (DNA)	304,622	1591	0.52%
ALS2Cas-4 (Chr. 5)	Cas9 단백질만(대조군 2)	807,014	125	0.02%
	Cas9-ALS-CR4 RGEN	791,084	3,613	0.45%
	Cas9 (DNA)+ALS-CR4 (DNA)	833,130	4251	0.51%

식물 수준에서 돌연변이 빈도를 측정하기 위해, Cas9-MS45-gRNA 복합체, ZmODP2, ZmWUS 및 MOPAT-DSRED로 공동으로 입자 충돌시킨 60개 배아를, 선택적 제제로서 비알라포스를 함유한 배지에 두었다. 36개의 제초제 저항성 캘러스 섹터 각각으로부터 다수의 식물을 재생하여 돌연변이에 대해 검사하였다. 36개 사건 중, 17개(47%)가 돌연변이 대립 유전자(10개의 단일대립 및 7개의 이대립)를 포함한 반면 19개(53%)는 야생형 MS45 대립 유전자만을 나타냈다. 돌연변이가 있는 식물 중, 각각의 대립 유전자에 대한 시퀀싱 해독의 수는 유사하여 식물이 키메라 식물이 아님을 나타냈다.

직접 RGEN 전달도 식물에서 내인성 유전자의 특이적 편집을 생성하기에 충분함을 입증하기 위해, 옥수수 ALS2 유전자를 실시예 2에 기술된 바와 같이 표적화하였다(ALS2 특이적 ALSCas-4 표적 부위). 복구 주형으로서 127 nt 단일 가닥 DNA Oligo2(SEQ ID NO: 45)를 전술한 바와 유사한 방식으로 Cas9/ALS-CR4 RGEN 복합체와 공동으로 전달하였다. 입자 충돌 2일 후 배아를 회수하여 앰플리콘 심층 시퀀싱으로 분석하였다(표 12).

RGEN 복합체 및 공여 DNA 주형을 옥수수 배아 세포 내에 전달하여 생성된 ALS 표적 부위에서의 돌연변이 해독 및 편집된 해독의 백분율

표적 부위	전달된 분자	총 해독 수	돌연변이 해독 수	돌연변이 해독의 %	편집된 해독 수	편집된 해독의 %
ALS2	Cas9 단백질만	807,014	105	0.01%	-	-
ALS2	Cas9-ALS-CR4 RGEN + ss Oligo2	791,084	3,613	0.45%	209	0.02%

또한, 두 가지 독립적 실험에서, 입자 충돌된 40 내지 50개 배아를 편집된 ALS2 유전자에 대한 직접 선택으로서 100 ppm의 클로르설푸론을 함유한 플레이트로 옮겼다. 6주 후, 클로르설푸론이 있는 배지에서 계속 성장한 2개의 캘러스 섹터(각각의 실험으로부터 하나)를 시퀀싱으로 분석하였다. 두 사건 모두에서, 하나의 ALS2 대립 유전자는 특이적으로 편집된 반면 두 번째 대립 유전자는 야생형으로 남아있었다. 이 캘러스 섹터들로부터 재생된 식물은 편집된 ALS2 대립 유전자를 포함하였고, 제초제를 살포했을 때 클로르설푸론에 대한 저항성이 있었다.

이 데이터들은 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체(폴리뉴클레오티드 변형 주형 DNA를 갖거나 갖지 않음)의 형태로 Cas9 및 gRNA를 옥수수 미성숙 배아 세포 내에 직접 전달하는 것이 식물에서 표적 돌연변이유발 및 유전자 편집을 위한 (재조합 DNA, 플라스미드 DNA와 같은) DNA 전달에 대한 실행 가능한 대안임을 보여준다.

실시예 11

mRNA 형태의 Cas9 및 gRNA를 배아 세포 내에 직접 전달하면 옥수수에서 돌연변이를 생성함

본 실시예는 mRNA 분자 형태의 Cas9 및 시험관내 전사되거나 화학적 합성된 RNA 분자 형태의 gRNA를 옥수수 미성숙 배아 세포 내에 직접 전달하면 해당 표적 부위에서 돌연변이를 생성함을 보여준다.

이전의 실험에서(Svitashev et al., Plant Physiology, 2015, Vol. 169, pp. 931-945), 시험관내 합성된 RNA 분자 형태의 gRNA를 DNA 벡터를 발현하는 Cas9과 공동으로 전달하면 Cas9과 gRNA가 모두 DNA 벡터로서 전달된 실험에서보다 돌연변이 빈도가 약 100배 더 낮았다. 이러한 차이에 대한 한 가지 가능한 설명은, gRNA가 RNA로서 전달되고 Cas9이 DNA 벡터로서 전달되었을 때 Cas9 및 gRNA의 동시 기능에 대한 요건이 충족되지 않았다는 것일 수 있다. 이러한 문제를 극복하기 위해, Cas9은 기능성 Cas9 단백질 발현에 전달되는 순간부터의 시간을 단축시킬 mRNA 분자로서 전달될 수 있다. 상업적으로 입수 가능한 Cas9 mRNA(TriLink Biotechnologies)를 실험에 사용하였다.

이 아이디어를 검정하기 위해, 옥수수 배아 세포를 shot 당 Cas9 mRNA(200 ng), 시험관내 합성된 RNA 분자 형태의 gRNA(100 ng), 유비퀴틴 조절 MoPAT-DsRED 융합(25 ng) 및 발육 유전자, 유비퀴틴 프로모터 조절 ODP2 및 IN2 프로모터 조절 WUS(각 12 ng)를 포함하는 DNA 벡터와 함께 공동으로 입자 충돌시켰다. 상업적으로 입수 가능한 Cas9 mRNA(TriLink Biotechnologies) 및 전술한 바와 같이 시험관내 합성된 RNA 분자를 실험에 사용하였다. 형질전환 2일 후 모은 배아에 대해 앰플리콘 심층 시퀀싱으로 돌연변이 빈도 분석을 수행하였다(표 13).

mRNA로서 Cas9 및 RNA 분자로서 gRNA를 옥수수 배아 세포 내에 일시적으로 전달하여 생성된 MS45 표적 부위에서의 돌연변이 해독의 백분율

표적 부위	전달된 분자	총 해독 수	돌연변이 해독 수	돌연변이 해독의 백분율
MS45	Cas9 mRNA만	1,097,279	799	0.07%
	Cas9 mRNA+Ms45 CR2 gRNA	1,260,332	2,304	0.18%
	Cas9 (DNA)+Ms45 CR2 (DNA)	1,106,125	3,490	0.31%

이 데이터들은 Cas9 및 gRNA를 모두 RNA 분자 형태로 전달하면 표적 돌연변이의 빈도를 향상시키고, RGEN 복합체로서의 Cas9-gRNA 전달과 함께, 식물에서 표적 돌연변이유발 및 유전자 편집을 위한 DNA 전달에 대한 실행 가능한 대안임을 보여준다.

실시예 12

선택 마커를 사용하지 않고 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질 복합체(RGEN)로서 Cas9 및 gRNA를 배아 세포 내에 직접 전달하면 옥수수에서 돌연변이를 생성함

본 실시예는 단백질 형태의 Cas9 및 시험관내 전사되거나 화학적 합성된 RNA 분자 형태의 gRNA를 선택 마커 유전자(들)의 공동 전달 없이 옥수수 미성숙 배아 세포 내에 전달하는 것이 실용적인 빈도로 해당 표적 부위에서 돌연변이를 가진 식물을 재생하기에 충분함을 보여준다.

형질전환되거나 변형된 세포에 성장 이점을 제공하기 위한 선택 마커의 필요성은 식물 형질전환 및 게놈 변형 프로토콜에서 오랜 패러다임이었다. 따라서, 모든 돌연변이, 유전자 편집 및 유전자 통합 실험에서, 게놈 편집 사건을 선택하기 위해 선택 마커가 사용된다. 실시예 10에 기술된 실험에서 RGEN 복합체의 예기치 않은 높은 활성(돌연변이 빈도)을 고려하여, 선택 마커 없는 완전히 DNA가 없는(벡터가 없는) 게놈 편집을 시도하였다. 옥수수 배아 세포를 3개의 다른 유전자(liguleless1 (LIG), MS26 및 MS45)를 표적화하는 가이드 RNA/Cas 엔도뉴클레아제 리보뉴클레오티드-단백질(RGEN) 복합체로 입자 충돌시켰다. DNA 벡터 상의 Cas9 엔도뉴클레아제 및 MS45-gRNA를 대조군으로 사용한 병행 실험에 전달하였다. 식물을 재생시키고 표적 돌연변이에 대해 시퀀싱으로 분석하였다. 모든 실험에서, 돌연변이 식물은 2.4 내지 9.7% 범위의 놀라울 정도로 높은 빈도로 복원되었다(표 14).

옥수수 미성숙 배아 세포 내에 Cas9 및 gRNA를 DNA 벡터 형태로 전달할 때와 RGEN 복합체를 직접 전달할 때 LIG, MS26 및 MS45 표적 부위에서의 돌연변이 빈도. 선택 없이(선택 마커를 사용하지 않고) 재생된 T0 식물에 대해 분석을 수행하였다

표적 부위	Cas9 및 gRNA 전달 방법	분석 식물	돌연변이 대립 유전자를 가진 식물	SEQ ID NO:
LIGCas-3	RGEN	756	73 (9.7%)	12
MS26Cas-2	RGEN	756	18 (2.4%)	14
MS45 Cas-2	RGEN	1,880	70 (3.7%)	8
MS45 Cas-2	벡터 DNA	940	38 (4.0%)	8

또한, 재생된 T0 식물을 야생형 Hi-II 식물과 교배하고 자손 식물을 분리 분석에 사용하였다. 분석된 모든 자손 식물에서 예상된 멘델의 분리(1:1)의 돌연변이 ms45 대립 유전자의 유성 유전이 입증되었다.

옥수수에서 표적 이탈 절단을 감소시키는 RGEN 전달의 잠재성을 평가하기 위해, DNA 벡터 및 RGEN 전달을 이용하여 부위 이탈 MS45에서의 돌연변이 빈도를 평가하였다. 정확한 표적 서열과 최대 2개의 불일치를 허용하는 Bowtie 서열 정렬자(Langmead, B., Trapnell, C., Pop, M. & Salzberg, S.L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 10:R25, 2009)를 이용하여 MS45Cas-2 표적 부위의 프로토스페이서 영역(가이드 RNA 스페이서와 염기쌍을 이루는 표적 부위의 영역)을 옥수수 B73 기준 게놈(B73 RefGen_v3, Maize Genetics and Genomics Database)과 정렬시킴으로써 정확한 표적 부위에 가까운 상동성을 갖는 부위에 대한 조사를 수행하였다. 이어서, 식별된 표적 이탈 프로토스페이서의 바로 3'에서 NGG 프로토스페이서 인접 모티프(PAM) 서열의 존재에 대해 잠재적 표적 이탈 부위를 검색하였다. 이러한 검색 기준을 사용하여 단 하나의 표적 이탈 부위(5’-CGCCGAGGGCGACTACCGGC-3’, SEQ ID NO:81)가 식별되었다. 이는 MS45 프로토스페이서 표적 및 AGG PAM과 2 bp의 불일치를 포함하였다(표 15). 부위가 생체내 절단되었는지 확인하기 위해, Cas9 및 MS45-CR2 gRNA를 발현하는 DNA 벡터로 형질전환된 옥수수 배아에서의 돌연변이 존재에 대해 심층 시퀀싱으로 분석하였다. 표 15에 나타낸 바와 같이, 표적 이탈 부위의 돌연변이 활성은 정확한 표적 부위에서 관찰된 4%의 빈도와 비교하여 2%의 빈도였다. 표 15에 나타낸 바와 같이, RGEN 표적 이탈 활성은 DNA 벡터 상의 Cas9 및 gRNA 전달에 비해 크게 감소되었다(2%에서 0%로).

본 실시예는 RNA-유도 엔도뉴클레아제를 이용한 표적 돌연변이를 가진 식물의 생성은 선택 또는 선별 마커 유전자의 공동 전달을 필요로 하지 않으므로, 도입된 변형의 특이성 및 정확성을 증가시킴을 보여준다. 재생된 식물은 DNA 벡터의 무작위 통합 없이 표적 돌연변이 또는 표적 유전자 편집(DNA 서열을 변형하기 위해 복구 주형이 포함된 경우)만을 포함하였다. 이러한 전달 방법은, 이에 한정되는 것은 아니지만, 옥수수, 대두, 밀, 벼, 밀렛, 수수 및 카놀라를 비롯한 주요 작물 종의 식물 세포 내 유전자 돌연변이유발에 대한 완전히 DNA가 없는 접근법을 제공한다.

SEQUENCE LISTING <110> Pioneer Hi-Bred International Inc. Cigan, Andrew Mark Svitashev, Sergei <120> RESTORING FUNCTION TO A NON-FUNCTIONAL GENE PRODUCT VIA GUIDED CAS SYSTEMS AND METHODS OF USE <130> BB2533 PCT <150> 62/243719 <151> 2015-10-20 <150> 62/309033 <151> 2016-03-16 <150> 62/359254 <151> 2016-07-07 <160> 82 <170> PatentIn version 3.5 <210> 1 <211> 4107 <212> DNA <213> Streptococcus pyogenes M1 GAS (SF370) <400> 1 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600 attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720 ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960 atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160 catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220 gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280 attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340 atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400 gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460 gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520 attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580 gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640 aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700 acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760 ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820 actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880 aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940 taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000 tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060 atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120 aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180 cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240 gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300 cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360 gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420 tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480 aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540 tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600 tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660 caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720 cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780 cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840 attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900 ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960 cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020 gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080 gatttgagtc agctaggagg tgactga 4107 <210> 2 <211> 189 <212> DNA <213> Solanum tuberosum <400> 2 gtaagtttct gcttctacct ttgatatata tataataatt atcattaatt agtagtaata 60 taatatttca aatatttttt tcaaaataaa agaatgtagt atatagcaat tgcttttctg 120 tagtttataa gtgtgtatat tttaatttat aacttttcta atatatgacc aaaacatggt 180 gatgtgcag 189 <210> 3 <211> 9 <212> PRT <213> Simian virus 40 <400> 3 Met Ala Pro Lys Lys Lys Arg Lys Val 1 5 <210> 4 <211> 18 <212> PRT <213> Agrobacterium tumefaciens <400> 4 Lys Arg Pro Arg Asp Arg His Asp Gly Glu Leu Gly Gly Arg Lys Arg 1 5 10 15 Ala Arg <210> 5 <211> 6717 <212> DNA <213> Artificial Sequence <220> <223> Maize optimized Cas9 expression cassette <400> 5 gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60 taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120 atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180 gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240 ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300 caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360 gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420 ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480 tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540 aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600 ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660 cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720 ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780 gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840 ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900 caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960 cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc taccttctct 1020 agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct gttcatgttt 1080 gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg gatgcgacct 1140 gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg aatcctggga 1200 tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt cgttgcatag 1260 ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt gtcgggtcat 1320 cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc ggtcgttcta 1380 gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg gatctgtatg 1440 tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat atcgatctag 1500 gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc tttttgttcg 1560 cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga tcggagtaga 1620 atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg tgtgtcatac 1680 atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag gtatacatgt 1740 tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1800 taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1860 atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1920 tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1980 tacttctgca ggtcgactct agaggatcca tggcaccgaa gaagaagcgc aaggtgatgg 2040 acaagaagta cagcatcggc ctcgacatcg gcaccaactc ggtgggctgg gccgtcatca 2100 cggacgaata taaggtcccg tcgaagaagt tcaaggtcct cggcaataca gaccgccaca 2160 gcatcaagaa aaacttgatc ggcgccctcc tgttcgatag cggcgagacc gcggaggcga 2220 ccaggctcaa gaggaccgcc aggagacggt acactaggcg caagaacagg atctgctacc 2280 tgcaggagat cttcagcaac gagatggcga aggtggacga ctccttcttc caccgcctgg 2340 aggaatcatt cctggtggag gaggacaaga agcatgagcg gcacccaatc ttcggcaaca 2400 tcgtcgacga ggtaagtttc tgcttctacc tttgatatat atataataat tatcattaat 2460 tagtagtaat ataatatttc aaatattttt ttcaaaataa aagaatgtag tatatagcaa 2520 ttgcttttct gtagtttata agtgtgtata ttttaattta taacttttct aatatatgac 2580 caaaacatgg tgatgtgcag gtggcctacc acgagaagta cccgacaatc taccacctcc 2640 ggaagaaact ggtggacagc acagacaagg cggacctccg gctcatctac cttgccctcg 2700 cgcatatgat caagttccgc ggccacttcc tcatcgaggg cgacctgaac ccggacaact 2760 ccgacgtgga caagctgttc atccagctcg tgcagacgta caatcaactg ttcgaggaga 2820 accccataaa cgctagcggc gtggacgcca aggccatcct ctcggccagg ctctcgaaat 2880 caagaaggct ggagaacctt atcgcgcagt tgccaggcga aaagaagaac ggcctcttcg 2940 gcaaccttat tgcgctcagc ctcggcctga cgccgaactt caaatcaaac ttcgacctcg 3000 cggaggacgc caagctccag ctctcaaagg acacctacga cgacgacctc gacaacctcc 3060 tggcccagat aggagaccag tacgcggacc tcttcctcgc cgccaagaac ctctccgacg 3120 ctatcctgct cagcgacatc cttcgggtca acaccgaaat taccaaggca ccgctgtccg 3180 ccagcatgat taaacgctac gacgagcacc atcaggacct cacgctgctc aaggcactcg 3240 tccgccagca gctccccgag aagtacaagg agatcttctt cgaccaatca aaaaacggct 3300 acgcgggata tatcgacggc ggtgccagcc aggaagagtt ctacaagttc atcaaaccaa 3360 tcctggagaa gatggacggc accgaggagt tgctggtcaa gctcaacagg gaggacctcc 3420 tcaggaagca gaggaccttc gacaacggct ccatcccgca tcagatccac ctgggcgaac 3480 tgcatgccat cctgcggcgc caggaggact tctacccgtt cctgaaggat aaccgggaga 3540 agatcgagaa gatcttgacg ttccgcatcc catactacgt gggcccgctg gctcgcggca 3600 actcccggtt cgcctggatg acccggaagt cggaggagac catcacaccc tggaactttg 3660 aggaggtggt cgataagggc gctagcgctc agagcttcat cgagcgcatg accaacttcg 3720 ataaaaacct gcccaatgaa aaagtcctcc ccaagcactc gctgctctac gagtacttca 3780 ccgtgtacaa cgagctcacc aaggtcaaat acgtcaccga gggcatgcgg aagccggcgt 3840 tcctgagcgg cgagcagaag aaggcgatag tggacctcct cttcaagacc aacaggaagg 3900 tgaccgtgaa gcaattaaaa gaggactact tcaagaaaat agagtgcttc gactccgtgg 3960 agatctcggg cgtggaggat cggttcaacg cctcactcgg cacgtatcac gacctcctca 4020 agatcattaa agacaaggac ttcctcgaca acgaggagaa cgaggacatc ctcgaggaca 4080 tcgtcctcac cctgaccctg ttcgaggacc gcgaaatgat cgaggagagg ctgaagacct 4140 acgcgcacct gttcgacgac aaggtcatga aacagctcaa gaggcgccgc tacactggtt 4200 ggggaaggct gtcccgcaag ctcattaatg gcatcaggga caagcagagc ggcaagacca 4260 tcctggactt cctcaagtcc gacgggttcg ccaaccgcaa cttcatgcag ctcattcacg 4320 acgactcgct cacgttcaag gaagacatcc agaaggcaca ggtgagcggg cagggtgact 4380 ccctccacga acacatcgcc aacctggccg gctcgccggc cattaaaaag ggcatcctgc 4440 agacggtcaa ggtcgtcgac gagctcgtga aggtgatggg ccggcacaag cccgaaaata 4500 tcgtcataga gatggccagg gagaaccaga ccacccaaaa agggcagaag aactcgcgcg 4560 agcggatgaa acggatcgag gagggcatta aagagctcgg gtcccagatc ctgaaggagc 4620 accccgtgga aaatacccag ctccagaatg aaaagctcta cctctactac ctgcagaacg 4680 gccgcgacat gtacgtggac caggagctgg acattaatcg gctatcggac tacgacgtcg 4740 accacatcgt gccgcagtcg ttcctcaagg acgatagcat cgacaacaag gtgctcaccc 4800 ggtcggataa aaatcggggc aagagcgaca acgtgcccag cgaggaggtc gtgaagaaga 4860 tgaaaaacta ctggcgccag ctcctcaacg cgaaactgat cacccagcgc aagttcgaca 4920 acctgacgaa ggcggaacgc ggtggcttga gcgaactcga taaggcgggc ttcataaaaa 4980 ggcagctggt cgagacgcgc cagatcacga agcatgtcgc ccagatcctg gacagccgca 5040 tgaatactaa gtacgatgaa aacgacaagc tgatccggga ggtgaaggtg atcacgctga 5100 agtccaagct cgtgtcggac ttccgcaagg acttccagtt ctacaaggtc cgcgagatca 5160 acaactacca ccacgcccac gacgcctacc tgaatgcggt ggtcgggacc gccctgatca 5220 agaagtaccc gaagctggag tcggagttcg tgtacggcga ctacaaggtc tacgacgtgc 5280 gcaaaatgat cgccaagtcc gagcaggaga tcggcaaggc cacggcaaaa tacttcttct 5340 actcgaacat catgaacttc ttcaagaccg agatcaccct cgcgaacggc gagatccgca 5400 agcgcccgct catcgaaacc aacggcgaga cgggcgagat cgtctgggat aagggccggg 5460 atttcgcgac ggtccgcaag gtgctctcca tgccgcaagt caatatcgtg aaaaagacgg 5520 aggtccagac gggcgggttc agcaaggagt ccatcctccc gaagcgcaac tccgacaagc 5580 tcatcgcgag gaagaaggat tgggacccga aaaaatatgg cggcttcgac agcccgaccg 5640 tcgcatacag cgtcctcgtc gtggcgaagg tggagaaggg caagtcaaag aagctcaagt 5700 ccgtgaagga gctgctcggg atcacgatta tggagcggtc ctccttcgag aagaacccga 5760 tcgacttcct agaggccaag ggatataagg aggtcaagaa ggacctgatt attaaactgc 5820 cgaagtactc gctcttcgag ctggaaaacg gccgcaagag gatgctcgcc tccgcaggcg 5880 agttgcagaa gggcaacgag ctcgccctcc cgagcaaata cgtcaatttc ctgtacctcg 5940 ctagccacta tgaaaagctc aagggcagcc cggaggacaa cgagcagaag cagctcttcg 6000 tggagcagca caagcattac ctggacgaga tcatcgagca gatcagcgag ttctcgaagc 6060 gggtgatcct cgccgacgcg aacctggaca aggtgctgtc ggcatataac aagcaccgcg 6120 acaaaccaat acgcgagcag gccgaaaata tcatccacct cttcaccctc accaacctcg 6180 gcgctccggc agccttcaag tacttcgaca ccacgattga ccggaagcgg tacacgagca 6240 cgaaggaggt gctcgatgcg acgctgatcc accagagcat cacagggctc tatgaaacac 6300 gcatcgacct gagccagctg ggcggagaca agagaccacg ggaccgccac gatggcgagc 6360 tgggaggccg caagcgggca aggtaggtac cgttaaccta gacttgtcca tcttctggat 6420 tggccaactt aattaatgta tgaaataaaa ggatgcacac atagtgacat gctaatcact 6480 ataatgtggg catcaaagtt gtgtgttatg tgtaattact agttatctga ataaaagaga 6540 aagagatcat ccatatttct tatcctaaat gaatgtcacg tgtctttata attctttgat 6600 gaaccagatg catttcatta accaaatcca tatacatata aatattaatc atatataatt 6660 aatatcaatt gggttagcaa aacaaatcta gtctaggtgt gttttgcgaa tgcggcc 6717 <210> 6 <211> 4437 <212> DNA <213> Artificial sequence <220> <223> Lig-CR3 guide RNA expression vector <400> 6 aaattgtaag cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 60 tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga 120 tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 180 acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct 240 aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 300 cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 360 cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 420 cacccgccgc gcttaatgcg ccgctacagg gcgcgtccca ttcgccattc aggctgcgca 480 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 540 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 600 aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc 660 ccctcgaggt cgacggtatc gataagcttt gagagtacaa tgatgaacct agattaatca 720 atgccaaagt ctgaaaaatg caccctcagt ctatgatcca gaaaatcaag attgcttgag 780 gccctgttcg gttgttccgg attagagccc cggattaatt cctagccgga ttacttctct 840 aatttatata gattttgatg agctggaatg aatcctggct tattccggta caaccgaaca 900 ggccctgaag gataccagta atcgctgagc taaattggca tgctgtcaga gtgtcagtat 960 tgcagcaagg tagtgagata accggcatca tggtgccagt ttgatggcac cattagggtt 1020 agagatggtg gccatgggcg catgtcctgg ccaactttgt atgatatatg gcagggtgaa 1080 taggaaagta aaattgtatt gtaaaaaggg atttcttctg tttgttagcg catgtacaag 1140 gaatgcaagt tttgagcgag ggggcatcaa agatctggct gtgtttccag ctgtttttgt 1200 tagccccatc gaatccttga cataatgatc ccgcttaaat aagcaacctc gcttgtatag 1260 ttccttgtgc tctaacacac gatgatgata agtcgtaaaa tagtggtgtc caaagaattt 1320 ccaggcccag ttgtaaaagc taaaatgcta ttcgaatttc tactagcagt aagtcgtgtt 1380 tagaaattat ttttttatat accttttttc cttctatgta cagtaggaca cagtgtcagc 1440 gccgcgttga cggagaatat ttgcaaaaaa gtaaaagaga aagtcatagc ggcgtatgtg 1500 ccaaaaactt cgtcacagag agggccataa gaaacatggc ccacggccca atacgaagca 1560 ccgcgacgaa gcccaaacag cagtccgtag gtggagcaaa gcgctgggta atacgcaaac 1620 gttttgtccc accttgacta atcacaagag tggagcgtac cttataaacc gagccgcaag 1680 caccgaattg cgtacgcgta cgtgtggttt tagagctaga aatagcaagt taaaataagg 1740 ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt tgcggccgcg 1800 aattcctgca gggccctctt gtcggaccag ttgcccacca cgttggtgag ctcggtgagg 1860 cccttcattg agaggaagga ggtcatgagg tgcctaccga tgtgggactt ggggccgttc 1920 ttgatggcga agatggagta gggggcgttc ttcttgaggg ccttgttgta ggacctcacg 1980 aggttgtcct tgaggagctg gtactcctgc ttgttggagg aggagttgcc ggtcctgttc 2040 accctcttga gcacgggctc tgagttcctg aggaactcgt cgaggtacac gagggggtcg 2100 atcctgccgc gagcggagaa gaagtagatg tgcctggaca cggaggtctt ggtctcggtc 2160 acgaggcact ggatgatcac gccgaggtac ttgttctgac tagttctaga gcggccgcca 2220 ccgcggtgga gctccagctt ttgttccctt tagtgagggt taatttcgag cttggcgtaa 2280 tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 2340 cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 2400 attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 2460 tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 2520 ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 2580 gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 2640 ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 2700 cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 2760 ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 2820 accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 2880 catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 2940 gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 3000 tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 3060 agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 3120 actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 3180 gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 3240 aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 3300 gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 3360 aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 3420 atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 3480 gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 3540 atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 3600 ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 3660 cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 3720 agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 3780 cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 3840 tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 3900 agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 3960 gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 4020 gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 4080 ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 4140 tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 4200 tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 4260 gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 4320 caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 4380 atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacct 4437 <210> 7 <211> 27 <212> DNA <213> Zea mays <400> 7 gtactccatc cgccccatcg agtaggg 27 <210> 8 <211> 24 <212> DNA <213> Zea mays <400> 8 gcacgtacgt caccatcccg ccgg 24 <210> 9 <211> 24 <212> DNA <213> Zea mays <400> 9 gacgtacgtg ccctactcga tggg 24 <210> 10 <211> 24 <212> DNA <213> Zea mays <400> 10 gtaccgtacg tgccccggcg gagg 24 <210> 11 <211> 24 <212> DNA <213> Zea mays <400> 11 ggaattgtac cgtacgtgcc ccgg 24 <210> 12 <211> 20 <212> DNA <213> Zea mays <400> 12 gcgtacgcgt acgtgtgagg 20 <210> 13 <211> 22 <212> DNA <213> Zea mays <400> 13 gctggccgag gtcgactacc gg 22 <210> 14 <211> 23 <212> DNA <213> Zea mays <400> 14 ggccgaggtc gactaccggc cgg 23 <210> 15 <211> 23 <212> DNA <213> Zea mays <400> 15 ggcgcgagct cgtgcttcac cgg 23 <210> 16 <211> 21 <212> DNA <213> Zea mays <400> 16 ggtgccaatc atgcgtcgcg g 21 <210> 17 <211> 20 <212> DNA <213> Zea mays <400> 17 ggtcgccatc acgggacagg 20 <210> 18 <211> 24 <212> DNA <213> Zea mays <400> 18 gtcgcggcac ctgtcccgtg atgg 24 <210> 19 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> MS26Cas-1 forward primer <400> 19 ctacactctt tccctacacg acgctcttcc gatctaggac cggaagctcg ccgcgt 56 <210> 20 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> MS26Cas-1 and MS26Cas-3 reverse primer <400> 20 caagcagaag acggcatacg agctcttccg atcttcctgg aggacgacgt gctg 54 <210> 21 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> MS26Cas-2 forward primer <400> 21 ctacactctt tccctacacg acgctcttcc gatctaaggt cctggaggac gacgtgctg 59 <210> 22 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> MS26Cas-2 reverse primer <400> 22 caagcagaag acggcatacg agctcttccg atctccggaa gctcgccgcg t 51 <210> 23 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> MS26Cas-3 forward primer <400> 23 ctacactctt tccctacacg acgctcttcc gatcttcctc cggaagctcg ccgcgt 56 <210> 24 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> LIGCas-1 forward primer <400> 24 ctacactctt tccctacacg acgctcttcc gatctaggac tgtaacgatt tacgcacctg 60 ctg 63 <210> 25 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> LIGCas-1 and LIGCas-2 reverse primer <400> 25 caagcagaag acggcatacg agctcttccg atctgcaaat gagtagcagc gcacgtat 58 <210> 26 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> LIGCas-2 forward primer <400> 26 ctacactctt tccctacacg acgctcttcc gatcttcctc tgtaacgatt tacgcacctg 60 ctg 63 <210> 27 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> LIGCas-3 forward primer <400> 27 ctacactctt tccctacacg acgctcttcc gatctaaggc gcaaatgagt agcagcgcac 60 <210> 28 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> LIGCas-3 reverse primer <400> 28 caagcagaag acggcatacg agctcttccg atctcacctg ctgggaattg taccgta 57 <210> 29 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> MS45Cas-1 forward primer <400> 29 ctacactctt tccctacacg acgctcttcc gatctaggag gacccgttcg gcctcagt 58 <210> 30 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> S45Cas-1, MS45Cas-2 and MS45Cas-3 reverse primer <400> 30 caagcagaag acggcatacg agctcttccg atctgccggc tggcattgtc tctg 54 <210> 31 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> MS45Cas-2 forward primer <400> 31 ctacactctt tccctacacg acgctcttcc gatcttcctg gacccgttcg gcctcagt 58 <210> 32 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> MS45Cas-3 forward primer <400> 32 ctacactctt tccctacacg acgctcttcc gatctgaagg gacccgttcg gcctcagt 58 <210> 33 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> ALSCas-1 forward primer <400> 33 ctacactctt tccctacacg acgctcttcc gatctaaggc gacgatgggc gtctcctg 58 <210> 34 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> ALSCas-1, ALSCas-2 and ALSCas-3 reverse primer <400> 34 caagcagaag acggcatacg agctcttccg atctgcgtct gcatcgccac ctc 53 <210> 35 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> ALSCas-2 forward primer <400> 35 ctacactctt tccctacacg acgctcttcc gatctttccc gacgatgggc gtctcctg 58 <210> 36 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> ALSCas-3 forward primer <400> 36 ctacactctt tccctacacg acgctcttcc gatctggaac gacgatgggc gtctcctg 58 <210> 37 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> forward primer for secondary PCR <400> 37 aatgatacgg cgaccaccga gatctacact ctttccctac acg 43 <210> 38 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> reverse primer for secondary PCR; <400> 38 caagcagaag acggcata 18 <210> 39 <211> 1910 <212> DNA <213> Zea mays <220> <221> misc_feature <222> (1)..(1910) <223> ALS1-DNA sequence <400> 39 atggccaccg ccgccaccgc ggccgccgcg ctcaccggcg ccactaccgc tacgcccaag 60 tcgaggcgcc gagcccacca cttggccacc cggcgcgccc tcgccgcgcc catcaggtgc 120 tcagcgttgt cacgcgccac gccgacggct cccccggcca ctccgctacg tccgtggggc 180 cccaacgagc cccgcaaggg ctccgacatc ctcgtcgagg ctctcgagcg ctgtggcgtc 240 cgtgacgtct tcgcctaccc cggcggcgca tccatggaga tccaccaggc actcacccgc 300 tcccccgtca tcgccaacca cctcttccgc cacgaacaag gggaggcctt cgccgcctcc 360 ggctacgcgc gctcctcggg ccgcgttggc gtctgcatcg ccacctccgg ccccggcgcc 420 accaacctag tctctgcgct cgcagacgcg ttgctcgact ccgtccccat tgtcgccatc 480 acgggacagg tgccgcgacg catgattggc accgacgcct ttcaggagac gcccatcgtc 540 gaggtcaccc gctccatcac caagcacaac tacctggtcc tcgacgtcga cgacatcccc 600 cgcgtcgtgc aggaggcctt cttcctcgca tcctctggtc gcccggggcc ggtgcttgtt 660 gacatcccca aggacatcca gcagcagatg gcggtgccgg cctgggacac gcccatgagt 720 ctgcctgggt acatcgcgcg ccttcccaag cctcccgcga ctgaatttct tgagcaggtg 780 ctgcgtcttg ttggtgaatc acggcgccct gttctttatg ttggcggtgg ctgtgcagca 840 tcaggtgagg agttgtgccg ctttgtggag ttgactggaa tcccagtcac aactactctt 900 atgggccttg gcaacttccc cagcgacgac ccactgtcac tgcgcatgct tggtatgcat 960 ggcacagtgt atgcaaatta tgcagtggat aaggccgatc tgttgcttgc atttggtgtg 1020 cggtttgatg atcgtgtgac agggaaaatt gaggcttttg caggcagagc taagattgtg 1080 cacattgata ttgatcctgc tgagattggc aagaacaagc agccacatgt gtccatctgt 1140 gcagatgtta agcttgcttt gcagggcatg aatactcttc tggaaggaag cacatcaaag 1200 aagagctttg acttcggctc atggcatgat gaattggatc agcaaaagcg ggagtttccc 1260 cttgggtata aaatcttcaa tgaggaaatc cagccacaat atgctattca ggttcttgat 1320 gagttgacga aggggaaggc catcattgcc acaggtgttg ggcagcacca gatgtgggcg 1380 gcacagtatt acacttacaa gcggccaagg cagtggctgt cttcagctgg tcttggggct 1440 atgggatttg gtttgccggc tgctgctggt gctgctgtgg ccaacccagg tgtcactgtt 1500 gttgacatcg acggagatgg tagcttcctc atgaacattc aggagctagc tatgatccgt 1560 attgagaacc tcccagtcaa ggtctttgtg ctaaacaacc agcacctcgg gatggtggtg 1620 cagtgggagg acaggttcta taaggccaat agagcacaca cattcttggg aaacccagag 1680 aacgaaagtg agatatatcc agattttgtg gcaattgcca aagggttcaa cattccagca 1740 gtccgtgtga caaagaagag cgaagtccat gcagcaatca agaagatgct tgaggctcca 1800 gggccgtacc tcttggatat aatcgtcccg caccaggagc atgtgttgcc tatgatccct 1860 agtggtgggg ctttcaagga tatgatcctg gatggtgatg gcaggactgt 1910 <210> 40 <211> 1910 <212> DNA <213> Zea mays <220> <221> misc_feature <222> (1)..(1910) <223> ALS2-DNA sequence <400> 40 atggccaccg ccgccgccgc gtctaccgcg ctcactggcg ccactaccgc tgcgcccaag 60 gcgaggcgcc gggcgcacct cctggccacc cgccgcgccc tcgccgcgcc catcaggtgc 120 tcagcggcgt cacccgccat gccgatggct cccccggcca ccccgctccg gccgtggggc 180 cccaccgatc cccgcaaggg cgccgacatc ctcgtcgagt ccctcgagcg ctgcggcgtc 240 cgcgacgtct tcgcctaccc cggcggcgcg tccatggaga tccaccaggc actcacccgc 300 tcccccgtca tcgccaacca cctcttccgc cacgagcaag gggaggcctt tgcggcctcc 360 ggctacgcgc gctcctcggg ccgcgtcggc gtctgcatcg ccacctccgg ccccggcgcc 420 accaaccttg tctccgcgct cgccgacgcg ctgctcgatt ccgtccccat ggtcgccatc 480 acgggacagg tgccgcgacg catgattggc accgacgcct tccaggagac gcccatcgtc 540 gaggtcaccc gctccatcac caagcacaac tacctggtcc tcgacgtcga cgacatcccc 600 cgcgtcgtgc aggaggcttt cttcctcgcc tcctctggtc gaccggggcc ggtgcttgtc 660 gacatcccca aggacatcca gcagcagatg gcggtgcctg tctgggacaa gcccatgagt 720 ctgcctgggt acattgcgcg ccttcccaag ccccctgcga ctgagttgct tgagcaggtg 780 ctgcgtcttg ttggtgaatc ccggcgccct gttctttatg ttggcggtgg ctgcgcagca 840 tctggtgagg agttgcgacg ctttgtggag ctgactggaa tcccggtcac aactactctt 900 atgggcctcg gcaacttccc cagcgacgac ccactgtctc tgcgcatgct aggtatgcat 960 ggcacggtgt atgcaaatta tgcagtggat aaggccgatc tgttgcttgc acttggtgtg 1020 cggtttgatg atcgtgtgac agggaagatt gaggcttttg caagcagggc taagattgtg 1080 cacgttgata ttgatccggc tgagattggc aagaacaagc agccacatgt gtccatctgt 1140 gcagatgtta agcttgcttt gcagggcatg aatgctcttc ttgaaggaag cacatcaaag 1200 aagagctttg actttggctc atggaacgat gagttggatc agcagaagag ggaattcccc 1260 cttgggtata aaacatctaa tgaggagatc cagccacaat atgctattca ggttcttgat 1320 gagctgacga aaggcgaggc catcatcggc acaggtgttg ggcagcacca gatgtgggcg 1380 gcacagtact acacttacaa gcggccaagg cagtggttgt cttcagctgg tcttggggct 1440 atgggatttg gtttgccggc tgctgctggt gcttctgtgg ccaacccagg tgttactgtt 1500 gttgacatcg atggagatgg tagctttctc atgaacgttc aggagctagc tatgatccga 1560 attgagaacc tcccggtgaa ggtctttgtg ctaaacaacc agcacctggg gatggtggtg 1620 cagtgggagg acaggttcta taaggccaac agagcgcaca catacttggg aaacccagag 1680 aatgaaagtg agatatatcc agatttcgtg acgatcgcca aagggttcaa cattccagcg 1740 gtccgtgtga caaagaagaa cgaagtccgc gcagcgataa agaagatgct cgagactcca 1800 gggccgtacc tcttggatat aatcgtccca caccaggagc atgtgttgcc tatgatccct 1860 agtggtgggg ctttcaagga tatgatcctg gatggtgatg gcaggactgt 1910 <210> 41 <211> 638 <212> PRT <213> Zea mays <220> <221> MISC_FEATURE <222> (1)..(638) <223> full length Zm-ALS2 protein <400> 41 Met Ala Thr Ala Ala Ala Ala Ser Thr Ala Leu Thr Gly Ala Thr Thr 1 5 10 15 Ala Ala Pro Lys Ala Arg Arg Arg Ala His Leu Leu Ala Thr Arg Arg 20 25 30 Ala Leu Ala Ala Pro Ile Arg Cys Ser Ala Ala Ser Pro Ala Met Pro 35 40 45 Met Ala Pro Pro Ala Thr Pro Leu Arg Pro Trp Gly Pro Thr Glu Pro 50 55 60 Arg Lys Gly Ala Asp Ile Leu Val Glu Ser Leu Glu Arg Cys Gly Val 65 70 75 80 Arg Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln 85 90 95 Ala Leu Thr Arg Ser Pro Val Ile Ala Asn His Leu Phe Arg His Glu 100 105 110 Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr Ala Arg Ser Ser Gly Arg 115 120 125 Val Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val 130 135 140 Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Met Val Ala Ile 145 150 155 160 Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu 165 170 175 Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu 180 185 190 Val Leu Asp Val Asp Asp Ile Pro Arg Val Val Gln Glu Ala Phe Phe 195 200 205 Leu Ala Ser Ser Gly Arg Pro Gly Pro Val Leu Val Asp Ile Pro Lys 210 215 220 Asp Ile Gln Gln Gln Met Ala Val Pro Val Trp Asp Lys Pro Met Ser 225 230 235 240 Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys Pro Pro Ala Thr Glu Leu 245 250 255 Leu Glu Gln Val Leu Arg Leu Val Gly Glu Ser Arg Arg Pro Val Leu 260 265 270 Tyr Val Gly Gly Gly Cys Ala Ala Ser Gly Glu Glu Leu Arg Arg Phe 275 280 285 Val Glu Leu Thr Gly Ile Pro Val Thr Thr Thr Leu Met Gly Leu Gly 290 295 300 Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu Arg Met Leu Gly Met His 305 310 315 320 Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Lys Ala Asp Leu Leu Leu 325 330 335 Ala Leu Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Ile Glu Ala 340 345 350 Phe Ala Ser Arg Ala Lys Ile Val His Val Asp Ile Asp Pro Ala Glu 355 360 365 Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile Cys Ala Asp Val Lys 370 375 380 Leu Ala Leu Gln Gly Met Asn Ala Leu Leu Glu Gly Ser Thr Ser Lys 385 390 395 400 Lys Ser Phe Asp Phe Gly Ser Trp Asn Asp Glu Leu Asp Gln Gln Lys 405 410 415 Arg Glu Phe Pro Leu Gly Tyr Lys Thr Ser Asn Glu Glu Ile Gln Pro 420 425 430 Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr Lys Gly Glu Ala Ile 435 440 445 Ile Gly Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Tyr Tyr 450 455 460 Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser Ser Ala Gly Leu Gly Ala 465 470 475 480 Met Gly Phe Gly Leu Pro Ala Ala Ala Gly Ala Ser Val Ala Asn Pro 485 490 495 Gly Val Thr Val Val Asp Ile Asp Gly Asp Gly Ser Phe Leu Met Asn 500 505 510 Val Gln Glu Leu Ala Met Ile Arg Ile Glu Asn Leu Pro Val Lys Val 515 520 525 Phe Val Leu Asn Asn Gln His Leu Gly Met Val Val Gln Trp Glu Asp 530 535 540 Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr Leu Gly Asn Pro Glu 545 550 555 560 Asn Glu Ser Glu Ile Tyr Pro Asp Phe Val Thr Ile Ala Lys Gly Phe 565 570 575 Asn Ile Pro Ala Val Arg Val Thr Lys Lys Asn Glu Val Arg Ala Ala 580 585 590 Ile Lys Lys Met Leu Glu Thr Pro Gly Pro Tyr Leu Leu Asp Ile Ile 595 600 605 Val Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser Gly Gly Ala 610 615 620 Phe Lys Asp Met Ile Leu Asp Gly Asp Gly Arg Thr Val Tyr 625 630 635 <210> 42 <211> 23 <212> DNA <213> Zea mays <400> 42 gctgctcgat tccgtcccca tgg 23 <210> 43 <211> 794 <212> DNA <213> Artificial sequence <220> <223> 794 bp polynucleotide modification template <400> 43 ttctgctcaa gcaactcagt cgcagggggc ttgggaaggc gcgcaatgta cccaggcaga 60 ctcatgggct tgtcccagac aggcaccgcc atctgctgct ggatgtcctt ggggatgtcg 120 acaagcaccg gccctggtcg accagaggag gcgaggaaga aagcctcctg cacgacgcgg 180 gggatgtcgt cgacgtcgag gaccaggtag ttgtgcttgg tgatggagcg ggtgacctcg 240 acgatgggcg tctcctggaa ggcgtcggtg ccaatcatgc gtcgcgacac ttggccggta 300 atcgccacca tggggacgga atcgagcagc gcgtcggcga gcgcggagac aaggttggtg 360 gcgccggggc cggaggtggc gatgcagacg ccgacgcggc ccgaggagcg cgcgtagccg 420 gaggccgcaa aggcctcccc ttgctcgtgg cggaagaggt ggttggcgat gacgggggag 480 cgggtgagtg cctggtggat ctccatggac gcgccgccgg ggtaggcgaa gacgtcgcgg 540 acgccgcagc gctcgaggga ctcgacgagg atgtcggcgc ccttgcgggg atcggtgggg 600 ccccacggcc ggagcggggt ggccggggga gccatcggca tggcgggtga cgccgctgag 660 cacctgatgg gcgcggcgag ggcgcggcgg gtggccagga ggtgcgcccg gcgcctcgcc 720 ttgggcgcag cggtagtggc gccagtgagc gcggtagacg cggcggcggc ggtggccatg 780 gttgcggcgg ctgt 794 <210> 44 <211> 127 <212> DNA <213> Artificial sequence <220> <223> 127 bp polynucleotide modification template oligo -1 <400> 44 aaccttgtct ccgcgctcgc cgacgcgttg ctcgactccg tccccattgt cgccatcacg 60 ggacaggtgt cgcgacgcat gattggcacc gacgccttcc aggagacgcc catcgtcgag 120 gtcaccc 127 <210> 45 <211> 127 <212> DNA <213> artificial sequence <220> <223> 127 bp polynucleotide modification template oligo-2 <400> 45 aaccttgtct ccgcgctcgc cgacgcgttg ctggactccg tgccgatggt cgccatcacg 60 ggacaggtgt cccgacgcat gattggcacc gacgccttcc aggagacgcc catcgtcgag 120 gtcaccc 127 <210> 46 <211> 56493 <212> DNA <213> Artificial sequence <220> <223> Agrobacterium vector containing maize codon optimized Cas9 and maize UBI promoter <400> 46 gtcggatcac cggaaaggac ccgtaaagtg ataatgatta tcatctacat atcacaacgt 60 gcgtggaggc catcaaacca cgtcaaataa tcaattatga cgcaggtatc gtattaattg 120 atctgcatca acttaacgta aaaacaactt cagacaatac aaatcagcga cactgaatac 180 ggggcaacct catgtccccc cccccccccc ccctgcaggc atcgtggtgt cacgctcgtc 240 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 300 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 360 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 420 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 480 tatgcggcga ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag 540 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 600 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 660 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 720 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 780 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 840 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 900 aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 960 tcaagaattc ggagcttttg ccattctcac cggattcagt cgtcactcat ggtgatttct 1020 cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag 1080 tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt 1140 ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata 1200 aattgcagtt tcatttgatg ctcgatgagt ttttctaatc agaattggtt aattggttgt 1260 aacactggca gagcattacg ctgacttgac gggacggcgg ctttgttgaa taaatcgaac 1320 ttttgctgag ttgaaggatc agatcacgca tcttcccgac aacgcagacc gttccgtggc 1380 aaagcaaaag ttcaaaatca ccaactggtc cacctacaac aaagctctca tcaaccgtgg 1440 ctccctcact ttctggctgg atgatggggc gattcaggcc tggtatgagt cagcaacacc 1500 ttcttcacga ggcagacctc agcgccagaa ggccgccaga gaggccgagc gcggccgtga 1560 ggcttggacg ctagggcagg gcatgaaaaa gcccgtagcg ggctgctacg ggcgtctgac 1620 gcggtggaaa gggggagggg atgttgtcta catggctctg ctgtagtgag tgggttgcgc 1680 tccggcagcg gtcctgatca atcgtcaccc tttctcggtc cttcaacgtt cctgacaacg 1740 agcctccttt tcgccaatcc atcgacaatc accgcgagtc cctgctcgaa cgctgcgtcc 1800 ggaccggctt cgtcgaaggc gtctatcgcg gcccgcaaca gcggcgagag cggagcctgt 1860 tcaacggtgc cgccgcgctc gccggcatcg ctgtcgccgg cctgctcctc aagcacggcc 1920 ccaacagtga agtagctgat tgtcatcagc gcattgacgg cgtccccggc cgaaaaaccc 1980 gcctcgcaga ggaagcgaag ctgcgcgtcg gccgtttcca tctgcggtgc gcccggtcgc 2040 gtgccggcat ggatgcgcgc gccatcgcgg taggcgagca gcgcctgcct gaagctgcgg 2100 gcattcccga tcagaaatga gcgccagtcg tcgtcggctc tcggcaccga atgcgtatga 2160 ttctccgcca gcatggcttc ggccagtgcg tcgagcagcg cccgcttgtt cctgaagtgc 2220 cagtaaagcg ccggctgctg aacccccaac cgttccgcca gtttgcgtgt cgtcagaccg 2280 tctacgccga cctcgttcaa caggtccagg gcggcacgga tcactgtatt cggctgcaac 2340 tttgtcatgc ttgacacttt atcactgata aacataatat gtccaccaac ttatcagtga 2400 taaagaatcc gcgcgttcaa tcggaccagc ggaggctggt ccggaggcca gacgtgaaac 2460 ccaacatacc cctgatcgta attctgagca ctgtcgcgct cgacgctgtc ggcatcggcc 2520 tgattatgcc ggtgctgccg ggcctcctgc gcgatctggt tcactcgaac gacgtcaccg 2580 cccactatgg cattctgctg gcgctgtatg cgttggtgca atttgcctgc gcacctgtgc 2640 tgggcgcgct gtcggatcgt ttcgggcggc ggccaatctt gctcgtctcg ctggccggcg 2700 ccactgtcga ctacgccatc atggcgacag cgcctttcct ttgggttctc tatatcgggc 2760 ggatcgtggc cggcatcacc ggggcgactg gggcggtagc cggcgcttat attgccgata 2820 tcactgatgg cgatgagcgc gcgcggcact tcggcttcat gagcgcctgt ttcgggttcg 2880 ggatggtcgc gggacctgtg ctcggtgggc tgatgggcgg tttctccccc cacgctccgt 2940 tcttcgccgc ggcagccttg aacggcctca atttcctgac gggctgtttc cttttgccgg 3000 agtcgcacaa aggcgaacgc cggccgttac gccgggaggc tctcaacccg ctcgcttcgt 3060 tccggtgggc ccggggcatg accgtcgtcg ccgccctgat ggcggtcttc ttcatcatgc 3120 aacttgtcgg acaggtgccg gccgcgcttt gggtcatttt cggcgaggat cgctttcact 3180 gggacgcgac cacgatcggc atttcgcttg ccgcatttgg cattctgcat tcactcgccc 3240 aggcaatgat caccggccct gtagccgccc ggctcggcga aaggcgggca ctcatgctcg 3300 gaatgattgc cgacggcaca ggctacatcc tgcttgcctt cgcgacacgg ggatggatgg 3360 cgttcccgat catggtcctg cttgcttcgg gtggcatcgg aatgccggcg ctgcaagcaa 3420 tgttgtccag gcaggtggat gaggaacgtc aggggcagct gcaaggctca ctggcggcgc 3480 tcaccagcct gacctcgatc gtcggacccc tcctcttcac ggcgatctat gcggcttcta 3540 taacaacgtg gaacgggtgg gcatggattg caggcgctgc cctctacttg ctctgcctgc 3600 cggcgctgcg tcgcgggctt tggagcggcg cagggcaacg agccgatcgc tgatcgtgga 3660 aacgataggc ctatgccatg cgggtcaagg cgacttccgg caagctatac gcgccctagg 3720 agtgcggttg gaacgttggc ccagccagat actcccgatc acgagcagga cgccgatgat 3780 ttgaagcgca ctcagcgtct gatccaagaa caaccatcct agcaacacgg cggtccccgg 3840 gctgagaaag cccagtaagg aaacaactgt aggttcgagt cgcgagatcc cccggaacca 3900 aaggaagtag gttaaacccg ctccgatcag gccgagccac gccaggccga gaacattggt 3960 tcctgtaggc atcgggattg gcggatcaaa cactaaagct actggaacga gcagaagtcc 4020 tccggccgcc agttgccagg cggtaaaggt gagcagaggc acgggaggtt gccacttgcg 4080 ggtcagcacg gttccgaacg ccatggaaac cgcccccgcc aggcccgctg cgacgccgac 4140 aggatctagc gctgcgtttg gtgtcaacac caacagcgcc acgcccgcag ttccgcaaat 4200 agcccccagg accgccatca atcgtatcgg gctacctagc agagcggcag agatgaacac 4260 gaccatcagc ggctgcacag cgcctaccgt cgccgcgacc ccgcccggca ggcggtagac 4320 cgaaataaac aacaagctcc agaatagcga aatattaagt gcgccgagga tgaagatgcg 4380 catccaccag attcccgttg gaatctgtcg gacgatcatc acgagcaata aacccgccgg 4440 caacgcccgc agcagcatac cggcgacccc tcggcctcgc tgttcgggct ccacgaaaac 4500 gccggacaga tgcgccttgt gagcgtcctt ggggccgtcc tcctgtttga agaccgacag 4560 cccaatgatc tcgccgtcga tgtaggcgcc gaatgccacg gcatctcgca accgttcagc 4620 gaacgcctcc atgggctttt tctcctcgtg ctcgtaaacg gacccgaaca tctctggagc 4680 tttcttcagg gccgacaatc ggatctcgcg gaaatcctgc acgtcggccg ctccaagccg 4740 tcgaatctga gccttaatca caattgtcaa ttttaatcct ctgtttatcg gcagttcgta 4800 gagcgcgccg tgcgtcccga gcgatactga gcgaagcaag tgcgtcgagc agtgcccgct 4860 tgttcctgaa atgccagtaa agcgctggct gctgaacccc cagccggaac tgaccccaca 4920 aggccctagc gtttgcaatg caccaggtca tcattgaccc aggcgtgttc caccaggccg 4980 ctgcctcgca actcttcgca ggcttcgccg acctgctcgc gccacttctt cacgcgggtg 5040 gaatccgatc cgcacatgag gcggaaggtt tccagcttga gcgggtacgg ctcccggtgc 5100 gagctgaaat agtcgaacat ccgtcgggcc gtcggcgaca gcttgcggta cttctcccat 5160 atgaatttcg tgtagtggtc gccagcaaac agcacgacga tttcctcgtc gatcaggacc 5220 tggcaacggg acgttttctt gccacggtcc aggacgcgga agcggtgcag cagcgacacc 5280 gattccaggt gcccaacgcg gtcggacgtg aagcccatcg ccgtcgcctg taggcgcgac 5340 aggcattcct cggccttcgt gtaataccgg ccattgatcg accagcccag gtcctggcaa 5400 agctcgtaga acgtgaaggt gatcggctcg ccgatagggg tgcgcttcgc gtactccaac 5460 acctgctgcc acaccagttc gtcatcgtcg gcccgcagct cgacgccggt gtaggtgatc 5520 ttcacgtcct tgttgacgtg gaaaatgacc ttgttttgca gcgcctcgcg cgggattttc 5580 ttgttgcgcg tggtgaacag ggcagagcgg gccgtgtcgt ttggcatcgc tcgcatcgtg 5640 tccggccacg gcgcaatatc gaacaaggaa agctgcattt ccttgatctg ctgcttcgtg 5700 tgtttcagca acgcggcctg cttggcctcg ctgacctgtt ttgccaggtc ctcgccggcg 5760 gtttttcgct tcttggtcgt catagttcct cgcgtgtcga tggtcatcga cttcgccaaa 5820 cctgccgcct cctgttcgag acgacgcgaa cgctccacgg cggccgatgg cgcgggcagg 5880 gcagggggag ccagttgcac gctgtcgcgc tcgatcttgg ccgtagcttg ctggaccatc 5940 gagccgacgg actggaaggt ttcgcggggc gcacgcatga cggtgcggct tgcgatggtt 6000 tcggcatcct cggcggaaaa ccccgcgtcg atcagttctt gcctgtatgc cttccggtca 6060 aacgtccgat tcattcaccc tccttgcggg attgccccga ctcacgccgg ggcaatgtgc 6120 ccttattcct gatttgaccc gcctggtgcc ttggtgtcca gataatccac cttatcggca 6180 atgaagtcgg tcccgtagac cgtctggccg tccttctcgt acttggtatt ccgaatcttg 6240 ccctgcacga ataccagcga ccccttgccc aaatacttgc cgtgggcctc ggcctgagag 6300 ccaaaacact tgatgcggaa gaagtcggtg cgctcctgct tgtcgccggc atcgttgcgc 6360 cactcttcat taaccgctat atcgaaaatt gcttgcggct tgttagaatt gccatgacgt 6420 acctcggtgt cacgggtaag attaccgata aactggaact gattatggct catatcgaaa 6480 gtctccttga gaaaggagac tctagtttag ctaaacattg gttccgctgt caagaacttt 6540 agcggctaaa attttgcggg ccgcgaccaa aggtgcgagg ggcggcttcc gctgtgtaca 6600 accagatatt tttcaccaac atccttcgtc tgctcgatga gcggggcatg acgaaacatg 6660 agctgtcgga gagggcaggg gtttcaattt cgtttttatc agacttaacc aacggtaagg 6720 ccaacccctc gttgaaggtg atggaggcca ttgccgacgc cctggaaact cccctacctc 6780 ttctcctgga gtccaccgac cttgaccgcg aggcactcgc ggagattgcg ggtcatcctt 6840 tcaagagcag cgtgccgccc ggatacgaac gcatcagtgt ggttttgccg tcacataagg 6900 cgtttatcgt aaagaaatgg ggcgacgaca cccgaaaaaa gctgcgtgga aggctctgac 6960 gccaagggtt agggcttgca cttccttctt tagccgctaa aacggcccct tctctgcggg 7020 ccgtcggctc gcgcatcata tcgacatcct caacggaagc cgtgccgcga atggcatcgg 7080 gcgggtgcgc tttgacagtt gttttctatc agaaccccta cgtcgtgcgg ttcgattagc 7140 tgtttgtctt gcaggctaaa cactttcggt atatcgtttg cctgtgcgat aatgttgcta 7200 atgatttgtt gcgtaggggt tactgaaaag tgagcgggaa agaagagttt cagaccatca 7260 aggagcgggc caagcgcaag ctggaacgcg acatgggtgc ggacctgttg gccgcgctca 7320 acgacccgaa aaccgttgaa gtcatgctca acgcggacgg caaggtgtgg cacgaacgcc 7380 ttggcgagcc gatgcggtac atctgcgaca tgcggcccag ccagtcgcag gcgattatag 7440 aaacggtggc cggattccac ggcaaagagg tcacgcggca ttcgcccatc ctggaaggcg 7500 agttcccctt ggatggcagc cgctttgccg gccaattgcc gccggtcgtg gccgcgccaa 7560 cctttgcgat ccgcaagcgc gcggtcgcca tcttcacgct ggaacagtac gtcgaggcgg 7620 gcatcatgac ccgcgagcaa tacgaggtca ttaaaagcgc cgtcgcggcg catcgaaaca 7680 tcctcgtcat tggcggtact ggctcgggca agaccacgct cgtcaacgcg atcatcaatg 7740 aaatggtcgc cttcaacccg tctgagcgcg tcgtcatcat cgaggacacc ggcgaaatcc 7800 agtgcgccgc agagaacgcc gtccaatacc acaccagcat cgacgtctcg atgacgctgc 7860 tgctcaagac aacgctgcgt atgcgccccg accgcatcct ggtcggtgag gtacgtggcc 7920 ccgaagccct tgatctgttg atggcctgga acaccgggca tgaaggaggt gccgccaccc 7980 tgcacgcaaa caaccccaaa gcgggcctga gccggctcgc catgcttatc agcatgcacc 8040 cggattcacc gaaacccatt gagccgctga ttggcgaggc ggttcatgtg gtcgtccata 8100 tcgccaggac ccctagcggc cgtcgagtgc aagaaattct cgaagttctt ggttacgaga 8160 acggccagta catcaccaaa accctgtaag gagtatttcc aatgacaacg gctgttccgt 8220 tccgtctgac catgaatcgc ggcattttgt tctaccttgc cgtgttcttc gttctcgctc 8280 tcgcgttatc cgcgcatccg gcgatggcct cggaaggcac cggcggcagc ttgccatatg 8340 agagctggct gacgaacctg cgcaactccg taaccggccc ggtggccttc gcgctgtcca 8400 tcatcggcat cgtcgtcgcc ggcggcgtgc tgatcttcgg cggcgaactc aacgccttct 8460 tccgaaccct gatcttcctg gttctggtga tggcgctgct ggtcggcgcg cagaacgtga 8520 tgagcacctt cttcggtcgt ggtgccgaaa tcgcggccct cggcaacggg gcgctgcacc 8580 aggtgcaagt cgcggcggcg gatgccgtgc gtgcggtagc ggctggacgg ctcgcctaat 8640 catggctctg cgcacgatcc ccatccgtcg cgcaggcaac cgagaaaacc tgttcatggg 8700 tggtgatcgt gaactggtga tgttctcggg cctgatggcg tttgcgctga ttttcagcgc 8760 ccaagagctg cgggccaccg tggtcggtct gatcctgtgg ttcggggcgc tctatgcgtt 8820 ccgaatcatg gcgaaggccg atccgaagat gcggttcgtg tacctgcgtc accgccggta 8880 caagccgtat tacccggccc gctcgacccc gttccgcgag aacaccaata gccaagggaa 8940 gcaataccga tgatccaagc aattgcgatt gcaatcgcgg gcctcggcgc gcttctgttg 9000 ttcatcctct ttgcccgcat ccgcgcggtc gatgccgaac tgaaactgaa aaagcatcgt 9060 tccaaggacg ccggcctggc cgatctgctc aactacgccg ctgtcgtcga tgacggcgta 9120 atcgtgggca agaacggcag ctttatggct gcctggctgt acaagggcga tgacaacgca 9180 agcagcaccg accagcagcg cgaagtagtg tccgcccgca tcaaccaggc cctcgcgggc 9240 ctgggaagtg ggtggatgat ccatgtggac gccgtgcggc gtcctgctcc gaactacgcg 9300 gagcggggcc tgtcggcgtt ccctgaccgt ctgacggcag cgattgaaga agagcgctcg 9360 gtcttgcctt gctcgtcggt gatgtacttc accagctccg cgaagtcgct cttcttgatg 9420 gagcgcatgg ggacgtgctt ggcaatcacg cgcacccccc ggccgtttta gcggctaaaa 9480 aagtcatggc tctgccctcg ggcggaccac gcccatcatg accttgccaa gctcgtcctg 9540 cttctcttcg atcttcgcca gcagggcgag gatcgtggca tcaccgaacc gcgccgtgcg 9600 cgggtcgtcg gtgagccaga gtttcagcag gccgcccagg cggcccaggt cgccattgat 9660 gcgggccagc tcgcggacgt gctcatagtc cacgacgccc gtgattttgt agccctggcc 9720 gacggccagc aggtaggccg acaggctcat gccggccgcc gccgcctttt cctcaatcgc 9780 tcttcgttcg tctggaaggc agtacacctt gataggtggg ctgcccttcc tggttggctt 9840 ggtttcatca gccatccgct tgccctcatc tgttacgccg gcggtagccg gccagcctcg 9900 cagagcagga ttcccgttga gcaccgccag gtgcgaataa gggacagtga agaaggaaca 9960 cccgctcgcg ggtgggccta cttcacctat cctgcccggc tgacgccgtt ggatacacca 10020 aggaaagtct acacgaaccc tttggcaaaa tcctgtatat cgtgcgaaaa aggatggata 10080 taccgaaaaa atcgctataa tgaccccgaa gcagggttat gcagcggaaa agcgctgctt 10140 ccctgctgtt ttgtggaata tctaccgact ggaaacaggc aaatgcagga aattactgaa 10200 ctgaggggac aggcgagaga cgatgccaaa gagctacacc gacgagctgg ccgagtgggt 10260 tgaatcccgc gcggccaaga agcgccggcg tgatgaggct gcggttgcgt tcctggcggt 10320 gagggcggat gtcgaggcgg cgttagcgtc cggctatgcg ctcgtcacca tttgggagca 10380 catgcgggaa acggggaagg tcaagttctc ctacgagacg ttccgctcgc acgccaggcg 10440 gcacatcaag gccaagcccg ccgatgtgcc cgcaccgcag gccaaggctg cggaacccgc 10500 gccggcaccc aagacgccgg agccacggcg gccgaagcag gggggcaagg ctgaaaagcc 10560 ggcccccgct gcggccccga ccggcttcac cttcaaccca acaccggaca aaaaggatct 10620 actgtaatgg cgaaaattca catggttttg cagggcaagg gcggggtcgg caagtcggcc 10680 atcgccgcga tcattgcgca gtacaagatg gacaaggggc agacaccctt gtgcatcgac 10740 accgacccgg tgaacgcgac gttcgagggc tacaaggccc tgaacgtccg ccggctgaac 10800 atcatggccg gcgacgaaat taactcgcgc aacttcgaca ccctggtcga gctgattgcg 10860 ccgaccaagg atgacgtggt gatcgacaac ggtgccagct cgttcgtgcc tctgtcgcat 10920 tacctcatca gcaaccaggt gccggctctg ctgcaagaaa tggggcatga gctggtcatc 10980 cataccgtcg tcaccggcgg ccaggctctc ctggacacgg tgagcggctt cgcccagctc 11040 gccagccagt tcccggccga agcgcttttc gtggtctggc tgaacccgta ttgggggcct 11100 atcgagcatg agggcaagag ctttgagcag atgaaggcgt acacggccaa caaggcccgc 11160 gtgtcgtcca tcatccagat tccggccctc aaggaagaaa cctacggccg cgatttcagc 11220 gacatgctgc aagagcggct gacgttcgac caggcgctgg ccgatgaatc gctcacgatc 11280 atgacgcggc aacgcctcaa gatcgtgcgg cgcggcctgt ttgaacagct cgacgcggcg 11340 gccgtgctat gagcgaccag attgaagagc tgatccggga gattgcggcc aagcacggca 11400 tcgccgtcgg ccgcgacgac ccggtgctga tcctgcatac catcaacgcc cggctcatgg 11460 ccgacagtgc ggccaagcaa gaggaaatcc ttgccgcgtt caaggaagag ctggaaggga 11520 tcgcccatcg ttggggcgag gacgccaagg ccaaagcgga gcggatgctg aacgcggccc 11580 tggcggccag caaggacgca atggcgaagg taatgaagga cagcgccgcg caggcggccg 11640 aagcgatccg cagggaaatc gacgacggcc ttggccgcca gctcgcggcc aaggtcgcgg 11700 acgcgcggcg cgtggcgatg atgaacatga tcgccggcgg catggtgttg ttcgcggccg 11760 ccctggtggt gtgggcctcg ttatgaatcg cagaggcgca gatgaaaaag cccggcgttg 11820 ccgggctttg tttttgcgtt agctgggctt gtttgacagg cccaagctct gactgcgccc 11880 gcgctcgcgc tcctgggcct gtttcttctc ctgctcctgc ttgcgcatca gggcctggtg 11940 ccgtcgggct gcttcacgca tcgaatccca gtcgccggcc agctcgggat gctccgcgcg 12000 catcttgcgc gtcgccagtt cctcgatctt gggcgcgtga atgcccatgc cttccttgat 12060 ttcgcgcacc atgtccagcc gcgtgtgcag ggtctgcaag cgggcttgct gttgggcctg 12120 ctgctgctgc caggcggcct ttgtacgcgg cagggacagc aagccggggg cattggactg 12180 tagctgctgc aaacgcgcct gctgacggtc tacgagctgt tctaggcggt cctcgatgcg 12240 ctccacctgg tcatgctttg cctgcacgta gagcgcaagg gtctgctggt aggtctgctc 12300 gatgggcgcg gattctaaga gggcctgctg ttccgtctcg gcctcctggg ccgcctgtag 12360 caaatcctcg ccgctgttgc cgctggactg ctttactgcc ggggactgct gttgccctgc 12420 tcgcgccgtc gtcgcagttc ggcttgcccc cactcgattg actgcttcat ttcgagccgc 12480 agcgatgcga tctcggattg cgtcaacgga cggggcagcg cggaggtgtc cggcttctcc 12540 ttgggtgagt cggtcgatgc catagccaaa ggtttccttc caaaatgcgt ccattgctgg 12600 accgtgtttc tcattgatgc ccgcaagcat cttcggcttg accgccaggt caagcgcgcc 12660 ttcatgggcg gtcatgacgg acgccgccat gaccttgccg ccgttgttct cgatgtagcc 12720 gcgtaatgag gcaatggtgc cgcccatcgt cagcgtgtca tcgacaacga tgtacttctg 12780 gccggggatc acctccccct cgaaagtcgg gttgaacgcc aggcgatgat ctgaaccggc 12840 tccggttcgg gcgaccttct cccgctgcac aatgtccgtt tcgacctcaa ggccaaggcg 12900 gtcggccaga acgaccgcca tcatggccgg aatcttgttg ttccccgccg cctcgacggc 12960 gaggactgga acgatgcggg gcttgtcgtc gccgatcagc gtcttgagct gggcaacagt 13020 gtcgtccgaa atcaggcgct cgaccaaatt aagcgccgct tccgcgtcgc cctgcttcgc 13080 agcctggtat tcaggctcgt tggtcaaaga accaaggtcg ccgttgcgaa ccaccttcgg 13140 gaagtctccc cacggtgcgc gctcggctct gctgtagctg ctcaagacgc ctcccttttt 13200 agccgctaaa actctaacga gtgcgcccgc gactcaactt gacgctttcg gcacttacct 13260 gtgccttgcc acttgcgtca taggtgatgc ttttcgcact cccgatttca ggtactttat 13320 cgaaatctga ccgggcgtgc attacaaagt tcttccccac ctgttggtaa atgctgccgc 13380 tatctgcgtg gacgatgctg ccgtcgtggc gctgcgactt atcggccttt tgggccatat 13440 agatgttgta aatgccaggt ttcagggccc cggctttatc taccttctgg ttcgtccatg 13500 cgccttggtt ctcggtctgg acaattcttt gcccattcat gaccaggagg cggtgtttca 13560 ttgggtgact cctgacggtt gcctctggtg ttaaacgtgt cctggtcgct tgccggctaa 13620 aaaaaagccg acctcggcag ttcgaggccg gctttcccta gagccgggcg cgtcaaggtt 13680 gttccatcta ttttagtgaa ctgcgttcga tttatcagtt actttcctcc cgctttgtgt 13740 ttcctcccac tcgtttccgc gtctagccga cccctcaaca tagcggcctc ttcttgggct 13800 gcctttgcct cttgccgcgc ttcgtcacgc tcggcttgca ccgtcgtaaa gcgctcggcc 13860 tgcctggccg cctcttgcgc cgccaacttc ctttgctcct ggtgggcctc ggcgtcggcc 13920 tgcgccttcg ctttcaccgc tgccaactcc gtgcgcaaac tctccgcttc gcgcctggtg 13980 gcgtcgcgct cgccgcgaag cgcctgcatt tcctggttgg ccgcgtccag ggtcttgcgg 14040 ctctcttctt tgaatgcgcg ggcgtcctgg tgagcgtagt ccagctcggc gcgcagctcc 14100 tgcgctcgac gctccacctc gtcggcccgc tgcgtcgcca gcgcggcccg ctgctcggct 14160 cctgccaggg cggtgcgtgc ttcggccagg gcttgccgct ggcgtgcggc cagctcggcc 14220 gcctcggcgg cctgctgctc tagcaatgta acgcgcgcct gggcttcttc cagctcgcgg 14280 gcctgcgcct cgaaggcgtc ggccagctcc ccgcgcacgg cttccaactc gttgcgctca 14340 cgatcccagc cggcttgcgc tgcctgcaac gattcattgg caagggcctg ggcggcttgc 14400 cagagggcgg ccacggcctg gttgccggcc tgctgcaccg cgtccggcac ctggactgcc 14460 agcggggcgg cctgcgccgt gcgctggcgt cgccattcgc gcatgccggc gctggcgtcg 14520 ttcatgttga cgcgggcggc cttacgcact gcatccacgg tcgggaagtt ctcccggtcg 14580 ccttgctcga acagctcgtc cgcagccgca aaaatgcggt cgcgcgtctc tttgttcagt 14640 tccatgttgg ctccggtaat tggtaagaat aataatactc ttacctacct tatcagcgca 14700 agagtttagc tgaacagttc tcgacttaac ggcaggtttt ttagcggctg aagggcaggc 14760 aaaaaaagcc ccgcacggtc ggcgggggca aagggtcagc gggaagggga ttagcgggcg 14820 tcgggcttct tcatgcgtcg gggccgcgct tcttgggatg gagcacgacg aagcgcgcac 14880 gcgcatcgtc ctcggcccta tcggcccgcg tcgcggtcag gaacttgtcg cgcgctaggt 14940 cctccctggt gggcaccagg ggcatgaact cggcctgctc gatgtaggtc cactccatga 15000 ccgcatcgca gtcgaggccg cgttccttca ccgtctcttg caggtcgcgg tacgcccgct 15060 cgttgagcgg ctggtaacgg gccaattggt cgtaaatggc tgtcggccat gagcggcctt 15120 tcctgttgag ccagcagccg acgacgaagc cggcaatgca ggcccctggc acaaccaggc 15180 cgacgccggg ggcaggggat ggcagcagct cgccaaccag gaaccccgcc gcgatgatgc 15240 cgatgccggt caaccagccc ttgaaactat ccggccccga aacacccctg cgcattgcct 15300 ggatgctgcg ccggatagct tgcaacatca ggagccgttt cttttgttcg tcagtcatgg 15360 tccgccctca ccagttgttc gtatcggtgt cggacgaact gaaatcgcaa gagctgccgg 15420 tatcggtcca gccgctgtcc gtgtcgctgc tgccgaagca cggcgagggg tccgcgaacg 15480 ccgcagacgg cgtatccggc cgcagcgcat cgcccagcat ggccccggtc agcgagccgc 15540 cggccaggta gcccagcatg gtgctgttgg tcgccccggc caccagggcc gacgtgacga 15600 aatcgccgtc attccctctg gattgttcgc tgctcggcgg ggcagtgcgc cgcgccggcg 15660 gcgtcgtgga tggctcgggt tggctggcct gcgacggccg gcgaaaggtg cgcagcagct 15720 cgttatcgac cggctgcggc gtcggggccg ccgccttgcg ctgcggtcgg tgttccttct 15780 tcggctcgcg cagcttgaac agcatgatcg cggaaaccag cagcaacgcc gcgcctacgc 15840 ctcccgcgat gtagaacagc atcggattca ttcttcggtc ctccttgtag cggaaccgtt 15900 gtctgtgcgg cgcgggtggc ccgcgccgct gtctttgggg atcagccctc gatgagcgcg 15960 accagtttca cgtcggcaag gttcgcctcg aactcctggc cgtcgtcctc gtacttcaac 16020 caggcatagc cttccgccgg cggccgacgg ttgaggataa ggcgggcagg gcgctcgtcg 16080 tgctcgacct ggacgatggc ctttttcagc ttgtccgggt ccggctcctt cgcgcccttt 16140 tccttggcgt ccttaccgtc ctggtcgccg tcctcgccgt cctggccgtc gccggcctcc 16200 gcgtcacgct cggcatcagt ctggccgttg aaggcatcga cggtgttggg atcgcggccc 16260 ttctcgtcca ggaactcgcg cagcagcttg accgtgccgc gcgtgatttc ctgggtgtcg 16320 tcgtcaagcc acgcctcgac ttcctccggg cgcttcttga aggccgtcac cagctcgttc 16380 accacggtca cgtcgcgcac gcggccggtg ttgaacgcat cggcgatctt ctccggcagg 16440 tccagcagcg tgacgtgctg ggtgatgaac gccggcgact tgccgatttc cttggcgata 16500 tcgcctttct tcttgccctt cgccagctcg cggccaatga agtcggcaat ttcgcgcggg 16560 gtcagctcgt tgcgttgcag gttctcgata acctggtcgg cttcgttgta gtcgttgtcg 16620 atgaacgccg ggatggactt cttgccggcc cacttcgagc cacggtagcg gcgggcgccg 16680 tgattgatga tatagcggcc cggctgctcc tggttctcgc gcaccgaaat gggtgacttc 16740 accccgcgct ctttgatcgt ggcaccgatt tccgcgatgc tctccgggga aaagccgggg 16800 ttgtcggccg tccgcggctg atgcggatct tcgtcgatca ggtccaggtc cagctcgata 16860 gggccggaac cgccctgaga cgccgcagga gcgtccagga ggctcgacag gtcgccgatg 16920 ctatccaacc ccaggccgga cggctgcgcc gcgcctgcgg cttcctgagc ggccgcagcg 16980 gtgtttttct tggtggtctt ggcttgagcc gcagtcattg ggaaatctcc atcttcgtga 17040 acacgtaatc agccagggcg cgaacctctt tcgatgcctt gcgcgcggcc gttttcttga 17100 tcttccagac cggcacaccg gatgcgaggg catcggcgat gctgctgcgc aggccaacgg 17160 tggccggaat catcatcttg gggtacgcgg ccagcagctc ggcttggtgg cgcgcgtggc 17220 gcggattccg cgcatcgacc ttgctgggca ccatgccaag gaattgcagc ttggcgttct 17280 tctggcgcac gttcgcaatg gtcgtgacca tcttcttgat gccctggatg ctgtacgcct 17340 caagctcgat gggggacagc acatagtcgg ccgcgaagag ggcggccgcc aggccgacgc 17400 caagggtcgg ggccgtgtcg atcaggcaca cgtcgaagcc ttggttcgcc agggccttga 17460 tgttcgcccc gaacagctcg cgggcgtcgt ccagcgacag ccgttcggcg ttcgccagta 17520 ccgggttgga ctcgatgagg gcgaggcgcg cggcctggcc gtcgccggct gcgggtgcgg 17580 tttcggtcca gccgccggca gggacagcgc cgaacagctt gcttgcatgc aggccggtag 17640 caaagtcctt gagcgtgtag gacgcattgc cctgggggtc caggtcgatc acggcaaccc 17700 gcaagccgcg ctcgaaaaag tcgaaggcaa gatgcacaag ggtcgaagtc ttgccgacgc 17760 cgcctttctg gttggccgtg accaaagttt tcatcgtttg gtttcctgtt ttttcttggc 17820 gtccgcttcc cacttccgga cgatgtacgc ctgatgttcc ggcagaaccg ccgttacccg 17880 cgcgtacccc tcgggcaagt tcttgtcctc gaacgcggcc cacacgcgat gcaccgcttg 17940 cgacactgcg cccctggtca gtcccagcga cgttgcgaac gtcgcctgtg gcttcccatc 18000 gactaagacg ccccgcgcta tctcgatggt ctgctgcccc acttccagcc cctggatcgc 18060 ctcctggaac tggctttcgg taagccgttt cttcatggat aacacccata atttgctccg 18120 cgccttggtt gaacatagcg gtgacagccg ccagcacatg agagaagttt agctaaacat 18180 ttctcgcacg tcaacacctt tagccgctaa aactcgtcct tggcgtaaca aaacaaaagc 18240 ccggaaaccg ggctttcgtc tcttgccgct tatggctctg cacccggctc catcaccaac 18300 aggtcgcgca cgcgcttcac tcggttgcgg atcgacactg ccagcccaac aaagccggtt 18360 gccgccgccg ccaggatcgc gccgatgatg ccggccacac cggccatcgc ccaccaggtc 18420 gccgccttcc ggttccattc ctgctggtac tgcttcgcaa tgctggacct cggctcacca 18480 taggctgacc gctcgatggc gtatgccgct tctccccttg gcgtaaaacc cagcgccgca 18540 ggcggcattg ccatgctgcc cgccgctttc ccgaccacga cgcgcgcacc aggcttgcgg 18600 tccagacctt cggccacggc gagctgcgca aggacataat cagccgccga cttggctcca 18660 cgcgcctcga tcagctcttg cactcgcgcg aaatccttgg cctccacggc cgccatgaat 18720 cgcgcacgcg gcgaaggctc cgcagggccg gcgtcgtgat cgccgccgag aatgcccttc 18780 accaagttcg acgacacgaa aatcatgctg acggctatca ccatcatgca gacggatcgc 18840 acgaacccgc tgaattgaac acgagcacgg cacccgcgac cactatgcca agaatgccca 18900 aggtaaaaat tgccggcccc gccatgaagt ccgtgaatgc cccgacggcc gaagtgaagg 18960 gcaggccgcc acccaggccg ccgccctcac tgcccggcac ctggtcgctg aatgtcgatg 19020 ccagcacctg cggcacgtca atgcttccgg gcgtcgcgct cgggctgatc gcccatcccg 19080 ttactgcccc gatcccggca atggcaagga ctgccagcgc tgccattttt ggggtgaggc 19140 cgttcgcggc cgaggggcgc agcccctggg gggatgggag gcccgcgtta gcgggccggg 19200 agggttcgag aagggggggc accccccttc ggcgtgcgcg gtcacgcgca cagggcgcag 19260 ccctggttaa aaacaaggtt tataaatatt ggtttaaaag caggttaaaa gacaggttag 19320 cggtggccga aaaacgggcg gaaacccttg caaatgctgg attttctgcc tgtggacagc 19380 ccctcaaatg tcaataggtg cgcccctcat ctgtcagcac tctgcccctc aagtgtcaag 19440 gatcgcgccc ctcatctgtc agtagtcgcg cccctcaagt gtcaataccg cagggcactt 19500 atccccaggc ttgtccacat catctgtggg aaactcgcgt aaaatcaggc gttttcgccg 19560 atttgcgagg ctggccagct ccacgtcgcc ggccgaaatc gagcctgccc ctcatctgtc 19620 aacgccgcgc cgggtgagtc ggcccctcaa gtgtcaacgt ccgcccctca tctgtcagtg 19680 agggccaagt tttccgcgag gtatccacaa cgccggcggc cgcggtgtct cgcacacggc 19740 ttcgacggcg tttctggcgc gtttgcaggg ccatagacgg ccgccagccc agcggcgagg 19800 gcaaccagcc cggtgagcgt cggaaaggcg ctggaagccc cgtagcgacg cggagagggg 19860 cgagacaagc caagggcgca ggctcgatgc gcagcacgac atagccggtt ctcgcaagga 19920 cgagaatttc cctgcggtgc ccctcaagtg tcaatgaaag tttccaacgc gagccattcg 19980 cgagagcctt gagtccacgc tagatgagag ctttgttgta ggtggaccag ttggtgattt 20040 tgaacttttg ctttgccacg gaacggtctg cgttgtcggg aagatgcgtg atctgatcct 20100 tcaactcagc aaaagttcga tttattcaac aaagccacgt tgtgtctcaa aatctctgat 20160 gttacattgc acaagataaa aatatatcat catgaacaat aaaactgtct gcttacataa 20220 acagtaatac aaggggtgtt atgagccata ttcaacggga aacgtcttgc tcgactctag 20280 agctcgttcc tcgaggcctc gaggcctcga ggaacggtac ctgcggggaa gcttacaata 20340 atgtgtgttg ttaagtcttg ttgcctgtca tcgtctgact gactttcgtc ataaatcccg 20400 gcctccgtaa cccagctttg ggcaagctca cggatttgat ccggcggaac gggaatatcg 20460 agatgccggg ctgaacgctg cagttccagc tttccctttc gggacaggta ctccagctga 20520 ttgattatct gctgaagggt cttggttcca cctcctggca caatgcgaat gattacttga 20580 gcgcgatcgg gcatccaatt ttctcccgtc aggtgcgtgg tcaagtgcta caaggcacct 20640 ttcagtaacg agcgaccgtc gatccgtcgc cgggatacgg acaaaatgga gcgcagtagt 20700 ccatcgaggg cggcgaaagc ctcgccaaaa gcaatacgtt catctcgcac agcctccaga 20760 tccgatcgag ggtcttcggc gtaggcagat agaagcatgg atacattgct tgagagtatt 20820 ccgatggact gaagtatggc ttccatcttt tctcgtgtgt ctgcatctat ttcgagaaag 20880 cccccgatgc ggcgcaccgc aacgcgaatt gccatactat ccgaaagtcc cagcaggcgc 20940 gcttgatagg aaaaggtttc atactcggcc gatcgcagac gggcactcac gaccttgaac 21000 ccttcaactt tcagggatcg atgctggttg atggtagtct cactcgacgt ggctctggtg 21060 tgttttgaca tagcttcctc caaagaaagc ggaaggtctg gatactccag cacgaaatgt 21120 gcccgggtag acggatggaa gtctagccct gctcaatatg aaatcaacag tacatttaca 21180 gtcaatactg aatatacttg ctacatttgc aattgtctta taacgaatgt gaaataaaaa 21240 tagtgtaaca acgcttttac tcatcgataa tcacaaaaac atttatacga acaaaaatac 21300 aaatgcactc cggtttcaca ggataggcgg gatcagaata tgcaactttt gacgttttgt 21360 tctttcaaag ggggtgctgg caaaaccacc gcactcatgg gcctttgcgc tgctttggca 21420 aatgacggta aacgagtggc cctctttgat gccgacgaaa accggcctct gacgcgatgg 21480 agagaaaacg ccttacaaag cagtactggg atcctcgctg tgaagtctat tccgccgacg 21540 aaatgcccct tcttgaagca gcctatgaaa atgccgagct cgaaggattt gattatgcgt 21600 tggccgatac gcgtggcggc tcgagcgagc tcaacaacac aatcatcgct agctcaaacc 21660 tgcttctgat ccccaccatg ctaacgccgc tcgacatcga tgaggcacta tctacctacc 21720 gctacgtcat cgagctgctg ttgagtgaaa atttggcaat tcctacagct gttttgcgcc 21780 aacgcgtccc ggtcggccga ttgacaacat cgcaacgcag gatgtcagag acgctagaga 21840 gccttccagt tgtaccgtct cccatgcatg aaagagatgc atttgccgcg atgaaagaac 21900 gcggcatgtt gcatcttaca ttactaaaca cgggaactga tccgacgatg cgcctcatag 21960 agaggaatct tcggattgcg atggaggaag tcgtggtcat ttcgaaactg atcagcaaaa 22020 tcttggaggc ttgaagatgg caattcgcaa gcccgcattg tcggtcggcg aagcacggcg 22080 gcttgctggt gctcgacccg agatccacca tcccaacccg acacttgttc cccagaagct 22140 ggacctccag cacttgcctg aaaaagccga cgagaaagac cagcaacgtg agcctctcgt 22200 cgccgatcac atttacagtc ccgatcgaca acttaagcta actgtggatg cccttagtcc 22260 acctccgtcc ccgaaaaagc tccaggtttt tctttcagcg cgaccgcccg cgcctcaagt 22320 gtcgaaaaca tatgacaacc tcgttcggca atacagtccc tcgaagtcgc tacaaatgat 22380 tttaaggcgc gcgttggacg atttcgaaag catgctggca gatggatcat ttcgcgtggc 22440 cccgaaaagt tatccgatcc cttcaactac agaaaaatcc gttctcgttc agacctcacg 22500 catgttcccg gttgcgttgc tcgaggtcgc tcgaagtcat tttgatccgt tggggttgga 22560 gaccgctcga gctttcggcc acaagctggc taccgccgcg ctcgcgtcat tctttgctgg 22620 agagaagcca tcgagcaatt ggtgaagagg gacctatcgg aacccctcac caaatattga 22680 gtgtaggttt gaggccgctg gccgcgtcct cagtcacctt ttgagccaga taattaagag 22740 ccaaatgcaa ttggctcagg ctgccatcgt ccccccgtgc gaaacctgca cgtccgcgtc 22800 aaagaaataa ccggcacctc ttgctgtttt tatcagttga gggcttgacg gatccgcctc 22860 aagtttgcgg cgcagccgca aaatgagaac atctatactc ctgtcgtaaa cctcctcgtc 22920 gcgtactcga ctggcaatga gaagttgctc gcgcgataga acgtcgcggg gtttctctaa 22980 aaacgcgagg agaagattga actcacctgc cgtaagtttc acctcaccgc cagcttcgga 23040 catcaagcga cgttgcctga gattaagtgt ccagtcagta aaacaaaaag accgtcggtc 23100 tttggagcgg acaacgttgg ggcgcacgcg caaggcaacc cgaatgcgtg caagaaactc 23160 tctcgtacta aacggcttag cgataaaatc acttgctcct agctcgagtg caacaacttt 23220 atccgtctcc tcaaggcggt cgccactgat aattatgatt ggaatatcag actttgccgc 23280 cagatttcga acgatctcaa gcccatcttc acgacctaaa tttagatcaa caaccacgac 23340 atcgaccgtc gcggaagaga gtactctagt gaactgggtg ctgtcggcta ccgcggtcac 23400 tttgaaggcg tggatcgtaa ggtattcgat aataagatgc cgcatagcga catcgtcatc 23460 gataagaaga acgtgtttca acggctcacc tttcaatcta aaatctgaac ccttgttcac 23520 agcgcttgag aaattttcac gtgaaggatg tacaatcatc tccagctaaa tgggcagttc 23580 gtcagaattg cggctgaccg cggatgacga aaatgcgaac caagtatttc aattttatga 23640 caaaagttct caatcgttgt tacaagtgaa acgcttcgag gttacagcta ctattgatta 23700 aggagatcgc ctatggtctc gccccggcgt cgtgcgtccg ccgcgagcca gatctcgcct 23760 acttcataaa cgtcctcata ggcacggaat ggaatgatga catcgatcgc cgtagagagc 23820 atgtcaatca gtgtgcgatc ttccaagcta gcaccttggg cgctactttt gacaagggaa 23880 aacagtttct tgaatccttg gattggattc gcgccgtgta ttgttgaaat cgatcccgga 23940 tgtcccgaga cgacttcact cagataagcc catgctgcat cgtcgcgcat ctcgccaagc 24000 aatatccggt ccggccgcat acgcagactt gcttggagca agtgctcggc gctcacagca 24060 cccagcccag caccgttctt ggagtagagt agtctaacat gattatcgtg tggaatgacg 24120 agttcgagcg tatcttctat ggtgattagc ctttcctggg gggggatggc gctgatcaag 24180 gtcttgctca ttgttgtctt gccgcttccg gtagggccac atagcaacat cgtcagtcgg 24240 ctgacgacgc atgcgtgcag aaacgcttcc aaatccccgt tgtcaaaatg ctgaaggata 24300 gcttcatcat cctgattttg gcgtttcctt cgtgtctgcc actggttcca cctcgaagca 24360 tcataacggg aggagacttc tttaagacca gaaacacgcg agcttggccg tcgaatggtc 24420 aagctgacgg tgcccgaggg aacggtcggc ggcagacaga tttgtagtcg ttcaccacca 24480 ggaagttcag tggcgcagag ggggttacgt ggtccgacat cctgctttct cagcgcgccc 24540 gctaaaatag cgatatcttc aagatcatca taagagacgg gcaaaggcat cttggtaaaa 24600 atgccggctt ggcgcacaaa tgcctctcca ggtcgattga tcgcaatttc ttcagtcttc 24660 gggtcatcga gccattccaa aatcggcttc agaagaaagc gtagttgcgg atccacttcc 24720 atttacaatg tatcctatct ctaagcggaa atttgaattc attaagagcg gcggttcctc 24780 ccccgcgtgg cgccgccagt caggcggagc tggtaaacac caaagaaatc gaggtcccgt 24840 gctacgaaaa tggaaacggt gtcaccctga ttcttcttca gggttggcgg tatgttgatg 24900 gttgccttaa gggctgtctc agttgtctgc tcaccgttat tttgaaagct gttgaagctc 24960 atcccgccac ccgagctgcc ggcgtaggtg ctagctgcct ggaaggcgcc ttgaacaaca 25020 ctcaagagca tagctccgct aaaacgctgc cagaagtggc tgtcgaccga gcccggcaat 25080 cctgagcgac cgagttcgtc cgcgcttggc gatgttaacg agatcatcgc atggtcaggt 25140 gtctcggcgc gatcccacaa cacaaaaacg cgcccatctc cctgttgcaa gccacgctgt 25200 atttcgccaa caacggtggt gccacgatca agaagcacga tattgttcgt tgttccacga 25260 atatcctgag gcaagacaca ctttacatag cctgccaaat ttgtgtcgat tgcggtttgc 25320 aagatgcacg gaattattgt cccttgcgtt accataaaat cggggtgcgg caagagcgtg 25380 gcgctgctgg gctgcagctc ggtgggtttc atacgtatcg acaaatcgtt ctcgccggac 25440 acttcgccat tcggcaagga gttgtcgtca cgcttgcctt cttgtcttcg gcccgtgtcg 25500 ccctgaatgg cgcgtttgct gaccccttga tcgccgctgc tatatgcaaa aatcggtgtt 25560 tcttccggcc gtggctcatg ccgctccggt tcgcccctcg gcggtagagg agcagcaggc 25620 tgaacagcct cttgaaccgc tggaggatcc ggcggcacct caatcggagc tggatgaaat 25680 ggcttggtgt ttgttgcgat caaagttgac ggcgatgcgt tctcattcac cttcttttgg 25740 cgcccaccta gccaaatgag gcttaatgat aacgcgagaa cgacacctcc gacgatcaat 25800 ttctgagacc ccgaaagacg ccggcgatgt ttgtcggaga ccagggatcc agatgcatca 25860 acctcatgtg ccgcttgctg actatcgtta ttcatccctt cgcccccttc aggacgcgtt 25920 tcacatcggg cctcaccgtg cccgtttgcg gcctttggcc aacgggatcg taagcggtgt 25980 tccagataca tagtactgtg tggccatccc tcagacgcca acctcgggaa accgaagaaa 26040 tctcgacatc gctcccttta actgaatagt tggcaacagc ttccttgcca tcaggattga 26100 tggtgtagat ggagggtatg cgtacattgc ccggaaagtg gaataccgtc gtaaatccat 26160 tgtcgaagac ttcgagtggc aacagcgaac gatcgccttg ggcgacgtag tgccaattac 26220 tgtccgccgc accaagggct gtgacaggct gatccaataa attctcagct ttccgttgat 26280 attgtgcttc cgcgtgtagt ctgtccacaa cagccttctg ttgtgcctcc cttcgccgag 26340 ccgccgcatc gtcggcgggg taggcgaatt ggacgctgta atagagatcg ggctgctctt 26400 tatcgaggtg ggacagagtc ttggaactta tactgaaaac ataacggcgc atcccggagt 26460 cgcttgcggt tagcacgatt actggctgag gcgtgaggac ctggcttgcc ttgaaaaata 26520 gataatttcc ccgcggtagg gctgctagat ctttgctatt tgaaacggca accgctgtca 26580 ccgtttcgtt cgtggcgaat gttacgacca aagtagctcc aaccgccgtc gagaggcgca 26640 ccacttgatc gggattgtaa gccaaataac gcatgcgcgg atctagcttg cccgccattg 26700 gagtgtcttc agcctccgca ccagtcgcag cggcaaataa acatgctaaa atgaaaagtg 26760 cttttctgat catggttcgc tgtggcctac gtttgaaacg gtatcttccg atgtctgata 26820 ggaggtgaca accagacctg ccgggttggt tagtctcaat ctgccgggca agctggtcac 26880 cttttcgtag cgaactgtcg cggtccacgt actcaccaca ggcattttgc cgtcaacgac 26940 gagggtcctt ttatagcgaa tttgctgcgt gcttggagtt acatcatttg aagcgatgtg 27000 ctcgacctcc accctgccgc gtttgccaag aatgacttga ggcgaactgg gattgggata 27060 gttgaagaat tgctggtaat cctggcgcac tgttggggca ctgaagttcg ataccaggtc 27120 gtaggcgtac tgagcggtgt cggcatcata actctcgcgc aggcgaacgt actcccacaa 27180 tgaggcgtta acgacggcct cctcttgagt tgcaggcaat cgcgagacag acacctcgct 27240 gtcaacggtg ccgtccggcc gtatccatag atatacgggc acaagcctgc tcaacggcac 27300 cattgtggct atagcgaacg cttgagcaac atttcccaaa atcgcgatag ctgcgacagc 27360 tgcaatgagt ttggagagac gtcgcgccga tttcgctcgc gcggtttgaa aggcttctac 27420 ttccttatag tgctcggcaa ggctttcgcg cgccactagc atggcatatt caggccccgt 27480 catagcgtcc acccgaattg ccgagctgaa gatctgacgg agtaggctgc catcgcccca 27540 cattcagcgg gaagatcggg cctttgcagc tcgctaatgt gtcgtttgtc tggcagccgc 27600 tcaaagcgac aactaggcac agcaggcaat acttcataga attctccatt gaggcgaatt 27660 tttgcgcgac ctagcctcgc tcaacctgag cgaagcgacg gtacaagctg ctggcagatt 27720 gggttgcgcc gctccagtaa ctgcctccaa tgttgccggc gatcgccggc aaagcgacaa 27780 tgagcgcatc ccctgtcaga aaaaacatat cgagttcgta aagaccaatg atcttggccg 27840 cggtcgtacc ggcgaaggtg attacaccaa gcataagggt gagcgcagtc gcttcggtta 27900 ggatgacgat cgttgccacg aggtttaaga ggagaagcaa gagaccgtag gtgataagtt 27960 gcccgatcca cttagctgcg atgtcccgcg tgcgatcaaa aatatatccg acgaggatca 28020 gaggcccgat cgcgagaagc actttcgtga gaattccaac ggcgtcgtaa actccgaagg 28080 cagaccagag cgtgccgtaa aggacccact gtgccccttg gaaagcaagg atgtcctggt 28140 cgttcatcgg accgatttcg gatgcgattt tctgaaaaac ggcctgggtc acggcgaaca 28200 ttgtatccaa ctgtgccgga acagtctgca gaggcaagcc ggttacacta aactgctgaa 28260 caaagtttgg gaccgtcttt tcgaagatgg aaaccacata gtcttggtag ttagcctgcc 28320 caacaattag agcaacaacg atggtgaccg tgatcacccg agtgataccg ctacgggtat 28380 cgacttcgcc gcgtatgact aaaataccct gaacaataat ccaaagagtg acacaggcga 28440 tcaatggcgc actcaccgcc tcctggatag tctcaagcat cgagtccaag cctgtcgtga 28500 aggctacatc gaagatcgta tgaatggccg taaacggcgc cggaatcgtg aaattcatcg 28560 attggacctg aacttgactg gtttgtcgca taatgttgga taaaatgagc tcgcattcgg 28620 cgaggatgcg ggcggatgaa caaatcgccc agccttaggg gagggcacca aagatgacag 28680 cggtcttttg atgctccttg cgttgagcgg ccgcctcttc cgcctcgtga aggccggcct 28740 gcgcggtagt catcgttaat aggcttgtcg cctgtacatt ttgaatcatt gcgtcatgga 28800 tctgcttgag aagcaaacca ttggtcacgg ttgcctgcat gatattgcga gatcgggaaa 28860 gctgagcaga cgtatcagca ttcgccgtca agcgtttgtc catcgtttcc agattgtcag 28920 ccgcaatgcc agcgctgttt gcggaaccgg tgatctgcga tcgcaacagg tccgcttcag 28980 catcactacc cacgactgca cgatctgtat cgctggtgat cgcacgtgcc gtggtcgaca 29040 ttggcattcg cggcgaaaac atttcattgt ctaggtcctt cgtcgaagga tactgatttt 29100 tctggttgag cgaagtcagt agtccagtaa cgccgtaggc cgacgtcaac atcgtaacca 29160 tcgctatagt ctgagtgaga ttctccgcag tcgcgagcgc agtcgcgagc gtctcagcct 29220 ccgttgccgg gtcgctaaca acaaactgcg cccgcgcggg ctgaatatat agaaagctgc 29280 aggtcaaaac tgttgcaata agttgcgtcg tcttcatcgt ttcctacctt atcaatcttc 29340 tgcctcgtgg tgacgggcca tgaattcgct gagccagcca gatgagttgc cttcttgtgc 29400 ctcgcgtagt cgagttgcaa agcgcaccgt gttggcacgc cccgaaagca cggcgacata 29460 ttcacgcata tcccgcagat caaattcgca gatgacgctt ccactttctc gtttaagaag 29520 aaacttacgg ctgccgaccg tcatgtcttc acggatcgcc tgaaattcct tttcggtaca 29580 tttcagtcca tcgacataag ccgatcgatc tgcggttggt gatggataga aaatcttcgt 29640 catacattgc gcaaccaagc tggctcctag cggcgattcc agaacatgct ctggttgctg 29700 cgttgccagt attagcatcc cgttgttttt tcgaacggtc aggaggaatt tgtcgacgac 29760 agtcgaaaat ttagggttta acaaataggc gcgaaactca tcgcagctca tcacaaaacg 29820 gcggccgtcg atcatggctc caatccgatg caggagatat gctgcagcgg gagcgcatac 29880 ttcctcgtat tcgagaagat gcgtcatgtc gaagccggta atcgacggat ctaactttac 29940 ttcgtcaact tcgccgtcaa atgcccagcc aagcgcatgg ccccggcacc agcgttggag 30000 ccgcgctcct gcgccttcgg cgggcccatg caacaaaaat tcacgtaacc ccgcgattga 30060 acgcatttgt ggatcaaacg agagctgacg atggatacca cggaccagac ggcggttctc 30120 ttccggagaa atcccacccc gaccatcact ctcgatgaga gccacgatcc attcgcgcag 30180 aaaatcgtgt gaggctgctg tgttttctag gccacgcaac ggcgccaacc cgctgggtgt 30240 gcctctgtga agtgccaaat atgttcctcc tgtggcgcga accagcaatt cgccaccccg 30300 gtccttgtca aagaacacga ccgtacctgc acggtcgacc atgctctgtt cgagcatggc 30360 tagaacaaac atcatgagcg tcgtcttacc cctcccgata ggcccgaata ttgccgtcat 30420 gccaacatcg tgctcatgcg ggatatagtc gaaaggcgtt ccgccattgg tacgaaatcg 30480 ggcaatcgcg ttgccccagt ggcctgagct ggcgccctct ggaaagtttt cgaaagagac 30540 aaaccctgcg aaattgcgtg aagtgattgc gccagggcgt gtgcgccact taaaattccc 30600 cggcaattgg gaccaatagg ccgcttccat accaatacct tcttggacaa ccacggcacc 30660 tgcatccgcc attcgtgtcc gagcccgcgc gcccctgtcc ccaagactat tgagatcgtc 30720 tgcatagacg caaaggctca aatgatgtga gcccataacg aattcgttgc tcgcaagtgc 30780 gtcctcagcc tcggataatt tgccgatttg agtcacggct ttatcgccgg aactcagcat 30840 ctggctcgat ttgaggctaa gtttcgcgtg cgcttgcggg cgagtcagga acgaaaaact 30900 ctgcgtgaga acaagtggaa aatcgaggga tagcagcgcg ttgagcatgc ccggccgtgt 30960 ttttgcaggg tattcgcgaa acgaatagat ggatccaacg taactgtctt ttggcgttct 31020 gatctcgagt cctcgcttgc cgcaaatgac tctgtcggta taaatcgaag cgccgagtga 31080 gccgctgacg accggaaccg gtgtgaaccg accagtcatg atcaaccgta gcgcttcgcc 31140 aatttcggtg aagagcacac cctgcttctc gcggatgcca agacgatgca ggccatacgc 31200 tttaagagag ccagcgacaa catgccaaag atcttccatg ttcctgatct ggcccgtgag 31260 atcgttttcc ctttttccgc ttagcttggt gaacctcctc tttaccttcc ctaaagccgc 31320 ctgtgggtag acaatcaacg taaggaagtg ttcattgcgg aggagttggc cggagagcac 31380 gcgctgttca aaagcttcgt tcaggctagc ggcgaaaaca ctacggaagt gtcgcggcgc 31440 cgatgatggc acgtcggcat gacgtacgag gtgagcatat attgacacat gatcatcagc 31500 gatattgcgc aacagcgtgt tgaacgcacg acaacgcgca ttgcgcattt cagtttcctc 31560 aagctcgaat gcaacgccat caattctcgc aatggtcatg atcgatccgt cttcaagaag 31620 gacgatatgg tcgctgaggt ggccaatata agggagatag atctcaccgg atctttcggt 31680 cgttccactc gcgccgagca tcacaccatt cctctccctc gtgggggaac cctaattgga 31740 tttgggctaa cagtagcgcc cccccaaact gcactatcaa tgcttcttcc cgcggtccgc 31800 aaaaatagca ggacgacgct cgccgcattg tagtctcgct ccacgatgag ccgggctgca 31860 aaccataacg gcacgagaac gacttcgtag agcgggttct gaacgataac gatgacaaag 31920 ccggcgaaca tcatgaataa ccctgccaat gtcagtggca ccccaagaaa caatgcgggc 31980 cgtgtggctg cgaggtaaag ggtcgattct tccaaacgat cagccatcaa ctaccgccag 32040 tgagcgtttg gccgaggaag ctcgccccaa acatgataac aatgccgccg acgacgccgg 32100 caaccagccc aagcgaagcc cgcccgaaca tccaggagat cccgatagcg acaatgccga 32160 gaacagcgag tgactggccg aacggaccaa ggataaacgt gcatatattg ttaaccattg 32220 tggcggggtc agtgccgcca cccgcagatt gcgctgcggc gggtccggat gaggaaatgc 32280 tccatgcaat tgcaccgcac aagcttgggg cgcagctcga tatcacgcgc atcatcgcat 32340 tcgagagcga gaggcgattt agatgtaaac ggtatctctc aaagcatcgc atcaatgcgc 32400 acctccttag tataagtcga ataagacttg attgtcgtct gcggatttgc cgttgtcctg 32460 gtgtggcggt ggcggagcga ttaaaccgcc agcgccatcc tcctgcgagc ggcgctgata 32520 tgacccccaa acatcccacg tctcttcgga ttttagcgcc tcgtgatcgt cttttggagg 32580 ctcgattaac gcgggcacca gcgattgagc agctgtttca acttttcgca cgtagccgtt 32640 tgcaaaaccg ccgatgaaat taccggtgtt gtaagcggag atcgcccgac gaagcgcaaa 32700 ttgcttctcg tcaatcgttt cgccgcctgc ataacgactt ttcagcatgt ttgcagcggc 32760 agataatgat gtgcacgcct ggagcgcacc gtcaggtgtc agaccgagca tagaaaaatt 32820 tcgagagttt atttgcatga ggccaacatc cagcgaatgc cgtgcatcga gacggtgcct 32880 gacgacttgg gttgcttggc tgtgatcttg ccagtgaagc gtttcgccgg tcgtgttgtc 32940 atgaatcgct aaaggatcaa agcgactctc caccttagct atcgccgcaa gcgtagatgt 33000 cgcaactgat ggggcacact tgcgagcaac atggtcaaac tcagcagatg agagtggcgt 33060 ggcaaggctc gacgaacaga aggagaccat caaggcaaga gaaagcgacc ccgatctctt 33120 aagcatacct tatctcctta gctcgcaact aacaccgcct ctcccgttgg aagaagtgcg 33180 ttgttttatg ttgaagatta tcgggagggt cggttactcg aaaattttca attgcttctt 33240 tatgatttca attgaagcga gaaacctcgc ccggcgtctt ggaacgcaac atggaccgag 33300 aaccgcgcat ccatgactaa gcaaccggat cgacctattc aggccgcagt tggtcaggtc 33360 aggctcagaa cgaaaatgct cggcgaggtt acgctgtctg taaacccatt cgatgaacgg 33420 gaagcttcct tccgattgct cttggcagga atattggccc atgcctgctt gcgctttgca 33480 aatgctctta tcgcgttggt atcatatgcc ttgtccgcca gcagaaacgc actctaagcg 33540 attatttgta aaaatgtttc ggtcatgcgg cggtcatggg cttgacccgc tgtcagcgca 33600 agacggatcg gtcaaccgtc ggcatcgaca acagcgtgaa tcttggtggt caaaccgcca 33660 cgggaacgtc ccatacagcc atcgtcttga tcccgctgtt tcccgtcgcc gcatgttggt 33720 ggacgcggac acaggaactg tcaatcatga cgacattcta tcgaaagcct tggaaatcac 33780 actcagaata tgatcccaga cgtctgcctc acgccatcgt acaaagcgat tgtagcaggt 33840 tgtacaggaa ccgtatcgat caggaacgtc tgcccagggc gggcccgtcc ggaagcgcca 33900 caagatgaca ttgatcaccc gcgtcaacgc gcggcacgcg acgcggctta tttgggaaca 33960 aaggactgaa caacagtcca ttcgaaatcg gtgacatcaa agcggggacg ggttatcagt 34020 ggcctccaag tcaagcctca atgaatcaaa atcagaccga tttgcaaacc tgatttatga 34080 gtgtgcggcc taaatgatga aatcgtcctt ctagatcgcc tccgtggtgt agcaacacct 34140 cgcagtatcg ccgtgctgac cttggccagg gaattgactg gcaagggtgc tttcacatga 34200 ccgctctttt ggccgcgata gatgatttcg ttgctgcttt gggcacgtag aaggagagaa 34260 gtcatatcgg agaaattcct cctggcgcga gagcctgctc tatcgcgacg gcatcccact 34320 gtcgggaaca gaccggatca ttcacgaggc gaaagtcgtc aacacatgcg ttataggcat 34380 cttcccttga aggatgatct tgttgctgcc aatctggagg tgcggcagcc gcaggcagat 34440 gcgatctcag cgcaacttgc ggcaaaacat ctcactcacc tgaaaaccac tagcgagtct 34500 cgcgatcaga cgaaggcctt ttacttaacg acacaatatc cgatgtctgc atcacaggcg 34560 tcgctatccc agtcaatact aaagcggtgc aggaactaaa gattactgat gacttaggcg 34620 tgccacgagg cctgagacga cgcgcgtaga cagttttttg aaatcattat caaagtgatg 34680 gcctccgctg aagcctatca cctctgcgcc ggtctgtcgg agagatgggc aagcattatt 34740 acggtcttcg cgcccgtaca tgcattggac gattgcaggg tcaatggatc tgagatcatc 34800 cagaggattg ccgcccttac cttccgtttc gagttggagc cagcccctaa atgagacgac 34860 atagtcgact tgatgtgaca atgccaagag agagatttgc ttaacccgat ttttttgctc 34920 aagcgtaagc ctattgaagc ttgccggcat gacgtccgcg ccgaaagaat atcctacaag 34980 taaaacattc tgcacaccga aatgcttggt gtagacatcg attatgtgac caagatcctt 35040 agcagtttcg cttggggacc gctccgacca gaaataccga agtgaactga cgccaatgac 35100 aggaatccct tccgtctgca gataggtacc atcgatagat ctgctgcctc gcgcgtttcg 35160 gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 35220 aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 35280 ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc 35340 ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 35400 cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 35460 ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 35520 cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 35580 gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 35640 tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 35700 ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 35760 atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 35820 gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 35880 tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 35940 cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 36000 cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 36060 tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 36120 cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 36180 cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 36240 gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 36300 gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 36360 gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 36420 ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 36480 atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 36540 agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 36600 ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 36660 tttgcgcaac gttgttgcca ttgctgcagg gggggggggg ggggggttcc attgttcatt 36720 ccacggacaa aaacagagaa aggaaacgac agaggccaaa aagctcgctt tcagcacctg 36780 tcgtttcctt tcttttcaga gggtatttta aataaaaaca ttaagttatg acgaagaaga 36840 acggaaacgc cttaaaccgg aaaattttca taaatagcga aaacccgcga ggtcgccgcc 36900 ccgtaacctg tcggatcacc ggaaaggacc cgtaaagtga taatgattat catctacata 36960 tcacaacgtg cgtggaggcc atcaaaccac gtcaaataat caattatgac gcaggtatcg 37020 tattaattga tctgcatcaa cttaacgtaa aaacaacttc agacaataca aatcagcgac 37080 actgaatacg gggcaacctc atgtcccccc cccccccccc cctgcaggca tcgtggtgtc 37140 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 37200 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 37260 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 37320 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 37380 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 37440 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 37500 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 37560 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 37620 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 37680 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 37740 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 37800 cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 37860 ctttcgtctt caagaattgg tcgacgatct tgctgcgttc ggatattttc gtggagttcc 37920 cgccacagac ccggattgaa ggcgagatcc agcaactcgc gccagatcat cctgtgacgg 37980 aactttggcg cgtgatgact ggccaggacg tcggccgaaa gagcgacaag cagatcacgc 38040 ttttcgacag cgtcggattt gcgatcgagg atttttcggc gctgcgctac gtccgcgacc 38100 gcgttgaggg atcaagccac agcagcccac tcgaccttct agccgaccca gacgagccaa 38160 gggatctttt tggaatgctg ctccgtcgtc aggctttccg acgtttgggt ggttgaacag 38220 aagtcattat cgtacggaat gccaagcact cccgagggga accctgtggt tggcatgcac 38280 atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccgt tattctaata 38340 aacgctcttt tctcttaggt ttacccgcca atatatcctg tcaaacactg atagtttaaa 38400 ctgaaggcgg gaaacgacaa tctgatcatg agcggagaat taagggagtc acgttatgac 38460 ccccgccgat gacgcgggac aagccgtttt acgtttggaa ctgacagaac cgcaacgttg 38520 aaggagccac tcagcccaag ctggtacgat tgtaatacga ctcactatag ggcgaattga 38580 gcgctgttta aacgctcttc aactggaaga gcggttacca gaggccagaa tggccatctc 38640 ggaccgatat cgctatcaac tttgtataga aaagttgggc cgaattcgag ctcggtacgg 38700 ccagaatggc ccggaccggg ttaccgaatt cgagctcggt accctgggat ccgatatcga 38760 tgggccctgg ccgaagcttg catgcctgca gtgcagcgtg acccggtcgt gcccctctct 38820 agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt tttttgtcac 38880 acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta ctctacgaat 38940 aatataatct atagtactac aataatatca gtgttttaga gaatcatata aatgaacagt 39000 tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag ttttatcttt 39060 ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata atacttcatc 39120 cattttatta gtacatccat ttagggttta gggttaatgg tttttataga ctaatttttt 39180 tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa ctctatttta 39240 gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact aaaaattaaa 39300 caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt cgagtagata 39360 atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc 39420 gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct ctggacccct 39480 ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga aattgcgtgg 39540 cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca cggcaccggc 39600 agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata 39660 aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag cgcacacaca 39720 cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt acgccgctcg 39780 tcctcccccc cccccctctc taccttctct agatcggcgt tccggtccat gcatggttag 39840 ggcccggtag ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt 39900 gctgctagcg ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt 39960 gccagtgttt ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga 40020 tttcatgatt ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa 40080 tatatgccgt gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg 40140 atgatgtggt ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc 40200 tggtggattt attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat 40260 tgaagatgat ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac 40320 tgatgcatat acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc 40380 ggtcgttcat tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat 40440 taattttgga actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg 40500 gaaatatcga tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg 40560 atggcatatg cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa 40620 caagtatgtt ttataattat tttgatcttg atatacttgg atgatggcat atgcagcagc 40680 tatatgtgga tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct 40740 tttgtcgatg ctcaccctgt tgtttggtgt tacttctgca ggtcgactct agaggatcca 40800 tggcaccgaa gaagaagcgc aaggtgatgg acaagaagta cagcatcggc ctcgacatcg 40860 gcaccaactc ggtgggctgg gccgtcatca cggacgaata taaggtcccg tcgaagaagt 40920 tcaaggtcct cggcaataca gaccgccaca gcatcaagaa aaacttgatc ggcgccctcc 40980 tgttcgatag cggcgagacc gcggaggcga ccaggctcaa gaggaccgcc aggagacggt 41040 acactaggcg caagaacagg atctgctacc tgcaggagat cttcagcaac gagatggcga 41100 aggtggacga ctccttcttc caccgcctgg aggaatcatt cctggtggag gaggacaaga 41160 agcatgagcg gcacccaatc ttcggcaaca tcgtcgacga ggtaagtttc tgcttctacc 41220 tttgatatat atataataat tatcattaat tagtagtaat ataatatttc aaatattttt 41280 ttcaaaataa aagaatgtag tatatagcaa ttgcttttct gtagtttata agtgtgtata 41340 ttttaattta taacttttct aatatatgac caaaacatgg tgatgtgcag gtggcctacc 41400 acgagaagta cccgacaatc taccacctcc ggaagaaact ggtggacagc acagacaagg 41460 cggacctccg gctcatctac cttgccctcg cgcatatgat caagttccgc ggccacttcc 41520 tcatcgaggg cgacctgaac ccggacaact ccgacgtgga caagctgttc atccagctcg 41580 tgcagacgta caatcaactg ttcgaggaga accccataaa cgctagcggc gtggacgcca 41640 aggccatcct ctcggccagg ctctcgaaat caagaaggct ggagaacctt atcgcgcagt 41700 tgccaggcga aaagaagaac ggcctcttcg gcaaccttat tgcgctcagc ctcggcctga 41760 cgccgaactt caaatcaaac ttcgacctcg cggaggacgc caagctccag ctctcaaagg 41820 acacctacga cgacgacctc gacaacctcc tggcccagat aggagaccag tacgcggacc 41880 tcttcctcgc cgccaagaac ctctccgacg ctatcctgct cagcgacatc cttcgggtca 41940 acaccgaaat taccaaggca ccgctgtccg ccagcatgat taaacgctac gacgagcacc 42000 atcaggacct cacgctgctc aaggcactcg tccgccagca gctccccgag aagtacaagg 42060 agatcttctt cgaccaatca aaaaacggct acgcgggata tatcgacggc ggtgccagcc 42120 aggaagagtt ctacaagttc atcaaaccaa tcctggagaa gatggacggc accgaggagt 42180 tgctggtcaa gctcaacagg gaggacctcc tcaggaagca gaggaccttc gacaacggct 42240 ccatcccgca tcagatccac ctgggcgaac tgcatgccat cctgcggcgc caggaggact 42300 tctacccgtt cctgaaggat aaccgggaga agatcgagaa gatcttgacg ttccgcatcc 42360 catactacgt gggcccgctg gctcgcggca actcccggtt cgcctggatg acccggaagt 42420 cggaggagac catcacaccc tggaactttg aggaggtggt cgataagggc gctagcgctc 42480 agagcttcat cgagcgcatg accaacttcg ataaaaacct gcccaatgaa aaagtcctcc 42540 ccaagcactc gctgctctac gagtacttca ccgtgtacaa cgagctcacc aaggtcaaat 42600 acgtcaccga gggcatgcgg aagccggcgt tcctgagcgg cgagcagaag aaggcgatag 42660 tggacctcct cttcaagacc aacaggaagg tgaccgtgaa gcaattaaaa gaggactact 42720 tcaagaaaat agagtgcttc gactccgtgg agatctcggg cgtggaggat cggttcaacg 42780 cctcactcgg cacgtatcac gacctcctca agatcattaa agacaaggac ttcctcgaca 42840 acgaggagaa cgaggacatc ctcgaggaca tcgtcctcac cctgaccctg ttcgaggacc 42900 gcgaaatgat cgaggagagg ctgaagacct acgcgcacct gttcgacgac aaggtcatga 42960 aacagctcaa gaggcgccgc tacactggtt ggggaaggct gtcccgcaag ctcattaatg 43020 gcatcaggga caagcagagc ggcaagacca tcctggactt cctcaagtcc gacgggttcg 43080 ccaaccgcaa cttcatgcag ctcattcacg acgactcgct cacgttcaag gaagacatcc 43140 agaaggcaca ggtgagcggg cagggtgact ccctccacga acacatcgcc aacctggccg 43200 gctcgccggc cattaaaaag ggcatcctgc agacggtcaa ggtcgtcgac gagctcgtga 43260 aggtgatggg ccggcacaag cccgaaaata tcgtcataga gatggccagg gagaaccaga 43320 ccacccaaaa agggcagaag aactcgcgcg agcggatgaa acggatcgag gagggcatta 43380 aagagctcgg gtcccagatc ctgaaggagc accccgtgga aaatacccag ctccagaatg 43440 aaaagctcta cctctactac ctgcagaacg gccgcgacat gtacgtggac caggagctgg 43500 acattaatcg gctatcggac tacgacgtcg accacatcgt gccgcagtcg ttcctcaagg 43560 acgatagcat cgacaacaag gtgctcaccc ggtcggataa aaatcggggc aagagcgaca 43620 acgtgcccag cgaggaggtc gtgaagaaga tgaaaaacta ctggcgccag ctcctcaacg 43680 cgaaactgat cacccagcgc aagttcgaca acctgacgaa ggcggaacgc ggtggcttga 43740 gcgaactcga taaggcgggc ttcataaaaa ggcagctggt cgagacgcgc cagatcacga 43800 agcatgtcgc ccagatcctg gacagccgca tgaatactaa gtacgatgaa aacgacaagc 43860 tgatccggga ggtgaaggtg atcacgctga agtccaagct cgtgtcggac ttccgcaagg 43920 acttccagtt ctacaaggtc cgcgagatca acaactacca ccacgcccac gacgcctacc 43980 tgaatgcggt ggtcgggacc gccctgatca agaagtaccc gaagctggag tcggagttcg 44040 tgtacggcga ctacaaggtc tacgacgtgc gcaaaatgat cgccaagtcc gagcaggaga 44100 tcggcaaggc cacggcaaaa tacttcttct actcgaacat catgaacttc ttcaagaccg 44160 agatcaccct cgcgaacggc gagatccgca agcgcccgct catcgaaacc aacggcgaga 44220 cgggcgagat cgtctgggat aagggccggg atttcgcgac ggtccgcaag gtgctctcca 44280 tgccgcaagt caatatcgtg aaaaagacgg aggtccagac gggcgggttc agcaaggagt 44340 ccatcctccc gaagcgcaac tccgacaagc tcatcgcgag gaagaaggat tgggacccga 44400 aaaaatatgg cggcttcgac agcccgaccg tcgcatacag cgtcctcgtc gtggcgaagg 44460 tggagaaggg caagtcaaag aagctcaagt ccgtgaagga gctgctcggg atcacgatta 44520 tggagcggtc ctccttcgag aagaacccga tcgacttcct agaggccaag ggatataagg 44580 aggtcaagaa ggacctgatt attaaactgc cgaagtactc gctcttcgag ctggaaaacg 44640 gccgcaagag gatgctcgcc tccgcaggcg agttgcagaa gggcaacgag ctcgccctcc 44700 cgagcaaata cgtcaatttc ctgtacctcg ctagccacta tgaaaagctc aagggcagcc 44760 cggaggacaa cgagcagaag cagctcttcg tggagcagca caagcattac ctggacgaga 44820 tcatcgagca gatcagcgag ttctcgaagc gggtgatcct cgccgacgcg aacctggaca 44880 aggtgctgtc ggcatataac aagcaccgcg acaaaccaat acgcgagcag gccgaaaata 44940 tcatccacct cttcaccctc accaacctcg gcgctccggc agccttcaag tacttcgaca 45000 ccacgattga ccggaagcgg tacacgagca cgaaggaggt gctcgatgcg acgctgatcc 45060 accagagcat cacagggctc tatgaaacac gcatcgacct gagccagctg ggcggagaca 45120 agagaccacg ggaccgccac gatggcgagc tgggaggccg caagcgggca aggtaggtac 45180 cgttaaccta gacttgtcca tcttctggat tggccaactt aattaatgta tgaaataaaa 45240 ggatgcacac atagtgacat gctaatcact ataatgtggg catcaaagtt gtgtgttatg 45300 tgtaattact agttatctga ataaaagaga aagagatcat ccatatttct tatcctaaat 45360 gaatgtcacg tgtctttata attctttgat gaaccagatg catttcatta accaaatcca 45420 tatacatata aatattaatc atatataatt aatatcaatt gggttagcaa aacaaatcta 45480 gtctaggtgt gttttgcgaa tgcggccgcc accgcggtgg agctcgaatt cgagctcggt 45540 accctgggat ccagcttcgc ttagttttta gtttttggca gaaaaaatga tcaatgtttc 45600 acaaaccaaa tatttttata acttttgatg aaagaagatc accacggtca tatctagggg 45660 tggtaacaaa ttgcgatcta aatgtttctt cataaaaaat aaggcttctt aataaatttt 45720 agttcaaaat aaatacgaat aaagtctgat tctaatctga ttcgatcctt aaattttata 45780 atgcaaaatt tagagctcat taccacctct agtcatatgt ctagtctgag gtatatccaa 45840 aaagcccttt ctctaaattc cacacccaac tcagatgttt gcaaataaat actccgactc 45900 caaaatgtag gtgaagtgca actttctcca ttttatatca acatttgtta ttttttgttt 45960 aacatttcac actcaaaact aattaataaa atacgtggtt gttgaacgtg cgcacatgtc 46020 tcccttacat tatgtttttt tatttatgta ttattgttgt tttcctccga acaacttgtc 46080 aacatatcat cattggtctt taatatttat gaatatggaa gcctagttat ttacacttgg 46140 ctacacacta gttgtagttt tgccacttgt ctaacatgca actctagtag ttttgccact 46200 tgcctggcat gcaactctag tattgacact tgtatagcat ataatgccaa tacgacacct 46260 gccttacatg aaacattatt tttgacactt gtataccatg caacattacc attgacattt 46320 gtccatacac attatatcaa atatattgag cgcatgtcac aaactcgata caaagctgga 46380 tgaccctccc tcaccacatc tataaaaacc cgagcgctac tgtaaatcac tcacaacaca 46440 acacatatct tttagtaacc tttcaatagg cgtcccccaa gaactagtaa ccatggccct 46500 gtccaacaag ttcatcggcg acgacatgaa gatgacctac cacatggacg gctgcgtgaa 46560 cggccactac ttcaccgtga agggcgaggg cagcggcaag ccctacgagg gcacccagac 46620 ctccaccttc aaggtgacca tggccaacgg cggccccctg gccttctcct tcgacatcct 46680 gtccaccgtg ttcatgtacg gcaaccgctg cttcaccgcc taccccacca gcatgcccga 46740 ctacttcaag caggccttcc ccgacggcat gtcctacgag agaaccttca cctacgagga 46800 cggcggcgtg gccaccgcca gctgggagat cagcctgaag ggcaactgct tcgagcacaa 46860 gtccaccttc cacggcgtga acttccccgc cgacggcccc gtgatggcca agaagaccac 46920 cggctgggac ccctccttcg agaagatgac cgtgtgcgac ggcatcttga agggcgacgt 46980 gaccgccttc ctgatgctgc agggcggcgg caactacaga tgccagttcc acacctccta 47040 caagaccaag aagcccgtga ccatgccccc caaccacgtg gtggagcacc gcatcgccag 47100 aaccgacctg gacaagggcg gcaacagcgt gcagctgacc gagcacgccg tggcccacat 47160 cacctccgtg gtgcccttct gaagcggccc atggatattc gaacgcgtag gtaccacatg 47220 gttaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag 47280 gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt 47340 gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg 47400 aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat 47460 atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag 47520 tctaggtgtg ttttgcgaat tcccatggac ctcgaggggg ggcccgggca cccagctttc 47580 ttgtacaaag tggccgttaa cggatcggcc agaatggccc ggaccgggtt accgaattcg 47640 agctcggtac cctgggatcg gccgctctag aactagtgga tcccccgggc tgcaggaatt 47700 cccatggagt caaagattca aatagaggac ctaacagaac tcgccgtaaa gactggcgaa 47760 cagttcatac agagtctctt acgactcaat gacaagaaga aaatcttcgt caacatggtg 47820 gagcacgaca cgcttgtcta ctccaaaaat atcaaagata cagtctcaga agaccaaagg 47880 gcaattgaga cttttcaaca aagggtaata tccggaaacc tcctcggatt ccattgccca 47940 gctatctgtc actttattgt gaagatagtg gaaaaggaag gtggctccta caaatgccat 48000 cattgcgata aaggaaaggc catcgttgaa gatgcctctg ccgacagtgg tcccaaagat 48060 ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac gtcttcaaag 48120 caagtggatt gatgtgatat ctccactgac gtaagggatg acgcacaatc ccactaagct 48180 tcggccgggg cccatcgatc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 48240 aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgcca agctcagatc 48300 agcttggggc tggtatcgat aaatgtttcc acatagattt tgcatatcat aatgatgttt 48360 gtcgttccgt atctatgttt catacaaaat ttttacgcat atcgcaacac atgggcacat 48420 acctagtgac tgtataactc tgcatgtatg agtgtatgac tatatgatgt agtaactaat 48480 aagaagggta gacatttgag tgattctttt attcctggac ttgtaagact tgacatttct 48540 gccttgagtg cgatacatca tatggacagg ggttatgcat acactgcttg tttgttgttt 48600 atgttctaag agcatctcca acaacgtgac atatgaaaat gccctacaat ttaaaaatgg 48660 ttatatttta taaaatttag ggcataaata aaacatcccg ctccaacatt aaagccttaa 48720 atctattata gggaagccca ctatgatata gtatatttga ggcactttag agggtgccct 48780 ataatttttt gaccattttt ttatgaaatg agacactatt ggagtatttt ttttccgtag 48840 agcaccatat ttcaatttga gacaccaatt taaggcattg ttggagatgt tctaaatgtt 48900 ggtttatttt gtctgtatcg ttgtggtttt gatagtggtg cctttgcaat gtacatctta 48960 cattgacaat aataataggt aaaactctac aaatttttta tctaatggac tcttgtatga 49020 aacattgtac ttgcacacat ctgatgtaaa cactgcatac ttttaacagt gacaagattc 49080 tgtttcattt tagggctagt ttgggaacca aattttatta gggtttttat tttctaagaa 49140 aaagtaattt attttacctt gagaaaatat aaattacttg agaaaataga gttccaaact 49200 agctcttatc tttgtcgaat cctcctctat tcaaatgtga catttctggc acgtgacaac 49260 tggtgatgtt gtagactgtg ttaagtaata cgtgtcatta ttactaaatg ccattttagt 49320 aaatgttgag tatgtactct actacagtaa gtattattgg tgtatttaca ctagacagtt 49380 ggcggcctgg cgggtaaagt tatcctgtag aaagttgggc caggccaaaa ccaaccgcca 49440 aaggaaaggc cttccggccc gcccaccttt gcgcgccgaa ggtcagttcc ttcagtctcc 49500 tcccgcttca gactctgacc acgtcgacaa tccgggccga aacacatctg caccgtccac 49560 ttgcgacaga ttgaacacac cacttctatc cacgtcagcg atccgtggca ctagcccttc 49620 caccaatcag cccaagttgc ccctttcctt taaattcgcc gcacccattg ctcttctcac 49680 ggccatagaa atcgaccgag cgaatccctc gcatcgcatt cgcagccttt gctgcatcac 49740 accaccgcga aaccccagca gccgcatctg caggtcgact ctagaggatc catggcctcc 49800 tccgaggacg tcatcaagga gttcatgcgc ttcaaggtgc gcatggaggg ctccgtgaac 49860 ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 49920 gccaagctga aggtgaccaa gggcggcccc ctgcccttcg cctgggacat cctgtccccc 49980 cagttccagt acggctccaa ggtgtacgtg aagcaccccg ccgacatccc cgactacaag 50040 aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggc 50100 gtggtgacag tgacccagga ctcctccctg caggacggct ccttcatcta caaggtgaag 50160 ttcatcggcg tgaacttccc ctccgacggc cccgtaatgc agaagaagac tatgggctgg 50220 gaggcctcca ccgagcgcct gtacccccgc gacggcgtgc tgaagggcga gatccacaag 50280 gccctgaagc tgaaggacgg cggccacgct agcccatcca cccactcact cactcatatc 50340 tgtgctgtac gtacgagaat ttctcgacca accgtcgtga gacctgccca ccggagatcg 50400 gacgcaagag ggtttaggca agaatgtcgt gcgacagggt gagcgctgac tagtatacgt 50460 gagagacctt gagatatacc tcacacgtac gcgtacttta catgacgtag gacattacga 50520 ctcaaacaga ttcacgtcag atttcggagt ttctcacgcg tgagagcctt ggagggcggt 50580 atgtatgtca tactatatgt tgggatggag ggagtgagtg agtgatatgt ggctagcaag 50640 ggcggccccc tgcccttcgc ctgggacatc ctgtcccccc agttccagta cggctccaag 50700 gtgtacgtga agcaccccgc cgacatcccc gactacaaga agctgtcctt ccccgagggc 50760 ttcaagtggg agcgcgtgat gaacttcgag gacggcggcg tggtgacagt gacccaggac 50820 tcctccctgc aggacggctc cttcatctac aaggtgaagt tcatcggcgt gaacttcccc 50880 tccgacggcc ccgtaatgca gaagaagact atgggctggg aggcctccac cgagcgcctg 50940 tacccccgcg acggcgtgct gaagggcgag atccacaagg ccctgaagct gaaggacggc 51000 ggccactacc tggtggagtt caagtccatc tacatggcca agaagcccgt gcagctgccc 51060 ggctactact acgtggactc caagctggac atcacctccc acaacgagga ctacaccatc 51120 gtggagcagt acgagcgcgc cgagggccgc caccacctgt tcctgtagtc aggatctgag 51180 tcgaaaccta gacttgtcca tcttctggat tggccaactt aattaatgta tgaaataaaa 51240 ggatgcacac atagtgacat gctaatcact ataatgtggg catcaaagtt gtgtgttatg 51300 tgtaattact agttatctga ataaaagaga aagagatcat ccatatttct tatcctaaat 51360 gaatgtcacg tgtctttata attctttgat gaaccagatg catttcatta accaaatcca 51420 tatacatata aatattaatc atatataatt aatatcaatt gggttagcaa aacaaatcta 51480 gtctaggtgt gttttgcgaa tgcggccgcc accgcggtgg agctcgaatt ccggtccggg 51540 tcacccggtc cgggcctaga aggccagctt gcggccgccc cgggcaactt tattatacaa 51600 agttgataga tatcggtccg agcggcctag aaggcctttg gtcacctttg tccaccaaga 51660 tggaactgcg gccgctcatt aattaagtca ggcgcgcctc tagttgaaga cacgttcatg 51720 tcttcatcgt aagaagacac tcagtagtct tcggccagaa tggcctaact caaggccatc 51780 gtggcctctt gctcttcagg atgaagagct atgtttaaac gtgcaagcgc tactagacaa 51840 ttcagtacat taaaaacgtc cgcaatgtgt tattaagttg tctaagcgtc aatttgttta 51900 caccacaata tatcctgcca ccagccagcc aacagctccc cgaccggcag ctcggcacaa 51960 aatcaccact cgatacaggc agcccatcag tccgggacgg cgtcagcggg agagccgttg 52020 taaggcggca gactttgctc atgttaccga tgctattcgg aagaacggca actaagctgc 52080 cgggtttgaa acacggatga tctcgcggag ggtagcatgt tgattgtaac gatgacagag 52140 cgttgctgcc tgtgatcaaa tatcatctcc ctcgcagaga tccgaattat cagccttctt 52200 attcatttct cgcttaaccg tgacaggctg tcgatcttga gaactatgcc gacataatag 52260 gaaatcgctg gataaagccg ctgaggaagc tgagtggcgc tatttcttta gaagtgaacg 52320 ttgacgatcg tcgaccgtac cccgatgaat taattcggac gtacgttctg aacacagctg 52380 gatacttact tgggcgattg tcatacatga catcaacaat gtacccgttt gtgtaaccgt 52440 ctcttggagg ttcgtatgac actagtggtt cccctcagct tgcgactaga tgttgaggcc 52500 taacatttta ttagagagca ggctagttgc ttagatacat gatcttcagg ccgttatctg 52560 tcagggcaag cgaaaattgg ccatttatga cgaccaatgc cccgcagaag ctcccatctt 52620 tgccgccata gacgccgcgc cccccttttg gggtgtagaa catccttttg ccagatgtgg 52680 aaaagaagtt cgttgtccca ttgttggcaa tgacgtagta gccggcgaaa gtgcgagacc 52740 catttgcgct atatataagc ctacgatttc cgttgcgact attgtcgtaa ttggatgaac 52800 tattatcgta gttgctctca gagttgtcgt aatttgatgg actattgtcg taattgctta 52860 tggagttgtc gtagttgctt ggagaaatgt cgtagttgga tggggagtag tcatagggaa 52920 gacgagcttc atccactaaa acaattggca ggtcagcaag tgcctgcccc gatgccatcg 52980 caagtacgag gcttagaacc accttcaaca gatcgcgcat agtcttcccc agctctctaa 53040 cgcttgagtt aagccgcgcc gcgaagcggc gtcggcttga acgaattgtt agacattatt 53100 tgccgactac cttggtgatc tcgcctttca cgtagtgaac aaattcttcc aactgatctg 53160 cgcgcgaggc caagcgatct tcttgtccaa gataagcctg cctagcttca agtatgacgg 53220 gctgatactg ggccggcagg cgctccattg cccagtcggc agcgacatcc ttcggcgcga 53280 ttttgccggt tactgcgctg taccaaatgc gggacaacgt aagcactaca tttcgctcat 53340 cgccagccca gtcgggcggc gagttccata gcgttaaggt ttcatttagc gcctcaaata 53400 gatcctgttc aggaaccgga tcaaagagtt cctccgccgc tggacctacc aaggcaacgc 53460 tatgttctct tgcttttgtc agcaagatag ccagatcaat gtcgatcgtg gctggctcga 53520 agatacctgc aagaatgtca ttgcgctgcc attctccaaa ttgcagttcg cgcttagctg 53580 gataacgcca cggaatgatg tcgtcgtgca caacaatggt gacttctaca gcgcggagaa 53640 tctcgctctc tccaggggaa gccgaagttt ccaaaaggtc gttgatcaaa gctcgccgcg 53700 ttgtttcatc aagccttaca gtcaccgtaa ccagcaaatc aatatcactg tgtggcttca 53760 ggccgccatc cactgcggag ccgtacaaat gtacggccag caacgtcggt tcgagatggc 53820 gctcgatgac gccaactacc tctgatagtt gagtcgatac ttcggcgatc accgcttccc 53880 tcatgatgtt taactcctga attaagccgc gccgcgaagc ggtgtcggct tgaatgaatt 53940 gttaggcgtc atcctgtgct cccgagaacc agtaccagta catcgctgtt tcgttcgaga 54000 cttgaggtct agttttatac gtgaacaggt caatgccgcc gagagtaaag ccacattttg 54060 cgtacaaatt gcaggcaggt acattgttcg tttgtgtctc taatcgtatg ccaaggagct 54120 gtctgcttag tgcccacttt ttcgcaaatt cgatgagact gtgcgcgact cctttgcctc 54180 ggtgcgtgtg cgacacaaca atgtgttcga tagaggctag atcgttccat gttgagttga 54240 gttcaatctt cccgacaagc tcttggtcga tgaatgcgcc atagcaagca gagtcttcat 54300 cagagtcatc atccgagatg taatccttcc ggtaggggct cacacttctg gtagatagtt 54360 caaagccttg gtcggatagg tgcacatcga acacttcacg aacaatgaaa tggttctcag 54420 catccaatgt ttccgccacc tgctcaggga tcaccgaaat cttcatatga cgcctaacgc 54480 ctggcacagc ggatcgcaaa cctggcgcgg cttttggcac aaaaggcgtg acaggtttgc 54540 gaatccgttg ctgccacttg ttaacccttt tgccagattt ggtaactata atttatgtta 54600 gaggcgaagt cttgggtaaa aactggccta aaattgctgg ggatttcagg aaagtaaaca 54660 tcaccttccg gctcgatgtc tattgtagat atatgtagtg tatctacttg atcgggggat 54720 ctgctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 54780 gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 54840 agcgggtgtt ggcgggtgtc ggggcgcagc catgacccag tcacgtagcg atagcggagt 54900 gtatactggc ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg 54960 tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc 55020 tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 55080 aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 55140 aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 55200 ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 55260 acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 55320 ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 55380 tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 55440 tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 55500 gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 55560 agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 55620 tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 55680 agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 55740 tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 55800 acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 55860 tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 55920 agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 55980 tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 56040 acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc 56100 tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 56160 ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 56220 agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctgcagg gggggggggg 56280 gggggggact tccattgttc attccacgga caaaaacaga gaaaggaaac gacagaggcc 56340 aaaaagcctc gctttcagca cctgtcgttt cctttctttt cagagggtat tttaaataaa 56400 aacattaagt tatgacgaag aagaacggaa acgccttaaa ccggaaaatt ttcataaata 56460 gcgaaaaccc gcgaggtcgc cgccccgtaa cct 56493 <210> 47 <211> 55518 <212> DNA <213> Artificial sequence <220> <223> Agrobacterium vector containing maize codon optimized Cas9 and maize MDH promoter <400> 47 gtcggatcac cggaaaggac ccgtaaagtg ataatgatta tcatctacat atcacaacgt 60 gcgtggaggc catcaaacca cgtcaaataa tcaattatga cgcaggtatc gtattaattg 120 atctgcatca acttaacgta aaaacaactt cagacaatac aaatcagcga cactgaatac 180 ggggcaacct catgtccccc cccccccccc ccctgcaggc atcgtggtgt cacgctcgtc 240 gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 300 catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 360 ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 420 atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 480 tatgcggcga ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag 540 cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 600 cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 660 atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 720 aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 780 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 840 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 900 aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 960 tcaagaattg gtcgacgatc ttgctgcgtt cggatatttt cgtggagttc ccgccacaga 1020 cccggattga aggcgagatc cagcaactcg cgccagatca tcctgtgacg gaactttggc 1080 gcgtgatgac tggccaggac gtcggccgaa agagcgacaa gcagatcacg cttttcgaca 1140 gcgtcggatt tgcgatcgag gatttttcgg cgctgcgcta cgtccgcgac cgcgttgagg 1200 gatcaagcca cagcagccca ctcgaccttc tagccgaccc agacgagcca agggatcttt 1260 ttggaatgct gctccgtcgt caggctttcc gacgtttggg tggttgaaca gaagtcatta 1320 tcgtacggaa tgccaagcac tcccgagggg aaccctgtgg ttggcatgca catacaaatg 1380 gacgaacgga taaacctttt cacgcccttt taaatatccg ttattctaat aaacgctctt 1440 ttctcttagg tttacccgcc aatatatcct gtcaaacact gatagtttaa actgaaggcg 1500 ggaaacgaca atctgatcat gagcggagaa ttaagggagt cacgttatga cccccgccga 1560 tgacgcggga caagccgttt tacgtttgga actgacagaa ccgcaacgtt gaaggagcca 1620 ctcagcccaa gctggtacga ttgtaatacg actcactata gggcgaattg agcgctgttt 1680 aaacgctctt caactggaag agcggttacc agaggccaga atggccatct cggaccgata 1740 tcgctatcaa ctttgtatag aaaagttggg ccgaattcga gctcggtacg gccagaatgg 1800 cccggaccgg gttaccgaat tcgagctcgg taccctggga tccgatatcg atgggccctg 1860 gccgaagctt tttggaaggc taaggagagg aagccggcga gaaggagggg gcgttttacg 1920 tgtcactgtc ctgtcgtgtt ggctgttgac acgaatcatt tcttccgcgc gtgggaagaa 1980 gaagatgcac attagcggcc tgaagtagag atgtcaatgg ggaattcccc agcggggatt 2040 aactccccag acccgtaccc atgaacatag accggccccc atccccgaac ccgaacccga 2100 cctcgggtac gaaaatcctc ccatacccat tcccgaccgg gtactaaata cccatgggta 2160 tccatacccg acccgattat tcaaaaatta atgggctttt tatttgttaa ccggcggacg 2220 caatgcttgg gactctaggt ttttttactt tgttgaccgg ctggcggctg ggctttttcc 2280 tacaggccca aagttggtcg gcagccacta ggccacacgt cacaggcagc ccacaagtaa 2340 atgtcgttgg attgctggat ggtggaataa aaatcctaga tgctagattg ttctggttcc 2400 gggtattttt ctccatggct aatcgggttt gggtttagcc ctcccaaacc cgaacccgcc 2460 atacccgatg ggtaagggat ttattccaaa tctataccca tggggatttg ttttaaccca 2520 taccttaacc ctaatagagg aattccccac gggtaatcgg gtttcggggc ccattgacat 2580 ctctagactg aaggcgtcca actcaaatca ttaaaaagtg ttgacgcacg cgctgatgcg 2640 ccggccgcac agcacaggct gcacagcccg tttaatcagc gatggagccc cggccgtcag 2700 ccagccaggt ccggcgtccg ggtctgcgcc ctgcggcgtc actgctgtcg ccaccgtctc 2760 cgatggtccc acatccatcc agcgggccgc gcgtggtaca aaaggctctt cctcgccgtc 2820 aggtgcagct gcccaaacac cagacacaga ctccaccacc ccgcttcgat cttctgttgc 2880 agctgaaatc tgtcagattc tgcagttcat tcctcatggc accgaagaag aagcgcaagg 2940 tgatggacaa gaagtacagc atcggcctcg acatcggcac caactcggtg ggctgggccg 3000 tcatcacgga cgaatataag gtcccgtcga agaagttcaa ggtcctcggc aatacagacc 3060 gccacagcat caagaaaaac ttgatcggcg ccctcctgtt cgatagcggc gagaccgcgg 3120 aggcgaccag gctcaagagg accgccagga gacggtacac taggcgcaag aacaggatct 3180 gctacctgca ggagatcttc agcaacgaga tggcgaaggt ggacgactcc ttcttccacc 3240 gcctggagga atcattcctg gtggaggagg acaagaagca tgagcggcac ccaatcttcg 3300 gcaacatcgt cgacgaggta agtttctgct tctacctttg atatatatat aataattatc 3360 attaattagt agtaatataa tatttcaaat atttttttca aaataaaaga atgtagtata 3420 tagcaattgc ttttctgtag tttataagtg tgtatatttt aatttataac ttttctaata 3480 tatgaccaaa acatggtgat gtgcaggtgg cctaccacga gaagtacccg acaatctacc 3540 acctccggaa gaaactggtg gacagcacag acaaggcgga cctccggctc atctaccttg 3600 ccctcgcgca tatgatcaag ttccgcggcc acttcctcat cgagggcgac ctgaacccgg 3660 acaactccga cgtggacaag ctgttcatcc agctcgtgca gacgtacaat caactgttcg 3720 aggagaaccc cataaacgct agcggcgtgg acgccaaggc catcctctcg gccaggctct 3780 cgaaatcaag aaggctggag aaccttatcg cgcagttgcc aggcgaaaag aagaacggcc 3840 tcttcggcaa ccttattgcg ctcagcctcg gcctgacgcc gaacttcaaa tcaaacttcg 3900 acctcgcgga ggacgccaag ctccagctct caaaggacac ctacgacgac gacctcgaca 3960 acctcctggc ccagatagga gaccagtacg cggacctctt cctcgccgcc aagaacctct 4020 ccgacgctat cctgctcagc gacatccttc gggtcaacac cgaaattacc aaggcaccgc 4080 tgtccgccag catgattaaa cgctacgacg agcaccatca ggacctcacg ctgctcaagg 4140 cactcgtccg ccagcagctc cccgagaagt acaaggagat cttcttcgac caatcaaaaa 4200 acggctacgc gggatatatc gacggcggtg ccagccagga agagttctac aagttcatca 4260 aaccaatcct ggagaagatg gacggcaccg aggagttgct ggtcaagctc aacagggagg 4320 acctcctcag gaagcagagg accttcgaca acggctccat cccgcatcag atccacctgg 4380 gcgaactgca tgccatcctg cggcgccagg aggacttcta cccgttcctg aaggataacc 4440 gggagaagat cgagaagatc ttgacgttcc gcatcccata ctacgtgggc ccgctggctc 4500 gcggcaactc ccggttcgcc tggatgaccc ggaagtcgga ggagaccatc acaccctgga 4560 actttgagga ggtggtcgat aagggcgcta gcgctcagag cttcatcgag cgcatgacca 4620 acttcgataa aaacctgccc aatgaaaaag tcctccccaa gcactcgctg ctctacgagt 4680 acttcaccgt gtacaacgag ctcaccaagg tcaaatacgt caccgagggc atgcggaagc 4740 cggcgttcct gagcggcgag cagaagaagg cgatagtgga cctcctcttc aagaccaaca 4800 ggaaggtgac cgtgaagcaa ttaaaagagg actacttcaa gaaaatagag tgcttcgact 4860 ccgtggagat ctcgggcgtg gaggatcggt tcaacgcctc actcggcacg tatcacgacc 4920 tcctcaagat cattaaagac aaggacttcc tcgacaacga ggagaacgag gacatcctcg 4980 aggacatcgt cctcaccctg accctgttcg aggaccgcga aatgatcgag gagaggctga 5040 agacctacgc gcacctgttc gacgacaagg tcatgaaaca gctcaagagg cgccgctaca 5100 ctggttgggg aaggctgtcc cgcaagctca ttaatggcat cagggacaag cagagcggca 5160 agaccatcct ggacttcctc aagtccgacg ggttcgccaa ccgcaacttc atgcagctca 5220 ttcacgacga ctcgctcacg ttcaaggaag acatccagaa ggcacaggtg agcgggcagg 5280 gtgactccct ccacgaacac atcgccaacc tggccggctc gccggccatt aaaaagggca 5340 tcctgcagac ggtcaaggtc gtcgacgagc tcgtgaaggt gatgggccgg cacaagcccg 5400 aaaatatcgt catagagatg gccagggaga accagaccac ccaaaaaggg cagaagaact 5460 cgcgcgagcg gatgaaacgg atcgaggagg gcattaaaga gctcgggtcc cagatcctga 5520 aggagcaccc cgtggaaaat acccagctcc agaatgaaaa gctctacctc tactacctgc 5580 agaacggccg cgacatgtac gtggaccagg agctggacat taatcggcta tcggactacg 5640 acgtcgacca catcgtgccg cagtcgttcc tcaaggacga tagcatcgac aacaaggtgc 5700 tcacccggtc ggataaaaat cggggcaaga gcgacaacgt gcccagcgag gaggtcgtga 5760 agaagatgaa aaactactgg cgccagctcc tcaacgcgaa actgatcacc cagcgcaagt 5820 tcgacaacct gacgaaggcg gaacgcggtg gcttgagcga actcgataag gcgggcttca 5880 taaaaaggca gctggtcgag acgcgccaga tcacgaagca tgtcgcccag atcctggaca 5940 gccgcatgaa tactaagtac gatgaaaacg acaagctgat ccgggaggtg aaggtgatca 6000 cgctgaagtc caagctcgtg tcggacttcc gcaaggactt ccagttctac aaggtccgcg 6060 agatcaacaa ctaccaccac gcccacgacg cctacctgaa tgcggtggtc gggaccgccc 6120 tgatcaagaa gtacccgaag ctggagtcgg agttcgtgta cggcgactac aaggtctacg 6180 acgtgcgcaa aatgatcgcc aagtccgagc aggagatcgg caaggccacg gcaaaatact 6240 tcttctactc gaacatcatg aacttcttca agaccgagat caccctcgcg aacggcgaga 6300 tccgcaagcg cccgctcatc gaaaccaacg gcgagacggg cgagatcgtc tgggataagg 6360 gccgggattt cgcgacggtc cgcaaggtgc tctccatgcc gcaagtcaat atcgtgaaaa 6420 agacggaggt ccagacgggc gggttcagca aggagtccat cctcccgaag cgcaactccg 6480 acaagctcat cgcgaggaag aaggattggg acccgaaaaa atatggcggc ttcgacagcc 6540 cgaccgtcgc atacagcgtc ctcgtcgtgg cgaaggtgga gaagggcaag tcaaagaagc 6600 tcaagtccgt gaaggagctg ctcgggatca cgattatgga gcggtcctcc ttcgagaaga 6660 acccgatcga cttcctagag gccaagggat ataaggaggt caagaaggac ctgattatta 6720 aactgccgaa gtactcgctc ttcgagctgg aaaacggccg caagaggatg ctcgcctccg 6780 caggcgagtt gcagaagggc aacgagctcg ccctcccgag caaatacgtc aatttcctgt 6840 acctcgctag ccactatgaa aagctcaagg gcagcccgga ggacaacgag cagaagcagc 6900 tcttcgtgga gcagcacaag cattacctgg acgagatcat cgagcagatc agcgagttct 6960 cgaagcgggt gatcctcgcc gacgcgaacc tggacaaggt gctgtcggca tataacaagc 7020 accgcgacaa accaatacgc gagcaggccg aaaatatcat ccacctcttc accctcacca 7080 acctcggcgc tccggcagcc ttcaagtact tcgacaccac gattgaccgg aagcggtaca 7140 cgagcacgaa ggaggtgctc gatgcgacgc tgatccacca gagcatcaca gggctctatg 7200 aaacacgcat cgacctgagc cagctgggcg gagacaagag accacgggac cgccacgatg 7260 gcgagctggg aggccgcaag cgggcaaggt aggtaccgtt aacctagact tgtccatctt 7320 ctggattggc caacttaatt aatgtatgaa ataaaaggat gcacacatag tgacatgcta 7380 atcactataa tgtgggcatc aaagttgtgt gttatgtgta attactagtt atctgaataa 7440 aagagaaaga gatcatccat atttcttatc ctaaatgaat gtcacgtgtc tttataattc 7500 tttgatgaac cagatgcatt tcattaacca aatccatata catataaata ttaatcatat 7560 ataattaata tcaattgggt tagcaaaaca aatctagtct aggtgtgttt tgcgaatgcg 7620 gccgccaccg cggtggagct cgaattcgag ctcggtaccc tgggatccag cttcgcttag 7680 tttttagttt ttggcagaaa aaatgatcaa tgtttcacaa accaaatatt tttataactt 7740 ttgatgaaag aagatcacca cggtcatatc taggggtggt aacaaattgc gatctaaatg 7800 tttcttcata aaaaataagg cttcttaata aattttagtt caaaataaat acgaataaag 7860 tctgattcta atctgattcg atccttaaat tttataatgc aaaatttaga gctcattacc 7920 acctctagtc atatgtctag tctgaggtat atccaaaaag ccctttctct aaattccaca 7980 cccaactcag atgtttgcaa ataaatactc cgactccaaa atgtaggtga agtgcaactt 8040 tctccatttt atatcaacat ttgttatttt ttgtttaaca tttcacactc aaaactaatt 8100 aataaaatac gtggttgttg aacgtgcgca catgtctccc ttacattatg tttttttatt 8160 tatgtattat tgttgttttc ctccgaacaa cttgtcaaca tatcatcatt ggtctttaat 8220 atttatgaat atggaagcct agttatttac acttggctac acactagttg tagttttgcc 8280 acttgtctaa catgcaactc tagtagtttt gccacttgcc tggcatgcaa ctctagtatt 8340 gacacttgta tagcatataa tgccaatacg acacctgcct tacatgaaac attatttttg 8400 acacttgtat accatgcaac attaccattg acatttgtcc atacacatta tatcaaatat 8460 attgagcgca tgtcacaaac tcgatacaaa gctggatgac cctccctcac cacatctata 8520 aaaacccgag cgctactgta aatcactcac aacacaacac atatctttta gtaacctttc 8580 aataggcgtc ccccaagaac tagtaaccat ggccctgtcc aacaagttca tcggcgacga 8640 catgaagatg acctaccaca tggacggctg cgtgaacggc cactacttca ccgtgaaggg 8700 cgagggcagc ggcaagccct acgagggcac ccagacctcc accttcaagg tgaccatggc 8760 caacggcggc cccctggcct tctccttcga catcctgtcc accgtgttca tgtacggcaa 8820 ccgctgcttc accgcctacc ccaccagcat gcccgactac ttcaagcagg ccttccccga 8880 cggcatgtcc tacgagagaa ccttcaccta cgaggacggc ggcgtggcca ccgccagctg 8940 ggagatcagc ctgaagggca actgcttcga gcacaagtcc accttccacg gcgtgaactt 9000 ccccgccgac ggccccgtga tggccaagaa gaccaccggc tgggacccct ccttcgagaa 9060 gatgaccgtg tgcgacggca tcttgaaggg cgacgtgacc gccttcctga tgctgcaggg 9120 cggcggcaac tacagatgcc agttccacac ctcctacaag accaagaagc ccgtgaccat 9180 gccccccaac cacgtggtgg agcaccgcat cgccagaacc gacctggaca agggcggcaa 9240 cagcgtgcag ctgaccgagc acgccgtggc ccacatcacc tccgtggtgc ccttctgaag 9300 cggcccatgg atattcgaac gcgtaggtac cacatggtta acctagactt gtccatcttc 9360 tggattggcc aacttaatta atgtatgaaa taaaaggatg cacacatagt gacatgctaa 9420 tcactataat gtgggcatca aagttgtgtg ttatgtgtaa ttactagtta tctgaataaa 9480 agagaaagag atcatccata tttcttatcc taaatgaatg tcacgtgtct ttataattct 9540 ttgatgaacc agatgcattt cattaaccaa atccatatac atataaatat taatcatata 9600 taattaatat caattgggtt agcaaaacaa atctagtcta ggtgtgtttt gcgaattccc 9660 atggacctcg agggggggcc cgggcaccca gctttcttgt acaaagtggc cgttaacgga 9720 tcggccagaa tggcccggac cgggttaccg aattcgagct cggtaccctg ggatcggccg 9780 ctctagaact agtggatccc ccgggctgca ggaattccca tggagtcaaa gattcaaata 9840 gaggacctaa cagaactcgc cgtaaagact ggcgaacagt tcatacagag tctcttacga 9900 ctcaatgaca agaagaaaat cttcgtcaac atggtggagc acgacacgct tgtctactcc 9960 aaaaatatca aagatacagt ctcagaagac caaagggcaa ttgagacttt tcaacaaagg 10020 gtaatatccg gaaacctcct cggattccat tgcccagcta tctgtcactt tattgtgaag 10080 atagtggaaa aggaaggtgg ctcctacaaa tgccatcatt gcgataaagg aaaggccatc 10140 gttgaagatg cctctgccga cagtggtccc aaagatggac ccccacccac gaggagcatc 10200 gtggaaaaag aagacgttcc aaccacgtct tcaaagcaag tggattgatg tgatatctcc 10260 actgacgtaa gggatgacgc acaatcccac taagcttcgg ccggggccca tcgatctggc 10320 gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg 10380 acgttgtaaa acgacggcca gtgccaagct cagatcagct tggggctggt atcgataaat 10440 gtttccacat agattttgca tatcataatg atgtttgtcg ttccgtatct atgtttcata 10500 caaaattttt acgcatatcg caacacatgg gcacatacct agtgactgta taactctgca 10560 tgtatgagtg tatgactata tgatgtagta actaataaga agggtagaca tttgagtgat 10620 tcttttattc ctggacttgt aagacttgac atttctgcct tgagtgcgat acatcatatg 10680 gacaggggtt atgcatacac tgcttgtttg ttgtttatgt tctaagagca tctccaacaa 10740 cgtgacatat gaaaatgccc tacaatttaa aaatggttat attttataaa atttagggca 10800 taaataaaac atcccgctcc aacattaaag ccttaaatct attataggga agcccactat 10860 gatatagtat atttgaggca ctttagaggg tgccctataa ttttttgacc atttttttat 10920 gaaatgagac actattggag tatttttttt ccgtagagca ccatatttca atttgagaca 10980 ccaatttaag gcattgttgg agatgttcta aatgttggtt tattttgtct gtatcgttgt 11040 ggttttgata gtggtgcctt tgcaatgtac atcttacatt gacaataata ataggtaaaa 11100 ctctacaaat tttttatcta atggactctt gtatgaaaca ttgtacttgc acacatctga 11160 tgtaaacact gcatactttt aacagtgaca agattctgtt tcattttagg gctagtttgg 11220 gaaccaaatt ttattagggt ttttattttc taagaaaaag taatttattt taccttgaga 11280 aaatataaat tacttgagaa aatagagttc caaactagct cttatctttg tcgaatcctc 11340 ctctattcaa atgtgacatt tctggcacgt gacaactggt gatgttgtag actgtgttaa 11400 gtaatacgtg tcattattac taaatgccat tttagtaaat gttgagtatg tactctacta 11460 cagtaagtat tattggtgta tttacactag acagttggcg gcctggcggg taaagttatc 11520 ctgtagaaag ttgggccagg ccaaaaccaa ccgccaaagg aaaggccttc cggcccgccc 11580 acctttgcgc gccgaaggtc agttccttca gtctcctccc gcttcagact ctgaccacgt 11640 cgacaatccg ggccgaaaca catctgcacc gtccacttgc gacagattga acacaccact 11700 tctatccacg tcagcgatcc gtggcactag cccttccacc aatcagccca agttgcccct 11760 ttcctttaaa ttcgccgcac ccattgctct tctcacggcc atagaaatcg accgagcgaa 11820 tccctcgcat cgcattcgca gcctttgctg catcacacca ccgcgaaacc ccagcagccg 11880 catctgcagg tcgactctag aggatccatg gcctcctccg aggacgtcat caaggagttc 11940 atgcgcttca aggtgcgcat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 12000 gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggc 12060 ggccccctgc ccttcgcctg ggacatcctg tccccccagt tccagtacgg ctccaaggtg 12120 tacgtgaagc accccgccga catccccgac tacaagaagc tgtccttccc cgagggcttc 12180 aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgacagtgac ccaggactcc 12240 tccctgcagg acggctcctt catctacaag gtgaagttca tcggcgtgaa cttcccctcc 12300 gacggccccg taatgcagaa gaagactatg ggctgggagg cctccaccga gcgcctgtac 12360 ccccgcgacg gcgtgctgaa gggcgagatc cacaaggccc tgaagctgaa ggacggcggc 12420 cacgctagcc catccaccca ctcactcact catatctgtg ctgtacgtac gagaatttct 12480 cgaccaaccg tcgtgagacc tgcccaccgg agatcggacg caagagggtt taggcaagaa 12540 tgtcgtgcga cagggtgagc gctgactagt atacgtgaga gaccttgaga tatacctcac 12600 acgtacgcgt actttacatg acgtaggaca ttacgactca aacagattca cgtcagattt 12660 cggagtttct cacgcgtgag agccttggag ggcggtatgt atgtcatact atatgttggg 12720 atggagggag tgagtgagtg atatgtggct agcaagggcg gccccctgcc cttcgcctgg 12780 gacatcctgt ccccccagtt ccagtacggc tccaaggtgt acgtgaagca ccccgccgac 12840 atccccgact acaagaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac 12900 ttcgaggacg gcggcgtggt gacagtgacc caggactcct ccctgcagga cggctccttc 12960 atctacaagg tgaagttcat cggcgtgaac ttcccctccg acggccccgt aatgcagaag 13020 aagactatgg gctgggaggc ctccaccgag cgcctgtacc cccgcgacgg cgtgctgaag 13080 ggcgagatcc acaaggccct gaagctgaag gacggcggcc actacctggt ggagttcaag 13140 tccatctaca tggccaagaa gcccgtgcag ctgcccggct actactacgt ggactccaag 13200 ctggacatca cctcccacaa cgaggactac accatcgtgg agcagtacga gcgcgccgag 13260 ggccgccacc acctgttcct gtagtcagga tctgagtcga aacctagact tgtccatctt 13320 ctggattggc caacttaatt aatgtatgaa ataaaaggat gcacacatag tgacatgcta 13380 atcactataa tgtgggcatc aaagttgtgt gttatgtgta attactagtt atctgaataa 13440 aagagaaaga gatcatccat atttcttatc ctaaatgaat gtcacgtgtc tttataattc 13500 tttgatgaac cagatgcatt tcattaacca aatccatata catataaata ttaatcatat 13560 ataattaata tcaattgggt tagcaaaaca aatctagtct aggtgtgttt tgcgaatgcg 13620 gccgccaccg cggtggagct cgaattccgg tccgggtcac ccggtccggg cctagaaggc 13680 cagcttgcgg ccgccccggg caactttatt atacaaagtt gatagatatc ggtccgagcg 13740 gcctagaagg cctttggtca cctttgtcca ccaagatgga actgcggccg ctcattaatt 13800 aagtcaggcg cgcctctagt tgaagacacg ttcatgtctt catcgtaaga agacactcag 13860 tagtcttcgg ccagaatggc ctaactcaag gccatcgtgg cctcttgctc ttcaggatga 13920 agagctatgt ttaaacgtgc aagcgctact agacaattca gtacattaaa aacgtccgca 13980 atgtgttatt aagttgtcta agcgtcaatt tgtttacacc acaatatatc ctgccaccag 14040 ccagccaaca gctccccgac cggcagctcg gcacaaaatc accactcgat acaggcagcc 14100 catcagtccg ggacggcgtc agcgggagag ccgttgtaag gcggcagact ttgctcatgt 14160 taccgatgct attcggaaga acggcaacta agctgccggg tttgaaacac ggatgatctc 14220 gcggagggta gcatgttgat tgtaacgatg acagagcgtt gctgcctgtg atcaaatatc 14280 atctccctcg cagagatccg aattatcagc cttcttattc atttctcgct taaccgtgac 14340 aggctgtcga tcttgagaac tatgccgaca taataggaaa tcgctggata aagccgctga 14400 ggaagctgag tggcgctatt tctttagaag tgaacgttga cgatcgtcga ccgtaccccg 14460 atgaattaat tcggacgtac gttctgaaca cagctggata cttacttggg cgattgtcat 14520 acatgacatc aacaatgtac ccgtttgtgt aaccgtctct tggaggttcg tatgacacta 14580 gtggttcccc tcagcttgcg actagatgtt gaggcctaac attttattag agagcaggct 14640 agttgcttag atacatgatc ttcaggccgt tatctgtcag ggcaagcgaa aattggccat 14700 ttatgacgac caatgccccg cagaagctcc catctttgcc gccatagacg ccgcgccccc 14760 cttttggggt gtagaacatc cttttgccag atgtggaaaa gaagttcgtt gtcccattgt 14820 tggcaatgac gtagtagccg gcgaaagtgc gagacccatt tgcgctatat ataagcctac 14880 gatttccgtt gcgactattg tcgtaattgg atgaactatt atcgtagttg ctctcagagt 14940 tgtcgtaatt tgatggacta ttgtcgtaat tgcttatgga gttgtcgtag ttgcttggag 15000 aaatgtcgta gttggatggg gagtagtcat agggaagacg agcttcatcc actaaaacaa 15060 ttggcaggtc agcaagtgcc tgccccgatg ccatcgcaag tacgaggctt agaaccacct 15120 tcaacagatc gcgcatagtc ttccccagct ctctaacgct tgagttaagc cgcgccgcga 15180 agcggcgtcg gcttgaacga attgttagac attatttgcc gactaccttg gtgatctcgc 15240 ctttcacgta gtgaacaaat tcttccaact gatctgcgcg cgaggccaag cgatcttctt 15300 gtccaagata agcctgccta gcttcaagta tgacgggctg atactgggcc ggcaggcgct 15360 ccattgccca gtcggcagcg acatccttcg gcgcgatttt gccggttact gcgctgtacc 15420 aaatgcggga caacgtaagc actacatttc gctcatcgcc agcccagtcg ggcggcgagt 15480 tccatagcgt taaggtttca tttagcgcct caaatagatc ctgttcagga accggatcaa 15540 agagttcctc cgccgctgga cctaccaagg caacgctatg ttctcttgct tttgtcagca 15600 agatagccag atcaatgtcg atcgtggctg gctcgaagat acctgcaaga atgtcattgc 15660 gctgccattc tccaaattgc agttcgcgct tagctggata acgccacgga atgatgtcgt 15720 cgtgcacaac aatggtgact tctacagcgc ggagaatctc gctctctcca ggggaagccg 15780 aagtttccaa aaggtcgttg atcaaagctc gccgcgttgt ttcatcaagc cttacagtca 15840 ccgtaaccag caaatcaata tcactgtgtg gcttcaggcc gccatccact gcggagccgt 15900 acaaatgtac ggccagcaac gtcggttcga gatggcgctc gatgacgcca actacctctg 15960 atagttgagt cgatacttcg gcgatcaccg cttccctcat gatgtttaac tcctgaatta 16020 agccgcgccg cgaagcggtg tcggcttgaa tgaattgtta ggcgtcatcc tgtgctcccg 16080 agaaccagta ccagtacatc gctgtttcgt tcgagacttg aggtctagtt ttatacgtga 16140 acaggtcaat gccgccgaga gtaaagccac attttgcgta caaattgcag gcaggtacat 16200 tgttcgtttg tgtctctaat cgtatgccaa ggagctgtct gcttagtgcc cactttttcg 16260 caaattcgat gagactgtgc gcgactcctt tgcctcggtg cgtgtgcgac acaacaatgt 16320 gttcgataga ggctagatcg ttccatgttg agttgagttc aatcttcccg acaagctctt 16380 ggtcgatgaa tgcgccatag caagcagagt cttcatcaga gtcatcatcc gagatgtaat 16440 ccttccggta ggggctcaca cttctggtag atagttcaaa gccttggtcg gataggtgca 16500 catcgaacac ttcacgaaca atgaaatggt tctcagcatc caatgtttcc gccacctgct 16560 cagggatcac cgaaatcttc atatgacgcc taacgcctgg cacagcggat cgcaaacctg 16620 gcgcggcttt tggcacaaaa ggcgtgacag gtttgcgaat ccgttgctgc cacttgttaa 16680 cccttttgcc agatttggta actataattt atgttagagg cgaagtcttg ggtaaaaact 16740 ggcctaaaat tgctggggat ttcaggaaag taaacatcac cttccggctc gatgtctatt 16800 gtagatatat gtagtgtatc tacttgatcg ggggatctgc tgcctcgcgc gtttcggtga 16860 tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 16920 ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 16980 cgcagccatg acccagtcac gtagcgatag cggagtgtat actggcttaa ctatgcggca 17040 tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta 17100 aggagaaaat accgcatcag gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 17160 gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 17220 gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 17280 cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 17340 aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 17400 tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 17460 ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 17520 ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 17580 cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 17640 ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 17700 gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 17760 atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 17820 aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 17880 aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 17940 gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 18000 cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 18060 gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 18120 tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 18180 ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 18240 ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 18300 atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 18360 cgcaacgttg ttgccattgc tgcagggggg gggggggggg gggacttcca ttgttcattc 18420 cacggacaaa aacagagaaa ggaaacgaca gaggccaaaa agcctcgctt tcagcacctg 18480 tcgtttcctt tcttttcaga gggtatttta aataaaaaca ttaagttatg acgaagaaga 18540 acggaaacgc cttaaaccgg aaaattttca taaatagcga aaacccgcga ggtcgccgcc 18600 ccgtaacctg tcggatcacc ggaaaggacc cgtaaagtga taatgattat catctacata 18660 tcacaacgtg cgtggaggcc atcaaaccac gtcaaataat caattatgac gcaggtatcg 18720 tattaattga tctgcatcaa cttaacgtaa aaacaacttc agacaataca aatcagcgac 18780 actgaatacg gggcaacctc atgtcccccc cccccccccc cctgcaggca tcgtggtgtc 18840 acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 18900 atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 18960 aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 19020 tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 19080 agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 19140 gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 19200 ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 19260 atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 19320 tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 19380 tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 19440 tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 19500 cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 19560 ctttcgtctt caagaattcg gagcttttgc cattctcacc ggattcagtc gtcactcatg 19620 gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt tgtattgatg 19680 ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg aactgcctcg 19740 gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt gataatcctg 19800 atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaatca gaattggtta 19860 attggttgta acactggcag agcattacgc tgacttgacg ggacggcggc tttgttgaat 19920 aaatcgaact tttgctgagt tgaaggatca gatcacgcat cttcccgaca acgcagaccg 19980 ttccgtggca aagcaaaagt tcaaaatcac caactggtcc acctacaaca aagctctcat 20040 caaccgtggc tccctcactt tctggctgga tgatggggcg attcaggcct ggtatgagtc 20100 agcaacacct tcttcacgag gcagacctca gcgccagaag gccgccagag aggccgagcg 20160 cggccgtgag gcttggacgc tagggcaggg catgaaaaag cccgtagcgg gctgctacgg 20220 gcgtctgacg cggtggaaag ggggagggga tgttgtctac atggctctgc tgtagtgagt 20280 gggttgcgct ccggcagcgg tcctgatcaa tcgtcaccct ttctcggtcc ttcaacgttc 20340 ctgacaacga gcctcctttt cgccaatcca tcgacaatca ccgcgagtcc ctgctcgaac 20400 gctgcgtccg gaccggcttc gtcgaaggcg tctatcgcgg cccgcaacag cggcgagagc 20460 ggagcctgtt caacggtgcc gccgcgctcg ccggcatcgc tgtcgccggc ctgctcctca 20520 agcacggccc caacagtgaa gtagctgatt gtcatcagcg cattgacggc gtccccggcc 20580 gaaaaacccg cctcgcagag gaagcgaagc tgcgcgtcgg ccgtttccat ctgcggtgcg 20640 cccggtcgcg tgccggcatg gatgcgcgcg ccatcgcggt aggcgagcag cgcctgcctg 20700 aagctgcggg cattcccgat cagaaatgag cgccagtcgt cgtcggctct cggcaccgaa 20760 tgcgtatgat tctccgccag catggcttcg gccagtgcgt cgagcagcgc ccgcttgttc 20820 ctgaagtgcc agtaaagcgc cggctgctga acccccaacc gttccgccag tttgcgtgtc 20880 gtcagaccgt ctacgccgac ctcgttcaac aggtccaggg cggcacggat cactgtattc 20940 ggctgcaact ttgtcatgct tgacacttta tcactgataa acataatatg tccaccaact 21000 tatcagtgat aaagaatccg cgcgttcaat cggaccagcg gaggctggtc cggaggccag 21060 acgtgaaacc caacataccc ctgatcgtaa ttctgagcac tgtcgcgctc gacgctgtcg 21120 gcatcggcct gattatgccg gtgctgccgg gcctcctgcg cgatctggtt cactcgaacg 21180 acgtcaccgc ccactatggc attctgctgg cgctgtatgc gttggtgcaa tttgcctgcg 21240 cacctgtgct gggcgcgctg tcggatcgtt tcgggcggcg gccaatcttg ctcgtctcgc 21300 tggccggcgc cactgtcgac tacgccatca tggcgacagc gcctttcctt tgggttctct 21360 atatcgggcg gatcgtggcc ggcatcaccg gggcgactgg ggcggtagcc ggcgcttata 21420 ttgccgatat cactgatggc gatgagcgcg cgcggcactt cggcttcatg agcgcctgtt 21480 tcgggttcgg gatggtcgcg ggacctgtgc tcggtgggct gatgggcggt ttctcccccc 21540 acgctccgtt cttcgccgcg gcagccttga acggcctcaa tttcctgacg ggctgtttcc 21600 ttttgccgga gtcgcacaaa ggcgaacgcc ggccgttacg ccgggaggct ctcaacccgc 21660 tcgcttcgtt ccggtgggcc cggggcatga ccgtcgtcgc cgccctgatg gcggtcttct 21720 tcatcatgca acttgtcgga caggtgccgg ccgcgctttg ggtcattttc ggcgaggatc 21780 gctttcactg ggacgcgacc acgatcggca tttcgcttgc cgcatttggc attctgcatt 21840 cactcgccca ggcaatgatc accggccctg tagccgcccg gctcggcgaa aggcgggcac 21900 tcatgctcgg aatgattgcc gacggcacag gctacatcct gcttgccttc gcgacacggg 21960 gatggatggc gttcccgatc atggtcctgc ttgcttcggg tggcatcgga atgccggcgc 22020 tgcaagcaat gttgtccagg caggtggatg aggaacgtca ggggcagctg caaggctcac 22080 tggcggcgct caccagcctg acctcgatcg tcggacccct cctcttcacg gcgatctatg 22140 cggcttctat aacaacgtgg aacgggtggg catggattgc aggcgctgcc ctctacttgc 22200 tctgcctgcc ggcgctgcgt cgcgggcttt ggagcggcgc agggcaacga gccgatcgct 22260 gatcgtggaa acgataggcc tatgccatgc gggtcaaggc gacttccggc aagctatacg 22320 cgccctagga gtgcggttgg aacgttggcc cagccagata ctcccgatca cgagcaggac 22380 gccgatgatt tgaagcgcac tcagcgtctg atccaagaac aaccatccta gcaacacggc 22440 ggtccccggg ctgagaaagc ccagtaagga aacaactgta ggttcgagtc gcgagatccc 22500 ccggaaccaa aggaagtagg ttaaacccgc tccgatcagg ccgagccacg ccaggccgag 22560 aacattggtt cctgtaggca tcgggattgg cggatcaaac actaaagcta ctggaacgag 22620 cagaagtcct ccggccgcca gttgccaggc ggtaaaggtg agcagaggca cgggaggttg 22680 ccacttgcgg gtcagcacgg ttccgaacgc catggaaacc gcccccgcca ggcccgctgc 22740 gacgccgaca ggatctagcg ctgcgtttgg tgtcaacacc aacagcgcca cgcccgcagt 22800 tccgcaaata gcccccagga ccgccatcaa tcgtatcggg ctacctagca gagcggcaga 22860 gatgaacacg accatcagcg gctgcacagc gcctaccgtc gccgcgaccc cgcccggcag 22920 gcggtagacc gaaataaaca acaagctcca gaatagcgaa atattaagtg cgccgaggat 22980 gaagatgcgc atccaccaga ttcccgttgg aatctgtcgg acgatcatca cgagcaataa 23040 acccgccggc aacgcccgca gcagcatacc ggcgacccct cggcctcgct gttcgggctc 23100 cacgaaaacg ccggacagat gcgccttgtg agcgtccttg gggccgtcct cctgtttgaa 23160 gaccgacagc ccaatgatct cgccgtcgat gtaggcgccg aatgccacgg catctcgcaa 23220 ccgttcagcg aacgcctcca tgggcttttt ctcctcgtgc tcgtaaacgg acccgaacat 23280 ctctggagct ttcttcaggg ccgacaatcg gatctcgcgg aaatcctgca cgtcggccgc 23340 tccaagccgt cgaatctgag ccttaatcac aattgtcaat tttaatcctc tgtttatcgg 23400 cagttcgtag agcgcgccgt gcgtcccgag cgatactgag cgaagcaagt gcgtcgagca 23460 gtgcccgctt gttcctgaaa tgccagtaaa gcgctggctg ctgaaccccc agccggaact 23520 gaccccacaa ggccctagcg tttgcaatgc accaggtcat cattgaccca ggcgtgttcc 23580 accaggccgc tgcctcgcaa ctcttcgcag gcttcgccga cctgctcgcg ccacttcttc 23640 acgcgggtgg aatccgatcc gcacatgagg cggaaggttt ccagcttgag cgggtacggc 23700 tcccggtgcg agctgaaata gtcgaacatc cgtcgggccg tcggcgacag cttgcggtac 23760 ttctcccata tgaatttcgt gtagtggtcg ccagcaaaca gcacgacgat ttcctcgtcg 23820 atcaggacct ggcaacggga cgttttcttg ccacggtcca ggacgcggaa gcggtgcagc 23880 agcgacaccg attccaggtg cccaacgcgg tcggacgtga agcccatcgc cgtcgcctgt 23940 aggcgcgaca ggcattcctc ggccttcgtg taataccggc cattgatcga ccagcccagg 24000 tcctggcaaa gctcgtagaa cgtgaaggtg atcggctcgc cgataggggt gcgcttcgcg 24060 tactccaaca cctgctgcca caccagttcg tcatcgtcgg cccgcagctc gacgccggtg 24120 taggtgatct tcacgtcctt gttgacgtgg aaaatgacct tgttttgcag cgcctcgcgc 24180 gggattttct tgttgcgcgt ggtgaacagg gcagagcggg ccgtgtcgtt tggcatcgct 24240 cgcatcgtgt ccggccacgg cgcaatatcg aacaaggaaa gctgcatttc cttgatctgc 24300 tgcttcgtgt gtttcagcaa cgcggcctgc ttggcctcgc tgacctgttt tgccaggtcc 24360 tcgccggcgg tttttcgctt cttggtcgtc atagttcctc gcgtgtcgat ggtcatcgac 24420 ttcgccaaac ctgccgcctc ctgttcgaga cgacgcgaac gctccacggc ggccgatggc 24480 gcgggcaggg cagggggagc cagttgcacg ctgtcgcgct cgatcttggc cgtagcttgc 24540 tggaccatcg agccgacgga ctggaaggtt tcgcggggcg cacgcatgac ggtgcggctt 24600 gcgatggttt cggcatcctc ggcggaaaac cccgcgtcga tcagttcttg cctgtatgcc 24660 ttccggtcaa acgtccgatt cattcaccct ccttgcggga ttgccccgac tcacgccggg 24720 gcaatgtgcc cttattcctg atttgacccg cctggtgcct tggtgtccag ataatccacc 24780 ttatcggcaa tgaagtcggt cccgtagacc gtctggccgt ccttctcgta cttggtattc 24840 cgaatcttgc cctgcacgaa taccagcgac cccttgccca aatacttgcc gtgggcctcg 24900 gcctgagagc caaaacactt gatgcggaag aagtcggtgc gctcctgctt gtcgccggca 24960 tcgttgcgcc actcttcatt aaccgctata tcgaaaattg cttgcggctt gttagaattg 25020 ccatgacgta cctcggtgtc acgggtaaga ttaccgataa actggaactg attatggctc 25080 atatcgaaag tctccttgag aaaggagact ctagtttagc taaacattgg ttccgctgtc 25140 aagaacttta gcggctaaaa ttttgcgggc cgcgaccaaa ggtgcgaggg gcggcttccg 25200 ctgtgtacaa ccagatattt ttcaccaaca tccttcgtct gctcgatgag cggggcatga 25260 cgaaacatga gctgtcggag agggcagggg tttcaatttc gtttttatca gacttaacca 25320 acggtaaggc caacccctcg ttgaaggtga tggaggccat tgccgacgcc ctggaaactc 25380 ccctacctct tctcctggag tccaccgacc ttgaccgcga ggcactcgcg gagattgcgg 25440 gtcatccttt caagagcagc gtgccgcccg gatacgaacg catcagtgtg gttttgccgt 25500 cacataaggc gtttatcgta aagaaatggg gcgacgacac ccgaaaaaag ctgcgtggaa 25560 ggctctgacg ccaagggtta gggcttgcac ttccttcttt agccgctaaa acggcccctt 25620 ctctgcgggc cgtcggctcg cgcatcatat cgacatcctc aacggaagcc gtgccgcgaa 25680 tggcatcggg cgggtgcgct ttgacagttg ttttctatca gaacccctac gtcgtgcggt 25740 tcgattagct gtttgtcttg caggctaaac actttcggta tatcgtttgc ctgtgcgata 25800 atgttgctaa tgatttgttg cgtaggggtt actgaaaagt gagcgggaaa gaagagtttc 25860 agaccatcaa ggagcgggcc aagcgcaagc tggaacgcga catgggtgcg gacctgttgg 25920 ccgcgctcaa cgacccgaaa accgttgaag tcatgctcaa cgcggacggc aaggtgtggc 25980 acgaacgcct tggcgagccg atgcggtaca tctgcgacat gcggcccagc cagtcgcagg 26040 cgattataga aacggtggcc ggattccacg gcaaagaggt cacgcggcat tcgcccatcc 26100 tggaaggcga gttccccttg gatggcagcc gctttgccgg ccaattgccg ccggtcgtgg 26160 ccgcgccaac ctttgcgatc cgcaagcgcg cggtcgccat cttcacgctg gaacagtacg 26220 tcgaggcggg catcatgacc cgcgagcaat acgaggtcat taaaagcgcc gtcgcggcgc 26280 atcgaaacat cctcgtcatt ggcggtactg gctcgggcaa gaccacgctc gtcaacgcga 26340 tcatcaatga aatggtcgcc ttcaacccgt ctgagcgcgt cgtcatcatc gaggacaccg 26400 gcgaaatcca gtgcgccgca gagaacgccg tccaatacca caccagcatc gacgtctcga 26460 tgacgctgct gctcaagaca acgctgcgta tgcgccccga ccgcatcctg gtcggtgagg 26520 tacgtggccc cgaagccctt gatctgttga tggcctggaa caccgggcat gaaggaggtg 26580 ccgccaccct gcacgcaaac aaccccaaag cgggcctgag ccggctcgcc atgcttatca 26640 gcatgcaccc ggattcaccg aaacccattg agccgctgat tggcgaggcg gttcatgtgg 26700 tcgtccatat cgccaggacc cctagcggcc gtcgagtgca agaaattctc gaagttcttg 26760 gttacgagaa cggccagtac atcaccaaaa ccctgtaagg agtatttcca atgacaacgg 26820 ctgttccgtt ccgtctgacc atgaatcgcg gcattttgtt ctaccttgcc gtgttcttcg 26880 ttctcgctct cgcgttatcc gcgcatccgg cgatggcctc ggaaggcacc ggcggcagct 26940 tgccatatga gagctggctg acgaacctgc gcaactccgt aaccggcccg gtggccttcg 27000 cgctgtccat catcggcatc gtcgtcgccg gcggcgtgct gatcttcggc ggcgaactca 27060 acgccttctt ccgaaccctg atcttcctgg ttctggtgat ggcgctgctg gtcggcgcgc 27120 agaacgtgat gagcaccttc ttcggtcgtg gtgccgaaat cgcggccctc ggcaacgggg 27180 cgctgcacca ggtgcaagtc gcggcggcgg atgccgtgcg tgcggtagcg gctggacggc 27240 tcgcctaatc atggctctgc gcacgatccc catccgtcgc gcaggcaacc gagaaaacct 27300 gttcatgggt ggtgatcgtg aactggtgat gttctcgggc ctgatggcgt ttgcgctgat 27360 tttcagcgcc caagagctgc gggccaccgt ggtcggtctg atcctgtggt tcggggcgct 27420 ctatgcgttc cgaatcatgg cgaaggccga tccgaagatg cggttcgtgt acctgcgtca 27480 ccgccggtac aagccgtatt acccggcccg ctcgaccccg ttccgcgaga acaccaatag 27540 ccaagggaag caataccgat gatccaagca attgcgattg caatcgcggg cctcggcgcg 27600 cttctgttgt tcatcctctt tgcccgcatc cgcgcggtcg atgccgaact gaaactgaaa 27660 aagcatcgtt ccaaggacgc cggcctggcc gatctgctca actacgccgc tgtcgtcgat 27720 gacggcgtaa tcgtgggcaa gaacggcagc tttatggctg cctggctgta caagggcgat 27780 gacaacgcaa gcagcaccga ccagcagcgc gaagtagtgt ccgcccgcat caaccaggcc 27840 ctcgcgggcc tgggaagtgg gtggatgatc catgtggacg ccgtgcggcg tcctgctccg 27900 aactacgcgg agcggggcct gtcggcgttc cctgaccgtc tgacggcagc gattgaagaa 27960 gagcgctcgg tcttgccttg ctcgtcggtg atgtacttca ccagctccgc gaagtcgctc 28020 ttcttgatgg agcgcatggg gacgtgcttg gcaatcacgc gcaccccccg gccgttttag 28080 cggctaaaaa agtcatggct ctgccctcgg gcggaccacg cccatcatga ccttgccaag 28140 ctcgtcctgc ttctcttcga tcttcgccag cagggcgagg atcgtggcat caccgaaccg 28200 cgccgtgcgc gggtcgtcgg tgagccagag tttcagcagg ccgcccaggc ggcccaggtc 28260 gccattgatg cgggccagct cgcggacgtg ctcatagtcc acgacgcccg tgattttgta 28320 gccctggccg acggccagca ggtaggccga caggctcatg ccggccgccg ccgccttttc 28380 ctcaatcgct cttcgttcgt ctggaaggca gtacaccttg ataggtgggc tgcccttcct 28440 ggttggcttg gtttcatcag ccatccgctt gccctcatct gttacgccgg cggtagccgg 28500 ccagcctcgc agagcaggat tcccgttgag caccgccagg tgcgaataag ggacagtgaa 28560 gaaggaacac ccgctcgcgg gtgggcctac ttcacctatc ctgcccggct gacgccgttg 28620 gatacaccaa ggaaagtcta cacgaaccct ttggcaaaat cctgtatatc gtgcgaaaaa 28680 ggatggatat accgaaaaaa tcgctataat gaccccgaag cagggttatg cagcggaaaa 28740 gcgctgcttc cctgctgttt tgtggaatat ctaccgactg gaaacaggca aatgcaggaa 28800 attactgaac tgaggggaca ggcgagagac gatgccaaag agctacaccg acgagctggc 28860 cgagtgggtt gaatcccgcg cggccaagaa gcgccggcgt gatgaggctg cggttgcgtt 28920 cctggcggtg agggcggatg tcgaggcggc gttagcgtcc ggctatgcgc tcgtcaccat 28980 ttgggagcac atgcgggaaa cggggaaggt caagttctcc tacgagacgt tccgctcgca 29040 cgccaggcgg cacatcaagg ccaagcccgc cgatgtgccc gcaccgcagg ccaaggctgc 29100 ggaacccgcg ccggcaccca agacgccgga gccacggcgg ccgaagcagg ggggcaaggc 29160 tgaaaagccg gcccccgctg cggccccgac cggcttcacc ttcaacccaa caccggacaa 29220 aaaggatcta ctgtaatggc gaaaattcac atggttttgc agggcaaggg cggggtcggc 29280 aagtcggcca tcgccgcgat cattgcgcag tacaagatgg acaaggggca gacacccttg 29340 tgcatcgaca ccgacccggt gaacgcgacg ttcgagggct acaaggccct gaacgtccgc 29400 cggctgaaca tcatggccgg cgacgaaatt aactcgcgca acttcgacac cctggtcgag 29460 ctgattgcgc cgaccaagga tgacgtggtg atcgacaacg gtgccagctc gttcgtgcct 29520 ctgtcgcatt acctcatcag caaccaggtg ccggctctgc tgcaagaaat ggggcatgag 29580 ctggtcatcc ataccgtcgt caccggcggc caggctctcc tggacacggt gagcggcttc 29640 gcccagctcg ccagccagtt cccggccgaa gcgcttttcg tggtctggct gaacccgtat 29700 tgggggccta tcgagcatga gggcaagagc tttgagcaga tgaaggcgta cacggccaac 29760 aaggcccgcg tgtcgtccat catccagatt ccggccctca aggaagaaac ctacggccgc 29820 gatttcagcg acatgctgca agagcggctg acgttcgacc aggcgctggc cgatgaatcg 29880 ctcacgatca tgacgcggca acgcctcaag atcgtgcggc gcggcctgtt tgaacagctc 29940 gacgcggcgg ccgtgctatg agcgaccaga ttgaagagct gatccgggag attgcggcca 30000 agcacggcat cgccgtcggc cgcgacgacc cggtgctgat cctgcatacc atcaacgccc 30060 ggctcatggc cgacagtgcg gccaagcaag aggaaatcct tgccgcgttc aaggaagagc 30120 tggaagggat cgcccatcgt tggggcgagg acgccaaggc caaagcggag cggatgctga 30180 acgcggccct ggcggccagc aaggacgcaa tggcgaaggt aatgaaggac agcgccgcgc 30240 aggcggccga agcgatccgc agggaaatcg acgacggcct tggccgccag ctcgcggcca 30300 aggtcgcgga cgcgcggcgc gtggcgatga tgaacatgat cgccggcggc atggtgttgt 30360 tcgcggccgc cctggtggtg tgggcctcgt tatgaatcgc agaggcgcag atgaaaaagc 30420 ccggcgttgc cgggctttgt ttttgcgtta gctgggcttg tttgacaggc ccaagctctg 30480 actgcgcccg cgctcgcgct cctgggcctg tttcttctcc tgctcctgct tgcgcatcag 30540 ggcctggtgc cgtcgggctg cttcacgcat cgaatcccag tcgccggcca gctcgggatg 30600 ctccgcgcgc atcttgcgcg tcgccagttc ctcgatcttg ggcgcgtgaa tgcccatgcc 30660 ttccttgatt tcgcgcacca tgtccagccg cgtgtgcagg gtctgcaagc gggcttgctg 30720 ttgggcctgc tgctgctgcc aggcggcctt tgtacgcggc agggacagca agccgggggc 30780 attggactgt agctgctgca aacgcgcctg ctgacggtct acgagctgtt ctaggcggtc 30840 ctcgatgcgc tccacctggt catgctttgc ctgcacgtag agcgcaaggg tctgctggta 30900 ggtctgctcg atgggcgcgg attctaagag ggcctgctgt tccgtctcgg cctcctgggc 30960 cgcctgtagc aaatcctcgc cgctgttgcc gctggactgc tttactgccg gggactgctg 31020 ttgccctgct cgcgccgtcg tcgcagttcg gcttgccccc actcgattga ctgcttcatt 31080 tcgagccgca gcgatgcgat ctcggattgc gtcaacggac ggggcagcgc ggaggtgtcc 31140 ggcttctcct tgggtgagtc ggtcgatgcc atagccaaag gtttccttcc aaaatgcgtc 31200 cattgctgga ccgtgtttct cattgatgcc cgcaagcatc ttcggcttga ccgccaggtc 31260 aagcgcgcct tcatgggcgg tcatgacgga cgccgccatg accttgccgc cgttgttctc 31320 gatgtagccg cgtaatgagg caatggtgcc gcccatcgtc agcgtgtcat cgacaacgat 31380 gtacttctgg ccggggatca cctccccctc gaaagtcggg ttgaacgcca ggcgatgatc 31440 tgaaccggct ccggttcggg cgaccttctc ccgctgcaca atgtccgttt cgacctcaag 31500 gccaaggcgg tcggccagaa cgaccgccat catggccgga atcttgttgt tccccgccgc 31560 ctcgacggcg aggactggaa cgatgcgggg cttgtcgtcg ccgatcagcg tcttgagctg 31620 ggcaacagtg tcgtccgaaa tcaggcgctc gaccaaatta agcgccgctt ccgcgtcgcc 31680 ctgcttcgca gcctggtatt caggctcgtt ggtcaaagaa ccaaggtcgc cgttgcgaac 31740 caccttcggg aagtctcccc acggtgcgcg ctcggctctg ctgtagctgc tcaagacgcc 31800 tcccttttta gccgctaaaa ctctaacgag tgcgcccgcg actcaacttg acgctttcgg 31860 cacttacctg tgccttgcca cttgcgtcat aggtgatgct tttcgcactc ccgatttcag 31920 gtactttatc gaaatctgac cgggcgtgca ttacaaagtt cttccccacc tgttggtaaa 31980 tgctgccgct atctgcgtgg acgatgctgc cgtcgtggcg ctgcgactta tcggcctttt 32040 gggccatata gatgttgtaa atgccaggtt tcagggcccc ggctttatct accttctggt 32100 tcgtccatgc gccttggttc tcggtctgga caattctttg cccattcatg accaggaggc 32160 ggtgtttcat tgggtgactc ctgacggttg cctctggtgt taaacgtgtc ctggtcgctt 32220 gccggctaaa aaaaagccga cctcggcagt tcgaggccgg ctttccctag agccgggcgc 32280 gtcaaggttg ttccatctat tttagtgaac tgcgttcgat ttatcagtta ctttcctccc 32340 gctttgtgtt tcctcccact cgtttccgcg tctagccgac ccctcaacat agcggcctct 32400 tcttgggctg cctttgcctc ttgccgcgct tcgtcacgct cggcttgcac cgtcgtaaag 32460 cgctcggcct gcctggccgc ctcttgcgcc gccaacttcc tttgctcctg gtgggcctcg 32520 gcgtcggcct gcgccttcgc tttcaccgct gccaactccg tgcgcaaact ctccgcttcg 32580 cgcctggtgg cgtcgcgctc gccgcgaagc gcctgcattt cctggttggc cgcgtccagg 32640 gtcttgcggc tctcttcttt gaatgcgcgg gcgtcctggt gagcgtagtc cagctcggcg 32700 cgcagctcct gcgctcgacg ctccacctcg tcggcccgct gcgtcgccag cgcggcccgc 32760 tgctcggctc ctgccagggc ggtgcgtgct tcggccaggg cttgccgctg gcgtgcggcc 32820 agctcggccg cctcggcggc ctgctgctct agcaatgtaa cgcgcgcctg ggcttcttcc 32880 agctcgcggg cctgcgcctc gaaggcgtcg gccagctccc cgcgcacggc ttccaactcg 32940 ttgcgctcac gatcccagcc ggcttgcgct gcctgcaacg attcattggc aagggcctgg 33000 gcggcttgcc agagggcggc cacggcctgg ttgccggcct gctgcaccgc gtccggcacc 33060 tggactgcca gcggggcggc ctgcgccgtg cgctggcgtc gccattcgcg catgccggcg 33120 ctggcgtcgt tcatgttgac gcgggcggcc ttacgcactg catccacggt cgggaagttc 33180 tcccggtcgc cttgctcgaa cagctcgtcc gcagccgcaa aaatgcggtc gcgcgtctct 33240 ttgttcagtt ccatgttggc tccggtaatt ggtaagaata ataatactct tacctacctt 33300 atcagcgcaa gagtttagct gaacagttct cgacttaacg gcaggttttt tagcggctga 33360 agggcaggca aaaaaagccc cgcacggtcg gcgggggcaa agggtcagcg ggaaggggat 33420 tagcgggcgt cgggcttctt catgcgtcgg ggccgcgctt cttgggatgg agcacgacga 33480 agcgcgcacg cgcatcgtcc tcggccctat cggcccgcgt cgcggtcagg aacttgtcgc 33540 gcgctaggtc ctccctggtg ggcaccaggg gcatgaactc ggcctgctcg atgtaggtcc 33600 actccatgac cgcatcgcag tcgaggccgc gttccttcac cgtctcttgc aggtcgcggt 33660 acgcccgctc gttgagcggc tggtaacggg ccaattggtc gtaaatggct gtcggccatg 33720 agcggccttt cctgttgagc cagcagccga cgacgaagcc ggcaatgcag gcccctggca 33780 caaccaggcc gacgccgggg gcaggggatg gcagcagctc gccaaccagg aaccccgccg 33840 cgatgatgcc gatgccggtc aaccagccct tgaaactatc cggccccgaa acacccctgc 33900 gcattgcctg gatgctgcgc cggatagctt gcaacatcag gagccgtttc ttttgttcgt 33960 cagtcatggt ccgccctcac cagttgttcg tatcggtgtc ggacgaactg aaatcgcaag 34020 agctgccggt atcggtccag ccgctgtccg tgtcgctgct gccgaagcac ggcgaggggt 34080 ccgcgaacgc cgcagacggc gtatccggcc gcagcgcatc gcccagcatg gccccggtca 34140 gcgagccgcc ggccaggtag cccagcatgg tgctgttggt cgccccggcc accagggccg 34200 acgtgacgaa atcgccgtca ttccctctgg attgttcgct gctcggcggg gcagtgcgcc 34260 gcgccggcgg cgtcgtggat ggctcgggtt ggctggcctg cgacggccgg cgaaaggtgc 34320 gcagcagctc gttatcgacc ggctgcggcg tcggggccgc cgccttgcgc tgcggtcggt 34380 gttccttctt cggctcgcgc agcttgaaca gcatgatcgc ggaaaccagc agcaacgccg 34440 cgcctacgcc tcccgcgatg tagaacagca tcggattcat tcttcggtcc tccttgtagc 34500 ggaaccgttg tctgtgcggc gcgggtggcc cgcgccgctg tctttgggga tcagccctcg 34560 atgagcgcga ccagtttcac gtcggcaagg ttcgcctcga actcctggcc gtcgtcctcg 34620 tacttcaacc aggcatagcc ttccgccggc ggccgacggt tgaggataag gcgggcaggg 34680 cgctcgtcgt gctcgacctg gacgatggcc tttttcagct tgtccgggtc cggctccttc 34740 gcgccctttt ccttggcgtc cttaccgtcc tggtcgccgt cctcgccgtc ctggccgtcg 34800 ccggcctccg cgtcacgctc ggcatcagtc tggccgttga aggcatcgac ggtgttggga 34860 tcgcggccct tctcgtccag gaactcgcgc agcagcttga ccgtgccgcg cgtgatttcc 34920 tgggtgtcgt cgtcaagcca cgcctcgact tcctccgggc gcttcttgaa ggccgtcacc 34980 agctcgttca ccacggtcac gtcgcgcacg cggccggtgt tgaacgcatc ggcgatcttc 35040 tccggcaggt ccagcagcgt gacgtgctgg gtgatgaacg ccggcgactt gccgatttcc 35100 ttggcgatat cgcctttctt cttgcccttc gccagctcgc ggccaatgaa gtcggcaatt 35160 tcgcgcgggg tcagctcgtt gcgttgcagg ttctcgataa cctggtcggc ttcgttgtag 35220 tcgttgtcga tgaacgccgg gatggacttc ttgccggccc acttcgagcc acggtagcgg 35280 cgggcgccgt gattgatgat atagcggccc ggctgctcct ggttctcgcg caccgaaatg 35340 ggtgacttca ccccgcgctc tttgatcgtg gcaccgattt ccgcgatgct ctccggggaa 35400 aagccggggt tgtcggccgt ccgcggctga tgcggatctt cgtcgatcag gtccaggtcc 35460 agctcgatag ggccggaacc gccctgagac gccgcaggag cgtccaggag gctcgacagg 35520 tcgccgatgc tatccaaccc caggccggac ggctgcgccg cgcctgcggc ttcctgagcg 35580 gccgcagcgg tgtttttctt ggtggtcttg gcttgagccg cagtcattgg gaaatctcca 35640 tcttcgtgaa cacgtaatca gccagggcgc gaacctcttt cgatgccttg cgcgcggccg 35700 ttttcttgat cttccagacc ggcacaccgg atgcgagggc atcggcgatg ctgctgcgca 35760 ggccaacggt ggccggaatc atcatcttgg ggtacgcggc cagcagctcg gcttggtggc 35820 gcgcgtggcg cggattccgc gcatcgacct tgctgggcac catgccaagg aattgcagct 35880 tggcgttctt ctggcgcacg ttcgcaatgg tcgtgaccat cttcttgatg ccctggatgc 35940 tgtacgcctc aagctcgatg ggggacagca catagtcggc cgcgaagagg gcggccgcca 36000 ggccgacgcc aagggtcggg gccgtgtcga tcaggcacac gtcgaagcct tggttcgcca 36060 gggccttgat gttcgccccg aacagctcgc gggcgtcgtc cagcgacagc cgttcggcgt 36120 tcgccagtac cgggttggac tcgatgaggg cgaggcgcgc ggcctggccg tcgccggctg 36180 cgggtgcggt ttcggtccag ccgccggcag ggacagcgcc gaacagcttg cttgcatgca 36240 ggccggtagc aaagtccttg agcgtgtagg acgcattgcc ctgggggtcc aggtcgatca 36300 cggcaacccg caagccgcgc tcgaaaaagt cgaaggcaag atgcacaagg gtcgaagtct 36360 tgccgacgcc gcctttctgg ttggccgtga ccaaagtttt catcgtttgg tttcctgttt 36420 tttcttggcg tccgcttccc acttccggac gatgtacgcc tgatgttccg gcagaaccgc 36480 cgttacccgc gcgtacccct cgggcaagtt cttgtcctcg aacgcggccc acacgcgatg 36540 caccgcttgc gacactgcgc ccctggtcag tcccagcgac gttgcgaacg tcgcctgtgg 36600 cttcccatcg actaagacgc cccgcgctat ctcgatggtc tgctgcccca cttccagccc 36660 ctggatcgcc tcctggaact ggctttcggt aagccgtttc ttcatggata acacccataa 36720 tttgctccgc gccttggttg aacatagcgg tgacagccgc cagcacatga gagaagttta 36780 gctaaacatt tctcgcacgt caacaccttt agccgctaaa actcgtcctt ggcgtaacaa 36840 aacaaaagcc cggaaaccgg gctttcgtct cttgccgctt atggctctgc acccggctcc 36900 atcaccaaca ggtcgcgcac gcgcttcact cggttgcgga tcgacactgc cagcccaaca 36960 aagccggttg ccgccgccgc caggatcgcg ccgatgatgc cggccacacc ggccatcgcc 37020 caccaggtcg ccgccttccg gttccattcc tgctggtact gcttcgcaat gctggacctc 37080 ggctcaccat aggctgaccg ctcgatggcg tatgccgctt ctccccttgg cgtaaaaccc 37140 agcgccgcag gcggcattgc catgctgccc gccgctttcc cgaccacgac gcgcgcacca 37200 ggcttgcggt ccagaccttc ggccacggcg agctgcgcaa ggacataatc agccgccgac 37260 ttggctccac gcgcctcgat cagctcttgc actcgcgcga aatccttggc ctccacggcc 37320 gccatgaatc gcgcacgcgg cgaaggctcc gcagggccgg cgtcgtgatc gccgccgaga 37380 atgcccttca ccaagttcga cgacacgaaa atcatgctga cggctatcac catcatgcag 37440 acggatcgca cgaacccgct gaattgaaca cgagcacggc acccgcgacc actatgccaa 37500 gaatgcccaa ggtaaaaatt gccggccccg ccatgaagtc cgtgaatgcc ccgacggccg 37560 aagtgaaggg caggccgcca cccaggccgc cgccctcact gcccggcacc tggtcgctga 37620 atgtcgatgc cagcacctgc ggcacgtcaa tgcttccggg cgtcgcgctc gggctgatcg 37680 cccatcccgt tactgccccg atcccggcaa tggcaaggac tgccagcgct gccatttttg 37740 gggtgaggcc gttcgcggcc gaggggcgca gcccctgggg ggatgggagg cccgcgttag 37800 cgggccggga gggttcgaga agggggggca ccccccttcg gcgtgcgcgg tcacgcgcac 37860 agggcgcagc cctggttaaa aacaaggttt ataaatattg gtttaaaagc aggttaaaag 37920 acaggttagc ggtggccgaa aaacgggcgg aaacccttgc aaatgctgga ttttctgcct 37980 gtggacagcc cctcaaatgt caataggtgc gcccctcatc tgtcagcact ctgcccctca 38040 agtgtcaagg atcgcgcccc tcatctgtca gtagtcgcgc ccctcaagtg tcaataccgc 38100 agggcactta tccccaggct tgtccacatc atctgtggga aactcgcgta aaatcaggcg 38160 ttttcgccga tttgcgaggc tggccagctc cacgtcgccg gccgaaatcg agcctgcccc 38220 tcatctgtca acgccgcgcc gggtgagtcg gcccctcaag tgtcaacgtc cgcccctcat 38280 ctgtcagtga gggccaagtt ttccgcgagg tatccacaac gccggcggcc gcggtgtctc 38340 gcacacggct tcgacggcgt ttctggcgcg tttgcagggc catagacggc cgccagccca 38400 gcggcgaggg caaccagccc ggtgagcgtc ggaaaggcgc tggaagcccc gtagcgacgc 38460 ggagaggggc gagacaagcc aagggcgcag gctcgatgcg cagcacgaca tagccggttc 38520 tcgcaaggac gagaatttcc ctgcggtgcc cctcaagtgt caatgaaagt ttccaacgcg 38580 agccattcgc gagagccttg agtccacgct agatgagagc tttgttgtag gtggaccagt 38640 tggtgatttt gaacttttgc tttgccacgg aacggtctgc gttgtcggga agatgcgtga 38700 tctgatcctt caactcagca aaagttcgat ttattcaaca aagccacgtt gtgtctcaaa 38760 atctctgatg ttacattgca caagataaaa atatatcatc atgaacaata aaactgtctg 38820 cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa acgtcttgct 38880 cgactctaga gctcgttcct cgaggcctcg aggcctcgag gaacggtacc tgcggggaag 38940 cttacaataa tgtgtgttgt taagtcttgt tgcctgtcat cgtctgactg actttcgtca 39000 taaatcccgg cctccgtaac ccagctttgg gcaagctcac ggatttgatc cggcggaacg 39060 ggaatatcga gatgccgggc tgaacgctgc agttccagct ttccctttcg ggacaggtac 39120 tccagctgat tgattatctg ctgaagggtc ttggttccac ctcctggcac aatgcgaatg 39180 attacttgag cgcgatcggg catccaattt tctcccgtca ggtgcgtggt caagtgctac 39240 aaggcacctt tcagtaacga gcgaccgtcg atccgtcgcc gggatacgga caaaatggag 39300 cgcagtagtc catcgagggc ggcgaaagcc tcgccaaaag caatacgttc atctcgcaca 39360 gcctccagat ccgatcgagg gtcttcggcg taggcagata gaagcatgga tacattgctt 39420 gagagtattc cgatggactg aagtatggct tccatctttt ctcgtgtgtc tgcatctatt 39480 tcgagaaagc ccccgatgcg gcgcaccgca acgcgaattg ccatactatc cgaaagtccc 39540 agcaggcgcg cttgatagga aaaggtttca tactcggccg atcgcagacg ggcactcacg 39600 accttgaacc cttcaacttt cagggatcga tgctggttga tggtagtctc actcgacgtg 39660 gctctggtgt gttttgacat agcttcctcc aaagaaagcg gaaggtctgg atactccagc 39720 acgaaatgtg cccgggtaga cggatggaag tctagccctg ctcaatatga aatcaacagt 39780 acatttacag tcaatactga atatacttgc tacatttgca attgtcttat aacgaatgtg 39840 aaataaaaat agtgtaacaa cgcttttact catcgataat cacaaaaaca tttatacgaa 39900 caaaaataca aatgcactcc ggtttcacag gataggcggg atcagaatat gcaacttttg 39960 acgttttgtt ctttcaaagg gggtgctggc aaaaccaccg cactcatggg cctttgcgct 40020 gctttggcaa atgacggtaa acgagtggcc ctctttgatg ccgacgaaaa ccggcctctg 40080 acgcgatgga gagaaaacgc cttacaaagc agtactggga tcctcgctgt gaagtctatt 40140 ccgccgacga aatgcccctt cttgaagcag cctatgaaaa tgccgagctc gaaggatttg 40200 attatgcgtt ggccgatacg cgtggcggct cgagcgagct caacaacaca atcatcgcta 40260 gctcaaacct gcttctgatc cccaccatgc taacgccgct cgacatcgat gaggcactat 40320 ctacctaccg ctacgtcatc gagctgctgt tgagtgaaaa tttggcaatt cctacagctg 40380 ttttgcgcca acgcgtcccg gtcggccgat tgacaacatc gcaacgcagg atgtcagaga 40440 cgctagagag ccttccagtt gtaccgtctc ccatgcatga aagagatgca tttgccgcga 40500 tgaaagaacg cggcatgttg catcttacat tactaaacac gggaactgat ccgacgatgc 40560 gcctcataga gaggaatctt cggattgcga tggaggaagt cgtggtcatt tcgaaactga 40620 tcagcaaaat cttggaggct tgaagatggc aattcgcaag cccgcattgt cggtcggcga 40680 agcacggcgg cttgctggtg ctcgacccga gatccaccat cccaacccga cacttgttcc 40740 ccagaagctg gacctccagc acttgcctga aaaagccgac gagaaagacc agcaacgtga 40800 gcctctcgtc gccgatcaca tttacagtcc cgatcgacaa cttaagctaa ctgtggatgc 40860 ccttagtcca cctccgtccc cgaaaaagct ccaggttttt ctttcagcgc gaccgcccgc 40920 gcctcaagtg tcgaaaacat atgacaacct cgttcggcaa tacagtccct cgaagtcgct 40980 acaaatgatt ttaaggcgcg cgttggacga tttcgaaagc atgctggcag atggatcatt 41040 tcgcgtggcc ccgaaaagtt atccgatccc ttcaactaca gaaaaatccg ttctcgttca 41100 gacctcacgc atgttcccgg ttgcgttgct cgaggtcgct cgaagtcatt ttgatccgtt 41160 ggggttggag accgctcgag ctttcggcca caagctggct accgccgcgc tcgcgtcatt 41220 ctttgctgga gagaagccat cgagcaattg gtgaagaggg acctatcgga acccctcacc 41280 aaatattgag tgtaggtttg aggccgctgg ccgcgtcctc agtcaccttt tgagccagat 41340 aattaagagc caaatgcaat tggctcaggc tgccatcgtc cccccgtgcg aaacctgcac 41400 gtccgcgtca aagaaataac cggcacctct tgctgttttt atcagttgag ggcttgacgg 41460 atccgcctca agtttgcggc gcagccgcaa aatgagaaca tctatactcc tgtcgtaaac 41520 ctcctcgtcg cgtactcgac tggcaatgag aagttgctcg cgcgatagaa cgtcgcgggg 41580 tttctctaaa aacgcgagga gaagattgaa ctcacctgcc gtaagtttca cctcaccgcc 41640 agcttcggac atcaagcgac gttgcctgag attaagtgtc cagtcagtaa aacaaaaaga 41700 ccgtcggtct ttggagcgga caacgttggg gcgcacgcgc aaggcaaccc gaatgcgtgc 41760 aagaaactct ctcgtactaa acggcttagc gataaaatca cttgctccta gctcgagtgc 41820 aacaacttta tccgtctcct caaggcggtc gccactgata attatgattg gaatatcaga 41880 ctttgccgcc agatttcgaa cgatctcaag cccatcttca cgacctaaat ttagatcaac 41940 aaccacgaca tcgaccgtcg cggaagagag tactctagtg aactgggtgc tgtcggctac 42000 cgcggtcact ttgaaggcgt ggatcgtaag gtattcgata ataagatgcc gcatagcgac 42060 atcgtcatcg ataagaagaa cgtgtttcaa cggctcacct ttcaatctaa aatctgaacc 42120 cttgttcaca gcgcttgaga aattttcacg tgaaggatgt acaatcatct ccagctaaat 42180 gggcagttcg tcagaattgc ggctgaccgc ggatgacgaa aatgcgaacc aagtatttca 42240 attttatgac aaaagttctc aatcgttgtt acaagtgaaa cgcttcgagg ttacagctac 42300 tattgattaa ggagatcgcc tatggtctcg ccccggcgtc gtgcgtccgc cgcgagccag 42360 atctcgccta cttcataaac gtcctcatag gcacggaatg gaatgatgac atcgatcgcc 42420 gtagagagca tgtcaatcag tgtgcgatct tccaagctag caccttgggc gctacttttg 42480 acaagggaaa acagtttctt gaatccttgg attggattcg cgccgtgtat tgttgaaatc 42540 gatcccggat gtcccgagac gacttcactc agataagccc atgctgcatc gtcgcgcatc 42600 tcgccaagca atatccggtc cggccgcata cgcagacttg cttggagcaa gtgctcggcg 42660 ctcacagcac ccagcccagc accgttcttg gagtagagta gtctaacatg attatcgtgt 42720 ggaatgacga gttcgagcgt atcttctatg gtgattagcc tttcctgggg ggggatggcg 42780 ctgatcaagg tcttgctcat tgttgtcttg ccgcttccgg tagggccaca tagcaacatc 42840 gtcagtcggc tgacgacgca tgcgtgcaga aacgcttcca aatccccgtt gtcaaaatgc 42900 tgaaggatag cttcatcatc ctgattttgg cgtttccttc gtgtctgcca ctggttccac 42960 ctcgaagcat cataacggga ggagacttct ttaagaccag aaacacgcga gcttggccgt 43020 cgaatggtca agctgacggt gcccgaggga acggtcggcg gcagacagat ttgtagtcgt 43080 tcaccaccag gaagttcagt ggcgcagagg gggttacgtg gtccgacatc ctgctttctc 43140 agcgcgcccg ctaaaatagc gatatcttca agatcatcat aagagacggg caaaggcatc 43200 ttggtaaaaa tgccggcttg gcgcacaaat gcctctccag gtcgattgat cgcaatttct 43260 tcagtcttcg ggtcatcgag ccattccaaa atcggcttca gaagaaagcg tagttgcgga 43320 tccacttcca tttacaatgt atcctatctc taagcggaaa tttgaattca ttaagagcgg 43380 cggttcctcc cccgcgtggc gccgccagtc aggcggagct ggtaaacacc aaagaaatcg 43440 aggtcccgtg ctacgaaaat ggaaacggtg tcaccctgat tcttcttcag ggttggcggt 43500 atgttgatgg ttgccttaag ggctgtctca gttgtctgct caccgttatt ttgaaagctg 43560 ttgaagctca tcccgccacc cgagctgccg gcgtaggtgc tagctgcctg gaaggcgcct 43620 tgaacaacac tcaagagcat agctccgcta aaacgctgcc agaagtggct gtcgaccgag 43680 cccggcaatc ctgagcgacc gagttcgtcc gcgcttggcg atgttaacga gatcatcgca 43740 tggtcaggtg tctcggcgcg atcccacaac acaaaaacgc gcccatctcc ctgttgcaag 43800 ccacgctgta tttcgccaac aacggtggtg ccacgatcaa gaagcacgat attgttcgtt 43860 gttccacgaa tatcctgagg caagacacac tttacatagc ctgccaaatt tgtgtcgatt 43920 gcggtttgca agatgcacgg aattattgtc ccttgcgtta ccataaaatc ggggtgcggc 43980 aagagcgtgg cgctgctggg ctgcagctcg gtgggtttca tacgtatcga caaatcgttc 44040 tcgccggaca cttcgccatt cggcaaggag ttgtcgtcac gcttgccttc ttgtcttcgg 44100 cccgtgtcgc cctgaatggc gcgtttgctg accccttgat cgccgctgct atatgcaaaa 44160 atcggtgttt cttccggccg tggctcatgc cgctccggtt cgcccctcgg cggtagagga 44220 gcagcaggct gaacagcctc ttgaaccgct ggaggatccg gcggcacctc aatcggagct 44280 ggatgaaatg gcttggtgtt tgttgcgatc aaagttgacg gcgatgcgtt ctcattcacc 44340 ttcttttggc gcccacctag ccaaatgagg cttaatgata acgcgagaac gacacctccg 44400 acgatcaatt tctgagaccc cgaaagacgc cggcgatgtt tgtcggagac cagggatcca 44460 gatgcatcaa cctcatgtgc cgcttgctga ctatcgttat tcatcccttc gcccccttca 44520 ggacgcgttt cacatcgggc ctcaccgtgc ccgtttgcgg cctttggcca acgggatcgt 44580 aagcggtgtt ccagatacat agtactgtgt ggccatccct cagacgccaa cctcgggaaa 44640 ccgaagaaat ctcgacatcg ctccctttaa ctgaatagtt ggcaacagct tccttgccat 44700 caggattgat ggtgtagatg gagggtatgc gtacattgcc cggaaagtgg aataccgtcg 44760 taaatccatt gtcgaagact tcgagtggca acagcgaacg atcgccttgg gcgacgtagt 44820 gccaattact gtccgccgca ccaagggctg tgacaggctg atccaataaa ttctcagctt 44880 tccgttgata ttgtgcttcc gcgtgtagtc tgtccacaac agccttctgt tgtgcctccc 44940 ttcgccgagc cgccgcatcg tcggcggggt aggcgaattg gacgctgtaa tagagatcgg 45000 gctgctcttt atcgaggtgg gacagagtct tggaacttat actgaaaaca taacggcgca 45060 tcccggagtc gcttgcggtt agcacgatta ctggctgagg cgtgaggacc tggcttgcct 45120 tgaaaaatag ataatttccc cgcggtaggg ctgctagatc tttgctattt gaaacggcaa 45180 ccgctgtcac cgtttcgttc gtggcgaatg ttacgaccaa agtagctcca accgccgtcg 45240 agaggcgcac cacttgatcg ggattgtaag ccaaataacg catgcgcgga tctagcttgc 45300 ccgccattgg agtgtcttca gcctccgcac cagtcgcagc ggcaaataaa catgctaaaa 45360 tgaaaagtgc ttttctgatc atggttcgct gtggcctacg tttgaaacgg tatcttccga 45420 tgtctgatag gaggtgacaa ccagacctgc cgggttggtt agtctcaatc tgccgggcaa 45480 gctggtcacc ttttcgtagc gaactgtcgc ggtccacgta ctcaccacag gcattttgcc 45540 gtcaacgacg agggtccttt tatagcgaat ttgctgcgtg cttggagtta catcatttga 45600 agcgatgtgc tcgacctcca ccctgccgcg tttgccaaga atgacttgag gcgaactggg 45660 attgggatag ttgaagaatt gctggtaatc ctggcgcact gttggggcac tgaagttcga 45720 taccaggtcg taggcgtact gagcggtgtc ggcatcataa ctctcgcgca ggcgaacgta 45780 ctcccacaat gaggcgttaa cgacggcctc ctcttgagtt gcaggcaatc gcgagacaga 45840 cacctcgctg tcaacggtgc cgtccggccg tatccataga tatacgggca caagcctgct 45900 caacggcacc attgtggcta tagcgaacgc ttgagcaaca tttcccaaaa tcgcgatagc 45960 tgcgacagct gcaatgagtt tggagagacg tcgcgccgat ttcgctcgcg cggtttgaaa 46020 ggcttctact tccttatagt gctcggcaag gctttcgcgc gccactagca tggcatattc 46080 aggccccgtc atagcgtcca cccgaattgc cgagctgaag atctgacgga gtaggctgcc 46140 atcgccccac attcagcggg aagatcgggc ctttgcagct cgctaatgtg tcgtttgtct 46200 ggcagccgct caaagcgaca actaggcaca gcaggcaata cttcatagaa ttctccattg 46260 aggcgaattt ttgcgcgacc tagcctcgct caacctgagc gaagcgacgg tacaagctgc 46320 tggcagattg ggttgcgccg ctccagtaac tgcctccaat gttgccggcg atcgccggca 46380 aagcgacaat gagcgcatcc cctgtcagaa aaaacatatc gagttcgtaa agaccaatga 46440 tcttggccgc ggtcgtaccg gcgaaggtga ttacaccaag cataagggtg agcgcagtcg 46500 cttcggttag gatgacgatc gttgccacga ggtttaagag gagaagcaag agaccgtagg 46560 tgataagttg cccgatccac ttagctgcga tgtcccgcgt gcgatcaaaa atatatccga 46620 cgaggatcag aggcccgatc gcgagaagca ctttcgtgag aattccaacg gcgtcgtaaa 46680 ctccgaaggc agaccagagc gtgccgtaaa ggacccactg tgccccttgg aaagcaagga 46740 tgtcctggtc gttcatcgga ccgatttcgg atgcgatttt ctgaaaaacg gcctgggtca 46800 cggcgaacat tgtatccaac tgtgccggaa cagtctgcag aggcaagccg gttacactaa 46860 actgctgaac aaagtttggg accgtctttt cgaagatgga aaccacatag tcttggtagt 46920 tagcctgccc aacaattaga gcaacaacga tggtgaccgt gatcacccga gtgataccgc 46980 tacgggtatc gacttcgccg cgtatgacta aaataccctg aacaataatc caaagagtga 47040 cacaggcgat caatggcgca ctcaccgcct cctggatagt ctcaagcatc gagtccaagc 47100 ctgtcgtgaa ggctacatcg aagatcgtat gaatggccgt aaacggcgcc ggaatcgtga 47160 aattcatcga ttggacctga acttgactgg tttgtcgcat aatgttggat aaaatgagct 47220 cgcattcggc gaggatgcgg gcggatgaac aaatcgccca gccttagggg agggcaccaa 47280 agatgacagc ggtcttttga tgctccttgc gttgagcggc cgcctcttcc gcctcgtgaa 47340 ggccggcctg cgcggtagtc atcgttaata ggcttgtcgc ctgtacattt tgaatcattg 47400 cgtcatggat ctgcttgaga agcaaaccat tggtcacggt tgcctgcatg atattgcgag 47460 atcgggaaag ctgagcagac gtatcagcat tcgccgtcaa gcgtttgtcc atcgtttcca 47520 gattgtcagc cgcaatgcca gcgctgtttg cggaaccggt gatctgcgat cgcaacaggt 47580 ccgcttcagc atcactaccc acgactgcac gatctgtatc gctggtgatc gcacgtgccg 47640 tggtcgacat tggcattcgc ggcgaaaaca tttcattgtc taggtccttc gtcgaaggat 47700 actgattttt ctggttgagc gaagtcagta gtccagtaac gccgtaggcc gacgtcaaca 47760 tcgtaaccat cgctatagtc tgagtgagat tctccgcagt cgcgagcgca gtcgcgagcg 47820 tctcagcctc cgttgccggg tcgctaacaa caaactgcgc ccgcgcgggc tgaatatata 47880 gaaagctgca ggtcaaaact gttgcaataa gttgcgtcgt cttcatcgtt tcctacctta 47940 tcaatcttct gcctcgtggt gacgggccat gaattcgctg agccagccag atgagttgcc 48000 ttcttgtgcc tcgcgtagtc gagttgcaaa gcgcaccgtg ttggcacgcc ccgaaagcac 48060 ggcgacatat tcacgcatat cccgcagatc aaattcgcag atgacgcttc cactttctcg 48120 tttaagaaga aacttacggc tgccgaccgt catgtcttca cggatcgcct gaaattcctt 48180 ttcggtacat ttcagtccat cgacataagc cgatcgatct gcggttggtg atggatagaa 48240 aatcttcgtc atacattgcg caaccaagct ggctcctagc ggcgattcca gaacatgctc 48300 tggttgctgc gttgccagta ttagcatccc gttgtttttt cgaacggtca ggaggaattt 48360 gtcgacgaca gtcgaaaatt tagggtttaa caaataggcg cgaaactcat cgcagctcat 48420 cacaaaacgg cggccgtcga tcatggctcc aatccgatgc aggagatatg ctgcagcggg 48480 agcgcatact tcctcgtatt cgagaagatg cgtcatgtcg aagccggtaa tcgacggatc 48540 taactttact tcgtcaactt cgccgtcaaa tgcccagcca agcgcatggc cccggcacca 48600 gcgttggagc cgcgctcctg cgccttcggc gggcccatgc aacaaaaatt cacgtaaccc 48660 cgcgattgaa cgcatttgtg gatcaaacga gagctgacga tggataccac ggaccagacg 48720 gcggttctct tccggagaaa tcccaccccg accatcactc tcgatgagag ccacgatcca 48780 ttcgcgcaga aaatcgtgtg aggctgctgt gttttctagg ccacgcaacg gcgccaaccc 48840 gctgggtgtg cctctgtgaa gtgccaaata tgttcctcct gtggcgcgaa ccagcaattc 48900 gccaccccgg tccttgtcaa agaacacgac cgtacctgca cggtcgacca tgctctgttc 48960 gagcatggct agaacaaaca tcatgagcgt cgtcttaccc ctcccgatag gcccgaatat 49020 tgccgtcatg ccaacatcgt gctcatgcgg gatatagtcg aaaggcgttc cgccattggt 49080 acgaaatcgg gcaatcgcgt tgccccagtg gcctgagctg gcgccctctg gaaagttttc 49140 gaaagagaca aaccctgcga aattgcgtga agtgattgcg ccagggcgtg tgcgccactt 49200 aaaattcccc ggcaattggg accaataggc cgcttccata ccaatacctt cttggacaac 49260 cacggcacct gcatccgcca ttcgtgtccg agcccgcgcg cccctgtccc caagactatt 49320 gagatcgtct gcatagacgc aaaggctcaa atgatgtgag cccataacga attcgttgct 49380 cgcaagtgcg tcctcagcct cggataattt gccgatttga gtcacggctt tatcgccgga 49440 actcagcatc tggctcgatt tgaggctaag tttcgcgtgc gcttgcgggc gagtcaggaa 49500 cgaaaaactc tgcgtgagaa caagtggaaa atcgagggat agcagcgcgt tgagcatgcc 49560 cggccgtgtt tttgcagggt attcgcgaaa cgaatagatg gatccaacgt aactgtcttt 49620 tggcgttctg atctcgagtc ctcgcttgcc gcaaatgact ctgtcggtat aaatcgaagc 49680 gccgagtgag ccgctgacga ccggaaccgg tgtgaaccga ccagtcatga tcaaccgtag 49740 cgcttcgcca atttcggtga agagcacacc ctgcttctcg cggatgccaa gacgatgcag 49800 gccatacgct ttaagagagc cagcgacaac atgccaaaga tcttccatgt tcctgatctg 49860 gcccgtgaga tcgttttccc tttttccgct tagcttggtg aacctcctct ttaccttccc 49920 taaagccgcc tgtgggtaga caatcaacgt aaggaagtgt tcattgcgga ggagttggcc 49980 ggagagcacg cgctgttcaa aagcttcgtt caggctagcg gcgaaaacac tacggaagtg 50040 tcgcggcgcc gatgatggca cgtcggcatg acgtacgagg tgagcatata ttgacacatg 50100 atcatcagcg atattgcgca acagcgtgtt gaacgcacga caacgcgcat tgcgcatttc 50160 agtttcctca agctcgaatg caacgccatc aattctcgca atggtcatga tcgatccgtc 50220 ttcaagaagg acgatatggt cgctgaggtg gccaatataa gggagataga tctcaccgga 50280 tctttcggtc gttccactcg cgccgagcat cacaccattc ctctccctcg tgggggaacc 50340 ctaattggat ttgggctaac agtagcgccc ccccaaactg cactatcaat gcttcttccc 50400 gcggtccgca aaaatagcag gacgacgctc gccgcattgt agtctcgctc cacgatgagc 50460 cgggctgcaa accataacgg cacgagaacg acttcgtaga gcgggttctg aacgataacg 50520 atgacaaagc cggcgaacat catgaataac cctgccaatg tcagtggcac cccaagaaac 50580 aatgcgggcc gtgtggctgc gaggtaaagg gtcgattctt ccaaacgatc agccatcaac 50640 taccgccagt gagcgtttgg ccgaggaagc tcgccccaaa catgataaca atgccgccga 50700 cgacgccggc aaccagccca agcgaagccc gcccgaacat ccaggagatc ccgatagcga 50760 caatgccgag aacagcgagt gactggccga acggaccaag gataaacgtg catatattgt 50820 taaccattgt ggcggggtca gtgccgccac ccgcagattg cgctgcggcg ggtccggatg 50880 aggaaatgct ccatgcaatt gcaccgcaca agcttggggc gcagctcgat atcacgcgca 50940 tcatcgcatt cgagagcgag aggcgattta gatgtaaacg gtatctctca aagcatcgca 51000 tcaatgcgca cctccttagt ataagtcgaa taagacttga ttgtcgtctg cggatttgcc 51060 gttgtcctgg tgtggcggtg gcggagcgat taaaccgcca gcgccatcct cctgcgagcg 51120 gcgctgatat gacccccaaa catcccacgt ctcttcggat tttagcgcct cgtgatcgtc 51180 ttttggaggc tcgattaacg cgggcaccag cgattgagca gctgtttcaa cttttcgcac 51240 gtagccgttt gcaaaaccgc cgatgaaatt accggtgttg taagcggaga tcgcccgacg 51300 aagcgcaaat tgcttctcgt caatcgtttc gccgcctgca taacgacttt tcagcatgtt 51360 tgcagcggca gataatgatg tgcacgcctg gagcgcaccg tcaggtgtca gaccgagcat 51420 agaaaaattt cgagagttta tttgcatgag gccaacatcc agcgaatgcc gtgcatcgag 51480 acggtgcctg acgacttggg ttgcttggct gtgatcttgc cagtgaagcg tttcgccggt 51540 cgtgttgtca tgaatcgcta aaggatcaaa gcgactctcc accttagcta tcgccgcaag 51600 cgtagatgtc gcaactgatg gggcacactt gcgagcaaca tggtcaaact cagcagatga 51660 gagtggcgtg gcaaggctcg acgaacagaa ggagaccatc aaggcaagag aaagcgaccc 51720 cgatctctta agcatacctt atctccttag ctcgcaacta acaccgcctc tcccgttgga 51780 agaagtgcgt tgttttatgt tgaagattat cgggagggtc ggttactcga aaattttcaa 51840 ttgcttcttt atgatttcaa ttgaagcgag aaacctcgcc cggcgtcttg gaacgcaaca 51900 tggaccgaga accgcgcatc catgactaag caaccggatc gacctattca ggccgcagtt 51960 ggtcaggtca ggctcagaac gaaaatgctc ggcgaggtta cgctgtctgt aaacccattc 52020 gatgaacggg aagcttcctt ccgattgctc ttggcaggaa tattggccca tgcctgcttg 52080 cgctttgcaa atgctcttat cgcgttggta tcatatgcct tgtccgccag cagaaacgca 52140 ctctaagcga ttatttgtaa aaatgtttcg gtcatgcggc ggtcatgggc ttgacccgct 52200 gtcagcgcaa gacggatcgg tcaaccgtcg gcatcgacaa cagcgtgaat cttggtggtc 52260 aaaccgccac gggaacgtcc catacagcca tcgtcttgat cccgctgttt cccgtcgccg 52320 catgttggtg gacgcggaca caggaactgt caatcatgac gacattctat cgaaagcctt 52380 ggaaatcaca ctcagaatat gatcccagac gtctgcctca cgccatcgta caaagcgatt 52440 gtagcaggtt gtacaggaac cgtatcgatc aggaacgtct gcccagggcg ggcccgtccg 52500 gaagcgccac aagatgacat tgatcacccg cgtcaacgcg cggcacgcga cgcggcttat 52560 ttgggaacaa aggactgaac aacagtccat tcgaaatcgg tgacatcaaa gcggggacgg 52620 gttatcagtg gcctccaagt caagcctcaa tgaatcaaaa tcagaccgat ttgcaaacct 52680 gatttatgag tgtgcggcct aaatgatgaa atcgtccttc tagatcgcct ccgtggtgta 52740 gcaacacctc gcagtatcgc cgtgctgacc ttggccaggg aattgactgg caagggtgct 52800 ttcacatgac cgctcttttg gccgcgatag atgatttcgt tgctgctttg ggcacgtaga 52860 aggagagaag tcatatcgga gaaattcctc ctggcgcgag agcctgctct atcgcgacgg 52920 catcccactg tcgggaacag accggatcat tcacgaggcg aaagtcgtca acacatgcgt 52980 tataggcatc ttcccttgaa ggatgatctt gttgctgcca atctggaggt gcggcagccg 53040 caggcagatg cgatctcagc gcaacttgcg gcaaaacatc tcactcacct gaaaaccact 53100 agcgagtctc gcgatcagac gaaggccttt tacttaacga cacaatatcc gatgtctgca 53160 tcacaggcgt cgctatccca gtcaatacta aagcggtgca ggaactaaag attactgatg 53220 acttaggcgt gccacgaggc ctgagacgac gcgcgtagac agttttttga aatcattatc 53280 aaagtgatgg cctccgctga agcctatcac ctctgcgccg gtctgtcgga gagatgggca 53340 agcattatta cggtcttcgc gcccgtacat gcattggacg attgcagggt caatggatct 53400 gagatcatcc agaggattgc cgcccttacc ttccgtttcg agttggagcc agcccctaaa 53460 tgagacgaca tagtcgactt gatgtgacaa tgccaagaga gagatttgct taacccgatt 53520 tttttgctca agcgtaagcc tattgaagct tgccggcatg acgtccgcgc cgaaagaata 53580 tcctacaagt aaaacattct gcacaccgaa atgcttggtg tagacatcga ttatgtgacc 53640 aagatcctta gcagtttcgc ttggggaccg ctccgaccag aaataccgaa gtgaactgac 53700 gccaatgaca ggaatccctt ccgtctgcag ataggtacca tcgatagatc tgctgcctcg 53760 cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 53820 cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 53880 gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct 53940 taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc 54000 gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga 54060 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 54120 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 54180 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 54240 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 54300 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 54360 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 54420 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 54480 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 54540 ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 54600 gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 54660 gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 54720 ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 54780 gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 54840 cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 54900 cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 54960 gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 55020 tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 55080 gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 55140 agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 55200 tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 55260 agttaatagt ttgcgcaacg ttgttgccat tgctgcaggg gggggggggg gggggttcca 55320 ttgttcattc cacggacaaa aacagagaaa ggaaacgaca gaggccaaaa agctcgcttt 55380 cagcacctgt cgtttccttt cttttcagag ggtattttaa ataaaaacat taagttatga 55440 cgaagaagaa cggaaacgcc ttaaaccgga aaattttcat aaatagcgaa aacccgcgag 55500 gtcgccgccc cgtaacct 55518 <210> 48 <211> 61 <212> DNA <213> artificial sequence <220> <223> reference sequence <400> 48 cacgtatata tacgcgtacg cgtacgtgtg aggtatatat atcctccgcc ggggcacgta 60 c 61 <210> 49 <211> 62 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 49 cacgtatata tacgcgtacg cgtacgttgt gaggtatata tatcctccgc cggggcacgt 60 ac 62 <210> 50 <211> 60 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 50 cacgtatata tacgcgtacg cgtacggtga ggtatatata tcctccgccg gggcacgtac 60 <210> 51 <211> 60 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 51 cacgtatata tacgcgtacg cgtactgtga ggtatatata tcctccgccg gggcacgtac 60 <210> 52 <211> 59 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 52 cacgtatata tacgcgtacg cgtacgtgag gtatatatat cctccgccgg ggcacgtac 59 <210> 53 <211> 32 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 53 cacgtatata tatcctccgc cggggcacgt ac 32 <210> 54 <211> 19 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 54 cacgtatata tacgcgtac 19 <210> 55 <211> 57 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 55 cacgtatata tacgcgtacg cgtgtgaggt atatatatcc tccgccgggg cacgtac 57 <210> 56 <211> 33 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 56 cacgtatata tacgcgtacg ccggggcacg tac 33 <210> 57 <211> 30 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 57 cacgtatata tcctccgccg gggcacgtac 30 <210> 58 <211> 59 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 1 <400> 58 cacgtatata tacgcgtacg cgtatgtgag gtatatatat cctccgccgg ggcacgtac 59 <210> 59 <211> 54 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 2 <400> 59 gcgctgctcg attccgtccc catggtcgcc atcacgggac aggtgccgcg acgc 54 <210> 60 <211> 18 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 2 <400> 60 Ala Leu Leu Asp Ser Val Pro Met Val Ala Ile Thr Gly Gln Val Pro 1 5 10 15 Arg Arg <210> 61 <211> 54 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 2 <400> 61 gcgttgctcg actccgtccc cattgtcgcc atcacgggac aggtgtcgcg acgc 54 <210> 62 <211> 18 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 2 <400> 62 Ala Leu Leu Asp Ser Val Pro Ile Val Ala Ile Thr Gly Gln Val Ser 1 5 10 15 Arg Arg <210> 63 <211> 54 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 2 <400> 63 gcgttgctgg actccgtgcc gatggtcgcc atcacgggac aggtgtcccg acgc 54 <210> 64 <211> 18 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 2 <400> 64 Ala Leu Leu Asp Ser Val Pro Met Val Ala Ile Thr Gly Gln Val Ser 1 5 10 15 Arg Arg <210> 65 <211> 31 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 4 <400> 65 atggctcccc cggccacccc gctccggccg t 31 <210> 66 <211> 10 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 4 <400> 66 Met Ala Pro Pro Ala Thr Pro Leu Arg Pro 1 5 10 <210> 67 <211> 30 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 4 <400> 67 atggctcccc cggccacccc ctccggccgt 30 <210> 68 <211> 10 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 4 <400> 68 Met Ala Pro Pro Ala Thr Pro Ser Gly Arg 1 5 10 <210> 69 <211> 31 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 4 <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 69 atggctcccc cggccacccc nctccggccg t 31 <210> 70 <211> 40 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 5 <400> 70 tcgactcgct caccatgtcc ggcccatgac caccgccgcc 40 <210> 71 <211> 41 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 5 <220> <221> misc_feature <222> (17)..(17) <223> n is a, c, g, or t <400> 71 tcgactcgct caccatngtc cggcccatga ctcccccggc c 41 <210> 72 <211> 24 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 6 <400> 72 attcccccgg ccaccccgtc ggcc 24 <210> 73 <211> 8 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 6 <400> 73 Ile Pro Pro Ala Thr Pro Ser Ala 1 5 <210> 74 <211> 23 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 6 <400> 74 attcccccgg ccacccgtcg gcc 23 <210> 75 <211> 7 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 6 <400> 75 Ile Pro Pro Ala Thr Arg Arg 1 5 <210> 76 <211> 24 <212> DNA <213> artificial sequence <220> <223> sequence on Fig. 6 <400> 76 attcccccgg ccacctcgtc ggcc 24 <210> 77 <211> 8 <212> PRT <213> artificial sequence <220> <223> sequence on Fig. 6 <400> 77 Ile Pro Pro Ala Thr Ser Ser Ala 1 5 <210> 78 <211> 441 <212> DNA <213> Artificial Sequence <220> <223> IN2 promoter <400> 78 atccctggcc accaaacatc cctaatcatc cccaaatttt ataggaacta ctaatttctc 60 taacttaaaa aaaatctaaa atagtatact ttagcagcct ctcaatctga tttgttcccc 120 aaatttgaat cctggcttcg ctctgtcacc tgttgtactc tacatggtgc gcagggggag 180 agcctaatct ttcacgactt tgtttgtaac tgttagccag accggcgtat ttgtcaatgt 240 ataaacacgt aataaaattt acgtaccata tagtaagact ttgtatataa gacgtcacct 300 cttacgtgca tggttatatg cgacatgtgc agtgacgtta tcagatatag ctcaccctat 360 atatatagct ctgtccggtg tcagtagcaa tcaccattca tcagcacccc ggcaggtcga 420 ccccgagctc cctgcacctg c 441 <210> 79 <211> 21 <212> DNA <213> Zea mays <400> 79 gctcccccgg ccaccccgct c 21 <210> 80 <211> 20 <212> DNA <213> Zea mays <400> 80 gctcccccgg ccaccccctc 20 <210> 81 <211> 20 <212> DNA <213> Zea mays <400> 81 cgccgagggc gactaccggc 20 <210> 82 <211> 23 <212> DNA <213> Zea mays <400> 82 cgccgagggc gactaccggc agg 23

Claims

세포의 게놈 내 비기능성 유전자 산물에 대한 기능을 복원하는 방법으로서, 게놈 내 파괴된 유전자를 포함하는 세포에 가이드 RNA/Cas 엔도뉴클레아제 복합체를 도입하는 단계를 포함하되, 상기 복합체는 이중 가닥 절단을 생성하고, 상기 파괴된 유전자는 기능성 유전자 산물을 암호화하지 않고, 상기 파괴된 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 상기 기능성 유전자 산물을 암호화할 수 있는 비파괴 유전자로 복원되는 방법.
제1항에 있어서, 상기 파괴된 유전자는 해당 비파괴 유전자와 비교할 때 PAM 서열의 상류(5') 네 번째 뉴클레오티드의 염기쌍 결실을 포함하고, 상기 염기쌍 결실은 파괴된 유전자의 유전자 산물에서 아미노산 프레임이동을 생성함으로써, 파괴된 유전자의 유전자 산물을 비기능적 상태로 만드는 방법.
제2항에 있어서, 염기쌍 결실은 코돈 서열의 첫 번째, 두 번째, 또는 세 번째 뉴클레오티드인 방법.
제1항에 있어서, 복원은 이중 가닥 절단에 단일 염기를 삽입시키는 비상동 말단 연결(NHEJ)에 의해 달성되는 방법.
세포의 게놈 내 뉴클레오티드 서열을 변형하는 방법으로서,
표적 부위 및 파괴된 선택 마커 유전자를 포함하는 적어도 하나의 세포에 제1 가이드 RNA, Cas 엔도뉴클레아제, 및 적어도 제2 가이드 RNA를 도입하되, 상기 제1 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 파괴된 선택 마커 유전자에 이중 가닥 절단을 도입할 수 있는 제1 복합체를 형성할 수 있고, 상기 파괴된 선택 마커 유전자는 폴리뉴클레오티드 변형 주형을 사용하지 않고 기능성 선택 마커 단백질을 암호화할 수 있는 비파괴 선택 마커 유전자로 복원되고, 상기 제2 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 위치한 상기 표적 부위를 인식하고, 거기에 결합하고, 닉킹 또는 절단할 수 있는 제2 복합체를 형성할 수 있는 단계; 및
상기 뉴클레오티드 서열의 변형을 갖는 세포를 상기 기능성 선택 마커 단백질에 의해 선택하는 단계를 포함하는 방법.
제5항에 있어서, 도입 및 선택 단계는 선택 마커 유전자의 도입을 포함하지 않는 방법.
제5항에 있어서, 변형은 상기 표적 부위에서의 적어도 하나의 뉴클레오티드의 삽입, 적어도 하나의 뉴클레오티드의 결실, 및 적어도 하나의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택되는 방법.
제5항에 있어서, 상기 세포에 폴리뉴클레오티드 변형 주형을 도입하는 단계를 더 포함하되, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 방법.
제8항에 있어서, 상기 폴리뉴클레오티드 변형 주형의 적어도 하나의 뉴클레오티드 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
제5항에 있어서, 상기 세포에 공여 DNA를 도입하는 단계를 더 포함하되, 상기 공여 DNA는 상기 표적 부위에 삽입될 적어도 하나의 관심 폴리뉴클레오티드를 포함하는 방법.
제5항에 있어서, 세포는 인간, 비인간, 동물, 고세균, 박테리아, 진균, 곤충, 효모, 비통상적 효모, 및 식물 세포로 이루어진 군으로부터 선택되는 방법.
제11항에 있어서, 식물 세포는 외떡잎식물 및 쌍떡잎식물 세포로 이루어진 군으로부터 선택되는 방법.
제11항에 있어서, 식물 세포는 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 토마토, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 방법.
제11항에 있어서, 상기 식물 세포로부터 식물 또는 자손 식물을 생산하는 단계를 더 포함하는 방법.
임의의 하나의 가이드 RNA 및 Cas 엔도뉴클레아제가 결여된, 제14항의 방법에 의해 생산된 식물 또는 자손 식물.
폴리뉴클레오티드 변형 주형을 사용하지 않고 세포의 게놈 내 뉴클레오티드 서열을 편집하는 방법으로서,
a) 적어도 하나의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있는 단계;
b) 상기 뉴클레오티드 서열에 적어도 하나의 단일 뉴클레오티드 결실을 포함하는 세포를 (a)로부터 선택하되, 상기 뉴클레오티드 결실은 편집될 위치에 위치하는 단계; 및
c) (b)의 세포에 적어도 하나의 가이드 RNA 및 적어도 하나의 Cas 엔도뉴클레아제를 도입하되, 상기 가이드 RNA 및 Cas 엔도뉴클레아제는 상기 뉴클레오티드 서열에 이중 가닥 절단을 도입할 수 있는 복합체를 형성할 수 있고, 폴리뉴클레오티드 변형 주형을 사용하지 않고 (b)의 뉴클레오티드 결실과 동일한 위치에 단일 뉴클레오티드를 삽입할 수 있는 단계를 포함하는 방법.
제1항에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체를 형성하는 가이드 RNA 및 Cas 엔도뉴클레아제 단백질은 각각 RNA 및 단백질로서 세포에 도입되는 방법.
제1항에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체는 리보뉴클레오티드-단백질 복합체로서 세포에 도입되는 방법.
제1항에 있어서, 가이드 RNA/Cas 엔도뉴클레아제 복합체의 성분은 Cas 엔도뉴클레아제 단백질을 암호화하는 mRNA로서, 그리고 가이드 RNA를 포함하는 RNA로서 도입되는 방법.
가이드 RNA/Cas 엔도뉴클레아제 복합체를 세포 내에 전달하는 방법으로서,
적어도 하나의 가이드 RNA 분자와 적어도 하나의 Cas 엔도뉴클레아제 단백질을 결합하여 리보뉴클레오티드-단백질을 형성하는 단계 및 상기 리보뉴클레오티드-단백질을 입자 전달 매트릭스와 결합하여 상기 리보뉴클레오티드-단백질과 매트릭스가 결합될 수 있도록 하여 리보뉴클레오티드-단백질-매트릭스 복합체를 형성하는 단계; 및 상기 리보뉴클레오티드-단백질-매트릭스 복합체를 상기 세포에 도입하는 단계를 포함하는 방법.
제20항에 있어서, 폴리뉴클레오티드 주형을 도입하는 단계를 더 포함하되, 상기 폴리뉴클레오티드 변형 주형은 상기 세포의 게놈 내 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하며, 상기 폴리뉴클레오티드 변형 주형의 상기 적어도 하나의 뉴클레오티드 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
제20항에 있어서, 공여 DNA를 도입하는 단계를 더 포함하되, 상기 공여 DNA는 적어도 하나의 관심 폴리뉴클레오티드를 포함하는 방법.
제20항에 있어서, 입자 전달 매트릭스는 양이온성 지질과 결합된 미립자를 포함하는 방법.
제1항에 있어서, 상기 Cas 엔도뉴클레아제는 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-H, Cas5, Cas7, Cas8, Cas10, 또는 이들의 복합체로 이루어진 군으로부터 선택되는 방법.