KR20220116485A

KR20220116485A - 쌍을 형성한 닉카제를 이용하는 개선된 게놈 편집

Info

Publication number: KR20220116485A
Application number: KR1020227023886A
Authority: KR
Inventors: 카텔린 드'할루인; 티모시 제임스 골스; 데이비드 드 블레스샤우어
Original assignee: 바스프 아그리컬쳐럴 솔루션즈 시드 유에스 엘엘씨
Priority date: 2019-12-16
Filing date: 2020-12-07
Publication date: 2022-08-23
Also published as: WO2021122080A1; CN114829612A; US20230042273A1; AU2020404580A1; EP4077682A1; CA3161254A1

Abstract

정확한 유전자 편집의 도입을 비롯한 게놈 편집은 이배체 식물에서 널리 확립되어 있다. 관련 기술분야에서 널리 확립된 방법은 Zn-핑거 뉴클레아제, 귀소 엔도뉴클레아제, TALEN 또는 RNA 가이딩된 뉴클레아제, 예를 들어 Cas9 또는 Cas12a와 같은 기술을 적용하여 식물의 게놈에 이중 가닥 DNA 파단을 도입한다.

Description

쌍을 형성한 닉카제를 이용하는 개선된 게놈 편집

본 발명은 식물 분자 생물학 분야에 관한 것이며, 작물, 바람직하게는 이질배수체 및/또는 다배수체 작물에서 개선된 게놈 편집을 위한 방법에 관한 것이다.

식물 세포, 예를 들어 배아, 캘러스 또는 원형질체에서 적용된 게놈 편집은 게놈에서 이중 가닥 파단이 오류가 발생하기 쉬운 비상동성 말단 연결 (NHEJ)에 의해 복구되는 경우 무작위 삽입 및/또는 결실 (InDel)을 포함하는 돌연변이, 편집 접근법이 실패한 경우 변경되지 않은 게놈 서열, 또는 파단이 상동성 재조합, 보통 식물 이중 가닥 파단 복구에서 가장 적게 발생하는 메카니즘에 의해 복구되는 경우 정확한 편집 (PE)을 유도하는데 합리적으로 효율적이다.

이배체 식물에서 이는 하기 유전자형을 유도할 것이다: WT/WT, WT/InDel, InDel/InDel, PE/WT, PE/InDel 또는 PE/PE. 정확한 편집이 의도되고, 무작위 돌연변이를 피해야 하는 경우, 바람직한 조합은 PE/WT 또는 PE/PE일 것이다. 이들 조합에 대한 스크리닝 시스템은 쉽게 이용가능하며, 게놈 편집의 개선된 효율성에 의해 합리적인 수의 세포만이 이배체 식물에서 스크리닝되어야 한다.

그러나, 이질배수체 및/또는 다배수체 유기체에서 잠재적인 조합의 수가 증가하며, InDel 돌연변이를 포함하는 식물 세포를 피하고, 이질배수체 및/또는 다배수체 식물에 존재하는 1개 초과의 게놈에서 바람직한 조합을 확인하기 위해 막대한 수의 세포가 필요하다. 비용- 및 노동-집약적인 스크리닝을 감소시키기 위해, 감소된 백분율의 InDel 및 더 높은 백분율의 PE를 갖는 방법이 관련 기술분야에서 요구된다.

이러한 방법은 특히 이질배수체 및/또는 다배수체 작물, 예컨대 밀, 트리티케일, 목화, 감자, 유지 종자 평지, 리크, 담배, 땅콩, 귀리, 키위, 바나나, 딸기, 사탕수수, 오카 및 일부 사과 및 키누 품종의 경우에 흥미롭다.

NHEJ는 대부분 HR 복구를 가능하게 하는 DNA가 이중 가닥 DNA 파단에 존재하지 않는 경우에 발생한다. HR 복구는 이중 가닥 파단에서 또는 그 부근에서의 DNA와 특정한 정도의 상동성을 갖는 DNA 영역을 필요로 한다. 이 상동성 DNA는 식물의 게놈 내에 존재할 수 있거나 또는 이중 가닥 파단에서 또는 그 부근에서의 게놈 DNA와 특정한 정도의 상동성을 갖는 3' 및/또는 5' 말단 영역을 포함하는 공여자 DNA 상에 존재할 수 있다. 그러나, 공여자 DNA가 이중 가닥 파단 유도제와 함께 세포에 도입되는 경우, 이는 DNA 복구가 일어나는 당시에 파단 부위에 존재하지 않을 수 있다.

본 발명은 이중 가닥 DNA의 물리적인 분리를 유도하지 않고 이중 가닥 DNA의 한 가닥 또는 두 가닥 모두를 닉킹하는 쌍을 형성한 닉카제를 이용하는 방법을 제공한다. 이러한 닉은 이중 가닥 파단을 유도하지 않지만, 닉 사이의 염기 쌍은 두 가닥의 상보성인 염기 사이의 수소 결합을 온전하게 유지함으로써 함께 상보성인 DNA 가닥을 유지한다. 3' 및/또는 5' 말단에서 상동성 오버행을 갖는 각각의 공여자 DNA 분자가 복구 당시에 닉에 존재하고, 따라서 무작위 InDel 돌연변이의 백분율이 감소하는 경우에, 복구는 WT 서열 또는 정확한 유전자 편집을 유도할 것이다.

EP3138912는 가이드 RNA에 대해 특정한 상동성을 갖는 비표적 부위에서 단일 Cas9 뉴클레아제 결합에 의해 도입된 표적외 이중 가닥 파단의 백분율을 감소시키도록 식물 세포의 게놈에 이중 가닥 파단을 도입하기 위해 쌍을 형성한 Cas9 닉카제를 개시한다. 저자는 닉카제가 이중 가닥 파단을 유도하기 위해 충분히 근접하게 닉킹해야 한다는 점을 명시적으로 지적한다. 그러나, 이들은 이중 가닥 파단을 도입하기 위해 충분히 가까운 거리가 얼마인지에 대한 지침을 제공하지 않으며, 이들은 복구 과정에서 InDel의 백분율을 감소시키는 문제에 대해서는 언급하지 않는다.

[Mali et al (2013)]은 공여자 DNA 분자를 공동 전달하지 않고 InDel을 유도하기 위해 이배체 인간 세포에서 쌍을 형성한 Cas9 닉카제의 사용을 개시한다.

[Schiml et al (2014) 및 Fauser et al (2014)]은 공여자 DNA 분자를 공동 전달하지 않고 염색체내 상동성 재조합을 유도하기 위해 이배체 아라비돕시스(Arabidopsis) 세포에서 쌍을 형성한 Cas9 닉카제 또는 단일 Cas9 닉카제의 사용을 기재한다.

[Mikami et al (2016)]은 공여자 DNA 분자를 공동 전달하지 않고 표적외 돌연변이의 백분율을 감소시키기 위해 이배체 벼 세포에서 쌍을 형성한 Cas9 닉카제의 사용을 기재한다.

[Wolter et al (2018)]은 공여자 DNA 분자를 공동 전달하지 않고 염색체내 상동성 재조합을 유도하기 위해 이배체 아라비돕시스 세포에서 쌍을 형성한 Cas9 닉카제의 사용을 개시한다. 이들은 게놈의 상이한 로커스에서 재조합 전에 식물 게놈으로부터 절단된 공여자 DNA에 의존하는 아라비돕시스에서의 식물체내 유전자 표적화 시스템에서, 표적 로커스에서 이중-가닥 DNA 파단의 도입만이 식물 게놈에서 상당수의 정확한 유전자 편집을 유도한 반면에, 닉카제 또는 쌍을 형성한 닉카제를 사용하여 임의의 진정한 유적화 표적화 사건이 전혀 또는 거의 확인되지 않았음을 나타낸다. 쌍을 형성한 닉카제에 의해 얻은 사건의 대부분은 이소성 재조합 사건이었다.

최근에 개발된 CRISPR 방법을 이용하여 이질배수체 및/또는 다배수체 식물, 바람직하게는 이질배수체 및/또는 다배수체 작물의 게놈의 미리 정의된 영역에 공여자 DNA의 효율적이고 신뢰가능한 도입이 관련 기술분야에서 요구된다. 더욱이, 식물 게놈에서 발생하는 InDel의 비율을 감소시킴으로써 식물, 바람직하게는 이질배수체 및/또는 다배수체 식물, 예를 들어 이질배수체 및/또는 다배수체 작물의 게놈에 공여자 DNA의 도입을 효율적으로 증가시키는 것이 관련 기술분야에서 요구된다.

본 발명의 제1 실시양태는 하기 단계를 포함하는, 식물 세포, 바람직하게는 작물 식물 세포, 더욱 바람직하게는 이질배수체 또는 다배수체 또는 이질배수체 및 다배수체 작물 식물 세포, 가장 바람직하게는 밀 세포의 게놈의 적어도 하나의 표적 영역에 적어도 하나의 공여자 DNA 분자를 도입하는 방법을 포함하며,

a. 상기 식물 세포에 하기를 도입하는 단계:

i. 공여자 DNA 분자 및

ii. 적어도 하나의 RNA 가이딩된 닉카제 및

iii. 적어도 2개의 단일 가이드 RNA (sgRNA) 또는 적어도 2개의 CRISPR RNA (crRNA) 및 트랜스-활성화 RNA (tracrRNA) 및

b. 게놈의 상기 적어도 하나의 표적 영역에 상기 적어도 하나의 공여자 DNA를 도입할 수 있도록 식물 세포를 인큐베이션하는 단계, 및

c. 상기 표적 영역에서 공여자 DNA 분자의 서열을 포함하는 식물 세포를 선택하는 단계,

여기서 닉카제는 식물 세포, 바람직하게는 작물 식물 세포, 더욱 바람직하게는 이질배수체 또는 다배수체 또는 이질배수체 및 다배수체 작물 식물 세포, 가장 바람직하게는 밀 세포의 게놈 DNA의 표적 부위에서, 즉, 표적 영역 내에서 또는 그 근처에서 반대쪽 가닥 상에 또는 한 가닥 상에 적어도 2개의 닉을 생성하고,

여기서 이들 닉은 서로 적어도 20개 염기 쌍 떨어져 있고,

여기서 닉 사이의 염기 쌍은 용해되지 않고, 상보성인 염기 사이의 수소 결합을 온전하게 유지함으로써 함께 DNA 이중 가닥을 유지하고,

여기서 각각의 닉킹 부위는 적어도 하나의 PAM 서열에 인접하고,

여기서 적어도 2개의 sgRNA 또는 적어도 2개의 tracrRNA 및 crRNA는 적어도 하나의 RNA 가이딩된 닉카제를 표적 부위로 표적화한다.

바람직한 실시양태에서, 닉은 서로 적어도 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 105, 110, 115, 120, 125, 130, 135, 140, 145 또는 150개 염기 쌍 떨어져 있지만, 서로 200, 195, 190, 185, 180, 175, 170, 165, 160 또는 155개 염기 쌍 이하로 떨어져 있다.

한 실시양태에서, 공여자 DNA는 표적 영역에서의 서열과 각각 적어도 80% 동일한 그의 5' 및/또는 3' 말단에서 적어도 30개의 염기에 기능적으로 연결되고, 바람직하게는 공여자 DNA는 그의 5' 및 3' 말단에서 이러한 서열에 기능적으로 연결된다. 바람직하게는, 공여자 DNA의 적어도 한 측에서, 바람직하게는 공여자 DNA의 양측에서의 서열은 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90 또는 적어도 100개의 염기를 포함한다. 더욱 바람직하게는, 공여자 DNA의 적어도 한 측에서, 바람직하게는 공여자 DNA의 양측에서의 서열은 적어도 150개의 염기, 적어도 200개의 염기, 적어도 300개의 염기, 적어도 350개의 염기 또는 적어도 400개의 염기를 포함한다. 이들 염기는 RNA 가이딩된 닉카제에 의해 도입된 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및 3' 영역과 적어도 80%, 바람직하게는 적어도 85%, 바람직하게는 90%, 바람직하게는 91%, 92%, 93% 또는 94% 동일하다. 더욱 바람직하게는, 이들 염기는 RNA 가이딩된 닉카제에 의해 도입된 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및 3' 영역과 적어도 95% 동일하거나, 96% 동일하거나, 97% 동일하거나, 98% 동일하거나 또는 99% 동일하다. 가장 바람직한 실시양태에서, 이들 염기는 RNA 가이딩된 닉카제에 의해 도입된 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및 3' 영역과 100% 동일하다.

한 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 30개의 염기는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 100% 동일하고, 공여자 DNA 또는 그의 서열은 게놈 DNA에 삽입된다. 또 다른 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 40 또는 50개의 염기는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 적어도 98% 동일하다. 추가의 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 60 또는 70개의 염기는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 적어도 95% 동일하다. 바람직한 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 80 또는 90개의 염기는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 적어도 92% 동일하다. 더욱 바람직한 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 100개의 염기는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 적어도 90% 동일하다. 더욱 바람직한 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 150 또는 200개의 염기는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 적어도 85% 동일하다. 추가의 바람직한 실시양태에서, 공여자 DNA의 5' 및/또는 3' 말단에서 적어도 250, 300, 350 또는 400개는 이중 가닥 또는 단일 가닥 닉의 각각의 5' 및/또는 3' 영역과 적어도 80% 동일하다.

본 발명의 한 실시양태에서, 공여자 DNA 분자는 단일 가닥이고, 또 다른 실시양태에서, 공여자 DNA 분자는 이중 가닥이다. 한 실시양태에서, 공여자 DNA 분자는 10개 이하의 뉴클레오티드 길이이거나, 또 다른 실시양태에서, 이는 20, 30 40 또는 50개 이하의 뉴클레오티드 길이이다. 또 다른 실시양태에서, 공여자 DNA 분자는 60, 70, 80, 90 또는 100개 이하의 뉴클레오티드 길이이다. 또 다른 실시양태에서, 공여자 DNA 분자는 125, 150, 200, 300, 400 또는 500개 이하의 뉴클레오티드 길이이다. 또 다른 실시양태에서, 공여자 DNA 분자는 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 또는 1500개 이하의 뉴클레오티드 길이이다. 또 다른 실시양태에서, 공여자 DNA 분자는 2000, 2500, 3000, 3500, 4000, 4500 또는 5000개 이하의 뉴클레오티드 길이이다.

한 실시양태에서, 공여자 DNA 분자는 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물의 게놈의 표적 영역에 부가되고, 게놈 DNA를 대체하지 않는다. 또 다른 실시양태에서, 공여자 DNA 분자는 공여자 DNA 분자보다 짧거나, 그와 동일한 크기이거나 또는 그보다 긴 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물 게놈의 표적 영역에서 서열을 대체한다.

한 실시양태에서, 공여자 DNA 분자는 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물 게놈의 표적 영역에 존재하지 않는 서열을 포함한다. 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물 게놈의 표적 영역에서 이러한 DNA 분자의 도입에 의해 조절 영역, 예컨대 프로모터, 인트론, 인핸서 또는 종결자를 포함할 수 있는 추가의 DNA가 게놈에 부가되고, 이는 전사된 영역, 예컨대 ORF를 포함할 수 있거나 또는 비코딩 RNA, 예컨대 마이크로RNA 전구체, 긴 비코딩 RNA 등을 코딩할 수 있거나 또는 이는 하나 이상의 발현 구축물을 포함할 수 있다. 또 다른 실시양태에서, 공여자 DNA 분자는 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물 게놈의 표적 영역과 상동성인 서열을 포함하지만, 게놈의 표적 영역에서 WT 서열과 상이한 하나 이상의 정확한 유전자 편집을 포함한다. 이러한 공여자 DNA 분자는 게놈에서 상응하는 서열을 대체하여, 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물 게놈에 정확한 유전자 편집을 도입한다.

식물 세포는 바람직하게는 이질배수체 또는 다배수체 식물, 예컨대 국화, 달리아 또는 샤프란, 바람직하게는 이질배수체 또는 다배수체 작물, 예를 들어 밀, 트리티케일, 목화, 감자, 유지 종자 평지, 리크, 담배, 땅콩, 귀리, 키위, 바나나, 딸기, 씨없는 수박, 바나나, 시트러스, 사탕수수, 오카 및 일부 사과 및 키누 품종으로부터 유래된다.

세포의 게놈에의 공여자 DNA의 도입을 가능하게 하는 식물 세포의 인큐베이션은 세포의 생존력을 유지하는데 유리한 임의의 조건에서 일어날 수 있다. 온도는 예를 들어 사용되는 RNA 가이딩된 닉카제에 따라 바람직하게는 20℃ 내지 32℃이다. Cas9 닉카제 (nCas9)와 관련하여, 온도는 바람직하게는 18℃ 내지 30℃, 더욱 바람직하게는 20℃ 내지 28℃, 가장 바람직하게는 22℃ 내지 26℃이다. Cas12a 닉카제 (nCas12a)와 관련하여, 온도는 바람직하게는 22℃ 내지 32℃, 더욱 바람직하게는 24℃ 내지 30℃, 가장 바람직하게는 28℃ 내지 30℃이다.

세포는 바람직하게는 16h 명/8h 암 조건하에, 바람직하게는 약광 조건하에, 더욱 바람직하게는 암실에서 인큐베이션된다. 인큐베이션 시간은 상기 조건하에 1 일 내지 7 주, 바람직하게는 5 주 내지 7 주이다.

RNA 가이딩된 닉카제는 각각 어닐링된 crRNA 및 tracrRNA 또는 단일 가이드 RNA에 의해 표적 부위로 가이딩된다. 표적 부위는 사용된 RNA 가이딩된 닉카제에 대해 특이적인 PAM 서열에 인접해 있다.

각각의 세포의 게놈 DNA에서 2개의 표적 부위가 닉킹되는 경우, 적어도 2개의 어닐링된 crRNA 및 tracrRNA 또는 적어도 2개의 단일 가이드 RNA 또는 적어도 하나의 어닐링된 crRNA 및 tracrRNA 및 적어도 하나의 단일 가이드 RNA가 세포에 도입되고, 이들 각각은 각각의 닉카제를 PAM 서열에 인접한 그의 표적 부위로 표적화시킨다.

본 발명의 추가의 실시양태는 하기 단계를 포함하는, 식물, 바람직하게는 작물 식물, 더욱 바람직하게는 이질배수체 또는 다배수체 작물 식물, 가장 바람직하게는 공여자 DNA를 포함하는 밀 식물을 생성하는 방법이며, 공여자 DNA는 바람직하게는 정확한 유전자 편집을 포함하며,

a. 상기 식물의 세포에 하기를 도입하는 단계:

i. 공여자 DNA 분자 및

ii. 적어도 하나의 RNA 가이딩된 닉카제 및

iii. 적어도 2개의 sgRNA 또는 적어도 2개의 crRNA 및 tracrRNA 및

b. 상기 식물 세포의 게놈의 표적 영역에 상기 적어도 하나의 공여자 DNA를 도입할 수 있도록 식물 세포를 인큐베이션하는 단계, 및

c. 상기 표적 영역에서 공여자 DNA 분자의 서열을 포함하는 식물 세포를 선택하는 단계, 및

d. 상기 선택된 식물 세포로부터 식물을 재생시키는 단계,

여기서 닉카제는 식물 세포, 바람직하게는 작물 식물 세포, 더욱 바람직하게는 이질배수체 또는 다배수체 작물 식물 세포, 가장 바람직하게는 밀 세포의 게놈 DNA의 표적 부위에서, 즉, 표적 영역 내에서 또는 그 근처에서 반대쪽 가닥 상에 또는 한 가닥 상에 적어도 2개의 닉을 생성하고, 여기서 이들 닉은 서로 적어도 20개 염기 쌍 떨어져 있고,

한 실시양태에서, 공여자 DNA 분자는 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물의 게놈의 표적 영역에 부가되고, 게놈 DNA를 대체하지 않는다. 또 다른 실시양태에서, 공여자 DNA 분자는 공여자 DNA 분자보다 짧거나, 그와 동일한 크기이거나 또는 그보다 긴 이질배수체 또는 다배수체 식물, 바람직하게는 이질배수체 또는 다배수체 작물 게놈의 표적 영역에서의 서열을 대체한다.

본 발명의 추가의 실시양태는 단계 b. 후에 식물 세포를 선택 작용제를 포함하는 배지 상에서 인큐베이션하는 것인 상기 기재된 방법이다.

음성 선택 마커는 살생물성 화합물, 예컨대 대사 억제제 (예를 들어, 2-데옥시글루코스-6-포스페이트, WO 98/45456), 항생제 (예를 들어, 카나마이신, G 418, 블레오마이신 또는 히그로마이신) 또는 제초제 (예를 들어, 포스피노트리신 또는 글리포세이트)에 대한 내성을 부여한다. 특히 바람직한 음성 선택 마커는 제초제에 대한 내성을 부여하는 것들이다. 이들 마커 중 일부는 마커로서 그들의 기능 외에도 생성된 식물에 제초제 내성 속성을 부여하기 위해 사용될 수 있다. 언급될 수 있는 예는 다음과 같다:

- 포스피노트리신 아세틸트랜스퍼라제 (PAT; 비알로포스(Bialophos) 내성으로도 명명됨; bar; de Block et al. (1987) EMBO J 6:2513-2518; EP 0 333 033; US 4,975,374)

- 글리포세이트 (N-포스포노메틸 글리신)에 대한 내성을 부여하는 5-에놀피루빌시키메이트-3-포스페이트 신타제 (EPSPS; US 5,633,435) 또는 글리포세이트 옥시도리덕타제 유전자 (US 5,463,175) (Shah et al. (1986) Science 233: 478)

- 글리포세이트 분해 효소 (글리포세이트 옥시도리덕타제; gox),

- 달라폰 불활성화 데할로게나제 (deh)

- 술포닐우레아- 및 이미다졸리논-불활성화 아세토락테이트 신타제 (예를 들어 S4 및/또는 Hra 돌연변이를 갖는 예를 들어 돌연변이된 ALS 변이체

- 브로목시닐 분해 니트릴라제 (bxn)

- 예를 들어 네오마이신 포스포트랜스퍼라제를 코딩하는 카나마이신- 또는 G418- 내성 유전자 (NPTII; NPTI) (Fraley et al. (1983) Proc Natl Acad Sci USA 80:4803), 이는 항생제 카나마이신 및 관련 항생제 네오마이신, 파로모마이신, 겐타미신, 및 G418에 대한 내성을 부여하는 효소를 발현함,

- 2-데옥시글루코스에 대한 내성을 부여하는 2-데옥시글루코스-6-포스페이트 포스파타제 (DOGR1-유전자 산물; WO 98/45456; EP 0 807 836) (Randez-Gil et al. (1995) Yeast 11:1233-1240)

- 히그로마이신에 대한 내성을 매개하는 히그로마이신 포스포트랜스퍼라제 (HPT) (Vanden Elzen et al. (1985) Plant Mol Biol. 5:299).

- 디히드로폴레이트 리덕타제 (Eichholtz et al. (1987) Somatic Cell and Molecular Genetics 13, 67-76)

항생제에 대한 내성을 부여하는 박테리아 기원의 추가의 음성 선택가능한 마커 유전자에는 항생제 스펙티노마이신, 겐타마이신 아세틸 트랜스퍼라제, 스트렙토마이신 포스포트랜스퍼라제 (SPT), 아미노글리코시드-3-아데닐 트랜스퍼라제 및 블레오마이신 내성 결정인자에 대한 내성을 부여하는 aadA 유전자가 포함된다 (Svab et al. (1990) Plant Mol. Biol. 14:197; Jones et al. (1987) Mol. Gen. Genet. 210:86; Hille et al. (1986) Plant Mol. Biol. 7:171 (1986); Hayford et al. (1988) Plant Physiol. 86:1216).

음성 선택 마커, 예를 들어 효모 로도토룰라 그라실리스(Rhodotorula gracilis) (로도스포리디움 토룰로이데스(Rhodosporidium toruloides))로부터의 다올 유전자 (EC: 1.4. 3.3: 진뱅크 수탁 번호: U60066) 및 이. 콜라이(E. coli) 유전자 dsdA (D-세린 데히드라타제 (D-세린 데아미나제) [EC: 4.3. 1.18; 진뱅크 수탁 번호: J01603)는 예를 들어 D-알라닌 및 D-세린과 같은 D-아미노산에 의해 부여된 독성 효과에 대한 내성을 추가로 부여할 수 있다 (WO 03/060133; Erikson et al. (2004) Nat Biotechnol. 22(4):455-8). 사용된 D-아미노산에 따라, D-아미노산 옥시다제 마커는 음성 선택 (예를 들어, D-알라닌 또는 D-세린과 조합될 때) 또는 대항 선택 (예를 들어, D-류신 또는 D-이소류신과 조합될 때)을 제공하는 이중 기능 마커로서 사용될 수 있다.

대안적으로, 양성 선택 마커가 본 발명의 방법에 적용될 수 있다. 이러한 양성 선택 마커는 형질전환되지 않은 것과 비교하여 형질전환된 식물에게 성장 이점을 부여한다. 시토키닌 생합성의 핵심 효소로서 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) (균주:PO22; 진뱅크 수탁 번호: AB025109)로부터의 이소펜테닐트랜스퍼라제와 같은 유전자는 형질전환된 식물의 재생을 용이하게 할 수 있다 (예를 들어, 시토키닌-무함유 배지에서 선택에 의해). 상응하는 선택 방법이 (Ebinuma et al. (2000a) Proc Natl Acad Sci USA 94:2117-2121; Ebinuma et al. (2000b) Selection of Marker-free transgenic plants using the oncogenes (ipt, rol A, B, C) of Agrobacterium as selectable markers, In Molecular Biology of Woody Plants. Kluwer Academic Publishers)에 기재되어 있다. 형질전환되지 않은 것과 비교하여 형질전환된 식물에게 성장 이점을 부여하는 추가의 양성 선택 마커는 예를 들어 EP-A 0 601 092에 기재되어 있다. 성장 자극 선택 마커에는 글루쿠로니다제 (예를 들어 시토키닌 글루쿠로니드와 조합됨), 만노스-6-포스페이트 아이소머라제 (만노스와 조합됨), UDP-갈락토스-4-에피머라제 (예를 들어 갈락토스와 조합됨)가 포함될 수 있다 (그러나 이로 제한되지 않음).

대항 선택 마커는 상기 마커를 포함하는 정의된 결실된 서열을 갖는 유기체를 선택하는데 특히 적합하다 (Koprek et al. (1999) Plant J 19(6): 719-726). 대항 선택 마커에 대한 예에는 티미딘 키나제 (TK), 시토신 데아미나제 (Gleave et al. (1999) Plant Mol Biol. 40(2):223-35; Perera et al. (1993) Plant Mol. Biol 23(4): 793-799; Stougaard (1993) Plant J 3:755-761), 시토크롬 P450 단백질 (Koprek et al. (1999) Plant J 19(6): 719-726), 할로알칸 데할로게나제 (Naested (1999) Plant J 18:571-576), iaaH 유전자 산물 (Sundaresan et al. (1995) Gene Develop 9: 1797-1810), 시토신 데아미나제 codA (Schlaman and Hooykaas (1997) Plant J 11:1377-1385), 또는 tms2 유전자 산물 (Fedoroff and Smith (1993) Plant J 3:273- 289)이 포함된다.

본 발명의 방법에서, RNA 가이딩된 닉카제는 임의의 RNA 가이딩된 닉카제일 수 있고, 바람직하게는 이들은 Cas 닉카제이다. 숙련된 기술자는 관련 기술분야에 기재된 여러 Cas 닉카제를 알고 있다. 예를 들어, Cas9, Cas12a, Cas12b, CasX, CasY, C2c1, C2c3, C2c2, Cas12k 등.

또한, 새로운 Cas 닉카제를 확인하는 방법은 (US9790490)에 기재되어 있으며, 숙련된 기술자는 아직 알려지지 않은 추가의 Cas 닉카제를 단리할 수 있다.

본 발명의 바람직한 실시양태에서, Cas 닉카제는 Cas9 또는 Cas12a 닉카제, 또는 불활성 Cas (dCas), 예를 들어 닉카제 활성, 예를 들어 FokI 닉카제에 융합된 dCas9 또는 dCas12a 융합 단백질이다 (US9200266).

본 발명의 방법의 추가의 실시양태에서, 닉카제 또는 적어도 하나의 sgRNA 또는 적어도 하나의 crRNA 및 tracrRNA는 핵산 분자에 의해 코딩되어 상기 세포에 도입된다. 상기 핵산 분자는 각각의 닉카제, sgRNA, crRNA 및/또는 tracrRNA를 코딩하는 RNA 분자 또는 선형 DNA 분자일 수 있고, 바람직하게는 핵산 분자는 상기 적어도 하나의 닉카제 또는 적어도 하나의 sgRNA 또는 적어도 하나의 crRNA 및 tracrRNA를 코딩하는 발현 카세트를 포함하는 플라스미드이다.

바람직한 실시양태에서, 적어도 하나의 닉카제는 각각의 이질배수체 또는 다배수체 식물에서의 발현을 위해 최적화된 서열이다. 서열 최적화는 숙련된 기술자에게 공지된 기술이다. 임의의 주어진 DNA 또는 RNA 분자를 각각의 단백질이 발현되어야 하는 유기체의 바람직한 코돈 용법에 맞게 조정하는 컴퓨터 프로그램이 이용가능하다. 일부 프로그램은 추가로 잠재 스플라이스 측의 돌연변이, RNA 폴딩의 감소 등을 가능하게 한다.

RNA 가이딩된 닉카제 및 적어도 하나의 sgRNA 또는 적어도 하나의 crRNA 및 tracrRNA는 숙련된 기술자에게 공지된 임의의 방법을 이용하여 세포에 도입될 수 있다. 아그로박테리움 매개된 형질전환, PEG, 지단백질 또는 다른 폴리펩티드를 사용하는 형질감염, 전기천공 또는 탄도적 방법, 예컨대 입자 충격과 같은 방법이 적용될 수 있다. 바람직하게는, 적어도 하나의 RNA 가이딩된 닉카제 및 적어도 하나의 sgRNA 또는 적어도 하나의 crRNA 및 tracrRNA는 상기 세포의 외부에서 조립된 리보핵단백질 (RNP)로서 상기 세포에 도입된다.

본 발명의 방법의 바람직한 실시양태에서, 공여자 DNA 및 crRNA/tracrRNA 또는 sgRNA의 조합은 표적 영역에의 공여자 DNA 분자의 효율적인 도입을 위해 미리 선택된다. 본 발명의 방법의 바람직한 실시양태에서, 적어도 하나의 공여자 DNA 및 적어도 하나의 RNA 가이딩된 닉카제 및 적어도 하나의 단일 가이드 RNA (sgRNA) 또는 tracrRNA 및 crRNA는 DNA의 입자 충격 또는 아그로박테리움 매개된 도입을 이용하여 상기 세포에 도입된다.

바람직하게는, 적어도 하나의 RNA 가이딩된 닉카제는 핵 국재화 신호를 포함한다.

정의

약어: GFP - 녹색 형광 단백질, GUS - 베타-글루쿠로니다제, BAP - 6-벤질아미노퓨린; 2,4-D - 2,4-디클로로페녹시아세트산; MS - 무라쉬게(Murashige) 및 스쿠그(Skoog) 배지; NAA - 1-나프탈렌아세트산; MES, 2-(N-모르폴리노-에탄술폰산, IAA 인돌 아세트산; Kan: 카나마이신 술페이트; GA3 - 지베렐산; 티멘틴(Timentin)^TM: 티카르실린 이나트륨 / 클라불라네이트 칼륨, microl: 마이크로리터.

본 발명이 특정한 방법 또는 프로토콜로 제한되지 않음을 이해해야 한다. 또한, 본원에서 사용된 용어가 단지 특정한 실시양태를 기재하기 위한 목적이며, 첨부된 청구항에 의해서만 제한되는 본 발명의 범위를 제한하는 것으로 의도되지 않음을 이해해야 한다. 본원 및 첨부된 청구항에서 사용된 바와 같이, 단수 형태는 문맥상 명백하게 달리 지시되지 않는다면 복수형을 포함한다는 것을 유의해야 한다. 따라서, 예를 들어, "벡터"에 대한 언급은 하나 이상의 벡터들에 대한 언급이며, 관련 기술분야의 기술자에게 공지된 그의 등가물 등을 포함한다. 용어 "약"은 대략, 거의, 그 즈음 또는 그 정도를 의미하기 위해 본원에서 사용된다. 용어 "약"이 수치 범위와 함께 사용되는 경우, 이는 명시된 수치 값의 상한 및 하한을 연장시킴으로써 해당 범위를 변형시킨다. 일반적으로, 용어 "약"은 20%, 바람직하게는 10%만큼 위로 또는 아래로 (높게 또는 낮게) 변동시킴으로써 명시된 값의 위 및 아래의 수치 값을 변형시키기 위해 본원에서 사용된다. 본원에서 사용된 바와 같이, 단어 "또는"은 특정한 목록의 임의의 한 구성원을 의미하고, 해당 목록의 구성원의 임의의 조합을 또한 포함한다. 단어 "포함하다" 및 "포함하는"이 본 명세서 및 하기 청구항에서 사용될 때, 이들은 하나 이상의 명시된 특징, 정수, 성분 또는 단계의 존재를 구체화하기 위해 의도되지만, 이들은 그의 하나 이상의 다른 특징, 정수, 성분, 단계 또는 그룹의 존재 또는 추가를 배제하지 않는다. 명확성을 위해, 본 명세서에서 사용된 특정한 용어들은 하기와 같이 정의되고 사용된다:

역평행: "역평행"은 본원에서 한 뉴클레오티드 서열에서는 5'-3' 방향으로 및 다른 뉴클레오티드 서열에서는 3'-5' 방향으로 진행하는 포스포디에스테르 결합을 갖는 상보성인 염기 잔기들 사이에서 수소 결합을 통해 쌍을 형성한 2개의 뉴클레오티드 서열을 지칭한다.

안티센스: 용어 "안티센스"는 전사 또는 기능을 위해 그의 정상적인 배향에 대해 반전되어 있는 뉴클레오티드 서열을 지칭하며, 따라서 숙주 세포 내에서 발현된 표적 유전자 mRNA 분자에 대해 상보성인 (예를 들어, 이는 왓슨-크릭(Watson-Crick) 염기 쌍 형성을 통해 표적 유전자 mRNA 분자 또는 단일 가닥 게놈 DNA와 혼성화할 수 있음) 또는 표적 DNA 분자, 예를 들어 숙주 세포에 존재하는 게놈 DNA에 대해 상보성인 RNA 전사체를 발현한다.

코딩 영역: 본원에서 사용된 바와 같이, 구조 유전자와 관련하에 사용될 때 용어 "코딩 영역"은 mRNA 분자의 번역의 결과로서 초기 폴리펩티드에서 발견되는 아미노산을 코딩하는 뉴클레오티드 서열을 지칭한다. 진핵생물에서는 코딩 영역이 개시제 메티오닌을 코딩하는 뉴클레오티드 삼중체 "ATG"에 의해 5'-측에 및 정지 코돈을 나타내는 3가지 삼중체 (즉, TAA, TAG, TGA) 중 하나에 의해 3'-측에 경계가 있다. 인트론을 함유하는 것 외에도, 유전자의 게놈 형태는 RNA 전사체에 존재하는 서열의 5'- 및 3'-말단 둘 다에 위치하는 서열을 또한 포함할 수 있다. 이들 서열은 "플랭킹" 서열 또는 영역으로 지칭된다 (이들 플랭킹 서열은 mRNA 전사체에 존재하는 비번역 서열에 대해 5' 또는 3'에 위치함). 5'-플랭킹 영역은 유전자의 전사를 제어하거나 또는 그에 영향을 미치는 조절 서열, 예컨대 프로모터 및 인핸서를 함유할 수 있다. 3'-플랭킹 영역은 전사의 종결, 전사후 절단 및 폴리아데닐화를 지시하는 서열을 함유할 수 있다.

상보성인: "상보성인" 또는 "상보성"은 역평행 뉴클레오티드 서열에서 상보성인 염기 잔기들 사이에서 수소 결합 형성 시 (염기 쌍 형성 규칙에 의해) 서로 쌍을 형성할 수 있는 역평행 뉴클레오티드 서열을 포함하는 2개의 뉴클레오티드 서열을 지칭한다. 예를 들어, 서열 5'-AGT-3'은 서열 5'-ACT-3'에 대해 상보성이다. 상보성은 "부분적인" 또는 "전체적인" 것일 수 있다. "부분적인" 상보성은 하나 이상의 핵산 염기가 염기 쌍 형성 규칙에 따라 매칭되지 않는 것이다. 핵산 분자들 사이의 "전체적인" 또는 "완전한" 상보성은 각각의 모든 핵산 염기가 염기 쌍 형성 규칙하에 또 다른 염기와 매칭되는 것이다. 핵산 분자 가닥들 사이의 상보성 정도는 핵산 분자 가닥들 사이의 혼성화의 효율 및 강도에 대해 유의한 효과를 갖는다. 본원에서 사용된 바와 같이, 핵산 서열의 "보체"는 핵산 분자가 핵산 서열의 핵산 분자에 대해 전체적인 상보성을 나타내는 것인 뉴클레오티드 서열을 지칭한다.

공여자 DNA 분자: 본원에서 사용된 바와 같이, 본원에서 상호교환적으로 사용되는 용어 "공여자 DNA 분자", "복구 DNA 분자" 또는 "주형 DNA 분자"는 모두 세포의 게놈에 도입되어야 하는 서열을 갖는 DNA 분자를 의미한다. 이는 상기 세포의 게놈의 표적 영역의 서열과 상동성 또는 동일성인 서열에 의해 5' 및/또는 3' 말단에서 플랭킹될 수 있다. 이는 각각의 세포에서 천연 발생이 아닌 서열, 예컨대 표적 영역에 도입되어야 하는 ORF, 비코딩 RNA 또는 조절 요소를 포함할 수 있거나, 또는 이는 유전자 편집인 적어도 하나의 돌연변이를 제외하고는 표적 영역에 대해 상동성인 서열을 포함할 수 있으며: 공여자 DNA 분자의 서열은 게놈에 부가될 수 있거나, 또는 이는 공여자 DNA 서열의 길이의 게놈에서 서열을 대체할 수 있다.

이중-가닥 RNA: "이중-가닥 RNA" 분자 또는 "dsRNA" 분자는 뉴클레오티드 서열의 센스 RNA 단편 및 뉴클레오티드 서열의 안티센스 RNA 단편을 포함하며, 이들 둘 다 서로 상보성인 뉴클레오티드 서열을 포함하여, 센스 및 안티센스 RNA 단편이 쌍을 형성하고, 이중-가닥 RNA 분자를 형성할 수 있다.

내인성: "내인성" 뉴클레오티드 서열은 형질전환되지 않은 식물 세포의 게놈에 존재하는 뉴클레오티드 서열을 지칭한다.

증강된 발현: 식물 세포에서 핵산 분자의 발현을 "증강시키다" 또는 "증가시키다"는 본원에서 동등하게 사용되며, 본 발명의 방법을 적용한 후에 식물, 식물의 일부 또는 식물 세포에서 핵산 분자의 발현 수준이 상기 방법을 적용하기 전에 식물, 식물의 일부 또는 식물 세포에서 그의 발현 수준보다 또는 본 발명의 재조합 핵산 분자가 결여된 기준 식물과 비교하여 높은 것을 의미한다. 예를 들어, 기준 식물은 각각의 NEENA만이 결여된 동일한 구축물을 포함한다. 본원에서 사용된 바와 같이, 용어 "증강된" 또는 "증가된"은 동의어이며, 본원에서 발현될 핵산 분자의 더 높은, 바람직하게는 유의하게 더 높은 발현을 의미한다. 본원에서 사용된 바와 같이, 단백질, mRNA 또는 RNA와 같은 작용제의 수준의 "증강" 또는 "증가"는 본 발명의 재조합 핵산 분자가 결여된, 예를 들어 본 발명의 NEENA 분자, 재조합 구축물 또는 재조합 벡터가 결여된, 실질적으로 동일한 조건하에 성장한 실질적으로 동일한 식물, 식물의 일부 또는 식물 세포에 비해 상기 수준이 증가한 것을 의미한다. 본원에서 사용된 바와 같이, 예를 들어 표적 유전자에 의해 발현되는 preRNA, mRNA, rRNA, tRNA, snoRNA, snRNA와 같은 작용제 및/또는 그에 의해 코딩되는 단백질 산물의 수준의 "증강" 또는 "증가"는 상기 수준이 본 발명의 재조합 핵산 분자가 결여된 세포 또는 유기체에 비해 50% 이상, 예를 들어 100% 이상, 바람직하게는 200% 이상, 더욱 바람직하게는 5배 이상, 훨씬 더 바람직하게는 10배 이상, 가장 바람직하게는 20배 이상, 예를 들어 50배 증가한 것을 의미한다. 증강 또는 증가는 숙련된 기술자에게 익숙한 방법에 의해 결정될 수 있다. 따라서, 핵산 또는 단백질 양의 증강 또는 증가는 예를 들어 단백질의 면역학적 검출에 의해 결정될 수 있다. 더욱이, 식물 또는 식물 세포에서 특이적인 단백질 또는 RNA를 측정하기 위해 단백질 검정, 형광, 노던 혼성화, 뉴클레아제 보호 검정, 역전사 (정량적인 RT-PCR), ELISA (효소-결합 면역흡착 검정), 웨스턴 블롯팅, 방사선 면역검정 (RIA) 또는 다른 면역검정 및 형광-활성화된 세포 분석 (FACS)과 같은 기술이 이용될 수 있다. 유도된 단백질 산물의 유형에 따라, 유기체 또는 세포의 표현형에 대한 그의 활성 또는 효과 또한 결정될 수 있다. 단백질 양을 결정하는 방법은 숙련된 기술자에게 공지되어 있다. 언급될 수 있는 예는 다음과 같다: 마이크로-뷰렛(micro-Biuret) 방법 (Goa J (1953) Scand J Clin Lab Invest 5:218-222), 폴린-시오칼토(Folin-Ciocalteau) 방법 (Lowry OH et al. (1951) J Biol Chem 193:265-275) 또는 CBB G-250 흡수의 측정 (Bradford MM (1976) Analyt Biochem 72:248-254). 단백질의 활성을 정량화하기 위한 한 예로서, 루시페라제 활성의 검출이 하기 실시예에 기재된다.

발현: "발현"은 세포에서 유전자 산물의 생합성, 바람직하게는 뉴클레오티드 서열, 예를 들어 내인성 유전자 또는 이종성 유전자의 전사 및/또는 번역을 지칭한다. 예를 들어, 구조 유전자의 경우에, 발현은 구조 유전자의 mRNA로의 전사 및 임의적으로 mRNA의 하나 이상의 폴리펩티드로의 후속적인 번역을 수반한다. 다른 경우에, 발현은 RNA 분자를 보유하는 DNA의 전사만을 지칭할 수 있다.

발현 구축물: 본원에서 사용된 바와 같이, "발현 구축물"은 식물 또는 식물 세포의 적절한 부분에서 특정한 뉴클레오티드 서열의 발현을 지시할 수 있는 DNA 서열을 의미하고, 그가 도입될 식물 또는 식물 세포의 상기 부분에서 기능적인 프로모터를 포함하며, 이는 관심 뉴클레오티드 서열에 작동가능하게 연결되고, 이는 임의적으로 종결 신호에 작동가능하게 연결된다. 번역이 필요한 경우, 이는 또한 전형적으로 뉴클레오티드 서열의 적절한 번역에 필요한 서열을 포함한다. 코딩 영역은 관심 단백질을 코딩할 수 있지만, 센스 또는 안티센스 방향에서 관심 기능적 RNA, 예를 들어 RNAa, siRNA, snoRNA, snRNA, 마이크로RNA, ta-siRNA 또는 임의의 다른 비코딩 조절 RNA를 또한 코딩할 수 있다. 관심 뉴클레오티드 서열을 포함하는 발현 구축물은 키메라일 수 있으며, 이는 그의 성분 중 하나 이상이 그의 다른 성분 중 하나 이상에 대해 이종성임을 의미한다. 발현 구축물은 또한 천연 발생이지만, 이종성 발현에 유용한 재조합 형태로 수득되었던 것일 수 있다. 그러나, 전형적으로, 발현 구축물은 숙주에 대해 이종성이며, 즉, 발현 구축물의 특정한 DNA 서열은 숙주 세포에서 천연 발생하지 않으며, 형질전환 사건에 의해 숙주 세포 또는 숙주 세포의 조상에 도입되었어야 했다. 발현 구축물에서 뉴클레오티드 서열의 발현은 구성적 프로모터 또는 유도성 프로모터의 제어하에 있을 수 있으며, 이는 숙주 세포가 일부 특정한 외부 자극에 노출되었을 때에만 전사를 개시한다. 식물의 경우, 프로모터는 또한 특정한 조직 또는 기관 또는 발달 단계에 대해 특이적일 수 있다.

외래: 용어 "외래"는 실험적 조작에 의해 세포의 게놈에 도입된 임의의 핵산 분자 (예를 들어, 유전자 서열)를 지칭하며, 도입된 서열이 일부 변형 (예를 들어, 점 돌연변이, 선택가능한 마커 유전자의 존재 등)을 함유하여, 천연 발생 서열에 비해 구별되는 한, 해당 세포에서 발견되는 서열을 포함할 수 있다.

기능적 연결: 용어 "기능적 연결" 또는 "기능적으로 연결된"은, 각각의 조절 요소가 그의 의도된 기능을 수행하여, 핵산 서열의 발현을 가능하게 하거나, 변형시키거나, 용이하게 하거나 또는 달리 영향을 미치도록 할 수 있는 방식으로, 예를 들어 조절 요소 (예를 들어 프로모터)와 발현될 상기 핵산 서열, 및 적절한 경우 추가의 조절 요소 (예를 들어, 종결자 또는 NEENA)의 순차적인 배열을 의미하는 것으로 이해되어야 한다. 동의어로서 단어 "작동가능한 연결" 또는 "작동가능하게 연결된"이 사용될 수 있다. 센스 또는 안티센스 RNA와 관련하여 핵산 서열의 배열에 따라 발현이 일어날 수 있다. 이를 위해, 화학적인 의미에서 직접적인 연결이 반드시 필요하지는 않다. 유전자 제어 서열, 예를 들어 인핸서 서열은 또한 더 멀리 떨어진 위치로부터 또는 실제로 다른 DNA 분자로부터 표적 서열에 대한 그들의 기능을 발휘할 수 있다. 바람직한 배열은 재조합적으로 발현될 핵산 서열이 프로모터로서 작용하는 서열 뒤에 위치하여, 두 서열이 서로 공유적으로 연결된 것이다. 프로모터 서열과 재조합적으로 발현될 핵산 서열 사이의 거리는 바람직하게는 200개 염기 쌍 미만, 특히 바람직하게는 100개 염기 쌍 미만, 매우 특히 바람직하게는 50개 염기 쌍 미만이다. 바람직한 실시양태에서, 전사 시작이 본 발명의 키메라 RNA의 원하는 시작과 동일하도록 하는 방식으로, 전사될 핵산 서열은 프로모터 뒤에 위치한다. 기능적 연결 및 발현 구축물은 예를 들어 (Maniatis T, Fritsch EF and Sambrook J (1989) Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory, Cold Spring Harbor (NY); Silhavy et al. (1984) Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor (NY); Ausubel et al. (1987) Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience; Gelvin et al. (Eds) (1990) Plant Molecular Biology Manual; Kluwer Academic Publisher, Dordrecht, The Netherlands) 기재된 통상적인 재조합 및 클로닝 기술에 의해 생성될 수 있다. 그러나, 예를 들어 제한 효소에 대한 특이적인 절단 부위를 갖는 링커로서, 또는 신호 펩티드로서 작용하는 추가의 서열 또한 두 서열 사이에 위치할 수 있다. 서열의 삽입은 또한 융합 단백질의 발현을 유도할 수 있다. 바람직하게는, 조절 영역, 예를 들어 프로모터 및 발현될 핵산 서열의 연결로 이루어지는 발현 구축물은 벡터-통합된 형태로 존재할 수 있으며, 예를 들어 형질전환에 의해 식물 게놈에 삽입될 수 있다.

유전자: 용어 "유전자"는 유전자 산물 (예를 들어, 폴리펩티드 또는 기능적 RNA)의 발현을 일부 방식으로 조절할 수 있는 적절한 조절 서열에 작동가능하게 연결된 영역을 지칭한다. 유전자는 코딩 영역 (오픈 리딩 프레임, ORF)의 앞에 (상류) 및 뒤에 (하류) DNA의 비번역 조절 영역 (예를 들어, 프로모터, 인핸서, 리프레서 등) 뿐만 아니라, 적용가능한 경우, 개별 코딩 영역 (즉, 엑손) 사이에 개재 서열 (즉, 인트론)을 포함한다. 본원에서 사용된 바와 같이, 용어 "구조 유전자"는 mRNA로 전사된 다음, 특이적인 폴리펩티드의 특징적인 아미노산 서열로 번역되는 DNA 서열을 의미한다.

"유전자 편집"은 본원에서 사용될 때 세포의 게놈의 특이적인 위치에서 특이적인 돌연변이의 도입을 의미한다. 유전자 편집은 더욱 진보된 기술을 적용하여, 예를 들어 CRISPR Cas 시스템 및 공여자 DNA, 또는 돌연변이 유발 활성에 연결된 CRISPR Cas 시스템, 예컨대 데아미나제를 이용하여 정확한 편집에 의해 도입될 수 있다 (WO15133554, WO17070632).

게놈 및 게놈 DNA: 용어 "게놈" 또는 "게놈 DNA"는 숙주 유기체의 유전가능한 유전 정보를 지칭한다. 상기 게놈 DNA는 핵의 DNA (염색체 DNA로도 지칭됨) 뿐만 아니라 색소체 (예를 들어, 엽록체) 및 다른 세포 소기관 (예를 들어, 미토콘드리아)의 DNA를 포함한다. 바람직하게는, 용어 게놈 또는 게놈 DNA는 핵의 염색체 DNA를 지칭한다.

이종성: 핵산 분자 또는 DNA와 관련하여 용어 "이종성"은 천연에서, 예를 들어 WT 식물의 게놈에서 작동가능하게 연결되지 않거나, 또는 천연에서, 예를 들어 WT 식물의 게놈에서 상이한 장소 또는 위치에서 작동가능하게 연결되는 제2 핵산 분자, 예를 들어 프로모터에 작동가능하게 연결되거나 또는 작동가능하게 연결되도록 조작된 핵산 분자를 지칭한다.

바람직하게는, 핵산 분자 또는 DNA, 예를 들어 NEENA와 관련하여 용어 "이종성"은 천연에서 작동가능하게 연결되지 않는 제2 핵산 분자, 예를 들어 프로모터에 작동가능하게 연결되거나 또는 작동가능하게 연결되도록 조작된 핵산 분자를 지칭한다.

그에 연결된 핵산 분자 및 하나 이상의 조절 핵산 분자 (예컨대 프로모터 또는 전사 종결 신호)를 포함하는 이종성 발현 구축물은 예를 들어 실험적 조작에 의해 기원하는 구축물이며, 여기서 a) 상기 핵산 분자, 또는 b) 상기 조절 핵산 분자 또는 c) 이들 둘 다 (즉 (a) 및 (b))는 그의 천연 (본래의) 유전 환경에 위치하지 않거나 또는 실험적 조작에 의해 변형되었고, 변형의 예는 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역전 또는 삽입이다. 천연 유전 환경은 기원 유기체의 천연 염색체 로커스, 또는 게놈 라이브러리의 존재를 지칭한다. 게놈 라이브러리의 경우, 핵산 분자의 서열의 천연 유전 환경은 바람직하게는 적어도 부분적으로 유지된다. 환경은 적어도 한 측에서 핵산 서열을 플랭킹하고, 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1,000 bp, 매우 특히 바람직하게는 적어도 5,000 bp 길이의 서열을 갖는다. 천연 발생 발현 구축물, 예를 들어 프로모터와 상응하는 유전자의 천연 발생 조합물은 비천연의 합성 "인공적인" 방법, 예를 들어 돌연변이 유발에 의해 변형될 때 트랜스제닉 발현 구축물이 된다. 이러한 방법은 (US 5,565,350; WO 00/15815)에 기재되어 있다. 예를 들어, 이 분자의 천연 프로모터가 아닌 프로모터에 작동가능하게 연결된 핵산 분자를 코딩하는 단백질은 프로모터에 대해 이종성인 것으로 고려된다. 바람직하게는, 이종성 DNA는 내인성이 아니거나 또는 그가 도입되는 세포와 천연적으로 회합되지 않지만, 또 다른 세포로부터 수득되었거나 또는 합성되었다. 이종성 DNA는 또한 일부 변형, 내인성 DNA 서열의 비천연 발생의 다중 카피, 또는 그에 물리적으로 연결된 또 다른 DNA 서열과 천연적으로 회합되지 않는 DNA 서열을 함유하는 내인성 DNA 서열을 포함한다. 일반적으로, 반드시 그런 것은 아니지만, 이종성 DNA는 그가 발현되는 세포에 의해 일반적으로 생성되지 않는 RNA 또는 단백질을 코딩한다.

고발현 프로모터: 본원에서 사용된 바와 같이, "고발현 프로모터"는 식물 또는 그의 일부에서 발현을 유발하는 프로모터를 의미하며, 각각의 프로모터의 제어하에 핵산 분자로부터 유래된 RNA의 축적 또는 합성 속도 또는 RNA의 안정성은 본 발명의 NEENA가 결여된 프로모터에 의해 유발된 발현에 비해 더 높으며, 바람직하게는 유의하게 더 높다. 바람직하게는, RNA의 양 및/또는 RNA 합성 속도 및/또는 RNA의 안정성은 본 발명의 NEENA가 결여된 프로모터에 비해 50% 이상, 예를 들어 100% 이상, 바람직하게는 200% 이상, 더욱 바람직하게는 5배 이상, 훨씬 더 바람직하게는 10배 이상, 가장 바람직하게는 20배 이상, 예를 들어 50배 증가한다.

혼성화: 본원에서 정의된 바와 같이 용어 "혼성화"는 실질적으로 상보성인 뉴클레오티드 서열이 서로 어닐링되는 과정이다. 혼성화 과정은 전적으로 용액에서 발생할 수 있고, 즉, 상보성인 핵산 둘 다 용액 중에 있다. 혼성화 과정은 또한 매트릭스, 예컨대 자성 비드, 세파로스 비드 또는 임의의 다른 수지에 고정된 상보성인 핵산 중 하나에 의해 발생할 수 있다. 혼성화 과정은 추가로 고체 지지체, 예컨대 니트로-셀룰로스 또는 나일론 막에 고정되거나 또는 예를 들어 포토리쏘그래피에 의해 예를 들어 규질 유리 지지체에 고정된 상보성인 핵산 중 하나에 의해 발생할 수 있다 (후자는 핵산 어레이 또는 마이크로어레이로서 또는 핵산 칩으로서 공지되어 있음). 혼성화가 발생하게 하기 위해, 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어, 이중 가닥을 2개의 단일 가닥으로 용융시키고/거나 단일 가닥 핵산으로부터 헤어핀 또는 다른 이차 구조를 제거한다.

용어 "엄격성"은 혼성화가 일어나는 조건을 지칭한다. 혼성화의 엄격성은 온도, 염 농도, 이온 강도 및 혼성화 완충제 조성과 같은 조건에 의해 영향을 받는다. 일반적으로, 낮은 엄격성 조건은 정의된 이온 강도 및 pH에서 특정한 서열에 대한 열 융점 (Tm)보다 약 30℃ 낮게 선택된다. 중간 엄격성 조건은 온도가 Tm보다 20℃ 낮을 때이고, 높은 엄격성 조건은 온도가 Tm보다 10℃ 낮을 때이다. 높은 엄격성 혼성화 조건은 전형적으로 표적 핵산 서열에 대해 높은 서열 유사성을 갖는 혼성화 서열을 단리하기 위해 이용된다. 그러나, 핵산은 유전자 코드의 축퇴성으로 인해 서열마다 다를 수 있고, 여전히 실질적으로 동일한 폴리펩티드를 코딩할 수 있다. 따라서, 중간 엄격성 혼성화 조건은 때때로 이러한 핵산 분자를 확인하기 위해 필요할 수 있다.

"Tm"은 정의된 이온 강도 및 pH 하에 표적 서열의 50%가 완벽하게 매칭되는 프로브와 혼성화하는 온도이다. Tm은 용액 조건 및 프로브의 염기 조성 및 길이에 의존적이다. 예를 들어, 더 긴 서열은 더 높은 온도에서 특이적으로 혼성화한다. 혼성화의 최대 속도는 Tm보다 약 16℃ 내지 32℃ 낮을 때 수득된다. 혼성화 용액에서 1가 양이온의 존재는 두 핵산 가닥 사이의 정전기적 반발을 감소시켜, 혼성체 형성을 촉진시키고; 이 효과는 0.4M 이하의 나트륨 농도에서 볼 수 있다 (더 높은 농도에서는, 이 효과가 무시될 수 있음). 포름아미드는 DNA-DNA 및 DNA-RNA 듀플렉스의 용융 온도를 각각의 퍼센트 포름아미드에 대해 0.6 내지 0.7℃ 감소시키고, 비록 혼성화 속도가 저하될 지라도 50% 포름아미드의 첨가는 혼성화가 30 내지 45℃에서 수행될 수 있게 한다. 염기 쌍 미스매치는 듀플렉스의 혼성화 속도 및 열 안정성을 감소시킨다. 평균적으로 큰 프로브의 경우, Tm은 % 염기 미스매치당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기 식을 이용하여 계산될 수 있다:

DNA-DNA 혼성체 (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):

Tm= 81.5℃ + 16.6xlog[Na+]a + 0.41x%[G/Cb] - 500x[Lc]-1 - 0.61x% 포름아미드

DNA-RNA 또는 RNA-RNA 혼성체:

Tm= 79.8 + 18.5 (log10[Na+]a) + 0.58 (%G/Cb) + 11.8 (%G/Cb)2 - 820/Lc

올리고-DNA 또는 올리고-RNAd 혼성체:

<20개 뉴클레오티드의 경우: Tm= 2 (ln)

20-35개 뉴클레오티드의 경우: Tm= 22 + 1.46 (ln)

a 또는 다른 1가 양이온에 대해, 그러나 0.01-0.4 M 범위에서만 정확함.

b 30% 내지 75% 범위에서 %GC에 대해서만 정확함.

c L = 염기 쌍에서 듀플렉스의 길이.

d 올리고, 올리고뉴클레오티드; ln, 프라이머의 유효 길이 = 2x(G/C의 수)+(A/T의 수).

비특이적인 결합은 수많은 공지된 기술, 예를 들어 막을 단백질 함유 용액으로 차단, 혼성화 완충제에 이종성 RNA, DNA 및 SDS의 첨가, 및 Rnase로의 처리 중 어느 하나를 이용하여 제어될 수 있다. 관련이 없는 프로브의 경우, 일련의 혼성화는 (i) 어닐링 온도를 점진적으로 저하시키거나 (예를 들어 68℃에서 42℃로) 또는 (ii) 포름아미드 농도를 점진적으로 저하시키는 (예를 들어 50%에서 0%로) 것 중 하나를 변경시킴으로써 수행될 수 있다. 숙련된 기술자는 혼성화 동안에 변경될 수 있고, 엄격성 조건을 유지하거나 또는 변화시키는 다양한 파라미터를 알고 있다.

혼성화 조건 외에도, 혼성화의 특이성은 또한 전형적으로 혼성화 이후 세척의 기능에 따라 좌우된다. 비특이적인 혼성화로부터 생성된 백그라운드를 제거하기 위해, 샘플을 묽은 염 용액으로 세척한다. 이러한 세척의 결정적인 요인에는 최적 세척 용액의 이온 강도 및 온도가 포함되며: 염 농도가 낮고 세척 온도가 높을수록, 세척 엄격성이 높아진다. 세척 조건은 전형적으로 혼성화 엄격성에서 또는 그 아래에서 수행된다. 양성 혼성화는 백그라운드 신호의 적어도 2배인 신호를 제공한다. 일반적으로, 핵산 혼성화 검정 또는 유전자 증폭 검출 절차에 대한 적합한 엄격한 조건은 상기 설명된 바와 같다. 다소 엄격한 조건 또한 선택될 수 있다. 숙련된 기술자는 세척 동안에 변경될 수 있고, 엄격성 조건을 유지하거나 또는 변화시키는 다양한 파라미터를 알고 있다.

예를 들어, 50개 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 엄격성 혼성화 조건은 65℃에서 1x SSC 중에서 또는 42℃에서 1x SSC 및 50% 포름아미드 중에서 혼성화, 이후 65℃에서 0.3x SSC 중에서 세척을 포함한다. 50개 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 엄격성 혼성화 조건의 예는 50℃에서 4x SSC 중에서 또는 40℃에서 6x SSC 및 50% 포름아미드 중에서 혼성화, 이후 50℃에서 2x SSC 중에서 세척을 포함한다. 혼성체의 길이는 혼성화 핵산에 대해 예상된 길이이다. 공지된 서열을 갖는 핵산이 혼성화되는 경우, 혼성체 길이는 서열을 정렬시키고, 본원에 기재된 보존된 영역을 확인함으로써 결정될 수 있다. 1xSSC는 0.15M NaCl 및 15mM 시트르산나트륨이고; 혼성화 용액 및 세척 용액은 5x 덴하르트(Denhardt) 시약, 0.5-1.0% SDS, 100 μg/ml 변성된 단편화된 연어 정자 DNA, 0.5% 피로인산나트륨을 추가로 포함할 수 있다. 높은 엄격성 조건의 또 다른 예는 65℃에서 0.1 SDS 및 임의적으로 5x 덴하르트 시약, 100 μg/ml 변성된 단편화된 연어 정자 DNA, 0.5% 피로인산나트륨을 포함하는 0.1x SSC 중에서 혼성화, 이후 65℃에서 0.3x SSC 중에서 세척이다.

엄격성 수준을 정의하기 위해, [Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 and yearly updates)]를 참고할 수 있다.

"동일성": 2개 이상의 핵산 또는 아미노산 분자의 비교와 관련하여 사용될 때 "동일성"은 상기 분자의 서열이 특정한 정도의 서열 유사성을 공유하고, 서열이 부분적으로 동일한 것을 의미한다.

효소 변이체는 모 효소와 비교할 때 그들의 서열 동일성에 의해 정의될 수 있다. 서열 동일성은 보통 "% 서열 동일성" 또는 "% 동일성"으로 제공된다. 제1 단계에서 두 아미노산 서열 사이의 % 동일성을 결정하기 위해, 이들 두 서열 사이에서 쌍별 서열 정렬을 생성하며, 두 서열을 그들의 전체 길이에 걸쳐 정렬시킨다 (즉, 쌍별 전체 정렬). 정렬은 니들만(Needleman) 및 운쉬(Wunsch) 알고리즘을 실행하는 프로그램에 의해 (J. Mol. Biol. (1979) 48, p. 443-453), 바람직하게는 프로그램 디폴트 파라미터 (갭 개방=10.0, 갭 연장=0.5 및 매트릭스=EBLOSUM62)에 의한 프로그램 "NEEDLE"을 이용하여 (The European Molecular Biology Open Software Suite (EMBOSS)) 생성된다. 본 발명의 목적을 위해 바람직한 정렬은 가장 높은 서열 동일성이 결정될 수 있는 해당 정렬이다.

하기 예시는 2개의 뉴클레오티드 서열을 설명하기 위해 의도되지만, 동일한 계산이 단백질 서열에 적용된다:

Seq A: AAGATACTG 길이: 9개 염기

Seq B: GATCTGA 길이: 7개 염기

따라서, 더 짧은 서열은 서열 B이다.

그들의 전체 길이에 걸쳐 두 서열을 나타내는 쌍별 전체 정렬을 생성하면 다음과 같다:

정렬에서 "I" 기호는 동일한 잔기를 나타낸다 (이는 DNA의 경우 염기 또는 단백질의 경우 아미노산을 의미함). 동일한 잔기의 수는 6개이다.

정렬에서 "-" 기호는 갭을 나타낸다. Seq B 내에서 정렬에 의해 도입된 갭의 수는 1개이다. Seq B의 경계에서 정렬에 의해 도입된 갭의 수는 2개이고, Seq A의 경계에서는 1개이다.

그들의 전체 길이에 걸쳐 정렬된 서열을 나타내는 정렬 길이는 10개이다.

본 발명에 따라 그의 전체 길이에 걸쳐 더 짧은 서열을 나타내는 쌍별 정렬을 생성하면 결과적으로 다음과 같다:

본 발명에 따라 그의 전체 길이에 걸쳐 서열 A를 나타내는 쌍별 정렬을 생성하면 결과적으로 다음과 같다:

본 발명에 따라 그의 전체 길이에 걸쳐 서열 B를 나타내는 쌍별 정렬을 생성하면 결과적으로 다음과 같다:

그의 전체 길이에 걸쳐 더 짧은 서열을 나타내는 정렬 길이는 8개이다 (더 짧은 서열의 정렬 길이에 고려되는 1개의 갭이 존재함).

따라서, 그의 전체 길이에 걸쳐 Seq A를 나타내는 정렬 길이는 9개일 것이다 (Seq A가 본 발명의 서열임을 의미함).

따라서, 그의 전체 길이에 걸쳐 Seq B를 나타내는 정렬 길이는 8개일 것이다 (Seq B가 본 발명의 서열임을 의미함).

두 서열을 정렬시킨 후, 제2 단계에서, 생성된 정렬로부터 동일성 값이 결정된다. 이 설명의 목적을 위해, 퍼센트 동일성은 %-동일성 = (동일한 잔기 / 그의 전체 길이에 걸쳐 본 발명의 각각의 서열을 나타내는 정렬 영역의 길이) *100. 따라서, 이 실시양태에 따른 두 아미노산 서열의 비교와 관련하여 서열 동일성은 동일한 잔기의 수를 그의 전체 길이에 걸쳐 본 발명의 각각의 서열을 나타내는 정렬 영역의 길이로 나누어서 계산된다. 이 값에 100을 곱하여 "%-동일성"을 제공한다. 상기 제공된 예시에 따라, %-동일성은 다음과 같다: Seq A가 본 발명의 서열인 경우 (6 / 9) * 100 = 66.7 %; Seq B가 본 발명의 서열인 경우 (6 / 8) * 100 =75%.

InDel은 NHEJ에 의한 DSB의 복구와 연관된 유기체의 게놈에서 염기의 무작위 삽입 또는 결실에 대한 용어이다. 이는 1 내지 10000개 염기 쌍 길이로 측정되는 작은 유전자 변형으로 분류된다. 본원에서 사용된 바와 같이, 이는 표적 부위 내에 또는 그 부근에서 (예를 들어 1000 bp, 900 bp, 800 bp, 700 bp, 600 bp, 500 bp, 400 bp, 300 bp, 250 bp, 200 bp, 150 bp, 100 bp, 50 bp, 40 bp, 30 bp, 25 bp, 20 bp, 15 bp, 10 bp 또는 5 bp 미만 상류 및/또는 하류) 염기의 무작위 삽입 또는 결실을 지칭한다.

표적 DNA의 표적 부위에서 공여자 DNA 분자의 도입과 관련하여 용어 "도입하는", "도입" 등은 예를 들어 공여자 DNA 분자 또는 그의 일부를 표적 영역에 물리적으로 통합시킴으로써 표적 영역에 공여자 DNA 분자의 서열의 임의의 도입, 또는 공여자 DNA가 폴리머라제에 대한 주형으로 사용되는 것인 표적 영역에 공여자 DNA 분자의 서열 또는 그의 일부의 도입을 의미한다.

인트론: 유전자가 생성하는 단백질의 일부를 코딩하지 않고, 세포 핵으로부터 방출되기 전에 유저자로부터 전사되는 mRNA로부터 스플라이싱되는, 유전자 내의 DNA (개재 서열)의 섹션을 지칭한다. 인트론 서열은 인트론의 핵산 서열을 지칭한다. 따라서, 인트론은 코딩 서열 (엑손)을 따라 전사되지만, 성숙 mRNA의 형성 동안에 제거되는 이들 DNA 서열 영역이다. 인트론은 실제 코딩 영역 내에 또는 프리-mRNA (스플라이싱되지 않은 mRNA)의 5' 또는 3' 비번역 리더에 위치할 수 있다. 일차 전사체에서 인트론은 절단되고, 코딩 서열은 동시에 정확하게 라이게이션되어 성숙 mRNA를 형성한다. 인트론 및 엑손의 접합은 스플라이스 부위를 형성한다. 인트론의 서열은 GU로 시작하여, AG로 끝난다. 추가로, 식물에서, AU-AC 인트론의 2가지 예가 기재되었다: RecA-유사 단백질 유전자의 14번째 인트론 및 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 G5 유전자의 7번째 인트론은 AT-AC 인트론이다. 인트론을 함유하는 프리-mRNA는 다른 서열 외에도 인트론이 정확하게 스플라이싱되는데 필수적인 3개의 짧은 서열을 갖는다. 이들 서열은 5' 스플라이스 부위, 3' 스플라이스 부위, 및 분기점이다. mRNA 스플라이싱은 일차 mRNA 전사체에 존재하는 개재 서열 (인트론)의 제거, 및 엑손 서열의 연결 또는 라이게이션이다. 이는 개재 서열 (인트론)의 제거에 의해 동일한 RNA 상의 두 엑손을 연결시키는 시스-스플라이싱으로도 공지되어 있다. 인트론의 기능적 요소는 스플라이세오솜의 특이적인 단백질 성분에 의해 인식되고 결합되는 서열 (예를 들어 인트론의 말단에 있는 스플라이싱 컨센서스 서열)을 포함한다. 기능적 요소와 스플라이세오솜의 상호작용은 미성숙 mRNA로부터 인트론 서열의 제거 및 엑손 서열의 재연결을 일으킨다. 인트론은 충분하지는 않지만 인트론이 정확하게 스플라이싱되는데 필수적인 3개의 짧은 서열을 갖는다. 이들 서열은 5' 스플라이스 부위, 3' 스플라이스 부위 및 분기점이다. 분기점 서열은 식물에서 스플라이싱 및 스플라이스 부위 선택에 중요하다. 분기점 서열은 보통 3' 스플라이스 부위로부터 10-60개 뉴클레오티드 상류에 위치한다.

이소제닉: 이종성 DNA 서열의 존재 또는 부재에 의해 상이할 수 있다는 점을 제외하고는, 유전적으로 동일한 유기체 (예를 들어, 식물).

단리된: 본원에서 사용된 바와 같이, 용어 "단리된"은 물질이 인간의 손에 의해 제거되었고, 그의 원래의 천연 환경으로부터 떨어져 존재하며, 따라서 천연 산물이 아님을 의미한다. 단리된 물질 또는 분자 (예컨대 DNA 분자 또는 효소)는 정제된 형태로 존재할 수 있거나 또는 비천연 환경, 예를 들어 트랜스제닉 숙주 세포에 존재할 수 있다. 예를 들어, 살아있는 식물에 존재하는 천연 발생 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이 아니지만, 자연계에서 공존하는 물질 중 일부 또는 전부로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 단리된 것이다. 이러한 폴리뉴클레오티드는 벡터의 일부일 수 있고/거나, 이러한 폴리뉴클레오티드 또는 폴리펩티드는 조성물의 일부일 수 있으며, 이러한 벡터 또는 조성물이 그의 원래의 환경의 일부가 아니라는 점에서 단리된 것이다. 바람직하게는, 용어 "단리된"은 "단리된 핵산 서열"에서와 같이 핵산 분자와 관련하여 사용될 때, 그의 천연 공급원에서 일반적으로 회합되는 적어도 하나의 오염 핵산 분자로부터 식별되고 분리된 핵산 서열을 지칭한다. 단리된 핵산 분자는 천연에서 발견되는 것과 상이한 형태 또는 설정으로 존재하는 핵산 분자이다. 대조적으로, 단리되지 않은 핵산 분자는 천연에서 존재하는 상태로 발견되는 핵산 분자, 예컨대 DNA 및 RNA이다. 예를 들어, 주어진 DNA 서열 (예를 들어, 유전자)은 숙주 세포 염색체에서 이웃 유전자에 근접하여 발견되고; RNA 서열, 예컨대 특이적인 단백질을 코딩하는 특이적인 mRNA 서열은 다수의 단백질을 코딩하는 수많은 다른 mRNA와의 혼합물로서 세포에서 발견된다. 그러나, 예를 들어 서열식별번호(SEQ ID NO): 1을 포함하는 단리된 핵산 서열은 예를 들어 핵산 서열이 천연 세포의 것과 상이한 염색체 또는 염색체외 위치에 있거나, 또는 천연에서 발견되는 것과 상이한 핵산 서열에 의해 달리 플랭킹된 것인 보통 서열식별번호: 1을 함유하는 세포에서의 이러한 핵산 서열을 포함한다. 단리된 핵산 서열은 단일-가닥 또는 이중-가닥 형태로 존재할 수 있다. 단리된 핵산 서열을 이용하여 단백질을 발현하는 경우, 핵산 서열은 센스 또는 코딩 가닥의 최소한 적어도 일부를 함유할 것이다 (즉, 핵산 서열은 단일-가닥일 수 있음). 대안적으로, 이는 센스 및 안티센스 가닥 둘 다를 함유할 수 있다 (즉, 핵산 서열은 이중-가닥일 수 있음).

최소 프로모터: 상류 활성화의 부재하에서는 불활성이거나 또는 크게 감소된 프로모터 활성을 갖는 프로모터 요소, 특히 TATA 요소. 적합한 전사 인자의 존재하에, 최소 프로모터는 전사를 허용하도록 기능한다.

비코딩: 용어 "비코딩"은 발현된 단백질의 일부 또는 전부를 코딩하지 않는 핵산 분자의 서열을 지칭한다. 비코딩 서열에는 인트론, 인핸서, 프로모터 영역, 3' 비번역 영역, 및 5' 비번역 영역이 포함되나 이로 제한되지 않는다.

핵산 발현 증강 핵산 (NEENA): 용어 "핵산 발현 증강 핵산"은 NEENA가 기능적으로 연결된 프로모터의 제어하에 핵산의 발현을 증강시키기 위해 고유한 성질을 갖는 특이적인 서열의 서열 및/또는 핵산 분자를 지칭한다. 따라서, 프로모터 서열과는 달리, NEENA는 발현을 유도할 수 없다. NEENA에 기능적으로 연결된 핵산 분자의 발현을 증강시키는 기능을 수행하기 위해, NEENA 자체는 프로모터에 기능적으로 연결되어야 한다. 관련 기술분야에 공지된 인핸서 서열과는 달리, NEENA는 시스에서 작용하고, 발현될 핵산의 전사 시작 부위에 가깝게 위치해야 한다.

핵산 및 뉴클레오티드: 용어 "핵산" 및 "뉴클레오티드"는 천연 발생 또는 합성 또는 인공적인 핵산 또는 뉴클레오티드를 지칭한다. 용어 "핵산" 및 "뉴클레오티드"는 단일- 또는 이중-가닥, 센스 또는 안티센스 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 임의의 뉴클레오티드 유사체 및 이들의 중합체 또는 혼성체를 포함한다. 달리 나타내지 않는다면, 특정한 핵산 서열은 또한 함축적으로 그의 보존적으로 변형된 변이체 (예를 들어, 축퇴 코돈 치환) 및 상보성인 서열, 뿐만 아니라 명시적으로 나타낸 서열을 포함한다. 용어 "핵산"은 본원에서 "유전자", "cDNA, "mRNA", "올리고뉴클레오티드," 및 "폴리뉴클레오티드"와 상호교환적으로 사용된다. 뉴클레오티드 유사체에는 염기, 당 및/또는 포스페이트의 화학적 구조에서 변형을 갖는 뉴클레오티드, 예컨대 비제한적으로 5-위치 피리미딘 변형, 8-위치 퓨린 변형, 시토신 엑소시클릭 아민에서의 변형, 5-브로모-우라실의 치환 등; 및 2'-위치 당 변형, 예컨대 비제한적으로 2'-OH가 H, OR, R, 할로, SH, SR, NH2, NHR, NR2, 또는 CN으로부터 선택된 기로 대체된 당-변형된 리보뉴클레오티드가 포함된다. 짧은 헤어핀 RNA (shRNA)는 또한 비천연 요소, 예컨대 비천연 염기, 예를 들어 이노신 및 크산틴, 비천연 당, 예를 들어 2'-메톡시 리보스, 또는 비천연 포스포디에스테르 연결, 예를 들어 메틸포스포네이트, 포스포로티오에이트 및 펩티드를 포함할 수 있다.

핵산 서열: 문구 "핵산 서열"은 5'-말단에서 3'-말단으로 판독한 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중-가닥 중합체를 지칭한다. 여기에는 염색체 DNA, 자가-복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 및 주로 구조적 역할을 수행하는 DNA 또는 RNA가 포함된다. "핵산 서열"은 또한 뉴클레오티드를 나타내는 약어, 문자, 캐릭터 또는 단어의 연이은 목록을 지칭한다. 한 실시양태에서, 핵산은 보통 100개 미만의 뉴클레오티드 길이인 비교적 짧은 핵산인 "프로브"일 수 있다. 종종 핵산 프로브는 약 50개의 뉴클레오티드 길이 내지 약 10개의 뉴클레오티드 길이이다. 핵산의 "표적 영역"은 관심의 대상인 것으로 확인된 핵산의 일부이다. 핵산의 "코딩 영역"은 적절한 조절 서열의 제어하에 배치될 때 특정한 폴리펩티드 또는 단백질을 생성하도록 서열-특이적인 방식으로 전사되고 번역되는 핵산의 일부이다. 코딩 영역은 이러한 폴리펩티드 또는 단백질을 코딩한다고 한다.

올리고뉴클레오티드: 용어 "올리고뉴클레오티드"는 리보핵산 (RNA) 또는 데옥시리보핵산 (DNA) 또는 그의 모방체의 올리고머 또는 중합체, 뿐만 아니라 유사하게 기능하는 비천연 발생 부분을 갖는 올리고뉴클레오티드를 지칭한다. 이러한 변형된 또는 치환된 올리고뉴클레오티드는 바람직한 성질, 예를 들어 증강된 세포 흡수, 핵산 표적에 대한 증강된 친화도, 및 뉴클레아제의 존재하에 증가된 안정성으로 인해 종종 바람직하다. 올리고뉴클레오티드는 바람직하게는 연결 (예를 들어, 포스포디에스테르) 또는 대체 연결에 의해 서로 공유적으로 커플링된 2개 이상의 핵단량체를 포함한다.

오버행: "오버행"은 이중-가닥 올리고뉴클레오티드 분자의 5'- 또는 3'-히드록실 말단 상의 비교적 짧은 단일-가닥 뉴클레오티드 서열이다 ("연장부", "돌출 말단," 또는 "점착성 말단"으로도 지칭됨).

식물: 이는 일반적으로 광합성이 가능한 임의의 진핵생물 단세포 또는 다세포 유기체 또는 세포, 조직, 기관, 부분 또는 번식 물질 (예컨대 종자 또는 과일)을 의미하는 것으로 이해된다. 본 발명의 목적을 위해 식물계의 고등 및 하등 식물의 모든 속 및 종을 포함한다. 일년생, 다년생, 단자엽 및 쌍자엽 식물이 바람직하다. 상기 용어에는 성숙한 식물, 종자, 새싹 및 묘목 및 이들의 유래된 부분, 번식 물질 (예컨대 종자 또는 미세포자), 식물 기관, 조직, 원형질체, 캘러스 및 다른 배양물, 예를 들어 세포 배양물, 및 기능적 또는 구조적 단위를 제공하기 위한 임의의 다른 유형의 식물 세포 그룹이 포함된다. 성숙한 식물은 묘목 단계를 넘어서 임의의 원하는 발달 단계에 있는 식물을 지칭한다. 묘목은 초기 발달 단계에 있는 어린 미성숙 식물을 지칭한다. 일년생, 이년생, 단자엽 및 쌍자엽 식물은 트랜스제닉 식물의 생성을 위한 바람직한 숙주 유기체이다. 유전자의 발현은 모든 관상용 식물, 유용한 또는 관상용 나무, 꽃, 절화, 관목 또는 잔디에서 추가로 유리하다. 언급될 수 있으나 예를 들어 비제한적인 식물은 속씨 식물, 선태류, 예를 들어 헤파티카에(Hepaticae) (우산이끼류) 및 뮤씨(Musci) (선류); 프테리도파이트(Pteridophyte), 예컨대 양치류, 호스테일 및 석송; 겉씨 식물, 예컨대 침엽수, 소철, 은행나무 및 그네타타에(Gnetatae); 조류, 예컨대 녹조류, 파에오파이세아에(Phaeophpyceae), 로도파이세아에(Rhodophyceae), 믹소파이세아에(Myxophyceae), 크산토파이세아에(Xanthophyceae), 바실라리오파이세아에(Bacillariophyceae) (규조류), 및 유글레노파이세아에(Euglenophyceae)이다. 식품 또는 사료 목적으로 사용되는 식물, 예컨대 콩과, 예컨대 완두콩, 알팔파 및 대두; 벼과, 예컨대 벼, 옥수수, 밀, 보리, 수수, 기장, 호밀, 트리티케일 또는 귀리; 산형과, 특히 다우쿠스(Daucus) 속, 매우 특히 캐로타 종 (당근) 및 아피움(Apium) 종, 매우 특히 그라베올렌스 둘세(Graveolens dulce) 종 (셀러리), 및 여러 다른 종; 가지과, 특히 리코페르시콘(Lycopersicon) 속, 매우 특히 에스쿨린툼(esculentum) 종 (토마토) 및 솔라눔(Solanum) 속, 매우 특히 투베로숨(tuberosum) 종 (감자) 및 멜론게나(melongena) 종 (가지), 및 여러 다른 종 (예컨대 담배); 및 캅시쿰(Capsicum) 속, 매우 특히 아누움(annuum) 종 (후추) 및 여러 다른 종; 콩과, 특히 글리신 속, 매우 특히 맥스(max) 종 (대두), 알팔파, 완투콩, 루체른, 콩 또는 땅콩 및 여러 다른 종; 및 겨자과 (브라시카카에(Brassicacae)), 특히 브라시카(Brassica) 속, 매우 특히 나푸스(napus) 종 (유지 종자 평지), 캄페스트리스(campestris) 종 (비트), 올레라세아 재배종 타스티에(oleracea cv Tastie) (양배추), 올레라세아 재배종 스노우볼 와이(oleracea cv Snowball Y) (콜리플라워) 및 올레라세아 재배종 엠퍼러(oleracea cv Emperor) (브로콜리); 및 아라비돕시스(Arabidopsis) 속, 매우 특히 탈리아나(thaliana) 종 및 여러 다른 종; 국화과, 특히 락투카(Lactuca) 속, 매우 특히 사티바(sativa) 종 (상추) 및 여러 다른 종; 엉거시과, 예컨대 해바라기, 만수국, 양상추 또는 금잔화 및 여러 다른 종; 박과, 예컨대 멜론, 호박/스쿼쉬 또는 주키니, 및 아마씨가 바람직하다. 목화, 사탕수수, 대마, 아마, 고추, 및 다양한 나무, 견과 및 와인 종이 추가로 바람직하다.

폴리펩티드: 용어 "폴리펩티드", "펩티드", "올리고펩티드", "폴리펩티드", "유전자 산물", "발현 산물" 및 "단백질"은 본원에서 연속하는 아미노산 잔기의 중합체 또는 올리고머를 지칭하기 위해 상호교환적으로 사용된다.

전단백질: 일반적으로 세포 소기관, 예컨대 엽록체에 대해 표적화되고, 여전히 그의 수송 펩티드를 포함하는 단백질.

표적 영역에서 공여자 DNA 분자의 도입과 관련하여 "정확한"은 공여자 DNA 분자 서열에 포함되지 않는 표적 영역의 변경되지 않은 DNA 서열과 비교하여 임의의 InDel, 복제 또는 다른 돌연변이없이 공여자 DNA 분자의 서열이 표적 영역에 도입되는 것을 의미한다.

일차 전사체: 본원에서 사용된 바와 같이, 용어 "일차 전사체"는 유전자의 미성숙 RNA 전사체를 지칭한다. "일차 전사체"는 예를 들어 인트론을 여전히 포함하고/거나, 폴리A 꼬리 또는 캡 구조는 아직 포함하지 않고/거나, 전사체로서 그의 정확한 기능을 위해 필요한 다른 변형, 예를 들어 트리밍 또는 편집이 누락되어 있다.

프로모터: 용어 "프로모터" 또는 "프로모터 서열"은 등가물이며, 본원에서 사용된 바와 같이, 관심 뉴클레오티드 서열에 라이게이션될 때 관심 뉴클레오티드 서열의 RNA로의 전사를 제어할 수 있는 DNA 서열을 지칭한다. 이러한 프로모터는 예를 들어 하기 공개 데이터베이스에서 확인할 수 있다: http://www.grassius.org/grasspromdb.html, http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom, http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi. 거기에 나열된 프로모터는 본 발명의 방법에 의해 다루어질 수 있으며, 본원에 참고로 포함된다. 프로모터는 관심 뉴클레오티드 서열의 전사 시작 부위 근접한 5'에 (즉, 상류) 위치하며, mRNA로의 전사를 제어하고, RNA 폴리머라제 및 전사 개시를 위한 다른 전사 인자의 특이적인 결합을 위한 부위를 제공한다. 상기 프로모터는 예를 들어 전사 시작 부위에 근접한 적어도 10 kb, 예를 들어 5 kb 또는 2 kb를 포함한다. 이는 전사 시작 부위에 근접한 적어도 1500 bp, 바람직하게는 적어도 1000 bp, 더욱 바람직하게는 적어도 500 bp, 훨씬 더 바람직하게는 적어도 400 bp, 적어도 300 bp, 적어도 200 bp 또는 적어도 100 bp 또한 포함할 수 있다. 추가의 바람직한 실시양태에서, 프로모터는 전사 시작 부위에 근접한 적어도 50 bp, 예를 들어 적어도 25 bp를 포함한다. 프로모터는 엑손 및/또는 인트론 영역 또는 5' 비번역 영역을 포함하지 않는다. 프로모터는 예를 들어 각각의 식물에 대해 이종성 또는 상동성일 수 있다. 폴리뉴클레오티드 서열이 외래 종으로부터 기원하는 경우 또는 동일한 종으로부터이지만 그의 원래 형태로부터 변형된 경우에는, 이는 유기체 또는 제2 폴리뉴클레오티드 서열에 대해 "이종성"이다. 예를 들어, 이종성 코딩 서열에 작동가능하게 연결된 프로모터는 프로모터가 유래된 것과 상이한 종으로부터의 코딩 서열, 또는 동일한 종으로부터인 경우 프로모터와 천연적으로 회합하지 않는 코딩 서열을 지칭한다 (예를 들어, 유전자 조작된 코딩 서열 또는 상이한 생태형 또는 품종으로부터의 대립유전자). 적합한 프로모터는 발현이 일어나야 하는 숙주 세포의 유전자로부터 또는 이 숙주 세포에 대한 병원체 (예를 들어, 식물 또는 식물 병원체, 예컨대 식물 바이러스)로부터 유래될 수 있다. 식물 특이적인 프로모터는 식물에서 발현을 조절하는데 적합한 프로모터이다. 이는 식물로부터 뿐만 아니라 식물 병원체로부터 유래될 수 있거나, 또는 이는 인간에 의해 설계된 합성 프로모터일 수 있다. 프로모터가 유도성 프로모터인 경우, 전사 속도는 유도제에 대한 반응으로 증가한다. 또한, 프로모터는 특이적인 조직 유형(들), 예컨대 잎, 뿌리 또는 분열 조직에서 연관된 코딩 영역을 전사하는 데에만 또는 우세하게 활성이도록 조직-특이적인 또는 조직 바람직한 방식으로 조절될 수 있다. 용어 "조직 특이적인"은 프로모터에 적용되는 경우 상이한 유형의 조직 (예를 들어, 뿌리)에서 동일한 관심 뉴클레오티드 서열의 발현이 상대적으로 부재할 때 관심 뉴클레오티드 서열에서 특이적인 유형의 조직 (예를 들어, 꽃잎)으로의 선택적인 발현을 지시할 수 있는 프로모터를 지칭한다. 프로모터의 조직 특이성은 예를 들어 리포터 유전자를 프로모터 서열에 작동가능하게 연결시켜 리포터 구축물을 생성하고, 리포터 구축물이 생성된 트랜스제닉 식물의 모든 조직에 통합되도록 리포터 구축물을 식물의 게놈에 도입하고, 트랜스제닉 식물의 상이한 조직에서 리포터 유전자의 발현을 검출함으로써 (예를 들어, mRNA, 단백질, 또는 리포터 유전자에 의해 코딩되는 단백질 활성을 검출함) 평가될 수 있다. 다른 조직에서 리포터 유전자의 발현 수준에 비해 하나 이상의 조직에서 더 높은 발현 수준의 리포터 유전자의 검출은 프로모터가 더 높은 발현 수준이 검출된 조직에 대해 특이적임을 나타낸다. 용어 "세포 유형 특이적인"은 프로모터에 적용되는 경우 동일한 조직 내의 상이한 유형의 세포에서 동일한 관심 뉴클레오티드 서열의 발현이 상대적으로 부재할 때 특이적인 유형의 세포에서 관심 뉴클레오티드 서열의 선택적인 발현을 지시할 수 있는 프로모터를 지칭한다. 용어 "세포 유형 특이적인"은 프로모터에 적용될 때 또한 단일 조직 내의 영역에서 관심 뉴클레오티드 서열의 선택적인 발현을 촉진시킬 수 있는 프로모터를 의미한다. 프로모터의 세포 유형 특이성은 관련 기술분야에 널리 공지된 방법, 예를 들어 GUS 활성 염색, GFP 단백질 또는 면역조직화학 염색을 이용하여 평가될 수 있다. 용어 "구성적"은 프로모터 또는 프로모터로부터 유래된 발현과 관련하여 사용될 때, 프로모터가 식물 또는 식물의 일부의 실질적으로 전체 수명에 걸쳐 대부분의 식물 조직 및 세포에서 자극 (예를 들어, 열 충격, 화학물질, 빛 등)의 부재하에 작동가능하게 연결된 핵산 분자의 전사를 지시할 수 있음을 의미한다. 전형적으로, 구성적 프로모터는 실질적으로 임의의 세포 및 임의의 조직에서 트랜스진의 발현을 지시할 수 있다.

프로모터 특이성: 용어 "특이성"은 프로모터에 대해 언급될 때 각각의 프로모터에 의해 부여된 발현 패턴을 의미한다. 특이성은 식물 또는 그의 일부의 조직 및/또는 발달 상태를 설명하고, 프로모터는 각각의 프로모터의 제어하에 핵산 분자의 발현을 부여한다. 프로모터의 특이성은 또한 환경 조건을 포함할 수 있으며, 환경 조건하에 프로모터가 활성화되거나 또는 하향조절될 수 있고, 예컨대 생물학적 또는 환경적 스트레스, 예컨대 추위, 가뭄, 상처 또는 감염에 의해 유도 또는 억제될 수 있다.

정제된: 본원에서 사용된 바와 같이, 용어 "정제된"은 그들의 천연 환경으로부터 제거되거나, 단리되거나 또는 분리된 핵산 또는 아미노산 서열인 분자를 지칭한다. "실질적으로 정제된" 분자에는 천연적으로 회합되는 다른 성분이 적어도 60% 없고, 바람직하게는 적어도 75% 없고, 더욱 바람직하게는 적어도 90% 없다. 정제된 핵산 서열은 단리된 핵산 서열일 수 있다.

재조합: 핵산 분자와 관련하여 용어 "재조합"은 재조합 DNA 기술에 의해 생성된 핵산 분자를 지칭한다. 재조합 핵산 분자는 또한 천연에서는 존재하지 않지만, 변형되거나, 변화되거나, 돌연변이되거나 또는 인간에 의해 달리 조작된 분자를 포함할 수 있다. 바람직하게는, "재조합 핵산 분자"는 천연 발생 핵산 분자로부터의 서열과 적어도 하나의 핵산에서 차이가 있는 비천연 발생 핵산 분자이다. "재조합 핵산 분자"는 또한 천연 발생이 아닌 핵산 분자의 서열을 해당 순서로 포함하는, 바람직하게는 작동가능하게 연결된 "재조합 구축물"을 포함할 수 있다. 상기 재조합 핵산 분자를 생성하기 위한 바람직한 방법은 클로닝 기술, 지정 또는 비지정 돌연변이 유발, 합성 또는 재조합 기술을 포함할 수 있다.

센스: 용어 "센스"는 표적 서열과 상보성인 또는 동일한 서열, 예를 들어 단백질 전사 인자에 결합하고 주어진 유전자의 발현에 관여하는 서열을 갖는 핵산 분자를 의미하는 것으로 이해된다. 바람직한 실시양태에 따라, 핵산 분자는 관심 유전자, 및 상기 관심 유전자의 발현을 가능하게 하는 요소를 포함한다.

유의한 증가 또는 감소: 측정 기술에서 고유한 오차 한계보다 큰, 예를 들어 효소 활성에서 또는 유전자 발현에서 증가 또는 감소, 바람직하게는 대조군 효소의 활성 또는 대조군 세포에서의 발현의 약 2배 이상 증가 또는 감소, 더욱 바람직하게는 약 5배 이상 증가 또는 감소, 및 가장 바람직하게는 약 10배 이상 증가 또는 감소.

소형 핵산 분자: "소형 핵산 분자"는 RNA 또는 DNA와 같이 핵산 또는 그의 유도체로 이루어진 분자로 이해된다. 이들은 이중-가닥 또는 단일-가닥일 수 있고, 약 15 내지 약 30 bp, 예를 들어 15 내지 30 bp, 더욱 바람직하게는 약 19 내지 약 26 bp, 예를 들어 19 내지 26 bp, 훨씬 더 바람직하게는 약 20 내지 약 25 bp, 예를 들어 20 내지 25 bp이다. 특히 바람직한 실시양태에서, 올리고뉴클레오티드는 약 21 내지 약 24 bp, 예를 들어 21 내지 24 bp이다. 가장 바람직한 실시양태에서, 소형 핵산 분자는 약 21 bp 내지 약 24 bp, 예를 들어 21 bp 내지 24 bp이다.

실질적으로 상보성인: 가장 넓은 의미에서, 기준 또는 표적 뉴클레오티드 서열과 관련하여 본원에서 뉴클레오티드 서열에 대해 사용될 때 용어 "실질적으로 상보성인"은 상기 기준 또는 표적 뉴클레오티드 서열의 실질적으로 상보성인 뉴클레오티드 서열과 정확하게 상보성인 서열 사이에 적어도 60%, 더욱 바람직하게는 적어도 70%, 더욱 바람직하게는 적어도 80% 또는 85%, 바람직하게는 적어도 90%, 더욱 바람직하게는 적어도 93%, 훨씬 더 바람직하게는 적어도 95% 또는 96%, 여전히 훨씬 더 바람직하게는 적어도 97% 또는 98%, 여전히 훨씬 더 바람직하게는 적어도 99% 또는 가장 바람직하게는 100%의 동일성 백분율을 갖는 뉴클레오티드 서열을 의미한다 (후자는 이 맥락에서 용어 "동일한"과 동등함). 바람직하게는, 동일성은 상기 기준 서열에 대해 적어도 19개 뉴클레오티드, 바람직하게는 적어도 50개 뉴클레오티드 길이, 더욱 바람직하게는 핵산 서열의 전체 길이에 걸쳐 평가된다 (이후 달리 명시되지 않는다면). 서열 비교는 니들만 및 운쉬의 알고리즘을 기반으로 하여 유니버시티 오브 위스콘신(University of Wisconsin) GCG, GAP의 SEQWEB 적용에 의해 디폴트 GAP 분석을 이용하여 수행된다 (Needleman and Wunsch (1970) J Mol. Biol. 48: 443-453; 상기 정의된 바와 같음). 기준 뉴클레오티드 서열에 대해 "실질적으로 상보성인" 뉴클레오티드 서열은 낮은 엄격성 조건, 바람직하게는 중간 엄격성 조건, 가장 바람직하게는 높은 엄격성 조건하에 (상기 정의된 바와 같음) 기준 뉴클레오티드 서열과 혼성화한다.

본원에서 사용된 바와 같이, "표적 영역"은 예를 들어 표적 부위로부터 10개 염기, 20개 염기, 30개 염기, 40개 염기, 50개 염기, 60개 염기, 70개 염기, 80개 염기, 90개 염기, 100개 염기, 125개 염기, 150개 염기, 200개 염기 또는 500개 염기 또는 그 초과로 까까운 영역을 의미하거나, 또는 공여자 DNA 분자의 서열이 세포의 게놈에 도입되는 표적 부위를 포함한다.

본원에서 사용된 바와 같이, "표적 부위"는 재조합 기술, 예컨대 Zn-핑거, TALEN, 제한 효소, 귀소 엔도뉴클레아제, RNA-가이딩된 뉴클레아제, RNA-가이딩된 닉카제, 예컨대 CRISPR/Cas 뉴클레아제 또는 닉카제 등을 이용하여 이중 가닥 파단 또는 1개 또는 1쌍의 단일 가닥 파단 (닉)이 유도되는 게놈에서의 위치를 의미한다.

트랜스진: 본원에서 사용된 바와 같이, 용어 "트랜스진"은 실험적 조작에 의해 세포의 게놈에 도입된 임의의 핵산 서열을 지칭한다. 트랜스진은 "내인성 DNA 서열" 또는 "이종성 DNA 서열" (즉, "외래 DNA")일 수 있다. 용어 "내인성 DNA 서열"은 천연 발생 서열에 비해 일부 변형 (예를 들어, 점 돌연변이, 선택가능한 마커 유전자의 존재 등)을 함유하지 않는 한, 도입되는 세포에서 천연적으로 발견되는 뉴클레오티드 서열을 지칭한다.

트랜스제닉: 용어 트랜스제닉은 유기체에 대해 언급될 때 바람직하게는 관심 DNA 서열에 작동가능하게 연결된 적합한 프로모터를 포함하는 재조합 DNA 분자에 의해 형질전환된, 바람직하게는 안정하게 형질전환된 것을 의미한다.

벡터: 본원에서 사용된 바와 같이, 용어 "벡터"는 연결된 또 다른 핵산 분자를 수송할 수 있는 핵산 분자를 지칭한다. 벡터의 한 유형은 게놈 통합된 벡터, 또는 "통합된 벡터"이며, 이는 숙주 세포의 염색체 DNA에 통합될 수 있다. 또 다른 유형의 벡터는 에피솜 벡터, 즉, 염색체외 복제할 수 있는 핵산 분자이다. 작동가능하게 연결된 유전자의 발현을 지시할 수 있는 벡터는 본원에서 "발현 벡터"로 지칭된다. 본 명세서에서, "플라스미드" 및 "벡터"는 문맥상 달리 명확하지 않다면 상호교환적으로 사용된다. 시험관내 또는 생체내에서 본원에 기재된 바와 같이 RNA를 생성하도록 설계된 발현 벡터는 임의의 RNA 폴리머라제, 예컨대 미토콘드리아 RNA 폴리머라제, RNA pol I, RNA pol II, 및 RNA pol III에 의해 인식되는 서열을 함유할 수 있다. 이들 벡터는 본 발명에 따라 세포에서 원하는 RNA 분자를 전사하기 위해 사용될 수 있다. 식물 형질전환 벡터는 식물 형질전환 과정에서 적합한 벡터인 것으로 이해해야 한다.

야생형: 용어 "야생형", "천연" 또는 "천연 기원"은 유기체, 폴리펩티드, 또는 핵산 서열과 관련하여, 상기 유기체가 천연 발생이거나, 또는 변화되거나, 돌연변이되거나 또는 인간에 의해 달리 조작되지 않은 적어도 하나의 천연 발생 유기체에서 이용가능한 것을 의미한다.

도면:

도 1: InDel 대립유전자의 존재 및 부재 시 벼 단일-대립유전자 TIPS 편집된 사건의 빈도: 쌍을 형성한 Cas9 닉카제 vs Cas9 뉴클레아제

실시예

화학물질 및 일반적인 방법

달리 나타내지 않는다면, 제한 소화, 아가로스 겔 전기영동, 핵산의 정제, 핵산의 라이게이션, 형질전환, 박테리아 세포의 선택 및 배양을 비롯하여 본 발명의 목적을 위해 수행된 클로닝 절차는 (Sambrook et al., 1989)에 기재된 바와 같이 수행되었다. 재조합 DNA의 서열 분석은 생어(Sanger) 기술 (Sanger et al., 1977)을 이용하여 레이저 형광 DNA 시퀀서 (어플라이드 바이오시스템즈(Applied Biosystems, 미국 캘리포니아주 포스터 시티)에 의해 수행되었다. 달리 기재되지 않는다면, 화학물질 및 시약은 시그마 알드리치(Sigma Aldrich) (시그마 알드리치, 미국 세인트 루이스), 프로메가(Promega) (미국 위스콘신주 메디슨), 두케파(Duchefa) (네덜란드 할르렘) 또는 인비트로젠(Invitrogen) (미국 캘리포니아주 칼스바드)으로부터 수득하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스(New England Biolabs) (미국 메사추세츠주 입스위치) 또는 로슈 다이아그노스틱스 게엠베하(Roche Diagnostics GmbH) (독일 펜츠베르크)로부터 수득하였다. 올리고뉴클레오티드는 유로핀스 유로핀스 게노믹스(Eurofins Eurofins Genomics) (독일 에베르스베르크) 또는 통합된 DNA 기술 (미국 아이오와주 코랄빌)에 의해 합성되었다.

실시예 1: 이질육배체 밀에서 HDR-매개된 정확한 유전자 편집을 위한 최상의 gRNA 및 공여자 DNA 조합의 스크리닝

밀에서 정확한 유전자 편집을 위한 본 발명자들의 접근법은 먼저 편집된 묘목의 생성을 위해 사용되는 바람직한 gRNA/공여자 DNA 조합을 확인하기 위해 배반 캘러스 수준에서 상이한 gRNA/ 공여자 DNA 조합의 세트를 스크리닝하는 것을 기반으로 하였다.

이 실시예에서, 본 발명자들은 특이적인 단일 아미노산 치환 (I1781L)을 ACCase 유전자의 코딩 서열에 도입하기 위해, 본 발명자들이 5가지 상이한 gRNA/ 공여자 DNA 조합을 사전 스크리닝하였음을 설명한다. I1781L 치환을 위한 표적 코돈 근처의 5가지 상이한 표적 부위로 Cas9를 가이딩하는 5가지 상이한 gRNA를 설계하였다. 각각의 sgRNA 벡터 pBAY02528 (서열식별번호: 5), pBAY02529 (서열식별번호: 6), pBAY02530 (서열식별번호: 7), pBAY02531 (서열식별번호: 8) 및 pBAY02532 ((서열식별번호: 9)는 각각 표적 부위 TS1 서열 CTAGGTGTGGAGAACATACA-TGG (서열식별번호: 50), TS2 서열 GAAGGAGGATGGGCTAGGTG-TGG (서열식별번호: 51), TS3 서열 ATAGGCCCTAGAATAGGCAC-TGG (서열식별번호: 52), TS4 서열 CTCCTCATAGGCCCTAGAAT-AGG (서열식별번호: 53), TS5 CTATTGCCAGTGCCTATTCT-AGG (서열식별번호: 54)에서 DSB의 생성을 위해 Cas9를 가이딩할 수 있는 gRNA의 발현을 위한 카세트를 포함한다. 3가지 공여자 DNA 벡터, pBAY02539 (서열식별번호: 13), pBAY02540 (서열식별번호: 14) 및 pBAY02541 (서열식별번호: 15)을 개발하였고, 각각은 원하는 돌연변이 (I1781L 치환)를 함유하는 트리티쿰 아에스티붐, 재배종 필더(Fielder) 서브게놈 B, ACCase 유전자의 803bp DNA 단편을 포함한다. 3가지 공여자 DNA는 공여자 DNA 및 원하는 돌연변이 (I1781L)를 갖는 편집된 대립유전자의 절단을 방지하기 위한 소수의 침묵 돌연변이에서만 상이하다. 각각의 공여자 DNA에서 3-bp (CTC) 코어 서열은 서브게놈 B의 WT ACCase 서열과 동일한 ~400-bp 좌측 및 우측 상동성 아암에 의해 플랭킹되었다. Cas9 발현 pBAY02430 (서열식별번호: 1)은 밀을 위해 최적화된 Cas9 뉴클레아제 코돈을 포함하고, pUbiZm 프로모터 및 3'35S 종결자의 제어하에 있었다. Cas9 뉴클레아제를 갖는 벡터, gRNA, 공여자 DNA의 플라스미드 DNA를 egfp-bar 융합 유전자를 함유하는 플라스미드 pIB26 (서열식별번호: 18)과 혼합하여, 포스피노트리신 (PPT)에 대해 선택하고, GFP 형광에 대해 스크리닝하였다.

2-3 mm 크기의 미성숙 배아를 밀 재배종 필더의 멸균된 이삭으로부터 단리하고, [Sparks and Jones (Cereal Genomics: Methods in Molecular biology, vol. 1099, Chapter 17)]에 기재된 바와 같이 PDS-1000/He 입자 전달 시스템을 이용하여 충격을 가하였다. 하기 DNA 혼합물을 충격을 위해 사용하였다:

1) pBAY02430 (Cas9), pBAY02539 (공여자 DNA-1), pBAY02528 (gRNA1), pIB26

2) pBAY02430 (Cas9), pBAY02539 (공여자 DNA-1), pBAY02529 (gRNA2), pIB26

3) pBAY02430 (Cas9), pBAY02540 (공여자 DNA-2), pBAY02530 (gRNA3), pIB26

4) pBAY02430 (Cas9), pBAY02540 (공여자 DNA-2), pBAY02531 (gRNA4), pIB26

5) pBAY02430 (Cas9), pBAY02540 (공여자 DNA-2), pBAY02532 (gRNA5), pIB26

6) pBAY02430 (Cas9), pBAY02541 (공여자 DNA-3), pBAY02530 (gRNA3), pIB26

7) pBAY02430 (Cas9), pBAY02541 (공여자 DNA-3), pBAY02531 (gRNA4), pIB26

8) pBAY02430 (Cas9), pBAY02541 (공여자 DNA-3), pBAY02532 (gRNA5), pIB26

[Ishida et al. (Agrobacterium Protocols: Volume 1, Methods in Moleclar Biology, vol. 1223, Chapter 15)]에 기재된 바와 같이, 충격을 받은 미성숙 배아를 며칠 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, PPT 함유 선택 배지로 옮겼다. 3 내지 4 주 후에, 게놈 DNA를 PCR 분석을 위해 개별 미성숙 배아의 배반 캘러스로부터 추출하였다. 하기 프라이머 쌍을 편집된 ACCase 유전자의 특이적인 증폭을 위해 설계하였다: 공여자 DNA pBAY02539 (서열식별번호: 13)의 경우 프라이머 쌍 HT-18-111 정방향 / HT-18-112 역방향, 공여자 DNA pBAY02540 (서열식별번호: 14) 및 공여자 DNA pBAY02541 (서열식별번호: 15)의 경우 프라이머 쌍 HT-18-113 정방향/ HT-18-112 역방향 (표 1). 정확한 유전자 편집 효율은 공여자 DNA-1 (pBAY02539) (서열식별번호: 13)이 gRNA1 pBAY02528 (서열식별번호: 5)과 조합되어 사용될 때 가장 높았고, 이 gRNA/공여자 DNA 조합에 의해 개별 미성숙 배아로부터 유래된 배반 캘러스의 13%가 예상된 크기의 증폭 산물인 편집 특이적인 PCR을 제공하였다 (표 2).

ACCase (I1781L) 돌연변이를 갖는 밀 식물의 생성을 위해, 본 발명자들은 DNA 혼합물 1) pBAY02430 (Cas9) (서열식별번호: 1), pBAY02539 (공여자 DNA-1) (서열식별번호: 13), pBAY02528 (gRNA1) (서열식별번호: 5), pIB26 (서열식별번호: 18)에 의해 미성숙 밀 배아의 공동-충격을 수행하였고, 본 발명자들은 PPT에 대한 간접적인 선택을 통해 하나 이상의 동종 대립유전자에서 표적화된 AA 치환 (I1781L)을 갖는 밀 식물이 비교적 높은 성공률로 수득될 수 있음을 보여 주었다 (실시예 2 참고). 이는 이 실시예에 기재된 바와 같이 충격을 받은 미성숙 배아로부터의 배반 조직에서 정확한 HR-매개된 유전자 편집을 위한 상이한 gRNA/ 공여자 DNA 조합의 사전 스크리닝이 이질육배체 밀에서 동종 대립유전자 중 하나 이상에서 원하는 AA 변형을 갖는 밀 식물의 생성 가능성에 대한 양호한 예측을 가능하게 함을 입증한다.

표 1. 편집-특이적인 PCR (ACCaseI1781L)을 위한 프라이머

표 2. ACCaseI1781L 편집을 위한 상이한 gRNA/ 공여자 DNA 조합의 스크리닝: 편집 PCR에서 양성인 배반 조직 샘플 (ACCaseI1781L)의 수

실시예 2: Cas9 뉴클레아제에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

본 발명자들은 실시예 1에 기재된 바와 같이 이질육배체 밀에서 잠재적인 HR-매개된 정확한 유전자 편집 능력에 대해 Cas9 뉴클레아제 및 사전 스크리닝된 gRNA/공여자 DNA 조합을 이용함으로써, 원하는 돌연변이가 하나 이상의 동종 대립유전자의 표적 코돈에 도입될 수 있음을 입증하였다. sgRNA 벡터 pBAY02528 (서열식별번호: 5)은 표적 코돈에 걸쳐 위치하는 표적 부위 TS1 서열 CTAGGTGTGGAGAACATACA-TGG (서열식별번호: 50)에서 DSB의 생성을 위해 Cas9 뉴클레아제를 가이딩하는 gRNA1의 발현을 위한 카세트를 포함한다. 공여자 DNA pBAY2539는 단백질 수준에서 I1781L 변화를 유도하는 표적 코돈에서 2개의 염기 치환 (ATA에서 CTC로)의 도입을 위해 설계되었다. 공여자 DNA는 원하는 돌연변이 (I1781L 치환)를 함유하는 트리티쿰 아에스티붐, 재배종 필더 서브게놈 B, ACCase 유전자의 803bp DNA 단편을 포함한다. 공여자 DNA는 또한 공여자 DNA 및 원하는 돌연변이 (I1781L)를 갖는 편집된 대립유전자의 절단을 방지하기 위해 일부 다른 침묵 돌연변이를 함유한다. 공여자 DNA에서 3-bp (CTC) 코어 서열은 서브게놈 B의 WT ACCase 서열과 동일한 ~400-bp 좌측 및 우측 상동성 아암에 의해 플랭킹되었다.

2-3 mm 크기의 미성숙 배아를 밀 재배종 필더의 멸균된 이삭으로부터 단리하고, [Sparks and Jones (Cereal Genomics: Methods in Molecular biology, vol. 1099, Chapter 17)]에 기재된 바와 같이 PDS-1000/He 입자 전달 시스템에 의해 충격을 가하였다. 벡터 pBAY02430 (Cas9 뉴클레아제) (서열식별번호: 1), pBAY02528 (gRNA) (서열식별번호: 5), pBAY02539 (공여자 DNA) (서열식별번호: 13)의 플라스미드 DNA를 플라스미드 pIB26 (서열식별번호: 18)과 혼합하였다. 벡터 pIB26 (서열식별번호: 18)은 35S 프로모터의 제어하에 egfp-bar 융합 유전자를 함유한다. [Ishida et al. (Agrobacterium Protocols: Volume 1, Methods in Molecular Biology, vol. 1223, Chapter 15)]에 기재된 바와 같이, 충격을 받은 미성숙 배아를 1-2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, PPT 함유 선택 배지로 옮겼고, PPT 내성 캘러스를 선택하고, 새싹 형성을 위해 재생 배지로 옮겼다.

한 미성숙 배아로부터 발달된 모든 식물은 풀로서 처리되었다. 게놈 DNA를 풀링된 잎 샘플로부터 추출하였고, 프라이머 세트 (HT-18-111 정방향 (서열식별번호: 28) / HT-18-112 역방향 (서열식별번호: 29))는 편집된 ACCase 유전자의 특이적인 증폭을 위해 설계되었다. 이어서, 이 제1 편집 특이적인 PCR에서 예상된 PCR 단편을 제공하는 풀에서의 묘목을 개별 튜브로 옮기고, 프라이머 세트 HT-18-111 (서열식별번호: 28) /HT-18-112 (서열식별번호: 29)를 이용하는 PCR에 의해 및 딥 시퀀싱에 의해 추가로 분석하였다. 9가지 실험을 위해 총 337, 326, 415, 322, 350, 329, 261, 361 및 362개의 배아를 pBAY02430 (Cas9 뉴클레아제) (서열식별번호: 1), pBAY02528 (gRNA) (서열식별번호: 5), pBAY02539 (공여자 DNA) (서열식별번호: 13) 및 pIB26 (서열식별번호: 18)의 플라스미드 DNA의 혼합물에 의해 충격을 가하였다. 이들 9가지 실험에서, 총 132, 172, 111, 177, 107, 166, 122, 244 및 279개의 미성숙 배아로부터 포스피노트리신 (PPT) 내성 새싹 재생 캘러스를 수득하였다. 편집된 ACCase 유전자의 특이적인 증폭은 8, 17, 15, 9, 16, 7, 6, 9 및 8개의 풀링된 잎 샘플에서 관찰되었다. 제2 편집 특이적인 PCR을 제1 편집 PCR에서 양성으로 평점된 8, 15, 15, 8, 16, 7, 6, 9 및 8개의 묘목 풀로부터 유래된 총 51, 62, 66, 33, 49, 25, 35, 42 및 31개의 개별 식물에 대해 수행하였고, 편집된 ACCase 유전자의 특이적인 증폭은 각각 6, 11, 8, 7, 10, 7, 4, 8 및 8개의 묘목 풀로부터 유래된 16, 28, 12, 25, 19, 19, 13, 21 및 12개의 개별 묘목에서 관찰되었다 (표 3). 각각의 묘목 풀이 단일 미성숙 배아로부터 유래되므로, 단일 미성숙 배아로부터 유래된 모든 묘목 (묘목 풀)은 독립적인 편집된 사건으로 고려되지만, 본 발명자들은 제2 편집 PCR에서 양성으로 평점된 단일 미성숙 배아로부터 유래된 개별 새싹들 사이에서 다중 독립적인 편집된 사건이 있을 수 있음을 배제할 수 없다. 제2 편집 PCR에서 양성으로 평점된 각각의 사건으로부터의 한 식물에 대해, 딥 시퀀싱을 수행하였다. 의도된 표적 부위를 둘러싸는 영역은 네스티드 PCR에 의해 Q5 고충실도 폴리머라제 (M0492L)를 사용하여 PCR 증폭시켰다. 제1 PCR을 위해 프라이머 쌍 HT-18-162 (서열식별번호: 34) / HT-18-112 (서열식별번호: 29)가 사용되었고; 이들 프라이머는 1736bp 단편의 증폭을 위해 공여자 DNA의 상동성 아암 외부에 위치하였다. NGS에 대한 386 bp 영역을 증폭시키기 위한 네스티드 PCR의 경우, 프라이머 쌍 HT-18-048 (서열식별번호: 19)/ HT-18-053 (서열식별번호: 21)이 사용되었다.

본 발명자들은 총 리드 수의 비율로서 공여자 DNA에 의해 지시되는 표적 코돈에서 원하는 돌연변이 (AA 치환)의 존재에 대한 증거를 나타내는 서열 리드의 백분율을 계산함으로써 편집 빈도를 평가하였다. 이들 데이터는 표 4에 요약되며, 59회 독립적인 사건으로부터 64개의 묘목에 대한 총 리드 수를 기반으로 하여 원하는 돌연변이 (I1781L 치환)를 갖는 정확하게 편집된 리드의 % 및 WT 리드의 %를 나타낸다. 충격을 받지 않은 미성숙 배아로부터 유래된 묘목 TMTA0136-Ctrl0001-01$002로부터의 대조군 샘플은 예상되는 바와 같이 ~100% WT 리드 및 정확하게 편집된 리드 없음을 나타내었다.

이들 딥 시퀀싱 분석 데이터는 이질육배체 밀에서 천연 ACCase 유전자의 1 내지 4개의 대립유전자의 상동성 재조합 (HR)에 의한 정확한 유전자 편집을 나타내었다.

공여자 DNA에 의해 지시되는 원하는 AA 치환 및 추가의 침묵 돌연변이 도입을 일으키는 HR-매개된 정확한 공여자는 클로닝된 PCR 단편의 생어 시퀀싱에 의해 추가로 확인되었다. 딥 시퀀싱에 의해 분석된 이들 사건 중 11개에서, 프라이머 쌍 HT-18-162 정방향 (서열식별번호: 34) / HT-18-112 (서열식별번호: 29) 역방향에 의한 표적 영역에 대한 PCR 증폭, 클로닝 및 생어 시퀀싱을 서브게놈 특징분석을 위해 수행하였다. 사건당 52 내지 96개의 클론을 시퀀싱하였다. 이들 데이터는 표 5에 요약되어 있으며, 정확하게 편집된 대립유전자(들)을 갖는 식물은 가장 흔하게는 NHEJ-유래된 InDel을 갖는 대립유전자(들) 및 때때로 또한 WT 대립유전자(들)을 함유한다. 이들 T0 식물을 종자 생성을 위해 온실로 옮겼다. 상이한 서브게놈에 정확한 편집된 대립유전자를 갖는 독립적인 사건으로부터의 식물을 교배하여, 예를 들어 ACCase 유전자의 3개의 상동성 카피 모두에서 원하는 AA 변형을 갖는 식물을 생성할 수 있고, NHEJ-유래된 Indel을 갖는 원치 않는 대립유전자는 자손 분리에 의해 제거될 수 있다.

표 3. 편집 PCR 분석을 기반으로 하는 ACCase I1781L 편집된 묘목의 수

* 각각의 잎 풀은 하나의 미성숙 배아로부터 유래된다

표 4. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터 개별 묘목의 아세틸-CoA 카르복실라제 표적 로커스 (ACCase I1781L)에서 정확하게 편집된 리드 퍼센트 (%)

표 5. 클로닝된 PCR 단편의 생어 시퀀싱에 의한 독립적인 사건으로부터의 11개의 T0 식물에서 ACCase 로커스 유전자형. 정확한 편집은 공여자 DNA에 의해 지시된 원하는 AA 치환 및 추가의 침묵 돌연변이를 갖는 정확하게 편집된 ACCase 대립유전자의 존재를 나타내고, InDel은 NHEJ 돌연변이의 존재를 나타내고, WT는 WT 천연 ACCase 서열의 존재를 나타낸다. 정확한 편집, WT, InDel 앞의 숫자는 ACCase 대립유전자의 3가지 상이한 버전이 확인된 빈도를 나타낸다.

실시예 3: 쌍을 형성한 Cas9 닉카제에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

하기 실시예는 쌍을 형성한 Cas9 닉카제에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집을 기재한다. Cas9 닉카제 및 2개의 sgRNA를 사용하여 SpCas9 닉카제를 반대쪽 가닥에서 서로 근접하고 표적 코돈 ACCase I1781 및 공여자 DNA에 근접하게 있는 2개의 표적 부위 (TS1, T2)로 유도함으로써, 원하는 돌연변이를 표적 코돈에 효율적으로 도입할 수 있다. Cas9 닉카제 발현 벡터 pBay02734 (서열식별번호: 3)를 구축하였다. RuvC 도메인 내의 위치 10에서 아스파르트산에서 알라닌으로의 돌연변이 (D10A 돌연변이)에 의한 Cas9 닉카제는 밀에 대해 코돈 최적화되었고, pUbiZm 프로모터 및 3'35S 종결자의 제어하에 있다. 3가지 밀 서브게놈 A, B 및 D 상의 모든 유전자 카피를 표적화하고, 표적 코돈에 걸쳐 있는 32 bp 3' 오버행을 생성하기 위해 2가지 sgRNA를 설계하였다. sgRNA 벡터 pBAY02528 (서열식별번호: 5)은 표적 부위 TS1 서열 CTAGGTGTGGAGAACATACA-TGG (서열식별번호: 50)에서 닉의 생성을 위해 Cas9 닉카제를 가이딩할 수 있는 gRNA1의 발현을 위한 카세트를 포함한다. sgRNA 벡터 pBAY02531은 표적 부위 TS2 서열 CTCCTCATAGGCCCTAGAAT-AGG (서열식별번호: 53)를 표적화하는 gRNA2의 발현을 위한 카세트를 포함한다. 공여자 DNA pBAY02540 (서열식별번호: 14)은 단백질 수준에서 I1781L 변화를 유도하는 표적 코돈에서 2개의 염기 치환 (ATA에서 CTC로)의 도입을 위해 설계되었다. 공여자 DNA는 원하는 돌연변이 (I1781L 치환)를 함유하는 트리티쿰 아에스티붐, 재배종 필더 서브게놈 B, ACCase 유전자의 803bp DNA 단편을 포함한다. 공여자 DNA는 또한 공여자 DNA 및 원하는 돌연변이 (I1781L)를 갖는 편집된 대립유전자의 절단을 방지하기 위해 일부 다른 침묵 돌연변이를 함유한다. 공여자 DNA에서 3-bp (CTC) 코어 서열은 서브게놈 B의 WT ACCase 서열과 동일한 ~400-bp 좌측 및 우측 상동성 아암에 의해 플랭킹되었다.

2-3 mm 크기의 미성숙 배아를 밀 재배종 필더의 멸균된 이삭으로부터 단리하고, [Sparks and Jones (Cereal Genomics: Methods in Molecular biology, vol. 1099, Chapter 17)]에 기재된 바와 같이 PDS-1000/He 입자 전달 시스템을 이용하여 충격을 가하였다. 벡터 pBAY02734 (Cas9 닉카제) (서열식별번호: 3), pBAY02528 (gRNA1) (서열식별번호: 5), pBAY02531 (gRNA2) (서열식별번호: 8), pBAY02540 (공여자 DNA) (서열식별번호: 14)의 플라스미드 DNA를 플라스미드 pIB26 (서열식별번호: 18)과 혼합하였다. 벡터 pIB26 (서열식별번호: 18)은 35S 프로모터의 제어하에 egfp-bar 융합 유전자를 함유한다. [Ishida et al. (Agrobacterium Protocols: Volume 1, Methods in Molecular Biology, vol. 1223, Chapter 15)]에 기재된 바와 같이, 충격을 받은 미성숙 배아를 1-2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, PPT 함유 선택 배지로 옮기고, PPT 내성 캘러스를 선택하고, 새싹 형성을 위해 재생 배지로 옮겼다.

하나의 미성숙 배아로부터 발달한 모든 식물은 풀로서 처리되었다. 게놈 DNA를 풀링된 잎 샘플로부터 추출하였고, 프라이머 세트 (HT-18-113 정방향 / HT-18-112 역방향 (서열식별번호: 30; 29))는 편집된 ACCase 유전자의 특이적인 증폭을 위해 설계되었다. 이어서, 이 제1 편집 특이적인 PCR에서 예상된 PCR 단편을 제공하는 풀에서의 묘목을 개별 튜브로 옮기고, 프라이머 세트 HT-18-113/HT-18-112 (서열식별번호: 30; 29)를 이용하는 PCR에 의해 및 딥 시퀀싱에 의해 추가로 분석하였다. 6가지 실험을 위해 총 358, 423, 365, 355, 409 및 395개의 배아를 pBAY02734 (Cas9 닉카제) (서열식별번호: 3), pBAY02528 (gRNA1) (서열식별번호: 5), pBAY02531 (gRNA2) (서열식별번호: 8), pBAY02540 (공여자 DNA) (서열식별번호: 14) 및 pIB26 (서열식별번호: 18)의 플라스미드 DNA의 혼합물에 의해 충격을 가하였다. 이들 6가지 실험에서, 포스피노트리신 (PPT) 내성 새싹 재생 캘러스는 총 195, 163, 192, 181, 268 및 190개의 미성숙 배아로부터 수득되었다. 편집된 ACCase 유전자의 특이적인 증폭은 13, 6, 44, 22, 21 및 22개의 풀링된 잎 샘플에서 관찰되었다. 제2 편집 특이적인 PCR은 제1 편집 PCR에서 양성으로 평점된 11, 5, 39, 17, 16 및 20개의 묘목 풀로부터 유래된 총 45, 20, 258, 64, 94, 93개의 개별 식물에서 수행되었다. 편집된 ACCase 유전자의 특이적인 증폭은 각각 11, 5, 33, 14, 12 및 17개의 묘목 풀로부터 유래된 22, 18, 93, 41, 18 및 35개의 개별 새싹에서 관찰되었다 (표 6). 각각의 묘목 풀이 단일 미성숙 배아로부터 유래되므로, 단일 미성숙 배아로부터 유래된 모든 묘목 (묘목 풀)이 독립적인 편집된 사건으로 고려되지만, 본 발명자들은 제2 편집 PCR에서 양성으로 평점된 단일 미성숙 배아로부터 유래된 개별 새싹들 사이의 다중 독립적인 편집된 사건이 있을 수 있음을 배제할 수 없다. 제2 편집 PCR에서 양성으로 평점된 각각의 사건으로부터의 한 식물에 대해, 딥 시퀀싱을 수행하였다. 의도된 표적 부위를 둘러싸는 영역을 네스티드 PCR에 의해 Q5 고충실도 폴리머라제 (M0492L)를 사용하여 PCR 증폭시켰다. 제1 PCR을 위해 프라이머 쌍 HT-18-162/ HT-18-112 (서열식별번호: 34; 29)가 사용되었고; 이들 프라이머는 1736bp 단편의 증폭을 위해 공여자 DNA의 상동성 아암 외부에 위치하였다. NGS에 대한 386 bp의 영역을 증폭시키기 위한 네스티드 PCR의 경우, 프라이머 쌍 HT-18-048/ HT-18-053 (서열식별번호: 19; 21)이 사용되었다.

본 발명자들은 총 리드 수의 비율로서 표적 코돈에서 원하는 I1781L 돌연변이의 존재에 대한 증거를 나타내는 서열 리드의 백분율을 계산함으로써 편집 빈도를 평가하였다. 이들 데이터는 표 7에 요약되며, 모두 독립적인 사건으로부터 유래된 57개의 묘목에 대해, 총 리드 수, 원하는 돌연변이 (I1781L 치환)을 갖는 리드의 %, 공여자 DNA에 존재하는 원하는 돌연변이 및 모든 침묵 돌연변이를 갖는 리드의 %, 및 WT 리드의 %를 나타낸다. 이들 딥 시퀀싱 분석 데이터는 이질육배체 밀에서 천연 ACCase 유전자의 1 내지 4개의 대립유전자가 원하는 I1781L 치환을 함유함을 나타내었다. 이들 데이터는 추가로 원하는 AA 치환을 갖는 식물에서 복구 DNA로부터 모든 침묵 돌연변이가 항상 도입된 것은 아니었음을 나타낸다. 침묵 돌연변이는 표적 부위 TS2 (gRNA2) 주위에 위치하였다. 이들 데이터는 추가로 원하는 편집 (I1781L)을 갖는 대립유전자(들)을 갖는 식물의 ~50% (28/57)가 NHEJ-유래된 InDel을 갖는 리드를 함유하지 않음을 나타낸다. 다른 50%에서 NHEJ-유래된 InDel을 갖는 리드의 수는 때때로 매우 낮다. 대조적으로 CRISPR/Cas 닉카제 대신에 CRISPR/Cas9 뉴클레아제를 사용함으로써, 하나 이상의 정확하게 편집된 대립유전자를 갖는 사건의 98-100% 또한 NHEJ-유래된 InDel을 갖는 대립유전자(들)을 함유한다 (표 4).

닉카제를 사용하여 정확하게 편집된 대립유전자를 갖는 사건에서 Indel을 갖는 대립유전자의 부재는 정확한 편집을 위해 밀 서브게놈 (A,B,D) 식물 동형접합성 (HH), 반접합성 (Hh) 및 WT (hh) 중 하나 이상에 대해 정확하게 편집된 대립유전자(들)의 성능 영향의 용량 효과를 연구하는 것을 더 용이하게 만들 것이고, 추가의 성능 평가를 위해 T1 세대에서 이미 이용가능하였을 것이다. 상이한 서브게놈에서 정확한 편집된 대립유전자를 갖는 독립적인 사건으로부터의 식물을 교배하여, 예를 들어 표적 유전자의 3개의 상동성 카피 모두에서 원하는 AA 변형을 갖는 식물을 생성할 수 있다.

표 6. 편집 PCR 분석을 기반으로 하여 Cas9 쌍을 형성한 닉카제의 사용에 의해 ACCase I1781L 편집된 묘목의 수

표 7. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 개별 묘목의 아세틸-CoA 카르복실라제 표적 로커스 (ACCase I1781L)에서 정확하게 편집된 리드 퍼센트 (%)

실시예 4: Cas9 뉴클레아제에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 A2004V 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

실시예 1에 기재된 바와 같이 이질육배체 밀에서 잠재적인 HR-매개된 정확한 유전자 편집 능력에 대한 Cas9 뉴클레아제 및 사전 스크리닝된 gRNA/공여자 DNA 조합을 이용함으로써, 본 발명자들은 표적화된 DSB의 HR-매개된 공여자에 의해 및 PPT에 대한 내성에 대한 간접적인 선택을 통해 ACCase 유전자의 하나 이상의 대립유전자에서 원하는 아미노산 치환 A2004V를 갖는 편집된 밀 식물을 복구하였다. sgRNA 벡터 pBAY02524 (서열식별번호: 10)는 표적 GCT 코돈의 상류 가까이에 위치하는 표적 부위 TS 서열 TTCCTCGTGCTGGGCAAGTC-TGG (서열식별번호: 55)에서 DSB의 생성을 위해 Cas9 뉴클레아제를 가이딩하는 gRNA의 발현을 위한 카세트를 포함한다. 공여자 DNA pBAY02536 (서열식별번호: 16)은 단백질 수준에서 A2004 변화를 유도하는 표적 코돈에서 2개의 염기 치환 (GCT에서 GTC로)의 도입을 위해 설계되었다. 공여자 DNA는 원하는 돌연변이 (A2004V 치환)를 함유하는 트리티쿰 아에스티붐, 재배종 필더 서브게놈 B, ACCase 유전자의 787bp DNA 단편을 포함한다. 공여자 DNA는 또한 공여자 DNA 및 원하는 돌연변이 (A2004V)를 갖는 편집된 대립유전자의 절단을 방지하기 위해 일부 다른 침묵 돌연변이를 함유한다. 공여자 DNA에서 3-bp (GTC) 코어 서열은 서브게놈 B의 WT ACCase 서열과 동일한 ~390-bp 좌측 및 우측 상동성 아암에 의해 플랭킹되었다.

2-3 mm 크기의 미성숙 배아를 밀 재배종 필더의 멸균된 이삭으로부터 단리하고, [Sparks and Jones (Cereal Genomics: Methods in Molecular biology, vol. 1099, Chapter 17)]에 기재된 바와 같이 PDS-1000/He 입자 전달 시스템을 이용하여 충격을 가하였다. 벡터 pBAY02430 (Cas9 뉴클레아제) (서열식별번호: 1), pBAY02524 (gRNA) (서열식별번호: 10), pBAY02536 (공여자 DNA) (서열식별번호: 16)의 플라스미드 DNA를 플라스미드 pIB26 (서열식별번호: 18)과 혼합하였다. 벡터 pIB26 (서열식별번호: 18)은 35S 프로모터의 제어하에 egfp-bar 융합 유전자를 함유한다. [Ishida et al. (Agrobacterium Protocols: Volume 1, Methods in Molecular Biology, vol. 1223, Chapter 15)]에 기재된 바와 같이, 충격을 받은 미성숙 배아를 1-2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, PPT 함유 선택 배지로 옮기고, PPT 내성 캘러스를 선택하고, 새싹 형성을 위해 재생 배지로 옮겼다.

하나의 미성숙 배아로부터 발달한 모든 식물은 풀로서 처리되었다. 게놈 DNA를 풀링된 잎 샘플로부터 추출하였고, 프라이머 쌍 (HT-18-101 정방향 (서열식별번호: 25)/ HT-18-102 역방향 (서열식별번호: 26))은 편집된 ACCase 유전자의 특이적인 증폭을 위해 설계되었다. 이어서, 이 제1 편집 특이적인 PCR에서 예상된 PCR 단편을 제공하는 풀에서의 묘목을 개별 튜브로 옮기고, 프라이머 세트 HT-18-101 정방향 (서열식별번호: 25)/ HT-18-102 역방향 (서열식별번호: 26)을 이용하는 PCR에 의해 및 딥 시퀀싱에 의해 추가로 분석하였다. 4가지 실험을 위해 총 382, 424, 401 및 375개의 배아를 pBAY02430 (Cas9 뉴클레아제) (서열식별번호: 1), pBAY02524 (gRNA1) (서열식별번호: 10), pBAY02536 (공여자 DNA-1) (서열식별번호: 16) 및 pIB26 (서열식별번호: 18)의 플라스미드 DNA의 혼합물에 의해 충격을 가하였다. 이들 4 실험에서, 포스피노트리신 (PPT) 내성 새싹 재생 캘러스를 총 107, 326, 341 및 300개의 미성숙 배아로부터 수득하였다. 편집된 ACCase 유전자의 특이적인 증폭은 2, 28, 7 및 5개의 풀링된 잎 샘플에서 관찰되었다. 제2 편집 특이적인 PCR은 제1 편집 PCR에서 양성으로 평점된 2, 27, 6 및 5개의 묘목 풀로부터 유래된 총 14, 259, 29 및 40개의 개별 식물에 대해 수행되었고, 편집된 ACCase 유전자의 특이적인 증폭은 각각 2, 23, 3 및 6개의 묘목 풀로부터 유래된 7, 58, 7 및 7개의 개별 묘목에서 관찰되었다 (표 8). 각각의 묘목 풀이 단일 미성숙 배아로부터 유래되므로, 단일 미성숙 배아로부터 유래된 모든 묘목 (묘목 풀)이 독립적인 편집된 사건으로 고려되지만, 본 발명자들은 제2 편집 PCR에서 양성으로 평점된 단일 미성숙 배아로부터 유래된 개별 새싹들 사이의 다중 독립적인 편집된 사건이 있을 수 있음을 배제할 수 없다. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 식물에 대해, 딥 시퀀싱을 수행하였다. 제1 PCR을 위해 프라이머 쌍 HT-18-101 (서열식별번호: 25)/ HT-18-110 (서열식별번호: 27)이 사용되었고; 이들 프라이머는 1313bp 단편의 증폭을 위해 공여자 DNA의 상동성 아암의 외부에 위치하였다. NGS에 대한 348 bp 영역을 증폭시키기 위한 네스티드 PCR의 경우, 프라이머 쌍 HT-18-051 (서열식별번호: 20)/ HT-18-054 (서열식별번호: 22)가 사용되었다. 이들 데이터는 본 발명자들이 AA 치환 A2004V를 갖는 정확하게 편집된 1 또는 2개의 대립유전자를 갖는 식물을 복구하였음을 나타낸다 (표 9).

표 8.

표 9. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 개별 묘목의 아세틸-CoA 카르복실라제 표적 로커스 (ACCase A2004V)에서 정확하게 편집된 리드 퍼센트 (%)

실시예 5: Cas9 뉴클레아제에 의해 이질육배체 밀의 ALS (아세토락테이트 신타제) 유전자에서 ALSW548L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

실시예 3에 기재된 바와 같이 이질육배체 밀에서 잠재적인 HR-매개된 정확한 유전자 편집 능력에 대해 Cas9 뉴클레아제 및 사전 스크리닝된 gRNA/공여자 DNA 조합을 사용함으로써, 본 발명자들은 표적화된 DSB의 HR-매개된 공여자에 의해 및 PPT에 대한 내성에 대한 간접적인 선택에 의해 ALS 유전자의 하나 이상의 대립유전자에서 원하는 아미노산 치환 W548L을 갖는 편집된 밀 식물을 복구하였다. 본 발명자들은 2가지 적절한 sgRNA 벡터를 확인하였다. sgRNA 벡터 pBAY02533 (서열식별번호: 11) 및 pBAY02535 (서열식별번호: 12)는 각각 표적 부위 TS 서열 GAACAACCAGCATCTGGGAA-TGG (서열식별번호: 56) 및 ATCTGGGAATGGTGGTGCAG-TGG (서열식별번호: 57)에서 DSB의 생성을 위해 Cas9 뉴클레아제를 가이딩하는 gRNA의 발현을 위한 카세트를 포함한다. 공여자 DNA pBAY02542 (서열식별번호: 17)는 단백질 수준에서 W548L 변화를 유도하는 표적 코돈에서 2개의 염기 치환 (TGG에서 CTC로)의 도입을 위해 설계되었다. 공여자 DNA는 원하는 돌연변이 (W548L 치환)를 함유하는 트리티쿰 아에스티붐, 재배종 필더 서브게놈 D, ALS 유전자의 805bp DNA 단편을 포함한다. 공여자 DNA는 또한 공여자 DNA 및 원하는 돌연변이 (W548L)를 갖는 편집된 대립유전자의 절단을 방지하기 위해 일부 다른 침묵 돌연변이를 함유한다. 공여자 DNA에서 3-bp (CTC) 코어 서열은 서브게놈 D의 WT ALS 서열과 동일한 ~400-bp 좌측 및 우측 상동성 아암에 의해 플랭킹되었다.

2-3 mm 크기의 미성숙 배아를 밀 재배종 필더의 멸균된 이삭으로부터 단리하고, [Sparks and Jones (Cereal Genomics: Methods in Molecular biology, vol. 1099, Chapter 17)]에 기재된 바와 같이 PDS-1000/He 입자 전달 시스템을 이용하여 충격을 가하였다. 벡터 pBAY02430 (Cas9 뉴클레아제) (서열식별번호: 1), pBAY02533 (gRNA) (서열식별번호: 11) 또는 pBAY02535 (gRNA) (서열식별번호: 12), pBAY02542 (공여자 DNA) (서열식별번호: 17)의 플라스미드 DNA를 플라스미드 pIB26 (서열식별번호: 18)과 혼합하였다. 벡터 pIB26 (서열식별번호: 18)은 35S 프로모터의 제어하에 egfp-bar 융합 유전자를 함유한다. [Ishida et al. (Agrobacterium Protocols: Volume 1, Methods in Molecular Biology, vol. 1223, Chapter 15)]에 기재된 바와 같이, 충격을 받은 미성숙 배아를 1-2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, PPT 함유 선택 배지로 옮기고, PPT 내성 캘러스를 선택하고, 새싹 형성을 위해 재생 배지로 옮겼다.

하나의 미성숙 배아로부터 발달한 모든 식물은 풀로서 처리되었다. 게놈 DNA를 풀링된 잎 샘플로부터 추출하였고, 프라이머 쌍 (HT-18-135 정방향 (서열식별번호: 32) / HT-18-136 역방향 (서열식별번호: 33))은 편집된 ALS 유전자의 특이적인 증폭을 위해 설계되었다. 이어서, 이 제1 편집 특이적인 PCR에서 예상된 PCR 단편을 제공하는 풀에서의 묘목을 개별 튜브로 옮기고, 프라이머 쌍 HT-18-135 정방향 (서열식별번호: 32) / HT-18-136 역방향 (서열식별번호: 33)을 이용하는 PCR에 의해 및 딥 시퀀싱에 의해 추가로 분석하였다. 4가지 실험을 위해 총 325, 467, 385 및 339개의 배아를 pBAY02430 (Cas9 뉴클레아제) (서열식별번호: 1), pBAY02533 (gRNA) (서열식별번호: 11) 또는 pBAY02535 (서열식별번호: 12) 및 pBAY02542 (공여자 DNA) (서열식별번호: 17) 및 pIB26 (서열식별번호: 18)의 플라스미드 DNA의 혼합물에 의해 충격을 가하였다. 이들 4가지 실험에서, 포스피노트리신 (PPT) 내성 새싹 재생 캘러스는 각각 총 235, ~258, 112 및 164개의 미성숙 배아로부터 수득되었다. 편집된 ALS 유전자의 특이적인 증폭은 10, 11, 3 및 4개의 풀링된 잎 샘플에서 관찰되었다. 제2 편집 특이적인 PCR은 제1 편집 PCR에서 양성으로 평점된 10, 11, 3 및 3개의 묘목 풀로부터 유래된 총 53, 71, 27 및 13개의 개별 식물에 대해 수행되었고, 편집된 ALS 유전자의 특이적인 증폭은 각각 4, 7, 3 및 2개의 묘목 풀로부터 유래된 14, 25, 12 및 4개의 개별 묘목에서 관찰되었다 (표 10). 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 수많은 식물에 대해, 딥 시퀀싱을 수행하였다. 제1 PCR을 위해 프라이머 쌍 HT-18-130 (서열식별번호: 31) / HT-18-136 (서열식별번호: 33)이 사용되었고; 이들 프라이머는 1278bp 단편의 증폭을 위해 공여자 DNA의 상동성 아암의 외부에 위치하였다. NGS에 대한 320 bp의 영역을 증폭시키기 위한 네스티드 PCR의 경우, 프라이머 쌍 HT-18-065 (서열식별번호: 23)/ HT-18-066 (서열식별번호: 24)이 사용되었다. 이들 데이터는 본 발명자들이 원하는 AA 치환 W548L을 갖는 정확하게 편집된 1 또는 2개의 대립유전자를 갖는 식물을 복구하였음을 나타내었다. 10% 미만의 정확한 편집 %를 갖는 묘목은 키메라인 것으로 고려된다 (예를 들어 TMTA0158-0107-B01-01$001, TMTA0183-0055-B01-01$001) (표 11).

표 10. 편집 PCR 분석을 기반으로 하는 ALS W548L 편집된 묘목의 수

표 11. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 개별 묘목의 아세토락테이트 신타제 유전자 (ALS W548L)에서 정확하게 편집된 리드 퍼센트 (%)

실시예 6: Cas9 뉴클레아제에 의해 및 직접적인 선택에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

ACCase 유전자에서 I1781L 돌연변이의 도입을 위해 충격을 받은 미성숙 배아를 플라스미드 DNA pBAY02430 (Cas9) (서열식별번호: 1), pBAY02528 (gRNA) (서열식별번호: 5) 및 공여자 DNA pBAY02539 (서열식별번호: 13)의 혼합물에 의해 충격을 가하였다. 충격을 받은 미성숙 배아를 1-2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, 200 및 300nM 퀴잘로포프를 갖는 선택 배지로 옮겼다. 프라이머 쌍 HT-18-111 정방향 (서열식별번호: 28) / HT-18-112 역방향 (서열식별번호: 29)을 이용하는 편집 특이적인 PCR에서 양성인 퀴잘로포프 내성 라인을 복구하였다. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 수많은 식물에 대해, 딥 시퀀싱을 수행하였다. 이들 NGS 데이터는 이들 식물이 원하는 AA 치환 I1781L을 갖는 하나 이상의 정확하게 편집된 대립유전자를 함유함을 추가로 확인시켜 준다.

실시예 7: CRISPR/Cas9 성분의 RNP-매개된 전달에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집

CRISPR/Cas9 RNP 복합체를 생성하기 위해, Cas9 단백질 (알트-알(Alt-R)® S.p. Cas9 뉴클레아제 V3, IDT) 및 sgRNA (알트-알® CRISPR-Cas9 crRNA XT 및 알트-알® CRISPR-Cas9 tracrRNA, IDT)를 IDT의 프로토콜에 따라 사전 혼합하였다 (www.idtdna.com). sgRNA는 ACCase에서 표적 코돈에 걸쳐 위치하는 서열 CTAGGTGTGGAGAACATACA-TGG (서열식별번호: 50)를 표적화하도록 설계되었다.

[Svitashev et al. 2016]에 기재된 바와 같이, 2-3 mm 크기의 미성숙 배아를 PDS-1000/He 입자 전달 시스템을 이용하여 RNP 및 공여자 DNA pBay02539 (서열식별번호: 13)의 혼합물에 의해 충격을 가하였다. 충격을 받은 미성숙 배아를 2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, 200nM 퀴잘로포프를 갖는 선택 배지로 옮겼다. 2가지 실험을 위해 총 298 및 302개의 배아를 RNP 및 공여자 DNA pBAY02539 (서열식별번호: 13)의 혼합물에 의해 충격을 가하였다. 이들 2가지 실험으로부터 퀴잘로포프 내성 라인이 16 및 9개의 미성숙 배아로부터 수득되었고, 이들 25개의 라인에 대해 프라이머 쌍 HT-18-111 정방향 (서열식별번호: 28) / HT-18-112 역방향 (서열식별번호: 29)을 이용하는 편집된 ACCase 유전자의 특이적인 증폭이 관찰되었다.

편집 PCR에서 양성으로 평점된 9가지 독립적인 사건에 대해, 1개의 식물 / 사건으로 딥 시퀀싱을 수행하였다. 의도된 표적 부위를 둘러싸는 영역을 네스티드 PCR에 의해 Q5 고충실도 폴리머라제 (M0492L)를 사용하여 PCR 증폭시켰다. 제1 PCR을 위해 프라이머 쌍 HT-18-162 (서열식별번호: 34) / HT-18-112 (서열식별번호: 29)가 사용되었고; 이들 프라이머는 1736bp 단편의 증폭을 위해 공여자 DNA의 상동성 아암 외부에 위치하였다. NGS에 대한 386 bp의 영역을 증폭시키기 위한 네스티드 PCR의 경우, 프라이머 쌍 HT-18-048 (서열식별번호: 19)/ HT-18-053 (서열식별번호: 21)이 사용되었다. 본 발명자들은 총 리드 수의 비율로서 공여자 DNA에 의해 지시되는 표적 코돈에서 원하는 돌연변이 AA 치환 (ACCase I1781L)의 존재에 대한 증거를 나타내는 서열 리드의 백분율을 계산함으로써 편집 빈도를 평가하였다. 이들 데이터는 본 발명자들이 원하는 AA 치환 I1781L을 갖는 정확하게 편집된 1 내지 3개의 대립유전자를 갖는 식물을 복구하였음을 나타내었다 (표 12).

표 12. 제2 편집 PCR에서 양성으로 평점된 독립적인 사건으로부터의 개별 묘목의 아세틸-CoA 카르복실라제 표적 로커스 (ACCase I1781L)에서 정확하게 편집된 리드 퍼센트 (%)

실시예 8: CRISPR/Cas9 성분의 RNP-매개된 전달에 의해 쌍을 형성한 Cas9 닉카제에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

CRISPR/Cas9 닉카제 RNP 복합체를 생성하기 위해, Cas9 닉카제 단백질 (알트-알® S.p. Cas9 D10A 닉카제 V3, IDT) 및 각각의 sgRNA (알트-알® CRISPR-Cas9 crRNA XT 및 알트-알® CRISPR-Cas9 tracrRNA, IDT)을 IDT의 프로토콜에 따라 사전 혼합하였다 (www.idtdna.com). crRNA1은 서열 CTAGGTGTGGAGAACATACA-TGG (TS1) (서열식별번호: 50)를 표적화하기 위해 설계되었고, crRNA2는 2개의 닉 사이의 거리가 32nt인 반대쪽 가닥 상에 위치한 표적 서열 CTCCTCATAGGCCCTAGAAT-AGG (TS2) (서열식별번호: 53)를 표적화하도록 설계되었다.

2-3 mm 크기의 미성숙 배아를 [Svitashev et al. 2016]에 기재된 바와 같이 PDS-1000/He 입자 전달 시스템을 이용하여 공여자 DNA pBay02540 (서열식별번호: 14)과 함께 RNP1 표적화 TS1 및 RNP2 표적화 TS2의 1:1 혼합물에 의해 충격을 가하였다. 충격을 받은 미성숙 배아를 2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, 200nM 퀴잘로포프를 갖는 선택 배지로 옮겼다. 퀴잘로포프 내성 식물을 편집된 ACCase 유전자의 특이적인 증폭을 위해 프라이머 세트 (HT-18-112 / HT-18-113) (서열식별번호: 29; 30)를 이용하는 PCR에 의해 추가로 분석하였다. 편집 PCR에서 양성으로 평점된 식물에 대해, 딥 시퀀싱을 수행하였다. 딥 시퀀싱을 위해 의도된 표적 부위를 둘러싸는 영역을 네스티드 PCR에 의해 Q5 고충실도 폴리머라제 (M0492L)를 사용하여 PCR 증폭시켰다. 제1 PCR을 위해 프라이머 쌍 HT-18-162/ HT-18-112 (서열식별번호: 34; 29)가 사용되었고; 이들 프라이머는 공여자 DNA의 상동성 아암의 외부에 위치하였다. 네스티드 PCR의 경우, 프라이머 쌍 HT-18-048/ HT-18-053 (서열식별번호: 19; 21)이 사용되었다.

이들 데이터는 원하는 편집 (I1781L)을 갖는 대립유전자(들)을 함유하는 거의 모든 식물에서, NHEJ-유래된 InDel을 갖는 대립유전자가 존재하지 않았음을 나타낸다 (표 13).

표 13. RNP로서 전달된 쌍을 형성한 Cas9 닉카제에 의해 편집된 퀴잘로포프 내성 식물의 아세틸-CoA 카르복실라제 표적 로커스 (ACCase I1781L)에서 정확하게 편집된 리드 퍼센트 (%)

실시예 9: 닉 사이의 거리가 더 큰, 쌍을 형성한 Cas9 닉카제에 의해 이질육배체 밀의 ACCase (아세틸-CoA 카르복실라제) 유전자에서 I1781L 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

이 실험을 위해, 45nt 또는 136 nt의 2개의 닉 부위 사이의 거리를 갖는 반대쪽 가닥 상의 표적 부위로 SpCas9 닉카제를 유도하는 gRNA를 설계한다. 서로 136 nt 거리에서 반대쪽 가닥 상에 닉을 생성하기 위해 미성숙 배아를 Cas9 닉카제 벡터 pBas02734 (서열식별번호: 3), 공여자 DNA pBas04096 (서열식별번호: 35) 및 gRNA 벡터 쌍 pBay02528 (서열식별번호: 5) 및 pBas04093 (서열식별번호: 37)에 의해 공동-충격을 가하거나, 또는 배아를 서로 45 nt 거리에서 반대쪽 가닥 상에 닉을 각각 생성하는 Cas9 닉카제 벡터 pBas02734 (서열식별번호: 3), 공여자 DNA pBay02544 (서열식별번호: 36) 및 gRNA 벡터 쌍 pBay02529 (서열식별번호: 6) 및 pBay02531 (서열식별번호: 8)에 의해 공동-충격을 가하였다. 충격 후에, 미성숙 배아를 2 주 동안 비-선택적인 캘러스 유도 배지로 옮긴 다음, 200nM 퀴잘로포프를 갖는 선택 배지로 옮겼다. 퀴잘로포프 내성 식물을 편집된 ACCase 유전자의 특이적인 증폭에 대해 프라이머 세트 (HT-18-113 정방향 / HT-18-112 역방향) (서열식별번호: 30; 29)를 사용하는 PCR에 의해 추가로 분석하였다. 편집 PCR에서 양성으로 평점된 식물에 대해, 딥 시퀀싱을 수행하였다. 딥 시퀀싱을 위해 의도된 표적 부위를 둘러싸는 영역을 네스티드 PCR에 의해 Q5 고충실도 폴리머라제 (M0492L)를 사용하여 PCR 증폭시켰다. 제1 PCR을 위해 프라이머 쌍 HT-18-162/ HT-18-112 (서열식별번호: 34; 29)가 사용되었고; 이들 프라이머는 1736bp 단편의 증폭을 위해 공여자 DNA의 상동성 아암 외부에 위치하였다. 네스티드 PCR을 위해, 프라이머 쌍 18-048/ HT-18-053 (서열식별번호: 19; 21)이 사용되었다. 표 14의 이들 데이터는, 심지어 닉 사이의 거리가 더 크더라도, NHEJ-유래된 InDel을 갖는 대립유전자가 없는 하나의 정확하게 편집된 대립유전자를 갖는 식물을 확인하는 것이 가능하다는 것을 나타내었다.

표 14. 쌍을 형성한 Cas9 닉카제에 의해 편집된 퀴잘로포프 내성 식물의 아세틸-CoA 카르복실라제 표적 로커스 (ACCase I1781L)에서 정확하게 편집된 리드 퍼센트 (%)

실시예 10: 벼의 5-에놀피루빌시키메이트-3-포스페이트 신타제 유전자에서 TIPS 돌연변이의 도입을 위한 상동성-의존적인 정확한 유전자 편집.

하기 실시예는 글리포세이트에 대한 내성을 부여하는, TIPS 아미노산 치환을 제공하는, 오리자 사티바(Oryza sativa)의 5-에놀피루빌시키메이트-3-포스페이트 신타제 유전자에서 T173I 및 P177S 돌연변이의 도입을 위해 쌍을 형성한 닉카제에 의한 상동성-의존적인 정확한 유전자 편집을 기재한다. Cas9 닉카제 (D10A) (pKVA824 (서열식별번호: 43)) 및 2가지 gRNA (pKVA766 (서열식별번호: 45)) 및 pKVA769 (서열식별번호: 46)) 및 공여자 DNA (pKVA791 (서열식별번호: 47))의 벼 코돈 최적화된 버전을 이용하여, 원하는 돌연변이가 표적 코돈에 도입될 수 있다. 표적 코돈에 걸쳐 있는 33 bp 3' 오버행의 생성을 위해 2가지 sgRNA가 설계되었다. sgRNA 벡터 pKVA766 및 pKVA769는 각각 SpCas9 닉카제를 표적 부위 TS1 (5'-CCA-TTGACAGCAGCCGTGACTGC-3') (서열식별번호: 58) 및 TS2 (5'-GAGGAAGTGCAACTCTTCTTG-GGG 3') (서열식별번호: 59)로 유도한다. 공여자 플라스미드 pKVA791에서 엑손 2의 서열은 TIPS 아미노산 뉴클레오티드 치환 C518T 및 C529T, 및 침묵 돌연변이 A531G를 함유하였고, 고유한 PvuI 제한 부위를 생성하였다. 성숙 종자로부터 유래된 벼 배발생 캘러스는 입자 충격을 위한 출발 물질로서 사용되었다. 배발생 캘러스를 입자 유입 총 (PIG) 시스템 (그레이엘(Grayel))을 이용하여 충격을 가하였다. 충격 파라미터는 다음과 같았다: 금 입자 직경, 0.6 μm; 표적 거리 17 cm, 충격 압력 500 kPa, 및 각각의 플라스미드 DNA (Cas9, gRNA, 공여자 DNA)에 대해 발사당 1.25 μg DNA가 사용되었다. 충격 후에 캘러스 조각을 며칠 동안 비-선택적인 RSK500 캘러스 유도 배지 (SK-1m 염 두케파(Duchefa) (Khanna & Raina, 1998, Plant Cell, Tissue and Organ Culture, 52: 145-153), 칸나(Khanna) 비타민 (Khanna & Raina, 상기 문헌), L-프롤린 1.16 g/L, CuSO4.5H2O 2.5 mg/L, 2.4-D 2mg/L, 말토스 20g/L, 소르비톨 30 g/L, MES 0.5g/L, 아가로스 6g/L, pH 5.8)로 옮긴 후, 150 mg/L 글리포세이트로 보충된 RSK500 배지로 옮겼다. 활성 성장 글리포세이트 내성 배발생 캘러스 라인으로부터 새싹이 재생되었다.

글리포세이트 내성 사건의 표적 영역에 걸쳐 증폭된 PCR 산물의 제한 소화 (PvuI)를 제1 분자 스크린으로서 수행하여, 천연 epsps 유전자에서 TIPS 돌연변이의 도입을 확인하였다. PvuI 부위를 생성하기 위한 침묵 돌연변이를 공여자 DNA에서 TIPS 돌연변이 근처에 도입하여, TIPS 편집된 사건의 확인을 위한 분자 스크리닝을 용이하게 하였다. 24개의 glyT 사건의 증폭된 PCR 산물의 PvuI 소화는 13개의 단일-대립유전자 TIPS 편집된 사건, 10개의 이중-대립유전자 TIPS 편집된 사건 및 1개의 TIPS 돌연변이 없음 사건을 나타내었다. 이중-대립유전자 사건의 시퀀싱 분석을 통해 두 대립유전자 모두에서 TIPS 돌연변이의 존재를 확인하였다. 쌍을 형성한 닉카제에 의해 수득된 13개의 단일-대립유전자 편집된 사건으로부터 수득한 클로닝된 PCR 산물의 시퀀싱은 이들 사건 중 10개가 TIPS 돌연변이에 의해 정확하게 편집된 1개의 대립유전자 및 1개의 WT 대립유전자 (TIPS / WT)를 갖는 단일-대립유전자 TIPS 편집된 사건이었음을 나타내었다. 다른 3개의 사건 또한 정확하게 편집된 TIPS 대립유전자를 가졌지만, 다른 대립유전자 (TIPS / InDel)에는 비특이적인 돌연변이 (InDel)가 있었다 (도 1).

상기 기재된 쌍을 형성한 Cas9 닉카제 대신에 Cas9 뉴클레아제 (pKVA790 (서열식별번호: 48)), 단일 sgRNA (pKVA766 (서열식별번호: 45)) 및 복구 DNA (pKVA761 (서열식별번호: 60)의 공동-전달에 의해 수득된 23개의 단일-대립유전자 TIPS 편집된 사건으로부터 수득한 클로닝된 PCR 산물의 시퀀싱은 TIPS 돌연변이를 갖는 정확하게 편집된 1개의 대립유전자를 갖는 이들 모든 23개의 사건이 InDel 대립유전자를 또한 함유하였음을 나타내었다 (TIPS / InDel) (도 1). 이들 데이터는 뉴클레아제 대신에 쌍을 형성한 닉카제를 사용함으로써, (TIPS / WT) 사건의 수가 증가되고, (TIPS / InDel) 사건의 수가 감소되었음을 나타내었다.

SEQUENCE LISTING <110> BASF Agricultural Solutions Seed US LLC <120> Improved genome editing using paired nickases <130> 191497WO01 <160> 60 <170> According Wipo Std 25 <210> 1 <211> 9155 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02430 encoding a modified Cas9 <400> 1 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatcctgc 420 aggcccgggt taattaagcg gccgcctgca gtgcagcgtg acccggtcgt gcccctctct 480 agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt tttttgtcac 540 acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta ctctacgaat 600 aatataatct atagtactac aataatatca gtgttttaga gaatcatata aatgaacagt 660 tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag ttttatcttt 720 ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata atacttcatc 780 cattttatta gtacatccat ttagggttta gggttaatgg tttttataga ctaatttttt 840 tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa ctctatttta 900 gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact aaaaattaaa 960 caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt cgagtagata 1020 atgccagcct gttaaacgcc gtcgatcgac gagtctaacg gacaccaacc agcgaaccag 1080 cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 1140 ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 1200 gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 1260 cggcagctac gggggattcc tttcccaccg ctccttcgct ttcccttcct cgcccgccgt 1320 aataaataga caccccctcc acaccctctt tccccaacct cgtgttgttc ggagcgcaca 1380 cacacacaac cagatctccc ccaaatccac ccgtcggcac ctccgcttca aggtacgccg 1440 ctcgtcctcc cccccccccc ctctctacct tctctagatc ggcgttccgg tccatgctta 1500 gggcccggta gttctacttc tgtccatgtt tgtgttagat ccgtgtttgt gttagatccg 1560 tgctactagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg attgctaact 1620 tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca gacgggatcg 1680 atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc ctttatttca 1740 atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg tcttggttgt 1800 gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt ttcaaactac 1860 ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca tagttacgaa 1920 ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat gcgggtttta 1980 ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg tgtggttggg 2040 cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct ggtgtattta 2100 ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt taagatggat 2160 ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat gcatatacat 2220 gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct attataataa 2280 acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca tatgcagcag 2340 ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg gtactgtttc 2400 ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc aggaccatgg cacccaagaa 2460 gaagaggaag gtgggcatcc acggcgtccc agcagcaatg gacaagaagt actccatcgg 2520 cctcgacatc ggcaccaaca gcgtcggctg ggccgtgatc accgacgagt acaaggtgcc 2580 aagcaagaag ttcaaggtgc tgggcaacac cgaccgtcac tccatcaaga agaacctcat 2640 cggcgccctc ctcttcgact caggtgagac ggccgaggcg acaaggttga agaggacggc 2700 aagaagaagg tacacaagaa ggaagaacag gatctgctac ctccaggaga tcttcagcaa 2760 cgagatggcc aaggtggatg acagcttctt ccaccggcta gaggagagct tcttggtgga 2820 ggaggacaag aagcatgaga ggcatcccat cttcggcaac atcgtcgacg aggtggccta 2880 ccatgagaag taccccacca tctaccatct ccgcaagaag ctggtggact caacggacaa 2940 ggccgacctc cgcctcatct acctcgcctt ggcccacatg atcaagttca gaggccactt 3000 cctcatcgag ggcgacctca accctgacaa cagcgatgtg gacaagctct tcatccagct 3060 ggtgcagacc tacaaccagc tctttgagga gaaccccatc aacgcctccg gcgtcgacgc 3120 caaggccatc ctctcggcaa ggttgagcaa gtcaagaagg ctggagaacc tcatcgctca 3180 gctccccggc gagaagaaaa atggcctctt cggcaacctc atcgccttga gcctcggcct 3240 cacccccaac ttcaagtcaa actttgacct cgccgaggat gccaagctcc agctctccaa 3300 ggacacctac gacgacgacc tcgacaacct cctcgcccag atcggcgacc agtacgccga 3360 cctcttcctc gccgccaaga acctctcaga tgccatcctc ctgagcgaca tcctccgcgt 3420 caacaccgag atcaccaagg cgccgctctc cgcctccatg atcaagaggt atgatgagca 3480 ccatcaagat ctcaccctcc tcaaggcctt ggtgaggcag cagctacctg agaagtacaa 3540 ggagatcttc ttcgaccaga gcaagaatgg ctacgccggc tacatcgacg gcggcgcctc 3600 ccaagaagag ttctacaagt tcatcaagcc catcttggag aagatggatg gcaccgagga 3660 gctactggtg aagctcaaca gagaagatct cctcaggaag cagaggacct tcgacaacgg 3720 cagcatccct caccagatcc accttggtga gctccatgcc atcttgagaa ggcaagaaga 3780 cttctacccc ttcctcaagg acaacaggga gaagatcgag aagatattga cattcaggat 3840 cccctactac gtcggaccct tggcaagagg caactcaagg ttcgcctgga tgacaaggaa 3900 gagcgaggaa accatcaccc cctggaactt tgaggaggtg gtggacaagg gcgcctcagc 3960 tcagagcttc atcgagagga tgaccaactt cgacaagaac ctccccaacg agaaggtgct 4020 ccccaagcac agcctcctct acgagtactt caccgtctac aatgagctca ccaaggtcaa 4080 gtacgtcacc gagggcatga ggaagccggc cttcctctca ggagagcaga agaaggccat 4140 cgtcgacctc ctcttcaaga ccaacaggaa ggtcaccgtc aagcagctca aggaggacta 4200 cttcaagaag atcgagtgct tcgactctgt ggagatctcc ggcgtggagg acaggttcaa 4260 cgcctccctc ggcacctacc atgatctcct gaagatcatc aaggacaagg acttcctcga 4320 caacgaggag aacgaggaca tcttagaaga catcgtcctc accctcaccc tcttcgagga 4380 cagggagatg atcgaggaga ggctcaagac ctatgctcac ctctttgatg acaaggtgat 4440 gaagcagctc aagagaagaa ggtacaccgg ctggggccgc ctctcaagga agctcatcaa 4500 cggcatcagg gacaagcaga gcggcaagac catcctcgac ttcctcaaga gcgatggctt 4560 cgccaacagg aacttcatgc agctcatcca tgatgacagc ttgaccttca aggaggacat 4620 ccagaaggct caagtctccg gccaaggaga ttccctccat gagcacatcg ccaacctcgc 4680 cggctcaccg gccatcaaga agggcatcct ccagaccgtc aaggtggtgg atgagctggt 4740 gaaggtgatg ggccgtcaca agccggagaa catcgtcatc gagatggcaa gggagaacca 4800 gaccacccag aagggccaga agaactcaag ggagaggatg aagaggattg aagaaggcat 4860 caaggagctc ggcagccaga tcctcaagga gcaccctgtg gagaacaccc agctacagaa 4920 cgagaagctc tacctctact acctccagaa tggccgtgac atgtacgtcg accaagagct 4980 ggacatcaac aggttgagcg actacgacgt cgaccacatc gtcccccaga gcttcctcaa 5040 ggatgacagc atcgacaaca aggtgctgac aagatcagac aagaaccgtg gcaagagcga 5100 caatgtcccc tccgaggagg tggtgaagaa gatgaagaac tactggaggc agctcctcaa 5160 cgccaagctc atcacccaga ggaagttcga caacctcacc aaggctgaaa gaggaggcct 5220 ctcagagctg gacaaggccg gcttcatcaa gaggcagctg gtggagacaa ggcagatcac 5280 caagcatgtt gctcagatcc ttgattcaag gatgaacacc aagtacgacg agaacgacaa 5340 gctcatcagg gaggtcaagg tcatcaccct caagagcaag ctggtgtccg acttcaggaa 5400 ggacttccag ttctacaagg tgagggagat caacaactac caccatgctc atgatgccta 5460 cctcaacgcc gtggtgggca ccgccctcat caagaagtac cccaagctgg agtcagagtt 5520 cgtctacggc gactacaagg tgtatgatgt gaggaagatg atcgccaaga gcgagcagga 5580 gatcggcaag gccaccgcca agtacttctt ctactcaaac atcatgaact tcttcaagac 5640 cgagatcacc ctcgccaacg gcgagatcag gaagaggccg ctcattgaga caaatggtga 5700 gactggtgag atcgtctggg acaagggccg agacttcgcc accgtgagga aggtgctctc 5760 catgcctcaa gtcaacatcg tcaagaagac cgaggtgcag accggaggct tctcaaagga 5820 gagcatcctc cccaagagga actctgacaa gctgatcgca aggaagaagg actgggaccc 5880 caagaagtac ggcggctttg attcaccaac ggtggcctac tccgtgctgg tggtggccaa 5940 ggtggagaag ggcaagagca agaagctcaa gagcgtcaag gagctcctcg gcatcaccat 6000 catggagaga tcatccttcg agaagaaccc catcgacttc cttgaggcca agggctacaa 6060 ggaggtgaag aaggacctca tcatcaagct ccccaagtac agcctcttcg agctggagaa 6120 tggccgcaag aggatgctgg catcagctgg agagctccag aagggcaacg agctggccct 6180 cccaagcaag tacgtgaact tcctctacct cgcctcccac tacgagaagc tcaagggctc 6240 accagaagac aatgagcaga agcagctctt cgtggagcag cacaagcact acctcgacga 6300 gatcatcgag cagatctccg agttctccaa gagggtgatc ctcgccgacg ccaacctcga 6360 caaggtgctc tcagcctaca acaagcaccg tgacaagccc atcagggagc aagctgagaa 6420 catcatccac ctcttcaccc tcaccaacct cggcgccccg gcggccttca agtacttcga 6480 caccaccatc gaccgcaaga ggtacacctc aaccaaggag gtgcttgatg ccaccttgat 6540 ccaccagagc atcaccggcc tctacgagac aaggatcgac ctctcccagc tcggcggcga 6600 caagaggccg gcggccacca agaaggccgg ccaagccaag aagaagaagt gattgctagc 6660 acgcgttgga cacgctgaaa tcaccagtct ctctctacaa atctatctct ctctattttc 6720 tccataataa tgtgtgagta gttcccagat aagggaatta gggttcctat agggtttcgc 6780 tcatgtgttg agcatataag aaacccttag tatgtatttg tatttgtaaa atacttctat 6840 caataaaatt tctaattcct aaaaccaaaa tccagtacta aaatccagat cggcgcgcca 6900 tcccaatggc gcgccgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 6960 ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 7020 tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 7080 gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 7140 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 7200 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 7260 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 7320 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 7380 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 7440 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 7500 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 7560 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 7620 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 7680 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 7740 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 7800 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 7860 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 7920 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 7980 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 8040 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 8100 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 8160 ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 8220 tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 8280 agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 8340 taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 8400 tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 8460 cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 8520 ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 8580 tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 8640 tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 8700 cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 8760 tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 8820 gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 8880 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 8940 atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 9000 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 9060 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 9120 ctataaaaat aggcgtatca cgaggccctt tcgtc 9155 <210> 2 <211> 1401 <212> PRT <213> Artificial sequence <220> <223> Modified Cas9 from Plasmid BAY02430 <400> 2 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1025 1030 1035 1040 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1045 1050 1055 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1060 1065 1070 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu 1075 1080 1085 Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu 1090 1095 1100 Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly 1105 1110 1115 1120 Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu 1125 1130 1135 Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp 1140 1145 1150 Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys 1155 1160 1165 Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1170 1175 1180 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1185 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1205 1210 1215 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1265 1270 1275 1280 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1285 1290 1295 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1300 1305 1310 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His 1315 1320 1325 Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe 1330 1335 1340 Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu 1345 1350 1355 1360 Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg 1365 1370 1375 Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys 1380 1385 1390 Lys Ala Gly Gln Ala Lys Lys Lys Lys 1395 1400 <210> 3 <211> 9155 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02734 encoding Cas9 D10A nickase <400> 3 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatcctgc 420 aggcccgggt taattaagcg gccgcctgca gtgcagcgtg acccggtcgt gcccctctct 480 agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt tttttgtcac 540 acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta ctctacgaat 600 aatataatct atagtactac aataatatca gtgttttaga gaatcatata aatgaacagt 660 tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag ttttatcttt 720 ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata atacttcatc 780 cattttatta gtacatccat ttagggttta gggttaatgg tttttataga ctaatttttt 840 tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa ctctatttta 900 gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact aaaaattaaa 960 caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt cgagtagata 1020 atgccagcct gttaaacgcc gtcgatcgac gagtctaacg gacaccaacc agcgaaccag 1080 cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 1140 ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 1200 gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 1260 cggcagctac gggggattcc tttcccaccg ctccttcgct ttcccttcct cgcccgccgt 1320 aataaataga caccccctcc acaccctctt tccccaacct cgtgttgttc ggagcgcaca 1380 cacacacaac cagatctccc ccaaatccac ccgtcggcac ctccgcttca aggtacgccg 1440 ctcgtcctcc cccccccccc ctctctacct tctctagatc ggcgttccgg tccatgctta 1500 gggcccggta gttctacttc tgtccatgtt tgtgttagat ccgtgtttgt gttagatccg 1560 tgctactagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg attgctaact 1620 tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca gacgggatcg 1680 atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc ctttatttca 1740 atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg tcttggttgt 1800 gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt ttcaaactac 1860 ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca tagttacgaa 1920 ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat gcgggtttta 1980 ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg tgtggttggg 2040 cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct ggtgtattta 2100 ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt taagatggat 2160 ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat gcatatacat 2220 gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct attataataa 2280 acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca tatgcagcag 2340 ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg gtactgtttc 2400 ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc aggaccatgg cacccaagaa 2460 gaagaggaag gtgggcatcc acggcgtccc agcagcaatg gacaagaagt actccatcgg 2520 cctcgccatc ggcaccaaca gcgtcggctg ggccgtgatc accgacgagt acaaggtgcc 2580 aagcaagaag ttcaaggtgc tgggcaacac cgaccgtcac tccatcaaga agaacctcat 2640 cggcgccctc ctcttcgact caggtgagac ggccgaggcg acaaggttga agaggacggc 2700 aagaagaagg tacacaagaa ggaagaacag gatctgctac ctccaggaga tcttcagcaa 2760 cgagatggcc aaggtggatg acagcttctt ccaccggcta gaggagagct tcttggtgga 2820 ggaggacaag aagcatgaga ggcatcccat cttcggcaac atcgtcgacg aggtggccta 2880 ccatgagaag taccccacca tctaccatct ccgcaagaag ctggtggact caacggacaa 2940 ggccgacctc cgcctcatct acctcgcctt ggcccacatg atcaagttca gaggccactt 3000 cctcatcgag ggcgacctca accctgacaa cagcgatgtg gacaagctct tcatccagct 3060 ggtgcagacc tacaaccagc tctttgagga gaaccccatc aacgcctccg gcgtcgacgc 3120 caaggccatc ctctcggcaa ggttgagcaa gtcaagaagg ctggagaacc tcatcgctca 3180 gctccccggc gagaagaaaa atggcctctt cggcaacctc atcgccttga gcctcggcct 3240 cacccccaac ttcaagtcaa actttgacct cgccgaggat gccaagctcc agctctccaa 3300 ggacacctac gacgacgacc tcgacaacct cctcgcccag atcggcgacc agtacgccga 3360 cctcttcctc gccgccaaga acctctcaga tgccatcctc ctgagcgaca tcctccgcgt 3420 caacaccgag atcaccaagg cgccgctctc cgcctccatg atcaagaggt atgatgagca 3480 ccatcaagat ctcaccctcc tcaaggcctt ggtgaggcag cagctacctg agaagtacaa 3540 ggagatcttc ttcgaccaga gcaagaatgg ctacgccggc tacatcgacg gcggcgcctc 3600 ccaagaagag ttctacaagt tcatcaagcc catcttggag aagatggatg gcaccgagga 3660 gctactggtg aagctcaaca gagaagatct cctcaggaag cagaggacct tcgacaacgg 3720 cagcatccct caccagatcc accttggtga gctccatgcc atcttgagaa ggcaagaaga 3780 cttctacccc ttcctcaagg acaacaggga gaagatcgag aagatattga cattcaggat 3840 cccctactac gtcggaccct tggcaagagg caactcaagg ttcgcctgga tgacaaggaa 3900 gagcgaggaa accatcaccc cctggaactt tgaggaggtg gtggacaagg gcgcctcagc 3960 tcagagcttc atcgagagga tgaccaactt cgacaagaac ctccccaacg agaaggtgct 4020 ccccaagcac agcctcctct acgagtactt caccgtctac aatgagctca ccaaggtcaa 4080 gtacgtcacc gagggcatga ggaagccggc cttcctctca ggagagcaga agaaggccat 4140 cgtcgacctc ctcttcaaga ccaacaggaa ggtcaccgtc aagcagctca aggaggacta 4200 cttcaagaag atcgagtgct tcgactctgt ggagatctcc ggcgtggagg acaggttcaa 4260 cgcctccctc ggcacctacc atgatctcct gaagatcatc aaggacaagg acttcctcga 4320 caacgaggag aacgaggaca tcttagaaga catcgtcctc accctcaccc tcttcgagga 4380 cagggagatg atcgaggaga ggctcaagac ctatgctcac ctctttgatg acaaggtgat 4440 gaagcagctc aagagaagaa ggtacaccgg ctggggccgc ctctcaagga agctcatcaa 4500 cggcatcagg gacaagcaga gcggcaagac catcctcgac ttcctcaaga gcgatggctt 4560 cgccaacagg aacttcatgc agctcatcca tgatgacagc ttgaccttca aggaggacat 4620 ccagaaggct caagtctccg gccaaggaga ttccctccat gagcacatcg ccaacctcgc 4680 cggctcaccg gccatcaaga agggcatcct ccagaccgtc aaggtggtgg atgagctggt 4740 gaaggtgatg ggccgtcaca agccggagaa catcgtcatc gagatggcaa gggagaacca 4800 gaccacccag aagggccaga agaactcaag ggagaggatg aagaggattg aagaaggcat 4860 caaggagctc ggcagccaga tcctcaagga gcaccctgtg gagaacaccc agctacagaa 4920 cgagaagctc tacctctact acctccagaa tggccgtgac atgtacgtcg accaagagct 4980 ggacatcaac aggttgagcg actacgacgt cgaccacatc gtcccccaga gcttcctcaa 5040 ggatgacagc atcgacaaca aggtgctgac aagatcagac aagaaccgtg gcaagagcga 5100 caatgtcccc tccgaggagg tggtgaagaa gatgaagaac tactggaggc agctcctcaa 5160 cgccaagctc atcacccaga ggaagttcga caacctcacc aaggctgaaa gaggaggcct 5220 ctcagagctg gacaaggccg gcttcatcaa gaggcagctg gtggagacaa ggcagatcac 5280 caagcatgtt gctcagatcc ttgattcaag gatgaacacc aagtacgacg agaacgacaa 5340 gctcatcagg gaggtcaagg tcatcaccct caagagcaag ctggtgtccg acttcaggaa 5400 ggacttccag ttctacaagg tgagggagat caacaactac caccatgctc atgatgccta 5460 cctcaacgcc gtggtgggca ccgccctcat caagaagtac cccaagctgg agtcagagtt 5520 cgtctacggc gactacaagg tgtatgatgt gaggaagatg atcgccaaga gcgagcagga 5580 gatcggcaag gccaccgcca agtacttctt ctactcaaac atcatgaact tcttcaagac 5640 cgagatcacc ctcgccaacg gcgagatcag gaagaggccg ctcattgaga caaatggtga 5700 gactggtgag atcgtctggg acaagggccg agacttcgcc accgtgagga aggtgctctc 5760 catgcctcaa gtcaacatcg tcaagaagac cgaggtgcag accggaggct tctcaaagga 5820 gagcatcctc cccaagagga actctgacaa gctgatcgca aggaagaagg actgggaccc 5880 caagaagtac ggcggctttg attcaccaac ggtggcctac tccgtgctgg tggtggccaa 5940 ggtggagaag ggcaagagca agaagctcaa gagcgtcaag gagctcctcg gcatcaccat 6000 catggagaga tcatccttcg agaagaaccc catcgacttc cttgaggcca agggctacaa 6060 ggaggtgaag aaggacctca tcatcaagct ccccaagtac agcctcttcg agctggagaa 6120 tggccgcaag aggatgctgg catcagctgg agagctccag aagggcaacg agctggccct 6180 cccaagcaag tacgtgaact tcctctacct cgcctcccac tacgagaagc tcaagggctc 6240 accagaagac aatgagcaga agcagctctt cgtggagcag cacaagcact acctcgacga 6300 gatcatcgag cagatctccg agttctccaa gagggtgatc ctcgccgacg ccaacctcga 6360 caaggtgctc tcagcctaca acaagcaccg tgacaagccc atcagggagc aagctgagaa 6420 catcatccac ctcttcaccc tcaccaacct cggcgccccg gcggccttca agtacttcga 6480 caccaccatc gaccgcaaga ggtacacctc aaccaaggag gtgcttgatg ccaccttgat 6540 ccaccagagc atcaccggcc tctacgagac aaggatcgac ctctcccagc tcggcggcga 6600 caagaggccg gcggccacca agaaggccgg ccaagccaag aagaagaagt gattgctagc 6660 acgcgttgga cacgctgaaa tcaccagtct ctctctacaa atctatctct ctctattttc 6720 tccataataa tgtgtgagta gttcccagat aagggaatta gggttcctat agggtttcgc 6780 tcatgtgttg agcatataag aaacccttag tatgtatttg tatttgtaaa atacttctat 6840 caataaaatt tctaattcct aaaaccaaaa tccagtacta aaatccagat cggcgcgcca 6900 tcccaatggc gcgccgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 6960 ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 7020 tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 7080 gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 7140 gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 7200 gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 7260 taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 7320 cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 7380 ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 7440 aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 7500 tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 7560 gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 7620 cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 7680 ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 7740 cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 7800 gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 7860 cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 7920 tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 7980 ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 8040 aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 8100 atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 8160 ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 8220 tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 8280 agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 8340 taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 8400 tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 8460 cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 8520 ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 8580 tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 8640 tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 8700 cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 8760 tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 8820 gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 8880 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 8940 atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 9000 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 9060 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 9120 ctataaaaat aggcgtatca cgaggccctt tcgtc 9155 <210> 4 <211> 1401 <212> PRT <213> Artificial sequence <220> <223> Cas9 D10A nickase from Plasmid BAY02734 <400> 4 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1025 1030 1035 1040 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1045 1050 1055 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1060 1065 1070 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu 1075 1080 1085 Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu 1090 1095 1100 Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly 1105 1110 1115 1120 Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu 1125 1130 1135 Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp 1140 1145 1150 Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys 1155 1160 1165 Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1170 1175 1180 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1185 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1205 1210 1215 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1265 1270 1275 1280 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1285 1290 1295 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1300 1305 1310 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His 1315 1320 1325 Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe 1330 1335 1340 Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu 1345 1350 1355 1360 Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg 1365 1370 1375 Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys 1380 1385 1390 Lys Ala Gly Gln Ala Lys Lys Lys Lys 1395 1400 <210> 5 <211> 3120 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02528 comprising guide RNA <400> 5 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ttaattaaaa aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc 480 cttattttaa cttgctattt ctagctctaa aactgtatgt tctccacacc tagcaagtct 540 gatgcagcaa gcgagtttat aaaccggtca gaactctgct ggacaggcga ggtgggacta 600 aactaagagg aactgctgcg ttgctctccc caatcgtgaa cacgtcgacc acccgacaaa 660 agcccgatca tgcgggccta aaagcccagc gctagaccgt tgctgaactc acgtgggctg 720 catctcacta tgcgacccag atcagtgaga gctagagggc agttatcttc agctctctcg 780 tagttcctct gatcaatatt cctagttcga ttccctccta gcagtgagta acaatgtgct 840 ccttgataaa tataaatgtg ttgagcacca gaactgtcag aataacgggc ttggtccctg 900 cagggttcca tcccaatggc gcgccgagct tggctcgagc atggtcatag ctgtttcctg 960 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 1020 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 1080 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 1140 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 1200 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 1260 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 1320 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1380 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1440 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1500 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 1560 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 1620 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 1680 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 1740 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 1800 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 1860 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 1920 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 1980 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2040 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2100 acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 2160 caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 2220 tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 2280 aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 2340 cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 2400 gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 2460 attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 2520 tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 2580 gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg agtaaccatg 2640 catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 2700 agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 2760 gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 2820 cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 2880 gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt tttcaatatt 2940 attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3000 aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 3060 aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 3120 <210> 6 <211> 3119 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02529 comprising guide RNA <400> 6 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ttaattaaaa aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc 480 cttattttaa cttgctattt ctagctctaa aaccacctag cccatcctcc ttccaagtct 540 gatgcagcaa gcgagtttat aaaccggtca gaactctgct ggacaggcga ggtgggacta 600 aactaagagg aactgctgcg ttgctctccc caatcgtgaa cacgtcgacc acccgacaaa 660 agcccgatca tgcgggccta aaagcccagc gctagaccgt tgctgaactc acgtgggctg 720 catctcacta tgcgacccag atcagtgaga gctagagggc agttatcttc agctctctcg 780 tagttcctct gatcaatatt cctagttcga ttccctccta gcagtgagta acaatgtgct 840 ccttgataaa tataaatgtg ttgagcacca gaactgtcag aataacgggc ttggtccctg 900 cagggttcat cccaatggcg cgccgagctt ggctcgagca tggtcatagc tgtttcctgt 960 gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 1020 agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 1080 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1140 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1200 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1260 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1320 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1380 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 1440 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 1500 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1560 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 1620 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1680 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1740 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 1800 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1860 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1920 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1980 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 2040 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 2100 cagttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 2160 aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 2220 ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 2280 acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 2340 gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 2400 ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 2460 ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 2520 cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 2580 atattcttct aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc 2640 atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 2700 gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 2760 aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 2820 gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 2880 cggcctagag caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta 2940 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 3000 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 3060 aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 3119 <210> 7 <211> 3117 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02530 comprising guide RNA <400> 7 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggataaccc 420 tgcagggacc aagcccgtta ttctgacagt tctggtgctc aacacattta tatttatcaa 480 ggagcacatt gttactcact gctaggaggg aatcgaacta ggaatattga tcagaggaac 540 tacgagagag ctgaagataa ctgccctcta gctctcactg atctgggtcg catagtgaga 600 tgcagcccac gtgagttcag caacggtcta gcgctgggct tttaggcccg catgatcggg 660 cttttgtcgg gtggtcgacg tgttcacgat tggggagagc aacgcagcag ttcctcttag 720 tttagtccca cctcgcctgt ccagcagagt tctgaccggt ttataaactc gcttgctgca 780 tcagacttga taggccctag aataggcacg ttttagagct agaaatagca agttaaaata 840 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt ttttttaatt 900 aagttcatcc caatggcgcg ccgagcttgg ctcgagcatg gtcatagctg tttcctgtgt 960 gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 1020 cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 1080 tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 1140 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 1200 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 1260 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 1320 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 1380 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1440 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 1500 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 1560 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 1620 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1680 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 1740 cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 1800 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 1860 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 1920 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 1980 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 2040 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 2100 gttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa 2160 taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc 2220 ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac 2280 ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga 2340 ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc 2400 agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt 2460 gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg 2520 aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat 2580 attcttctaa tacctggaat gctgttttcc cagggatcgc agtggtgagt aaccatgcat 2640 catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt 2700 ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa 2760 acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga 2820 cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg 2880 gcctagagca agacgtttcc cgttgaatat ggctcatact cttccttttt caatattatt 2940 gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3000 ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 3060 ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtc 3117 <210> 8 <211> 3117 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02531 comprising guide RNA <400> 8 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 cctgcaggga ccaagcccgt tattctgaca gttctggtgc tcaacacatt tatatttatc 480 aaggagcaca ttgttactca ctgctaggag ggaatcgaac taggaatatt gatcagagga 540 actacgagag agctgaagat aactgccctc tagctctcac tgatctgggt cgcatagtga 600 gatgcagccc acgtgagttc agcaacggtc tagcgctggg cttttaggcc cgcatgatcg 660 ggcttttgtc gggtggtcga cgtgttcacg attggggaga gcaacgcagc agttcctctt 720 agtttagtcc cacctcgcct gtccagcaga gttctgaccg gtttataaac tcgcttgctg 780 catcagactt gctcctcata ggccctagaa tgttttagag ctagaaatag caagttaaaa 840 taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttttttaa 900 ttaagtatcc caatggcgcg ccgagcttgg ctcgagcatg gtcatagctg tttcctgtgt 960 gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 1020 cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 1080 tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 1140 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 1200 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 1260 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 1320 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 1380 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 1440 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 1500 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 1560 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 1620 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 1680 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 1740 cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 1800 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 1860 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 1920 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 1980 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 2040 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 2100 gttagaaaaa ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa 2160 taccatattt ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc 2220 ataggatggc aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac 2280 ctattaattt cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga 2340 ctgaatccgg tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc 2400 agccattacg ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt 2460 gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg 2520 aatgcaaccg gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat 2580 attcttctaa tacctggaat gctgttttcc cagggatcgc agtggtgagt aaccatgcat 2640 catcaggagt acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt 2700 ttagtctgac catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa 2760 acaactctgg cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga 2820 cattatcgcg agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg 2880 gcctagagca agacgtttcc cgttgaatat ggctcatact cttccttttt caatattatt 2940 gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 3000 ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 3060 ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtc 3117 <210> 9 <211> 3119 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02532 comprising guide RNA <400> 9 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatgaacc 420 ctgcagggac caagcccgtt attctgacag ttctggtgct caacacattt atatttatca 480 aggagcacat tgttactcac tgctaggagg gaatcgaact aggaatattg atcagaggaa 540 ctacgagaga gctgaagata actgccctct agctctcact gatctgggtc gcatagtgag 600 atgcagccca cgtgagttca gcaacggtct agcgctgggc ttttaggccc gcatgatcgg 660 gcttttgtcg ggtggtcgac gtgttcacga ttggggagag caacgcagca gttcctctta 720 gtttagtccc acctcgcctg tccagcagag ttctgaccgg tttataaact cgcttgctgc 780 atcagacttg ctattgccag tgcctattct gttttagagc tagaaatagc aagttaaaat 840 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttttaat 900 taagttccat cccaatggcg cgccgagctt ggctcgagca tggtcatagc tgtttcctgt 960 gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 1020 agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 1080 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1140 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1200 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1260 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1320 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1380 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 1440 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 1500 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1560 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 1620 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1680 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1740 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 1800 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1860 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1920 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1980 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 2040 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 2100 cagttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 2160 aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 2220 ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 2280 acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 2340 gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 2400 ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 2460 ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 2520 cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 2580 atattcttct aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc 2640 atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 2700 gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 2760 aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 2820 gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 2880 cggcctagag caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta 2940 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 3000 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 3060 aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 3119 <210> 10 <211> 3119 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02524 comprising guide RNA <400> 10 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatgaact 420 taattaaaaa aaaaaagcac cgactcggtg ccactttttc aagttgataa cggactagcc 480 ttattttaac ttgctatttc tagctctaaa acgacttgcc cagcacgagg aacaagtctg 540 atgcagcaag cgagtttata aaccggtcag aactctgctg gacaggcgag gtgggactaa 600 actaagagga actgctgcgt tgctctcccc aatcgtgaac acgtcgacca cccgacaaaa 660 gcccgatcat gcgggcctaa aagcccagcg ctagaccgtt gctgaactca cgtgggctgc 720 atctcactat gcgacccaga tcagtgagag ctagagggca gttatcttca gctctctcgt 780 agttcctctg atcaatattc ctagttcgat tccctcctag cagtgagtaa caatgtgctc 840 cttgataaat ataaatgtgt tgagcaccag aactgtcaga ataacgggct tggtccctgc 900 agggttccat cccaatggcg cgccgagctt ggctcgagca tggtcatagc tgtttcctgt 960 gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 1020 agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 1080 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 1140 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 1200 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 1260 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 1320 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 1380 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 1440 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 1500 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 1560 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 1620 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 1680 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 1740 tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 1800 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 1860 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 1920 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 1980 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 2040 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 2100 cagttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 2160 aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 2220 ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 2280 acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 2340 gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 2400 ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 2460 ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 2520 cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 2580 atattcttct aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc 2640 atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 2700 gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 2760 aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 2820 gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 2880 cggcctagag caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta 2940 ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 3000 aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 3060 aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 3119 <210> 11 <211> 3120 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02533 comprising guide RNA <400> 11 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 cctgcaggga ccaagcccgt tattctgaca gttctggtgc tcaacacatt tatatttatc 480 aaggagcaca ttgttactca ctgctaggag ggaatcgaac taggaatatt gatcagagga 540 actacgagag agctgaagat aactgccctc tagctctcac tgatctgggt cgcatagtga 600 gatgcagccc acgtgagttc agcaacggtc tagcgctggg cttttaggcc cgcatgatcg 660 ggcttttgtc gggtggtcga cgtgttcacg attggggaga gcaacgcagc agttcctctt 720 agtttagtcc cacctcgcct gtccagcaga gttctgaccg gtttataaac tcgcttgctg 780 catcagactt ggaacaacca gcatctggga agttttagag ctagaaatag caagttaaaa 840 taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttttttaa 900 ttaagttcca tcccaatggc gcgccgagct tggctcgagc atggtcatag ctgtttcctg 960 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 1020 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 1080 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 1140 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 1200 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 1260 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 1320 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1380 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1440 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1500 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 1560 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 1620 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 1680 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 1740 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 1800 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 1860 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 1920 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 1980 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2040 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2100 acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 2160 caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 2220 tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 2280 aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 2340 cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 2400 gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 2460 attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 2520 tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 2580 gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg agtaaccatg 2640 catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 2700 agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 2760 gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 2820 cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 2880 gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt tttcaatatt 2940 attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3000 aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 3060 aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 3120 <210> 12 <211> 3120 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02535 comprising guide RNA <400> 12 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 cctgcaggga ccaagcccgt tattctgaca gttctggtgc tcaacacatt tatatttatc 480 aaggagcaca ttgttactca ctgctaggag ggaatcgaac taggaatatt gatcagagga 540 actacgagag agctgaagat aactgccctc tagctctcac tgatctgggt cgcatagtga 600 gatgcagccc acgtgagttc agcaacggtc tagcgctggg cttttaggcc cgcatgatcg 660 ggcttttgtc gggtggtcga cgtgttcacg attggggaga gcaacgcagc agttcctctt 720 agtttagtcc cacctcgcct gtccagcaga gttctgaccg gtttataaac tcgcttgctg 780 catcagactt gatctgggaa tggtggtgca ggttttagag ctagaaatag caagttaaaa 840 taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttttttaa 900 ttaagttcca tcccaatggc gcgccgagct tggctcgagc atggtcatag ctgtttcctg 960 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 1020 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 1080 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 1140 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 1200 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 1260 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 1320 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1380 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1440 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1500 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 1560 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 1620 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 1680 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 1740 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 1800 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 1860 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 1920 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 1980 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2040 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2100 acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 2160 caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 2220 tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 2280 aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 2340 cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 2400 gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 2460 attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 2520 tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 2580 gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg agtaaccatg 2640 catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 2700 agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 2760 gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 2820 cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 2880 gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt tttcaatatt 2940 attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 3000 aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 3060 aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 3120 <210> 13 <211> 3455 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02539 comprising donor DNA <400> 13 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ggcgcgccat gtattctcag ggatgtaagc aacgggtctg tcaggtgggt ccaaagattt 480 tgtaatagga agaggtccac caatgttggc aggaacatag ctgagccacc tcaatatatt 540 agatacacct tcaaggtcat ctgaaactgt cagatggaca acaccgtttg tcgccataat 600 tttggggcca cccaactgca tgtgggagct gtaaacttcc cggccaagaa gcttgttcaa 660 ggcagagaac ccagttagga taatgggctg gtcagtacgc tgtatgcacc gtatgccaag 720 tcgagcaaga tatgctccta ttccaacagt ccgtccagtc acaaatgtaa gcgtaaatgt 780 ctcctcatag gccctagaat aggcactggc aatagcagca cttccatgga ggttctcgac 840 gcccaaccca tcctccttcc ccacaacaga atcgataacc cacctaattt caccattatc 900 aagctgcatc ttgtgcgcta taacagaagt gctaatacga gcatggtctt cttcagtcag 960 ataaatgtac tgaaacccac gttcagggct gccatcatca gaccatccaa cacggaagca 1020 agattttact tcatctgcta tgccgatccg agcaccagag tttgctgcca agtagatgag 1080 aggaagcttc ctctcacaag ctaggttggt aacagtttca aaaaatgcat cttcccttgg 1140 accaaacgat ccagctctaa aagtaatatc atttgcgatg acaacaatct gcctgccatt 1200 gggatattca ggagtggaca tgtccaagat cttaattaag ttccatccca atggcgcgcc 1260 gagcttggct cgagcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 1320 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 1380 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 1440 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 1500 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 1560 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 1620 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 1680 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 1740 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 1800 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 1860 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 1920 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 1980 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 2040 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 2100 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 2160 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 2220 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 2280 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 2340 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 2400 atcaatctaa agtatatatg agtaaacttg gtctgacagt tagaaaaact catcgagcat 2460 caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg 2520 tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta 2580 tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa 2640 aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa 2700 aagtttatgc atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa 2760 atcactcgca tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac 2820 gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac 2880 tgccagcgca tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc 2940 tgttttccca gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg 3000 cttgatggtc ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt 3060 aacatcattg gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt 3120 cccatacaat cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata 3180 cccatataaa tcagcatcca tgttggaatt taatcgcggc ctagagcaag acgtttcccg 3240 ttgaatatgg ctcatactct tcctttttca atattattga agcatttatc agggttattg 3300 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3360 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 3420 ctataaaaat aggcgtatca cgaggccctt tcgtc 3455 <210> 14 <211> 3455 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02540 comprising donor DNA <400> 14 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ttaattaaga tcttggacat gtccactcct gaatatccca atggcaggca gattgttgtc 480 atcgcaaatg atattacttt tagagctgga tcgtttggtc caagggaaga tgcatttttt 540 gaaactgtta ccaacctagc ttgtgagagg aagcttcctc tcatctactt ggcagcaaac 600 tctggtgctc ggatcggcat agcagatgaa gtaaaatctt gcttccgtgt tggatggtct 660 gatgatggca gccctgaacg tgggtttcag tacatttatc tgactgaaga agaccatgct 720 cgtattagca cttctgttat agcgcacaag atgcagcttg ataatggtga aattaggtgg 780 gttatcgatt ctgttgtggg gaaggaggat gggctaggtg tggagaacct ccatggaagt 840 gctgctattg cgagtgcgta tagccgcgcc tatgaggaga catttacgct tacatttgtg 900 actggacgga ctgttggaat aggagcatat cttgctcgac ttggcatacg gtgcatacag 960 cgtactgacc agcccattat cctaactggg ttctctgcct tgaacaagct tcttggccgg 1020 gaagtttaca gctcccacat gcagttgggt ggccccaaaa ttatggcgac aaacggtgtt 1080 gtccatctga cagtttcaga tgaccttgaa ggtgtatcta atatattgag gtggctcagc 1140 tatgttcctg ccaacattgg tggacctctt cctattacaa aatctttgga cccacctgac 1200 agacccgttg cttacatccc tgagaataca tggcgcgccg ttccatccca atggcgcgcc 1260 gagcttggct cgagcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 1320 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 1380 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 1440 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 1500 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 1560 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 1620 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 1680 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 1740 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 1800 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 1860 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 1920 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 1980 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 2040 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 2100 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 2160 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 2220 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 2280 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 2340 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 2400 atcaatctaa agtatatatg agtaaacttg gtctgacagt tagaaaaact catcgagcat 2460 caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg 2520 tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta 2580 tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa 2640 aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa 2700 aagtttatgc atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa 2760 atcactcgca tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac 2820 gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac 2880 tgccagcgca tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc 2940 tgttttccca gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg 3000 cttgatggtc ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt 3060 aacatcattg gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt 3120 cccatacaat cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata 3180 cccatataaa tcagcatcca tgttggaatt taatcgcggc ctagagcaag acgtttcccg 3240 ttgaatatgg ctcatactct tcctttttca atattattga agcatttatc agggttattg 3300 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3360 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 3420 ctataaaaat aggcgtatca cgaggccctt tcgtc 3455 <210> 15 <211> 3455 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02541 comprising donor DNA <400> 15 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ggcgcgccat gtattctcag ggatgtaagc aacgggtctg tcaggtgggt ccaaagattt 480 tgtaatagga agaggtccac caatgttggc aggaacatag ctgagccacc tcaatatatt 540 agatacacct tcaaggtcat ctgaaactgt cagatggaca acaccgtttg tcgccataat 600 tttggggcca cccaactgca tgtgggagct gtaaacttcc cggccaagaa gcttgttcaa 660 ggcagagaac ccagttagga taatgggctg gtcagtacgc tgtatgcacc gtatgccaag 720 tcgagcaaga tatgctccta ttccaacagt ccgtccagtc acaaatgtaa gcgtaaatgt 780 ctcctcatag gcgcggctat acgcactcgc aatagcaaca cttccatgga ggttctccac 840 acctagccca tcctccttcc ccacaacaga atcgataacc cacctaattt caccattatc 900 aagctgcatc ttgtgcgcta taacagaagt gctaatacga gcatggtctt cttcagtcag 960 ataaatgtac tgaaacccac gttcagggct gccatcatca gaccatccaa cacggaagca 1020 agattttact tcatctgcta tgccgatccg agcaccagag tttgctgcca agtagatgag 1080 aggaagcttc ctctcacaag ctaggttggt aacagtttca aaaaatgcat cttcccttgg 1140 accaaacgat ccagctctaa aagtaatatc atttgcgatg acaacaatct gcctgccatt 1200 gggatattca ggagtggaca tgtccaagat cttaattaag ttccatccca atggcgcgcc 1260 gagcttggct cgagcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 1320 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 1380 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 1440 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 1500 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 1560 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 1620 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 1680 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 1740 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 1800 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 1860 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 1920 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 1980 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 2040 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 2100 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 2160 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 2220 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 2280 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 2340 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 2400 atcaatctaa agtatatatg agtaaacttg gtctgacagt tagaaaaact catcgagcat 2460 caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg 2520 tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta 2580 tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa 2640 aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa 2700 aagtttatgc atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa 2760 atcactcgca tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac 2820 gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac 2880 tgccagcgca tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc 2940 tgttttccca gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg 3000 cttgatggtc ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt 3060 aacatcattg gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt 3120 cccatacaat cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata 3180 cccatataaa tcagcatcca tgttggaatt taatcgcggc ctagagcaag acgtttcccg 3240 ttgaatatgg ctcatactct tcctttttca atattattga agcatttatc agggttattg 3300 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3360 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 3420 ctataaaaat aggcgtatca cgaggccctt tcgtc 3455 <210> 16 <211> 3439 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02536 comprising donor DNA <400> 16 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ggcgcgccgg agctttgcct tcagatttat caattctgga tcaagcctac ccatgcactc 480 ttggagttcc tctgacctga acttgatctc gatcaaccct tgaggttcga gaacattgcc 540 ctttgcagtc ctctcagcat agaactcaat gcgatctgga tttatcttgc tatcaatcac 600 gacccaagcc cctccacgta gctctgcagc cttggggata tatacaaagg caggctgatt 660 gtatgtccta aggttctcaa caattgttga cccagcctga aggattcctt caaaaagatc 720 tctttgtcca ccagagaagc ctctccagtt agcaaggatg aacagaggta atccttcacg 780 gttgaagtcc agcattgcct gcgctgtctt cgtgacgctg tccgggaacc acacctgccc 840 agcacgagga acagatcgct catgggaatc aagctggcct ggatcagcag ggatgagctg 900 catcatagtc tgtgtctcca cagctataac acccaccgga atccctccga gtttcgctct 960 gccagtaaca actgacttcg cccatccttc aaatgtctcc acaaaactgt ctttgtcgaa 1020 catgcccccc aaccatttcc cttggctatc atcaatgcca ctgatggcag cacgaggatc 1080 gcatgtattc tcagggatgt aagcaacggg tctgtcaggt gggtccaaag attttgtaat 1140 aggaagaggt ccaccaatgt tggcaggaac atagctgagc cacctcaata tattagatac 1200 accttcaagg tcatcttaat taagttccat cccaatggcg cgccgagctt ggctcgagca 1260 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga 1320 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt 1380 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 1440 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 1500 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 1560 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 1620 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 1680 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 1740 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 1800 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 1860 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 1920 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 1980 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 2040 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 2100 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 2160 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 2220 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 2280 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 2340 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 2400 tatgagtaaa cttggtctga cagttagaaa aactcatcga gcatcaaatg aaactgcaat 2460 ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 2520 gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 2580 actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 2640 gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct 2700 ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 2760 aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 2820 ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 2880 atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccagggatc 2940 gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 3000 ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 3060 ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 3120 attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 3180 tccatgttgg aatttaatcg cggcctagag caagacgttt cccgttgaat atggctcata 3240 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 3300 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 3360 gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 3420 atcacgaggc cctttcgtc 3439 <210> 17 <211> 3457 <212> DNA <213> Artificial sequence <220> <223> Plasmid BAY02542 comprising donor DNA <400> 17 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ttaattaagg tccatggcac aaggagttgg atcagcagaa gagggagttt cctctaggat 480 tcaagacttt tggcgaggcc atcccgccgc aatatgctat ccaggtactg gatgagctga 540 caaaagggga ggcgatcatt gccactggtg ttgggcagca ccagatgtgg gcggctcagt 600 attacactta caagcggcca cggcagtggc tgtcttcgtc tggtttgggg gcaatgggat 660 ttgggttacc agctgcagct ggcgctgctg tggccaaccc aggtgttaca gttgttgaca 720 ttgatggtga tggtagtttc ctcatgaaca ttcaggagtt ggcgttgatc cgcattgaga 780 acctcccagt gaaggtgatg atattgaaca accagcatct cggcatggtc gtccagctcg 840 aggataggtt ttacaaggcc aatcgggcgc acacatacct tggcaaccca gaaaatgaga 900 gtgagatata tccagatttt gtgacgattg ctaaaggatt caacgttcca gcagttcgag 960 tgacgaagaa gagcgaagtc actgcagcaa tcaagaagat gcttgagacc ccagggccat 1020 acttgttgga tatcatagtc ccgcatcagg agcacgtgct gcctatgatc ccaagcggtg 1080 gtgctttcaa ggacatgatc atggagggtg atggcaggac ctcgtactga aatttcgacc 1140 tacaagacct acaagtgtga catgcgcaat cagcatgatg cccgcgtgtt gtatcaacta 1200 ctaggggttc aactgtgagc catgcgtttt ctaggcgcgc cgttccatcc caatggcgcg 1260 ccgagcttgg ctcgagcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 1320 attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 1380 agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 1440 tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 1500 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 1560 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 1620 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 1680 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 1740 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 1800 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 1860 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 1920 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 1980 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 2040 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 2100 cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 2160 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 2220 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 2280 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 2340 gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 2400 aaatcaatct aaagtatata tgagtaaact tggtctgaca gttagaaaaa ctcatcgagc 2460 atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc 2520 cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg 2580 tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca 2640 aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc 2700 aaaagtttat gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca 2760 aaatcactcg catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat 2820 acgcgatcgc tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac 2880 actgccagcg catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat 2940 gctgttttcc cagggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa 3000 tgcttgatgg tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct 3060 gtaacatcat tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc 3120 ttcccataca atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta 3180 tacccatata aatcagcatc catgttggaa tttaatcgcg gcctagagca agacgtttcc 3240 cgttgaatat ggctcatact cttccttttt caatattatt gaagcattta tcagggttat 3300 tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 3360 cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta 3420 acctataaaa ataggcgtat cacgaggccc tttcgtc 3457 <210> 18 <211> 6635 <212> DNA <213> Artificial sequence <220> <223> Plasmid IB26 (transforming DNA) <400> 18 gtgcaccata cctgcaggca attggccgct gtaccatgca tgatctggat tttagtactg 60 gattttggtt ttaggaatta gaaattttat tgatagaagt attttacaaa tacaaataca 120 tactaagggt ttcttatatg ctcaacacat gagcgaaacc ctataggaac cctaattccc 180 ttatctggga actactcaca cattattatg gagaaaatag agagagatag atttgtagag 240 agagactggt gatttcagcg tgtccaagct tgctagagtc gcggccgctt cagatctcgg 300 tgacgggcag gaccggacgt ggcggtaccg gcaggctgaa gtccagctgc cagaaaccca 360 cgtcatgcca gttcccgtgc ttgaagccgg ccgcccgcag catgccgcgg ggggcatatc 420 cgagcgcctc gtgcatgcgc acgctcgggt cgttgggcag cccgatgaca gcgaccacgc 480 tcttgaagcc ctgtgcctcc agggacttca gcaggtgggt gtagagcgtg gagcccagtc 540 ccgtccgctg gtggcggggg gagacgtaca cggtcgactc ggccgtccag tcgtaggcgt 600 tgcgtgcctt ccaggggccc gcgtaggcga tgccggcgac ctcgccgtcc acctcggcga 660 cgagccaggg atagcgctcc cgcagacgga cgaggtcgtc cgtccactcc tgcggttcct 720 gcggctcggt acggaagttg accgtgcttg tctcgatgta gtggttgacg atggtgcaga 780 ccgccggcat gtccgcctcg gtggcacggc ggatgtcggc cgggcgtcgt tctgggtcca 840 tcttgtacag ctcgtccatg ccgagagtga tcccggcggc ggtcacgaac tccagcagga 900 ccatgtgatc gcgcttctcg ttggggtctt tgctcagggc ggactgggtg ctcaggtagt 960 ggttgtcggg cagcagcacg gggccgtcgc cgatgggggt gttctgctgg tagtggtcgg 1020 cgagctgcac gctgccgtcc tcgatgttgt ggcggatctt gaagttcacc ttgatgccgt 1080 tcttctgctt gtcggccatg atatagacgt tgtggctgtt gtagttgtac tccagcttgt 1140 gccccaggat gttgccgtcc tccttgaagt cgatgccctt cagctcgatg cggttcacca 1200 gggtgtcgcc ctcgaacttc acctcggcgc gggtcttgta gttgccgtcg tccttgaaga 1260 agatggtgcg ctcctggacg tagccttcgg gcatggcgga cttgaagaag tcgtgctgct 1320 tcatgtggtc ggggtagcgg ctgaagcact gcacgccgta ggtcagggtg gtcacgaggg 1380 tgggccaggg cacgggcagc ttgccggtgg tgcagatgaa cttcagggtc agcttgccgt 1440 aggtggcatc gccctcgccc tcgccggaca cgctgaactt gtggccgttt acgtcgccgt 1500 ccagctcgac caggatgggc accaccccgg tgaacagctc ctcgcccttg ctcaccatgg 1560 ttttggttta ataagaagag aaaagagttc ttttgttatg gctgaagtaa tagagaaatg 1620 agctcgagtc ctctccaaat gaaatgaact tccttatata gaggaagggt cttgcgaagg 1680 atagtgggat tgtgcgtcat cccttacgtc agtggagata tcacatcaat ccacttgctt 1740 tgaagacgtg gttggaacgt cttctttttc cacgatgctc ctcgtgggtg ggggtccatc 1800 tttgggacca ctgtcggcag gggcatcttg aacgatagcc tttcctttat cgcaatgatg 1860 gcatttgtag gtgccacctt ccttttctac tgtccttttg atgaagtgac agatagctgg 1920 gcaatggaat ccgaggaggt ttcccgatat taccctttgt tgaaaagtct caatagccct 1980 ttggtcttct gagactgtat ctttgatatt cttggagtag acgagagtgt cgtgctccac 2040 catgttgacg aagattttct tcttgtcatt gagtcgtaaa agactctgta tgaactgttc 2100 gccagtcttc acggcgagtt ctgttagatc ctcgatctga atttttgact ccatgtatgg 2160 tgcatatggc gcgccataga tccgtcaatt ctcactcatt aggcacccca ggctttacac 2220 tttatgcttc cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga 2280 aacaggatca tgagcggaga attaagggag tcacgttatg acccccgccg atgacgcggg 2340 acaagccgtt ttacgtttgg aactgacaga accgcaacgt tgaaggagcc actcagccgc 2400 gggtttctgg agtttaatga gctaagcaca tacgtcagaa accattattg cgcgttcaaa 2460 agtcgcctaa ggtcactatc agctagcaaa tatttcttgt caaaaatgct ccactgacgt 2520 tccataaatt cccctcggta tccaattaga gtctcatatt cactctcaat ccagatccgg 2580 cccatgatca tgtggattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 2640 gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 2700 ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 2760 ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 2820 tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 2880 gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 2940 gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 3000 gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 3060 gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 3120 cgcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 3180 atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 3240 cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 3300 gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 3360 tatcgccttc ttgacgagtt cttctgagcg ggactctggg gttcgaaatg accgaccaag 3420 cgacgcccaa cctgccatca cgagatttcg attccaccgc cgccttctat gaaaggttgg 3480 gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 3540 tggagttctt cgcccacccc ctgctttaat gagatatgcg agacgcctat gatcgcatga 3600 tatttgcttt caattctgtt gtgcacgttg taaaaaacct gagcatgtgt agctcagatc 3660 cttaccgccg gtttcggttc attctaatga atatatcacc cgttactatc gtatttttat 3720 gaataatatt ctccgttcaa tttactgatt gtaccctact acttatatgt acaatattaa 3780 aatgaaaaca atatattgtg ctgaataggt ttatagcgac atctatgata gagcgccaca 3840 ataacaaaca attgcgtttt attattacaa atccaatttt aaaaaaagcg gcagaaccgg 3900 tcaaacctaa aagactgatt acataaatct tattcaaatt tcaaaagtgc cccaggggct 3960 agtatctacg acacaccgag cggcgaacta ataacgctca ctgaagggaa ctccggttcc 4020 ccgccggcgc gcatgggtga gattccttga agttgagtat tggccgtccg ctctaccgaa 4080 agttacgggc accattcaac ccggtccagc acggcggccg ggtaaccgac ttgctgcccc 4140 gagaattatg cagcattttt ttggtgtatg tgggccctgt acagcggccg cgttaacgcg 4200 tatactctag agcgatcgca agcttggcgt aatcatggtc atagctgttt cctgtgtgaa 4260 attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 4320 ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 4380 agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 4440 gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4500 ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 4560 gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 4620 aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 4680 gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 4740 ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 4800 cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 4860 cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 4920 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 4980 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 5040 agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 5100 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 5160 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 5220 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 5280 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 5340 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 5400 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 5460 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 5520 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 5580 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 5640 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 5700 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 5760 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 5820 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 5880 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 5940 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 6000 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 6060 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 6120 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 6180 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 6240 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 6300 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 6360 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 6420 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 6480 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 6540 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 6600 ttaactatgc ggcatcagag cagattgtac tgaga 6635 <210> 19 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-048 <400> 19 atgatggcag ccctgaacg 19 <210> 20 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-051 <400> 20 ggcatgttcg acaaagacag 20 <210> 21 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-053 <400> 21 caactgcatg tgggagctg 19 <210> 22 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-054 <400> 22 acaattgttg acccagcctg 20 <210> 23 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-065 <400> 23 gttacagttg ttgacattga tgg 23 <210> 24 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-066 <400> 24 aagtatggcc ctggggtctc 20 <210> 25 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-101 <400> 25 ctattgccag tgcctattct agg 23 <210> 26 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-102 <400> 26 gtgacgctgt ccgggaacca c 21 <210> 27 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-110 <400> 27 ctgcttgcca cttacacctc 20 <210> 28 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-111 <400> 28 gttgggcgtc gagaacctc 19 <210> 29 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-112 <400> 29 acttgcccag cacgaggaac 20 <210> 30 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-113 <400> 30 gctaggtgtg gagaacctc 19 <210> 31 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-130 <400> 31 gatgcatggc actgtgtatg c 21 <210> 32 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-135 <400> 32 ggcatggtcg tccagctc 18 <210> 33 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-136 <400> 33 cagaaaggaa ccagcacact g 21 <210> 34 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Primer HT-18-162 <400> 34 gttccttccc cttgcatc 18 <210> 35 <211> 3496 <212> DNA <213> Artificial sequence <220> <223> Plasmid Bas04096 comprising donor DNA <400> 35 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggctt 420 ttggcggaat gatcaattgc cctcgtttat tgcaccgctg atttccggtg ggcatattaa 480 ccgatcttgg acatgtccac tcctgaatat cccaatggca ggcagattgt tgtcatcgca 540 aatgatatta cttttagagc tggatcgttt ggtccaaggg aagatgcatt ttttgaaact 600 gttaccaacc tagcttgtga gaggaagctt cctctcatct acttggcagc aaactctggt 660 gctcggatcg gcatagcaga tgaagtaaaa tcttgcttcc gtgttggatg gtctgatgat 720 ggcagccctg aacgtgggtt tcagtacatt tatctgactg aagaagatca tgctcgtatt 780 agcacttctg ttatagcgca caagatgcag cttgataatg gtgaaatccg ctgggttatc 840 gattctgttg tggggaagga ggatgggcta ggtgtggaga acctccatgg aagtgctgct 900 attgccagtg cctattctag ggcctatgag gagacattta cgcttacatt tgtgactgga 960 cggactgttg gaataggagc atatcttgct cgacttggca tacggtgcat acagcgtact 1020 gatcagccca ttatcctaac tgggttctct gccttgaaca agcttcttgg ccgggaagtt 1080 tacagctccc acatgcagtt gggtggcccc aaaattatgg cgacaaacgg tgttgtccat 1140 ctgacagttt cagatgacct tgaaggtgta tctaatatat tgaggtggct cagctatgtt 1200 cctgccaaca ttggtggacc tcttcctatt acaaaatctt tggacccacc tgacagaccc 1260 gttgcttaca tccctgagaa tacatatccc aatggcgcgc cgagcttggc tcgagcatgg 1320 tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 1380 ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 1440 ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 1500 ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact 1560 gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 1620 atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 1680 caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 1740 cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 1800 taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 1860 ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 1920 tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 1980 gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 2040 ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 2100 aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 2160 agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 2220 agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 2280 cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 2340 gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 2400 atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 2460 gagtaaactt ggtctgacag ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta 2520 ttcatatcag gattatcaat accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa 2580 aactcaccga ggcagttcca taggatggca agatcctggt atcggtctgc gattccgact 2640 cgtccaacat caatacaacc tattaatttc ccctcgtcaa aaataaggtt atcaagtgag 2700 aaatcaccat gagtgacgac tgaatccggt gagaatggca aaagtttatg catttctttc 2760 cagacttgtt caacaggcca gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa 2820 ccgttattca ttcgtgattg cgcctgagcg agacgaaata cgcgatcgct gttaaaagga 2880 caattacaaa caggaatcga atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata 2940 ttttcacctg aatcaggata ttcttctaat acctggaatg ctgttttccc agggatcgca 3000 gtggtgagta accatgcatc atcaggagta cggataaaat gcttgatggt cggaagaggc 3060 ataaattccg tcagccagtt tagtctgacc atctcatctg taacatcatt ggcaacgcta 3120 cctttgccat gtttcagaaa caactctggc gcatcgggct tcccatacaa tcgatagatt 3180 gtcgcacctg attgcccgac attatcgcga gcccatttat acccatataa atcagcatcc 3240 atgttggaat ttaatcgcgg cctagagcaa gacgtttccc gttgaatatg gctcatactc 3300 ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 3360 tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 3420 ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 3480 acgaggccct ttcgtc 3496 <210> 36 <211> 3490 <212> DNA <213> Artificial sequence <220> <223> Plasmid Bay02544 comprising donor DNA <400> 36 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatccaag 420 ctcggcgcgc cattgggatg gcgcgccatg tattctcagg gatgtaagca acgggtctgt 480 caggtgggtc caaagatttt gtaataggaa gaggtccacc aatgttggca ggaacatagc 540 tgagccacct caatatatta gatacacctt caaggtcatc tgaaactgtc agatggacaa 600 caccgtttgt cgccataatt ttggggccac ccaactgcat gtgggagctg taaacttccc 660 ggccaagaag cttgttcaag gcagagaacc cagttaggat aatgggctgg tcagtacgct 720 gtatgcaccg tatgccaagt cgagcaagat atgctcctat tccaacagtc cgtccagtca 780 caaatgtaag cgtaaatgtc tcctcatagg cgcggctata cgcactcgca atagcaacac 840 ttccatggag gttctcgacg cccaacccat cctccttccc cacaacagaa tcgataaccc 900 acctaatttc accattatca agctgcatct tgtgcgctat aacagaagtg ctaatacgag 960 catggtcttc ttcagtcaga taaatgtact gaaacccacg ttcagggctg ccatcatcag 1020 accatccaac acggaagcaa gattttactt catctgctat gccgatccga gcaccagagt 1080 ttgctgccaa gtagatgaga ggaagcttcc tctcacaagc taggttggta acagtttcaa 1140 aaaatgcatc ttcccttgga ccaaacgatc cagctctaaa agtaatatca tttgcgatga 1200 caacaatctg cctgccattg ggatattcag gagtggacat gtccaagatc ttaattaaat 1260 cccaatacgc gtcaattcaa tcccaatggc gcgccgagct tggctcgagc atggtcatag 1320 ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 1380 ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 1440 tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 1500 cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 1560 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 1620 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 1680 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 1740 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 1800 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 1860 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 1920 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 1980 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2040 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 2100 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 2160 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 2220 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 2280 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 2340 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 2400 acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 2460 acttggtctg acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata 2520 tcaggattat caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca 2580 ccgaggcagt tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca 2640 acatcaatac aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca 2700 ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact 2760 tgttcaacag gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta 2820 ttcattcgtg attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta 2880 caaacaggaa tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca 2940 cctgaatcag gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg 3000 agtaaccatg catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat 3060 tccgtcagcc agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg 3120 ccatgtttca gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca 3180 cctgattgcc cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg 3240 gaatttaatc gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt 3300 tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 3360 tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 3420 gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 3480 ccctttcgtc 3490 <210> 37 <211> 3155 <212> DNA <213> Artificial sequence <220> <223> Plasmid Bas04093 comprising donor DNA <400> 37 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatgatga 420 gaccgaggtc gtgatgtctg aagtacgcca atacatctat ggcatcggta cgcagtgacc 480 aagcccgtta ttctgacagt tctggtgctc aacacattta tatttatcaa ggagcacatt 540 gttactcact gctaggaggg aatcgaacta ggaatattga tcagaggaac tacgagagag 600 ctgaagataa ctgccctcta gctctcactg atctgggtcg catagtgaga tgcagcccac 660 gtgagttcag caacggtcta gcgctgggct tttaggcccg catgatcggg cttttgtcgg 720 gtggtcgacg tgttcacgat tggggagagc aacgcagcag ttcctcttag tttagtccca 780 cctcgcctgt ccagcagagt tctgaccggt ttataaactc gcttgctgca tcagacttga 840 cccagttagg ataatgggcg ttttagagct agaaatagca agttaaaata aggctagtcc 900 gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt ttttatccca atggcgcgcc 960 gagcttggct cgagcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 1020 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 1080 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 1140 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 1200 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 1260 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 1320 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 1380 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 1440 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 1500 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 1560 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 1620 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 1680 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 1740 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 1800 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 1860 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 1920 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 1980 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 2040 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 2100 atcaatctaa agtatatatg agtaaacttg gtctgacagt tagaaaaact catcgagcat 2160 caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg 2220 tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta 2280 tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa 2340 aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa 2400 aagtttatgc atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa 2460 atcactcgca tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac 2520 gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac 2580 tgccagcgca tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc 2640 tgttttccca gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg 2700 cttgatggtc ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt 2760 aacatcattg gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt 2820 cccatacaat cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata 2880 cccatataaa tcagcatcca tgttggaatt taatcgcggc ctagagcaag acgtttcccg 2940 ttgaatatgg ctcatactct tcctttttca atattattga agcatttatc agggttattg 3000 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3060 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 3120 ctataaaaat aggcgtatca cgaggccctt tcgtc 3155 <210> 38 <211> 8853 <212> DNA <213> Artificial sequence <220> <223> Plasmid Bas03568 encoding a modified LbCas12a <400> 38 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gggcccggcc ggccgcgatc 420 gcgcggccgc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat 480 tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc 540 agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt 600 actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa 660 ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt 720 tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca 780 tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta catctatttt 840 attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat 900 aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag 960 aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa 1020 acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg 1080 ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc 1140 cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag 1200 acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg 1260 attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc 1320 cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat 1380 ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt cctccccccc 1440 cccccctctc taccttctct agatcggcgt tccggtccat gcttagggcc cggtagttct 1500 acttctgtcc atgtttgtgt tagatccgtg tttgtgttag atccgtgcta ctagcgttcg 1560 tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca gtgtttctct 1620 ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatttc atgatttttt 1680 ttgtttcgtt gcatagggtt tggtttgccc ttttccttta tttcaatata tgccgtgcac 1740 ttgtttgtcg ggtcatcttt tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg 1800 ttgggcggtc gttctagatc ggagtagaat tctgtttcaa actacctggt ggatttatta 1860 attttggatc tgtatgtgtg tgccatacat attcatagtt acgaattgaa gatgatggat 1920 ggaaatatcg atctaggata ggtatacatg ttgatgcggg ttttactgat gcatatacag 1980 agatgctttt tgttcgcttg gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt 2040 tctagatcgg agtagaatac tgtttcaaac tacctggtgt atttattaat tttggaactg 2100 tatgtgtgtg tcatacatct tcatagttac gagtttaaga tggatggaaa tatcgatcta 2160 ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 2220 atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 2280 aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 2340 tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 2400 ccctgttgtt tggtgttact tctgcagcca tggcgcccaa gaagaagagg aaggtgggca 2460 tccacggcgt ccccgccgcc atgagcaagc tggagaagtt caccaactgc tactcactct 2520 ccaagaccct ccgcttcaag gccatccccg tcggcaagac ccaggagaac atcgacaaca 2580 agaggctgct ggtggaggat gagaagaggg ccgaggacta caagggcgtc aagaagctcc 2640 tcgaccggta ctacctctca ttcatcaatg atgtcctcca ctccatcaag ctgaagaacc 2700 tcaacaacta catctccctc ttccgcaaga agacaaggac cgagaaggag aacaaggagc 2760 tggagaacct ggagatcaac ctccgcaagg agatcgccaa ggccttcaag ggcaacgagg 2820 gctacaagag cctcttcaag aaggacatca tcgagacgat cctaccggag ttcctggatg 2880 acaaggacga gatcgccctg gtgaacagct tcaacggctt caccaccgcc ttcaccggct 2940 tcttcgacaa ccgggagaac atgttctccg aggaggccaa gagcacctcc atcgccttca 3000 ggtgcatcaa cgagaacctc acccgctaca tctcaaacat ggacatcttc gagaaggtgg 3060 acgccatctt cgacaagcat gaggtccagg agatcaagga gaagatcctg aactccgact 3120 acgacgtgga ggacttcttc gagggcgagt tcttcaactt cgtcctgacc caagaaggca 3180 tcgacgtcta caacgccatc atcggcggct tcgtcaccga gtcaggtgag aagatcaagg 3240 gcctcaacga gtacatcaac ctctacaacc agaagaccaa gcagaagctc cccaagttca 3300 agcccctcta caagcaggtg ctctccgacc gtgagagctt gagcttctac ggcgagggct 3360 acacctccga cgaggaggtg ctggaggtct tccgcaacac cctcaacaag aactcagaga 3420 tcttctcctc catcaagaag ctggagaagc tcttcaagaa cttcgacgag tactcctccg 3480 ccggcatctt cgtgaagaac ggcccggcca tctcaaccat ctccaaggac atcttcggcg 3540 agtggaacgt catccgtgac aagtggaacg ccgagtacga cgacatccac ctcaagaaga 3600 aggccgtggt gaccgagaag tacgaggacg accgccgcaa gagcttcaag aagatcggca 3660 gcttctcact ggagcagctc caggagtacg ccgacgccga cctctccgtg gtggagaagc 3720 tgaaggagat catcatccag aaggtggacg agatctacaa ggtgtacggc agctctgaga 3780 agctcttcga cgccgacttc gtcctggaga agagcctcaa gaagaacgac gccgtggtgg 3840 ccatcatgaa ggacctcctc gactcagtca agagcttcga gaactacatc aaggccttct 3900 tcggcgaggg caaggagaca aaccgcgacg agagcttcta cggcgacttc gtcctcgcct 3960 atgacatcct cctcaaggtg gaccacatct acgacgccat caggaactac gtcacccaga 4020 agccctactc aaaggacaag ttcaagctct acttccagaa cccccagttc atgaggggct 4080 gggacaagga caaggagact gactaccgcg ccaccatcct ccgctacggc tcaaagtact 4140 acctcgccat catggacaag aagtacgcca agtgcctcca gaagatcgac aaggatgatg 4200 tgaacggcaa ctacgagaag atcaactaca agctcctccc cggccccaac aagatgctac 4260 caagggtctt cttctccaag aagtggatgg cctactacaa cccctccgag gacatccaga 4320 agatctacaa gaacggcacc ttcaagaagg gtgacatgtt caacctcaac gactgccaca 4380 agctgatcga cttcttcaag gacagcatct caaggtaccc caagtggagc aacgcctacg 4440 acttcaactt ctctgagacg gagaagtaca aggacatcgc cggcttctac cgggaggtgg 4500 aggagcaagg ctacaaggtg agcttcgagt ccgcctccaa gaaggaggtg gacaagctgg 4560 tggaggaggg caagctctac atgttccaga tctacaacaa ggacttctct gacaagagcc 4620 acggcacccc caacctacac accatgtact tcaagctcct cttcgacgag aacaaccacg 4680 gccagatccg cctctccggc ggcgccgagc tcttcatgag gagggcctcc ctcaagaagg 4740 aggagctggt ggttcacccg gccaacagcc ccatcgccaa caagaaccct gacaacccca 4800 agaagaccac caccctctcc tacgacgtct acaaggacaa gaggttctca gaagaccagt 4860 acgagctcca catccccatc gccatcaaca agtgccccaa gaacatcttc aagatcaaca 4920 ccgaggtgag ggtgctactc aagcatgatg ataaccccta cgtcatcggc atcgaccgcg 4980 gcgagaggaa cctcctctac atcgtggtgg tggacggcaa gggcaacatc gtggagcagt 5040 actccttgaa cgagatcatc aacaacttca acggcatcag gatcaagacc gactaccact 5100 cactccttga caagaaggag aaggagaggt tcgaggcccg gcaaaattgg acaagcatcg 5160 agaacatcaa ggagctgaag gccggctaca tctcccaggt ggtgcacaag atctgtgagc 5220 tggtggagaa gtacgacgcc gtcatcgccc tggaggacct caacagcggc ttcaagaact 5280 caagggtcaa ggtggagaag caggtgtacc agaagttcga gaagatgctc atcgacaagc 5340 tgaactacat ggtggacaag aagagcaacc cctgcgccac cggcggcgcc ctcaagggct 5400 accagatcac caacaagttt gagagcttca agagcatgtc aacccagaac ggcttcatct 5460 tctacatccc ggcctggctc acctccaaga tcgacccctc caccggcttc gtcaacctcc 5520 tcaagaccaa gtacacctcc atagccgaca gcaagaagtt catctcctcc ttcgaccgca 5580 tcatgtacgt ccctgaggag gacctcttcg agttcgccct cgactacaag aacttctcaa 5640 ggaccgacgc cgactacatc aagaagtgga agctctacag ctacggcaac cgcatcagga 5700 tcttcaggaa ccccaagaag aacaacgtct tcgactggga ggaggtgtgc ctgacctccg 5760 cctacaagga gctcttcaac aagtacggca tcaactacca gcaaggtgac atcagggcgc 5820 tcctatgcga gcagagcgac aaggccttct actcctcctt catggccctc atgagcttga 5880 tgctccagat gaggaacagc atcaccggcc gcaccgacgt cgacttcctc atctcccccg 5940 tcaagaactc tgatggcatc ttctacgact caaggaacta cgaggcccag gagaacgcca 6000 tcctccccaa gaacgccgac gccaacggcg cctacaacat cgccaggaag gtgctctggg 6060 ccatcggcca gttcaagaag gccgaggatg agaagctgga caaggtgaag atcgccatct 6120 caaacaagga gtggctggag tacgcccaga cctccgtcaa gcacaagagg ccggcggcca 6180 ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtccccgact 6240 acgcctaccc ctacgacgtc cccgactacg cctaccccta cgacgtcccc gactacgcct 6300 aattgctagc acgcgtcgaa gcagatcgtt caaacatttg gcaataaagt ttcttaagat 6360 tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 6420 atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 6480 tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 6540 aattatcgcg cgcggtgtca tctatgttac tagatccctg caggcccggg ttaattaaat 6600 ttaaatggcg cgccagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 6660 atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 6720 cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 6780 gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 6840 gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 6900 ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 6960 acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 7020 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 7080 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 7140 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 7200 tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 7260 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 7320 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 7380 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 7440 tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 7500 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 7560 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 7620 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 7680 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 7740 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 7800 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 7860 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 7920 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 7980 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 8040 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 8100 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 8160 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 8220 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 8280 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 8340 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 8400 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 8460 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 8520 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 8580 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 8640 gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 8700 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 8760 catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct 8820 ataaaaatag gcgtatcacg aggccctttc gtc 8853 <210> 39 <211> 1290 <212> PRT <213> Artificial sequence <220> <223> Modified LbCas12a from Plasmid Bas03568 <400> 39 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys 20 25 30 Thr Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile 35 40 45 Asp Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr 50 55 60 Lys Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn 65 70 75 80 Asp Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser 85 90 95 Leu Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu 100 105 110 Asn Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly 115 120 125 Asn Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile 130 135 140 Leu Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser 145 150 155 160 Phe Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu 165 170 175 Asn Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys 180 185 190 Ile Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu 195 200 205 Lys Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu 210 215 220 Lys Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu 225 230 235 240 Phe Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala 245 250 255 Ile Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu 260 265 270 Asn Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro 275 280 285 Lys Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu 290 295 300 Ser Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val 305 310 315 320 Phe Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys 325 330 335 Lys Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly 340 345 350 Ile Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile 355 360 365 Phe Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp 370 375 380 Asp Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp 385 390 395 400 Asp Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln 405 410 415 Leu Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys 420 425 430 Glu Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser 435 440 445 Ser Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys 450 455 460 Lys Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val 465 470 475 480 Lys Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu 485 490 495 Thr Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp 500 505 510 Ile Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val 515 520 525 Thr Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn 530 535 540 Pro Gln Phe Met Arg Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg 545 550 555 560 Ala Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp 565 570 575 Lys Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn 580 585 590 Gly Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys 595 600 605 Met Leu Pro Arg Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn 610 615 620 Pro Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys 625 630 635 640 Gly Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe 645 650 655 Lys Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe 660 665 670 Asn Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg 675 680 685 Glu Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys 690 695 700 Lys Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln 705 710 715 720 Ile Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu 725 730 735 His Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln 740 745 750 Ile Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu 755 760 765 Lys Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn 770 775 780 Lys Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val 785 790 795 800 Tyr Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro 805 810 815 Ile Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu 820 825 830 Val Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile 835 840 845 Asp Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys 850 855 860 Gly Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe 865 870 875 880 Asn Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys 885 890 895 Glu Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn 900 905 910 Ile Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile 915 920 925 Cys Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu 930 935 940 Asn Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr 945 950 955 960 Gln Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp 965 970 975 Lys Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln 980 985 990 Ile Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly 995 1000 1005 Phe Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser 1010 1015 1020 Thr Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp 1025 1030 1035 1040 Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu 1045 1050 1055 Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr 1060 1065 1070 Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg 1075 1080 1085 Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu 1090 1095 1100 Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly 1105 1110 1115 1120 Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser 1125 1130 1135 Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu 1140 1145 1150 Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile 1155 1160 1165 Ser Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr 1170 1175 1180 Glu Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly 1185 1190 1195 1200 Ala Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys 1205 1210 1215 Lys Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn 1220 1225 1230 Lys Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His Lys Arg Pro 1235 1240 1245 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr 1250 1255 1260 Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr 1265 1270 1275 1280 Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1285 1290 <210> 40 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Primer HT-19-022 <400> 40 ggctaggagt cgaaaacctc 20 <210> 41 <211> 2918 <212> DNA <213> Artificial sequence <220> <223> Plasmid Bas03609 comprising guide RNA <400> 41 gcgggtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg 60 agagaaaccc aattgggtac cgagctccct gcaggaagct taattaagat gagaccgagg 120 tcgtgatgtc tgaagtacgc caatacatct atggcatcgg tacgcagtga ccaagcccgt 180 tattctgaca gttctggtgc tcaacacatt tatatttatc aaggagcaca ttgttactca 240 ctgctaggag ggaatcgaac taggaatatt gatcagagga actacgagag agctgaagat 300 aactgccctc tagctctcac tgatctgggt cgcatagtga gatgcagccc acgtgagttc 360 agcaacggtc tagcgctggg cttttaggcc cgcatgatcg ggcttttgtc gggtggtcga 420 cgtgttcacg attggggaga gcaacgcagc agttcctctt agtttagtcc cacctcgcct 480 gtccagcaga gttctgaccg gtttataaac tcgcttgctg catcagactt gtaatttcta 540 ctaagtgtag atcacctagc ccatcctcct tcccctttta ttttttggcg cgccacctgc 600 tagcgctcgc ttggatccga attcaaacct gaaattgtta tccgctcaca attccacaca 660 acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 720 cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 780 attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 840 cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 900 caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 960 caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 1020 ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 1080 cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 1140 ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 1200 tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 1260 gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 1320 ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 1380 ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 1440 gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 1500 aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 1560 tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 1620 ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 1680 tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 1740 aaagtatata tgagtaaact tggtctgaca gccggaattg ccagctgggg cgccctctgg 1800 taaggttggg aagccctgca aagtaaactg gatggctttc ttgccgccaa ggatctgatg 1860 gcgcagggga tcaagatctg atcaagagac aggatgagga tcgtttcgca tgattgaaca 1920 agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg gctatgactg 1980 ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag cgcaggggcg 2040 cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc aggacgaggc 2100 agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt 2160 cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg atctcctgtc 2220 atcccacctt gctcctgccg agaaagtatc catcatggct gatgcaatgc ggcggctgca 2280 tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca tcgagcgagc 2340 acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag agcatcaggg 2400 gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg gcgaggatct 2460 cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc 2520 tggattcatc gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc 2580 tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta 2640 cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg acgagttctt 2700 ctgatccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 2760 tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtctcgcg cgtttcggtg 2820 atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 2880 cggatgccgg gagcagacaa gcccgtcagg gcgcgtca 2918 <210> 42 <211> 3455 <212> DNA <213> Artificial sequence <220> <223> Plasmid Bas03253 comprising donor DNA <400> 42 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 ggcgcgccat gtattctcag ggatgtaagc aacgggtctg tcaggtgggt ccaaagattt 480 tgtaatagga agaggtccac caatgttggc aggaacatag ctgagccacc tcaatatatt 540 agatacacct tcaaggtcat ctgaaactgt cagatggaca acaccgtttg tcgccataat 600 tttggggcca cccaactgca tgtgggagct gtaaacttcc cggccaagaa gcttgttcaa 660 ggcagagaac ccagttagga taatgggctg gtcagtacgc tgtatgcacc gtatgccaag 720 tcgagcaaga tatgctccta ttccaacagt ccgtccagtc acaaatgtaa gcgtaaatgt 780 ctcctcatag gccctagaat aggcactggc aatagcagca cttccatgga ggttttcgac 840 tcctagccca tcctccttcc ccacaacaga atcgataacc cacctaattt caccattatc 900 aagctgcatc ttgtgcgcta taacagaagt gctaatacga gcatggtctt cttcagtcag 960 ataaatgtac tgaaacccac gttcagggct gccatcatca gaccatccaa cacggaagca 1020 agattttact tcatctgcta tgccgatccg agcaccagag tttgctgcca agtagatgag 1080 aggaagcttc ctctcacaag ctaggttggt aacagtttca aaaaatgcat cttcccttgg 1140 accaaacgat ccagctctaa aagtaatatc atttgcgatg acaacaatct gcctgccatt 1200 gggatattca ggagtggaca tgtccaagat cttaattaag ttccatccca atggcgcgcc 1260 gagcttggct cgagcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 1320 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 1380 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 1440 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 1500 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 1560 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 1620 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 1680 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 1740 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 1800 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 1860 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 1920 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 1980 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 2040 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 2100 taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 2160 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 2220 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 2280 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 2340 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 2400 atcaatctaa agtatatatg agtaaacttg gtctgacagt tagaaaaact catcgagcat 2460 caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg 2520 tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta 2580 tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa 2640 aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa 2700 aagtttatgc atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa 2760 atcactcgca tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac 2820 gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac 2880 tgccagcgca tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc 2940 tgttttccca gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg 3000 cttgatggtc ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt 3060 aacatcattg gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt 3120 cccatacaat cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata 3180 cccatataaa tcagcatcca tgttggaatt taatcgcggc ctagagcaag acgtttcccg 3240 ttgaatatgg ctcatactct tcctttttca atattattga agcatttatc agggttattg 3300 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 3360 cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 3420 ctataaaaat aggcgtatca cgaggccctt tcgtc 3455 <210> 43 <211> 9186 <212> DNA <213> Artificial sequence <220> <223> Plasmid KVA824 encoding Cas9 D10A nickase <400> 43 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gggcccggcc ggccgcgatc 420 gcgcggccgc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat 480 tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc 540 agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt 600 actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa 660 ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt 720 tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca 780 tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta catctatttt 840 attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat 900 aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag 960 aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa 1020 acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg 1080 ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc 1140 cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag 1200 acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg 1260 attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc 1320 cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat 1380 ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt cctccccccc 1440 cccccctctc taccttctct agatcggcgt tccggtccat gcttagggcc cggtagttct 1500 acttctgtcc atgtttgtgt tagatccgtg tttgtgttag atccgtgcta ctagcgttcg 1560 tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca gtgtttctct 1620 ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatttc atgatttttt 1680 ttgtttcgtt gcatagggtt tggtttgccc ttttccttta tttcaatata tgccgtgcac 1740 ttgtttgtcg ggtcatcttt tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg 1800 ttgggcggtc gttctagatc ggagtagaat tctgtttcaa actacctggt ggatttatta 1860 attttggatc tgtatgtgtg tgccatacat attcatagtt acgaattgaa gatgatggat 1920 ggaaatatcg atctaggata ggtatacatg ttgatgcggg ttttactgat gcatatacag 1980 agatgctttt tgttcgcttg gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt 2040 tctagatcgg agtagaatac tgtttcaaac tacctggtgt atttattaat tttggaactg 2100 tatgtgtgtg tcatacatct tcatagttac gagtttaaga tggatggaaa tatcgatcta 2160 ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 2220 atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 2280 aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 2340 tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 2400 ccctgttgtt tggtgttact tctgcagcca tggcccctaa gaagaaacga aaggtaggca 2460 tccacggtgt tccagcggct atggacaaga agtacagcat cgggctggcc attggcacga 2520 actctgttgg gtgggcggtt atcactgacg agtacaaggt gccgtcgaag aagttcaagg 2580 tgctaggcaa caccgaccgt cacagcatca agaagaacct catcggcgcc ctgttgtttg 2640 actctgggga aaccgccgag gctactcgac taaagagaac cgcccgtagg cgatacacta 2700 ggcggaagaa caggatctgt tatctccagg agatcttcag caacgagatg gcgaaggtcg 2760 atgactcatt cttccaccgc cttgaggagt ctttcctggt cgaggaggac aaaaagcacg 2820 agcgacaccc gatcttcggg aacatcgttg atgaggtagc ctaccacgag aagtacccta 2880 ctatctacca cctgcgcaag aaactagtgg actccaccga caaggcggac ctccgcctta 2940 tctatctcgc cctcgcccac atgatcaagt ttcgcgggca cttcctcatc gaaggcgatc 3000 tcaatccgga caacagcgac gtggacaagc tattcatcca gctagttcag acctacaacc 3060 agctctttga agagaaccct attaacgcga gcggggtgga cgccaaagcc atcctttccg 3120 ccaggctctc taagagccgg agactcgaga accttatcgc tcagttgccc ggcgagaaga 3180 aaaacggcct tttcggcaac ctgattgccc tgtccttggg cttgacgccg aacttcaaga 3240 gcaacttcga cctagctgag gatgctaaac tgcagctgtc caaggacact tatgatgacg 3300 accttgacaa cctcctggcc caaattgggg atcagtacgc ggacctcttc ctcgctgcca 3360 agaacctctc cgacgcgatt ctgttgtcgg acatcctccg cgtgaacacc gagattacta 3420 aggccccact gtccgcgagc atgatcaaac gctacgacga gcaccatcag gatctaactc 3480 tgctcaaggc gctcgtccgt cagcaactcc ctgagaagta caaggagatc ttcttcgacc 3540 agtccaagaa cggctacgcc ggttacattg atggtggcgc gagccaggag gagttctaca 3600 agttcatcaa gcccatctta gagaagatgg acggcaccga agagcttctc gtgaagctca 3660 acagggagga cctcctaagg aagcagcgca cctttgacaa cgggtctatt cctcatcaga 3720 tccatctcgg cgagctccac gcgattttga gacgccaaga ggacttctac ccgttcttga 3780 aggacaaccg ggagaagatc gagaagatcc tcacgttcag gatcccttat tacgtcggcc 3840 ccctagctag gggtaactcg agattcgcgt ggatgaccag aaagtccgag gaaaccatta 3900 ccccgtggaa ctttgaagag gtggtcgaca agggcgcgag cgcgcaatcg ttcattgagc 3960 ggatgaccaa cttcgacaag aacctaccga acgagaaggt cctgccgaaa cactccctgc 4020 tctacgagta cttcaccgtt tataacgagc tgacgaaggt caagtacgtg actgagggca 4080 tgcgtaaacc agcgttcctc agcggtgagc agaagaaggc tatcgtggac ctgctcttta 4140 agacgaaccg caaggtgacc gtgaagcagc tcaaggagga ttatttcaag aagatcgagt 4200 gcttcgactc agtggagatt agcggcgtgg aggaccgttt caatgcgagc ttaggtacct 4260 accacgacct cctgaagatc atcaaggaca aggacttcct cgacaacgag gaaaacgagg 4320 acatcctgga ggacatcgtg ctcaccctga ccctctttga agacagggag atgatcgagg 4380 aaaggttgaa gacctacgcg cacctattcg acgacaaggt catgaaacag ctcaagcgga 4440 ggagatacac tggctggggc agactttcgc ggaagctcat caatgggatc agggacaagc 4500 agtccggcaa gaccatcctg gacttcttga agagcgacgg cttcgctaat cgcaacttca 4560 tgcagctcat tcatgacgac tccctaacat tcaaggagga catccaaaag gcgcaagtct 4620 cgggtcaggg ggattctttg cacgagcaca tcgcaaacct cgccggttct ccggccatta 4680 aaaagggcat ccttcagacg gtcaaggtgg tcgacgagct cgtgaaggtt atgggccggc 4740 ataagcccga gaacatagtg atcgagatgg ctagggagaa ccagaccacg caaaagggcc 4800 agaagaactc acgtgagcgc atgaagagga tcgaggaagg tatcaaggag ctgggctctc 4860 agattctcaa ggagcatccg gtcgagaaca cccagcttca gaacgagaag ctgtacctct 4920 actacctcca gaatggccgc gacatgtacg ttgatcagga gttagatatt aatcggctga 4980 gcgactacga cgttgaccac atcgtgcccc agtcgttcct caaggatgac tccatcgaca 5040 acaaggtcct gaccagatcg gacaagaacc gtggtaagag cgacaatgtg ccctccgagg 5100 aggtggtcaa aaagatgaag aactattggc ggcagttgct gaacgccaag ctcatcaccc 5160 agcgaaagtt cgataattta acgaaggccg aacgaggggg cctttccgaa ctcgataagg 5220 ccggtttcat caagcgtcag ctggttgaga cgcgacagat cacgaagcat gtggcccaga 5280 ttctggacag ccggatgaac acgaagtacg acgagaacga caaacttatt cgggaggtga 5340 aggtgataac cctcaagtcc aagttagtgt cggacttccg caaggacttt cagttctata 5400 aagtgcgcga gatcaacaat taccaccacg cccacgacgc ctacttgaat gccgtggtcg 5460 gcacggcgct catcaaaaag taccccaagc tggagagcga gttcgtctac ggcgactaca 5520 aggtttatga cgtcaggaag atgattgcga agtcagagca agagatcggg aaggccaccg 5580 ccaagtactt cttctactcg aacatcatga acttctttaa gaccgagatc accctcgcca 5640 atggggagat ccggaaacgt ccccttatcg agacgaacgg cgagactggc gagatagtct 5700 gggacaaagg tcgcgatttc gccaccgttc gaaaggtgct ctcaatgcct caggtcaata 5760 tcgtgaagaa gaccgaggtt cagacggggg gcttcagcaa ggagtccatc ctccctaagc 5820 gcaactctga caagctgatc gcccggaaaa aggattggga cccgaaaaag tacggcggct 5880 tcgattctcc caccgtagct tatagcgtgc tcgtggttgc caaggtggag aagggcaaga 5940 gcaagaaact gaagtcggtc aaggagttac tcggcatcac aatcatggag cgcagctcgt 6000 ttgaaaagaa cccgatcgac ttcctggagg ccaagggcta taaggaggtg aagaaggacc 6060 tcatcattaa gctgccgaag tacagcttgt tcgagctcga gaatggcagg aagaggatgc 6120 tagcttcggc cggcgaactt caaaaaggga acgagctcgc gttgccgtcg aagtacgtga 6180 acttcctcta cttagctagt cactatgaaa agctgaaggg ctcgccggag gacaacgagc 6240 agaagcagct cttcgtcgag caacacaagc actacctcga cgagatcatc gagcagataa 6300 gtgagttcag caagcgcgtg atcctcgctg atgccaacct cgataaggtg ctcagcgcct 6360 acaataagca ccgagacaag ccgattcggg agcaggcgga gaacatcatt catttattta 6420 cgctcactaa cctaggcgct ccggctgcct tcaagtactt cgacaccacg atcgacagga 6480 agcgctacac cagcaccaaa gaagtcctcg acgcgacgct cattcaccag agcatcacag 6540 ggctctacga gactcggatc gacttgtcgc aattgggtgg ggataagagg ccggccgcga 6600 ctaaaaaggc cggccaagcc aagaaaaaga aatgattgct agcacgcgtc gaagcagatc 6660 gttcaaacat ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga 6720 ttatcatata atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga 6780 cgttatttat gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga 6840 tagaaaacaa aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt 6900 tactagatcc ctgcaggccc gggttaatta aatttaaatg gcgcgccagc ttggcgtaat 6960 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 7020 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 7080 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 7140 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 7200 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7260 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7320 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7380 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7440 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7500 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 7560 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 7620 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 7680 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 7740 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 7800 ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 7860 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 7920 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 7980 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 8040 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 8100 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 8160 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 8220 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 8280 cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 8340 ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 8400 gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 8460 gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 8520 gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 8580 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 8640 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 8700 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 8760 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 8820 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 8880 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 8940 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 9000 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9060 tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 9120 tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct 9180 ttcgtc 9186 <210> 44 <211> 1401 <212> PRT <213> Artificial sequence <220> <223> Cas9 D10A nickase from Plasmid KVA824 <400> 44 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1025 1030 1035 1040 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1045 1050 1055 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1060 1065 1070 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu 1075 1080 1085 Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu 1090 1095 1100 Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly 1105 1110 1115 1120 Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu 1125 1130 1135 Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp 1140 1145 1150 Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys 1155 1160 1165 Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1170 1175 1180 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1185 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1205 1210 1215 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1265 1270 1275 1280 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1285 1290 1295 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1300 1305 1310 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His 1315 1320 1325 Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe 1330 1335 1340 Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu 1345 1350 1355 1360 Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg 1365 1370 1375 Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys 1380 1385 1390 Lys Ala Gly Gln Ala Lys Lys Lys Lys 1395 1400 <210> 45 <211> 3318 <212> DNA <213> Artificial sequence <220> <223> Plasmid KVA766 comprising guide RNA <400> 45 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggaac 420 cctgcaggaa aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc 480 cttattttaa cttgctattt ctagctctaa aacttgacag cagccgtgac tgcaagctga 540 ctacagcgcg cgggtttata agctggttcc atcgtctttc ggtttccgat gtggtactaa 600 acatcccccg caacgccacc gcgcaaacca tcggatcccc atccaacgga ctaaagtggg 660 tagcagcgcc acccgcgcgg tacggcgcgc gtgggctgca ccttccgacg cagcccaaat 720 caggatacgg cccattagta tatattctcc tcctcccagc ccacatcaca tgcgtttcac 780 actttcgcct gtaatcgctc aagtagtcaa gtatgagctc tgtctgcacg aactgattgt 840 cactagtgta ccatcaaact actagacgtg acttgtgata atctcagacg cttatggagt 900 gaaacatggt aaaaaaatgc gtttatgtgc ttgatcactt tgatcagcct tgcctccatc 960 gtctgaaaca tgataagaag acctttgtta cgaaagtgtg aaacgattct gttattcctt 1020 cggctatgcc gtaattcaac tttcacaaag cgatcgcgtt ccatcccaat ggcgcgccga 1080 gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 1140 cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct 1200 aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 1260 agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 1320 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 1380 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 1440 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 1500 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 1560 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 1620 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 1680 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 1740 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 1800 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 1860 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 1920 actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 1980 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 2040 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 2100 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 2160 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 2220 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 2280 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 2340 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 2400 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 2460 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 2520 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 2580 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 2640 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 2700 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 2760 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 2820 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 2880 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 2940 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 3000 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 3060 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 3120 tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 3180 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 3240 tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta 3300 tcacgaggcc ctttcgtc 3318 <210> 46 <211> 3349 <212> DNA <213> Artificial sequence <220> <223> Plasmid KVA769 comprising guide RNA <400> 46 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatgttgt 420 aaaacgacgg ccagtgcgat cgctttgtga aagttgaatt acggcatagc cgaaggaata 480 acagaatcgt ttcacacttt cgtaacaaag gtcttcttat catgtttcag acgatggagg 540 caaggctgat caaagtgatc aagcacataa acgcattttt ttaccatgtt tcactccata 600 agcgtctgag attatcacaa gtcacgtcta gtagtttgat ggtacactag tgacaatcag 660 ttcgtgcaga cagagctcat acttgactac ttgagcgatt acaggcgaaa gtgtgaaacg 720 catgtgatgt gggctgggag gaggagaata tatactaatg ggccgtatcc tgatttgggc 780 tgcgtcggaa ggtgcagccc acgcgcgccg taccgcgcgg gtggcgctgc tacccacttt 840 agtccgttgg atggggatcc gatggtttgc gcggtggcgt tgcgggggat gtttagtacc 900 acatcggaaa ccgaaagacg atggaaccag cttataaacc cgcgcgctgt agtcagcttg 960 aggaagtgca actcttcttg gttttagagc tagaaatagc aagttaaaat aaggctagtc 1020 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tttttcctgc aggggcgtaa 1080 tcatggtcat agcatcccaa tggcgcgccg agcttggcgt aatcatggtc atagctgttt 1140 cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 1200 tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 1260 cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 1320 gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 1380 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 1440 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 1500 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 1560 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 1620 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 1680 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 1740 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 1800 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 1860 gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 1920 ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 1980 ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 2040 ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 2100 agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 2160 aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 2220 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 2280 tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 2340 tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 2400 tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 2460 gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 2520 tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 2580 ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 2640 gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 2700 aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 2760 ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 2820 tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 2880 ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 2940 aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 3000 ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 3060 ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 3120 agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 3180 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 3240 ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 3300 atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 3349 <210> 47 <211> 3645 <212> DNA <213> Artificial sequence <220> <223> Plasmid KVA791 comprising donor DNA <400> 47 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgcgat cgcttctccc aaaattatgc 420 aattttgagg ctcctctaca tcattataat tccccaatac attgctcttt attcttaaca 480 gctttgatcg cgaaatttaa cattttaatt cttgagctgt tattttgtag catcagttta 540 tcatgagcca tgtttggtac taaatataca atcccttggg tttatttgtt tccaagcatg 600 tcattaactt atcttaatgt ggacaagaaa ctgatgcctg cttacattgc tattatttca 660 agcgggtatt gatcctttga catgtgattg atcatttttt tttctctggt tattagggca 720 caacagtggt ggacaacttg ctgaacagtg aggatgttca ctacatgctt gaggccctga 780 aagccctcgg gctctctgtg gaagcagata aagttgcaaa aagagctgta gtcgttggct 840 gtggtggcaa gtttcctgtt gagaaggatg cgaaagagga agtgcaactc ttcttgggaa 900 acgctggaat tgcaatgcga tcgttgacag cagccgtgac tgctgctggt ggaaatgcaa 960 cgtatgtttt tttttaatgt ttatgaaaat aagtatggaa ttcatggggt atgttttatg 1020 acctttttct ttaccatcag ttatgtgctt gatggagtgc cacgaatgag ggagagaccg 1080 attggtgact tggttgtcgg gttgaaacaa cttggtgcgg atgtcgactg tttccttggc 1140 actgaatgcc cacctgttcg tgtcaaggga attggaggac ttcctggtgg caaggttagt 1200 tactcctaaa ctgcatcctt tgtacttctg tatgcacctc aattctttgt caaccttctg 1260 catttataag gaacattcta tgatgaaatt cgaccttaca ctgcacagta acttgaaatg 1320 tttcatgctt aatcaatatg ccatattcct gccaagctca agcgagcaat atttgtttga 1380 atttggtacc atatttttgt atacctgcag gggcgtaatc atggtcatag ctgtttcctg 1440 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 1500 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 1560 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 1620 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 1680 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 1740 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 1800 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1860 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1920 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1980 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 2040 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 2100 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 2160 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 2220 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 2280 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 2340 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 2400 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 2460 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2520 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2580 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 2640 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 2700 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 2760 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 2820 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 2880 gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 2940 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 3000 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 3060 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 3120 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 3180 gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 3240 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 3300 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 3360 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 3420 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 3480 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 3540 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 3600 tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 3645 <210> 48 <211> 9186 <212> DNA <213> Artificial sequence <220> <223> Plasmid KVA790 encoding a modified Cas9 <400> 48 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gggcccggcc ggccgcgatc 420 gcgcggccgc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat 480 tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc 540 agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt 600 actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa 660 ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt 720 tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca 780 tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta catctatttt 840 attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat 900 aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag 960 aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa 1020 acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg 1080 ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc 1140 cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag 1200 acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg 1260 attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc 1320 cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat 1380 ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt cctccccccc 1440 cccccctctc taccttctct agatcggcgt tccggtccat gcttagggcc cggtagttct 1500 acttctgtcc atgtttgtgt tagatccgtg tttgtgttag atccgtgcta ctagcgttcg 1560 tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca gtgtttctct 1620 ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatttc atgatttttt 1680 ttgtttcgtt gcatagggtt tggtttgccc ttttccttta tttcaatata tgccgtgcac 1740 ttgtttgtcg ggtcatcttt tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg 1800 ttgggcggtc gttctagatc ggagtagaat tctgtttcaa actacctggt ggatttatta 1860 attttggatc tgtatgtgtg tgccatacat attcatagtt acgaattgaa gatgatggat 1920 ggaaatatcg atctaggata ggtatacatg ttgatgcggg ttttactgat gcatatacag 1980 agatgctttt tgttcgcttg gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt 2040 tctagatcgg agtagaatac tgtttcaaac tacctggtgt atttattaat tttggaactg 2100 tatgtgtgtg tcatacatct tcatagttac gagtttaaga tggatggaaa tatcgatcta 2160 ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 2220 atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 2280 aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 2340 tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 2400 ccctgttgtt tggtgttact tctgcagcca tggcccctaa gaagaaacga aaggtaggca 2460 tccacggtgt tccagcggct atggacaaga agtacagcat cgggctggac attggcacga 2520 actctgttgg gtgggcggtt atcactgacg agtacaaggt gccgtcgaag aagttcaagg 2580 tgctaggcaa caccgaccgt cacagcatca agaagaacct catcggcgcc ctgttgtttg 2640 actctgggga aaccgccgag gctactcgac taaagagaac cgcccgtagg cgatacacta 2700 ggcggaagaa caggatctgt tatctccagg agatcttcag caacgagatg gcgaaggtcg 2760 atgactcatt cttccaccgc cttgaggagt ctttcctggt cgaggaggac aaaaagcacg 2820 agcgacaccc gatcttcggg aacatcgttg atgaggtagc ctaccacgag aagtacccta 2880 ctatctacca cctgcgcaag aaactagtgg actccaccga caaggcggac ctccgcctta 2940 tctatctcgc cctcgcccac atgatcaagt ttcgcgggca cttcctcatc gaaggcgatc 3000 tcaatccgga caacagcgac gtggacaagc tattcatcca gctagttcag acctacaacc 3060 agctctttga agagaaccct attaacgcga gcggggtgga cgccaaagcc atcctttccg 3120 ccaggctctc taagagccgg agactcgaga accttatcgc tcagttgccc ggcgagaaga 3180 aaaacggcct tttcggcaac ctgattgccc tgtccttggg cttgacgccg aacttcaaga 3240 gcaacttcga cctagctgag gatgctaaac tgcagctgtc caaggacact tatgatgacg 3300 accttgacaa cctcctggcc caaattgggg atcagtacgc ggacctcttc ctcgctgcca 3360 agaacctctc cgacgcgatt ctgttgtcgg acatcctccg cgtgaacacc gagattacta 3420 aggccccact gtccgcgagc atgatcaaac gctacgacga gcaccatcag gatctaactc 3480 tgctcaaggc gctcgtccgt cagcaactcc ctgagaagta caaggagatc ttcttcgacc 3540 agtccaagaa cggctacgcc ggttacattg atggtggcgc gagccaggag gagttctaca 3600 agttcatcaa gcccatctta gagaagatgg acggcaccga agagcttctc gtgaagctca 3660 acagggagga cctcctaagg aagcagcgca cctttgacaa cgggtctatt cctcatcaga 3720 tccatctcgg cgagctccac gcgattttga gacgccaaga ggacttctac ccgttcttga 3780 aggacaaccg ggagaagatc gagaagatcc tcacgttcag gatcccttat tacgtcggcc 3840 ccctagctag gggtaactcg agattcgcgt ggatgaccag aaagtccgag gaaaccatta 3900 ccccgtggaa ctttgaagag gtggtcgaca agggcgcgag cgcgcaatcg ttcattgagc 3960 ggatgaccaa cttcgacaag aacctaccga acgagaaggt cctgccgaaa cactccctgc 4020 tctacgagta cttcaccgtt tataacgagc tgacgaaggt caagtacgtg actgagggca 4080 tgcgtaaacc agcgttcctc agcggtgagc agaagaaggc tatcgtggac ctgctcttta 4140 agacgaaccg caaggtgacc gtgaagcagc tcaaggagga ttatttcaag aagatcgagt 4200 gcttcgactc agtggagatt agcggcgtgg aggaccgttt caatgcgagc ttaggtacct 4260 accacgacct cctgaagatc atcaaggaca aggacttcct cgacaacgag gaaaacgagg 4320 acatcctgga ggacatcgtg ctcaccctga ccctctttga agacagggag atgatcgagg 4380 aaaggttgaa gacctacgcg cacctattcg acgacaaggt catgaaacag ctcaagcgga 4440 ggagatacac tggctggggc agactttcgc ggaagctcat caatgggatc agggacaagc 4500 agtccggcaa gaccatcctg gacttcttga agagcgacgg cttcgctaat cgcaacttca 4560 tgcagctcat tcatgacgac tccctaacat tcaaggagga catccaaaag gcgcaagtct 4620 cgggtcaggg ggattctttg cacgagcaca tcgcaaacct cgccggttct ccggccatta 4680 aaaagggcat ccttcagacg gtcaaggtgg tcgacgagct cgtgaaggtt atgggccggc 4740 ataagcccga gaacatagtg atcgagatgg ctagggagaa ccagaccacg caaaagggcc 4800 agaagaactc acgtgagcgc atgaagagga tcgaggaagg tatcaaggag ctgggctctc 4860 agattctcaa ggagcatccg gtcgagaaca cccagcttca gaacgagaag ctgtacctct 4920 actacctcca gaatggccgc gacatgtacg ttgatcagga gttagatatt aatcggctga 4980 gcgactacga cgttgaccac atcgtgcccc agtcgttcct caaggatgac tccatcgaca 5040 acaaggtcct gaccagatcg gacaagaacc gtggtaagag cgacaatgtg ccctccgagg 5100 aggtggtcaa aaagatgaag aactattggc ggcagttgct gaacgccaag ctcatcaccc 5160 agcgaaagtt cgataattta acgaaggccg aacgaggggg cctttccgaa ctcgataagg 5220 ccggtttcat caagcgtcag ctggttgaga cgcgacagat cacgaagcat gtggcccaga 5280 ttctggacag ccggatgaac acgaagtacg acgagaacga caaacttatt cgggaggtga 5340 aggtgataac cctcaagtcc aagttagtgt cggacttccg caaggacttt cagttctata 5400 aagtgcgcga gatcaacaat taccaccacg cccacgacgc ctacttgaat gccgtggtcg 5460 gcacggcgct catcaaaaag taccccaagc tggagagcga gttcgtctac ggcgactaca 5520 aggtttatga cgtcaggaag atgattgcga agtcagagca agagatcggg aaggccaccg 5580 ccaagtactt cttctactcg aacatcatga acttctttaa gaccgagatc accctcgcca 5640 atggggagat ccggaaacgt ccccttatcg agacgaacgg cgagactggc gagatagtct 5700 gggacaaagg tcgcgatttc gccaccgttc gaaaggtgct ctcaatgcct caggtcaata 5760 tcgtgaagaa gaccgaggtt cagacggggg gcttcagcaa ggagtccatc ctccctaagc 5820 gcaactctga caagctgatc gcccggaaaa aggattggga cccgaaaaag tacggcggct 5880 tcgattctcc caccgtagct tatagcgtgc tcgtggttgc caaggtggag aagggcaaga 5940 gcaagaaact gaagtcggtc aaggagttac tcggcatcac aatcatggag cgcagctcgt 6000 ttgaaaagaa cccgatcgac ttcctggagg ccaagggcta taaggaggtg aagaaggacc 6060 tcatcattaa gctgccgaag tacagcttgt tcgagctcga gaatggcagg aagaggatgc 6120 tagcttcggc cggcgaactt caaaaaggga acgagctcgc gttgccgtcg aagtacgtga 6180 acttcctcta cttagctagt cactatgaaa agctgaaggg ctcgccggag gacaacgagc 6240 agaagcagct cttcgtcgag caacacaagc actacctcga cgagatcatc gagcagataa 6300 gtgagttcag caagcgcgtg atcctcgctg atgccaacct cgataaggtg ctcagcgcct 6360 acaataagca ccgagacaag ccgattcggg agcaggcgga gaacatcatt catttattta 6420 cgctcactaa cctaggcgct ccggctgcct tcaagtactt cgacaccacg atcgacagga 6480 agcgctacac cagcaccaaa gaagtcctcg acgcgacgct cattcaccag agcatcacag 6540 ggctctacga gactcggatc gacttgtcgc aattgggtgg ggataagagg ccggccgcga 6600 ctaaaaaggc cggccaagcc aagaaaaaga aatgattgct agcacgcgtc gaagcagatc 6660 gttcaaacat ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga 6720 ttatcatata atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga 6780 cgttatttat gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga 6840 tagaaaacaa aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt 6900 tactagatcc ctgcaggccc gggttaatta aatttaaatg gcgcgccagc ttggcgtaat 6960 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 7020 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 7080 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 7140 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 7200 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7260 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7320 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7380 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7440 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7500 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 7560 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 7620 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 7680 ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 7740 gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 7800 ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 7860 ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 7920 agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 7980 ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 8040 aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 8100 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 8160 cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 8220 tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 8280 cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 8340 ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 8400 gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 8460 gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 8520 gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 8580 gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 8640 tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 8700 aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 8760 cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 8820 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 8880 cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 8940 ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 9000 aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9060 tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 9120 tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct 9180 ttcgtc 9186 <210> 49 <211> 1401 <212> PRT <213> Artificial sequence <220> <223> Modified Cas9 from plasmid KVA790 <400> 49 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser 20 25 30 Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys 35 40 45 Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu 50 55 60 Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg 65 70 75 80 Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile 85 90 95 Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp 100 105 110 Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys 115 120 125 Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala 130 135 140 Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val 145 150 155 160 Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala 165 170 175 His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn 180 185 190 Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr 195 200 205 Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp 210 215 220 Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu 225 230 235 240 Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly 245 250 255 Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn 260 265 270 Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr 275 280 285 Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala 290 295 300 Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser 305 310 315 320 Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala 325 330 335 Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu 340 345 350 Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe 355 360 365 Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala 370 375 380 Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met 385 390 395 400 Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu 405 410 415 Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His 420 425 430 Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro 435 440 445 Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg 450 455 460 Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala 465 470 475 480 Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu 485 490 495 Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met 500 505 510 Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His 515 520 525 Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val 530 535 540 Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu 545 550 555 560 Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val 565 570 575 Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe 580 585 590 Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu 595 600 605 Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu 610 615 620 Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu 625 630 635 640 Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr 645 650 655 Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg 660 665 670 Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg 675 680 685 Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 690 695 700 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr 705 710 715 720 Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 725 730 735 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys 740 745 750 Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met 755 760 765 Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn 770 775 780 Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg 785 790 795 800 Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His 805 810 815 Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 820 825 830 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn 835 840 845 Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu 850 855 860 Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn 865 870 875 880 Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met 885 890 895 Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg 900 905 910 Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu 915 920 925 Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 930 935 940 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr 945 950 955 960 Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 965 970 975 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val 980 985 990 Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 995 1000 1005 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1025 1030 1035 1040 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1045 1050 1055 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1060 1065 1070 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu 1075 1080 1085 Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu 1090 1095 1100 Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly 1105 1110 1115 1120 Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu 1125 1130 1135 Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp 1140 1145 1150 Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys 1155 1160 1165 Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1170 1175 1180 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1185 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1205 1210 1215 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1235 1240 1245 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1265 1270 1275 1280 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1285 1290 1295 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1300 1305 1310 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His 1315 1320 1325 Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe 1330 1335 1340 Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu 1345 1350 1355 1360 Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg 1365 1370 1375 Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys 1380 1385 1390 Lys Ala Gly Gln Ala Lys Lys Lys Lys 1395 1400 <210> 50 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS1 <400> 50 ctaggtgtgg agaacataca tgg 23 <210> 51 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS2 <400> 51 gaaggaggat gggctaggtg tgg 23 <210> 52 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS3 <400> 52 ataggcccta gaataggcac tgg 23 <210> 53 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS4 <400> 53 ctcctcatag gccctagaat agg 23 <210> 54 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS5 <400> 54 ctattgccag tgcctattct agg 23 <210> 55 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS6 <400> 55 ttcctcgtgc tgggcaagtc tgg 23 <210> 56 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS7 <400> 56 gaacaaccag catctgggaa tgg 23 <210> 57 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS8 <400> 57 atctgggaat ggtggtgcag tgg 23 <210> 58 <211> 23 <212> DNA <213> Triticum aestivum <220> <223> Target site TS9 <400> 58 ccattgacag cagccgtgac tgc 23 <210> 59 <211> 24 <212> DNA <213> Triticum aestivum <220> <223> Target site TS10 <400> 59 gaggaagtgc aactcttctt gggg 24 <210> 60 <211> 3645 <212> DNA <213> Artificial sequence <220> <223> Plasmid KVA761 comprising donor DNA <400> 60 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgcgat cgcttctccc aaaattatgc 420 aattttgagg ctcctctaca tcattataat tccccaatac attgctcttt attcttaaca 480 gctttgatcg cgaaatttaa cattttaatt cttgagctgt tattttgtag catcagttta 540 tcatgagcca tgtttggtac taaatataca atcccttggg tttatttgtt tccaagcatg 600 tcattaactt atcttaatgt ggacaagaaa ctgatgcctg cttacattgc tattatttca 660 agcgggtatt gatcctttga catgtgattg atcatttttt tttctctggt tattagggca 720 caacagtggt ggacaacttg ctgaacagtg aggatgttca ctacatgctt gaggccctga 780 aagccctcgg gctctctgtg gaagcagata aagttgcaaa aagagctgta gtcgttggct 840 gtggtggcaa gtttcctgtt gagaaggatg cgaaagagga agtgcaactc ttcttgggga 900 acgctggaat tgcaatgcga tcgttgacag cagccgtgac tgctgctggt ggaaatgcaa 960 cgtatgtttt tttttaatgt ttatgaaaat aagtatggaa ttcatggggt atgttttatg 1020 acctttttct ttaccatcag ttatgtgctt gatggagtgc cacgaatgag ggagagaccg 1080 attggtgact tggttgtcgg gttgaaacaa cttggtgcgg atgtcgactg tttccttggc 1140 actgaatgcc cacctgttcg tgtcaaggga attggaggac ttcctggtgg caaggttagt 1200 tactcctaaa ctgcatcctt tgtacttctg tatgcacctc aattctttgt caaccttctg 1260 catttataag gaacattcta tgatgaaatt cgaccttaca ctgcacagta acttgaaatg 1320 tttcatgctt aatcaatatg ccatattcct gccaagctca agcgagcaat atttgtttga 1380 atttggtacc atatttttgt atacctgcag gggcgtaatc atggtcatag ctgtttcctg 1440 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 1500 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 1560 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 1620 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 1680 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 1740 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 1800 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 1860 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 1920 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1980 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 2040 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 2100 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 2160 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 2220 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 2280 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 2340 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 2400 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 2460 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 2520 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 2580 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 2640 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 2700 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 2760 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 2820 tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 2880 gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 2940 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 3000 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 3060 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 3120 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 3180 gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 3240 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 3300 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 3360 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 3420 cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 3480 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 3540 gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 3600 tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 3645

Claims

하기 단계를 포함하는, 식물 세포의 게놈의 적어도 하나의 표적 영역에 적어도 하나의 공여자 DNA 분자를 도입하는 방법이며:
a. 상기 식물 세포에 하기를 도입하는 단계:
i. 공여자 DNA 분자 및
ii. 적어도 하나의 RNA 가이딩된 닉카제 및
iii. 적어도 2개의 sgRNA 또는 적어도 2개의 crRNA 및 tracrRNA 및
b. 게놈의 상기 적어도 하나의 표적 영역에 상기 적어도 하나의 공여자 DNA를 도입할 수 있도록 식물 세포를 인큐베이션하는 단계, 및
c. 상기 표적 영역에서 공여자 DNA 분자의 서열을 포함하는 식물 세포를 선택하는 단계,
여기서 닉카제는 식물 세포의 게놈 DNA의 표적 부위에서 반대쪽 가닥 상에 적어도 2개의 닉을 생성하고,
여기서 이들 닉은 서로 적어도 20개 떨어져 있는 것인 방법.
하기 단계를 포함하는, 공여자 DNA를 포함하는 식물을 생성하는 방법이며:
a. 상기 식물의 세포에 하기를 도입하는 단계:
i. 공여자 DNA 분자 및
ii. 적어도 하나의 RNA 가이딩된 닉카제 및
iii. 적어도 2개의 sgRNA 또는 적어도 2개의 crRNA 및 tracrRNA 및
b. 상기 식물 세포의 게놈의 표적 영역에 상기 적어도 하나의 공여자 DNA를 도입할 수 있도록 식물 세포를 인큐베이션하는 단계, 및
c. 상기 표적 영역에서 공여자 DNA 분자의 서열을 포함하는 식물 세포를 선택하는 단계, 및
d. 상기 선택된 식물 세포로부터 식물을 재생시키는 단계,
여기서 닉카제는 식물 세포의 게놈 DNA의 표적 부위에서 반대쪽 가닥 상에 적어도 2개의 닉을 생성하고,
여기서 이들 닉은 서로 적어도 20개 염기 떨어져 있는 것인 방법.
제1항 또는 제2항에 있어서, 단계 b. 후에 식물 세포를 선택 작용제를 포함하는 배지 상에서 인큐베이션하는 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, RNA 가이딩된 닉카제가 Cas 닉카제인 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, Cas 닉카제가 Cas9 또는 Cas12a 닉카제인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 닉카제 또는 sgRNA 또는 crRNA 및 tracrRNA 중 적어도 하나가 핵산 분자에 의해 코딩되어 상기 세포에 도입되는 것인 방법.
제6항에 있어서, 핵산 분자가 상기 닉카제 또는 sgRNA 또는 crRNA 및 tracrRNA를 코딩하는 발현 카세트를 포함하는 플라스미드인 방법.
제6항에 있어서, 핵산이 RNA 분자인 방법.
제6항 내지 제8항 중 어느 한 항에 있어서, 적어도 하나의 닉카제가 각각의 식물 세포에서의 발현을 위해 최적화된 서열인 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, RNA 가이딩된 닉카제 또는 sgRNA 또는 crRNA 및 tracrRNA 중 적어도 하나가 상기 세포의 외부에서 조립된 리보핵단백질 (RNP)로서 상기 세포에 도입되는 것인 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, 공여자 DNA 및 crRNA/tracrRNA 또는 sgRNA의 조합이 미리 선택되는 것인 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 공여자 DNA 및 RNA 가이딩된 닉카제 및 단일 가이드 RNA 또는 tracrRNA 및 crRNA가 DNA의 입자 충격 또는 아그로박테리움 매개된 도입을 이용하여 상기 세포에 도입되는 것인 방법.
제1항 내지 제12항 중 어느 한 항에 있어서, RNA 가이딩된 닉카제가 핵 국재화 신호를 포함하는 것인 방법.