KR20220052905A

KR20220052905A - 개선된 상동성 의존적 수선 게놈 편집

Info

Publication number: KR20220052905A
Application number: KR1020227002110A
Authority: KR
Inventors: 토마스 세르막
Original assignee: 이나리 아그리컬쳐 테크놀로지, 인크.
Priority date: 2019-06-25
Filing date: 2020-06-24
Publication date: 2022-04-28
Also published as: AR123323A1; EP3990633A1; WO2020264016A1; MX2021014861A; US20200407754A1; US11041172B2; BR112021026220A2; CN114630910A; JP2022539338A; US20210277422A1; SG11202112092TA; CA3138663A1; AU2020301236A1; IL289106A

Abstract

게놈 편집 분자를 사용하여 표적 편집 부위의 상동성 지정 수선(HDR)의 빈도를 증가시키기 위한 진핵 세포 및 관련 시약, 시스템, 방법 및 조성물이 제공된다.

Description

개선된 상동성 의존적 수선 게놈 편집

관련 출원에 관한 상호-참조

본 출원은 2019년 6월 25일자 출원된 미국 가출원 제62/866,317호에 대한 우선권을 주장하며, 이의 내용은 모든 목적을 위하여 그의 전체가 본원에 참조로 포함된다.

ASCII 텍스트 파일 상의 서열 목록의 제출

하기의 ASCII 텍스트 파일 상의 제출의 내용은 그의 전체가 본원에 참조로 포함된다: 컴퓨터 판독 가능한 형태(CRF)의 서열 목록(파일명: 165362000640SEQLIST.TXT, 기록된 날짜: 2020년 6월 24일, 크기: 284 KB).

기술분야

본 출원은 유전자 편집을 위한 방법, 키트 및 조성물에 관한 것이다.

상동성-지정 수선(HDR)은 원하는 대체 서열을 함유하는 제공되는 DNA 주형 유래의 서열로 표적 게놈 DNA 부위를 정확하게 대체하기 위해 사용될 수 있는 게놈 편집 방법이다. HDR의 결과가 꽤 바람직할 수 있지만, 그것은 다수의 이유로 잘 작동하지 않는다. 가장 큰 문제 중 하나는 특히 게놈 내의 표적화된 편집 부위를 절단하는 게놈 편집 분자에 의해 종종 촉발되는 대안적인 비-상동성 말단-연결(NHEJ) 수선 메커니즘과 비교하는 경우, 그의 낮은 전체 발생 빌도이다. 대부분의 세포가 HDR을 매개할 수 있는 몇몇의 경로를 가질 수 있지만, 이들 중 일부는 세포 주기 동안 가장 활성이어서, 전형적인 세포 배양 조건에서 HDR의 성공률을 감소시킨다.

원핵 숙주, 예컨대 에스케리키아 콜라이(E. coli)에서, 상동성 유전자 대체는 박테리오파지 λ 엑소뉴클레아제, 박테리오파지 λ 베타 단백질, 상보적 DNA 가닥의 어닐링을 용이하게 하는 단일-가닥 DNA 어닐링 단백질(SSAP) 및 DNA 주형을 포함하는 박테리오파지 λ 레드 상동성 재조합 시스템을 사용하여 시행될 수 있다(문헌[Murphy, 2016]). 박테리오파지 λ 레드 상동성 재조합 시스템을 원핵생물에서의 CRISPR-Cas9 시스템과 조합하여, 박테리아 게놈 내의 표적 서열에서 재조합을 시행한 바 있다(문헌[Jiang et al., 2013]; 문헌[Wang et al., 2016]).

대조군과 비교하여 상동성-지정 수선(HDR)에 의하여 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 증가된 변형 빈도를 제공할 수 있는 방법, 시스템, 진핵 세포(예를 들어, 식물 세포 또는 포유류 세포) 및 조성물(예를 들어, 세포 배양 조성물, 핵산, 벡터, 키트 또는 세포)이 본원에 개시된다. 이러한 증가된 HDR의 빈도를 제공할 수 있는 이러한 방법, 시스템, 진핵 세포(예를 들어, 식물 세포 또는 포유류 세포) 및 조성물(예를 들어, 세포 배양 조성물, 핵산, 벡터, 키트 또는 세포)의 특징은 진핵 세포 게놈 내의 표적 편집 부위를 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자와 조합하여, 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제의 제공을 포함한다. 특정 구현예에서, 공여자 주형 DNA 분자는 엔도뉴클레아제 인식 서열의 카피가 측접된다.

본원에 제공되는 방법은 하기를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형의 증가 방법을 포함한다: 게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공함으로써; 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계.

본원에 제공되는 방법은 또한, 하기를 포함하는 게놈 변형을 갖는 진핵 세포의 제조 방법을 포함한다: 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 진핵 세포에 제공함으로써; 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계; 및 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시키는 단계.

본원에 제공되는 시스템은

(a) 진핵 세포;

(b) 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제; 및

(c) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자(들)를 포함하는, 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 시스템을 포함하며; 진핵 세포는 유효량의 HDR 촉진제 및 게놈 편집 분자(들)와 회합되고/되거나, 이와 접촉하고/하거나, 이를 함유한다.

본원에 제공되는 방법은 또한, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 진핵 세포에 제공하는 단계를 포함하는 진핵 세포의 유전학적 엔지니어링 방법을 포함하며, 세포의 표적 편집 부위는 공여자 주형 DNA 분자에 의해 변형된다.

본원에 제공되는 방법은 또한, (a) 표적 편집 부위 내의 적어도 하나의 엔도뉴클레아제 인식 서열의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 상기 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 제공하는 단계, 및 (b) 적어도 하나의 이중-가닥 DNA 서열을 포함하는 적어도 하나의 공여자 분자를 제공하는 단계로서, (i) 상기 DNA 서열이 표적 편집 부위에 측접한 서열에 대하여 적어도 50개 뉴클레오티드의 길이에 걸쳐 적어도 90%의 상동성을 가지며, (ii) 상기 공여자 서열이 상기 표적 편집 부위에 비하여 적어도 하나의 변형을 포함하는 단계; 및 (c) (i) 적어도 하나의 단일-가닥 DNA 어닐링 단백질(SSAP), 및 (ii) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 적어도 하나의 엑소뉴클레아제, 및 (iii) 적어도 하나의 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 적어도 하나의 상동성 지정 수선(HDR) 촉진제를 제공하는 단계를 포함함으로써, 적어도 하나의 서열-특이적 엔도뉴클레아제, 적어도 하나의 공여자 분자 및 적어도 하나의 HDR 촉진제가 상기 진핵 세포의 상기 표적 편집 부위 내로 상기 변형을 도입하며; (d) 상기 표적 편집 부분 내에 변형을 포함하는 진핵 세포를 단리하는 단계를 포함하는 유전학적으로 변형된 표적 편집 부위를 갖는 진핵 세포의 생성 방법을 포함한다.

본원에 제공되는 조성물은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물을 포함한다.

본원에 제공되는 벡터는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 벡터를 포함한다.

본원에 제공되는 키트는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 진핵 세포를 유전학적으로 엔지니어링하기 위한 사용 설명서를 포함하는 키트를 포함한다.

본원에 제공되는 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 세포를 포함한다.

본원에 제공되는 세포는 또한, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)의 하위세트를 포함하는, 표적 편집 부위에서의 유전학적 엔지니어링을 위한 전구 진핵 세포 또는 유기체를 포함하며, 세포는 i) 내지 v) 중 적어도 하나를 포함하지 않고, 전구 세포 또는 유기체에 포함되지 않은 i) 내지 v) 중 적어도 하나를 세포 또는 유기체에 제공하는 것은 공여자 주형 분자에 의한 표적 편집 부위의 변형을 초래한다.

도 1은 벡터 pRS08t의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 발현 카세트(아라비돕시스 탈리아나(A. thaliana) U6 프로모터(AtU6), 가이드 RNA를 인코딩하는 서열, 및 35S 프로모터), mGFP6 서열, 완두 rbcS E9 종결인자, ANT1 공여자 주형, 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 2는 벡터 pRS045의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 앰피실린 저항성 마커(AmpR), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 핵 국소화 서열(NLS), 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타(Red Beta) CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소(Red Exo) CDS)에 융합된 c2 NLS, 및 35S 종결인자), 및 pUC 복제 원점(pUC ori)을 포함한다.
도 3은 벡터 pAP046의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(hammerhead; HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 35S 종결인자), ANT1 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 4는 벡터 pRS148의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자) 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 5는 벡터 pRS192의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS, 및 35S 종결인자), ANT1 공여자 주형 및 앰피실린 저항성 마커(AmpR)를 포함한다.
도 6은 벡터 pTC801의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(옥수수 유비퀴틴(ubiquitin)(ZmUbi) 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA 1 및 2를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(오리자 사티바(Oryza sativa) 액틴(OsActin) 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 파니쿰 비르가툼(Panicum virgatum) 유비퀴틴(PvUbi1) 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, 완두 rbcS E9 종결인자, 오리자 사티바 유비퀴틴(OsUB1) 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 담배 익스텐신(extensin)(NtEXT) 종결인자), SPX 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 7은 벡터 pAB156의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 카나마이신 저항성 마커(KanR), 좌측 T-DNA 경계(border), 하이그로마이신 저항성 카세트(2x 35S 프로모터, 하이그로마이신 포스포트랜스퍼라제(hygR) 코딩 서열 및 35S 종결인자), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 가이드 RNA를 인코딩하는 서열, 해머헤드(HH) 리보자임을 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi4 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, AtUbi10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, 완두 rbcS E9 종결인자, HaUbiCh4 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 Ext3' 종결인자), GFP 공여자 주형, 우측 T-DNA 경계 및 pVS1 유래의 STA 영역을 포함한다.
도 8은 슈퍼바이너리(superbinary) T-DNA 벡터 pIN1757(하측) 및 pIN1576(상측)의 설계된 삽입 영역의 개략도를 보여준다. pIN1757은 좌측 T-DNA 경계, NOS 종결인자, 글루포시네이트 선택을 위한 PAT, 35S 프로모터, Cas 발현 카세트(옥수수 유비퀴틴(ZmUbi) 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 발현 카세트(밀 U6(TaU6) 프로모터, 가이드 RNA(Gln1-3 Pro-2)를 인코딩하는 서열 및 Pol III 종결인자), Gln1-3 공여자 주형 및 우측 T-DNA 경계를 포함한다. 또한, 벡터 pIN1756는 HDR 촉진제 발현 카세트(오리자 사티바 액틴(OsActin 프로모터 + 인트론) 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(SSB), 완두 3A 종결인자; 파니쿰 비르가툼 유비퀴틴(PvUbi1 프로모터 + 인트론) 프로모터, SSAP 코딩 서열(베타), 완두 rbcS E9 종결인자; 오리자 사티바 유비퀴틴(OsUB1) 프로모터, 엑소뉴클레아제 코딩 서열(엑소) 및 담배 익스텐신(NtEXT) 종결인자)를 포함한다.
도 9a 및 도 9b는 토마토 떡잎을 형질전환시키기 위한 벡터 및 발현 카세트의 개략도를 보여준다. 도 9a는 벡터 pIN1705의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 카나마이신 저항성 마커(KanR), 좌측 T-DNA 경계, 5-에놀피루빌시키메이트-3-포스페이트(EPSPS) 신타제 발현 카세트(즉, 아라비돕시스 탈리아나 유비퀴틴 프로모터(AtUbi10) 및 완두 rbcS E9 종결인자의 제어 하의 EPSPS 코딩 서열(CDS)), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열, 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 35S 종결인자), ANT1 공여자 주형, 우측 T-DNA 경계, pVS1 유래의 STA 영역, pVS1 복제 원점(ori) 및 복제 원점(ori)을 포함한다. 도 9b는 토마토 떡잎의 게놈 내로의 염색체 통합을 위한 아그로박테리움(Agrobacterium) T-DNA 벡터의 좌측과 우측 경계 사이의 영역의 개략도를 보여준다. 상측에서 하측으로, pIN1703, pIN1704 및 pIN1705 벡터의 영역이 나타나 있다. CS는 절단 부위를 나타내며, EPSPS는 EPSPS 발현 카세트를 나타내며, CasS는 Cas 발현 카세트를 나타내며, ANT1 공여자는 공여자 주형을 나타내며, HDR 작용제는 SSAP, SSB 및 엑소뉴클레아제를 인코딩하는 HDR 촉진제 발현 카세트를 나타내며, GFP는 녹색 형광 단백질 코딩 서열을 나타낸다.
도 10은 인간에서의 발현을 위한 벡터의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(CAG 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 토끼 베타-글로빈(rb 글로빈) 종결인자), 가이드 RNA 발현 카세트(호모 사피엔스(H. sapiens) U6(HsU6) 프로모터, 가이드 RNA를 인코딩하는 서열), HDR 촉진제 발현 카세트(호모 사피엔스 EF1a 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 연결된 SV40 NLS, 인간 성장 호르몬(hGH) 종결인자, 호모 사피엔스 ACTB(hACTB) 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 연결된 SV40 NLS, 소 성장 호르몬(bGH) 종결인자, CMV 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 연결된 SV40 NLS 및 SV40 폴리A 신호), EMX1 FRT 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.

I. 정의

달리 언급되지 않는 한, 본 명세서의 본문에서 핵산 서열은 좌측에서 우측으로 읽는 경우 5'에서 3' 방향으로 제공된다. 핵산 서열은 명시된 바와 같이 DNA로서 또는 RNA로서 제공될 수 있으며; 당업자에게 알려져 있는 바와 같이, 하나의 개시는 다른 하나를 반드시 정의할 뿐만 아니라 정확한 상보물을 반드시 정의한다. 용어가 단수로 제공되는 경우, 본 발명자들은 또한 복수의 상기 용어에 의해 설명되는 구현예를 고려한다.

본원에 사용되는 바와 같은 어구 "대립유전자 변이체"는 제공된 유기체의 상이한 스트레인(strain), 변종 또는 단리주에서 발생하는 폴리뉴클레오티드 또는 폴리펩티드 서열 변이체를 나타낸다.

본원에 사용되는 경우 용어 "및/또는"은 다른 하나와 함께 또는 이것 없이 2개의 지정된 특징 또는 성분의 각각의 구체적인 개시로 간주되어야 한다. 따라서, 본원에서 "A 및/또는 B"와 같은 어구에서 사용되는 용어 "및/또는"은 "A 및 B", "A 또는 B", "A"(단독) 및 "B"(단독)를 포함하는 것으로 의도된다. 마찬가지로, "A, B 및/또는 C"와 같은 어구에서 사용되는 용어 "및/또는"은 하기의 구현예의 각각을 포함하는 것으로 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A(단독); B(단독); 및 C(단독).

본원에 사용되는 바와 같이, 용어 "Cpf1" 및 "Cas12a"는 동일한 RNA 지정 뉴클레아제를 나타내기 위해 본원에서 상호교환 가능하게 사용된다.

본원에 사용되는 바와 같이, 어구 "게놈-편집 분자"는 엔도뉴클레아제 인식 부위에서 적어도 하나의 DNA 서열을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제(들) 또는 서열-특이적 엔도뉴클레아제(들)를 인코딩하는 폴리뉴클레오티드(들)를 나타낸다.

본원에 사용되는 바와 같이, "외인성" 작용제 또는 분자는 시스템, 조성물, 진핵 또는 식물 세포 배양물, 반응 시스템 또는 진핵 또는 식물 세포에 제공되거나, 그 내로 도입되는 외부 공급원 유래의 임의의 작용제 또는 분자를 나타낸다. 특정 구현예에서, 외부 공급원 유래의 외인성 작용제(예를 들어, 폴리뉴클레오티드, 단백질 또는 화합물)는 또한, 진핵 또는 식물 세포에서 관찰되는 작용제일 수 있다. 특정 구현예에서, 외부 공급원 유래의 외인성 작용제(예를 들어, 폴리뉴클레오티드, 단백질 또는 화합물)는 진핵 또는 식물 세포에 대하여 이종인 작용제일 수 있다.

본원에 사용되는 바와 같이, "이종" 작용제 또는 분자는 (i) 야생형, 비처리 또는 자연 발생 조성물, 진핵 세포 또는 식물 세포에서 관찰되지 않는 임의의 작용제 또는 분자; 및/또는 (ii) 서열이 자연에서 발생하는 것 이외의 상황에서, 예를 들어, 게놈 또는 벡터에 위치하는 폴리뉴클레오티드 또는 펩티드 서열을 나타낸다. 예를 들어, 프로모터가 자연에서 작동 가능하게 연결된 유전자 이외의 유전자에 작동 가능하게 연결된 프로모터는 이종 프로모터이다.

본원에 사용되는 바와 같이, 용어 "포함하다", "포함한다" 및 "포함하는"은 임의의 추가의 비특정된 특징을 배제하지 않으면서 적어도 그들이 언급하는 특징을 갖는 것으로 해석되어야 한다.

본원에 사용되는 바와 같은 용어 "상동성 재조합"은 상동성 부위에서 2개의 DNA 분자 사이의 DNA 단편의 교환을 나타낸다. 상동성 재조합의 빈도는 다수의 요인에 의해 영향을 받는다. 상이한 유기체는 상동성 재조합의 양 및 상동성 대 비-상동성 재조합의 상대적인 비에 관하여 다양하다. 일반적으로, 상동성 영역의 길이는 상동성 재조합 이벤트의 빈도에 영향을 미친다: 상동성의 영역이 더 길수록 빈도가 더 크다. 상동성 재조합을 관찰하는 데 필요한 상동성 영역의 길이도 또한, 종-가변적이다. 많은 경우에, 적어도 5 kb의 상동성이 사용되어 왔지만, 상동성 재조합은 25 bp 내지 50 bp만큼 적은 상동성에서 관찰된 바 있다.

본원에 사용되는 바와 같이, 상동성-지정 수선(HDR)은 제공된 공여자 서열을 혼입시킴으로써 표적 편집 부위의 정확한 편집을 초래하는 DNA 수선 방법을 의미한다.

본원에 사용되는 바와 같이, "HDR의 빈도", "HDR 빈도" 등과 같은 어구는 분석되는 총 표적-편집 부위 수와 비교하여 표적 편집 부위에서의 HDR-매개된 이벤트의 수를 지칭한다. 총 표적 편집 부위 수는 (a) NHEJ-매개된 이벤트를 갖는 표적 편집 부위; (b) 변화를 갖지 않는 표적 편집 부위; 및 (c) HDR-매개된 이벤트를 갖는 표적 편집 부위의 합이다. HDR-매개된 이벤트는 삽입된 이종 서열, 이종 삽입물에 측접한 상동성 서열 또는 이종 서열과 상동성 서열의 접합부에 위치한 서열에, 임의의 의도되지 않은 뉴클레오티드 삽입, 결실 또는 치환을 함유하지 않는 표적 편집 부위 내로의 이종 서열의 정확한 삽입을 포함한다.

본원에 사용되는 바와 같이, 어구 "진핵 세포"는 핵을 함유하는 임의의 세포를 지칭하며, 이에 따라, 포유류(예를 들어, 인간, 가축 및 반려 동물 세포), 곤충 세포, 파충류 세포, 식물 세포(예를 들어, 외떡잎 및 쌍떡잎 식물 세포), 효모 세포 및 진균 세포(예를 들어, 사상 및 비-사상 진균)를 포함한다.

"변형된 뉴클레오티드" 또는 "편집된 뉴클레오티드"는 그의 비-변형된 뉴클레오티드 서열과 비교하는 경우 적어도 하나의 변경을 포함하는 관심 뉴클레오티드 서열을 나타낸다. 이러한 "변경"은 예를 들어, (i) 적어도 하나의 뉴클레오티드의 대체, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.

본원에 사용되는 바와 같이, 어구 "식물 세포"는 식물 세포벽을 갖는 식물 세포 또는 식물 세포벽이 결여된 식물 세포 원형질체를 지칭할 수 있다.

본원에 사용되는 경우, 용어 "폴리뉴클레오티드"는 둘(2) 이상의 뉴클레오티드 잔기를 함유하는 핵산 분자이다. 폴리뉴클레오티드는 일반적으로 단일- 또는 이중-가닥으로서 기술된다. 폴리뉴클레오티드가 분자내 또는 분자간 혼성화에 의해 형성되는 이중-가닥 영역을 함유하는 경우, 각각의 이중-가닥 영역의 길이는 편리하게 염기쌍의 수에 관하여 기술된다. 본원에 제공되는 시스템, 방법 및 조성물의 구현예는 (i) 2 내지 25개 잔기 길이의 하나 이상의 폴리뉴클레오티드, 26개 초과의 잔기 길이의 하나 이상의 폴리뉴클레오티드 또는 둘 모두의 혼합물을 사용하거나 이를 포함할 수 있다. 폴리뉴클레오티드는 단일- 또는 이중-가닥 RNA, 단일- 또는 이중-가닥 DNA, 이중-가닥 DNA/RNA 혼성물, 그의 화학적으로 변형된 유사체 또는 그의 혼합물을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 리보뉴클레오티드 및 데옥시리보뉴클레오티드의 조합(예를 들어, 주로 리보뉴클레오티드로 이루어지지만 하나 이상의 말단 데옥시리보뉴클레오티드를 갖는 합성 폴리뉴클레오티드 또는 주로 데옥시리보뉴클레오티드로 이루어지지만, 하나 이상의 말단 디데옥시리보뉴클레오티드를 갖는 합성 폴리뉴클레오티드)을 포함할 수 있거나, 비-정규 뉴클레오티드, 예컨대 이노신, 티오우리딘 또는 슈도우리딘을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 화학적으로 변형된 뉴클레오티드를 포함한다(예를 들어, 문헌[Verma and Eckstein (1998) Annu. Rev. Biochem., 67:99-134] 참조). 본원에 제공되는 폴리뉴클레오티드에 사용될 수 있는 화학적으로 변형된 뉴클레오티드는 (i) 포스포디에스테르 백본의 포스포로티오에이트, 포스포로디티오에이트 또는 메틸포스포네이트 뉴클레오티드간 연결기 변형; (ii) 변형된 염기 및/또는 변형된 당을 포함하는 뉴클레오시드; 및/또는 (iii) 형광 모이어티(예를 들어, 플루오레세인 또는 로다민 또는 형광 공명 에너지 전달 또는 발색단 표지의 FRET 쌍) 또는 기타 표지(예를 들어, 비오틴 또는 동위원소)를 포함하는 검출 가능한 표지를 포함한다. 본원에 제공되거나 사용되는 폴리뉴클레오티드는 또한, 변형된 핵산, 특히 변형된 RNA를 포함하며, 이는 본원에 그의 전체가 참조로 포함되는 미국 특허 제9,464,124호에 개시되어 있다.

"재조합 AAV 벡터(rAAV 벡터)"는 적어도 하나의, 일부 구현예에서, 2개의 AAV 역위 말단 반복 서열(ITR)이 측접한 하나 이상의 이종 서열(즉, AAV 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 이러한 rAAV 벡터는 적합한 헬퍼 바이러스로 감염된(또는 적합한 헬퍼 기능을 발현하는) 및 AAV rep 및 cap 유전자 생성물(즉, AAV Rep 및 Cap 단백질)을 발현하는 숙주 세포에 존재하는 경우에 복제되고 감염성 바이러스 입자 내로 패키징될 수 있다. rAAV 벡터가 더 큰 폴리뉴클레오티드 내로(예를 들어, 염색체 내에 또는 또 다른 벡터, 예컨대 클로닝 또는 트랜스펙션을 위해 사용되는 플라스미드 내에) 혼입되는 경우, rAAV 벡터는 "프로-벡터"로 지칭될 수 있으며, 이는 AAV 패키징 기능 및 적합한 헬퍼 기능의 존재 하에 복제 및 캡슐화에 의해 "구제"될 수 있다. rAAV 벡터는 플라스미드, 선형 인공 염색체, 지질과 복합체화된 것, 리포좀 내에 캡슐화된 것, 및 바이러스 입자, 특히 AAV 입자에 캡슐화된 것을 포함하지만 이에 제한되지 않는 임의의 다수의 형태로 존재할 수 있다. rAAV 벡터를 AAV 바이러스 캡시드 내로 패키징하여, "재조합 아데노-연관 바이러스 입자(rAAV 입자)"를 생성할 수 있다.

"재조합 아데노바이러스 벡터"는 적어도 하나의 아데노바이러스 역위 말단 반복 서열(ITR)이 측접한 하나 이상의 이종 서열(즉, 아데노바이러스 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 일부 구현예에서, 재조합 핵산은 2개의 역위 말단 반복 서열(ITR)이 측접된다. 이러한 재조합 바이러스 벡터는 재조합 바이러스 게놈으로부터 결실된 필수 아데노바이러스 유전자(예를 들어, El 유전자, E2 유전자, E4 유전자 등)를 발현하는 숙주 세포에 존재하는 경우, 복제되고, 감염성 바이러스 입자 내로 패키징될 수 있다. 재조합 바이러스 벡터가 더 큰 폴리뉴클레오티드 내로(예를 들어, 염색체 내에 또는 또 다른 벡터, 예컨대 클로닝 또는 트랜스펙션을 위해 사용되는 플라스미드 내에) 혼입되는 경우, 재조합 바이러스 벡터는 "프로-벡터"로 지칭될 수 있으며, 이는 아데노바이러스 패키징 기능의 존재 하에 복제 및 캡슐화에 의해 "구제"될 수 있다. 재조합 바이러스 벡터는 플라스미드, 선형 인공 염색체, 지질과 복합체화된 것, 리포좀 내에 캡슐화된 것, 및 바이러스 입자, 예를 들어, 아데노바이러스 입자에 캡슐화된 것을 포함하지만 이에 제한되지 않는 임의의 다수의 형태로 존재할 수 있다. 재조합 바이러스 벡터를 아데노바이러스 바이러스 캡시드 내로 패키징하여, "재조합 아데노바이러스 입자"를 생성할 수 있다.

"재조합 렌티바이러스 벡터"는 적어도 하나의 렌티바이러스 말단 반복 서열(LTR)이 측접한 하나 이상의 이종 서열(즉, 렌티바이러스 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 일부 구현예에서, 재조합 핵산은 2개의 렌티바이러스 말단 반복 서열(LTR)이 측접된다. 이러한 재조합 바이러스 벡터는 적합한 헬퍼 기능으로 감염된 숙주 세포에 존재하는 경우 복제되고 감염성 바이러스 입자 내로 패키징될 수 있다. 재조합 렌티바이러스 벡터를 렌티바이러스 캡시드 내로 패키징하여, "재조합 렌티바이러스 입자"를 생성할 수 있다.

"재조합 단순 헤르페스 벡터(재조합 HSV 벡터)"는 HSV 말단 반복 서열이 측접된 하나 이상의 이종 서열(즉, HSV 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 이러한 재조합 바이러스 벡터는 적합한 헬퍼 기능으로 감염된 숙주 세포에 존재하는 경우 복제되고 감염성 바이러스 입자 내로 패키징될 수 있다. 재조합 바이러스 벡터가 더 큰 폴리뉴클레오티드 내로(예를 들어, 염색체 내에 또는 또 다른 벡터, 예컨대 클로닝 또는 트랜스펙션을 위해 사용되는 플라스미드 내에) 혼입되는 경우, 재조합 바이러스 벡터는 "프로-벡터"로 지칭될 수 있으며, 이는 HSV 패키징 기능의 존재 하에 복제 및 캡슐화에 의해 "구제"될 수 있다. 재조합 바이러스 벡터는 플라스미드, 선형 인공 염색체, 지질과 복합체화된 것, 리포좀 내에 캡슐화된 것, 및 바이러스 입자, 예를 들어, HSV 입자에 캡슐화된 것을 포함하지만 이에 제한되지 않는 임의의 다수의 형태로 존재할 수 있다. 재조합 바이러스 벡터를 HSV 캡시드 내로 패키징하여, "재조합 단순 헤르페스 바이러스 입자"를 생성할 수 있다.

본원에 사용되는 바와 같이, 어구 "표적 편집 부위"는 공여자 핵산에 의해 변형된 DNA 서열을 지칭한다.

본원에 사용되는 바와 같이, 어구 "표적 유전자"는 본원에 제공되는 시스템, 방법, 조성물 및/또는 진핵 세포에 제공되는 유전자 편집 분자에 의해 변형될 게놈에 위치한 유전자를 지칭할 수 있다. 표적 유전자의 구현예는 (단백질-) 코딩 서열, 비-코딩 서열, 및 코딩 및 비-코딩 서열의 조합을 포함한다. 표적 유전자의 변형은 전사 인핸서 또는 프로모터, 5' 또는 3' 비번역 영역, 성숙 또는 전구 RNA 코딩 서열, 인트론, 스플라이스 공여자 및/또는 수여자, 단백질 코딩 서열, 폴리아데닐화 부위 및/또는 전사 종결인자를 포함하는 유전자의 하나 이상의 요소 내의 뉴클레오티드 치환, 삽입 및/또는 결실을 포함한다. 특정 구현예에서, 이배체 또는 배수체 식물 세포 내의 제공되는 표적 유전자의 모든 카피 또는 모든 대립유전자는 식물 세포에서 변형된 표적 유전자의 동형접합성을 제공하도록 변형된다. 원하는 형질이 유전자 편집에 의해 표적 유전자 내로 도입된 기능 상실 돌연변이에 의해 부여되는 구현예들에서, 식물 세포, 식물 세포의 집단, 식물 또는 종자는 기능 상실 돌연변이를 갖는 변형된 표적 유전자에 대하여 동형접합성이다. 다른 구현예에서, 제공되는 표적 유전자의 카피 또는 대립유전자의 하위세트만이 변형되어, 식물 세포에서 이형접합성의 변형된 표적 유전자를 제공한다. 원하는 형질이 유전자 편집에 의해 표적 유전자 내로 도입된 우성 돌연변이에 의해 부여되는 특정 구현예에서, 식물 세포, 식물 세포의 집단, 식물 또는 종자는 우성 돌연변이를 갖는 변형된 표적 유전자에 대하여 이형접합성이다. 이러한 변형에 의해 특정 식물 표적 유전자에 부여되는 형질은 전부 변형이 결여된 대조군 식물에 비하여, 개선된 수율, 곤충, 진균, 박테리아 병원체 및/또는 선충류에 대한 저항성, 제초제 내성, 무생물 스트레스 내성(예를 들어, 내건성, 내한성, 내염성 및/또는 내열성), 단백질 양 및/또는 질, 전분 양 및/또는 질, 지질 양 및/또는 질, 이차 대사산물 양 및/또는 질 등을 포함한다. 본원에 제공되는 시스템, 방법, 조성물 및/또는 식물 세포에 제공되는 유전자 편집 분자에 의해 변형된 게놈을 갖는 식물은, 게놈 영역의 원치 않는 및 무작위 교환뿐만 아니라, 게놈 내의 무작위 유사분열 또는 감수분열에 의해 생성된 유전학적 및 후성적 변화가 전형적으로 교배 동안 발생하고 이어서 자손 식물에서 발견되는 전통적인 육종(즉, 부모 수그루 및 부모 암그루의 교배)에 의해 변형된 게놈을 갖는 식물과 상이하다. 따라서, 변형된 게놈을 갖는 식물(또는 식물 세포)의 구현예에서, 변형된 게놈은 원래(비변형) 게놈과 99.9% 초과로 동일하다. 구현예들에서, 변형된 게놈은 원래(비변형) 게놈에 비하여 무작위 유사분열 또는 감수분열에 의해 생성된 유전학적 및 후성적 변화가 없다. 구현예들에서, 변형된 게놈은 원래(비변형) 게놈에 비하여 게놈의 0.01% 미만에서 후성적 변화의 차이를 포함한다. 구현예들에서, 변형된 게놈은 하기를 포함한다: (a) 원래(비변형) 게놈에 비하여 0.01% 미만의 게놈에서의 DNA 메틸화의 차이; 또는 (b) 원래(비변형) 게놈에 비하여 0.005% 미만의 게놈에서의 DNA 메틸화의 차이; 또는 (c) 원래(비변형) 게놈에 비하여 0.001% 미만의 게놈에서의 DNA 메틸화의 차이. 구현예에서, 관심 유전자는 식물 세포 내의 염색체 상에 위치하며, 변형된 게놈은 하기를 포함한다: (a) 원래(비변형) 게놈에 비하여 관심 유전자를 함유하는 염색체 내에 함유되는 게놈의 부분의 0.01% 미만에서의 DNA 메틸화의 차이; 또는 (b) 원래(비변형) 게놈에 비하여 관심 유전자를 함유하는 염색체 내에 함유되는 게놈의 부분의 0.005% 미만에서의 DNA 메틸화의 차이; 또는 (c) 원래(비변형) 게놈에 비하여 관심 유전자를 함유하는 염색체 내에 함유되는 게놈의 부분의 0.001% 미만에서의 DNA 메틸화의 차이. 구현예들에서, 변형된 게놈은 원래(비변형) 게놈에 비하여 복제당 염기쌍당 1 x 10^-8개 돌연변이 이하의 의도하지 않은 변화를 갖는다. 특정 구현예에서, 변형된 게놈은 자연 돌연변이율로 발생할 것보다 더 많지 않은 의도하지 않은 변화를 갖는다. 자연 돌연변이율은 실험적으로 결정될 수 있거나, 문헌에 기술된 바와 같다(문헌[Lynch, M., 2010]; 문헌[Clark et al., 2005]).

본원에 사용되는 바와 같은, "벡터"는 시험관내에서 또는 생체내에서 숙주 세포 내로 전달될 핵산을 포함하는 재조합 플라스미드를 지칭한다.

임의의 전술된 정의가 본원에 참조로 포함된 임의의 특허 또는 비특허 참고문헌, 본원에 인용된 임의의 특허 또는 비특허 참고문헌 또는 다른 곳에서 발견되는 임의의 특허 또는 비특허 참고문헌에 제공된 정의와 일치하지 않는 정도까지, 전술된 정의가 본원에서 사용될 것임을 이해한다.

II. 방법 및 조성물

A. 상동성 지정 수선-매개된 게놈 변형을 증가시키기 위한 방법

HDR 촉진제(SSAP, 엑소뉴클레아제 및 SSB) 및 게놈-편집 분자를 포함하며, 대조군 실험에 비하여 진핵 세포 유전자 편집 실험에서 증가된 상동성 의존성 수선(HDR)의 빈도를 제공하는 다양한 시약, 시스템, 방법 및 조성물이 본원에 제공된다. 특정 구현예에서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 이것이 HDR 촉진제(SSAP, 엑소뉴클레아제 및 SSB) 중 적어도 하나에 노출되지 않는 대조군 방법에 비하여 적어도 2배, 3배, 5배 또는 10배 증가된다. 특정 구현예에서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 이것이 HDR 촉진제(SSAP, 엑소뉴클레아제 및 SSB) 중 적어도 하나에 노출되지 않는 대조군 방법에 비하여 적어도 2배, 3배 또는 5배 내지 약 12배, 15배, 20배, 25배 또는 30배 증가된다. 일부 구현예에서, 본 발명의 방법은 유사분열 또는 감수분열을 겪고 있지 않은 세포 상에서 사용될 수 있다. 일부 구현예에서, 본 발명의 방법은 DNA 복제를 필요로 하지 않는다.

i. 핵 국소화 신호(NLS)

본원에 제공되는 SSAP, 엑소뉴클레아제, SSB 및/또는 유전자 편집 분자를 지향시킬 수 있는 핵 국소화 신호(NLS)는 1부분(monopartite) 및 2부분(bipartite) 핵 국소화 신호를 포함한다(문헌[Kosugi et al., 2009]). 사용될 수 있는 1부분 NLS의 예에는 적어도 4개의 연속 염기성 아미노산을 포함하는 NLS, 예컨대 SV40 대형 T 항원 NLS(PKKKRKV; SEQ ID NO:11) 및 K(K/R)X(K/R) 컨센서스 서열(SEQ ID NO:12)과 함께 오직 3개의 염기성 아미노산을 갖는 또 다른 부류가 포함된다. 본원에 제공된 것에 사용될 수 있는 2부분 NLS의 예에는 (K/R)(K/R)X _10-12(K/R)_3/5(SEQ ID NO:13)가 포함되며, (K/R)_3/5는 5개의 연속 아미노산 중 적어도 3개의 라이신 또는 아르기닌을 나타낸다. NLS는 또한 LGKR(K/R)(W/F/Y)(SEQ ID NO:14)의 컨센서스 서열을 갖는 식물-특이적 부류 5 NLS를 포함할 수 있다. 사용될 수 있는 구체적인 NLS의 예에는 옥수수 opaque-2 핵 국소화 신호(SEQ ID NO:10), 벤디 황화 잎맥 모자이크 바이러스(BYVMV) c2 NLS(SEQ ID NO:15), 및 연장된 SV40 대형 T 항원 NLS(SEQ ID NO:16)가 추가로 포함된다.

일부 구현예에서, NLS는 포유류(예컨대 인간 NLS)이다. 일부 구현예에서, NLS는 SV40 NLS이다. 일부 구현예에서, NLS는 아미노산 링커를 갖는 SV40 NLS이다. 일부 구현예에서, NLS는 아미노산 서열 MAPKKKRKVGGSGS(SEQ ID NO:148)를 갖는다.

특정 구현예에서, NLS 요소 또는 기타 원하는 요소(예를 들어, 에피토프 태그)는 요소 및 도메인의 직접적인 공유적 연결을 통해 또는 링커 펩티드 또는 유연성 힌지 폴리펩티드의 이용에 의해 본원에 제공되는 SSAP, 엑소뉴클레아제, SSB 및/또는 유전자 편집 분자에 작동 가능하게 연결될 수 있다. 유연성 힌지 폴리펩티드는 글리신-풍부 또는 글리신/세린 함유 펩티드 서열을 포함한다. 이러한 서열은 (Gly4)n 서열, (Gly4Ser)n 서열, Ser(Gly₄Ser)n 서열, 그의 조합 및 그의 변이체를 포함할 수 있지만, 이에 한정되지 않으며, n은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10과 동일한 양의 정수이다. 특정 구현예에서, 이러한 글리신-풍부 또는 글리신/세린 함유 힌지 펩티드는 또한, 유연성을 위한 트레오닐 및/또는 알라닐 잔기뿐만 아니라 극성 라이실 및/또는 글루타밀 잔기를 함유할 수 있다. 사용될 수 있는 힌지 펩티드의 다른 예에는 면역글로불린 힌지 펩티드가 포함된다(문헌[Vidarsson et al., 2014]).

다양한 세포-투과 펩티드(CPP)가 또한, 본원에 제공되는 SSAP, 엑소뉴클레아제, SSB 및/또는 유전자 편집 분자에 사용될 수 있다. 사용될 수 있는 CPP에는 최소 운데카펩티드(undecapeptide) 단백질 형질도입 도메인(YGRKKRRQRRR을 포함하는 HIV-1 TAT의 잔기 47 내지 57에 해당; SEQ ID NO:17); 세포 내로의 직접적인 유입에 충분한 수의 아르기닌(예를 들어, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 10개 내지 50개의 아르기닌)을 포함하는 폴리아르기닌 서열; VP22 도메인(문헌[Zender et al. (2002) Cancer Gene Ther. 9(6):489-96]); 드로소필라 안테나페디아(Drosophila Antennapedia) 단백질 형질도입 도메인(문헌[Noguchi et al. (2003) Diabetes 52(7): 1732-1737]); 절단된 인간 칼시토닌 펩티드(문헌[Trehin et al. (2004) Pharm. Research 21: 1248-1256]); 폴리라이신(문헌[Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008]); RRQRRTSKLMKR(SEQ ID NO:18); 트랜스포탄(Transportan)(예를 들어, GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:19); KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:20); 및 RQIKIWFQNRRMKWKK(SEQ ID NO:21)가 포함된다. 예시적인 CPP 아미노산 서열에는 또한, YGRKKRRQRRR(SEQ ID NO:22); RKKRRQRR(SEQ ID NO:23); YARAAARQARA(SEQ ID NO:24); THRLPRRRRRR(SEQ ID NO:25); 및 GGRRARRRRRR(SEQ ID NO:26)이 포함된다.

ii. 단일-가닥 DNA 어닐링 단백질(SSAP)

특정 구현예에서, 본원에 제공되는 방법, 시스템, 세포 및 세포 배양 조성물에 사용되는 단일-가닥 DNA 어닐링 단백질(SSAP)은 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 촉진시키거나 촉매하는 단백질을 포함한다. 본원에 사용되는 SSAP의 특징은 RecA 의존적 및 독립적 경로의 자극, 시험관내에서의 올리고머 고리 및/또는 필라멘트 형성, ssDNA 결합 활성 및 상보적 ssDNA 가닥 어닐링의 ATPase-독립적 자극을 포함한다. RecT/Redβ-, ERF- 또는 RAD52-과의 단백질에서 SSAP 단백질의 특징은 문헌[Murphy, 2016] 및 문헌[Iyer et al., 2002]에 개시된 바 있다. 특정 구현예에서, SSAP는 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 RecT/Redβ-과의 단백질의 구성원이다. 특정 RecT/Redβ-과의 단백질의 특징은 전부는 아니지만 대부분의 구성원에서 5개의 β-가닥 및 5개의 α-나선의 코어를 갖는 α + β 도메인, Mg⁺² 의존적 단일 가닥 어닐링 활성 및 2개의 c-말단 산성 잔기의 보존을 포함한다(문헌[Iyer et al., 2002]). 특정 구현예에서, RecT/ Redβ-과 단백질은 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성 및 선택적으로 5개의 β-가닥 및 5개의 α-나선의 코어를 갖는 보존된 α + β 도메인, Mg⁺² 의존적 단일 가닥 어닐링 활성 및/또는 2개의 c-말단 산성 잔기의 보존을 갖는 단백질을 포함한다. 특정 구현예에서, SSAP는 ERF-과 단백질이다. EFR-과의 단백질의 특징은 GuXXoYhp + YXhXXhh(SEQ ID NO:32) 모티프를 포함하는 약 150개 아미노산 잔기의 보존된 영역을 포함하며, G는 글리신, Y-티로신이며, u는 "아주 작은(tiny)" 잔기(글리신, 세린, 알라닌), h-소수성(알라닌, 발린, 류신, 이소류신, 페닐알라닌, 메티오닌)이며, p는 극성 잔기(라이신, 아르기닌, 글루탐산염, 아스파르트산염, 아스파라긴, 트레오닌, 세린)이며, o는 알코올-함유 아미노산 잔기(세린 또는 트레오닌)이며, +는 염기성 잔기이며, X는 임의의 잔기이다(문헌[Iyer et al., 2002]). ERF 과 단백질은 박테리오파지 P22 ERF 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하며, 선택적으로 GuXXoYhp + YXhXXhh(SEQ ID NO:32) 모티프를 추가로 포함할 수 있다. ERF-과의 SSAP는 또한, 월드 와이드 웹 사이트 ncbi.nlm.nih.gov/protein 상의 NCBI 데이터베이스에서 수탁(gi 또는 유전자 식별자) 번호 9634188, 9635694, 16804357, 12719409, 458219, 11497308, 11497280, 1497168, 11527300, 9634634, 9635643, 13491642, 6015511, 11138335, 9627938, 9628668 및 15088753 하에 제시된 단백질을 포함한다. 특정 구현예에서, 본원에 사용되는 SSAP는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe) 및 클루이베로마이세스 락티스(Kluyveromyces lactis) 유래의 RAD52-과 단백질 및 각각 SEQ ID NO:5, 6 및 7의 전체 길이에 걸쳐 적어도 85%, 90%, 95%, 97%, 98% 또는 99% 서열 동일성을 갖는 이의 변이체; 또는 SEQ ID NO: 5, 6 또는 7에 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 변이체를 포함한다. RAD52-과의 단백질의 특징은 DNA 결합 활성을 갖는 보존된 나선-헤어핀-나선(HhH) 모티프를 포함한다(문헌[Iyer et al., 2002]). 본원에 사용되는 SSAP는 내용이 본원에 그들 전체가 참조로 포함되는 WO 2017/184227호로서 공개된 PCT/US2017/016184의 미국 국내 단계인 미국 특허 출원 제16/075,281호의 적어도 표 1, 2, 3, 4, 5 및 6에 제시된 "재조합효소"로 확인된 단백질을 추가로 포함할 수 있다. 특정 구현예에서, SSAP는 상기 언급된 SSAP 중 임의의 것의 대립유전자 변이체를 포함할 수 있다. 특정 구현예에서, 상기 언급된 SSAP 중 임의의 것은 SSAP를 인코딩하는 핵산(예를 들어, 발현 벡터, mRNA 또는 바이러스 발현 벡터)의 방식에 의해 세포에 제공될 수 있다. 특정 구현예에서, 상기 언급된 SSAP 중 임의의 것은 단백질로서, (예를 들어, 세포 투과 펩티드 및/또는 핵 국소화 서열과의) 융합 단백질로서 또는 SSAP와 기타 단백질 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는(예를 들어, SSB 및/또는 엑소뉴클레아제와 조합된) 폴리단백질로서 세포에 제공될 수 있다.

iii. 엑소뉴클레아제

특정 구현예에서, 본원에 제공되는 방법, 시스템, 세포 및 세포 배양 조성물에 사용되는 엑소뉴클레아제는 이중-가닥 DNA(dsDNA) 기질 상에서 5'에서 3' 또는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제를 포함하며, 이는 각각 노출된 3' 말단 또는 노출된 5' 말단을 갖는 적어도 부분적으로 단일 가닥의 DNA(ssDNA)를 포함하는 생성물을 초래할 수 있다. 특정 구현예에서, 엑소뉴클레아제는 5' 포스페이트 기를 갖는 블런트 말단을 포함하여 블런트 말단을 갖는 dsDNA 기질을 인식할 것이다. 특정 구현예에서, 엑소뉴클레아제는 ssDNA의 오버행(예를 들어, dsDNA 기질에 스태거형 절단을 제공하는 엔도뉴클레아제에 의해 생성되는 말단을 포함하는 dsDNA 분자의 말단에서의 5' 또는 3' ssDNA 영역)을 갖는 dsDNA 기질을 인식할 것이다. 특정 구현예에서, 엑소뉴클레아제는 한 가닥에 내부 파단을 갖는 dsDNA 기질(예를 들어, 닉킹된 dsDNA)을 인식할 것이다. 본원에 사용될 수 있는 5'에서 3' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 박테리오파지 람다 엑소 단백질(예를 들어, SEQ ID NO:8), Rac 프로파지 RecE 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO:9), 아르테미스(Artemis) 단백질(예를 들어, SEQ ID NO: 136), 아폴로(Apollo) 단백질(예를 들어, SEQ ID NO: 137), DNA2 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 138), Exo1 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 139), 헤르페스바이러스 SOX 단백질(예를 들어, SEQ ID NO: 140), UL12 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 141), 엔테로박테리아(enterobacterial) 엑소뉴클레아제 VIII 단백질(예를 들어, SEQ ID NO: 142), T7 파지 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO:143) 또는 동등한 5'에서 3' 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142 또는 143에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다. 특정 구현예에서, 본원에 제공되는 5'에서 3' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 SEQ ID NO:8, 9, 136, 137, 138, 139, 140, 141, 142 또는 143에 적어도 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142 또는 143에 제시된 단백질을 포함한다. 본원에 사용될 수 있는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 에스케리키아 콜라이 엑소뉴클레아제 III 단백질(예를 들어, SEQ ID NO: 144), 포유류 Trex2 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 145), 동등한 3'에서 5' 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다. 특정 구현예에서, 본원에 제공되는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 SEQ ID NO: 144 또는 145에 적어도 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 SEQ ID NO: 144 또는 145에 제시된 단백질을 포함한다. 특정 구현예에서, 상기 언급된 엑소뉴클레아제는 DEDD/DnaQ 상과의 엑소뉴클레아제에 특징적인 보존된 DEDD 촉매적 잔기를 포함할 것이다(문헌[Bernad et al., 1989]). 특정 구현예에서, 상기 언급된 엑소뉴클레아제 중 임의의 것은 단백질로서, (예를 들어, 세포 투과 펩티드 및/또는 핵 국소화 서열과의) 융합 단백질로서 또는 엑소뉴클레아제와 기타 단백질 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는(예를 들어, SSB 및/또는 SSAP와 조합된) 폴리단백질로서 세포에 제공될 수 있다. 특정 구현예에서, 엑소뉴클레아제는 상기 언급된 엑소뉴클레아제 중 임의의 것의 대립유전자 변이체를 포함할 수 있다. 특정 구현예에서, 상기 언급된 엑소뉴클레아제 중 임의의 것은 엑소뉴클레아제를 인코딩하는 핵산(예를 들어, 발현 벡터, mRNA 또는 바이러스 발현 벡터)의 방식에 의해 세포에 제공될 수 있다. 일부 구현예에서, 서열-특이적 엔도뉴클레아제는 닉카제이다.

iv. 단일 가닥 DNA 결합 단백질(SSB)

다양한 단일 가닥 DNA 결합 단백질(SSB)이 본원에 제공되는 방법, 시스템, 세포 및 세포 배양 조성물에서 사용될 수 있다. 특정 구현예에서, SSB는 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에(Enterobacteriaceae) 종 SSB를 포함한다. 특정 구현예에서, SSB는 에스케리키아 종, 시겔라(Shigella) 종, 엔테로박터(Enterobacter) 종, 클레브시엘라(Klebsiella) 종, 세라티아(Serratia) 종, 판토에아(Pantoea) 종 또는 예르시니아(Yersinia) 종이다. 본원에 제공되는 SSB는 SEQ ID NO: 31, 및 SEQ ID NO: 34 내지 131, 및 132에 제시된 것, 및 SEQ ID NO: 31, SEQ ID NO: 34 내지 131 또는 132의 전체 길이에 걸쳐 적어도 85%, 90%, 95%, 97%, 98% 또는 99% 서열 동일성을 갖는; 또는 SEQ ID NO: 31 또는 SEQ ID NO: 34 내지 131 또는 132에 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 이의 변이체를 포함한다. 본원에 사용되는 SSB는 내용이 본원에 그들 전체가 참조로 포함되는 WO 2017/184227호로서 공개된 PCT/US2017/016184호의 미국 국내 단계인 미국 특허 출원 제16/075,281호의 개시내용 및 적어도 표 7 및 8에 제시된 SSB 단백질을 포함할 수 있다. 특정 구현예에서, SSB는 상기 언급된 SSB 중 임의의 것의 대립유전자 변이체를 포함할 수 있다. 특정 구현예에서, 상기 언급된 SSB 중 임의의 것은 SSB를 인코딩하는 핵산(예를 들어, 발현 벡터, mRNA 또는 바이러스 발현 벡터)의 방식에 의해 세포에 제공될 수 있다. 특정 구현예에서, 상기 언급된 SSB 중 임의의 것은 단백질로서, (예를 들어, 세포 투과 펩티드 및/또는 핵 국소화 서열과의) 융합 단백질로서 또는 SSB와 기타 단백질 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는(예를 들어, SSAP 및/또는 엑소뉴클레아제와 조합된) 폴리단백질로서 세포에 제공될 수 있다.

일부 구현예에서, 본 발명의 방법에서 사용되는 SSB 및 SSAP는 동일한 유기체 유래 또는 파지 및 파지의 박테리아 숙주 유래의 것이다.

일부 구현예에서, SSB는 필요하지 않다. 일부 구현예에서, SSAP는 복제 단백질 A(RPA)-결합 파트너와 융합된다(문헌[Fanning et al. Nucleic acids research, 34(15), 4126-4137]). 일부 구현예에서, SSB는 내인성 SSB이다. 일부 구현예에서, 내인성 SSB에 결합하도록 변형된 SSAP가 제공된다.

일부 구현예에서, 본원에 제공되는 방법에 사용되는 성분은 융합 단백질로서 제공된다. 일부 구현예에서, SSAP는 SSB와 융합된다. 일부 구현예에서, SSAP는 복제 단백질 A(RPA)에 융합된다.

v. 식물, 식물 조직 및 식물 세포

특정 구현예에서, HDR은 단리된 식물 세포 또는 식물 원형질체(즉, 비해리된 또는 온전한 식물 조직, 식물 부분 또는 전체 식물에 위치하지 않음)에서 증가된다. 특정 구현예에서, 식물 세포는 임의의 식물 부분 또는 조직 또는 캘러스로부터 수득된다. 특정 구현예에서, 배양물은 식물 조직, 배양된 식물 조직 외식편, 전체 식물, 온전한 마디 눈(nodal bud), 슈트 정단부(shoot apex) 또는 슈트 정단 분열조직(shoot apical meristem), 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할(halved) 종자 또는 기타 종자 단편, 접합자 배(zygotic embryo), 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리, 캘러스 또는 식물 세포 현탁액으로부터 수득되는 식물 세포를 포함한다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층으로부터 유래된다.

특정 구현예에서, HDR은 비해리된 또는 온전한 식물 조직, 식물 부분, 식물 외식편 또는 전체 식물에 위치한 식물 세포에서 증가된다. 특정 구현예에서, 식물 세포는 온전한 마디 눈, 배양된 식물 조직 외식편, 슈트 정단부 또는 슈트 정단 분열조직, 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할 종자 또는 기타 종자 단편, 접합자 배, 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리 또는 캘러스에 위치할 수 있다. 특정 구현예에서, 사용되는 외식편은 미성숙 배를 포함한다. 미성숙 배(예를 들어, 미성숙 옥수수 배)는 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3 내지 7 ㎜ 배를 포함한다. 특정 구현예에서, 상기 언급된 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대(tassel), 미성숙 이삭 및 생사(silk)로부터 수득된다. 다양한 양태에서, 형질전환을 위해 사용되는 식물-유래 외식편은 미성숙 배, 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3.5 내지 7 ㎜ 배를 포함한다. 일 양태에서, 개시된 방법에서 사용되는 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대, 미성숙 이삭 또는 생사로부터 유래될 수 있다. 특정 구현예에서, 식물 세포는 만능 식물 세포(예를 들어, 줄기 세포 또는 분열조직 세포)이다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층 내에 위치한다. 특정 구현예에서, 그의 전체가 본원에 참조로 포함되는 WO2018085693호에 공개된 전체 식물, 종자, 배, 외식편 또는 분열조직의 게놈 편집 방법은 본원에 제공되는 식물 세포 및 관련 시스템, 방법, 조성물 또는 배양물에 사용하기 위해 조정될 수 있다.

특정 구현예에서, 식물 세포는 반수체, 이배체 또는 배수체 식물 세포 또는 식물 원형질체, 예를 들어, 반수체, 이배체 또는 배수체 식물, 식물 부분 또는 조직 또는 캘러스로부터 수득되는 것들을 포함할 수 있다. 특정 구현예에서, 배양 중 식물 세포(또는 재생된 식물, 자손 종자 및 자손 식물)는 반수체이거나, 반수체가 되도록 유도될 수 있으며; 반수체 식물 및 식물 세포의 제조 및 이용을 위한 기법은 당업계에 알려져 있으며, 예를 들어, www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf에서 이용 가능한 "How to make haploid Arabidopsis thaliana" 프로토콜(문헌[Ravi et al. (2014) Nature Communications, 5:5334, doi: 10.1038/ncomms6334])에서 Maruthachalam 및 Chan에 의해 기술된 바와 같은, 변경된 형태의 동원체-특이적 히스톤 CENH3을 발현하는 반수체-유도 스트레인과 야생형 스트레인의 교배에 의해 아라비돕시스 탈리아나(Arabidopsis thaliana)에서 반수체를 생성하기 위한 방법을 참조한다. 반수체는 또한 그의 전체가 본원에 참조로 포함되는 미국 특허 제9,215,849호에 개시된 바와 같이 돌연변이된 CENH3 유전자를 포함하는 식물을 야생형 이배체 식물과 교배하여, 반수체 자손을 생성함으로써 매우 다양한 외떡잎 식물(예를 들어, 옥수수, 밀, 벼, 수수, 보리) 또는 쌍떡잎 식물(예를 들어, 대두, 브라시카(Brassica) 종, 예를 들어, 카놀라, 목화, 토마토)에서 수득될 수 있다. 반수체 옥수수 식물 및/또는 세포를 수득하기 위해 사용될 수 있는 반수체-유도 옥수수 라인(line)은 스톡(Stock) 6, MHI(몰도바(Moldovian) 반수체 유도제), 부정 배우체(indeterminate gametophyte; ig) 돌연변이, KEMS, RWK, ZEM, ZMS, KMS, 및 본원에 그의 전체가 참조로 포함되는 미국 특허 제9,677,082호에 개시된 전이유전자 반수체 유도 라인을 포함한다. 반수체 세포의 예는 반수체 식물로부터 수득되는 식물 세포 및 생식 조직으로부터, 예를 들어, 꽃, 발생 중인 꽃 또는 꽃눈, 씨방, 밑씨, 대포자, 꽃밥, 화분, 대배우체 및 소포자로부터 수득되는 식물 세포를 포함하지만, 이에 한정되지 않는다. 식물 세포 또는 식물 원형질체가 반수체인 특정 구현예에서, 유전학적 상보물은 식물 세포 또는 식물 원형질체에서 염색체 배가에 의해(예를 들어, 감수분열 비-감소에 의한 자발적 염색체 배가에 의해 또는 염색체 배가 작용제, 예컨대 콜히친(colchicine), 오리잘린(oryzalin), 트리플루랄린(trifluralin), 프로나미드(pronamide), 아산화질소 기체, 항-미세소관 제초제, 항-미세소관 작용제 및 유사분열 저해제의 사용에 의해) 배가되어, 유전자 또는 대립유전자의 상보물이 동형접합성인 배가된 반수체 식물 세포 또는 식물 원형질체를 생성할 수 있으며; 또 다른 구현예는 배가된 반수체 식물 세포 또는 식물 원형질체로부터의 배가된 반수체 식물의 재생을 포함한다. 또 다른 구현예는 이 접근법에 의해 제공되는 배가된 반수체 식물인 적어도 하나의 부모 식물을 갖는 하이브리드 식물에 관한 것이다. 배가된 반수체 식물의 생성에 의해, 동형접합성 식물을 수득하기 위하여 몇 세대의 자가-교배를 필요로 하는 것 대신에 한 세대에서 동형접합성이 제공된다. 배가된 반수체의 이용은 가능한 최소의 시간에 유전학적 순도(즉, 동형접합성)를 확립하고자 하는 임의의 상황에서 유리하다. 배가된 반수체 생성은 느리게 성장하는 식물, 예컨대 과수 및 기타 식물에서 또는 적어도 하나의 배가된-반수체 식물의 자손인 하이브리드 식물을 생성하는 데 특히 유리할 수 있다.

HDR이 식물 세포에서 증가되는 특정 구현예에서, 본원에 제공되는 관련 방법, 시스템, 조성물 또는 반응 혼합물은 임의의 관심 외떡잎 또는 쌍떡잎 식물 종, 예를 들어, 줄뿌림 작물(row crop) 식물, 과실-생성 식물 및 나무, 야채, 나무 및 관상용 꽃, 관목, 나무, 지피식물(groundcover) 및 잔디풀을 포함하는 관상용 식물로부터 수득되거나 이에 위치한 식물 세포를 포함할 수 있다. 특정 비-제한적인 구현예에서, 식물 세포는 알팔파(메디카고 사티바(Medicago sativa)), 아몬드(프루누스 둘시스(Prunus dulcis)), 사과(말루스(Malus) x 도메스티카(domestica)), 살구(프루누스 아르메니아카(Prunus armeniaca), 프루누스 브리간티네(P. brigantine), 프루누스 만드슈리카(P. mandshurica), 프루누스 무메(P. mume), 프루누스 시비리카(P. sibirica)), 아스파라거스(아스파라거스 오피시날리스(Asparagus officinalis)), 바나나(무사(Musa) 종), 보리(호르데움 불가레(Hordeum vulgare)), 콩(파세올루스(Phaseolus) 종), 블루베리 및 크랜베리(백시니움(Vaccinium) 종), 카카오(테오브로마 카카오(Theobroma cacao)), 카놀라 및 평지씨 또는 오일시드 평지, (브라시카 나푸스(Brassica napus)), 카네이션(디안투스 카리오필루스(Dianthus caryophyllus)), 당근(다우쿠스 카로타 사티부스(Daucus carota sativus)), 카사바(마니호트 에스쿨렌툼(Manihot esculentum)), 체리(프루누스 아비움(Prunus avium)), 병아리콩(시더 아리에티눔(Cider arietinum)), 치커리(시코리움 인티부스(Cichorium intybus)), 칠리 페퍼 및 기타 캅시쿰 페퍼(capsicum pepper)(캅시쿰 아눔(Capsicum annuum), 캅시쿰 프루테센스(C. frutescens), 캅시쿰 키넨세(C. chinense), 캅시쿰 푸베센스(C. pubescens), 캅시쿰 바카툼(C. baccatum)), 국화(크리산테뭄(Chrysanthemum) 종), 코코넛(코코스 누시페라(Cocos nucifera)), 커피(코페아(Coffea) 종, 예를 들어, 코페아 아라비카(Coffea arabica) 및 코페아 카네포라(Coffea canephora)), 목화(고시피움 히르수툼(Gossypium hirsutum) L.), 동부(비그나 운구이쿨라타(Vigna unguiculata)), 오이(쿠쿠미스 사티부스(Cucumis sativus)), 커런트 및 구스베리(리베스(Ribes) 종), 가지(eggplant 또는 aubergine)(솔라눔 멜론게나(Solanum melongena)), 유칼립투스(유칼립투스(Eucalyptus) 종), 아마(리눔 우시타티수뭄(Linum usitatissumum) L.), 제라늄(geranium)(펠라르고늄(Pelargonium) 종), 자몽(시트러스(Citrus) x 파라디시(paradisi)), 포도(비투스(Vitus) 종), 예를 들어, 양조용 포도(비투스 비니페라(Vitus vinifera)), 구아바(프시디움 구아자바(Psidium guajava)), 삼 및 대마(예를 들어, 카나비스 사티바(Cannabis sativa) 및 카나비스 종), 홉(후물러스 루풀러스(Humulus lupulus)), 붓꽃(이리스(Iris) 종), 레몬(시트러스 리몬(Citrus limon)), 상추(락투카 사티바(Lactuca sativa)), 라임(시트러스 종), 옥수수(제아 메이즈(Zea mays) L.), 망고(만지페라 인디카(Mangifera indica)), 망고스틴(가르시니아 망고스타나(Garcinia mangostana)), 멜론(쿠쿠미스 멜로(Cucumis melo)), 기장(세타리아(Setaria) 종, 에키노클로아(Echinochloa) 종, 엘레우신(Eleusine) 종, 파니쿰(Panicum) 종, 페니세툼(Pennisetum) 종), 귀리(아베나 사티바(Avena sativa)), 기름야자(엘리스 퀴닌시스(Ellis quineensis)), 올리브(올레아 유로파에아(Olea europaea)), 양파(알리움 세파(Allium cepa)), 오렌지(시트러스 시넨시스(Citrus sinensis)), 파파야(카리카 파파야(Carica papaya)), 복숭아 및 천도복숭아(프루누스 페르시카(Prunus persica)), 배(피루스(Pyrus) 종), 완두(피사 사티붐(Pisa sativum)), 땅콩(아라키스 하이포가에아(Arachis hypogaea)), 작약(파에오니아(Paeonia) 종), 페투니아(petunia)(페투니아(Petunia) 종), 파인애플(아나나스 코모수스(Ananas comosus)), 플랜테인(plantain)(무사(Musa) 종), 자두(프루누스 도메스티카(Prunus domestica)), 포인세티아(poinsettia)(유포르비아 풀체리마(Euphorbia pulcherrima)), 폴란드 카놀라(Polish canola)(브라시카 라파(Brassica rapa)), 포플러(포풀러스(Populus) 종), 감자(솔라눔 투베로숨(Solanum tuberosum)), 호박(쿠쿠르비타 페포(Cucurbita pepo)), 벼(오리자 사티바 L.), 장미(로사(Rosa) 종), 고무(헤베아 브라실리엔시스(Hevea brasiliensis)), 호밀(세칼레 세레알레(Secale cereale)), 잇꽃(카르타무스 틴크토리우스(Carthamus tinctorius) L), 참깨 종자(세사메 인디움(Sesame indium)), 수수(소르굼 비콜로르(Sorghum bicolor)), 대두(글리신 맥스(Glycine max) L.), 애호박(squash)(쿠쿠르비타 페포(Cucurbita pepo)), 딸기(프라가리아(Fragaria) 종, 프라가리아 x 아나나사(ananassa)), 사탕무(베타 불가리스(Beta vulgaris)), 사탕수수(사카룸(Saccharum) 종), 해바라기(헬리안투스 안누스(Helianthus annus)), 고구마(이포모에아 바타타스(Ipomoea batatas)), 탠저린(시트러스 탄제리나(Citrus tangerina)), 찻잎(카멜리아 시넨시스(Camellia sinensis)), 담배(니코티아나 타바쿰(Nicotiana tabacum) L.), 토마토(라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), 튤립(툴리파(Tulipa) 종), 순무(브라시카 라파 라파(Brassica rapa rapa)), 호두(저글란스(Juglans) 종 L.), 수박(시트룰루스 라나투스(Citrulus lanatus)), 밀(트리티움 아에스티붐(Tritium aestivum)) 또는 마(디스코레아(Discorea) 종)로부터 수득되거나, 이에 위치한다.

vi. 진핵 세포

특정 구현예에서, HDR이 증가된 진핵 세포(예를 들어, 식물 세포)는 (a) 폴리머(예를 들어, 펙틴, 아가로스 또는 기타 다당류) 또는 기타 지지체(고체 또는 반-고체 표면 또는 매트릭스 또는 입자 또는 나노입자) 내에 캡슐화되거나, 봉입되거나, 이에 부착되거나; (b) 소낭 또는 리포좀 또는 기타 유체 구획 내에 캡슐화되거나, 봉입되거나, 이에 부착되거나; 또는 (c) 캡슐화되거나, 봉입되거나, 부착되지 않은 세포일 수 있다. 특정 구현예에서, 세포는 액체 또는 현탁액 배양에 존재할 수 있거나, 반-고체 또는 고체 배지 내에 또는 그 상에, 또는 액체 및 고체 또는 반-고체 배지의 조합에서 배양될 수 있다(예를 들어, 액체 배지 오버레이를 갖는 고체 배지 상에서 배양된 식물 세포 또는 원형질체, 또는 고체 비드 또는 매트릭스에 부착되고, 액체 배지를 사용하여 성장한 식물 세포 또는 원형질체). 특정 구현예에서, 세포는 폴리머(예를 들어, 펙틴, 아가로스 또는 기타 다당류) 또는 기타 캡슐화 물질 내에 캡슐화되거나, 소낭 또는 리포좀에 봉입되거나, 혼합상 배지(예컨대, 에멀젼 또는 역 에멀젼)에 현탁화되거나, 매트릭스 또는 기타 고체 지지체(예를 들어, 비드 또는 마이크로비드, 멤브레인 또는 고체 표면) 내에 임베딩되거나, 이에 부착된다.

관련된 양태에서, 본 개시내용은 본원에 기술된 시스템, 방법 및 조성물에서 개선된 HDR 빈도를 갖는 진핵 세포(예를 들어, 식물 세포)의 배열, 예컨대 선별을 위한 또는 고효율 및/또는 다중 형질전환 또는 유전자 편집 실험을 위한 편리한 세포의 배열을 제공한다. 일 구현예에서, 본 개시내용은 하기를 포함하는 다중 세포의 배열을 제공한다: (a) HDR 촉진제; 및 선택적으로 (b) 게놈 편집 분자. 특정 구현예에서, 세포의 배열은 적어도 하나의 화학적, 효소적 또는 물리적 전달제를 추가로 포함할 수 있다. 또 다른 구현예에서, 본 개시내용은 각각이 증가된 HDR-매개된 게놈 변형 빈도를 갖는 적어도 하나의 세포를 포함하는 복수의 용기를 포함하는 어레이를 제공한다. 일 구현예에서, 본 개시내용은 HDR 촉진제 및 선택적으로 게놈 편집 분자를 갖는 세포의 배열을 제공하며, 세포는 어레이된 형식에, 예를 들어, 멀티-웰 플레이트에 존재하거나, (예를 들어, 미세유체 디바이스에서 유용한) 소낭, 리포좀 또는 액적에 캡슐화되거나 봉입되거나, 분리되어 매트릭스에, 또는 분리된 입자 또는 비드에 부착되며; 구체적인 구현예는 어레이 상의 적어도 일부 위치에 대하여 또는 심지어 어레이 상의 각각의 위치에 대하여 상이할 수 있는 적어도 하나의 게놈 편집 분자(예를 들어, RNA-가이드된 DNA 뉴클레아제, 적어도 하나의 가이드 RNA 또는 RNA-가이드된 DNA 뉴클레아제 및 적어도 하나의 가이드 RNA 둘 모두를 포함하는 리보핵단백질), 및 선택적으로 적어도 하나의 화학적, 효소적 또는 물리적 전달제를 추가로 포함하는, 어레이된 형식에 제공되는 증가된 HDR-매개된 게놈 변형 빈도를 갖는 이러한 다수의 세포의 배열이다.

본원에 제공되는 시스템 및 방법에서, 진핵 세포(예를 들어, 식물 세포)는 하나 이상의 HDR 촉진제 및/또는 하나 이상의 유전자 편집 분자에 임의의 시간 순서로 노출될 수 있다. 특정 구현예에서, HDR 촉진제 및 유전자 편집 분자는 동시에 제공된다. 다른 구현예에서, HDR 촉진제가 제공된 후에 게놈 편집 분자가 제공된다. 다른 구현예에서, HDR 촉진제가 제공되기 전에 유전자 편집 분자가 제공된다. 요약하여, HDR 촉진제는 세포를 유전자 편집 분자에 노출시키기 이전에, 이와 동시에 또는 이후에 진핵 세포(예를 들어, 식물 세포)에 제공될 수 있다.

HDR 촉진제(예를 들어, SSAP, 엑소뉴클레아제, 및 SSB) 및/또는 변형된 DNA 공여자 주형에 의해 부여되는 증가된 상동성 지정 수선(HDR)-매개된 게놈 변형 빈도를 갖는 진핵 세포(예를 들어, 식물 세포)가 본원에 제공된다. 또한, 본원에 개시된 시스템 및 방법에 의해 제공되는 증가된 HDR-매개된 게놈 변형 빈도를 갖는 식물 세포 또는 식물 원형질체로부터 유래된 또는 이로부터 성장한 조성물이 본 개시내용에 의해 제공되며; 이러한 조성물은 증가된 HDR-매개된 게놈 변형 빈도를 갖는 식물 세포 또는 식물 원형질체로부터 성장한 다수의 원형질체 또는 세포, 캘러스, 체세포 배, 체세포 분열조직, 배형성 캘러스 또는 재생된 식물을 포함한다. HDR 촉진제 및/또는 변형된 DNA 공여자 주형으로 처리된 세포에서의 증가된 HDR-매개된 게놈 변형 빈도는 다수의 기법에 의해 평가될 수 있다. 특정 구현예에서, 이러한 기법은 HDR 촉진제(예를 들어, SSAP, 엑소뉴클레아제, 및 SSB) 및/또는 변형된 DNA 공여자 주형으로 처리되지 않은 대조군 세포에서의 HDR의 빈도에 대하여, HDR 촉진제로 처리된 세포에서 관찰되는 HDR의 빈도를 비교할 수 있다.

특정 구현예에서, 본원에 제공되는 시스템, 방법 및 조성물에서 사용되는 진핵 세포(예를 들어, 식물 세포)는 비-분열 세포를 포함할 수 있다. 이러한 비-분열 세포는 유전학적 및/또는 약제학으로-유도된 세포-사이클 차단 등 중 하나 이상으로 처리된 식물 세포 원형질체, 진핵 세포를 포함할 수 있다. 특정 구현예에서, 비-분열 세포는 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제, 및 SSB) 및/또는 본원에 제공되는 변형된 DNA 공여자 주형을 선택적으로 포함할 수 있는 유전자-편집 분자로의 처리 후에 (예를 들어, 유전학적 또는 약제학적 세포-사이클 차단을 역전시키거나 제거함으로써) 분열하도록 유도될 수 있다.

특정 구현예에서, 본원에 제공되는 시스템, 방법 및 조성물에서 사용되는 진핵 세포(예를 들어, 식물 세포)는 분열 중인 세포를 포함할 수 있다. 분열 중인 세포는 잎, 분열조직 및 배를 포함하는 다양한 식물 조직에서 관찰되는 그들 세포를 포함할 수 있다. 이들 조직은 어린 옥수수 잎, 분열조직 및 약 8 또는 10 내지 약 12 또는 14 DAP(days after pollination) 배의 배반 조직 유래의 분열 중인 세포를 포함하지만, 이에 제한되지 않는다. 옥수수 배의 단리는 몇몇의 문헌에 기술된 바 있다(문헌[Brettschneider, Becker, and L

rz 1997]; 문헌[Leduc et al. 1996]; 문헌[Frame et al. 2011]; 문헌[K. Wang and Frame 2009]). 특정 구현예에서, 기부엽 조직(예를 들어, 옥수수 식물의 엽설로부터 약 0 내지 3 ㎝에 위치한 잎 조직; 문헌[Kirienko, Luo, and Sylvester 2012])은 HDR-매개된 유전자 편집을 위해 표적화된다. 본원에 제공된 식물 세포의 HDR-매개된 유전자 편집으로부터 재생 가능한 식물 구조 및 재생하는 식물을 수득하기 위한 방법은 구체적으로 이러한 개시내용에 관하여 그의 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호에 개시된 방법으로부터 조정될 수 있다. 특정 구현예에서, HDR-매개된 유전자 편집으로 처리된 단일의 식물 세포는 단일의 재생 가능한 식물 구조를 야기할 것이다. 특정 구현예에서, 단일의 재생 가능한 식물 세포 구조는 HDR-매개된 유전자 편집으로 처리된 외식편 상에서 또는 그 내에서 단일의 세포로부터 형성될 수 있다.

vii. 식물 재생

일부 구현예에서, 본원에 제공되는 방법은 개선된 HDR-매개된 유전자 편집을 겪은 식물 세포로부터, 또는 식물 세포로부터 수득되는 재생 가능한 식물 구조로부터 식물을 성장시키거나 재생시키는 추가의 단계를 포함할 수 있다. 특정 구현예에서, 식물은 본원에 개시된 방법 및 조성물에 의해 제공되는 바와 같은 삽입된 전이유전자, 표적 유전자 편집 또는 게놈 편집을 추가로 포함할 수 있다. 특정 구현예에서, 캘러스는 식물 세포, 및 이러한 캘러스로부터 생성된 소식물체 및 식물로부터 생성된다. 다른 구현예에서, 전체 묘목 또는 식물은 캘러스 단계 없이 식물 세포로부터 바로 성장한다. 따라서, 추가의 관련 양태는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포 또는 식물 원형질체로부터 성장하거나 재생된 전체 묘목 및 식물, 이러한 식물의 종자에 관한 것이다. 식물 세포 또는 식물 원형질체가 유전학적 변형(예를 들어, RNA-가이드된 DNA 뉴클레아제의 수단에 의한 게놈 편집)으로 처리된 특정 구현예에서, 성장한 또는 재생된 식물은 유전학적 변형과 연관된 표현형을 나타낸다. 특정 구현예에서, 성장한 또는 재생된 식물은 그의 게놈에 둘 이상의 유전학적 또는 후성적 변형을 포함하며, 이는 조합하여 적어도 하나의 관심 표현형을 제공한다. 특정 구현예에서, 적어도 일부가 적어도 하나의 유전학적 또는 후성적 변형을 포함하는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포의 이종 집단이 상기 방법에 의해 제공되며; 관련 양태는 표적 유전자 또는 게놈 편집을 갖는 식물 세포의 이종 집단으로부터 선택되는 식물 세포 또는 식물 원형질체로부터의 관심 표현형을 갖는 식물의 재생에 의해, 또는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포의 집단으로부터 성장하거나 재생된 식물의 이종 집단으로부터의 관심 표현형을 갖는 식물의 선택에 의해 제공되는, 유전학적 또는 후성적 변형과 연관된 관심 표현형을 갖는 식물을 포함한다. 관심 표현형의 예는 제초제 저항성, 무생물학적 스트레스(예를 들어, 극한의 온도의 내성, 내건성 또는 내염성) 또는 생물학적 스트레스(예를 들어, 선충, 박테리아 또는 진균 병원체에 대한 저항성)의 개선된 내성, 영양소 또는 물, 변형된 지질, 탄수화물 또는 단백질 조성물의 개선된 이용, 개선된 향미 또는 외양, 개선된 저장 특징(예를 들어, 멍(bruising), 갈변 또는 무름(softening)에 대한 저항성), 증가된 수율, 변경된 형태(예를 들어, 꽃 구조 또는 색상, 식물 높이, 분지, 뿌리 구조)를 포함한다. 일 구현예에서, 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포의 이종 집단(또는 이로부터 성장하거나 재생된 묘목 또는 식물)은 관심 표현형의 발현을 가능하게 하는 조건에 노출되며; 예를 들어, 제초제 저항성에 대한 선택은 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포 집단(또는 이로부터 성장하거나 재생된 묘목 또는 식물)을 성장을 저해하거나 독성인 양의 제초제 또는 기타 물질에 노출시켜, 처리를 견디는 그들 저항성 식물 세포(또는 묘목 또는 식물)의 확인 및 선택을 가능하게 하는 것을 포함할 수 있다. 재생 가능한 식물 구조를 수득하고, 식물 세포 또는 재생 가능한 식물 구조로부터 식물을 재생하기 위한 방법은 공개된 절차로부터 조정될 수 있다(문헌[Roest and Gilissen, Acta Bot. Neerl., 1989, 38(1), 1-23]; 문헌[Bhaskaran and Smith, Crop Sci. 30(6):1328-1337]; 문헌[Ikeuchi et al., Development, 2016, 143: 1442-1451]). 재생 가능한 식물 구조를 수득하고, 식물 세포 또는 재생 가능한 식물 구조로부터 식물을 재생하기 위한 방법은 또한, 구체적으로 이러한 개시내용에 관하여, 그의 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호로부터 조정될 수 있다. 또한, 이러한 식물의 이종 집단, 어레이 또는 라이브러리, 표적 유전자 편집 또는 게놈 편집을 갖는, 식물 세포 또는 식물 원형질체로부터 성장하거나 이로부터 재생된 이러한 식물의 후속 세대 또는 종자, 식물의 부분(접순 또는 대목으로서 접목에 사용되는 식물 부분 포함), 또는 식물 또는 그들의 종자로 제조된 생성물(예를 들어, 과실 또는 기타 식용 식물 부분, 세정된 곡물 또는 종자, 식용 오일, 가루 또는 전분, 단백질 및 기타 가공 생성물)이 제공된다. 구현예는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포로부터 성장하거나 재생된 식물을 포함하며, 식물은 유전학적 또는 후성적 변형을 갖지 않는 세포 또는 조직, 예를 들어 접순 또는 대목이 유전학적 또는 후성적 변형을 함유하는 이식된 식물, 또는 전부의 세포 또는 조직이 아닌 일부가 유전학적 또는 후성적 변형을 함유하는 키메라 식물을 함유한다. 이식이 보통 유용한 식물은 많은 과수 및 식물, 예컨대 많은 감귤류 나무, 사과, 핵과(예를 들어, 복숭아, 살구, 체리 및 자두), 아보카도, 토마토, 가지, 오이, 멜론, 수박 및 포도, 및 다양한 관상 식물, 예컨대 장미를 포함한다. 이식된 식물은 동일한 또는 상이한(일반적으로 관련된) 종 간의 이식편일 수 있다. 추가의 관련된 양태는 표적 유전자 편집 또는 게놈 편집을 갖고 적어도 하나의 유전학적 또는 후성적 변형을 갖는 식물 세포 또는 식물 원형질체로부터 성장하거나 재생된 제1 식물을 하이브리드 식물이 유전학적 또는 후성적 변형을 함유하는 제2 식물과 교배함으로써 제공되는 하이브리드 식물을 포함하며; 하이브리드 식물에 의해 생성되는 종자도 또한 고려된다. 또한, 부모 또는 조상으로서 재생된 식물을 갖는, 하이브리드 종자 및 하이브리드 식물을 포함하는 자손 종자 및 자손 식물이 관련 양태로서 고려된다. 본원에 개시된 식물 세포 및 유도 식물 및 종자는 소비자 또는 재배자에게 유용한 다양한 목적을 위해 사용될 수 있다. 온전한 식물 그 자체, 예를 들어, 피복 작물(cover crop)로서 또는 관상식물로서 성장한 식물이 바람직할 수 있다. 다른 구현예에서, 가공된 생성물, 예컨대 추출된 단백질, 오일, 당 및 전분, 발효 생성물, 동물 사료 또는 인간 식품, 목재 및 목제품, 약제학적 및 다양한 산업적 제품은 식물 또는 그의 종자로부터 제조된다.

viii. 진핵 세포로의 HDR 촉진제의 제공

HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB는 임의의 적합한 기법에 의해 진핵 세포(예를 들어, 식물 세포 또는 식물 원형질체)에 제공될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 세포를 SSAP, 엑소뉴클레아제 및/또는 SSB, 또는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드와 직접 접촉시킴으로서 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB, 또는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드를 화학적, 효소적 또는 물리적 작용제를 사용하여 세포 내로 수송함으로써 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드를 사용한 식물 세포 또는 식물 원형질체의 박테리아 매개의(예를 들어, 아그로박테리움 종, 리조비움(Rhizobium) 종, 시노리조비움(Sinorhizobium) 종, 메소리조비움(Mesorhizobium) 종, 브라디리조비움(Bradyrhizobium) 종, 아조박터(Azobacter) 종, 필로박테리움(Phyllobacterium) 종) 트랜스펙션에 의해 제공되며; 예를 들어, 문헌[Broothaerts et al. (2005) Nature, 433:629 - 633]을 참조한다. 일 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하고, 식물 세포의 게놈에 안정하게 통합되는 DNA의 식물 세포 또는 식물 원형질체에서의 전사에 의해 제공되거나, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 플라스미드 또는 발현 벡터(예를 들어, 바이러스 벡터)의 형태로 식물 세포 또는 식물 원형질체에 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드로서, 예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 RNA(예를 들어, 내부 리보솜 유입 부위(IRES)를 함유하는 mRNA 또는 RNA)의 형태로 식물 세포 또는 식물 원형질체에 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 인코딩된 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 아미노산 서열을 갖는, SSAP, 엑소뉴클레아제 및/또는 SSB를 임의의 순서로 포함하는 폴리단백질을 인코딩하는 폴리뉴클레오티드로서 식물 세포 또는 식물 원형질체에 제공된다. 이러한 프로테아제 인식 서열의 예에는 내인성 식물 프로테아제에 의해 절단될 수 있는 식물 메탈로티오네인-유사 단백질(PsMTa)의 스페이서 영역(문헌[Unwin et al., 1998]) 또는 세포에 또한 제공되는 특이적인 프로테아제의 인식 서열(예를 들어, TVMV Nia 프로테이나제; 문헌[Dasgupta, et al., 1998])이 포함된다. 이러한 자가-가공 단백질 서열의 예에는 구제역 바이러스(FMDV) 2A 서열(SEQ ID NO:33; 문헌[Halpin, C., et al, 1999])이 포함된다. 게놈 편집 분자는 또한 유사한 기법에 의해 식물 세포 내로 도입될 수 있다.

ix. HDR 촉진제의 일시적인 발현

본원에 제공되는 방법, 시스템, 세포 및 조성물의 특정 구현예에서, HDR 촉진제 및/또는 게놈 편집 분자의 일시적 발현이 사용된다. HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB 또는 게놈 편집 분자의 일시적 발현은 다양한 기법에 의해 달성될 수 있다. 일부 구현예에서, HDR 촉진제의 발현은 유도 가능하다. 특정 구현예에서, SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자는 단리된 분자로서, 무세포 합성 과정(예를 들어, 시험관내 번역)의 단리된 또는 반-정제된 생성물로서 또는 세포-기반의 합성 과정에서(예를 들어, 예컨대 박테리아 또는 다른 세포 용해물에서)의 단리된 또는 반-정제된 생성물로서 세포, 시스템, 방법 및 조성물에 직접 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자는 (예를 들어, 문헌[Gao et al. 2016]; 또는 문헌[Li et al. 2009]으로부터 조정된 방법에 의해) 일시적 발현을 보장하는 방식으로 세포 또는 세포 핵에 표적화된다. 특정 구현예에서, SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자는 SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자를 인코딩하는 임의의 폴리뉴클레오티드의 부재 하에 SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자의 전달에 의해 세포 내로 전달된다. 임의의 인코딩 폴리뉴클레오티드의 부재 하에 전달될 수 있는 외인성 작용제의 예에는 SSAP, 엑소뉴클레아제, SSB, 서열-특이적 엔도뉴클레아제 및 RNA 가이드가 포함된다. RNA-가이드된 DNA 결합 폴리펩티드/RNA 가이드는 개별적으로 및/또는 RNP 복합체로서 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질은 (예를 들어, 문헌[Martin-Ortigosa and Wang 2014]으로부터 조정된 방법에 의해) 이종 시스템에서 생성되고, 정제되고, 입자 충격(particle bombardment)에 의해 식물 세포에 전달될 수 있다. SSAP, 엑소뉴클레아제 및/또는 SSB가 임의의 인코딩 폴리뉴클레오티드의 부재 하에 전달되는 구현예에서, 전달되는 작용제는 임의의 도입된 인코딩 폴리뉴클레오티드로부터 진행 중인 발현의 부재 하에 시간이 지나면서 분해하여, 일시적인 발현을 초래하는 것으로 예상된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드의 전달에 의해 세포 내로 전달된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 (예를 들어, 문헌[Hamada et al. 2018]; 또는 문헌[Kirienko, Luo, and Sylvester 2012]으로부터 조정된 방법에 의해) 박테리아 플라스미드 상에 인코딩되고, 입자 충격에 의해 식물 조직에 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 (예를 들어, 문헌[Leonelli et al. 2016]; 또는 문헌[Wu et al. 2014]으로부터 조정된 방법에 의해) T-DNA 상에서 인코딩되고, 아그로박테리움을 사용하여 식물 세포로 일시적으로 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 (예를 들어, 문헌[Honig et al. 2015]으로부터 조정된 방법에 의해) 바이러스 게놈에 인코딩되고, 식물에 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 mRNA 또는 IRES를 포함하는 RNA에 인코딩되고, 표적 세포에 전달될 수 있다. SSAP, 엑소뉴클레아제 및/또는 SSB가 RNA-가이드된 DNA 결합 폴리펩티드 및 RNA 가이드를 포함하는 특정 구현예에서, 폴리펩티드 또는 가이드는 하기의 조합에 의해 전달될 수 있다: (i) 폴리펩티드 또는 가이드에 대한 인코딩 폴리뉴클레오티드; 및 (ii) 인코딩 폴리뉴클레오티드의 부재 하의 폴리펩티드 또는 가이드 그 자체. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 HDR 촉진제를 인코딩하는 폴리뉴클레오티드의 전달에 의해 식물 세포 내로 전달된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드는 (예를 들어, 통합 결핍 T-DNA 벡터 또는 시스템 상의 아그로인필트레이션(agroinfiltration)에 의한 또는 바이러스 벡터 내의 통합을 제공하는 서열이 결여된 폴리뉴클레오티드로서) 식물 세포 게놈 내로 통합되지 않고/않거나 자가 복제를 제공하는 폴리뉴클레오티드에 작동 가능하게 연결되지 않고/않거나 자가 복제를 제공하는 인자(예를 들어, 바이러스 복제 단백질)만이 제공된다. 문헌[Canto, 2016] 등에 의해 개시된 폴리뉴클레오티드의 비올리스틱(biolistic) 및 기타 전달, 아그로인필트레이션 및 바이러스 벡터의 이용을 포함하는 일시적 발현에 적합한 기법은 본원에 제공된 SSAP, 엑소뉴클레아제 및/또는 SSB의 일시적인 발현을 위해 조정될 수 있다. 비-통합된 폴리뉴클레오티드에 의해 인코딩되는 작용제의 일시적 발현은 폴리뉴클레오티드의 절제 및/또는 작용제의 조절된 발현에 의해 유발된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드는 진핵 세포 게놈(예를 들어, 식물 핵 또는 색소체 게놈) 내로 통합되며, 작용제의 일시적 발현은 폴리뉴클레오티드의 절제 및/또는 SSAP, 엑소뉴클레아제 및/또는 SSB의 조절된 발현에 의해 유발된다. 작용제를 인코딩하는 폴리뉴클레오티드의 절제는 부위-특이적 재조합 시스템(예를 들어, Cre-Lox, FLP-FRT)의 이용에 의해 제공될 수 있다. 작용제의 조절된 발현은 하기를 포함하는 방법에 의해 유발될 수 있다: (i) 발생적으로-조절되는, 탈-억제 가능한 및/또는 유도성 프로모터로의 작용제를 인코딩하는 폴리뉴클레오티드의 작동 가능한 연결; 및/또는 (ii) 작용제의 siRNA-매개된 저해를 유도할 수 있는 폴리뉴클레오티드(예를 들어, dsRNA 또는 miRNA)의 도입. 적합한 부위-특이적 재조합 시스템 및 발생적으로-조절되는, 탈-억제 가능한 및/또는 유도성 프로모터에는 이러한 개시내용에 관하여 구체적으로, 그의 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호에 개시된 것들이 포함된다.

SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자(예를 들어, SSAP, 엑소뉴클레아제, SSB, 서열-특이적 엔도뉴클레아제, RNA-가이드된 엔도뉴클레아제 및/또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드)의 일시적인 발현을 유발하기 위해 사용될 수 있는 폴리뉴클레오티드는 하기를 포함한다: (a) 이중-가닥 RNA; (b) 단일-가닥 RNA; (c) 화학적으로 변형된 RNA; (d) 이중-가닥 DNA; (e) 단일-가닥 DNA; (f) 화학적으로 변형된 DNA; 또는 (g) (a) 내지 (f)의 조합. 폴리뉴클레오티드의 특정 구현예는 유용한 기능을 제공하는 추가의 뉴클레오티드 서열을 추가로 포함하며; 이러한 추가의 뉴클레오티드 서열의 비제한적인 예에는 압타머 또는 리보스위치 서열, 이차 구조, 예컨대 스템-루프를 제공하거나 효소에 대한 서열-특이적 부위(예를 들어, 서열-특이적 재조합효소 또는 엔도뉴클레아제 부위)를 제공하는 뉴클레오티드 서열, T-DNA(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 DNA 서열이 아그로박테리움 종 유래의 또는 식물에서 감염시키거나 종양을 유도하는 기타 박테리아 유래의 좌측 및 우측 T-DNA 경계 사이에 봉입됨), DNA 핵-표적화 서열, 조절 서열, 예컨대 프로모터 서열, 및 전사물-안정화 또는 -불안정화 서열이 포함된다. 폴리뉴클레오티드의 특정 구현예는 폴리뉴클레오티드가 비-핵산 요소, 예를 들어, 담체 분자, 항체, 항원, 바이러스 이동 단백질, 세포-투과 또는 포어-형성 펩티드, 폴리머, 검출 가능한 표지, 양자점 또는 미립자 또는 나노미립자와 복합체화되거나, 이에 공유적으로 또는 비-공유적으로 결합된 것들을 포함한다. 일부 구현예에서, 본원에 제공되는 성분 중 하나 이상은 유도성 프로모터의 유도에 의해 일시적으로 발현된다.

x. HDR 촉진제의 전달

다양한 처리가 유전자 편집 분자 및/또는 HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB를 진핵 세포(예를 들어, 식물 세포)에 전달하는 데 유용하다. 특정 구현예에서, 하나 이상의 처리를 사용하여 (예를 들어, 폴리뉴클레오티드, 폴리펩티드 또는 이의 조합을 포함하는) HDR 촉진제를 예를 들어, 장벽, 예컨대 세포벽, 원형질막, 핵피막 및/또는 기타 지질 이중층을 통해 진핵 또는 식물 세포 내로 전달한다. 특정 구현예에서, 작용제(들)를 포함하는 폴리뉴클레오티드-, 폴리펩티드- 또는 RNP-함유 조성물은 예를 들어, 조성물과 진핵 세포의 직접적인 접촉에 의해 직접적으로 전달된다. 상기 언급된 조성물은 액체, 용액, 현탁액, 에멀젼, 역 에멀젼, 콜로이드, 분산액, 겔, 리포좀, 미셀, 주사 가능한 물질, 에어로졸, 고체, 분말, 미립자, 나노입자 또는 이의 조합의 형태로 제공될 수 있고, (예를 들어, 세포벽 또는 세포막의 마모 또는 천공 또는 다르게는 파괴를 통해, 분무 또는 침지(dipping) 또는 소킹(soaking) 또는 다르게는 직접적인 접촉에 의해, 미세주입에 의해) 진핵 세포, 진핵 조직, 진핵 기관, 진핵 유기체, 식물, 식물 부분, 식물 세포 또는 식물 외식편에 직접 적용될 수 있다. 예를 들어, 식물 세포 또는 식물 원형질체를 액체 SSAP, 엑소뉴클레아제 및/또는 SSB-함유 조성물에 소킹시킴으로써, 작용제를 식물 세포에 전달한다. 특정 구현예에서, 작용제-함유 조성물은 예를 들어, 진공 침윤 또는 유체역학 또는 유체 압력의 인가를 사용하여 음압 또는 양압을 사용하여 전달된다. 특정 구현예에서, 작용제-함유 조성물은 예를 들어, 미세주입에 의해 또는 예를 들어, 물리적 처리에 의한, 예컨대 음압 또는 양압, 전단력 또는 화학적 또는 물리적 전달제, 예컨대 계면활성제, 리포좀 또는 나노입자를 사용한 처리의 적용에 의한 세포벽 또는 세포막의 파괴 또는 변형에 의해 식물 세포 또는 식물 원형질체 내로 도입되며; 예를 들어, 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2014/0287509호에 기술된 바와 같은 세포-변형 수축을 통한 미세유체 흐름을 사용한 세포로의 물질의 전달을 참조한다. 진핵 세포, 식물 세포 또는 식물 원형질체에 작용제-함유 조성물을 전달하는 데 유용한 다른 기법은 하기를 포함한다: 초음파 또는 음파처리; 진동, 마찰, 전단 스트레스, 와동(vortexing), 캐비테이션(cavitation); 원심분리 또는 기계적인 힘의 적용; 기계적 세포벽 또는 세포막 변형 또는 파괴; 효소적 세포벽 또는 세포막 파괴 또는 투과화; 마모 또는 기계적 파상(scarification)(예를 들어, 카보런덤 또른 기타 미립자 마모제를 사용한 마모 또는 파일(file) 또는 사포를 사용한 파상) 또는 화학적 파상(예를 들어, 산 또는 가성제를 사용한 처리); 및 전기천공법. 특정 구현예에서, 작용제-함유 조성물은 작용제(예를 들어, SSAP, 엑소뉴클레아제, SSB, 서열-특이적 엔도뉴클레아제 및/또는 가이드 RNA)를 인코딩하는 폴리뉴클레오티드를 사용한 식물 세포 또는 식물 원형질체의 박테리아로 매개된(예를 들어, 아그로박테리움 종, 리조비움 종, 시노리조비움 종, 메소리조비움 종, 브라디리조비움 종, 아조박터 종, 필로박테리움 종) 트랜스펙션에 의해 제공되며; 예를 들어, 문헌[Broothaerts et al. (2005) Nature, 433:629 - 633]을 참조한다. 이들 기법 또는 이들의 조합 중 임의의 것은 대안적으로 식물 세포가 이후에 선택적으로 수득되거나 단리되는 식물 외식편, 식물 부분 또는 조직 또는 온전한 식물(또는 종자)에서 사용되며; 특정 구현예에서, 작용제-함유 조성물은 식물 세포가 단리된 후 개별 단계에서 전달된다. 특정 구현예에서, 상기 언급된 방법을 사용하여 게놈 편집 분자를 진핵 세포(예를 들어, 식물 세포) 내로 도입할 수도 있다.

구현예들에서, HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB를 진핵 세포(예를 들어, 식물 세포)에 전달하는 데 사용되는 처리는 하나 이상의 적절한 온도, 예를 들어, 냉각 또는 저온 스트레스(정상적인 식물 성장이 발생하는 온도 미만의 온도에 대한 노출) 또는 가열 또는 고온 스트레스(정상적인 식물 성장이 발생하는 온도 초과의 온도에 대한 노출) 또는 상이한 온도의 조합으로 처리하는 것을 포함할 수 있는 구체적인 열 체제 하에 수행된다. 특정 구현예에서, 구체적인 열 체제는 작용제 전달로부터 분리된 하나 이상의 단계에서 식물 세포 상에서, 또는 식물 세포 또는 식물 원형질체가 이후에 수득되거나 단리되는 식물, 식물 외식편 또는 식물 부분 상에서 수행된다. 특정 구현예에서, 상기 언급된 방법을 사용하여 게놈 편집 분자를 진핵 세포 내로 도입할 수도 있다.

본원에 제공되는 식물 부분, 시스템, 방법 및 조성물의 특정 구현예에서, 전체 식물 또는 식물 부분 또는 종자, 또는 단리된 식물 세포, 식물 외식편, 또는 식물 세포 또는 식물 원형질체가 수득되거나 단리되는 식물 또는 식물 부분은 적어도 하나의 화학적, 효소적 또는 물리적 작용제 또는 이의 조합을 포함할 수 있는 하나 이상의 전달 작용제로 처리된다. 특정 구현예에서, HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB는 전달을 위하여 하나 이상의 화학적, 효소적 또는 물리적 작용제를 추가로 포함한다. 화학적, 효소적 또는 물리적 작용제로의 처리는 작용제 전달과 동시에, 또는 작용제 전달 이전의 또는 이후의 하나 이상의 개별 단계에서 수행될 수 있다. 특정 구현예에서, 화학적, 효소적 또는 물리적 작용제 또는 이들의 조합은 폴리뉴클레오티드 조성물과, 공여자 주형 폴리뉴클레오티드와, SSAP, 엑소뉴클레아제 및/또는 SSB와 회합되거나 복합체화되며; 이러한 회합 또는 복합체의 예는 비-공유적 상호작용(예를 들어, 이온성 또는 정전기적 상호작용, 소수성 또는 친수성 상호작용, 리포좀, 미셀 또는 기타 이종 조성물의 형성) 및 공유적 상호작용(예를 들어, 펩티드 결합, 교차-결합제를 사용하여 형성된 결합)을 포함하는 것들을 포함한다. 비-제한적인 예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 양이온성 지질과의 리포좀 복합체로서 제공되고/되거나; SSAP, 엑소뉴클레아제 및/또는 SSB는 탄소 나노튜브와의 복합체로서 제공되고/되거나; SSAP, 엑소뉴클레아제 및/또는 SSB는 작용제와 세포-투과 펩티드 간의 융합 단백질로서 제공된다. SSAP, 엑소뉴클레아제 및/또는 SSB를 운반하는 데 유용한 작용제의 예는 문헌[Zhang et al. (2007) J. Controlled Release, 123:1 - 10]에 의해 검토된 다양한 양이온성 리포좀 및 폴리머 나노입자 및 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2014/0356414 A1호에 기술된 교차-결합된 다층 리포좀을 포함한다. 상기 언급된 임의의 구현예에서, 상기 언급된 방법을 사용하여 게놈-편집 분자를 진핵 세포(예를 들어, 식물 세포) 내로 도입할 수도 있는 것이 추가로 고려된다.

특정 구현예에서, HDR 빈도를 증가시킬 수 있는 SSAP, 엑소뉴클레아제 및/또는 SSB 단백질 또는 이를 인코딩하는 폴리뉴클레오티드를 전달하기 위해 사용되는 화학적 작용제는 하기를 포함할 수 있다:

(a) 용매(예를 들어, 물, 디메틸술폭시드, 디메틸포름아미드, 아세토니트릴, N-피롤리딘, 피리딘, 헥사메틸포스포르아미드, 알코올, 알칸, 알켄, 디옥산, 폴리에틸렌 글리콜, 및 물과 혼화 가능하거나 유화 가능하거나, 비-수성계에서 포스포뉴클레오티드를 용해시킬 기타 용매);

(b) 플루오로카본(예를 들어, 퍼플루오로데칼린, 퍼플루오로메틸데칼린);

(c) 글리콜 또는 폴리올(예를 들어, 프로필렌 글리콜, 폴리에틸렌 글리콜);

(d) 계면활성제, 예를 들어, 양이온성 계면활성제, 음이온성 계면활성제, 비-이온성 계면활성제 및 양쪽성 계면활성제, 예를 들어, 알킬 또는 아릴 술페이트, 포스페이트, 술포네이트 또는 카복실레이트; 일차, 이차 또는 삼차 아민; 사차 암모늄 염; 술타인(sultaine), 베타인; 양이온성 지질; 인지질; 탈로아민; 담즙산, 예컨대 콜산; 장쇄 알코올; 오르가노실리콘(organosilicone) 계면활성제, 예를 들어, 비이온성 오르가노실리콘 계면활성제, 예컨대 트리실록산 에톡실레이트 계면활성제 또는 실리콘 폴리에테르 코폴리머, 예컨대 폴리알킬렌 옥시드 변형된 헵타메틸 트리실록산 및 알릴옥시폴리프로필렌 글리콜 메틸에테르(CAS 번호 27306-78-1 및 EPA 번호 CAL. REG. NO. 5905-50073-AA를 갖는 SILWET L-77^TM 브랜드 계면활성제로서 상업적으로 입수 가능, 모멘티브 퍼포먼스 머티리얼즈, 인코포레이티드(Momentive Performance Materials, Inc.), 미국 뉴욕주 올버니 소재)의 코폴리머; 유용한 계면활성제의 구체적인 예에는 라우릴황산나트륨, 트윈(Tween) 시리즈의 계면활성제, 트리톤(Triton)-X100, 트리톤-X114, CHAPS 및 CHAPSO, 터지톨(Tergitol)-형 NP-40, 노니데트(Nonidet) P-40이 포함됨;

(e) 지질, 지질단백질, 지질다당류;

(f) 산, 염기, 가성제;

(g) 펩티드, 단백질 또는 효소(예를 들어, 셀룰라제, 펙톨리아제, 마세로엔자임(maceroenzyme), 펙티나제), 예를 들어, 세포-투과 또는 포어-형성 펩티드(예를 들어, (BO100)2K8, 진스크립트(Genscript); 폴리-라이신, 폴리-아르기닌 또는 폴리-호모아르기닌 펩티드; 감마 제인(zein), 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제2011/0247100호 참조; 인간 면역결핍 바이러스 1형("HIV-1 Tat") 및 기타 Tat 단백질의 전사 활성화인자, 예를 들어, www[dot]lifetein[dot]com/Cell_Penetrating_Peptides[dot]html 및 문헌[J

rver (2012) Mol. Therapy-Nucleic acids, 1:e27,1 - 17] 참조); 옥타-아르기닌 또는 노나-아르기닌; 폴리-호모아르기닌(문헌[Unnamalai et al. (2004) FEBS Letters, 566:307 - 310] 참조); crdd[dot]osdd[dot]net/raghava/cppsite/에서 공개적으로 이용 가능한 세포-투과 펩티드 CPPsite 2.0의 데이터베이스도 또한 참조;

(h) RNase 저해제;

(i) 양이온성 분지형 또는 선형 폴리머, 예컨대 키토산, 폴리-라이신, DEAE-덱스트란, 폴리비닐피롤리돈("PVP") 또는 폴리에틸렌이민("PEI", 예를 들어, PEI, 분지형, MW 25,000, CAS# 9002-98-6; PEI, 선형, MW 5000, CAS# 9002-98-6; PEI 선형, MW 2500, CAS# 9002-98-6);

(j) 덴드리머(dendrimer)(예를 들어, 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제2011/0093982호 참조);

(k) 반대-이온, 아민 또는 폴리아민(예를 들어, 스페르민, 스페르미딘, 푸트레신), 삼투물질, 완충제 및 염(예를 들어, 인산칼슘, 인산암모늄);

(l) 폴리뉴클레오티드(예를 들어, 비-특이적 이중-가닥 DNA, 연어 정자 DNA);

(m) 트랜스펙션 작용제(예를 들어, 리포펙틴(Lipofectin)®, 리포펙타민(Lipofectamine)® 및 올리고펙타민(Oligofectamine)®, 및 인비보펙타민(Invivofectamine)®(전부 미국 매사츠세츠주 월섬 소재의 써모 피셔 사이언티픽(Thermo Fisher Scientific)사 제품), 펩펙트(PepFect)(문헌[Ezzat et al. (2011) Nucleic acids Res., 39:5284 - 5298] 참조), 트랜스잇(TransIt)® 트랜스펙션 시약(미국 위스콘신주 매디슨 소재의 미루스 바이오, 엘엘씨(Mirus Bio, LLC)) 및 문헌[Lu et al. (2010) J. Agric. Food Chem., 58:2288 - 2294]에 기술된 바와 같은 폴리-라이신, 폴리-호모아르기닌 및 폴리-아르기닌 분자, 예를 들어, 옥토-아르기닌 및 노노-아르기닌);

(n) 항생제, 예를 들어, 비-특이적인 DNA 이중-가닥-파단-유도제(예를 들어, 플레오마이신(phleomycin), 블레오마이신(bleomycin), 탈리소마이신(talisomycin)); 및/또는

(o) 산화방지제(예를 들어, 글루타티온, 디티오트레이톨, 아스코르베이트).

상기 언급된 임의의 구현예에서, 상기 언급된 화학적 작용제가 또한 게놈-편집 분자를 진핵 세포(예를 들어, 식물 세포) 내로 도입하기 위해 사용될 수 있는 것이 추가로 고려된다.

특정 구현예에서, 화학적 작용제는 HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB와 동시에 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 하나 이상의 화학적 작용제와 공유적으로 또는 비-공유적으로 연결되거나, 이와 복합체화되며; 예를 들어, SSAP, 엑소뉴클레아제, SSB 및/또는 서열-특이적 엔도뉴클레아제는 펩티드 또는 단백질(예를 들어, 세포-투과 펩티드 또는 포어-형성 펩티드)에 공유적으로 연결되거나, 양이온성 지질, 다가양이온(예를 들어, 폴리아민) 또는 양이온성 폴리머(예를 들어, PEI)와 비공유적으로 복합체화될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 하나 이상의 화학적 작용제와 복합체화되어, 예를 들어, 용액, 리포좀, 미셀, 에멀젼, 역 에멀젼, 현탁액, 콜로이드 또는 겔을 형성한다. 상기 언급된 임의의 구현예에서, 폴리뉴클레오티드 및/또는 폴리펩티드를 포함하는 게놈 편집 분자도 또한 상기 기술된 바와 같이 전달될 수 있는 것이 추가로 고려된다.

특정 구현예에서, HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB의 전달을 위한 물리적 작용제는 다양한 크기 범위 및 형상의 입자 또는 나노입자(예를 들어, 탄소, 규소, 탄화규소, 금, 텅스텐, 폴리머 또는 세라믹과 같은 물질로 제조된 입자 또는 나노입자), 자성 입자 또는 나노입자(예를 들어, silenceMag Magnetotransfection^TM 작용제, 오즈 바이오사이언스즈(OZ Biosciences), 미국 캘리포니아주 샌 디에고 소재), 연마제 또는 파상제, 니들(needle) 또는 마이크로니들(microneedle), 매트릭스 및 그리드(grid)로 이루어진 군으로부터 선택되는 적어도 하나이다. 특정 구현예에서, 미립자 및 나노미립자는 SSAP, 엑소뉴클레아제 및/또는 SSB의 전달에 유용하다. 유용한 미립자 및 나노입자는 금속(예를 들어, 금, 은, 텅스텐, 철, 세륨), 세라믹(예를 들어, 산화알루미늄, 탄화규소, 질화규소, 탄화텅스텐), 폴리머(예를 들어, 폴리스티렌, 폴리디아세틸렌 및 폴리(3,4-에틸렌디옥시티오펜) 수화물), 반도체(예를 들어, 양자점), 규소(예를 들어, 탄화규소), 탄소(예를 들어, 그래파이트, 그래핀, 산화그래핀 또는 탄소 나노시트, 나노복합체 또는 나노튜브), 및 합성물(예를 들어, 폴리비닐카르바졸/그래핀, 폴리스티렌/그래핀, 백금/그래핀, 팔라듐/그래핀 나노복합물)로 제조된 것들을 포함한다. 특정 구현예에서, 이러한 미립자 및 나노미립자는 추가로 공유적으로 또는 비-공유적으로 작용화되거나, 개질제 또는 교차-결합된 물질, 예컨대 폴리머(예를 들어, 선형 또는 분지형 폴리에틸렌이민, 폴리-라이신), 폴리뉴클레오티드(예를 들어, DNA 또는 RNA), 다당류, 지질, 폴리글리콜(예를 들어, 폴리에틸렌 글리콜, 티올화 폴리에틸렌 글리콜), 폴리펩티드 또는 단백질, 및 검출 가능한 표지(예를 들어, 형광단, 항원, 항체 또는 양자점)를 추가로 포함한다. 다양한 구현예에서, 이러한 미립자 및 나노입자는 중성이거나, 양전하를 띠거나 음전하를 띤다. 미립자를 포함하는 조성물의 구현예는 예를 들어, 액체, 콜로이드, 분산액, 현탁액, 에어로졸, 겔 및 고체로서 제형화된 것들을 포함한다. 구현예는 표면 또는 지지체에 부착된 나노입자, 예를 들어, 규소 또는 구리 웨이퍼 기판 상에 수직으로 정렬된 탄소 나노튜브의 어레이를 포함한다. 구현예는 비올리스틱-형 기법에 의해 또는 자력으로 전달되는 미립자(예를 들어, 금 또는 텅스텐 또는 자성 입자)를 포함하는 폴리뉴클레오티드 조성물을 포함한다. 비올리스틱에 사용되는 입자의 크기는 일반적으로 "마이크로입자" 범위, 예를 들어, 0.6, 1.0, 및 1.6 마이크로미터 크기 범위의 금 마이크로캐리어(예를 들어, 헬리오스(Helios)® 유전자 총(Gene Gun) 시스템에 대한 설명 매뉴얼, 바이오-라드(Bio-Rad), 미국 캘리포니아주 허큘레스 소재; 문헌[Randolph-Anderson et al. (2015) "Sub-micron gold particles are superior to larger particles for efficient Biolistic® transformation of organelles and some cell types", Bio-Rad US/EG Bulletin 2015] 참조)이지만; 더 큰(40 나노미터) 나노입자를 사용한 성공적인 비올리스틱 전달이 배양된 동물 세포에서 보고된 바 있으며; 문헌[O'Brian and Lummis (2011) BMC Biotechnol., 11:66 - 71]을 참조한다. 유용한 미립자의 다른 구현예에는 일반적으로 나노미터(nm) 크기 범위 또는 1 마이크로미터 미만인, 예를 들어, 약 1 nm 미만, 약 3 nm 미만, 약 5 nm 미만, 약 10 nm 미만, 약 20 nm 미만, 약 40 nm 미만, 약 60 nm 미만, 약 80 nm 미만, 및 약 100 nm 미만의 직경을 갖는 나노입자가 있다. 상업적으로 입수 가능한 나노입자의 구체적인 비제한적인 구현예(모두 미국 미주리주 세인트 루이스 소재의 시그마-알드리치 코포레이션(Sigma-Aldrich Corp.)사 제품)에는 5, 10 또는 15 nm의 직경을 갖는 금 나노입자; 10, 20, 40, 60 또는 100 nm의 입자 크기를 갖는 은 나노입자; 25 nm 미만의 입자 크기의 팔라듐 "나노분말"; 예를 들어, 0.7 내지 1.1, 1.3 내지 2.3, 0.7 내지 0.9 또는 0.7 내지 1.3 nm의 직경을 갖는 또는 2 내지 10 nm x 1 내지 5 마이크로미터, 6 내지 9 nm x 5 마이크로미터, 7 내지 15 nm x 0.5 내지 10 마이크로미터, 7 내지 12 nm x 0.5 내지 10 마이크로미터, 110 내지 170 nm x 5 내지 9 마이크로미터, 6 내지 13 nm x 2.5 내지 20 마이크로미터의 나노튜브 번들 직경을 갖는 단일-, 이중-, 및 다중-벽의 탄소 나노튜브가 포함된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB의 전달을 위한 물리적 작용제는 금, 규소, 세륨 또는 탄소와 같은 물질, 예를 들어, 금 또는 금-코팅 나노입자, 탄화규소 위스커(whisker), 카보런덤, 다공성 실리카 나노입자, 젤라틴/실리카 나노입자, 나노세리아(nanoceria) 또는 산화세륨 나노입자(CNP), 탄소 나노튜브(CNT), 예컨대 단일-, 이중-, 및 다중-벽의 탄소 나노튜브 및 이들의 화학적으로 작용화된 형태(예를 들어, 아미드, 아미노, 카복실산, 술폰산 또는 폴리에틸렌 글리콜 모이어티로 작용화된 탄소 나노튜브), 및 그래핀 또는 산화그래핀 또는 그래핀 복합체를 포함할 수 있다. SSAP, 엑소뉴클레아제 및/또는 SSB의 전달을 위해 조정될 수 있는 이러한 물리적 작용제는 문헌[Wong et al. (2016) Nano Lett., 16:1161 - 1172]; 문헌[Giraldo et al. (2014) Nature Materials, 13:400-409]; 문헌[Shen et al. (2012) Theranostics, 2:283 - 294]; 문헌[Kim et al. (2011) Bioconjugate Chem., 22:2558 - 2567]; 문헌[Wang et al. (2010) J. Am. Chem. Soc. Comm., 132:9274 - 9276]; 문헌[Zhao et al. (2016) Nanoscale Res. Lett., 11:195 - 203]; 및 문헌[Choi et al. (2016) J. Controlled Release, 235:222 - 235]에 개시된 것들을 포함한다. 또한, 예를 들어, 전부 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2010/0311168호, 제2012/0023619호, 제2012/0244569호, 제2013/0145488호, 제2013/0185823호, 제2014/0096284호, 제2015/0040268호, 제2015/0047074호 및 제2015/0208663호에 개시된 다양한 유형의 입자 및 나노입자, 이들의 제제, 및 예를 들어, 폴리뉴클레오티드 및 폴리펩티드를 세포에 전달하는 데 이들을 사용하기 위한 방법도 참조한다. 상기 언급된 임의의 구현예에서, 폴리뉴클레오티드 및/또는 폴리펩티드를 포함하는 게놈 편집 분자도 또한 상기 기술된 바와 같이 전달될 수 있는 것이 추가로 고려된다.

일부 구현예에서, 본원에 사용된 바와 같은 "제공된"은 세포의 핵 내에서 성분을 접촉시키는 것을 포함한다. 일부 구현예에서, 하나 이상의 성분의 제공은 폴리펩티드의 전달의 형태로 이루어진다. 일부 구현예에서, 하나 이상의 성분의 전달은 폴리뉴클레오티드와 복합체화된 폴리펩티드의 형태로 이루어진다. 일부 구현예에서, 하나 이상의 성분의 전달은 리보핵단백질(RNP)의 형태로 이루어진다. 일부 구현예에서, Cas 및 가이드 RNA는 리보핵단백질로서 전달된다. 일부 구현예에서, RNP는 리포펙션 또는 전기천공법을 사용하여 세포에 전달된다. 일부 구현예에서, 폴리펩티드 또는 RNP는 비올리스틱을 통해 세포에 전달된다. 일부 구현예에서, 폴리펩티드 또는 RNP는 PEG-매개된 트랜스펙션을 통해 세포에 전달된다. 일부 구현예에서, 성분은 유성 교배에 의해 전달된다.

일부 구현예에서, 성분은 RNA로서 또는 DNA로서 제공된다. 예를 들어, 일부 구현예에서, 하나 이상의 성분은 mRNA로서 제공된다. 일부 구현예에서, mRNA는 성분 중 하나인 단백질을 인코딩한다. 일부 구현예에서, mRNA는 세포에서 번역되어, 하나 이상의 성분을 생성한다.

일부 구현예에서, 하나 이상의 성분은 염색체 내로 통합된 핵산으로서 제공된다.

일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상은 i) 내지 v) 중 하나 이상을 포함하는 전구 세포에 의해 제공된다. 일부 구현예에서, 전구 세포는 본원에 기술된 세포, 예를 들어, 식물, 동물, 진균 또는 기타 진핵 세포 중 임의의 것이다. 일부 구현예에서, 전구 세포는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나를 포함하지 않는다. 일부 구현예에서, 전구 세포에 의해 포함되지 않는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나는 전구 세포로의 폴리펩티드, DNA 또는 mRNA의 전달 및/또는 전구 세포의 유성 교배에 의해 이후에 제공된다. 일부 구현예에서, 성분은 하기 표 A에 나타낸 바와 같이 제공된다.

[표 A]

xi. 유전자 편집 분자

유전자 편집 분자가 뉴클레아제 활성이 결핍된 RNA 가이드된 DNA 결합 폴리펩티드(또는 이들을 인코딩하는 폴리뉴클레오티드)를 추가로 포함하는 조성물에 제공되는 gRNA(또는 gRNA를 인코딩하는 폴리뉴클레오티드)를 포함하는 특정 구현예에서, 하나 이상의 화학적, 효소적 또는 물리적 작용제가 유사하게 사용될 수 있다. 특정 구현예에서, RNA 가이드 및 뉴클레아제 활성 결핍 RNA-가이드된 DNA 결합 폴리펩티드(ndRGDBP) 또는 이를 인코딩하는 폴리뉴클레오티드는 개별적으로, 예를 들어, 개별 조성물에서 제공된다. 이러한 조성물은 폴리뉴클레오티드 조성물에 유용한 것으로 상기 기술된 것들과 같은 다른 화학적 또는 물리적 작용제(예를 들어, 용매, 계면활성제, 단백질 또는 효소, 트랜스펙션 작용제, 미립자 또는 나노미립자)를 포함할 수 있다. 예를 들어, 다공성 실리카 나노입자는 DNA 재조합효소를 옥수수 세포 내로 전달하는 데 유용하며; 예를 들어, 문헌[Martin-Ortigosa et al. (2015) Plant Physiol., 164:537 - 547]을 참조하고, ndRGDBP 또는 이를 인코딩하는 폴리뉴클레오티드를 옥수수 또는 기타 식물 세포 내로 제공하기 위해 조정될 수 있다. 일 구현예에서, 폴리뉴클레오티드 조성물은 gRNA 및 ndRGDBP를 포함하며, 계면활성제 및 ndRGDBP에 작동 가능하게 연결될 수 있는 세포-투과 펩티드(CPP)를 추가로 포함한다. 일 구현예에서, 폴리뉴클레오티드 조성물은 gRNA 및 ndRGDBP 둘 모두를 인코딩하는 플라스미드 또는 바이러스 벡터를 포함하며, 계면활성제 및 탄소 나노튜브를 추가로 포함한다. 일 구현예에서, 폴리뉴클레오티드 조성물은 다수의 gRNA 및 ndRGDBP를 인코딩하는 mRNA를 포함하며, 입자(예를 들어, 금 또는 텅스텐 입자)를 추가로 포함하며, 폴리뉴클레오티드 조성물은 비올리스틱에 의해 식물 세포 또는 식물 원형질체로 전달된다. 상기 언급된 구현예 중 임의의 것에서, 게놈 편집 분자를 포함하는 다른 관심 폴리뉴클레오티드가 또한, gRNA 및 ndRGDBP의 전달 이전에, 그 동안 또는 그 이후에 전달될 수 있는 것이 추가로 고려된다.

특정 구현예에서, 식물 세포가 수득되거나 단리되는 식물, 식물 외식편 또는 식물 부분을, 식물 세포를 수득하거나, 단리하거나, 처리하는 과정에서 하나 이상의 화학적, 효소적 또는 물리적 작용제(들)로 처리한다. 특정 구현예에서, 식물 세포, 식물, 식물 외식편 또는 식물 부분을 연마제, 가성제, 계면활성제, 예컨대 Silwet L-77 또는 양이온성 지질 또는 셀룰라제와 같은 효소로 처리한다. 상기 언급된 구현예 중 임의의 것에서, 게놈 편집 분자를 포함하는 다른 관심 폴리뉴클레오티드가 또한, HDR 촉진제의 전달 이전에, 그 동안 또는 그 이후에 전달될 수 있는 것이 추가로 고려된다.

특정 구현예에서, 개별적으로 또는 HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드 조성물과 함께, 화학적, 효소적 또는 물리적 작용제 중 하나 이상은 식물 세포가 처리되거나, 수득되거나, 단리되는 식물 위치, 부분 또는 조직 이외의 식물 또는 식물 부분 내의 위치에 제공/적용된다. 특정 구현예에서, 폴리뉴클레오티드 조성물은 인접 또는 원위 세포 또는 조직에 적용되며, 식물 세포가 이후에 단리되는 분열조직에 (예를 들어, 관다발계를 통해 또는 세포-대-세포 이동에 의해) 수송된다. 특정 구현예에서, 폴리뉴클레오티드-함유 조성물은 종자 또는 종자 단편 또는 접합자 또는 체세포 배를 폴리뉴클레오티드-함유 조성물에 소킹함으로써 적용되며, 이에 의해, 폴리뉴클레오티드는 식물 세포에 전달된다. 특정 구현예에서, 꽃눈 또는 경단(shoot tip)을 폴리뉴클레오티드-함유 조성물과 접촉시킴으로써, 폴리뉴클레오티드는 원하는 식물 세포가 수득되는 꽃눈 또는 경단 내의 세포로 전달된다. 특정 구현예에서, 폴리뉴클레오티드-함유 조성물을 식물의 또는 식물의 부분(예를 들어, 잎 표면)의 표면에 적용함으로써, 폴리뉴클레오티드(들)는 원하는 식물 세포가 수득되는 식물의 조직으로 전달된다. 특정 구현예에서, 전체 식물 또는 식물 조직은 폴리뉴클레오티드-함유 조성물의 입자- 또는 나노입자-매개된 전달(예를 들어, 비올리스틱 또는 탄소 나노튜브 또는 나노입자 전달)로 처리됨으로써, 폴리뉴클레오티드(들)는 식물 세포가 이후에 수득되는 세포 또는 조직으로 전달된다. 상기 언급된 구현예 중 임의의 것에서, 게놈 편집 분자를 포함하는 다른 관심 폴리뉴클레오티드가 또한, HDR 촉진제의 전달 이전에, 그 동안 또는 그 이후에 전달될 수 있는 것이 추가로 고려된다.

게놈 편집 분자는 본원에 제공되는 증가된 HDR-매개된 게놈 변형 빈도를 갖는 식물 세포에서 유전학적 변형을 유도하기 위한 유전자 편집 분자를 포함한다. 특정 구현예에서, 이러한 게놈 편집 분자는 하기를 포함할 수 있다: (i) RNA-가이드된 뉴클레아제를 위한 RNA 가이드, RNA-가이드된 뉴클레아제를 위한 RNA 가이드를 인코딩하는 DNA로 이루어진 군으로부터 선택되는 폴리뉴클레오티드; (ii) RNA-가이드된 뉴클레아제, RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9, nCas9, V형 Cas 뉴클레아제, Cas12a, nCas12a, CasY, CasX, Cas12b, Cas12c, Cas12i, Cas14, 엔지니어링된 뉴클레아제, 코돈-최적화된 뉴클레아제, 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제로 이루어진 군으로부터 선택되는 뉴클레아제; (iii) 표적 뉴클레오티드 서열의 부위-특이적 절단을 유발할 수 있는 하나 이상의 뉴클레아제를 인코딩하는 폴리뉴클레오티드; 및/또는 (iv) 공여자 주형 DNA 분자. 특정 구현예에서, 적어도 하나의 전달제는 용매, 플루오로카본, 글리콜 또는 폴리올, 계면활성제; 일차, 이차 또는 삼차 아민 및 사차 암모늄 염; 오르가노실리콘 계면활성제; 지질, 지질단백질, 지질다당류; 산, 염기, 가소제; 펩티드, 단백질 또는 효소; 세포-투과 펩티드; RNase 저해제; 양이온성 분지형 또는 선형 폴리머; 덴드리머; 반대-이온, 아민 또는 폴리아민, 삼투물질, 완충제 및 염; 폴리뉴클레오티드; 트랜스펙션 작용제; 항생제; 킬레이트제, 예컨대 옥살산암모늄, EDTA, EGTA 또는 사이클로헥산 디아민 테트라아세테이트, 비-특이적인 DNA 이중-가닥-파단-유도제; 및 산화방지제; 입자 또는 나노입자, 자성 입자 또는 나노입자, 연마제 또는 파상제, 니들 또는 마이크로니들, 매트릭스 및 그리드로 이루어진 군으로부터 선택된다. 특정 구현예에서, 본원에 제공되는 세포를 포함하는 진핵 세포(예를 들어, 식물 세포), 시스템, 방법 또는 조성물은 (a) 적어도 하나의 Cas9, nCas9, Cas12a, nCas12a, CasY, CasX, Cas12b, Cas12c 또는 Cas12i 뉴클레아제 또는 닉카제를 갖는 적어도 하나의 세포; (b) 적어도 하나의 가이드 RNA; 및 (c) 선택적으로, 적어도 하나의 화학적, 효소적 또는 물리적 전달제를 추가로 포함한다.

본원에 제공된 세포, 시스템, 방법, 조성물 및 반응 혼합물에 사용되는 유전자 편집 분자는 이중-가닥 DNA 내에, 예컨대 게놈 DNA 내에 또는 게놈 DNA 내에 위치한 표적 유전자 및 동반 가이드 RNA 또는 공여자 주형 폴리뉴클레오티드 내에 이중-가닥 파단("DSB")을 도입할 수 있는 분자를 포함한다. 이러한 유전자 편집 분자의 예는 하기를 포함한다: (a) RNA-가이드된 뉴클레아제, RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9, nCas9 닉카제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, nCas12a 닉카제, CasY, CasX, Cas12b, Cas12c, Cas12i, Cas14 엔지니어링된 뉴클레아제, 코돈-최적화된 뉴클레아제, 아연-핑거 뉴클레아제(ZFN) 또는 닉카제, 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제) 또는 닉카제, 아르고노트 및 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제로 이루어진 군으로부터 선택되는 뉴클레아제; (b) 표적 편집 부위의 부위-특이적 변경(예컨대 DSB의 도입)을 유발할 수 있는 하나 이상의 뉴클레아제를 인코딩하는 폴리뉴클레오티드; (c) RNA-가이드된 뉴클레아제를 위한 가이드 RNA(gRNA) 또는 RNA-가이드된 뉴클레아제를 위한 gRNA를 인코딩하는 DNA; 및 (d) 공여자 주형 폴리뉴클레오티드.

CRISPR-형 게놈 편집은 본원에 제공된 진핵 세포(예를 들어, 식물 세포), 시스템, 방법 및 조성물에 사용하기 위하여 몇몇의 방식으로 조정될 수 있다. CRISPR 요소, 즉, CRISPR 엔도뉴클레아제 및 CRISPR 단일-가이드 RNA 또는 이를 인코딩하는 폴리뉴클레오티드를 포함하는 유전자 편집 분자는 자손에서 발생하는 CRISPR 요소 또는 선택적 유전학적 마커의 잔류물 없이 게놈 편집을 유발하는 데 유용하다. 특정 구현예에서, CRISPR 요소는 단리된 분자로서, 무세포 합성 과정(예를 들어, 시험관내 번역)의 단리된 또는 반-정제된 생성물로서, 또는 세포-기반 합성 과정(예를 들어, 예컨대 박테리아 또는 기타 세포 용해물)에서의 단리된 또는 반-정제된 생성물로서 진핵 세포(예를 들어, 식물 세포), 시스템, 방법 및 조성물에 직접적으로 제공된다. 특정 구현예에서, 게놈-삽입된 CRISPR 요소는 본원에서 제공하는 시스템, 방법 및 조성물에 사용하기 위해 조정된 식물 계통에서 유용하다. 특정 구현예에서, 본원에 제공된 시스템, 방법 및 조성물에 사용되는 식물 또는 식물 세포는 CRISPR 엔도뉴클레아제(예를 들어, Cas9, Cpf1-형 또는 기타 CRISPR 엔도뉴클레아제)를 발현하는 전이유전자를 포함할 수 있다. 특정 구현예에서, 독특한 PAM 인식 부위를 갖는 하나 이상의 CRISPR 엔도뉴클레아제가 사용될 수 있다. 가이드 RNA(sgRNA 또는 crRNA 및 tracrRNA)는 프로토스페이서 인접 모티프(PAM) 서열에 인접한 gDNA 표적 편집 부위의 서열에 특이적으로 결합할 수 있는 RNA-가이드된 엔도뉴클레아제/가이드 RNA 복합체를 형성한다. RNA-가이드된 엔도뉴클레아제의 유형은 전형적으로 적합한 PAM 부위의 위치 및 crRNA 또는 sgRNA의 설계에 영향을 미친다. G-풍부 PAM 부위, 예를 들어, 5'-NGG는 전형적으로 Cas9 단백질과 함께 사용되는 crRNA 또는 sgRNA의 설계를 위해 표적화된다. T-풍부 PAM 부위(예를 들어, 5'-TTTV [1], 여기서 "V"는 A, C 또는 G임)는 전형적으로 Cas12a 단백질과 함께 사용되는 crRNA 또는 sgRNA의 설계를 위해 표적화된다(예를 들어, SEQ ID NO:27, 28, 29 및 30). Cpf1 엔도뉴클레아제 및 상응하는 가이드 RNA 및 PAM 부위는 미국 특허 출원 공개 제2016/0208243 A1호에 개시되어 있으며, 이는 Cpf1 엔도뉴클레아제 및 가이드 RNA 및 PAM 부위를 인코딩하는 DNA의 그의 개시에 대하여 본원에 참조로 포함된다. 식물 게놈 내로 통합되거나 달리 식물에 제공되는 CRISPR 엔도뉴클레아제와 상호작용하는 매우 다양한 CRISPR 가이드 RNA 중 하나 이상의 도입은 원하는 표현형 또는 형질을 제공하기 위한 유전학적 편집을 위해, 형질 스크리닝을 위해 또는 유전자 편집 매개된 형질 이입을 위해(예를 들어, 반복친으로의 역교배 없이 또는 반복친으로의 제한된 역교배와 함께 형질을 새로운 유전자형에 도입하기 위해) 유용하다. 다중 엔도뉴클레아제는 염색체 DNA 또는 에피솜 DNA 중 어느 하나에서 공간적으로 또는 시간적으로 분리된 방식으로 다수의 게놈 편집을 허용하도록 적절한 프로모터를 갖는 발현 카세트에 제공될 수 있다.

진핵생물의 유전자를 편집하기 위한 CRISPR 기술은 미국 특허 출원 공개 제2016/0138008A1호 및 제US2015/0344912A1호, 및 미국 특허 제8,697,359호, 제8,771,945호, 제8,945,839호, 제8,999,641호, 제8,993,233호, 제8,895,308호, 8,865,406호, 제8,889,418호, 제8,871,445호, 제8,889,356호, 제8,932,814호, 제8,795,965호, 및 제8,906,616호에 개시된다. Cpf1 엔도뉴클레아제 및 상응하는 가이드 RNA 및 PAM 부위는 미국 특허 출원 공개 제2016/0208243 A1호에 개시된다. 게놈을 편집하는 데 유용한 다른 CRISPR 뉴클레아제는 Cas12b 및 Cas12c(문헌[Shmakov et al. (2015) Mol. Cell, 60:385 - 397] 참조) 및 CasX 및 CasY(문헌[Burstein et al. (2016) Nature, doi:10.1038/nature21059] 참조)를 포함한다. CRISPR 가이드 RNA 및 식물 코돈-최적화된 CRISPR Cas9 엔도뉴클레아제를 발현하기 위한 식물 RNA 프로모터는 국제 특허 출원 제PCT/US2015/018104호(WO 2015/131101호로서 공개 및 미국 가출원 제61/945,700호에 대해 우선권 주장)에 개시된다. 식물에서 게놈 편집을 위한 CRISPR 기술의 이용 방법은 미국 특허 출원 공개 제US 2015/0082478A1호 및 제US 2015/0059010A1호 및 국제 특허 출원 제PCT/US2015/038767 A1호(WO 2016/007347호로서 공개 및 미국 가출원 제62/023,246호에 대해 우선권 주장)에 개시된다. 이 단락에서 언급된 모든 특허 공보는 그들 전체가 본원에 참조로 포함된다. 특정 구현예에서, 엔도뉴클레아제 인식 서열에서 표적 편집 부위의 절단 후에 블런트 말단을 남기는 RNA-가이드된 엔도뉴클레아제가 사용된다. 블런트-말단 절단 RNA-가이드된 엔도뉴클레아제는 Cas9, Cas12c 및 Cas12h를 포함한다(문헌[Yan et al., 2019]). 특정 구현예에서, 엔도뉴클레아제 인식 서열의 절단 후에 스태거형(staggered) 단일 가닥 DNA 오버행 말단을 남기는 RNA-가이드된 엔도뉴클레아제가 사용된다. 스태거형-말단 절단 RNA-가이드된 엔도뉴클레아제는 Cas12a, Cas12b 및 Cas12e를 포함한다.

방법, 시스템, 조성물, 진핵 세포(예를 들어, 식물 세포)는 또한 표적 편집 부위 내의 엔도뉴클레아제 인식 서열에서 dsDNA 내에 단일의 DNA 가닥을 절단하는 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 사용할 수 있다. dsDNA 표적 편집 부위에서의 단일의 DNA 가닥의 이러한 절단은 또한 본원 및 다른 곳에서 "닉킹"으로 지칭되며, 다양한 "닉카제" 또는 닉킹을 제공하는 시스템에 의해 시행될 수 있다. 사용될 수 있는 닉카제는 nCas9(D10A 아미노산 치환을 포함하는 Cas9), nCas12a(예를 들어, R1226A 아미노산 치환을 포함하는 Cas12a; 문헌[Yamano et al., 2016]), Cas12i(문헌[Yan et al. 2019], 예를 들어, 문헌[Kim et al., 2012]에 개시된 바와 같은 아연 핑거 닉카제), TALE 닉카제(예를 들어, 문헌[Wu et al., 2014]에 개시된 바와 같음) 또는 이들의 조합을 포함한다. 특정 구현예에서, 닉킹을 제공하는 시스템은 Cas 뉴클레아제(예를 들어, Cas9 및/또는 Cas12a) 및 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 가이드 RNA 분자를 포함할 수 있다(문헌[Fu et al., 2019]). 특정 구현예에서, 게놈 변형은 약 10개, 20개, 30개, 40개, 50개, 60개, 80개, 100개, 150개 또는 200개 이하의 염기쌍의 DNA에 의해 분리된 게놈 위치에서 단일 가닥 파단(즉, "닉")을 생성함으로써 표적 편집 부위 내로 도입될 수 있다. 특정한 예시적인 및 비제한적인 구현예에서, 2개의 닉카제(즉, nCas9, nCas12a, Cas12i, 아연 핑거 닉카제, TALE 닉카제, 이들의 조합 등을 포함하는 단일 가닥 DNA 파단을 도입하는 CAS 뉴클레아제) 또는 닉카제 시스템은 약 10개, 20개, 30개, 40개, 50개, 60개, 80개 또는 100개 이하의 염기쌍의 DNA에 의해 분리된 인접 부위에 대하여 절단을 이루도록 유도될 수 있다. RNA 가이드된 닉카제 및 RNA 가이드가 사용되는 경우에, RNA 가이드는 충분히 가까운(즉, 약 10개, 20개, 30개, 40개, 50개, 60개, 80개, 100개, 150개 또는 200개 이하의 염기쌍의 DNA에 의해 분리된) PAM 서열에 인접한다. 닉카제 또는 닉카제 시스템이 사용되는 상기 언급된 구현예 중 임의의 것에서, 한 가닥 내에 내부 파단을 갖는 dsDNA 기질을 인식할 수 있는 5'에서 3' 또는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제가 사용될 수 있다. 특정 구현예에서, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질은 닉카제 또는 닉카제 시스템, SSAP 및 SSB와 함께 사용될 수 있다.

유전자 편집을 위하여, CRISPR 어레이는 원하는 표적 DNA 서열에 상응하는 하나의 또는 다수의 가이드 RNA 서열을 함유하도록 설계될 수 있으며; 예를 들어, 문헌[Cong et al. (2013) Science, 339:819-823]; 문헌[Ran et al. (2013) Nature Protocols, 8:2281 - 2308]을 참조한다. 적어도 16개 또는 17개 뉴클레오티드의 gRNA 서열은 DNA 절단이 발생하기 위하여 Cas9에 의해 요구되며; Cpf1에 있어서, 적어도 16개 뉴클레오티드의 gRNA 서열은 검출 가능한 DNA 절단을 달성하기 위하여 필요하며, 적어도 18개 뉴클레오티드의 gRNA 서열은 시험관내에서의 효율적인 DNA 절단에 필요한 것으로 보고되었으며; 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다. 실시에서, 가이드 RNA 서열은 일반적으로 17개 내지 24개 뉴클레오티드(빈번하게 19개, 20개 또는 21개의 뉴클레오티드)의 길이를 갖고 표적화된 유전자 또는 핵산 서열에 대하여 정확한 상보성(즉, 완벽한 염기-쌍형성)을 갖도록 설계되며; 표적 서열에 대하여 100% 미만의 상보성을 갖는 가이드 RNA가 사용될 수 있지만(예를 들어, 20개 뉴클레오티드의 길이 및 표적 서열에 대하여 1개 내지 4개의 불일치를 갖는 gRNA), 오프-표적 효과 가능성을 증가시킬 수 있다. 식물 게놈 편집에 사용하기 위한 효율적인 가이드 RNA의 설계는 미국 특허 출원 공개 제2015/0082478 A1호에 개시되며, 이의 전체 명세서는 본원에 참조로 포함된다. 더욱 최근에, 효율적인 유전자 편집은 자연 발생 crRNA-tracrRNA 복합체를 모방하고 tracrRNA(뉴클레아제에 결합하기 위함) 및 적어도 하나의 crRNA(뉴클레아제를 편집을 위해 표적화된 서열로 가이드하기 위함) 둘 모두를 함유하는 엔지니어링된(합성) 단일 RNA 분자인, 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 달성된 바 있으며; 예를 들어, 문헌[Cong et al. (2013) Science, 339:819 - 823]; 문헌[Xing et al. (2014) BMC Plant Biol., 14:327 - 340]을 참조한다. 화학적으로 변형된 sgRNA는 게놈 편집에서 효율적인 것으로 입증된 바 있으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다. 식물 게놈 편집에 사용하기 위한 효율적인 gRNA의 설계는 미국 특허 출원 공개 제2015/0082478 A1호에 개시되어 있으며, 이의 전체 명세서는 본원에 참조로 포함된다.

본원에 제공된 시스템, 방법 및 조성물에서 표적 뉴클레오티드 서열의 부위-특이적 변형을 시행할 수 있는 다른 서열-특이적 엔도뉴클레아제는 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제 또는 TALEN), 아르고노트 단백질 및 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함한다. 아연 핑거 뉴클레아제(ZFN)는 핵산 절단 도메인, 예를 들어, 뉴클레아제에 융합된 아연 핑거 DNA-결합 도메인을 포함하는 엔지니어링된 단백질이다. 아연 핑거 결합 도메인은 특이성을 제공하며, 임의의 원하는 표적 DNA 서열을 특이적으로 인식하도록 엔지니어링될 수 있다. 식물 및 기타 유기체에서의 ZFN의 구축 및 이용의 검토를 위하여, 예를 들어, 문헌[Urnov et al. (2010) Nature Rev. Genet., 11:636 - 646]을 참조한다. 아연 핑거 DNA 결합 도메인은 아연 핑거 단백질(ZFP)로 지칭되는 큰 부류의 진핵 전사 인자의 DNA-결합 도메인으로부터 유래된다. ZFP의 DNA-결합 도메인은 전형적으로 적어도 3개의 아연 "핑거"의 탠덤 어레이를 함유하며, 각각은 특이적인 DNA의 트리플렛(triplet)을 인식한다. 다수의 전략을 사용하여 아연 핑거 결합 도메인의 결합 특이성을 설계할 수 있다. "모듈러 어셈블리(modular assembly)"로 지칭되는 한 접근법은 DNA에 대한 개별 아연 핑거의 기능적 자율성에 좌우된다. 이 접근법에서, 제공된 서열은 서열 내의 각각의 성분 트리플렛에 대한 아연 핑거를 확인하고, 이들을 멀티핑거 펩티드에 연결함으로써 표적화된다. 아연 핑거 DNA 결합 도메인을 설계하기 위한 몇몇의 대안적인 전략도 또한 개발된 바 있다. 이들 방법은 아연 핑거가 그들의 표적 트리플렛 외측의 뉴클레오티드 염기뿐만 아니라 이웃 핑거와 접촉하는 능력을 제공하도록 설계된다. 전형적으로, 엔지니어링된 아연 핑거 DNA 결합 도메인은 자연-발생 아연 핑거 단백질에 비하여 신규한 결합 특이성을 갖는다. 엔지니어링 방법은 예를 들어, 합리적인 설계 및 다양한 유형의 선택을 포함한다. 합리적인 설계는 예를 들어, 트리플렛(또는 쿼드러플(quadruple)) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열의 데이터베이스의 이용을 포함하며, 각각의 트리플렛 또는 쿼드러플 뉴클레오티드 서열은 특정 트리플렛 또는 쿼드러플 서열에 결합하는 아연 핑거의 하나 이상의 아미노산 서열과 연관된다. 예를 들어, 미국 특허 제6,453,242호 및 제6,534,261호를 참조하며, 둘 모두 본원에 전체가 참조로 포함된다. 예시적인 선택 방법(예를 들어, 파지 디스플레이 및 효모 2-하이브리드 시스템)이 널리 알려져 있으며, 문헌에 기술되어 있다. 또한, 아연 핑거 결합 도메인에 대한 결합 특이성의 향상은 본원에 전체가 참조로 포함되는 미국 특허 제6,794,136호에 기술된 바 있다. 또한, 개별 아연 핑거 도메인은 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 링커 서열의 예는 공개적으로 알려져 있으며, 예를 들어, 본원에 전체가 참조로 포함되는 미국 특허 제6,479,626호; 제6,903,185호; 및 제7,153,949호를 참조한다. 핵산 절단 도메인은 비-특이적이며, 전형적으로, 제한 엔도뉴클레아제, 예컨대 Fokl이다. 이 엔도뉴클레아제는 DNA를 절단하기 위하여 이량체화되어야 한다. 따라서, ZFN의 부분으로서 Fokl에 의한 절단은 2개의 인접하고 독립적인 결합 이벤트를 필요로 하며, 이는 이량체 형성을 허용하기 위해 올바른 배향에서, 그리고 적절한 간격으로 발생해야 한다. 2개의 DNA 결합 이벤트에 대한 요건은 길고 잠재적으로 고유한 인식 부위의 보다 특이적인 표적화를 가능하게 한다. 향상된 활성을 갖는 Fokl 변이체가 기술된 바 있으며; 예를 들어, 문헌[Guo et al. (2010) J. Mol. Biol., 400:96 - 107]을 참조한다.

전사 활성화인자 유사 이펙터(TALE)는 숙주 식물에서 유전자 발현을 조절하기 위하여, 그리고 박테리아에 의한 콜로니화 및 그의 생존을 용이하게 하기 위하여 특정 잔토모나스(Xanthomonas) 종에 의해 분비되는 단백질이다. TALE는 전사 인자로서 작용하고 식물에서 저항성 유전자의 발현을 조절한다. TALE의 최근의 연구에서 TALE의 반복 영역을 그들의 표적 DNA-결합 부위와 연결하는 규칙이 드러났다. TALE는 대부분 33개 또는 34개 아미노산 세그먼트의 탠덤 반복부로 이루어진 고도로 보존되고 반복적인 영역을 포함한다. 반복 단량체는 주로 아미노산 위치 12 및 13에서 서로 상이하다. 위치 12 및 13의 고유한 아미노산 쌍과 TALE-결합 부위의 상응하는 뉴클레오티드 간에 강력한 상관관계가 발견된 바 있다. TALE 결합 도메인의 아미노산 서열과 DNA 인식 사이의 단순한 관계는 임의의 원하는 특이성의 DNA 결합 도메인의 설계를 가능하게 한다. TALE는 비-특이적 DNA 절단 도메인에 연결되어 TAL-이펙터 뉴클레아제 또는 TALEN으로 지칭되는 서열-특이적 엔도뉴클레아제를 제조할 수 있다. ZFN의 경우에서와 같이, Fokl과 같은 제한 엔도뉴클레아제가 편리하게 사용될 수 있다. 식물에서 TALEN의 사용에 대한 설명에 대해서는, 문헌[Mahfouz et al. (2011) Proc. Natl. Acad. Sci. USA, 108:2623 - 2628] 및 문헌[Mahfouz (2011) GM Crops, 2:99 - 103]을 참조한다.

아르고노트는 아르고노트를 표적 뉴클레오티드 서열에 가이드하고, 표적 뉴클레오티드 서열의 부위-특이적 변경을 시행하는 표적 뉴클레오티드 서열에 대하여 상보적인 서열을 포함하는 폴리뉴클레오티드(예를 들어, 단일-가닥 DNA 또는 단일-가닥 RNA)에 결합함으로써 서열-특이적 엔도뉴클레아제로서 기능할 수 있는 단백질이며; 예를 들어, 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2015/0089681호를 참조한다.

일부 구현예에서, 엔도뉴클레아제는 엔도뉴클레아제 인식 서열에 결합한다. 일부 구현예에서, 엔도뉴클레아제는 엔도뉴클레아제 인식 서열을 절단한다. 일부 구현예에서, 용어 "엔도뉴클레아제 인식 서열"은 엔도뉴클레아제 절단 부위 서열과 상호교환 가능하게 사용된다.

일부 구현예에서, 엔도뉴클레아제가 필요하지 않다. 일부 구현예에서, 당해 방법은 비-특이적으로 이중 가닥 파단을 도입하는 화합물을 제공함으로써 수행된다. 예시적인 이중 가닥 파단 유도 화합물은 하이드로퀴논(HQ), 벤조퀴논(BQ), 벤젠트리올(BT), 과산화수소(H2O2), 블레오마이신(BLM) 또는 아스코르브산나트륨(Vit C)을 포함하며, 이는 이중 가닥 파단을 도입하기 위해 사용된다.

본원에 제공되는 방법, 시스템, 진핵 세포(예를 들어, 식물 세포) 및 조성물에서 사용되는 공여자 주형 DNA 분자는 5'에서 3'으로, 제1 상동성 아암, 대체 DNA 및 제2 상동성 아암을 포함하는 DNA 분자를 포함하며, 상동성 아암은 gDNA 내의 엔도뉴클레아제 인식 서열에 측접한 게놈 DNA(gDNA) 서열에 부분적으로 또는 완전히 상동성인 서열을 함유하며, 대체 DNA는 표적 gDNA에 비하여 1개 이상의 DNA 염기쌍의 삽입, 결실 또는 치환을 포함할 수 있다. 특정 구현예에서, 공여자 DNA 주형 상동성 아암은 약 20개, 50개, 100개, 200개, 400개 또는 600개 내지 약 800개 또는 1000개 염기쌍 길이일 수 있다. 특정 구현예에서, 공여자 주형 DNA 분자는 원형(예를 들어, 플라스미드 또는 제미니바이러스 벡터를 포함하는 바이러스 벡터) 또는 선형 DNA 분자에서 진핵 세포(예를 들어, 식물 세포)에 전달될 수 있다. 특정 구현예에서, 사용되는 원형 또는 선형 DNA 분자는 5'에서 3'으로, 제1 카피의 엔도뉴클레아제 인식 서열, 제1 상동성 아암, 대체 DNA, 제2 상동성 아암 및 제2 카피의 엔도뉴클레아제 인식 서열을 포함하는 변형된 공여자 주형 DNA 분자를 포함할 수 있다. 이론에 의해 제한되고자 하지 않고, 이러한 변형된 DNA 공여자 주형 분자는 진핵 세포의 표적 편집 부위 게놈 DNA 내의 엔도뉴클레아제 인식 서열을 절단하는 데 사용되는 동일한 서열-특이적 엔도뉴클레아제에 의해 절단되어, 진핵 세포 게놈 내의 표적 편집 부위의 HDR-매개된 게놈 변형에 참여할 수 있는 공여자 주형 DNA 분자를 방출할 수 있다. 특정 구현예에서, 공여자 DNA 주형은 5'에서 3'으로, 절단된 엔도뉴클레아제 인식 서열, 제1 상동성 아암, 대체 DNA, 제2 상동성 아암 및 절단된 엔도뉴클레아제 인식 서열을 포함하는 선형 DNA 분자를 포함할 수 있다. 특정 구현예에서, 절단된 엔도뉴클레아제 서열은 블런트 DNA 말단, 또는 선택적으로 5' 포스페이트 기를 포함할 수 있는 블런트 DNA 말단을 포함할 수 있다. 특정 구현예에서, 절단된 엔도뉴클레아제 서열은 단일-가닥 5' 또는 3' DNA 오버행을 갖는 DNA 말단을 포함한다. 이러한 절단된 엔도뉴클레아제 인식 서열은 온전한 표적 서열을 절단하거나, 절단된 표적 서열-특이적 엔도뉴클레아제 인식 서열의 카피를 합성함으로써 생성될 수 있다. 공여자 DNA 주형은 화학적으로 또는 효소적으로(예를 들어, 중합효소 연쇄 반응(PCR)에서) 합성될 수 있다.

이중-가닥 DNA가 아닌 공여자 주형의 이용도 또한 고려된다. 예를 들어, 일부 구현예에서, 이중 가닥 DNA의 전구체가 제공된다. 일부 구현예에서, 역전사효소의 RNA 주형이 제공된다. 일부 구현예에서, 역전사효소가 RNA에 더하여 제공된다. 일부 구현예에서, 당해 방법은 단일 가닥 DNA 공여자 주형의 이용을 포함한다. 일부에서, 단일 또는 이중 가닥 RNA 주형이 사용된다. 일부 구현예에서, 당해 방법은 DNA/RNA 하이브리드의 이용을 포함한다. 일부 구현예에서, PNA를 사용하여 공여자 주형을 생성한다.

일부 구현예에서, 1가지 초과의 공여자 주형이 제공된다. 일부 구현예에서, 2가지, 3가지, 4가지, 5가지, 6가지, 7가지, 8가지, 9가지, 10가지 이상의 공여자 주형이 제공된다. 일부 구현예에서, 공여자 주형은 동일한 유전자를 표적화한다. 일부 구현예에서, 공여자 주형은 동일한 경로의 상이한 유전자를 표적화한다. 일부 구현예에서, 공여자 주형은 동일한 기능을 수행하는 다수의 유전자를 표적화한다.

본원에 제공되는 식물 세포 및 방법에서 사용되는 다른 게놈 편집 분자는 전이유전자 또는 이를 포함하는 벡터를 갖는 식물 또는 세포 상에서 사용될 수 있다. 이러한 전이유전자는 제초제 내성, 해충 내성(예를 들어, 곤충, 선충 또는 식물 병원성 진균 및 박테리아에 대한 내성), 개선된 수율, 증가된 및/또는 정량적으로 개선된 오일, 전분 및 단백질 함량, 개선된 무생물적 스트레스 내성(예를 들어, 개선된 또는 향상된 물 이용 효율 또는 내건성, 삼투 스트레스 내성, 고 염분 스트레스 내성, 고온 스트레스 내성, 향상된 저온 내성, 예를 들어, 저온 발아 내성) 등을 포함하는 유용한 형질을 부여할 수 있다. 이러한 전이유전자는 외인성 단백질의 발현에 의해 형질을 부여하는 전이유전자 및 내인성 식물 유전자의 발현을 저해함으로써(예를 들어, 내인성 식물 유전자의 발현을 저해하는 siRNA 반응을 유도함으로써) 형질을 부여하는 전이유전자 둘 모두를 포함한다. 이러한 형질을 제공할 수 있는 전이유전자는 미국 특허 출원 공개 제20170121722호 및 제20170275636호에 개시되며, 이는 각각 이러한 개시내용에 관하여 구체적으로, 그들 전체가 본원에 참조로 포함된다.

일부 구현예에서, 상기 언급된 SSAP, 엑소뉴클레아제 및/또는 SSB 및/또는 게놈 편집 분자 중 임의의 것을 인코딩하는 하나 이상의 폴리뉴클레오티드의 발현을 유도하는 하나 이상의 폴리뉴클레오티드 또는 벡터는 진핵 세포(예를 들어, 식물 세포) 내로 도입된다. 특정 구현예에서, 폴리뉴클레오티드 벡터는 SSAP, 엑소뉴클레아제 및/또는 SSB 또는 게놈 편집 분자를 인코딩하는 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터와 같은 조절 요소를 포함한다. 이러한 구현예에서, 이들 폴리뉴클레오티드의 발현은 적절한 프로모터, 특히 진핵 세포(예를 들어, 식물 세포)에서 기능성인 프로모터의 선택에 의해 제어될 수 있으며; 유용한 프로모터는 구성성, 조건성, 유도성 및 시간적으로 또는 공간적으로 특이적인 프로모터(예를 들어, 조직 특이적 프로모터, 발생적으로 조절되는 프로모터 또는 세포 사이클 조절된 프로모터)를 포함한다. 식물 세포에서 사용될 수 있는 발생적으로 조절되는 프로모터는 인지질 전달 단백질(PLTP), 프룩토스-1,6-비스포스파타제 단백질, NAD(P)-결합 로스만(Rossmann)-폴드(Fold) 단백질, 지방세포 원형질막-회합 단백질-유사 단백질, Rieske [2Fe-2S] 철-황 도메인 단백질, 엽록체호흡 환원(chlororespiratory reduction) 6 단백질, D-글리세레이트 3-키나제, 엽록체-유사 단백질, 엽록소 a-b 결합 단백질 7, 엽록체-유사 단백질, 자외선-B-억제성 단백질, Soul 헴-결합 과 단백질, 광계 I 반응 중심 서브유닛 psi-N 단백질, 및 단쇄 데하이드로게나제/환원효소 단백질을 포함하며, 이는 구체적으로 이러한 개시내용에 관하여 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호에 개시된다. 특정 구현예에서, 프로모터는 다중의 가이드 RNA를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결되며, 가이드 RNA를 인코딩하는 서열은 절단 부위, 예컨대 마이크로RNA 인식/절단 부위 또는 자가-절단 리보자임을 인코딩하는 뉴클레오티드 서열에 의해 분리된다(예를 들어, 문헌[Ferr

-D'Amar

and Scott (2014) Cold Spring Harbor Perspectives Biol., 2:a003574] 참조). 특정 구현예에서, 프로모터는 하나 이상의 가이드 RNA를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 RNA 중합효소 III 프로모터이다. 특정 구현예에서, 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터는 진핵 세포(예를 들어, 식물 세포)에서 유전자 발현을 유도하는 구성성 프로모터이다. 특정 구현예에서, 프로모터는 핵에서 또는 세포소기관, 예컨대 엽록체 또는 미토콘드리아에서 유전자 발현을 유도한다. 식물에 사용하기 위한 구성성 프로모터의 예는 미국 특허 제5,858,742호 및 제5,322,938호에 개시된 바와 같은 CaMV 35S 프로모터, 미국 특허 제5,641,876호에 개시된 바와 같은 벼 액틴 프로모터, 미국 특허 제7,151,204호에 개시된 바와 같은 옥수수 엽록체 알돌라제 프로모터, 및 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 유래의 노팔린 신타제(NOS) 및 옥토핀 신타제(OCS) 프로모터를 포함한다. 특정 구현예에서, 게놈-편집 시스템의 요소를 인코딩하는 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터는 현삼 모자이크 바이러스(FMV) 유래의 프로모터, RUBISCO 프로모터 또는 광합성 조직에서 활성인 피루베이트 포스페이트 디키나제(PPDK) 프로모터이다. 다른 고려되는 프로모터는 세포-특이적 또는 조직-특이적 또는 발생적으로 조절된 프로모터, 예를 들어, 핵산 표적화 시스템의 발현을 생식선 또는 생식 세포에 제한하는 프로모터(예를 들어, 생식선 또는 생식 세포에서 특이적으로 발현되는 DNA 리가제, 재조합효소, 복제효소를 인코딩하는 유전자, 또는 기타 유전자의 프로모터)를 포함한다. 특정 구현예에서, 게놈 변경은 DNA가 이후의 세대에 유전되는 세포에만 제한되며, 이는 유전독성 또는 다른 원치않는 효과를 피하기 위하여 게놈-편집 시스템의 발현이 제한되는 것이 바람직한 경우에 유리하다. 이 단락에 언급된 모든 특허 공보는 본원에 전체가 참조로 포함된다.

본원에 제공되는 발현 벡터 또는 폴리뉴클레오티드는 전사를 종료하기 위한 신호로서 작용하고, 생성된 mRNA의 폴리아데닐화를 유도하고, 또한 프로모터 활성을 뒷받침할 수 있는 DNA 세그먼트를 발현 카세트의 3' 말단 근처에 함유할 수 있다. 이러한 3' 요소는 흔히 "3'-비번역 영역" 또는 "3'-UTR" 또는 "폴리아데닐화 신호"로 지칭된다. 일부 경우에, 식물 유전자-기반의 3' 요소(또는 종결인자)는 3'-UTR 및 하류 비-전사 서열 둘 모두로 이루어진다(문헌[Nuccio et al., 2015]). 유용한 3' 요소는 하기를 포함한다: 본원에 참조로 포함되는 미국 특허 제6,090,627호에 개시된 아그로박테리움 투메파시엔스 nos 3', tml 3', tmr 3', tms 3', ocs 3' 및 tr7 3' 요소, 및 본원에 참조로 포함되는 미국 특허 출원 공개 제2002/0192813 A1호에 개시된, 밀(트리티쿰 아에스티붐(Triticum aestivum)) 유래의 열 충격 단백질 17, 유비퀴틴 및 프룩토스-1,6-비포스파타제 유전자, 및 벼(오리자 사티바) 유래의 글루텔린, 락테이트 데하이드로게나제 및 베타-투불린 유전자와 같은 식물 유전자 유래의 3' 요소.

특정 구현예에서, 발현 카세트를 포함하는 벡터 또는 폴리뉴클레오티드는 추가의 성분, 예를 들어, 약물 저항성을 인코딩하는 폴리뉴클레오티드 또는 제초제 유전자, 또는 검출 가능한 마커, 예컨대 녹색 형광 단백질(GFP) 또는 베타-글루쿠로니다제(gus)를 인코딩하는 폴리뉴클레오티드를 포함하여, 벡터 또는 폴리뉴클레오티드를 발현하는 세포의 편리한 스크리닝 또는 선택을 가능하게 한다. 선택 가능한 마커는 제초제 화합물, 예컨대 글리포세이트, 술포닐우레아, 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 저항성을 부여하는 유전자를 포함한다. 이러한 선택 가능한 마커 유전자 및 선택제는 술포닐우레아 및 이미다졸리논에 대한 저항성을 부여하는 옥수수 HRA 유전자(문헌[Lee et al., 1988, EMBO J 7:1241-1248]), 글리포세이트에 대한 저항성을 부여하는 CP4 유전자(이러한 유전자 및 관련 선택 방법에 관하여 전체가 본원에 구체적으로 참조로 포함되는 미국 재발행 특허 제RE039247호), 글리포세이트에 대한 저항성을 부여하는 GAT 유전자(문헌[Castle et al., 2004, Science 304:1151-1154]), 스펙티노마이신에 대한 저항성을 부여하는 유전자, 예컨대 aadA 유전자(문헌[Svab et al., 1990, Plant Mol Biol. 14:197-205]) 및 글루포시네이트 암모늄에 대한 저항성을 부여하는 bar 유전자(문헌[White et al., 1990, Nucl. Acids Res. 25:1062]), 및 PAT(또는 옥수수에 있어서 moPAT, 문헌[Rasco-Gaunt et al., 2003, Plant Cell Rep. 21:569-76] 참조; 또한 문헌[Sivamani et al., 2019] 참조) 및 만노스-함유 배지 상의 성장을 가능하게 하는 PMI 유전자(문헌[Negrotto et al., 2000, Plant Cell Rep. 22:684-690])를 포함한다.

특정 구현예에서, 반대-선택 가능한 마커는 본원에 제공되는 진핵 세포(예를 들어, 식물), 방법, 시스템 및 조성물에서 사용될 수 있다. 이러한 반대-선택 가능한 마커는 특정 구현예에서, 표적 편집 부위에서 숙주 세포 게놈 내로의 삽입이 의도되지 않은 임의의 DNA 내로 혼입될 수 있다. 이러한 구현예에서, 반대-선택 가능한 마커를 갖는 DNA의 비제한적인 예는 HDR-촉진제(예를 들어, SSB, SSAP 및/또는 엑소뉴클레아제), 유전자-편집 분자 및/또는 공여자 주형 DNA 분자를 인코딩하는 DNA에 연결된 임의의 DNA 분자를 포함한다. 공여자 주형 DNA 분자를 포함하는 벡터 또는 DNA 분자가 제공되며, 반대-선택 가능한 마커는 공여자 주형 DNA에 연결되고, 선택적으로 표적 편집 부위 서열에 의해 공여자 주형 DNA로부터 분리된다. 식물에서 사용될 수 있는 반대-선택 가능한 마커의 예는 시토신 데아미나제 유전자(예를 들어, 5-플루오로시토신과 함께 사용됨; 문헌[Schlaman and Hooykaas, 1997]), 포스포네이트 에스테르 하이드롤라제(예를 들어, 글리세롤 글리포세이트를 포함하는 글리포세이트의 포스포네이트 에스테르와 함께 사용됨; 문헌[Dotson, et al. 1996]), 질산염 환원효소(예를 들어, 단독의 질소원으로서 암모니아를 함유하는 배지 상에 염소산염과 함께 사용됨; 문헌[Nussaume, et al. 1991])를 포함한다.

특정 구현예에서, 선택 가능한 마커의 이용은 HDR 촉진제(즉, SSAP, 엑소뉴클레아제 및/또는 SSB)에 의해 제공되는 HDR의 빈도 증가 및/또는 변형된 주형 DNA 분자에 의해 배제된다. 이러한 구현예에서, 선택 가능한 마커 및/또는 반대-선택 가능한 마커는 공여자 주형 DNA 분자, 공여자-주형 또는 기타 DNA 분자를 전달하기 위해 사용되는 플라스미드 또는 본원에 제공되는 세포, 시스템, 방법 또는 조성물에서 사용되는 임의의 다른 벡터(예를 들어, 바이러스 벡터) 또는 폴리뉴클레오티드로부터 생략될 수 있다.

B. 유전학적 엔지니어링 방법

일 양태에서, 본 개시내용은 진핵 세포의 유전학적 엔지니어링 방법을 제공한다. 일부 구현예에서, 당해 방법은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 제공하는 것을 포함한다. 일부 구현예에서, 당해 방법은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 전달하는 것을 포함한다.

또 다른 양태에서, 본 개시내용은 진핵 세포의 유전학적 엔지니어링 방법을 제공한다. 일부 구현예에서, 당해 방법은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), 및 iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 포함한다.

또 다른 양태에서, 당해 방법은 i) 이중 가닥 파단 유도 화합물, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), 및 iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 포함한다.

i. 유전학적 변형

유전학적 엔지니어링은 유전자 기능(즉, 인코딩된 유전자 생성물의 활성)의 감소일 수 있다. 이는 결함이 있는 서열을 제공하기 위하여 본원에 논의된 바와 같이 상응하는 수선 주형을 필요로 할 수 있거나, 이는 DSB의 유도를 통해 이루어질 수 있다. 특히, 유전자 섭동은 유전자 낙다운이다. 일부 구현예에서, 세포는 식물 또는 동물 세포이다. 일부 구현예에서, 유전학적 엔지니어링은 유전자 내의 정지 코돈의 도입이다. 일부 구현예에서, 유전학적 엔지니어링은 프로모터 또는 출발 코돈 내의 돌연변이이다.

대안적으로, 유전학적 엔지니어링은 유전자 기능(즉, 인코딩된 유전자 생성물의 활성)의 증가일 수 있다. 이는 교정된 서열을 제공하기 위하여 본원에 논의된 바와 같이 상응하는 수선 주형을 필요로 할 수 있다. 일부 구현예에서, 유전학적 엔지니어링은 단백질 코딩 유전자 내의 하나 이상의 뉴클레오티드의 치환이다.

일부 구현예에서, 표적 편집 부위는 프로모터 영역에 위치한다. 일 구현예에서, 뉴클레오티드 서열은 프로모터일 수 있으며, 프로모터의 편집은 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 증가된 프로모터 활성, 증가된 프로모터 조직 특이성, 감소된 프로모터 활성, 감소된 프로모터 조직 특이성, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 결실 또는 부가.

일 구현예에서, 뉴클레오티드 서열은 세포의 게놈 내의 조절 서열일 수 있다. 조절 서열은 유기체 내에서 특정 유전자의 발현을 증가시키거나 감소시킬 수 있는 핵산 분자의 세그먼트이다. 조절 서열의 예는 전사 활성화인자, 전사 억제인자 및 번역 억제인자, 스플라이싱 인자, miRNA, siRNA, 인공 miRNA, CAAT 박스, CCAAT 박스, Pribnow 박스, TATA 박스, SECIS 요소 및 폴리아데닐화 신호를 포함하지만 이에 한정되지 않는다. 일부 구현예에서, 조절 요소의 편집은 변경된 단백질 번역, RNA 절단, RNA 스플라이싱 또는 전사 종결을 초래한다.

일 구현예에서, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 사용하여, TET 오퍼레이터 억제인자/오퍼레이터/유도인자 시스템의 성분, 또는 술포닐우레아(Su) 억제인자/오퍼레이터/유도인자 시스템의 성분을 식물 게놈 내로 삽입하여, 유도 가능한 발현 시스템을 생성하거나 제어할 수 있다.

또 다른 구현예에서, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 사용하여, 프로모터 또는 프로모터 요소의 결실을 허용할 수 있으며, 프로모터 결실(또는 프로모터 요소 결실)은 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 영구적으로 불활성화된 유전자 좌, 증가된 프로모터 활성(증가된 프로모터 세기), 증가된 프로모터 조직 특이성, 감소된 프로모터 활성, 감소된 프로모터 조직 특이성, 새로운 프로모터 활성, 유도 가능한 프로모터 활성, 연장된 유전자 발현 윈도우, 유전자 발현의 시기 또는 발생 과정의 변형, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 부가. 결실될 프로모터 요소는, 비-제한적으로, 프로모터 코어 요소, 프로모터 인핸서 요소 또는 35S 인핸서 요소일 수 있다. 결실될 프로모터 또는 프로모터 단편은 편집 대상 세포에 대해 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성일 수 있다.

일 구현예에서, 변형될 뉴클레오티드 서열은 종결인자일 수 있으며, 종결인자의 편집은 종결인자("종결인자 스왑(terminator swap)" 또는 "종결인자 대체(terminator replacement)"로도 지칭됨) 또는 종결인자 단편을, 상이한 종결인자(대체 종결인자로도 지칭됨) 또는 종결인자 단편(대체 종결인자 단편으로도 지칭됨)으로 대체하는 것을 포함하며, 종결인자 대체는 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 증가된 종결인자 활성, 증가된 종결인자 조직 특이성, 감소된 종결인자 활성, 감소된 종결인자 조직 특이성, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 결실 또는 부가. 변형될 종결인자 (또는 종결인자 단편)은 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성인 종결인자 (또는 종결인자 단편)일 수 있다. 대체 종결인자 (또는 대체 종결인자 단편)는 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성인 종결인자 (또는 종결인자 단편)일 수 있다.

삽입될 종결인자 (또는 종결인자 요소)는 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성인 종결인자 (또는 종결인자 요소)일 수 있다.

또 다른 구현예에서, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 사용하여, 종결인자 또는 종결인자 요소의 결실을 허용할 수 있으며, 종결인자 결실 (또는 종결인자 요소 결실)은 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 증가된 종결인자 활성(증가된 종결인자 세기), 증가된 종결인자 조직 특이성, 감소된 종결인자 활성, 감소된 종결인자 조직 특이성, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 부가. 결실될 종결인자 또는 종결인자 단편은 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성일 수 있다.

변형은 5' 캡, 3' 폴리아데닐화 테일, 리보스위치 서열, 안정성 제어 서열, dsRNA 듀플렉스를 형성하는 서열, 가이드 폴리 뉴클레오티드를 세포하 위치에 표적화하는 변형 또는 서열, 트래킹(tracking)을 제공하는 변형 또는 서열, 단백질에 대한 결합 부위를 제공하는 변형 또는 서열, 잠금(Locked) 핵산(LNA), 5-메틸 dC 뉴클레오티드, 2,6-디아미노퓨린 뉴클레오티드, 2'-플루오로 A 뉴클레오티드, 2'-플루오로 U 뉴클레오티드; 2'-O-메틸 RNA 뉴클레오티드, 포스포로티오에이트 결합, 콜레스테롤 분자로의 연결, 폴리에틸렌 글리콜 분자로의 연결, 스페이서 18 분자로의 연결, 5'에서 3' 공유 결합 또는 이들의 임의의 조합을 포함한다. 이들 변형은 적어도 하나의 추가의 유리한 특징을 초래할 수 있으며, 추가의 유리한 특징은 변형된 또는 조절된 안정성, 세포하 표적화, 트래킹, 형광 표지, 단백질 또는 단백질 복합체에 대한 결합 부위, 상보적 표적 편집 부위에 대한 변경된 결합 친화성, 세포 분해에 대한 변경된 저항성 및 증가된 세포 투과성의 군으로부터 선택된다.

일부 구현예에서, 변형될 관심 게놈 서열은 폴리유비퀴틴화 부위이며, 폴리유비퀴틴화 부위의 변형은 단백질 분해 속도의 변경을 초래한다. 유비퀴틴 태그는 단백질이 프로테아좀 또는 자가포식에 의해 분해되게 만든다. 프로테아좀 저해제는 단백질 과잉생성을 유발하는 것으로 알려져 있다. 관심 단백질을 인코딩하는 DNA 서열에 이루어진 변형은 관심 단백질의 적어도 하나의 아미노산 변형을 초래할 수 있으며, 상기 변형은 단백질의 폴리유비퀴틴화(번역 후 변형)를 허용하여 단백질 분해의 변형을 초래한다.

일부 구현예에서, 표적 편집 부위는 유전자 코딩 영역에 위치한다. 일부 구현예에서, 표적 서열은 유전자내 영역에 위치한다. 일부 구현예에서, 표적 서열은 텔로미어(telomere)에 위치한다.

일부 구현예에서, 본원에 제공되는 방법은 표적 편집 부위에서 하나 이상의 뉴클레오티드의 변형을 초래한다.

일부 구현예에서, 표적 편집 부위에 대한 변형은 하나 이상의 뉴클레오티드의 치환이다. 일부 구현예에서, 표적 편집 부위에 대한 변형은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환이다.

일부 구현예에서, 표적 편집 부위에 대한 변형은 하나 이상의 뉴클레오티드의 결실이다. 일부 구현예에서, 표적 편집 부위에 대한 변형은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환이다.

일부 구현예에서, 표적 편집 부위에 대한 변형은 하나 이상의 뉴클레오티드의 삽입이다. 일부 구현예에서, 표적 편집 부위에 대한 변형은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환이다.

일부 구현예에서, 표적 편집 부위는 표적 편집 부위에 비하여 하나 이상의 삽입, 결실 또는 치환을 갖는 공여자 서열에 의해 변형된다. 일부 구현예에서, 표적 편집 부위는 공여자 서열에 의해 대체된다.

표적 서열의 조작이란, 본 발명자들은 또한, 표적 편집 부위의 후성적 조작을 의미한다. 이는 예컨대 표적 편집 부위의 메틸화 상태의 변형(즉, 메틸화 또는 메틸화 패턴 또는 CpG 섬의 부가 또는 제거), 히스톤 변형, 표적 편집 부위에 대한 접근성의 증가 또는 감소, 또는 3D 폴딩의 촉진에 의한, 표적 서열의 염색질 상태의 것일 수 있다.

또한, 본원에 제공된 방법을 사용하여 유전학적 섭동을 도입하고, 변경된 세포에서 하나 이상의 유전자의 발현의 변화를 결정함으로써, 하나 이상의 유전자의 기능을 질의하는 것을 포함하는 하나 이상의 동물 또는 식물 세포 내의 하나 이상의 유전자의 기능의 질의 방법이 제공된다. 일부 구현예에서, 유전학적 섭동은 기능 상실 돌연변이이다.

일부 구현예에서, 당해 방법은 동일한 표적에 대하여 상이한 변형(즉, 삽입, 결실 또는 치환)을 갖는 다중의 공여자 DNA를 사용하는 것을 포함한다. 일부 구현예에서, 다중의 공여자 DNA는 프로모터 영역 또는 코딩 서열을 표적화한다. 일부 구현예에서, 상이한 변형을 갖는 세포는 이후에 특정 표현형에 대하여 스크리닝될 수 있다.

ii. 포유류의 유전학적 엔지니어링

또한, 포유류 세포의 유전학적 편집 방법이 본원에 제공된다. 일부 구현예에서, 유전학적 편집은 유전학적 질환 또는 질병에 관여되는 유전자 좌의 것이다. 일부 구현예에서, 질병 또는 장애는 효소의 돌연변이에 의해 야기된다. 일부 구현예에서, 유전학적 질환은 대사 장애이다.

예시적인 조건 및 유전자는 아밀로이드 신경병증(TTR, PALB); 아밀로이드증(APOA1, APP, AAA, CVAP, AD1, GSN, FGA, LYZ, TTR, PALB); 경화증(KRT18, KRT8, CIRH1A, NAIC, TEX292, KIAA1988); 낭성 섬유증(CFTR, ABCC7, CF, MRP7); 글리코겐 저장병(SLC2A2, GLUT2, G6PC, G6PT, G6PT1, GAA, LAMP2, LAMPB, AGL, GDE, GBE1, GYS2, PYGL, PFKM); 간 선종, 142330(TCF1, HNF1A, MODY3), 간부전, 조기 발병 및 신경 장애(SCOD1, SCOl), 간 리파제 결핍(LIPC), 간모세포종, 암 및 암종(CTNNB1, PDGFRL, PDGRL, PRLTS, AXIN1, AXIN, CTNNB1, TP53, P53, LFS1, IGF2R, MPRI, MET, CASP8, MCH5; 수질 낭성 신장병(UMOD, HNFJ, FJHN, MCKD2, ADMCKD2); 페닐케톤뇨증(PAH, PKU1, QDPR, DHPR, PTS); 다낭성 신장 및 간 질병(FCYT, PKHD1, ARPKD, PKD1, PKD2, PKD4, PKDTS, PRKCSH, G19P1, PCLD, SEC63)이다. 다른 바람직한 표적은 하기 중 임의의 하나 이상을 포함하거나 하기 중 하나 이상을 포함한다: PCSK9; Hmgcr; SERPINA1; ApoB; LDL; 헌팅턴병(헌팅턴), 혈색소증(HEF), 뒤쉔 근디스트로피(디스트로핀), 겸상 적혈구 빈혈(베타 글로빈) 및 테이-삭스(헥소사미니다제 A).

관심 게놈 유전자좌 내의 표적 편집 부위의 조작에 의한 인간 또는 비-인간 포유류 또는 유기체를 포함하는 유기체 또는 포유류의 변형 방법을 언급하는 경우, 이는 유기체(또는 포유류)에 그 유기체(유기체가 다세포일 경우) 유래의 전체 또는 단지 단일의 세포 또는 세포의 집단으로서 적용될 수 있음이 이해될 것이다. 인간의 경우, 예를 들어, 본 발명자들은 그 중에서도 단일 세포 또는 세포의 집단을 예상하며 이들은 바람직하게는 생체외 변형된 다음, 재도입될 수 있다. 이 경우에, 생검 또는 다른 조직 또는 생물학적 유체 시료가 필요할 수 있다. 줄기 세포는 또한 특히 이에 관하여 바람직하다. 그러나, 물론, 생체내 구현예도 예상된다.

당해 방법은 생체외 또는 시험관내에서, 예를 들어, 세포 배양에서 또는 생체외 또는 시험관내 모델(예컨대 오르가노이드(organoid) 또는 '칩 상의 동물 또는 식물 세포')에서 이루어질 수 있다. 대안적으로, 방법은 생체내에서 이루어질 수 있으며, 이 경우에, 이는 또한 제1 세포의 집단을 대상체로부터 단리하는 것 및 제2 세포의 집단을 대상체 내로 (다시) 이식하는 것을 포함할 수 있다. 유전자 섭동은 하나 이상의 또는 2개 이상의 또는 3개 이상의 또는 4개 이상의 유전자에 대하여 이루어질 수 있다.

본 발명의 일부 구현예에서, 낙 아웃 모델이 생성될 수 있다.

일부 구현예에서, 전달은 바이러스 벡터, 예컨대 렌티- 또는 배큘로- 또는 바람직하게는 아데노-바이러스/아데노-연관 바이러스 벡터일 수 있는 벡터의 형태로 이루어지지만, 다른 전달 수단(예컨대, 효모 시스템, 미세소낭, 유전자 총/금 나노입자로의 벡터의 부착 수단)이 알려져 있고, 이것이 제공된다. 벡터는 바이러스 또는 효모 시스템(예를 들어, 관심 핵산이 (발현에 관하여, 예컨대 궁극적으로 가공된 RNA를 제공하기 위하여) 프로모터에 작동 가능하게 연결되고 이의 제어 하에 존재할 수 있음)뿐만 아니라, 숙주 세포 내로의 핵산의 직접적인 전달을 의미할 수 있다. 본원의 방법에서 벡터가 바이러스 벡터일 수 있으며, 이것이 유리하게는 AAV이지만, 본원에 논의된 바와 같은 기타 바이러스 벡터, 예컨대 렌티바이러스가 사용될 수 있다. 예를 들어, 배큘로바이러스는 곤충 세포에서의 발현을 위해 사용될 수 있다. 이들 곤충 세포는 이어서 다량의 추가의 벡터, 예컨대 본 발명의 전달을 위해 조정된 AAV 또는 렌티바이러스 벡터를 생성하는 데 유용할 수 있다.

iii. 식물의 유전학적 엔지니어링

일부 구현예에서, 식물의 유전학적 엔지니어링 방법이 본원에 제공된다. 관심 폴리뉴클레오티드/폴리펩티드는 제초제-내성 코딩 서열, 살충 코딩 서열, 살선충 코딩 서열, 항미생물 코딩 서열, 항진균 코딩 서열, 항바이러스 코딩 서열, 무생물적 및 생물적 스트레스 내성 코딩 서열 또는 식물 형질, 예컨대 수율, 곡물 품질, 영양소 함량, 전분 질 및 양, 질소 고정 및/또는 이용, 지방산 및 오일 함량 및/또는 조성을 변경시키는 서열을 포함하지만 이에 한정되지 않는다. 더욱 구체적인 관심 폴리뉴클레오티드는 작물 수율을 개선시키는 유전자, 작물의 만족도를 개선시키는 폴리펩티드, 무생물적 스트레스, 예컨대 가뭄, 질소, 온도, 염분, 독성 금속 또는 미량 원소에 대한 저항성을 부여하는 단백질, 또는 독소, 예컨대 농약 및 제초제에 대한 또는 생물적 스트레스, 예컨대 진균, 바이러스, 박테리아, 곤충 및 선충에 의한 공격 및 이들 유기체와 연관된 질병의 발생에 대한 저항성을 부여하는 것들을 인코딩하는 유전자를 포함하지만 이에 한정되지 않는다. 관심 유전자의 일반적인 범주는 예를 들어, 아연 핑거와 같이 정보에 연관된 유전자, 키나제와 같이 커뮤니케이션에 연관된 것들 및 열 충격 단백질과 같이 하우스키핑에 연관된 것들을 포함한다. 더욱 구체적인 전이유전자의 범주는 예를 들어, 작물재배학, 곤충 저항성, 질병 저항성, 제초제 저항성, 생식력 또는 불임성, 곡물 특징 및 상업적 제품에 대한 중요한 형질을 인코딩하는 유전자를 포함한다. 관심 유전자는 일반적으로, 오일, 전분, 탄수화물 또는 영양소 대사에 연관된 것들 및 낟알 크기, 수크로스 부하 등에 영향을 미치는 것들을 포함하며, 이는 다른 형질과 조합하여 사용되거나 쌓일 수 있다.

작물재배학적으로 중요한 형질, 예컨대 오일, 전분 및 단백질 함량은 전통적인 육종 방법을 사용하는 것에 더하여 유전학적으로 변경될 수 있다. 변형은 올레산, 포화 및 불포화 오일의 함량을 증가시키는 것, 라이신 및 황의 수준을 증가시키는 것, 필수 아미노산 및 또한 전분의 변형을 제공하는 것을 포함한다. 호도티오닌(hordothionin) 단백질 변형은 본원에 참조로 포함되는 미국 특허 제5,703,049호, 제5,885,801호, 제5,885,802호 및 제5,990,389호에 기술된다. 또 다른 예는 미국 특허 제5,850,016호에 기술된 대두 2S 알부민에 의해 인코딩되는 라이신 및/또는 황 풍부 종자 단백질, 및 개시내용이 본원에 참조로 포함되는 문헌[Williamson et al. (1987) Eur. J. Biochem. 165:99-106]에 기술된 보리 유래의 키모트립신 저해제이다.

상업적 형질도 또한 관심 폴리뉴클레오티드 상에 인코딩될 수 있으며, 이는 예를 들어, 에탄올 생성을 위해 전분을 증가시키거나, 단백질의 발현을 제공할 수 있다. 형질전환된 식물의 또 다른 중요한 상업적 용도는 미국 특허 제5,602,321호에 기술된 바와 같은 폴리머 및 바이오플라스틱의 생성이다. β-케토티올라제, PHBase(폴리하이드록시부티레이트 신타제), 및 아세토아세틸-CoA 환원효소(문헌[Schubert et al. (1988) J. Bacteriol. 170:5837-5847] 참조)와 같은 유전자는 폴리하이드록시알카노에이트(PHA)의 발현을 촉진시킨다.

코딩 서열의 유도체는 인코딩된 폴리펩티드에서 사전선택된 아미노산의 수준을 증가시키기 위하여 부위-지정 돌연변이유발에 의해 제조될 수 있다. 예를 들어, 보리 고 라이신 폴리펩티드(BHL)를 인코딩하는 유전자는 보리 키모트립신 저해제, 개시내용이 본원에 참조로 포함되는 1996년 11월 1일자 출원된 미국 출원 제08/740,682호 및 제WO 98/20133호로부터 유래된다. 다른 단백질은 예컨대 해바라기씨(문헌[Lilley et al. (1989) Proceedings of the World Congress on Vegetable Protein Utilization in Human Foods and Animal Feedstuffs, ed. Applewhite (American Oil Chemists Society, Champaign, Ill.), pp. 497-502]; 본원에 참조로 포함됨); 옥수수(문헌[Pedersen et al. (1986) J. Biol. Chem. 261:6279]; 문헌[Kirihara et al. (1988) Gene 71:359]; 이들 둘 모두는 본원에 참조로 포함됨); 및 벼(문헌[Musumura et al. (1989) Plant Mol. Biol. 12:123], 본원에 참조로 포함됨) 유래의 메티오닌-풍부 식물 단백질을 포함한다. 다른 작물재배학적으로 중요한 유전자는 라텍스, Floury 2, 성장 인자, 종자 저장 인자 및 전사 인자를 인코딩한다.

작물 수율을 개선시키는 폴리뉴클레오티드는 왜화(dwarfing) 유전자, 예컨대 Rht1 및 Rht2(문헌[Peng et al. (1999) Nature 400:256-261]) 및 식물 성장을 증가시키는 것들, 예컨대 암모늄-유도 가능한 글루탐산염 데하이드로게나제를 포함한다. 작물의 만족도를 개선시키는 폴리뉴클레오티드는 예를 들어, 식물이 감소된 포화 지방 함량을 갖게 하는 것들, 식물의 영양가를 증가시키는 것들, 및 곡물 단백질을 증가시키는 것들을 포함한다. 내염성을 개선시키는 폴리뉴클레오티드는 염분-내성 유전자(들)가 도입된 식물의 고유 환경보다 더 높은 염분의 환경에서 식물 성장을 증가시키거나 이를 가능하게 하는 것들이다.

아미노산 생합성에 영향을 미치는 폴리뉴클레오티드/폴리펩티드는 예를 들어, 식물, 진균 및 박테리아에서 방향족 아미노산 경로로부터 트립토판의 생합성까지 분기되는 제1 반응을 촉매하는 안트라닐레이트 신타제(AS; EC 4.1.3.27)를 포함한다. 식물에서, 트립토판의 생합성을 위한 화학적 과정은 엽록체에서 구분된다. 예를 들어, 본원에 참조로 포함되는 미국 공개 제20080050506호를 참조한다. 추가의 관심 서열은 코리스메이트 피루베이트 리아제(Chorismate Pyruvate Lyase; CPL)를 포함하며, 이는 코리스메이트에서 피루베이트 및 pHBA로의 전환을 촉매하는 효소를 인코딩하는 유전자를 나타낸다. 가장 잘 특성화된 CPL 유전자는 에스케리키아 콜라이로부터 단리된 바 있으며, GenBank 수탁 번호 M96268을 갖는다. 본원에 참조로 포함된 미국 특허 제7,361,811호를 참조한다.

이들 관심 폴리뉴클레오티드 서열은 질병 또는 해충 저항성을 제공하는 데 연관된 단백질을 인코딩할 수 있다. "질병 저항성" 또는 "해충 저항성"은, 식물이 식물-병원체 상호작용의 결과인 유해 증상을 회피한다는 의미이다. 해충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 인코딩할 수 있다. 질병 저항성 및 곤충 저항성 유전자, 예컨대, 항박테리아 보호를 위한 라이소자임 또는 세크로핀, 또는 항진균 보호를 위한 디펜신, 글루카나제 또는 키티나제와 같은 단백질, 또는 선충 또는 곤충 방제를 위한 바실러스 투린지엔시스(Bacillus thuringiensis) 내독소, 프로테아제 저해제, 콜라게나제, 렉틴 또는 글리코시다제가 모두 유용한 유전자 생성물의 예이다. 질병 저항성 형질을 인코딩하는 유전자는, 예컨대 푸모니신(fumonisin)에 대한 해독작용 유전자(미국 특허 제5,792,931호); 약독성(avr) 및 질병 저항성(R) 유전자(문헌[Jones et al. (1994) Science 266:789]; 문헌[Martin et al. (1993) Science 262:1432]; 및 문헌[Mindrinos et al. (1994) Cell 78:1089]); 등을 포함한다. 곤충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 인코딩할 수 있다. 이러한 유전자는, 예를 들어, 바실러스 투린지엔시스 독성 단백질 유전자(미국 특허 제5,366,892호; 제5,747,450호; 제5,736,514호; 제5,723,756호; 제5,593,881호; 및 문헌[Geiser et al. (1986) Gene 48:109]); 등을 포함한다.

"제초제 저항성 단백질" 또는 "제초제 저항성-인코딩 핵산 분자"의 발현으로 초래되는 단백질은 이 단백질을 발현하지 않는 세포보다 더 높은 농도의 제초제를 견디는 능력, 또는 이 단백질을 발현하지 않는 세포보다 더 긴 기간 동안 특정 농도의 제초제를 견디는 능력을 세포에 부여하는 단백질을 포함한다. 제초제 저항성 형질은 아세토락테이트 신타제(ALS)의 작용을 저해하는 작용을 하는 제초제, 특히 술포닐우레아(sulfonylurea)-유형 제초제에 대한 저항성을 코딩하는 유전자, 글루타민 신타제의 작용을 저해하는 작용을 하는 제초제에 대한 저항성을 코딩하는 유전자, 예컨대, 포스피노트리신 또는 바스타(basta)(예를 들어, bar 유전자), 글리포세이트(예를 들어, EPSP 신타제 유전자 및 GAT 유전자), HPPD 저해제(예를 들어, HPPD 유전자) 또는 당업계에 알려진 다른 이러한 유전자에 의해 식물 내로 도입될 수 있다. 예를 들어, 각각이 본원에 참조로 포함되는 미국 특허 제7,626,077호, 제5,310,667호, 제5,866,775호, 제6,225,114호, 제6,248,876호, 제7,169,970호, 제6,867,293호 및 미국 가출원 제61/401,456호를 참조한다. bar 유전자는 제초제 바스타에 대한 저항성을 인코딩하고, nptII 유전자는 항생제 카나마이신 및 제네티신에 대한 저항성을 인코딩하고, ALS-유전자 돌연변이체는 제초제 클로르술푸론(chlorsulfuron)에 대한 저항성을 인코딩한다.

추가의 선택 가능한 마커는 제초제 화합물, 예컨대 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 저항성을 부여하는 유전자를 포함한다. 예를 들어, 문헌[Yarranton, (1992) Curr Opin Biotech 3:506-11]; 문헌[Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8]; 문헌[Yao et al., (1992) Cell 71:63-72]; 문헌[Reznikoff, (1992) Mol Microbiol 6:2419-22]; 문헌[Hu et al., (1987) Cell 48:555-66]; 문헌[Brown et al., (1987) Cell 49:603-12]; 문헌[Figge et al., (1988) Cell 52:713-22]; 문헌[Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4]; 문헌[Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53]; 문헌[Deuschle et al., (1990) Science 248:480-3]; 문헌[Gossen, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21]; 문헌[Labow et al., (1990) Mol Cell Biol 10:3343-56]; 문헌[Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6]; 문헌[Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6]; 문헌[Wyborski et al., (1991) Nucleic Acids Res 19:4647-53]; 문헌[Hillen and Wissman, (1989) Topics Mol Struc Biol 10:143-62]; 문헌[Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5]; 문헌[Kleinschnidt et al., (1988) Biochemistry 27:1094-104]; 문헌[Bonin, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51]; 문헌[Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9]; 문헌[Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin)]; 문헌[Gill et al., (1988) Nature 334:721-4]을 참조한다. 상업적 형질도 또한 예를 들어, 에탄올 생성을 위해 전분을 증가시키거나, 단백질의 발현을 제공할 수 있는 유전자 또는 유전자들 상에 인코딩될 수 있다. 형질전환된 식물의 또 다른 중요한 상업적 용도는 미국 특허 제5,602,321호에 기술된 바와 같은 폴리머 및 바이오플라스틱의 생성이다. β-케토티올라제, PHBase(폴리하이드록시부티레이트 신타제), 및 아세토아세틸-CoA 환원효소(문헌[Schubert et al. (1988) J. Bacteriol. 170:5837-5847] 참조)와 같은 유전자는 폴리하이드록시알카노에이트(PHA)의 발현을 촉진시킨다.

외인성 생성물은 식물 효소 및 생성물, 및 원핵생물 및 기타 진핵생물을 포함하는 기타 공급원 유래의 것들을 포함한다. 이러한 생성물은 효소, 보조인자, 호르몬 등을 포함한다. 단백질, 특히 식물의 영양가를 개선시키도록 개선된 아미노산 분포를 갖는 변형된 단백질의 수준이 증가될 수 있다. 이는 향상된 아미노산 함량을 갖는 이러한 단백질의 발현에 의해 달성된다.

일부 구현예에서, 진핵 세포는 생합성 경로에서 하나 이상의 외인성 단백질을 생성하도록 엔지니어링된다. 일부 구현예에서, 생합성 경로는 바이오연료 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 알코올을 위한 것이다. 일부 구현예에서, 생합성 경로는 에탄올을 위한 것이다. 일부 구현예에서, 생합성 경로는 소분자의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 약물의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 스테롤의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 호르몬을 위한 것이다. 일부 구현예에서, 생합성 경로는 펩티드의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 테르펜을 위한 것이다.

일부 구현예에서, 진핵 세포는 그의 자손이 더 이상 복제할 수 없도록 엔지니어링된다. 일부 구현예에서, 진핵 세포는 병원성 세포이다.

전이유전자, 재조합 DNA 분자, 관심 DNA 서열 및 관심 폴리뉴클레오티드는 유전자 침묵화를 위한 하나 이상의 DNA 서열을 포함할 수 있다. 식물에서의 DNA 서열의 발현을 포함하는 유전자 침묵화 방법은 당업계에 알려져 있으며, 공동억제, 안티센스 억제, 이중-가닥 RNA(dsRNA) 간섭, 헤어핀 RNA(hpRNA) 간섭, 인트론-함유 헤어핀 RNA(ihpRNA) 간섭, 전사적 유전자 침묵화 및 마이크로 RNA(miRNA) 간섭을 포함하지만, 이에 한정되지 않는다.

iv. 검출

당업자는 표적 편집 부위의 유전학적 변형이 다양한 수단에 의해 검출될 수 있다는 것을 이해할 것이다. 일부 구현예에서, 당해 방법은 세포를 서열분석하는 것을 추가로 포함한다. 일부 구현예에서, 당해 방법은 리포터 유전자를 검출하는 것을 포함한다. 일부 구현예에서, 당해 방법은 선택 가능한 마커를 사용하여 세포를 선택하는 것을 포함한다.

선택 가능한 마커의 예에는 제한 효소 부위를 포함하는 DNA 세그먼트; 항생제, 예컨대 스펙티노마이신, 앰피실린, 카나마이신, 테트라사이클린, 바스타, 네오마이신 포스포트랜스퍼라제 II(NEO) 및 하이그로마이신 포스포트랜스퍼라제(HPT)를 포함하는 다르게 독성인 화합물에 대한 저항성을 제공하는 생성물을 인코딩하는 DNA 세그먼트; 다르게는 수여자 세포에서 결여된 생성물(예를 들어, tRNA 유전자, 영양요구성 마커)을 인코딩하는 DNA 세그먼트; 용이하게 확인될 수 있는 생성물(예를 들어, 표현형 마커, 예컨대 β-갈락토시다제, GUS; 형광 단백질, 예컨대 녹색 형광 단백질(GFP), 청록색(CFP), 황색(YFP), 적색(RFP), 및 세포 표면 단백질)을 인코딩하는 DNA 세그먼트; PCR을 위한 새로운 프라이머 부위의 생성(예를 들어, 이전에 근접하지 않았던 2개의 DNA 서열의 근접위치), 제한 엔도뉴클레아제 또는 기타 DNA 변형 효소, 화학물질 등에 의해 작용하지 않거나, 이에 의해 작용하는 DNA 서열의 포함; 및 확인을 가능하게 하는 특정 변형(예를 들어, 메틸화)에 필요한 DNA 서열의 포함이 포함되지만 이에 한정되지 않는다.

추가의 선택 가능한 마커는 제초제 화합물, 예컨대 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 저항성을 부여하는 유전자를 포함한다. 예를 들어, 문헌[Yarranton, (1992) Curr Opin Biotech 3:506-11]; 문헌[Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8]; 문헌[Yao et al., (1992) Cell 71:63-72]; 문헌[Reznikoff, (1992) Mol Microbiol 6:2419-22]; 문헌[Hu et al., (1987) Cell 48:555-66]; 문헌[Brown et al., (1987) Cell 49:603-12]; 문헌[Figge et al., (1988) Cell 52:713-22]; 문헌[Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4]; 문헌[Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53]; 문헌[Deuschle et al., (1990) Science 248:480-3]; 문헌[Gossen, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21]; 문헌[Labow et al., (1990) Mol Cell Biol 10:3343-56]; 문헌[Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6]; 문헌[Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6]; 문헌[Wyborski et al., (1991) Nucleic Acids Res 19:4647-53]; 문헌[Hillen and Wissman, (1989) Topics Mol Struc Biol 10:143-62]; 문헌[Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5]; 문헌[Kleinschnidt et al., (1988) Biochemistry 27:1094-104]; 문헌[Bonin, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51]; 문헌[Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9]; 문헌[Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin)]; 문헌[Gill et al., (1988) Nature 334:721-4]을 참조한다.

C. 핵산

일 양태에서, 본 개시내용은 HDR 촉진제를 인코딩하는 핵산을 제공한다. 일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, 핵산은 하나 이상의 벡터에 존재한다. 일부 구현예에서, 핵산은 하나의 벡터에 존재한다.

일부 구현예에서, 핵산은 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함한다. 일부 구현예에서, 핵산은 HDR 촉진제를 인코딩한다. 일부 구현예에서, 핵산은 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩한다. 일부 구현예에서, 핵산은 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 단일 가닥 DNA 결합 단백질(SSB)을 인코딩한다. 일부 구현예에서, 핵산은 발현 구축물 또는 벡터이다. 일부 구현예에서, 발현 구축물 또는 벡터는 핵산을 포함한다.

일부 구현예에서, 핵산은 유전자-편집 분자를 인코딩한다. 일부 구현예에서, 핵산은 서열-특이적 엔도뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드를 포함하는 서열-특이적 엔도뉴클레아제, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 인코딩한다. 일부 구현예에서, 핵산은 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 인코딩한다. 일부 구현예에서, 핵산은 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 서열-특이적 엔도뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 Cas9 및/또는 Cas12a를 포함하는 서열-특이적 엔도뉴클레아제를 인코딩하며, 가이드 RNA 분자는 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는다.

일부 구현예에서, 핵산은 공여자 DNA 분자를 포함한다. 일부 구현예에서, 핵산은 공여자 주형 DNA를 포함한다. 일부 구현예에서, 공여자 DNA 분자는 원형 DNA 벡터, 제미니바이러스 레플리콘 상에 또는 선형 DNA 단편으로서 제공된다. 일부 구현예에서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접된다.

일부 구현예에서, 공여자 DNA 분자는 게놈 DNA 표적 편집 부위의 변형된 서열을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 표적 편집 부위에 비하여 하나 이상의 뉴클레오티드의 치환을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환을 포함한다.

일부 구현예에서, 공여자 DNA 분자는 게놈 표적 편집 부위에 비하여 하나 이상의 뉴클레오티드의 결실을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 결실을 포함한다.

일부 구현예에서, 공여자 DNA 분자는 게놈 표적 편집 부위에 비하여 하나 이상의 뉴클레오티드의 삽입을 포함한다. 일부 구현예에서, 삽입은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드이다.

일부 구현예에서, 핵산은 RNA-가이드된 뉴클레아제를 포함하는 서열-특이적 엔도뉴클레아제를 인코딩하며, 표적 편집 부위는 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하게 위치한 서열을 포함한다. 일부 구현예에서, 핵산은 서열-특이적 엔도뉴클레아제를 인코딩하며, 이는 절단 후에 표적-편집 부위에 5' 오버행을 제공한다. 일부 구현예에서, 핵산은 상동성 DNA 분자의 상보적인 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 SSAP를 인코딩한다. 일부 구현예에서, 핵산은 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 SSAP를 인코딩한다. 일부 구현예에서, 핵산은 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, 동등한 SSAP 활성을 갖는 관련 단백질 또는 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 RecT/ Redβ-과 단백질을 인코딩한다. 일부 구현예에서, 핵산은 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 ERF-과 단백질을 인코딩한다. 일부 구현예에서, 핵산은 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 RAD52-과 단백질을 인코딩한다.

일부 구현예에서, 핵산은 엑소뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 엑소뉴클레아제를 인코딩하며, 선형 dsDNA 분자는 엑소뉴클레아제의 바람직한 기질이다. 일부 구현예에서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질이다. 일부 구현예에서, 엑소뉴클레아제는 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있다. 일부 구현예에서, 엑소뉴클레아제는 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있다. 일부 구현예에서, 엑소뉴클레아제는 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 엑소뉴클레아제 III, Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 엑소뉴클레아제는 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다.

일부 구현예에서, 핵산은 단일 가닥 DNA 결합 단백질(SSB)을 인코딩한다. 일부 구현예에서, 핵산은 SSB 및 SSAP를 인코딩한다. 일부 구현예에서, 핵산은 동일한 숙주 유기체로부터 수득되는 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP를 인코딩한다. 일부 구현예에서, 단일 가닥 DNA 결합 단백질(SSB)은 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB이다. 일부 구현예에서, SSB는 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB이다. 일부 구현예에서, SSB는 SEQ ID NO: 31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다.

일부 구현예에서, 핵산은 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 SSAP, 엑소뉴클레아제 및/또는 SSB 단백질을 인코딩한다. 일부 구현예에서, 핵산은 식물 세포에서의 발현을 위한 단백질을 인코딩한다. 일부 구현예에서, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질은 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함한다.

일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 본원에 제공되는 핵산은 각각 프로모터에 작동 가능하게 연결된다. 일부 구현예에서, 프로모터는 구성적 활성 프로모터이다. 일부 구현예에서, 프로모터는 유도성 프로모터이다. 일부 구현예에서, 프로모터는 식물-특이적 프로모터이다. 일부 구현예에서, 프로모터는 포유류 프로모터이다. 일부 구현예에서, 프로모터는 바이러스 프로모터이다. 일부 구현예에서, 프로모터는 35S 프로모터이다. 일부 구현예에서, 프로모터는 유비퀴틴 프로모터이다. 일부 구현예에서, 프로모터는 액틴 프로모터이다. 일부 구현예에서, 프로모터는 포유류 프로모터이다. 일부 구현예에서, 프로모터는 CAG 프로모터이다. 일부 구현예에서, 프로모터는 U6 프로모터이다. 일부 구현예에서, 프로모터는 EF1a 프로모터이다. 일부 구현예에서, 프로모터는 인간 ACTB 프로모터이다. 일부 구현예에서, 프로모터는 CMV 프로모터이다. 일부 구현예에서, 프로모터는 U6 프로모터이다. 일부 구현예에서, 프로모터는 T7 프로모터이다. 일부 구현예에서, CRISPR/Cas-기반의 뉴클레아제를 위한 부위 특이적 뉴클레아제 및/또는 이의 가이드 RNA는 유도성 프로모터의 제어 하에 발현된다. 이 구성에서, 게놈 편집 과정의 발생은 시스템의 다른 성분의 농도가 속도를 제한하지 않는 시간에 유도될 수 있다.

일부 구현예에서, 본원에 제공되는 핵산은 하나 이상의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 하나의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 2개의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 3개의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 4개의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 5개의 벡터에 제공된다.

일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 벡터가 본원에 제공된다. 일부 구현예에서, HDR 촉진제를 인코딩하는 벡터가 본원에 제공된다. 일부 구현예에서, 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 벡터가 본원에 제공된다. 일부 구현예에서, 적어도 하나의 서열-특이적 엔도뉴클레아제 및 공여자 주형을 인코딩하는 벡터가 본원에 제공된다.

또한, 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 제1 벡터, 및 공여자 주형 DNA 및 가이드 RNA를 포함하는 제2 벡터가 본원에 제공된다.

일부 구현예에서, 핵산은 특정 세포 유형에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 특정 종에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 식물 세포에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 포유류 세포에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 단백질 코딩 서열, 예컨대 엑소뉴클레아제, SSB 단백질 및/또는 SSAP를 포함한다. 일부 구현예에서, 단백질 코딩 서열은 식물 세포에서의 번역을 위해 코돈-최적화된다. 일부 구현예에서, 단백질 코딩 서열은 포유류 세포에서의 번역을 위해 코돈-최적화된다.

특정 구현예에서, 공여자 DNA 주형 상동성 아암은 약 20개, 50개, 100개, 200개, 400개 또는 600개 내지 약 800개 또는 1000개 염기쌍 길이일 수 있다. 예를 들어, 공여자 DNA 주형 상동성 아암은 약 20개 내지 약 1000개, 약 50개 내지 약 1000개, 약 100개 내지 약 1000개, 약 200개 내지 약 1000개 또는 약 600개 내지 1000개 염기쌍 길이일 수 있다. 일부 구현예에서, 공여자 DNA 주형 상동성 아암은 약 400개 내지 약 800개 염기쌍 길이이다. 일부 구현예에서, 공여자 DNA 주형 상동성 아암은 250개 미만의 염기쌍 길이이다. 일부 구현예에서, 공여자 DNA 주형 상동성 아암은 100개 미만의 염기쌍 길이이다.

특정 구현예에서, 공여자 DNA 주형 상동성 아암의 GC 함량은 변경된다. 일부 구현예에서, GC 함량은 최대화된다.

일부 구현예에서, 본원에 제공되는 핵산은 특정 세포 유형에서의 발현을 위해 변형된다. 일부 구현예에서, 본원에 제공되는 핵산은 진핵 세포에서의 발현을 위해 변형된다. 일부 구현예에서, 핵산은 식물 또는 동물 세포에서의 발현을 위해 변형된다. 일부 구현예에서, 핵산은 포유류 세포를 위하여 변형된다. 일부 구현예에서, 핵산은 쥣과 또는 영장류 세포를 위해 변형된다. 일부 구현예에서, 핵산은 인간 세포를 위해 변형된다. 일부 구현예에서, 핵산은 마우스 세포를 위해 변형된다.

특정 세포 유형의 발현을 위한 핵산 조성물의 변형 방법은 당업계에 널리 알려져 있다. 일부 구현예에서, 본원에 제공되는 뉴클레오티드의 GC(구아닌-시토신) 함량은 변경된다. 일부 구현예에서, 본원에 제공되는 핵산은 특정 세포 유형을 위해, 예를 들어, 진핵 세포를 위해 코돈 최적화된다.

i. 바이러스 벡터

일 양태에서, 본 개시내용은 포유류 세포에서의 발현을 위한 본원에 개시된 핵산 중 임의의 것을 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 발현 구축물을 포함한다. 일부 구현예에서, 벡터는 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 핵산을 포함한다.

일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및/또는 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 벡터가 본원에 제공된다.

일부 구현예에서, 제1 벡터는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩한다. 일부 구현예에서, 제2 벡터는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩한다. 일부 구현예에서, 제1 벡터는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나를 인코딩하지 않는다. 일부 구현예에서, 제1 벡터에 의해 인코딩되지 않는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나는 제2 벡터에 의해 인코딩된다. 일부 구현예에서, 성분은 하기 표 B에 나타낸 바와 같이 제1 및 제2 벡터에 의해 인코딩된다.

[표 B]

일부 구현예에서, 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB는 3가지 벡터에 다양한 조합으로 제공된다. 예를 들어, 서열-특이적 엔도뉴클레아제를 포함하는 제1 벡터, 공여자 주형 DNA를 포함하는 제2 벡터, 및 SSAP, 엑소뉴클레아제 및 SSB를 포함하는 제3 벡터, 또는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 및 SSAP를 포함하는 제1 벡터, 엑소뉴클레아제를 포함하는 제2 벡터, 및 SSB를 포함하는 제3 벡터.

일부 구현예에서, 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB는 4가지 벡터에 다양한 조합으로 제공된다. 예를 들어, 서열-특이적 엔도뉴클레아제를 포함하는 제1 벡터, 공여자 주형 DNA를 포함하는 제2 벡터, SSAP를 포함하는 제3 벡터, 및 엑소뉴클레아제 및 SSB를 포함하는 제4 벡터, 또는 서열-특이적 엔도뉴클레아제 및 공여자 주형 DNA를 포함하는 제1 벡터, SSAP를 포함하는 제2 벡터, 엑소뉴클레아제를 포함하는 제3 벡터 및 SSB를 포함하는 제4 벡터.

일부 구현예에서, 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB는 5가지 벡터에 제공된다.

일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 파보바이러스 벡터이다. 일부 구현예에서, 벡터는 아데노-연관 바이러스(AAV) 벡터이다. 일부 구현예에서, 벡터는 재조합 AAV(rAAV) 벡터이다. 일부 구현예에서, 벡터는 아데노바이러스 벡터이다. 일부 구현예에서, 벡터는 레트로바이러스 벡터이다. 일부 구현예에서, 벡터는 렌티바이러스 벡터이다. 일부 구현예에서, 벡터는 헤르페스바이러스 벡터이다. 일부 구현예에서, 벡터는 배큘로바이러스 벡터이다.

일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2, 1, 5, 6, 19, 3, 11, 7, 14, 16, 21, 12, 18, 31, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24-30, 37, 40, 41, AdHu2, AdHu 3, AdHu4, AdHu24, AdHu26, AdHu34, AdHu35, AdHu36, AdHu37, AdHu41, AdHu48, AdHu49, AdHuSO, AdC6, AdC7, AdC69, 소 Ad 3형, 개 Ad 2형, 양 Ad 또는 돼지 Ad 3형으로부터 유래된다. 일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2 또는 아데노바이러스 혈청형 5의 변이체로부터 유래된다. 일부 구현예에서, 벡터는 재조합 렌티바이러스 벡터이다. 일부 구현예에서, 재조합 렌티바이러스 벡터는 수포성 구내염 바이러스(VSV), 림프구성 맥락수막염 바이러스(LCMV), 로스 리버 바이러스(RRV), 에볼라 바이러스, 마르부르그 바이러스, 모칼라 바이러스, 광견병 바이러스, RD 114 또는 이의 변이체로 위형화된(pseudotyped) 렌티바이러스로부터 유래된다. 일부 구현예에서, 벡터는 rHSV 벡터이다. 일부 구현예에서, rHSV 벡터는 rHSV-1 또는 rHSV-2로부터 유래된다.

상기 방법의 일부 구현예에서, 벡터는 rAAV 벡터이다. 일부 구현예에서, HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 발현 구축물은 하나 이상의 AAV 역위 말단 반복부(ITR) 서열이 측접된다. 일부 구현예에서, 발현 구축물은 2개의 AAV ITR이 측접된다. 일부 구현예에서, AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAVrh8R, AAV9, AAV10, AAVrh10, AAV11, AAV12, AAV2R471A, AAV DJ, 염소 AAV, 소 AAV, 또는 마우스 AAV 혈청형 ITR이다. 일부 구현예에서, AAV ITR은 AAV2 ITR이다. 일부 구현예에서, 벡터는 스터퍼(stuffier) 핵산을 추가로 포함한다. 일부 구현예에서, 스터퍼 핵산은 프로모터와 발현 구축물을 인코딩하는 핵산 사이에 위치한다. 일부 구현예에서, 벡터는 자가-상보적 rAAV 벡터이다. 일부 구현예에서, 벡터는 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 제1 핵산 서열 및 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 제2 핵산 서열을 포함한다. 일부 구현예에서, 제1 핵산 서열 및 제2 핵산 서열은 돌연변이된 AAV ITR에 의해 연결되고, 돌연변이된 AAV ITR은 D 영역의 결실을 포함하고, 말단 분해 서열(terminal resolution sequence)의 돌연변이를 포함한다. 일부 구현예에서, 본 발명은 본원에 기술된 임의의 벡터(예를 들어, rAAV 벡터)를 포함하는 세포를 제공한다.

상기 방법의 일부 구현예에서, HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 벡터는 바이러스 입자에 존재하며, 바이러스 입자는 rAAV 벡터를 캡시드화하는 AAV 입자, 재조합 아데노바이러스 벡터를 캡시드화하는 아데노바이러스 입자, 재조합 렌티바이러스 벡터를 캡시드화하는 렌티바이러스 입자 또는 재조합 HSV 벡터를 캡시드화하는 HSV 입자이다. 일부 구현예에서, 바이러스 입자는 재조합 아데노바이러스 벡터를 캡시드화하는 아데노바이러스 입자이다. 일부 구현예에서, 아데노바이러스 입자는 아데노바이러스 혈청형 2, 1, 5, 6, 19, 3, 11, 7, 14, 16, 21, 12, 18, 31, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24-30, 37, 40, 41, AdHu2, AdHu3, AdHu4, AdHu24, AdHu26, AdHu34, AdHu35, AdHu36, AdHu37, AdHu41, AdHu48, AdHu49, AdHuSO, AdC6, AdC7, AdC69, 소 Ad 3형, 개 Ad 2형, 양 Ad, 또는 돼지 Ad 3형 유래의 캡시드를 포함한다. 일부 구현예에서, 아데노바이러스 입자는 아데노바이러스 혈청형 2 캡시드 또는 아데노바이러스 혈청형 S 캡시드의 변이체를 포함한다. 일부 구현예에서, 바이러스 입자는 재조합 렌티바이러스 벡터를 캡시드화하는 렌티바이러스 입자이다. 일부 구현예에서, 렌티바이러스 입자는 수포성 구내염 바이러스(VSV), 림프구성 맥락수막염 바이러스(LCMV), 로스 리버 바이러스(RRV), 에볼라 바이러스, 마르부르그 바이러스, 모칼라 바이러스, 광견병 바이러스, RD114 또는 이의 변이체로 위형화된 캡시드를 포함한다. 일부 구현예에서, 바이러스 입자는 HSV 입자이다. 일부 구현예에서, HSV 입자는 rHSV-1 입자 또는 rHSV-2 입자이다.

상기 방법의 일부 구현예에서, 본 발명은 본원에 기술된 rAAV 벡터 중 임의의 것을 포함하는 재조합 AAV 입자를 제공한다. 일부 구현예에서, AAV 바이러스 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAVrh8R, AAV9, AAV 10, AAVrh10, AAV11, AAV12, AAV2R471A, AAV2/2-7m8, AAV DJ, AAV2 N587A, AAV2 E548A, AAV2 N708A, AAV V708K, 염소 AAV, AAV1/AAV2 키메라, 소 AAV 또는 마우스 AAV 캡시드 rAAV2/HBoVl 혈청형 캡시드를 포함한다. 일부 구현예에서, ITR 및 rAAV 바이러스 입자의 캡시드는 동일한 AAV 혈청형으로부터 유래된다. 일부 구현예에서, ITR 및 rAAV 바이러스 입자의 캡시드는 상이한 AAV 혈청형으로부터 유래된다. 일부 구현예에서, ITR은 AAV2로부터 유래되고, rAAV 입자의 캡시드는 AAV1로부터 유래된다. 본 발명은 본원에 기술된 구현예 중 어느 하나의 발현 구축물을 포함하는 벡터를 제공한다. 일부 구현예에서, 발현 구축물은 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩한다. 일부 구현예에서, 벡터는 재조합 아데노-연관 바이러스(rAAV) 벡터, 재조합 아데노바이러스 벡터, 재조합 렌티바이러스 벡터 또는 재조합 단순 헤르페스 바이러스(HSV) 벡터이다. 일부 구현예에서, 벡터는 재조합 아데노바이러스 벡터이다. 일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2, 1, 5, 6, 19, 3, 11, 7, 14, 16, 21, 12, 18, 31, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24-30, 37, 40, 41, AdHu2, AdHu 3, AdHu4, AdHu24, AdHu26, AdHu34, AdHu35, AdHu36, AdHu37, AdHu41, AdHu48, AdHu49, AdHu50, AdC6, AdC7, AdC69, 소 Ad 3형, 개 Ad 2형, 양 Ad 또는 돼지 Ad 3형으로부터 유래된다. 일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2 또는 아데노바이러스 혈청형 S의 변이체로부터 유래된다. 일부 구현예에서, 벡터는 재조합 렌티바이러스 벡터이다. 일부 구현예에서, 재조합 렌티바이러스 벡터는 수포성 구내염 바이러스(VSV), 림프구성 맥락수막염 바이러스(LCMV), 로스 리버 바이러스(RRV), 에볼라 바이러스, 마르부르그 바이러스, 모칼라 바이러스, 광견병 바이러스, RD114 또는 이의 변이체로 위형화된 렌티바이러스로부터 유래된다. 일부 구현예에서, 벡터는 rHSV 벡터이다. 일부 구현예에서, rHSV 벡터는 rHSV-1 또는 rHSV-2로부터 유래된다.

일부 구현예에서, 벡터는 선택 가능한 마커를 포함한다.

상기 방법의 일부 구현예에서, 바이러스 입자는 조성물(예를 들어, 약제학적 조성물)에 존재한다. 일부 구현예에서, 조성물은 약제학적으로 허용 가능한 담체를 추가로 포함한다.

ii. 기타 벡터

일부 구현예에서, 벡터는 비-바이러스 벡터이다. 일부 구현예에서, 벡터는 플라스미드이다. 일부 구현예에서, 벡터는 식물 형질전환 벡터이다. 일부 구현예에서, 벡터는 조직 배양물 또는 식물 조직에서의 아그로박테리움(Agrobacterium)-매개된 일시적인 발현 또는 안정한 형질전환을 위한 벡터이다.

본 발명과 양립 가능한 재조합 플라스미드 벡터를 사용한 예시적인 시스템은 "통합(cointegrate)" 및 "이원(binary)" 시스템을 포함하지만 이에 한정되지 않는다. "통합" 시스템에서, 관심 유전자를 함유하는 셔틀 벡터는 예를 들어, pMLJ1 셔틀 벡터 및 비-종양형성 플라스미드 pGV3850에서와 같이, 식물 세포 형질전환에 필요한 시스-작용 및 트랜스-작용 요소를 둘 모두 함유하는 비-종양형성 플리스미드 내로 유전학적 재조합에 의해 삽입된다. 제2 시스템은 2가지 플라스미드가 사용되는 "이원" 시스템으로 지칭되며; 관심 유전자는 식물 형질전환에 필요한 시스-작용 요소를 함유하는 셔틀 벡터 내로 삽입된다. 다른 필요한 기능은 pBIN19 셔틀 벡터 및 비-종양형성 플라스미드 PAL4404에 의해 예시된 바와 같은 비-종양형성 플라스미드에 의해 트랜스로 제공된다. 이들 시스템에 유용한 이들 및 기타 벡터는 상업적으로 입수 가능하다.

D. 세포

일 양태에서, 본 개시내용은 HDR 촉진제를 포함하는 진핵 세포를 제공한다. 일부 구현예에서, 진핵 세포는 게놈-편집 분자 및 HDR 촉진제를 포함한다. 일부 구현예에서, 세포는 숙주 세포이다. 일부 구현예에서, 세포는 본 발명의 방법에 따라 변형될 세포이다. 일부 구현예에서, 게놈 편집 분자는 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함한다. 일부 구현예에서, HDR 촉진제는 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함한다.

또 다른 양태에서, 본 개시내용은 본원에 제공되는 방법에 의해 생성되는 진핵 세포를 제공한다. 일부 구현예에서, 진핵 세포 게놈의 표적 편집 부위의 변형은 게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공하는 것을 포함하며, 게놈 편집 분자는 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드, 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제는 SSAP, 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 SSB 단백질을 포함한다. 일부 구현예에서, 세포는 본 발명의 방법에 따른 변형에 의해 생성되는 게놈 시그너쳐(genomic signature)를 갖는다. 일부 구현예에서, 뉴클레아제 절단 부위가 제거된다. 일부 구현예에서, 핵산 서열 태그에 관심이 있다.

일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 핵산, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩하는 핵산, iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩하는 핵산 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 하나 이상의 벡터를 포함하는 숙주 세포가 본원에 제공된다. 일부 구현예에서, 숙주 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 핵산, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩하는 핵산, iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩하는 핵산, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 인코딩하는 하나의 벡터를 포함한다. 일부 구현예에서, 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 핵산, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 제1 벡터, 및 iii) 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩하는 핵산, iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩하는 핵산, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 제2 벡터를 포함한다.

추가로, 본 개시내용의 방법을 사용하여, 진핵 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 진핵 세포를 제조하고/하거나 본원에 기술된 바와 같이 진핵 세포를 유전학적으로 엔지니어링할 수 있다.

일부 구현예에서, 세포는 단리된 세포이다. 일부 구현예에서, 세포는 세포 배양물에 존재한다. 일부 구현예에서, 세포는 생체외에 존재한다. 일부 구현예에서, 세포는 살아 있는 유기체로부터 수득되고, 세포 배양물에서 유지된다. 일부 구현예에서, 세포는 단-세포 유기체이다. 일부 구현예에서, 세포는 유기체의 내측에 존재한다. 일부 구현예에서, 세포는 유기체이다. 일부 구현예에서, 세포는 단-세포 진핵 유기체의 세포, 원생동물 세포, 식물 유래 세포, 조류 세포, (예를 들어, 보트리오코쿠스 브라우니이(Botryococcus braunii), 클라마이도모나스 레인하르드티이(Chlamydomonas reinhardtii), 난노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스(Sargassum patens), 씨. 아가르드(C. agardh) 등), 해초(예를 들어, 켈프) 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추동물(예를 들어, 초파리, 강장동물, 극피동물, 선충 등) 유래의 세포, 척추동물(예를 들어, 어류, 양서류, 파충류, 조류, 포유류) 유래의 세포, 포유류(예를 들어, 유제류(예를 들어, 돼지, 소, 염소, 양); 설치류(예를 들어, 랫트, 마우스); 비-인간 영장류; 인간; 고양이과(예를 들어, 고양이); 갯과(예를 들어, 개); 등) 유래의 세포 등이다. 일부 구현예에서, 세포는 천연 유기체로부터 기원하지 않은 세포이다(예를 들어, 세포는 합성으로 제조된 세포일 수 있고; 또한 인공 세포로 지칭된다). 일부 구현예에서, 세포는 세포 배양물(예를 들어, 시험관내 세포 배양물)에 존재한다. 일부 구현예에서, 세포는 세포의 집합 중 하나이다. 일부 구현예에서, 세포는 진핵 세포이거나, 진핵 세포로부터 유래된다. 일부 구현예에서, 세포는 식물 세포이거나, 식물 세포로부터 유래된다. 일부 구현예에서, 세포는 동물 세포이거나, 동물 세포로부터 유래된다. 일부 구현예에서, 세포는 무척추동물 세포이거나, 무척추동물 세포로부터 유래된다. 일부 구현예에서, 세포는 척추동물 세포이거나, 척추동물 세포로부터 유래된다. 일부 구현예에서, 세포는 포유류 세포이거나, 포유류 세포로부터 유래된다. 일부 구현예에서, 세포는 설치류 세포이거나, 설치류 세포로부터 유래된다. 일부 구현예에서, 세포는 인간 세포이거나, 인간 세포로부터 유래된다. 일부 구현예에서, 세포는 비-인간 동물 세포이거나, 비-인간 동물 세포로부터 유래된다. 일부 구현예에서, 세포는 비-인간 포유류 세포이거나, 비-인간 포유류 세포로부터 유래된다. 일부 구현예에서, 세포는 진균 세포이거나, 진균 세포로부터 유래된다. 일부 구현예에서, 세포는 곤충 세포이다. 일부 구현예에서, 세포는 절지동물 세포이다. 일부 구현예에서, 세포는 원생동물 세포이다. 일부 구현예에서, 세포는 연충 세포이다. 일부 구현예에서, 세포는 비-포유류 동물 세포이다. 일부 구현예에서, 세포는 어류 세포이다. 일부 구현예에서, 세포는 곤충 세포이다. 일부 구현예에서, 세포는 초파리 세포이다. 일부 구현예에서, 세포는 드로소필라 멜라노개스터(Drosophila melanogaster) 세포이다. 일부 구현예에서, 세포는 선충류 세포이다. 일부 구현예에서, 세포는 카에노랍디티스 엘레간스(Caenorhabditis elegans) 세포이다. 일부 구현예에서, 세포는 회충 세포이다.

일부 구현예에서, 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 포함하는 전구 세포이며, 전구 세포는 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나는 이후에 폴리펩티드, DNA 또는 mRNA를 전구 세포에 전달함으로써 및/또는 전구 세포의 유성 교배에 의해 제공된다. 예를 들어, 일부 구현예에서, 전구 세포는 i) 내지 v) 중 하나 이상의 성분이 결여되며, 결여된 성분이 형질전환된다.

i. 식물 세포

일부 구현예에서, 진핵 세포는 식물 세포이다. 일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 식물 세포이다. 추가로, 본 개시내용의 방법을 사용하여, 식물 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 식물 세포를 제조하고/하거나 식물 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포 게놈에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.

특정 구현예에서, 세포는 단리된 식물 세포 또는 식물 원형질체(즉, 비해리된 또는 온전한 식물 조직, 식물 부분 또는 전체 식물에 위치하지 않음)이다. 특정 구현예에서, 식물 세포는 임의의 식물 부분 또는 조직 또는 캘러스로부터 수득된다. 특정 구현예에서, 배양물은 식물 조직, 배양된 식물 조직 외식편, 전체 식물, 온전한 마디 눈, 슈트 정단부 또는 슈트 정단 분열조직, 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할 종자 또는 기타 종자 단편, 접합자 배, 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리, 캘러스 또는 식물 세포 현탁액으로부터 수득되는 식물 세포를 포함한다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층으로부터 유래된다.

특정 구현예에서, 식물 세포는 비해리된 또는 온전한 식물 조직, 식물 부분, 식물 외식편 또는 전체 식물에 위치한다. 특정 구현예에서, 식물 세포는 온전한 마디 눈, 배양된 식물 조직 외식편, 슈트 정단부 또는 슈트 정단 분열조직, 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할 종자 또는 기타 종자 단편, 접합자 배, 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리 또는 캘러스에 위치할 수 있다. 특정 구현예에서, 사용되는 외식편은 미성숙 배를 포함한다. 미성숙 배(예를 들어, 미성숙 옥수수 배)는 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3 내지 7 ㎜ 배를 포함한다. 특정 구현예에서, 상기 언급된 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대, 미성숙 이삭 및 생사로부터 수득된다. 다양한 양태에서, 형질전환을 위해 사용되는 식물-유래 외식편은 미성숙 배, 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3.5 내지 7 ㎜ 배를 포함한다. 일 양태에서, 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대, 미성숙 이삭 또는 생사로부터 유래될 수 있다. 특정 구현예에서, 식물 세포는 만능 식물 세포(예를 들어, 줄기 세포 또는 분열조직 세포)이다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층 내에 위치한다.

특정 구현예에서, 식물 세포는 반수체, 이배체 또는 배수체 식물 세포 또는 식물 원형질체, 예를 들어, 반수체, 이배체 또는 배수체 식물, 식물 부분 또는 조직 또는 캘러스로부터 수득되는 것들이다. 특정 구현예에서, 배양 중 식물 세포(또는 재생된 식물, 자손 종자 및 자손 식물)는 반수체이거나, 반수체가 되도록 유도될 수 있으며; 반수체 식물 및 식물 세포의 제조 및 이용을 위한 기법은 당업계에 알려져 있으며, 예를 들어, www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf에서 이용 가능한 "How to make haploid Arabidopsis thaliana" 프로토콜(문헌[Ravi et al. (2014) Nature Communications, 5:5334, doi: 10.1038/ncomms6334])에서 Maruthachalam 및 Chan에 의해 기술된 바와 같은, 변경된 형태의 동원체-특이적 히스톤 CENH3을 발현하는 반수체-유도 스트레인과 야생형 스트레인의 교배에 의해 아라비돕시스 탈리아나에서 반수체를 생성하기 위한 방법을 참조한다. 반수체는 또한 그의 전체가 본원에 참조로 포함되는 미국 특허 제9,215,849호에 개시된 바와 같이 돌연변이된 CENH3 유전자를 포함하는 식물을 야생형 이배체 식물과 교배하여, 반수체 자손을 생성함으로써 매우 다양한 외떡잎 식물(예를 들어, 옥수수, 밀, 벼, 수수, 보리) 또는 쌍떡잎 식물(예를 들어, 대두, 브라시카 종, 예를 들어, 카놀라, 목화, 토마토)에서 수득될 수 있다. 반수체 옥수수 식물 및/또는 세포를 수득하기 위해 사용될 수 있는 반수체-유도 옥수수 라인은 스톡 6, MHI(몰도바 반수체 유도제), 부정 배우체(ig) 돌연변이, KEMS, RWK, ZEM, ZMS, KMS, 및 본원에 전체가 참조로 포함되는 미국 특허 제9,677,082호에 개시된 트랜스제닉 반수체 유도 라인을 포함한다. 반수체 세포의 예는 반수체 식물로부터 수득되는 식물 세포 및 생식 조직으로부터, 예를 들어, 꽃, 발생 중인 꽃 또는 꽃눈, 씨방, 밑씨, 대포자, 꽃밥, 화분, 대배우체 및 소포자로부터 수득되는 식물 세포를 포함하지만, 이에 한정되지 않는다. 식물 세포 또는 식물 원형질체가 반수체인 특정 구현예에서, 유전학적 상보물은 식물 세포 또는 식물 원형질체에서 염색체 배가에 의해(예를 들어, 감수분열 비-감소에 의한 자발적 염색체 배가에 의해 또는 염색체 배가 작용제, 예컨대 콜히친, 오리잘린, 트리플루랄린, 프로나미드, 아산화질소 기체, 항-미세소관 제초제, 항-미세소관 작용제 및 유사분열 저해제의 사용에 의해) 배가되어, 유전자 또는 대립유전자의 상보물이 동형접합성인 배가된 반수체 식물 세포 또는 식물 원형질체를 생성할 수 있으며; 또 다른 구현예는 배가된 반수체 식물 세포 또는 식물 원형질체로부터의 배가된 반수체 식물의 재생을 포함한다. 또 다른 구현예는 이 접근법에 의해 제공되는 배가된 반수체 식물인 적어도 하나의 부모 식물을 갖는 하이브리드 식물에 관한 것이다. 배가된 반수체 식물의 생성에 의해, 동형접합성 식물을 수득하기 위하여 몇 세대의 자가-교배를 필요로 하는 것 대신에 한 세대에서 동형접합성이 제공된다. 배가된 반수체의 이용은 가능한 최소의 시간에 유전학적 순도(즉, 동형접합성)를 확립하고자 하는 임의의 상황에서 유리하다. 배가된 반수체 생성은 느리게 성장하는 식물, 예컨대 과수 및 기타 식물에서 또는 적어도 하나의 배가된-반수체 식물의 자손인 하이브리드 식물을 생성하는 데 특히 유리할 수 있다.

특정 구현예에서, 식물 세포는 임의의 관심 외떡잎 또는 쌍떡잎 식물 종, 예를 들어, 줄뿌림 작물 식물, 과실-생성 식물, 및 나무, 야채, 나무 및 관상용 꽃, 관목, 나무, 지피식물 및 잔디풀을 포함하는 관상용 식물로부터 수득되거나 이에 위치한다. 특정 비-제한적인 구현예에서, 식물 세포는 알팔파(메디카고 사티바), 아몬드(프루누스 둘시스), 사과(말루스 x 도메스티카), 살구(프루누스 아르메니아카, 프루누스 브리간티네, 프루누스 만드슈리카, 프루누스 무메, 프루누스 시비리카), 아스파라거스(아스파라거스 오피시날리스), 바나나(무사 종), 보리(호르데움 불가레), 콩(파세올루스 종), 블루베리 및 크랜베리(백시니움 종), 카카오(테오브로마 카카오), 카놀라 및 평지씨 또는 오일시드 평지, (브라시카 나푸스), 카네이션(디안투스 카리오필루스), 당근(다우쿠스 카로타 사티부스), 카사바(마니호트 에스쿨렌툼), 체리(프루누스 아비움), 병아리콩(시더 아리에티눔), 치커리(시코리움 인티부스), 칠리 페퍼 및 기타 캅시쿰 페퍼(캅시쿰 아눔, 캅시쿰 프루테센스, 캅시쿰 키넨세, 캅시쿰 푸베센스, 캅시쿰 바카툼), 국화(크리산테뭄 종), 코코넛(코코스 누시페라), 커피(코페아 종, 예를 들어, 코페아 아라비카 및 코페아 카네포라), 목화(고시피움 히르수툼 L.), 동부(비그나 운구이쿨라타), 오이(쿠쿠미스 사티부스), 커런트 및 구스베리(리베스 종), 가지(eggplant 또는 aubergine)(솔라눔 멜론게나), 유칼립투스(유칼립투스 종), 아마(리눔 우시타티수뭄 L.), 제라늄(펠라르고늄 종), 자몽(시트러스 x 파라디시), 포도(비투스 종), 예를 들어, 양조용 포도(비투스 비니페라), 구아바(프시디움 구아자바), 삼 및 대마(예를 들어, 카나비스 사티바 및 카나비스 종), 홉(후물러스 루풀러스), 붓꽃(이리스 종), 레몬(시트러스 리몬), 상추(락투카 사티바), 라임(시트러스 종), 옥수수(제아 메이즈 L.), 망고(만지페라 인디카), 망고스틴(가르시니아 망고스타나), 멜론(쿠쿠미스 멜로), 기장(세타리아 종, 에키노클로아 종, 엘레우신 종, 파니쿰 종, 페니세툼 종), 귀리(아베나 사티바), 기름야자(엘리스 퀴닌시스), 올리브(올레아 유로파에아), 양파(알리움 세파), 오렌지(시트러스 시넨시스), 파파야(카리카 파파야), 복숭아 및 천도복숭아(프루누스 페르시카), 배(피루스 종), 완두(피사 사티붐), 땅콩(아라키스 하이포가에아), 작약(파에오니아 종), 페투니아(페투니아 종), 파인애플(아나나스 코모수스), 플랜테인(무사 종), 자두(프루누스 도메스티카), 포인세티아(유포르비아 풀체리마), 폴란드 카놀라(브라시카 라파), 포플러(포풀러스 종), 감자(솔라눔 투베로숨), 호박(쿠쿠르비타 페포), 벼(오리자 사티바 L.), 장미(로사 종), 고무(헤베아 브라실리엔시스), 호밀(세칼레 세레알레), 잇꽃(카르타무스 틴크토리우스 L), 참깨 종자(세사메 인디움), 수수(소르굼 비콜로르), 대두(글리신 맥스 L.), 애호박(쿠쿠르비타 페포), 딸기(프라가리아 종, 프라가리아 x 아나나사), 사탕무(베타 불가리스), 사탕수수(사카룸 종), 해바라기(헬리안투스 안누스), 고구마(이포모에아 바타타스), 탠저린(시트러스 탄제리나), 찻잎(카멜리아 시넨시스), 담배(니코티아나 타바쿰 L.), 토마토(라이코페르시콘 에스쿨렌툼), 튤립(툴리파 종), 순무(브라시카 라파 라파), 호두(저글란스 종 L.), 수박(시트룰러스 라나투스), 밀(트리티움 아에스티붐) 또는 마(디스코레아 종)로부터 수득되거나, 이에 위치한다.

ii. 포유류 세포

일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 동물 세포이다. 일부 구현예에서, 동물 세포는 포유류 세포이다. 추가로, 본 개시내용의 방법을 사용하여 동물 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 동물 세포를 제조하고/하거나 동물 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 당해 방법을 사용하여, HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 세포를 제조하고/하거나 포유류 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.

일부 구현예에서, 세포는 임의의 다세포 척추동물 또는 무척추동물 유래의 동물 세포이다. 일부 구현예에서, 동물은 생물학적, 생리학적 또는 유전학적 연구를 위해 사용되는 모델 유기체이다. 따라서, 일부 구현예에서, 동물은 하기로부터 선택된다: 마우스(무스 무스쿨러스(Mus musculus)), 제브라피시(zebrafish)(다니오 레리오(Danio rerio)), 초파리(드로소필라 멜라노개스터), 고양이(펠리스 실베스트리스 카투스(Felis sylvestris catus)), 닭(갈루스 갈루스(Gallus gallus)), 개(카니스 루푸스 파밀리아리스(Canis lupus familiaris)), 기니피그(카비아 포르셀루스(Cavia porcellus)), 랫트(래투스 노르베지쿠스(Rattus norvegicus)) 및 선충류(카에노랍디티스 엘레간스). 일부 구현예에서, 동물은 가축 또는 농장 동물이다. 따라서, 일부 구현예에서, 동물은 하기로부터 선택된다: 염소(카프라 아에가그루스 히르쿠스(Capra aegagrus hircus)), 돼지(수스 스크로파 도메스티쿠스(Sus scrofa domesticus)), 양(오비스 아리에스(Ovis aries)), 소(보스 타우루스(Bos taurus)), 고양이(펠리스 카투스(Felis catus)), 당나귀(에쿠스 아프리카누스 아시누스(Equus africanus asinus)), 오리(아나스 플라티린코스 도메스티쿠스(Anas platyrhynchos domesticus)), 물소, 예를 들어, 부발루스 부발리스 부발리스(Bubalus bubalis bubalis) 및 부발루스 부발리스 카라베네시스(Bubalus bubalis carabenesis), 양봉 꿀벌(아피스 멜리페라(Apis mellifera)), 예를 들어, 아종 이탈리아 벌(아피스 멜리페라 리구스티카(A. mellifera ligustica)), 유럽 검정벌(아피스 멜리페라 멜리페라(A. mellifera mellifera)), 카니올란 꿀벌(Carniolan honey bee)(아피스 멜리페라 카르니카(A. mellifera carnica)), 코카시안 꿀벌(Caucasian honey bee)(아피스 멜리페라 코카시아(A. mellifera caucasia)), 및 그리스 벌(Greek bee)(아피스 멜리페라 세크로피아(A. mellifera cecropia)), 단봉낙타(카멜루스 드로메다리우스(Camelus dromedarius)), 말(에쿠스 페른스 카발루스(Equus ferns caballus)), 누에나방(봄빅스 모리(Bombyx mori)), 비둘기(콜럼바 리비아(Columba livia)), 거위(안세르 도메스티쿠스(Anser domesticus) 및 안세르 사이그노이데스 도메스티쿠스(Anser cygnoides domesticus)), 야크(보스 그루니엔스(Bos grunniens)), 쌍봉낙타(카멜루스 박트리아누스(Camelus bactrianus)), 라마(라마 글라마(Lama glama)), 알파카(비쿠그나 파코스(Vicugna pacos)), 뿔닭(누미다 멜레아그리스(Numida meleagris)), 페렛(무스텔라 푸토리우스 푸로(Mustela putorius furo)), 칠면조(멜레아그리스 갈로파보(Meleagris gallopavo)) 초어, 백련어, 잉어, 나일 틸라피아(nile tilapia), 대두어, 카틀라(catla)(인도 잉어(indian carp)), 붕어, 대서양 연어, 로호 라베오(roho labeo), 갯농어(milkfish), 무지개 송어, 우창 브림(wuchang bream), 검정 잉어(black carp), 가물치(northern snakehead) 및 메기(amur catfish).

일부 구현예에서, 세포는 세포주, 예를 들어, 포유류 세포주 또는 인간 세포주로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 알려져 있다. 세포주의 예는 A549, HEK-293, 293T, MF7, K562, Caco-2, HeLa 세포 및 이의 전이유전자 변종을 포함하지만 이에 한정되지 않는다. 일부 구현예에서, 세포는 HEK-293 세포이다. 일부 구현예에서, 세포는 중국 햄스터 난소(CHO) 세포이다. 세포주는 당업자에게 알려져 있는 다양한 공급원으로부터 입수 가능하다(예를 들어, 어메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; ATCC)(미국 버지니아주 머내서스 소재) 참조). 일부 구현예에서, 본원에 기술된 바와 같은 하나 이상의 핵산(예컨대 HDR 촉진제를 인코딩하는 벡터)으로 트랜스펙션된 세포를 사용하여, 하나 이상의 벡터-유래 서열을 포함하는 새로운 세포주를 확립하여, 표적 핵산에 대한 변형을 포함하는 새로운 세포주를 확립한다.

일부 구현예에서, 세포는 일차 세포, 예를 들어, 포유류 일차 세포 또는 인간 일차 세포이다. 예를 들어, 일차 세포의 배양물은 0회, 1회, 2회, 4회, 5회, 10회, 15회 이상 계대될 수 있다. 일부 구현예에서, 일차 세포는 임의의 알려져 있는 방법에 의해 개체로부터 수집된다. 예를 들어, 백혈구는 분리반출법, 백혈구분반술, 밀도 기울기 분리 등에 의해 수집될 수 있다. 조직, 예컨대 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등 유래의 세포는 생검에 의해 수집될 수 있다. 적절한 용액은 수집된 세포의 분산 또는 현탁을 위해 사용될 수 있다. 이러한 용액은 일반적으로 낮은 농도의 허용 가능한 완충제와 함께, 우태아혈청 또는 기타 자연 발생 인자가 편리하게 보충된, 평형 염 용액(예를 들어, 생리 식염수, 인산염-완충 식염수(PBS), 행크스 평형 염 용액 등)일 수 있다. 완충제는 HEPES, 인산염 완충제, 락테이트 완충제 등을 포함할 수 있다. 세포는 즉시 사용되거나 저장될 수 있다(예를 들어, 동결에 의해). 동결된 세포는 해동될 수 있고 재사용될 수 있다. 세포는 DMSO, 혈청, 배지 완충제(예를 들어, 10% DMSO, 50% 혈청, 40% 완충 배지), 및/또는 동결 온도에서 세포를 보존하는 데 사용되는 일부 다른 일반적인 용액에서 동결될 수 있다.

일부 구현예에서, 세포는 인간 세포이다. 일부 구현예에서, 세포는 생식선 세포이다. 일부 구현예에서, 세포는 체세포이다. 일부 구현예에서, 세포는 유사분열-후 세포이다. 일부 구현예에서, 세포는 면역 세포, 예컨대 T 세포, 자연 살해(NK) 세포 또는 대식구이다. 일부 구현예에서, 세포는 환자 또는 공여자로부터 수득되는 인간 T 세포이다. 본원에 제공되는 방법을 사용하여, 면역요법에 사용하기 위한 일차 T 세포에서 표적 핵산을 변형시킬 수 있다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여 예를 들어, T 세포의 게놈을 편집하여, 키메라 항원 수용체(CAR)를 발현하는 발현 구축물을 도입함으로써 CAR-T 세포를 생성한다. 일부 구현예에서, 본원에 제공된 방법을 사용하여 면역 세포를 생체외에서 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여 CAR-T 세포를 생체외에서 생성한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.

일부 구현예에서, 세포는 줄기 세포 또는 전구 세포이다. 일부 구현예에서, 세포는 비-분화된 세포이다. 일부 구현예에서, 세포는 인간 줄기 세포 또는 전구 세포이다. 일부 구현예에서, 세포는 포유류 줄기 세포 또는 전구 세포이다. 일부 구현예에서, 세포는 성인 줄기 세포, 배아 줄기 세포, 유도된 만능(iPS) 세포 또는 전구 세포(예를 들어, 심장 전구 세포, 신경 줄기 세포 등)이다. 일부 구현예에서, 세포는 조혈 줄기 세포(HSC)이다. 일부 구현예에서, 세포는 중간엽 줄기 세포(MSC)이다. 일부 구현예에서, 세포는 신경 줄기 세포이다. 일부 구현예에서, 세포는 상피 줄기 세포이다. 세포는 포유류 줄기 세포 및 전구 세포, 예를 들어, 설치류 줄기 세포, 설치류 전구 세포, 인간 줄기 세포, 인간 전구 세포 등을 포함할 수 있다.

일부 구현예에서, 세포는 이환된 세포, 예를 들어, 이환된 포유류 세포 또는 이환된 인간 세포이다. 이환된 세포는 변경된 대사, 유전자 발현 및/또는 형태적 특징을 가질 수 있다. 일부 구현예에서, 세포는 질병과 연관된 유전학적 변이체를 갖는 게놈을 갖는다. 일부 구현예에서, 세포는 질병과 연관된 SNP를 갖는다. 일부 구현예에서, 세포의 게놈은 질병과 연관된 유전학적 마커를 갖는다. 일부 구현예에서, 세포는 유해한 돌연변이를 갖는다. 일부 구현예에서, 세포는 질병을 야기하는 돌연변이를 갖는다. 일부 구현예에서, 세포는 질병과 연관된 돌연변이 대립유전자를 갖는다. 일부 구현예에서, 세포는 기능 상실 돌연변이를 갖는다. 일부 구현예에서, 세포는 질병 유전형을 갖는다. 일부 구현예에서, 세포는 질병 표현형을 갖는다. 일부 구현예에서, 세포는 유전학적 결함을 갖는다. 일부 구현예에서, 세포는 종양형성 돌연변이를 갖는다. 일부 구현예에서, 세포는 통합된 및/또는 안정하게 유지된 바이러스를 갖는다. 일부 구현예에서, 레트로바이러스는 세포의 게놈 내로 통합된다. 일부 구현예에서, 렌티바이러스는 세포의 게놈 내로 통합된다. 일부 구현예에서, 세포는 지속적인 바이러스 감염을 갖는다. 일부 구현예에서, 세포는 HIV를 갖는다. 일부 구현예에서, 세포는 HIV 게놈의 통합된 카피를 갖는다. 일부 구현예에서, 세포는 바이러스로 감염된다. 일부 구현예에서, 세포는 잠복 바이러스 감염을 갖는다. 일부 구현예에서, 세포는 헤르페스바이러스에 의해 감염된다. 일부 구현예에서, 세포는 인간 헤르페스바이러스 6 또는 7에 의해 감염된다. 일부 구현예에서, 세포는 단순 헤르페스 바이러스 1형 또는 2형에 의해 감염된다. 일부 구현예에서, 세포는 바리셀라-조스터(Varicella-Zoster) 바이러스에 의해 감염된다. 일부 구현예에서, 세포는 인간 파포바바이러스(Papovavirus)에 의해 감염된다. 일부 구현예에서, 세포는 엡스테인-바 바이러스에 의해 감염된다. 이환된 세포는 암 세포, 당뇨병 세포 또는 아폽토시스 세포일 수 있다. 이환된 세포는 이환된 대상체 유래의 세포일 수 있다. 예시적인 질병은 유전학적 장애, 감염성 질병, 혈액 장애, 암, 대사 장애, 눈 장애, 기관 장애, 근골격 장애, 심장병 등을 포함할 수 있다. 일부 구현예에서, 세포는 환자로부터 유래된다. 일부 구현예에서, 세포는 생체외에서 변형된다. 일부 구현예에서, 세포는 암 세포이다. 일부 구현예에서, 세포는 배 세포이다. 일부 구현예에서, 세포는 배 줄기 세포이다.

일부 구현예에서, 본원에 제공되는 방법을 사용하여 이환된 세포, 예를 들어, 이환된 포유류 세포 또는 이환된 인간 세포를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 이환된 세포를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 유전자의 야생형 대립유전자를 이환된 세포 내로 삽입한다. 일부 구현예에서, 본원에 제공된 방법을 사용하여, 이환된 세포에서 유해한 돌연변이를 교정한다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 종양유전자를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여 질병과 연관된 유전자의 대립유전자를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 유전자의 건강한 대립유전자를 삽입한다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 질병과 연관되지 않은 유전자의 대립유전자를 삽입한다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 세포의 게놈으로부터 통합된 또는 안정하게 유지된 바이러스, 예컨대 렌티바이러스, 레트로바이러스 또는 헤르페스바이러스를 제거한다.

iii. 진균 세포

일부 구현예에서, 진핵 세포는 진균 세포이다. 일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 진균 세포이다. 추가로, 본 개시내용의 방법을 사용하여 진균 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나, 게놈 변형을 갖는 진균 세포를 제조하고/하거나, 진균 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.

일부 구현예에서, 진균 세포는 다세포 진균으로부터 유래된 세포이다. 일부 구현예에서, 세포는 자낭균 세포이다. 일부 구현예에서, 세포는 단-세포 진균이다. 일부 구현예에서, 세포는 효모 세포이다. 일부 구현예에서, 세포는 속 아스페르길루스(Aspergillus), 칸디다(Candida), 코클리오볼루스(Cochliobolus), 크리포넥트리아(Cryphonectria), 크립토코커스(Cryptococcus), 에피더모피톤(Epidermophyton), 푸사리움(Fusarium), 클루이베로마이세스(Kluyveromyces), 라찬세아(Lachancea), 무코르(Mucor), 뉴로스포라(Neurospora), 오피오스토마(Ophiostoma), 페니실리움(Penicillium), 피키아(Pichia), 뉴모시스티스(Pneumocystis), 풀룰라리아(Pullularia), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 톨리포클라디움(Tolypocladium), 트리코더마(Trichoderma), 로도토룰라(Rhodotorula) 또는 야로위아(Yarrowia)의 진균 세포이다. 일부 구현예에서, 세포는 칸디다 종 세포, 예컨대 칸디다 알비칸스(C. albicans), 칸디다 아우리스(C. auris), 칸디다 두블리니엔시스(C. dubliniensis), 칸디다 글라브라타(C. glabrata), 칸디다 구일리에르몬디이(C. guilliermondii) 또는 칸디다 트로피칼리스(C. tropicalis) 세포이다. 일부 구현예에서, 세포는 병꼴균류(chytrid) 진균 세포, 즉, 키트리디오미코타(Chytridiomycota) 세포이다. 일부 구현예에서, 세포는 바트라코키트리움(Batrachochytrium) 종 세포, 예컨대 바트라코키트리움 덴드로바티디스(Batrachochytrium dendrobatidis) 세포이다. 일부 구현예에서, 세포는 미크로스포리디아(Microsporidia) 세포, 예컨대 글루게아(Glugea) 종 또는 노세마(Nosema) 종 세포이다. 일부 구현예에서, 진균 세포는 기생충이다. 일부 구현예에서, 세포는 트리코피톤(Trichophyton) 종 또는 미크로스포룸(Microsporum) 종 세포, 즉, 백선을 야기하는 기생충 종류를 포함하는 진균의 속의 구성원이다. 일부 구현예에서, 세포는 사상 진균 세포, 즉, 사상 진균 유래의 세포이다. 일부 구현예에서, 세포는 크립토코커스(Cryptococcus) 종 세포, 예컨대 크립토코커스 네오포르만스(Cryptococcus neoformans) 세포이다. 일부 구현예에서, 세포는 보트리티스(Botrytis) 종 세포, 예컨대 보트리티스 시네레아(Botrytis cinerea), 보트리티스 알리이(Botrytis allii), 보트리티스 안토필라(Botrytis anthophila), 보트리티스 엘립티카(Botrytis elliptica), 보트리티스 파바에(Botrytis fabae), 보트리티스 스쿠아모살(Botrytis squamosal) 또는 보트리티스 트라케이필라(Botrytis tracheiphila) 세포이다.

iv. 기타 진핵 세포

일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 미생물 진핵 세포이다. 추가로, 본 개시내용의 방법을 사용하여 미생물 진핵 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나, 게놈 변형을 갖는 미생물 진핵 세포를 제조하고/하거나 미생물 진핵 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물을 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다. 일부 구현예에서, 세포는 미생물 진핵생물이다. 일부 구현예에서, 세포는 단-세포 진핵 유기체의 세포이다. 일부 구현예에서, 세포는 원생동물 세포이다. 일부 구현예에서, 세포는 원생생물이다. 일부 구현예에서, 세포는 감염성 미생물 진핵생물이다. 일부 구현예에서, 세포는 기생충 미생물 진핵생물이다. 일부 구현예에서, 세포는 기아르디아(Giardia) 종 세포, 예컨대 기아르디아 람블리아(G. lamblia), 기아르디아 무리스(G. muris), 기아르디아 아르데아에(G. ardeae), 기아르디아 시타시(G. psittaci), 기아르디아 아길리스(G. agilis) 또는 기아르디아 미크로티(G. microti) 세포이다. 일부 구현예에서, 세포는 플라스모디움(Plasmodium) 종 세포, 예컨대 플라스모디움 비박스(P. vivax), 플라스모디움 팔시파룸(P. falciparum), 플라스모디움 말라리아에(P. malariae), 플라스모디움 오발레(P. ovale) 또는 플라스모디움 노울레시(P. knowlesi) 세포이다. 일부 구현예에서, 세포는 동원핵편모충류(kinetoplastid) 세포이다. 일부 구현예에서, 세포는 트리파노소마(Trypanosoma) 종 세포, 예컨대 트리파노소마 크루지(Trypanosoma cruzi) 또는 트리파노소마 브루세이(Trypanosoma brucei) 세포이다.

일부 구현예에서, 세포는 조류 세포이다. 일부 구현예에서, 조류 세포는 아크난테스(Achnanthes), 암피프로라(Amphiprora), 암포라(Amphora), 안키스트로데스무스(Ankistrodesmus), 아스테로모나스(Asteromonas), 보에켈로비아(Boekelovia), 볼리도모나스(Bolidomonas), 보로디넬라(Borodinella), 보트리디움(Botrydium), 보트리오코커스(Botryococcus), 브락테오코커스(Bracteococcus), 카에토세로스(Chaetoceros), 카르테리아(Carteria), 클라미도모나스(Chlamydomonas), 클로로코쿰(Chlorococcum), 클로로고늄(Chlorogonium), 클로렐라(Chlorella), 크루모나스(Chroomonas), 크리소스파에라(Chrysosphaera), 크리코스파에라(Cricosphaera), 크립테코디니움(Crypthecodinium), 크립토모나스(Cryptomonas), 사이클로텔라(Cyclotella), 두날리엘라(Dunaliella), 엘립소이돈(Ellipsoidon), 에밀리아니아(Emiliania), 에레모스파에라(Eremosphaera), 에르노데스미우스(Ernodesmius), 유글레나(Euglena), 유스티그마토스(Eustigmatos), 프란세이아(Franceia), 프라질라리아(Fragilaria), 프라질라롭시스(Fragilaropsis), 글로에오탐니온(Gloeothamnion), 해마토코커스(Haematococcus), 할로카페테리아(Halocafeteria), 헤테로시그마(Heterosigma), 하이메노모나스(Hymenomonas), 이소크리시스(Isochrysis), 레포신클리스(Lepocinclis), 미크락티니움(Micractinium), 모노라피디움(Monoraphidium), 나노클로리스(Nannochloris), 나노클로롭시스(Nannochloropsis), 나비쿨라(Navicula), 네오클로리스(Neochloris), 네프로클로리스(Nephrochloris), 네프로셀미스(Nephroselmis), 니츠키아(Nitzschia), 오크로모나스(Ochromonas), 오에도고니움(Oedogonium), 오오시스티스(Oocystis), 오스트레오코커스(Ostreococcus), 파블로바(Pavlova), 파라클로렐라(Parachlorella), 파스케리아(Pascheria), 펠라고모나스(Pelagomonas), 파에오닥틸룸(Phaeodactylum), 파구스(Phagus), 피코클로룸(Picochlorum), 플라티모나스(Platymonas), 플루로크리시스(Pleurochrysis), 플루로코커스(Pleurococcus), 프로토테카(Prototheca), 슈도클로렐라(Pseudochlorella), 슈도네오클로리스(Pseudoneochloris), 슈도스타우라스트룸(Pseudostaurastrum), 피라미모나스(Pyramimonas), 피로보트리스(Pyrobotrys), 세네데스무스(Scenedesmus), 스켈레토네마(Skeletonema), 스피로기라(Spyrogyra), 스티코코커스(Stichococcus), 테트라셀미스(Tetraselmis), 탈라시오시라(Thalassiosira), 트리보네마(Tribonema), 보체리아(Vaucheria), 비리디엘라(Viridiella), 비스케리아(Vischeria) 또는 볼복스(Volvox)의 종의 것이다. 일부 구현예에서, 세포는 규조류이다. 규조류는 속 아크난테스(Achnanthes), 암포라(Amphora), 카에토세로스(Chaetoceros), 코시노디스쿠스(Coscinodiscus), 실린드로테카(Cylindrotheca), 시클로텔라(Cyclotella), 심벨라(Cymbella), 프라질라리아(Fragilaria), 프라질라롭시스(Fragilaropsis), 한츠키아(Hantzschia), 나비쿨라(Navicula), 니츠키아(Nitzschia), 슈도-니츠키아(Pseudo-Nitzschia), 파에오닥틸룸(Phaeodactylum), 프사모딕티온(Psammodictyon), 스켈레토네마(Skeletonema), 탈라시오네마(Thalassionema) 및 탈라시오시라(Thalassiosira)의 구성원을 포함한다. 일부 구현예에서, 세포는 진안점조류(eustigmatophyte), 예컨대 나노클로롭시스(Nannochloropsis) 종 또는 모노두스(Monodus), 슈도스타우라스트룸(Pseudostaurastrum), 비스케리아(Vischeria) 및 유스티그마토스(Eustigmatos)의 종이다. 일부 구현예에서, 세포는 속 나노클로롭시스, 예컨대, 비제한적으로, 나노클로롭시스 가디타나(N. gaditana), 나노클로롭시스 그라눌라타(N. granulata), 나노클로롭시스 림네티카(N. limnetica), 나노클로롭시스 오세아니카(N. oceanica), 나노클로롭시스 오쿨라타(N. oculata) 및 나노클로롭시스 살리나(N. salina)의 조류 세포이다.

일부 구현예에서, 세포는 부등편모조류(heterokont)이다. 예를 들어, 부등편모조류는 진암점조류 및 규조류, 예컨대 상기 열거된 것들뿐만 아니라 병꼴균류 종, 예를 들어, 라브린툴리드(labrinthulid) 및 트라우스토키트리드(thraustochytrid)를 포함한다. 일부 구현예에서, 세포는 바실라리오피테스(Bacillariophytes), 유스티그마토피테스(Eustigmatophytes), 라브린툴리드(Labrinthulid) 및 트라우스토키트리드(Thraustochytrid)를 포함하지만 이에 한정되지 않는 부등편모조류 종의 것이다. 일부 구현예에서, 세포는 라브리인툴라(Labryinthula), 라브리인툴로이데스(Labryinthuloides), 트라우스토키트리움(Thraustochytrium), 스키조키트리움(Schizochytrium), 아플라노키트리움(Aplanochytrium), 아우란티오키트리움(Aurantiochytrium), 자포노키트리움(Japonochytrium), 디플로프리스(Diplophrys) 또는 울케니아(Ulkenia)의 종의 것이다. 예를 들어, 균주는 트라우스토키트리움(Thraustochytrium), 스키조키트리움(Schizochytrium), 오블론지키트리움(Oblongichytrium) 또는 아우란티오키트리움(Aurantiochytrium)의 종일 수 있다. 일부 구현예에서, 세포는 후편모생물군(opisthokont)이다. 일부 구현예에서, 세포는 동정편모충류(choanoflagellate)이다. 일부 구현예에서, 세포는 아메소마이세토조에아(amesomycetozoea)(예를 들어, 스파에로포르마(Sphaeroforma))이다. 일부 구현예에서, 세포는 단편모생물(unikont)이다. 일부 구현예에서, 세포는 아메바류(amoebozoa)이다. 일부 구현예에서, 세포는 속 아칸타모에바(Acanthamoeba), 아모에바(Amoeba), 카오스(Chaos), 딕티오스텔리움 엔타모에바(Dictyostelium Entamoeba) 또는 펠로믹사(Pelomyxa)의 것이다.

v. 세포의 조성물

세포의 조성물이 본원에 제공된다. 일 양태에서, 본원에 제공되는 방법을 사용하여 진핵 세포의 조성물을 생성할 수 있다. 일부 구현예에서, 진핵 세포의 조성물은 본원에 기술된 세포, 예를 들어, 식물, 동물, 진균 또는 기타 진핵 세포 중 임의의 것으로 구성될 수 있다. 일부 구현예에서, 본원에 개시된 방법은 세포의 집단을 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 편집된 세포의 집단을 생성하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 편집된 세포의 집단을 생성하는 것을 포함하며, 집단 내의 편집된 세포의 비는 HDR 촉진제의 부재 하에 편집된 세포의 집단보다 약 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 20-, 25-, 30-배 중 임의의 값, 예를 들어, 이들 값 사이의 임의의 값 또는 범위만큼 더 크다. 일부 구현예에서, 본원에 개시된 방법은 편집된 세포의 집단을 생성하는 것을 포함하며, 집단 내의 편집된 세포의 비는 HDR 촉진제의 부재 하에 편집된 세포의 집단보다 10배 더 높다.

일부 구현예에서, 본원에 제공된 방법에서 사용되는 세포의 클론 하위집단 조성물이 본원에 제공된다. 일부 구현예에서, 클론 하위집단은 세포주의 하위집단이다. 일부 구현예에서, 클론 하위집단은 개체로부터 유래된 세포의 하위집단이다. 일부 구현예에서, 클론 세포 하위집단은 단일의 세포로부터 유래된 세포의 집단이다. 일부 구현예에서, 클론 세포 하위집단은 동일한 유전학적 및 후성적 프로파일을 갖는다.

일부 구현예에서, 본원에 개시된 방법은 세포의 집단에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 게놈 변형을 갖는 세포의 조성물을 생성하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 게놈 변형을 갖는 세포의 조성물을 생성하는 것을 포함하며, 게놈 변형을 갖는 집단 내의 세포의 비는 HDR 촉진제의 부재 하에 변형된 세포의 집단보다 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 20-, 25-, 30-배, 예를 들어, 이들 값 사이의 임의의 값 또는 범위만큼 더 크다. 일부 구현예에서, 본원에 개시된 방법은 세포의 집단에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 변형된 표적 유전자좌를 갖는 세포의 집단을 생성하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 변형된 표적 유전자좌를 갖는 세포의 집단을 생성하는 것을 포함하며, 변형된 표적 유전자좌를 갖는 집단 내의 세포의 비는 HDR 촉진제의 부재 하에 변형된 세포의 집단보다 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 20-, 25-, 30-배, 예를 들어, 이들 값 사이의 임의의 값 또는 범위만큼 더 크다.

E. 키트

본 발명의 방법은 키트의 형태로 제공될 수 있다. 일부 구현예에서, 키트는 HDR 촉진제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 키트는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 사용 설명서를 포함한다. 일부 구현예에서, 키트는 핵산을 포함하는 벡터를 제공한다. 일부 구현예에서, 키트는 공여자 주형 DNA 분자를 사용하여 세포의 표적 편집 부위를 변형시키기 위해 사용된다. 일부 구현예에서, 키트는 본원에 기술된 벡터 중 임의의 것을 포함한다. 일부 구현예에서, 키트는 진핵 세포 게놈, 예컨대 식물 또는 포유류 세포 게놈의 표적 편집 부위의 HDR-매개된 게놈 변형을 증가시키기 위한 벡터를 포함한다. 일부 구현예에서, 키트는 식물 세포 내의 표적 편집 부위의 HDR-매개된 게놈 변형을 증가시키기 위한 벡터를 포함한다. 일부 구현예에서, 키트는 포유류 세포 내의 표적 편집 부위의 HDR-매개된 게놈 변형을 증가시키기 위한 벡터를 포함한다.

일부 구현예에서, 키트는 설명서를 포함한다. 일부 구현예에서, 설명서는 세포를 핵산으로 형질전환시키는 것에 대한 설명서를 포함한다. 일부 구현예에서, 설명서는 세포 내의 핵산의 존재를 검출하는 것에 대한 설명서를 포함한다. 일부 구현예에서, 설명서는 세포 내의 핵산의 영향을 평가하는 것에 대한 설명서를 포함한다.

일부 구현예에서, 키트는 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제를 포함한다. 일부 구현예에서, 키트는 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제는 세포의 게놈을 평가하기 위한 검정, 예컨대 PCR 검정, RT-qPCR 검정, 서던(Southern) 블롯 또는 서열분석 검정이다. 일부 구현예에서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제는 올리고뉴클레오티드 프라이머의 세트이며, 특정 프라이머의 쌍은 유전학적 변형 또는 야생형 표적 유전자좌를 특이적으로 증폭시킨다. 일부 구현예에서, 유전학적으로 엔지니어링된 세포의 검출은 리포터, 예컨대 형광 리포터, 전사 리포터, 비색 리포터 또는 화학발광 리포터를 사용하여 수행된다. 따라서, 일부 구현예에서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제는 리포터를 검출하기 위한 수단이다.

일부 구현예에서, 진핵 세포 게놈, 예컨대 식물 또는 포유류 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 키트가 본원에 제공된다. 일부 구현예에서, 키트는 게놈-편집 분자 및 HDR 촉진제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 게놈 편집 분자는 하기를 포함한다: (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자. 일부 구현예에서, HDR 촉진제는 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함한다. 일부 구현예에서, 게놈 편집 분자 및 HDR 촉진제는 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공한다. 일부 구현예에서, 키트는 표적 편집 부위의 HDR-매개된 게놈 변형의 수준을 측정하기 위한 작용제를 포함한다.

일부 구현예에서, 게놈 변형을 갖는 진핵 세포를 제조하기 위한 키트가 본원에 제공된다. 일부 구현예에서, 키트는 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 인코딩하는 핵산을 포함하며, 게놈 편집 분자는: (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제는 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하며; 이에 의해 게놈 편집 분자 및 HDR 촉진제는 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공한다. 일부 구현예에서, 키트는 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시킴으로써 게놈 변형을 갖는 진핵 세포를 제조하는 수단을 제공한다. 일부 구현예에서, 키트는 표적 편집 부위의 게놈 변형의 존재를 검출하기 위한 작용제를 포함한다.

일부 구현예에서, 진핵 세포의 유전학적 엔지니어링 방법을 위한 키트가 본원에 제공된다. 일부 구현예에서, 키트는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함한다. 일부 구현예에서, 키트는 표적 편집 부위의 유전학적 엔지니어링을 검출하기 위한 작용제를 포함한다.

구현예

본원에 제공되는 진핵 세포(예를 들어, 식물 세포 및 포유류 세포), 시스템, 및 방법의 다양한 구현예는 하기의 비제한적인 구현예의 목록에 포함된다.

1. 하기를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형의 증가 방법:

게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공함으로써, 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며;

HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계.

2. 구현예 1에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.

3. 구현예 2에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.

4. 구현예 1에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.

5. 구현예 1에 있어서, 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.

6. 구현예 5에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.

7. 구현예 5에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.

8. 구현예 1에 있어서, 공여자 DNA 분자가 원형 DNA 벡터, 제미니바이러스 레플리콘 상에 또는 선형 DNA 단편으로서 제공되는 방법.

9. 구현예 1 내지 8 중 어느 한 구현예에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열의 카피가 측접된 방법.

10. 구현예 1 내지 9 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 표적 편집 부위가 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하게 위치한 서열을 포함하는 방법.

11. 구현예 1 내지 10 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 절단 후에 표적 편집 부위에 5' 오버행을 제공하는 방법.

12. 구현예 1 내지 11 중 어느 한 구현예에 있어서, SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.

13. 구현예 1 내지 12 중 어느 한 구현예에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.

14. 구현예 13에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, 동등한 SSAP 활성을 갖는 관련 단백질 또는 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

15. 구현예 13에 있어서, ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

16. 구현예 13에 있어서, RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

17. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.

18. 구현예 17에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.

19. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.

20. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.

21. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 엑소뉴클레아제 III, Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

22. 구현예 1, 5 또는 6에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

23. 구현예 1 내지 22 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.

24. 구현예 1 내지 23 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 방법.

25. 구현예 24에 있어서, SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 방법.

26. 구현예 1 내지 23 중 어느 한 구현예에 있어서, SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

27. 구현예 1 내지 26 중 어느 한 구현예에 있어서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.

28. 구현예 1 내지 26 중 어느 한 구현예에 있어서, 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.

29. 구현예 1 내지 28 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.

30. 구현예 1 내지 29 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 방법.

31. 구현예 1 내지 30 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 방법.

32. 구현예 31에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 방법.

33. 구현예 32에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.

34. 구현예 31 내지 33 중 어느 한 구현예에 있어서, 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.

35. 구현예 31 내지 34 중 어느 한 구현예에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.

36. (a) 진핵 세포;

(c) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자(들)를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 시스템으로서,

진핵 세포가 유효량의 HDR 촉진제 및 게놈 편집 분자(들)와 회합되고/되거나 이와 접촉되고/되거나 이를 함유하는 시스템.

37. 구현예 36에 있어서, 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 시스템.

38. 구현예 37에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 시스템.

39. 구현예 36에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 시스템.

40. 구현예 36에 있어서, 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 시스템.

41. 구현예 40에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 시스템.

42. 구현예 40에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 시스템.

43. 구현예 36에 있어서, 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈 상에 제공되는 시스템.

44. 구현예 36 내지 43 중 어느 한 구현예에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 시스템.

45. 구현예 36 내지 44 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 표적 편집 부위가 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 시스템.

46. 구현예 36 내지 45 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 절단 후에 표적 편집 부위에 5' 오버행을 제공하는 시스템.

47. 구현예 36 내지 46 중 어느 한 구현예에 있어서, 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 적어도 2배 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 시스템.

48. 구현예 36 내지 47 중 어느 한 구현예에 있어서, SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 시스템.

49. 구현예 36 또는 48에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 시스템.

50. 구현예 49에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.

51. 구현예 49에 있어서, RecT/ Redβ-과 단백질이 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, Rac 박테리아 프로파지 RecT 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.

52. 구현예 49에 있어서, RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.

53. 구현예 49에 있어서, ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.

54. 구현예 49에 있어서, RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.

55. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.

56. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.

57. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.

58. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.

59. 구현예 36 내지 58 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.

60. 구현예 36, 40 또는 41에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.

61. 구현예 36 내지 60 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 시스템.

62. 구현예 36 내지 61 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 시스템.

63. 구현예 62에 있어서, SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 시스템.

64. 구현예 36 내지 63 중 어느 한 구현예에 있어서, SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.

65. 구현예 36 내지 64 중 어느 한 구현예에 있어서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 적어도 2배 증가되는 시스템.

66. 구현예 36 내지 64 중 어느 한 구현예에 있어서, 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 유지되거나 적어도 2배 감소되는 시스템.

67. 구현예 36 내지 66 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 시스템.

68. 구현예 36 내지 64 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.

69. 구현예 36 내지 68 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 시스템.

70. 구현예 69에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 시스템.

71. 구현예 69 또는 70에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 시스템.

72. 구현예 69, 70 또는 71에 있어서, 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 시스템.

73. 구현예 69 내지 72 중 어느 한 구현예에 있어서, 시스템이 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 것을 제공하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 시스템.

74. (a) 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 진핵 세포에 제공함으로써, 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드, 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하고; HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계; 및

(b) 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시킴으로써, 게놈 변형을 갖는 진핵 세포를 제조하는 단계를 포함하는, 게놈 변형을 갖는 진핵 세포의 제조 방법.

75. 구현예 74에 있어서, 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.

76. 구현예 75에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.

77. 구현예 74에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.

78. 구현예 74에 있어서, 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.

79. 구현예 78에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.

80. 구현예 78에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.

81. 구현예 74에 있어서, 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.

82. 구현예 74 내지 81 중 어느 한 구현예에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접된 방법.

83. 구현예 74 내지 82 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 표적 편집 부위가 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 방법.

84. 구현예 74 내지 83 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 절단 후에 표적 편집 부위에 5' 오버행을 제공하는 방법.

85. 구현예 74 내지 84 중 어느 한 구현예에 있어서, SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.

86. 구현예 74 내지 85 중 어느 한 구현예에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.

87. 구현예 86에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.

88. 구현예 86에 있어서, RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

89. 구현예 86에 있어서, ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

90. 구현예 86에 있어서, RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

91. 구현예 74 내지 90 중 어느 한 구현예에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.

92. 구현예 74 내지 91 중 어느 한 구현예에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.

93. 구현예 74 내지 92 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.

94. 구현예 74 내지 92 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.

95. 구현예 74 내지 90 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

96. 구현예 74, 78 또는 79에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

97. 구현예 74 내지 96 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.

98. 구현예 74 내지 97 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 방법.

99. 구현예 98에 있어서, SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 방법.

100. 구현예 74 내지 99 중 어느 한 구현예에 있어서, SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

101. 구현예 74 내지 100 중 어느 한 구현예에 있어서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.

102. 구현예 74 내지 100 중 어느 한 구현예에 있어서, 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.

103. 구현예 74 내지 102 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.

104. 구현예 74 내지 103 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.

105. 구현예 74 내지 104 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 방법.

106. 구현예 105에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 방법.

107. 구현예 105 또는 106에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.

108. 구현예 105, 106 또는 107에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.

109. 구현예 105 내지 108 중 어느 한 구현예에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.

110. HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포가 복수의 용기, 구획 또는 위치를 포함하는 어레이에 제공되며, 각각의 용기, 구획 또는 위치가 HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포를 포함하는 구현예 1 내지 30 중 어느 한 구현예의 방법, 구현예 36 내지 68 중 어느 한 구현예의 시스템 또는 구현예 74 내지 104 중 어느 한 구현예의 방법.

111. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 진핵 세포에 제공하는 단계를 포함하는 진핵 세포의 유전학적 엔지니어링 방법으로서,

세포의 표적 편집 부위가 공여자 주형 DNA 분자에 의해 변형되는 방법.

112. 구현예 111에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.

113. 구현예 112에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제, Cas12i, Cas14 또는 엔지니어링된 뉴클레아제를 포함하는 방법.

114. 구현예 111에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.

115. 구현예 111에 있어서, 가이드 RNA를 추가로 포함하며, 서열-특이적 엔도뉴클레아제 및 가이드 RNA가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 방법.

116. 구현예 115에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하며, 서열-특이적 엔도뉴클레아제가 표적 편집 부위 내의 엔도뉴클레아제 인식 서열에 특이적인 방법.

117. 구현예 115에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.

118. 구현예 111에 있어서, 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.

119. 구현예 111에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 방법.

120. 구현예 111에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.

121. 구현예 120에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.

122. 구현예 111에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.

123. 구현예 111에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.

124. 구현예 111에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.

125. 구현예 111에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.

126. 구현예 111에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

127. 구현예 111에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.

128. 구현예 111에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.

129. 구현예 111 내지 128 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 방법.

130. 구현예 129에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 방법.

131. 구현예 130에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.

132. 구현예 131에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.

133. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 하나 이상의 벡터에 제공되는 방법.

135. 구현예 133에 있어서, 벡터가 아그로박테리움 벡터인 방법.

136. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 염색체에 의해 제공되는 방법.

137. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 폴리펩티드, DNA, mRNA를 도입함으로써 및/또는 유성 교배에 의해 제공되는 방법.

138. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 i) 내지 v) 중 하나 이상을 포함하는 전구 세포에 의해 제공되며,

전구 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며,

전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 이후에 전구 세포로의 폴리펩티드, DNA 또는 mRNA의 전달에 의해 및/또는 전구 세포의 유성 교배에 의해 제공되는 방법.

139. 구현예 111 내지 138 중 어느 한 구현예에 있어서, 변형을 검출하는 단계를 추가로 포함하는 방법.

140. 구현예 139에 있어서, 변형을 검출하는 단계가 앰플리콘 서열분석을 포함하는 방법.

141. 구현예 111 내지 140 중 어느 한 구현예에 있어서, 표적 편집 부위가 단백질 코딩 서열 또는 프로모터 내에 존재하는 방법.

142. 구현예 111 내지 141 중 어느 한 구현예에 있어서, 표적 편집 부위의 변형이 삽입, 결실 또는 치환인 방법.

143. 구현예 111 내지 142 중 어느 한 구현예에 있어서, 표적 편집 부위가 작물재배학적으로 중요한 형질을 인코딩하는 유전자 또는 포유류 질병에 연관되는 유전자인 방법.

144. 하기를 포함하는 유전학적으로 변형된 표적 편집 부위를 갖는 진핵 세포의 생성 방법:

(a) 표적 편집 부위 내의 적어도 하나의 엔도뉴클레아제 인식 서열의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 상기 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 제공하는 단계, 및

(b) 적어도 하나의 이중-가닥 DNA 서열을 포함하는 적어도 하나의 공여자 분자를 제공하는 단계로서, (i) 상기 DNA 서열이 표적 편집 부위에 측접한 서열에 대하여 적어도 50개 뉴클레오티드의 길이에 걸쳐 적어도 90%의 상동성을 가지며, (ii) 상기 공여자 서열이 상기 표적 편집 부위와 비교하여 적어도 하나의 변형을 포함하는 단계; 및

(c) (i) 적어도 하나의 단일-가닥 DNA 어닐링 단백질(SSAP), 및

(ii) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 적어도 하나의 엑소뉴클레아제, 및

(iii) 적어도 하나의 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 적어도 하나의 상동성 지정 수선(HDR) 촉진제를 제공하는 단계를 포함함으로써,

적어도 하나의 서열-특이적 엔도뉴클레아제, 적어도 하나의 공여자 분자 및 적어도 하나의 HDR 촉진제가 상기 변형을 상기 진핵 세포의 상기 표적 편집 부위 내로 도입하며;

(d) 상기 표적 편집 부위 내에 변형을 포함하는 진핵 세포를 단리하는 단계.

145. 구현예 144에 있어서, 변형이 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 결실 또는 하나 이상의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택되는 방법.

146. 구현예 144에 있어서, 표적 편집 부위의 일부가 상기 표적 편집 부위 내의 2개의 서열 특이적 절단을 사용함으로써 결실되며, 공여자 분자에 의해 제공되는 서열로 대체되는 방법.

147. 구현예 144 내지 146 중 어느 한 구현예에 있어서, 상기 공여자 서열이 엔도뉴클레아제 인식 서열이 측접된 벡터에 존재하는 방법.

148. 구현예 144 내지 147 중 어느 한 구현예에 있어서, 변형을 포함하는 진핵 세포를 증식시키는 단계를 추가로 포함하는 방법.

149. 하기의 단계를 포함하는 유전학적으로 변형된 유기체의 생성 방법:

(i) 구현예 144 내지 148 중 어느 한 구현예에 의해 유전학적으로 변형된 진핵 세포를 생성하는 단계, 및

(ii) 상기 세포를 유기체 내로 재생시키는 단계.

150. 구현예 149에 있어서, 유기체가 식물 및 비-인간 동물로 이루어진 군으로부터 선택되는 유기체.

151. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물.

152. 구현예 151에 있어서, 핵산이 하나 이상의 벡터에 존재하는 조성물.

153. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 벡터.

154. 구현예 153에 있어서, 벡터가 공여자 주형 DNA, 서열 특이적 엔도뉴클레아제 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터.

155. 구현예 153에 있어서, 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 벡터.

156. 구현예 153에 있어서, 벡터가 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 벡터.

157. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 진핵 세포를 유전학적으로 엔지니어링하기 위한 사용 설명서를 포함하는 키트.

158. 구현예 157에 있어서, 키트가 제1 벡터 및 제2 벡터를 포함하며,

i) 제1 벡터가 공여자 주형 DNA 및 서열 특이적 엔도뉴클레아제를 포함하는 핵산을 포함하며, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하며;

ii) 제2 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 키트.

159. 구현예 157 또는 158에 있어서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제를 추가로 포함하는 키트.

160. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 세포.

161. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 세포.

162. 구현예 160 또는 161에 있어서, 세포가 식물 또는 포유류 세포인 세포.

163. 구현예 160 내지 162 중 어느 한 구현예에 있어서, 세포가 숙주 세포인 세포.

164. 구현예 1 내지 35 및 74 내지 149 중 어느 한 구현예의 방법에 의해 생성되는 유전학적으로 엔지니어링된 세포.

165. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)의 하위세트를 포함하는 표적 편집 부위에서의 유전학적 엔지니어링을 위한 전구 진핵 세포 또는 유기체로서, 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 전구 세포 또는 유기체에 포함되지 않은 i) 내지 v) 중 적어도 하나를 세포 또는 유기체에 제공하는 것이 공여자 주형 분자에 의한 표적 편집 부위의 변형을 초래하는 전구 진핵 세포 또는 유기체.

166. 구현예 165에 있어서, 공여자 주형이 이중-가닥 DNA 분자인 전구 진핵 세포 또는 유기체.

167. 구현예 165에 있어서, 세포가 생식선 세포인 전구 세포.

168. 구현예 165에 있어서, 전구 진핵 세포가 전구 식물 세포이며, 전구 식물 세포 또는 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 형질전환에 의해 공급되는 전구 진핵 세포 또는 유기체.

169. 구현예 165에 있어서, 유기체가 식물이며, 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 제2 식물과의 유성 교배에 의해 공급되는 전구 유기체.

170. 구현예 165에 있어서, 전구 진핵 세포가 동물 세포이며, 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 트랜스펙션에 의해 공급되는 전구 진핵 세포.

171. 구현예 165에 있어서, 전구 유기체가 비-인간 동물이며, 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 비-인간 동물과의 유성 교배에 의해 공급되는 전구 유기체.

172. 구현예 153에 있어서, 서열-특이적 뉴클레아제가 유도성 프로모터에 작동 가능하게 연결된 벡터.

173. 구현예 111에 있어서, 서열-특이적 엔도뉴클레아제가 닉카제인 방법.

실시예

하기의 실시예는 오직 본 발명의 예시인 것으로 의도되며, 이에 따라 어떠한 방식으로든 본 발명을 제한하는 것으로 간주되지 않아야 한다. 하기의 실시예 및 상세한 설명은 예시에 의해 제한 없이 제공된다.

실시예 1. 엑소뉴클레아제, SSAP, 및 SSB 발현 벡터 및 공여자 DNA 주형 서열

본 실시예에는 박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO:1) 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위해 사용되는 식물 발현 벡터의 구축이 기술된다.

박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO: 1), 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위한 식물 발현 구축물을 구축하였다. SEQ ID NO:15의 담배 c2 핵 국소화 신호(NLS)를 인코딩하는 DNA 서열을 엑소뉴클레아제, 박테리오파지 람다 베타 SSAP 단백질, 및 에스케리키아 콜라이 SSB를 인코딩하는 DNA 서열에 작동 가능하게 연결하여, 각각 SEQ ID NO: 135, SEQ ID NO: 134, 및 SEQ ID NO: 133에 제시된 c2 NLS-Exo(레드-엑소로도 알려져 있음), c2 NLS 람다 베타 SSAP(레드-베타로도 알려져 있음), 및 c2 NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 제공하였다. c2 NLS-Exo, c2 NLS 람다 베타 SSAP, 및 c2NLSf-SSB 융합 단백질을 인코딩하는 DNA 서열을 각각 2x35S, SlUBI10, PcUBI4 프로모터 및 35S, AtHSP, pea3A 폴리아데닐화 부위에 작동 가능하게 연결하여, 엑소뉴클레아제, SSAP, 및 SSB 식물 세포 유전자 발현 카세트를 제공하였다(도 2 참조).

HDR에 의한 42개 염기쌍 이종 서열의 삽입을 위한 토마토 Ant1 유전자의 프로모터 영역을 표적화하는 DNA 공여자 주형 플라스미드를 구축하였다(도 1). 원형 DNA 공여자 플라스미드는 양측에 약 600 내지 800 bp 길이의 상동성 아암이 측접된 원하는 삽입 영역(42개 염기쌍 길이)을 갖는 대체 주형을 포함하였다. 상동성 아암은 표적 gDNA 삽입 부위에 측접한 gDNA(게놈 DNA) 영역과 일치하였다(즉, 이와 상동성이었다). 공여자 DNA를 포함하는 대체 주형 영역은 RNA-가이드된 뉴클레아제에 의해 인식되는 표적 gDNA 서열과 동일한 DNA 서열이 각각의 말단에서 측접하였다. RNA-가이드된 서열-특이적 엔도뉴클레아제 및 삽입 부위에 인접한 서열에 상보적인 가이드 RNA의 발현을 제공하는 식물 발현 카세트도 또한 구축하였다(도 1).

실시예 2. 토마토 원형질체를 사용한 게놈 편집 실험

본 실시예에는 엑소뉴클레아제, SSB 및 SSAP의 존재 및 부재 하에 블런트- 및 스태거형 말단 절단 CAS 뉴클레아제를 사용한 토마토 원형질체에서의 유전자 편집이 기술된다.

토마토 원형질체를 본질적으로 공개된 절차에 따라 단리하고, 재배하고, PEG-매개된 트랜스펙션으로 처리하였다(문헌[

erm

k et al. 2017]). 트랜스펙션된 물질은 실시예 1에 기술된 공여자 DNA 주형 영역을 가질 뿐 아니라 표기된 바와 같이 gRNA 및 Cas 폴리뉴클레오티드를 발현하는 플라스미드를 포함하였다(도 1). Cas 폴리뉴클레오티드를 핵 국소화 신호에 융합시켰다. gRNA는 의도된 게놈 DNA 표적 내로 이중 가닥 파단을 표적화하고, 공여자 플라스미드로부터 대체 주형을 방출시킨다(도 1 참조). 일부 실험을 엔도뉴클레아제 인식 서열의 절단 후에 블런트 말단을 남기는 CAS 뉴클레아제를 대표하고, 본원에 CasB 뉴클레아제로 지칭되는 Cas 뉴클레아제를 사용하여 수행하였다. 다른 실험을 엔도뉴클레아제 인식 서열의 절단 후에 스태거형 단일 가닥 DNA 오버행 말단을 남기는 CAS 뉴클레아제를 대표하고, 본원에 CasS 뉴클레아제로 지칭되는 Cas 뉴클레아제를 사용하여 수행하였다.

트랜스펙션 이후 원형질체의 48시간의 인큐베이션 후에, gDNA를 트랜스펙션된 시료로부터 추출하고, 표적 유전자좌를 도입되는 대체 서열에 측접한 게놈 서열 및 대체 주형의 상동성 아암에 상보적인 프라이머를 사용하여 증폭하고, 앰플리콘 서열분석에 의해 분석하였다.

앰플리콘을 쌍형성-말단 일루미나(paired-end Illumina) 서열분석을 사용하여 서열분석하였다. 앰플리콘의 크기로 인하여, 쌍형성-말단 판독물의 오직 하나의 판독물 말단(판독물 1)만이 표적화된 서열 삽입을 함유하는 관심 부위를 포함한다. 관심 판독물(판독물 1)을 품질에 대하여 트리밍하고, 참조 앰플리콘에 대하여 정렬하였다. 판독물은 독특한 분자 식별자(UMI) 태그를 가져, 이들을 몇몇의 종류의 PCR 복제물로부터 구별하였으며, 이들 판독물에서, 정렬로부터 복제물을 제거하였다. 이어서 비-편집된 게놈 서열에 맵핑된 판독물(판독물 2)을 게놈에 대한 정확한 캡핑에 대하여 점검하였다. 판독물 1로부터 생성된 정렬을 CrispRVariants를 사용하여 분석하였으며, 이는 절단 부위를 중심으로 하는 100bp 윈도우 내에서 상이한 모든 서열 대립유전자를 설명하며, 이를 기록하였다(문헌[Lindsay, H. et al. Nature Biotechnology 2016 34: 701-702]). CrispRVariants에 의해, 전체 정렬의 판독물의 수에서 각각의 대립유전자의 판독물의 빈도가 보고되었다. 상이한 서열 대립유전자를 1) 야생형 서열, SNP 또는 서열분석 인공산물, 2) 삽입결실 돌연변이 또는 3) 정확한 삽입 이벤트로 분류하였다. CrispRVariants는 돌연변이의 유형 및 정의된 절단 부위로부터의 그의 거리에 기초하여 SNP를 자동으로 검출하였으며, 추가의 필터링 단계를 사용하여, 예측된 절단 부위의 어느 하나의 측 상의 5bp 내에서 염기를 포함하지 않은 임의의 다른 서열 이상을 제거하였다. 이들 대립유전자를 범주 1에 배치하였다. 절단 부위의 어느 하나의 측 상의 5bp 내에 임의의 염기를 포함하는 삽입 또는 결실 돌연변이를 갖는 모든 서열분석 대립유전자는 삽입결실인 것으로 결정되었으며, 범주 2에 배치하였다. 성공적인 정확한 유전자 표적화는 예상되는 크기의 삽입 및 서열에 의해 확인 가능한 단일의 CrispRVariants 서열 대립유전자를 제공하였다. 하기의 표 1 내지 2에서, 삽입결실%에 대해 보고된 빈도는 삽입결실인 것으로 결정된 모든 서열분석 대립유전자의 모든 빈도의 합이다. 정확%에 대해 보고된 빈도는 단일의 정확한 삽입 서열분석 대립유전자의 빈도이다. 두 빈도 모두에 대한 분모는 참조 앰플리콘에 대하여 정렬되는 모든 판독물의 합이다.

평균 측정치의 결과는 하기 표 1에 요약되어 있다. CasS(1) 및 CasS(2)는 (1)에 비하여 (2)에서 가이드 RNA의 2배 증가가 사용된 것을 제외하고 유사한 처리였다. "람다 레드"는 3개 모두의 HDR 촉진제(엑소뉴클레아제, 람다 베다 SSAP 단백질, 및 SSB)를 지칭한다. SD = 표준 편차.

[표 1]

모든 3개의 HDR 촉진제(즉, SSB, 엑소뉴클레아제 및 SSAP)의 트랜스펙션은 CasB 블런트 말단 뉴클레아제 실험 및 CasS 스태거형 말단 절단 뉴클레아제 둘 모두에 대하여 HDR의 발생을 크게 향상시켰다(약 10배). 공여자 주형(HDR)이 게놈 편집 편집부의 오직 0.1 내지 0.22%에서만 혼입되는 경우에, 기준선을 모든 3가지 HDR 촉진제의 부재 하에 측정하였다. 표 1에 나타낸 바와 같이, HDR 촉진제를 함유하지 않았던 시료를 기준선 대조군으로서 제공하였다.

3개의 HDR 촉진제 중 어느 하나 또는 둘의 제거는 모든 경우에, 그것이 여전히 기준선을 초과하여 측정 가능하였지만, HDR 발생을 유의미하게 감소시켰다(표 2).

[표 2]

표적 편집 부위에 스태거형 말단을 갖는 CasS 뉴클레아제-매개된 편집은 표적 편집 부위에 블런트 말단을 갖는 CasB 뉴클레아제-매개된 편집보다 더 높은 비의 정확한 편집 이벤트(HDR)를 생성하였다. 따라서, CasS 뉴클레아제-매개된 편집 이벤트의 약 80% 및 CasB 뉴클레아제-매개된 편집 이벤트의 30%는 NHEJ 이벤트에 비하여 정확한 HDR 이벤트였다. NHEJ 이벤트의 생성률은 HDR 촉진제의 존재에 의하여 유의미하게 감소되었다.

실시예 3. 옥수수 원형질체를 사용한 게놈 편집 실험

본 실시예는 삽입보다는 서열 대체를 유도하기 위하여 2개의 이중 가닥 파단을 아주 근접하게 유도하는 블런트 말단 절단 CAS 뉴클레아제를 사용한, 엑소뉴클레아제, SSB 및 SSAP의 존재 및 부재 하의 옥수수 원형질체에서의 유전자 편집을 설명한다.

110개 염기쌍 서열의 HDR-매개된 대체를 위하여 옥수수 PYL-E 유전자의 코딩 영역을 표적화하여 동의 돌연변이 및 2개의 gRNA에 의해 표적화된 2개의 PAM 부위의 파괴를 초래하는 7개 염기 편집 및 아미노산 변화를 초래하는 1개 염기 편집을 도입하는 DNA 공여자 주형 플라스미드를 구축한다. 원형 DNA 공여자 플라스미드는 양측에 약 약 500 bp 길이의 상동성 아암이 측접된 원하는 변형을 갖는 대체 주형(8개의 염기 변형을 갖는 110개 염기쌍 길이 영역)을 포함한다. 상동성 아암은 2개의 gRNA 표적 부위에 측접한 gDNA(게놈 DNA) 영역과 일치한다(즉, 이와 상동성이다). 공여자 DNA를 포함하는 대체 주형 영역은 각각의 말단에서 RNA-가이드된 뉴클레아제에 의해 인식되는 2개의 표적 gDNA 서열 중 하나와 동일한 DNA 서열이 측접한다.

옥수수 원형질체를 단리하고, 재배하고, PEG-매개된 트랜스펙션으로 처리한다. 트랜스펙션된 물질은 SEQ ID NO: 135, SEQ ID NO: 134, 및 SEQ ID NO: 133에 제시되고, 각각 2x35S, ZmUBI1, OsACT1 프로모터 및 35S, AtHSP, pea3A 폴리아데닐화 부위에 작동 가능하게 연결된, c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2 NLS-SSB 융합 단백질을 발현하는 플라스미드를 포함한다. 또한, 플라스미드는 상기 기술된 공여자 DNA 주형 영역을 가지며, 표기된 바와 같은 2개의 gRNA 및 Cas 폴리뉴클레오티드를 발현한다. Cas 폴리뉴클레오티드는 핵 국소화 신호에 융합된다. 2개의 gRNA의 각각은 공여자 플라스미드로부터 대체 주형을 방출하기 위해 한 말단에서 대체 주형에 측접한 서열 및 의도된 게놈 DNA 표적 내로 이중 가닥 파단을 표적화한다. 실험을 엔도뉴클레아제 인식 서열의 절단 후에 블런트 말단을 남기고 본원에서 CasB 뉴클레아제로 지칭되는 Cas 뉴클레아제를 사용하여 수행한다.

트랜스펙션 후 원형질체의 48시간의 인큐베이션 후에, gDNA를 트랜스펙션된 시료로부터 추출하고, 표적 유전자좌를 대체 주형의 상동성 아암 및 도입된 염기 변형에 측접하는 게놈 서열에 상보적인 프라이머를 사용하여 증폭시키고, 앰플리콘 서열분석에 의해 분석하였다. HDR은 gRNA 및 Cas 뉴클레아제를 인코딩하는 폴리뉴클레오티드만으로 트랜스펙션된 대조군에 비하여, c2 NLS-Exo, c2 NLS 람다 베타 SSAP, 및 c2 NLS-SSB 융합 단백질, gRNA 및 Cas 뉴클레아제를 인코딩하는 폴리뉴클레오티드를 발현하는 플라스미드로 트랜스펙션된 원형질체에서 증가된 수준으로 관찰된다.

실시예 4. 생물학적 서열

본 실시예는 본원에 언급된 단백질 및 핵산 서열의 비제한적인 구현예를 제공한다. 생물학적 서열 및 이들의 SEQ ID NO는 표 3에 제시되어 있다.

[표 3]

실시예 5. 토마토 원형질체에서의 게놈 편집

하기의 실시예에는 HDR 촉진제(즉, 엑소뉴클레아제, SSB 단백질 및 SSAP)의 존재 및 부재 하에 Cas 뉴클레아제를 사용한 토마토 원형질체에서 유전자 편집을 평가하는 실험이 기술된다. 구체적으로, 게놈 편집에 대한 주형 공여자 DNA, HDR 촉진제, 및 뉴클레아제 시약의 형태 및 전달 방법의 변경의 효과를 시험하기 위한 실험을 수행하였다.

재료 및 방법

토마토 원형질체를 실시예 2에 기술된 바와 같이 단리하고, 재배하고, 트랜스펙션시켰다. 게놈 편집을 실시예 2에 기술된 바와 같이, 앰플리콘 서열분석을 사용하여 평가하였다.

트랜스펙션을 위한 플라스미드의 설계

모든 성분을 단일의 벡터의 부분으로서 포함하거나(플라스미드, 도 3 참조), 동시-트랜스펙션을 위한 2개의 상이한 플라스미드 상에 분리된 성분을 갖는(도 4 내지 도 5 참조) 플라스미드를 구축하였다. 특히, 제1 벡터는 CasS 뉴클레아제 및 그의 상응하는 가이드 RNA를 인코딩하였으며, 제2 벡터는 모든 3개의 HDR 촉진제(즉, SSB 단백질, 엑소뉴클레아제 및 SSAP)를 인코딩하였다. 또한, 엔도뉴클레아제 인식 서열이 측접한 공여자 주형은 제1 또는 제2 벡터 중 어느 하나에 존재하였다.

HDR에 의한 42개 염기쌍 이종 서열의 삽입 및 3개 염기쌍의 결실을 위하여 토마토 Ant1 유전자의 프로모터 영역을 표적화하기 위한 DNA 공여자 주형을 구축하였다.

선형화된 공여자 DNA

공여자 주형 DNA를 특이적인 뉴클레아제 인식 서열이 측접한 선형 이중 가닥 DNA 분자로서 또는 원형 벡터의 부분으로서 첨가하였다.

DNA 주형 상의 gRNA 인식 부위의 존재

공여자 DNA 주형에 측접한 gRNA-인식되는 절단 부위의 존재의 영향을 이들을 트랜스펙션 벡터로부터 제거함으로써 시험하였다.

결과

토마토 원형질체를 HDR 촉진제(즉, 엑소뉴클레아제, SSB 단백질 및 SSAP)의 존재 및 부재 하에 Cas 뉴클레아제, 가이드 RNA, 및 공여자 DNA를 인코딩하는 1개 또는 2개의 플라스미드 벡터로 형질전환시켰다(도 3 내지 도 5 참조). 하기의 표 4A 내지 표 4C는 토마토 원형질체 유전자 편집 실험으로부터의 데이터의 요약을 제공한다.

2개의 벡터의 동시-형질전환은 하기 표 4A에 나타낸 바와 같이, HDR에 기인한 정확한 게놈 편집의 유의미한 증가, 및 비-상동성 말단 연결(NHEJ)에 기인한 삽입 및 결실(삽입결실) 편집의 감소를 지속적으로 보여주었다. HDR 촉진제(즉, SSB, 엑소뉴클레아제 및 SSAP)의 존재 하에 높은 비(예를 들어, 약 70 내지 80%)의 정확한 편집 대 삽입결실 편집이 존재하였다. 공여자 주형 DNA 및 Cas 뉴클레아제가 개별 벡터 상에서 동시-형질전환되는 경우(도 4 내지 도 5), HDR 촉진제의 부재 하의 공여자 주형의 포함은 정확한 편집을 유의미하게 촉진시키지 않고 NHEJ 편집을 유의미하게 감소시켰다. 공여자 주형 DNA 및 Cas 뉴클레아제가 단일의 벡터 상에 존재하는 경우(도 3), HDR 촉진제의 존재는 NHEJ 편집을 더 낮은 정도로 감소시켰다. 공여자 주형 DNA에 측접한 gRNA-인식되는 절단 부위가 제거되는 경우, HDR 촉진제의 존재는 NHEJ 편집의 수준을 감소시키지 않았다. 상이한 벡터 상의 성분의 동시-형질전환은 실시예 2에 기술된 효율에 비하여 HDR 효율을 유의미하게 개선시키지 않았다.

[표 4A]

선형 주형 DNA는 실시예 2에서 사용되는 바와 같은 특이적인 뉴클레아제 인식 서열이 측접한 원형 벡터만큼, 정확한(HDR) 편집을 촉진시키고 삽입결실(NHEJ) 편집을 감소시키는 데 효율적이었다(표 4B).

[표 4B]

절단 부위에 측접한 DNA 주형의 영향을, 이들을 트랜스펙션 벡터로부터 제거함으로써 시험하였다. 정확한 편집의 수 및 백분율은 HDR 촉진제를 갖지 않았던 음성 대조군의 것보다 더 컸지만, 실시예 2에서와 같이 절단 부위가 측접한 DNA 주형을 갖는 양성 대조군보다는 더 낮았다(표 4C). 유사하게, 삽입결실 빈도는 음성 대조군의 것보다 더 낮았으며, 양성 대조군보다 약간 더 높았다.

[표 4C]

실시예 6. 옥수수에서의 SPX 의 게놈 대체

하기의 실시예에는 HDR 촉진제(즉, 엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질)를 사용한 옥수수 원형질체 내의 SPX 유전자좌에서의 miRNA 결합 부위의 편집이 기술된다.

재료 및 방법

플라스미드 구축물의 설계

2개의 gRNA를 사용하여 CasS-매개된 절단을 위하여 옥수수 내의 SPX 유전자좌에서 miRNA 결합 부위 주변의 영역을 표적화함으로써, 상기 부위의 대체를 매개한다. 공여자 DNA 단편은 HDR 촉진제에 의해 매개되는 HDR 수선/편집을 위한 주형으로서 사용된다.

옥수수 내의 SPX 유전자좌 및 이의 측접 영역에서 miRNA 결합 부위를, miRNA 결합 부위 내의 3개의 염기쌍마다 SNP를 함유하는 단편으로 대체하도록 플라스미드 구축물을 설계한다. 또한, SNP를 도입하여 2개의 PAM 부위를 돌연변이시킴으로써, 편집이 발생한 후에 유전자좌의 절단을 방지한다. miRNA 결합 부위 내로 도입된 SNP 중 하나는 miRNA 결합 부위 및 PAM 서열 중 하나에 대한 SNP로서 작용한다.

표적에 특이적인 2개의 gRNA와 함께 CasS 뉴클레아제, HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질), 및 대체 단편 및 표적 편집 부위에 대하여 상동성인 약 700개 염기쌍 상동성 아암을 갖는 공여자 주형을 갖는 시스템이 사용된다. Cas9 및 HDR 촉진제를 발현하는 벡터를 실시예 6에 기술된 바와 같이 설계하였다. 상동성 아암은 약 700개 염기쌍이도록 설계하였는데, 그 이유는 이전의 실험에 의해, 약 500개 내지 750개 염기쌍 아암이 작용성임이 나타났기 때문이다(실시예 6 참조). 또한, 상동성 아암의 GC 함량도 또한 고려하고, 최대화하였으며, 이는 이론에 결부시키고자 하지 않고, 어닐링과, 정확한 편집의 촉진에 도움을 줄 수 있다. HDR 촉진제에 의해 매개되는 이후의 편집을 위하여 공여자가 플라스미드로부터 절단되고 방출되도록 2개의 gRNA 표적 서열의 각각이 또한, 공여자의 말단에 존재하였다. 단일의 플라스미드가 편집을 위한 모든 필요한 성분을 발현하였다(도 6 참조). 각각의 발현되는 성분은 그 자체의 프로모터에 의해 유도되었다.

옥수수 재배 및 트랜스펙션 및 앰플리콘 서열분석

각각의 개별 플라스미드를 4개의 개별 반복실험에서 옥수수 원형질체 내로 트랜스펙션시킨다. 세포를 48시간 동안 인큐베이션시킨다. 이어서, 게놈 DNA를 추출하고, 앰플리콘 서열분석 라이브러리를 제조한다. 삽입 및 결실(삽입결실) 빈도 및 대체 효율을 상기 실시예 2에 기술된 바와 같이 앰플리콘 서열분석 데이터로부터 정량화한다.

결과

옥수수 내의 SPX 유전자좌에서의 miRNA 결합 부위를 HDR 촉진제의 존재 또는 부재 하에 2개의 gRNA에 의해 표적화된 CasS 뉴클레아제를 사용하여 편집한다. 이 실험 시료에 더하여, 기준선 대조군 및 몇몇의 다른 대조군이 실험에 포함된다. 표 5에 나타낸 바와 같이, 2개의 gRNA와 함께 CasS 및 공여자, 2개의 gRNA와 함께 CasS, 개별 gRNA와 함께 CasS, 및 공여자 단독을 인코딩하는 벡터를 대조군으로서 제공한다.

[표 5]

정확한 편집 및 삽입결실을 서열분석에 의해 측정하고, 상이한 시료 간에 비교한다.

실시예 7. 니코티아나 벤타미아나( Nicotiana benthamiana )에서의 향상된 HDR

하기의 실시예에는 니코티아나 벤타미아나 잎에서의 게놈 편집이 기술된다. 특히, 식물계에서의 편집의 효율을 HDR 촉진제(즉, 엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질)의 존재 또는 부재 하에 니코티아나 벤타미아나 리포터 라인에서의 GFP의 코딩 서열을 GFP의 돌연변이 대립유전자로 수선함으로써 측정한다.

재료 및 방법

니코티아나 벤타미아나 재배 및 트랜스펙션

GFP의 기능 상실 대립유전자를 갖는 니코티아나 벤타미아나의 종자를 2주 동안 카나마이신 선택 배지(50 ㎎/㎖) 상에서 발아시킨 후에, 토양으로 옮기고, 2주 동안 컨비론(Conviron) 성장 챔버(12h/12h/75μmol/m²s^-1, 낮:밤:광)에서 성장시킨다. 니코티아나 벤타미아나 잎에, CasS 및 HDR 촉진제 발현 카세트, 및 GFP-수선 주형을 갖는 공여자 주형을 함유하는 T-DNA 벡터를 발현하는 아그로박테리움 투메파시엔스(균주 GV3101)를 주사기-침윤시킨다(도 7 참조). 이어서, 잎 시료를 유전자형분석을 위해 취하여, PCR을 통해 리포터 전이유전자의 존재를 확인한다. 식물을 3일 동안 성장 리드(growth lid)를 사용하여 인큐베이션시킨 후에, 평가하고, 수집한다. 처리된 잎을 조직 배양으로 옮기고, 전체 식물을 조직 배양으로부터 재생시킨다. 모든 시료를 3벌로 시험한다.

GFP 코딩 서열 수선의 평가

GFP 코딩 서열의 수선을 수많은 방법 중 하나를 사용하여 평가한다. 표적화된 삽입을 함유하는 잎 세포의 비 및 수를 침윤 3일 후에, 형광 현미경을 사용하여 GFP 신호의 가시화에 의해 정량화한다.

침윤된 잎 내의 표적 삽입의 빈도를 실시예 2에 기술된 바와 같이, 우측 게놈/공여자 경계의 앰플리콘 서열분석을 사용하여 정량화하여, 정확한 편집의 전체 효율을 추산한다.

재생된 전체 식물을 정성적으로 비교하여, 형광 현미경을 사용한 GFP 신호의 가시화에 의해 표적화된 삽입의 안정한 발현을 확인한다.

재생된 전체 식물 내의 표적화된 삽입의 빈도를 우측 게놈/공여자 경계의 생거(Sanger) 서열분석에 의해 정량화하여, 정확한 편집의 전체 효율을 추산한다.

결과

니코티아나 벤타미아나 잎을 HDR 촉진제와 함께 및 이것 없이 돌연변이 GFP 유전자를 유전학적으로 변형시키기 위하여 CasS 시스템을 발현하도록 형질전환시킨다. 하기의 표 6은 니코티아나 벤타미아나 잎 내로 형질전환된 성분의 요약을 제공한다. "람다 레드"는 모든 3개의 HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 단백질 및 SSB)를 나타낸다.

[표 6]

돌연변이 GFP의 수선을 측정하고, 시료 간에 비교한다.

실시예 8. 분열하는 토마토 및 옥수수 조직에서의 향상된 HDR

하기의 실시예에는 분열하는 식물 조직에서 HDR 촉진제에 의해 매개되는 유전자 편집을 시험하는 실험이 기술된다. 특히, 토마토 떡잎 외식편을 HDR 촉진제의 존재 및 부재 하에 Cas 뉴클레아제를 사용하여 편집하였다. 또한, 옥수수 배 외식편을 HDR 촉진제의 존재 및 부재 하에 Cas 뉴클레아제를 사용하여 편집한다.

옥수수 외식편 형질전환

재료 및 방법

옥수수 형질전환을 위한 플라스미드의 설계

본 실시예에는 아그로박테리움 매개된 옥수수 형질전환을 위한 식물 발현 벡터의 구축이 기술된다. 2개의 식물 유전자 발현 벡터를 제조하였다. 박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO: 1) 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위한 식물 발현 카세트를 구축하였다. SEQ ID NO:15의 담배 c2 핵 국소화 신호(NLS)를 인코딩하는 DNA 서열을 엑소뉴클레아제, 박테리오파지 람다 베타 SSAP 단백질, 및 에스케리키아 콜라이 SSB를 인코딩하는 DNA 서열에 융합시켜, 각각 SEQ ID NO: 135, SEQ ID NO: 134 및 SEQ ID NO: 133에 제시된 c2 NLS-Exo, c2 NLS 람다 베타 SSAP, 및 c2 NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 제공하였다. c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 각각 OsUBI1, SlUBI1, OsACT 프로모터 및 pea3A, 완두 rbcs E9, NtEXT 폴리아데닐화 부위에 작동 가능하게 연결하여, 엑소뉴클레아제, SSAP 및 SSB 식물 발현 카세트를 제공하였다.

HDR에 의한 36개 염기쌍 이종 서열의 삽입을 위하여 옥수수 gln1-3 유전자의 프로모터 영역을 표적화하는 DNA 공여자 서열을 구축하였다. DNA 공여자 서열은 양측 모두에서 약 500 내지 635 bp 길이의 상동성 아암이 측접된 원하는 삽입 영역(36개 염기쌍 길이)을 갖는 대체 주형을 포함한다. 상동성 아암은 표적 gDNA 삽입 부위에 측접한 gDNA(게놈 DNA) 영역과 일치한다(즉, 이에 대해 상동성이다). 공여자 DNA를 포함하는 대체 주형 영역은 각각의 말단에서 RNA-가이드된 뉴클레아제에 의해 인식되는 gln1-3 유전자 서열과 동일한 DNA 서열이 측접된다.

RNA-가이드된 서열-특이적(CasB 절단 유형) 엔도뉴클레아제의 발현을 제공하는 식물 발현 카세트를 구축하였다. 삽입 부위에 인접한 서열에 상보적인 가이드 RNA의 발현을 제공하는 식물 발현 카세트를 구축하였다. 포스피노트리신 N-아세틸트랜스퍼라제신타제(PAT) 단백질의 발현을 제공하는 카세트를 함유하는 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터를 구축하였다. 카세트, 공여자 서열 및 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터가 구축되면, 이들을 조합하여, 2개의 옥수수 형질전환 플라스미드를 생성하였다.

옥수수 형질전환 플라스미드 pIN1757을 PAT 카세트, RNA-가이드 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트, 및 gln1-3 DNA 공여자 서열을 사용하여 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터 내로 구축하였다(도 8).

옥수수 형질전환 플라스미드 pIN1756을 PAT 카세트, RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트, SSB 카세트, 람다 베타 SSAP 카세트, Exo 카세트 및 gln1-3 DNA 공여자 서열을 사용하여 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터 내로 구축하였다(도 8).

옥수수 형질전환

모든 구축물을 슈퍼바이너리 벡터로부터 아그로박테리아 균주 LBA4404 내에 전달하였다.

옥수수 형질전환을 공개된 방법에 기초하여 수행하였다(문헌[Ishida et. al, Nature Protocols 2007; 2, 1614-1621]). 요약하여, 대략 1.8 내지 2.2 mm 크기의 근교계 GIBE0104 유래의 미성숙 배를 수분 후 10 내지 14일에, 표면 살균된 이삭으로부터 단리하였다. 배를 OD₆₀₀ = 1.0의 농도로 감염 배지를 사용하여 제조된 아그로박테리움 현탁액에 배치하였다. 아세토시린곤(acetosyringone)(200 μM)을 사용 시에 감염 배지에 첨가하였다. 배 및 아그로박테리움을 락커 쉐이커(rocker shaker) 상에 저속으로 15분 동안 배치하였다. 이어서, 배를 동시-배양 배지의 플레이트의 표면 상에 부었다. 플레이트를 기울이고, 모든 액체를 피펫을 사용하여 빼냄으로써 과잉의 액체 배지를 제거하였다. 배를 배판(scutellum) 상향 배향을 유지하기 위하여 필요에 따라 뒤집었다. 동시-배양 플레이트를 뚜껑이 있는 상자에 배치하고, 22℃에서 3일 동안 암 중에서 배양하였다. 이어서, 배를 배반 상향 배향을 유지하여 휴지 배지로 전달하였다. 배를 27 내지 28℃에서 7일 동안 휴지 배지 상에 남겨둔다. 캘러스를 생성한 배를 7.5 ㎎/ℓ 포스피노트리신(PPT)이 있는 선택 1 배지로 옮기고, 추가 7일 동안 배양하였다. 캘러스 형성된 배를 10 ㎎/ℓ PPT가 있는 선택 2 배지 상에 배치하고, 27 내지 28℃에서 14일 동안 배양하였다. 선택제 저항성인 성장하는 캘러스를 10 ㎎/ℓ PPT가 있는 사전-재생 배지로 옮겨, 슈트 발생을 개시하였다. 캘러스를 사전-재생 배지 상에서 7일 동안 유지하였다. 슈트를 개시하기 시작한 캘러스를 파이타트레이(Phytatray)에서 7.5 ㎎/ℓ PPT가 있는 재생 배지로 옮기고, 27 내지 28℃에서 광 중에 배양하였다. 온전한 뿌리를 갖는 파이타트레이의 상측에 도달한 슈트를 슈트 신장 배지 내로 단리한 후에, 토양으로 이식하고, 온실 조건에 점차 순응시켰다.

결과

각각의 실험 조건에서 외식편의 수는 하기 표 7A에 제공된다. 재생된 슈트를 시료추출하고, gDNA를 pIN1757에 대하여 16개의 배("이벤트") 유래의 45개의 재생된 식물로부터, 그리고 pIN1756에 대하여 53개의 배 유래의 201개의 재생된 식물로부터 추출하였다. ZmGln1.3 유전자좌를 약 835개 염기쌍의 앰플리콘을 생성하기 위하여 설계된 프라이머를 사용하여 gDNA로부터 증폭시켰으며; 정방향 프라이머는 엔도뉴클레아제 절단 부위의 약 130 bp 5'이며, 역방향 프라이머는 3' 상동성 아암의 외측에 존재하여, 오직 내인성 유전자좌만이 증폭되게 한다. 비드 클린-업(clean-up) 후에, 앰플리콘을 차세대 서열분석에 의해 분석하였다.

표 7A, 삽입결실# 및 HDR# 열에 기록된 수는 표적 서열에 대해 적어도 5,000개의 맵핑된 판독물 및 앰플리콘에 대한 적어도 50%의 완전한 정렬을 갖는 시료를 나타낸다. 표적 서열에 대한 적어도 5,000개의 판독물 맵핑 및 앰플리콘에 대한 적어도 50%의 완전한 정렬을 갖는 시료에 대하여 필터링한 후에, HDR 촉진제가 존재하는 경우, 표적화된 삽입을 갖는 53개의 이벤트(201개의 식물) 중에 2개의 독립적인 이벤트(5개의 식물)가 확인되었으며(3.77%), 이는 HDR 촉진제가 존재하지 않는 경우 16개의 이벤트 중에 0개인 것과 비교된다.

[표 7A]

토마토 외식편 형질전환

재료 및 방법

토마토 형질전환을 위한 플라스미드의 설계

박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO: 1) 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위한 식물 발현 카세트를 구축하였다. SEQ ID NO:15의 담배 c2 핵 국소화 신호(NLS)를 인코딩하는 DNA 서열을 엑소뉴클레아제, 박테리오파지 람다 베타 SSAP 단백질 및 에스케리키아 콜라이 SSB를 인코딩하는 DNA 서열에 작동 가능하게 연결하여, 각각 SEQ ID NO: 135, SEQ ID NO: 134, 및 SEQ ID NO: 133에 제시된 c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2 NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 제공하였다. c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 각각 2x35S, SlUBI10, PcUBI4　프로모터 및 35S, AtHSP, pea3A 폴리아데닐화 부위에 작동 가능하게 연결하여, 엑소뉴클레아제, SSAP 및 SSB 식물 발현 카세트를 제공하였다.

또한, HDR에 의한 42개 염기쌍 이종 서열의 삽입을 위한 토마토 Ant1 유전자(SlAnt1)의 프로모터 영역을 표적화하는 DNA 공여자 서열을 구축하였다. DNA 공여자 서열은 양 측에서 약 600 내지 800 bp 길이의 상동성 아암이 측접한 원하는 삽입 영역(42개 염기쌍 길이)을 갖는 대체 주형을 포함하였다. 상동성 아암은 표적 gDNA 삽입 부위에 측접한 내인성 DNA 영역과 일치하였다(즉, 이에 대해 상동성이었다). 공여자 DNA를 포함하는 대체 주형 영역은 각 말단에서 RNA-가이드된 뉴클레아제에 의해 인식되는 내인성 표적 편집 부위 서열과 동일한 DNA 서열이 측접하였다.

추가로, RNA-가이드된 서열-특이적 엔도뉴클레아제의 발현을 제공하는 식물 발현 카세트를 구축하였다. 삽입 부위에 인접한 서열에 상보적인 가이드 RNA의 발현을 제공하는 식물 발현 카세트를 구축하였다. 녹색 형광 단백질(GFP)의 발현을 제공하는 식물 발현 카세트를 구축하였다. 5-에놀피루빌시키메이트-3-포스페이트(EPSPS) 신타제의 발현을 제공하는 카세트를 함유하는 아그로박테리움 바이너리 플라스미드 형질전환 벡터를 구축하였다.

일단 카세트, 공여자 서열 및 아그로박테리움 형질전환 플라스미드 벡터가 구축되면, 이들을 조합하여, 3가지 토마토 형질전환 플라스미드를 생성하였다.

토마토 형질전환 플라스미드 pIN1703을 아그로박테리움 형질전환 플라스미드 벡터 내로 클로닝된 RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트 및 GFP 카세트를 사용하여 구축하였다(도 9b). 토마토 형질전환 플라스미드 pIN1704를 아그로박테리움 형질전환 플라스미드 벡터 내로 클로닝된 RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트 및 Ant1 DNA 공여자 서열을 사용하여 구축하였다(도 9b). 토마토 형질전환 플라스미드 pIN1705를 아그로박테리움 형질전환 플라스미드 벡터 내로 클로닝된 RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트, SSB 카세트, 람다 베타 SSAP 카세트, 엑소뉴클레아제 카세트 및 Ant1 DNA 공여자 서열을 사용하여 구축하였다(도 9a 내지 도 9b).

모든 벡터를 아그로박테리움 균주 EHA105를 사용하여 토마토에 전달하였다.

토마토 외식편 형질전환

상기 기술된 벡터를 사용하여 토마토(재배종 머니메이커(Moneymaker)) 외식편을 형질전환시켜, 상기 언급된 성분을 갖는 안정하게 형질전환된 전이유전자 슈트를 재생시켰다. 토마토 형질전환을 이전에 공개된 방법에 기초하여 수행하였다(문헌[Van Eck J., Keen P., Tjahjadi M. (2019) Agrobacterium tumefaciens-Mediated Transformation of Tomato. In: Kumar S., Barone P., Smith M. (eds) Transgenic Plants. Methods in Molecular Biology, vol 1864. Humana Press, New York, NY]). 요약하여, 토마토 종자를 10분 동안 50% 상용 표백제로 살균시키고, ½ 세기 MSO 배지 상에서 발아시켰다. 본엽이 나오기 전에, 떡잎을 절개하여, 잎의 중간 3 내지 5 mm 섹션을 수집하였다. 이들 잎을 아그로박테리움으로 형질전환시킨 다음, 2주 동안 휴지 재생 배지 상에 배치하였다. 2주 후에, 외식편을 선택제로서 2 ㎎/ℓ 글리포세이트가 보충된 재생 배지로 옮겼다. 외식편을 2주마다 계대배양하였다. 약 6주 내지 7주에, 슈트는 이들 외식편으로부터 재생하기 시작하였다.

시료를 잘-신장된 슈트로부터 수집하였으며, 슈트를 2 ㎎/ℓ 글리포세이트가 보충된 발근 배지로 이동시켰다. 작은 슈트에 있어서, 전체 슈트 매스를 분자적 분석을 위하여 수집하였다(즉, 파괴적 시료추출).

토마토 외식편 형질전환의 평가

재생된 슈트는 먼저, 뉴클레아제 서열의 존재를 검출하기 위한 TaqMan qPCR 검정에 의해 전이유전자 양성으로 확인되었다. 추가로, qPCR 검정을 사용하여, 하기 표 7B에 나타낸 바와 같이, 전이유전자 삽입이 저(1 내지 2 카피) 카피수로 발생하는지 또는 고(2 카피 초과) 카피수로 발생하는 지 여부를 추정하였다. HDR-매개된 편집 이벤트의 수준을 평가하기 위하여, SlAnt1 유전자좌를 이전에 확인된 뉴클레아제 서열 양성 외식편으로부터 추출된 동일한 gDNA 공급원으로부터 증폭시키고, 차세대 서열분석을 통해 분석하였다.

결과

상기 기술된 바와 같이, CRISPR 엔도뉴클레아제(CasS), 부위-특이적 절단을 위한 가이드 RNA 및 HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 단백질 및 에스케리키아 콜라이 SSB)를 갖는 시스템을 설계하였다. 표적화된 게놈 유전자좌와 일치하는 상동성 아암이 측접한 통합될 서열을 특징짓는 공여자 DNA 분자도 또한 포함시켰다. 공여자 DNA는 어느 하나의 측 상에 가이드 RNA와 일치하는 절단 부위가 측접하여, 전이유전자가 삽입되는 게놈 삽입 부위로부터 공여자 분자가 절개되고 방출될 수 있게 하였다. 분열하는 식물 조직의 게놈 내로의 표적화된 통합을 개선하는 데에서의 이 시스템의 효율성을 시험하기 위하여, 상기 기술된 전체 시스템을 아그로박테리움을 통해 토마토의 외식편에 전달하였다.

HDR 촉진제 시스템(도 9a)으로부터의 정확한 표적화된 통합의 효율을 단지 CasS 뉴클레아제, 가이드 RNA 및 DNA 공여자로 구성된 기준선 실험 조건(도 9b에서 pIN1704 참조)과 비교함으로써, 시스템의 효율성을 측정하였다. 정확한 표적화된 통합의 효율을 형질전환된 외식편으로부터 재생된 슈트의 DNA 서열분석에 기초하여 계산하였다. 총 재생된 슈트의 수 중에, 통합된 공여자 서열을 함유하였던 토마토 슈트의 백분율은 각각의 구축물에 대하여 하기 표 7B에 나타나 있다. 시료추출된 조직은 토마토 형질전환 시스템의 성질로 인하여 유전학적으로 균일하기 보다는 키메라였으며, 서열분석 결과는 개별 식물 내의 일부 독립적인 편집 발생을 반영하였다. 표 7B에서, 삽입결실은 SlAnt1 프로모터 내의 표적 위치에서의 NHEJ-형 및 HDR-형 돌연변이 둘 모두를 나타낸다. HDR 돌연변이는 개별 시료로부터의 서열분석 판독물의 30% 초과가 정확한 편집인, 즉, 주형 DNA의 삽입인 경우, 유전 가능할 가능성이 있는 것으로 간주하였다. 정확한 편집의 수준은 전이유전자 카피의 수와 상호관련되지 않았다. 유전 가능한 HDR-매개된 편집 이벤트의 백분율은 HDR 촉진제를 인코딩하는 벡터(pIN1705)로 형질전환된 슈트에서 가장 높았다. 소수의 편집된 식물을 긴 판독물 서열분석에 의해 추가로 특성화하였다. 6개의 pIN1704-형질전환된 식물 시료 중에, 오직 하나에서 일부 무흔적(scarless) 편집이 검출되었다. 15개의 pIN1705-형질전환된 식물 시료 중에, 10개에서 일부 무흔적 편집이 검출되었으며, 이 중 적어도 4개는 이중대립유전자 100% 무흔적 편집을 가졌다. 표적화된 서열 삽입의 결과로서, 편집된 식물은 상이한 수준의 안토시아닌 축적을 보였다. 종합하여, HDR 촉진제를 인코딩하는 벡터는 HDR-매개된 정확한 편집을 유의미하게 개선시켰다.

[표 7B]

상기 기술된 바와 같은 토마토 편집 실험을 반복하였으며, 결과는 표 7C에 나타나 있다. 다시, 유전 가능한 HDR-매개된 편집 이벤트의 백분율은 HDR 촉진제를 인코딩하는 벡터(pIN1705)로 형질전환된 슈트에서 가장 높았으며; 동일한 경향이 관찰되었다.

[표 7C]

실시예 9. 포유류 세포에서의 향상된 HDR

하기의 실시예에는 HDR 촉진제의 존재 또는 부재 하의 인간 배아 신장 293(HEK-293) 세포에서의 유전자좌의 정확한 편집이 기술된다. FRT 부위 및 최소 AAVS1 부위를 각각 EMX1 및 GRIN2b 유전자 내로 삽입한다. 편집 기구를 발현하는 플라스미드를 세포주 내로 트랜스펙션시켜, 이들 유전자 내의 특이적인 표적 편집 부위에서 표적화된 삽입을 유도한다.

재료 및 방법

트랜스펙션을 위한 플라스미드의 설계

EMX1 또는 GRIN2b 표적 유전자좌에 특이적인 gRNA와 함께 CasS 뉴클레아제, HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질), 및 삽입 서열 및 표적 편집 부위에 대해 상동성인 약 700개 염기쌍 상동성 아암을 갖는 공여자 주형를 인코딩하는 단일의 플라스미드를 생성한다. 각각의 성분은 개별 프로모터에 의해 유도된다. 유전자 카세트를 먼저 모듈 A, B 및 C로 지칭되는 3가지 개별 중간 플라스미드에서 합성한 다음, 단일의 발현 플라스미드 내에 어셈블한다.

CasS 및 HDR 촉진제의 아미노산 서열은 HDR 촉진제에 대한 NLS를 제외하고, 실시예 1에 기술된 바와 같다. 특히, HDR 촉진제를 아미노산 링커(SEQ ID NO: 148, MAPKKKRKVGGSGS)를 사용하여 SV40 NLS에 융합시킨다. 모든 코딩-서열을 인간에서의 발현을 위해 코돈-최적화시킨다. 도 10에 나타낸 바와 같이, CasB는 CAG 프로모터 및 토끼 베타-글로빈 종결인자의 제어 하에 있으며(CAGp- CasS -rb_globin_t), gRNA는 호모 사피엔스(H. sapiens) U6 프로모터의 제어 하에 있으며(HsU6p-gRNA), SSB 단백질은 호모 사피엔스 EF1a 프로모터 및 인간 성장 호르몬(hGH) 종결인자의 제어 하에 있으며(HsEF1ap-SSB-hGHt), SSAP는 호모 사피엔스 ACTB 프로모터 및 소 성장 호르몬(bGH) 종결인자의 제어 하에 있으며(HsACTB-Beta-bGHt), 엑소뉴클레아제는 CMV 프로모터 및 SV40 종결인자의 제어 하에 있다(CMVp-Exo-SV40t).

또한, 공여자는 게놈 표적에 존재하는 것과 동일한 gRNA 표적 서열이 측접함에 따라, 전달되는 플라스미드로부터의 공여자의 방출 및 이후의 HDR 촉진제에 의해 매개되는 편집을 야기한다(도 10 참조).

개별 플라스미드를 하기 표 8에 나타낸 각각의 시료에 대하여 구축한다.

HEK-293 세포의 트랜스펙션

플라스미드를 HEK-293 세포 내로 트랜스펙션시킨다. 플라스미드당 3개의 개별 트랜스펙션을 반복실험으로서 제공한다.

트랜스펙션 후에, 세포를 48 내지 72시간 동안 인큐베이션시킨 후에, 이후의 앰플리콘 서열분석 라이브러리의 제조를 위하여 게놈 DNA를 모든 시료로부터 추출한다.

앰플리콘 서열분석

표적을 삽입 부위에 바로 인접한 서열에 어닐링하는 프라이머 및 공여자에 존재하는 상동성 영역의 외측의 게놈 서열에 어닐링하는 프라이머를 사용하여 증폭시킨다(플라스미드로부터 공여자의 증폭을 방지하기 위함). 이어서, 표적 유전자좌에서의 삽입 효율을 삽입 서열에 인접한 프라이머로부터 생성되는 판독물로부터의 앰플리콘 서열분석 데이터를 사용하여 정량화한다.

HEK-293 세포를 HDR 촉진제의 존재 또는 부재 하에 편집한다. 특히, 상기 기술된 플라스미드를 사용하여 34개 염기쌍 FRT 부위를 EMX1 유전자좌 내로 삽입하고, 33개 염기쌍 최소 AAVS1 부위를 GRIN2b 유전자좌 내로 삽입한다.

CasS, 모든 3가지 HDR 촉진제("람다 레드"), gRNA 및 공여자 DNA를 함유하는 시료에 더하여, 몇몇의 대조군을 표 8에 나타낸 바와 같이 포함시켜, HDR 촉진제를 갖는 시료의 편집 효율을 기준선과 비교한다. "람다 레드"는 모든 3가지 HDR 촉진제를 나타낸다(엑소뉴클레아제, 람다 베타 SSAP 단백질 및 SSB).

[표 8]

특히, gRNA와 함께 CasS 및 공여자(HDR 촉진제 부재의 기준선 대조군), 람다 레드 유전자 및 공여자(표적 DNA의 뉴클레아제-매개된 절단이 중요한 것을 확인하기 위한 뉴클레아제 부재 대조군), 공여자 단독, 및 gRNA와 함께 CasS(본 발명자들이 표적의 효율적인 절단을 얻고 있는 것을 확인하기 위한 절단 대조군)를 함유하는 시료를 개별적으로 대조군으로서 트랜스펙션시킨다. gRNA와 함께 CasS 및 공여자를 갖는 시료는 HDR 촉진제를 갖는 시료가 비교되는 기준선 시료이다. 또한, 트랜스펙션 부재 대조군도 또한 평가한다.

본 개시내용의 폭 및 범주는 상기 기술된 실시예 중 어느 것에 의해서도 제한되지 않고, 전술된 구현예에, 하기의 청구범위 및 이들의 등가물에 의해서만 정의되어야 한다.

참고문헌

SEQUENCE LISTING <110> Inari Agriculture, Inc. <120> IMPROVED HOMOLOGY DEPENDENT REPAIR GENOME EDITING <130> 16536-20006.40 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 62/866,317 <151> 2019-06-25 <160> 149 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 261 <212> PRT <213> Unknown <220> <223> Bacteria (eubacteria) <400> 1 Met Ser Thr Ala Leu Ala Thr Leu Ala Gly Lys Leu Ala Glu Arg Val 1 5 10 15 Gly Met Asp Ser Val Asp Pro Gln Glu Leu Ile Thr Thr Leu Arg Gln 20 25 30 Thr Ala Phe Lys Gly Asp Ala Ser Asp Ala Gln Phe Ile Ala Leu Leu 35 40 45 Ile Val Ala Asn Gln Tyr Gly Leu Asn Pro Trp Thr Lys Glu Ile Tyr 50 55 60 Ala Phe Pro Asp Lys Gln Asn Gly Ile Val Pro Val Val Gly Val Asp 65 70 75 80 Gly Trp Ser Arg Ile Ile Asn Glu Asn Gln Gln Phe Asp Gly Met Asp 85 90 95 Phe Glu Gln Asp Asn Glu Ser Cys Thr Cys Arg Ile Tyr Arg Lys Asp 100 105 110 Arg Asn His Pro Ile Cys Val Thr Glu Trp Met Asp Glu Cys Arg Arg 115 120 125 Glu Pro Phe Lys Thr Arg Glu Gly Arg Glu Ile Thr Gly Pro Trp Gln 130 135 140 Ser His Pro Lys Arg Met Leu Arg His Lys Ala Met Ile Gln Cys Ala 145 150 155 160 Arg Leu Ala Phe Gly Phe Ala Gly Ile Tyr Asp Lys Asp Glu Ala Glu 165 170 175 Arg Ile Val Glu Asn Thr Ala Tyr Thr Ala Glu Arg Gln Pro Glu Arg 180 185 190 Asp Ile Thr Pro Val Asn Asp Glu Thr Met Gln Glu Ile Asn Thr Leu 195 200 205 Leu Ile Ala Leu Asp Lys Thr Trp Asp Asp Asp Leu Leu Pro Leu Cys 210 215 220 Ser Gln Ile Phe Arg Arg Asp Ile Arg Ala Ser Ser Glu Leu Thr Gln 225 230 235 240 Ala Glu Ala Val Lys Ala Leu Gly Phe Leu Lys Gln Lys Ala Ala Glu 245 250 255 Gln Lys Val Ala Ala 260 <210> 2 <211> 269 <212> PRT <213> Escherichia coli str. K-12 substr. MG1655 <400> 2 Met Thr Lys Gln Pro Pro Ile Ala Lys Ala Asp Leu Gln Lys Thr Gln 1 5 10 15 Gly Asn Arg Ala Pro Ala Ala Val Lys Asn Ser Asp Val Ile Ser Phe 20 25 30 Ile Asn Gln Pro Ser Met Lys Glu Gln Leu Ala Ala Ala Leu Pro Arg 35 40 45 His Met Thr Ala Glu Arg Met Ile Arg Ile Ala Thr Thr Glu Ile Arg 50 55 60 Lys Val Pro Ala Leu Gly Asn Cys Asp Thr Met Ser Phe Val Ser Ala 65 70 75 80 Ile Val Gln Cys Ser Gln Leu Gly Leu Glu Pro Gly Ser Ala Leu Gly 85 90 95 His Ala Tyr Leu Leu Pro Phe Gly Asn Lys Asn Glu Lys Ser Gly Lys 100 105 110 Lys Asn Val Gln Leu Ile Ile Gly Tyr Arg Gly Met Ile Asp Leu Ala 115 120 125 Arg Arg Ser Gly Gln Ile Ala Ser Leu Ser Ala Arg Val Val Arg Glu 130 135 140 Gly Asp Glu Phe Ser Phe Glu Phe Gly Leu Asp Glu Lys Leu Ile His 145 150 155 160 Arg Pro Gly Glu Asn Glu Asp Ala Pro Val Thr His Val Tyr Ala Val 165 170 175 Ala Arg Leu Lys Asp Gly Gly Thr Gln Phe Glu Val Met Thr Arg Lys 180 185 190 Gln Ile Glu Leu Val Arg Ser Leu Ser Lys Ala Gly Asn Asn Gly Pro 195 200 205 Trp Val Thr His Trp Glu Glu Met Ala Lys Lys Thr Ala Ile Arg Arg 210 215 220 Leu Phe Lys Tyr Leu Pro Val Ser Ile Glu Ile Gln Arg Ala Val Ser 225 230 235 240 Met Asp Glu Lys Glu Pro Leu Thr Ile Asp Pro Ala Asp Ser Ser Val 245 250 255 Leu Thr Gly Glu Tyr Ser Val Ile Asp Asn Ser Glu Glu 260 265 <210> 3 <211> 287 <212> PRT <213> Unknown <220> <223> Bacteriophage SPP1 35 protein <400> 3 Met Ala Thr Lys Lys Gln Glu Glu Leu Lys Asn Ala Leu Ala Gln Gln 1 5 10 15 Asn Gly Ala Val Pro Gln Thr Pro Val Lys Pro Gln Asp Lys Val Lys 20 25 30 Gly Tyr Leu Glu Arg Met Met Pro Ala Ile Lys Asp Val Leu Pro Lys 35 40 45 His Leu Asp Ala Asp Arg Leu Ser Arg Ile Ala Met Asn Val Ile Arg 50 55 60 Thr Asn Pro Lys Leu Leu Glu Cys Asp Thr Ala Ser Leu Met Gly Ala 65 70 75 80 Val Leu Glu Ser Ala Lys Leu Gly Val Glu Pro Gly Leu Leu Gly Gln 85 90 95 Ala Tyr Ile Leu Pro Tyr Thr Asn Tyr Lys Lys Lys Thr Val Glu Ala 100 105 110 Gln Phe Ile Leu Gly Tyr Lys Gly Leu Leu Asp Leu Val Arg Arg Ser 115 120 125 Gly His Val Ser Thr Ile Ser Ala Gln Thr Val Tyr Lys Asn Asp Thr 130 135 140 Phe Glu Tyr Glu Tyr Gly Leu Asp Asp Lys Leu Val His Arg Pro Ala 145 150 155 160 Pro Phe Gly Thr Asp Arg Gly Glu Pro Val Gly Tyr Tyr Ala Val Ala 165 170 175 Lys Met Lys Asp Gly Gly Tyr Asn Phe Leu Val Met Ser Lys Gln Asp 180 185 190 Val Glu Lys His Arg Asp Ala Phe Ser Lys Ser Lys Asn Arg Glu Gly 195 200 205 Val Val Tyr Gly Pro Trp Ala Asp His Phe Asp Ala Met Ala Lys Lys 210 215 220 Thr Val Leu Arg Gln Leu Ile Asn Tyr Leu Pro Ile Ser Val Glu Gln 225 230 235 240 Leu Ser Gly Val Ala Ala Asp Glu Arg Thr Gly Ser Glu Leu His Asn 245 250 255 Gln Phe Ala Asp Asp Asp Asn Ile Ile Asn Val Asp Ile Asn Thr Gly 260 265 270 Glu Ile Ile Asp His Gln Glu Lys Leu Gly Gly Glu Thr Asn Glu 275 280 285 <210> 4 <211> 205 <212> PRT <213> Salmonella virus P22 <400> 4 Met Ser Lys Glu Phe Tyr Ala Arg Leu Ala Glu Ile Gln Glu His Leu 1 5 10 15 Asn Ala Pro Lys Asn Gln Tyr Asn Ser Phe Gly Lys Tyr Lys Tyr Arg 20 25 30 Ser Cys Glu Asp Ile Leu Glu Gly Val Lys Pro Leu Leu Lys Gly Leu 35 40 45 Phe Leu Ser Ile Ser Asp Glu Ile Val Leu Ile Gly Asp Arg Tyr Tyr 50 55 60 Val Lys Ala Thr Ala Thr Ile Thr Asp Gly Glu Asn Ser His Ser Ala 65 70 75 80 Ser Ala Ile Ala Arg Glu Glu Glu Asn Lys Lys Gly Met Asp Ala Ala 85 90 95 Gln Val Thr Gly Ala Thr Ser Ser Tyr Ala Arg Lys Tyr Cys Leu Asn 100 105 110 Gly Leu Phe Gly Ile Asp Asp Ala Lys Asp Ala Asp Thr Glu Glu His 115 120 125 Lys Gln Gln Gln Asn Ala Ala Pro Ala Lys Gln Thr Lys Ser Ser Pro 130 135 140 Ser Ser Pro Ala Pro Glu Gln Val Leu Lys Ala Phe Ser Glu Tyr Ala 145 150 155 160 Ala Thr Glu Thr Asp Lys Lys Lys Leu Ile Glu Arg Tyr Gln His Asp 165 170 175 Trp Gln Leu Leu Thr Gly His Asp Asp Glu Gln Thr Lys Cys Val Gln 180 185 190 Val Met Asn Ile Arg Ile Asn Glu Leu Lys Gln Val Ala 195 200 205 <210> 5 <211> 471 <212> PRT <213> Saccharomyces cerevisiae S288C <400> 5 Met Asn Glu Ile Met Asp Met Asp Glu Lys Lys Pro Val Phe Gly Asn 1 5 10 15 His Ser Glu Asp Ile Gln Thr Lys Leu Asp Lys Lys Leu Gly Pro Glu 20 25 30 Tyr Ile Ser Lys Arg Val Gly Phe Gly Thr Ser Arg Ile Ala Tyr Ile 35 40 45 Glu Gly Trp Arg Val Ile Asn Leu Ala Asn Gln Ile Phe Gly Tyr Asn 50 55 60 Gly Trp Ser Thr Glu Val Lys Ser Val Val Ile Asp Phe Leu Asp Glu 65 70 75 80 Arg Gln Gly Lys Phe Ser Ile Gly Cys Thr Ala Ile Val Arg Val Thr 85 90 95 Leu Thr Ser Gly Thr Tyr Arg Glu Asp Ile Gly Tyr Gly Thr Val Glu 100 105 110 Asn Glu Arg Arg Lys Pro Ala Ala Phe Glu Arg Ala Lys Lys Ser Ala 115 120 125 Val Thr Asp Ala Leu Lys Arg Ser Leu Arg Gly Phe Gly Asn Ala Leu 130 135 140 Gly Asn Cys Leu Tyr Asp Lys Asp Phe Leu Ala Lys Ile Asp Lys Val 145 150 155 160 Lys Phe Asp Pro Pro Asp Phe Asp Glu Asn Asn Leu Phe Arg Pro Thr 165 170 175 Asp Glu Ile Ser Glu Ser Ser Arg Thr Asn Thr Leu His Glu Asn Gln 180 185 190 Glu Gln Gln Gln Tyr Pro Asn Lys Arg Arg Gln Leu Thr Lys Val Thr 195 200 205 Asn Thr Asn Pro Asp Ser Thr Lys Asn Leu Val Lys Ile Glu Asn Thr 210 215 220 Val Ser Arg Gly Thr Pro Met Met Ala Ala Pro Ala Glu Ala Asn Ser 225 230 235 240 Lys Asn Ser Ser Asn Lys Asp Thr Asp Leu Lys Ser Leu Asp Ala Ser 245 250 255 Lys Gln Asp Gln Asp Asp Leu Leu Asp Asp Ser Leu Met Phe Ser Asp 260 265 270 Asp Phe Gln Asp Asp Asp Leu Ile Asn Met Gly Asn Thr Asn Ser Asn 275 280 285 Val Leu Thr Thr Glu Lys Asp Pro Val Val Ala Lys Gln Ser Pro Thr 290 295 300 Ala Ser Ser Asn Pro Glu Ala Glu Gln Ile Thr Phe Val Thr Ala Lys 305 310 315 320 Ala Ala Thr Ser Val Gln Asn Glu Arg Tyr Ile Gly Glu Glu Ser Ile 325 330 335 Phe Asp Pro Lys Tyr Gln Ala Gln Ser Ile Arg His Thr Val Asp Gln 340 345 350 Thr Thr Ser Lys His Ile Pro Ala Ser Val Leu Lys Asp Lys Thr Met 355 360 365 Thr Thr Ala Arg Asp Ser Val Tyr Glu Lys Phe Ala Pro Lys Gly Lys 370 375 380 Gln Leu Ser Met Lys Asn Asn Asp Lys Glu Leu Gly Pro His Met Leu 385 390 395 400 Glu Gly Ala Gly Asn Gln Val Pro Arg Glu Thr Thr Pro Ile Lys Thr 405 410 415 Asn Ala Thr Ala Phe Pro Pro Ala Ala Ala Pro Arg Phe Ala Pro Pro 420 425 430 Ser Lys Val Val His Pro Asn Gly Asn Gly Ala Val Pro Ala Val Pro 435 440 445 Gln Gln Arg Ser Thr Arg Arg Glu Val Gly Arg Pro Lys Ile Asn Pro 450 455 460 Leu His Ala Arg Lys Pro Thr 465 470 <210> 6 <211> 469 <212> PRT <213> Schizosaccharomyces pombe <400> 6 Met Ser Phe Glu Gln Lys Gln His Val Ala Ser Glu Asp Gln Gly His 1 5 10 15 Phe Asn Thr Ala Tyr Ser His Glu Glu Phe Asn Phe Leu Gln Ser Ser 20 25 30 Leu Thr Arg Lys Leu Gly Pro Glu Tyr Val Ser Arg Arg Ser Gly Pro 35 40 45 Gly Gly Phe Ser Val Ser Tyr Ile Glu Ser Trp Lys Ala Ile Glu Leu 50 55 60 Ala Asn Glu Ile Phe Gly Phe Asn Gly Trp Ser Ser Ser Ile Arg Ser 65 70 75 80 Ile Asn Val Asp Phe Met Asp Glu Asn Lys Glu Asn Gly Arg Ile Ser 85 90 95 Leu Gly Leu Ser Val Ile Val Arg Val Thr Ile Lys Asp Gly Ala Tyr 100 105 110 His Glu Asp Ile Gly Tyr Gly Ser Ile Asp Asn Cys Arg Gly Lys Ala 115 120 125 Ser Ala Phe Glu Lys Cys Lys Lys Glu Gly Thr Thr Asp Ala Leu Lys 130 135 140 Arg Ala Leu Arg Asn Phe Gly Asn Ser Leu Gly Asn Cys Met Tyr Asp 145 150 155 160 Lys Tyr Tyr Leu Arg Glu Val Gly Lys Met Lys Pro Pro Thr Tyr His 165 170 175 Phe Asp Ser Gly Asp Leu Phe Arg Lys Thr Asp Pro Ala Ala Arg Glu 180 185 190 Ser Phe Ile Lys Lys Gln Lys Thr Leu Asn Ser Thr Arg Thr Val Asn 195 200 205 Asn Gln Pro Leu Val Asn Lys Gly Glu Gln Leu Ala Pro Arg Arg Ala 210 215 220 Ala Glu Leu Asn Asp Glu Gln Thr Arg Glu Ile Glu Met Tyr Ala Asp 225 230 235 240 Glu Glu Leu Asp Asn Ile Phe Val Glu Asp Asp Ile Ile Ala His Leu 245 250 255 Ala Val Ala Glu Asp Thr Ala His Pro Ala Ala Asn Asn His His Ser 260 265 270 Glu Lys Ala Gly Thr Gln Ile Asn Asn Lys Asp Lys Gly Ser His Asn 275 280 285 Ser Ala Lys Pro Val Gln Arg Ser His Thr Tyr Pro Val Ala Val Pro 290 295 300 Gln Asn Thr Ser Asp Ser Val Gly Asn Ala Val Thr Asp Thr Ser Pro 305 310 315 320 Lys Thr Leu Phe Asp Pro Leu Lys Pro Asn Thr Gly Thr Pro Ser Pro 325 330 335 Lys Phe Ile Ser Ala Arg Ala Ala Ala Ala Ala Glu Gly Val Val Ser 340 345 350 Ala Pro Phe Thr Asn Asn Phe Asn Pro Arg Leu Asp Ser Pro Ser Ile 355 360 365 Arg Lys Thr Ser Ile Ile Asp His Ser Lys Ser Leu Pro Val Gln Arg 370 375 380 Ala Ser Val Leu Pro Ile Ile Lys Gln Ser Ser Gln Thr Ser Pro Val 385 390 395 400 Ser Asn Asn Ser Met Ile Arg Asp Ser Glu Ser Ile Ile Asn Glu Arg 405 410 415 Lys Glu Asn Ile Gly Leu Ile Gly Val Lys Arg Ser Leu His Asp Ser 420 425 430 Thr Thr Ser His Asn Lys Ser Asp Leu Met Arg Thr Asn Ser Asp Pro 435 440 445 Gln Ser Ala Met Arg Ser Arg Glu Asn Tyr Asp Ala Thr Val Asp Lys 450 455 460 Lys Ala Lys Lys Gly 465 <210> 7 <211> 436 <212> PRT <213> Kluyveromyces lactis <400> 7 Met Glu Asp Thr Gly Ser Gly Lys Asn Gly Lys Asp Asp Ile Gln Thr 1 5 10 15 Lys Leu Asp Lys Lys Leu Gly Pro Glu Tyr Ile Ser Lys Arg Val Gly 20 25 30 Phe Gly Ser Ser Arg Val Ala Tyr Ile Glu Gly Trp Lys Ala Ile Asn 35 40 45 Leu Ala Asn Gln Ile Phe Gly Tyr Asp Gly Trp Ser Thr Glu Val Lys 50 55 60 Asn Val Thr Ile Asp Phe Leu Asp Glu Arg Gln Gly Arg Phe Ser Ile 65 70 75 80 Gly Cys Thr Ala Ile Val Arg Val Ser Leu Ala Asp Gly Thr Phe Arg 85 90 95 Glu Asp Ile Gly Tyr Gly Thr Val Glu Asn Glu Arg Arg Lys Ala Ser 100 105 110 Ala Phe Glu Arg Ala Lys Lys Ser Ala Val Thr Asp Ala Leu Lys Arg 115 120 125 Ser Leu Arg Gly Phe Gly Asn Ala Leu Gly Asn Cys Leu Tyr Asp Lys 130 135 140 Asp Phe Leu Ala Lys Ile Asp Lys Val Lys Phe Asp Pro Pro Asp Phe 145 150 155 160 Asp Glu Gly Asn Leu Phe Arg Pro Ala Asp Glu Leu Ser Glu Met Ser 165 170 175 Arg Ser Asn Met Val Gly Asp Ala His Thr Glu Gly Pro Ser Leu Lys 180 185 190 Lys Arg Ser Leu Thr Asn Glu Asp Arg Asn Ala Val Pro Ser Ala Pro 195 200 205 Ala Gln Gln Thr Tyr Arg Ser Asn Asn His Thr Thr Gln Lys Arg Ala 210 215 220 Pro Lys Ala Gln Ala Val Thr Ala Ser Ala Ser Pro Asn Glu Glu Thr 225 230 235 240 Ser Asn Gln Gln Gln Asp Pro Asp Asp Leu Leu Asp Asp Ser Phe Met 245 250 255 Phe Ser Asp Glu Ile Gln Asp Asp Asp Leu Leu Asn Met Asn Thr Thr 260 265 270 Thr Asn Asn Lys Asn Ser Thr Asn Ser Ser Thr Thr Thr Thr Thr Ile 275 280 285 Ser Asp Glu Ala Thr Gly Ile Ile Ser Pro Val Thr Phe Val Thr Ala 290 295 300 Lys Ala Ala Thr Ser Leu Gln His Lys Asp Pro Ile Pro Ser Gly Ser 305 310 315 320 Met Phe Asp Pro Lys Phe Gln Ala Gln Ser Ile Arg His Thr Val Asp 325 330 335 Gln Ser Val Ser Thr Pro Val Arg Ala Thr Ile Leu Lys Glu Lys Gly 340 345 350 Leu Asp Ser Asp Arg Ser Ser Ile Tyr Ser Lys Phe Ala Pro Lys Gly 355 360 365 Lys Glu Leu Ser Gly Thr Thr Thr Asn Ser Glu Pro Tyr Val Ala Ala 370 375 380 Pro Gln Thr Ser Ala Thr Glu Ser Asn Arg Ser Thr Pro Thr Arg Ser 385 390 395 400 Asn Ala Gln Leu Ala Gly Pro Gln Pro Ala Pro Gln Leu Gln Gly Pro 405 410 415 Gln Arg Thr Gln Leu Gly Arg Pro Arg Met Leu Gln Gln Pro Asn Arg 420 425 430 Arg Asn Val Ser 435 <210> 8 <211> 226 <212> PRT <213> Unknown <220> <223> Bacteria (eubacteria) <400> 8 Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala 1 5 10 15 Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile 20 25 30 Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys 35 40 45 Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu 50 55 60 Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp 65 70 75 80 Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser 85 90 95 Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met 100 105 110 Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu 115 120 125 Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu 130 135 140 Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr 145 150 155 160 Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp 165 170 175 Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp 180 185 190 Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu 195 200 205 Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln 210 215 220 Trp Arg 225 <210> 9 <211> 866 <212> PRT <213> Unknown <220> <223> Rac bacterial prophage RecE exonuclease <400> 9 Met Ser Thr Lys Pro Leu Phe Leu Leu Arg Lys Ala Lys Lys Ser Ser 1 5 10 15 Gly Glu Pro Asp Val Val Leu Trp Ala Ser Asn Asp Phe Glu Ser Thr 20 25 30 Cys Ala Thr Leu Asp Tyr Leu Ile Val Lys Ser Gly Lys Lys Leu Ser 35 40 45 Ser Tyr Phe Lys Ala Val Ala Thr Asn Phe Pro Val Val Asn Asp Leu 50 55 60 Pro Ala Glu Gly Glu Ile Asp Phe Thr Trp Ser Glu Arg Tyr Gln Leu 65 70 75 80 Ser Lys Asp Ser Met Thr Trp Glu Leu Lys Pro Gly Ala Ala Pro Asp 85 90 95 Asn Ala His Tyr Gln Gly Asn Thr Asn Val Asn Gly Glu Asp Met Thr 100 105 110 Glu Ile Glu Glu Asn Met Leu Leu Pro Ile Ser Gly Gln Glu Leu Pro 115 120 125 Ile Arg Trp Leu Ala Gln His Gly Ser Glu Lys Pro Val Thr His Val 130 135 140 Ser Arg Asp Gly Leu Gln Ala Leu His Ile Ala Arg Ala Glu Glu Leu 145 150 155 160 Pro Ala Val Thr Ala Leu Ala Val Ser His Lys Thr Ser Leu Leu Asp 165 170 175 Pro Leu Glu Ile Arg Glu Leu His Lys Leu Val Arg Asp Thr Asp Lys 180 185 190 Val Phe Pro Asn Pro Gly Asn Ser Asn Leu Gly Leu Ile Thr Ala Phe 195 200 205 Phe Glu Ala Tyr Leu Asn Ala Asp Tyr Thr Asp Arg Gly Leu Leu Thr 210 215 220 Lys Glu Trp Met Lys Gly Asn Arg Val Ser His Ile Thr Arg Thr Ala 225 230 235 240 Ser Gly Ala Asn Ala Gly Gly Gly Asn Leu Thr Asp Arg Gly Glu Gly 245 250 255 Phe Val His Asp Leu Thr Ser Leu Ala Arg Asp Val Ala Thr Gly Val 260 265 270 Leu Ala Arg Ser Met Asp Leu Asp Ile Tyr Asn Leu His Pro Ala His 275 280 285 Ala Lys Arg Ile Glu Glu Ile Ile Ala Glu Asn Lys Pro Pro Phe Ser 290 295 300 Val Phe Arg Asp Lys Phe Ile Thr Met Pro Gly Gly Leu Asp Tyr Ser 305 310 315 320 Arg Ala Ile Val Val Ala Ser Val Lys Glu Ala Pro Ile Gly Ile Glu 325 330 335 Val Ile Pro Ala His Val Thr Glu Tyr Leu Asn Lys Val Leu Thr Glu 340 345 350 Thr Asp His Ala Asn Pro Asp Pro Glu Ile Val Asp Ile Ala Cys Gly 355 360 365 Arg Ser Ser Ala Pro Met Pro Gln Arg Val Thr Glu Glu Gly Lys Gln 370 375 380 Asp Asp Glu Glu Lys Pro Gln Pro Ser Gly Thr Thr Ala Val Glu Gln 385 390 395 400 Gly Glu Ala Glu Thr Met Glu Pro Asp Ala Thr Glu His His Gln Asp 405 410 415 Thr Gln Pro Leu Asp Ala Gln Ser Gln Val Asn Ser Val Asp Ala Lys 420 425 430 Tyr Gln Glu Leu Arg Ala Glu Leu His Glu Ala Arg Lys Asn Ile Pro 435 440 445 Ser Lys Asn Pro Val Asp Asp Asp Lys Leu Leu Ala Ala Ser Arg Gly 450 455 460 Glu Phe Val Asp Gly Ile Ser Asp Pro Asn Asp Pro Lys Trp Val Lys 465 470 475 480 Gly Ile Gln Thr Arg Asp Cys Val Tyr Gln Asn Gln Pro Glu Thr Glu 485 490 495 Lys Thr Ser Pro Asp Met Asn Gln Pro Glu Pro Val Val Gln Gln Glu 500 505 510 Pro Glu Ile Ala Cys Asn Ala Cys Gly Gln Thr Gly Gly Asp Asn Cys 515 520 525 Pro Asp Cys Gly Ala Val Met Gly Asp Ala Thr Tyr Gln Glu Thr Phe 530 535 540 Asp Glu Glu Ser Gln Val Glu Ala Lys Glu Asn Asp Pro Glu Glu Met 545 550 555 560 Glu Gly Ala Glu His Pro His Asn Glu Asn Ala Gly Ser Asp Pro His 565 570 575 Arg Asp Cys Ser Asp Glu Thr Gly Glu Val Ala Asp Pro Val Ile Val 580 585 590 Glu Asp Ile Glu Pro Gly Ile Tyr Tyr Gly Ile Ser Asn Glu Asn Tyr 595 600 605 His Ala Gly Pro Gly Ile Ser Lys Ser Gln Leu Asp Asp Ile Ala Asp 610 615 620 Thr Pro Ala Leu Tyr Leu Trp Arg Lys Asn Ala Pro Val Asp Thr Thr 625 630 635 640 Lys Thr Lys Thr Leu Asp Leu Gly Thr Ala Phe His Cys Arg Val Leu 645 650 655 Glu Pro Glu Glu Phe Ser Asn Arg Phe Ile Val Ala Pro Glu Phe Asn 660 665 670 Arg Arg Thr Asn Ala Gly Lys Glu Glu Glu Lys Ala Phe Leu Met Glu 675 680 685 Cys Ala Ser Thr Gly Lys Thr Val Ile Thr Ala Glu Glu Gly Arg Lys 690 695 700 Ile Glu Leu Met Tyr Gln Ser Val Met Ala Leu Pro Leu Gly Gln Trp 705 710 715 720 Leu Val Glu Ser Ala Gly His Ala Glu Ser Ser Ile Tyr Trp Glu Asp 725 730 735 Pro Glu Thr Gly Ile Leu Cys Arg Cys Arg Pro Asp Lys Ile Ile Pro 740 745 750 Glu Phe His Trp Ile Met Asp Val Lys Thr Thr Ala Asp Ile Gln Arg 755 760 765 Phe Lys Thr Ala Tyr Tyr Asp Tyr Arg Tyr His Val Gln Asp Ala Phe 770 775 780 Tyr Ser Asp Gly Tyr Glu Ala Gln Phe Gly Val Gln Pro Thr Phe Val 785 790 795 800 Phe Leu Val Ala Ser Thr Thr Ile Glu Cys Gly Arg Tyr Pro Val Glu 805 810 815 Ile Phe Met Met Gly Glu Glu Ala Lys Leu Ala Gly Gln Gln Glu Tyr 820 825 830 His Arg Asn Leu Arg Thr Leu Ser Asp Cys Leu Asn Thr Asp Glu Trp 835 840 845 Pro Ala Ile Lys Thr Leu Ser Leu Pro Arg Trp Ala Lys Glu Tyr Ala 850 855 860 Asn Asp 865 <210> 10 <211> 23 <212> PRT <213> Unknown <220> <223> Maize opaque-2 nuclear localization signal <400> 10 Arg Lys Arg Lys Glu Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Arg 1 5 10 15 Ser Arg Tyr Arg Lys Lys Val 20 <210> 11 <211> 7 <212> PRT <213> Unknown <220> <223> SV40 large T antigen NLS <400> 11 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 12 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Class II monopartite NLS consensus <220> <221> VARIANT <222> 2, 4 <223> Xaa = Lys or Arg <220> <221> VARIANT <222> 3 <223> Xaa = Any Amino Acid <400> 12 Lys Xaa Xaa Xaa 1 <210> 13 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Bipartite NLS consensus <220> <221> VARIANT <222> 1, 2 <223> Xaa = Lys or Arg <220> <221> VARIANT <222> 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 <223> Xaa = Any Amino Acid, and up to two can be present or absent <220> <221> VARIANT <222> 15, 16, 17, 18, 19 <223> Xaa = Any Amino Acid, and at least three are either Lys or Arg <400> 13 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa <210> 14 <211> 6 <212> PRT <213> Unknown <220> <223> Class 5 Plant NLS <220> <221> VARIANT <222> 5 <223> Xaa = Lys or Arg <220> <221> VARIANT <222> 6 <223> Xaa = Trp, Phe, or Tyr <400> 14 Leu Gly Lys Arg Xaa Xaa 1 5 <210> 15 <211> 15 <212> PRT <213> Unknown <220> <223> tobacco c2 NLS <400> 15 Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro 1 5 10 15 <210> 16 <211> 14 <212> PRT <213> Unknown <220> <223> Extended SV40 Nuclear Localization Domain <400> 16 Ala Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser 1 5 10 <210> 17 <211> 11 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 17 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 18 <211> 12 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 18 Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg 1 5 10 <210> 19 <211> 27 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 19 Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu 1 5 10 15 Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu 20 25 <210> 20 <211> 33 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 20 Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala 1 5 10 15 Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu 20 25 30 Ala <210> 21 <211> 16 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 21 Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys 1 5 10 15 <210> 22 <211> 11 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 22 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 23 <211> 8 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 23 Arg Lys Lys Arg Arg Gln Arg Arg 1 5 <210> 24 <211> 11 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 24 Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala 1 5 10 <210> 25 <211> 11 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 25 Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg 1 5 10 <210> 26 <211> 11 <212> PRT <213> Unknown <220> <223> cell-penetrating peptide (CPP) <400> 26 Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg 1 5 10 <210> 27 <211> 1307 <212> PRT <213> Unknown <220> <223> Acidaminococcus sp. <400> 27 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn 1010 1015 1020 Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu 1025 1030 1035 1040 Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly 1045 1050 1055 Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys 1060 1065 1070 Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile 1075 1080 1085 Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu 1090 1095 1100 His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn 1105 1110 1115 1120 Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp 1125 1130 1135 Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr 1140 1145 1150 Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg 1155 1160 1165 Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala 1170 1175 1180 Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu 1185 1190 1195 1200 Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val 1205 1210 1215 Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr 1220 1225 1230 Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala 1250 1255 1260 Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His 1265 1270 1275 1280 Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln 1285 1290 1295 Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1300 1305 <210> 28 <211> 1228 <212> PRT <213> Unknown <220> <223> Lachnospiraceae bacterium <400> 28 Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr 1 5 10 15 Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp 20 25 30 Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys 35 40 45 Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp 50 55 60 Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu 65 70 75 80 Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn 85 90 95 Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn 100 105 110 Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu 115 120 125 Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe 130 135 140 Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn 145 150 155 160 Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile 165 170 175 Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys 180 185 190 Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys 195 200 205 Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe 210 215 220 Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile 225 230 235 240 Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn 245 250 255 Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys 260 265 270 Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser 275 280 285 Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe 290 295 300 Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys 305 310 315 320 Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile 325 330 335 Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe 340 345 350 Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp 355 360 365 Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp 370 375 380 Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu 385 390 395 400 Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu 405 410 415 Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser 420 425 430 Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys 435 440 445 Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys 450 455 460 Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr 465 470 475 480 Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile 485 490 495 Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr 500 505 510 Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro 515 520 525 Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala 530 535 540 Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys 545 550 555 560 Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly 565 570 575 Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met 580 585 590 Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro 595 600 605 Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly 610 615 620 Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys 625 630 635 640 Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn 645 650 655 Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu 660 665 670 Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys 675 680 685 Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile 690 695 700 Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His 705 710 715 720 Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 725 730 735 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys 740 745 750 Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys 755 760 765 Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr 770 775 780 Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 785 790 795 800 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 805 810 815 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp 820 825 830 Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly 835 840 845 Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn 850 855 860 Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu 865 870 875 880 Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile 885 890 895 Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys 900 905 910 Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn 915 920 925 Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 930 935 940 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys 945 950 955 960 Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 965 970 975 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe 980 985 990 Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr 995 1000 1005 Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser 1010 1015 1020 Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu 1025 1030 1035 1040 Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp 1045 1050 1055 Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile 1060 1065 1070 Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu 1075 1080 1085 Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile 1090 1095 1100 Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp 1105 1110 1115 1120 Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln 1125 1130 1135 Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser 1140 1145 1150 Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu 1155 1160 1165 Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala 1170 1175 1180 Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys 1185 1190 1195 1200 Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys 1205 1210 1215 Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His 1220 1225 <210> 29 <211> 1300 <212> PRT <213> Francisella novicida <400> 29 Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys 20 25 30 Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys 35 40 45 Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu 50 55 60 Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser 65 70 75 80 Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys 85 90 95 Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr 100 105 110 Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile 115 120 125 Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln 130 135 140 Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr 145 150 155 160 Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr 165 170 175 Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser 180 185 190 Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu 195 200 205 Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys 210 215 220 Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu 225 230 235 240 Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg 245 250 255 Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr 260 265 270 Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys 275 280 285 Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile 290 295 300 Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys 305 310 315 320 Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser 325 330 335 Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met 340 345 350 Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys 355 360 365 Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln 370 375 380 Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr 385 390 395 400 Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala 405 410 415 Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn 420 425 430 Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala 435 440 445 Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn 450 455 460 Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala 465 470 475 480 Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys 485 490 495 Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys 500 505 510 Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp 515 520 525 Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His 530 535 540 Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His 545 550 555 560 Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val 565 570 575 Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser 580 585 590 Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly 595 600 605 Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys 610 615 620 Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile 625 630 635 640 Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys 645 650 655 Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val 660 665 670 Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile 675 680 685 Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln 690 695 700 Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe 705 710 715 720 Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp 725 730 735 Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu 740 745 750 Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn 755 760 765 Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr 770 775 780 Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg 785 790 795 800 Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn 805 810 815 Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr 820 825 830 Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala 835 840 845 Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu 850 855 860 Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe 865 870 875 880 His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe 885 890 895 Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His 900 905 910 Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu 915 920 925 Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile 930 935 940 Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile 945 950 955 960 Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn 965 970 975 Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile 980 985 990 Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu 995 1000 1005 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr 1010 1015 1020 Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe 1025 1030 1035 1040 Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln 1045 1050 1055 Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly 1060 1065 1070 Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val 1075 1080 1085 Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys 1090 1095 1100 Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp 1105 1110 1115 1120 Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp Lys 1125 1130 1135 Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg Leu Ile 1140 1145 1150 Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr Arg Glu Val 1155 1160 1165 Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu 1170 1175 1180 Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp 1185 1190 1195 1200 Lys Lys Phe Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln 1205 1210 1215 Met Arg Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro 1220 1225 1230 Val Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys 1235 1240 1245 Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu 1250 1255 1260 Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys 1265 1270 1275 1280 Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln 1285 1290 1295 Asn Arg Asn Asn 1300 <210> 30 <211> 1320 <212> PRT <213> Unknown <220> <223> CasJ (wild type) <400> 30 Met Gln Gln Tyr Gln Val Ser Lys Thr Val Arg Phe Gly Leu Thr Leu 1 5 10 15 Lys Asn Ser Glu Lys Lys His Ala Thr His Leu Leu Leu Lys Asp Leu 20 25 30 Val Asn Val Ser Glu Glu Arg Ile Lys Asn Glu Ile Thr Lys Asp Asp 35 40 45 Lys Asn Gln Ser Glu Leu Ser Phe Phe Asn Glu Val Ile Glu Thr Leu 50 55 60 Asp Leu Met Asp Lys Tyr Ile Lys Asp Trp Glu Asn Cys Phe Tyr Arg 65 70 75 80 Thr Asp Gln Ile Gln Leu Thr Lys Glu Tyr Tyr Lys Val Ile Ala Lys 85 90 95 Lys Ala Cys Phe Asp Trp Phe Trp Thr Asn Asp Arg Gly Met Lys Phe 100 105 110 Pro Thr Ser Ser Ile Ile Ser Phe Asn Ser Leu Lys Ser Ser Asp Lys 115 120 125 Ser Lys Thr Ser Asp Asn Leu Asp Arg Lys Lys Lys Ile Leu Asp Tyr 130 135 140 Trp Lys Gly Asn Ile Phe Lys Thr Gln Lys Ala Ile Lys Asp Val Leu 145 150 155 160 Asp Ile Thr Glu Asp Ile Gln Lys Ala Ile Glu Glu Lys Lys Ser His 165 170 175 Arg Glu Ile Asn Arg Val Asn His Arg Lys Met Gly Ile His Leu Ile 180 185 190 His Leu Ile Asn Asp Thr Leu Val Pro Leu Cys Asn Gly Ser Ile Phe 195 200 205 Phe Gly Asn Ile Ser Lys Leu Asp Phe Cys Glu Ser Glu Asn Glu Lys 210 215 220 Leu Ile Asp Phe Ala Ser Thr Glu Lys Gln Asp Glu Arg Lys Phe Leu 225 230 235 240 Leu Ser Lys Ile Asn Glu Ile Lys Gln Tyr Phe Glu Asp Asn Gly Gly 245 250 255 Asn Val Pro Phe Ala Arg Ala Thr Leu Asn Arg His Thr Ala Asn Gln 260 265 270 Lys Pro Asp Arg Tyr Asn Glu Glu Ile Lys Lys Leu Val Asn Glu Leu 275 280 285 Gly Val Asn Ser Leu Val Arg Ser Leu Lys Ser Lys Thr Ile Glu Glu 290 295 300 Ile Lys Thr His Phe Glu Phe Glu Asn Lys Asn Lys Ile Asn Glu Leu 305 310 315 320 Lys Asn Ser Phe Val Leu Ser Ile Val Glu Lys Ile Gln Leu Phe Lys 325 330 335 Tyr Lys Thr Ile Pro Ala Ser Val Arg Phe Leu Leu Ala Asp Tyr Phe 340 345 350 Glu Glu Gln Lys Leu Ser Thr Lys Glu Glu Ala Leu Thr Ile Phe Glu 355 360 365 Glu Ile Gly Lys Pro Gln Asn Ile Gly Phe Asp Tyr Ile Gln Leu Lys 370 375 380 Glu Lys Asp Asn Phe Thr Leu Lys Lys Tyr Pro Leu Lys Gln Ala Phe 385 390 395 400 Asp Tyr Ala Trp Glu Asn Leu Ala Arg Leu Asp Gln Asn Pro Lys Ala 405 410 415 Asn Gln Phe Ser Val Asp Glu Cys Lys Arg Phe Phe Lys Glu Val Phe 420 425 430 Ser Met Glu Met Asp Asn Ile Asn Phe Lys Thr Tyr Ala Leu Leu Leu 435 440 445 Ala Leu Lys Glu Lys Thr Thr Ala Phe Asp Lys Lys Gly Glu Gly Ala 450 455 460 Ala Lys Asn Lys Ser Glu Ile Ile Glu Gln Ile Lys Gly Val Phe Glu 465 470 475 480 Glu Leu Asp Gln Pro Phe Lys Ile Ile Ala Asn Thr Leu Arg Glu Glu 485 490 495 Val Ile Lys Lys Glu Asp Glu Leu Asn Val Leu Lys Arg Gln Tyr Arg 500 505 510 Glu Thr Asp Arg Lys Ile Lys Thr Leu Gln Asn Glu Ile Lys Lys Ile 515 520 525 Lys Asn Gln Ile Lys Asn Leu Glu Asn Ser Lys Lys Tyr Ser Phe Pro 530 535 540 Glu Ile Ile Lys Trp Ile Asp Leu Thr Glu Gln Glu Gln Leu Leu Asp 545 550 555 560 Lys Asn Lys Gln Ala Lys Ser Asn Tyr Gln Lys Ala Lys Gly Asp Leu 565 570 575 Gly Leu Ile Arg Gly Ser Gln Lys Thr Ser Ile Asn Asp Tyr Phe Tyr 580 585 590 Leu Thr Asp Lys Val Tyr Arg Lys Leu Ala Gln Asp Phe Gly Lys Lys 595 600 605 Met Ala Asp Leu Arg Glu Lys Leu Leu Asp Lys Asn Asp Val Asn Lys 610 615 620 Ile Lys Tyr Leu Ser Tyr Ile Val Lys Asp Asn Gln Gly Tyr Gln Tyr 625 630 635 640 Thr Leu Leu Lys Pro Leu Glu Asp Lys Asn Ala Glu Ile Ile Glu Leu 645 650 655 Lys Ser Glu Pro Asn Gly Asp Leu Lys Leu Phe Glu Ile Lys Ser Leu 660 665 670 Thr Ser Lys Thr Leu Asn Lys Phe Ile Lys Asn Lys Gly Ala Tyr Lys 675 680 685 Glu Phe His Ser Ala Glu Phe Glu His Lys Lys Ile Lys Glu Asp Trp 690 695 700 Lys Asn Tyr Lys Tyr Asn Ser Asp Phe Ile Val Lys Leu Lys Lys Cys 705 710 715 720 Leu Ser His Ser Asp Met Ala Asn Thr Gln Asn Trp Lys Ala Phe Gly 725 730 735 Trp Asp Leu Asp Lys Cys Lys Ser Tyr Glu Thr Ile Glu Lys Glu Ile 740 745 750 Asp Gln Lys Ser Tyr Gln Leu Val Glu Ile Lys Leu Ser Lys Thr Thr 755 760 765 Ile Glu Lys Trp Val Lys Glu Asn Asn Tyr Leu Leu Leu Pro Ile Val 770 775 780 Asn Gln Asp Ile Thr Ala Glu Lys Leu Lys Val Asn Thr Asn Gln Phe 785 790 795 800 Thr Lys Asp Trp Gln His Ile Phe Glu Lys Asn Pro Asn His Arg Leu 805 810 815 His Pro Glu Phe Asn Ile Ala Tyr Arg Gln Pro Thr Lys Asp Tyr Ala 820 825 830 Lys Glu Gly Glu Lys Arg Tyr Ser Arg Phe Gln Leu Thr Gly Gln Phe 835 840 845 Met Tyr Glu Tyr Ile Pro Gln Asp Ala Asn Tyr Ile Ser Arg Lys Glu 850 855 860 Gln Ile Thr Leu Phe Asn Asp Lys Glu Glu Gln Lys Ile Gln Val Glu 865 870 875 880 Thr Phe Asn Asn Gln Ile Ala Lys Ile Leu Asn Ala Glu Asp Phe Tyr 885 890 895 Val Ile Gly Ile Asp Arg Gly Ile Thr Gln Leu Ala Thr Leu Cys Val 900 905 910 Leu Asn Lys Asn Gly Val Ile Gln Gly Gly Phe Glu Ile Phe Thr Arg 915 920 925 Glu Phe Asp Tyr Thr Asn Lys Gln Trp Lys His Thr Lys Leu Lys Glu 930 935 940 Asn Arg Asn Ile Leu Asp Ile Ser Asn Leu Lys Val Glu Thr Thr Val 945 950 955 960 Asn Gly Glu Lys Val Leu Val Asp Leu Ser Glu Val Lys Thr Tyr Leu 965 970 975 Arg Asp Glu Asn Gly Glu Pro Met Lys Asn Glu Lys Gly Val Ile Leu 980 985 990 Thr Lys Asp Asn Leu Gln Lys Ile Lys Leu Lys Gln Leu Ala Tyr Asp 995 1000 1005 Arg Lys Leu Gln Tyr Lys Met Gln His Glu Pro Glu Leu Val Leu Ser 1010 1015 1020 Phe Leu Asp Arg Leu Glu Asn Lys Glu Gln Ile Pro Asn Leu Leu Ala 1025 1030 1035 1040 Ser Thr Lys Leu Ile Ser Ala Tyr Lys Glu Gly Thr Ala Tyr Ala Asp 1045 1050 1055 Ile Asp Ile Glu Gln Phe Trp Asn Ile Leu Gln Thr Phe Gln Thr Ile 1060 1065 1070 Val Asp Lys Phe Gly Gly Ile Glu Asn Ala Lys Lys Thr Met Glu Phe 1075 1080 1085 Arg Gln Tyr Thr Glu Leu Asp Ala Ser Phe Asp Leu Lys Asn Gly Val 1090 1095 1100 Val Ala Asn Met Val Gly Val Val Lys Phe Ile Met Glu Lys Tyr Asn 1105 1110 1115 1120 Tyr Lys Thr Phe Ile Ala Leu Glu Asp Leu Thr Phe Ala Phe Gly Gln 1125 1130 1135 Ser Ile Asp Gly Ile Asn Gly Glu Arg Leu Arg Ser Thr Lys Glu Asp 1140 1145 1150 Lys Glu Val Asp Phe Lys Glu Gln Glu Asn Ser Thr Leu Ala Gly Leu 1155 1160 1165 Gly Thr Tyr His Phe Phe Glu Met Gln Leu Leu Lys Lys Leu Ser Lys 1170 1175 1180 Thr Gln Ile Gly Asn Glu Ile Lys His Phe Val Pro Ala Phe Arg Ser 1185 1190 1195 1200 Thr Glu Asn Tyr Glu Lys Ile Val Arg Lys Asp Lys Asn Val Lys Ala 1205 1210 1215 Lys Ile Val Ser Tyr Pro Phe Gly Ile Val Ser Phe Val Asn Pro Arg 1220 1225 1230 Asn Thr Ser Ile Ser Cys Pro Asn Cys Lys Asn Ala Asn Lys Ser Asn 1235 1240 1245 Arg Ile Lys Lys Glu Asn Asp Arg Ile Leu Cys Lys His Asn Ile Glu 1250 1255 1260 Lys Thr Lys Gly Asn Cys Gly Phe Asp Thr Ala Asn Phe Asp Glu Asn 1265 1270 1275 1280 Lys Leu Arg Ala Glu Asn Lys Gly Lys Asn Phe Lys Tyr Ile Ser Ser 1285 1290 1295 Gly Asp Ala Asn Ala Ala Tyr Asn Ile Ala Val Lys Leu Leu Glu Asp 1300 1305 1310 Lys Ile Phe Glu Ile Asn Lys Lys 1315 1320 <210> 31 <211> 178 <212> PRT <213> Escherichia coli <400> 31 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 32 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> ERF protein motif <220> <221> VARIANT <222> 2 <223> Xaa = Gly, Ser, or Ala <220> <221> VARIANT <222> 3, 4 <223> Xaa = Any Amino Acid <220> <221> VARIANT <222> 5 <223> Xaa = Ser or Thr <220> <221> VARIANT <222> 7 <223> Xaa = Ala, Val, Leu, Ile, Met, or Phe <220> <221> VARIANT <222> 8 <223> Xaa = Lys, Arg, Glu, Asp, Asn, Thr, or Ser <220> <221> VARIANT <222> 9 <223> Xaa = Lys or Arg <220> <221> VARIANT <222> 11 <223> Xaa = Any Amino Acid <220> <221> VARIANT <222> 12 <223> Xaa = Ala, Val, Leu, Ile, Met, or Phe <220> <221> VARIANT <222> 13, 14 <223> Xaa = Any Amino Acid <220> <221> VARIANT <222> 15, 16 <223> Xaa = Ala, Val, Leu, Ile, Met, or Phe <400> 32 Gly Xaa Xaa Xaa Xaa Tyr Xaa Xaa Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 <210> 33 <211> 20 <212> PRT <213> Unknown <220> <223> FMDV 2A self-processing peptide sequence <400> 33 Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 34 <211> 178 <212> PRT <213> Escherichia coli APEC Ol <400> 34 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 35 <211> 178 <212> PRT <213> Escherichia coli UTI89 <400> 35 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 36 <211> 178 <212> PRT <213> Unknown <220> <223> Proteobacteria <400> 36 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 37 <211> 178 <212> PRT <213> Unknown <220> <223> Escherichia <400> 37 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Val Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 38 <211> 178 <212> PRT <213> Shigella flexneri <400> 38 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Lys Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 39 <211> 178 <212> PRT <213> Escherichia coli <400> 39 Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 40 <211> 178 <212> PRT <213> Escherichia coli <400> 40 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Leu 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 41 <211> 178 <212> PRT <213> Escherichia coli <400> 41 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Ala Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 42 <211> 178 <212> PRT <213> Escherichia coli <400> 42 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Ala Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 43 <211> 178 <212> PRT <213> Escherichia coli <400> 43 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 His Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 44 <211> 178 <212> PRT <213> Escherichia coli <400> 44 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Ser Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 45 <211> 178 <212> PRT <213> Escherichia coli <400> 45 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Ser Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 46 <211> 178 <212> PRT <213> Escherichia coli <400> 46 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Ser Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 47 <211> 178 <212> PRT <213> Escherichia coli <400> 47 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Ser Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 48 <211> 178 <212> PRT <213> Escherichia coli <400> 48 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Ser Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 49 <211> 178 <212> PRT <213> Escherichia coli <400> 49 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Ser Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 50 <211> 178 <212> PRT <213> Unknown <220> <223> Escherichia <400> 50 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 51 <211> 178 <212> PRT <213> Escherichia coli <400> 51 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Thr 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 52 <211> 177 <212> PRT <213> Escherichia coli <400> 52 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gln Pro Gln Gly Gly Trp Gly Gln Ser Gln Gln Pro Gln Gly Gly 130 135 140 Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro 145 150 155 160 Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 165 170 175 Phe <210> 53 <211> 178 <212> PRT <213> Escherichia coli <400> 53 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Cys Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 54 <211> 178 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> 111 <223> Xaa = Any Amino Acid <400> 54 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Xaa Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 55 <211> 178 <212> PRT <213> Escherichia coli <400> 55 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Val Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 56 <211> 178 <212> PRT <213> Escherichia coli <400> 56 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Val Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 57 <211> 178 <212> PRT <213> Escherichia coli <400> 57 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Asp Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 58 <211> 178 <212> PRT <213> Escherichia coli <400> 58 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Asp 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 59 <211> 178 <212> PRT <213> Escherichia coli <400> 59 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Ile Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 60 <211> 178 <212> PRT <213> Shigella dysenteriae 1617 <400> 60 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Leu Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 61 <211> 178 <212> PRT <213> Escherichia albertii <400> 61 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Leu Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 62 <211> 178 <212> PRT <213> Escherichia coli <400> 62 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Cys Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 63 <211> 178 <212> PRT <213> Escherichia coli <400> 63 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Leu Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 64 <211> 178 <212> PRT <213> Escherichia coli <400> 64 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Pro Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 65 <211> 178 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 65 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Leu Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 66 <211> 178 <212> PRT <213> Escherichia coli <400> 66 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Asp Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Thr 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 67 <211> 178 <212> PRT <213> Escherichia coli <400> 67 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Leu Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 68 <211> 178 <212> PRT <213> Escherichia coli <400> 68 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Leu Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 69 <211> 178 <212> PRT <213> Unknown <220> <223> Escherichia <400> 69 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Thr Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 70 <211> 178 <212> PRT <213> Escherichia coli <400> 70 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Gly Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 71 <211> 178 <212> PRT <213> Escherichia coli <400> 71 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Gly Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 72 <211> 178 <212> PRT <213> Escherichia albertii <400> 72 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Leu Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 73 <211> 178 <212> PRT <213> Escherichia albertii <400> 73 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Phe Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 74 <211> 188 <212> PRT <213> Escherichia coli <400> 74 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly 145 150 155 160 Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn 165 170 175 Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 180 185 <210> 75 <211> 177 <212> PRT <213> Unknown <220> <223> Citrobacter <400> 75 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ala Gly 115 120 125 Gly Gly Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly 130 135 140 Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro 145 150 155 160 Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 165 170 175 Phe <210> 76 <211> 178 <212> PRT <213> Citrobacter koseri <400> 76 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser 145 150 155 160 Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 77 <211> 171 <212> PRT <213> Escherichia coli ECC-1470 <400> 77 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp 165 170 <210> 78 <211> 178 <212> PRT <213> Citrobacter koseri <400> 78 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Val Pro Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser 145 150 155 160 Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 79 <211> 178 <212> PRT <213> Citrobacter koseri <400> 79 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Ile Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser 145 150 155 160 Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 80 <211> 171 <212> PRT <213> Unknown <220> <223> Shigella <400> 80 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly 115 120 125 Gly Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly 130 135 140 Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu 145 150 155 160 Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 81 <211> 174 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 81 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 82 <211> 174 <212> PRT <213> Citrobacter freundii complex <400> 82 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Gly Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 83 <211> 174 <212> PRT <213> Unknown <220> <223> Citrobacter <400> 83 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Glu Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 84 <211> 174 <212> PRT <213> Citrobacter youngae <400> 84 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 85 <211> 174 <212> PRT <213> Citrobacter werkmanii <400> 85 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Ser Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 86 <211> 174 <212> PRT <213> Citrobacter sp. MGH109 <400> 86 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Leu Gln Gln Ser Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 87 <211> 175 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 87 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 88 <211> 174 <212> PRT <213> Unknown <220> <223> Citrobacter <400> 88 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 89 <211> 174 <212> PRT <213> Unknown <220> <223> Proteobacteria <400> 89 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 90 <211> 155 <212> PRT <213> Escherichia coli PA5 <400> 90 Met Pro Asn Gly Gly Ala Val Ala Asn Ile Thr Leu Ala Thr Ser Glu 1 5 10 15 Ser Trp Arg Asp Lys Ala Thr Gly Glu Met Lys Glu Gln Thr Glu Trp 20 25 30 His Arg Val Val Leu Phe Gly Lys Leu Ala Glu Val Ala Ser Glu Tyr 35 40 45 Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly Gln Leu Arg Thr Arg 50 55 60 Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg Tyr Thr Thr Glu Val Val 65 70 75 80 Val Asn Val Gly Gly Thr Met Gln Met Leu Gly Gly Arg Gln Gly Gly 85 90 95 Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly Gly Gln Pro Gln Gly Gly 100 105 110 Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly 115 120 125 Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu 130 135 140 Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 145 150 155 <210> 91 <211> 174 <212> PRT <213> Enterobacter aerogenes <400> 91 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Ser Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 92 <211> 176 <212> PRT <213> Enterobacter cloacae <400> 92 Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser 20 25 30 Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Thr Gly Gly Ser Gln Asn 115 120 125 Gln Gln Gln Gly Gly Trp Gly Arg His Gln Gln Pro Gln Gly Gly Asn 130 135 140 Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro 145 150 155 160 Ala Pro Ser Asn Glu Pro Pro Met Asp Leu Asp Asp Asp Ile Pro Phe 165 170 175 <210> 93 <211> 174 <212> PRT <213> Enterobacter cloacae <400> 93 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 94 <211> 178 <212> PRT <213> Klebsiella sp. G5 <400> 94 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser 145 150 155 160 Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 95 <211> 175 <212> PRT <213> Klebsiella oxytoca <400> 95 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Ser Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 96 <211> 178 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 96 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gly Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln 130 135 140 Gly Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser 145 150 155 160 Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 97 <211> 178 <212> PRT <213> Enterobacter lignolyticus <400> 97 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Ser Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser 145 150 155 160 Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 98 <211> 176 <212> PRT <213> Serratia marcescens <400> 98 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly 115 120 125 Gly Gln Ser Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro 145 150 155 160 Ala Thr Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 99 <211> 174 <212> PRT <213> Enterobacter cloacae complex <400> 99 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Ser Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 100 <211> 176 <212> PRT <213> Enterobacter cloacae complex <400> 100 Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser 20 25 30 Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Asn 115 120 125 Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn 130 135 140 Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro 145 150 155 160 Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 101 <211> 175 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 101 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 102 <211> 175 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 102 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 103 <211> 176 <212> PRT <213> Enterobacter cloacae <400> 103 Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Ser Ala Val Cys Ser 20 25 30 Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Asn 115 120 125 Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn 130 135 140 Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro 145 150 155 160 Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 104 <211> 175 <212> PRT <213> Klebsiella oxytoca <400> 104 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Tyr Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 105 <211> 175 <212> PRT <213> Klebsiella oxytoca <400> 105 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Thr Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 106 <211> 184 <212> PRT <213> Unknown <220> <223> Pantoea <400> 106 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Asn Lys Glu Ile Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Gln Asp Gln Gly Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Gly Ala Ser Ala Gly Gly Ala Pro Met 115 120 125 Gly Gly Gly Gln Gln Ser Gly Gly Asn Asn Asn Gly Trp Gly Gln Pro 130 135 140 Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg 145 150 155 160 Pro Gln Pro Gln Ser Ala Pro Ala Ser Asn Asn Asn Glu Pro Pro Met 165 170 175 Asp Phe Asp Asp Asp Ile Pro Phe 180 <210> 107 <211> 175 <212> PRT <213> Klebsiella oxytoca <400> 107 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 108 <211> 176 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 108 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly 115 120 125 Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Ser Gly Asn Gln 130 135 140 Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro 145 150 155 160 Ala Thr Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 109 <211> 174 <212> PRT <213> Klebsiella pneumoniae <400> 109 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys His Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 110 <211> 171 <212> PRT <213> Klebsiella pneumoniae <400> 110 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly 130 135 140 Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn Glu 145 150 155 160 Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 111 <211> 173 <212> PRT <213> Unknown <220> <223> Enterobacteriaceae <400> 111 Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln 1 5 10 15 Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn Phe 20 25 30 Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu Met 35 40 45 Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala 50 55 60 Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu 65 70 75 80 Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys 85 90 95 Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu 100 105 110 Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln 115 120 125 Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser 130 135 140 Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser 145 150 155 160 Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 112 <211> 174 <212> PRT <213> Klebsiella pneumoniae <400> 112 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 113 <211> 175 <212> PRT <213> Unknown <220> <223> Gammaproteobacteria <400> 113 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 114 <211> 173 <212> PRT <213> Enterobacter aerogenes <400> 114 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln 115 120 125 Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser 130 135 140 Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser 145 150 155 160 Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 115 <211> 174 <212> PRT <213> Enterobacter aerogenes <400> 115 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 116 <211> 177 <212> PRT <213> Unknown <220> <223> Serratia <400> 116 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly 115 120 125 Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro 145 150 155 160 Ala Ala Ser Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 165 170 175 Phe <210> 117 <211> 174 <212> PRT <213> Yokenella regensburgei <400> 117 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 118 <211> 178 <212> PRT <213> Raoultella terrigena <400> 118 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu 85 90 95 Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala 145 150 155 160 Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile 165 170 175 Pro Phe <210> 119 <211> 174 <212> PRT <213> Klebsiella pneumoniae <400> 119 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ser Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 120 <211> 181 <212> PRT <213> Unknown <220> <223> Yersinia <400> 120 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Ala Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Glu 85 90 95 Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Gln 115 120 125 Asp Gly Gly Ala Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly 130 135 140 Gly Asn Gln Phe Ser Gly Gly Gln Thr Ser Arg Pro Ala Gln Ser Ala 145 150 155 160 Pro Ala Ala Gln Pro Gln Gly Gly Asn Glu Pro Pro Met Asp Phe Asp 165 170 175 Asp Asp Ile Pro Phe 180 <210> 121 <211> 174 <212> PRT <213> Klebsiella pneumoniae <400> 121 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Ser Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 122 <211> 180 <212> PRT <213> Cronobacter condimenti <400> 122 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Leu Arg Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Val Thr Glu Trp His Ser Val Val Leu Tyr Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Ile Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp 85 90 95 Arg Tyr Ser Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly 115 120 125 Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln 130 135 140 Gln Ser Gly Gly Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln 145 150 155 160 Gln Gln Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp 165 170 175 Asp Ile Pro Phe 180 <210> 123 <211> 174 <212> PRT <213> Klebsiella sp. 10982 <400> 123 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Ser Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 124 <211> 458 <212> PRT <213> Klebsiella pneumoniae <400> 124 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro 145 150 155 160 Ser Asn Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Met Ala 165 170 175 Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln Asp 180 185 190 Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn Phe Thr 195 200 205 Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu Met Lys 210 215 220 Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala Glu 225 230 235 240 Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly 245 250 255 Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys Tyr 260 265 270 Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu Gly 275 280 285 Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln Gly 290 295 300 Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly 305 310 315 320 Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn 325 330 335 Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Ala Glu Val Ala 340 345 350 Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly Gln Leu 355 360 365 Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys Tyr Thr Thr 370 375 380 Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu Gly Gly Arg 385 390 395 400 Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln Gly Gly Trp 405 410 415 Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala 420 425 430 Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn Glu Thr 435 440 445 Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 450 455 <210> 125 <211> 176 <212> PRT <213> Trabulsiella guamensis <400> 125 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Ala 130 135 140 Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro 145 150 155 160 Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 126 <211> 176 <212> PRT <213> Enterobacter cloacae <400> 126 Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser 20 25 30 Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Leu Lys Glu Gln Thr Glu Trp His Arg Ile Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Ser 115 120 125 Gln Gln His Gly Gly Trp Gly Gln Tyr Gln His Pro Gln Val Gly Asn 130 135 140 Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro 145 150 155 160 Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 127 <211> 177 <212> PRT <213> Trabulsiella odontotermitis <400> 127 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Pro Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly 130 135 140 Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala 145 150 155 160 Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 165 170 175 Phe <210> 128 <211> 177 <212> PRT <213> Trabulsiella odontotermitis <400> 128 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln Gln Gly Gly 130 135 140 Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala 145 150 155 160 Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 165 170 175 Phe <210> 129 <211> 174 <212> PRT <213> Kosakonia radicincitans <400> 129 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe 130 135 140 Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ser Ala Pro Ala Pro 145 150 155 160 Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 <210> 130 <211> 177 <212> PRT <213> Serratia marcescens <400> 130 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Ser Leu Gln Thr Arg Lys Trp Thr Asp Gln Ala Gly Val Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly 115 120 125 Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro 145 150 155 160 Ala Ala Ser Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 165 170 175 Phe <210> 131 <211> 175 <212> PRT <213> Unknown <220> <223> Kluyvera <400> 131 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 132 <211> 175 <212> PRT <213> Enterobacter asburiae <400> 132 Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly 1 5 10 15 Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn 20 25 30 Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu 35 40 45 Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu 50 55 60 Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile 65 70 75 80 Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu 85 90 95 Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met 100 105 110 Leu Gly Gly Arg Gln Gly Gly Gly Thr Pro Ala Gly Gly Gly Gln Gln 115 120 125 Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln 130 135 140 Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala 145 150 155 160 Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe 165 170 175 <210> 133 <211> 193 <212> PRT <213> Artificial Sequence <220> <223> c2 NLS-SSB fusion protein <400> 133 Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro 1 5 10 15 Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln 20 25 30 Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn Ile 35 40 45 Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu Met 50 55 60 Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala 65 70 75 80 Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu 85 90 95 Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg 100 105 110 Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu 115 120 125 Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly 130 135 140 Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly 145 150 155 160 Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro 165 170 175 Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro 180 185 190 Phe <210> 134 <211> 277 <212> PRT <213> Artificial Sequence <220> <223> c2 NLS-Bacteriophage Lambda Red beta SSAP-fusion protein <400> 134 Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro 1 5 10 15 Met Ser Thr Ala Leu Ala Thr Leu Ala Gly Lys Leu Ala Glu Arg Val 20 25 30 Gly Met Asp Ser Val Asp Pro Gln Glu Leu Ile Thr Thr Leu Arg Gln 35 40 45 Thr Ala Phe Lys Gly Asp Ala Ser Asp Ala Gln Phe Ile Ala Leu Leu 50 55 60 Ile Val Ala Asn Gln Tyr Gly Leu Asn Pro Trp Thr Lys Glu Ile Tyr 65 70 75 80 Ala Phe Pro Asp Lys Gln Asn Gly Ile Val Pro Val Val Gly Val Asp 85 90 95 Gly Trp Ser Arg Ile Ile Asn Glu Asn Gln Gln Phe Asp Gly Met Asp 100 105 110 Phe Glu Gln Asp Asn Glu Ser Cys Thr Cys Arg Ile Tyr Arg Lys Asp 115 120 125 Arg Asn His Pro Ile Cys Val Thr Glu Trp Met Asp Glu Cys Arg Arg 130 135 140 Glu Pro Phe Lys Thr Arg Glu Gly Arg Glu Ile Thr Gly Pro Trp Gln 145 150 155 160 Ser His Pro Lys Arg Met Leu Arg His Lys Ala Met Ile Gln Cys Ala 165 170 175 Arg Leu Ala Phe Gly Phe Ala Gly Ile Tyr Asp Lys Asp Glu Ala Glu 180 185 190 Arg Ile Val Glu Asn Thr Ala Tyr Thr Ala Glu Arg Gln Pro Glu Arg 195 200 205 Asp Ile Thr Pro Val Asn Asp Glu Thr Met Gln Glu Ile Asn Thr Leu 210 215 220 Leu Ile Ala Leu Asp Lys Thr Trp Asp Asp Asp Leu Leu Pro Leu Cys 225 230 235 240 Ser Gln Ile Phe Arg Arg Asp Ile Arg Ala Ser Ser Glu Leu Thr Gln 245 250 255 Ala Glu Ala Val Lys Ala Leu Gly Phe Leu Lys Gln Lys Ala Ala Glu 260 265 270 Gln Lys Val Ala Ala 275 <210> 135 <211> 241 <212> PRT <213> Artificial Sequence <220> <223> c2 NLS-Bacteriophage Lambda Red Exonuclease-fusion protein <400> 135 Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro 1 5 10 15 Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala Val 20 25 30 Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile Thr 35 40 45 Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys Lys 50 55 60 Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu Val 65 70 75 80 Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp Gly 85 90 95 Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser Gly 100 105 110 Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met Arg 115 120 125 Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu Glu 130 135 140 Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu Gly 145 150 155 160 Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr Ser 165 170 175 Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp Pro 180 185 190 Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp Glu 195 200 205 Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu Lys 210 215 220 Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln Trp 225 230 235 240 Arg <210> 136 <211> 692 <212> PRT <213> Homo sapiens <400> 136 Met Ser Ser Phe Glu Gly Gln Met Ala Glu Tyr Pro Thr Ile Ser Ile 1 5 10 15 Asp Arg Phe Asp Arg Glu Asn Leu Arg Ala Arg Ala Tyr Phe Leu Ser 20 25 30 His Cys His Lys Asp His Met Lys Gly Leu Arg Ala Pro Thr Leu Lys 35 40 45 Arg Arg Leu Glu Cys Ser Leu Lys Val Tyr Leu Tyr Cys Ser Pro Val 50 55 60 Thr Lys Glu Leu Leu Leu Thr Ser Pro Lys Tyr Arg Phe Trp Lys Lys 65 70 75 80 Arg Ile Ile Ser Ile Glu Ile Glu Thr Pro Thr Gln Ile Ser Leu Val 85 90 95 Asp Glu Ala Ser Gly Glu Lys Glu Glu Ile Val Val Thr Leu Leu Pro 100 105 110 Ala Gly His Cys Pro Gly Ser Val Met Phe Leu Phe Gln Gly Asn Asn 115 120 125 Gly Thr Val Leu Tyr Thr Gly Asp Phe Arg Leu Ala Gln Gly Glu Ala 130 135 140 Ala Arg Met Glu Leu Leu His Ser Gly Gly Arg Val Lys Asp Ile Gln 145 150 155 160 Ser Val Tyr Leu Asp Thr Thr Phe Cys Asp Pro Arg Phe Tyr Gln Ile 165 170 175 Pro Ser Arg Glu Glu Cys Leu Ser Gly Val Leu Glu Leu Val Arg Ser 180 185 190 Trp Ile Thr Arg Ser Pro Tyr His Val Val Trp Leu Asn Cys Lys Ala 195 200 205 Ala Tyr Gly Tyr Glu Tyr Leu Phe Thr Asn Leu Ser Glu Glu Leu Gly 210 215 220 Val Gln Val His Val Asn Lys Leu Asp Met Phe Arg Asn Met Pro Glu 225 230 235 240 Ile Leu His His Leu Thr Thr Asp Arg Asn Thr Gln Ile His Ala Cys 245 250 255 Arg His Pro Lys Ala Glu Glu Tyr Phe Gln Trp Ser Lys Leu Pro Cys 260 265 270 Gly Ile Thr Ser Arg Asn Arg Ile Pro Leu His Ile Ile Ser Ile Lys 275 280 285 Pro Ser Thr Met Trp Phe Gly Glu Arg Ser Arg Lys Thr Asn Val Ile 290 295 300 Val Arg Thr Gly Glu Ser Ser Tyr Arg Ala Cys Phe Ser Phe His Ser 305 310 315 320 Ser Tyr Ser Glu Ile Lys Asp Phe Leu Ser Tyr Leu Cys Pro Val Asn 325 330 335 Ala Tyr Pro Asn Val Ile Pro Val Gly Thr Thr Met Asp Lys Val Val 340 345 350 Glu Ile Leu Lys Pro Leu Cys Arg Ser Ser Gln Ser Thr Glu Pro Lys 355 360 365 Tyr Lys Pro Leu Gly Lys Leu Lys Arg Ala Arg Thr Val His Arg Asp 370 375 380 Ser Glu Glu Glu Asp Asp Tyr Leu Phe Asp Asp Pro Leu Pro Ile Pro 385 390 395 400 Leu Arg His Lys Val Pro Tyr Pro Glu Thr Phe His Pro Glu Val Phe 405 410 415 Ser Met Thr Ala Val Ser Glu Lys Gln Pro Glu Lys Leu Arg Gln Thr 420 425 430 Pro Gly Cys Cys Arg Ala Glu Cys Met Gln Ser Ser Arg Phe Thr Asn 435 440 445 Phe Val Asp Cys Glu Glu Ser Asn Ser Glu Ser Glu Glu Glu Val Gly 450 455 460 Ile Pro Ala Ser Leu Gln Gly Asp Leu Gly Ser Val Leu His Leu Gln 465 470 475 480 Lys Ala Asp Gly Asp Val Pro Gln Trp Glu Val Phe Phe Lys Arg Asn 485 490 495 Asp Glu Ile Thr Asp Glu Ser Leu Glu Asn Phe Pro Ser Ser Thr Val 500 505 510 Ala Gly Gly Ser Gln Ser Pro Lys Leu Phe Ser Asp Ser Asp Gly Glu 515 520 525 Ser Thr His Ile Ser Ser Gln Asn Ser Ser Gln Ser Thr His Ile Thr 530 535 540 Glu Gln Gly Ser Gln Gly Trp Asp Ser Gln Ser Asp Thr Val Leu Leu 545 550 555 560 Ser Ser Gln Glu Arg Asn Ser Gly Asp Ile Thr Ser Leu Asp Lys Ala 565 570 575 Asp Tyr Arg Pro Thr Ile Lys Glu Asn Ile Pro Ala Ser Leu Met Glu 580 585 590 Gln Asn Val Ile Cys Pro Lys Asp Thr Tyr Ser Asp Leu Lys Ser Arg 595 600 605 Asp Lys Asp Val Thr Ile Val Pro Ser Thr Gly Glu Pro Thr Thr Leu 610 615 620 Ser Ser Glu Thr His Ile Pro Glu Glu Lys Ser Leu Leu Asn Leu Ser 625 630 635 640 Thr Asn Ala Asp Ser Gln Ser Ser Ser Asp Phe Glu Val Pro Ser Thr 645 650 655 Pro Glu Ala Glu Leu Pro Lys Arg Glu His Leu Gln Tyr Leu Tyr Glu 660 665 670 Lys Leu Ala Thr Gly Glu Ser Ile Ala Val Lys Lys Arg Lys Cys Ser 675 680 685 Leu Leu Asp Thr 690 <210> 137 <211> 708 <212> PRT <213> Actinidia chinensis var. chinensis <400> 137 Met Gly Ile Gln Gly Leu Leu Pro Leu Leu Lys Ser Ile Met Val Pro 1 5 10 15 Ile His Ile Lys Asp Leu Glu Asp Cys Cys Val Ala Ile Asp Thr Tyr 20 25 30 Ser Trp Leu His Lys Gly Ala Leu Ser Cys Ser Lys Asp Leu Cys Lys 35 40 45 Gly Gln Ser Thr Ser Lys His Ile Asp Tyr Cys Met Asn Arg Val Asn 50 55 60 Leu Leu Gln His Tyr Gly Ile Arg Pro Ile Leu Val Phe Asp Gly Gly 65 70 75 80 Pro Leu Pro Met Lys Ser Glu Gln Glu Ser Lys Arg Ala Arg Ser Arg 85 90 95 Lys Glu Asn Leu Ala Cys Ala Ile Glu Asn Glu Ser Asn Gly Asn Asn 100 105 110 Ala Ser Ala Tyr Lys Cys Tyr Gln Lys Ala Val Val Ile Ser Pro Ser 115 120 125 Val Ala Tyr Glu Leu Ile Gln Val Leu Lys Lys Glu Asn Val Tyr Tyr 130 135 140 Val Val Ala Pro Tyr Glu Ala Asp Ala Gln Met Thr Phe Leu Ala Val 145 150 155 160 Ser Lys Gln Val Asp Ala Val Ile Thr Glu Asp Ser Asp Leu Ile Ala 165 170 175 Phe Gly Cys Pro Arg Ile Ile Tyr Lys Met Asp Lys Leu Glu Gln Gly 180 185 190 Val Glu Phe Arg Tyr Ser Met Leu Gln Gln Asn Lys Glu Leu Asn Phe 195 200 205 Thr Gly Phe Thr Lys Arg Met Leu Leu Glu Met Cys Ile Leu Ser Gly 210 215 220 Cys Asp Tyr Leu Gln Ser Leu Pro Gly Ile Gly Leu Lys Lys Ala His 225 230 235 240 Ala Leu Val Lys Lys Phe Lys Ser Tyr Asp Lys Val Ile Lys His Leu 245 250 255 Lys Tyr Ser Thr Ala Ser Val Ser Ser Ser Tyr Glu Glu Ser Phe Arg 260 265 270 Lys Ala Ile Met Thr Phe Gln His Gln Arg Val Tyr Asp Pro Thr Ile 275 280 285 Glu Asp Ile Val His Leu Ser Asp Leu Pro Gln Tyr Val Gly Asp Asp 290 295 300 Leu Asp Phe Leu Gly Pro Ala Ile Leu Gln His Ile Ala Lys Gly Ile 305 310 315 320 Ala Arg Gly Asp Leu Asp Pro Phe Thr Lys Met Pro Ile Gln Gly Val 325 330 335 Asn Asn Gly Ala Gly Leu Val Asp Glu Gly Met Tyr Lys Leu Asn Asn 340 345 350 Phe Lys Ser Glu Gly Phe Ala Ser Leu Glu Ala Lys Arg Arg Phe Met 355 360 365 Ala Pro Arg Ser Thr Pro Lys His Arg Asn Pro Ile Thr Glu Thr Cys 370 375 380 Ser Thr Val Glu His Ile Thr Glu Asp Ala Asp Ala Cys Lys Thr Asn 385 390 395 400 Cys Ser Leu Glu Ser Leu Leu Asp Ser Arg Tyr Phe Asp Val Ala Ser 405 410 415 Pro Ser Glu Gly Tyr Val Lys His Gly Val Ala Ala Lys Ser Pro Glu 420 425 430 Ser Lys Ser Pro Ser His Gly Ser His Asp Lys Glu Glu Ile Leu Gly 435 440 445 Glu Gly Asp Asn Arg Ser Pro Gln Asp Pro Leu Leu Gln Gln Phe Lys 450 455 460 His Ser Ile Pro Lys Leu Cys Met Thr Leu Gln Lys Glu Arg Ala Lys 465 470 475 480 Ser Val Ala Asp Ser Gly Gln Asp Lys Thr Arg Lys Glu Asn Thr Lys 485 490 495 Val Ile Val Arg Ser Ser Tyr Phe Gln His Lys Leu Val Lys Glu Asn 500 505 510 Asp Lys Glu Asn Ile Lys Glu Asp Val Thr Thr Asp Lys Gly Glu Asn 515 520 525 Ile Asn Pro Lys Arg Glu His Lys Ser Ala Ser Asp Gly Gly Glu Ala 530 535 540 Lys Thr Arg Ile Lys Asn Arg Lys Thr Ile Val Arg Ser Ser Tyr Phe 545 550 555 560 Leu His Lys Ser Val Asn Glu Asn Asp Gln Asp Asn Arg His Glu Lys 565 570 575 Leu Ile Ile Asn Asp Asp Phe Thr Thr His Thr His Glu Asn Gly Ile 580 585 590 Pro Glu Ser Ala Ser Gly Asp Gly Tyr Phe Asn Asn Ser Ile Val Lys 595 600 605 Arg Lys Val Ser Pro Val Asp Ser Val Gln Met Glu Lys Thr Asn Tyr 610 615 620 Lys Cys Met Arg Met Asp Ala Ser Leu Pro Ile Glu Ser Ser Ser Ile 625 630 635 640 Ser Thr Leu Asn Asn Thr Thr Met Glu Thr Lys Ala Glu Gly Gly Lys 645 650 655 Phe Gly Ser Asn Ile Ser His Leu Lys Asn Tyr Ser Asp Ile Ala Glu 660 665 670 Lys Ser Ile Glu Arg Phe Val Ser Val Ile Ser Ser Phe Lys Cys Ser 675 680 685 Ser Ser Gly Ser Ser Ala Ser Gly Leu Arg Ala Pro Leu Arg Asn Thr 690 695 700 Glu His Met Tyr 705 <210> 138 <211> 1062 <212> PRT <213> Mus musculus <400> 138 Met Glu Pro Leu Asp Glu Leu Asp Leu Leu Leu Leu Glu Glu Asp Gly 1 5 10 15 Gly Ala Glu Ala Val Pro Arg Val Glu Leu Leu Arg Lys Lys Ala Asp 20 25 30 Ala Leu Phe Pro Glu Thr Val Leu Ser Arg Gly Val Asp Asn Arg Tyr 35 40 45 Leu Val Leu Ala Val Glu Thr Ser Gln Asn Glu Arg Gly Ala Glu Glu 50 55 60 Lys Arg Leu His Val Thr Ala Ser Gln Asp Arg Glu His Glu Val Leu 65 70 75 80 Cys Ile Leu Arg Asn Gly Trp Ser Ser Val Pro Val Glu Pro Gly Asp 85 90 95 Ile Val His Leu Glu Gly Asp Cys Thr Ser Glu Pro Trp Ile Ile Asp 100 105 110 Asp Asp Phe Gly Tyr Phe Ile Leu Tyr Pro Asp Met Met Ile Ser Gly 115 120 125 Thr Ser Val Ala Ser Ser Ile Arg Cys Leu Arg Arg Ala Val Leu Ser 130 135 140 Glu Thr Phe Arg Gly Ser Asp Pro Ala Thr Arg Gln Met Leu Ile Gly 145 150 155 160 Thr Ile Leu His Glu Val Phe Gln Lys Ala Ile Ser Glu Ser Phe Ala 165 170 175 Pro Glu Arg Leu Gln Glu Leu Ala Leu Gln Thr Leu Arg Glu Val Arg 180 185 190 His Leu Lys Glu Met Tyr Arg Leu Asn Leu Ser Gln Asp Glu Ile Leu 195 200 205 Cys Glu Val Glu Glu Tyr Leu Pro Ser Phe Ser Lys Trp Ala Glu Asp 210 215 220 Phe Met Arg Lys Gly Pro Ser Ser Glu Phe Pro Gln Met Gln Leu Ser 225 230 235 240 Leu Pro Ser Asp Gly Ser Asn Arg Ser Ser Pro Cys Asn Ile Glu Val 245 250 255 Val Lys Ser Leu Asp Ile Glu Glu Ser Ile Trp Ser Pro Arg Phe Gly 260 265 270 Leu Lys Gly Lys Ile Asp Val Thr Val Gly Val Lys Ile His Arg Asp 275 280 285 Cys Lys Met Lys Tyr Lys Val Met Pro Leu Glu Leu Lys Thr Gly Lys 290 295 300 Glu Ser Asn Ser Ile Glu His Arg Ser Gln Val Val Leu Tyr Thr Leu 305 310 315 320 Leu Ser Gln Glu Arg Arg Glu Asp Pro Glu Ala Gly Trp Leu Leu Tyr 325 330 335 Leu Lys Thr Gly Gln Met Tyr Pro Val Pro Ala Asn His Leu Asp Lys 340 345 350 Arg Glu Leu Leu Lys Leu Arg Asn Trp Leu Ala Ala Ser Leu Leu His 355 360 365 Arg Val Ser Arg Ala Ala Pro Gly Glu Glu Ala Arg Leu Ser Ala Leu 370 375 380 Pro Gln Ile Ile Glu Glu Glu Lys Thr Cys Lys Tyr Cys Ser Gln Ile 385 390 395 400 Gly Asn Cys Ala Leu Tyr Ser Arg Ala Val Glu Glu Gln Gly Asp Asp 405 410 415 Ala Ser Ile Pro Glu Ala Met Leu Ser Lys Ile Gln Glu Glu Thr Arg 420 425 430 His Leu Gln Leu Ala His Leu Lys Tyr Phe Ser Leu Trp Cys Leu Met 435 440 445 Leu Thr Leu Glu Ser Gln Ser Lys Asp Asn Arg Lys Thr His Gln Ser 450 455 460 Ile Trp Leu Thr Pro Ala Ser Glu Leu Glu Glu Ser Gly Asn Cys Val 465 470 475 480 Gly Asn Leu Val Arg Thr Glu Pro Val Ser Arg Val Cys Asp Gly Gln 485 490 495 Tyr Leu His Asn Phe Gln Arg Lys Asn Gly Pro Met Pro Ala Thr Asn 500 505 510 Leu Met Ala Gly Asp Arg Ile Ile Leu Ser Gly Glu Glu Arg Lys Leu 515 520 525 Phe Ala Leu Ser Lys Gly Tyr Val Lys Lys Met Asn Lys Ala Ala Val 530 535 540 Thr Cys Leu Leu Asp Arg Asn Leu Ser Thr Leu Pro Ala Thr Thr Val 545 550 555 560 Phe Arg Leu Asp Arg Glu Glu Arg His Gly Asp Ile Ser Thr Pro Leu 565 570 575 Gly Asn Leu Ser Lys Leu Met Glu Ser Thr Asp Pro Ser Lys Arg Leu 580 585 590 Arg Glu Leu Ile Ile Asp Phe Arg Glu Pro Gln Phe Ile Ala Tyr Leu 595 600 605 Ser Ser Val Leu Pro His Asp Ala Lys Asp Thr Val Ala Asn Ile Leu 610 615 620 Lys Gly Leu Asn Lys Pro Gln Arg Gln Ala Met Lys Arg Val Leu Leu 625 630 635 640 Ser Lys Asp Tyr Thr Leu Ile Val Gly Met Pro Gly Thr Gly Lys Thr 645 650 655 Thr Thr Ile Cys Ala Leu Val Arg Ile Leu Ser Ala Cys Gly Phe Ser 660 665 670 Val Leu Leu Thr Ser Tyr Thr His Ser Ala Val Asp Asn Ile Leu Leu 675 680 685 Lys Leu Ala Lys Phe Lys Val Gly Phe Leu Arg Leu Gly Gln Ser His 690 695 700 Lys Val His Pro Asp Ile Gln Lys Phe Thr Glu Glu Glu Ile Cys Arg 705 710 715 720 Ser Arg Ser Ile Ala Ser Leu Ala His Leu Glu Glu Leu Tyr Asn Ser 725 730 735 His Pro Ile Val Ala Thr Thr Cys Met Gly Ile Asn His Pro Ile Phe 740 745 750 Ser Arg Lys Thr Phe Asp Phe Cys Ile Val Asp Glu Ala Ser Gln Ile 755 760 765 Ser Gln Pro Val Cys Leu Gly Pro Leu Phe Phe Ser Arg Arg Phe Val 770 775 780 Leu Val Gly Asp His Gln Gln Leu Pro Pro Leu Val Val Asn Arg Glu 785 790 795 800 Ala Arg Ala Leu Gly Met Ser Glu Ser Leu Phe Lys Arg Leu Glu Arg 805 810 815 Asn Glu Ser Ala Val Val Gln Leu Thr Val Gln Tyr Arg Met Asn Arg 820 825 830 Lys Ile Met Ser Leu Ser Asn Lys Leu Thr Tyr Ala Gly Lys Leu Glu 835 840 845 Cys Gly Ser Asp Arg Val Ala Asn Ala Val Leu Ala Leu Pro Asn Leu 850 855 860 Lys Asp Ala Arg Leu Ser Leu Gln Leu Tyr Ala Asp Tyr Ser Asp Ser 865 870 875 880 Pro Trp Leu Ala Gly Val Leu Glu Pro Asp Asn Pro Val Cys Phe Leu 885 890 895 Asn Thr Asp Lys Val Pro Ala Pro Glu Gln Val Glu Asn Gly Gly Val 900 905 910 Ser Asn Val Thr Glu Ala Arg Leu Ile Val Phe Leu Thr Ser Thr Phe 915 920 925 Ile Lys Ala Gly Cys Ser Pro Ser Asp Ile Gly Val Ile Ala Pro Tyr 930 935 940 Arg Gln Gln Leu Arg Ile Ile Ser Asp Leu Leu Ala Arg Ser Ser Val 945 950 955 960 Gly Met Val Glu Val Asn Thr Val Asp Lys Tyr Gln Gly Arg Asp Lys 965 970 975 Ser Leu Ile Leu Val Ser Phe Val Arg Ser Asn Glu Asp Gly Thr Leu 980 985 990 Gly Glu Leu Leu Lys Asp Trp Arg Arg Leu Asn Val Ala Leu Thr Arg 995 1000 1005 Ala Lys His Lys Leu Ile Leu Leu Gly Ser Val Ser Ser Leu Lys Arg 1010 1015 1020 Phe Pro Pro Leu Gly Thr Leu Phe Asp His Leu Asn Ala Glu Gln Leu 1025 1030 1035 1040 Ile Leu Asp Leu Pro Ser Arg Glu His Glu Ser Leu Ser His Ile Leu 1045 1050 1055 Gly Asp Cys Gln Arg Asp 1060 <210> 139 <211> 702 <212> PRT <213> Saccharomyces cerevisiae <400> 139 Met Gly Ile Gln Gly Leu Leu Pro Gln Leu Lys Pro Ile Gln Asn Ala 1 5 10 15 Val Ser Leu Arg Arg Tyr Glu Gly Glu Val Leu Ala Ile Asp Gly Tyr 20 25 30 Ala Trp Leu His Arg Ala Ala Cys Ser Cys Ala Tyr Glu Leu Ala Met 35 40 45 Gly Lys Pro Thr Asp Lys Tyr Leu Gln Phe Phe Ile Lys Arg Phe Ser 50 55 60 Leu Leu Lys Thr Phe Lys Val Glu Pro Tyr Leu Val Phe Asp Gly Asp 65 70 75 80 Ala Ile Pro Val Lys Lys Ser Thr Glu Ser Lys Arg Arg Asp Lys Arg 85 90 95 Lys Glu Asn Lys Ala Ile Ala Glu Arg Leu Trp Ala Cys Gly Glu Lys 100 105 110 Lys Asn Ala Met Asp Tyr Phe Gln Lys Cys Val Asp Ile Thr Pro Glu 115 120 125 Met Ala Lys Cys Ile Ile Cys Tyr Cys Lys Leu Asn Gly Ile Arg Tyr 130 135 140 Ile Val Ala Pro Phe Glu Ala Asp Ser Gln Met Val Tyr Leu Glu Gln 145 150 155 160 Lys Asn Ile Val Gln Gly Ile Ile Ser Glu Asp Ser Asp Leu Leu Val 165 170 175 Phe Gly Cys Arg Arg Leu Ile Thr Lys Leu Asn Asp Tyr Gly Glu Cys 180 185 190 Leu Glu Ile Cys Arg Asp Asn Phe Ile Lys Leu Pro Lys Lys Phe Pro 195 200 205 Leu Gly Ser Leu Thr Asn Glu Glu Ile Ile Thr Met Val Cys Leu Ser 210 215 220 Gly Cys Asp Tyr Thr Asn Gly Ile Pro Lys Val Gly Leu Ile Thr Ala 225 230 235 240 Met Lys Leu Val Arg Arg Phe Asn Thr Ile Glu Arg Ile Ile Leu Ser 245 250 255 Ile Gln Arg Glu Gly Lys Leu Met Ile Pro Asp Thr Tyr Ile Asn Glu 260 265 270 Tyr Glu Ala Ala Val Leu Ala Phe Gln Phe Gln Arg Val Phe Cys Pro 275 280 285 Ile Arg Lys Lys Ile Val Ser Leu Asn Glu Ile Pro Leu Tyr Leu Lys 290 295 300 Asp Thr Glu Ser Lys Arg Lys Arg Leu Tyr Ala Cys Ile Gly Phe Val 305 310 315 320 Ile His Arg Glu Thr Gln Lys Lys Gln Ile Val His Phe Asp Asp Asp 325 330 335 Ile Asp His His Leu His Leu Lys Ile Ala Gln Gly Asp Leu Asn Pro 340 345 350 Tyr Asp Phe His Gln Pro Leu Ala Asn Arg Glu His Lys Leu Gln Leu 355 360 365 Ala Ser Lys Ser Asn Ile Glu Phe Gly Lys Thr Asn Ser Thr Asn Ser 370 375 380 Glu Ala Lys Val Lys Pro Ile Glu Ser Phe Phe Gln Lys Met Thr Lys 385 390 395 400 Leu Asp His Tyr Pro Lys Val Ala Asn Asn Ile His Ser Leu Arg Gln 405 410 415 Ala Glu Asp Lys Leu Thr Met Ala Ile Lys Arg Arg Lys Leu Ser Asn 420 425 430 Ala Asn Val Val Gln Glu Thr Leu Lys Asp Thr Arg Ser Lys Phe Phe 435 440 445 Asn Lys Pro Ser Met Thr Val Val Glu Asn Phe Lys Glu Lys Gly Asp 450 455 460 Ser Thr Gln Asp Phe Lys Glu Asp Thr Asn Ser Gln Ser Leu Glu Glu 465 470 475 480 Pro Val Ser Glu Ser Gln Leu Ser Thr Gln Ile Pro Ser Ser Phe Ile 485 490 495 Thr Thr Asn Leu Glu Asp Asp Asp Asn Leu Ser Glu Glu Val Ser Glu 500 505 510 Val Val Ser Asp Thr Glu Glu Asp Arg Lys Asn Ser Glu Gly Lys Ile 515 520 525 Ile Gly Asn Glu Ile Tyr Asn Thr Asp Asp Asp Gly Asp Gly Asp Thr 530 535 540 Ser Glu Asp Tyr Ser Glu Thr Ala Glu Ser Arg Val Pro Thr Ser Ser 545 550 555 560 Thr Thr Ser Phe Pro Gly Ser Ser Gln Arg Ser Ile Ser Gly Cys Thr 565 570 575 Lys Val Leu Gln Lys Phe Arg Tyr Ser Ser Ser Phe Ser Gly Val Asn 580 585 590 Ala Asn Arg Gln Pro Leu Phe Pro Arg His Val Asn Gln Lys Ser Arg 595 600 605 Gly Met Val Tyr Val Asn Gln Asn Arg Asp Asp Asp Cys Asp Asp Asn 610 615 620 Asp Gly Lys Asn Gln Ile Met Gln Arg Pro Leu Leu Arg Lys Ser Leu 625 630 635 640 Ile Gly Ala Arg Ser Gln Arg Ile Val Ile Asp Met Lys Ser Val Asp 645 650 655 Glu Arg Lys Ser Phe Asn Ser Ser Pro Ile Leu His Glu Glu Ser Lys 660 665 670 Lys Arg Asp Ile Glu Thr Thr Lys Ser Ser Gln Ala Arg Pro Ala Val 675 680 685 Arg Ser Ile Ser Leu Leu Ser Gln Phe Val Tyr Lys Gly Lys 690 695 700 <210> 140 <211> 486 <212> PRT <213> Unknown <220> <223> herpesvirus <400> 140 Met Glu Ala Thr Pro Thr Pro Ala Asp Leu Phe Ser Glu Asp Tyr Leu 1 5 10 15 Val Asp Thr Leu Asp Gly Leu Thr Val Asp Asp Gln Gln Ala Val Leu 20 25 30 Ala Ser Leu Ser Phe Ser Lys Phe Leu Lys His Ala Lys Val Arg Asp 35 40 45 Trp Cys Ala Gln Ala Lys Ile Gln Pro Ser Met Pro Ala Leu Arg Met 50 55 60 Ala Tyr Asn Tyr Phe Leu Phe Ser Lys Val Gly Glu Phe Ile Gly Ser 65 70 75 80 Glu Asp Val Cys Asn Phe Phe Val Asp Arg Val Phe Gly Gly Val Arg 85 90 95 Leu Leu Asp Val Ala Ser Val Tyr Ala Ala Cys Ser Gln Met Asn Ala 100 105 110 His Gln Arg His His Ile Cys Cys Leu Val Glu Arg Ala Thr Ser Ser 115 120 125 Gln Ser Leu Asn Pro Val Trp Asp Ala Leu Arg Asp Gly Ile Ile Ser 130 135 140 Ser Ser Lys Phe His Trp Ala Val Lys Gln Gln Asn Thr Ser Lys Lys 145 150 155 160 Ile Phe Ser Pro Trp Pro Ile Thr Asn Asn His Phe Val Ala Gly Pro 165 170 175 Leu Ala Phe Gly Leu Arg Cys Glu Glu Val Val Lys Thr Leu Leu Ala 180 185 190 Thr Leu Leu His Pro Asp Glu Ala Asn Cys Leu Asp Tyr Gly Phe Met 195 200 205 Gln Ser Pro Gln Asn Gly Ile Phe Gly Val Ser Leu Asp Phe Ala Ala 210 215 220 Asn Val Lys Thr Asp Thr Glu Gly Arg Leu Gln Phe Asp Pro Asn Cys 225 230 235 240 Lys Val Tyr Glu Ile Lys Cys Arg Phe Lys Tyr Thr Phe Ala Lys Met 245 250 255 Glu Cys Asp Pro Ile Tyr Ala Ala Tyr Gln Arg Leu Tyr Glu Ala Pro 260 265 270 Gly Lys Leu Ala Leu Lys Asp Phe Phe Tyr Ser Ile Ser Lys Pro Ala 275 280 285 Val Glu Tyr Val Gly Leu Gly Lys Leu Pro Ser Glu Ser Asp Tyr Leu 290 295 300 Val Ala Tyr Asp Gln Glu Trp Glu Ala Cys Pro Arg Lys Lys Arg Lys 305 310 315 320 Leu Thr Pro Leu His Asn Leu Ile Arg Glu Cys Ile Leu His Asn Ser 325 330 335 Thr Thr Glu Ser Asp Val Tyr Val Leu Thr Asp Pro Gln Asp Thr Arg 340 345 350 Gly Gln Ile Ser Ile Lys Ala Arg Phe Lys Ala Asn Leu Phe Val Asn 355 360 365 Val Arg His Ser Tyr Phe Tyr Gln Val Leu Leu Gln Ser Ser Ile Val 370 375 380 Glu Glu Tyr Ile Gly Leu Asp Ser Gly Ile Pro Arg Leu Gly Ser Pro 385 390 395 400 Lys Tyr Tyr Ile Ala Thr Gly Phe Phe Arg Lys Arg Gly Tyr Gln Asp 405 410 415 Pro Val Asn Cys Thr Ile Gly Gly Asp Ala Leu Asp Pro His Val Glu 420 425 430 Ile Pro Thr Leu Leu Ile Val Thr Pro Val Tyr Phe Pro Arg Gly Ala 435 440 445 Lys His Arg Leu Leu His Gln Ala Ala Asn Phe Trp Ser Arg Ser Ala 450 455 460 Lys Asp Thr Phe Pro Tyr Ile Lys Trp Asp Phe Ser Tyr Leu Ser Ala 465 470 475 480 Asn Val Pro His Ser Pro 485 <210> 141 <211> 521 <212> PRT <213> Unknown <220> <223> UL12 exonuclease <400> 141 Met Glu Leu Glu Pro Val Gly Lys Lys Tyr Arg Pro Glu Arg Glu Asp 1 5 10 15 Ser Ser Lys Gly Arg Lys Ile Leu Thr Val Ser Val Asn Ser Gln Leu 20 25 30 Gln Gly Ala Ser Pro Thr Leu Gly Thr Arg Ala His Pro Pro His Ser 35 40 45 Glu Leu Thr Asp Tyr Thr Phe Ser Arg Tyr Ile Leu Tyr His Leu Ala 50 55 60 Pro Ser Glu Leu Lys Glu Ala Ile His Pro Leu Tyr His Arg Leu Asn 65 70 75 80 Tyr Ile Ala Asp Val Ile Lys Arg Gly Thr Ser Glu Gly Arg Trp Leu 85 90 95 Gly Tyr Pro Tyr Ser Cys Ile Leu Asp Thr Glu Asp Glu Leu Arg Asn 100 105 110 Glu Ser Arg Arg Asn Thr Ser Ser Pro Ser Asp His Ala Leu Arg Trp 115 120 125 Cys Leu Leu Val Glu Ser Phe Thr Ile Glu Gln Ala Asn Cys Asp Leu 130 135 140 Trp His Ile Phe Arg Gln Ser Leu Leu Thr Ala Ser Ser Val Lys Trp 145 150 155 160 Thr Asp Asp Gly Lys Leu Asp Thr Val Gly Ile Met Ser Asp Asn Ser 165 170 175 Thr Ala Tyr Val Glu Thr Cys Ser Val Ala Phe Gly Lys His Asn Glu 180 185 190 Pro Leu Ala Lys Ser Leu Val Thr Met Phe Cys Leu Asn His Ser Arg 195 200 205 His Val His Asn Thr Ser Pro Arg Arg Glu Asn Val Phe Val Phe Glu 210 215 220 Asp Val Ser Asp Arg Thr Ile Gln Ser Glu Ser Asp Tyr Ser Cys Gly 225 230 235 240 Leu Met Ile Asp Thr Arg Thr Gly Met Val Gly Ala Ser Leu Asp Met 245 250 255 Leu Val Cys Glu Arg Asp Pro Phe Gly Leu Leu Gln Pro Asp Ser Glu 260 265 270 Asn Gln Ala Ile Glu Thr Tyr Glu Ile Lys Cys Arg Ala Lys Tyr Ala 275 280 285 Phe Cys Pro Asp Lys Arg Ser Glu Leu Ser Gln Cys Tyr Glu Arg Leu 290 295 300 Leu Asn Val Arg Thr Met Gly Ser Leu Arg Leu Phe Ile Ser Ala Ile 305 310 315 320 Gln Arg Pro Cys Val Asp Tyr Phe Gln Pro Gly Asn Val Pro Arg Ser 325 330 335 Lys Glu Ala Leu Ile Thr Ser Asn Glu Glu Trp Lys Val Gly Asn Ser 340 345 350 Ala Tyr His Ala Ala Gln Ser Arg Ile Arg Cys Asn Ala Phe Asp Lys 355 360 365 Cys His Leu Glu Leu Asn Ser Asn Val Gln Ser Arg Val Trp Leu Phe 370 375 380 Gly Glu Pro Asp Leu Glu Thr Asp Thr Ile Tyr Pro Leu Pro Trp Asp 385 390 395 400 Thr Gly Lys Leu Ser Leu Asp Val Pro Ile Phe Ser Asn Pro Arg His 405 410 415 Pro Asn Phe Lys Gln Ile Tyr Leu Gln Thr Tyr Val Ala Ala Gly Tyr 420 425 430 Phe Gly Glu Arg Arg Thr Thr Pro Phe Leu Val Thr Phe Ile Gly Arg 435 440 445 Trp Arg Lys Arg Arg Glu Phe Gly Lys Lys Phe Ser Leu Ile Ala Asp 450 455 460 Ser Gly Leu Gly Lys Pro Ile Ser Thr Val His Ala Asp Gln Ala Ile 465 470 475 480 Pro Val Leu Leu Ile Val Thr Pro Val Ile Val Asp Glu Ala Phe Tyr 485 490 495 Gly Glu Ile Glu Ser Ala Gly Cys Arg Ala Phe Gly Glu Leu Val Lys 500 505 510 Gln Leu Trp Ala Lys Gln Pro His Thr 515 520 <210> 142 <211> 664 <212> PRT <213> Escherichia coli <400> 142 Met Ser Lys Val Phe Ile Cys Ala Ala Ile Pro Asp Glu Leu Ala Thr 1 5 10 15 Arg Glu Glu Gly Ala Val Ala Val Ala Thr Ala Ile Glu Ala Gly Asp 20 25 30 Glu Arg Arg Ala Arg Ala Lys Phe His Trp Gln Phe Leu Glu His Tyr 35 40 45 Pro Ala Ala Gln Asp Cys Ala Tyr Lys Phe Ile Val Cys Glu Asp Lys 50 55 60 Pro Gly Ile Pro Arg Pro Ala Leu Asp Ser Trp Asp Ala Glu Tyr Met 65 70 75 80 Gln Glu Asn Arg Trp Asp Glu Glu Ser Ala Ser Phe Val Pro Val Glu 85 90 95 Thr Glu Ser Asp Pro Met Asn Val Thr Phe Asp Lys Leu Ala Pro Glu 100 105 110 Val Gln Asn Ala Val Met Val Lys Phe Asp Thr Cys Glu Asn Ile Thr 115 120 125 Val Asp Met Val Ile Ser Ala Gln Glu Leu Leu Gln Glu Asp Met Ala 130 135 140 Thr Phe Asp Gly His Ile Val Glu Ala Leu Met Lys Met Pro Glu Val 145 150 155 160 Asn Ala Met Tyr Pro Glu Leu Lys Leu His Ala Ile Gly Trp Val Lys 165 170 175 His Lys Cys Ile Pro Gly Ala Lys Trp Pro Glu Ile Gln Ala Glu Met 180 185 190 Arg Ile Trp Lys Lys Arg Arg Glu Gly Glu Arg Lys Glu Thr Gly Lys 195 200 205 Tyr Thr Ser Val Val Asp Leu Ala Arg Ala Arg Ala Asn Gln Gln Tyr 210 215 220 Thr Glu Asn Ser Thr Gly Lys Ile Ser Pro Val Ile Ala Ala Ile His 225 230 235 240 Arg Glu Tyr Lys Gln Thr Trp Lys Thr Leu Asp Asp Glu Leu Ala Tyr 245 250 255 Ala Leu Trp Pro Gly Asp Val Asp Ala Gly Asn Ile Asp Gly Ser Ile 260 265 270 His Arg Trp Ala Lys Lys Glu Val Ile Asp Asn Asp Arg Glu Asp Trp 275 280 285 Lys Arg Ile Ser Ala Ser Met Arg Lys Gln Pro Asp Ala Leu Arg Tyr 290 295 300 Asp Arg Gln Thr Ile Phe Gly Leu Val Arg Glu Arg Pro Ile Asp Ile 305 310 315 320 His Lys Asp Pro Ile Ala Leu Asn Lys Tyr Ile Cys Glu Tyr Leu Thr 325 330 335 Thr Lys Gly Val Phe Glu Asn Glu Glu Thr Asp Leu Gly Thr Val Asp 340 345 350 Val Leu Gln Ser Ser Glu Thr Gln Thr Asp Ala Val Glu Thr Glu Val 355 360 365 Ser Asp Ile Pro Lys Asn Glu Thr Ala Pro Glu Ala Glu Pro Ser Val 370 375 380 Glu Arg Glu Gly Pro Phe Tyr Phe Leu Phe Ala Asp Lys Asp Gly Glu 385 390 395 400 Lys Tyr Gly Arg Ala Asn Lys Leu Ser Gly Leu Asp Lys Ala Leu Ala 405 410 415 Ala Gly Ala Thr Glu Ile Thr Lys Glu Glu Tyr Phe Ala Arg Lys Asn 420 425 430 Gly Thr Tyr Thr Gly Leu Pro Gln Asn Val Asp Thr Ala Glu Asp Ser 435 440 445 Glu Gln Pro Glu Pro Ile Lys Val Thr Ala Asp Glu Val Asn Lys Ile 450 455 460 Met Gln Ala Ala Asn Ile Ser Gln Pro Asp Ala Asp Lys Leu Leu Ala 465 470 475 480 Ala Ser Arg Gly Glu Phe Val Glu Glu Ile Ser Asp Pro Asn Asp Pro 485 490 495 Lys Trp Val Lys Gly Ile Gln Thr Arg Asp Ser Val Asn Gln Asn Gln 500 505 510 His Glu Ser Glu Arg Asn Tyr Gln Lys Ala Glu Gln Asn Ser Thr Asn 515 520 525 Ala Leu Gln Asn Glu Pro Glu Thr Lys Gln Pro Glu Pro Val Ala Gln 530 535 540 Gln Glu Val Glu Lys Val Cys Thr Ala Cys Gly Gln Thr Gly Gly Gly 545 550 555 560 Asn Cys Pro Asp Cys Gly Ala Val Met Gly Asp Ala Thr Tyr Gln Glu 565 570 575 Thr Phe Asp Glu Glu Tyr Gln Val Glu Val Gln Glu Asp Asp Pro Glu 580 585 590 Glu Met Glu Gly Ala Glu His Pro His Lys Glu Asn Thr Gly Gly Asn 595 600 605 Gln His His Asn Ser Asp Asn Glu Thr Gly Glu Thr Ala Asp His Ser 610 615 620 Ile Lys Val Asn Gly His His Glu Ile Thr Ser Thr Ser Arg Ala Gly 625 630 635 640 Ile His Leu Met Ile Asp Leu Glu Thr Met Gly Lys Asn Pro Asp Ala 645 650 655 Pro Ile Ile Cys Asn Arg Leu Ile 660 <210> 143 <211> 300 <212> PRT <213> Unknown <220> <223> Enterobacteria phage T7 <400> 143 Met Ala Leu Leu Asp Leu Lys Gln Phe Tyr Glu Leu Arg Glu Gly Cys 1 5 10 15 Asp Asp Lys Gly Ile Leu Val Met Asp Gly Asp Trp Leu Val Phe Gln 20 25 30 Ala Met Ser Ala Ala Glu Phe Asp Ala Ser Trp Glu Glu Glu Ile Trp 35 40 45 His Arg Cys Cys Asp His Ala Lys Ala Arg Gln Ile Leu Glu Asp Ser 50 55 60 Ile Lys Ser Tyr Glu Thr Arg Lys Lys Ala Trp Ala Gly Ala Pro Ile 65 70 75 80 Val Leu Ala Phe Thr Asp Ser Val Asn Trp Arg Lys Glu Leu Val Asp 85 90 95 Pro Asn Tyr Lys Ala Asn Arg Lys Ala Val Lys Lys Pro Val Gly Tyr 100 105 110 Phe Glu Phe Leu Asp Ala Leu Phe Glu Arg Glu Glu Phe Tyr Cys Ile 115 120 125 Arg Glu Pro Met Leu Glu Gly Asp Asp Val Met Gly Val Ile Ala Ser 130 135 140 Asn Pro Ser Ala Phe Gly Ala Arg Lys Ala Val Ile Ile Ser Cys Asp 145 150 155 160 Lys Asp Phe Lys Thr Ile Pro Asn Cys Asp Phe Leu Trp Cys Thr Thr 165 170 175 Gly Asn Ile Leu Thr Gln Thr Glu Glu Ser Ala Asp Trp Trp His Leu 180 185 190 Phe Gln Thr Ile Lys Gly Asp Ile Thr Asp Gly Tyr Ser Gly Ile Ala 195 200 205 Gly Trp Gly Asp Thr Ala Glu Asp Phe Leu Asn Asn Pro Phe Ile Thr 210 215 220 Glu Pro Lys Thr Ser Val Leu Lys Ser Gly Lys Asn Lys Gly Gln Glu 225 230 235 240 Val Thr Lys Trp Val Lys Arg Asp Pro Glu Pro His Glu Thr Leu Trp 245 250 255 Asp Cys Ile Lys Ser Ile Gly Ala Lys Ala Gly Met Thr Glu Glu Asp 260 265 270 Ile Ile Lys Gln Gly Gln Met Ala Arg Ile Leu Arg Phe Asn Glu Tyr 275 280 285 Asn Phe Ile Asp Lys Glu Ile Tyr Leu Trp Arg Pro 290 295 300 <210> 144 <211> 267 <212> PRT <213> Escherichia coli <400> 144 Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His 1 5 10 15 Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu 20 25 30 Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala 35 40 45 Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly 50 55 60 Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe 65 70 75 80 Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile 85 90 95 Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln 100 105 110 Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe 115 120 125 Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn 130 135 140 Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp 145 150 155 160 Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys 165 170 175 Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser 180 185 190 Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp 195 200 205 Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg 210 215 220 Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys 225 230 235 240 Cys Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro Ser 245 250 255 Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg 260 265 <210> 145 <211> 236 <212> PRT <213> Mus musculus <400> 145 Met Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu 1 5 10 15 Ala Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu 20 25 30 Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser 35 40 45 Gly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met 50 55 60 Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu 65 70 75 80 Ser Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala 85 90 95 Val Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile 100 105 110 Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys 115 120 125 Thr Glu Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys 130 135 140 Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His 145 150 155 160 Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe 165 170 175 His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly 180 185 190 Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu 195 200 205 Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro 210 215 220 Met Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu Ala 225 230 235 <210> 146 <211> 43 <212> DNA <213> Unknown <220> <223> Hammerhead ribozyme <400> 146 aaattactga tgagtccgtg aggacgaaac gagtaagctc gtc 43 <210> 147 <211> 68 <212> DNA <213> Unknown <220> <223> Hepatitis delta virus (HDV) ribozyme <400> 147 ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60 aatgggac 68 <210> 148 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Amino acid linker <400> 148 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Ser 1 5 10 <210> 149 <211> 2243 <212> DNA <213> Solanum lycopersicum <400> 149 atcgtatcca gtgcaccata ttttttggcg attaccactc atattattgt gtttagtaga 60 tattttaggt gcataattga tctcttcttt aaaactaggg gcacttatta ttatacatcc 120 acttgacact tgctttagtt ggctattttt tttatttttt attttttgtc aactacccca 180 atttaaattt tatttgatta agatattttt atggacctac tttataatta aaaatatttt 240 ctatttgaaa aggaaggaca aaaatcatac aattttggtc caactactcc tctctttttt 300 tttttggctt tataaaaaag gaaagtgatt agtaataaat aattaaataa tgaaaaaagg 360 aggaaataaa attttcgaat taaaatgtaa aagagaaaaa ggagagggag taatcattgt 420 ttaactttat ctaaagtacc ccaattcgat tttacatgta tatcaaatta tacaaatatt 480 ttattaaaat atagatattg aataatttta ttattcttga acatgtaaat aaaaattatc 540 tattatttca atttttatat aaactattat ttgaaatctc aattatgatt ttttaatatc 600 actttctatc catgataatt tcagcttaaa aagttttgtc aataattaca ttaattttgt 660 tgatgaggat gacaagattt cggtcatcaa ttacatatac acaaattgaa atagtaagca 720 acttgatttt ttttctcata atgataatga caaagacacg aaaagacaat tcaatattca 780 cattgattta tttttatatg ataataatta caataataat attcttataa agaaagagat 840 caattttgac tgatccaaaa atttatttat ttttactata ccaacgtcac taattatatc 900 taataatgta aaacaattca atcttactta aatattaatt tgaaataaac tatttttata 960 acgaaattac taaatttatc caataacaaa aaggtcttaa gaagacataa attctttttt 1020 tgtaatgctc aaataaattt gagtaaaaaa gaatgaaatt gagtgatttt tttttaatca 1080 taagaaaata aataattaat ttcaatataa taaaacagta atataatttc ataaatggaa 1140 ttcaatactt acctcttaga tataaaaaat aaatataaaa ataaagtgtt tctaataaac 1200 ccgcaattta aataaaatat ttaatatttt caatcaaatt taaataatta tattaaaata 1260 tcgtagaaaa agagcaatat ataatacaag aaagaagatt taagtacaat tatcaactat 1320 tattatactc taattttgtt atatttaatt tcttacggtt aaggtcatgt tcacgataaa 1380 ctcaaaatac gctgtatgag gacatatttt aaattttaac caataataaa actaagttat 1440 ttttagtata tttttttgtt taacgtgact taatttttct tttctagagg agcgtgtaag 1500 tgtcaacctc attctcctaa ttttcccaac cacataaaaa aaaaataaag gtagcttttg 1560 cgtgttgatt tggtacacta cacgtcatta ttacacgtgt tttcgtatga ttggttaatc 1620 catgaggcgg tttcctctag agtcggccat accatctata aaataaagct ttctgcagct 1680 cattttttca tcttctatct gatttctatt ataatttctc tgaattgcct tcaaatttct 1740 ctttcaaggt tagaattttt ctctattttt tggtttttgt ttgtttagat tctgagttta 1800 gttaatcagg tgctgttaaa gccctaaatt ttgagttttt ttcggttgtt ttgatggaaa 1860 atacctaaca attgagtttt ttcatgttgt tttgtcggag aatgcctaca attggagttc 1920 ctttcgttgt tttgatgaga aagcccctaa tttgagtgtt tttccgtcga tttgatttta 1980 aaggtttata ttcgagtttt tttcgtcggt ttaatgagaa ggcctaaaat aggagttttt 2040 ctggttgatt tgactaaaaa agccatggaa ttttgtgttt ttgatgtcgc tttggttctc 2100 aaggcctaag atctgagttt ctccggttgt tttgatgaaa aagccctaaa attggagttt 2160 ttatcttgtg ttttaggttg ttttaatcct tataatttga gttttttcgt tgttctgatt 2220 gttgttttta tgaatttcct gca 2243

Claims

하기를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형의 증가 방법:
게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공함으로써, 상기 게놈 편집 분자 및 상기 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 상기 게놈 편집 분자가 (i) 상기 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 상기 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; 상기 HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계.
제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
제2항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트(Argonaute), 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
제1항에 있어서, 상기 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.
제5항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제(nickase), Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.
제5항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
제1항에 있어서, 상기 공여자 DNA 분자가 원형 DNA 벡터, 제미니바이러스 레플리콘 상에 또는 선형 DNA 단편으로서 제공되는 방법.
제1항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열의 카피가 측접된 방법.
제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 상기 표적 편집 부위가 PAM 서열 및 상기 가이드 RNA에 대하여 상보적이고 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하게 위치한 서열을 포함하는 방법.
제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 절단 후에 상기 표적 편집 부위에 5' 오버행을 제공하는 방법.
제1항에 있어서, 상기 SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.
제1항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
제13항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, 동등한 SSAP 활성을 갖는 관련 단백질 또는 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제13항에 있어서, 상기 ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제13항에 있어서, 상기 RAD52-과 단백질이 사카로마이세스 세레비지애(Saccharomyces cerevisiae) Rad52 단백질, 스키조사카로마이세스 폼베(Schizosaccharomyces pombe) Rad22 단백질, 클루이베로마이세스 락티스(Kluyveromyces lactis) Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제1항에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
제1항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
제1항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
제1항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
제1항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스(Artemis) 단백질, 아폴로(Apollo) 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스(herpesvirus) SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아(enterobacterial) 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 엑소뉴클레아제 III, Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제5항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이(E. coli) 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제1항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
제1항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에(Enterobacteriaceae) 종 SSB인 방법.
제1항에 있어서, 상기 SSB가 에스케리키아 종, 시겔라(Shigella) 종, 엔테로박터(Enterobacter) 종, 클레브시엘라(Klebsiella) 종, 세라티아(Serratia) 종, 판토에아(Pantoea) 종 또는 예르시니아(Yersinia) 종 SSB인 방법.
제1항에 있어서, 상기 SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제1항에 있어서, 상기 HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.
제1항에 있어서, 상기 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.
제1항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.
제1항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB가 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 방법.
제1항 내지 제30항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
제31항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 방법.
제32항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
제31항에 있어서, 상기 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.
제31항에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
(a) 진핵 세포;
(b) 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제; 및
(c) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자(들)를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 시스템으로서,
상기 진핵 세포가 유효량의 HDR 촉진제 및 게놈 편집 분자(들)와 회합되고/되거나 이와 접촉되고/되거나 이를 함유하는 시스템.
제36항에 있어서, 상기 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 시스템.
제37항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 시스템.
제36항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 시스템.
제36항에 있어서, 상기 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 시스템.
제40항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제(nickase), Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 시스템.
제40항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 시스템.
제36항에 있어서, 상기 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈 상에 제공되는 시스템.
제36항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 시스템.
제36항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 상기 표적 편집 부위가 PAM 서열 및 상기 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 시스템.
제36항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 절단 후에 상기 표적 편집 부위에 5' 오버행을 제공하는 시스템.
제36항에 있어서, 상기 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 적어도 2배 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 시스템.
제36항에 있어서, 상기 SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 시스템.
제36항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 시스템.
제49항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.
제49항에 있어서, 상기 RecT/ Redβ-과 단백질이 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, Rac 박테리아 프로파지 RecT 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.
제49항에 있어서, 상기 RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
제49항에 있어서, 상기 ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
제49항에 있어서, 상기 RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
제36항에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.
제36항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.
제36항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.
제36항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.
제36항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
제40항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
제36항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 시스템.
제36항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 시스템.
제62항에 있어서, 상기 SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 시스템.
제36항에 있어서, 상기 SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
제36항에 있어서, 상기 HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 적어도 2배 증가되는 시스템.
제36항에 있어서, 상기 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 유지되거나 적어도 2배 감소되는 시스템.
제36항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 시스템.
제36항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB가 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.
제36항 내지 제68항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 시스템.
제69항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 시스템.
제69항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 시스템.
제69항에 있어서, 상기 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 시스템.
제69항에 있어서, 상기 시스템이 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 것을 제공하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 시스템.
(a) 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 진핵 세포에 제공함으로써, 상기 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 상기 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드, 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하고; 상기 HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계; 및
(b) 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시킴으로써, 게놈 변형을 갖는 진핵 세포를 제조하는 단계를 포함하는, 게놈 변형을 갖는 진핵 세포의 제조 방법.
제74항에 있어서, 상기 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
제75항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
제74항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
제74항에 있어서, 상기 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.
제78항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.
제78항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
제74항에 있어서, 상기 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.
제74항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접된 방법.
제74항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 상기 표적 편집 부위가 PAM 서열 및 상기 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 방법.
제74항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 절단 후에 상기 표적 편집 부위에 5' 오버행을 제공하는 방법.
제74항에 있어서, 상기 SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.
제74항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
제86항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.
제86항에 있어서, 상기 RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제86항에 있어서, 상기 ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제86항에 있어서, 상기 RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제74항에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
제74항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
제74항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
제74항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
제74항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제78항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제74항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
제74항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 방법.
제98항에 있어서, 상기 SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 방법.
제74항에 있어서, 상기 SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제74항에 있어서, 상기 HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.
제74항에 있어서, 상기 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.
제74항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.
제74항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB가 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.
제74항 내지 제104항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
제105항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 방법.
제105항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
제105항에 있어서, 상기 SSAP, 엑소뉴클레아제 및/또는 SSB가 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.
제105항에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
제1항 내지 제30항 중 어느 한 항, 제36항 내지 제68항 중 어느 한 항, 또는 제74항 내지 제104항 중 어느 한 항에 있어서, HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포가 복수의 용기, 구획 또는 위치를 포함하는 어레이에 제공되며, 각각의 용기, 구획 또는 위치가 HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포를 포함하는 방법 또는 시스템 또는 .
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 진핵 세포에 제공하는 단계를 포함하는 진핵 세포의 유전학적 엔지니어링 방법으로서,
상기 세포의 표적 편집 부위가 공여자 주형 DNA 분자에 의해 변형되는 방법.
제111항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
제112항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제, Cas12i, Cas14 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
제111항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
제111항에 있어서, 가이드 RNA를 추가로 포함하며, 상기 서열-특이적 엔도뉴클레아제 및 가이드 RNA가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 방법.
제115항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하며, 상기 서열-특이적 엔도뉴클레아제가 표적 편집 부위 내의 엔도뉴클레아제 인식 서열에 특이적인 방법.
제115항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
제111항에 있어서, 상기 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.
제111항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 방법.
제111항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
제120항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.
제111항에 있어서, 상기 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
제111항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
제111항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
제111항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
제111항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제111항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
제111항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
제111항 내지 제128항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
제129항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 방법.
제130항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
제131항에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 하나 이상의 벡터에 제공되는 방법.
(없음)
제133항에 있어서, 상기 벡터가 아그로박테리움 벡터인 방법.
제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 염색체에 의해 제공되는 방법.
제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 폴리펩티드, DNA, mRNA를 도입함으로써 및/또는 유성 교배(sexual crossing)에 의해 제공되는 방법.
제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 i) 내지 v) 중 하나 이상을 포함하는 전구 세포에 의해 제공되며, 상기 전구 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 이후에 전구 세포로의 폴리펩티드, DNA 또는 mRNA의 전달에 의해 및/또는 전구 세포의 유성 교배에 의해 제공되는 방법.
제111항 내지 제138항 중 어느 한 항에 있어서, 변형을 검출하는 단계를 추가로 포함하는 방법.
제139항에 있어서, 상기 변형을 검출하는 단계가 앰플리콘 서열분석을 포함하는 방법.
제111항 내지 제140항 중 어느 한 항에 있어서, 상기 표적 편집 부위가 단백질 코딩 서열 또는 프로모터 내에 존재하는 방법.
제111항 내지 제141항 중 어느 한 항에 있어서, 상기 표적 편집 부위의 변형이 삽입, 결실 또는 치환인 방법.
제111항 내지 제142항 중 어느 한 항에 있어서, 상기 표적 편집 부위가 작물재배학적으로 중요한 형질을 인코딩하는 유전자 또는 포유류 질병에 연관되는 유전자인 방법.
하기를 포함하는 유전학적으로 변형된 표적 편집 부위를 갖는 진핵 세포의 생성 방법:
(a) 상기 표적 편집 부위 내의 적어도 하나의 엔도뉴클레아제 인식 서열의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 상기 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 제공하는 단계, 및
(b) 적어도 하나의 이중-가닥 DNA 서열을 포함하는 적어도 하나의 공여자 분자를 제공하는 단계로서, (i) 상기 DNA 서열이 표적 편집 부위에 측접한 서열에 대하여 적어도 50개 뉴클레오티드의 길이에 걸쳐 적어도 90%의 상동성을 가지며, (ii) 상기 공여자 서열이 상기 표적 편집 부위와 비교하여 적어도 하나의 변형을 포함하는 단계; 및
(c) (i) 적어도 하나의 단일-가닥 DNA 어닐링 단백질(SSAP), 및
(ii) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 적어도 하나의 엑소뉴클레아제, 및
(iii) 적어도 하나의 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 적어도 하나의 상동성 지정 수선(HDR) 촉진제를 제공하는 단계를 포함함으로써,
상기 적어도 하나의 서열-특이적 엔도뉴클레아제, 상기 적어도 하나의 공여자 분자 및 상기 적어도 하나의 HDR 촉진제가 상기 변형을 상기 진핵 세포의 상기 표적 편집 부위 내로 도입하며;
(d) 상기 표적 편집 부위 내에 변형을 포함하는 진핵 세포를 단리하는 단계.
제144항에 있어서, 상기 변형이 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 결실 또는 하나 이상의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택되는 방법.
제144항에 있어서, 상기 표적 편집 부위의 일부가 상기 표적 편집 부위 내의 2개의 서열 특이적 절단을 사용함으로써 결실되며, 상기 공여자 분자에 의해 제공되는 서열로 대체되는 방법.
제144항 내지 제146항 중 어느 한 항에 있어서, 상기 공여자 서열이 엔도뉴클레아제 인식 서열이 측접된 벡터에 존재하는 방법.
제144항 내지 제147항 중 어느 한 항에 있어서, 상기 변형을 포함하는 진핵 세포를 증식시키는 단계를 추가로 포함하는 방법.
하기의 단계를 포함하는 유전학적으로 변형된 유기체의 생성 방법:
(i) 제144항 내지 제148항 중 어느 한 항에 의해 유전학적으로 변형된 진핵 세포를 생성하는 단계, 및
(ii) 상기 세포를 유기체 내로 재생시키는 단계.
제149항에 있어서, 상기 유기체가 식물 및 비-인간 동물로 이루어진 군으로부터 선택되는 유기체.
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물.
제151항에 있어서, 상기 핵산이 하나 이상의 벡터에 존재하는 조성물.
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 벡터.
제153항에 있어서, 상기 벡터가 공여자 주형 DNA, 서열 특이적 엔도뉴클레아제 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터.
제153항에 있어서, 상기 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 벡터.
제153항에 있어서, 상기 벡터가 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 벡터.
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 진핵 세포를 유전학적으로 엔지니어링하기 위한 사용 설명서를 포함하는 키트.
제157항에 있어서, 상기 키트가 제1 벡터 및 제2 벡터를 포함하며,
i) 상기 제1 벡터가 공여자 주형 DNA 및 서열 특이적 엔도뉴클레아제를 포함하는 핵산을 포함하며, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하며;
ii) 상기 제2 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 키트.
제157항 또는 제158항에 있어서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제를 추가로 포함하는 키트.
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 세포.
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 세포.
제160항 또는 제161항에 있어서, 상기 세포가 식물 또는 포유류 세포인 세포.
제160항 내지 제162항 중 어느 한 항에 있어서, 상기 세포가 숙주 세포인 세포.
제1항 내지 제35항 및 제74항 내지 제149항 중 어느 한 항의 방법에 의해 생성되는 유전학적으로 엔지니어링된 세포.
i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)의 하위세트를 포함하는 표적 편집 부위에서의 유전학적 엔지니어링을 위한 전구 진핵 세포 또는 유기체로서, 상기 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 상기 전구 세포 또는 유기체에 포함되지 않은 i) 내지 v) 중 적어도 하나를 상기 세포 또는 유기체에 제공하는 것이 상기 공여자 주형 분자에 의한 상기 표적 편집 부위의 변형을 초래하는 전구 진핵 세포 또는 유기체.
제165항에 있어서, 상기 공여자 주형이 이중-가닥 DNA 분자인 전구 진핵 세포 또는 유기체.
제165항에 있어서, 상기 세포가 생식선 세포인 전구 세포.
제165항에 있어서, 상기 전구 진핵 세포가 전구 식물 세포이며, 상기 전구 식물 세포 또는 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 형질전환에 의해 공급되는 전구 진핵 세포 또는 유기체.
제165항에 있어서, 상기 유기체가 식물이며, 상기 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 상기 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 제2 식물과의 유성 교배에 의해 공급되는 전구 유기체.
제165항에 있어서, 상기 전구 진핵 세포가 동물 세포이며, 상기 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 트랜스펙션에 의해 공급되는 전구 진핵 세포.
제165항에 있어서, 상기 전구 유기체가 비-인간 동물이며, 상기 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 비-인간 동물과의 유성 교배에 의해 공급되는 전구 유기체.
제153항에 있어서, 상기 서열-특이적 뉴클레아제가 유도성 프로모터에 작동 가능하게 연결된 벡터.
제111항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 닉카제인 방법.