KR20220052905A - 개선된 상동성 의존적 수선 게놈 편집 - Google Patents
개선된 상동성 의존적 수선 게놈 편집 Download PDFInfo
- Publication number
- KR20220052905A KR20220052905A KR1020227002110A KR20227002110A KR20220052905A KR 20220052905 A KR20220052905 A KR 20220052905A KR 1020227002110 A KR1020227002110 A KR 1020227002110A KR 20227002110 A KR20227002110 A KR 20227002110A KR 20220052905 A KR20220052905 A KR 20220052905A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- exonuclease
- cell
- sequence
- stranded dna
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
게놈 편집 분자를 사용하여 표적 편집 부위의 상동성 지정 수선(HDR)의 빈도를 증가시키기 위한 진핵 세포 및 관련 시약, 시스템, 방법 및 조성물이 제공된다.
Description
관련 출원에 관한 상호-참조
본 출원은 2019년 6월 25일자 출원된 미국 가출원 제62/866,317호에 대한 우선권을 주장하며, 이의 내용은 모든 목적을 위하여 그의 전체가 본원에 참조로 포함된다.
ASCII 텍스트 파일 상의 서열 목록의 제출
하기의 ASCII 텍스트 파일 상의 제출의 내용은 그의 전체가 본원에 참조로 포함된다: 컴퓨터 판독 가능한 형태(CRF)의 서열 목록(파일명: 165362000640SEQLIST.TXT, 기록된 날짜: 2020년 6월 24일, 크기: 284 KB).
기술분야
본 출원은 유전자 편집을 위한 방법, 키트 및 조성물에 관한 것이다.
상동성-지정 수선(HDR)은 원하는 대체 서열을 함유하는 제공되는 DNA 주형 유래의 서열로 표적 게놈 DNA 부위를 정확하게 대체하기 위해 사용될 수 있는 게놈 편집 방법이다. HDR의 결과가 꽤 바람직할 수 있지만, 그것은 다수의 이유로 잘 작동하지 않는다. 가장 큰 문제 중 하나는 특히 게놈 내의 표적화된 편집 부위를 절단하는 게놈 편집 분자에 의해 종종 촉발되는 대안적인 비-상동성 말단-연결(NHEJ) 수선 메커니즘과 비교하는 경우, 그의 낮은 전체 발생 빌도이다. 대부분의 세포가 HDR을 매개할 수 있는 몇몇의 경로를 가질 수 있지만, 이들 중 일부는 세포 주기 동안 가장 활성이어서, 전형적인 세포 배양 조건에서 HDR의 성공률을 감소시킨다.
원핵 숙주, 예컨대 에스케리키아 콜라이(E. coli)에서, 상동성 유전자 대체는 박테리오파지 λ 엑소뉴클레아제, 박테리오파지 λ 베타 단백질, 상보적 DNA 가닥의 어닐링을 용이하게 하는 단일-가닥 DNA 어닐링 단백질(SSAP) 및 DNA 주형을 포함하는 박테리오파지 λ 레드 상동성 재조합 시스템을 사용하여 시행될 수 있다(문헌[Murphy, 2016]). 박테리오파지 λ 레드 상동성 재조합 시스템을 원핵생물에서의 CRISPR-Cas9 시스템과 조합하여, 박테리아 게놈 내의 표적 서열에서 재조합을 시행한 바 있다(문헌[Jiang et al., 2013]; 문헌[Wang et al., 2016]).
대조군과 비교하여 상동성-지정 수선(HDR)에 의하여 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 증가된 변형 빈도를 제공할 수 있는 방법, 시스템, 진핵 세포(예를 들어, 식물 세포 또는 포유류 세포) 및 조성물(예를 들어, 세포 배양 조성물, 핵산, 벡터, 키트 또는 세포)이 본원에 개시된다. 이러한 증가된 HDR의 빈도를 제공할 수 있는 이러한 방법, 시스템, 진핵 세포(예를 들어, 식물 세포 또는 포유류 세포) 및 조성물(예를 들어, 세포 배양 조성물, 핵산, 벡터, 키트 또는 세포)의 특징은 진핵 세포 게놈 내의 표적 편집 부위를 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자와 조합하여, 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제의 제공을 포함한다. 특정 구현예에서, 공여자 주형 DNA 분자는 엔도뉴클레아제 인식 서열의 카피가 측접된다.
본원에 제공되는 방법은 하기를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형의 증가 방법을 포함한다: 게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공함으로써; 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계.
본원에 제공되는 방법은 또한, 하기를 포함하는 게놈 변형을 갖는 진핵 세포의 제조 방법을 포함한다: 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 진핵 세포에 제공함으로써; 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계; 및 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시키는 단계.
본원에 제공되는 시스템은
(a) 진핵 세포;
(b) 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제; 및
(c) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자(들)를 포함하는, 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 시스템을 포함하며; 진핵 세포는 유효량의 HDR 촉진제 및 게놈 편집 분자(들)와 회합되고/되거나, 이와 접촉하고/하거나, 이를 함유한다.
본원에 제공되는 방법은 또한, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 진핵 세포에 제공하는 단계를 포함하는 진핵 세포의 유전학적 엔지니어링 방법을 포함하며, 세포의 표적 편집 부위는 공여자 주형 DNA 분자에 의해 변형된다.
본원에 제공되는 방법은 또한, (a) 표적 편집 부위 내의 적어도 하나의 엔도뉴클레아제 인식 서열의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 상기 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 제공하는 단계, 및 (b) 적어도 하나의 이중-가닥 DNA 서열을 포함하는 적어도 하나의 공여자 분자를 제공하는 단계로서, (i) 상기 DNA 서열이 표적 편집 부위에 측접한 서열에 대하여 적어도 50개 뉴클레오티드의 길이에 걸쳐 적어도 90%의 상동성을 가지며, (ii) 상기 공여자 서열이 상기 표적 편집 부위에 비하여 적어도 하나의 변형을 포함하는 단계; 및 (c) (i) 적어도 하나의 단일-가닥 DNA 어닐링 단백질(SSAP), 및 (ii) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 적어도 하나의 엑소뉴클레아제, 및 (iii) 적어도 하나의 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 적어도 하나의 상동성 지정 수선(HDR) 촉진제를 제공하는 단계를 포함함으로써, 적어도 하나의 서열-특이적 엔도뉴클레아제, 적어도 하나의 공여자 분자 및 적어도 하나의 HDR 촉진제가 상기 진핵 세포의 상기 표적 편집 부위 내로 상기 변형을 도입하며; (d) 상기 표적 편집 부분 내에 변형을 포함하는 진핵 세포를 단리하는 단계를 포함하는 유전학적으로 변형된 표적 편집 부위를 갖는 진핵 세포의 생성 방법을 포함한다.
본원에 제공되는 조성물은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물을 포함한다.
본원에 제공되는 벡터는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 벡터를 포함한다.
본원에 제공되는 키트는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 진핵 세포를 유전학적으로 엔지니어링하기 위한 사용 설명서를 포함하는 키트를 포함한다.
본원에 제공되는 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 세포를 포함한다.
본원에 제공되는 세포는 또한, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)의 하위세트를 포함하는, 표적 편집 부위에서의 유전학적 엔지니어링을 위한 전구 진핵 세포 또는 유기체를 포함하며, 세포는 i) 내지 v) 중 적어도 하나를 포함하지 않고, 전구 세포 또는 유기체에 포함되지 않은 i) 내지 v) 중 적어도 하나를 세포 또는 유기체에 제공하는 것은 공여자 주형 분자에 의한 표적 편집 부위의 변형을 초래한다.
도 1은 벡터 pRS08t의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 발현 카세트(아라비돕시스 탈리아나(A. thaliana) U6 프로모터(AtU6), 가이드 RNA를 인코딩하는 서열, 및 35S 프로모터), mGFP6 서열, 완두 rbcS E9 종결인자, ANT1 공여자 주형, 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 2는 벡터 pRS045의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 앰피실린 저항성 마커(AmpR), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 핵 국소화 서열(NLS), 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타(Red Beta) CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소(Red Exo) CDS)에 융합된 c2 NLS, 및 35S 종결인자), 및 pUC 복제 원점(pUC ori)을 포함한다.
도 3은 벡터 pAP046의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(hammerhead; HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 35S 종결인자), ANT1 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 4는 벡터 pRS148의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자) 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 5는 벡터 pRS192의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS, 및 35S 종결인자), ANT1 공여자 주형 및 앰피실린 저항성 마커(AmpR)를 포함한다.
도 6은 벡터 pTC801의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(옥수수 유비퀴틴(ubiquitin)(ZmUbi) 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA 1 및 2를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(오리자 사티바(Oryza sativa) 액틴(OsActin) 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 파니쿰 비르가툼(Panicum virgatum) 유비퀴틴(PvUbi1) 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, 완두 rbcS E9 종결인자, 오리자 사티바 유비퀴틴(OsUB1) 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 담배 익스텐신(extensin)(NtEXT) 종결인자), SPX 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 7은 벡터 pAB156의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 카나마이신 저항성 마커(KanR), 좌측 T-DNA 경계(border), 하이그로마이신 저항성 카세트(2x 35S 프로모터, 하이그로마이신 포스포트랜스퍼라제(hygR) 코딩 서열 및 35S 종결인자), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 가이드 RNA를 인코딩하는 서열, 해머헤드(HH) 리보자임을 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi4 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, AtUbi10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, 완두 rbcS E9 종결인자, HaUbiCh4 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 Ext3' 종결인자), GFP 공여자 주형, 우측 T-DNA 경계 및 pVS1 유래의 STA 영역을 포함한다.
도 8은 슈퍼바이너리(superbinary) T-DNA 벡터 pIN1757(하측) 및 pIN1576(상측)의 설계된 삽입 영역의 개략도를 보여준다. pIN1757은 좌측 T-DNA 경계, NOS 종결인자, 글루포시네이트 선택을 위한 PAT, 35S 프로모터, Cas 발현 카세트(옥수수 유비퀴틴(ZmUbi) 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 발현 카세트(밀 U6(TaU6) 프로모터, 가이드 RNA(Gln1-3 Pro-2)를 인코딩하는 서열 및 Pol III 종결인자), Gln1-3 공여자 주형 및 우측 T-DNA 경계를 포함한다. 또한, 벡터 pIN1756는 HDR 촉진제 발현 카세트(오리자 사티바 액틴(OsActin 프로모터 + 인트론) 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(SSB), 완두 3A 종결인자; 파니쿰 비르가툼 유비퀴틴(PvUbi1 프로모터 + 인트론) 프로모터, SSAP 코딩 서열(베타), 완두 rbcS E9 종결인자; 오리자 사티바 유비퀴틴(OsUB1) 프로모터, 엑소뉴클레아제 코딩 서열(엑소) 및 담배 익스텐신(NtEXT) 종결인자)를 포함한다.
도 9a 및 도 9b는 토마토 떡잎을 형질전환시키기 위한 벡터 및 발현 카세트의 개략도를 보여준다. 도 9a는 벡터 pIN1705의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 카나마이신 저항성 마커(KanR), 좌측 T-DNA 경계, 5-에놀피루빌시키메이트-3-포스페이트(EPSPS) 신타제 발현 카세트(즉, 아라비돕시스 탈리아나 유비퀴틴 프로모터(AtUbi10) 및 완두 rbcS E9 종결인자의 제어 하의 EPSPS 코딩 서열(CDS)), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열, 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 35S 종결인자), ANT1 공여자 주형, 우측 T-DNA 경계, pVS1 유래의 STA 영역, pVS1 복제 원점(ori) 및 복제 원점(ori)을 포함한다. 도 9b는 토마토 떡잎의 게놈 내로의 염색체 통합을 위한 아그로박테리움(Agrobacterium) T-DNA 벡터의 좌측과 우측 경계 사이의 영역의 개략도를 보여준다. 상측에서 하측으로, pIN1703, pIN1704 및 pIN1705 벡터의 영역이 나타나 있다. CS는 절단 부위를 나타내며, EPSPS는 EPSPS 발현 카세트를 나타내며, CasS는 Cas 발현 카세트를 나타내며, ANT1 공여자는 공여자 주형을 나타내며, HDR 작용제는 SSAP, SSB 및 엑소뉴클레아제를 인코딩하는 HDR 촉진제 발현 카세트를 나타내며, GFP는 녹색 형광 단백질 코딩 서열을 나타낸다.
도 10은 인간에서의 발현을 위한 벡터의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(CAG 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 토끼 베타-글로빈(rb 글로빈) 종결인자), 가이드 RNA 발현 카세트(호모 사피엔스(H. sapiens) U6(HsU6) 프로모터, 가이드 RNA를 인코딩하는 서열), HDR 촉진제 발현 카세트(호모 사피엔스 EF1a 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 연결된 SV40 NLS, 인간 성장 호르몬(hGH) 종결인자, 호모 사피엔스 ACTB(hACTB) 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 연결된 SV40 NLS, 소 성장 호르몬(bGH) 종결인자, CMV 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 연결된 SV40 NLS 및 SV40 폴리A 신호), EMX1 FRT 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 2는 벡터 pRS045의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 앰피실린 저항성 마커(AmpR), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 핵 국소화 서열(NLS), 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타(Red Beta) CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소(Red Exo) CDS)에 융합된 c2 NLS, 및 35S 종결인자), 및 pUC 복제 원점(pUC ori)을 포함한다.
도 3은 벡터 pAP046의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(hammerhead; HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 35S 종결인자), ANT1 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 4는 벡터 pRS148의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자) 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 5는 벡터 pRS192의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS, 및 35S 종결인자), ANT1 공여자 주형 및 앰피실린 저항성 마커(AmpR)를 포함한다.
도 6은 벡터 pTC801의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(옥수수 유비퀴틴(ubiquitin)(ZmUbi) 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA 1 및 2를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(오리자 사티바(Oryza sativa) 액틴(OsActin) 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 파니쿰 비르가툼(Panicum virgatum) 유비퀴틴(PvUbi1) 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, 완두 rbcS E9 종결인자, 오리자 사티바 유비퀴틴(OsUB1) 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 담배 익스텐신(extensin)(NtEXT) 종결인자), SPX 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
도 7은 벡터 pAB156의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 카나마이신 저항성 마커(KanR), 좌측 T-DNA 경계(border), 하이그로마이신 저항성 카세트(2x 35S 프로모터, 하이그로마이신 포스포트랜스퍼라제(hygR) 코딩 서열 및 35S 종결인자), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 가이드 RNA를 인코딩하는 서열, 해머헤드(HH) 리보자임을 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열 및 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi4 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, AtUbi10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, 완두 rbcS E9 종결인자, HaUbiCh4 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 Ext3' 종결인자), GFP 공여자 주형, 우측 T-DNA 경계 및 pVS1 유래의 STA 영역을 포함한다.
도 8은 슈퍼바이너리(superbinary) T-DNA 벡터 pIN1757(하측) 및 pIN1576(상측)의 설계된 삽입 영역의 개략도를 보여준다. pIN1757은 좌측 T-DNA 경계, NOS 종결인자, 글루포시네이트 선택을 위한 PAT, 35S 프로모터, Cas 발현 카세트(옥수수 유비퀴틴(ZmUbi) 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 발현 카세트(밀 U6(TaU6) 프로모터, 가이드 RNA(Gln1-3 Pro-2)를 인코딩하는 서열 및 Pol III 종결인자), Gln1-3 공여자 주형 및 우측 T-DNA 경계를 포함한다. 또한, 벡터 pIN1756는 HDR 촉진제 발현 카세트(오리자 사티바 액틴(OsActin 프로모터 + 인트론) 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(SSB), 완두 3A 종결인자; 파니쿰 비르가툼 유비퀴틴(PvUbi1 프로모터 + 인트론) 프로모터, SSAP 코딩 서열(베타), 완두 rbcS E9 종결인자; 오리자 사티바 유비퀴틴(OsUB1) 프로모터, 엑소뉴클레아제 코딩 서열(엑소) 및 담배 익스텐신(NtEXT) 종결인자)를 포함한다.
도 9a 및 도 9b는 토마토 떡잎을 형질전환시키기 위한 벡터 및 발현 카세트의 개략도를 보여준다. 도 9a는 벡터 pIN1705의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 카나마이신 저항성 마커(KanR), 좌측 T-DNA 경계, 5-에놀피루빌시키메이트-3-포스페이트(EPSPS) 신타제 발현 카세트(즉, 아라비돕시스 탈리아나 유비퀴틴 프로모터(AtUbi10) 및 완두 rbcS E9 종결인자의 제어 하의 EPSPS 코딩 서열(CDS)), Cas 발현 카세트(토마토 SlUBI10 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 HSP 종결인자), 가이드 RNA 및 리보자임 발현 카세트(35S 프로모터, 해머헤드(HH) 리보자임을 인코딩하는 서열, 가이드 RNA를 인코딩하는 서열, 델타 간염 바이러스(HDV) 리보자임을 인코딩하는 서열, 35S 종결인자), HDR 촉진제 발현 카세트(PcUbi 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 융합된 c2 NLS, 완두 3A 종결인자, 토마토 SlUBI10 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 융합된 c2 NLS, HSP 종결인자, 2x 35S 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 융합된 c2 NLS 및 35S 종결인자), ANT1 공여자 주형, 우측 T-DNA 경계, pVS1 유래의 STA 영역, pVS1 복제 원점(ori) 및 복제 원점(ori)을 포함한다. 도 9b는 토마토 떡잎의 게놈 내로의 염색체 통합을 위한 아그로박테리움(Agrobacterium) T-DNA 벡터의 좌측과 우측 경계 사이의 영역의 개략도를 보여준다. 상측에서 하측으로, pIN1703, pIN1704 및 pIN1705 벡터의 영역이 나타나 있다. CS는 절단 부위를 나타내며, EPSPS는 EPSPS 발현 카세트를 나타내며, CasS는 Cas 발현 카세트를 나타내며, ANT1 공여자는 공여자 주형을 나타내며, HDR 작용제는 SSAP, SSB 및 엑소뉴클레아제를 인코딩하는 HDR 촉진제 발현 카세트를 나타내며, GFP는 녹색 형광 단백질 코딩 서열을 나타낸다.
도 10은 인간에서의 발현을 위한 벡터의 개략도를 보여준다. 염기쌍 길이는 벡터의 외측의 표지에 의해 나타나 있다. 염기쌍 1에서 시작하여, 벡터는 고 카피수 복제 원점(High Copy Ori), Cas 발현 카세트(CAG 프로모터, Cas 뉴클레아제 코딩 서열(Cas 뉴클레아제 CDS) 및 토끼 베타-글로빈(rb 글로빈) 종결인자), 가이드 RNA 발현 카세트(호모 사피엔스(H. sapiens) U6(HsU6) 프로모터, 가이드 RNA를 인코딩하는 서열), HDR 촉진제 발현 카세트(호모 사피엔스 EF1a 프로모터, 에스케리키아 콜라이 SSB 코딩 서열(에스케리키아 콜라이 SSB CDS)에 연결된 SV40 NLS, 인간 성장 호르몬(hGH) 종결인자, 호모 사피엔스 ACTB(hACTB) 프로모터, SSAP 코딩 서열(레드 베타 CDS)에 연결된 SV40 NLS, 소 성장 호르몬(bGH) 종결인자, CMV 프로모터, 엑소뉴클레아제 코딩 서열(레드 엑소 CDS)에 연결된 SV40 NLS 및 SV40 폴리A 신호), EMX1 FRT 공여자 주형 및 스펙티노마이신 저항성 마커(SpnR)를 포함한다.
I. 정의
달리 언급되지 않는 한, 본 명세서의 본문에서 핵산 서열은 좌측에서 우측으로 읽는 경우 5'에서 3' 방향으로 제공된다. 핵산 서열은 명시된 바와 같이 DNA로서 또는 RNA로서 제공될 수 있으며; 당업자에게 알려져 있는 바와 같이, 하나의 개시는 다른 하나를 반드시 정의할 뿐만 아니라 정확한 상보물을 반드시 정의한다. 용어가 단수로 제공되는 경우, 본 발명자들은 또한 복수의 상기 용어에 의해 설명되는 구현예를 고려한다.
본원에 사용되는 바와 같은 어구 "대립유전자 변이체"는 제공된 유기체의 상이한 스트레인(strain), 변종 또는 단리주에서 발생하는 폴리뉴클레오티드 또는 폴리펩티드 서열 변이체를 나타낸다.
본원에 사용되는 경우 용어 "및/또는"은 다른 하나와 함께 또는 이것 없이 2개의 지정된 특징 또는 성분의 각각의 구체적인 개시로 간주되어야 한다. 따라서, 본원에서 "A 및/또는 B"와 같은 어구에서 사용되는 용어 "및/또는"은 "A 및 B", "A 또는 B", "A"(단독) 및 "B"(단독)를 포함하는 것으로 의도된다. 마찬가지로, "A, B 및/또는 C"와 같은 어구에서 사용되는 용어 "및/또는"은 하기의 구현예의 각각을 포함하는 것으로 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A(단독); B(단독); 및 C(단독).
본원에 사용되는 바와 같이, 용어 "Cpf1" 및 "Cas12a"는 동일한 RNA 지정 뉴클레아제를 나타내기 위해 본원에서 상호교환 가능하게 사용된다.
본원에 사용되는 바와 같이, 어구 "게놈-편집 분자"는 엔도뉴클레아제 인식 부위에서 적어도 하나의 DNA 서열을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제(들) 또는 서열-특이적 엔도뉴클레아제(들)를 인코딩하는 폴리뉴클레오티드(들)를 나타낸다.
본원에 사용되는 바와 같이, "외인성" 작용제 또는 분자는 시스템, 조성물, 진핵 또는 식물 세포 배양물, 반응 시스템 또는 진핵 또는 식물 세포에 제공되거나, 그 내로 도입되는 외부 공급원 유래의 임의의 작용제 또는 분자를 나타낸다. 특정 구현예에서, 외부 공급원 유래의 외인성 작용제(예를 들어, 폴리뉴클레오티드, 단백질 또는 화합물)는 또한, 진핵 또는 식물 세포에서 관찰되는 작용제일 수 있다. 특정 구현예에서, 외부 공급원 유래의 외인성 작용제(예를 들어, 폴리뉴클레오티드, 단백질 또는 화합물)는 진핵 또는 식물 세포에 대하여 이종인 작용제일 수 있다.
본원에 사용되는 바와 같이, "이종" 작용제 또는 분자는 (i) 야생형, 비처리 또는 자연 발생 조성물, 진핵 세포 또는 식물 세포에서 관찰되지 않는 임의의 작용제 또는 분자; 및/또는 (ii) 서열이 자연에서 발생하는 것 이외의 상황에서, 예를 들어, 게놈 또는 벡터에 위치하는 폴리뉴클레오티드 또는 펩티드 서열을 나타낸다. 예를 들어, 프로모터가 자연에서 작동 가능하게 연결된 유전자 이외의 유전자에 작동 가능하게 연결된 프로모터는 이종 프로모터이다.
본원에 사용되는 바와 같이, 용어 "포함하다", "포함한다" 및 "포함하는"은 임의의 추가의 비특정된 특징을 배제하지 않으면서 적어도 그들이 언급하는 특징을 갖는 것으로 해석되어야 한다.
본원에 사용되는 바와 같은 용어 "상동성 재조합"은 상동성 부위에서 2개의 DNA 분자 사이의 DNA 단편의 교환을 나타낸다. 상동성 재조합의 빈도는 다수의 요인에 의해 영향을 받는다. 상이한 유기체는 상동성 재조합의 양 및 상동성 대 비-상동성 재조합의 상대적인 비에 관하여 다양하다. 일반적으로, 상동성 영역의 길이는 상동성 재조합 이벤트의 빈도에 영향을 미친다: 상동성의 영역이 더 길수록 빈도가 더 크다. 상동성 재조합을 관찰하는 데 필요한 상동성 영역의 길이도 또한, 종-가변적이다. 많은 경우에, 적어도 5 kb의 상동성이 사용되어 왔지만, 상동성 재조합은 25 bp 내지 50 bp만큼 적은 상동성에서 관찰된 바 있다.
본원에 사용되는 바와 같이, 상동성-지정 수선(HDR)은 제공된 공여자 서열을 혼입시킴으로써 표적 편집 부위의 정확한 편집을 초래하는 DNA 수선 방법을 의미한다.
본원에 사용되는 바와 같이, "HDR의 빈도", "HDR 빈도" 등과 같은 어구는 분석되는 총 표적-편집 부위 수와 비교하여 표적 편집 부위에서의 HDR-매개된 이벤트의 수를 지칭한다. 총 표적 편집 부위 수는 (a) NHEJ-매개된 이벤트를 갖는 표적 편집 부위; (b) 변화를 갖지 않는 표적 편집 부위; 및 (c) HDR-매개된 이벤트를 갖는 표적 편집 부위의 합이다. HDR-매개된 이벤트는 삽입된 이종 서열, 이종 삽입물에 측접한 상동성 서열 또는 이종 서열과 상동성 서열의 접합부에 위치한 서열에, 임의의 의도되지 않은 뉴클레오티드 삽입, 결실 또는 치환을 함유하지 않는 표적 편집 부위 내로의 이종 서열의 정확한 삽입을 포함한다.
본원에 사용되는 바와 같이, 어구 "진핵 세포"는 핵을 함유하는 임의의 세포를 지칭하며, 이에 따라, 포유류(예를 들어, 인간, 가축 및 반려 동물 세포), 곤충 세포, 파충류 세포, 식물 세포(예를 들어, 외떡잎 및 쌍떡잎 식물 세포), 효모 세포 및 진균 세포(예를 들어, 사상 및 비-사상 진균)를 포함한다.
"변형된 뉴클레오티드" 또는 "편집된 뉴클레오티드"는 그의 비-변형된 뉴클레오티드 서열과 비교하는 경우 적어도 하나의 변경을 포함하는 관심 뉴클레오티드 서열을 나타낸다. 이러한 "변경"은 예를 들어, (i) 적어도 하나의 뉴클레오티드의 대체, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
본원에 사용되는 바와 같이, 어구 "식물 세포"는 식물 세포벽을 갖는 식물 세포 또는 식물 세포벽이 결여된 식물 세포 원형질체를 지칭할 수 있다.
본원에 사용되는 경우, 용어 "폴리뉴클레오티드"는 둘(2) 이상의 뉴클레오티드 잔기를 함유하는 핵산 분자이다. 폴리뉴클레오티드는 일반적으로 단일- 또는 이중-가닥으로서 기술된다. 폴리뉴클레오티드가 분자내 또는 분자간 혼성화에 의해 형성되는 이중-가닥 영역을 함유하는 경우, 각각의 이중-가닥 영역의 길이는 편리하게 염기쌍의 수에 관하여 기술된다. 본원에 제공되는 시스템, 방법 및 조성물의 구현예는 (i) 2 내지 25개 잔기 길이의 하나 이상의 폴리뉴클레오티드, 26개 초과의 잔기 길이의 하나 이상의 폴리뉴클레오티드 또는 둘 모두의 혼합물을 사용하거나 이를 포함할 수 있다. 폴리뉴클레오티드는 단일- 또는 이중-가닥 RNA, 단일- 또는 이중-가닥 DNA, 이중-가닥 DNA/RNA 혼성물, 그의 화학적으로 변형된 유사체 또는 그의 혼합물을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 리보뉴클레오티드 및 데옥시리보뉴클레오티드의 조합(예를 들어, 주로 리보뉴클레오티드로 이루어지지만 하나 이상의 말단 데옥시리보뉴클레오티드를 갖는 합성 폴리뉴클레오티드 또는 주로 데옥시리보뉴클레오티드로 이루어지지만, 하나 이상의 말단 디데옥시리보뉴클레오티드를 갖는 합성 폴리뉴클레오티드)을 포함할 수 있거나, 비-정규 뉴클레오티드, 예컨대 이노신, 티오우리딘 또는 슈도우리딘을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 화학적으로 변형된 뉴클레오티드를 포함한다(예를 들어, 문헌[Verma and Eckstein (1998) Annu. Rev. Biochem., 67:99-134] 참조). 본원에 제공되는 폴리뉴클레오티드에 사용될 수 있는 화학적으로 변형된 뉴클레오티드는 (i) 포스포디에스테르 백본의 포스포로티오에이트, 포스포로디티오에이트 또는 메틸포스포네이트 뉴클레오티드간 연결기 변형; (ii) 변형된 염기 및/또는 변형된 당을 포함하는 뉴클레오시드; 및/또는 (iii) 형광 모이어티(예를 들어, 플루오레세인 또는 로다민 또는 형광 공명 에너지 전달 또는 발색단 표지의 FRET 쌍) 또는 기타 표지(예를 들어, 비오틴 또는 동위원소)를 포함하는 검출 가능한 표지를 포함한다. 본원에 제공되거나 사용되는 폴리뉴클레오티드는 또한, 변형된 핵산, 특히 변형된 RNA를 포함하며, 이는 본원에 그의 전체가 참조로 포함되는 미국 특허 제9,464,124호에 개시되어 있다.
"재조합 AAV 벡터(rAAV 벡터)"는 적어도 하나의, 일부 구현예에서, 2개의 AAV 역위 말단 반복 서열(ITR)이 측접한 하나 이상의 이종 서열(즉, AAV 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 이러한 rAAV 벡터는 적합한 헬퍼 바이러스로 감염된(또는 적합한 헬퍼 기능을 발현하는) 및 AAV rep 및 cap 유전자 생성물(즉, AAV Rep 및 Cap 단백질)을 발현하는 숙주 세포에 존재하는 경우에 복제되고 감염성 바이러스 입자 내로 패키징될 수 있다. rAAV 벡터가 더 큰 폴리뉴클레오티드 내로(예를 들어, 염색체 내에 또는 또 다른 벡터, 예컨대 클로닝 또는 트랜스펙션을 위해 사용되는 플라스미드 내에) 혼입되는 경우, rAAV 벡터는 "프로-벡터"로 지칭될 수 있으며, 이는 AAV 패키징 기능 및 적합한 헬퍼 기능의 존재 하에 복제 및 캡슐화에 의해 "구제"될 수 있다. rAAV 벡터는 플라스미드, 선형 인공 염색체, 지질과 복합체화된 것, 리포좀 내에 캡슐화된 것, 및 바이러스 입자, 특히 AAV 입자에 캡슐화된 것을 포함하지만 이에 제한되지 않는 임의의 다수의 형태로 존재할 수 있다. rAAV 벡터를 AAV 바이러스 캡시드 내로 패키징하여, "재조합 아데노-연관 바이러스 입자(rAAV 입자)"를 생성할 수 있다.
"재조합 아데노바이러스 벡터"는 적어도 하나의 아데노바이러스 역위 말단 반복 서열(ITR)이 측접한 하나 이상의 이종 서열(즉, 아데노바이러스 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 일부 구현예에서, 재조합 핵산은 2개의 역위 말단 반복 서열(ITR)이 측접된다. 이러한 재조합 바이러스 벡터는 재조합 바이러스 게놈으로부터 결실된 필수 아데노바이러스 유전자(예를 들어, El 유전자, E2 유전자, E4 유전자 등)를 발현하는 숙주 세포에 존재하는 경우, 복제되고, 감염성 바이러스 입자 내로 패키징될 수 있다. 재조합 바이러스 벡터가 더 큰 폴리뉴클레오티드 내로(예를 들어, 염색체 내에 또는 또 다른 벡터, 예컨대 클로닝 또는 트랜스펙션을 위해 사용되는 플라스미드 내에) 혼입되는 경우, 재조합 바이러스 벡터는 "프로-벡터"로 지칭될 수 있으며, 이는 아데노바이러스 패키징 기능의 존재 하에 복제 및 캡슐화에 의해 "구제"될 수 있다. 재조합 바이러스 벡터는 플라스미드, 선형 인공 염색체, 지질과 복합체화된 것, 리포좀 내에 캡슐화된 것, 및 바이러스 입자, 예를 들어, 아데노바이러스 입자에 캡슐화된 것을 포함하지만 이에 제한되지 않는 임의의 다수의 형태로 존재할 수 있다. 재조합 바이러스 벡터를 아데노바이러스 바이러스 캡시드 내로 패키징하여, "재조합 아데노바이러스 입자"를 생성할 수 있다.
"재조합 렌티바이러스 벡터"는 적어도 하나의 렌티바이러스 말단 반복 서열(LTR)이 측접한 하나 이상의 이종 서열(즉, 렌티바이러스 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 일부 구현예에서, 재조합 핵산은 2개의 렌티바이러스 말단 반복 서열(LTR)이 측접된다. 이러한 재조합 바이러스 벡터는 적합한 헬퍼 기능으로 감염된 숙주 세포에 존재하는 경우 복제되고 감염성 바이러스 입자 내로 패키징될 수 있다. 재조합 렌티바이러스 벡터를 렌티바이러스 캡시드 내로 패키징하여, "재조합 렌티바이러스 입자"를 생성할 수 있다.
"재조합 단순 헤르페스 벡터(재조합 HSV 벡터)"는 HSV 말단 반복 서열이 측접된 하나 이상의 이종 서열(즉, HSV 기원이 아닌 핵산 서열)을 포함하는 폴리뉴클레오티드 벡터를 지칭한다. 이러한 재조합 바이러스 벡터는 적합한 헬퍼 기능으로 감염된 숙주 세포에 존재하는 경우 복제되고 감염성 바이러스 입자 내로 패키징될 수 있다. 재조합 바이러스 벡터가 더 큰 폴리뉴클레오티드 내로(예를 들어, 염색체 내에 또는 또 다른 벡터, 예컨대 클로닝 또는 트랜스펙션을 위해 사용되는 플라스미드 내에) 혼입되는 경우, 재조합 바이러스 벡터는 "프로-벡터"로 지칭될 수 있으며, 이는 HSV 패키징 기능의 존재 하에 복제 및 캡슐화에 의해 "구제"될 수 있다. 재조합 바이러스 벡터는 플라스미드, 선형 인공 염색체, 지질과 복합체화된 것, 리포좀 내에 캡슐화된 것, 및 바이러스 입자, 예를 들어, HSV 입자에 캡슐화된 것을 포함하지만 이에 제한되지 않는 임의의 다수의 형태로 존재할 수 있다. 재조합 바이러스 벡터를 HSV 캡시드 내로 패키징하여, "재조합 단순 헤르페스 바이러스 입자"를 생성할 수 있다.
본원에 사용되는 바와 같이, 어구 "표적 편집 부위"는 공여자 핵산에 의해 변형된 DNA 서열을 지칭한다.
본원에 사용되는 바와 같이, 어구 "표적 유전자"는 본원에 제공되는 시스템, 방법, 조성물 및/또는 진핵 세포에 제공되는 유전자 편집 분자에 의해 변형될 게놈에 위치한 유전자를 지칭할 수 있다. 표적 유전자의 구현예는 (단백질-) 코딩 서열, 비-코딩 서열, 및 코딩 및 비-코딩 서열의 조합을 포함한다. 표적 유전자의 변형은 전사 인핸서 또는 프로모터, 5' 또는 3' 비번역 영역, 성숙 또는 전구 RNA 코딩 서열, 인트론, 스플라이스 공여자 및/또는 수여자, 단백질 코딩 서열, 폴리아데닐화 부위 및/또는 전사 종결인자를 포함하는 유전자의 하나 이상의 요소 내의 뉴클레오티드 치환, 삽입 및/또는 결실을 포함한다. 특정 구현예에서, 이배체 또는 배수체 식물 세포 내의 제공되는 표적 유전자의 모든 카피 또는 모든 대립유전자는 식물 세포에서 변형된 표적 유전자의 동형접합성을 제공하도록 변형된다. 원하는 형질이 유전자 편집에 의해 표적 유전자 내로 도입된 기능 상실 돌연변이에 의해 부여되는 구현예들에서, 식물 세포, 식물 세포의 집단, 식물 또는 종자는 기능 상실 돌연변이를 갖는 변형된 표적 유전자에 대하여 동형접합성이다. 다른 구현예에서, 제공되는 표적 유전자의 카피 또는 대립유전자의 하위세트만이 변형되어, 식물 세포에서 이형접합성의 변형된 표적 유전자를 제공한다. 원하는 형질이 유전자 편집에 의해 표적 유전자 내로 도입된 우성 돌연변이에 의해 부여되는 특정 구현예에서, 식물 세포, 식물 세포의 집단, 식물 또는 종자는 우성 돌연변이를 갖는 변형된 표적 유전자에 대하여 이형접합성이다. 이러한 변형에 의해 특정 식물 표적 유전자에 부여되는 형질은 전부 변형이 결여된 대조군 식물에 비하여, 개선된 수율, 곤충, 진균, 박테리아 병원체 및/또는 선충류에 대한 저항성, 제초제 내성, 무생물 스트레스 내성(예를 들어, 내건성, 내한성, 내염성 및/또는 내열성), 단백질 양 및/또는 질, 전분 양 및/또는 질, 지질 양 및/또는 질, 이차 대사산물 양 및/또는 질 등을 포함한다. 본원에 제공되는 시스템, 방법, 조성물 및/또는 식물 세포에 제공되는 유전자 편집 분자에 의해 변형된 게놈을 갖는 식물은, 게놈 영역의 원치 않는 및 무작위 교환뿐만 아니라, 게놈 내의 무작위 유사분열 또는 감수분열에 의해 생성된 유전학적 및 후성적 변화가 전형적으로 교배 동안 발생하고 이어서 자손 식물에서 발견되는 전통적인 육종(즉, 부모 수그루 및 부모 암그루의 교배)에 의해 변형된 게놈을 갖는 식물과 상이하다. 따라서, 변형된 게놈을 갖는 식물(또는 식물 세포)의 구현예에서, 변형된 게놈은 원래(비변형) 게놈과 99.9% 초과로 동일하다. 구현예들에서, 변형된 게놈은 원래(비변형) 게놈에 비하여 무작위 유사분열 또는 감수분열에 의해 생성된 유전학적 및 후성적 변화가 없다. 구현예들에서, 변형된 게놈은 원래(비변형) 게놈에 비하여 게놈의 0.01% 미만에서 후성적 변화의 차이를 포함한다. 구현예들에서, 변형된 게놈은 하기를 포함한다: (a) 원래(비변형) 게놈에 비하여 0.01% 미만의 게놈에서의 DNA 메틸화의 차이; 또는 (b) 원래(비변형) 게놈에 비하여 0.005% 미만의 게놈에서의 DNA 메틸화의 차이; 또는 (c) 원래(비변형) 게놈에 비하여 0.001% 미만의 게놈에서의 DNA 메틸화의 차이. 구현예에서, 관심 유전자는 식물 세포 내의 염색체 상에 위치하며, 변형된 게놈은 하기를 포함한다: (a) 원래(비변형) 게놈에 비하여 관심 유전자를 함유하는 염색체 내에 함유되는 게놈의 부분의 0.01% 미만에서의 DNA 메틸화의 차이; 또는 (b) 원래(비변형) 게놈에 비하여 관심 유전자를 함유하는 염색체 내에 함유되는 게놈의 부분의 0.005% 미만에서의 DNA 메틸화의 차이; 또는 (c) 원래(비변형) 게놈에 비하여 관심 유전자를 함유하는 염색체 내에 함유되는 게놈의 부분의 0.001% 미만에서의 DNA 메틸화의 차이. 구현예들에서, 변형된 게놈은 원래(비변형) 게놈에 비하여 복제당 염기쌍당 1 x 10^-8개 돌연변이 이하의 의도하지 않은 변화를 갖는다. 특정 구현예에서, 변형된 게놈은 자연 돌연변이율로 발생할 것보다 더 많지 않은 의도하지 않은 변화를 갖는다. 자연 돌연변이율은 실험적으로 결정될 수 있거나, 문헌에 기술된 바와 같다(문헌[Lynch, M., 2010]; 문헌[Clark et al., 2005]).
본원에 사용되는 바와 같은, "벡터"는 시험관내에서 또는 생체내에서 숙주 세포 내로 전달될 핵산을 포함하는 재조합 플라스미드를 지칭한다.
임의의 전술된 정의가 본원에 참조로 포함된 임의의 특허 또는 비특허 참고문헌, 본원에 인용된 임의의 특허 또는 비특허 참고문헌 또는 다른 곳에서 발견되는 임의의 특허 또는 비특허 참고문헌에 제공된 정의와 일치하지 않는 정도까지, 전술된 정의가 본원에서 사용될 것임을 이해한다.
II. 방법 및 조성물
A. 상동성 지정 수선-매개된 게놈 변형을 증가시키기 위한 방법
HDR 촉진제(SSAP, 엑소뉴클레아제 및 SSB) 및 게놈-편집 분자를 포함하며, 대조군 실험에 비하여 진핵 세포 유전자 편집 실험에서 증가된 상동성 의존성 수선(HDR)의 빈도를 제공하는 다양한 시약, 시스템, 방법 및 조성물이 본원에 제공된다. 특정 구현예에서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 이것이 HDR 촉진제(SSAP, 엑소뉴클레아제 및 SSB) 중 적어도 하나에 노출되지 않는 대조군 방법에 비하여 적어도 2배, 3배, 5배 또는 10배 증가된다. 특정 구현예에서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 이것이 HDR 촉진제(SSAP, 엑소뉴클레아제 및 SSB) 중 적어도 하나에 노출되지 않는 대조군 방법에 비하여 적어도 2배, 3배 또는 5배 내지 약 12배, 15배, 20배, 25배 또는 30배 증가된다. 일부 구현예에서, 본 발명의 방법은 유사분열 또는 감수분열을 겪고 있지 않은 세포 상에서 사용될 수 있다. 일부 구현예에서, 본 발명의 방법은 DNA 복제를 필요로 하지 않는다.
i. 핵 국소화 신호(NLS)
본원에 제공되는 SSAP, 엑소뉴클레아제, SSB 및/또는 유전자 편집 분자를 지향시킬 수 있는 핵 국소화 신호(NLS)는 1부분(monopartite) 및 2부분(bipartite) 핵 국소화 신호를 포함한다(문헌[Kosugi et al., 2009]). 사용될 수 있는 1부분 NLS의 예에는 적어도 4개의 연속 염기성 아미노산을 포함하는 NLS, 예컨대 SV40 대형 T 항원 NLS(PKKKRKV; SEQ ID NO:11) 및 K(K/R)X(K/R) 컨센서스 서열(SEQ ID NO:12)과 함께 오직 3개의 염기성 아미노산을 갖는 또 다른 부류가 포함된다. 본원에 제공된 것에 사용될 수 있는 2부분 NLS의 예에는 (K/R)(K/R)X 10-12(K/R)3/5(SEQ ID NO:13)가 포함되며, (K/R)3/5는 5개의 연속 아미노산 중 적어도 3개의 라이신 또는 아르기닌을 나타낸다. NLS는 또한 LGKR(K/R)(W/F/Y)(SEQ ID NO:14)의 컨센서스 서열을 갖는 식물-특이적 부류 5 NLS를 포함할 수 있다. 사용될 수 있는 구체적인 NLS의 예에는 옥수수 opaque-2 핵 국소화 신호(SEQ ID NO:10), 벤디 황화 잎맥 모자이크 바이러스(BYVMV) c2 NLS(SEQ ID NO:15), 및 연장된 SV40 대형 T 항원 NLS(SEQ ID NO:16)가 추가로 포함된다.
일부 구현예에서, NLS는 포유류(예컨대 인간 NLS)이다. 일부 구현예에서, NLS는 SV40 NLS이다. 일부 구현예에서, NLS는 아미노산 링커를 갖는 SV40 NLS이다. 일부 구현예에서, NLS는 아미노산 서열 MAPKKKRKVGGSGS(SEQ ID NO:148)를 갖는다.
특정 구현예에서, NLS 요소 또는 기타 원하는 요소(예를 들어, 에피토프 태그)는 요소 및 도메인의 직접적인 공유적 연결을 통해 또는 링커 펩티드 또는 유연성 힌지 폴리펩티드의 이용에 의해 본원에 제공되는 SSAP, 엑소뉴클레아제, SSB 및/또는 유전자 편집 분자에 작동 가능하게 연결될 수 있다. 유연성 힌지 폴리펩티드는 글리신-풍부 또는 글리신/세린 함유 펩티드 서열을 포함한다. 이러한 서열은 (Gly4)n 서열, (Gly4Ser)n 서열, Ser(Gly4Ser)n 서열, 그의 조합 및 그의 변이체를 포함할 수 있지만, 이에 한정되지 않으며, n은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10과 동일한 양의 정수이다. 특정 구현예에서, 이러한 글리신-풍부 또는 글리신/세린 함유 힌지 펩티드는 또한, 유연성을 위한 트레오닐 및/또는 알라닐 잔기뿐만 아니라 극성 라이실 및/또는 글루타밀 잔기를 함유할 수 있다. 사용될 수 있는 힌지 펩티드의 다른 예에는 면역글로불린 힌지 펩티드가 포함된다(문헌[Vidarsson et al., 2014]).
다양한 세포-투과 펩티드(CPP)가 또한, 본원에 제공되는 SSAP, 엑소뉴클레아제, SSB 및/또는 유전자 편집 분자에 사용될 수 있다. 사용될 수 있는 CPP에는 최소 운데카펩티드(undecapeptide) 단백질 형질도입 도메인(YGRKKRRQRRR을 포함하는 HIV-1 TAT의 잔기 47 내지 57에 해당; SEQ ID NO:17); 세포 내로의 직접적인 유입에 충분한 수의 아르기닌(예를 들어, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 10개 내지 50개의 아르기닌)을 포함하는 폴리아르기닌 서열; VP22 도메인(문헌[Zender et al. (2002) Cancer Gene Ther. 9(6):489-96]); 드로소필라 안테나페디아(Drosophila Antennapedia) 단백질 형질도입 도메인(문헌[Noguchi et al. (2003) Diabetes 52(7): 1732-1737]); 절단된 인간 칼시토닌 펩티드(문헌[Trehin et al. (2004) Pharm. Research 21: 1248-1256]); 폴리라이신(문헌[Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008]); RRQRRTSKLMKR(SEQ ID NO:18); 트랜스포탄(Transportan)(예를 들어, GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:19); KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:20); 및 RQIKIWFQNRRMKWKK(SEQ ID NO:21)가 포함된다. 예시적인 CPP 아미노산 서열에는 또한, YGRKKRRQRRR(SEQ ID NO:22); RKKRRQRR(SEQ ID NO:23); YARAAARQARA(SEQ ID NO:24); THRLPRRRRRR(SEQ ID NO:25); 및 GGRRARRRRRR(SEQ ID NO:26)이 포함된다.
ii. 단일-가닥 DNA 어닐링 단백질(SSAP)
특정 구현예에서, 본원에 제공되는 방법, 시스템, 세포 및 세포 배양 조성물에 사용되는 단일-가닥 DNA 어닐링 단백질(SSAP)은 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 촉진시키거나 촉매하는 단백질을 포함한다. 본원에 사용되는 SSAP의 특징은 RecA 의존적 및 독립적 경로의 자극, 시험관내에서의 올리고머 고리 및/또는 필라멘트 형성, ssDNA 결합 활성 및 상보적 ssDNA 가닥 어닐링의 ATPase-독립적 자극을 포함한다. RecT/Redβ-, ERF- 또는 RAD52-과의 단백질에서 SSAP 단백질의 특징은 문헌[Murphy, 2016] 및 문헌[Iyer et al., 2002]에 개시된 바 있다. 특정 구현예에서, SSAP는 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 RecT/Redβ-과의 단백질의 구성원이다. 특정 RecT/Redβ-과의 단백질의 특징은 전부는 아니지만 대부분의 구성원에서 5개의 β-가닥 및 5개의 α-나선의 코어를 갖는 α + β 도메인, Mg+2 의존적 단일 가닥 어닐링 활성 및 2개의 c-말단 산성 잔기의 보존을 포함한다(문헌[Iyer et al., 2002]). 특정 구현예에서, RecT/ Redβ-과 단백질은 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성 및 선택적으로 5개의 β-가닥 및 5개의 α-나선의 코어를 갖는 보존된 α + β 도메인, Mg+2 의존적 단일 가닥 어닐링 활성 및/또는 2개의 c-말단 산성 잔기의 보존을 갖는 단백질을 포함한다. 특정 구현예에서, SSAP는 ERF-과 단백질이다. EFR-과의 단백질의 특징은 GuXXoYhp + YXhXXhh(SEQ ID NO:32) 모티프를 포함하는 약 150개 아미노산 잔기의 보존된 영역을 포함하며, G는 글리신, Y-티로신이며, u는 "아주 작은(tiny)" 잔기(글리신, 세린, 알라닌), h-소수성(알라닌, 발린, 류신, 이소류신, 페닐알라닌, 메티오닌)이며, p는 극성 잔기(라이신, 아르기닌, 글루탐산염, 아스파르트산염, 아스파라긴, 트레오닌, 세린)이며, o는 알코올-함유 아미노산 잔기(세린 또는 트레오닌)이며, +는 염기성 잔기이며, X는 임의의 잔기이다(문헌[Iyer et al., 2002]). ERF 과 단백질은 박테리오파지 P22 ERF 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하며, 선택적으로 GuXXoYhp + YXhXXhh(SEQ ID NO:32) 모티프를 추가로 포함할 수 있다. ERF-과의 SSAP는 또한, 월드 와이드 웹 사이트 ncbi.nlm.nih.gov/protein 상의 NCBI 데이터베이스에서 수탁(gi 또는 유전자 식별자) 번호 9634188, 9635694, 16804357, 12719409, 458219, 11497308, 11497280, 1497168, 11527300, 9634634, 9635643, 13491642, 6015511, 11138335, 9627938, 9628668 및 15088753 하에 제시된 단백질을 포함한다. 특정 구현예에서, 본원에 사용되는 SSAP는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe) 및 클루이베로마이세스 락티스(Kluyveromyces lactis) 유래의 RAD52-과 단백질 및 각각 SEQ ID NO:5, 6 및 7의 전체 길이에 걸쳐 적어도 85%, 90%, 95%, 97%, 98% 또는 99% 서열 동일성을 갖는 이의 변이체; 또는 SEQ ID NO: 5, 6 또는 7에 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 변이체를 포함한다. RAD52-과의 단백질의 특징은 DNA 결합 활성을 갖는 보존된 나선-헤어핀-나선(HhH) 모티프를 포함한다(문헌[Iyer et al., 2002]). 본원에 사용되는 SSAP는 내용이 본원에 그들 전체가 참조로 포함되는 WO 2017/184227호로서 공개된 PCT/US2017/016184의 미국 국내 단계인 미국 특허 출원 제16/075,281호의 적어도 표 1, 2, 3, 4, 5 및 6에 제시된 "재조합효소"로 확인된 단백질을 추가로 포함할 수 있다. 특정 구현예에서, SSAP는 상기 언급된 SSAP 중 임의의 것의 대립유전자 변이체를 포함할 수 있다. 특정 구현예에서, 상기 언급된 SSAP 중 임의의 것은 SSAP를 인코딩하는 핵산(예를 들어, 발현 벡터, mRNA 또는 바이러스 발현 벡터)의 방식에 의해 세포에 제공될 수 있다. 특정 구현예에서, 상기 언급된 SSAP 중 임의의 것은 단백질로서, (예를 들어, 세포 투과 펩티드 및/또는 핵 국소화 서열과의) 융합 단백질로서 또는 SSAP와 기타 단백질 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는(예를 들어, SSB 및/또는 엑소뉴클레아제와 조합된) 폴리단백질로서 세포에 제공될 수 있다.
iii. 엑소뉴클레아제
특정 구현예에서, 본원에 제공되는 방법, 시스템, 세포 및 세포 배양 조성물에 사용되는 엑소뉴클레아제는 이중-가닥 DNA(dsDNA) 기질 상에서 5'에서 3' 또는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제를 포함하며, 이는 각각 노출된 3' 말단 또는 노출된 5' 말단을 갖는 적어도 부분적으로 단일 가닥의 DNA(ssDNA)를 포함하는 생성물을 초래할 수 있다. 특정 구현예에서, 엑소뉴클레아제는 5' 포스페이트 기를 갖는 블런트 말단을 포함하여 블런트 말단을 갖는 dsDNA 기질을 인식할 것이다. 특정 구현예에서, 엑소뉴클레아제는 ssDNA의 오버행(예를 들어, dsDNA 기질에 스태거형 절단을 제공하는 엔도뉴클레아제에 의해 생성되는 말단을 포함하는 dsDNA 분자의 말단에서의 5' 또는 3' ssDNA 영역)을 갖는 dsDNA 기질을 인식할 것이다. 특정 구현예에서, 엑소뉴클레아제는 한 가닥에 내부 파단을 갖는 dsDNA 기질(예를 들어, 닉킹된 dsDNA)을 인식할 것이다. 본원에 사용될 수 있는 5'에서 3' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 박테리오파지 람다 엑소 단백질(예를 들어, SEQ ID NO:8), Rac 프로파지 RecE 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO:9), 아르테미스(Artemis) 단백질(예를 들어, SEQ ID NO: 136), 아폴로(Apollo) 단백질(예를 들어, SEQ ID NO: 137), DNA2 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 138), Exo1 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 139), 헤르페스바이러스 SOX 단백질(예를 들어, SEQ ID NO: 140), UL12 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 141), 엔테로박테리아(enterobacterial) 엑소뉴클레아제 VIII 단백질(예를 들어, SEQ ID NO: 142), T7 파지 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO:143) 또는 동등한 5'에서 3' 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142 또는 143에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다. 특정 구현예에서, 본원에 제공되는 5'에서 3' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 SEQ ID NO:8, 9, 136, 137, 138, 139, 140, 141, 142 또는 143에 적어도 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142 또는 143에 제시된 단백질을 포함한다. 본원에 사용될 수 있는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 에스케리키아 콜라이 엑소뉴클레아제 III 단백질(예를 들어, SEQ ID NO: 144), 포유류 Trex2 엑소뉴클레아제 단백질(예를 들어, SEQ ID NO: 145), 동등한 3'에서 5' 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다. 특정 구현예에서, 본원에 제공되는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제는 SEQ ID NO: 144 또는 145에 적어도 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 SEQ ID NO: 144 또는 145에 제시된 단백질을 포함한다. 특정 구현예에서, 상기 언급된 엑소뉴클레아제는 DEDD/DnaQ 상과의 엑소뉴클레아제에 특징적인 보존된 DEDD 촉매적 잔기를 포함할 것이다(문헌[Bernad et al., 1989]). 특정 구현예에서, 상기 언급된 엑소뉴클레아제 중 임의의 것은 단백질로서, (예를 들어, 세포 투과 펩티드 및/또는 핵 국소화 서열과의) 융합 단백질로서 또는 엑소뉴클레아제와 기타 단백질 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는(예를 들어, SSB 및/또는 SSAP와 조합된) 폴리단백질로서 세포에 제공될 수 있다. 특정 구현예에서, 엑소뉴클레아제는 상기 언급된 엑소뉴클레아제 중 임의의 것의 대립유전자 변이체를 포함할 수 있다. 특정 구현예에서, 상기 언급된 엑소뉴클레아제 중 임의의 것은 엑소뉴클레아제를 인코딩하는 핵산(예를 들어, 발현 벡터, mRNA 또는 바이러스 발현 벡터)의 방식에 의해 세포에 제공될 수 있다. 일부 구현예에서, 서열-특이적 엔도뉴클레아제는 닉카제이다.
iv. 단일 가닥 DNA 결합 단백질(SSB)
다양한 단일 가닥 DNA 결합 단백질(SSB)이 본원에 제공되는 방법, 시스템, 세포 및 세포 배양 조성물에서 사용될 수 있다. 특정 구현예에서, SSB는 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에(Enterobacteriaceae) 종 SSB를 포함한다. 특정 구현예에서, SSB는 에스케리키아 종, 시겔라(Shigella) 종, 엔테로박터(Enterobacter) 종, 클레브시엘라(Klebsiella) 종, 세라티아(Serratia) 종, 판토에아(Pantoea) 종 또는 예르시니아(Yersinia) 종이다. 본원에 제공되는 SSB는 SEQ ID NO: 31, 및 SEQ ID NO: 34 내지 131, 및 132에 제시된 것, 및 SEQ ID NO: 31, SEQ ID NO: 34 내지 131 또는 132의 전체 길이에 걸쳐 적어도 85%, 90%, 95%, 97%, 98% 또는 99% 서열 동일성을 갖는; 또는 SEQ ID NO: 31 또는 SEQ ID NO: 34 내지 131 또는 132에 하나 이상의 보존적 및/또는 반-보존적 아미노산 치환을 갖는 이의 변이체를 포함한다. 본원에 사용되는 SSB는 내용이 본원에 그들 전체가 참조로 포함되는 WO 2017/184227호로서 공개된 PCT/US2017/016184호의 미국 국내 단계인 미국 특허 출원 제16/075,281호의 개시내용 및 적어도 표 7 및 8에 제시된 SSB 단백질을 포함할 수 있다. 특정 구현예에서, SSB는 상기 언급된 SSB 중 임의의 것의 대립유전자 변이체를 포함할 수 있다. 특정 구현예에서, 상기 언급된 SSB 중 임의의 것은 SSB를 인코딩하는 핵산(예를 들어, 발현 벡터, mRNA 또는 바이러스 발현 벡터)의 방식에 의해 세포에 제공될 수 있다. 특정 구현예에서, 상기 언급된 SSB 중 임의의 것은 단백질로서, (예를 들어, 세포 투과 펩티드 및/또는 핵 국소화 서열과의) 융합 단백질로서 또는 SSB와 기타 단백질 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는(예를 들어, SSAP 및/또는 엑소뉴클레아제와 조합된) 폴리단백질로서 세포에 제공될 수 있다.
일부 구현예에서, 본 발명의 방법에서 사용되는 SSB 및 SSAP는 동일한 유기체 유래 또는 파지 및 파지의 박테리아 숙주 유래의 것이다.
일부 구현예에서, SSB는 필요하지 않다. 일부 구현예에서, SSAP는 복제 단백질 A(RPA)-결합 파트너와 융합된다(문헌[Fanning et al. Nucleic acids research, 34(15), 4126-4137]). 일부 구현예에서, SSB는 내인성 SSB이다. 일부 구현예에서, 내인성 SSB에 결합하도록 변형된 SSAP가 제공된다.
일부 구현예에서, 본원에 제공되는 방법에 사용되는 성분은 융합 단백질로서 제공된다. 일부 구현예에서, SSAP는 SSB와 융합된다. 일부 구현예에서, SSAP는 복제 단백질 A(RPA)에 융합된다.
v. 식물, 식물 조직 및 식물 세포
특정 구현예에서, HDR은 단리된 식물 세포 또는 식물 원형질체(즉, 비해리된 또는 온전한 식물 조직, 식물 부분 또는 전체 식물에 위치하지 않음)에서 증가된다. 특정 구현예에서, 식물 세포는 임의의 식물 부분 또는 조직 또는 캘러스로부터 수득된다. 특정 구현예에서, 배양물은 식물 조직, 배양된 식물 조직 외식편, 전체 식물, 온전한 마디 눈(nodal bud), 슈트 정단부(shoot apex) 또는 슈트 정단 분열조직(shoot apical meristem), 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할(halved) 종자 또는 기타 종자 단편, 접합자 배(zygotic embryo), 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리, 캘러스 또는 식물 세포 현탁액으로부터 수득되는 식물 세포를 포함한다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층으로부터 유래된다.
특정 구현예에서, HDR은 비해리된 또는 온전한 식물 조직, 식물 부분, 식물 외식편 또는 전체 식물에 위치한 식물 세포에서 증가된다. 특정 구현예에서, 식물 세포는 온전한 마디 눈, 배양된 식물 조직 외식편, 슈트 정단부 또는 슈트 정단 분열조직, 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할 종자 또는 기타 종자 단편, 접합자 배, 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리 또는 캘러스에 위치할 수 있다. 특정 구현예에서, 사용되는 외식편은 미성숙 배를 포함한다. 미성숙 배(예를 들어, 미성숙 옥수수 배)는 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3 내지 7 ㎜ 배를 포함한다. 특정 구현예에서, 상기 언급된 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대(tassel), 미성숙 이삭 및 생사(silk)로부터 수득된다. 다양한 양태에서, 형질전환을 위해 사용되는 식물-유래 외식편은 미성숙 배, 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3.5 내지 7 ㎜ 배를 포함한다. 일 양태에서, 개시된 방법에서 사용되는 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대, 미성숙 이삭 또는 생사로부터 유래될 수 있다. 특정 구현예에서, 식물 세포는 만능 식물 세포(예를 들어, 줄기 세포 또는 분열조직 세포)이다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층 내에 위치한다. 특정 구현예에서, 그의 전체가 본원에 참조로 포함되는 WO2018085693호에 공개된 전체 식물, 종자, 배, 외식편 또는 분열조직의 게놈 편집 방법은 본원에 제공되는 식물 세포 및 관련 시스템, 방법, 조성물 또는 배양물에 사용하기 위해 조정될 수 있다.
특정 구현예에서, 식물 세포는 반수체, 이배체 또는 배수체 식물 세포 또는 식물 원형질체, 예를 들어, 반수체, 이배체 또는 배수체 식물, 식물 부분 또는 조직 또는 캘러스로부터 수득되는 것들을 포함할 수 있다. 특정 구현예에서, 배양 중 식물 세포(또는 재생된 식물, 자손 종자 및 자손 식물)는 반수체이거나, 반수체가 되도록 유도될 수 있으며; 반수체 식물 및 식물 세포의 제조 및 이용을 위한 기법은 당업계에 알려져 있으며, 예를 들어, www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf에서 이용 가능한 "How to make haploid Arabidopsis thaliana" 프로토콜(문헌[Ravi et al. (2014) Nature Communications, 5:5334, doi: 10.1038/ncomms6334])에서 Maruthachalam 및 Chan에 의해 기술된 바와 같은, 변경된 형태의 동원체-특이적 히스톤 CENH3을 발현하는 반수체-유도 스트레인과 야생형 스트레인의 교배에 의해 아라비돕시스 탈리아나(Arabidopsis thaliana)에서 반수체를 생성하기 위한 방법을 참조한다. 반수체는 또한 그의 전체가 본원에 참조로 포함되는 미국 특허 제9,215,849호에 개시된 바와 같이 돌연변이된 CENH3 유전자를 포함하는 식물을 야생형 이배체 식물과 교배하여, 반수체 자손을 생성함으로써 매우 다양한 외떡잎 식물(예를 들어, 옥수수, 밀, 벼, 수수, 보리) 또는 쌍떡잎 식물(예를 들어, 대두, 브라시카(Brassica) 종, 예를 들어, 카놀라, 목화, 토마토)에서 수득될 수 있다. 반수체 옥수수 식물 및/또는 세포를 수득하기 위해 사용될 수 있는 반수체-유도 옥수수 라인(line)은 스톡(Stock) 6, MHI(몰도바(Moldovian) 반수체 유도제), 부정 배우체(indeterminate gametophyte; ig) 돌연변이, KEMS, RWK, ZEM, ZMS, KMS, 및 본원에 그의 전체가 참조로 포함되는 미국 특허 제9,677,082호에 개시된 전이유전자 반수체 유도 라인을 포함한다. 반수체 세포의 예는 반수체 식물로부터 수득되는 식물 세포 및 생식 조직으로부터, 예를 들어, 꽃, 발생 중인 꽃 또는 꽃눈, 씨방, 밑씨, 대포자, 꽃밥, 화분, 대배우체 및 소포자로부터 수득되는 식물 세포를 포함하지만, 이에 한정되지 않는다. 식물 세포 또는 식물 원형질체가 반수체인 특정 구현예에서, 유전학적 상보물은 식물 세포 또는 식물 원형질체에서 염색체 배가에 의해(예를 들어, 감수분열 비-감소에 의한 자발적 염색체 배가에 의해 또는 염색체 배가 작용제, 예컨대 콜히친(colchicine), 오리잘린(oryzalin), 트리플루랄린(trifluralin), 프로나미드(pronamide), 아산화질소 기체, 항-미세소관 제초제, 항-미세소관 작용제 및 유사분열 저해제의 사용에 의해) 배가되어, 유전자 또는 대립유전자의 상보물이 동형접합성인 배가된 반수체 식물 세포 또는 식물 원형질체를 생성할 수 있으며; 또 다른 구현예는 배가된 반수체 식물 세포 또는 식물 원형질체로부터의 배가된 반수체 식물의 재생을 포함한다. 또 다른 구현예는 이 접근법에 의해 제공되는 배가된 반수체 식물인 적어도 하나의 부모 식물을 갖는 하이브리드 식물에 관한 것이다. 배가된 반수체 식물의 생성에 의해, 동형접합성 식물을 수득하기 위하여 몇 세대의 자가-교배를 필요로 하는 것 대신에 한 세대에서 동형접합성이 제공된다. 배가된 반수체의 이용은 가능한 최소의 시간에 유전학적 순도(즉, 동형접합성)를 확립하고자 하는 임의의 상황에서 유리하다. 배가된 반수체 생성은 느리게 성장하는 식물, 예컨대 과수 및 기타 식물에서 또는 적어도 하나의 배가된-반수체 식물의 자손인 하이브리드 식물을 생성하는 데 특히 유리할 수 있다.
HDR이 식물 세포에서 증가되는 특정 구현예에서, 본원에 제공되는 관련 방법, 시스템, 조성물 또는 반응 혼합물은 임의의 관심 외떡잎 또는 쌍떡잎 식물 종, 예를 들어, 줄뿌림 작물(row crop) 식물, 과실-생성 식물 및 나무, 야채, 나무 및 관상용 꽃, 관목, 나무, 지피식물(groundcover) 및 잔디풀을 포함하는 관상용 식물로부터 수득되거나 이에 위치한 식물 세포를 포함할 수 있다. 특정 비-제한적인 구현예에서, 식물 세포는 알팔파(메디카고 사티바(Medicago sativa)), 아몬드(프루누스 둘시스(Prunus dulcis)), 사과(말루스(Malus) x 도메스티카(domestica)), 살구(프루누스 아르메니아카(Prunus armeniaca), 프루누스 브리간티네(P. brigantine), 프루누스 만드슈리카(P. mandshurica), 프루누스 무메(P. mume), 프루누스 시비리카(P. sibirica)), 아스파라거스(아스파라거스 오피시날리스(Asparagus officinalis)), 바나나(무사(Musa) 종), 보리(호르데움 불가레(Hordeum vulgare)), 콩(파세올루스(Phaseolus) 종), 블루베리 및 크랜베리(백시니움(Vaccinium) 종), 카카오(테오브로마 카카오(Theobroma cacao)), 카놀라 및 평지씨 또는 오일시드 평지, (브라시카 나푸스(Brassica napus)), 카네이션(디안투스 카리오필루스(Dianthus caryophyllus)), 당근(다우쿠스 카로타 사티부스(Daucus carota sativus)), 카사바(마니호트 에스쿨렌툼(Manihot esculentum)), 체리(프루누스 아비움(Prunus avium)), 병아리콩(시더 아리에티눔(Cider arietinum)), 치커리(시코리움 인티부스(Cichorium intybus)), 칠리 페퍼 및 기타 캅시쿰 페퍼(capsicum pepper)(캅시쿰 아눔(Capsicum annuum), 캅시쿰 프루테센스(C. frutescens), 캅시쿰 키넨세(C. chinense), 캅시쿰 푸베센스(C. pubescens), 캅시쿰 바카툼(C. baccatum)), 국화(크리산테뭄(Chrysanthemum) 종), 코코넛(코코스 누시페라(Cocos nucifera)), 커피(코페아(Coffea) 종, 예를 들어, 코페아 아라비카(Coffea arabica) 및 코페아 카네포라(Coffea canephora)), 목화(고시피움 히르수툼(Gossypium hirsutum) L.), 동부(비그나 운구이쿨라타(Vigna unguiculata)), 오이(쿠쿠미스 사티부스(Cucumis sativus)), 커런트 및 구스베리(리베스(Ribes) 종), 가지(eggplant 또는 aubergine)(솔라눔 멜론게나(Solanum melongena)), 유칼립투스(유칼립투스(Eucalyptus) 종), 아마(리눔 우시타티수뭄(Linum usitatissumum) L.), 제라늄(geranium)(펠라르고늄(Pelargonium) 종), 자몽(시트러스(Citrus) x 파라디시(paradisi)), 포도(비투스(Vitus) 종), 예를 들어, 양조용 포도(비투스 비니페라(Vitus vinifera)), 구아바(프시디움 구아자바(Psidium guajava)), 삼 및 대마(예를 들어, 카나비스 사티바(Cannabis sativa) 및 카나비스 종), 홉(후물러스 루풀러스(Humulus lupulus)), 붓꽃(이리스(Iris) 종), 레몬(시트러스 리몬(Citrus limon)), 상추(락투카 사티바(Lactuca sativa)), 라임(시트러스 종), 옥수수(제아 메이즈(Zea mays) L.), 망고(만지페라 인디카(Mangifera indica)), 망고스틴(가르시니아 망고스타나(Garcinia mangostana)), 멜론(쿠쿠미스 멜로(Cucumis melo)), 기장(세타리아(Setaria) 종, 에키노클로아(Echinochloa) 종, 엘레우신(Eleusine) 종, 파니쿰(Panicum) 종, 페니세툼(Pennisetum) 종), 귀리(아베나 사티바(Avena sativa)), 기름야자(엘리스 퀴닌시스(Ellis quineensis)), 올리브(올레아 유로파에아(Olea europaea)), 양파(알리움 세파(Allium cepa)), 오렌지(시트러스 시넨시스(Citrus sinensis)), 파파야(카리카 파파야(Carica papaya)), 복숭아 및 천도복숭아(프루누스 페르시카(Prunus persica)), 배(피루스(Pyrus) 종), 완두(피사 사티붐(Pisa sativum)), 땅콩(아라키스 하이포가에아(Arachis hypogaea)), 작약(파에오니아(Paeonia) 종), 페투니아(petunia)(페투니아(Petunia) 종), 파인애플(아나나스 코모수스(Ananas comosus)), 플랜테인(plantain)(무사(Musa) 종), 자두(프루누스 도메스티카(Prunus domestica)), 포인세티아(poinsettia)(유포르비아 풀체리마(Euphorbia pulcherrima)), 폴란드 카놀라(Polish canola)(브라시카 라파(Brassica rapa)), 포플러(포풀러스(Populus) 종), 감자(솔라눔 투베로숨(Solanum tuberosum)), 호박(쿠쿠르비타 페포(Cucurbita pepo)), 벼(오리자 사티바 L.), 장미(로사(Rosa) 종), 고무(헤베아 브라실리엔시스(Hevea brasiliensis)), 호밀(세칼레 세레알레(Secale cereale)), 잇꽃(카르타무스 틴크토리우스(Carthamus tinctorius) L), 참깨 종자(세사메 인디움(Sesame indium)), 수수(소르굼 비콜로르(Sorghum bicolor)), 대두(글리신 맥스(Glycine max) L.), 애호박(squash)(쿠쿠르비타 페포(Cucurbita pepo)), 딸기(프라가리아(Fragaria) 종, 프라가리아 x 아나나사(ananassa)), 사탕무(베타 불가리스(Beta vulgaris)), 사탕수수(사카룸(Saccharum) 종), 해바라기(헬리안투스 안누스(Helianthus annus)), 고구마(이포모에아 바타타스(Ipomoea batatas)), 탠저린(시트러스 탄제리나(Citrus tangerina)), 찻잎(카멜리아 시넨시스(Camellia sinensis)), 담배(니코티아나 타바쿰(Nicotiana tabacum) L.), 토마토(라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), 튤립(툴리파(Tulipa) 종), 순무(브라시카 라파 라파(Brassica rapa rapa)), 호두(저글란스(Juglans) 종 L.), 수박(시트룰루스 라나투스(Citrulus lanatus)), 밀(트리티움 아에스티붐(Tritium aestivum)) 또는 마(디스코레아(Discorea) 종)로부터 수득되거나, 이에 위치한다.
vi. 진핵 세포
특정 구현예에서, HDR이 증가된 진핵 세포(예를 들어, 식물 세포)는 (a) 폴리머(예를 들어, 펙틴, 아가로스 또는 기타 다당류) 또는 기타 지지체(고체 또는 반-고체 표면 또는 매트릭스 또는 입자 또는 나노입자) 내에 캡슐화되거나, 봉입되거나, 이에 부착되거나; (b) 소낭 또는 리포좀 또는 기타 유체 구획 내에 캡슐화되거나, 봉입되거나, 이에 부착되거나; 또는 (c) 캡슐화되거나, 봉입되거나, 부착되지 않은 세포일 수 있다. 특정 구현예에서, 세포는 액체 또는 현탁액 배양에 존재할 수 있거나, 반-고체 또는 고체 배지 내에 또는 그 상에, 또는 액체 및 고체 또는 반-고체 배지의 조합에서 배양될 수 있다(예를 들어, 액체 배지 오버레이를 갖는 고체 배지 상에서 배양된 식물 세포 또는 원형질체, 또는 고체 비드 또는 매트릭스에 부착되고, 액체 배지를 사용하여 성장한 식물 세포 또는 원형질체). 특정 구현예에서, 세포는 폴리머(예를 들어, 펙틴, 아가로스 또는 기타 다당류) 또는 기타 캡슐화 물질 내에 캡슐화되거나, 소낭 또는 리포좀에 봉입되거나, 혼합상 배지(예컨대, 에멀젼 또는 역 에멀젼)에 현탁화되거나, 매트릭스 또는 기타 고체 지지체(예를 들어, 비드 또는 마이크로비드, 멤브레인 또는 고체 표면) 내에 임베딩되거나, 이에 부착된다.
관련된 양태에서, 본 개시내용은 본원에 기술된 시스템, 방법 및 조성물에서 개선된 HDR 빈도를 갖는 진핵 세포(예를 들어, 식물 세포)의 배열, 예컨대 선별을 위한 또는 고효율 및/또는 다중 형질전환 또는 유전자 편집 실험을 위한 편리한 세포의 배열을 제공한다. 일 구현예에서, 본 개시내용은 하기를 포함하는 다중 세포의 배열을 제공한다: (a) HDR 촉진제; 및 선택적으로 (b) 게놈 편집 분자. 특정 구현예에서, 세포의 배열은 적어도 하나의 화학적, 효소적 또는 물리적 전달제를 추가로 포함할 수 있다. 또 다른 구현예에서, 본 개시내용은 각각이 증가된 HDR-매개된 게놈 변형 빈도를 갖는 적어도 하나의 세포를 포함하는 복수의 용기를 포함하는 어레이를 제공한다. 일 구현예에서, 본 개시내용은 HDR 촉진제 및 선택적으로 게놈 편집 분자를 갖는 세포의 배열을 제공하며, 세포는 어레이된 형식에, 예를 들어, 멀티-웰 플레이트에 존재하거나, (예를 들어, 미세유체 디바이스에서 유용한) 소낭, 리포좀 또는 액적에 캡슐화되거나 봉입되거나, 분리되어 매트릭스에, 또는 분리된 입자 또는 비드에 부착되며; 구체적인 구현예는 어레이 상의 적어도 일부 위치에 대하여 또는 심지어 어레이 상의 각각의 위치에 대하여 상이할 수 있는 적어도 하나의 게놈 편집 분자(예를 들어, RNA-가이드된 DNA 뉴클레아제, 적어도 하나의 가이드 RNA 또는 RNA-가이드된 DNA 뉴클레아제 및 적어도 하나의 가이드 RNA 둘 모두를 포함하는 리보핵단백질), 및 선택적으로 적어도 하나의 화학적, 효소적 또는 물리적 전달제를 추가로 포함하는, 어레이된 형식에 제공되는 증가된 HDR-매개된 게놈 변형 빈도를 갖는 이러한 다수의 세포의 배열이다.
본원에 제공되는 시스템 및 방법에서, 진핵 세포(예를 들어, 식물 세포)는 하나 이상의 HDR 촉진제 및/또는 하나 이상의 유전자 편집 분자에 임의의 시간 순서로 노출될 수 있다. 특정 구현예에서, HDR 촉진제 및 유전자 편집 분자는 동시에 제공된다. 다른 구현예에서, HDR 촉진제가 제공된 후에 게놈 편집 분자가 제공된다. 다른 구현예에서, HDR 촉진제가 제공되기 전에 유전자 편집 분자가 제공된다. 요약하여, HDR 촉진제는 세포를 유전자 편집 분자에 노출시키기 이전에, 이와 동시에 또는 이후에 진핵 세포(예를 들어, 식물 세포)에 제공될 수 있다.
HDR 촉진제(예를 들어, SSAP, 엑소뉴클레아제, 및 SSB) 및/또는 변형된 DNA 공여자 주형에 의해 부여되는 증가된 상동성 지정 수선(HDR)-매개된 게놈 변형 빈도를 갖는 진핵 세포(예를 들어, 식물 세포)가 본원에 제공된다. 또한, 본원에 개시된 시스템 및 방법에 의해 제공되는 증가된 HDR-매개된 게놈 변형 빈도를 갖는 식물 세포 또는 식물 원형질체로부터 유래된 또는 이로부터 성장한 조성물이 본 개시내용에 의해 제공되며; 이러한 조성물은 증가된 HDR-매개된 게놈 변형 빈도를 갖는 식물 세포 또는 식물 원형질체로부터 성장한 다수의 원형질체 또는 세포, 캘러스, 체세포 배, 체세포 분열조직, 배형성 캘러스 또는 재생된 식물을 포함한다. HDR 촉진제 및/또는 변형된 DNA 공여자 주형으로 처리된 세포에서의 증가된 HDR-매개된 게놈 변형 빈도는 다수의 기법에 의해 평가될 수 있다. 특정 구현예에서, 이러한 기법은 HDR 촉진제(예를 들어, SSAP, 엑소뉴클레아제, 및 SSB) 및/또는 변형된 DNA 공여자 주형으로 처리되지 않은 대조군 세포에서의 HDR의 빈도에 대하여, HDR 촉진제로 처리된 세포에서 관찰되는 HDR의 빈도를 비교할 수 있다.
특정 구현예에서, 본원에 제공되는 시스템, 방법 및 조성물에서 사용되는 진핵 세포(예를 들어, 식물 세포)는 비-분열 세포를 포함할 수 있다. 이러한 비-분열 세포는 유전학적 및/또는 약제학으로-유도된 세포-사이클 차단 등 중 하나 이상으로 처리된 식물 세포 원형질체, 진핵 세포를 포함할 수 있다. 특정 구현예에서, 비-분열 세포는 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제, 및 SSB) 및/또는 본원에 제공되는 변형된 DNA 공여자 주형을 선택적으로 포함할 수 있는 유전자-편집 분자로의 처리 후에 (예를 들어, 유전학적 또는 약제학적 세포-사이클 차단을 역전시키거나 제거함으로써) 분열하도록 유도될 수 있다.
특정 구현예에서, 본원에 제공되는 시스템, 방법 및 조성물에서 사용되는 진핵 세포(예를 들어, 식물 세포)는 분열 중인 세포를 포함할 수 있다. 분열 중인 세포는 잎, 분열조직 및 배를 포함하는 다양한 식물 조직에서 관찰되는 그들 세포를 포함할 수 있다. 이들 조직은 어린 옥수수 잎, 분열조직 및 약 8 또는 10 내지 약 12 또는 14 DAP(days after pollination) 배의 배반 조직 유래의 분열 중인 세포를 포함하지만, 이에 제한되지 않는다. 옥수수 배의 단리는 몇몇의 문헌에 기술된 바 있다(문헌[Brettschneider, Becker, and Lrz 1997]; 문헌[Leduc et al. 1996]; 문헌[Frame et al. 2011]; 문헌[K. Wang and Frame 2009]). 특정 구현예에서, 기부엽 조직(예를 들어, 옥수수 식물의 엽설로부터 약 0 내지 3 ㎝에 위치한 잎 조직; 문헌[Kirienko, Luo, and Sylvester 2012])은 HDR-매개된 유전자 편집을 위해 표적화된다. 본원에 제공된 식물 세포의 HDR-매개된 유전자 편집으로부터 재생 가능한 식물 구조 및 재생하는 식물을 수득하기 위한 방법은 구체적으로 이러한 개시내용에 관하여 그의 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호에 개시된 방법으로부터 조정될 수 있다. 특정 구현예에서, HDR-매개된 유전자 편집으로 처리된 단일의 식물 세포는 단일의 재생 가능한 식물 구조를 야기할 것이다. 특정 구현예에서, 단일의 재생 가능한 식물 세포 구조는 HDR-매개된 유전자 편집으로 처리된 외식편 상에서 또는 그 내에서 단일의 세포로부터 형성될 수 있다.
vii. 식물 재생
일부 구현예에서, 본원에 제공되는 방법은 개선된 HDR-매개된 유전자 편집을 겪은 식물 세포로부터, 또는 식물 세포로부터 수득되는 재생 가능한 식물 구조로부터 식물을 성장시키거나 재생시키는 추가의 단계를 포함할 수 있다. 특정 구현예에서, 식물은 본원에 개시된 방법 및 조성물에 의해 제공되는 바와 같은 삽입된 전이유전자, 표적 유전자 편집 또는 게놈 편집을 추가로 포함할 수 있다. 특정 구현예에서, 캘러스는 식물 세포, 및 이러한 캘러스로부터 생성된 소식물체 및 식물로부터 생성된다. 다른 구현예에서, 전체 묘목 또는 식물은 캘러스 단계 없이 식물 세포로부터 바로 성장한다. 따라서, 추가의 관련 양태는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포 또는 식물 원형질체로부터 성장하거나 재생된 전체 묘목 및 식물, 이러한 식물의 종자에 관한 것이다. 식물 세포 또는 식물 원형질체가 유전학적 변형(예를 들어, RNA-가이드된 DNA 뉴클레아제의 수단에 의한 게놈 편집)으로 처리된 특정 구현예에서, 성장한 또는 재생된 식물은 유전학적 변형과 연관된 표현형을 나타낸다. 특정 구현예에서, 성장한 또는 재생된 식물은 그의 게놈에 둘 이상의 유전학적 또는 후성적 변형을 포함하며, 이는 조합하여 적어도 하나의 관심 표현형을 제공한다. 특정 구현예에서, 적어도 일부가 적어도 하나의 유전학적 또는 후성적 변형을 포함하는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포의 이종 집단이 상기 방법에 의해 제공되며; 관련 양태는 표적 유전자 또는 게놈 편집을 갖는 식물 세포의 이종 집단으로부터 선택되는 식물 세포 또는 식물 원형질체로부터의 관심 표현형을 갖는 식물의 재생에 의해, 또는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포의 집단으로부터 성장하거나 재생된 식물의 이종 집단으로부터의 관심 표현형을 갖는 식물의 선택에 의해 제공되는, 유전학적 또는 후성적 변형과 연관된 관심 표현형을 갖는 식물을 포함한다. 관심 표현형의 예는 제초제 저항성, 무생물학적 스트레스(예를 들어, 극한의 온도의 내성, 내건성 또는 내염성) 또는 생물학적 스트레스(예를 들어, 선충, 박테리아 또는 진균 병원체에 대한 저항성)의 개선된 내성, 영양소 또는 물, 변형된 지질, 탄수화물 또는 단백질 조성물의 개선된 이용, 개선된 향미 또는 외양, 개선된 저장 특징(예를 들어, 멍(bruising), 갈변 또는 무름(softening)에 대한 저항성), 증가된 수율, 변경된 형태(예를 들어, 꽃 구조 또는 색상, 식물 높이, 분지, 뿌리 구조)를 포함한다. 일 구현예에서, 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포의 이종 집단(또는 이로부터 성장하거나 재생된 묘목 또는 식물)은 관심 표현형의 발현을 가능하게 하는 조건에 노출되며; 예를 들어, 제초제 저항성에 대한 선택은 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포 집단(또는 이로부터 성장하거나 재생된 묘목 또는 식물)을 성장을 저해하거나 독성인 양의 제초제 또는 기타 물질에 노출시켜, 처리를 견디는 그들 저항성 식물 세포(또는 묘목 또는 식물)의 확인 및 선택을 가능하게 하는 것을 포함할 수 있다. 재생 가능한 식물 구조를 수득하고, 식물 세포 또는 재생 가능한 식물 구조로부터 식물을 재생하기 위한 방법은 공개된 절차로부터 조정될 수 있다(문헌[Roest and Gilissen, Acta Bot. Neerl., 1989, 38(1), 1-23]; 문헌[Bhaskaran and Smith, Crop Sci. 30(6):1328-1337]; 문헌[Ikeuchi et al., Development, 2016, 143: 1442-1451]). 재생 가능한 식물 구조를 수득하고, 식물 세포 또는 재생 가능한 식물 구조로부터 식물을 재생하기 위한 방법은 또한, 구체적으로 이러한 개시내용에 관하여, 그의 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호로부터 조정될 수 있다. 또한, 이러한 식물의 이종 집단, 어레이 또는 라이브러리, 표적 유전자 편집 또는 게놈 편집을 갖는, 식물 세포 또는 식물 원형질체로부터 성장하거나 이로부터 재생된 이러한 식물의 후속 세대 또는 종자, 식물의 부분(접순 또는 대목으로서 접목에 사용되는 식물 부분 포함), 또는 식물 또는 그들의 종자로 제조된 생성물(예를 들어, 과실 또는 기타 식용 식물 부분, 세정된 곡물 또는 종자, 식용 오일, 가루 또는 전분, 단백질 및 기타 가공 생성물)이 제공된다. 구현예는 표적 유전자 편집 또는 게놈 편집을 갖는 식물 세포로부터 성장하거나 재생된 식물을 포함하며, 식물은 유전학적 또는 후성적 변형을 갖지 않는 세포 또는 조직, 예를 들어 접순 또는 대목이 유전학적 또는 후성적 변형을 함유하는 이식된 식물, 또는 전부의 세포 또는 조직이 아닌 일부가 유전학적 또는 후성적 변형을 함유하는 키메라 식물을 함유한다. 이식이 보통 유용한 식물은 많은 과수 및 식물, 예컨대 많은 감귤류 나무, 사과, 핵과(예를 들어, 복숭아, 살구, 체리 및 자두), 아보카도, 토마토, 가지, 오이, 멜론, 수박 및 포도, 및 다양한 관상 식물, 예컨대 장미를 포함한다. 이식된 식물은 동일한 또는 상이한(일반적으로 관련된) 종 간의 이식편일 수 있다. 추가의 관련된 양태는 표적 유전자 편집 또는 게놈 편집을 갖고 적어도 하나의 유전학적 또는 후성적 변형을 갖는 식물 세포 또는 식물 원형질체로부터 성장하거나 재생된 제1 식물을 하이브리드 식물이 유전학적 또는 후성적 변형을 함유하는 제2 식물과 교배함으로써 제공되는 하이브리드 식물을 포함하며; 하이브리드 식물에 의해 생성되는 종자도 또한 고려된다. 또한, 부모 또는 조상으로서 재생된 식물을 갖는, 하이브리드 종자 및 하이브리드 식물을 포함하는 자손 종자 및 자손 식물이 관련 양태로서 고려된다. 본원에 개시된 식물 세포 및 유도 식물 및 종자는 소비자 또는 재배자에게 유용한 다양한 목적을 위해 사용될 수 있다. 온전한 식물 그 자체, 예를 들어, 피복 작물(cover crop)로서 또는 관상식물로서 성장한 식물이 바람직할 수 있다. 다른 구현예에서, 가공된 생성물, 예컨대 추출된 단백질, 오일, 당 및 전분, 발효 생성물, 동물 사료 또는 인간 식품, 목재 및 목제품, 약제학적 및 다양한 산업적 제품은 식물 또는 그의 종자로부터 제조된다.
viii. 진핵 세포로의 HDR 촉진제의 제공
HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB는 임의의 적합한 기법에 의해 진핵 세포(예를 들어, 식물 세포 또는 식물 원형질체)에 제공될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 세포를 SSAP, 엑소뉴클레아제 및/또는 SSB, 또는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드와 직접 접촉시킴으로서 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB, 또는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드를 화학적, 효소적 또는 물리적 작용제를 사용하여 세포 내로 수송함으로써 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드를 사용한 식물 세포 또는 식물 원형질체의 박테리아 매개의(예를 들어, 아그로박테리움 종, 리조비움(Rhizobium) 종, 시노리조비움(Sinorhizobium) 종, 메소리조비움(Mesorhizobium) 종, 브라디리조비움(Bradyrhizobium) 종, 아조박터(Azobacter) 종, 필로박테리움(Phyllobacterium) 종) 트랜스펙션에 의해 제공되며; 예를 들어, 문헌[Broothaerts et al. (2005) Nature, 433:629 - 633]을 참조한다. 일 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하고, 식물 세포의 게놈에 안정하게 통합되는 DNA의 식물 세포 또는 식물 원형질체에서의 전사에 의해 제공되거나, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 플라스미드 또는 발현 벡터(예를 들어, 바이러스 벡터)의 형태로 식물 세포 또는 식물 원형질체에 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드로서, 예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 RNA(예를 들어, 내부 리보솜 유입 부위(IRES)를 함유하는 mRNA 또는 RNA)의 형태로 식물 세포 또는 식물 원형질체에 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 인코딩된 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 아미노산 서열을 갖는, SSAP, 엑소뉴클레아제 및/또는 SSB를 임의의 순서로 포함하는 폴리단백질을 인코딩하는 폴리뉴클레오티드로서 식물 세포 또는 식물 원형질체에 제공된다. 이러한 프로테아제 인식 서열의 예에는 내인성 식물 프로테아제에 의해 절단될 수 있는 식물 메탈로티오네인-유사 단백질(PsMTa)의 스페이서 영역(문헌[Unwin et al., 1998]) 또는 세포에 또한 제공되는 특이적인 프로테아제의 인식 서열(예를 들어, TVMV Nia 프로테이나제; 문헌[Dasgupta, et al., 1998])이 포함된다. 이러한 자가-가공 단백질 서열의 예에는 구제역 바이러스(FMDV) 2A 서열(SEQ ID NO:33; 문헌[Halpin, C., et al, 1999])이 포함된다. 게놈 편집 분자는 또한 유사한 기법에 의해 식물 세포 내로 도입될 수 있다.
ix. HDR 촉진제의 일시적인 발현
본원에 제공되는 방법, 시스템, 세포 및 조성물의 특정 구현예에서, HDR 촉진제 및/또는 게놈 편집 분자의 일시적 발현이 사용된다. HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB 또는 게놈 편집 분자의 일시적 발현은 다양한 기법에 의해 달성될 수 있다. 일부 구현예에서, HDR 촉진제의 발현은 유도 가능하다. 특정 구현예에서, SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자는 단리된 분자로서, 무세포 합성 과정(예를 들어, 시험관내 번역)의 단리된 또는 반-정제된 생성물로서 또는 세포-기반의 합성 과정에서(예를 들어, 예컨대 박테리아 또는 다른 세포 용해물에서)의 단리된 또는 반-정제된 생성물로서 세포, 시스템, 방법 및 조성물에 직접 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자는 (예를 들어, 문헌[Gao et al. 2016]; 또는 문헌[Li et al. 2009]으로부터 조정된 방법에 의해) 일시적 발현을 보장하는 방식으로 세포 또는 세포 핵에 표적화된다. 특정 구현예에서, SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자는 SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자를 인코딩하는 임의의 폴리뉴클레오티드의 부재 하에 SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자의 전달에 의해 세포 내로 전달된다. 임의의 인코딩 폴리뉴클레오티드의 부재 하에 전달될 수 있는 외인성 작용제의 예에는 SSAP, 엑소뉴클레아제, SSB, 서열-특이적 엔도뉴클레아제 및 RNA 가이드가 포함된다. RNA-가이드된 DNA 결합 폴리펩티드/RNA 가이드는 개별적으로 및/또는 RNP 복합체로서 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질은 (예를 들어, 문헌[Martin-Ortigosa and Wang 2014]으로부터 조정된 방법에 의해) 이종 시스템에서 생성되고, 정제되고, 입자 충격(particle bombardment)에 의해 식물 세포에 전달될 수 있다. SSAP, 엑소뉴클레아제 및/또는 SSB가 임의의 인코딩 폴리뉴클레오티드의 부재 하에 전달되는 구현예에서, 전달되는 작용제는 임의의 도입된 인코딩 폴리뉴클레오티드로부터 진행 중인 발현의 부재 하에 시간이 지나면서 분해하여, 일시적인 발현을 초래하는 것으로 예상된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드의 전달에 의해 세포 내로 전달된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 (예를 들어, 문헌[Hamada et al. 2018]; 또는 문헌[Kirienko, Luo, and Sylvester 2012]으로부터 조정된 방법에 의해) 박테리아 플라스미드 상에 인코딩되고, 입자 충격에 의해 식물 조직에 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 (예를 들어, 문헌[Leonelli et al. 2016]; 또는 문헌[Wu et al. 2014]으로부터 조정된 방법에 의해) T-DNA 상에서 인코딩되고, 아그로박테리움을 사용하여 식물 세포로 일시적으로 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 (예를 들어, 문헌[Honig et al. 2015]으로부터 조정된 방법에 의해) 바이러스 게놈에 인코딩되고, 식물에 전달될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 mRNA 또는 IRES를 포함하는 RNA에 인코딩되고, 표적 세포에 전달될 수 있다. SSAP, 엑소뉴클레아제 및/또는 SSB가 RNA-가이드된 DNA 결합 폴리펩티드 및 RNA 가이드를 포함하는 특정 구현예에서, 폴리펩티드 또는 가이드는 하기의 조합에 의해 전달될 수 있다: (i) 폴리펩티드 또는 가이드에 대한 인코딩 폴리뉴클레오티드; 및 (ii) 인코딩 폴리뉴클레오티드의 부재 하의 폴리펩티드 또는 가이드 그 자체. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 HDR 촉진제를 인코딩하는 폴리뉴클레오티드의 전달에 의해 식물 세포 내로 전달된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드는 (예를 들어, 통합 결핍 T-DNA 벡터 또는 시스템 상의 아그로인필트레이션(agroinfiltration)에 의한 또는 바이러스 벡터 내의 통합을 제공하는 서열이 결여된 폴리뉴클레오티드로서) 식물 세포 게놈 내로 통합되지 않고/않거나 자가 복제를 제공하는 폴리뉴클레오티드에 작동 가능하게 연결되지 않고/않거나 자가 복제를 제공하는 인자(예를 들어, 바이러스 복제 단백질)만이 제공된다. 문헌[Canto, 2016] 등에 의해 개시된 폴리뉴클레오티드의 비올리스틱(biolistic) 및 기타 전달, 아그로인필트레이션 및 바이러스 벡터의 이용을 포함하는 일시적 발현에 적합한 기법은 본원에 제공된 SSAP, 엑소뉴클레아제 및/또는 SSB의 일시적인 발현을 위해 조정될 수 있다. 비-통합된 폴리뉴클레오티드에 의해 인코딩되는 작용제의 일시적 발현은 폴리뉴클레오티드의 절제 및/또는 작용제의 조절된 발현에 의해 유발된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드는 진핵 세포 게놈(예를 들어, 식물 핵 또는 색소체 게놈) 내로 통합되며, 작용제의 일시적 발현은 폴리뉴클레오티드의 절제 및/또는 SSAP, 엑소뉴클레아제 및/또는 SSB의 조절된 발현에 의해 유발된다. 작용제를 인코딩하는 폴리뉴클레오티드의 절제는 부위-특이적 재조합 시스템(예를 들어, Cre-Lox, FLP-FRT)의 이용에 의해 제공될 수 있다. 작용제의 조절된 발현은 하기를 포함하는 방법에 의해 유발될 수 있다: (i) 발생적으로-조절되는, 탈-억제 가능한 및/또는 유도성 프로모터로의 작용제를 인코딩하는 폴리뉴클레오티드의 작동 가능한 연결; 및/또는 (ii) 작용제의 siRNA-매개된 저해를 유도할 수 있는 폴리뉴클레오티드(예를 들어, dsRNA 또는 miRNA)의 도입. 적합한 부위-특이적 재조합 시스템 및 발생적으로-조절되는, 탈-억제 가능한 및/또는 유도성 프로모터에는 이러한 개시내용에 관하여 구체적으로, 그의 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호에 개시된 것들이 포함된다.
SSAP, 엑소뉴클레아제, SSB 및/또는 게놈 편집 분자(예를 들어, SSAP, 엑소뉴클레아제, SSB, 서열-특이적 엔도뉴클레아제, RNA-가이드된 엔도뉴클레아제 및/또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드)의 일시적인 발현을 유발하기 위해 사용될 수 있는 폴리뉴클레오티드는 하기를 포함한다: (a) 이중-가닥 RNA; (b) 단일-가닥 RNA; (c) 화학적으로 변형된 RNA; (d) 이중-가닥 DNA; (e) 단일-가닥 DNA; (f) 화학적으로 변형된 DNA; 또는 (g) (a) 내지 (f)의 조합. 폴리뉴클레오티드의 특정 구현예는 유용한 기능을 제공하는 추가의 뉴클레오티드 서열을 추가로 포함하며; 이러한 추가의 뉴클레오티드 서열의 비제한적인 예에는 압타머 또는 리보스위치 서열, 이차 구조, 예컨대 스템-루프를 제공하거나 효소에 대한 서열-특이적 부위(예를 들어, 서열-특이적 재조합효소 또는 엔도뉴클레아제 부위)를 제공하는 뉴클레오티드 서열, T-DNA(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 DNA 서열이 아그로박테리움 종 유래의 또는 식물에서 감염시키거나 종양을 유도하는 기타 박테리아 유래의 좌측 및 우측 T-DNA 경계 사이에 봉입됨), DNA 핵-표적화 서열, 조절 서열, 예컨대 프로모터 서열, 및 전사물-안정화 또는 -불안정화 서열이 포함된다. 폴리뉴클레오티드의 특정 구현예는 폴리뉴클레오티드가 비-핵산 요소, 예를 들어, 담체 분자, 항체, 항원, 바이러스 이동 단백질, 세포-투과 또는 포어-형성 펩티드, 폴리머, 검출 가능한 표지, 양자점 또는 미립자 또는 나노미립자와 복합체화되거나, 이에 공유적으로 또는 비-공유적으로 결합된 것들을 포함한다. 일부 구현예에서, 본원에 제공되는 성분 중 하나 이상은 유도성 프로모터의 유도에 의해 일시적으로 발현된다.
x. HDR 촉진제의 전달
다양한 처리가 유전자 편집 분자 및/또는 HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB를 진핵 세포(예를 들어, 식물 세포)에 전달하는 데 유용하다. 특정 구현예에서, 하나 이상의 처리를 사용하여 (예를 들어, 폴리뉴클레오티드, 폴리펩티드 또는 이의 조합을 포함하는) HDR 촉진제를 예를 들어, 장벽, 예컨대 세포벽, 원형질막, 핵피막 및/또는 기타 지질 이중층을 통해 진핵 또는 식물 세포 내로 전달한다. 특정 구현예에서, 작용제(들)를 포함하는 폴리뉴클레오티드-, 폴리펩티드- 또는 RNP-함유 조성물은 예를 들어, 조성물과 진핵 세포의 직접적인 접촉에 의해 직접적으로 전달된다. 상기 언급된 조성물은 액체, 용액, 현탁액, 에멀젼, 역 에멀젼, 콜로이드, 분산액, 겔, 리포좀, 미셀, 주사 가능한 물질, 에어로졸, 고체, 분말, 미립자, 나노입자 또는 이의 조합의 형태로 제공될 수 있고, (예를 들어, 세포벽 또는 세포막의 마모 또는 천공 또는 다르게는 파괴를 통해, 분무 또는 침지(dipping) 또는 소킹(soaking) 또는 다르게는 직접적인 접촉에 의해, 미세주입에 의해) 진핵 세포, 진핵 조직, 진핵 기관, 진핵 유기체, 식물, 식물 부분, 식물 세포 또는 식물 외식편에 직접 적용될 수 있다. 예를 들어, 식물 세포 또는 식물 원형질체를 액체 SSAP, 엑소뉴클레아제 및/또는 SSB-함유 조성물에 소킹시킴으로써, 작용제를 식물 세포에 전달한다. 특정 구현예에서, 작용제-함유 조성물은 예를 들어, 진공 침윤 또는 유체역학 또는 유체 압력의 인가를 사용하여 음압 또는 양압을 사용하여 전달된다. 특정 구현예에서, 작용제-함유 조성물은 예를 들어, 미세주입에 의해 또는 예를 들어, 물리적 처리에 의한, 예컨대 음압 또는 양압, 전단력 또는 화학적 또는 물리적 전달제, 예컨대 계면활성제, 리포좀 또는 나노입자를 사용한 처리의 적용에 의한 세포벽 또는 세포막의 파괴 또는 변형에 의해 식물 세포 또는 식물 원형질체 내로 도입되며; 예를 들어, 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2014/0287509호에 기술된 바와 같은 세포-변형 수축을 통한 미세유체 흐름을 사용한 세포로의 물질의 전달을 참조한다. 진핵 세포, 식물 세포 또는 식물 원형질체에 작용제-함유 조성물을 전달하는 데 유용한 다른 기법은 하기를 포함한다: 초음파 또는 음파처리; 진동, 마찰, 전단 스트레스, 와동(vortexing), 캐비테이션(cavitation); 원심분리 또는 기계적인 힘의 적용; 기계적 세포벽 또는 세포막 변형 또는 파괴; 효소적 세포벽 또는 세포막 파괴 또는 투과화; 마모 또는 기계적 파상(scarification)(예를 들어, 카보런덤 또른 기타 미립자 마모제를 사용한 마모 또는 파일(file) 또는 사포를 사용한 파상) 또는 화학적 파상(예를 들어, 산 또는 가성제를 사용한 처리); 및 전기천공법. 특정 구현예에서, 작용제-함유 조성물은 작용제(예를 들어, SSAP, 엑소뉴클레아제, SSB, 서열-특이적 엔도뉴클레아제 및/또는 가이드 RNA)를 인코딩하는 폴리뉴클레오티드를 사용한 식물 세포 또는 식물 원형질체의 박테리아로 매개된(예를 들어, 아그로박테리움 종, 리조비움 종, 시노리조비움 종, 메소리조비움 종, 브라디리조비움 종, 아조박터 종, 필로박테리움 종) 트랜스펙션에 의해 제공되며; 예를 들어, 문헌[Broothaerts et al. (2005) Nature, 433:629 - 633]을 참조한다. 이들 기법 또는 이들의 조합 중 임의의 것은 대안적으로 식물 세포가 이후에 선택적으로 수득되거나 단리되는 식물 외식편, 식물 부분 또는 조직 또는 온전한 식물(또는 종자)에서 사용되며; 특정 구현예에서, 작용제-함유 조성물은 식물 세포가 단리된 후 개별 단계에서 전달된다. 특정 구현예에서, 상기 언급된 방법을 사용하여 게놈 편집 분자를 진핵 세포(예를 들어, 식물 세포) 내로 도입할 수도 있다.
구현예들에서, HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB를 진핵 세포(예를 들어, 식물 세포)에 전달하는 데 사용되는 처리는 하나 이상의 적절한 온도, 예를 들어, 냉각 또는 저온 스트레스(정상적인 식물 성장이 발생하는 온도 미만의 온도에 대한 노출) 또는 가열 또는 고온 스트레스(정상적인 식물 성장이 발생하는 온도 초과의 온도에 대한 노출) 또는 상이한 온도의 조합으로 처리하는 것을 포함할 수 있는 구체적인 열 체제 하에 수행된다. 특정 구현예에서, 구체적인 열 체제는 작용제 전달로부터 분리된 하나 이상의 단계에서 식물 세포 상에서, 또는 식물 세포 또는 식물 원형질체가 이후에 수득되거나 단리되는 식물, 식물 외식편 또는 식물 부분 상에서 수행된다. 특정 구현예에서, 상기 언급된 방법을 사용하여 게놈 편집 분자를 진핵 세포 내로 도입할 수도 있다.
본원에 제공되는 식물 부분, 시스템, 방법 및 조성물의 특정 구현예에서, 전체 식물 또는 식물 부분 또는 종자, 또는 단리된 식물 세포, 식물 외식편, 또는 식물 세포 또는 식물 원형질체가 수득되거나 단리되는 식물 또는 식물 부분은 적어도 하나의 화학적, 효소적 또는 물리적 작용제 또는 이의 조합을 포함할 수 있는 하나 이상의 전달 작용제로 처리된다. 특정 구현예에서, HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB는 전달을 위하여 하나 이상의 화학적, 효소적 또는 물리적 작용제를 추가로 포함한다. 화학적, 효소적 또는 물리적 작용제로의 처리는 작용제 전달과 동시에, 또는 작용제 전달 이전의 또는 이후의 하나 이상의 개별 단계에서 수행될 수 있다. 특정 구현예에서, 화학적, 효소적 또는 물리적 작용제 또는 이들의 조합은 폴리뉴클레오티드 조성물과, 공여자 주형 폴리뉴클레오티드와, SSAP, 엑소뉴클레아제 및/또는 SSB와 회합되거나 복합체화되며; 이러한 회합 또는 복합체의 예는 비-공유적 상호작용(예를 들어, 이온성 또는 정전기적 상호작용, 소수성 또는 친수성 상호작용, 리포좀, 미셀 또는 기타 이종 조성물의 형성) 및 공유적 상호작용(예를 들어, 펩티드 결합, 교차-결합제를 사용하여 형성된 결합)을 포함하는 것들을 포함한다. 비-제한적인 예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 양이온성 지질과의 리포좀 복합체로서 제공되고/되거나; SSAP, 엑소뉴클레아제 및/또는 SSB는 탄소 나노튜브와의 복합체로서 제공되고/되거나; SSAP, 엑소뉴클레아제 및/또는 SSB는 작용제와 세포-투과 펩티드 간의 융합 단백질로서 제공된다. SSAP, 엑소뉴클레아제 및/또는 SSB를 운반하는 데 유용한 작용제의 예는 문헌[Zhang et al. (2007) J. Controlled Release, 123:1 - 10]에 의해 검토된 다양한 양이온성 리포좀 및 폴리머 나노입자 및 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2014/0356414 A1호에 기술된 교차-결합된 다층 리포좀을 포함한다. 상기 언급된 임의의 구현예에서, 상기 언급된 방법을 사용하여 게놈-편집 분자를 진핵 세포(예를 들어, 식물 세포) 내로 도입할 수도 있는 것이 추가로 고려된다.
특정 구현예에서, HDR 빈도를 증가시킬 수 있는 SSAP, 엑소뉴클레아제 및/또는 SSB 단백질 또는 이를 인코딩하는 폴리뉴클레오티드를 전달하기 위해 사용되는 화학적 작용제는 하기를 포함할 수 있다:
(a) 용매(예를 들어, 물, 디메틸술폭시드, 디메틸포름아미드, 아세토니트릴, N-피롤리딘, 피리딘, 헥사메틸포스포르아미드, 알코올, 알칸, 알켄, 디옥산, 폴리에틸렌 글리콜, 및 물과 혼화 가능하거나 유화 가능하거나, 비-수성계에서 포스포뉴클레오티드를 용해시킬 기타 용매);
(b) 플루오로카본(예를 들어, 퍼플루오로데칼린, 퍼플루오로메틸데칼린);
(c) 글리콜 또는 폴리올(예를 들어, 프로필렌 글리콜, 폴리에틸렌 글리콜);
(d) 계면활성제, 예를 들어, 양이온성 계면활성제, 음이온성 계면활성제, 비-이온성 계면활성제 및 양쪽성 계면활성제, 예를 들어, 알킬 또는 아릴 술페이트, 포스페이트, 술포네이트 또는 카복실레이트; 일차, 이차 또는 삼차 아민; 사차 암모늄 염; 술타인(sultaine), 베타인; 양이온성 지질; 인지질; 탈로아민; 담즙산, 예컨대 콜산; 장쇄 알코올; 오르가노실리콘(organosilicone) 계면활성제, 예를 들어, 비이온성 오르가노실리콘 계면활성제, 예컨대 트리실록산 에톡실레이트 계면활성제 또는 실리콘 폴리에테르 코폴리머, 예컨대 폴리알킬렌 옥시드 변형된 헵타메틸 트리실록산 및 알릴옥시폴리프로필렌 글리콜 메틸에테르(CAS 번호 27306-78-1 및 EPA 번호 CAL. REG. NO. 5905-50073-AA를 갖는 SILWET L-77TM 브랜드 계면활성제로서 상업적으로 입수 가능, 모멘티브 퍼포먼스 머티리얼즈, 인코포레이티드(Momentive Performance Materials, Inc.), 미국 뉴욕주 올버니 소재)의 코폴리머; 유용한 계면활성제의 구체적인 예에는 라우릴황산나트륨, 트윈(Tween) 시리즈의 계면활성제, 트리톤(Triton)-X100, 트리톤-X114, CHAPS 및 CHAPSO, 터지톨(Tergitol)-형 NP-40, 노니데트(Nonidet) P-40이 포함됨;
(e) 지질, 지질단백질, 지질다당류;
(f) 산, 염기, 가성제;
(g) 펩티드, 단백질 또는 효소(예를 들어, 셀룰라제, 펙톨리아제, 마세로엔자임(maceroenzyme), 펙티나제), 예를 들어, 세포-투과 또는 포어-형성 펩티드(예를 들어, (BO100)2K8, 진스크립트(Genscript); 폴리-라이신, 폴리-아르기닌 또는 폴리-호모아르기닌 펩티드; 감마 제인(zein), 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제2011/0247100호 참조; 인간 면역결핍 바이러스 1형("HIV-1 Tat") 및 기타 Tat 단백질의 전사 활성화인자, 예를 들어, www[dot]lifetein[dot]com/Cell_Penetrating_Peptides[dot]html 및 문헌[Jrver (2012) Mol. Therapy-Nucleic acids, 1:e27,1 - 17] 참조); 옥타-아르기닌 또는 노나-아르기닌; 폴리-호모아르기닌(문헌[Unnamalai et al. (2004) FEBS Letters, 566:307 - 310] 참조); crdd[dot]osdd[dot]net/raghava/cppsite/에서 공개적으로 이용 가능한 세포-투과 펩티드 CPPsite 2.0의 데이터베이스도 또한 참조;
(h) RNase 저해제;
(i) 양이온성 분지형 또는 선형 폴리머, 예컨대 키토산, 폴리-라이신, DEAE-덱스트란, 폴리비닐피롤리돈("PVP") 또는 폴리에틸렌이민("PEI", 예를 들어, PEI, 분지형, MW 25,000, CAS# 9002-98-6; PEI, 선형, MW 5000, CAS# 9002-98-6; PEI 선형, MW 2500, CAS# 9002-98-6);
(j) 덴드리머(dendrimer)(예를 들어, 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제2011/0093982호 참조);
(k) 반대-이온, 아민 또는 폴리아민(예를 들어, 스페르민, 스페르미딘, 푸트레신), 삼투물질, 완충제 및 염(예를 들어, 인산칼슘, 인산암모늄);
(l) 폴리뉴클레오티드(예를 들어, 비-특이적 이중-가닥 DNA, 연어 정자 DNA);
(m) 트랜스펙션 작용제(예를 들어, 리포펙틴(Lipofectin)®, 리포펙타민(Lipofectamine)® 및 올리고펙타민(Oligofectamine)®, 및 인비보펙타민(Invivofectamine)®(전부 미국 매사츠세츠주 월섬 소재의 써모 피셔 사이언티픽(Thermo Fisher Scientific)사 제품), 펩펙트(PepFect)(문헌[Ezzat et al. (2011) Nucleic acids Res., 39:5284 - 5298] 참조), 트랜스잇(TransIt)® 트랜스펙션 시약(미국 위스콘신주 매디슨 소재의 미루스 바이오, 엘엘씨(Mirus Bio, LLC)) 및 문헌[Lu et al. (2010) J. Agric. Food Chem., 58:2288 - 2294]에 기술된 바와 같은 폴리-라이신, 폴리-호모아르기닌 및 폴리-아르기닌 분자, 예를 들어, 옥토-아르기닌 및 노노-아르기닌);
(n) 항생제, 예를 들어, 비-특이적인 DNA 이중-가닥-파단-유도제(예를 들어, 플레오마이신(phleomycin), 블레오마이신(bleomycin), 탈리소마이신(talisomycin)); 및/또는
(o) 산화방지제(예를 들어, 글루타티온, 디티오트레이톨, 아스코르베이트).
상기 언급된 임의의 구현예에서, 상기 언급된 화학적 작용제가 또한 게놈-편집 분자를 진핵 세포(예를 들어, 식물 세포) 내로 도입하기 위해 사용될 수 있는 것이 추가로 고려된다.
특정 구현예에서, 화학적 작용제는 HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB와 동시에 제공된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 하나 이상의 화학적 작용제와 공유적으로 또는 비-공유적으로 연결되거나, 이와 복합체화되며; 예를 들어, SSAP, 엑소뉴클레아제, SSB 및/또는 서열-특이적 엔도뉴클레아제는 펩티드 또는 단백질(예를 들어, 세포-투과 펩티드 또는 포어-형성 펩티드)에 공유적으로 연결되거나, 양이온성 지질, 다가양이온(예를 들어, 폴리아민) 또는 양이온성 폴리머(예를 들어, PEI)와 비공유적으로 복합체화될 수 있다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB는 하나 이상의 화학적 작용제와 복합체화되어, 예를 들어, 용액, 리포좀, 미셀, 에멀젼, 역 에멀젼, 현탁액, 콜로이드 또는 겔을 형성한다. 상기 언급된 임의의 구현예에서, 폴리뉴클레오티드 및/또는 폴리펩티드를 포함하는 게놈 편집 분자도 또한 상기 기술된 바와 같이 전달될 수 있는 것이 추가로 고려된다.
특정 구현예에서, HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB의 전달을 위한 물리적 작용제는 다양한 크기 범위 및 형상의 입자 또는 나노입자(예를 들어, 탄소, 규소, 탄화규소, 금, 텅스텐, 폴리머 또는 세라믹과 같은 물질로 제조된 입자 또는 나노입자), 자성 입자 또는 나노입자(예를 들어, silenceMag MagnetotransfectionTM 작용제, 오즈 바이오사이언스즈(OZ Biosciences), 미국 캘리포니아주 샌 디에고 소재), 연마제 또는 파상제, 니들(needle) 또는 마이크로니들(microneedle), 매트릭스 및 그리드(grid)로 이루어진 군으로부터 선택되는 적어도 하나이다. 특정 구현예에서, 미립자 및 나노미립자는 SSAP, 엑소뉴클레아제 및/또는 SSB의 전달에 유용하다. 유용한 미립자 및 나노입자는 금속(예를 들어, 금, 은, 텅스텐, 철, 세륨), 세라믹(예를 들어, 산화알루미늄, 탄화규소, 질화규소, 탄화텅스텐), 폴리머(예를 들어, 폴리스티렌, 폴리디아세틸렌 및 폴리(3,4-에틸렌디옥시티오펜) 수화물), 반도체(예를 들어, 양자점), 규소(예를 들어, 탄화규소), 탄소(예를 들어, 그래파이트, 그래핀, 산화그래핀 또는 탄소 나노시트, 나노복합체 또는 나노튜브), 및 합성물(예를 들어, 폴리비닐카르바졸/그래핀, 폴리스티렌/그래핀, 백금/그래핀, 팔라듐/그래핀 나노복합물)로 제조된 것들을 포함한다. 특정 구현예에서, 이러한 미립자 및 나노미립자는 추가로 공유적으로 또는 비-공유적으로 작용화되거나, 개질제 또는 교차-결합된 물질, 예컨대 폴리머(예를 들어, 선형 또는 분지형 폴리에틸렌이민, 폴리-라이신), 폴리뉴클레오티드(예를 들어, DNA 또는 RNA), 다당류, 지질, 폴리글리콜(예를 들어, 폴리에틸렌 글리콜, 티올화 폴리에틸렌 글리콜), 폴리펩티드 또는 단백질, 및 검출 가능한 표지(예를 들어, 형광단, 항원, 항체 또는 양자점)를 추가로 포함한다. 다양한 구현예에서, 이러한 미립자 및 나노입자는 중성이거나, 양전하를 띠거나 음전하를 띤다. 미립자를 포함하는 조성물의 구현예는 예를 들어, 액체, 콜로이드, 분산액, 현탁액, 에어로졸, 겔 및 고체로서 제형화된 것들을 포함한다. 구현예는 표면 또는 지지체에 부착된 나노입자, 예를 들어, 규소 또는 구리 웨이퍼 기판 상에 수직으로 정렬된 탄소 나노튜브의 어레이를 포함한다. 구현예는 비올리스틱-형 기법에 의해 또는 자력으로 전달되는 미립자(예를 들어, 금 또는 텅스텐 또는 자성 입자)를 포함하는 폴리뉴클레오티드 조성물을 포함한다. 비올리스틱에 사용되는 입자의 크기는 일반적으로 "마이크로입자" 범위, 예를 들어, 0.6, 1.0, 및 1.6 마이크로미터 크기 범위의 금 마이크로캐리어(예를 들어, 헬리오스(Helios)® 유전자 총(Gene Gun) 시스템에 대한 설명 매뉴얼, 바이오-라드(Bio-Rad), 미국 캘리포니아주 허큘레스 소재; 문헌[Randolph-Anderson et al. (2015) "Sub-micron gold particles are superior to larger particles for efficient Biolistic® transformation of organelles and some cell types", Bio-Rad US/EG Bulletin 2015] 참조)이지만; 더 큰(40 나노미터) 나노입자를 사용한 성공적인 비올리스틱 전달이 배양된 동물 세포에서 보고된 바 있으며; 문헌[O'Brian and Lummis (2011) BMC Biotechnol., 11:66 - 71]을 참조한다. 유용한 미립자의 다른 구현예에는 일반적으로 나노미터(nm) 크기 범위 또는 1 마이크로미터 미만인, 예를 들어, 약 1 nm 미만, 약 3 nm 미만, 약 5 nm 미만, 약 10 nm 미만, 약 20 nm 미만, 약 40 nm 미만, 약 60 nm 미만, 약 80 nm 미만, 및 약 100 nm 미만의 직경을 갖는 나노입자가 있다. 상업적으로 입수 가능한 나노입자의 구체적인 비제한적인 구현예(모두 미국 미주리주 세인트 루이스 소재의 시그마-알드리치 코포레이션(Sigma-Aldrich Corp.)사 제품)에는 5, 10 또는 15 nm의 직경을 갖는 금 나노입자; 10, 20, 40, 60 또는 100 nm의 입자 크기를 갖는 은 나노입자; 25 nm 미만의 입자 크기의 팔라듐 "나노분말"; 예를 들어, 0.7 내지 1.1, 1.3 내지 2.3, 0.7 내지 0.9 또는 0.7 내지 1.3 nm의 직경을 갖는 또는 2 내지 10 nm x 1 내지 5 마이크로미터, 6 내지 9 nm x 5 마이크로미터, 7 내지 15 nm x 0.5 내지 10 마이크로미터, 7 내지 12 nm x 0.5 내지 10 마이크로미터, 110 내지 170 nm x 5 내지 9 마이크로미터, 6 내지 13 nm x 2.5 내지 20 마이크로미터의 나노튜브 번들 직경을 갖는 단일-, 이중-, 및 다중-벽의 탄소 나노튜브가 포함된다. 특정 구현예에서, SSAP, 엑소뉴클레아제 및/또는 SSB의 전달을 위한 물리적 작용제는 금, 규소, 세륨 또는 탄소와 같은 물질, 예를 들어, 금 또는 금-코팅 나노입자, 탄화규소 위스커(whisker), 카보런덤, 다공성 실리카 나노입자, 젤라틴/실리카 나노입자, 나노세리아(nanoceria) 또는 산화세륨 나노입자(CNP), 탄소 나노튜브(CNT), 예컨대 단일-, 이중-, 및 다중-벽의 탄소 나노튜브 및 이들의 화학적으로 작용화된 형태(예를 들어, 아미드, 아미노, 카복실산, 술폰산 또는 폴리에틸렌 글리콜 모이어티로 작용화된 탄소 나노튜브), 및 그래핀 또는 산화그래핀 또는 그래핀 복합체를 포함할 수 있다. SSAP, 엑소뉴클레아제 및/또는 SSB의 전달을 위해 조정될 수 있는 이러한 물리적 작용제는 문헌[Wong et al. (2016) Nano Lett., 16:1161 - 1172]; 문헌[Giraldo et al. (2014) Nature Materials, 13:400-409]; 문헌[Shen et al. (2012) Theranostics, 2:283 - 294]; 문헌[Kim et al. (2011) Bioconjugate Chem., 22:2558 - 2567]; 문헌[Wang et al. (2010) J. Am. Chem. Soc. Comm., 132:9274 - 9276]; 문헌[Zhao et al. (2016) Nanoscale Res. Lett., 11:195 - 203]; 및 문헌[Choi et al. (2016) J. Controlled Release, 235:222 - 235]에 개시된 것들을 포함한다. 또한, 예를 들어, 전부 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2010/0311168호, 제2012/0023619호, 제2012/0244569호, 제2013/0145488호, 제2013/0185823호, 제2014/0096284호, 제2015/0040268호, 제2015/0047074호 및 제2015/0208663호에 개시된 다양한 유형의 입자 및 나노입자, 이들의 제제, 및 예를 들어, 폴리뉴클레오티드 및 폴리펩티드를 세포에 전달하는 데 이들을 사용하기 위한 방법도 참조한다. 상기 언급된 임의의 구현예에서, 폴리뉴클레오티드 및/또는 폴리펩티드를 포함하는 게놈 편집 분자도 또한 상기 기술된 바와 같이 전달될 수 있는 것이 추가로 고려된다.
일부 구현예에서, 본원에 사용된 바와 같은 "제공된"은 세포의 핵 내에서 성분을 접촉시키는 것을 포함한다. 일부 구현예에서, 하나 이상의 성분의 제공은 폴리펩티드의 전달의 형태로 이루어진다. 일부 구현예에서, 하나 이상의 성분의 전달은 폴리뉴클레오티드와 복합체화된 폴리펩티드의 형태로 이루어진다. 일부 구현예에서, 하나 이상의 성분의 전달은 리보핵단백질(RNP)의 형태로 이루어진다. 일부 구현예에서, Cas 및 가이드 RNA는 리보핵단백질로서 전달된다. 일부 구현예에서, RNP는 리포펙션 또는 전기천공법을 사용하여 세포에 전달된다. 일부 구현예에서, 폴리펩티드 또는 RNP는 비올리스틱을 통해 세포에 전달된다. 일부 구현예에서, 폴리펩티드 또는 RNP는 PEG-매개된 트랜스펙션을 통해 세포에 전달된다. 일부 구현예에서, 성분은 유성 교배에 의해 전달된다.
일부 구현예에서, 성분은 RNA로서 또는 DNA로서 제공된다. 예를 들어, 일부 구현예에서, 하나 이상의 성분은 mRNA로서 제공된다. 일부 구현예에서, mRNA는 성분 중 하나인 단백질을 인코딩한다. 일부 구현예에서, mRNA는 세포에서 번역되어, 하나 이상의 성분을 생성한다.
일부 구현예에서, 하나 이상의 성분은 염색체 내로 통합된 핵산으로서 제공된다.
일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상은 i) 내지 v) 중 하나 이상을 포함하는 전구 세포에 의해 제공된다. 일부 구현예에서, 전구 세포는 본원에 기술된 세포, 예를 들어, 식물, 동물, 진균 또는 기타 진핵 세포 중 임의의 것이다. 일부 구현예에서, 전구 세포는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나를 포함하지 않는다. 일부 구현예에서, 전구 세포에 의해 포함되지 않는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나는 전구 세포로의 폴리펩티드, DNA 또는 mRNA의 전달 및/또는 전구 세포의 유성 교배에 의해 이후에 제공된다. 일부 구현예에서, 성분은 하기 표 A에 나타낸 바와 같이 제공된다.
[표 A]
xi. 유전자 편집 분자
유전자 편집 분자가 뉴클레아제 활성이 결핍된 RNA 가이드된 DNA 결합 폴리펩티드(또는 이들을 인코딩하는 폴리뉴클레오티드)를 추가로 포함하는 조성물에 제공되는 gRNA(또는 gRNA를 인코딩하는 폴리뉴클레오티드)를 포함하는 특정 구현예에서, 하나 이상의 화학적, 효소적 또는 물리적 작용제가 유사하게 사용될 수 있다. 특정 구현예에서, RNA 가이드 및 뉴클레아제 활성 결핍 RNA-가이드된 DNA 결합 폴리펩티드(ndRGDBP) 또는 이를 인코딩하는 폴리뉴클레오티드는 개별적으로, 예를 들어, 개별 조성물에서 제공된다. 이러한 조성물은 폴리뉴클레오티드 조성물에 유용한 것으로 상기 기술된 것들과 같은 다른 화학적 또는 물리적 작용제(예를 들어, 용매, 계면활성제, 단백질 또는 효소, 트랜스펙션 작용제, 미립자 또는 나노미립자)를 포함할 수 있다. 예를 들어, 다공성 실리카 나노입자는 DNA 재조합효소를 옥수수 세포 내로 전달하는 데 유용하며; 예를 들어, 문헌[Martin-Ortigosa et al. (2015) Plant Physiol., 164:537 - 547]을 참조하고, ndRGDBP 또는 이를 인코딩하는 폴리뉴클레오티드를 옥수수 또는 기타 식물 세포 내로 제공하기 위해 조정될 수 있다. 일 구현예에서, 폴리뉴클레오티드 조성물은 gRNA 및 ndRGDBP를 포함하며, 계면활성제 및 ndRGDBP에 작동 가능하게 연결될 수 있는 세포-투과 펩티드(CPP)를 추가로 포함한다. 일 구현예에서, 폴리뉴클레오티드 조성물은 gRNA 및 ndRGDBP 둘 모두를 인코딩하는 플라스미드 또는 바이러스 벡터를 포함하며, 계면활성제 및 탄소 나노튜브를 추가로 포함한다. 일 구현예에서, 폴리뉴클레오티드 조성물은 다수의 gRNA 및 ndRGDBP를 인코딩하는 mRNA를 포함하며, 입자(예를 들어, 금 또는 텅스텐 입자)를 추가로 포함하며, 폴리뉴클레오티드 조성물은 비올리스틱에 의해 식물 세포 또는 식물 원형질체로 전달된다. 상기 언급된 구현예 중 임의의 것에서, 게놈 편집 분자를 포함하는 다른 관심 폴리뉴클레오티드가 또한, gRNA 및 ndRGDBP의 전달 이전에, 그 동안 또는 그 이후에 전달될 수 있는 것이 추가로 고려된다.
특정 구현예에서, 식물 세포가 수득되거나 단리되는 식물, 식물 외식편 또는 식물 부분을, 식물 세포를 수득하거나, 단리하거나, 처리하는 과정에서 하나 이상의 화학적, 효소적 또는 물리적 작용제(들)로 처리한다. 특정 구현예에서, 식물 세포, 식물, 식물 외식편 또는 식물 부분을 연마제, 가성제, 계면활성제, 예컨대 Silwet L-77 또는 양이온성 지질 또는 셀룰라제와 같은 효소로 처리한다. 상기 언급된 구현예 중 임의의 것에서, 게놈 편집 분자를 포함하는 다른 관심 폴리뉴클레오티드가 또한, HDR 촉진제의 전달 이전에, 그 동안 또는 그 이후에 전달될 수 있는 것이 추가로 고려된다.
특정 구현예에서, 개별적으로 또는 HDR 빈도를 증가시키는 SSAP, 엑소뉴클레아제 및/또는 SSB를 인코딩하는 폴리뉴클레오티드 조성물과 함께, 화학적, 효소적 또는 물리적 작용제 중 하나 이상은 식물 세포가 처리되거나, 수득되거나, 단리되는 식물 위치, 부분 또는 조직 이외의 식물 또는 식물 부분 내의 위치에 제공/적용된다. 특정 구현예에서, 폴리뉴클레오티드 조성물은 인접 또는 원위 세포 또는 조직에 적용되며, 식물 세포가 이후에 단리되는 분열조직에 (예를 들어, 관다발계를 통해 또는 세포-대-세포 이동에 의해) 수송된다. 특정 구현예에서, 폴리뉴클레오티드-함유 조성물은 종자 또는 종자 단편 또는 접합자 또는 체세포 배를 폴리뉴클레오티드-함유 조성물에 소킹함으로써 적용되며, 이에 의해, 폴리뉴클레오티드는 식물 세포에 전달된다. 특정 구현예에서, 꽃눈 또는 경단(shoot tip)을 폴리뉴클레오티드-함유 조성물과 접촉시킴으로써, 폴리뉴클레오티드는 원하는 식물 세포가 수득되는 꽃눈 또는 경단 내의 세포로 전달된다. 특정 구현예에서, 폴리뉴클레오티드-함유 조성물을 식물의 또는 식물의 부분(예를 들어, 잎 표면)의 표면에 적용함으로써, 폴리뉴클레오티드(들)는 원하는 식물 세포가 수득되는 식물의 조직으로 전달된다. 특정 구현예에서, 전체 식물 또는 식물 조직은 폴리뉴클레오티드-함유 조성물의 입자- 또는 나노입자-매개된 전달(예를 들어, 비올리스틱 또는 탄소 나노튜브 또는 나노입자 전달)로 처리됨으로써, 폴리뉴클레오티드(들)는 식물 세포가 이후에 수득되는 세포 또는 조직으로 전달된다. 상기 언급된 구현예 중 임의의 것에서, 게놈 편집 분자를 포함하는 다른 관심 폴리뉴클레오티드가 또한, HDR 촉진제의 전달 이전에, 그 동안 또는 그 이후에 전달될 수 있는 것이 추가로 고려된다.
게놈 편집 분자는 본원에 제공되는 증가된 HDR-매개된 게놈 변형 빈도를 갖는 식물 세포에서 유전학적 변형을 유도하기 위한 유전자 편집 분자를 포함한다. 특정 구현예에서, 이러한 게놈 편집 분자는 하기를 포함할 수 있다: (i) RNA-가이드된 뉴클레아제를 위한 RNA 가이드, RNA-가이드된 뉴클레아제를 위한 RNA 가이드를 인코딩하는 DNA로 이루어진 군으로부터 선택되는 폴리뉴클레오티드; (ii) RNA-가이드된 뉴클레아제, RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9, nCas9, V형 Cas 뉴클레아제, Cas12a, nCas12a, CasY, CasX, Cas12b, Cas12c, Cas12i, Cas14, 엔지니어링된 뉴클레아제, 코돈-최적화된 뉴클레아제, 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제로 이루어진 군으로부터 선택되는 뉴클레아제; (iii) 표적 뉴클레오티드 서열의 부위-특이적 절단을 유발할 수 있는 하나 이상의 뉴클레아제를 인코딩하는 폴리뉴클레오티드; 및/또는 (iv) 공여자 주형 DNA 분자. 특정 구현예에서, 적어도 하나의 전달제는 용매, 플루오로카본, 글리콜 또는 폴리올, 계면활성제; 일차, 이차 또는 삼차 아민 및 사차 암모늄 염; 오르가노실리콘 계면활성제; 지질, 지질단백질, 지질다당류; 산, 염기, 가소제; 펩티드, 단백질 또는 효소; 세포-투과 펩티드; RNase 저해제; 양이온성 분지형 또는 선형 폴리머; 덴드리머; 반대-이온, 아민 또는 폴리아민, 삼투물질, 완충제 및 염; 폴리뉴클레오티드; 트랜스펙션 작용제; 항생제; 킬레이트제, 예컨대 옥살산암모늄, EDTA, EGTA 또는 사이클로헥산 디아민 테트라아세테이트, 비-특이적인 DNA 이중-가닥-파단-유도제; 및 산화방지제; 입자 또는 나노입자, 자성 입자 또는 나노입자, 연마제 또는 파상제, 니들 또는 마이크로니들, 매트릭스 및 그리드로 이루어진 군으로부터 선택된다. 특정 구현예에서, 본원에 제공되는 세포를 포함하는 진핵 세포(예를 들어, 식물 세포), 시스템, 방법 또는 조성물은 (a) 적어도 하나의 Cas9, nCas9, Cas12a, nCas12a, CasY, CasX, Cas12b, Cas12c 또는 Cas12i 뉴클레아제 또는 닉카제를 갖는 적어도 하나의 세포; (b) 적어도 하나의 가이드 RNA; 및 (c) 선택적으로, 적어도 하나의 화학적, 효소적 또는 물리적 전달제를 추가로 포함한다.
본원에 제공된 세포, 시스템, 방법, 조성물 및 반응 혼합물에 사용되는 유전자 편집 분자는 이중-가닥 DNA 내에, 예컨대 게놈 DNA 내에 또는 게놈 DNA 내에 위치한 표적 유전자 및 동반 가이드 RNA 또는 공여자 주형 폴리뉴클레오티드 내에 이중-가닥 파단("DSB")을 도입할 수 있는 분자를 포함한다. 이러한 유전자 편집 분자의 예는 하기를 포함한다: (a) RNA-가이드된 뉴클레아제, RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9, nCas9 닉카제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, nCas12a 닉카제, CasY, CasX, Cas12b, Cas12c, Cas12i, Cas14 엔지니어링된 뉴클레아제, 코돈-최적화된 뉴클레아제, 아연-핑거 뉴클레아제(ZFN) 또는 닉카제, 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제) 또는 닉카제, 아르고노트 및 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제로 이루어진 군으로부터 선택되는 뉴클레아제; (b) 표적 편집 부위의 부위-특이적 변경(예컨대 DSB의 도입)을 유발할 수 있는 하나 이상의 뉴클레아제를 인코딩하는 폴리뉴클레오티드; (c) RNA-가이드된 뉴클레아제를 위한 가이드 RNA(gRNA) 또는 RNA-가이드된 뉴클레아제를 위한 gRNA를 인코딩하는 DNA; 및 (d) 공여자 주형 폴리뉴클레오티드.
CRISPR-형 게놈 편집은 본원에 제공된 진핵 세포(예를 들어, 식물 세포), 시스템, 방법 및 조성물에 사용하기 위하여 몇몇의 방식으로 조정될 수 있다. CRISPR 요소, 즉, CRISPR 엔도뉴클레아제 및 CRISPR 단일-가이드 RNA 또는 이를 인코딩하는 폴리뉴클레오티드를 포함하는 유전자 편집 분자는 자손에서 발생하는 CRISPR 요소 또는 선택적 유전학적 마커의 잔류물 없이 게놈 편집을 유발하는 데 유용하다. 특정 구현예에서, CRISPR 요소는 단리된 분자로서, 무세포 합성 과정(예를 들어, 시험관내 번역)의 단리된 또는 반-정제된 생성물로서, 또는 세포-기반 합성 과정(예를 들어, 예컨대 박테리아 또는 기타 세포 용해물)에서의 단리된 또는 반-정제된 생성물로서 진핵 세포(예를 들어, 식물 세포), 시스템, 방법 및 조성물에 직접적으로 제공된다. 특정 구현예에서, 게놈-삽입된 CRISPR 요소는 본원에서 제공하는 시스템, 방법 및 조성물에 사용하기 위해 조정된 식물 계통에서 유용하다. 특정 구현예에서, 본원에 제공된 시스템, 방법 및 조성물에 사용되는 식물 또는 식물 세포는 CRISPR 엔도뉴클레아제(예를 들어, Cas9, Cpf1-형 또는 기타 CRISPR 엔도뉴클레아제)를 발현하는 전이유전자를 포함할 수 있다. 특정 구현예에서, 독특한 PAM 인식 부위를 갖는 하나 이상의 CRISPR 엔도뉴클레아제가 사용될 수 있다. 가이드 RNA(sgRNA 또는 crRNA 및 tracrRNA)는 프로토스페이서 인접 모티프(PAM) 서열에 인접한 gDNA 표적 편집 부위의 서열에 특이적으로 결합할 수 있는 RNA-가이드된 엔도뉴클레아제/가이드 RNA 복합체를 형성한다. RNA-가이드된 엔도뉴클레아제의 유형은 전형적으로 적합한 PAM 부위의 위치 및 crRNA 또는 sgRNA의 설계에 영향을 미친다. G-풍부 PAM 부위, 예를 들어, 5'-NGG는 전형적으로 Cas9 단백질과 함께 사용되는 crRNA 또는 sgRNA의 설계를 위해 표적화된다. T-풍부 PAM 부위(예를 들어, 5'-TTTV [1], 여기서 "V"는 A, C 또는 G임)는 전형적으로 Cas12a 단백질과 함께 사용되는 crRNA 또는 sgRNA의 설계를 위해 표적화된다(예를 들어, SEQ ID NO:27, 28, 29 및 30). Cpf1 엔도뉴클레아제 및 상응하는 가이드 RNA 및 PAM 부위는 미국 특허 출원 공개 제2016/0208243 A1호에 개시되어 있으며, 이는 Cpf1 엔도뉴클레아제 및 가이드 RNA 및 PAM 부위를 인코딩하는 DNA의 그의 개시에 대하여 본원에 참조로 포함된다. 식물 게놈 내로 통합되거나 달리 식물에 제공되는 CRISPR 엔도뉴클레아제와 상호작용하는 매우 다양한 CRISPR 가이드 RNA 중 하나 이상의 도입은 원하는 표현형 또는 형질을 제공하기 위한 유전학적 편집을 위해, 형질 스크리닝을 위해 또는 유전자 편집 매개된 형질 이입을 위해(예를 들어, 반복친으로의 역교배 없이 또는 반복친으로의 제한된 역교배와 함께 형질을 새로운 유전자형에 도입하기 위해) 유용하다. 다중 엔도뉴클레아제는 염색체 DNA 또는 에피솜 DNA 중 어느 하나에서 공간적으로 또는 시간적으로 분리된 방식으로 다수의 게놈 편집을 허용하도록 적절한 프로모터를 갖는 발현 카세트에 제공될 수 있다.
진핵생물의 유전자를 편집하기 위한 CRISPR 기술은 미국 특허 출원 공개 제2016/0138008A1호 및 제US2015/0344912A1호, 및 미국 특허 제8,697,359호, 제8,771,945호, 제8,945,839호, 제8,999,641호, 제8,993,233호, 제8,895,308호, 8,865,406호, 제8,889,418호, 제8,871,445호, 제8,889,356호, 제8,932,814호, 제8,795,965호, 및 제8,906,616호에 개시된다. Cpf1 엔도뉴클레아제 및 상응하는 가이드 RNA 및 PAM 부위는 미국 특허 출원 공개 제2016/0208243 A1호에 개시된다. 게놈을 편집하는 데 유용한 다른 CRISPR 뉴클레아제는 Cas12b 및 Cas12c(문헌[Shmakov et al. (2015) Mol. Cell, 60:385 - 397] 참조) 및 CasX 및 CasY(문헌[Burstein et al. (2016) Nature, doi:10.1038/nature21059] 참조)를 포함한다. CRISPR 가이드 RNA 및 식물 코돈-최적화된 CRISPR Cas9 엔도뉴클레아제를 발현하기 위한 식물 RNA 프로모터는 국제 특허 출원 제PCT/US2015/018104호(WO 2015/131101호로서 공개 및 미국 가출원 제61/945,700호에 대해 우선권 주장)에 개시된다. 식물에서 게놈 편집을 위한 CRISPR 기술의 이용 방법은 미국 특허 출원 공개 제US 2015/0082478A1호 및 제US 2015/0059010A1호 및 국제 특허 출원 제PCT/US2015/038767 A1호(WO 2016/007347호로서 공개 및 미국 가출원 제62/023,246호에 대해 우선권 주장)에 개시된다. 이 단락에서 언급된 모든 특허 공보는 그들 전체가 본원에 참조로 포함된다. 특정 구현예에서, 엔도뉴클레아제 인식 서열에서 표적 편집 부위의 절단 후에 블런트 말단을 남기는 RNA-가이드된 엔도뉴클레아제가 사용된다. 블런트-말단 절단 RNA-가이드된 엔도뉴클레아제는 Cas9, Cas12c 및 Cas12h를 포함한다(문헌[Yan et al., 2019]). 특정 구현예에서, 엔도뉴클레아제 인식 서열의 절단 후에 스태거형(staggered) 단일 가닥 DNA 오버행 말단을 남기는 RNA-가이드된 엔도뉴클레아제가 사용된다. 스태거형-말단 절단 RNA-가이드된 엔도뉴클레아제는 Cas12a, Cas12b 및 Cas12e를 포함한다.
방법, 시스템, 조성물, 진핵 세포(예를 들어, 식물 세포)는 또한 표적 편집 부위 내의 엔도뉴클레아제 인식 서열에서 dsDNA 내에 단일의 DNA 가닥을 절단하는 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 사용할 수 있다. dsDNA 표적 편집 부위에서의 단일의 DNA 가닥의 이러한 절단은 또한 본원 및 다른 곳에서 "닉킹"으로 지칭되며, 다양한 "닉카제" 또는 닉킹을 제공하는 시스템에 의해 시행될 수 있다. 사용될 수 있는 닉카제는 nCas9(D10A 아미노산 치환을 포함하는 Cas9), nCas12a(예를 들어, R1226A 아미노산 치환을 포함하는 Cas12a; 문헌[Yamano et al., 2016]), Cas12i(문헌[Yan et al. 2019], 예를 들어, 문헌[Kim et al., 2012]에 개시된 바와 같은 아연 핑거 닉카제), TALE 닉카제(예를 들어, 문헌[Wu et al., 2014]에 개시된 바와 같음) 또는 이들의 조합을 포함한다. 특정 구현예에서, 닉킹을 제공하는 시스템은 Cas 뉴클레아제(예를 들어, Cas9 및/또는 Cas12a) 및 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 가이드 RNA 분자를 포함할 수 있다(문헌[Fu et al., 2019]). 특정 구현예에서, 게놈 변형은 약 10개, 20개, 30개, 40개, 50개, 60개, 80개, 100개, 150개 또는 200개 이하의 염기쌍의 DNA에 의해 분리된 게놈 위치에서 단일 가닥 파단(즉, "닉")을 생성함으로써 표적 편집 부위 내로 도입될 수 있다. 특정한 예시적인 및 비제한적인 구현예에서, 2개의 닉카제(즉, nCas9, nCas12a, Cas12i, 아연 핑거 닉카제, TALE 닉카제, 이들의 조합 등을 포함하는 단일 가닥 DNA 파단을 도입하는 CAS 뉴클레아제) 또는 닉카제 시스템은 약 10개, 20개, 30개, 40개, 50개, 60개, 80개 또는 100개 이하의 염기쌍의 DNA에 의해 분리된 인접 부위에 대하여 절단을 이루도록 유도될 수 있다. RNA 가이드된 닉카제 및 RNA 가이드가 사용되는 경우에, RNA 가이드는 충분히 가까운(즉, 약 10개, 20개, 30개, 40개, 50개, 60개, 80개, 100개, 150개 또는 200개 이하의 염기쌍의 DNA에 의해 분리된) PAM 서열에 인접한다. 닉카제 또는 닉카제 시스템이 사용되는 상기 언급된 구현예 중 임의의 것에서, 한 가닥 내에 내부 파단을 갖는 dsDNA 기질을 인식할 수 있는 5'에서 3' 또는 3'에서 5' 엑소뉴클레아제 활성을 갖는 엑소뉴클레아제가 사용될 수 있다. 특정 구현예에서, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질은 닉카제 또는 닉카제 시스템, SSAP 및 SSB와 함께 사용될 수 있다.
유전자 편집을 위하여, CRISPR 어레이는 원하는 표적 DNA 서열에 상응하는 하나의 또는 다수의 가이드 RNA 서열을 함유하도록 설계될 수 있으며; 예를 들어, 문헌[Cong et al. (2013) Science, 339:819-823]; 문헌[Ran et al. (2013) Nature Protocols, 8:2281 - 2308]을 참조한다. 적어도 16개 또는 17개 뉴클레오티드의 gRNA 서열은 DNA 절단이 발생하기 위하여 Cas9에 의해 요구되며; Cpf1에 있어서, 적어도 16개 뉴클레오티드의 gRNA 서열은 검출 가능한 DNA 절단을 달성하기 위하여 필요하며, 적어도 18개 뉴클레오티드의 gRNA 서열은 시험관내에서의 효율적인 DNA 절단에 필요한 것으로 보고되었으며; 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다. 실시에서, 가이드 RNA 서열은 일반적으로 17개 내지 24개 뉴클레오티드(빈번하게 19개, 20개 또는 21개의 뉴클레오티드)의 길이를 갖고 표적화된 유전자 또는 핵산 서열에 대하여 정확한 상보성(즉, 완벽한 염기-쌍형성)을 갖도록 설계되며; 표적 서열에 대하여 100% 미만의 상보성을 갖는 가이드 RNA가 사용될 수 있지만(예를 들어, 20개 뉴클레오티드의 길이 및 표적 서열에 대하여 1개 내지 4개의 불일치를 갖는 gRNA), 오프-표적 효과 가능성을 증가시킬 수 있다. 식물 게놈 편집에 사용하기 위한 효율적인 가이드 RNA의 설계는 미국 특허 출원 공개 제2015/0082478 A1호에 개시되며, 이의 전체 명세서는 본원에 참조로 포함된다. 더욱 최근에, 효율적인 유전자 편집은 자연 발생 crRNA-tracrRNA 복합체를 모방하고 tracrRNA(뉴클레아제에 결합하기 위함) 및 적어도 하나의 crRNA(뉴클레아제를 편집을 위해 표적화된 서열로 가이드하기 위함) 둘 모두를 함유하는 엔지니어링된(합성) 단일 RNA 분자인, 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 달성된 바 있으며; 예를 들어, 문헌[Cong et al. (2013) Science, 339:819 - 823]; 문헌[Xing et al. (2014) BMC Plant Biol., 14:327 - 340]을 참조한다. 화학적으로 변형된 sgRNA는 게놈 편집에서 효율적인 것으로 입증된 바 있으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다. 식물 게놈 편집에 사용하기 위한 효율적인 gRNA의 설계는 미국 특허 출원 공개 제2015/0082478 A1호에 개시되어 있으며, 이의 전체 명세서는 본원에 참조로 포함된다.
본원에 제공된 시스템, 방법 및 조성물에서 표적 뉴클레오티드 서열의 부위-특이적 변형을 시행할 수 있는 다른 서열-특이적 엔도뉴클레아제는 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제 또는 TALEN), 아르고노트 단백질 및 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함한다. 아연 핑거 뉴클레아제(ZFN)는 핵산 절단 도메인, 예를 들어, 뉴클레아제에 융합된 아연 핑거 DNA-결합 도메인을 포함하는 엔지니어링된 단백질이다. 아연 핑거 결합 도메인은 특이성을 제공하며, 임의의 원하는 표적 DNA 서열을 특이적으로 인식하도록 엔지니어링될 수 있다. 식물 및 기타 유기체에서의 ZFN의 구축 및 이용의 검토를 위하여, 예를 들어, 문헌[Urnov et al. (2010) Nature Rev. Genet., 11:636 - 646]을 참조한다. 아연 핑거 DNA 결합 도메인은 아연 핑거 단백질(ZFP)로 지칭되는 큰 부류의 진핵 전사 인자의 DNA-결합 도메인으로부터 유래된다. ZFP의 DNA-결합 도메인은 전형적으로 적어도 3개의 아연 "핑거"의 탠덤 어레이를 함유하며, 각각은 특이적인 DNA의 트리플렛(triplet)을 인식한다. 다수의 전략을 사용하여 아연 핑거 결합 도메인의 결합 특이성을 설계할 수 있다. "모듈러 어셈블리(modular assembly)"로 지칭되는 한 접근법은 DNA에 대한 개별 아연 핑거의 기능적 자율성에 좌우된다. 이 접근법에서, 제공된 서열은 서열 내의 각각의 성분 트리플렛에 대한 아연 핑거를 확인하고, 이들을 멀티핑거 펩티드에 연결함으로써 표적화된다. 아연 핑거 DNA 결합 도메인을 설계하기 위한 몇몇의 대안적인 전략도 또한 개발된 바 있다. 이들 방법은 아연 핑거가 그들의 표적 트리플렛 외측의 뉴클레오티드 염기뿐만 아니라 이웃 핑거와 접촉하는 능력을 제공하도록 설계된다. 전형적으로, 엔지니어링된 아연 핑거 DNA 결합 도메인은 자연-발생 아연 핑거 단백질에 비하여 신규한 결합 특이성을 갖는다. 엔지니어링 방법은 예를 들어, 합리적인 설계 및 다양한 유형의 선택을 포함한다. 합리적인 설계는 예를 들어, 트리플렛(또는 쿼드러플(quadruple)) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열의 데이터베이스의 이용을 포함하며, 각각의 트리플렛 또는 쿼드러플 뉴클레오티드 서열은 특정 트리플렛 또는 쿼드러플 서열에 결합하는 아연 핑거의 하나 이상의 아미노산 서열과 연관된다. 예를 들어, 미국 특허 제6,453,242호 및 제6,534,261호를 참조하며, 둘 모두 본원에 전체가 참조로 포함된다. 예시적인 선택 방법(예를 들어, 파지 디스플레이 및 효모 2-하이브리드 시스템)이 널리 알려져 있으며, 문헌에 기술되어 있다. 또한, 아연 핑거 결합 도메인에 대한 결합 특이성의 향상은 본원에 전체가 참조로 포함되는 미국 특허 제6,794,136호에 기술된 바 있다. 또한, 개별 아연 핑거 도메인은 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 링커 서열의 예는 공개적으로 알려져 있으며, 예를 들어, 본원에 전체가 참조로 포함되는 미국 특허 제6,479,626호; 제6,903,185호; 및 제7,153,949호를 참조한다. 핵산 절단 도메인은 비-특이적이며, 전형적으로, 제한 엔도뉴클레아제, 예컨대 Fokl이다. 이 엔도뉴클레아제는 DNA를 절단하기 위하여 이량체화되어야 한다. 따라서, ZFN의 부분으로서 Fokl에 의한 절단은 2개의 인접하고 독립적인 결합 이벤트를 필요로 하며, 이는 이량체 형성을 허용하기 위해 올바른 배향에서, 그리고 적절한 간격으로 발생해야 한다. 2개의 DNA 결합 이벤트에 대한 요건은 길고 잠재적으로 고유한 인식 부위의 보다 특이적인 표적화를 가능하게 한다. 향상된 활성을 갖는 Fokl 변이체가 기술된 바 있으며; 예를 들어, 문헌[Guo et al. (2010) J. Mol. Biol., 400:96 - 107]을 참조한다.
전사 활성화인자 유사 이펙터(TALE)는 숙주 식물에서 유전자 발현을 조절하기 위하여, 그리고 박테리아에 의한 콜로니화 및 그의 생존을 용이하게 하기 위하여 특정 잔토모나스(Xanthomonas) 종에 의해 분비되는 단백질이다. TALE는 전사 인자로서 작용하고 식물에서 저항성 유전자의 발현을 조절한다. TALE의 최근의 연구에서 TALE의 반복 영역을 그들의 표적 DNA-결합 부위와 연결하는 규칙이 드러났다. TALE는 대부분 33개 또는 34개 아미노산 세그먼트의 탠덤 반복부로 이루어진 고도로 보존되고 반복적인 영역을 포함한다. 반복 단량체는 주로 아미노산 위치 12 및 13에서 서로 상이하다. 위치 12 및 13의 고유한 아미노산 쌍과 TALE-결합 부위의 상응하는 뉴클레오티드 간에 강력한 상관관계가 발견된 바 있다. TALE 결합 도메인의 아미노산 서열과 DNA 인식 사이의 단순한 관계는 임의의 원하는 특이성의 DNA 결합 도메인의 설계를 가능하게 한다. TALE는 비-특이적 DNA 절단 도메인에 연결되어 TAL-이펙터 뉴클레아제 또는 TALEN으로 지칭되는 서열-특이적 엔도뉴클레아제를 제조할 수 있다. ZFN의 경우에서와 같이, Fokl과 같은 제한 엔도뉴클레아제가 편리하게 사용될 수 있다. 식물에서 TALEN의 사용에 대한 설명에 대해서는, 문헌[Mahfouz et al. (2011) Proc. Natl. Acad. Sci. USA, 108:2623 - 2628] 및 문헌[Mahfouz (2011) GM Crops, 2:99 - 103]을 참조한다.
아르고노트는 아르고노트를 표적 뉴클레오티드 서열에 가이드하고, 표적 뉴클레오티드 서열의 부위-특이적 변경을 시행하는 표적 뉴클레오티드 서열에 대하여 상보적인 서열을 포함하는 폴리뉴클레오티드(예를 들어, 단일-가닥 DNA 또는 단일-가닥 RNA)에 결합함으로써 서열-특이적 엔도뉴클레아제로서 기능할 수 있는 단백질이며; 예를 들어, 본원에 전체가 참조로 포함되는 미국 특허 출원 공개 제2015/0089681호를 참조한다.
일부 구현예에서, 엔도뉴클레아제는 엔도뉴클레아제 인식 서열에 결합한다. 일부 구현예에서, 엔도뉴클레아제는 엔도뉴클레아제 인식 서열을 절단한다. 일부 구현예에서, 용어 "엔도뉴클레아제 인식 서열"은 엔도뉴클레아제 절단 부위 서열과 상호교환 가능하게 사용된다.
일부 구현예에서, 엔도뉴클레아제가 필요하지 않다. 일부 구현예에서, 당해 방법은 비-특이적으로 이중 가닥 파단을 도입하는 화합물을 제공함으로써 수행된다. 예시적인 이중 가닥 파단 유도 화합물은 하이드로퀴논(HQ), 벤조퀴논(BQ), 벤젠트리올(BT), 과산화수소(H2O2), 블레오마이신(BLM) 또는 아스코르브산나트륨(Vit C)을 포함하며, 이는 이중 가닥 파단을 도입하기 위해 사용된다.
본원에 제공되는 방법, 시스템, 진핵 세포(예를 들어, 식물 세포) 및 조성물에서 사용되는 공여자 주형 DNA 분자는 5'에서 3'으로, 제1 상동성 아암, 대체 DNA 및 제2 상동성 아암을 포함하는 DNA 분자를 포함하며, 상동성 아암은 gDNA 내의 엔도뉴클레아제 인식 서열에 측접한 게놈 DNA(gDNA) 서열에 부분적으로 또는 완전히 상동성인 서열을 함유하며, 대체 DNA는 표적 gDNA에 비하여 1개 이상의 DNA 염기쌍의 삽입, 결실 또는 치환을 포함할 수 있다. 특정 구현예에서, 공여자 DNA 주형 상동성 아암은 약 20개, 50개, 100개, 200개, 400개 또는 600개 내지 약 800개 또는 1000개 염기쌍 길이일 수 있다. 특정 구현예에서, 공여자 주형 DNA 분자는 원형(예를 들어, 플라스미드 또는 제미니바이러스 벡터를 포함하는 바이러스 벡터) 또는 선형 DNA 분자에서 진핵 세포(예를 들어, 식물 세포)에 전달될 수 있다. 특정 구현예에서, 사용되는 원형 또는 선형 DNA 분자는 5'에서 3'으로, 제1 카피의 엔도뉴클레아제 인식 서열, 제1 상동성 아암, 대체 DNA, 제2 상동성 아암 및 제2 카피의 엔도뉴클레아제 인식 서열을 포함하는 변형된 공여자 주형 DNA 분자를 포함할 수 있다. 이론에 의해 제한되고자 하지 않고, 이러한 변형된 DNA 공여자 주형 분자는 진핵 세포의 표적 편집 부위 게놈 DNA 내의 엔도뉴클레아제 인식 서열을 절단하는 데 사용되는 동일한 서열-특이적 엔도뉴클레아제에 의해 절단되어, 진핵 세포 게놈 내의 표적 편집 부위의 HDR-매개된 게놈 변형에 참여할 수 있는 공여자 주형 DNA 분자를 방출할 수 있다. 특정 구현예에서, 공여자 DNA 주형은 5'에서 3'으로, 절단된 엔도뉴클레아제 인식 서열, 제1 상동성 아암, 대체 DNA, 제2 상동성 아암 및 절단된 엔도뉴클레아제 인식 서열을 포함하는 선형 DNA 분자를 포함할 수 있다. 특정 구현예에서, 절단된 엔도뉴클레아제 서열은 블런트 DNA 말단, 또는 선택적으로 5' 포스페이트 기를 포함할 수 있는 블런트 DNA 말단을 포함할 수 있다. 특정 구현예에서, 절단된 엔도뉴클레아제 서열은 단일-가닥 5' 또는 3' DNA 오버행을 갖는 DNA 말단을 포함한다. 이러한 절단된 엔도뉴클레아제 인식 서열은 온전한 표적 서열을 절단하거나, 절단된 표적 서열-특이적 엔도뉴클레아제 인식 서열의 카피를 합성함으로써 생성될 수 있다. 공여자 DNA 주형은 화학적으로 또는 효소적으로(예를 들어, 중합효소 연쇄 반응(PCR)에서) 합성될 수 있다.
이중-가닥 DNA가 아닌 공여자 주형의 이용도 또한 고려된다. 예를 들어, 일부 구현예에서, 이중 가닥 DNA의 전구체가 제공된다. 일부 구현예에서, 역전사효소의 RNA 주형이 제공된다. 일부 구현예에서, 역전사효소가 RNA에 더하여 제공된다. 일부 구현예에서, 당해 방법은 단일 가닥 DNA 공여자 주형의 이용을 포함한다. 일부에서, 단일 또는 이중 가닥 RNA 주형이 사용된다. 일부 구현예에서, 당해 방법은 DNA/RNA 하이브리드의 이용을 포함한다. 일부 구현예에서, PNA를 사용하여 공여자 주형을 생성한다.
일부 구현예에서, 1가지 초과의 공여자 주형이 제공된다. 일부 구현예에서, 2가지, 3가지, 4가지, 5가지, 6가지, 7가지, 8가지, 9가지, 10가지 이상의 공여자 주형이 제공된다. 일부 구현예에서, 공여자 주형은 동일한 유전자를 표적화한다. 일부 구현예에서, 공여자 주형은 동일한 경로의 상이한 유전자를 표적화한다. 일부 구현예에서, 공여자 주형은 동일한 기능을 수행하는 다수의 유전자를 표적화한다.
본원에 제공되는 식물 세포 및 방법에서 사용되는 다른 게놈 편집 분자는 전이유전자 또는 이를 포함하는 벡터를 갖는 식물 또는 세포 상에서 사용될 수 있다. 이러한 전이유전자는 제초제 내성, 해충 내성(예를 들어, 곤충, 선충 또는 식물 병원성 진균 및 박테리아에 대한 내성), 개선된 수율, 증가된 및/또는 정량적으로 개선된 오일, 전분 및 단백질 함량, 개선된 무생물적 스트레스 내성(예를 들어, 개선된 또는 향상된 물 이용 효율 또는 내건성, 삼투 스트레스 내성, 고 염분 스트레스 내성, 고온 스트레스 내성, 향상된 저온 내성, 예를 들어, 저온 발아 내성) 등을 포함하는 유용한 형질을 부여할 수 있다. 이러한 전이유전자는 외인성 단백질의 발현에 의해 형질을 부여하는 전이유전자 및 내인성 식물 유전자의 발현을 저해함으로써(예를 들어, 내인성 식물 유전자의 발현을 저해하는 siRNA 반응을 유도함으로써) 형질을 부여하는 전이유전자 둘 모두를 포함한다. 이러한 형질을 제공할 수 있는 전이유전자는 미국 특허 출원 공개 제20170121722호 및 제20170275636호에 개시되며, 이는 각각 이러한 개시내용에 관하여 구체적으로, 그들 전체가 본원에 참조로 포함된다.
일부 구현예에서, 상기 언급된 SSAP, 엑소뉴클레아제 및/또는 SSB 및/또는 게놈 편집 분자 중 임의의 것을 인코딩하는 하나 이상의 폴리뉴클레오티드의 발현을 유도하는 하나 이상의 폴리뉴클레오티드 또는 벡터는 진핵 세포(예를 들어, 식물 세포) 내로 도입된다. 특정 구현예에서, 폴리뉴클레오티드 벡터는 SSAP, 엑소뉴클레아제 및/또는 SSB 또는 게놈 편집 분자를 인코딩하는 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터와 같은 조절 요소를 포함한다. 이러한 구현예에서, 이들 폴리뉴클레오티드의 발현은 적절한 프로모터, 특히 진핵 세포(예를 들어, 식물 세포)에서 기능성인 프로모터의 선택에 의해 제어될 수 있으며; 유용한 프로모터는 구성성, 조건성, 유도성 및 시간적으로 또는 공간적으로 특이적인 프로모터(예를 들어, 조직 특이적 프로모터, 발생적으로 조절되는 프로모터 또는 세포 사이클 조절된 프로모터)를 포함한다. 식물 세포에서 사용될 수 있는 발생적으로 조절되는 프로모터는 인지질 전달 단백질(PLTP), 프룩토스-1,6-비스포스파타제 단백질, NAD(P)-결합 로스만(Rossmann)-폴드(Fold) 단백질, 지방세포 원형질막-회합 단백질-유사 단백질, Rieske [2Fe-2S] 철-황 도메인 단백질, 엽록체호흡 환원(chlororespiratory reduction) 6 단백질, D-글리세레이트 3-키나제, 엽록체-유사 단백질, 엽록소 a-b 결합 단백질 7, 엽록체-유사 단백질, 자외선-B-억제성 단백질, Soul 헴-결합 과 단백질, 광계 I 반응 중심 서브유닛 psi-N 단백질, 및 단쇄 데하이드로게나제/환원효소 단백질을 포함하며, 이는 구체적으로 이러한 개시내용에 관하여 전체가 본원에 참조로 포함되는 미국 특허 출원 공개 제20170121722호에 개시된다. 특정 구현예에서, 프로모터는 다중의 가이드 RNA를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결되며, 가이드 RNA를 인코딩하는 서열은 절단 부위, 예컨대 마이크로RNA 인식/절단 부위 또는 자가-절단 리보자임을 인코딩하는 뉴클레오티드 서열에 의해 분리된다(예를 들어, 문헌[Ferr-D'Amar and Scott (2014) Cold Spring Harbor Perspectives Biol., 2:a003574] 참조). 특정 구현예에서, 프로모터는 하나 이상의 가이드 RNA를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 RNA 중합효소 III 프로모터이다. 특정 구현예에서, 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터는 진핵 세포(예를 들어, 식물 세포)에서 유전자 발현을 유도하는 구성성 프로모터이다. 특정 구현예에서, 프로모터는 핵에서 또는 세포소기관, 예컨대 엽록체 또는 미토콘드리아에서 유전자 발현을 유도한다. 식물에 사용하기 위한 구성성 프로모터의 예는 미국 특허 제5,858,742호 및 제5,322,938호에 개시된 바와 같은 CaMV 35S 프로모터, 미국 특허 제5,641,876호에 개시된 바와 같은 벼 액틴 프로모터, 미국 특허 제7,151,204호에 개시된 바와 같은 옥수수 엽록체 알돌라제 프로모터, 및 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 유래의 노팔린 신타제(NOS) 및 옥토핀 신타제(OCS) 프로모터를 포함한다. 특정 구현예에서, 게놈-편집 시스템의 요소를 인코딩하는 하나 이상의 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터는 현삼 모자이크 바이러스(FMV) 유래의 프로모터, RUBISCO 프로모터 또는 광합성 조직에서 활성인 피루베이트 포스페이트 디키나제(PPDK) 프로모터이다. 다른 고려되는 프로모터는 세포-특이적 또는 조직-특이적 또는 발생적으로 조절된 프로모터, 예를 들어, 핵산 표적화 시스템의 발현을 생식선 또는 생식 세포에 제한하는 프로모터(예를 들어, 생식선 또는 생식 세포에서 특이적으로 발현되는 DNA 리가제, 재조합효소, 복제효소를 인코딩하는 유전자, 또는 기타 유전자의 프로모터)를 포함한다. 특정 구현예에서, 게놈 변경은 DNA가 이후의 세대에 유전되는 세포에만 제한되며, 이는 유전독성 또는 다른 원치않는 효과를 피하기 위하여 게놈-편집 시스템의 발현이 제한되는 것이 바람직한 경우에 유리하다. 이 단락에 언급된 모든 특허 공보는 본원에 전체가 참조로 포함된다.
본원에 제공되는 발현 벡터 또는 폴리뉴클레오티드는 전사를 종료하기 위한 신호로서 작용하고, 생성된 mRNA의 폴리아데닐화를 유도하고, 또한 프로모터 활성을 뒷받침할 수 있는 DNA 세그먼트를 발현 카세트의 3' 말단 근처에 함유할 수 있다. 이러한 3' 요소는 흔히 "3'-비번역 영역" 또는 "3'-UTR" 또는 "폴리아데닐화 신호"로 지칭된다. 일부 경우에, 식물 유전자-기반의 3' 요소(또는 종결인자)는 3'-UTR 및 하류 비-전사 서열 둘 모두로 이루어진다(문헌[Nuccio et al., 2015]). 유용한 3' 요소는 하기를 포함한다: 본원에 참조로 포함되는 미국 특허 제6,090,627호에 개시된 아그로박테리움 투메파시엔스 nos 3', tml 3', tmr 3', tms 3', ocs 3' 및 tr7 3' 요소, 및 본원에 참조로 포함되는 미국 특허 출원 공개 제2002/0192813 A1호에 개시된, 밀(트리티쿰 아에스티붐(Triticum aestivum)) 유래의 열 충격 단백질 17, 유비퀴틴 및 프룩토스-1,6-비포스파타제 유전자, 및 벼(오리자 사티바) 유래의 글루텔린, 락테이트 데하이드로게나제 및 베타-투불린 유전자와 같은 식물 유전자 유래의 3' 요소.
특정 구현예에서, 발현 카세트를 포함하는 벡터 또는 폴리뉴클레오티드는 추가의 성분, 예를 들어, 약물 저항성을 인코딩하는 폴리뉴클레오티드 또는 제초제 유전자, 또는 검출 가능한 마커, 예컨대 녹색 형광 단백질(GFP) 또는 베타-글루쿠로니다제(gus)를 인코딩하는 폴리뉴클레오티드를 포함하여, 벡터 또는 폴리뉴클레오티드를 발현하는 세포의 편리한 스크리닝 또는 선택을 가능하게 한다. 선택 가능한 마커는 제초제 화합물, 예컨대 글리포세이트, 술포닐우레아, 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 저항성을 부여하는 유전자를 포함한다. 이러한 선택 가능한 마커 유전자 및 선택제는 술포닐우레아 및 이미다졸리논에 대한 저항성을 부여하는 옥수수 HRA 유전자(문헌[Lee et al., 1988, EMBO J 7:1241-1248]), 글리포세이트에 대한 저항성을 부여하는 CP4 유전자(이러한 유전자 및 관련 선택 방법에 관하여 전체가 본원에 구체적으로 참조로 포함되는 미국 재발행 특허 제RE039247호), 글리포세이트에 대한 저항성을 부여하는 GAT 유전자(문헌[Castle et al., 2004, Science 304:1151-1154]), 스펙티노마이신에 대한 저항성을 부여하는 유전자, 예컨대 aadA 유전자(문헌[Svab et al., 1990, Plant Mol Biol. 14:197-205]) 및 글루포시네이트 암모늄에 대한 저항성을 부여하는 bar 유전자(문헌[White et al., 1990, Nucl. Acids Res. 25:1062]), 및 PAT(또는 옥수수에 있어서 moPAT, 문헌[Rasco-Gaunt et al., 2003, Plant Cell Rep. 21:569-76] 참조; 또한 문헌[Sivamani et al., 2019] 참조) 및 만노스-함유 배지 상의 성장을 가능하게 하는 PMI 유전자(문헌[Negrotto et al., 2000, Plant Cell Rep. 22:684-690])를 포함한다.
특정 구현예에서, 반대-선택 가능한 마커는 본원에 제공되는 진핵 세포(예를 들어, 식물), 방법, 시스템 및 조성물에서 사용될 수 있다. 이러한 반대-선택 가능한 마커는 특정 구현예에서, 표적 편집 부위에서 숙주 세포 게놈 내로의 삽입이 의도되지 않은 임의의 DNA 내로 혼입될 수 있다. 이러한 구현예에서, 반대-선택 가능한 마커를 갖는 DNA의 비제한적인 예는 HDR-촉진제(예를 들어, SSB, SSAP 및/또는 엑소뉴클레아제), 유전자-편집 분자 및/또는 공여자 주형 DNA 분자를 인코딩하는 DNA에 연결된 임의의 DNA 분자를 포함한다. 공여자 주형 DNA 분자를 포함하는 벡터 또는 DNA 분자가 제공되며, 반대-선택 가능한 마커는 공여자 주형 DNA에 연결되고, 선택적으로 표적 편집 부위 서열에 의해 공여자 주형 DNA로부터 분리된다. 식물에서 사용될 수 있는 반대-선택 가능한 마커의 예는 시토신 데아미나제 유전자(예를 들어, 5-플루오로시토신과 함께 사용됨; 문헌[Schlaman and Hooykaas, 1997]), 포스포네이트 에스테르 하이드롤라제(예를 들어, 글리세롤 글리포세이트를 포함하는 글리포세이트의 포스포네이트 에스테르와 함께 사용됨; 문헌[Dotson, et al. 1996]), 질산염 환원효소(예를 들어, 단독의 질소원으로서 암모니아를 함유하는 배지 상에 염소산염과 함께 사용됨; 문헌[Nussaume, et al. 1991])를 포함한다.
특정 구현예에서, 선택 가능한 마커의 이용은 HDR 촉진제(즉, SSAP, 엑소뉴클레아제 및/또는 SSB)에 의해 제공되는 HDR의 빈도 증가 및/또는 변형된 주형 DNA 분자에 의해 배제된다. 이러한 구현예에서, 선택 가능한 마커 및/또는 반대-선택 가능한 마커는 공여자 주형 DNA 분자, 공여자-주형 또는 기타 DNA 분자를 전달하기 위해 사용되는 플라스미드 또는 본원에 제공되는 세포, 시스템, 방법 또는 조성물에서 사용되는 임의의 다른 벡터(예를 들어, 바이러스 벡터) 또는 폴리뉴클레오티드로부터 생략될 수 있다.
B. 유전학적 엔지니어링 방법
일 양태에서, 본 개시내용은 진핵 세포의 유전학적 엔지니어링 방법을 제공한다. 일부 구현예에서, 당해 방법은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 제공하는 것을 포함한다. 일부 구현예에서, 당해 방법은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 전달하는 것을 포함한다.
또 다른 양태에서, 본 개시내용은 진핵 세포의 유전학적 엔지니어링 방법을 제공한다. 일부 구현예에서, 당해 방법은 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), 및 iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 포함한다.
또 다른 양태에서, 당해 방법은 i) 이중 가닥 파단 유도 화합물, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), 및 iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 포함한다.
i. 유전학적 변형
유전학적 엔지니어링은 유전자 기능(즉, 인코딩된 유전자 생성물의 활성)의 감소일 수 있다. 이는 결함이 있는 서열을 제공하기 위하여 본원에 논의된 바와 같이 상응하는 수선 주형을 필요로 할 수 있거나, 이는 DSB의 유도를 통해 이루어질 수 있다. 특히, 유전자 섭동은 유전자 낙다운이다. 일부 구현예에서, 세포는 식물 또는 동물 세포이다. 일부 구현예에서, 유전학적 엔지니어링은 유전자 내의 정지 코돈의 도입이다. 일부 구현예에서, 유전학적 엔지니어링은 프로모터 또는 출발 코돈 내의 돌연변이이다.
대안적으로, 유전학적 엔지니어링은 유전자 기능(즉, 인코딩된 유전자 생성물의 활성)의 증가일 수 있다. 이는 교정된 서열을 제공하기 위하여 본원에 논의된 바와 같이 상응하는 수선 주형을 필요로 할 수 있다. 일부 구현예에서, 유전학적 엔지니어링은 단백질 코딩 유전자 내의 하나 이상의 뉴클레오티드의 치환이다.
일부 구현예에서, 표적 편집 부위는 프로모터 영역에 위치한다. 일 구현예에서, 뉴클레오티드 서열은 프로모터일 수 있으며, 프로모터의 편집은 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 증가된 프로모터 활성, 증가된 프로모터 조직 특이성, 감소된 프로모터 활성, 감소된 프로모터 조직 특이성, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 결실 또는 부가.
일 구현예에서, 뉴클레오티드 서열은 세포의 게놈 내의 조절 서열일 수 있다. 조절 서열은 유기체 내에서 특정 유전자의 발현을 증가시키거나 감소시킬 수 있는 핵산 분자의 세그먼트이다. 조절 서열의 예는 전사 활성화인자, 전사 억제인자 및 번역 억제인자, 스플라이싱 인자, miRNA, siRNA, 인공 miRNA, CAAT 박스, CCAAT 박스, Pribnow 박스, TATA 박스, SECIS 요소 및 폴리아데닐화 신호를 포함하지만 이에 한정되지 않는다. 일부 구현예에서, 조절 요소의 편집은 변경된 단백질 번역, RNA 절단, RNA 스플라이싱 또는 전사 종결을 초래한다.
일 구현예에서, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 사용하여, TET 오퍼레이터 억제인자/오퍼레이터/유도인자 시스템의 성분, 또는 술포닐우레아(Su) 억제인자/오퍼레이터/유도인자 시스템의 성분을 식물 게놈 내로 삽입하여, 유도 가능한 발현 시스템을 생성하거나 제어할 수 있다.
또 다른 구현예에서, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 사용하여, 프로모터 또는 프로모터 요소의 결실을 허용할 수 있으며, 프로모터 결실(또는 프로모터 요소 결실)은 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 영구적으로 불활성화된 유전자 좌, 증가된 프로모터 활성(증가된 프로모터 세기), 증가된 프로모터 조직 특이성, 감소된 프로모터 활성, 감소된 프로모터 조직 특이성, 새로운 프로모터 활성, 유도 가능한 프로모터 활성, 연장된 유전자 발현 윈도우, 유전자 발현의 시기 또는 발생 과정의 변형, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 부가. 결실될 프로모터 요소는, 비-제한적으로, 프로모터 코어 요소, 프로모터 인핸서 요소 또는 35S 인핸서 요소일 수 있다. 결실될 프로모터 또는 프로모터 단편은 편집 대상 세포에 대해 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성일 수 있다.
일 구현예에서, 변형될 뉴클레오티드 서열은 종결인자일 수 있으며, 종결인자의 편집은 종결인자("종결인자 스왑(terminator swap)" 또는 "종결인자 대체(terminator replacement)"로도 지칭됨) 또는 종결인자 단편을, 상이한 종결인자(대체 종결인자로도 지칭됨) 또는 종결인자 단편(대체 종결인자 단편으로도 지칭됨)으로 대체하는 것을 포함하며, 종결인자 대체는 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 증가된 종결인자 활성, 증가된 종결인자 조직 특이성, 감소된 종결인자 활성, 감소된 종결인자 조직 특이성, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 결실 또는 부가. 변형될 종결인자 (또는 종결인자 단편)은 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성인 종결인자 (또는 종결인자 단편)일 수 있다. 대체 종결인자 (또는 대체 종결인자 단편)는 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성인 종결인자 (또는 종결인자 단편)일 수 있다.
삽입될 종결인자 (또는 종결인자 요소)는 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성인 종결인자 (또는 종결인자 요소)일 수 있다.
또 다른 구현예에서, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템을 사용하여, 종결인자 또는 종결인자 요소의 결실을 허용할 수 있으며, 종결인자 결실 (또는 종결인자 요소 결실)은 하기 중 어느 하나 또는 하기의 어느 하나의 조합을 초래한다: 증가된 종결인자 활성(증가된 종결인자 세기), 증가된 종결인자 조직 특이성, 감소된 종결인자 활성, 감소된 종결인자 조직 특이성, DNA 결합 요소의 돌연변이 및/또는 DNA 결합 요소의 부가. 결실될 종결인자 또는 종결인자 단편은 편집 대상 세포에 대하여 내인성이거나, 인공이거나, 기존의 것이거나 또는 전이유전자성일 수 있다.
변형은 5' 캡, 3' 폴리아데닐화 테일, 리보스위치 서열, 안정성 제어 서열, dsRNA 듀플렉스를 형성하는 서열, 가이드 폴리 뉴클레오티드를 세포하 위치에 표적화하는 변형 또는 서열, 트래킹(tracking)을 제공하는 변형 또는 서열, 단백질에 대한 결합 부위를 제공하는 변형 또는 서열, 잠금(Locked) 핵산(LNA), 5-메틸 dC 뉴클레오티드, 2,6-디아미노퓨린 뉴클레오티드, 2'-플루오로 A 뉴클레오티드, 2'-플루오로 U 뉴클레오티드; 2'-O-메틸 RNA 뉴클레오티드, 포스포로티오에이트 결합, 콜레스테롤 분자로의 연결, 폴리에틸렌 글리콜 분자로의 연결, 스페이서 18 분자로의 연결, 5'에서 3' 공유 결합 또는 이들의 임의의 조합을 포함한다. 이들 변형은 적어도 하나의 추가의 유리한 특징을 초래할 수 있으며, 추가의 유리한 특징은 변형된 또는 조절된 안정성, 세포하 표적화, 트래킹, 형광 표지, 단백질 또는 단백질 복합체에 대한 결합 부위, 상보적 표적 편집 부위에 대한 변경된 결합 친화성, 세포 분해에 대한 변경된 저항성 및 증가된 세포 투과성의 군으로부터 선택된다.
일부 구현예에서, 변형될 관심 게놈 서열은 폴리유비퀴틴화 부위이며, 폴리유비퀴틴화 부위의 변형은 단백질 분해 속도의 변경을 초래한다. 유비퀴틴 태그는 단백질이 프로테아좀 또는 자가포식에 의해 분해되게 만든다. 프로테아좀 저해제는 단백질 과잉생성을 유발하는 것으로 알려져 있다. 관심 단백질을 인코딩하는 DNA 서열에 이루어진 변형은 관심 단백질의 적어도 하나의 아미노산 변형을 초래할 수 있으며, 상기 변형은 단백질의 폴리유비퀴틴화(번역 후 변형)를 허용하여 단백질 분해의 변형을 초래한다.
일부 구현예에서, 표적 편집 부위는 유전자 코딩 영역에 위치한다. 일부 구현예에서, 표적 서열은 유전자내 영역에 위치한다. 일부 구현예에서, 표적 서열은 텔로미어(telomere)에 위치한다.
일부 구현예에서, 본원에 제공되는 방법은 표적 편집 부위에서 하나 이상의 뉴클레오티드의 변형을 초래한다.
일부 구현예에서, 표적 편집 부위에 대한 변형은 하나 이상의 뉴클레오티드의 치환이다. 일부 구현예에서, 표적 편집 부위에 대한 변형은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환이다.
일부 구현예에서, 표적 편집 부위에 대한 변형은 하나 이상의 뉴클레오티드의 결실이다. 일부 구현예에서, 표적 편집 부위에 대한 변형은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환이다.
일부 구현예에서, 표적 편집 부위에 대한 변형은 하나 이상의 뉴클레오티드의 삽입이다. 일부 구현예에서, 표적 편집 부위에 대한 변형은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환이다.
일부 구현예에서, 표적 편집 부위는 표적 편집 부위에 비하여 하나 이상의 삽입, 결실 또는 치환을 갖는 공여자 서열에 의해 변형된다. 일부 구현예에서, 표적 편집 부위는 공여자 서열에 의해 대체된다.
표적 서열의 조작이란, 본 발명자들은 또한, 표적 편집 부위의 후성적 조작을 의미한다. 이는 예컨대 표적 편집 부위의 메틸화 상태의 변형(즉, 메틸화 또는 메틸화 패턴 또는 CpG 섬의 부가 또는 제거), 히스톤 변형, 표적 편집 부위에 대한 접근성의 증가 또는 감소, 또는 3D 폴딩의 촉진에 의한, 표적 서열의 염색질 상태의 것일 수 있다.
또한, 본원에 제공된 방법을 사용하여 유전학적 섭동을 도입하고, 변경된 세포에서 하나 이상의 유전자의 발현의 변화를 결정함으로써, 하나 이상의 유전자의 기능을 질의하는 것을 포함하는 하나 이상의 동물 또는 식물 세포 내의 하나 이상의 유전자의 기능의 질의 방법이 제공된다. 일부 구현예에서, 유전학적 섭동은 기능 상실 돌연변이이다.
일부 구현예에서, 당해 방법은 동일한 표적에 대하여 상이한 변형(즉, 삽입, 결실 또는 치환)을 갖는 다중의 공여자 DNA를 사용하는 것을 포함한다. 일부 구현예에서, 다중의 공여자 DNA는 프로모터 영역 또는 코딩 서열을 표적화한다. 일부 구현예에서, 상이한 변형을 갖는 세포는 이후에 특정 표현형에 대하여 스크리닝될 수 있다.
ii. 포유류의 유전학적 엔지니어링
또한, 포유류 세포의 유전학적 편집 방법이 본원에 제공된다. 일부 구현예에서, 유전학적 편집은 유전학적 질환 또는 질병에 관여되는 유전자 좌의 것이다. 일부 구현예에서, 질병 또는 장애는 효소의 돌연변이에 의해 야기된다. 일부 구현예에서, 유전학적 질환은 대사 장애이다.
예시적인 조건 및 유전자는 아밀로이드 신경병증(TTR, PALB); 아밀로이드증(APOA1, APP, AAA, CVAP, AD1, GSN, FGA, LYZ, TTR, PALB); 경화증(KRT18, KRT8, CIRH1A, NAIC, TEX292, KIAA1988); 낭성 섬유증(CFTR, ABCC7, CF, MRP7); 글리코겐 저장병(SLC2A2, GLUT2, G6PC, G6PT, G6PT1, GAA, LAMP2, LAMPB, AGL, GDE, GBE1, GYS2, PYGL, PFKM); 간 선종, 142330(TCF1, HNF1A, MODY3), 간부전, 조기 발병 및 신경 장애(SCOD1, SCOl), 간 리파제 결핍(LIPC), 간모세포종, 암 및 암종(CTNNB1, PDGFRL, PDGRL, PRLTS, AXIN1, AXIN, CTNNB1, TP53, P53, LFS1, IGF2R, MPRI, MET, CASP8, MCH5; 수질 낭성 신장병(UMOD, HNFJ, FJHN, MCKD2, ADMCKD2); 페닐케톤뇨증(PAH, PKU1, QDPR, DHPR, PTS); 다낭성 신장 및 간 질병(FCYT, PKHD1, ARPKD, PKD1, PKD2, PKD4, PKDTS, PRKCSH, G19P1, PCLD, SEC63)이다. 다른 바람직한 표적은 하기 중 임의의 하나 이상을 포함하거나 하기 중 하나 이상을 포함한다: PCSK9; Hmgcr; SERPINA1; ApoB; LDL; 헌팅턴병(헌팅턴), 혈색소증(HEF), 뒤쉔 근디스트로피(디스트로핀), 겸상 적혈구 빈혈(베타 글로빈) 및 테이-삭스(헥소사미니다제 A).
관심 게놈 유전자좌 내의 표적 편집 부위의 조작에 의한 인간 또는 비-인간 포유류 또는 유기체를 포함하는 유기체 또는 포유류의 변형 방법을 언급하는 경우, 이는 유기체(또는 포유류)에 그 유기체(유기체가 다세포일 경우) 유래의 전체 또는 단지 단일의 세포 또는 세포의 집단으로서 적용될 수 있음이 이해될 것이다. 인간의 경우, 예를 들어, 본 발명자들은 그 중에서도 단일 세포 또는 세포의 집단을 예상하며 이들은 바람직하게는 생체외 변형된 다음, 재도입될 수 있다. 이 경우에, 생검 또는 다른 조직 또는 생물학적 유체 시료가 필요할 수 있다. 줄기 세포는 또한 특히 이에 관하여 바람직하다. 그러나, 물론, 생체내 구현예도 예상된다.
당해 방법은 생체외 또는 시험관내에서, 예를 들어, 세포 배양에서 또는 생체외 또는 시험관내 모델(예컨대 오르가노이드(organoid) 또는 '칩 상의 동물 또는 식물 세포')에서 이루어질 수 있다. 대안적으로, 방법은 생체내에서 이루어질 수 있으며, 이 경우에, 이는 또한 제1 세포의 집단을 대상체로부터 단리하는 것 및 제2 세포의 집단을 대상체 내로 (다시) 이식하는 것을 포함할 수 있다. 유전자 섭동은 하나 이상의 또는 2개 이상의 또는 3개 이상의 또는 4개 이상의 유전자에 대하여 이루어질 수 있다.
본 발명의 일부 구현예에서, 낙 아웃 모델이 생성될 수 있다.
일부 구현예에서, 전달은 바이러스 벡터, 예컨대 렌티- 또는 배큘로- 또는 바람직하게는 아데노-바이러스/아데노-연관 바이러스 벡터일 수 있는 벡터의 형태로 이루어지지만, 다른 전달 수단(예컨대, 효모 시스템, 미세소낭, 유전자 총/금 나노입자로의 벡터의 부착 수단)이 알려져 있고, 이것이 제공된다. 벡터는 바이러스 또는 효모 시스템(예를 들어, 관심 핵산이 (발현에 관하여, 예컨대 궁극적으로 가공된 RNA를 제공하기 위하여) 프로모터에 작동 가능하게 연결되고 이의 제어 하에 존재할 수 있음)뿐만 아니라, 숙주 세포 내로의 핵산의 직접적인 전달을 의미할 수 있다. 본원의 방법에서 벡터가 바이러스 벡터일 수 있으며, 이것이 유리하게는 AAV이지만, 본원에 논의된 바와 같은 기타 바이러스 벡터, 예컨대 렌티바이러스가 사용될 수 있다. 예를 들어, 배큘로바이러스는 곤충 세포에서의 발현을 위해 사용될 수 있다. 이들 곤충 세포는 이어서 다량의 추가의 벡터, 예컨대 본 발명의 전달을 위해 조정된 AAV 또는 렌티바이러스 벡터를 생성하는 데 유용할 수 있다.
iii. 식물의 유전학적 엔지니어링
일부 구현예에서, 식물의 유전학적 엔지니어링 방법이 본원에 제공된다. 관심 폴리뉴클레오티드/폴리펩티드는 제초제-내성 코딩 서열, 살충 코딩 서열, 살선충 코딩 서열, 항미생물 코딩 서열, 항진균 코딩 서열, 항바이러스 코딩 서열, 무생물적 및 생물적 스트레스 내성 코딩 서열 또는 식물 형질, 예컨대 수율, 곡물 품질, 영양소 함량, 전분 질 및 양, 질소 고정 및/또는 이용, 지방산 및 오일 함량 및/또는 조성을 변경시키는 서열을 포함하지만 이에 한정되지 않는다. 더욱 구체적인 관심 폴리뉴클레오티드는 작물 수율을 개선시키는 유전자, 작물의 만족도를 개선시키는 폴리펩티드, 무생물적 스트레스, 예컨대 가뭄, 질소, 온도, 염분, 독성 금속 또는 미량 원소에 대한 저항성을 부여하는 단백질, 또는 독소, 예컨대 농약 및 제초제에 대한 또는 생물적 스트레스, 예컨대 진균, 바이러스, 박테리아, 곤충 및 선충에 의한 공격 및 이들 유기체와 연관된 질병의 발생에 대한 저항성을 부여하는 것들을 인코딩하는 유전자를 포함하지만 이에 한정되지 않는다. 관심 유전자의 일반적인 범주는 예를 들어, 아연 핑거와 같이 정보에 연관된 유전자, 키나제와 같이 커뮤니케이션에 연관된 것들 및 열 충격 단백질과 같이 하우스키핑에 연관된 것들을 포함한다. 더욱 구체적인 전이유전자의 범주는 예를 들어, 작물재배학, 곤충 저항성, 질병 저항성, 제초제 저항성, 생식력 또는 불임성, 곡물 특징 및 상업적 제품에 대한 중요한 형질을 인코딩하는 유전자를 포함한다. 관심 유전자는 일반적으로, 오일, 전분, 탄수화물 또는 영양소 대사에 연관된 것들 및 낟알 크기, 수크로스 부하 등에 영향을 미치는 것들을 포함하며, 이는 다른 형질과 조합하여 사용되거나 쌓일 수 있다.
작물재배학적으로 중요한 형질, 예컨대 오일, 전분 및 단백질 함량은 전통적인 육종 방법을 사용하는 것에 더하여 유전학적으로 변경될 수 있다. 변형은 올레산, 포화 및 불포화 오일의 함량을 증가시키는 것, 라이신 및 황의 수준을 증가시키는 것, 필수 아미노산 및 또한 전분의 변형을 제공하는 것을 포함한다. 호도티오닌(hordothionin) 단백질 변형은 본원에 참조로 포함되는 미국 특허 제5,703,049호, 제5,885,801호, 제5,885,802호 및 제5,990,389호에 기술된다. 또 다른 예는 미국 특허 제5,850,016호에 기술된 대두 2S 알부민에 의해 인코딩되는 라이신 및/또는 황 풍부 종자 단백질, 및 개시내용이 본원에 참조로 포함되는 문헌[Williamson et al. (1987) Eur. J. Biochem. 165:99-106]에 기술된 보리 유래의 키모트립신 저해제이다.
상업적 형질도 또한 관심 폴리뉴클레오티드 상에 인코딩될 수 있으며, 이는 예를 들어, 에탄올 생성을 위해 전분을 증가시키거나, 단백질의 발현을 제공할 수 있다. 형질전환된 식물의 또 다른 중요한 상업적 용도는 미국 특허 제5,602,321호에 기술된 바와 같은 폴리머 및 바이오플라스틱의 생성이다. β-케토티올라제, PHBase(폴리하이드록시부티레이트 신타제), 및 아세토아세틸-CoA 환원효소(문헌[Schubert et al. (1988) J. Bacteriol. 170:5837-5847] 참조)와 같은 유전자는 폴리하이드록시알카노에이트(PHA)의 발현을 촉진시킨다.
코딩 서열의 유도체는 인코딩된 폴리펩티드에서 사전선택된 아미노산의 수준을 증가시키기 위하여 부위-지정 돌연변이유발에 의해 제조될 수 있다. 예를 들어, 보리 고 라이신 폴리펩티드(BHL)를 인코딩하는 유전자는 보리 키모트립신 저해제, 개시내용이 본원에 참조로 포함되는 1996년 11월 1일자 출원된 미국 출원 제08/740,682호 및 제WO 98/20133호로부터 유래된다. 다른 단백질은 예컨대 해바라기씨(문헌[Lilley et al. (1989) Proceedings of the World Congress on Vegetable Protein Utilization in Human Foods and Animal Feedstuffs, ed. Applewhite (American Oil Chemists Society, Champaign, Ill.), pp. 497-502]; 본원에 참조로 포함됨); 옥수수(문헌[Pedersen et al. (1986) J. Biol. Chem. 261:6279]; 문헌[Kirihara et al. (1988) Gene 71:359]; 이들 둘 모두는 본원에 참조로 포함됨); 및 벼(문헌[Musumura et al. (1989) Plant Mol. Biol. 12:123], 본원에 참조로 포함됨) 유래의 메티오닌-풍부 식물 단백질을 포함한다. 다른 작물재배학적으로 중요한 유전자는 라텍스, Floury 2, 성장 인자, 종자 저장 인자 및 전사 인자를 인코딩한다.
작물 수율을 개선시키는 폴리뉴클레오티드는 왜화(dwarfing) 유전자, 예컨대 Rht1 및 Rht2(문헌[Peng et al. (1999) Nature 400:256-261]) 및 식물 성장을 증가시키는 것들, 예컨대 암모늄-유도 가능한 글루탐산염 데하이드로게나제를 포함한다. 작물의 만족도를 개선시키는 폴리뉴클레오티드는 예를 들어, 식물이 감소된 포화 지방 함량을 갖게 하는 것들, 식물의 영양가를 증가시키는 것들, 및 곡물 단백질을 증가시키는 것들을 포함한다. 내염성을 개선시키는 폴리뉴클레오티드는 염분-내성 유전자(들)가 도입된 식물의 고유 환경보다 더 높은 염분의 환경에서 식물 성장을 증가시키거나 이를 가능하게 하는 것들이다.
아미노산 생합성에 영향을 미치는 폴리뉴클레오티드/폴리펩티드는 예를 들어, 식물, 진균 및 박테리아에서 방향족 아미노산 경로로부터 트립토판의 생합성까지 분기되는 제1 반응을 촉매하는 안트라닐레이트 신타제(AS; EC 4.1.3.27)를 포함한다. 식물에서, 트립토판의 생합성을 위한 화학적 과정은 엽록체에서 구분된다. 예를 들어, 본원에 참조로 포함되는 미국 공개 제20080050506호를 참조한다. 추가의 관심 서열은 코리스메이트 피루베이트 리아제(Chorismate Pyruvate Lyase; CPL)를 포함하며, 이는 코리스메이트에서 피루베이트 및 pHBA로의 전환을 촉매하는 효소를 인코딩하는 유전자를 나타낸다. 가장 잘 특성화된 CPL 유전자는 에스케리키아 콜라이로부터 단리된 바 있으며, GenBank 수탁 번호 M96268을 갖는다. 본원에 참조로 포함된 미국 특허 제7,361,811호를 참조한다.
이들 관심 폴리뉴클레오티드 서열은 질병 또는 해충 저항성을 제공하는 데 연관된 단백질을 인코딩할 수 있다. "질병 저항성" 또는 "해충 저항성"은, 식물이 식물-병원체 상호작용의 결과인 유해 증상을 회피한다는 의미이다. 해충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 인코딩할 수 있다. 질병 저항성 및 곤충 저항성 유전자, 예컨대, 항박테리아 보호를 위한 라이소자임 또는 세크로핀, 또는 항진균 보호를 위한 디펜신, 글루카나제 또는 키티나제와 같은 단백질, 또는 선충 또는 곤충 방제를 위한 바실러스 투린지엔시스(Bacillus thuringiensis) 내독소, 프로테아제 저해제, 콜라게나제, 렉틴 또는 글리코시다제가 모두 유용한 유전자 생성물의 예이다. 질병 저항성 형질을 인코딩하는 유전자는, 예컨대 푸모니신(fumonisin)에 대한 해독작용 유전자(미국 특허 제5,792,931호); 약독성(avr) 및 질병 저항성(R) 유전자(문헌[Jones et al. (1994) Science 266:789]; 문헌[Martin et al. (1993) Science 262:1432]; 및 문헌[Mindrinos et al. (1994) Cell 78:1089]); 등을 포함한다. 곤충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 인코딩할 수 있다. 이러한 유전자는, 예를 들어, 바실러스 투린지엔시스 독성 단백질 유전자(미국 특허 제5,366,892호; 제5,747,450호; 제5,736,514호; 제5,723,756호; 제5,593,881호; 및 문헌[Geiser et al. (1986) Gene 48:109]); 등을 포함한다.
"제초제 저항성 단백질" 또는 "제초제 저항성-인코딩 핵산 분자"의 발현으로 초래되는 단백질은 이 단백질을 발현하지 않는 세포보다 더 높은 농도의 제초제를 견디는 능력, 또는 이 단백질을 발현하지 않는 세포보다 더 긴 기간 동안 특정 농도의 제초제를 견디는 능력을 세포에 부여하는 단백질을 포함한다. 제초제 저항성 형질은 아세토락테이트 신타제(ALS)의 작용을 저해하는 작용을 하는 제초제, 특히 술포닐우레아(sulfonylurea)-유형 제초제에 대한 저항성을 코딩하는 유전자, 글루타민 신타제의 작용을 저해하는 작용을 하는 제초제에 대한 저항성을 코딩하는 유전자, 예컨대, 포스피노트리신 또는 바스타(basta)(예를 들어, bar 유전자), 글리포세이트(예를 들어, EPSP 신타제 유전자 및 GAT 유전자), HPPD 저해제(예를 들어, HPPD 유전자) 또는 당업계에 알려진 다른 이러한 유전자에 의해 식물 내로 도입될 수 있다. 예를 들어, 각각이 본원에 참조로 포함되는 미국 특허 제7,626,077호, 제5,310,667호, 제5,866,775호, 제6,225,114호, 제6,248,876호, 제7,169,970호, 제6,867,293호 및 미국 가출원 제61/401,456호를 참조한다. bar 유전자는 제초제 바스타에 대한 저항성을 인코딩하고, nptII 유전자는 항생제 카나마이신 및 제네티신에 대한 저항성을 인코딩하고, ALS-유전자 돌연변이체는 제초제 클로르술푸론(chlorsulfuron)에 대한 저항성을 인코딩한다.
추가의 선택 가능한 마커는 제초제 화합물, 예컨대 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 저항성을 부여하는 유전자를 포함한다. 예를 들어, 문헌[Yarranton, (1992) Curr Opin Biotech 3:506-11]; 문헌[Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8]; 문헌[Yao et al., (1992) Cell 71:63-72]; 문헌[Reznikoff, (1992) Mol Microbiol 6:2419-22]; 문헌[Hu et al., (1987) Cell 48:555-66]; 문헌[Brown et al., (1987) Cell 49:603-12]; 문헌[Figge et al., (1988) Cell 52:713-22]; 문헌[Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4]; 문헌[Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53]; 문헌[Deuschle et al., (1990) Science 248:480-3]; 문헌[Gossen, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21]; 문헌[Labow et al., (1990) Mol Cell Biol 10:3343-56]; 문헌[Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6]; 문헌[Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6]; 문헌[Wyborski et al., (1991) Nucleic Acids Res 19:4647-53]; 문헌[Hillen and Wissman, (1989) Topics Mol Struc Biol 10:143-62]; 문헌[Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5]; 문헌[Kleinschnidt et al., (1988) Biochemistry 27:1094-104]; 문헌[Bonin, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51]; 문헌[Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9]; 문헌[Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin)]; 문헌[Gill et al., (1988) Nature 334:721-4]을 참조한다. 상업적 형질도 또한 예를 들어, 에탄올 생성을 위해 전분을 증가시키거나, 단백질의 발현을 제공할 수 있는 유전자 또는 유전자들 상에 인코딩될 수 있다. 형질전환된 식물의 또 다른 중요한 상업적 용도는 미국 특허 제5,602,321호에 기술된 바와 같은 폴리머 및 바이오플라스틱의 생성이다. β-케토티올라제, PHBase(폴리하이드록시부티레이트 신타제), 및 아세토아세틸-CoA 환원효소(문헌[Schubert et al. (1988) J. Bacteriol. 170:5837-5847] 참조)와 같은 유전자는 폴리하이드록시알카노에이트(PHA)의 발현을 촉진시킨다.
외인성 생성물은 식물 효소 및 생성물, 및 원핵생물 및 기타 진핵생물을 포함하는 기타 공급원 유래의 것들을 포함한다. 이러한 생성물은 효소, 보조인자, 호르몬 등을 포함한다. 단백질, 특히 식물의 영양가를 개선시키도록 개선된 아미노산 분포를 갖는 변형된 단백질의 수준이 증가될 수 있다. 이는 향상된 아미노산 함량을 갖는 이러한 단백질의 발현에 의해 달성된다.
일부 구현예에서, 진핵 세포는 생합성 경로에서 하나 이상의 외인성 단백질을 생성하도록 엔지니어링된다. 일부 구현예에서, 생합성 경로는 바이오연료 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 알코올을 위한 것이다. 일부 구현예에서, 생합성 경로는 에탄올을 위한 것이다. 일부 구현예에서, 생합성 경로는 소분자의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 약물의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 스테롤의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 호르몬을 위한 것이다. 일부 구현예에서, 생합성 경로는 펩티드의 생성을 위한 것이다. 일부 구현예에서, 생합성 경로는 테르펜을 위한 것이다.
일부 구현예에서, 진핵 세포는 그의 자손이 더 이상 복제할 수 없도록 엔지니어링된다. 일부 구현예에서, 진핵 세포는 병원성 세포이다.
전이유전자, 재조합 DNA 분자, 관심 DNA 서열 및 관심 폴리뉴클레오티드는 유전자 침묵화를 위한 하나 이상의 DNA 서열을 포함할 수 있다. 식물에서의 DNA 서열의 발현을 포함하는 유전자 침묵화 방법은 당업계에 알려져 있으며, 공동억제, 안티센스 억제, 이중-가닥 RNA(dsRNA) 간섭, 헤어핀 RNA(hpRNA) 간섭, 인트론-함유 헤어핀 RNA(ihpRNA) 간섭, 전사적 유전자 침묵화 및 마이크로 RNA(miRNA) 간섭을 포함하지만, 이에 한정되지 않는다.
iv. 검출
당업자는 표적 편집 부위의 유전학적 변형이 다양한 수단에 의해 검출될 수 있다는 것을 이해할 것이다. 일부 구현예에서, 당해 방법은 세포를 서열분석하는 것을 추가로 포함한다. 일부 구현예에서, 당해 방법은 리포터 유전자를 검출하는 것을 포함한다. 일부 구현예에서, 당해 방법은 선택 가능한 마커를 사용하여 세포를 선택하는 것을 포함한다.
선택 가능한 마커의 예에는 제한 효소 부위를 포함하는 DNA 세그먼트; 항생제, 예컨대 스펙티노마이신, 앰피실린, 카나마이신, 테트라사이클린, 바스타, 네오마이신 포스포트랜스퍼라제 II(NEO) 및 하이그로마이신 포스포트랜스퍼라제(HPT)를 포함하는 다르게 독성인 화합물에 대한 저항성을 제공하는 생성물을 인코딩하는 DNA 세그먼트; 다르게는 수여자 세포에서 결여된 생성물(예를 들어, tRNA 유전자, 영양요구성 마커)을 인코딩하는 DNA 세그먼트; 용이하게 확인될 수 있는 생성물(예를 들어, 표현형 마커, 예컨대 β-갈락토시다제, GUS; 형광 단백질, 예컨대 녹색 형광 단백질(GFP), 청록색(CFP), 황색(YFP), 적색(RFP), 및 세포 표면 단백질)을 인코딩하는 DNA 세그먼트; PCR을 위한 새로운 프라이머 부위의 생성(예를 들어, 이전에 근접하지 않았던 2개의 DNA 서열의 근접위치), 제한 엔도뉴클레아제 또는 기타 DNA 변형 효소, 화학물질 등에 의해 작용하지 않거나, 이에 의해 작용하는 DNA 서열의 포함; 및 확인을 가능하게 하는 특정 변형(예를 들어, 메틸화)에 필요한 DNA 서열의 포함이 포함되지만 이에 한정되지 않는다.
추가의 선택 가능한 마커는 제초제 화합물, 예컨대 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대한 저항성을 부여하는 유전자를 포함한다. 예를 들어, 문헌[Yarranton, (1992) Curr Opin Biotech 3:506-11]; 문헌[Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8]; 문헌[Yao et al., (1992) Cell 71:63-72]; 문헌[Reznikoff, (1992) Mol Microbiol 6:2419-22]; 문헌[Hu et al., (1987) Cell 48:555-66]; 문헌[Brown et al., (1987) Cell 49:603-12]; 문헌[Figge et al., (1988) Cell 52:713-22]; 문헌[Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4]; 문헌[Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53]; 문헌[Deuschle et al., (1990) Science 248:480-3]; 문헌[Gossen, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21]; 문헌[Labow et al., (1990) Mol Cell Biol 10:3343-56]; 문헌[Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6]; 문헌[Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6]; 문헌[Wyborski et al., (1991) Nucleic Acids Res 19:4647-53]; 문헌[Hillen and Wissman, (1989) Topics Mol Struc Biol 10:143-62]; 문헌[Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5]; 문헌[Kleinschnidt et al., (1988) Biochemistry 27:1094-104]; 문헌[Bonin, (1993) Ph.D. Thesis, University of Heidelberg]; 문헌[Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51]; 문헌[Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9]; 문헌[Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin)]; 문헌[Gill et al., (1988) Nature 334:721-4]을 참조한다.
C. 핵산
일 양태에서, 본 개시내용은 HDR 촉진제를 인코딩하는 핵산을 제공한다. 일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물이 본원에 제공된다. 일부 구현예에서, 핵산은 하나 이상의 벡터에 존재한다. 일부 구현예에서, 핵산은 하나의 벡터에 존재한다.
일부 구현예에서, 핵산은 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함한다. 일부 구현예에서, 핵산은 HDR 촉진제를 인코딩한다. 일부 구현예에서, 핵산은 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩한다. 일부 구현예에서, 핵산은 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 단일 가닥 DNA 결합 단백질(SSB)을 인코딩한다. 일부 구현예에서, 핵산은 발현 구축물 또는 벡터이다. 일부 구현예에서, 발현 구축물 또는 벡터는 핵산을 포함한다.
일부 구현예에서, 핵산은 유전자-편집 분자를 인코딩한다. 일부 구현예에서, 핵산은 서열-특이적 엔도뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드를 포함하는 서열-특이적 엔도뉴클레아제, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 인코딩한다. 일부 구현예에서, 핵산은 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 인코딩한다. 일부 구현예에서, 핵산은 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 서열-특이적 엔도뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 Cas9 및/또는 Cas12a를 포함하는 서열-특이적 엔도뉴클레아제를 인코딩하며, 가이드 RNA 분자는 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는다.
일부 구현예에서, 핵산은 공여자 DNA 분자를 포함한다. 일부 구현예에서, 핵산은 공여자 주형 DNA를 포함한다. 일부 구현예에서, 공여자 DNA 분자는 원형 DNA 벡터, 제미니바이러스 레플리콘 상에 또는 선형 DNA 단편으로서 제공된다. 일부 구현예에서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접된다.
일부 구현예에서, 공여자 DNA 분자는 게놈 DNA 표적 편집 부위의 변형된 서열을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 표적 편집 부위에 비하여 하나 이상의 뉴클레오티드의 치환을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 치환을 포함한다.
일부 구현예에서, 공여자 DNA 분자는 게놈 표적 편집 부위에 비하여 하나 이상의 뉴클레오티드의 결실을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드의 결실을 포함한다.
일부 구현예에서, 공여자 DNA 분자는 게놈 표적 편집 부위에 비하여 하나 이상의 뉴클레오티드의 삽입을 포함한다. 일부 구현예에서, 삽입은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드이다.
일부 구현예에서, 핵산은 RNA-가이드된 뉴클레아제를 포함하는 서열-특이적 엔도뉴클레아제를 인코딩하며, 표적 편집 부위는 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하게 위치한 서열을 포함한다. 일부 구현예에서, 핵산은 서열-특이적 엔도뉴클레아제를 인코딩하며, 이는 절단 후에 표적-편집 부위에 5' 오버행을 제공한다. 일부 구현예에서, 핵산은 상동성 DNA 분자의 상보적인 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 SSAP를 인코딩한다. 일부 구현예에서, 핵산은 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 SSAP를 인코딩한다. 일부 구현예에서, 핵산은 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, 동등한 SSAP 활성을 갖는 관련 단백질 또는 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 RecT/ Redβ-과 단백질을 인코딩한다. 일부 구현예에서, 핵산은 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 ERF-과 단백질을 인코딩한다. 일부 구현예에서, 핵산은 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 RAD52-과 단백질을 인코딩한다.
일부 구현예에서, 핵산은 엑소뉴클레아제를 인코딩한다. 일부 구현예에서, 핵산은 엑소뉴클레아제를 인코딩하며, 선형 dsDNA 분자는 엑소뉴클레아제의 바람직한 기질이다. 일부 구현예에서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질이다. 일부 구현예에서, 엑소뉴클레아제는 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있다. 일부 구현예에서, 엑소뉴클레아제는 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있다. 일부 구현예에서, 엑소뉴클레아제는 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 엑소뉴클레아제 III, Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다. 일부 구현예에서, 엑소뉴클레아제는 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다.
일부 구현예에서, 핵산은 단일 가닥 DNA 결합 단백질(SSB)을 인코딩한다. 일부 구현예에서, 핵산은 SSB 및 SSAP를 인코딩한다. 일부 구현예에서, 핵산은 동일한 숙주 유기체로부터 수득되는 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP를 인코딩한다. 일부 구현예에서, 단일 가닥 DNA 결합 단백질(SSB)은 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB이다. 일부 구현예에서, SSB는 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB이다. 일부 구현예에서, SSB는 SEQ ID NO: 31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함한다.
일부 구현예에서, 핵산은 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 SSAP, 엑소뉴클레아제 및/또는 SSB 단백질을 인코딩한다. 일부 구현예에서, 핵산은 식물 세포에서의 발현을 위한 단백질을 인코딩한다. 일부 구현예에서, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질은 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함한다.
일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 본원에 제공되는 핵산은 각각 프로모터에 작동 가능하게 연결된다. 일부 구현예에서, 프로모터는 구성적 활성 프로모터이다. 일부 구현예에서, 프로모터는 유도성 프로모터이다. 일부 구현예에서, 프로모터는 식물-특이적 프로모터이다. 일부 구현예에서, 프로모터는 포유류 프로모터이다. 일부 구현예에서, 프로모터는 바이러스 프로모터이다. 일부 구현예에서, 프로모터는 35S 프로모터이다. 일부 구현예에서, 프로모터는 유비퀴틴 프로모터이다. 일부 구현예에서, 프로모터는 액틴 프로모터이다. 일부 구현예에서, 프로모터는 포유류 프로모터이다. 일부 구현예에서, 프로모터는 CAG 프로모터이다. 일부 구현예에서, 프로모터는 U6 프로모터이다. 일부 구현예에서, 프로모터는 EF1a 프로모터이다. 일부 구현예에서, 프로모터는 인간 ACTB 프로모터이다. 일부 구현예에서, 프로모터는 CMV 프로모터이다. 일부 구현예에서, 프로모터는 U6 프로모터이다. 일부 구현예에서, 프로모터는 T7 프로모터이다. 일부 구현예에서, CRISPR/Cas-기반의 뉴클레아제를 위한 부위 특이적 뉴클레아제 및/또는 이의 가이드 RNA는 유도성 프로모터의 제어 하에 발현된다. 이 구성에서, 게놈 편집 과정의 발생은 시스템의 다른 성분의 농도가 속도를 제한하지 않는 시간에 유도될 수 있다.
일부 구현예에서, 본원에 제공되는 핵산은 하나 이상의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 하나의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 2개의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 3개의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 4개의 벡터에 제공된다. 일부 구현예에서, 본원에 제공되는 핵산은 5개의 벡터에 제공된다.
일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 벡터가 본원에 제공된다. 일부 구현예에서, HDR 촉진제를 인코딩하는 벡터가 본원에 제공된다. 일부 구현예에서, 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 벡터가 본원에 제공된다. 일부 구현예에서, 적어도 하나의 서열-특이적 엔도뉴클레아제 및 공여자 주형을 인코딩하는 벡터가 본원에 제공된다.
또한, 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 제1 벡터, 및 공여자 주형 DNA 및 가이드 RNA를 포함하는 제2 벡터가 본원에 제공된다.
일부 구현예에서, 핵산은 특정 세포 유형에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 특정 종에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 식물 세포에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 포유류 세포에서의 발현을 위해 최적화된다. 일부 구현예에서, 핵산은 단백질 코딩 서열, 예컨대 엑소뉴클레아제, SSB 단백질 및/또는 SSAP를 포함한다. 일부 구현예에서, 단백질 코딩 서열은 식물 세포에서의 번역을 위해 코돈-최적화된다. 일부 구현예에서, 단백질 코딩 서열은 포유류 세포에서의 번역을 위해 코돈-최적화된다.
특정 구현예에서, 공여자 DNA 주형 상동성 아암은 약 20개, 50개, 100개, 200개, 400개 또는 600개 내지 약 800개 또는 1000개 염기쌍 길이일 수 있다. 예를 들어, 공여자 DNA 주형 상동성 아암은 약 20개 내지 약 1000개, 약 50개 내지 약 1000개, 약 100개 내지 약 1000개, 약 200개 내지 약 1000개 또는 약 600개 내지 1000개 염기쌍 길이일 수 있다. 일부 구현예에서, 공여자 DNA 주형 상동성 아암은 약 400개 내지 약 800개 염기쌍 길이이다. 일부 구현예에서, 공여자 DNA 주형 상동성 아암은 250개 미만의 염기쌍 길이이다. 일부 구현예에서, 공여자 DNA 주형 상동성 아암은 100개 미만의 염기쌍 길이이다.
특정 구현예에서, 공여자 DNA 주형 상동성 아암의 GC 함량은 변경된다. 일부 구현예에서, GC 함량은 최대화된다.
일부 구현예에서, 본원에 제공되는 핵산은 특정 세포 유형에서의 발현을 위해 변형된다. 일부 구현예에서, 본원에 제공되는 핵산은 진핵 세포에서의 발현을 위해 변형된다. 일부 구현예에서, 핵산은 식물 또는 동물 세포에서의 발현을 위해 변형된다. 일부 구현예에서, 핵산은 포유류 세포를 위하여 변형된다. 일부 구현예에서, 핵산은 쥣과 또는 영장류 세포를 위해 변형된다. 일부 구현예에서, 핵산은 인간 세포를 위해 변형된다. 일부 구현예에서, 핵산은 마우스 세포를 위해 변형된다.
특정 세포 유형의 발현을 위한 핵산 조성물의 변형 방법은 당업계에 널리 알려져 있다. 일부 구현예에서, 본원에 제공되는 뉴클레오티드의 GC(구아닌-시토신) 함량은 변경된다. 일부 구현예에서, 본원에 제공되는 핵산은 특정 세포 유형을 위해, 예를 들어, 진핵 세포를 위해 코돈 최적화된다.
i. 바이러스 벡터
일 양태에서, 본 개시내용은 포유류 세포에서의 발현을 위한 본원에 개시된 핵산 중 임의의 것을 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 발현 구축물을 포함한다. 일부 구현예에서, 벡터는 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 핵산을 포함한다.
일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및/또는 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 벡터가 본원에 제공된다.
일부 구현예에서, 제1 벡터는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩한다. 일부 구현예에서, 제2 벡터는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩한다. 일부 구현예에서, 제1 벡터는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나를 인코딩하지 않는다. 일부 구현예에서, 제1 벡터에 의해 인코딩되지 않는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB 단백질 중 적어도 하나는 제2 벡터에 의해 인코딩된다. 일부 구현예에서, 성분은 하기 표 B에 나타낸 바와 같이 제1 및 제2 벡터에 의해 인코딩된다.
[표 B]
일부 구현예에서, 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB는 3가지 벡터에 다양한 조합으로 제공된다. 예를 들어, 서열-특이적 엔도뉴클레아제를 포함하는 제1 벡터, 공여자 주형 DNA를 포함하는 제2 벡터, 및 SSAP, 엑소뉴클레아제 및 SSB를 포함하는 제3 벡터, 또는 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 및 SSAP를 포함하는 제1 벡터, 엑소뉴클레아제를 포함하는 제2 벡터, 및 SSB를 포함하는 제3 벡터.
일부 구현예에서, 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB는 4가지 벡터에 다양한 조합으로 제공된다. 예를 들어, 서열-특이적 엔도뉴클레아제를 포함하는 제1 벡터, 공여자 주형 DNA를 포함하는 제2 벡터, SSAP를 포함하는 제3 벡터, 및 엑소뉴클레아제 및 SSB를 포함하는 제4 벡터, 또는 서열-특이적 엔도뉴클레아제 및 공여자 주형 DNA를 포함하는 제1 벡터, SSAP를 포함하는 제2 벡터, 엑소뉴클레아제를 포함하는 제3 벡터 및 SSB를 포함하는 제4 벡터.
일부 구현예에서, 서열-특이적 엔도뉴클레아제, 공여자 주형 DNA 분자, SSAP, 엑소뉴클레아제 및 SSB는 5가지 벡터에 제공된다.
일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 파보바이러스 벡터이다. 일부 구현예에서, 벡터는 아데노-연관 바이러스(AAV) 벡터이다. 일부 구현예에서, 벡터는 재조합 AAV(rAAV) 벡터이다. 일부 구현예에서, 벡터는 아데노바이러스 벡터이다. 일부 구현예에서, 벡터는 레트로바이러스 벡터이다. 일부 구현예에서, 벡터는 렌티바이러스 벡터이다. 일부 구현예에서, 벡터는 헤르페스바이러스 벡터이다. 일부 구현예에서, 벡터는 배큘로바이러스 벡터이다.
일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2, 1, 5, 6, 19, 3, 11, 7, 14, 16, 21, 12, 18, 31, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24-30, 37, 40, 41, AdHu2, AdHu 3, AdHu4, AdHu24, AdHu26, AdHu34, AdHu35, AdHu36, AdHu37, AdHu41, AdHu48, AdHu49, AdHuSO, AdC6, AdC7, AdC69, 소 Ad 3형, 개 Ad 2형, 양 Ad 또는 돼지 Ad 3형으로부터 유래된다. 일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2 또는 아데노바이러스 혈청형 5의 변이체로부터 유래된다. 일부 구현예에서, 벡터는 재조합 렌티바이러스 벡터이다. 일부 구현예에서, 재조합 렌티바이러스 벡터는 수포성 구내염 바이러스(VSV), 림프구성 맥락수막염 바이러스(LCMV), 로스 리버 바이러스(RRV), 에볼라 바이러스, 마르부르그 바이러스, 모칼라 바이러스, 광견병 바이러스, RD 114 또는 이의 변이체로 위형화된(pseudotyped) 렌티바이러스로부터 유래된다. 일부 구현예에서, 벡터는 rHSV 벡터이다. 일부 구현예에서, rHSV 벡터는 rHSV-1 또는 rHSV-2로부터 유래된다.
상기 방법의 일부 구현예에서, 벡터는 rAAV 벡터이다. 일부 구현예에서, HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 발현 구축물은 하나 이상의 AAV 역위 말단 반복부(ITR) 서열이 측접된다. 일부 구현예에서, 발현 구축물은 2개의 AAV ITR이 측접된다. 일부 구현예에서, AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAVrh8R, AAV9, AAV10, AAVrh10, AAV11, AAV12, AAV2R471A, AAV DJ, 염소 AAV, 소 AAV, 또는 마우스 AAV 혈청형 ITR이다. 일부 구현예에서, AAV ITR은 AAV2 ITR이다. 일부 구현예에서, 벡터는 스터퍼(stuffier) 핵산을 추가로 포함한다. 일부 구현예에서, 스터퍼 핵산은 프로모터와 발현 구축물을 인코딩하는 핵산 사이에 위치한다. 일부 구현예에서, 벡터는 자가-상보적 rAAV 벡터이다. 일부 구현예에서, 벡터는 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 제1 핵산 서열 및 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 제2 핵산 서열을 포함한다. 일부 구현예에서, 제1 핵산 서열 및 제2 핵산 서열은 돌연변이된 AAV ITR에 의해 연결되고, 돌연변이된 AAV ITR은 D 영역의 결실을 포함하고, 말단 분해 서열(terminal resolution sequence)의 돌연변이를 포함한다. 일부 구현예에서, 본 발명은 본원에 기술된 임의의 벡터(예를 들어, rAAV 벡터)를 포함하는 세포를 제공한다.
상기 방법의 일부 구현예에서, HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩하는 벡터는 바이러스 입자에 존재하며, 바이러스 입자는 rAAV 벡터를 캡시드화하는 AAV 입자, 재조합 아데노바이러스 벡터를 캡시드화하는 아데노바이러스 입자, 재조합 렌티바이러스 벡터를 캡시드화하는 렌티바이러스 입자 또는 재조합 HSV 벡터를 캡시드화하는 HSV 입자이다. 일부 구현예에서, 바이러스 입자는 재조합 아데노바이러스 벡터를 캡시드화하는 아데노바이러스 입자이다. 일부 구현예에서, 아데노바이러스 입자는 아데노바이러스 혈청형 2, 1, 5, 6, 19, 3, 11, 7, 14, 16, 21, 12, 18, 31, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24-30, 37, 40, 41, AdHu2, AdHu3, AdHu4, AdHu24, AdHu26, AdHu34, AdHu35, AdHu36, AdHu37, AdHu41, AdHu48, AdHu49, AdHuSO, AdC6, AdC7, AdC69, 소 Ad 3형, 개 Ad 2형, 양 Ad, 또는 돼지 Ad 3형 유래의 캡시드를 포함한다. 일부 구현예에서, 아데노바이러스 입자는 아데노바이러스 혈청형 2 캡시드 또는 아데노바이러스 혈청형 S 캡시드의 변이체를 포함한다. 일부 구현예에서, 바이러스 입자는 재조합 렌티바이러스 벡터를 캡시드화하는 렌티바이러스 입자이다. 일부 구현예에서, 렌티바이러스 입자는 수포성 구내염 바이러스(VSV), 림프구성 맥락수막염 바이러스(LCMV), 로스 리버 바이러스(RRV), 에볼라 바이러스, 마르부르그 바이러스, 모칼라 바이러스, 광견병 바이러스, RD114 또는 이의 변이체로 위형화된 캡시드를 포함한다. 일부 구현예에서, 바이러스 입자는 HSV 입자이다. 일부 구현예에서, HSV 입자는 rHSV-1 입자 또는 rHSV-2 입자이다.
상기 방법의 일부 구현예에서, 본 발명은 본원에 기술된 rAAV 벡터 중 임의의 것을 포함하는 재조합 AAV 입자를 제공한다. 일부 구현예에서, AAV 바이러스 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAVrh8R, AAV9, AAV 10, AAVrh10, AAV11, AAV12, AAV2R471A, AAV2/2-7m8, AAV DJ, AAV2 N587A, AAV2 E548A, AAV2 N708A, AAV V708K, 염소 AAV, AAV1/AAV2 키메라, 소 AAV 또는 마우스 AAV 캡시드 rAAV2/HBoVl 혈청형 캡시드를 포함한다. 일부 구현예에서, ITR 및 rAAV 바이러스 입자의 캡시드는 동일한 AAV 혈청형으로부터 유래된다. 일부 구현예에서, ITR 및 rAAV 바이러스 입자의 캡시드는 상이한 AAV 혈청형으로부터 유래된다. 일부 구현예에서, ITR은 AAV2로부터 유래되고, rAAV 입자의 캡시드는 AAV1로부터 유래된다. 본 발명은 본원에 기술된 구현예 중 어느 하나의 발현 구축물을 포함하는 벡터를 제공한다. 일부 구현예에서, 발현 구축물은 HDR-촉진제(예를 들어, SSAP, 엑소뉴클레아제 및/또는 SSB), 서열-특이적 엔도뉴클레아제 및/또는 공여자 주형 DNA 분자를 인코딩한다. 일부 구현예에서, 벡터는 재조합 아데노-연관 바이러스(rAAV) 벡터, 재조합 아데노바이러스 벡터, 재조합 렌티바이러스 벡터 또는 재조합 단순 헤르페스 바이러스(HSV) 벡터이다. 일부 구현예에서, 벡터는 재조합 아데노바이러스 벡터이다. 일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2, 1, 5, 6, 19, 3, 11, 7, 14, 16, 21, 12, 18, 31, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24-30, 37, 40, 41, AdHu2, AdHu 3, AdHu4, AdHu24, AdHu26, AdHu34, AdHu35, AdHu36, AdHu37, AdHu41, AdHu48, AdHu49, AdHu50, AdC6, AdC7, AdC69, 소 Ad 3형, 개 Ad 2형, 양 Ad 또는 돼지 Ad 3형으로부터 유래된다. 일부 구현예에서, 재조합 아데노바이러스 벡터는 아데노바이러스 혈청형 2 또는 아데노바이러스 혈청형 S의 변이체로부터 유래된다. 일부 구현예에서, 벡터는 재조합 렌티바이러스 벡터이다. 일부 구현예에서, 재조합 렌티바이러스 벡터는 수포성 구내염 바이러스(VSV), 림프구성 맥락수막염 바이러스(LCMV), 로스 리버 바이러스(RRV), 에볼라 바이러스, 마르부르그 바이러스, 모칼라 바이러스, 광견병 바이러스, RD114 또는 이의 변이체로 위형화된 렌티바이러스로부터 유래된다. 일부 구현예에서, 벡터는 rHSV 벡터이다. 일부 구현예에서, rHSV 벡터는 rHSV-1 또는 rHSV-2로부터 유래된다.
일부 구현예에서, 벡터는 선택 가능한 마커를 포함한다.
상기 방법의 일부 구현예에서, 바이러스 입자는 조성물(예를 들어, 약제학적 조성물)에 존재한다. 일부 구현예에서, 조성물은 약제학적으로 허용 가능한 담체를 추가로 포함한다.
ii. 기타 벡터
일부 구현예에서, 벡터는 비-바이러스 벡터이다. 일부 구현예에서, 벡터는 플라스미드이다. 일부 구현예에서, 벡터는 식물 형질전환 벡터이다. 일부 구현예에서, 벡터는 조직 배양물 또는 식물 조직에서의 아그로박테리움(Agrobacterium)-매개된 일시적인 발현 또는 안정한 형질전환을 위한 벡터이다.
본 발명과 양립 가능한 재조합 플라스미드 벡터를 사용한 예시적인 시스템은 "통합(cointegrate)" 및 "이원(binary)" 시스템을 포함하지만 이에 한정되지 않는다. "통합" 시스템에서, 관심 유전자를 함유하는 셔틀 벡터는 예를 들어, pMLJ1 셔틀 벡터 및 비-종양형성 플라스미드 pGV3850에서와 같이, 식물 세포 형질전환에 필요한 시스-작용 및 트랜스-작용 요소를 둘 모두 함유하는 비-종양형성 플리스미드 내로 유전학적 재조합에 의해 삽입된다. 제2 시스템은 2가지 플라스미드가 사용되는 "이원" 시스템으로 지칭되며; 관심 유전자는 식물 형질전환에 필요한 시스-작용 요소를 함유하는 셔틀 벡터 내로 삽입된다. 다른 필요한 기능은 pBIN19 셔틀 벡터 및 비-종양형성 플라스미드 PAL4404에 의해 예시된 바와 같은 비-종양형성 플라스미드에 의해 트랜스로 제공된다. 이들 시스템에 유용한 이들 및 기타 벡터는 상업적으로 입수 가능하다.
D. 세포
일 양태에서, 본 개시내용은 HDR 촉진제를 포함하는 진핵 세포를 제공한다. 일부 구현예에서, 진핵 세포는 게놈-편집 분자 및 HDR 촉진제를 포함한다. 일부 구현예에서, 세포는 숙주 세포이다. 일부 구현예에서, 세포는 본 발명의 방법에 따라 변형될 세포이다. 일부 구현예에서, 게놈 편집 분자는 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함한다. 일부 구현예에서, HDR 촉진제는 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함한다.
또 다른 양태에서, 본 개시내용은 본원에 제공되는 방법에 의해 생성되는 진핵 세포를 제공한다. 일부 구현예에서, 진핵 세포 게놈의 표적 편집 부위의 변형은 게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공하는 것을 포함하며, 게놈 편집 분자는 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드, 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제는 SSAP, 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 SSB 단백질을 포함한다. 일부 구현예에서, 세포는 본 발명의 방법에 따른 변형에 의해 생성되는 게놈 시그너쳐(genomic signature)를 갖는다. 일부 구현예에서, 뉴클레아제 절단 부위가 제거된다. 일부 구현예에서, 핵산 서열 태그에 관심이 있다.
일부 구현예에서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 핵산, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩하는 핵산, iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩하는 핵산 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 하나 이상의 벡터를 포함하는 숙주 세포가 본원에 제공된다. 일부 구현예에서, 숙주 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 핵산, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩하는 핵산, iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩하는 핵산, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 인코딩하는 하나의 벡터를 포함한다. 일부 구현예에서, 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 핵산, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 제1 벡터, 및 iii) 단일-가닥 DNA 어닐링 단백질(SSAP)을 인코딩하는 핵산, iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제를 인코딩하는 핵산, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 제2 벡터를 포함한다.
추가로, 본 개시내용의 방법을 사용하여, 진핵 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 진핵 세포를 제조하고/하거나 본원에 기술된 바와 같이 진핵 세포를 유전학적으로 엔지니어링할 수 있다.
일부 구현예에서, 세포는 단리된 세포이다. 일부 구현예에서, 세포는 세포 배양물에 존재한다. 일부 구현예에서, 세포는 생체외에 존재한다. 일부 구현예에서, 세포는 살아 있는 유기체로부터 수득되고, 세포 배양물에서 유지된다. 일부 구현예에서, 세포는 단-세포 유기체이다. 일부 구현예에서, 세포는 유기체의 내측에 존재한다. 일부 구현예에서, 세포는 유기체이다. 일부 구현예에서, 세포는 단-세포 진핵 유기체의 세포, 원생동물 세포, 식물 유래 세포, 조류 세포, (예를 들어, 보트리오코쿠스 브라우니이(Botryococcus braunii), 클라마이도모나스 레인하르드티이(Chlamydomonas reinhardtii), 난노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스(Sargassum patens), 씨. 아가르드(C. agardh) 등), 해초(예를 들어, 켈프) 진균 세포(예를 들어, 효모 세포, 버섯 유래의 세포), 동물 세포, 무척추동물(예를 들어, 초파리, 강장동물, 극피동물, 선충 등) 유래의 세포, 척추동물(예를 들어, 어류, 양서류, 파충류, 조류, 포유류) 유래의 세포, 포유류(예를 들어, 유제류(예를 들어, 돼지, 소, 염소, 양); 설치류(예를 들어, 랫트, 마우스); 비-인간 영장류; 인간; 고양이과(예를 들어, 고양이); 갯과(예를 들어, 개); 등) 유래의 세포 등이다. 일부 구현예에서, 세포는 천연 유기체로부터 기원하지 않은 세포이다(예를 들어, 세포는 합성으로 제조된 세포일 수 있고; 또한 인공 세포로 지칭된다). 일부 구현예에서, 세포는 세포 배양물(예를 들어, 시험관내 세포 배양물)에 존재한다. 일부 구현예에서, 세포는 세포의 집합 중 하나이다. 일부 구현예에서, 세포는 진핵 세포이거나, 진핵 세포로부터 유래된다. 일부 구현예에서, 세포는 식물 세포이거나, 식물 세포로부터 유래된다. 일부 구현예에서, 세포는 동물 세포이거나, 동물 세포로부터 유래된다. 일부 구현예에서, 세포는 무척추동물 세포이거나, 무척추동물 세포로부터 유래된다. 일부 구현예에서, 세포는 척추동물 세포이거나, 척추동물 세포로부터 유래된다. 일부 구현예에서, 세포는 포유류 세포이거나, 포유류 세포로부터 유래된다. 일부 구현예에서, 세포는 설치류 세포이거나, 설치류 세포로부터 유래된다. 일부 구현예에서, 세포는 인간 세포이거나, 인간 세포로부터 유래된다. 일부 구현예에서, 세포는 비-인간 동물 세포이거나, 비-인간 동물 세포로부터 유래된다. 일부 구현예에서, 세포는 비-인간 포유류 세포이거나, 비-인간 포유류 세포로부터 유래된다. 일부 구현예에서, 세포는 진균 세포이거나, 진균 세포로부터 유래된다. 일부 구현예에서, 세포는 곤충 세포이다. 일부 구현예에서, 세포는 절지동물 세포이다. 일부 구현예에서, 세포는 원생동물 세포이다. 일부 구현예에서, 세포는 연충 세포이다. 일부 구현예에서, 세포는 비-포유류 동물 세포이다. 일부 구현예에서, 세포는 어류 세포이다. 일부 구현예에서, 세포는 곤충 세포이다. 일부 구현예에서, 세포는 초파리 세포이다. 일부 구현예에서, 세포는 드로소필라 멜라노개스터(Drosophila melanogaster) 세포이다. 일부 구현예에서, 세포는 선충류 세포이다. 일부 구현예에서, 세포는 카에노랍디티스 엘레간스(Caenorhabditis elegans) 세포이다. 일부 구현예에서, 세포는 회충 세포이다.
일부 구현예에서, 세포는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 포함하는 전구 세포이며, 전구 세포는 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나는 이후에 폴리펩티드, DNA 또는 mRNA를 전구 세포에 전달함으로써 및/또는 전구 세포의 유성 교배에 의해 제공된다. 예를 들어, 일부 구현예에서, 전구 세포는 i) 내지 v) 중 하나 이상의 성분이 결여되며, 결여된 성분이 형질전환된다.
i. 식물 세포
일부 구현예에서, 진핵 세포는 식물 세포이다. 일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 식물 세포이다. 추가로, 본 개시내용의 방법을 사용하여, 식물 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 식물 세포를 제조하고/하거나 식물 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포 게놈에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 식물 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.
특정 구현예에서, 세포는 단리된 식물 세포 또는 식물 원형질체(즉, 비해리된 또는 온전한 식물 조직, 식물 부분 또는 전체 식물에 위치하지 않음)이다. 특정 구현예에서, 식물 세포는 임의의 식물 부분 또는 조직 또는 캘러스로부터 수득된다. 특정 구현예에서, 배양물은 식물 조직, 배양된 식물 조직 외식편, 전체 식물, 온전한 마디 눈, 슈트 정단부 또는 슈트 정단 분열조직, 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할 종자 또는 기타 종자 단편, 접합자 배, 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리, 캘러스 또는 식물 세포 현탁액으로부터 수득되는 식물 세포를 포함한다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층으로부터 유래된다.
특정 구현예에서, 식물 세포는 비해리된 또는 온전한 식물 조직, 식물 부분, 식물 외식편 또는 전체 식물에 위치한다. 특정 구현예에서, 식물 세포는 온전한 마디 눈, 배양된 식물 조직 외식편, 슈트 정단부 또는 슈트 정단 분열조직, 뿌리 정단부 또는 뿌리 정단 분열조직, 측생 분열조직, 절간 분열조직, 묘목, 전체 종자, 반할 종자 또는 기타 종자 단편, 접합자 배, 체세포 배, 미성숙 배, 밑씨, 화분, 소포자, 꽃밥, 하배축, 떡잎, 잎, 잎자루, 줄기, 괴경, 뿌리 또는 캘러스에 위치할 수 있다. 특정 구현예에서, 사용되는 외식편은 미성숙 배를 포함한다. 미성숙 배(예를 들어, 미성숙 옥수수 배)는 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3 내지 7 ㎜ 배를 포함한다. 특정 구현예에서, 상기 언급된 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대, 미성숙 이삭 및 생사로부터 수득된다. 다양한 양태에서, 형질전환을 위해 사용되는 식물-유래 외식편은 미성숙 배, 1.8 내지 2.2 ㎜ 배, 1 내지 7 ㎜ 배 및 3.5 내지 7 ㎜ 배를 포함한다. 일 양태에서, 배는 성숙 이삭-유래 종자, 엽저, 성숙 식물 유래의 잎, 잎끝, 미성숙 꽃차례, 수꽃대, 미성숙 이삭 또는 생사로부터 유래될 수 있다. 특정 구현예에서, 식물 세포는 만능 식물 세포(예를 들어, 줄기 세포 또는 분열조직 세포)이다. 특정 구현예에서, 식물 세포는 외떡잎 식물(예를 들어, 옥수수, 밀, 수수 또는 벼)의 미성숙 또는 성숙 배의 L1 또는 L2 층 내에 위치한다.
특정 구현예에서, 식물 세포는 반수체, 이배체 또는 배수체 식물 세포 또는 식물 원형질체, 예를 들어, 반수체, 이배체 또는 배수체 식물, 식물 부분 또는 조직 또는 캘러스로부터 수득되는 것들이다. 특정 구현예에서, 배양 중 식물 세포(또는 재생된 식물, 자손 종자 및 자손 식물)는 반수체이거나, 반수체가 되도록 유도될 수 있으며; 반수체 식물 및 식물 세포의 제조 및 이용을 위한 기법은 당업계에 알려져 있으며, 예를 들어, www[dot]openwetware[dot]org/images/d/d3/Haploid_Arabidopsis_protocol[dot]pdf에서 이용 가능한 "How to make haploid Arabidopsis thaliana" 프로토콜(문헌[Ravi et al. (2014) Nature Communications, 5:5334, doi: 10.1038/ncomms6334])에서 Maruthachalam 및 Chan에 의해 기술된 바와 같은, 변경된 형태의 동원체-특이적 히스톤 CENH3을 발현하는 반수체-유도 스트레인과 야생형 스트레인의 교배에 의해 아라비돕시스 탈리아나에서 반수체를 생성하기 위한 방법을 참조한다. 반수체는 또한 그의 전체가 본원에 참조로 포함되는 미국 특허 제9,215,849호에 개시된 바와 같이 돌연변이된 CENH3 유전자를 포함하는 식물을 야생형 이배체 식물과 교배하여, 반수체 자손을 생성함으로써 매우 다양한 외떡잎 식물(예를 들어, 옥수수, 밀, 벼, 수수, 보리) 또는 쌍떡잎 식물(예를 들어, 대두, 브라시카 종, 예를 들어, 카놀라, 목화, 토마토)에서 수득될 수 있다. 반수체 옥수수 식물 및/또는 세포를 수득하기 위해 사용될 수 있는 반수체-유도 옥수수 라인은 스톡 6, MHI(몰도바 반수체 유도제), 부정 배우체(ig) 돌연변이, KEMS, RWK, ZEM, ZMS, KMS, 및 본원에 전체가 참조로 포함되는 미국 특허 제9,677,082호에 개시된 트랜스제닉 반수체 유도 라인을 포함한다. 반수체 세포의 예는 반수체 식물로부터 수득되는 식물 세포 및 생식 조직으로부터, 예를 들어, 꽃, 발생 중인 꽃 또는 꽃눈, 씨방, 밑씨, 대포자, 꽃밥, 화분, 대배우체 및 소포자로부터 수득되는 식물 세포를 포함하지만, 이에 한정되지 않는다. 식물 세포 또는 식물 원형질체가 반수체인 특정 구현예에서, 유전학적 상보물은 식물 세포 또는 식물 원형질체에서 염색체 배가에 의해(예를 들어, 감수분열 비-감소에 의한 자발적 염색체 배가에 의해 또는 염색체 배가 작용제, 예컨대 콜히친, 오리잘린, 트리플루랄린, 프로나미드, 아산화질소 기체, 항-미세소관 제초제, 항-미세소관 작용제 및 유사분열 저해제의 사용에 의해) 배가되어, 유전자 또는 대립유전자의 상보물이 동형접합성인 배가된 반수체 식물 세포 또는 식물 원형질체를 생성할 수 있으며; 또 다른 구현예는 배가된 반수체 식물 세포 또는 식물 원형질체로부터의 배가된 반수체 식물의 재생을 포함한다. 또 다른 구현예는 이 접근법에 의해 제공되는 배가된 반수체 식물인 적어도 하나의 부모 식물을 갖는 하이브리드 식물에 관한 것이다. 배가된 반수체 식물의 생성에 의해, 동형접합성 식물을 수득하기 위하여 몇 세대의 자가-교배를 필요로 하는 것 대신에 한 세대에서 동형접합성이 제공된다. 배가된 반수체의 이용은 가능한 최소의 시간에 유전학적 순도(즉, 동형접합성)를 확립하고자 하는 임의의 상황에서 유리하다. 배가된 반수체 생성은 느리게 성장하는 식물, 예컨대 과수 및 기타 식물에서 또는 적어도 하나의 배가된-반수체 식물의 자손인 하이브리드 식물을 생성하는 데 특히 유리할 수 있다.
특정 구현예에서, 식물 세포는 임의의 관심 외떡잎 또는 쌍떡잎 식물 종, 예를 들어, 줄뿌림 작물 식물, 과실-생성 식물, 및 나무, 야채, 나무 및 관상용 꽃, 관목, 나무, 지피식물 및 잔디풀을 포함하는 관상용 식물로부터 수득되거나 이에 위치한다. 특정 비-제한적인 구현예에서, 식물 세포는 알팔파(메디카고 사티바), 아몬드(프루누스 둘시스), 사과(말루스 x 도메스티카), 살구(프루누스 아르메니아카, 프루누스 브리간티네, 프루누스 만드슈리카, 프루누스 무메, 프루누스 시비리카), 아스파라거스(아스파라거스 오피시날리스), 바나나(무사 종), 보리(호르데움 불가레), 콩(파세올루스 종), 블루베리 및 크랜베리(백시니움 종), 카카오(테오브로마 카카오), 카놀라 및 평지씨 또는 오일시드 평지, (브라시카 나푸스), 카네이션(디안투스 카리오필루스), 당근(다우쿠스 카로타 사티부스), 카사바(마니호트 에스쿨렌툼), 체리(프루누스 아비움), 병아리콩(시더 아리에티눔), 치커리(시코리움 인티부스), 칠리 페퍼 및 기타 캅시쿰 페퍼(캅시쿰 아눔, 캅시쿰 프루테센스, 캅시쿰 키넨세, 캅시쿰 푸베센스, 캅시쿰 바카툼), 국화(크리산테뭄 종), 코코넛(코코스 누시페라), 커피(코페아 종, 예를 들어, 코페아 아라비카 및 코페아 카네포라), 목화(고시피움 히르수툼 L.), 동부(비그나 운구이쿨라타), 오이(쿠쿠미스 사티부스), 커런트 및 구스베리(리베스 종), 가지(eggplant 또는 aubergine)(솔라눔 멜론게나), 유칼립투스(유칼립투스 종), 아마(리눔 우시타티수뭄 L.), 제라늄(펠라르고늄 종), 자몽(시트러스 x 파라디시), 포도(비투스 종), 예를 들어, 양조용 포도(비투스 비니페라), 구아바(프시디움 구아자바), 삼 및 대마(예를 들어, 카나비스 사티바 및 카나비스 종), 홉(후물러스 루풀러스), 붓꽃(이리스 종), 레몬(시트러스 리몬), 상추(락투카 사티바), 라임(시트러스 종), 옥수수(제아 메이즈 L.), 망고(만지페라 인디카), 망고스틴(가르시니아 망고스타나), 멜론(쿠쿠미스 멜로), 기장(세타리아 종, 에키노클로아 종, 엘레우신 종, 파니쿰 종, 페니세툼 종), 귀리(아베나 사티바), 기름야자(엘리스 퀴닌시스), 올리브(올레아 유로파에아), 양파(알리움 세파), 오렌지(시트러스 시넨시스), 파파야(카리카 파파야), 복숭아 및 천도복숭아(프루누스 페르시카), 배(피루스 종), 완두(피사 사티붐), 땅콩(아라키스 하이포가에아), 작약(파에오니아 종), 페투니아(페투니아 종), 파인애플(아나나스 코모수스), 플랜테인(무사 종), 자두(프루누스 도메스티카), 포인세티아(유포르비아 풀체리마), 폴란드 카놀라(브라시카 라파), 포플러(포풀러스 종), 감자(솔라눔 투베로숨), 호박(쿠쿠르비타 페포), 벼(오리자 사티바 L.), 장미(로사 종), 고무(헤베아 브라실리엔시스), 호밀(세칼레 세레알레), 잇꽃(카르타무스 틴크토리우스 L), 참깨 종자(세사메 인디움), 수수(소르굼 비콜로르), 대두(글리신 맥스 L.), 애호박(쿠쿠르비타 페포), 딸기(프라가리아 종, 프라가리아 x 아나나사), 사탕무(베타 불가리스), 사탕수수(사카룸 종), 해바라기(헬리안투스 안누스), 고구마(이포모에아 바타타스), 탠저린(시트러스 탄제리나), 찻잎(카멜리아 시넨시스), 담배(니코티아나 타바쿰 L.), 토마토(라이코페르시콘 에스쿨렌툼), 튤립(툴리파 종), 순무(브라시카 라파 라파), 호두(저글란스 종 L.), 수박(시트룰러스 라나투스), 밀(트리티움 아에스티붐) 또는 마(디스코레아 종)로부터 수득되거나, 이에 위치한다.
ii. 포유류 세포
일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 동물 세포이다. 일부 구현예에서, 동물 세포는 포유류 세포이다. 추가로, 본 개시내용의 방법을 사용하여 동물 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 동물 세포를 제조하고/하거나 동물 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 당해 방법을 사용하여, HDR-매개된 게놈 변형을 증가시키고/시키거나 게놈 변형을 갖는 세포를 제조하고/하거나 포유류 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 동물 세포, 예를 들어, 포유류 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.
일부 구현예에서, 세포는 임의의 다세포 척추동물 또는 무척추동물 유래의 동물 세포이다. 일부 구현예에서, 동물은 생물학적, 생리학적 또는 유전학적 연구를 위해 사용되는 모델 유기체이다. 따라서, 일부 구현예에서, 동물은 하기로부터 선택된다: 마우스(무스 무스쿨러스(Mus musculus)), 제브라피시(zebrafish)(다니오 레리오(Danio rerio)), 초파리(드로소필라 멜라노개스터), 고양이(펠리스 실베스트리스 카투스(Felis sylvestris catus)), 닭(갈루스 갈루스(Gallus gallus)), 개(카니스 루푸스 파밀리아리스(Canis lupus familiaris)), 기니피그(카비아 포르셀루스(Cavia porcellus)), 랫트(래투스 노르베지쿠스(Rattus norvegicus)) 및 선충류(카에노랍디티스 엘레간스). 일부 구현예에서, 동물은 가축 또는 농장 동물이다. 따라서, 일부 구현예에서, 동물은 하기로부터 선택된다: 염소(카프라 아에가그루스 히르쿠스(Capra aegagrus hircus)), 돼지(수스 스크로파 도메스티쿠스(Sus scrofa domesticus)), 양(오비스 아리에스(Ovis aries)), 소(보스 타우루스(Bos taurus)), 고양이(펠리스 카투스(Felis catus)), 당나귀(에쿠스 아프리카누스 아시누스(Equus africanus asinus)), 오리(아나스 플라티린코스 도메스티쿠스(Anas platyrhynchos domesticus)), 물소, 예를 들어, 부발루스 부발리스 부발리스(Bubalus bubalis bubalis) 및 부발루스 부발리스 카라베네시스(Bubalus bubalis carabenesis), 양봉 꿀벌(아피스 멜리페라(Apis mellifera)), 예를 들어, 아종 이탈리아 벌(아피스 멜리페라 리구스티카(A. mellifera ligustica)), 유럽 검정벌(아피스 멜리페라 멜리페라(A. mellifera mellifera)), 카니올란 꿀벌(Carniolan honey bee)(아피스 멜리페라 카르니카(A. mellifera carnica)), 코카시안 꿀벌(Caucasian honey bee)(아피스 멜리페라 코카시아(A. mellifera caucasia)), 및 그리스 벌(Greek bee)(아피스 멜리페라 세크로피아(A. mellifera cecropia)), 단봉낙타(카멜루스 드로메다리우스(Camelus dromedarius)), 말(에쿠스 페른스 카발루스(Equus ferns caballus)), 누에나방(봄빅스 모리(Bombyx mori)), 비둘기(콜럼바 리비아(Columba livia)), 거위(안세르 도메스티쿠스(Anser domesticus) 및 안세르 사이그노이데스 도메스티쿠스(Anser cygnoides domesticus)), 야크(보스 그루니엔스(Bos grunniens)), 쌍봉낙타(카멜루스 박트리아누스(Camelus bactrianus)), 라마(라마 글라마(Lama glama)), 알파카(비쿠그나 파코스(Vicugna pacos)), 뿔닭(누미다 멜레아그리스(Numida meleagris)), 페렛(무스텔라 푸토리우스 푸로(Mustela putorius furo)), 칠면조(멜레아그리스 갈로파보(Meleagris gallopavo)) 초어, 백련어, 잉어, 나일 틸라피아(nile tilapia), 대두어, 카틀라(catla)(인도 잉어(indian carp)), 붕어, 대서양 연어, 로호 라베오(roho labeo), 갯농어(milkfish), 무지개 송어, 우창 브림(wuchang bream), 검정 잉어(black carp), 가물치(northern snakehead) 및 메기(amur catfish).
일부 구현예에서, 세포는 세포주, 예를 들어, 포유류 세포주 또는 인간 세포주로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 알려져 있다. 세포주의 예는 A549, HEK-293, 293T, MF7, K562, Caco-2, HeLa 세포 및 이의 전이유전자 변종을 포함하지만 이에 한정되지 않는다. 일부 구현예에서, 세포는 HEK-293 세포이다. 일부 구현예에서, 세포는 중국 햄스터 난소(CHO) 세포이다. 세포주는 당업자에게 알려져 있는 다양한 공급원으로부터 입수 가능하다(예를 들어, 어메리칸 타입 컬쳐 콜렉션(American Type Culture Collection; ATCC)(미국 버지니아주 머내서스 소재) 참조). 일부 구현예에서, 본원에 기술된 바와 같은 하나 이상의 핵산(예컨대 HDR 촉진제를 인코딩하는 벡터)으로 트랜스펙션된 세포를 사용하여, 하나 이상의 벡터-유래 서열을 포함하는 새로운 세포주를 확립하여, 표적 핵산에 대한 변형을 포함하는 새로운 세포주를 확립한다.
일부 구현예에서, 세포는 일차 세포, 예를 들어, 포유류 일차 세포 또는 인간 일차 세포이다. 예를 들어, 일차 세포의 배양물은 0회, 1회, 2회, 4회, 5회, 10회, 15회 이상 계대될 수 있다. 일부 구현예에서, 일차 세포는 임의의 알려져 있는 방법에 의해 개체로부터 수집된다. 예를 들어, 백혈구는 분리반출법, 백혈구분반술, 밀도 기울기 분리 등에 의해 수집될 수 있다. 조직, 예컨대 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등 유래의 세포는 생검에 의해 수집될 수 있다. 적절한 용액은 수집된 세포의 분산 또는 현탁을 위해 사용될 수 있다. 이러한 용액은 일반적으로 낮은 농도의 허용 가능한 완충제와 함께, 우태아혈청 또는 기타 자연 발생 인자가 편리하게 보충된, 평형 염 용액(예를 들어, 생리 식염수, 인산염-완충 식염수(PBS), 행크스 평형 염 용액 등)일 수 있다. 완충제는 HEPES, 인산염 완충제, 락테이트 완충제 등을 포함할 수 있다. 세포는 즉시 사용되거나 저장될 수 있다(예를 들어, 동결에 의해). 동결된 세포는 해동될 수 있고 재사용될 수 있다. 세포는 DMSO, 혈청, 배지 완충제(예를 들어, 10% DMSO, 50% 혈청, 40% 완충 배지), 및/또는 동결 온도에서 세포를 보존하는 데 사용되는 일부 다른 일반적인 용액에서 동결될 수 있다.
일부 구현예에서, 세포는 인간 세포이다. 일부 구현예에서, 세포는 생식선 세포이다. 일부 구현예에서, 세포는 체세포이다. 일부 구현예에서, 세포는 유사분열-후 세포이다. 일부 구현예에서, 세포는 면역 세포, 예컨대 T 세포, 자연 살해(NK) 세포 또는 대식구이다. 일부 구현예에서, 세포는 환자 또는 공여자로부터 수득되는 인간 T 세포이다. 본원에 제공되는 방법을 사용하여, 면역요법에 사용하기 위한 일차 T 세포에서 표적 핵산을 변형시킬 수 있다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여 예를 들어, T 세포의 게놈을 편집하여, 키메라 항원 수용체(CAR)를 발현하는 발현 구축물을 도입함으로써 CAR-T 세포를 생성한다. 일부 구현예에서, 본원에 제공된 방법을 사용하여 면역 세포를 생체외에서 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여 CAR-T 세포를 생체외에서 생성한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 인간 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.
일부 구현예에서, 세포는 줄기 세포 또는 전구 세포이다. 일부 구현예에서, 세포는 비-분화된 세포이다. 일부 구현예에서, 세포는 인간 줄기 세포 또는 전구 세포이다. 일부 구현예에서, 세포는 포유류 줄기 세포 또는 전구 세포이다. 일부 구현예에서, 세포는 성인 줄기 세포, 배아 줄기 세포, 유도된 만능(iPS) 세포 또는 전구 세포(예를 들어, 심장 전구 세포, 신경 줄기 세포 등)이다. 일부 구현예에서, 세포는 조혈 줄기 세포(HSC)이다. 일부 구현예에서, 세포는 중간엽 줄기 세포(MSC)이다. 일부 구현예에서, 세포는 신경 줄기 세포이다. 일부 구현예에서, 세포는 상피 줄기 세포이다. 세포는 포유류 줄기 세포 및 전구 세포, 예를 들어, 설치류 줄기 세포, 설치류 전구 세포, 인간 줄기 세포, 인간 전구 세포 등을 포함할 수 있다.
일부 구현예에서, 세포는 이환된 세포, 예를 들어, 이환된 포유류 세포 또는 이환된 인간 세포이다. 이환된 세포는 변경된 대사, 유전자 발현 및/또는 형태적 특징을 가질 수 있다. 일부 구현예에서, 세포는 질병과 연관된 유전학적 변이체를 갖는 게놈을 갖는다. 일부 구현예에서, 세포는 질병과 연관된 SNP를 갖는다. 일부 구현예에서, 세포의 게놈은 질병과 연관된 유전학적 마커를 갖는다. 일부 구현예에서, 세포는 유해한 돌연변이를 갖는다. 일부 구현예에서, 세포는 질병을 야기하는 돌연변이를 갖는다. 일부 구현예에서, 세포는 질병과 연관된 돌연변이 대립유전자를 갖는다. 일부 구현예에서, 세포는 기능 상실 돌연변이를 갖는다. 일부 구현예에서, 세포는 질병 유전형을 갖는다. 일부 구현예에서, 세포는 질병 표현형을 갖는다. 일부 구현예에서, 세포는 유전학적 결함을 갖는다. 일부 구현예에서, 세포는 종양형성 돌연변이를 갖는다. 일부 구현예에서, 세포는 통합된 및/또는 안정하게 유지된 바이러스를 갖는다. 일부 구현예에서, 레트로바이러스는 세포의 게놈 내로 통합된다. 일부 구현예에서, 렌티바이러스는 세포의 게놈 내로 통합된다. 일부 구현예에서, 세포는 지속적인 바이러스 감염을 갖는다. 일부 구현예에서, 세포는 HIV를 갖는다. 일부 구현예에서, 세포는 HIV 게놈의 통합된 카피를 갖는다. 일부 구현예에서, 세포는 바이러스로 감염된다. 일부 구현예에서, 세포는 잠복 바이러스 감염을 갖는다. 일부 구현예에서, 세포는 헤르페스바이러스에 의해 감염된다. 일부 구현예에서, 세포는 인간 헤르페스바이러스 6 또는 7에 의해 감염된다. 일부 구현예에서, 세포는 단순 헤르페스 바이러스 1형 또는 2형에 의해 감염된다. 일부 구현예에서, 세포는 바리셀라-조스터(Varicella-Zoster) 바이러스에 의해 감염된다. 일부 구현예에서, 세포는 인간 파포바바이러스(Papovavirus)에 의해 감염된다. 일부 구현예에서, 세포는 엡스테인-바 바이러스에 의해 감염된다. 이환된 세포는 암 세포, 당뇨병 세포 또는 아폽토시스 세포일 수 있다. 이환된 세포는 이환된 대상체 유래의 세포일 수 있다. 예시적인 질병은 유전학적 장애, 감염성 질병, 혈액 장애, 암, 대사 장애, 눈 장애, 기관 장애, 근골격 장애, 심장병 등을 포함할 수 있다. 일부 구현예에서, 세포는 환자로부터 유래된다. 일부 구현예에서, 세포는 생체외에서 변형된다. 일부 구현예에서, 세포는 암 세포이다. 일부 구현예에서, 세포는 배 세포이다. 일부 구현예에서, 세포는 배 줄기 세포이다.
일부 구현예에서, 본원에 제공되는 방법을 사용하여 이환된 세포, 예를 들어, 이환된 포유류 세포 또는 이환된 인간 세포를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 이환된 세포를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 유전자의 야생형 대립유전자를 이환된 세포 내로 삽입한다. 일부 구현예에서, 본원에 제공된 방법을 사용하여, 이환된 세포에서 유해한 돌연변이를 교정한다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 종양유전자를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여 질병과 연관된 유전자의 대립유전자를 유전학적으로 변형시킨다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 유전자의 건강한 대립유전자를 삽입한다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 질병과 연관되지 않은 유전자의 대립유전자를 삽입한다. 일부 구현예에서, 본원에 제공되는 방법을 사용하여, 세포의 게놈으로부터 통합된 또는 안정하게 유지된 바이러스, 예컨대 렌티바이러스, 레트로바이러스 또는 헤르페스바이러스를 제거한다.
iii. 진균 세포
일부 구현예에서, 진핵 세포는 진균 세포이다. 일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 진균 세포이다. 추가로, 본 개시내용의 방법을 사용하여 진균 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나, 게놈 변형을 갖는 진균 세포를 제조하고/하거나, 진균 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포를 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 진균 세포에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다.
일부 구현예에서, 진균 세포는 다세포 진균으로부터 유래된 세포이다. 일부 구현예에서, 세포는 자낭균 세포이다. 일부 구현예에서, 세포는 단-세포 진균이다. 일부 구현예에서, 세포는 효모 세포이다. 일부 구현예에서, 세포는 속 아스페르길루스(Aspergillus), 칸디다(Candida), 코클리오볼루스(Cochliobolus), 크리포넥트리아(Cryphonectria), 크립토코커스(Cryptococcus), 에피더모피톤(Epidermophyton), 푸사리움(Fusarium), 클루이베로마이세스(Kluyveromyces), 라찬세아(Lachancea), 무코르(Mucor), 뉴로스포라(Neurospora), 오피오스토마(Ophiostoma), 페니실리움(Penicillium), 피키아(Pichia), 뉴모시스티스(Pneumocystis), 풀룰라리아(Pullularia), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 톨리포클라디움(Tolypocladium), 트리코더마(Trichoderma), 로도토룰라(Rhodotorula) 또는 야로위아(Yarrowia)의 진균 세포이다. 일부 구현예에서, 세포는 칸디다 종 세포, 예컨대 칸디다 알비칸스(C. albicans), 칸디다 아우리스(C. auris), 칸디다 두블리니엔시스(C. dubliniensis), 칸디다 글라브라타(C. glabrata), 칸디다 구일리에르몬디이(C. guilliermondii) 또는 칸디다 트로피칼리스(C. tropicalis) 세포이다. 일부 구현예에서, 세포는 병꼴균류(chytrid) 진균 세포, 즉, 키트리디오미코타(Chytridiomycota) 세포이다. 일부 구현예에서, 세포는 바트라코키트리움(Batrachochytrium) 종 세포, 예컨대 바트라코키트리움 덴드로바티디스(Batrachochytrium dendrobatidis) 세포이다. 일부 구현예에서, 세포는 미크로스포리디아(Microsporidia) 세포, 예컨대 글루게아(Glugea) 종 또는 노세마(Nosema) 종 세포이다. 일부 구현예에서, 진균 세포는 기생충이다. 일부 구현예에서, 세포는 트리코피톤(Trichophyton) 종 또는 미크로스포룸(Microsporum) 종 세포, 즉, 백선을 야기하는 기생충 종류를 포함하는 진균의 속의 구성원이다. 일부 구현예에서, 세포는 사상 진균 세포, 즉, 사상 진균 유래의 세포이다. 일부 구현예에서, 세포는 크립토코커스(Cryptococcus) 종 세포, 예컨대 크립토코커스 네오포르만스(Cryptococcus neoformans) 세포이다. 일부 구현예에서, 세포는 보트리티스(Botrytis) 종 세포, 예컨대 보트리티스 시네레아(Botrytis cinerea), 보트리티스 알리이(Botrytis allii), 보트리티스 안토필라(Botrytis anthophila), 보트리티스 엘립티카(Botrytis elliptica), 보트리티스 파바에(Botrytis fabae), 보트리티스 스쿠아모살(Botrytis squamosal) 또는 보트리티스 트라케이필라(Botrytis tracheiphila) 세포이다.
iv. 기타 진핵 세포
일부 구현예에서, HDR 촉진제를 포함하는 진핵 세포는 미생물 진핵 세포이다. 추가로, 본 개시내용의 방법을 사용하여 미생물 진핵 세포에서 HDR-매개된 게놈 변형을 증가시키고/시키거나, 게놈 변형을 갖는 미생물 진핵 세포를 제조하고/하거나 미생물 진핵 세포를 유전학적으로 엔지니어링할 수 있다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물을 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 미생물 진핵생물에서 HDR-매개된 게놈 변형을 증가시키는 것을 포함한다. 일부 구현예에서, 세포는 미생물 진핵생물이다. 일부 구현예에서, 세포는 단-세포 진핵 유기체의 세포이다. 일부 구현예에서, 세포는 원생동물 세포이다. 일부 구현예에서, 세포는 원생생물이다. 일부 구현예에서, 세포는 감염성 미생물 진핵생물이다. 일부 구현예에서, 세포는 기생충 미생물 진핵생물이다. 일부 구현예에서, 세포는 기아르디아(Giardia) 종 세포, 예컨대 기아르디아 람블리아(G. lamblia), 기아르디아 무리스(G. muris), 기아르디아 아르데아에(G. ardeae), 기아르디아 시타시(G. psittaci), 기아르디아 아길리스(G. agilis) 또는 기아르디아 미크로티(G. microti) 세포이다. 일부 구현예에서, 세포는 플라스모디움(Plasmodium) 종 세포, 예컨대 플라스모디움 비박스(P. vivax), 플라스모디움 팔시파룸(P. falciparum), 플라스모디움 말라리아에(P. malariae), 플라스모디움 오발레(P. ovale) 또는 플라스모디움 노울레시(P. knowlesi) 세포이다. 일부 구현예에서, 세포는 동원핵편모충류(kinetoplastid) 세포이다. 일부 구현예에서, 세포는 트리파노소마(Trypanosoma) 종 세포, 예컨대 트리파노소마 크루지(Trypanosoma cruzi) 또는 트리파노소마 브루세이(Trypanosoma brucei) 세포이다.
일부 구현예에서, 세포는 조류 세포이다. 일부 구현예에서, 조류 세포는 아크난테스(Achnanthes), 암피프로라(Amphiprora), 암포라(Amphora), 안키스트로데스무스(Ankistrodesmus), 아스테로모나스(Asteromonas), 보에켈로비아(Boekelovia), 볼리도모나스(Bolidomonas), 보로디넬라(Borodinella), 보트리디움(Botrydium), 보트리오코커스(Botryococcus), 브락테오코커스(Bracteococcus), 카에토세로스(Chaetoceros), 카르테리아(Carteria), 클라미도모나스(Chlamydomonas), 클로로코쿰(Chlorococcum), 클로로고늄(Chlorogonium), 클로렐라(Chlorella), 크루모나스(Chroomonas), 크리소스파에라(Chrysosphaera), 크리코스파에라(Cricosphaera), 크립테코디니움(Crypthecodinium), 크립토모나스(Cryptomonas), 사이클로텔라(Cyclotella), 두날리엘라(Dunaliella), 엘립소이돈(Ellipsoidon), 에밀리아니아(Emiliania), 에레모스파에라(Eremosphaera), 에르노데스미우스(Ernodesmius), 유글레나(Euglena), 유스티그마토스(Eustigmatos), 프란세이아(Franceia), 프라질라리아(Fragilaria), 프라질라롭시스(Fragilaropsis), 글로에오탐니온(Gloeothamnion), 해마토코커스(Haematococcus), 할로카페테리아(Halocafeteria), 헤테로시그마(Heterosigma), 하이메노모나스(Hymenomonas), 이소크리시스(Isochrysis), 레포신클리스(Lepocinclis), 미크락티니움(Micractinium), 모노라피디움(Monoraphidium), 나노클로리스(Nannochloris), 나노클로롭시스(Nannochloropsis), 나비쿨라(Navicula), 네오클로리스(Neochloris), 네프로클로리스(Nephrochloris), 네프로셀미스(Nephroselmis), 니츠키아(Nitzschia), 오크로모나스(Ochromonas), 오에도고니움(Oedogonium), 오오시스티스(Oocystis), 오스트레오코커스(Ostreococcus), 파블로바(Pavlova), 파라클로렐라(Parachlorella), 파스케리아(Pascheria), 펠라고모나스(Pelagomonas), 파에오닥틸룸(Phaeodactylum), 파구스(Phagus), 피코클로룸(Picochlorum), 플라티모나스(Platymonas), 플루로크리시스(Pleurochrysis), 플루로코커스(Pleurococcus), 프로토테카(Prototheca), 슈도클로렐라(Pseudochlorella), 슈도네오클로리스(Pseudoneochloris), 슈도스타우라스트룸(Pseudostaurastrum), 피라미모나스(Pyramimonas), 피로보트리스(Pyrobotrys), 세네데스무스(Scenedesmus), 스켈레토네마(Skeletonema), 스피로기라(Spyrogyra), 스티코코커스(Stichococcus), 테트라셀미스(Tetraselmis), 탈라시오시라(Thalassiosira), 트리보네마(Tribonema), 보체리아(Vaucheria), 비리디엘라(Viridiella), 비스케리아(Vischeria) 또는 볼복스(Volvox)의 종의 것이다. 일부 구현예에서, 세포는 규조류이다. 규조류는 속 아크난테스(Achnanthes), 암포라(Amphora), 카에토세로스(Chaetoceros), 코시노디스쿠스(Coscinodiscus), 실린드로테카(Cylindrotheca), 시클로텔라(Cyclotella), 심벨라(Cymbella), 프라질라리아(Fragilaria), 프라질라롭시스(Fragilaropsis), 한츠키아(Hantzschia), 나비쿨라(Navicula), 니츠키아(Nitzschia), 슈도-니츠키아(Pseudo-Nitzschia), 파에오닥틸룸(Phaeodactylum), 프사모딕티온(Psammodictyon), 스켈레토네마(Skeletonema), 탈라시오네마(Thalassionema) 및 탈라시오시라(Thalassiosira)의 구성원을 포함한다. 일부 구현예에서, 세포는 진안점조류(eustigmatophyte), 예컨대 나노클로롭시스(Nannochloropsis) 종 또는 모노두스(Monodus), 슈도스타우라스트룸(Pseudostaurastrum), 비스케리아(Vischeria) 및 유스티그마토스(Eustigmatos)의 종이다. 일부 구현예에서, 세포는 속 나노클로롭시스, 예컨대, 비제한적으로, 나노클로롭시스 가디타나(N. gaditana), 나노클로롭시스 그라눌라타(N. granulata), 나노클로롭시스 림네티카(N. limnetica), 나노클로롭시스 오세아니카(N. oceanica), 나노클로롭시스 오쿨라타(N. oculata) 및 나노클로롭시스 살리나(N. salina)의 조류 세포이다.
일부 구현예에서, 세포는 부등편모조류(heterokont)이다. 예를 들어, 부등편모조류는 진암점조류 및 규조류, 예컨대 상기 열거된 것들뿐만 아니라 병꼴균류 종, 예를 들어, 라브린툴리드(labrinthulid) 및 트라우스토키트리드(thraustochytrid)를 포함한다. 일부 구현예에서, 세포는 바실라리오피테스(Bacillariophytes), 유스티그마토피테스(Eustigmatophytes), 라브린툴리드(Labrinthulid) 및 트라우스토키트리드(Thraustochytrid)를 포함하지만 이에 한정되지 않는 부등편모조류 종의 것이다. 일부 구현예에서, 세포는 라브리인툴라(Labryinthula), 라브리인툴로이데스(Labryinthuloides), 트라우스토키트리움(Thraustochytrium), 스키조키트리움(Schizochytrium), 아플라노키트리움(Aplanochytrium), 아우란티오키트리움(Aurantiochytrium), 자포노키트리움(Japonochytrium), 디플로프리스(Diplophrys) 또는 울케니아(Ulkenia)의 종의 것이다. 예를 들어, 균주는 트라우스토키트리움(Thraustochytrium), 스키조키트리움(Schizochytrium), 오블론지키트리움(Oblongichytrium) 또는 아우란티오키트리움(Aurantiochytrium)의 종일 수 있다. 일부 구현예에서, 세포는 후편모생물군(opisthokont)이다. 일부 구현예에서, 세포는 동정편모충류(choanoflagellate)이다. 일부 구현예에서, 세포는 아메소마이세토조에아(amesomycetozoea)(예를 들어, 스파에로포르마(Sphaeroforma))이다. 일부 구현예에서, 세포는 단편모생물(unikont)이다. 일부 구현예에서, 세포는 아메바류(amoebozoa)이다. 일부 구현예에서, 세포는 속 아칸타모에바(Acanthamoeba), 아모에바(Amoeba), 카오스(Chaos), 딕티오스텔리움 엔타모에바(Dictyostelium Entamoeba) 또는 펠로믹사(Pelomyxa)의 것이다.
v. 세포의 조성물
세포의 조성물이 본원에 제공된다. 일 양태에서, 본원에 제공되는 방법을 사용하여 진핵 세포의 조성물을 생성할 수 있다. 일부 구현예에서, 진핵 세포의 조성물은 본원에 기술된 세포, 예를 들어, 식물, 동물, 진균 또는 기타 진핵 세포 중 임의의 것으로 구성될 수 있다. 일부 구현예에서, 본원에 개시된 방법은 세포의 집단을 편집하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 편집된 세포의 집단을 생성하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 편집된 세포의 집단을 생성하는 것을 포함하며, 집단 내의 편집된 세포의 비는 HDR 촉진제의 부재 하에 편집된 세포의 집단보다 약 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 20-, 25-, 30-배 중 임의의 값, 예를 들어, 이들 값 사이의 임의의 값 또는 범위만큼 더 크다. 일부 구현예에서, 본원에 개시된 방법은 편집된 세포의 집단을 생성하는 것을 포함하며, 집단 내의 편집된 세포의 비는 HDR 촉진제의 부재 하에 편집된 세포의 집단보다 10배 더 높다.
일부 구현예에서, 본원에 제공된 방법에서 사용되는 세포의 클론 하위집단 조성물이 본원에 제공된다. 일부 구현예에서, 클론 하위집단은 세포주의 하위집단이다. 일부 구현예에서, 클론 하위집단은 개체로부터 유래된 세포의 하위집단이다. 일부 구현예에서, 클론 세포 하위집단은 단일의 세포로부터 유래된 세포의 집단이다. 일부 구현예에서, 클론 세포 하위집단은 동일한 유전학적 및 후성적 프로파일을 갖는다.
일부 구현예에서, 본원에 개시된 방법은 세포의 집단에서 게놈 변형을 수행하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 게놈 변형을 갖는 세포의 조성물을 생성하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 게놈 변형을 갖는 세포의 조성물을 생성하는 것을 포함하며, 게놈 변형을 갖는 집단 내의 세포의 비는 HDR 촉진제의 부재 하에 변형된 세포의 집단보다 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 20-, 25-, 30-배, 예를 들어, 이들 값 사이의 임의의 값 또는 범위만큼 더 크다. 일부 구현예에서, 본원에 개시된 방법은 세포의 집단에서 표적 유전자좌를 변형시키는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 변형된 표적 유전자좌를 갖는 세포의 집단을 생성하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 방법은 변형된 표적 유전자좌를 갖는 세포의 집단을 생성하는 것을 포함하며, 변형된 표적 유전자좌를 갖는 집단 내의 세포의 비는 HDR 촉진제의 부재 하에 변형된 세포의 집단보다 2-, 3-, 4-, 5-, 6-, 7-, 8-, 9-, 10-, 11-, 12-, 13-, 14-, 15-, 16-, 17-, 18-, 20-, 25-, 30-배, 예를 들어, 이들 값 사이의 임의의 값 또는 범위만큼 더 크다.
E. 키트
본 발명의 방법은 키트의 형태로 제공될 수 있다. 일부 구현예에서, 키트는 HDR 촉진제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 키트는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 사용 설명서를 포함한다. 일부 구현예에서, 키트는 핵산을 포함하는 벡터를 제공한다. 일부 구현예에서, 키트는 공여자 주형 DNA 분자를 사용하여 세포의 표적 편집 부위를 변형시키기 위해 사용된다. 일부 구현예에서, 키트는 본원에 기술된 벡터 중 임의의 것을 포함한다. 일부 구현예에서, 키트는 진핵 세포 게놈, 예컨대 식물 또는 포유류 세포 게놈의 표적 편집 부위의 HDR-매개된 게놈 변형을 증가시키기 위한 벡터를 포함한다. 일부 구현예에서, 키트는 식물 세포 내의 표적 편집 부위의 HDR-매개된 게놈 변형을 증가시키기 위한 벡터를 포함한다. 일부 구현예에서, 키트는 포유류 세포 내의 표적 편집 부위의 HDR-매개된 게놈 변형을 증가시키기 위한 벡터를 포함한다.
일부 구현예에서, 키트는 설명서를 포함한다. 일부 구현예에서, 설명서는 세포를 핵산으로 형질전환시키는 것에 대한 설명서를 포함한다. 일부 구현예에서, 설명서는 세포 내의 핵산의 존재를 검출하는 것에 대한 설명서를 포함한다. 일부 구현예에서, 설명서는 세포 내의 핵산의 영향을 평가하는 것에 대한 설명서를 포함한다.
일부 구현예에서, 키트는 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제를 포함한다. 일부 구현예에서, 키트는 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제는 세포의 게놈을 평가하기 위한 검정, 예컨대 PCR 검정, RT-qPCR 검정, 서던(Southern) 블롯 또는 서열분석 검정이다. 일부 구현예에서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제는 올리고뉴클레오티드 프라이머의 세트이며, 특정 프라이머의 쌍은 유전학적 변형 또는 야생형 표적 유전자좌를 특이적으로 증폭시킨다. 일부 구현예에서, 유전학적으로 엔지니어링된 세포의 검출은 리포터, 예컨대 형광 리포터, 전사 리포터, 비색 리포터 또는 화학발광 리포터를 사용하여 수행된다. 따라서, 일부 구현예에서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제는 리포터를 검출하기 위한 수단이다.
일부 구현예에서, 진핵 세포 게놈, 예컨대 식물 또는 포유류 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 키트가 본원에 제공된다. 일부 구현예에서, 키트는 게놈-편집 분자 및 HDR 촉진제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 게놈 편집 분자는 하기를 포함한다: (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자. 일부 구현예에서, HDR 촉진제는 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함한다. 일부 구현예에서, 게놈 편집 분자 및 HDR 촉진제는 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공한다. 일부 구현예에서, 키트는 표적 편집 부위의 HDR-매개된 게놈 변형의 수준을 측정하기 위한 작용제를 포함한다.
일부 구현예에서, 게놈 변형을 갖는 진핵 세포를 제조하기 위한 키트가 본원에 제공된다. 일부 구현예에서, 키트는 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 인코딩하는 핵산을 포함하며, 게놈 편집 분자는: (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; HDR 촉진제는 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하며; 이에 의해 게놈 편집 분자 및 HDR 촉진제는 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공한다. 일부 구현예에서, 키트는 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시킴으로써 게놈 변형을 갖는 진핵 세포를 제조하는 수단을 제공한다. 일부 구현예에서, 키트는 표적 편집 부위의 게놈 변형의 존재를 검출하기 위한 작용제를 포함한다.
일부 구현예에서, 진핵 세포의 유전학적 엔지니어링 방법을 위한 키트가 본원에 제공된다. 일부 구현예에서, 키트는 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함한다. 일부 구현예에서, 키트는 표적 편집 부위의 유전학적 엔지니어링을 검출하기 위한 작용제를 포함한다.
구현예
본원에 제공되는 진핵 세포(예를 들어, 식물 세포 및 포유류 세포), 시스템, 및 방법의 다양한 구현예는 하기의 비제한적인 구현예의 목록에 포함된다.
1. 하기를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형의 증가 방법:
게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공함으로써, 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며;
HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계.
2. 구현예 1에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
3. 구현예 2에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
4. 구현예 1에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
5. 구현예 1에 있어서, 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.
6. 구현예 5에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.
7. 구현예 5에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
8. 구현예 1에 있어서, 공여자 DNA 분자가 원형 DNA 벡터, 제미니바이러스 레플리콘 상에 또는 선형 DNA 단편으로서 제공되는 방법.
9. 구현예 1 내지 8 중 어느 한 구현예에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열의 카피가 측접된 방법.
10. 구현예 1 내지 9 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 표적 편집 부위가 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하게 위치한 서열을 포함하는 방법.
11. 구현예 1 내지 10 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 절단 후에 표적 편집 부위에 5' 오버행을 제공하는 방법.
12. 구현예 1 내지 11 중 어느 한 구현예에 있어서, SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.
13. 구현예 1 내지 12 중 어느 한 구현예에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
14. 구현예 13에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, 동등한 SSAP 활성을 갖는 관련 단백질 또는 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
15. 구현예 13에 있어서, ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
16. 구현예 13에 있어서, RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
17. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
18. 구현예 17에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
19. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
20. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
21. 구현예 1 내지 16 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 엑소뉴클레아제 III, Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
22. 구현예 1, 5 또는 6에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
23. 구현예 1 내지 22 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
24. 구현예 1 내지 23 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 방법.
25. 구현예 24에 있어서, SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 방법.
26. 구현예 1 내지 23 중 어느 한 구현예에 있어서, SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
27. 구현예 1 내지 26 중 어느 한 구현예에 있어서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.
28. 구현예 1 내지 26 중 어느 한 구현예에 있어서, 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.
29. 구현예 1 내지 28 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.
30. 구현예 1 내지 29 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 방법.
31. 구현예 1 내지 30 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
32. 구현예 31에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 방법.
33. 구현예 32에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
34. 구현예 31 내지 33 중 어느 한 구현예에 있어서, 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.
35. 구현예 31 내지 34 중 어느 한 구현예에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
36. (a) 진핵 세포;
(b) 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제; 및
(c) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자(들)를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 시스템으로서,
진핵 세포가 유효량의 HDR 촉진제 및 게놈 편집 분자(들)와 회합되고/되거나 이와 접촉되고/되거나 이를 함유하는 시스템.
37. 구현예 36에 있어서, 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 시스템.
38. 구현예 37에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 시스템.
39. 구현예 36에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 시스템.
40. 구현예 36에 있어서, 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 시스템.
41. 구현예 40에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 시스템.
42. 구현예 40에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 시스템.
43. 구현예 36에 있어서, 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈 상에 제공되는 시스템.
44. 구현예 36 내지 43 중 어느 한 구현예에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 시스템.
45. 구현예 36 내지 44 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 표적 편집 부위가 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 시스템.
46. 구현예 36 내지 45 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 절단 후에 표적 편집 부위에 5' 오버행을 제공하는 시스템.
47. 구현예 36 내지 46 중 어느 한 구현예에 있어서, 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 적어도 2배 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 시스템.
48. 구현예 36 내지 47 중 어느 한 구현예에 있어서, SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 시스템.
49. 구현예 36 또는 48에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 시스템.
50. 구현예 49에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.
51. 구현예 49에 있어서, RecT/ Redβ-과 단백질이 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, Rac 박테리아 프로파지 RecT 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.
52. 구현예 49에 있어서, RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
53. 구현예 49에 있어서, ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
54. 구현예 49에 있어서, RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
55. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.
56. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.
57. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.
58. 구현예 36 내지 54 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.
59. 구현예 36 내지 58 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
60. 구현예 36, 40 또는 41에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
61. 구현예 36 내지 60 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 시스템.
62. 구현예 36 내지 61 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 시스템.
63. 구현예 62에 있어서, SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 시스템.
64. 구현예 36 내지 63 중 어느 한 구현예에 있어서, SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
65. 구현예 36 내지 64 중 어느 한 구현예에 있어서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 적어도 2배 증가되는 시스템.
66. 구현예 36 내지 64 중 어느 한 구현예에 있어서, 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 유지되거나 적어도 2배 감소되는 시스템.
67. 구현예 36 내지 66 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 시스템.
68. 구현예 36 내지 64 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.
69. 구현예 36 내지 68 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 시스템.
70. 구현예 69에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 시스템.
71. 구현예 69 또는 70에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 시스템.
72. 구현예 69, 70 또는 71에 있어서, 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 시스템.
73. 구현예 69 내지 72 중 어느 한 구현예에 있어서, 시스템이 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 것을 제공하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 시스템.
74. (a) 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 진핵 세포에 제공함으로써, 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드, 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하고; HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계; 및
(b) 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시킴으로써, 게놈 변형을 갖는 진핵 세포를 제조하는 단계를 포함하는, 게놈 변형을 갖는 진핵 세포의 제조 방법.
75. 구현예 74에 있어서, 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
76. 구현예 75에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
77. 구현예 74에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
78. 구현예 74에 있어서, 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.
79. 구현예 78에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.
80. 구현예 78에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
81. 구현예 74에 있어서, 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.
82. 구현예 74 내지 81 중 어느 한 구현예에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접된 방법.
83. 구현예 74 내지 82 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 표적 편집 부위가 PAM 서열, 및 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 방법.
84. 구현예 74 내지 83 중 어느 한 구현예에 있어서, 서열-특이적 엔도뉴클레아제가 절단 후에 표적 편집 부위에 5' 오버행을 제공하는 방법.
85. 구현예 74 내지 84 중 어느 한 구현예에 있어서, SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.
86. 구현예 74 내지 85 중 어느 한 구현예에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
87. 구현예 86에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.
88. 구현예 86에 있어서, RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
89. 구현예 86에 있어서, ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
90. 구현예 86에 있어서, RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
91. 구현예 74 내지 90 중 어느 한 구현예에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
92. 구현예 74 내지 91 중 어느 한 구현예에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
93. 구현예 74 내지 92 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
94. 구현예 74 내지 92 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
95. 구현예 74 내지 90 중 어느 한 구현예에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
96. 구현예 74, 78 또는 79에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
97. 구현예 74 내지 96 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
98. 구현예 74 내지 97 중 어느 한 구현예에 있어서, 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 방법.
99. 구현예 98에 있어서, SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 방법.
100. 구현예 74 내지 99 중 어느 한 구현예에 있어서, SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
101. 구현예 74 내지 100 중 어느 한 구현예에 있어서, HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.
102. 구현예 74 내지 100 중 어느 한 구현예에 있어서, 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.
103. 구현예 74 내지 102 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.
104. 구현예 74 내지 103 중 어느 한 구현예에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SSAP, 엑소뉴클레아제 및/또는 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.
105. 구현예 74 내지 104 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
106. 구현예 105에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 방법.
107. 구현예 105 또는 106에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
108. 구현예 105, 106 또는 107에 있어서, SSAP, 엑소뉴클레아제 및/또는 SSB가 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.
109. 구현예 105 내지 108 중 어느 한 구현예에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
110. HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포가 복수의 용기, 구획 또는 위치를 포함하는 어레이에 제공되며, 각각의 용기, 구획 또는 위치가 HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포를 포함하는 구현예 1 내지 30 중 어느 한 구현예의 방법, 구현예 36 내지 68 중 어느 한 구현예의 시스템 또는 구현예 74 내지 104 중 어느 한 구현예의 방법.
111. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 진핵 세포에 제공하는 단계를 포함하는 진핵 세포의 유전학적 엔지니어링 방법으로서,
세포의 표적 편집 부위가 공여자 주형 DNA 분자에 의해 변형되는 방법.
112. 구현예 111에 있어서, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
113. 구현예 112에 있어서, RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제, Cas12i, Cas14 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
114. 구현예 111에 있어서, 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
115. 구현예 111에 있어서, 가이드 RNA를 추가로 포함하며, 서열-특이적 엔도뉴클레아제 및 가이드 RNA가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 방법.
116. 구현예 115에 있어서, 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하며, 서열-특이적 엔도뉴클레아제가 표적 편집 부위 내의 엔도뉴클레아제 인식 서열에 특이적인 방법.
117. 구현예 115에 있어서, 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 가이드 RNA 분자가 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
118. 구현예 111에 있어서, 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.
119. 구현예 111에 있어서, 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 방법.
120. 구현예 111에 있어서, SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
121. 구현예 120에 있어서, RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.
122. 구현예 111에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
123. 구현예 111에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
124. 구현예 111에 있어서, 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
125. 구현예 111에 있어서, 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
126. 구현예 111에 있어서, 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
127. 구현예 111에 있어서, 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
128. 구현예 111에 있어서, 단일 가닥 DNA 결합 단백질(SSB) 및 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
129. 구현예 111 내지 128 중 어느 한 구현예에 있어서, 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
130. 구현예 129에 있어서, 식물 세포가 반수체, 이배체 또는 배수체인 방법.
131. 구현예 130에 있어서, 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
132. 구현예 131에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
133. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 하나 이상의 벡터에 제공되는 방법.
135. 구현예 133에 있어서, 벡터가 아그로박테리움 벡터인 방법.
136. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 염색체에 의해 제공되는 방법.
137. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 폴리펩티드, DNA, mRNA를 도입함으로써 및/또는 유성 교배에 의해 제공되는 방법.
138. 구현예 111 내지 132 중 어느 한 구현예에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 i) 내지 v) 중 하나 이상을 포함하는 전구 세포에 의해 제공되며,
전구 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며,
전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 이후에 전구 세포로의 폴리펩티드, DNA 또는 mRNA의 전달에 의해 및/또는 전구 세포의 유성 교배에 의해 제공되는 방법.
139. 구현예 111 내지 138 중 어느 한 구현예에 있어서, 변형을 검출하는 단계를 추가로 포함하는 방법.
140. 구현예 139에 있어서, 변형을 검출하는 단계가 앰플리콘 서열분석을 포함하는 방법.
141. 구현예 111 내지 140 중 어느 한 구현예에 있어서, 표적 편집 부위가 단백질 코딩 서열 또는 프로모터 내에 존재하는 방법.
142. 구현예 111 내지 141 중 어느 한 구현예에 있어서, 표적 편집 부위의 변형이 삽입, 결실 또는 치환인 방법.
143. 구현예 111 내지 142 중 어느 한 구현예에 있어서, 표적 편집 부위가 작물재배학적으로 중요한 형질을 인코딩하는 유전자 또는 포유류 질병에 연관되는 유전자인 방법.
144. 하기를 포함하는 유전학적으로 변형된 표적 편집 부위를 갖는 진핵 세포의 생성 방법:
(a) 표적 편집 부위 내의 적어도 하나의 엔도뉴클레아제 인식 서열의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 상기 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 제공하는 단계, 및
(b) 적어도 하나의 이중-가닥 DNA 서열을 포함하는 적어도 하나의 공여자 분자를 제공하는 단계로서, (i) 상기 DNA 서열이 표적 편집 부위에 측접한 서열에 대하여 적어도 50개 뉴클레오티드의 길이에 걸쳐 적어도 90%의 상동성을 가지며, (ii) 상기 공여자 서열이 상기 표적 편집 부위와 비교하여 적어도 하나의 변형을 포함하는 단계; 및
(c) (i) 적어도 하나의 단일-가닥 DNA 어닐링 단백질(SSAP), 및
(ii) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 적어도 하나의 엑소뉴클레아제, 및
(iii) 적어도 하나의 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 적어도 하나의 상동성 지정 수선(HDR) 촉진제를 제공하는 단계를 포함함으로써,
적어도 하나의 서열-특이적 엔도뉴클레아제, 적어도 하나의 공여자 분자 및 적어도 하나의 HDR 촉진제가 상기 변형을 상기 진핵 세포의 상기 표적 편집 부위 내로 도입하며;
(d) 상기 표적 편집 부위 내에 변형을 포함하는 진핵 세포를 단리하는 단계.
145. 구현예 144에 있어서, 변형이 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 결실 또는 하나 이상의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택되는 방법.
146. 구현예 144에 있어서, 표적 편집 부위의 일부가 상기 표적 편집 부위 내의 2개의 서열 특이적 절단을 사용함으로써 결실되며, 공여자 분자에 의해 제공되는 서열로 대체되는 방법.
147. 구현예 144 내지 146 중 어느 한 구현예에 있어서, 상기 공여자 서열이 엔도뉴클레아제 인식 서열이 측접된 벡터에 존재하는 방법.
148. 구현예 144 내지 147 중 어느 한 구현예에 있어서, 변형을 포함하는 진핵 세포를 증식시키는 단계를 추가로 포함하는 방법.
149. 하기의 단계를 포함하는 유전학적으로 변형된 유기체의 생성 방법:
(i) 구현예 144 내지 148 중 어느 한 구현예에 의해 유전학적으로 변형된 진핵 세포를 생성하는 단계, 및
(ii) 상기 세포를 유기체 내로 재생시키는 단계.
150. 구현예 149에 있어서, 유기체가 식물 및 비-인간 동물로 이루어진 군으로부터 선택되는 유기체.
151. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물.
152. 구현예 151에 있어서, 핵산이 하나 이상의 벡터에 존재하는 조성물.
153. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 벡터.
154. 구현예 153에 있어서, 벡터가 공여자 주형 DNA, 서열 특이적 엔도뉴클레아제 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터.
155. 구현예 153에 있어서, 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 벡터.
156. 구현예 153에 있어서, 벡터가 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 벡터.
157. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 진핵 세포를 유전학적으로 엔지니어링하기 위한 사용 설명서를 포함하는 키트.
158. 구현예 157에 있어서, 키트가 제1 벡터 및 제2 벡터를 포함하며,
i) 제1 벡터가 공여자 주형 DNA 및 서열 특이적 엔도뉴클레아제를 포함하는 핵산을 포함하며, 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하며;
ii) 제2 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 키트.
159. 구현예 157 또는 158에 있어서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제를 추가로 포함하는 키트.
160. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 세포.
161. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 세포.
162. 구현예 160 또는 161에 있어서, 세포가 식물 또는 포유류 세포인 세포.
163. 구현예 160 내지 162 중 어느 한 구현예에 있어서, 세포가 숙주 세포인 세포.
164. 구현예 1 내지 35 및 74 내지 149 중 어느 한 구현예의 방법에 의해 생성되는 유전학적으로 엔지니어링된 세포.
165. i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)의 하위세트를 포함하는 표적 편집 부위에서의 유전학적 엔지니어링을 위한 전구 진핵 세포 또는 유기체로서, 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 전구 세포 또는 유기체에 포함되지 않은 i) 내지 v) 중 적어도 하나를 세포 또는 유기체에 제공하는 것이 공여자 주형 분자에 의한 표적 편집 부위의 변형을 초래하는 전구 진핵 세포 또는 유기체.
166. 구현예 165에 있어서, 공여자 주형이 이중-가닥 DNA 분자인 전구 진핵 세포 또는 유기체.
167. 구현예 165에 있어서, 세포가 생식선 세포인 전구 세포.
168. 구현예 165에 있어서, 전구 진핵 세포가 전구 식물 세포이며, 전구 식물 세포 또는 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 형질전환에 의해 공급되는 전구 진핵 세포 또는 유기체.
169. 구현예 165에 있어서, 유기체가 식물이며, 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 제2 식물과의 유성 교배에 의해 공급되는 전구 유기체.
170. 구현예 165에 있어서, 전구 진핵 세포가 동물 세포이며, 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 트랜스펙션에 의해 공급되는 전구 진핵 세포.
171. 구현예 165에 있어서, 전구 유기체가 비-인간 동물이며, 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 비-인간 동물과의 유성 교배에 의해 공급되는 전구 유기체.
172. 구현예 153에 있어서, 서열-특이적 뉴클레아제가 유도성 프로모터에 작동 가능하게 연결된 벡터.
173. 구현예 111에 있어서, 서열-특이적 엔도뉴클레아제가 닉카제인 방법.
실시예
하기의 실시예는 오직 본 발명의 예시인 것으로 의도되며, 이에 따라 어떠한 방식으로든 본 발명을 제한하는 것으로 간주되지 않아야 한다. 하기의 실시예 및 상세한 설명은 예시에 의해 제한 없이 제공된다.
실시예 1. 엑소뉴클레아제, SSAP, 및 SSB 발현 벡터 및 공여자 DNA 주형 서열
본 실시예에는 박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO:1) 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위해 사용되는 식물 발현 벡터의 구축이 기술된다.
박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO: 1), 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위한 식물 발현 구축물을 구축하였다. SEQ ID NO:15의 담배 c2 핵 국소화 신호(NLS)를 인코딩하는 DNA 서열을 엑소뉴클레아제, 박테리오파지 람다 베타 SSAP 단백질, 및 에스케리키아 콜라이 SSB를 인코딩하는 DNA 서열에 작동 가능하게 연결하여, 각각 SEQ ID NO: 135, SEQ ID NO: 134, 및 SEQ ID NO: 133에 제시된 c2 NLS-Exo(레드-엑소로도 알려져 있음), c2 NLS 람다 베타 SSAP(레드-베타로도 알려져 있음), 및 c2 NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 제공하였다. c2 NLS-Exo, c2 NLS 람다 베타 SSAP, 및 c2NLSf-SSB 융합 단백질을 인코딩하는 DNA 서열을 각각 2x35S, SlUBI10, PcUBI4 프로모터 및 35S, AtHSP, pea3A 폴리아데닐화 부위에 작동 가능하게 연결하여, 엑소뉴클레아제, SSAP, 및 SSB 식물 세포 유전자 발현 카세트를 제공하였다(도 2 참조).
HDR에 의한 42개 염기쌍 이종 서열의 삽입을 위한 토마토 Ant1 유전자의 프로모터 영역을 표적화하는 DNA 공여자 주형 플라스미드를 구축하였다(도 1). 원형 DNA 공여자 플라스미드는 양측에 약 600 내지 800 bp 길이의 상동성 아암이 측접된 원하는 삽입 영역(42개 염기쌍 길이)을 갖는 대체 주형을 포함하였다. 상동성 아암은 표적 gDNA 삽입 부위에 측접한 gDNA(게놈 DNA) 영역과 일치하였다(즉, 이와 상동성이었다). 공여자 DNA를 포함하는 대체 주형 영역은 RNA-가이드된 뉴클레아제에 의해 인식되는 표적 gDNA 서열과 동일한 DNA 서열이 각각의 말단에서 측접하였다. RNA-가이드된 서열-특이적 엔도뉴클레아제 및 삽입 부위에 인접한 서열에 상보적인 가이드 RNA의 발현을 제공하는 식물 발현 카세트도 또한 구축하였다(도 1).
실시예 2. 토마토 원형질체를 사용한 게놈 편집 실험
본 실시예에는 엑소뉴클레아제, SSB 및 SSAP의 존재 및 부재 하에 블런트- 및 스태거형 말단 절단 CAS 뉴클레아제를 사용한 토마토 원형질체에서의 유전자 편집이 기술된다.
토마토 원형질체를 본질적으로 공개된 절차에 따라 단리하고, 재배하고, PEG-매개된 트랜스펙션으로 처리하였다(문헌[ermk et al. 2017]). 트랜스펙션된 물질은 실시예 1에 기술된 공여자 DNA 주형 영역을 가질 뿐 아니라 표기된 바와 같이 gRNA 및 Cas 폴리뉴클레오티드를 발현하는 플라스미드를 포함하였다(도 1). Cas 폴리뉴클레오티드를 핵 국소화 신호에 융합시켰다. gRNA는 의도된 게놈 DNA 표적 내로 이중 가닥 파단을 표적화하고, 공여자 플라스미드로부터 대체 주형을 방출시킨다(도 1 참조). 일부 실험을 엔도뉴클레아제 인식 서열의 절단 후에 블런트 말단을 남기는 CAS 뉴클레아제를 대표하고, 본원에 CasB 뉴클레아제로 지칭되는 Cas 뉴클레아제를 사용하여 수행하였다. 다른 실험을 엔도뉴클레아제 인식 서열의 절단 후에 스태거형 단일 가닥 DNA 오버행 말단을 남기는 CAS 뉴클레아제를 대표하고, 본원에 CasS 뉴클레아제로 지칭되는 Cas 뉴클레아제를 사용하여 수행하였다.
트랜스펙션 이후 원형질체의 48시간의 인큐베이션 후에, gDNA를 트랜스펙션된 시료로부터 추출하고, 표적 유전자좌를 도입되는 대체 서열에 측접한 게놈 서열 및 대체 주형의 상동성 아암에 상보적인 프라이머를 사용하여 증폭하고, 앰플리콘 서열분석에 의해 분석하였다.
앰플리콘을 쌍형성-말단 일루미나(paired-end Illumina) 서열분석을 사용하여 서열분석하였다. 앰플리콘의 크기로 인하여, 쌍형성-말단 판독물의 오직 하나의 판독물 말단(판독물 1)만이 표적화된 서열 삽입을 함유하는 관심 부위를 포함한다. 관심 판독물(판독물 1)을 품질에 대하여 트리밍하고, 참조 앰플리콘에 대하여 정렬하였다. 판독물은 독특한 분자 식별자(UMI) 태그를 가져, 이들을 몇몇의 종류의 PCR 복제물로부터 구별하였으며, 이들 판독물에서, 정렬로부터 복제물을 제거하였다. 이어서 비-편집된 게놈 서열에 맵핑된 판독물(판독물 2)을 게놈에 대한 정확한 캡핑에 대하여 점검하였다. 판독물 1로부터 생성된 정렬을 CrispRVariants를 사용하여 분석하였으며, 이는 절단 부위를 중심으로 하는 100bp 윈도우 내에서 상이한 모든 서열 대립유전자를 설명하며, 이를 기록하였다(문헌[Lindsay, H. et al. Nature Biotechnology 2016 34: 701-702]). CrispRVariants에 의해, 전체 정렬의 판독물의 수에서 각각의 대립유전자의 판독물의 빈도가 보고되었다. 상이한 서열 대립유전자를 1) 야생형 서열, SNP 또는 서열분석 인공산물, 2) 삽입결실 돌연변이 또는 3) 정확한 삽입 이벤트로 분류하였다. CrispRVariants는 돌연변이의 유형 및 정의된 절단 부위로부터의 그의 거리에 기초하여 SNP를 자동으로 검출하였으며, 추가의 필터링 단계를 사용하여, 예측된 절단 부위의 어느 하나의 측 상의 5bp 내에서 염기를 포함하지 않은 임의의 다른 서열 이상을 제거하였다. 이들 대립유전자를 범주 1에 배치하였다. 절단 부위의 어느 하나의 측 상의 5bp 내에 임의의 염기를 포함하는 삽입 또는 결실 돌연변이를 갖는 모든 서열분석 대립유전자는 삽입결실인 것으로 결정되었으며, 범주 2에 배치하였다. 성공적인 정확한 유전자 표적화는 예상되는 크기의 삽입 및 서열에 의해 확인 가능한 단일의 CrispRVariants 서열 대립유전자를 제공하였다. 하기의 표 1 내지 2에서, 삽입결실%에 대해 보고된 빈도는 삽입결실인 것으로 결정된 모든 서열분석 대립유전자의 모든 빈도의 합이다. 정확%에 대해 보고된 빈도는 단일의 정확한 삽입 서열분석 대립유전자의 빈도이다. 두 빈도 모두에 대한 분모는 참조 앰플리콘에 대하여 정렬되는 모든 판독물의 합이다.
평균 측정치의 결과는 하기 표 1에 요약되어 있다. CasS(1) 및 CasS(2)는 (1)에 비하여 (2)에서 가이드 RNA의 2배 증가가 사용된 것을 제외하고 유사한 처리였다. "람다 레드"는 3개 모두의 HDR 촉진제(엑소뉴클레아제, 람다 베다 SSAP 단백질, 및 SSB)를 지칭한다. SD = 표준 편차.
[표 1]
모든 3개의 HDR 촉진제(즉, SSB, 엑소뉴클레아제 및 SSAP)의 트랜스펙션은 CasB 블런트 말단 뉴클레아제 실험 및 CasS 스태거형 말단 절단 뉴클레아제 둘 모두에 대하여 HDR의 발생을 크게 향상시켰다(약 10배). 공여자 주형(HDR)이 게놈 편집 편집부의 오직 0.1 내지 0.22%에서만 혼입되는 경우에, 기준선을 모든 3가지 HDR 촉진제의 부재 하에 측정하였다. 표 1에 나타낸 바와 같이, HDR 촉진제를 함유하지 않았던 시료를 기준선 대조군으로서 제공하였다.
3개의 HDR 촉진제 중 어느 하나 또는 둘의 제거는 모든 경우에, 그것이 여전히 기준선을 초과하여 측정 가능하였지만, HDR 발생을 유의미하게 감소시켰다(표 2).
[표 2]
표적 편집 부위에 스태거형 말단을 갖는 CasS 뉴클레아제-매개된 편집은 표적 편집 부위에 블런트 말단을 갖는 CasB 뉴클레아제-매개된 편집보다 더 높은 비의 정확한 편집 이벤트(HDR)를 생성하였다. 따라서, CasS 뉴클레아제-매개된 편집 이벤트의 약 80% 및 CasB 뉴클레아제-매개된 편집 이벤트의 30%는 NHEJ 이벤트에 비하여 정확한 HDR 이벤트였다. NHEJ 이벤트의 생성률은 HDR 촉진제의 존재에 의하여 유의미하게 감소되었다.
실시예 3. 옥수수 원형질체를 사용한 게놈 편집 실험
본 실시예는 삽입보다는 서열 대체를 유도하기 위하여 2개의 이중 가닥 파단을 아주 근접하게 유도하는 블런트 말단 절단 CAS 뉴클레아제를 사용한, 엑소뉴클레아제, SSB 및 SSAP의 존재 및 부재 하의 옥수수 원형질체에서의 유전자 편집을 설명한다.
110개 염기쌍 서열의 HDR-매개된 대체를 위하여 옥수수 PYL-E 유전자의 코딩 영역을 표적화하여 동의 돌연변이 및 2개의 gRNA에 의해 표적화된 2개의 PAM 부위의 파괴를 초래하는 7개 염기 편집 및 아미노산 변화를 초래하는 1개 염기 편집을 도입하는 DNA 공여자 주형 플라스미드를 구축한다. 원형 DNA 공여자 플라스미드는 양측에 약 약 500 bp 길이의 상동성 아암이 측접된 원하는 변형을 갖는 대체 주형(8개의 염기 변형을 갖는 110개 염기쌍 길이 영역)을 포함한다. 상동성 아암은 2개의 gRNA 표적 부위에 측접한 gDNA(게놈 DNA) 영역과 일치한다(즉, 이와 상동성이다). 공여자 DNA를 포함하는 대체 주형 영역은 각각의 말단에서 RNA-가이드된 뉴클레아제에 의해 인식되는 2개의 표적 gDNA 서열 중 하나와 동일한 DNA 서열이 측접한다.
옥수수 원형질체를 단리하고, 재배하고, PEG-매개된 트랜스펙션으로 처리한다. 트랜스펙션된 물질은 SEQ ID NO: 135, SEQ ID NO: 134, 및 SEQ ID NO: 133에 제시되고, 각각 2x35S, ZmUBI1, OsACT1 프로모터 및 35S, AtHSP, pea3A 폴리아데닐화 부위에 작동 가능하게 연결된, c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2 NLS-SSB 융합 단백질을 발현하는 플라스미드를 포함한다. 또한, 플라스미드는 상기 기술된 공여자 DNA 주형 영역을 가지며, 표기된 바와 같은 2개의 gRNA 및 Cas 폴리뉴클레오티드를 발현한다. Cas 폴리뉴클레오티드는 핵 국소화 신호에 융합된다. 2개의 gRNA의 각각은 공여자 플라스미드로부터 대체 주형을 방출하기 위해 한 말단에서 대체 주형에 측접한 서열 및 의도된 게놈 DNA 표적 내로 이중 가닥 파단을 표적화한다. 실험을 엔도뉴클레아제 인식 서열의 절단 후에 블런트 말단을 남기고 본원에서 CasB 뉴클레아제로 지칭되는 Cas 뉴클레아제를 사용하여 수행한다.
트랜스펙션 후 원형질체의 48시간의 인큐베이션 후에, gDNA를 트랜스펙션된 시료로부터 추출하고, 표적 유전자좌를 대체 주형의 상동성 아암 및 도입된 염기 변형에 측접하는 게놈 서열에 상보적인 프라이머를 사용하여 증폭시키고, 앰플리콘 서열분석에 의해 분석하였다. HDR은 gRNA 및 Cas 뉴클레아제를 인코딩하는 폴리뉴클레오티드만으로 트랜스펙션된 대조군에 비하여, c2 NLS-Exo, c2 NLS 람다 베타 SSAP, 및 c2 NLS-SSB 융합 단백질, gRNA 및 Cas 뉴클레아제를 인코딩하는 폴리뉴클레오티드를 발현하는 플라스미드로 트랜스펙션된 원형질체에서 증가된 수준으로 관찰된다.
실시예 4. 생물학적 서열
본 실시예는 본원에 언급된 단백질 및 핵산 서열의 비제한적인 구현예를 제공한다. 생물학적 서열 및 이들의 SEQ ID NO는 표 3에 제시되어 있다.
[표 3]
실시예 5. 토마토 원형질체에서의 게놈 편집
하기의 실시예에는 HDR 촉진제(즉, 엑소뉴클레아제, SSB 단백질 및 SSAP)의 존재 및 부재 하에 Cas 뉴클레아제를 사용한 토마토 원형질체에서 유전자 편집을 평가하는 실험이 기술된다. 구체적으로, 게놈 편집에 대한 주형 공여자 DNA, HDR 촉진제, 및 뉴클레아제 시약의 형태 및 전달 방법의 변경의 효과를 시험하기 위한 실험을 수행하였다.
재료 및 방법
토마토 원형질체를 실시예 2에 기술된 바와 같이 단리하고, 재배하고, 트랜스펙션시켰다. 게놈 편집을 실시예 2에 기술된 바와 같이, 앰플리콘 서열분석을 사용하여 평가하였다.
트랜스펙션을 위한 플라스미드의 설계
모든 성분을 단일의 벡터의 부분으로서 포함하거나(플라스미드, 도 3 참조), 동시-트랜스펙션을 위한 2개의 상이한 플라스미드 상에 분리된 성분을 갖는(도 4 내지 도 5 참조) 플라스미드를 구축하였다. 특히, 제1 벡터는 CasS 뉴클레아제 및 그의 상응하는 가이드 RNA를 인코딩하였으며, 제2 벡터는 모든 3개의 HDR 촉진제(즉, SSB 단백질, 엑소뉴클레아제 및 SSAP)를 인코딩하였다. 또한, 엔도뉴클레아제 인식 서열이 측접한 공여자 주형은 제1 또는 제2 벡터 중 어느 하나에 존재하였다.
HDR에 의한 42개 염기쌍 이종 서열의 삽입 및 3개 염기쌍의 결실을 위하여 토마토 Ant1 유전자의 프로모터 영역을 표적화하기 위한 DNA 공여자 주형을 구축하였다.
선형화된 공여자 DNA
공여자 주형 DNA를 특이적인 뉴클레아제 인식 서열이 측접한 선형 이중 가닥 DNA 분자로서 또는 원형 벡터의 부분으로서 첨가하였다.
DNA 주형 상의 gRNA 인식 부위의 존재
공여자 DNA 주형에 측접한 gRNA-인식되는 절단 부위의 존재의 영향을 이들을 트랜스펙션 벡터로부터 제거함으로써 시험하였다.
결과
토마토 원형질체를 HDR 촉진제(즉, 엑소뉴클레아제, SSB 단백질 및 SSAP)의 존재 및 부재 하에 Cas 뉴클레아제, 가이드 RNA, 및 공여자 DNA를 인코딩하는 1개 또는 2개의 플라스미드 벡터로 형질전환시켰다(도 3 내지 도 5 참조). 하기의 표 4A 내지 표 4C는 토마토 원형질체 유전자 편집 실험으로부터의 데이터의 요약을 제공한다.
2개의 벡터의 동시-형질전환은 하기 표 4A에 나타낸 바와 같이, HDR에 기인한 정확한 게놈 편집의 유의미한 증가, 및 비-상동성 말단 연결(NHEJ)에 기인한 삽입 및 결실(삽입결실) 편집의 감소를 지속적으로 보여주었다. HDR 촉진제(즉, SSB, 엑소뉴클레아제 및 SSAP)의 존재 하에 높은 비(예를 들어, 약 70 내지 80%)의 정확한 편집 대 삽입결실 편집이 존재하였다. 공여자 주형 DNA 및 Cas 뉴클레아제가 개별 벡터 상에서 동시-형질전환되는 경우(도 4 내지 도 5), HDR 촉진제의 부재 하의 공여자 주형의 포함은 정확한 편집을 유의미하게 촉진시키지 않고 NHEJ 편집을 유의미하게 감소시켰다. 공여자 주형 DNA 및 Cas 뉴클레아제가 단일의 벡터 상에 존재하는 경우(도 3), HDR 촉진제의 존재는 NHEJ 편집을 더 낮은 정도로 감소시켰다. 공여자 주형 DNA에 측접한 gRNA-인식되는 절단 부위가 제거되는 경우, HDR 촉진제의 존재는 NHEJ 편집의 수준을 감소시키지 않았다. 상이한 벡터 상의 성분의 동시-형질전환은 실시예 2에 기술된 효율에 비하여 HDR 효율을 유의미하게 개선시키지 않았다.
[표 4A]
선형 주형 DNA는 실시예 2에서 사용되는 바와 같은 특이적인 뉴클레아제 인식 서열이 측접한 원형 벡터만큼, 정확한(HDR) 편집을 촉진시키고 삽입결실(NHEJ) 편집을 감소시키는 데 효율적이었다(표 4B).
[표 4B]
절단 부위에 측접한 DNA 주형의 영향을, 이들을 트랜스펙션 벡터로부터 제거함으로써 시험하였다. 정확한 편집의 수 및 백분율은 HDR 촉진제를 갖지 않았던 음성 대조군의 것보다 더 컸지만, 실시예 2에서와 같이 절단 부위가 측접한 DNA 주형을 갖는 양성 대조군보다는 더 낮았다(표 4C). 유사하게, 삽입결실 빈도는 음성 대조군의 것보다 더 낮았으며, 양성 대조군보다 약간 더 높았다.
[표 4C]
실시예 6. 옥수수에서의
SPX
의 게놈 대체
하기의 실시예에는 HDR 촉진제(즉, 엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질)를 사용한 옥수수 원형질체 내의 SPX 유전자좌에서의 miRNA 결합 부위의 편집이 기술된다.
재료 및 방법
플라스미드 구축물의 설계
2개의 gRNA를 사용하여 CasS-매개된 절단을 위하여 옥수수 내의 SPX 유전자좌에서 miRNA 결합 부위 주변의 영역을 표적화함으로써, 상기 부위의 대체를 매개한다. 공여자 DNA 단편은 HDR 촉진제에 의해 매개되는 HDR 수선/편집을 위한 주형으로서 사용된다.
옥수수 내의 SPX 유전자좌 및 이의 측접 영역에서 miRNA 결합 부위를, miRNA 결합 부위 내의 3개의 염기쌍마다 SNP를 함유하는 단편으로 대체하도록 플라스미드 구축물을 설계한다. 또한, SNP를 도입하여 2개의 PAM 부위를 돌연변이시킴으로써, 편집이 발생한 후에 유전자좌의 절단을 방지한다. miRNA 결합 부위 내로 도입된 SNP 중 하나는 miRNA 결합 부위 및 PAM 서열 중 하나에 대한 SNP로서 작용한다.
표적에 특이적인 2개의 gRNA와 함께 CasS 뉴클레아제, HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질), 및 대체 단편 및 표적 편집 부위에 대하여 상동성인 약 700개 염기쌍 상동성 아암을 갖는 공여자 주형을 갖는 시스템이 사용된다. Cas9 및 HDR 촉진제를 발현하는 벡터를 실시예 6에 기술된 바와 같이 설계하였다. 상동성 아암은 약 700개 염기쌍이도록 설계하였는데, 그 이유는 이전의 실험에 의해, 약 500개 내지 750개 염기쌍 아암이 작용성임이 나타났기 때문이다(실시예 6 참조). 또한, 상동성 아암의 GC 함량도 또한 고려하고, 최대화하였으며, 이는 이론에 결부시키고자 하지 않고, 어닐링과, 정확한 편집의 촉진에 도움을 줄 수 있다. HDR 촉진제에 의해 매개되는 이후의 편집을 위하여 공여자가 플라스미드로부터 절단되고 방출되도록 2개의 gRNA 표적 서열의 각각이 또한, 공여자의 말단에 존재하였다. 단일의 플라스미드가 편집을 위한 모든 필요한 성분을 발현하였다(도 6 참조). 각각의 발현되는 성분은 그 자체의 프로모터에 의해 유도되었다.
옥수수 재배 및 트랜스펙션 및 앰플리콘 서열분석
각각의 개별 플라스미드를 4개의 개별 반복실험에서 옥수수 원형질체 내로 트랜스펙션시킨다. 세포를 48시간 동안 인큐베이션시킨다. 이어서, 게놈 DNA를 추출하고, 앰플리콘 서열분석 라이브러리를 제조한다. 삽입 및 결실(삽입결실) 빈도 및 대체 효율을 상기 실시예 2에 기술된 바와 같이 앰플리콘 서열분석 데이터로부터 정량화한다.
결과
옥수수 내의 SPX 유전자좌에서의 miRNA 결합 부위를 HDR 촉진제의 존재 또는 부재 하에 2개의 gRNA에 의해 표적화된 CasS 뉴클레아제를 사용하여 편집한다. 이 실험 시료에 더하여, 기준선 대조군 및 몇몇의 다른 대조군이 실험에 포함된다. 표 5에 나타낸 바와 같이, 2개의 gRNA와 함께 CasS 및 공여자, 2개의 gRNA와 함께 CasS, 개별 gRNA와 함께 CasS, 및 공여자 단독을 인코딩하는 벡터를 대조군으로서 제공한다.
[표 5]
정확한 편집 및 삽입결실을 서열분석에 의해 측정하고, 상이한 시료 간에 비교한다.
실시예 7. 니코티아나 벤타미아나(
Nicotiana benthamiana
)에서의 향상된 HDR
하기의 실시예에는 니코티아나 벤타미아나 잎에서의 게놈 편집이 기술된다. 특히, 식물계에서의 편집의 효율을 HDR 촉진제(즉, 엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질)의 존재 또는 부재 하에 니코티아나 벤타미아나 리포터 라인에서의 GFP의 코딩 서열을 GFP의 돌연변이 대립유전자로 수선함으로써 측정한다.
재료 및 방법
니코티아나 벤타미아나 재배 및 트랜스펙션
GFP의 기능 상실 대립유전자를 갖는 니코티아나 벤타미아나의 종자를 2주 동안 카나마이신 선택 배지(50 ㎎/㎖) 상에서 발아시킨 후에, 토양으로 옮기고, 2주 동안 컨비론(Conviron) 성장 챔버(12h/12h/75μmol/m2s-1, 낮:밤:광)에서 성장시킨다. 니코티아나 벤타미아나 잎에, CasS 및 HDR 촉진제 발현 카세트, 및 GFP-수선 주형을 갖는 공여자 주형을 함유하는 T-DNA 벡터를 발현하는 아그로박테리움 투메파시엔스(균주 GV3101)를 주사기-침윤시킨다(도 7 참조). 이어서, 잎 시료를 유전자형분석을 위해 취하여, PCR을 통해 리포터 전이유전자의 존재를 확인한다. 식물을 3일 동안 성장 리드(growth lid)를 사용하여 인큐베이션시킨 후에, 평가하고, 수집한다. 처리된 잎을 조직 배양으로 옮기고, 전체 식물을 조직 배양으로부터 재생시킨다. 모든 시료를 3벌로 시험한다.
GFP 코딩 서열 수선의 평가
GFP 코딩 서열의 수선을 수많은 방법 중 하나를 사용하여 평가한다. 표적화된 삽입을 함유하는 잎 세포의 비 및 수를 침윤 3일 후에, 형광 현미경을 사용하여 GFP 신호의 가시화에 의해 정량화한다.
침윤된 잎 내의 표적 삽입의 빈도를 실시예 2에 기술된 바와 같이, 우측 게놈/공여자 경계의 앰플리콘 서열분석을 사용하여 정량화하여, 정확한 편집의 전체 효율을 추산한다.
재생된 전체 식물을 정성적으로 비교하여, 형광 현미경을 사용한 GFP 신호의 가시화에 의해 표적화된 삽입의 안정한 발현을 확인한다.
재생된 전체 식물 내의 표적화된 삽입의 빈도를 우측 게놈/공여자 경계의 생거(Sanger) 서열분석에 의해 정량화하여, 정확한 편집의 전체 효율을 추산한다.
결과
니코티아나 벤타미아나 잎을 HDR 촉진제와 함께 및 이것 없이 돌연변이 GFP 유전자를 유전학적으로 변형시키기 위하여 CasS 시스템을 발현하도록 형질전환시킨다. 하기의 표 6은 니코티아나 벤타미아나 잎 내로 형질전환된 성분의 요약을 제공한다. "람다 레드"는 모든 3개의 HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 단백질 및 SSB)를 나타낸다.
[표 6]
돌연변이 GFP의 수선을 측정하고, 시료 간에 비교한다.
실시예 8. 분열하는 토마토 및 옥수수 조직에서의 향상된 HDR
하기의 실시예에는 분열하는 식물 조직에서 HDR 촉진제에 의해 매개되는 유전자 편집을 시험하는 실험이 기술된다. 특히, 토마토 떡잎 외식편을 HDR 촉진제의 존재 및 부재 하에 Cas 뉴클레아제를 사용하여 편집하였다. 또한, 옥수수 배 외식편을 HDR 촉진제의 존재 및 부재 하에 Cas 뉴클레아제를 사용하여 편집한다.
옥수수 외식편 형질전환
재료 및 방법
옥수수 형질전환을 위한 플라스미드의 설계
본 실시예에는 아그로박테리움 매개된 옥수수 형질전환을 위한 식물 발현 벡터의 구축이 기술된다. 2개의 식물 유전자 발현 벡터를 제조하였다. 박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO: 1) 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위한 식물 발현 카세트를 구축하였다. SEQ ID NO:15의 담배 c2 핵 국소화 신호(NLS)를 인코딩하는 DNA 서열을 엑소뉴클레아제, 박테리오파지 람다 베타 SSAP 단백질, 및 에스케리키아 콜라이 SSB를 인코딩하는 DNA 서열에 융합시켜, 각각 SEQ ID NO: 135, SEQ ID NO: 134 및 SEQ ID NO: 133에 제시된 c2 NLS-Exo, c2 NLS 람다 베타 SSAP, 및 c2 NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 제공하였다. c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 각각 OsUBI1, SlUBI1, OsACT 프로모터 및 pea3A, 완두 rbcs E9, NtEXT 폴리아데닐화 부위에 작동 가능하게 연결하여, 엑소뉴클레아제, SSAP 및 SSB 식물 발현 카세트를 제공하였다.
HDR에 의한 36개 염기쌍 이종 서열의 삽입을 위하여 옥수수 gln1-3 유전자의 프로모터 영역을 표적화하는 DNA 공여자 서열을 구축하였다. DNA 공여자 서열은 양측 모두에서 약 500 내지 635 bp 길이의 상동성 아암이 측접된 원하는 삽입 영역(36개 염기쌍 길이)을 갖는 대체 주형을 포함한다. 상동성 아암은 표적 gDNA 삽입 부위에 측접한 gDNA(게놈 DNA) 영역과 일치한다(즉, 이에 대해 상동성이다). 공여자 DNA를 포함하는 대체 주형 영역은 각각의 말단에서 RNA-가이드된 뉴클레아제에 의해 인식되는 gln1-3 유전자 서열과 동일한 DNA 서열이 측접된다.
RNA-가이드된 서열-특이적(CasB 절단 유형) 엔도뉴클레아제의 발현을 제공하는 식물 발현 카세트를 구축하였다. 삽입 부위에 인접한 서열에 상보적인 가이드 RNA의 발현을 제공하는 식물 발현 카세트를 구축하였다. 포스피노트리신 N-아세틸트랜스퍼라제신타제(PAT) 단백질의 발현을 제공하는 카세트를 함유하는 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터를 구축하였다. 카세트, 공여자 서열 및 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터가 구축되면, 이들을 조합하여, 2개의 옥수수 형질전환 플라스미드를 생성하였다.
옥수수 형질전환 플라스미드 pIN1757을 PAT 카세트, RNA-가이드 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트, 및 gln1-3 DNA 공여자 서열을 사용하여 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터 내로 구축하였다(도 8).
옥수수 형질전환 플라스미드 pIN1756을 PAT 카세트, RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트, SSB 카세트, 람다 베타 SSAP 카세트, Exo 카세트 및 gln1-3 DNA 공여자 서열을 사용하여 아그로박테리움 슈퍼바이너리 플라스미드 형질전환 벡터 내로 구축하였다(도 8).
옥수수 형질전환
모든 구축물을 슈퍼바이너리 벡터로부터 아그로박테리아 균주 LBA4404 내에 전달하였다.
옥수수 형질전환을 공개된 방법에 기초하여 수행하였다(문헌[Ishida et. al, Nature Protocols 2007; 2, 1614-1621]). 요약하여, 대략 1.8 내지 2.2 mm 크기의 근교계 GIBE0104 유래의 미성숙 배를 수분 후 10 내지 14일에, 표면 살균된 이삭으로부터 단리하였다. 배를 OD600 = 1.0의 농도로 감염 배지를 사용하여 제조된 아그로박테리움 현탁액에 배치하였다. 아세토시린곤(acetosyringone)(200 μM)을 사용 시에 감염 배지에 첨가하였다. 배 및 아그로박테리움을 락커 쉐이커(rocker shaker) 상에 저속으로 15분 동안 배치하였다. 이어서, 배를 동시-배양 배지의 플레이트의 표면 상에 부었다. 플레이트를 기울이고, 모든 액체를 피펫을 사용하여 빼냄으로써 과잉의 액체 배지를 제거하였다. 배를 배판(scutellum) 상향 배향을 유지하기 위하여 필요에 따라 뒤집었다. 동시-배양 플레이트를 뚜껑이 있는 상자에 배치하고, 22℃에서 3일 동안 암 중에서 배양하였다. 이어서, 배를 배반 상향 배향을 유지하여 휴지 배지로 전달하였다. 배를 27 내지 28℃에서 7일 동안 휴지 배지 상에 남겨둔다. 캘러스를 생성한 배를 7.5 ㎎/ℓ 포스피노트리신(PPT)이 있는 선택 1 배지로 옮기고, 추가 7일 동안 배양하였다. 캘러스 형성된 배를 10 ㎎/ℓ PPT가 있는 선택 2 배지 상에 배치하고, 27 내지 28℃에서 14일 동안 배양하였다. 선택제 저항성인 성장하는 캘러스를 10 ㎎/ℓ PPT가 있는 사전-재생 배지로 옮겨, 슈트 발생을 개시하였다. 캘러스를 사전-재생 배지 상에서 7일 동안 유지하였다. 슈트를 개시하기 시작한 캘러스를 파이타트레이(Phytatray)에서 7.5 ㎎/ℓ PPT가 있는 재생 배지로 옮기고, 27 내지 28℃에서 광 중에 배양하였다. 온전한 뿌리를 갖는 파이타트레이의 상측에 도달한 슈트를 슈트 신장 배지 내로 단리한 후에, 토양으로 이식하고, 온실 조건에 점차 순응시켰다.
결과
각각의 실험 조건에서 외식편의 수는 하기 표 7A에 제공된다. 재생된 슈트를 시료추출하고, gDNA를 pIN1757에 대하여 16개의 배("이벤트") 유래의 45개의 재생된 식물로부터, 그리고 pIN1756에 대하여 53개의 배 유래의 201개의 재생된 식물로부터 추출하였다. ZmGln1.3 유전자좌를 약 835개 염기쌍의 앰플리콘을 생성하기 위하여 설계된 프라이머를 사용하여 gDNA로부터 증폭시켰으며; 정방향 프라이머는 엔도뉴클레아제 절단 부위의 약 130 bp 5'이며, 역방향 프라이머는 3' 상동성 아암의 외측에 존재하여, 오직 내인성 유전자좌만이 증폭되게 한다. 비드 클린-업(clean-up) 후에, 앰플리콘을 차세대 서열분석에 의해 분석하였다.
표 7A, 삽입결실# 및 HDR# 열에 기록된 수는 표적 서열에 대해 적어도 5,000개의 맵핑된 판독물 및 앰플리콘에 대한 적어도 50%의 완전한 정렬을 갖는 시료를 나타낸다. 표적 서열에 대한 적어도 5,000개의 판독물 맵핑 및 앰플리콘에 대한 적어도 50%의 완전한 정렬을 갖는 시료에 대하여 필터링한 후에, HDR 촉진제가 존재하는 경우, 표적화된 삽입을 갖는 53개의 이벤트(201개의 식물) 중에 2개의 독립적인 이벤트(5개의 식물)가 확인되었으며(3.77%), 이는 HDR 촉진제가 존재하지 않는 경우 16개의 이벤트 중에 0개인 것과 비교된다.
[표 7A]
토마토 외식편 형질전환
재료 및 방법
토마토 형질전환을 위한 플라스미드의 설계
박테리오파지 람다 엑소뉴클레아제(SEQ ID NO:8), 박테리오파지 람다 베타 SSAP 단백질(SEQ ID NO: 1) 및 에스케리키아 콜라이 SSB(SEQ ID NO:31)를 발현하기 위한 식물 발현 카세트를 구축하였다. SEQ ID NO:15의 담배 c2 핵 국소화 신호(NLS)를 인코딩하는 DNA 서열을 엑소뉴클레아제, 박테리오파지 람다 베타 SSAP 단백질 및 에스케리키아 콜라이 SSB를 인코딩하는 DNA 서열에 작동 가능하게 연결하여, 각각 SEQ ID NO: 135, SEQ ID NO: 134, 및 SEQ ID NO: 133에 제시된 c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2 NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 제공하였다. c2 NLS-Exo, c2 NLS 람다 베타 SSAP 및 c2NLS-SSB 융합 단백질을 인코딩하는 DNA 서열을 각각 2x35S, SlUBI10, PcUBI4 프로모터 및 35S, AtHSP, pea3A 폴리아데닐화 부위에 작동 가능하게 연결하여, 엑소뉴클레아제, SSAP 및 SSB 식물 발현 카세트를 제공하였다.
또한, HDR에 의한 42개 염기쌍 이종 서열의 삽입을 위한 토마토 Ant1 유전자(SlAnt1)의 프로모터 영역을 표적화하는 DNA 공여자 서열을 구축하였다. DNA 공여자 서열은 양 측에서 약 600 내지 800 bp 길이의 상동성 아암이 측접한 원하는 삽입 영역(42개 염기쌍 길이)을 갖는 대체 주형을 포함하였다. 상동성 아암은 표적 gDNA 삽입 부위에 측접한 내인성 DNA 영역과 일치하였다(즉, 이에 대해 상동성이었다). 공여자 DNA를 포함하는 대체 주형 영역은 각 말단에서 RNA-가이드된 뉴클레아제에 의해 인식되는 내인성 표적 편집 부위 서열과 동일한 DNA 서열이 측접하였다.
추가로, RNA-가이드된 서열-특이적 엔도뉴클레아제의 발현을 제공하는 식물 발현 카세트를 구축하였다. 삽입 부위에 인접한 서열에 상보적인 가이드 RNA의 발현을 제공하는 식물 발현 카세트를 구축하였다. 녹색 형광 단백질(GFP)의 발현을 제공하는 식물 발현 카세트를 구축하였다. 5-에놀피루빌시키메이트-3-포스페이트(EPSPS) 신타제의 발현을 제공하는 카세트를 함유하는 아그로박테리움 바이너리 플라스미드 형질전환 벡터를 구축하였다.
일단 카세트, 공여자 서열 및 아그로박테리움 형질전환 플라스미드 벡터가 구축되면, 이들을 조합하여, 3가지 토마토 형질전환 플라스미드를 생성하였다.
토마토 형질전환 플라스미드 pIN1703을 아그로박테리움 형질전환 플라스미드 벡터 내로 클로닝된 RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트 및 GFP 카세트를 사용하여 구축하였다(도 9b). 토마토 형질전환 플라스미드 pIN1704를 아그로박테리움 형질전환 플라스미드 벡터 내로 클로닝된 RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트 및 Ant1 DNA 공여자 서열을 사용하여 구축하였다(도 9b). 토마토 형질전환 플라스미드 pIN1705를 아그로박테리움 형질전환 플라스미드 벡터 내로 클로닝된 RNA-가이드된 서열-특이적 엔도뉴클레아제 카세트, 가이드 RNA 카세트, SSB 카세트, 람다 베타 SSAP 카세트, 엑소뉴클레아제 카세트 및 Ant1 DNA 공여자 서열을 사용하여 구축하였다(도 9a 내지 도 9b).
모든 벡터를 아그로박테리움 균주 EHA105를 사용하여 토마토에 전달하였다.
토마토 외식편 형질전환
상기 기술된 벡터를 사용하여 토마토(재배종 머니메이커(Moneymaker)) 외식편을 형질전환시켜, 상기 언급된 성분을 갖는 안정하게 형질전환된 전이유전자 슈트를 재생시켰다. 토마토 형질전환을 이전에 공개된 방법에 기초하여 수행하였다(문헌[Van Eck J., Keen P., Tjahjadi M. (2019) Agrobacterium tumefaciens-Mediated Transformation of Tomato. In: Kumar S., Barone P., Smith M. (eds) Transgenic Plants. Methods in Molecular Biology, vol 1864. Humana Press, New York, NY]). 요약하여, 토마토 종자를 10분 동안 50% 상용 표백제로 살균시키고, ½ 세기 MSO 배지 상에서 발아시켰다. 본엽이 나오기 전에, 떡잎을 절개하여, 잎의 중간 3 내지 5 mm 섹션을 수집하였다. 이들 잎을 아그로박테리움으로 형질전환시킨 다음, 2주 동안 휴지 재생 배지 상에 배치하였다. 2주 후에, 외식편을 선택제로서 2 ㎎/ℓ 글리포세이트가 보충된 재생 배지로 옮겼다. 외식편을 2주마다 계대배양하였다. 약 6주 내지 7주에, 슈트는 이들 외식편으로부터 재생하기 시작하였다.
시료를 잘-신장된 슈트로부터 수집하였으며, 슈트를 2 ㎎/ℓ 글리포세이트가 보충된 발근 배지로 이동시켰다. 작은 슈트에 있어서, 전체 슈트 매스를 분자적 분석을 위하여 수집하였다(즉, 파괴적 시료추출).
토마토 외식편 형질전환의 평가
재생된 슈트는 먼저, 뉴클레아제 서열의 존재를 검출하기 위한 TaqMan qPCR 검정에 의해 전이유전자 양성으로 확인되었다. 추가로, qPCR 검정을 사용하여, 하기 표 7B에 나타낸 바와 같이, 전이유전자 삽입이 저(1 내지 2 카피) 카피수로 발생하는지 또는 고(2 카피 초과) 카피수로 발생하는 지 여부를 추정하였다. HDR-매개된 편집 이벤트의 수준을 평가하기 위하여, SlAnt1 유전자좌를 이전에 확인된 뉴클레아제 서열 양성 외식편으로부터 추출된 동일한 gDNA 공급원으로부터 증폭시키고, 차세대 서열분석을 통해 분석하였다.
결과
상기 기술된 바와 같이, CRISPR 엔도뉴클레아제(CasS), 부위-특이적 절단을 위한 가이드 RNA 및 HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 단백질 및 에스케리키아 콜라이 SSB)를 갖는 시스템을 설계하였다. 표적화된 게놈 유전자좌와 일치하는 상동성 아암이 측접한 통합될 서열을 특징짓는 공여자 DNA 분자도 또한 포함시켰다. 공여자 DNA는 어느 하나의 측 상에 가이드 RNA와 일치하는 절단 부위가 측접하여, 전이유전자가 삽입되는 게놈 삽입 부위로부터 공여자 분자가 절개되고 방출될 수 있게 하였다. 분열하는 식물 조직의 게놈 내로의 표적화된 통합을 개선하는 데에서의 이 시스템의 효율성을 시험하기 위하여, 상기 기술된 전체 시스템을 아그로박테리움을 통해 토마토의 외식편에 전달하였다.
HDR 촉진제 시스템(도 9a)으로부터의 정확한 표적화된 통합의 효율을 단지 CasS 뉴클레아제, 가이드 RNA 및 DNA 공여자로 구성된 기준선 실험 조건(도 9b에서 pIN1704 참조)과 비교함으로써, 시스템의 효율성을 측정하였다. 정확한 표적화된 통합의 효율을 형질전환된 외식편으로부터 재생된 슈트의 DNA 서열분석에 기초하여 계산하였다. 총 재생된 슈트의 수 중에, 통합된 공여자 서열을 함유하였던 토마토 슈트의 백분율은 각각의 구축물에 대하여 하기 표 7B에 나타나 있다. 시료추출된 조직은 토마토 형질전환 시스템의 성질로 인하여 유전학적으로 균일하기 보다는 키메라였으며, 서열분석 결과는 개별 식물 내의 일부 독립적인 편집 발생을 반영하였다. 표 7B에서, 삽입결실은 SlAnt1 프로모터 내의 표적 위치에서의 NHEJ-형 및 HDR-형 돌연변이 둘 모두를 나타낸다. HDR 돌연변이는 개별 시료로부터의 서열분석 판독물의 30% 초과가 정확한 편집인, 즉, 주형 DNA의 삽입인 경우, 유전 가능할 가능성이 있는 것으로 간주하였다. 정확한 편집의 수준은 전이유전자 카피의 수와 상호관련되지 않았다. 유전 가능한 HDR-매개된 편집 이벤트의 백분율은 HDR 촉진제를 인코딩하는 벡터(pIN1705)로 형질전환된 슈트에서 가장 높았다. 소수의 편집된 식물을 긴 판독물 서열분석에 의해 추가로 특성화하였다. 6개의 pIN1704-형질전환된 식물 시료 중에, 오직 하나에서 일부 무흔적(scarless) 편집이 검출되었다. 15개의 pIN1705-형질전환된 식물 시료 중에, 10개에서 일부 무흔적 편집이 검출되었으며, 이 중 적어도 4개는 이중대립유전자 100% 무흔적 편집을 가졌다. 표적화된 서열 삽입의 결과로서, 편집된 식물은 상이한 수준의 안토시아닌 축적을 보였다. 종합하여, HDR 촉진제를 인코딩하는 벡터는 HDR-매개된 정확한 편집을 유의미하게 개선시켰다.
[표 7B]
상기 기술된 바와 같은 토마토 편집 실험을 반복하였으며, 결과는 표 7C에 나타나 있다. 다시, 유전 가능한 HDR-매개된 편집 이벤트의 백분율은 HDR 촉진제를 인코딩하는 벡터(pIN1705)로 형질전환된 슈트에서 가장 높았으며; 동일한 경향이 관찰되었다.
[표 7C]
실시예 9. 포유류 세포에서의 향상된 HDR
하기의 실시예에는 HDR 촉진제의 존재 또는 부재 하의 인간 배아 신장 293(HEK-293) 세포에서의 유전자좌의 정확한 편집이 기술된다. FRT 부위 및 최소 AAVS1 부위를 각각 EMX1 및 GRIN2b 유전자 내로 삽입한다. 편집 기구를 발현하는 플라스미드를 세포주 내로 트랜스펙션시켜, 이들 유전자 내의 특이적인 표적 편집 부위에서 표적화된 삽입을 유도한다.
재료 및 방법
트랜스펙션을 위한 플라스미드의 설계
EMX1 또는 GRIN2b 표적 유전자좌에 특이적인 gRNA와 함께 CasS 뉴클레아제, HDR 촉진제(엑소뉴클레아제, 람다 베타 SSAP 및 에스케리키아 콜라이 SSB 단백질), 및 삽입 서열 및 표적 편집 부위에 대해 상동성인 약 700개 염기쌍 상동성 아암을 갖는 공여자 주형를 인코딩하는 단일의 플라스미드를 생성한다. 각각의 성분은 개별 프로모터에 의해 유도된다. 유전자 카세트를 먼저 모듈 A, B 및 C로 지칭되는 3가지 개별 중간 플라스미드에서 합성한 다음, 단일의 발현 플라스미드 내에 어셈블한다.
CasS 및 HDR 촉진제의 아미노산 서열은 HDR 촉진제에 대한 NLS를 제외하고, 실시예 1에 기술된 바와 같다. 특히, HDR 촉진제를 아미노산 링커(SEQ ID NO: 148, MAPKKKRKVGGSGS)를 사용하여 SV40 NLS에 융합시킨다. 모든 코딩-서열을 인간에서의 발현을 위해 코돈-최적화시킨다. 도 10에 나타낸 바와 같이, CasB는 CAG 프로모터 및 토끼 베타-글로빈 종결인자의 제어 하에 있으며(CAGp- CasS -rb_globin_t), gRNA는 호모 사피엔스(H. sapiens) U6 프로모터의 제어 하에 있으며(HsU6p-gRNA), SSB 단백질은 호모 사피엔스 EF1a 프로모터 및 인간 성장 호르몬(hGH) 종결인자의 제어 하에 있으며(HsEF1ap-SSB-hGHt), SSAP는 호모 사피엔스 ACTB 프로모터 및 소 성장 호르몬(bGH) 종결인자의 제어 하에 있으며(HsACTB-Beta-bGHt), 엑소뉴클레아제는 CMV 프로모터 및 SV40 종결인자의 제어 하에 있다(CMVp-Exo-SV40t).
또한, 공여자는 게놈 표적에 존재하는 것과 동일한 gRNA 표적 서열이 측접함에 따라, 전달되는 플라스미드로부터의 공여자의 방출 및 이후의 HDR 촉진제에 의해 매개되는 편집을 야기한다(도 10 참조).
개별 플라스미드를 하기 표 8에 나타낸 각각의 시료에 대하여 구축한다.
HEK-293 세포의 트랜스펙션
플라스미드를 HEK-293 세포 내로 트랜스펙션시킨다. 플라스미드당 3개의 개별 트랜스펙션을 반복실험으로서 제공한다.
트랜스펙션 후에, 세포를 48 내지 72시간 동안 인큐베이션시킨 후에, 이후의 앰플리콘 서열분석 라이브러리의 제조를 위하여 게놈 DNA를 모든 시료로부터 추출한다.
앰플리콘 서열분석
표적을 삽입 부위에 바로 인접한 서열에 어닐링하는 프라이머 및 공여자에 존재하는 상동성 영역의 외측의 게놈 서열에 어닐링하는 프라이머를 사용하여 증폭시킨다(플라스미드로부터 공여자의 증폭을 방지하기 위함). 이어서, 표적 유전자좌에서의 삽입 효율을 삽입 서열에 인접한 프라이머로부터 생성되는 판독물로부터의 앰플리콘 서열분석 데이터를 사용하여 정량화한다.
HEK-293 세포를 HDR 촉진제의 존재 또는 부재 하에 편집한다. 특히, 상기 기술된 플라스미드를 사용하여 34개 염기쌍 FRT 부위를 EMX1 유전자좌 내로 삽입하고, 33개 염기쌍 최소 AAVS1 부위를 GRIN2b 유전자좌 내로 삽입한다.
CasS, 모든 3가지 HDR 촉진제("람다 레드"), gRNA 및 공여자 DNA를 함유하는 시료에 더하여, 몇몇의 대조군을 표 8에 나타낸 바와 같이 포함시켜, HDR 촉진제를 갖는 시료의 편집 효율을 기준선과 비교한다. "람다 레드"는 모든 3가지 HDR 촉진제를 나타낸다(엑소뉴클레아제, 람다 베타 SSAP 단백질 및 SSB).
[표 8]
특히, gRNA와 함께 CasS 및 공여자(HDR 촉진제 부재의 기준선 대조군), 람다 레드 유전자 및 공여자(표적 DNA의 뉴클레아제-매개된 절단이 중요한 것을 확인하기 위한 뉴클레아제 부재 대조군), 공여자 단독, 및 gRNA와 함께 CasS(본 발명자들이 표적의 효율적인 절단을 얻고 있는 것을 확인하기 위한 절단 대조군)를 함유하는 시료를 개별적으로 대조군으로서 트랜스펙션시킨다. gRNA와 함께 CasS 및 공여자를 갖는 시료는 HDR 촉진제를 갖는 시료가 비교되는 기준선 시료이다. 또한, 트랜스펙션 부재 대조군도 또한 평가한다.
본 개시내용의 폭 및 범주는 상기 기술된 실시예 중 어느 것에 의해서도 제한되지 않고, 전술된 구현예에, 하기의 청구범위 및 이들의 등가물에 의해서만 정의되어야 한다.
참고문헌
SEQUENCE LISTING
<110> Inari Agriculture, Inc.
<120> IMPROVED HOMOLOGY DEPENDENT REPAIR
GENOME EDITING
<130> 16536-20006.40
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 62/866,317
<151> 2019-06-25
<160> 149
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 261
<212> PRT
<213> Unknown
<220>
<223> Bacteria (eubacteria)
<400> 1
Met Ser Thr Ala Leu Ala Thr Leu Ala Gly Lys Leu Ala Glu Arg Val
1 5 10 15
Gly Met Asp Ser Val Asp Pro Gln Glu Leu Ile Thr Thr Leu Arg Gln
20 25 30
Thr Ala Phe Lys Gly Asp Ala Ser Asp Ala Gln Phe Ile Ala Leu Leu
35 40 45
Ile Val Ala Asn Gln Tyr Gly Leu Asn Pro Trp Thr Lys Glu Ile Tyr
50 55 60
Ala Phe Pro Asp Lys Gln Asn Gly Ile Val Pro Val Val Gly Val Asp
65 70 75 80
Gly Trp Ser Arg Ile Ile Asn Glu Asn Gln Gln Phe Asp Gly Met Asp
85 90 95
Phe Glu Gln Asp Asn Glu Ser Cys Thr Cys Arg Ile Tyr Arg Lys Asp
100 105 110
Arg Asn His Pro Ile Cys Val Thr Glu Trp Met Asp Glu Cys Arg Arg
115 120 125
Glu Pro Phe Lys Thr Arg Glu Gly Arg Glu Ile Thr Gly Pro Trp Gln
130 135 140
Ser His Pro Lys Arg Met Leu Arg His Lys Ala Met Ile Gln Cys Ala
145 150 155 160
Arg Leu Ala Phe Gly Phe Ala Gly Ile Tyr Asp Lys Asp Glu Ala Glu
165 170 175
Arg Ile Val Glu Asn Thr Ala Tyr Thr Ala Glu Arg Gln Pro Glu Arg
180 185 190
Asp Ile Thr Pro Val Asn Asp Glu Thr Met Gln Glu Ile Asn Thr Leu
195 200 205
Leu Ile Ala Leu Asp Lys Thr Trp Asp Asp Asp Leu Leu Pro Leu Cys
210 215 220
Ser Gln Ile Phe Arg Arg Asp Ile Arg Ala Ser Ser Glu Leu Thr Gln
225 230 235 240
Ala Glu Ala Val Lys Ala Leu Gly Phe Leu Lys Gln Lys Ala Ala Glu
245 250 255
Gln Lys Val Ala Ala
260
<210> 2
<211> 269
<212> PRT
<213> Escherichia coli str. K-12 substr. MG1655
<400> 2
Met Thr Lys Gln Pro Pro Ile Ala Lys Ala Asp Leu Gln Lys Thr Gln
1 5 10 15
Gly Asn Arg Ala Pro Ala Ala Val Lys Asn Ser Asp Val Ile Ser Phe
20 25 30
Ile Asn Gln Pro Ser Met Lys Glu Gln Leu Ala Ala Ala Leu Pro Arg
35 40 45
His Met Thr Ala Glu Arg Met Ile Arg Ile Ala Thr Thr Glu Ile Arg
50 55 60
Lys Val Pro Ala Leu Gly Asn Cys Asp Thr Met Ser Phe Val Ser Ala
65 70 75 80
Ile Val Gln Cys Ser Gln Leu Gly Leu Glu Pro Gly Ser Ala Leu Gly
85 90 95
His Ala Tyr Leu Leu Pro Phe Gly Asn Lys Asn Glu Lys Ser Gly Lys
100 105 110
Lys Asn Val Gln Leu Ile Ile Gly Tyr Arg Gly Met Ile Asp Leu Ala
115 120 125
Arg Arg Ser Gly Gln Ile Ala Ser Leu Ser Ala Arg Val Val Arg Glu
130 135 140
Gly Asp Glu Phe Ser Phe Glu Phe Gly Leu Asp Glu Lys Leu Ile His
145 150 155 160
Arg Pro Gly Glu Asn Glu Asp Ala Pro Val Thr His Val Tyr Ala Val
165 170 175
Ala Arg Leu Lys Asp Gly Gly Thr Gln Phe Glu Val Met Thr Arg Lys
180 185 190
Gln Ile Glu Leu Val Arg Ser Leu Ser Lys Ala Gly Asn Asn Gly Pro
195 200 205
Trp Val Thr His Trp Glu Glu Met Ala Lys Lys Thr Ala Ile Arg Arg
210 215 220
Leu Phe Lys Tyr Leu Pro Val Ser Ile Glu Ile Gln Arg Ala Val Ser
225 230 235 240
Met Asp Glu Lys Glu Pro Leu Thr Ile Asp Pro Ala Asp Ser Ser Val
245 250 255
Leu Thr Gly Glu Tyr Ser Val Ile Asp Asn Ser Glu Glu
260 265
<210> 3
<211> 287
<212> PRT
<213> Unknown
<220>
<223> Bacteriophage SPP1 35 protein
<400> 3
Met Ala Thr Lys Lys Gln Glu Glu Leu Lys Asn Ala Leu Ala Gln Gln
1 5 10 15
Asn Gly Ala Val Pro Gln Thr Pro Val Lys Pro Gln Asp Lys Val Lys
20 25 30
Gly Tyr Leu Glu Arg Met Met Pro Ala Ile Lys Asp Val Leu Pro Lys
35 40 45
His Leu Asp Ala Asp Arg Leu Ser Arg Ile Ala Met Asn Val Ile Arg
50 55 60
Thr Asn Pro Lys Leu Leu Glu Cys Asp Thr Ala Ser Leu Met Gly Ala
65 70 75 80
Val Leu Glu Ser Ala Lys Leu Gly Val Glu Pro Gly Leu Leu Gly Gln
85 90 95
Ala Tyr Ile Leu Pro Tyr Thr Asn Tyr Lys Lys Lys Thr Val Glu Ala
100 105 110
Gln Phe Ile Leu Gly Tyr Lys Gly Leu Leu Asp Leu Val Arg Arg Ser
115 120 125
Gly His Val Ser Thr Ile Ser Ala Gln Thr Val Tyr Lys Asn Asp Thr
130 135 140
Phe Glu Tyr Glu Tyr Gly Leu Asp Asp Lys Leu Val His Arg Pro Ala
145 150 155 160
Pro Phe Gly Thr Asp Arg Gly Glu Pro Val Gly Tyr Tyr Ala Val Ala
165 170 175
Lys Met Lys Asp Gly Gly Tyr Asn Phe Leu Val Met Ser Lys Gln Asp
180 185 190
Val Glu Lys His Arg Asp Ala Phe Ser Lys Ser Lys Asn Arg Glu Gly
195 200 205
Val Val Tyr Gly Pro Trp Ala Asp His Phe Asp Ala Met Ala Lys Lys
210 215 220
Thr Val Leu Arg Gln Leu Ile Asn Tyr Leu Pro Ile Ser Val Glu Gln
225 230 235 240
Leu Ser Gly Val Ala Ala Asp Glu Arg Thr Gly Ser Glu Leu His Asn
245 250 255
Gln Phe Ala Asp Asp Asp Asn Ile Ile Asn Val Asp Ile Asn Thr Gly
260 265 270
Glu Ile Ile Asp His Gln Glu Lys Leu Gly Gly Glu Thr Asn Glu
275 280 285
<210> 4
<211> 205
<212> PRT
<213> Salmonella virus P22
<400> 4
Met Ser Lys Glu Phe Tyr Ala Arg Leu Ala Glu Ile Gln Glu His Leu
1 5 10 15
Asn Ala Pro Lys Asn Gln Tyr Asn Ser Phe Gly Lys Tyr Lys Tyr Arg
20 25 30
Ser Cys Glu Asp Ile Leu Glu Gly Val Lys Pro Leu Leu Lys Gly Leu
35 40 45
Phe Leu Ser Ile Ser Asp Glu Ile Val Leu Ile Gly Asp Arg Tyr Tyr
50 55 60
Val Lys Ala Thr Ala Thr Ile Thr Asp Gly Glu Asn Ser His Ser Ala
65 70 75 80
Ser Ala Ile Ala Arg Glu Glu Glu Asn Lys Lys Gly Met Asp Ala Ala
85 90 95
Gln Val Thr Gly Ala Thr Ser Ser Tyr Ala Arg Lys Tyr Cys Leu Asn
100 105 110
Gly Leu Phe Gly Ile Asp Asp Ala Lys Asp Ala Asp Thr Glu Glu His
115 120 125
Lys Gln Gln Gln Asn Ala Ala Pro Ala Lys Gln Thr Lys Ser Ser Pro
130 135 140
Ser Ser Pro Ala Pro Glu Gln Val Leu Lys Ala Phe Ser Glu Tyr Ala
145 150 155 160
Ala Thr Glu Thr Asp Lys Lys Lys Leu Ile Glu Arg Tyr Gln His Asp
165 170 175
Trp Gln Leu Leu Thr Gly His Asp Asp Glu Gln Thr Lys Cys Val Gln
180 185 190
Val Met Asn Ile Arg Ile Asn Glu Leu Lys Gln Val Ala
195 200 205
<210> 5
<211> 471
<212> PRT
<213> Saccharomyces cerevisiae S288C
<400> 5
Met Asn Glu Ile Met Asp Met Asp Glu Lys Lys Pro Val Phe Gly Asn
1 5 10 15
His Ser Glu Asp Ile Gln Thr Lys Leu Asp Lys Lys Leu Gly Pro Glu
20 25 30
Tyr Ile Ser Lys Arg Val Gly Phe Gly Thr Ser Arg Ile Ala Tyr Ile
35 40 45
Glu Gly Trp Arg Val Ile Asn Leu Ala Asn Gln Ile Phe Gly Tyr Asn
50 55 60
Gly Trp Ser Thr Glu Val Lys Ser Val Val Ile Asp Phe Leu Asp Glu
65 70 75 80
Arg Gln Gly Lys Phe Ser Ile Gly Cys Thr Ala Ile Val Arg Val Thr
85 90 95
Leu Thr Ser Gly Thr Tyr Arg Glu Asp Ile Gly Tyr Gly Thr Val Glu
100 105 110
Asn Glu Arg Arg Lys Pro Ala Ala Phe Glu Arg Ala Lys Lys Ser Ala
115 120 125
Val Thr Asp Ala Leu Lys Arg Ser Leu Arg Gly Phe Gly Asn Ala Leu
130 135 140
Gly Asn Cys Leu Tyr Asp Lys Asp Phe Leu Ala Lys Ile Asp Lys Val
145 150 155 160
Lys Phe Asp Pro Pro Asp Phe Asp Glu Asn Asn Leu Phe Arg Pro Thr
165 170 175
Asp Glu Ile Ser Glu Ser Ser Arg Thr Asn Thr Leu His Glu Asn Gln
180 185 190
Glu Gln Gln Gln Tyr Pro Asn Lys Arg Arg Gln Leu Thr Lys Val Thr
195 200 205
Asn Thr Asn Pro Asp Ser Thr Lys Asn Leu Val Lys Ile Glu Asn Thr
210 215 220
Val Ser Arg Gly Thr Pro Met Met Ala Ala Pro Ala Glu Ala Asn Ser
225 230 235 240
Lys Asn Ser Ser Asn Lys Asp Thr Asp Leu Lys Ser Leu Asp Ala Ser
245 250 255
Lys Gln Asp Gln Asp Asp Leu Leu Asp Asp Ser Leu Met Phe Ser Asp
260 265 270
Asp Phe Gln Asp Asp Asp Leu Ile Asn Met Gly Asn Thr Asn Ser Asn
275 280 285
Val Leu Thr Thr Glu Lys Asp Pro Val Val Ala Lys Gln Ser Pro Thr
290 295 300
Ala Ser Ser Asn Pro Glu Ala Glu Gln Ile Thr Phe Val Thr Ala Lys
305 310 315 320
Ala Ala Thr Ser Val Gln Asn Glu Arg Tyr Ile Gly Glu Glu Ser Ile
325 330 335
Phe Asp Pro Lys Tyr Gln Ala Gln Ser Ile Arg His Thr Val Asp Gln
340 345 350
Thr Thr Ser Lys His Ile Pro Ala Ser Val Leu Lys Asp Lys Thr Met
355 360 365
Thr Thr Ala Arg Asp Ser Val Tyr Glu Lys Phe Ala Pro Lys Gly Lys
370 375 380
Gln Leu Ser Met Lys Asn Asn Asp Lys Glu Leu Gly Pro His Met Leu
385 390 395 400
Glu Gly Ala Gly Asn Gln Val Pro Arg Glu Thr Thr Pro Ile Lys Thr
405 410 415
Asn Ala Thr Ala Phe Pro Pro Ala Ala Ala Pro Arg Phe Ala Pro Pro
420 425 430
Ser Lys Val Val His Pro Asn Gly Asn Gly Ala Val Pro Ala Val Pro
435 440 445
Gln Gln Arg Ser Thr Arg Arg Glu Val Gly Arg Pro Lys Ile Asn Pro
450 455 460
Leu His Ala Arg Lys Pro Thr
465 470
<210> 6
<211> 469
<212> PRT
<213> Schizosaccharomyces pombe
<400> 6
Met Ser Phe Glu Gln Lys Gln His Val Ala Ser Glu Asp Gln Gly His
1 5 10 15
Phe Asn Thr Ala Tyr Ser His Glu Glu Phe Asn Phe Leu Gln Ser Ser
20 25 30
Leu Thr Arg Lys Leu Gly Pro Glu Tyr Val Ser Arg Arg Ser Gly Pro
35 40 45
Gly Gly Phe Ser Val Ser Tyr Ile Glu Ser Trp Lys Ala Ile Glu Leu
50 55 60
Ala Asn Glu Ile Phe Gly Phe Asn Gly Trp Ser Ser Ser Ile Arg Ser
65 70 75 80
Ile Asn Val Asp Phe Met Asp Glu Asn Lys Glu Asn Gly Arg Ile Ser
85 90 95
Leu Gly Leu Ser Val Ile Val Arg Val Thr Ile Lys Asp Gly Ala Tyr
100 105 110
His Glu Asp Ile Gly Tyr Gly Ser Ile Asp Asn Cys Arg Gly Lys Ala
115 120 125
Ser Ala Phe Glu Lys Cys Lys Lys Glu Gly Thr Thr Asp Ala Leu Lys
130 135 140
Arg Ala Leu Arg Asn Phe Gly Asn Ser Leu Gly Asn Cys Met Tyr Asp
145 150 155 160
Lys Tyr Tyr Leu Arg Glu Val Gly Lys Met Lys Pro Pro Thr Tyr His
165 170 175
Phe Asp Ser Gly Asp Leu Phe Arg Lys Thr Asp Pro Ala Ala Arg Glu
180 185 190
Ser Phe Ile Lys Lys Gln Lys Thr Leu Asn Ser Thr Arg Thr Val Asn
195 200 205
Asn Gln Pro Leu Val Asn Lys Gly Glu Gln Leu Ala Pro Arg Arg Ala
210 215 220
Ala Glu Leu Asn Asp Glu Gln Thr Arg Glu Ile Glu Met Tyr Ala Asp
225 230 235 240
Glu Glu Leu Asp Asn Ile Phe Val Glu Asp Asp Ile Ile Ala His Leu
245 250 255
Ala Val Ala Glu Asp Thr Ala His Pro Ala Ala Asn Asn His His Ser
260 265 270
Glu Lys Ala Gly Thr Gln Ile Asn Asn Lys Asp Lys Gly Ser His Asn
275 280 285
Ser Ala Lys Pro Val Gln Arg Ser His Thr Tyr Pro Val Ala Val Pro
290 295 300
Gln Asn Thr Ser Asp Ser Val Gly Asn Ala Val Thr Asp Thr Ser Pro
305 310 315 320
Lys Thr Leu Phe Asp Pro Leu Lys Pro Asn Thr Gly Thr Pro Ser Pro
325 330 335
Lys Phe Ile Ser Ala Arg Ala Ala Ala Ala Ala Glu Gly Val Val Ser
340 345 350
Ala Pro Phe Thr Asn Asn Phe Asn Pro Arg Leu Asp Ser Pro Ser Ile
355 360 365
Arg Lys Thr Ser Ile Ile Asp His Ser Lys Ser Leu Pro Val Gln Arg
370 375 380
Ala Ser Val Leu Pro Ile Ile Lys Gln Ser Ser Gln Thr Ser Pro Val
385 390 395 400
Ser Asn Asn Ser Met Ile Arg Asp Ser Glu Ser Ile Ile Asn Glu Arg
405 410 415
Lys Glu Asn Ile Gly Leu Ile Gly Val Lys Arg Ser Leu His Asp Ser
420 425 430
Thr Thr Ser His Asn Lys Ser Asp Leu Met Arg Thr Asn Ser Asp Pro
435 440 445
Gln Ser Ala Met Arg Ser Arg Glu Asn Tyr Asp Ala Thr Val Asp Lys
450 455 460
Lys Ala Lys Lys Gly
465
<210> 7
<211> 436
<212> PRT
<213> Kluyveromyces lactis
<400> 7
Met Glu Asp Thr Gly Ser Gly Lys Asn Gly Lys Asp Asp Ile Gln Thr
1 5 10 15
Lys Leu Asp Lys Lys Leu Gly Pro Glu Tyr Ile Ser Lys Arg Val Gly
20 25 30
Phe Gly Ser Ser Arg Val Ala Tyr Ile Glu Gly Trp Lys Ala Ile Asn
35 40 45
Leu Ala Asn Gln Ile Phe Gly Tyr Asp Gly Trp Ser Thr Glu Val Lys
50 55 60
Asn Val Thr Ile Asp Phe Leu Asp Glu Arg Gln Gly Arg Phe Ser Ile
65 70 75 80
Gly Cys Thr Ala Ile Val Arg Val Ser Leu Ala Asp Gly Thr Phe Arg
85 90 95
Glu Asp Ile Gly Tyr Gly Thr Val Glu Asn Glu Arg Arg Lys Ala Ser
100 105 110
Ala Phe Glu Arg Ala Lys Lys Ser Ala Val Thr Asp Ala Leu Lys Arg
115 120 125
Ser Leu Arg Gly Phe Gly Asn Ala Leu Gly Asn Cys Leu Tyr Asp Lys
130 135 140
Asp Phe Leu Ala Lys Ile Asp Lys Val Lys Phe Asp Pro Pro Asp Phe
145 150 155 160
Asp Glu Gly Asn Leu Phe Arg Pro Ala Asp Glu Leu Ser Glu Met Ser
165 170 175
Arg Ser Asn Met Val Gly Asp Ala His Thr Glu Gly Pro Ser Leu Lys
180 185 190
Lys Arg Ser Leu Thr Asn Glu Asp Arg Asn Ala Val Pro Ser Ala Pro
195 200 205
Ala Gln Gln Thr Tyr Arg Ser Asn Asn His Thr Thr Gln Lys Arg Ala
210 215 220
Pro Lys Ala Gln Ala Val Thr Ala Ser Ala Ser Pro Asn Glu Glu Thr
225 230 235 240
Ser Asn Gln Gln Gln Asp Pro Asp Asp Leu Leu Asp Asp Ser Phe Met
245 250 255
Phe Ser Asp Glu Ile Gln Asp Asp Asp Leu Leu Asn Met Asn Thr Thr
260 265 270
Thr Asn Asn Lys Asn Ser Thr Asn Ser Ser Thr Thr Thr Thr Thr Ile
275 280 285
Ser Asp Glu Ala Thr Gly Ile Ile Ser Pro Val Thr Phe Val Thr Ala
290 295 300
Lys Ala Ala Thr Ser Leu Gln His Lys Asp Pro Ile Pro Ser Gly Ser
305 310 315 320
Met Phe Asp Pro Lys Phe Gln Ala Gln Ser Ile Arg His Thr Val Asp
325 330 335
Gln Ser Val Ser Thr Pro Val Arg Ala Thr Ile Leu Lys Glu Lys Gly
340 345 350
Leu Asp Ser Asp Arg Ser Ser Ile Tyr Ser Lys Phe Ala Pro Lys Gly
355 360 365
Lys Glu Leu Ser Gly Thr Thr Thr Asn Ser Glu Pro Tyr Val Ala Ala
370 375 380
Pro Gln Thr Ser Ala Thr Glu Ser Asn Arg Ser Thr Pro Thr Arg Ser
385 390 395 400
Asn Ala Gln Leu Ala Gly Pro Gln Pro Ala Pro Gln Leu Gln Gly Pro
405 410 415
Gln Arg Thr Gln Leu Gly Arg Pro Arg Met Leu Gln Gln Pro Asn Arg
420 425 430
Arg Asn Val Ser
435
<210> 8
<211> 226
<212> PRT
<213> Unknown
<220>
<223> Bacteria (eubacteria)
<400> 8
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 9
<211> 866
<212> PRT
<213> Unknown
<220>
<223> Rac bacterial prophage RecE exonuclease
<400> 9
Met Ser Thr Lys Pro Leu Phe Leu Leu Arg Lys Ala Lys Lys Ser Ser
1 5 10 15
Gly Glu Pro Asp Val Val Leu Trp Ala Ser Asn Asp Phe Glu Ser Thr
20 25 30
Cys Ala Thr Leu Asp Tyr Leu Ile Val Lys Ser Gly Lys Lys Leu Ser
35 40 45
Ser Tyr Phe Lys Ala Val Ala Thr Asn Phe Pro Val Val Asn Asp Leu
50 55 60
Pro Ala Glu Gly Glu Ile Asp Phe Thr Trp Ser Glu Arg Tyr Gln Leu
65 70 75 80
Ser Lys Asp Ser Met Thr Trp Glu Leu Lys Pro Gly Ala Ala Pro Asp
85 90 95
Asn Ala His Tyr Gln Gly Asn Thr Asn Val Asn Gly Glu Asp Met Thr
100 105 110
Glu Ile Glu Glu Asn Met Leu Leu Pro Ile Ser Gly Gln Glu Leu Pro
115 120 125
Ile Arg Trp Leu Ala Gln His Gly Ser Glu Lys Pro Val Thr His Val
130 135 140
Ser Arg Asp Gly Leu Gln Ala Leu His Ile Ala Arg Ala Glu Glu Leu
145 150 155 160
Pro Ala Val Thr Ala Leu Ala Val Ser His Lys Thr Ser Leu Leu Asp
165 170 175
Pro Leu Glu Ile Arg Glu Leu His Lys Leu Val Arg Asp Thr Asp Lys
180 185 190
Val Phe Pro Asn Pro Gly Asn Ser Asn Leu Gly Leu Ile Thr Ala Phe
195 200 205
Phe Glu Ala Tyr Leu Asn Ala Asp Tyr Thr Asp Arg Gly Leu Leu Thr
210 215 220
Lys Glu Trp Met Lys Gly Asn Arg Val Ser His Ile Thr Arg Thr Ala
225 230 235 240
Ser Gly Ala Asn Ala Gly Gly Gly Asn Leu Thr Asp Arg Gly Glu Gly
245 250 255
Phe Val His Asp Leu Thr Ser Leu Ala Arg Asp Val Ala Thr Gly Val
260 265 270
Leu Ala Arg Ser Met Asp Leu Asp Ile Tyr Asn Leu His Pro Ala His
275 280 285
Ala Lys Arg Ile Glu Glu Ile Ile Ala Glu Asn Lys Pro Pro Phe Ser
290 295 300
Val Phe Arg Asp Lys Phe Ile Thr Met Pro Gly Gly Leu Asp Tyr Ser
305 310 315 320
Arg Ala Ile Val Val Ala Ser Val Lys Glu Ala Pro Ile Gly Ile Glu
325 330 335
Val Ile Pro Ala His Val Thr Glu Tyr Leu Asn Lys Val Leu Thr Glu
340 345 350
Thr Asp His Ala Asn Pro Asp Pro Glu Ile Val Asp Ile Ala Cys Gly
355 360 365
Arg Ser Ser Ala Pro Met Pro Gln Arg Val Thr Glu Glu Gly Lys Gln
370 375 380
Asp Asp Glu Glu Lys Pro Gln Pro Ser Gly Thr Thr Ala Val Glu Gln
385 390 395 400
Gly Glu Ala Glu Thr Met Glu Pro Asp Ala Thr Glu His His Gln Asp
405 410 415
Thr Gln Pro Leu Asp Ala Gln Ser Gln Val Asn Ser Val Asp Ala Lys
420 425 430
Tyr Gln Glu Leu Arg Ala Glu Leu His Glu Ala Arg Lys Asn Ile Pro
435 440 445
Ser Lys Asn Pro Val Asp Asp Asp Lys Leu Leu Ala Ala Ser Arg Gly
450 455 460
Glu Phe Val Asp Gly Ile Ser Asp Pro Asn Asp Pro Lys Trp Val Lys
465 470 475 480
Gly Ile Gln Thr Arg Asp Cys Val Tyr Gln Asn Gln Pro Glu Thr Glu
485 490 495
Lys Thr Ser Pro Asp Met Asn Gln Pro Glu Pro Val Val Gln Gln Glu
500 505 510
Pro Glu Ile Ala Cys Asn Ala Cys Gly Gln Thr Gly Gly Asp Asn Cys
515 520 525
Pro Asp Cys Gly Ala Val Met Gly Asp Ala Thr Tyr Gln Glu Thr Phe
530 535 540
Asp Glu Glu Ser Gln Val Glu Ala Lys Glu Asn Asp Pro Glu Glu Met
545 550 555 560
Glu Gly Ala Glu His Pro His Asn Glu Asn Ala Gly Ser Asp Pro His
565 570 575
Arg Asp Cys Ser Asp Glu Thr Gly Glu Val Ala Asp Pro Val Ile Val
580 585 590
Glu Asp Ile Glu Pro Gly Ile Tyr Tyr Gly Ile Ser Asn Glu Asn Tyr
595 600 605
His Ala Gly Pro Gly Ile Ser Lys Ser Gln Leu Asp Asp Ile Ala Asp
610 615 620
Thr Pro Ala Leu Tyr Leu Trp Arg Lys Asn Ala Pro Val Asp Thr Thr
625 630 635 640
Lys Thr Lys Thr Leu Asp Leu Gly Thr Ala Phe His Cys Arg Val Leu
645 650 655
Glu Pro Glu Glu Phe Ser Asn Arg Phe Ile Val Ala Pro Glu Phe Asn
660 665 670
Arg Arg Thr Asn Ala Gly Lys Glu Glu Glu Lys Ala Phe Leu Met Glu
675 680 685
Cys Ala Ser Thr Gly Lys Thr Val Ile Thr Ala Glu Glu Gly Arg Lys
690 695 700
Ile Glu Leu Met Tyr Gln Ser Val Met Ala Leu Pro Leu Gly Gln Trp
705 710 715 720
Leu Val Glu Ser Ala Gly His Ala Glu Ser Ser Ile Tyr Trp Glu Asp
725 730 735
Pro Glu Thr Gly Ile Leu Cys Arg Cys Arg Pro Asp Lys Ile Ile Pro
740 745 750
Glu Phe His Trp Ile Met Asp Val Lys Thr Thr Ala Asp Ile Gln Arg
755 760 765
Phe Lys Thr Ala Tyr Tyr Asp Tyr Arg Tyr His Val Gln Asp Ala Phe
770 775 780
Tyr Ser Asp Gly Tyr Glu Ala Gln Phe Gly Val Gln Pro Thr Phe Val
785 790 795 800
Phe Leu Val Ala Ser Thr Thr Ile Glu Cys Gly Arg Tyr Pro Val Glu
805 810 815
Ile Phe Met Met Gly Glu Glu Ala Lys Leu Ala Gly Gln Gln Glu Tyr
820 825 830
His Arg Asn Leu Arg Thr Leu Ser Asp Cys Leu Asn Thr Asp Glu Trp
835 840 845
Pro Ala Ile Lys Thr Leu Ser Leu Pro Arg Trp Ala Lys Glu Tyr Ala
850 855 860
Asn Asp
865
<210> 10
<211> 23
<212> PRT
<213> Unknown
<220>
<223> Maize opaque-2 nuclear localization signal
<400> 10
Arg Lys Arg Lys Glu Ser Asn Arg Glu Ser Ala Arg Arg Ser Arg Arg
1 5 10 15
Ser Arg Tyr Arg Lys Lys Val
20
<210> 11
<211> 7
<212> PRT
<213> Unknown
<220>
<223> SV40 large T antigen NLS
<400> 11
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 12
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Class II monopartite NLS consensus
<220>
<221> VARIANT
<222> 2, 4
<223> Xaa = Lys or Arg
<220>
<221> VARIANT
<222> 3
<223> Xaa = Any Amino Acid
<400> 12
Lys Xaa Xaa Xaa
1
<210> 13
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Bipartite NLS consensus
<220>
<221> VARIANT
<222> 1, 2
<223> Xaa = Lys or Arg
<220>
<221> VARIANT
<222> 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14
<223> Xaa = Any Amino Acid, and up to two
can be present or absent
<220>
<221> VARIANT
<222> 15, 16, 17, 18, 19
<223> Xaa = Any Amino Acid, and at least three
are either Lys or Arg
<400> 13
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa
<210> 14
<211> 6
<212> PRT
<213> Unknown
<220>
<223> Class 5 Plant NLS
<220>
<221> VARIANT
<222> 5
<223> Xaa = Lys or Arg
<220>
<221> VARIANT
<222> 6
<223> Xaa = Trp, Phe, or Tyr
<400> 14
Leu Gly Lys Arg Xaa Xaa
1 5
<210> 15
<211> 15
<212> PRT
<213> Unknown
<220>
<223> tobacco c2 NLS
<400> 15
Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
<210> 16
<211> 14
<212> PRT
<213> Unknown
<220>
<223> Extended SV40 Nuclear Localization Domain
<400> 16
Ala Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser
1 5 10
<210> 17
<211> 11
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 17
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 18
<211> 12
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 18
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 19
<211> 27
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 19
Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu
1 5 10 15
Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu
20 25
<210> 20
<211> 33
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 20
Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala
1 5 10 15
Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu
20 25 30
Ala
<210> 21
<211> 16
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 21
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 22
<211> 11
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 22
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 23
<211> 8
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 23
Arg Lys Lys Arg Arg Gln Arg Arg
1 5
<210> 24
<211> 11
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 24
Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala
1 5 10
<210> 25
<211> 11
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 25
Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg
1 5 10
<210> 26
<211> 11
<212> PRT
<213> Unknown
<220>
<223> cell-penetrating peptide (CPP)
<400> 26
Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg
1 5 10
<210> 27
<211> 1307
<212> PRT
<213> Unknown
<220>
<223> Acidaminococcus sp.
<400> 27
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn
1010 1015 1020
Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035 1040
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly
1045 1050 1055
Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1060 1065 1070
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile
1075 1080 1085
Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1090 1095 1100
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met Asn
1105 1110 1115 1120
Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro Ala Trp
1125 1130 1135
Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala Lys Gly Thr
1140 1145 1150
Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile Glu Asn His Arg
1155 1160 1165
Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala
1170 1175 1180
Leu Leu Glu Glu Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu
1185 1190 1195 1200
Pro Lys Leu Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val
1205 1210 1215
Ala Leu Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr
1220 1225 1230
Gly Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala
1250 1255 1260
Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275 1280
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln
1285 1290 1295
Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1300 1305
<210> 28
<211> 1228
<212> PRT
<213> Unknown
<220>
<223> Lachnospiraceae bacterium
<400> 28
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser
1010 1015 1020
Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu
1025 1030 1035 1040
Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp
1045 1050 1055
Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg Ile
1060 1065 1070
Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp Glu Glu
1075 1080 1085
Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys Tyr Gly Ile
1090 1095 1100
Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys Glu Gln Ser Asp
1105 1110 1115 1120
Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met Ser Leu Met Leu Gln
1125 1130 1135
Met Arg Asn Ser Ile Thr Gly Arg Thr Asp Val Asp Phe Leu Ile Ser
1140 1145 1150
Pro Val Lys Asn Ser Asp Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu
1155 1160 1165
Ala Gln Glu Asn Ala Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala
1170 1175 1180
Tyr Asn Ile Ala Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys
1185 1190 1195 1200
Ala Glu Asp Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys
1205 1210 1215
Glu Trp Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 29
<211> 1300
<212> PRT
<213> Francisella novicida
<400> 29
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr
1010 1015 1020
Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val Phe
1025 1030 1035 1040
Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala Tyr Gln
1045 1050 1055
Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys Gln Thr Gly
1060 1065 1070
Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys Ile Cys Pro Val
1075 1080 1085
Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr Glu Ser Val Ser Lys
1090 1095 1100
Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys Ile Cys Tyr Asn Leu Asp
1105 1110 1115 1120
Lys Gly Tyr Phe Glu Phe Ser Phe Asp Tyr Lys Asn Phe Gly Asp Lys
1125 1130 1135
Ala Ala Lys Gly Lys Trp Thr Ile Ala Ser Phe Gly Ser Arg Leu Ile
1140 1145 1150
Asn Phe Arg Asn Ser Asp Lys Asn His Asn Trp Asp Thr Arg Glu Val
1155 1160 1165
Tyr Pro Thr Lys Glu Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu
1170 1175 1180
Tyr Gly His Gly Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp
1185 1190 1195 1200
Lys Lys Phe Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln
1205 1210 1215
Met Arg Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro
1220 1225 1230
Val Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu
1250 1255 1260
Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly Lys
1265 1270 1275 1280
Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe Val Gln
1285 1290 1295
Asn Arg Asn Asn
1300
<210> 30
<211> 1320
<212> PRT
<213> Unknown
<220>
<223> CasJ (wild type)
<400> 30
Met Gln Gln Tyr Gln Val Ser Lys Thr Val Arg Phe Gly Leu Thr Leu
1 5 10 15
Lys Asn Ser Glu Lys Lys His Ala Thr His Leu Leu Leu Lys Asp Leu
20 25 30
Val Asn Val Ser Glu Glu Arg Ile Lys Asn Glu Ile Thr Lys Asp Asp
35 40 45
Lys Asn Gln Ser Glu Leu Ser Phe Phe Asn Glu Val Ile Glu Thr Leu
50 55 60
Asp Leu Met Asp Lys Tyr Ile Lys Asp Trp Glu Asn Cys Phe Tyr Arg
65 70 75 80
Thr Asp Gln Ile Gln Leu Thr Lys Glu Tyr Tyr Lys Val Ile Ala Lys
85 90 95
Lys Ala Cys Phe Asp Trp Phe Trp Thr Asn Asp Arg Gly Met Lys Phe
100 105 110
Pro Thr Ser Ser Ile Ile Ser Phe Asn Ser Leu Lys Ser Ser Asp Lys
115 120 125
Ser Lys Thr Ser Asp Asn Leu Asp Arg Lys Lys Lys Ile Leu Asp Tyr
130 135 140
Trp Lys Gly Asn Ile Phe Lys Thr Gln Lys Ala Ile Lys Asp Val Leu
145 150 155 160
Asp Ile Thr Glu Asp Ile Gln Lys Ala Ile Glu Glu Lys Lys Ser His
165 170 175
Arg Glu Ile Asn Arg Val Asn His Arg Lys Met Gly Ile His Leu Ile
180 185 190
His Leu Ile Asn Asp Thr Leu Val Pro Leu Cys Asn Gly Ser Ile Phe
195 200 205
Phe Gly Asn Ile Ser Lys Leu Asp Phe Cys Glu Ser Glu Asn Glu Lys
210 215 220
Leu Ile Asp Phe Ala Ser Thr Glu Lys Gln Asp Glu Arg Lys Phe Leu
225 230 235 240
Leu Ser Lys Ile Asn Glu Ile Lys Gln Tyr Phe Glu Asp Asn Gly Gly
245 250 255
Asn Val Pro Phe Ala Arg Ala Thr Leu Asn Arg His Thr Ala Asn Gln
260 265 270
Lys Pro Asp Arg Tyr Asn Glu Glu Ile Lys Lys Leu Val Asn Glu Leu
275 280 285
Gly Val Asn Ser Leu Val Arg Ser Leu Lys Ser Lys Thr Ile Glu Glu
290 295 300
Ile Lys Thr His Phe Glu Phe Glu Asn Lys Asn Lys Ile Asn Glu Leu
305 310 315 320
Lys Asn Ser Phe Val Leu Ser Ile Val Glu Lys Ile Gln Leu Phe Lys
325 330 335
Tyr Lys Thr Ile Pro Ala Ser Val Arg Phe Leu Leu Ala Asp Tyr Phe
340 345 350
Glu Glu Gln Lys Leu Ser Thr Lys Glu Glu Ala Leu Thr Ile Phe Glu
355 360 365
Glu Ile Gly Lys Pro Gln Asn Ile Gly Phe Asp Tyr Ile Gln Leu Lys
370 375 380
Glu Lys Asp Asn Phe Thr Leu Lys Lys Tyr Pro Leu Lys Gln Ala Phe
385 390 395 400
Asp Tyr Ala Trp Glu Asn Leu Ala Arg Leu Asp Gln Asn Pro Lys Ala
405 410 415
Asn Gln Phe Ser Val Asp Glu Cys Lys Arg Phe Phe Lys Glu Val Phe
420 425 430
Ser Met Glu Met Asp Asn Ile Asn Phe Lys Thr Tyr Ala Leu Leu Leu
435 440 445
Ala Leu Lys Glu Lys Thr Thr Ala Phe Asp Lys Lys Gly Glu Gly Ala
450 455 460
Ala Lys Asn Lys Ser Glu Ile Ile Glu Gln Ile Lys Gly Val Phe Glu
465 470 475 480
Glu Leu Asp Gln Pro Phe Lys Ile Ile Ala Asn Thr Leu Arg Glu Glu
485 490 495
Val Ile Lys Lys Glu Asp Glu Leu Asn Val Leu Lys Arg Gln Tyr Arg
500 505 510
Glu Thr Asp Arg Lys Ile Lys Thr Leu Gln Asn Glu Ile Lys Lys Ile
515 520 525
Lys Asn Gln Ile Lys Asn Leu Glu Asn Ser Lys Lys Tyr Ser Phe Pro
530 535 540
Glu Ile Ile Lys Trp Ile Asp Leu Thr Glu Gln Glu Gln Leu Leu Asp
545 550 555 560
Lys Asn Lys Gln Ala Lys Ser Asn Tyr Gln Lys Ala Lys Gly Asp Leu
565 570 575
Gly Leu Ile Arg Gly Ser Gln Lys Thr Ser Ile Asn Asp Tyr Phe Tyr
580 585 590
Leu Thr Asp Lys Val Tyr Arg Lys Leu Ala Gln Asp Phe Gly Lys Lys
595 600 605
Met Ala Asp Leu Arg Glu Lys Leu Leu Asp Lys Asn Asp Val Asn Lys
610 615 620
Ile Lys Tyr Leu Ser Tyr Ile Val Lys Asp Asn Gln Gly Tyr Gln Tyr
625 630 635 640
Thr Leu Leu Lys Pro Leu Glu Asp Lys Asn Ala Glu Ile Ile Glu Leu
645 650 655
Lys Ser Glu Pro Asn Gly Asp Leu Lys Leu Phe Glu Ile Lys Ser Leu
660 665 670
Thr Ser Lys Thr Leu Asn Lys Phe Ile Lys Asn Lys Gly Ala Tyr Lys
675 680 685
Glu Phe His Ser Ala Glu Phe Glu His Lys Lys Ile Lys Glu Asp Trp
690 695 700
Lys Asn Tyr Lys Tyr Asn Ser Asp Phe Ile Val Lys Leu Lys Lys Cys
705 710 715 720
Leu Ser His Ser Asp Met Ala Asn Thr Gln Asn Trp Lys Ala Phe Gly
725 730 735
Trp Asp Leu Asp Lys Cys Lys Ser Tyr Glu Thr Ile Glu Lys Glu Ile
740 745 750
Asp Gln Lys Ser Tyr Gln Leu Val Glu Ile Lys Leu Ser Lys Thr Thr
755 760 765
Ile Glu Lys Trp Val Lys Glu Asn Asn Tyr Leu Leu Leu Pro Ile Val
770 775 780
Asn Gln Asp Ile Thr Ala Glu Lys Leu Lys Val Asn Thr Asn Gln Phe
785 790 795 800
Thr Lys Asp Trp Gln His Ile Phe Glu Lys Asn Pro Asn His Arg Leu
805 810 815
His Pro Glu Phe Asn Ile Ala Tyr Arg Gln Pro Thr Lys Asp Tyr Ala
820 825 830
Lys Glu Gly Glu Lys Arg Tyr Ser Arg Phe Gln Leu Thr Gly Gln Phe
835 840 845
Met Tyr Glu Tyr Ile Pro Gln Asp Ala Asn Tyr Ile Ser Arg Lys Glu
850 855 860
Gln Ile Thr Leu Phe Asn Asp Lys Glu Glu Gln Lys Ile Gln Val Glu
865 870 875 880
Thr Phe Asn Asn Gln Ile Ala Lys Ile Leu Asn Ala Glu Asp Phe Tyr
885 890 895
Val Ile Gly Ile Asp Arg Gly Ile Thr Gln Leu Ala Thr Leu Cys Val
900 905 910
Leu Asn Lys Asn Gly Val Ile Gln Gly Gly Phe Glu Ile Phe Thr Arg
915 920 925
Glu Phe Asp Tyr Thr Asn Lys Gln Trp Lys His Thr Lys Leu Lys Glu
930 935 940
Asn Arg Asn Ile Leu Asp Ile Ser Asn Leu Lys Val Glu Thr Thr Val
945 950 955 960
Asn Gly Glu Lys Val Leu Val Asp Leu Ser Glu Val Lys Thr Tyr Leu
965 970 975
Arg Asp Glu Asn Gly Glu Pro Met Lys Asn Glu Lys Gly Val Ile Leu
980 985 990
Thr Lys Asp Asn Leu Gln Lys Ile Lys Leu Lys Gln Leu Ala Tyr Asp
995 1000 1005
Arg Lys Leu Gln Tyr Lys Met Gln His Glu Pro Glu Leu Val Leu Ser
1010 1015 1020
Phe Leu Asp Arg Leu Glu Asn Lys Glu Gln Ile Pro Asn Leu Leu Ala
1025 1030 1035 1040
Ser Thr Lys Leu Ile Ser Ala Tyr Lys Glu Gly Thr Ala Tyr Ala Asp
1045 1050 1055
Ile Asp Ile Glu Gln Phe Trp Asn Ile Leu Gln Thr Phe Gln Thr Ile
1060 1065 1070
Val Asp Lys Phe Gly Gly Ile Glu Asn Ala Lys Lys Thr Met Glu Phe
1075 1080 1085
Arg Gln Tyr Thr Glu Leu Asp Ala Ser Phe Asp Leu Lys Asn Gly Val
1090 1095 1100
Val Ala Asn Met Val Gly Val Val Lys Phe Ile Met Glu Lys Tyr Asn
1105 1110 1115 1120
Tyr Lys Thr Phe Ile Ala Leu Glu Asp Leu Thr Phe Ala Phe Gly Gln
1125 1130 1135
Ser Ile Asp Gly Ile Asn Gly Glu Arg Leu Arg Ser Thr Lys Glu Asp
1140 1145 1150
Lys Glu Val Asp Phe Lys Glu Gln Glu Asn Ser Thr Leu Ala Gly Leu
1155 1160 1165
Gly Thr Tyr His Phe Phe Glu Met Gln Leu Leu Lys Lys Leu Ser Lys
1170 1175 1180
Thr Gln Ile Gly Asn Glu Ile Lys His Phe Val Pro Ala Phe Arg Ser
1185 1190 1195 1200
Thr Glu Asn Tyr Glu Lys Ile Val Arg Lys Asp Lys Asn Val Lys Ala
1205 1210 1215
Lys Ile Val Ser Tyr Pro Phe Gly Ile Val Ser Phe Val Asn Pro Arg
1220 1225 1230
Asn Thr Ser Ile Ser Cys Pro Asn Cys Lys Asn Ala Asn Lys Ser Asn
1235 1240 1245
Arg Ile Lys Lys Glu Asn Asp Arg Ile Leu Cys Lys His Asn Ile Glu
1250 1255 1260
Lys Thr Lys Gly Asn Cys Gly Phe Asp Thr Ala Asn Phe Asp Glu Asn
1265 1270 1275 1280
Lys Leu Arg Ala Glu Asn Lys Gly Lys Asn Phe Lys Tyr Ile Ser Ser
1285 1290 1295
Gly Asp Ala Asn Ala Ala Tyr Asn Ile Ala Val Lys Leu Leu Glu Asp
1300 1305 1310
Lys Ile Phe Glu Ile Asn Lys Lys
1315 1320
<210> 31
<211> 178
<212> PRT
<213> Escherichia coli
<400> 31
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 32
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> ERF protein motif
<220>
<221> VARIANT
<222> 2
<223> Xaa = Gly, Ser, or Ala
<220>
<221> VARIANT
<222> 3, 4
<223> Xaa = Any Amino Acid
<220>
<221> VARIANT
<222> 5
<223> Xaa = Ser or Thr
<220>
<221> VARIANT
<222> 7
<223> Xaa = Ala, Val, Leu, Ile, Met, or Phe
<220>
<221> VARIANT
<222> 8
<223> Xaa = Lys, Arg, Glu, Asp, Asn, Thr, or Ser
<220>
<221> VARIANT
<222> 9
<223> Xaa = Lys or Arg
<220>
<221> VARIANT
<222> 11
<223> Xaa = Any Amino Acid
<220>
<221> VARIANT
<222> 12
<223> Xaa = Ala, Val, Leu, Ile, Met, or Phe
<220>
<221> VARIANT
<222> 13, 14
<223> Xaa = Any Amino Acid
<220>
<221> VARIANT
<222> 15, 16
<223> Xaa = Ala, Val, Leu, Ile, Met, or Phe
<400> 32
Gly Xaa Xaa Xaa Xaa Tyr Xaa Xaa Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
<210> 33
<211> 20
<212> PRT
<213> Unknown
<220>
<223> FMDV 2A self-processing peptide sequence
<400> 33
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 34
<211> 178
<212> PRT
<213> Escherichia coli APEC Ol
<400> 34
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 35
<211> 178
<212> PRT
<213> Escherichia coli UTI89
<400> 35
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 36
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Proteobacteria
<400> 36
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 37
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Escherichia
<400> 37
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Val Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 38
<211> 178
<212> PRT
<213> Shigella flexneri
<400> 38
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Lys Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 39
<211> 178
<212> PRT
<213> Escherichia coli
<400> 39
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 40
<211> 178
<212> PRT
<213> Escherichia coli
<400> 40
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Leu
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 41
<211> 178
<212> PRT
<213> Escherichia coli
<400> 41
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Ala Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 42
<211> 178
<212> PRT
<213> Escherichia coli
<400> 42
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Ala Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 43
<211> 178
<212> PRT
<213> Escherichia coli
<400> 43
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
His Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 44
<211> 178
<212> PRT
<213> Escherichia coli
<400> 44
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Ser Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 45
<211> 178
<212> PRT
<213> Escherichia coli
<400> 45
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Ser Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 46
<211> 178
<212> PRT
<213> Escherichia coli
<400> 46
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Ser Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 47
<211> 178
<212> PRT
<213> Escherichia coli
<400> 47
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Ser Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 48
<211> 178
<212> PRT
<213> Escherichia coli
<400> 48
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Ser Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 49
<211> 178
<212> PRT
<213> Escherichia coli
<400> 49
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Ser Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 50
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Escherichia
<400> 50
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 51
<211> 178
<212> PRT
<213> Escherichia coli
<400> 51
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Thr
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 52
<211> 177
<212> PRT
<213> Escherichia coli
<400> 52
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gln Pro Gln Gly Gly Trp Gly Gln Ser Gln Gln Pro Gln Gly Gly
130 135 140
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
145 150 155 160
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 53
<211> 178
<212> PRT
<213> Escherichia coli
<400> 53
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Cys Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 54
<211> 178
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> 111
<223> Xaa = Any Amino Acid
<400> 54
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Xaa Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 55
<211> 178
<212> PRT
<213> Escherichia coli
<400> 55
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Val Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 56
<211> 178
<212> PRT
<213> Escherichia coli
<400> 56
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Val Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 57
<211> 178
<212> PRT
<213> Escherichia coli
<400> 57
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Asp Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 58
<211> 178
<212> PRT
<213> Escherichia coli
<400> 58
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Asp
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 59
<211> 178
<212> PRT
<213> Escherichia coli
<400> 59
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Ile Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 60
<211> 178
<212> PRT
<213> Shigella dysenteriae 1617
<400> 60
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Leu Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 61
<211> 178
<212> PRT
<213> Escherichia albertii
<400> 61
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Leu Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 62
<211> 178
<212> PRT
<213> Escherichia coli
<400> 62
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Cys Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 63
<211> 178
<212> PRT
<213> Escherichia coli
<400> 63
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Leu Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 64
<211> 178
<212> PRT
<213> Escherichia coli
<400> 64
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Pro Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 65
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 65
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Leu Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 66
<211> 178
<212> PRT
<213> Escherichia coli
<400> 66
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Asp Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Thr
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 67
<211> 178
<212> PRT
<213> Escherichia coli
<400> 67
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Leu Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 68
<211> 178
<212> PRT
<213> Escherichia coli
<400> 68
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Leu Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 69
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Escherichia
<400> 69
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Thr Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 70
<211> 178
<212> PRT
<213> Escherichia coli
<400> 70
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Gly Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 71
<211> 178
<212> PRT
<213> Escherichia coli
<400> 71
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Gly Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 72
<211> 178
<212> PRT
<213> Escherichia albertii
<400> 72
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Leu Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 73
<211> 178
<212> PRT
<213> Escherichia albertii
<400> 73
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Phe Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Ser Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 74
<211> 188
<212> PRT
<213> Escherichia coli
<400> 74
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly
145 150 155 160
Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn
165 170 175
Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
180 185
<210> 75
<211> 177
<212> PRT
<213> Unknown
<220>
<223> Citrobacter
<400> 75
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ala Gly
115 120 125
Gly Gly Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
130 135 140
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
145 150 155 160
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 76
<211> 178
<212> PRT
<213> Citrobacter koseri
<400> 76
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 77
<211> 171
<212> PRT
<213> Escherichia coli ECC-1470
<400> 77
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp
165 170
<210> 78
<211> 178
<212> PRT
<213> Citrobacter koseri
<400> 78
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Val Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 79
<211> 178
<212> PRT
<213> Citrobacter koseri
<400> 79
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Ile Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 80
<211> 171
<212> PRT
<213> Unknown
<220>
<223> Shigella
<400> 80
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly
115 120 125
Gly Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly
130 135 140
Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu
145 150 155 160
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 81
<211> 174
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 81
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 82
<211> 174
<212> PRT
<213> Citrobacter freundii complex
<400> 82
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Gly Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 83
<211> 174
<212> PRT
<213> Unknown
<220>
<223> Citrobacter
<400> 83
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Glu Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 84
<211> 174
<212> PRT
<213> Citrobacter youngae
<400> 84
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 85
<211> 174
<212> PRT
<213> Citrobacter werkmanii
<400> 85
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Ser Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 86
<211> 174
<212> PRT
<213> Citrobacter sp. MGH109
<400> 86
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Leu Gln Gln Ser Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 87
<211> 175
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 87
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 88
<211> 174
<212> PRT
<213> Unknown
<220>
<223> Citrobacter
<400> 88
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 89
<211> 174
<212> PRT
<213> Unknown
<220>
<223> Proteobacteria
<400> 89
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 90
<211> 155
<212> PRT
<213> Escherichia coli PA5
<400> 90
Met Pro Asn Gly Gly Ala Val Ala Asn Ile Thr Leu Ala Thr Ser Glu
1 5 10 15
Ser Trp Arg Asp Lys Ala Thr Gly Glu Met Lys Glu Gln Thr Glu Trp
20 25 30
His Arg Val Val Leu Phe Gly Lys Leu Ala Glu Val Ala Ser Glu Tyr
35 40 45
Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly Gln Leu Arg Thr Arg
50 55 60
Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg Tyr Thr Thr Glu Val Val
65 70 75 80
Val Asn Val Gly Gly Thr Met Gln Met Leu Gly Gly Arg Gln Gly Gly
85 90 95
Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly Gly Gln Pro Gln Gly Gly
100 105 110
Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly
115 120 125
Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu
130 135 140
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
145 150 155
<210> 91
<211> 174
<212> PRT
<213> Enterobacter aerogenes
<400> 91
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Ser Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 92
<211> 176
<212> PRT
<213> Enterobacter cloacae
<400> 92
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Thr Gly Gly Ser Gln Asn
115 120 125
Gln Gln Gln Gly Gly Trp Gly Arg His Gln Gln Pro Gln Gly Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Leu Asp Asp Asp Ile Pro Phe
165 170 175
<210> 93
<211> 174
<212> PRT
<213> Enterobacter cloacae
<400> 93
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 94
<211> 178
<212> PRT
<213> Klebsiella sp. G5
<400> 94
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 95
<211> 175
<212> PRT
<213> Klebsiella oxytoca
<400> 95
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Ser Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 96
<211> 178
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 96
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gly Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln
130 135 140
Gly Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 97
<211> 178
<212> PRT
<213> Enterobacter lignolyticus
<400> 97
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Ser Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser
145 150 155 160
Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 98
<211> 176
<212> PRT
<213> Serratia marcescens
<400> 98
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Ser Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Thr Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 99
<211> 174
<212> PRT
<213> Enterobacter cloacae complex
<400> 99
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Ser Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 100
<211> 176
<212> PRT
<213> Enterobacter cloacae complex
<400> 100
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Asn
115 120 125
Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 101
<211> 175
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 101
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 102
<211> 175
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 102
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 103
<211> 176
<212> PRT
<213> Enterobacter cloacae
<400> 103
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Ser Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Asn
115 120 125
Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 104
<211> 175
<212> PRT
<213> Klebsiella oxytoca
<400> 104
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Tyr Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 105
<211> 175
<212> PRT
<213> Klebsiella oxytoca
<400> 105
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Thr Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 106
<211> 184
<212> PRT
<213> Unknown
<220>
<223> Pantoea
<400> 106
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Asn Lys Glu Ile Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Gln Asp Gln Gly Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Gly Ala Ser Ala Gly Gly Ala Pro Met
115 120 125
Gly Gly Gly Gln Gln Ser Gly Gly Asn Asn Asn Gly Trp Gly Gln Pro
130 135 140
Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg
145 150 155 160
Pro Gln Pro Gln Ser Ala Pro Ala Ser Asn Asn Asn Glu Pro Pro Met
165 170 175
Asp Phe Asp Asp Asp Ile Pro Phe
180
<210> 107
<211> 175
<212> PRT
<213> Klebsiella oxytoca
<400> 107
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 108
<211> 176
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 108
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Ser Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Thr Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 109
<211> 174
<212> PRT
<213> Klebsiella pneumoniae
<400> 109
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys His Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 110
<211> 171
<212> PRT
<213> Klebsiella pneumoniae
<400> 110
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly
130 135 140
Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn Glu
145 150 155 160
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 111
<211> 173
<212> PRT
<213> Unknown
<220>
<223> Enterobacteriaceae
<400> 111
Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln
1 5 10 15
Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn Phe
20 25 30
Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu Met
35 40 45
Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala
50 55 60
Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu
65 70 75 80
Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys
85 90 95
Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu
100 105 110
Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln
115 120 125
Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser
130 135 140
Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser
145 150 155 160
Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 112
<211> 174
<212> PRT
<213> Klebsiella pneumoniae
<400> 112
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 113
<211> 175
<212> PRT
<213> Unknown
<220>
<223> Gammaproteobacteria
<400> 113
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 114
<211> 173
<212> PRT
<213> Enterobacter aerogenes
<400> 114
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gln Gln Gln
115 120 125
Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser
130 135 140
Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser
145 150 155 160
Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 115
<211> 174
<212> PRT
<213> Enterobacter aerogenes
<400> 115
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 116
<211> 177
<212> PRT
<213> Unknown
<220>
<223> Serratia
<400> 116
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Ala Ser Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 117
<211> 174
<212> PRT
<213> Yokenella regensburgei
<400> 117
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 118
<211> 178
<212> PRT
<213> Raoultella terrigena
<400> 118
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Ile Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala
145 150 155 160
Pro Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile
165 170 175
Pro Phe
<210> 119
<211> 174
<212> PRT
<213> Klebsiella pneumoniae
<400> 119
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ser Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 120
<211> 181
<212> PRT
<213> Unknown
<220>
<223> Yersinia
<400> 120
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ala Leu Gln Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Glu
85 90 95
Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Ser Gln Gln
115 120 125
Asp Gly Gly Ala Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly
130 135 140
Gly Asn Gln Phe Ser Gly Gly Gln Thr Ser Arg Pro Ala Gln Ser Ala
145 150 155 160
Pro Ala Ala Gln Pro Gln Gly Gly Asn Glu Pro Pro Met Asp Phe Asp
165 170 175
Asp Asp Ile Pro Phe
180
<210> 121
<211> 174
<212> PRT
<213> Klebsiella pneumoniae
<400> 121
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Ser Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 122
<211> 180
<212> PRT
<213> Cronobacter condimenti
<400> 122
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Leu Arg Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Val Thr Glu Trp His Ser Val Val Leu Tyr Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Ile Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Gln Asp Gln Ser Gly Gln Asp
85 90 95
Arg Tyr Ser Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Met Gly
115 120 125
Gly Gly Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln
130 135 140
Gln Ser Gly Gly Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln
145 150 155 160
Gln Gln Ala Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp
165 170 175
Asp Ile Pro Phe
180
<210> 123
<211> 174
<212> PRT
<213> Klebsiella sp. 10982
<400> 123
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Ser Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 124
<211> 458
<212> PRT
<213> Klebsiella pneumoniae
<400> 124
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Phe Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro
145 150 155 160
Ser Asn Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Met Ala
165 170 175
Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln Asp
180 185 190
Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn Phe Thr
195 200 205
Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu Met Lys
210 215 220
Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala Glu
225 230 235 240
Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly
245 250 255
Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys Tyr
260 265 270
Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu Gly
275 280 285
Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln Gly
290 295 300
Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly
305 310 315 320
Gly Ala Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn
325 330 335
Glu Thr Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Ala Glu Val Ala
340 345 350
Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu Gly Gln Leu
355 360 365
Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Lys Tyr Thr Thr
370 375 380
Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu Gly Gly Arg
385 390 395 400
Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln Gln Gly Gly Trp
405 410 415
Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala
420 425 430
Gln Ser Arg Pro Gln Gln Gln Ala Pro Ala Ala Pro Ser Asn Glu Thr
435 440 445
Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
450 455
<210> 125
<211> 176
<212> PRT
<213> Trabulsiella guamensis
<400> 125
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Ala
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 126
<211> 176
<212> PRT
<213> Enterobacter cloacae
<400> 126
Met Ala Ser Lys Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Leu Pro Ser Gly Gly Ala Val Cys Ser
20 25 30
Val Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Leu Lys Glu Gln Thr Glu Trp His Arg Ile Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Ser
115 120 125
Gln Gln His Gly Gly Trp Gly Gln Tyr Gln His Pro Gln Val Gly Asn
130 135 140
Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro
145 150 155 160
Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 127
<211> 177
<212> PRT
<213> Trabulsiella odontotermitis
<400> 127
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Pro Gln Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
130 135 140
Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala
145 150 155 160
Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 128
<211> 177
<212> PRT
<213> Trabulsiella odontotermitis
<400> 128
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gln Gly Ala Gly Ala Pro Ala Gly Gly Gly Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gln Gln Gly Gly
130 135 140
Ala Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala
145 150 155 160
Pro Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 129
<211> 174
<212> PRT
<213> Kosakonia radicincitans
<400> 129
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe
130 135 140
Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ser Ala Pro Ala Pro
145 150 155 160
Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170
<210> 130
<211> 177
<212> PRT
<213> Serratia marcescens
<400> 130
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Gln Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ser Leu Gln Thr Arg Lys Trp Thr Asp Gln Ala Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gln Ser Ala Gly
115 120 125
Gly Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Gln Gln Gln Ser Arg Pro Ala Gln Asn Ser Ala Pro
145 150 155 160
Ala Ala Ser Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 131
<211> 175
<212> PRT
<213> Unknown
<220>
<223> Kluyvera
<400> 131
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 132
<211> 175
<212> PRT
<213> Enterobacter asburiae
<400> 132
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Ser Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu
35 40 45
Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Ala Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Gln Gly Gly Gly Thr Pro Ala Gly Gly Gly Gln Gln
115 120 125
Gln Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln
130 135 140
Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Gln Ser Ala Pro Ala
145 150 155 160
Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe
165 170 175
<210> 133
<211> 193
<212> PRT
<213> Artificial Sequence
<220>
<223> c2 NLS-SSB fusion protein
<400> 133
Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln
20 25 30
Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn Ile
35 40 45
Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu Met
50 55 60
Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala
65 70 75 80
Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu
85 90 95
Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg
100 105 110
Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu
115 120 125
Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly
130 135 140
Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
145 150 155 160
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
165 170 175
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
180 185 190
Phe
<210> 134
<211> 277
<212> PRT
<213> Artificial Sequence
<220>
<223> c2 NLS-Bacteriophage Lambda Red beta SSAP-fusion protein
<400> 134
Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
Met Ser Thr Ala Leu Ala Thr Leu Ala Gly Lys Leu Ala Glu Arg Val
20 25 30
Gly Met Asp Ser Val Asp Pro Gln Glu Leu Ile Thr Thr Leu Arg Gln
35 40 45
Thr Ala Phe Lys Gly Asp Ala Ser Asp Ala Gln Phe Ile Ala Leu Leu
50 55 60
Ile Val Ala Asn Gln Tyr Gly Leu Asn Pro Trp Thr Lys Glu Ile Tyr
65 70 75 80
Ala Phe Pro Asp Lys Gln Asn Gly Ile Val Pro Val Val Gly Val Asp
85 90 95
Gly Trp Ser Arg Ile Ile Asn Glu Asn Gln Gln Phe Asp Gly Met Asp
100 105 110
Phe Glu Gln Asp Asn Glu Ser Cys Thr Cys Arg Ile Tyr Arg Lys Asp
115 120 125
Arg Asn His Pro Ile Cys Val Thr Glu Trp Met Asp Glu Cys Arg Arg
130 135 140
Glu Pro Phe Lys Thr Arg Glu Gly Arg Glu Ile Thr Gly Pro Trp Gln
145 150 155 160
Ser His Pro Lys Arg Met Leu Arg His Lys Ala Met Ile Gln Cys Ala
165 170 175
Arg Leu Ala Phe Gly Phe Ala Gly Ile Tyr Asp Lys Asp Glu Ala Glu
180 185 190
Arg Ile Val Glu Asn Thr Ala Tyr Thr Ala Glu Arg Gln Pro Glu Arg
195 200 205
Asp Ile Thr Pro Val Asn Asp Glu Thr Met Gln Glu Ile Asn Thr Leu
210 215 220
Leu Ile Ala Leu Asp Lys Thr Trp Asp Asp Asp Leu Leu Pro Leu Cys
225 230 235 240
Ser Gln Ile Phe Arg Arg Asp Ile Arg Ala Ser Ser Glu Leu Thr Gln
245 250 255
Ala Glu Ala Val Lys Ala Leu Gly Phe Leu Lys Gln Lys Ala Ala Glu
260 265 270
Gln Lys Val Ala Ala
275
<210> 135
<211> 241
<212> PRT
<213> Artificial Sequence
<220>
<223> c2 NLS-Bacteriophage Lambda Red Exonuclease-fusion
protein
<400> 135
Met Gln Pro Ser Leu Lys Arg Met Lys Ile Gln Pro Ser Ser Gln Pro
1 5 10 15
Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala Val
20 25 30
Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile Thr
35 40 45
Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys Lys
50 55 60
Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu Val
65 70 75 80
Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp Gly
85 90 95
Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser Gly
100 105 110
Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met Arg
115 120 125
Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu Glu
130 135 140
Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu Gly
145 150 155 160
Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr Ser
165 170 175
Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp Pro
180 185 190
Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp Glu
195 200 205
Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu Lys
210 215 220
Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln Trp
225 230 235 240
Arg
<210> 136
<211> 692
<212> PRT
<213> Homo sapiens
<400> 136
Met Ser Ser Phe Glu Gly Gln Met Ala Glu Tyr Pro Thr Ile Ser Ile
1 5 10 15
Asp Arg Phe Asp Arg Glu Asn Leu Arg Ala Arg Ala Tyr Phe Leu Ser
20 25 30
His Cys His Lys Asp His Met Lys Gly Leu Arg Ala Pro Thr Leu Lys
35 40 45
Arg Arg Leu Glu Cys Ser Leu Lys Val Tyr Leu Tyr Cys Ser Pro Val
50 55 60
Thr Lys Glu Leu Leu Leu Thr Ser Pro Lys Tyr Arg Phe Trp Lys Lys
65 70 75 80
Arg Ile Ile Ser Ile Glu Ile Glu Thr Pro Thr Gln Ile Ser Leu Val
85 90 95
Asp Glu Ala Ser Gly Glu Lys Glu Glu Ile Val Val Thr Leu Leu Pro
100 105 110
Ala Gly His Cys Pro Gly Ser Val Met Phe Leu Phe Gln Gly Asn Asn
115 120 125
Gly Thr Val Leu Tyr Thr Gly Asp Phe Arg Leu Ala Gln Gly Glu Ala
130 135 140
Ala Arg Met Glu Leu Leu His Ser Gly Gly Arg Val Lys Asp Ile Gln
145 150 155 160
Ser Val Tyr Leu Asp Thr Thr Phe Cys Asp Pro Arg Phe Tyr Gln Ile
165 170 175
Pro Ser Arg Glu Glu Cys Leu Ser Gly Val Leu Glu Leu Val Arg Ser
180 185 190
Trp Ile Thr Arg Ser Pro Tyr His Val Val Trp Leu Asn Cys Lys Ala
195 200 205
Ala Tyr Gly Tyr Glu Tyr Leu Phe Thr Asn Leu Ser Glu Glu Leu Gly
210 215 220
Val Gln Val His Val Asn Lys Leu Asp Met Phe Arg Asn Met Pro Glu
225 230 235 240
Ile Leu His His Leu Thr Thr Asp Arg Asn Thr Gln Ile His Ala Cys
245 250 255
Arg His Pro Lys Ala Glu Glu Tyr Phe Gln Trp Ser Lys Leu Pro Cys
260 265 270
Gly Ile Thr Ser Arg Asn Arg Ile Pro Leu His Ile Ile Ser Ile Lys
275 280 285
Pro Ser Thr Met Trp Phe Gly Glu Arg Ser Arg Lys Thr Asn Val Ile
290 295 300
Val Arg Thr Gly Glu Ser Ser Tyr Arg Ala Cys Phe Ser Phe His Ser
305 310 315 320
Ser Tyr Ser Glu Ile Lys Asp Phe Leu Ser Tyr Leu Cys Pro Val Asn
325 330 335
Ala Tyr Pro Asn Val Ile Pro Val Gly Thr Thr Met Asp Lys Val Val
340 345 350
Glu Ile Leu Lys Pro Leu Cys Arg Ser Ser Gln Ser Thr Glu Pro Lys
355 360 365
Tyr Lys Pro Leu Gly Lys Leu Lys Arg Ala Arg Thr Val His Arg Asp
370 375 380
Ser Glu Glu Glu Asp Asp Tyr Leu Phe Asp Asp Pro Leu Pro Ile Pro
385 390 395 400
Leu Arg His Lys Val Pro Tyr Pro Glu Thr Phe His Pro Glu Val Phe
405 410 415
Ser Met Thr Ala Val Ser Glu Lys Gln Pro Glu Lys Leu Arg Gln Thr
420 425 430
Pro Gly Cys Cys Arg Ala Glu Cys Met Gln Ser Ser Arg Phe Thr Asn
435 440 445
Phe Val Asp Cys Glu Glu Ser Asn Ser Glu Ser Glu Glu Glu Val Gly
450 455 460
Ile Pro Ala Ser Leu Gln Gly Asp Leu Gly Ser Val Leu His Leu Gln
465 470 475 480
Lys Ala Asp Gly Asp Val Pro Gln Trp Glu Val Phe Phe Lys Arg Asn
485 490 495
Asp Glu Ile Thr Asp Glu Ser Leu Glu Asn Phe Pro Ser Ser Thr Val
500 505 510
Ala Gly Gly Ser Gln Ser Pro Lys Leu Phe Ser Asp Ser Asp Gly Glu
515 520 525
Ser Thr His Ile Ser Ser Gln Asn Ser Ser Gln Ser Thr His Ile Thr
530 535 540
Glu Gln Gly Ser Gln Gly Trp Asp Ser Gln Ser Asp Thr Val Leu Leu
545 550 555 560
Ser Ser Gln Glu Arg Asn Ser Gly Asp Ile Thr Ser Leu Asp Lys Ala
565 570 575
Asp Tyr Arg Pro Thr Ile Lys Glu Asn Ile Pro Ala Ser Leu Met Glu
580 585 590
Gln Asn Val Ile Cys Pro Lys Asp Thr Tyr Ser Asp Leu Lys Ser Arg
595 600 605
Asp Lys Asp Val Thr Ile Val Pro Ser Thr Gly Glu Pro Thr Thr Leu
610 615 620
Ser Ser Glu Thr His Ile Pro Glu Glu Lys Ser Leu Leu Asn Leu Ser
625 630 635 640
Thr Asn Ala Asp Ser Gln Ser Ser Ser Asp Phe Glu Val Pro Ser Thr
645 650 655
Pro Glu Ala Glu Leu Pro Lys Arg Glu His Leu Gln Tyr Leu Tyr Glu
660 665 670
Lys Leu Ala Thr Gly Glu Ser Ile Ala Val Lys Lys Arg Lys Cys Ser
675 680 685
Leu Leu Asp Thr
690
<210> 137
<211> 708
<212> PRT
<213> Actinidia chinensis var. chinensis
<400> 137
Met Gly Ile Gln Gly Leu Leu Pro Leu Leu Lys Ser Ile Met Val Pro
1 5 10 15
Ile His Ile Lys Asp Leu Glu Asp Cys Cys Val Ala Ile Asp Thr Tyr
20 25 30
Ser Trp Leu His Lys Gly Ala Leu Ser Cys Ser Lys Asp Leu Cys Lys
35 40 45
Gly Gln Ser Thr Ser Lys His Ile Asp Tyr Cys Met Asn Arg Val Asn
50 55 60
Leu Leu Gln His Tyr Gly Ile Arg Pro Ile Leu Val Phe Asp Gly Gly
65 70 75 80
Pro Leu Pro Met Lys Ser Glu Gln Glu Ser Lys Arg Ala Arg Ser Arg
85 90 95
Lys Glu Asn Leu Ala Cys Ala Ile Glu Asn Glu Ser Asn Gly Asn Asn
100 105 110
Ala Ser Ala Tyr Lys Cys Tyr Gln Lys Ala Val Val Ile Ser Pro Ser
115 120 125
Val Ala Tyr Glu Leu Ile Gln Val Leu Lys Lys Glu Asn Val Tyr Tyr
130 135 140
Val Val Ala Pro Tyr Glu Ala Asp Ala Gln Met Thr Phe Leu Ala Val
145 150 155 160
Ser Lys Gln Val Asp Ala Val Ile Thr Glu Asp Ser Asp Leu Ile Ala
165 170 175
Phe Gly Cys Pro Arg Ile Ile Tyr Lys Met Asp Lys Leu Glu Gln Gly
180 185 190
Val Glu Phe Arg Tyr Ser Met Leu Gln Gln Asn Lys Glu Leu Asn Phe
195 200 205
Thr Gly Phe Thr Lys Arg Met Leu Leu Glu Met Cys Ile Leu Ser Gly
210 215 220
Cys Asp Tyr Leu Gln Ser Leu Pro Gly Ile Gly Leu Lys Lys Ala His
225 230 235 240
Ala Leu Val Lys Lys Phe Lys Ser Tyr Asp Lys Val Ile Lys His Leu
245 250 255
Lys Tyr Ser Thr Ala Ser Val Ser Ser Ser Tyr Glu Glu Ser Phe Arg
260 265 270
Lys Ala Ile Met Thr Phe Gln His Gln Arg Val Tyr Asp Pro Thr Ile
275 280 285
Glu Asp Ile Val His Leu Ser Asp Leu Pro Gln Tyr Val Gly Asp Asp
290 295 300
Leu Asp Phe Leu Gly Pro Ala Ile Leu Gln His Ile Ala Lys Gly Ile
305 310 315 320
Ala Arg Gly Asp Leu Asp Pro Phe Thr Lys Met Pro Ile Gln Gly Val
325 330 335
Asn Asn Gly Ala Gly Leu Val Asp Glu Gly Met Tyr Lys Leu Asn Asn
340 345 350
Phe Lys Ser Glu Gly Phe Ala Ser Leu Glu Ala Lys Arg Arg Phe Met
355 360 365
Ala Pro Arg Ser Thr Pro Lys His Arg Asn Pro Ile Thr Glu Thr Cys
370 375 380
Ser Thr Val Glu His Ile Thr Glu Asp Ala Asp Ala Cys Lys Thr Asn
385 390 395 400
Cys Ser Leu Glu Ser Leu Leu Asp Ser Arg Tyr Phe Asp Val Ala Ser
405 410 415
Pro Ser Glu Gly Tyr Val Lys His Gly Val Ala Ala Lys Ser Pro Glu
420 425 430
Ser Lys Ser Pro Ser His Gly Ser His Asp Lys Glu Glu Ile Leu Gly
435 440 445
Glu Gly Asp Asn Arg Ser Pro Gln Asp Pro Leu Leu Gln Gln Phe Lys
450 455 460
His Ser Ile Pro Lys Leu Cys Met Thr Leu Gln Lys Glu Arg Ala Lys
465 470 475 480
Ser Val Ala Asp Ser Gly Gln Asp Lys Thr Arg Lys Glu Asn Thr Lys
485 490 495
Val Ile Val Arg Ser Ser Tyr Phe Gln His Lys Leu Val Lys Glu Asn
500 505 510
Asp Lys Glu Asn Ile Lys Glu Asp Val Thr Thr Asp Lys Gly Glu Asn
515 520 525
Ile Asn Pro Lys Arg Glu His Lys Ser Ala Ser Asp Gly Gly Glu Ala
530 535 540
Lys Thr Arg Ile Lys Asn Arg Lys Thr Ile Val Arg Ser Ser Tyr Phe
545 550 555 560
Leu His Lys Ser Val Asn Glu Asn Asp Gln Asp Asn Arg His Glu Lys
565 570 575
Leu Ile Ile Asn Asp Asp Phe Thr Thr His Thr His Glu Asn Gly Ile
580 585 590
Pro Glu Ser Ala Ser Gly Asp Gly Tyr Phe Asn Asn Ser Ile Val Lys
595 600 605
Arg Lys Val Ser Pro Val Asp Ser Val Gln Met Glu Lys Thr Asn Tyr
610 615 620
Lys Cys Met Arg Met Asp Ala Ser Leu Pro Ile Glu Ser Ser Ser Ile
625 630 635 640
Ser Thr Leu Asn Asn Thr Thr Met Glu Thr Lys Ala Glu Gly Gly Lys
645 650 655
Phe Gly Ser Asn Ile Ser His Leu Lys Asn Tyr Ser Asp Ile Ala Glu
660 665 670
Lys Ser Ile Glu Arg Phe Val Ser Val Ile Ser Ser Phe Lys Cys Ser
675 680 685
Ser Ser Gly Ser Ser Ala Ser Gly Leu Arg Ala Pro Leu Arg Asn Thr
690 695 700
Glu His Met Tyr
705
<210> 138
<211> 1062
<212> PRT
<213> Mus musculus
<400> 138
Met Glu Pro Leu Asp Glu Leu Asp Leu Leu Leu Leu Glu Glu Asp Gly
1 5 10 15
Gly Ala Glu Ala Val Pro Arg Val Glu Leu Leu Arg Lys Lys Ala Asp
20 25 30
Ala Leu Phe Pro Glu Thr Val Leu Ser Arg Gly Val Asp Asn Arg Tyr
35 40 45
Leu Val Leu Ala Val Glu Thr Ser Gln Asn Glu Arg Gly Ala Glu Glu
50 55 60
Lys Arg Leu His Val Thr Ala Ser Gln Asp Arg Glu His Glu Val Leu
65 70 75 80
Cys Ile Leu Arg Asn Gly Trp Ser Ser Val Pro Val Glu Pro Gly Asp
85 90 95
Ile Val His Leu Glu Gly Asp Cys Thr Ser Glu Pro Trp Ile Ile Asp
100 105 110
Asp Asp Phe Gly Tyr Phe Ile Leu Tyr Pro Asp Met Met Ile Ser Gly
115 120 125
Thr Ser Val Ala Ser Ser Ile Arg Cys Leu Arg Arg Ala Val Leu Ser
130 135 140
Glu Thr Phe Arg Gly Ser Asp Pro Ala Thr Arg Gln Met Leu Ile Gly
145 150 155 160
Thr Ile Leu His Glu Val Phe Gln Lys Ala Ile Ser Glu Ser Phe Ala
165 170 175
Pro Glu Arg Leu Gln Glu Leu Ala Leu Gln Thr Leu Arg Glu Val Arg
180 185 190
His Leu Lys Glu Met Tyr Arg Leu Asn Leu Ser Gln Asp Glu Ile Leu
195 200 205
Cys Glu Val Glu Glu Tyr Leu Pro Ser Phe Ser Lys Trp Ala Glu Asp
210 215 220
Phe Met Arg Lys Gly Pro Ser Ser Glu Phe Pro Gln Met Gln Leu Ser
225 230 235 240
Leu Pro Ser Asp Gly Ser Asn Arg Ser Ser Pro Cys Asn Ile Glu Val
245 250 255
Val Lys Ser Leu Asp Ile Glu Glu Ser Ile Trp Ser Pro Arg Phe Gly
260 265 270
Leu Lys Gly Lys Ile Asp Val Thr Val Gly Val Lys Ile His Arg Asp
275 280 285
Cys Lys Met Lys Tyr Lys Val Met Pro Leu Glu Leu Lys Thr Gly Lys
290 295 300
Glu Ser Asn Ser Ile Glu His Arg Ser Gln Val Val Leu Tyr Thr Leu
305 310 315 320
Leu Ser Gln Glu Arg Arg Glu Asp Pro Glu Ala Gly Trp Leu Leu Tyr
325 330 335
Leu Lys Thr Gly Gln Met Tyr Pro Val Pro Ala Asn His Leu Asp Lys
340 345 350
Arg Glu Leu Leu Lys Leu Arg Asn Trp Leu Ala Ala Ser Leu Leu His
355 360 365
Arg Val Ser Arg Ala Ala Pro Gly Glu Glu Ala Arg Leu Ser Ala Leu
370 375 380
Pro Gln Ile Ile Glu Glu Glu Lys Thr Cys Lys Tyr Cys Ser Gln Ile
385 390 395 400
Gly Asn Cys Ala Leu Tyr Ser Arg Ala Val Glu Glu Gln Gly Asp Asp
405 410 415
Ala Ser Ile Pro Glu Ala Met Leu Ser Lys Ile Gln Glu Glu Thr Arg
420 425 430
His Leu Gln Leu Ala His Leu Lys Tyr Phe Ser Leu Trp Cys Leu Met
435 440 445
Leu Thr Leu Glu Ser Gln Ser Lys Asp Asn Arg Lys Thr His Gln Ser
450 455 460
Ile Trp Leu Thr Pro Ala Ser Glu Leu Glu Glu Ser Gly Asn Cys Val
465 470 475 480
Gly Asn Leu Val Arg Thr Glu Pro Val Ser Arg Val Cys Asp Gly Gln
485 490 495
Tyr Leu His Asn Phe Gln Arg Lys Asn Gly Pro Met Pro Ala Thr Asn
500 505 510
Leu Met Ala Gly Asp Arg Ile Ile Leu Ser Gly Glu Glu Arg Lys Leu
515 520 525
Phe Ala Leu Ser Lys Gly Tyr Val Lys Lys Met Asn Lys Ala Ala Val
530 535 540
Thr Cys Leu Leu Asp Arg Asn Leu Ser Thr Leu Pro Ala Thr Thr Val
545 550 555 560
Phe Arg Leu Asp Arg Glu Glu Arg His Gly Asp Ile Ser Thr Pro Leu
565 570 575
Gly Asn Leu Ser Lys Leu Met Glu Ser Thr Asp Pro Ser Lys Arg Leu
580 585 590
Arg Glu Leu Ile Ile Asp Phe Arg Glu Pro Gln Phe Ile Ala Tyr Leu
595 600 605
Ser Ser Val Leu Pro His Asp Ala Lys Asp Thr Val Ala Asn Ile Leu
610 615 620
Lys Gly Leu Asn Lys Pro Gln Arg Gln Ala Met Lys Arg Val Leu Leu
625 630 635 640
Ser Lys Asp Tyr Thr Leu Ile Val Gly Met Pro Gly Thr Gly Lys Thr
645 650 655
Thr Thr Ile Cys Ala Leu Val Arg Ile Leu Ser Ala Cys Gly Phe Ser
660 665 670
Val Leu Leu Thr Ser Tyr Thr His Ser Ala Val Asp Asn Ile Leu Leu
675 680 685
Lys Leu Ala Lys Phe Lys Val Gly Phe Leu Arg Leu Gly Gln Ser His
690 695 700
Lys Val His Pro Asp Ile Gln Lys Phe Thr Glu Glu Glu Ile Cys Arg
705 710 715 720
Ser Arg Ser Ile Ala Ser Leu Ala His Leu Glu Glu Leu Tyr Asn Ser
725 730 735
His Pro Ile Val Ala Thr Thr Cys Met Gly Ile Asn His Pro Ile Phe
740 745 750
Ser Arg Lys Thr Phe Asp Phe Cys Ile Val Asp Glu Ala Ser Gln Ile
755 760 765
Ser Gln Pro Val Cys Leu Gly Pro Leu Phe Phe Ser Arg Arg Phe Val
770 775 780
Leu Val Gly Asp His Gln Gln Leu Pro Pro Leu Val Val Asn Arg Glu
785 790 795 800
Ala Arg Ala Leu Gly Met Ser Glu Ser Leu Phe Lys Arg Leu Glu Arg
805 810 815
Asn Glu Ser Ala Val Val Gln Leu Thr Val Gln Tyr Arg Met Asn Arg
820 825 830
Lys Ile Met Ser Leu Ser Asn Lys Leu Thr Tyr Ala Gly Lys Leu Glu
835 840 845
Cys Gly Ser Asp Arg Val Ala Asn Ala Val Leu Ala Leu Pro Asn Leu
850 855 860
Lys Asp Ala Arg Leu Ser Leu Gln Leu Tyr Ala Asp Tyr Ser Asp Ser
865 870 875 880
Pro Trp Leu Ala Gly Val Leu Glu Pro Asp Asn Pro Val Cys Phe Leu
885 890 895
Asn Thr Asp Lys Val Pro Ala Pro Glu Gln Val Glu Asn Gly Gly Val
900 905 910
Ser Asn Val Thr Glu Ala Arg Leu Ile Val Phe Leu Thr Ser Thr Phe
915 920 925
Ile Lys Ala Gly Cys Ser Pro Ser Asp Ile Gly Val Ile Ala Pro Tyr
930 935 940
Arg Gln Gln Leu Arg Ile Ile Ser Asp Leu Leu Ala Arg Ser Ser Val
945 950 955 960
Gly Met Val Glu Val Asn Thr Val Asp Lys Tyr Gln Gly Arg Asp Lys
965 970 975
Ser Leu Ile Leu Val Ser Phe Val Arg Ser Asn Glu Asp Gly Thr Leu
980 985 990
Gly Glu Leu Leu Lys Asp Trp Arg Arg Leu Asn Val Ala Leu Thr Arg
995 1000 1005
Ala Lys His Lys Leu Ile Leu Leu Gly Ser Val Ser Ser Leu Lys Arg
1010 1015 1020
Phe Pro Pro Leu Gly Thr Leu Phe Asp His Leu Asn Ala Glu Gln Leu
1025 1030 1035 1040
Ile Leu Asp Leu Pro Ser Arg Glu His Glu Ser Leu Ser His Ile Leu
1045 1050 1055
Gly Asp Cys Gln Arg Asp
1060
<210> 139
<211> 702
<212> PRT
<213> Saccharomyces cerevisiae
<400> 139
Met Gly Ile Gln Gly Leu Leu Pro Gln Leu Lys Pro Ile Gln Asn Ala
1 5 10 15
Val Ser Leu Arg Arg Tyr Glu Gly Glu Val Leu Ala Ile Asp Gly Tyr
20 25 30
Ala Trp Leu His Arg Ala Ala Cys Ser Cys Ala Tyr Glu Leu Ala Met
35 40 45
Gly Lys Pro Thr Asp Lys Tyr Leu Gln Phe Phe Ile Lys Arg Phe Ser
50 55 60
Leu Leu Lys Thr Phe Lys Val Glu Pro Tyr Leu Val Phe Asp Gly Asp
65 70 75 80
Ala Ile Pro Val Lys Lys Ser Thr Glu Ser Lys Arg Arg Asp Lys Arg
85 90 95
Lys Glu Asn Lys Ala Ile Ala Glu Arg Leu Trp Ala Cys Gly Glu Lys
100 105 110
Lys Asn Ala Met Asp Tyr Phe Gln Lys Cys Val Asp Ile Thr Pro Glu
115 120 125
Met Ala Lys Cys Ile Ile Cys Tyr Cys Lys Leu Asn Gly Ile Arg Tyr
130 135 140
Ile Val Ala Pro Phe Glu Ala Asp Ser Gln Met Val Tyr Leu Glu Gln
145 150 155 160
Lys Asn Ile Val Gln Gly Ile Ile Ser Glu Asp Ser Asp Leu Leu Val
165 170 175
Phe Gly Cys Arg Arg Leu Ile Thr Lys Leu Asn Asp Tyr Gly Glu Cys
180 185 190
Leu Glu Ile Cys Arg Asp Asn Phe Ile Lys Leu Pro Lys Lys Phe Pro
195 200 205
Leu Gly Ser Leu Thr Asn Glu Glu Ile Ile Thr Met Val Cys Leu Ser
210 215 220
Gly Cys Asp Tyr Thr Asn Gly Ile Pro Lys Val Gly Leu Ile Thr Ala
225 230 235 240
Met Lys Leu Val Arg Arg Phe Asn Thr Ile Glu Arg Ile Ile Leu Ser
245 250 255
Ile Gln Arg Glu Gly Lys Leu Met Ile Pro Asp Thr Tyr Ile Asn Glu
260 265 270
Tyr Glu Ala Ala Val Leu Ala Phe Gln Phe Gln Arg Val Phe Cys Pro
275 280 285
Ile Arg Lys Lys Ile Val Ser Leu Asn Glu Ile Pro Leu Tyr Leu Lys
290 295 300
Asp Thr Glu Ser Lys Arg Lys Arg Leu Tyr Ala Cys Ile Gly Phe Val
305 310 315 320
Ile His Arg Glu Thr Gln Lys Lys Gln Ile Val His Phe Asp Asp Asp
325 330 335
Ile Asp His His Leu His Leu Lys Ile Ala Gln Gly Asp Leu Asn Pro
340 345 350
Tyr Asp Phe His Gln Pro Leu Ala Asn Arg Glu His Lys Leu Gln Leu
355 360 365
Ala Ser Lys Ser Asn Ile Glu Phe Gly Lys Thr Asn Ser Thr Asn Ser
370 375 380
Glu Ala Lys Val Lys Pro Ile Glu Ser Phe Phe Gln Lys Met Thr Lys
385 390 395 400
Leu Asp His Tyr Pro Lys Val Ala Asn Asn Ile His Ser Leu Arg Gln
405 410 415
Ala Glu Asp Lys Leu Thr Met Ala Ile Lys Arg Arg Lys Leu Ser Asn
420 425 430
Ala Asn Val Val Gln Glu Thr Leu Lys Asp Thr Arg Ser Lys Phe Phe
435 440 445
Asn Lys Pro Ser Met Thr Val Val Glu Asn Phe Lys Glu Lys Gly Asp
450 455 460
Ser Thr Gln Asp Phe Lys Glu Asp Thr Asn Ser Gln Ser Leu Glu Glu
465 470 475 480
Pro Val Ser Glu Ser Gln Leu Ser Thr Gln Ile Pro Ser Ser Phe Ile
485 490 495
Thr Thr Asn Leu Glu Asp Asp Asp Asn Leu Ser Glu Glu Val Ser Glu
500 505 510
Val Val Ser Asp Thr Glu Glu Asp Arg Lys Asn Ser Glu Gly Lys Ile
515 520 525
Ile Gly Asn Glu Ile Tyr Asn Thr Asp Asp Asp Gly Asp Gly Asp Thr
530 535 540
Ser Glu Asp Tyr Ser Glu Thr Ala Glu Ser Arg Val Pro Thr Ser Ser
545 550 555 560
Thr Thr Ser Phe Pro Gly Ser Ser Gln Arg Ser Ile Ser Gly Cys Thr
565 570 575
Lys Val Leu Gln Lys Phe Arg Tyr Ser Ser Ser Phe Ser Gly Val Asn
580 585 590
Ala Asn Arg Gln Pro Leu Phe Pro Arg His Val Asn Gln Lys Ser Arg
595 600 605
Gly Met Val Tyr Val Asn Gln Asn Arg Asp Asp Asp Cys Asp Asp Asn
610 615 620
Asp Gly Lys Asn Gln Ile Met Gln Arg Pro Leu Leu Arg Lys Ser Leu
625 630 635 640
Ile Gly Ala Arg Ser Gln Arg Ile Val Ile Asp Met Lys Ser Val Asp
645 650 655
Glu Arg Lys Ser Phe Asn Ser Ser Pro Ile Leu His Glu Glu Ser Lys
660 665 670
Lys Arg Asp Ile Glu Thr Thr Lys Ser Ser Gln Ala Arg Pro Ala Val
675 680 685
Arg Ser Ile Ser Leu Leu Ser Gln Phe Val Tyr Lys Gly Lys
690 695 700
<210> 140
<211> 486
<212> PRT
<213> Unknown
<220>
<223> herpesvirus
<400> 140
Met Glu Ala Thr Pro Thr Pro Ala Asp Leu Phe Ser Glu Asp Tyr Leu
1 5 10 15
Val Asp Thr Leu Asp Gly Leu Thr Val Asp Asp Gln Gln Ala Val Leu
20 25 30
Ala Ser Leu Ser Phe Ser Lys Phe Leu Lys His Ala Lys Val Arg Asp
35 40 45
Trp Cys Ala Gln Ala Lys Ile Gln Pro Ser Met Pro Ala Leu Arg Met
50 55 60
Ala Tyr Asn Tyr Phe Leu Phe Ser Lys Val Gly Glu Phe Ile Gly Ser
65 70 75 80
Glu Asp Val Cys Asn Phe Phe Val Asp Arg Val Phe Gly Gly Val Arg
85 90 95
Leu Leu Asp Val Ala Ser Val Tyr Ala Ala Cys Ser Gln Met Asn Ala
100 105 110
His Gln Arg His His Ile Cys Cys Leu Val Glu Arg Ala Thr Ser Ser
115 120 125
Gln Ser Leu Asn Pro Val Trp Asp Ala Leu Arg Asp Gly Ile Ile Ser
130 135 140
Ser Ser Lys Phe His Trp Ala Val Lys Gln Gln Asn Thr Ser Lys Lys
145 150 155 160
Ile Phe Ser Pro Trp Pro Ile Thr Asn Asn His Phe Val Ala Gly Pro
165 170 175
Leu Ala Phe Gly Leu Arg Cys Glu Glu Val Val Lys Thr Leu Leu Ala
180 185 190
Thr Leu Leu His Pro Asp Glu Ala Asn Cys Leu Asp Tyr Gly Phe Met
195 200 205
Gln Ser Pro Gln Asn Gly Ile Phe Gly Val Ser Leu Asp Phe Ala Ala
210 215 220
Asn Val Lys Thr Asp Thr Glu Gly Arg Leu Gln Phe Asp Pro Asn Cys
225 230 235 240
Lys Val Tyr Glu Ile Lys Cys Arg Phe Lys Tyr Thr Phe Ala Lys Met
245 250 255
Glu Cys Asp Pro Ile Tyr Ala Ala Tyr Gln Arg Leu Tyr Glu Ala Pro
260 265 270
Gly Lys Leu Ala Leu Lys Asp Phe Phe Tyr Ser Ile Ser Lys Pro Ala
275 280 285
Val Glu Tyr Val Gly Leu Gly Lys Leu Pro Ser Glu Ser Asp Tyr Leu
290 295 300
Val Ala Tyr Asp Gln Glu Trp Glu Ala Cys Pro Arg Lys Lys Arg Lys
305 310 315 320
Leu Thr Pro Leu His Asn Leu Ile Arg Glu Cys Ile Leu His Asn Ser
325 330 335
Thr Thr Glu Ser Asp Val Tyr Val Leu Thr Asp Pro Gln Asp Thr Arg
340 345 350
Gly Gln Ile Ser Ile Lys Ala Arg Phe Lys Ala Asn Leu Phe Val Asn
355 360 365
Val Arg His Ser Tyr Phe Tyr Gln Val Leu Leu Gln Ser Ser Ile Val
370 375 380
Glu Glu Tyr Ile Gly Leu Asp Ser Gly Ile Pro Arg Leu Gly Ser Pro
385 390 395 400
Lys Tyr Tyr Ile Ala Thr Gly Phe Phe Arg Lys Arg Gly Tyr Gln Asp
405 410 415
Pro Val Asn Cys Thr Ile Gly Gly Asp Ala Leu Asp Pro His Val Glu
420 425 430
Ile Pro Thr Leu Leu Ile Val Thr Pro Val Tyr Phe Pro Arg Gly Ala
435 440 445
Lys His Arg Leu Leu His Gln Ala Ala Asn Phe Trp Ser Arg Ser Ala
450 455 460
Lys Asp Thr Phe Pro Tyr Ile Lys Trp Asp Phe Ser Tyr Leu Ser Ala
465 470 475 480
Asn Val Pro His Ser Pro
485
<210> 141
<211> 521
<212> PRT
<213> Unknown
<220>
<223> UL12 exonuclease
<400> 141
Met Glu Leu Glu Pro Val Gly Lys Lys Tyr Arg Pro Glu Arg Glu Asp
1 5 10 15
Ser Ser Lys Gly Arg Lys Ile Leu Thr Val Ser Val Asn Ser Gln Leu
20 25 30
Gln Gly Ala Ser Pro Thr Leu Gly Thr Arg Ala His Pro Pro His Ser
35 40 45
Glu Leu Thr Asp Tyr Thr Phe Ser Arg Tyr Ile Leu Tyr His Leu Ala
50 55 60
Pro Ser Glu Leu Lys Glu Ala Ile His Pro Leu Tyr His Arg Leu Asn
65 70 75 80
Tyr Ile Ala Asp Val Ile Lys Arg Gly Thr Ser Glu Gly Arg Trp Leu
85 90 95
Gly Tyr Pro Tyr Ser Cys Ile Leu Asp Thr Glu Asp Glu Leu Arg Asn
100 105 110
Glu Ser Arg Arg Asn Thr Ser Ser Pro Ser Asp His Ala Leu Arg Trp
115 120 125
Cys Leu Leu Val Glu Ser Phe Thr Ile Glu Gln Ala Asn Cys Asp Leu
130 135 140
Trp His Ile Phe Arg Gln Ser Leu Leu Thr Ala Ser Ser Val Lys Trp
145 150 155 160
Thr Asp Asp Gly Lys Leu Asp Thr Val Gly Ile Met Ser Asp Asn Ser
165 170 175
Thr Ala Tyr Val Glu Thr Cys Ser Val Ala Phe Gly Lys His Asn Glu
180 185 190
Pro Leu Ala Lys Ser Leu Val Thr Met Phe Cys Leu Asn His Ser Arg
195 200 205
His Val His Asn Thr Ser Pro Arg Arg Glu Asn Val Phe Val Phe Glu
210 215 220
Asp Val Ser Asp Arg Thr Ile Gln Ser Glu Ser Asp Tyr Ser Cys Gly
225 230 235 240
Leu Met Ile Asp Thr Arg Thr Gly Met Val Gly Ala Ser Leu Asp Met
245 250 255
Leu Val Cys Glu Arg Asp Pro Phe Gly Leu Leu Gln Pro Asp Ser Glu
260 265 270
Asn Gln Ala Ile Glu Thr Tyr Glu Ile Lys Cys Arg Ala Lys Tyr Ala
275 280 285
Phe Cys Pro Asp Lys Arg Ser Glu Leu Ser Gln Cys Tyr Glu Arg Leu
290 295 300
Leu Asn Val Arg Thr Met Gly Ser Leu Arg Leu Phe Ile Ser Ala Ile
305 310 315 320
Gln Arg Pro Cys Val Asp Tyr Phe Gln Pro Gly Asn Val Pro Arg Ser
325 330 335
Lys Glu Ala Leu Ile Thr Ser Asn Glu Glu Trp Lys Val Gly Asn Ser
340 345 350
Ala Tyr His Ala Ala Gln Ser Arg Ile Arg Cys Asn Ala Phe Asp Lys
355 360 365
Cys His Leu Glu Leu Asn Ser Asn Val Gln Ser Arg Val Trp Leu Phe
370 375 380
Gly Glu Pro Asp Leu Glu Thr Asp Thr Ile Tyr Pro Leu Pro Trp Asp
385 390 395 400
Thr Gly Lys Leu Ser Leu Asp Val Pro Ile Phe Ser Asn Pro Arg His
405 410 415
Pro Asn Phe Lys Gln Ile Tyr Leu Gln Thr Tyr Val Ala Ala Gly Tyr
420 425 430
Phe Gly Glu Arg Arg Thr Thr Pro Phe Leu Val Thr Phe Ile Gly Arg
435 440 445
Trp Arg Lys Arg Arg Glu Phe Gly Lys Lys Phe Ser Leu Ile Ala Asp
450 455 460
Ser Gly Leu Gly Lys Pro Ile Ser Thr Val His Ala Asp Gln Ala Ile
465 470 475 480
Pro Val Leu Leu Ile Val Thr Pro Val Ile Val Asp Glu Ala Phe Tyr
485 490 495
Gly Glu Ile Glu Ser Ala Gly Cys Arg Ala Phe Gly Glu Leu Val Lys
500 505 510
Gln Leu Trp Ala Lys Gln Pro His Thr
515 520
<210> 142
<211> 664
<212> PRT
<213> Escherichia coli
<400> 142
Met Ser Lys Val Phe Ile Cys Ala Ala Ile Pro Asp Glu Leu Ala Thr
1 5 10 15
Arg Glu Glu Gly Ala Val Ala Val Ala Thr Ala Ile Glu Ala Gly Asp
20 25 30
Glu Arg Arg Ala Arg Ala Lys Phe His Trp Gln Phe Leu Glu His Tyr
35 40 45
Pro Ala Ala Gln Asp Cys Ala Tyr Lys Phe Ile Val Cys Glu Asp Lys
50 55 60
Pro Gly Ile Pro Arg Pro Ala Leu Asp Ser Trp Asp Ala Glu Tyr Met
65 70 75 80
Gln Glu Asn Arg Trp Asp Glu Glu Ser Ala Ser Phe Val Pro Val Glu
85 90 95
Thr Glu Ser Asp Pro Met Asn Val Thr Phe Asp Lys Leu Ala Pro Glu
100 105 110
Val Gln Asn Ala Val Met Val Lys Phe Asp Thr Cys Glu Asn Ile Thr
115 120 125
Val Asp Met Val Ile Ser Ala Gln Glu Leu Leu Gln Glu Asp Met Ala
130 135 140
Thr Phe Asp Gly His Ile Val Glu Ala Leu Met Lys Met Pro Glu Val
145 150 155 160
Asn Ala Met Tyr Pro Glu Leu Lys Leu His Ala Ile Gly Trp Val Lys
165 170 175
His Lys Cys Ile Pro Gly Ala Lys Trp Pro Glu Ile Gln Ala Glu Met
180 185 190
Arg Ile Trp Lys Lys Arg Arg Glu Gly Glu Arg Lys Glu Thr Gly Lys
195 200 205
Tyr Thr Ser Val Val Asp Leu Ala Arg Ala Arg Ala Asn Gln Gln Tyr
210 215 220
Thr Glu Asn Ser Thr Gly Lys Ile Ser Pro Val Ile Ala Ala Ile His
225 230 235 240
Arg Glu Tyr Lys Gln Thr Trp Lys Thr Leu Asp Asp Glu Leu Ala Tyr
245 250 255
Ala Leu Trp Pro Gly Asp Val Asp Ala Gly Asn Ile Asp Gly Ser Ile
260 265 270
His Arg Trp Ala Lys Lys Glu Val Ile Asp Asn Asp Arg Glu Asp Trp
275 280 285
Lys Arg Ile Ser Ala Ser Met Arg Lys Gln Pro Asp Ala Leu Arg Tyr
290 295 300
Asp Arg Gln Thr Ile Phe Gly Leu Val Arg Glu Arg Pro Ile Asp Ile
305 310 315 320
His Lys Asp Pro Ile Ala Leu Asn Lys Tyr Ile Cys Glu Tyr Leu Thr
325 330 335
Thr Lys Gly Val Phe Glu Asn Glu Glu Thr Asp Leu Gly Thr Val Asp
340 345 350
Val Leu Gln Ser Ser Glu Thr Gln Thr Asp Ala Val Glu Thr Glu Val
355 360 365
Ser Asp Ile Pro Lys Asn Glu Thr Ala Pro Glu Ala Glu Pro Ser Val
370 375 380
Glu Arg Glu Gly Pro Phe Tyr Phe Leu Phe Ala Asp Lys Asp Gly Glu
385 390 395 400
Lys Tyr Gly Arg Ala Asn Lys Leu Ser Gly Leu Asp Lys Ala Leu Ala
405 410 415
Ala Gly Ala Thr Glu Ile Thr Lys Glu Glu Tyr Phe Ala Arg Lys Asn
420 425 430
Gly Thr Tyr Thr Gly Leu Pro Gln Asn Val Asp Thr Ala Glu Asp Ser
435 440 445
Glu Gln Pro Glu Pro Ile Lys Val Thr Ala Asp Glu Val Asn Lys Ile
450 455 460
Met Gln Ala Ala Asn Ile Ser Gln Pro Asp Ala Asp Lys Leu Leu Ala
465 470 475 480
Ala Ser Arg Gly Glu Phe Val Glu Glu Ile Ser Asp Pro Asn Asp Pro
485 490 495
Lys Trp Val Lys Gly Ile Gln Thr Arg Asp Ser Val Asn Gln Asn Gln
500 505 510
His Glu Ser Glu Arg Asn Tyr Gln Lys Ala Glu Gln Asn Ser Thr Asn
515 520 525
Ala Leu Gln Asn Glu Pro Glu Thr Lys Gln Pro Glu Pro Val Ala Gln
530 535 540
Gln Glu Val Glu Lys Val Cys Thr Ala Cys Gly Gln Thr Gly Gly Gly
545 550 555 560
Asn Cys Pro Asp Cys Gly Ala Val Met Gly Asp Ala Thr Tyr Gln Glu
565 570 575
Thr Phe Asp Glu Glu Tyr Gln Val Glu Val Gln Glu Asp Asp Pro Glu
580 585 590
Glu Met Glu Gly Ala Glu His Pro His Lys Glu Asn Thr Gly Gly Asn
595 600 605
Gln His His Asn Ser Asp Asn Glu Thr Gly Glu Thr Ala Asp His Ser
610 615 620
Ile Lys Val Asn Gly His His Glu Ile Thr Ser Thr Ser Arg Ala Gly
625 630 635 640
Ile His Leu Met Ile Asp Leu Glu Thr Met Gly Lys Asn Pro Asp Ala
645 650 655
Pro Ile Ile Cys Asn Arg Leu Ile
660
<210> 143
<211> 300
<212> PRT
<213> Unknown
<220>
<223> Enterobacteria phage T7
<400> 143
Met Ala Leu Leu Asp Leu Lys Gln Phe Tyr Glu Leu Arg Glu Gly Cys
1 5 10 15
Asp Asp Lys Gly Ile Leu Val Met Asp Gly Asp Trp Leu Val Phe Gln
20 25 30
Ala Met Ser Ala Ala Glu Phe Asp Ala Ser Trp Glu Glu Glu Ile Trp
35 40 45
His Arg Cys Cys Asp His Ala Lys Ala Arg Gln Ile Leu Glu Asp Ser
50 55 60
Ile Lys Ser Tyr Glu Thr Arg Lys Lys Ala Trp Ala Gly Ala Pro Ile
65 70 75 80
Val Leu Ala Phe Thr Asp Ser Val Asn Trp Arg Lys Glu Leu Val Asp
85 90 95
Pro Asn Tyr Lys Ala Asn Arg Lys Ala Val Lys Lys Pro Val Gly Tyr
100 105 110
Phe Glu Phe Leu Asp Ala Leu Phe Glu Arg Glu Glu Phe Tyr Cys Ile
115 120 125
Arg Glu Pro Met Leu Glu Gly Asp Asp Val Met Gly Val Ile Ala Ser
130 135 140
Asn Pro Ser Ala Phe Gly Ala Arg Lys Ala Val Ile Ile Ser Cys Asp
145 150 155 160
Lys Asp Phe Lys Thr Ile Pro Asn Cys Asp Phe Leu Trp Cys Thr Thr
165 170 175
Gly Asn Ile Leu Thr Gln Thr Glu Glu Ser Ala Asp Trp Trp His Leu
180 185 190
Phe Gln Thr Ile Lys Gly Asp Ile Thr Asp Gly Tyr Ser Gly Ile Ala
195 200 205
Gly Trp Gly Asp Thr Ala Glu Asp Phe Leu Asn Asn Pro Phe Ile Thr
210 215 220
Glu Pro Lys Thr Ser Val Leu Lys Ser Gly Lys Asn Lys Gly Gln Glu
225 230 235 240
Val Thr Lys Trp Val Lys Arg Asp Pro Glu Pro His Glu Thr Leu Trp
245 250 255
Asp Cys Ile Lys Ser Ile Gly Ala Lys Ala Gly Met Thr Glu Glu Asp
260 265 270
Ile Ile Lys Gln Gly Gln Met Ala Arg Ile Leu Arg Phe Asn Glu Tyr
275 280 285
Asn Phe Ile Asp Lys Glu Ile Tyr Leu Trp Arg Pro
290 295 300
<210> 144
<211> 267
<212> PRT
<213> Escherichia coli
<400> 144
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro Ser
245 250 255
Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 145
<211> 236
<212> PRT
<213> Mus musculus
<400> 145
Met Ser Glu Pro Pro Arg Ala Glu Thr Phe Val Phe Leu Asp Leu Glu
1 5 10 15
Ala Thr Gly Leu Pro Asn Met Asp Pro Glu Ile Ala Glu Ile Ser Leu
20 25 30
Phe Ala Val His Arg Ser Ser Leu Glu Asn Pro Glu Arg Asp Asp Ser
35 40 45
Gly Ser Leu Val Leu Pro Arg Val Leu Asp Lys Leu Thr Leu Cys Met
50 55 60
Cys Pro Glu Arg Pro Phe Thr Ala Lys Ala Ser Glu Ile Thr Gly Leu
65 70 75 80
Ser Ser Glu Ser Leu Met His Cys Gly Lys Ala Gly Phe Asn Gly Ala
85 90 95
Val Val Arg Thr Leu Gln Gly Phe Leu Ser Arg Gln Glu Gly Pro Ile
100 105 110
Cys Leu Val Ala His Asn Gly Phe Asp Tyr Asp Phe Pro Leu Leu Cys
115 120 125
Thr Glu Leu Gln Arg Leu Gly Ala His Leu Pro Gln Asp Thr Val Cys
130 135 140
Leu Asp Thr Leu Pro Ala Leu Arg Gly Leu Asp Arg Ala His Ser His
145 150 155 160
Gly Thr Arg Ala Gln Gly Arg Lys Ser Tyr Ser Leu Ala Ser Leu Phe
165 170 175
His Arg Tyr Phe Gln Ala Glu Pro Ser Ala Ala His Ser Ala Glu Gly
180 185 190
Asp Val His Thr Leu Leu Leu Ile Phe Leu His Arg Ala Pro Glu Leu
195 200 205
Leu Ala Trp Ala Asp Glu Gln Ala Arg Ser Trp Ala His Ile Glu Pro
210 215 220
Met Tyr Val Pro Pro Asp Gly Pro Ser Leu Glu Ala
225 230 235
<210> 146
<211> 43
<212> DNA
<213> Unknown
<220>
<223> Hammerhead ribozyme
<400> 146
aaattactga tgagtccgtg aggacgaaac gagtaagctc gtc 43
<210> 147
<211> 68
<212> DNA
<213> Unknown
<220>
<223> Hepatitis delta virus (HDV) ribozyme
<400> 147
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60
aatgggac 68
<210> 148
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid linker
<400> 148
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Ser
1 5 10
<210> 149
<211> 2243
<212> DNA
<213> Solanum lycopersicum
<400> 149
atcgtatcca gtgcaccata ttttttggcg attaccactc atattattgt gtttagtaga 60
tattttaggt gcataattga tctcttcttt aaaactaggg gcacttatta ttatacatcc 120
acttgacact tgctttagtt ggctattttt tttatttttt attttttgtc aactacccca 180
atttaaattt tatttgatta agatattttt atggacctac tttataatta aaaatatttt 240
ctatttgaaa aggaaggaca aaaatcatac aattttggtc caactactcc tctctttttt 300
tttttggctt tataaaaaag gaaagtgatt agtaataaat aattaaataa tgaaaaaagg 360
aggaaataaa attttcgaat taaaatgtaa aagagaaaaa ggagagggag taatcattgt 420
ttaactttat ctaaagtacc ccaattcgat tttacatgta tatcaaatta tacaaatatt 480
ttattaaaat atagatattg aataatttta ttattcttga acatgtaaat aaaaattatc 540
tattatttca atttttatat aaactattat ttgaaatctc aattatgatt ttttaatatc 600
actttctatc catgataatt tcagcttaaa aagttttgtc aataattaca ttaattttgt 660
tgatgaggat gacaagattt cggtcatcaa ttacatatac acaaattgaa atagtaagca 720
acttgatttt ttttctcata atgataatga caaagacacg aaaagacaat tcaatattca 780
cattgattta tttttatatg ataataatta caataataat attcttataa agaaagagat 840
caattttgac tgatccaaaa atttatttat ttttactata ccaacgtcac taattatatc 900
taataatgta aaacaattca atcttactta aatattaatt tgaaataaac tatttttata 960
acgaaattac taaatttatc caataacaaa aaggtcttaa gaagacataa attctttttt 1020
tgtaatgctc aaataaattt gagtaaaaaa gaatgaaatt gagtgatttt tttttaatca 1080
taagaaaata aataattaat ttcaatataa taaaacagta atataatttc ataaatggaa 1140
ttcaatactt acctcttaga tataaaaaat aaatataaaa ataaagtgtt tctaataaac 1200
ccgcaattta aataaaatat ttaatatttt caatcaaatt taaataatta tattaaaata 1260
tcgtagaaaa agagcaatat ataatacaag aaagaagatt taagtacaat tatcaactat 1320
tattatactc taattttgtt atatttaatt tcttacggtt aaggtcatgt tcacgataaa 1380
ctcaaaatac gctgtatgag gacatatttt aaattttaac caataataaa actaagttat 1440
ttttagtata tttttttgtt taacgtgact taatttttct tttctagagg agcgtgtaag 1500
tgtcaacctc attctcctaa ttttcccaac cacataaaaa aaaaataaag gtagcttttg 1560
cgtgttgatt tggtacacta cacgtcatta ttacacgtgt tttcgtatga ttggttaatc 1620
catgaggcgg tttcctctag agtcggccat accatctata aaataaagct ttctgcagct 1680
cattttttca tcttctatct gatttctatt ataatttctc tgaattgcct tcaaatttct 1740
ctttcaaggt tagaattttt ctctattttt tggtttttgt ttgtttagat tctgagttta 1800
gttaatcagg tgctgttaaa gccctaaatt ttgagttttt ttcggttgtt ttgatggaaa 1860
atacctaaca attgagtttt ttcatgttgt tttgtcggag aatgcctaca attggagttc 1920
ctttcgttgt tttgatgaga aagcccctaa tttgagtgtt tttccgtcga tttgatttta 1980
aaggtttata ttcgagtttt tttcgtcggt ttaatgagaa ggcctaaaat aggagttttt 2040
ctggttgatt tgactaaaaa agccatggaa ttttgtgttt ttgatgtcgc tttggttctc 2100
aaggcctaag atctgagttt ctccggttgt tttgatgaaa aagccctaaa attggagttt 2160
ttatcttgtg ttttaggttg ttttaatcct tataatttga gttttttcgt tgttctgatt 2220
gttgttttta tgaatttcct gca 2243
Claims (173)
- 하기를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형의 증가 방법:
게놈-편집 분자 및 HDR 촉진제를 진핵 세포에 제공함으로써, 상기 게놈 편집 분자 및 상기 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 상기 게놈 편집 분자가 (i) 상기 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드; 및 (ii) 상기 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하며; 상기 HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계. - 제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
- 제2항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
- 제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트(Argonaute), 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
- 제1항에 있어서, 상기 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.
- 제5항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제(nickase), Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.
- 제5항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
- 제1항에 있어서, 상기 공여자 DNA 분자가 원형 DNA 벡터, 제미니바이러스 레플리콘 상에 또는 선형 DNA 단편으로서 제공되는 방법.
- 제1항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열의 카피가 측접된 방법.
- 제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 상기 표적 편집 부위가 PAM 서열 및 상기 가이드 RNA에 대하여 상보적이고 프로토스페이서 인접 모티프(PAM) 서열에 바로 인접하게 위치한 서열을 포함하는 방법.
- 제1항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 절단 후에 상기 표적 편집 부위에 5' 오버행을 제공하는 방법.
- 제1항에 있어서, 상기 SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.
- 제1항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
- 제13항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, 동등한 SSAP 활성을 갖는 관련 단백질 또는 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제13항에 있어서, 상기 ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제13항에 있어서, 상기 RAD52-과 단백질이 사카로마이세스 세레비지애(Saccharomyces cerevisiae) Rad52 단백질, 스키조사카로마이세스 폼베(Schizosaccharomyces pombe) Rad22 단백질, 클루이베로마이세스 락티스(Kluyveromyces lactis) Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제1항에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
- 제1항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
- 제1항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
- 제1항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
- 제1항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스(Artemis) 단백질, 아폴로(Apollo) 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스(herpesvirus) SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아(enterobacterial) 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 엑소뉴클레아제 III, Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제5항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이(E. coli) 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제1항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
- 제1항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에(Enterobacteriaceae) 종 SSB인 방법.
- 제1항에 있어서, 상기 SSB가 에스케리키아 종, 시겔라(Shigella) 종, 엔테로박터(Enterobacter) 종, 클레브시엘라(Klebsiella) 종, 세라티아(Serratia) 종, 판토에아(Pantoea) 종 또는 예르시니아(Yersinia) 종 SSB인 방법.
- 제1항에 있어서, 상기 SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제1항에 있어서, 상기 HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.
- 제1항에 있어서, 상기 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.
- 제1항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.
- 제1항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB가 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 방법.
- 제1항 내지 제30항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
- 제31항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 방법.
- 제32항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
- 제31항에 있어서, 상기 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.
- 제31항에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
- (a) 진핵 세포;
(b) 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 HDR 촉진제; 및
(c) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하는 게놈 편집 분자(들)를 포함하는 진핵 세포 게놈의 표적 편집 부위의 상동성 지정 수선(HDR)-매개된 게놈 변형을 증가시키기 위한 시스템으로서,
상기 진핵 세포가 유효량의 HDR 촉진제 및 게놈 편집 분자(들)와 회합되고/되거나 이와 접촉되고/되거나 이를 함유하는 시스템. - 제36항에 있어서, 상기 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 시스템.
- 제37항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 시스템.
- 제36항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 시스템.
- 제36항에 있어서, 상기 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 시스템.
- 제40항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제(nickase), Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 시스템.
- 제40항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 시스템.
- 제36항에 있어서, 상기 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈 상에 제공되는 시스템.
- 제36항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 시스템.
- 제36항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 상기 표적 편집 부위가 PAM 서열 및 상기 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 시스템.
- 제36항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 절단 후에 상기 표적 편집 부위에 5' 오버행을 제공하는 시스템.
- 제36항에 있어서, 상기 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 적어도 2배 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 시스템.
- 제36항에 있어서, 상기 SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 시스템.
- 제36항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 시스템.
- 제49항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.
- 제49항에 있어서, 상기 RecT/ Redβ-과 단백질이 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질, Rac 박테리아 프로파지 RecT 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 시스템.
- 제49항에 있어서, 상기 RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
- 제49항에 있어서, 상기 ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
- 제49항에 있어서, 상기 RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
- 제36항에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.
- 제36항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 시스템.
- 제36항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.
- 제36항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 시스템.
- 제36항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
- 제40항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
- 제36항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 시스템.
- 제36항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 시스템.
- 제62항에 있어서, 상기 SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 시스템.
- 제36항에 있어서, 상기 SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 시스템.
- 제36항에 있어서, 상기 HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 적어도 2배 증가되는 시스템.
- 제36항에 있어서, 상기 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 시스템과 비교하여 유지되거나 적어도 2배 감소되는 시스템.
- 제36항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 시스템.
- 제36항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB가 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.
- 제36항 내지 제68항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 시스템.
- 제69항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 시스템.
- 제69항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 시스템.
- 제69항에 있어서, 상기 세포가 식물 세포이며, SSAP, 엑소뉴클레아제 및/또는 단일 가닥 DNA 결합 단백질이 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 시스템.
- 제69항에 있어서, 상기 시스템이 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 것을 제공하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 시스템.
- (a) 게놈 편집 분자 및 상동성 지정 수선(HDR) 촉진제를 진핵 세포에 제공함으로써, 상기 게놈 편집 분자 및 HDR 촉진제가 대조군에 비하여 증가된 빈도로 HDR에 의한 공여자 주형 폴리뉴클레오티드를 사용한 진핵 세포 게놈의 표적 편집 부위의 변형을 제공하는 단계로서, 상기 게놈 편집 분자가 (i) 표적 편집 부위 내의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드, 및 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자를 포함하고; 상기 HDR 촉진제가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 단계; 및
(b) 게놈 변형을 포함하는 진핵 세포를 단리하거나 증식시킴으로써, 게놈 변형을 갖는 진핵 세포를 제조하는 단계를 포함하는, 게놈 변형을 갖는 진핵 세포의 제조 방법. - 제74항에 있어서, 상기 게놈 편집 분자 및/또는 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
- 제75항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
- 제74항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
- 제74항에 있어서, 상기 게놈 편집 분자가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 하나 이상의 서열-특이적 엔도뉴클레아제 또는 서열-특이적 엔도뉴클레아제 및 가이드 RNA를 포함하는 방법.
- 제78항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, Cas12i, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하는 방법.
- 제78항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
- 제74항에 있어서, 상기 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.
- 제74항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접된 방법.
- 제74항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 포함하며, 상기 표적 편집 부위가 PAM 서열 및 상기 가이드 RNA에 대하여 상보적이고 PAM 서열에 바로 인접하게 위치한 서열을 포함하는 방법.
- 제74항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 절단 후에 상기 표적 편집 부위에 5' 오버행을 제공하는 방법.
- 제74항에 있어서, 상기 SSAP가 상동성 DNA 분자의 상보적 DNA 가닥의 DNA 가닥 교환 및 염기 쌍형성을 제공하는 방법.
- 제74항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
- 제86항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.
- 제86항에 있어서, 상기 RecT/ Redβ-과 단백질이 SEQ ID NO: 1, 2 또는 3에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제86항에 있어서, 상기 ERF-과 단백질이 박테리오파지 P22 ERF 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 4에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제86항에 있어서, 상기 RAD52-과 단백질이 사카로마이세스 세레비지애 Rad52 단백질, 스키조사카로마이세스 폼베 Rad22 단백질, 클루이베로마이세스 락티스 Rad52 단백질, 기능적으로 관련된 단백질 또는 SEQ ID NO: 5, 6 또는 7에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제74항에 있어서, 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
- 제74항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
- 제74항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
- 제74항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
- 제74항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제78항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제74항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
- 제74항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB)이 박테리아 SSB 또는 선택적으로 엔테로박테리아세아에 종 SSB인 방법.
- 제98항에 있어서, 상기 SSB가 에스케리키아 종, 시겔라 종, 엔테로박터 종, 클레브시엘라 종, 세라티아 종, 판토에아 종 또는 예르시니아 종 SSB인 방법.
- 제74항에 있어서, 상기 SSB가 SEQ ID NO:31, 34 내지 131 또는 132에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제74항에 있어서, 상기 HDR의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 적어도 2배 증가되는 방법.
- 제74항에 있어서, 상기 비-상동성 말단-연결(NHEJ)의 빈도는, 대조군 진핵 세포에 게놈 편집 분자가 제공되지만 상기 HDR 촉진제 중 적어도 하나에 노출되지 않는 대조군 방법과 비교하여 유지되거나 적어도 2배 감소되는 방법.
- 제74항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 단일 가닥 DNA 결합 단백질이 작동 가능하게 연결된 핵 국소화 신호(NLS) 및/또는 세포-투과 펩티드(CPP)를 추가로 포함하는 방법.
- 제74항에 있어서, 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB가 상기 SSAP, 상기 엑소뉴클레아제 및/또는 상기 SSB 사이에 삽입된 프로테아제 인식 부위 또는 자가-가공 단백질 서열을 포함하는 폴리단백질로서 세포에 제공되는 시스템.
- 제74항 내지 제104항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
- 제105항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 방법.
- 제105항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
- 제105항에 있어서, 상기 SSAP, 엑소뉴클레아제 및/또는 SSB가 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15 및 SEQ ID NO: 16으로 이루어진 군으로부터 선택되는 작동 가능하게 연결된 핵 국소화 신호(NLS)를 추가로 포함하는 방법.
- 제105항에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
- 제1항 내지 제30항 중 어느 한 항, 제36항 내지 제68항 중 어느 한 항, 또는 제74항 내지 제104항 중 어느 한 항에 있어서, HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포가 복수의 용기, 구획 또는 위치를 포함하는 어레이에 제공되며, 각각의 용기, 구획 또는 위치가 HDR 촉진제, 게놈-편집 분자 및 진핵 세포 또는 게놈 변형을 포함하는 진핵 세포를 포함하는 방법 또는 시스템 또는 .
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 진핵 세포에 제공하는 단계를 포함하는 진핵 세포의 유전학적 엔지니어링 방법으로서,
상기 세포의 표적 편집 부위가 공여자 주형 DNA 분자에 의해 변형되는 방법. - 제111항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제 또는 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드, 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 방법.
- 제112항에 있어서, 상기 RNA-가이드된 뉴클레아제가 RNA-가이드된 DNA 엔도뉴클레아제, II형 Cas 뉴클레아제, Cas9 뉴클레아제, V형 Cas 뉴클레아제, Cas12a 뉴클레아제, Cas12b 뉴클레아제, Cas12c 뉴클레아제, CasY 뉴클레아제, CasX 뉴클레아제, Cas12i, Cas14 또는 엔지니어링된 뉴클레아제를 포함하는 방법.
- 제111항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 아연-핑거 뉴클레아제(ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제(TAL-이펙터 뉴클레아제), 아르고노트, 메가뉴클레아제 또는 엔지니어링된 메가뉴클레아제를 포함하는 방법.
- 제111항에 있어서, 가이드 RNA를 추가로 포함하며, 상기 서열-특이적 엔도뉴클레아제 및 가이드 RNA가 표적 편집 부위 내의 2개의 별개의 DNA 서열에서 단일의 DNA 가닥을 절단하는 방법.
- 제115항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 적어도 하나의 Cas9 닉카제, Cas12a 닉카제, 아연 핑거 닉카제, TALE 닉카제 또는 이의 조합을 포함하며, 상기 서열-특이적 엔도뉴클레아제가 표적 편집 부위 내의 엔도뉴클레아제 인식 서열에 특이적인 방법.
- 제115항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 Cas9 및/또는 Cas12a를 포함하며, 상기 가이드 RNA 분자가 상기 표적 편집 부위 내의 DNA 서열에 대하여 적어도 하나의 염기 불일치를 갖는 방법.
- 제111항에 있어서, 상기 공여자 DNA 분자가 플라스미드 또는 제미니바이러스 게놈에 제공되는 방법.
- 제111항에 있어서, 상기 공여자 DNA 분자는 엔도뉴클레아제 인식 서열이 측접되는 방법.
- 제111항에 있어서, 상기 SSAP가 RecT/Redβ-, ERF- 또는 RAD52-과 단백질을 포함하는 방법.
- 제120항에 있어서, 상기 RecT/ Redβ-과 단백질이 Rac 박테리아 프로파지 RecT 단백질, 박테리오파지 λ 베타 단백질, 박테리오파지 SPP1 35 단백질 또는 동등한 SSAP 활성을 갖는 관련 단백질을 포함하는 방법.
- 제111항에 있어서, 상기 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
- 제111항에 있어서, 인산화된 5' 말단을 포함하는 선형 dsDNA 분자가 엑소뉴클레아제의 바람직한 기질인 방법.
- 제111항에 있어서, 상기 엑소뉴클레아제가 5'에서 3' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
- 제111항에 있어서, 상기 엑소뉴클레아제가 3'에서 5' 엑소뉴클레아제 활성을 가지며, 블런트 말단 dsDNA 기질, 한 가닥에 내부 파단을 갖는 dsDNA 기질, 5' 오버행을 갖는 dsDNA 기질 및/또는 3' 오버행을 갖는 dsDNA 기질을 인식할 수 있는 방법.
- 제111항에 있어서, 상기 엑소뉴클레아제가 박테리오파지 람다 엑소 단백질, Rac 프로파지 RecE 엑소뉴클레아제, 아르테미스 단백질, 아폴로 단백질, DNA2 엑소뉴클레아제, Exo1 엑소뉴클레아제, 헤르페스바이러스 SOX 단백질, UL12 엑소뉴클레아제, 엔테로박테리아 엑소뉴클레아제 VIII, T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 포유류 Trex2 엑소뉴클레아제, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 8, 9, 136, 137, 138, 139, 140, 141, 142, 143, 144 또는 145에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제111항에 있어서, 상기 엑소뉴클레아제가 T7 파지 엑소뉴클레아제, 에스케리키아 콜라이 엑소뉴클레아제 III, 동등한 엑소뉴클레아제 활성을 갖는 관련 단백질 또는 SEQ ID NO: 143 또는 144에 대하여 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 99% 서열 동일성을 갖는 단백질을 포함하는 방법.
- 제111항에 있어서, 상기 단일 가닥 DNA 결합 단백질(SSB) 및 상기 SSAP가 동일한 숙주 유기체로부터 수득되는 방법.
- 제111항 내지 제128항 중 어느 한 항에 있어서, 상기 진핵 세포가 포유류 세포 또는 식물 세포인 방법.
- 제129항에 있어서, 상기 식물 세포가 반수체, 이배체 또는 배수체인 방법.
- 제130항에 있어서, 상기 식물 세포가 배양 배지 중에, 식물 내에 또는 식물 조직 내에 존재하는 방법.
- 제131항에 있어서, 게놈 변형을 포함하는 식물 세포로부터 수득되는 식물 세포, 번식체 또는 식물을 단리하고/하거나 성장시키는 단계를 추가로 포함하며, 상기 식물 세포, 번식체 또는 식물의 게놈이 게놈 변형을 포함하는 방법.
- 제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 하나 이상의 벡터에 제공되는 방법.
- (없음)
- 제133항에 있어서, 상기 벡터가 아그로박테리움 벡터인 방법.
- 제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 염색체에 의해 제공되는 방법.
- 제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 폴리펩티드, DNA, mRNA를 도입함으로써 및/또는 유성 교배(sexual crossing)에 의해 제공되는 방법.
- 제111항 내지 제132항 중 어느 한 항에 있어서, i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상이 i) 내지 v) 중 하나 이상을 포함하는 전구 세포에 의해 제공되며, 상기 전구 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 이후에 전구 세포로의 폴리펩티드, DNA 또는 mRNA의 전달에 의해 및/또는 전구 세포의 유성 교배에 의해 제공되는 방법.
- 제111항 내지 제138항 중 어느 한 항에 있어서, 변형을 검출하는 단계를 추가로 포함하는 방법.
- 제139항에 있어서, 상기 변형을 검출하는 단계가 앰플리콘 서열분석을 포함하는 방법.
- 제111항 내지 제140항 중 어느 한 항에 있어서, 상기 표적 편집 부위가 단백질 코딩 서열 또는 프로모터 내에 존재하는 방법.
- 제111항 내지 제141항 중 어느 한 항에 있어서, 상기 표적 편집 부위의 변형이 삽입, 결실 또는 치환인 방법.
- 제111항 내지 제142항 중 어느 한 항에 있어서, 상기 표적 편집 부위가 작물재배학적으로 중요한 형질을 인코딩하는 유전자 또는 포유류 질병에 연관되는 유전자인 방법.
- 하기를 포함하는 유전학적으로 변형된 표적 편집 부위를 갖는 진핵 세포의 생성 방법:
(a) 상기 표적 편집 부위 내의 적어도 하나의 엔도뉴클레아제 인식 서열의 DNA 서열을 절단하는 적어도 하나의 서열-특이적 엔도뉴클레아제 또는 상기 적어도 하나의 서열-특이적 엔도뉴클레아제를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 제공하는 단계, 및
(b) 적어도 하나의 이중-가닥 DNA 서열을 포함하는 적어도 하나의 공여자 분자를 제공하는 단계로서, (i) 상기 DNA 서열이 표적 편집 부위에 측접한 서열에 대하여 적어도 50개 뉴클레오티드의 길이에 걸쳐 적어도 90%의 상동성을 가지며, (ii) 상기 공여자 서열이 상기 표적 편집 부위와 비교하여 적어도 하나의 변형을 포함하는 단계; 및
(c) (i) 적어도 하나의 단일-가닥 DNA 어닐링 단백질(SSAP), 및
(ii) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 적어도 하나의 엑소뉴클레아제, 및
(iii) 적어도 하나의 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 적어도 하나의 상동성 지정 수선(HDR) 촉진제를 제공하는 단계를 포함함으로써,
상기 적어도 하나의 서열-특이적 엔도뉴클레아제, 상기 적어도 하나의 공여자 분자 및 상기 적어도 하나의 HDR 촉진제가 상기 변형을 상기 진핵 세포의 상기 표적 편집 부위 내로 도입하며;
(d) 상기 표적 편집 부위 내에 변형을 포함하는 진핵 세포를 단리하는 단계. - 제144항에 있어서, 상기 변형이 하나 이상의 뉴클레오티드의 삽입, 하나 이상의 뉴클레오티드의 결실 또는 하나 이상의 뉴클레오티드의 치환으로 이루어진 군으로부터 선택되는 방법.
- 제144항에 있어서, 상기 표적 편집 부위의 일부가 상기 표적 편집 부위 내의 2개의 서열 특이적 절단을 사용함으로써 결실되며, 상기 공여자 분자에 의해 제공되는 서열로 대체되는 방법.
- 제144항 내지 제146항 중 어느 한 항에 있어서, 상기 공여자 서열이 엔도뉴클레아제 인식 서열이 측접된 벡터에 존재하는 방법.
- 제144항 내지 제147항 중 어느 한 항에 있어서, 상기 변형을 포함하는 진핵 세포를 증식시키는 단계를 추가로 포함하는 방법.
- 하기의 단계를 포함하는 유전학적으로 변형된 유기체의 생성 방법:
(i) 제144항 내지 제148항 중 어느 한 항에 의해 유전학적으로 변형된 진핵 세포를 생성하는 단계, 및
(ii) 상기 세포를 유기체 내로 재생시키는 단계. - 제149항에 있어서, 상기 유기체가 식물 및 비-인간 동물로 이루어진 군으로부터 선택되는 유기체.
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 조성물.
- 제151항에 있어서, 상기 핵산이 하나 이상의 벡터에 존재하는 조성물.
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB) 중 하나 이상을 인코딩하는 핵산을 포함하는 벡터.
- 제153항에 있어서, 상기 벡터가 공여자 주형 DNA, 서열 특이적 엔도뉴클레아제 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터.
- 제153항에 있어서, 상기 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 벡터.
- 제153항에 있어서, 상기 벡터가 i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 벡터.
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산 및 진핵 세포를 유전학적으로 엔지니어링하기 위한 사용 설명서를 포함하는 키트.
- 제157항에 있어서, 상기 키트가 제1 벡터 및 제2 벡터를 포함하며,
i) 상기 제1 벡터가 공여자 주형 DNA 및 서열 특이적 엔도뉴클레아제를 포함하는 핵산을 포함하며, 상기 서열-특이적 엔도뉴클레아제가 RNA-가이드된 뉴클레아제를 인코딩하는 폴리뉴클레오티드 및 가이드 RNA를 인코딩하는 폴리뉴클레오티드를 포함하며;
ii) 상기 제2 벡터가 단일-가닥 DNA 어닐링 단백질(SSAP), 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제 및 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 키트. - 제157항 또는 제158항에 있어서, 유전학적으로 엔지니어링된 세포를 검출하기 위한 작용제를 추가로 포함하는 키트.
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 포함하는 세포.
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 DNA 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)을 인코딩하는 핵산을 포함하는 세포.
- 제160항 또는 제161항에 있어서, 상기 세포가 식물 또는 포유류 세포인 세포.
- 제160항 내지 제162항 중 어느 한 항에 있어서, 상기 세포가 숙주 세포인 세포.
- 제1항 내지 제35항 및 제74항 내지 제149항 중 어느 한 항의 방법에 의해 생성되는 유전학적으로 엔지니어링된 세포.
- i) 적어도 하나의 서열-특이적 엔도뉴클레아제, ii) 진핵 세포 내의 표적 편집 부위에 대하여 상동성을 갖는 공여자 주형 분자, iii) 단일-가닥 DNA 어닐링 단백질(SSAP), iv) 이중 가닥 DNA 기질을 적어도 부분적으로 단일 가닥 DNA 생성물로 전환할 수 있는 엑소뉴클레아제, 및 v) 단일 가닥 DNA 결합 단백질(SSB)의 하위세트를 포함하는 표적 편집 부위에서의 유전학적 엔지니어링을 위한 전구 진핵 세포 또는 유기체로서, 상기 세포가 i) 내지 v) 중 적어도 하나를 포함하지 않으며, 상기 전구 세포 또는 유기체에 포함되지 않은 i) 내지 v) 중 적어도 하나를 상기 세포 또는 유기체에 제공하는 것이 상기 공여자 주형 분자에 의한 상기 표적 편집 부위의 변형을 초래하는 전구 진핵 세포 또는 유기체.
- 제165항에 있어서, 상기 공여자 주형이 이중-가닥 DNA 분자인 전구 진핵 세포 또는 유기체.
- 제165항에 있어서, 상기 세포가 생식선 세포인 전구 세포.
- 제165항에 있어서, 상기 전구 진핵 세포가 전구 식물 세포이며, 상기 전구 식물 세포 또는 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 형질전환에 의해 공급되는 전구 진핵 세포 또는 유기체.
- 제165항에 있어서, 상기 유기체가 식물이며, 상기 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 상기 전구 식물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 제2 식물과의 유성 교배에 의해 공급되는 전구 유기체.
- 제165항에 있어서, 상기 전구 진핵 세포가 동물 세포이며, 상기 전구 세포에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 트랜스펙션에 의해 공급되는 전구 진핵 세포.
- 제165항에 있어서, 상기 전구 유기체가 비-인간 동물이며, 상기 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나가 비-인간 동물에 의해 포함되지 않은 i) 내지 v) 중 적어도 하나를 포함하는 비-인간 동물과의 유성 교배에 의해 공급되는 전구 유기체.
- 제153항에 있어서, 상기 서열-특이적 뉴클레아제가 유도성 프로모터에 작동 가능하게 연결된 벡터.
- 제111항에 있어서, 상기 서열-특이적 엔도뉴클레아제가 닉카제인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962866317P | 2019-06-25 | 2019-06-25 | |
US62/866,317 | 2019-06-25 | ||
PCT/US2020/039410 WO2020264016A1 (en) | 2019-06-25 | 2020-06-24 | Improved homology dependent repair genome editing |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220052905A true KR20220052905A (ko) | 2022-04-28 |
Family
ID=71579688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227002110A KR20220052905A (ko) | 2019-06-25 | 2020-06-24 | 개선된 상동성 의존적 수선 게놈 편집 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11041172B2 (ko) |
EP (1) | EP3990633A1 (ko) |
JP (1) | JP2022539338A (ko) |
KR (1) | KR20220052905A (ko) |
CN (1) | CN114630910A (ko) |
AR (1) | AR123323A1 (ko) |
AU (1) | AU2020301236A1 (ko) |
BR (1) | BR112021026220A2 (ko) |
CA (1) | CA3138663A1 (ko) |
IL (1) | IL289106A (ko) |
MX (1) | MX2021014861A (ko) |
SG (1) | SG11202112092TA (ko) |
WO (1) | WO2020264016A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117487959A (zh) * | 2024-01-02 | 2024-02-02 | 东北农业大学 | 一种与印度南瓜侧枝数量相关基因连锁的分子标记及应用 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018119021A1 (en) * | 2016-12-21 | 2018-06-28 | HSU, Ethan | Composition for editing a nucleic acid sequence and method using the same |
CN109666693B (zh) * | 2018-12-29 | 2022-08-16 | 北京市农林科学院 | Mg132在碱基编辑系统编辑受体基因组中的应用 |
US20240011042A1 (en) * | 2020-07-31 | 2024-01-11 | Inari Agriculture Technology, Inc. | Excisable plant transgenic loci with signature protospacer adjacent motifs or signature guide rna recognition sites |
US20220030822A1 (en) * | 2020-07-31 | 2022-02-03 | Inari Agriculture Technology, Inc. | Inht26 transgenic soybean |
US11242534B1 (en) | 2020-07-31 | 2022-02-08 | Inari Agriculture Technology, Inc. | INHT31 transgenic soybean |
KR20240128889A (ko) * | 2021-12-20 | 2024-08-27 | 알데브론 엘엘씨 | 조작된 박테리아에서 유전자 치료 벡터의 생산 |
WO2023156585A1 (en) * | 2022-02-18 | 2023-08-24 | Pulmobiotics, S.L. | Systems, tools, and methods for engineering bacteria |
CN116286741A (zh) * | 2022-03-03 | 2023-06-23 | 清华大学 | 5’→3’核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法 |
CN115960733B (zh) * | 2022-09-19 | 2023-11-24 | 苏州泓迅生物科技股份有限公司 | 一种用于大片段dna组装的基因工程酵母菌、构建方法及其应用 |
CN115976086B (zh) * | 2023-01-19 | 2023-08-08 | 河南农业大学 | 一种细菌CRISPR-Cas9基因编辑的方法和应用 |
WO2024168253A1 (en) * | 2023-02-10 | 2024-08-15 | Possible Medicines Llc | Delivery of an rna guided recombination system |
WO2024168265A1 (en) * | 2023-02-10 | 2024-08-15 | Possible Medicines Llc | Aav delivery of rna guided recombination system |
CN116873928A (zh) * | 2023-06-28 | 2023-10-13 | 浙江工业大学 | 一种碳化钨纳米棒-碳纳米片复合材料、铁碳微电极材料的制备方法和应用 |
CN116555346B (zh) * | 2023-07-05 | 2023-09-01 | 中山大学 | 一种采用碳纳米管基因载体递送系统促进草鱼生长的方法 |
Family Cites Families (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US39247A (en) | 1863-07-14 | Improvement in skates | ||
US5352605A (en) | 1983-01-17 | 1994-10-04 | Monsanto Company | Chimeric genes for transforming plant cells using viral promoters |
US5428147A (en) | 1983-04-15 | 1995-06-27 | Mycogen Plant Science, Inc. | Octopine T-DNA promoters |
US5322938A (en) | 1987-01-13 | 1994-06-21 | Monsanto Company | DNA sequence for enhancing the efficiency of transcription |
US5310667A (en) | 1989-07-17 | 1994-05-10 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases |
US5641876A (en) | 1990-01-05 | 1997-06-24 | Cornell Research Foundation, Inc. | Rice actin gene and promoter |
ES2171391T3 (es) | 1990-04-26 | 2002-09-16 | Aventis Cropscience Nv | Nueva cepa de bacillus thuringiensis y su gen de codificado de toxina insecticida. |
US5633435A (en) | 1990-08-31 | 1997-05-27 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases |
US5866775A (en) | 1990-09-28 | 1999-02-02 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases |
US5277905A (en) | 1991-01-16 | 1994-01-11 | Mycogen Corporation | Coleopteran-active bacillus thuringiensis isolate |
DE69227911T2 (de) | 1991-08-02 | 1999-05-12 | Kubota Corp., Tokio/Tokyo | Neuer mikroorganismus und insektizid |
AU5676394A (en) | 1992-11-20 | 1994-06-22 | Agracetus, Inc. | Transgenic cotton plants producing heterologous bioplastic |
CA2161881C (en) | 1993-01-13 | 2001-03-27 | A. Gururaj Rao | High lysine derivatives of alpha-hordothionin |
ATE195509T1 (de) | 1994-02-04 | 2000-09-15 | Basf Ag | Phenylessigsäurederivate, verfahren und zwischenprodukte zu ihrer herstellung und sie enthaltende mittel |
US5593881A (en) | 1994-05-06 | 1997-01-14 | Mycogen Corporation | Bacillus thuringiensis delta-endotoxin |
US5792931A (en) | 1994-08-12 | 1998-08-11 | Pioneer Hi-Bred International, Inc. | Fumonisin detoxification compositions and methods |
US5736514A (en) | 1994-10-14 | 1998-04-07 | Nissan Chemical Industries, Ltd. | Bacillus strain and harmful organism controlling agents |
EP0828835A1 (en) | 1995-06-02 | 1998-03-18 | Pioneer Hi-Bred International, Inc. | HIGH THREONINE DERIVATIVES OF $g(a)-HORDOTHIONIN |
EP0832235A1 (en) | 1995-06-02 | 1998-04-01 | Pioneer Hi-Bred International, Inc. | HIGH METHIONINE DERIVATIVES OF alfa-HORDOTHIONIN |
US5703049A (en) | 1996-02-29 | 1997-12-30 | Pioneer Hi-Bred Int'l, Inc. | High methionine derivatives of α-hordothionin for pathogen-control |
US5850016A (en) | 1996-03-20 | 1998-12-15 | Pioneer Hi-Bred International, Inc. | Alteration of amino acid compositions in seeds |
EP0946729A2 (en) | 1996-11-01 | 1999-10-06 | Pioneer Hi-Bred International, Inc. | Proteins with enhanced levels of essential amino acids |
WO1999045132A1 (en) | 1998-03-02 | 1999-09-10 | Massachusetts Institute Of Technology | Poly zinc finger proteins with improved linkers |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
WO2000066748A1 (en) | 1999-04-29 | 2000-11-09 | Syngenta Limited | Herbicide resistant plants |
US20020192813A1 (en) | 1999-08-18 | 2002-12-19 | Timothy W. Conner | Plant expression vectors |
US6683231B2 (en) | 2000-06-02 | 2004-01-27 | E. I. Du Pont De Nemours And Company | High level production of p-hydroxybenzoic acid in green plants |
AU2001287862B2 (en) | 2000-09-29 | 2006-12-14 | Syngenta Limited | Herbicide resistant plants |
US7151204B2 (en) | 2001-01-09 | 2006-12-19 | Monsanto Technology Llc | Maize chloroplast aldolase promoter compositions and methods for use thereof |
US7045684B1 (en) | 2002-08-19 | 2006-05-16 | Mertec, Llc | Glyphosate-resistant plants |
KR101447300B1 (ko) | 2006-08-11 | 2014-10-07 | 몬산토 테크놀로지 엘엘씨 | 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산 |
US8338665B2 (en) | 2008-07-16 | 2012-12-25 | Monsanto Technology Llc | Methods and vectors for producing transgenic plants |
CN102369287B (zh) | 2009-04-07 | 2014-09-17 | 陶氏益农公司 | 纳米颗粒介导的序列特异性核酸酶的投递 |
MX2012003981A (es) | 2009-10-06 | 2012-06-12 | Univ California | Generacion de plantas haploides y cruza de plantas mejorada. |
EP2488650A4 (en) | 2009-10-16 | 2013-07-03 | Dow Agrosciences Llc | USE OF DENDRIMERIC NANOTECHNOLOGY FOR THE DELIVERY OF BIOMOLECULES INTO PLANT CELLS |
BR112012024589A2 (pt) | 2010-03-31 | 2017-06-20 | Dow Agrosciences Llc | peptídeo zeína -gama de planta para liberação de biomoléculas em células de plantas |
GB201009732D0 (en) | 2010-06-10 | 2010-07-21 | Gene Bridges Gmbh | Direct cloning |
AU2011274811C1 (en) | 2010-07-07 | 2015-09-24 | Corteva Agriscience Llc | Linear DNA molecule delivery using pegylated quantum dots for stable transformation in plants |
WO2012129443A2 (en) | 2011-03-23 | 2012-09-27 | Dow Agrosciences Llc | Quantum dot carrier peptide conjugates suitable for imaging and delivery applications in plants |
US9464124B2 (en) | 2011-09-12 | 2016-10-11 | Moderna Therapeutics, Inc. | Engineered nucleic acids and methods of use thereof |
CA2852672C (en) | 2011-10-17 | 2021-07-20 | Massachusetts Institute Of Technology | A microfluidic system and method for delivering a payload into a cell by causing perturbations in a cell membrane of the cell |
US20130145488A1 (en) | 2011-12-06 | 2013-06-06 | Iowa State University Research Foundation, Inc. | Mesoporous silica nanoparticles suitable for co-delivery |
US20130185823A1 (en) | 2012-01-16 | 2013-07-18 | Academia Sinica | Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root |
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
US20140096284A1 (en) | 2012-10-01 | 2014-04-03 | Iowa State University Research Foundation, Inc. | Method for the delivery of molecules lyophilized onto microparticles to plant tissues |
SG11201503059XA (en) | 2012-10-23 | 2015-06-29 | Toolgen Inc | Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof |
WO2014093655A2 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP4286402A3 (en) | 2012-12-12 | 2024-02-14 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
DK3064585T3 (da) | 2012-12-12 | 2020-04-27 | Broad Inst Inc | Konstruering og optimering af forbedrede systemer, fremgangsmåder og enzymsammensætninger til sekvensmanipulation |
KR20150105633A (ko) | 2012-12-12 | 2015-09-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작 |
EP2951295B1 (en) | 2013-02-01 | 2018-08-01 | Cellectis | Tevi chimeric endonucleases and their preferential cleavage sites |
US9677082B2 (en) | 2013-03-15 | 2017-06-13 | Syngenta Participations Ag | Haploid induction compositions and methods for use therefor |
US9902973B2 (en) | 2013-04-11 | 2018-02-27 | Caribou Biosciences, Inc. | Methods of modifying a target nucleic acid with an argonaute |
US20150040268A1 (en) | 2013-04-25 | 2015-02-05 | Morflora Israel Ltd | Methods and compositions for the delivery of nucleic acids to seeds |
US20140356414A1 (en) | 2013-06-03 | 2014-12-04 | University Of Southern California | Targeted Crosslinked Multilamellar Liposomes |
US20160145631A1 (en) | 2013-06-14 | 2016-05-26 | Cellectis | Methods for non-transgenic genome editing in plants |
ES2915377T3 (es) | 2013-08-02 | 2022-06-22 | Enevolv Inc | Procedimientos y células huésped para ingeniería genómica, de vías y biomolécular |
US11208628B2 (en) | 2013-08-09 | 2021-12-28 | Massachusetts Institute Of Technology | Nanobionic engineering of organelles and photosynthetic organisms |
MX2016002306A (es) | 2013-08-22 | 2016-07-08 | Du Pont | Promotor u6 de polimerasa iii de soja y metodos de uso. |
US9675078B2 (en) | 2013-10-15 | 2017-06-13 | Board Of Trustees Of The University Of Arkansas | Method of delivery of bio-active agents to plant cells by using nano-sized materials as carriers |
US11186843B2 (en) | 2014-02-27 | 2021-11-30 | Monsanto Technology Llc | Compositions and methods for site directed genomic modification |
CA2953499C (en) | 2014-06-23 | 2023-10-24 | Regeneron Pharmaceuticals, Inc. | Nuclease-mediated dna assembly |
AU2015288157A1 (en) | 2014-07-11 | 2017-01-19 | E. I. Du Pont De Nemours And Company | Compositions and methods for producing plants resistant to glyphosate herbicide |
CN107429241A (zh) | 2014-08-14 | 2017-12-01 | 北京百奥赛图基因生物技术有限公司 | Dna敲入系统 |
AU2015324935B2 (en) | 2014-10-01 | 2021-04-08 | The General Hospital Corporation | Methods for increasing efficiency of nuclease-induced homology-directed repair |
CA2963820A1 (en) * | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
JP6947638B2 (ja) | 2014-12-20 | 2021-10-13 | アーク バイオ, エルエルシー | Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法 |
US10155938B2 (en) | 2015-04-14 | 2018-12-18 | City Of Hope | Coexpression of CAS9 and TREX2 for targeted mutagenesis |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
US11667911B2 (en) | 2015-09-24 | 2023-06-06 | Editas Medicine, Inc. | Use of exonucleases to improve CRISPR/CAS-mediated genome editing |
WO2017074547A1 (en) | 2015-10-30 | 2017-05-04 | Pioneer Hi-Bred International, Inc. | Methods and compositions for rapid plant transformation |
US20170175140A1 (en) | 2015-12-16 | 2017-06-22 | Regents Of The University Of Minnesota | Methods for using a 5'-exonuclease to increase homologous recombination in eukaryotic cells |
US20210332350A1 (en) * | 2016-02-04 | 2021-10-28 | President And Fellows Of Harvard College | Recombinase Genome Editing |
US20190241899A1 (en) | 2016-10-05 | 2019-08-08 | President And Fellows Of Harvard College | Methods of Crispr Mediated Genome Modulation in V. Natriegens |
CA3042259A1 (en) | 2016-11-04 | 2018-05-11 | Flagship Pioneering Innovations V. Inc. | Novel plant cells, plants, and seeds |
CN108085328B (zh) | 2016-11-21 | 2021-06-22 | 中国科学院分子植物科学卓越创新中心 | 一种dna序列编辑的方法 |
US11293019B2 (en) | 2017-12-22 | 2022-04-05 | Gflas Life Sciences, Inc. | Chimeric genome engineering molecules and methods |
EP3810636A1 (en) | 2018-06-25 | 2021-04-28 | Yeda Research and Development Co. Ltd | Systems and methods for increasing efficiency of genome editing |
WO2020041172A1 (en) | 2018-08-21 | 2020-02-27 | The Jackson Laboratory | Methods and compositions for recruiting dna repair proteins |
-
2020
- 2020-06-24 JP JP2021576666A patent/JP2022539338A/ja active Pending
- 2020-06-24 AU AU2020301236A patent/AU2020301236A1/en active Pending
- 2020-06-24 WO PCT/US2020/039410 patent/WO2020264016A1/en unknown
- 2020-06-24 KR KR1020227002110A patent/KR20220052905A/ko unknown
- 2020-06-24 BR BR112021026220A patent/BR112021026220A2/pt unknown
- 2020-06-24 MX MX2021014861A patent/MX2021014861A/es unknown
- 2020-06-24 EP EP20739829.8A patent/EP3990633A1/en active Pending
- 2020-06-24 CA CA3138663A patent/CA3138663A1/en active Pending
- 2020-06-24 CN CN202080044833.1A patent/CN114630910A/zh active Pending
- 2020-06-24 SG SG11202112092TA patent/SG11202112092TA/en unknown
- 2020-06-24 US US16/911,156 patent/US11041172B2/en active Active
- 2020-06-25 AR ARP200101810A patent/AR123323A1/es unknown
-
2021
- 2021-05-21 US US17/326,891 patent/US20210277422A1/en active Pending
- 2021-12-19 IL IL289106A patent/IL289106A/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117487959A (zh) * | 2024-01-02 | 2024-02-02 | 东北农业大学 | 一种与印度南瓜侧枝数量相关基因连锁的分子标记及应用 |
Also Published As
Publication number | Publication date |
---|---|
AR123323A1 (es) | 2022-11-23 |
EP3990633A1 (en) | 2022-05-04 |
WO2020264016A1 (en) | 2020-12-30 |
MX2021014861A (es) | 2022-06-22 |
US20200407754A1 (en) | 2020-12-31 |
US11041172B2 (en) | 2021-06-22 |
BR112021026220A2 (pt) | 2022-02-15 |
CN114630910A (zh) | 2022-06-14 |
JP2022539338A (ja) | 2022-09-08 |
US20210277422A1 (en) | 2021-09-09 |
SG11202112092TA (en) | 2021-11-29 |
CA3138663A1 (en) | 2020-12-30 |
AU2020301236A1 (en) | 2021-11-25 |
IL289106A (en) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11041172B2 (en) | Homology dependent repair genome editing | |
US20230242927A1 (en) | Novel plant cells, plants, and seeds | |
US10590415B2 (en) | Engineered nucleic acid-targeting nucleic acids | |
US12043838B2 (en) | Methods for improved plant gene-editing | |
US11220694B1 (en) | Rice cells and rice plants | |
US20220251585A1 (en) | Novel plant cells, plants, and seeds | |
US20230235349A1 (en) | Novel maize cells and maize plants | |
US20240271154A1 (en) | Genetically enhanced maize plants | |
WO2018187347A1 (en) | Compositions and methods for transferring cytoplasmic or nuclear traits or components | |
Elias et al. | Development of a mesophyll protoplast-based system for gene editing of papaya | |
JP5780596B2 (ja) | 遺伝的に改変された植物細胞の製造方法 | |
WO2019150200A2 (en) | Dna free crispr plant transformation | |
US11319547B1 (en) | Plant transformation | |
US11802288B1 (en) | Methods for efficient soybean genome editing | |
US11926835B1 (en) | Methods for efficient tomato genome editing | |
US11859219B1 (en) | Methods of altering a target nucleotide sequence with an RNA-guided nuclease and a single guide RNA | |
WO2023244269A1 (en) | Genetically enhanced maize plants | |
Dhiman et al. | Plant regeneration, genetic transformation and expression of gus gene in broccoli | |
WO2024191756A2 (en) | Mobile genomic editing reagents and methods for scion editing |