KR20230156150A - 제vi형 crispr 오솔로그 및 시스템 - Google Patents

제vi형 crispr 오솔로그 및 시스템 Download PDF

Info

Publication number
KR20230156150A
KR20230156150A KR1020237037115A KR20237037115A KR20230156150A KR 20230156150 A KR20230156150 A KR 20230156150A KR 1020237037115 A KR1020237037115 A KR 1020237037115A KR 20237037115 A KR20237037115 A KR 20237037115A KR 20230156150 A KR20230156150 A KR 20230156150A
Authority
KR
South Korea
Prior art keywords
rna
target
protein
cell
sequence
Prior art date
Application number
KR1020237037115A
Other languages
English (en)
Inventor
펑 장
오마르 오 아부다예
조나단 구텐버그
에릭 에스 랜더
Original Assignee
더 브로드 인스티튜트, 인코퍼레이티드
매사추세츠 인스티튜트 오브 테크놀로지
프레지던트 앤드 펠로우즈 오브 하바드 칼리지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 브로드 인스티튜트, 인코퍼레이티드, 매사추세츠 인스티튜트 오브 테크놀로지, 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 filed Critical 더 브로드 인스티튜트, 인코퍼레이티드
Publication of KR20230156150A publication Critical patent/KR20230156150A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)
  • Compounds Of Unknown Constitution (AREA)

Abstract

본 발명은 핵산을 표적화하기 위한 시스템, 방법, 및 조성물을 제공한다. 구체적으로, 본 발명은 신규 RNA-표적화 CRISPR 이펙터 단백질 및 가이드 RNA와 같은 적어도 하나의 표적화 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 RNA-표적화 시스템을 제공한다.

Description

제VI형 CRISPR 오솔로그 및 시스템 {TYPE VI CRISPR ORTHOLOGS AND SYSTEMS}
관련 출원 및 참조에 의한 포함
본 출원은 2016년 6월 17일에 출원된 미국 임시 출원 62/351,662 및 62/351,803, 2016년 8월 17일에 출원된 미국 임시 출원 62/376,377, 2016년 10월 19일에 출원된 미국 임시 출원 62/410,366, 2016년 12월 9일에 출원된 미국 임시 출원 62/432,240, 2017년 3월 15일에 출원된 미국 임시 출원 62/471,792, 2017년 4월 12일에 출원된 미국 출원 62/484,786에 대한 우선권을 주장한다.
2017년 3월 15일에 출원된 미국 임시 출원 62/471,710가 참조된다(제목 "Novel Cas13B Orthologues CRISPR Enzymes and Systems," 대리인 참조번호: BI-10157 VP 47627.04.2149). 2016년 12월 9일에 출원된 미국 임시 출원 62/432,553, 2017년 2월 8일에 출원된 미국 임시 출원 62/456,645, 및 2017년 3월 15일에 출원된 미국 임시 출원 62/471,930(제목 "CRISPR Effector System Based Diagnostics," 대리인 참조번호 BI-10121 BROD 0842P) 및 2017 년 4월 12일에 출원된 미국 임시 출원 번호 미지정(제목 "CRISPR Effector System Based Diagnostics," 대리인 참조번호 BI-10121 BROD 0843P)가 추가로 참조된다.
본 명세서에 인용된 문헌들에서 인용되거나 언급된 모든 문헌은, 본 명세서에 언급된 임의의 제품에 대한 임의의 제조사의 지침서, 설명서, 제품 명세서 및 제품 시트(sheet) 또는 본 명세서에 참조로 포함된 임의의 문헌과 함께, 본 명세서에 참조로 포함되어 있으며, 본 발명의 실시에 이용될 수 있다. 더 구체적으로, 모든 참조된 문헌은, 마치 각각의 개별 문헌을 참조로 포함하는 것으로 특정적으로 그리고 개별적으로 나타내는 것과 동일한 정도로 참조로 포함된다.
연방 정부가 후원하는 연구에 대한 성명
본 발명은 미국 국립 보건원(National Institutes of Health)에 의해 지급된 승인 번호 MH100706 및 MH110049 하에 정부 지원으로 수행되었다. 정부는 본 발명에 대해 특정 권리를 갖는다.
발명의 분야
본 발명은 일반적으로 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats; CRISPR)와 관련된 벡터 시스템 및 이의 성분을 사용할 수 있는, 서열 표적화를 수반하는 유전자 발현의 제어, 예를 들어 유전자 전사물의 변동(perturbation) 또는 핵산 편집에 사용되는 시스템, 방법 및 조성물에 관한 것이다.
최근 게놈 시퀀싱 기법 및 분석 방법의 진보는 다양한 범위의 생물학적 기능 및 질환과 연관된 유전적 요인을 목록화하고 매핑하는 능력을 상당히 가속화시켰다. 개별적인 유전 요소의 선택적인 변동을 허용함으로써 원인이 되는 유전 변이의 체계적인 역조작(reverse engineering)을 가능하게 할 뿐만 아니라, 합성 생물학, 생명공학, 및 의학 응용 분야를 진전시키기 위하여, 정확한 게놈 표적화 기술이 필요하다. 게놈-편집 기법, 예를 들어 설계자 징크 핑거(designer zinc finger), 전사 활성자-유사 이펙터(transcription activator-like effector; TALE), 또는 귀소 메가뉴클레아제(homing meganuclease)가 표적화된 게놈 변동을 생성하는 데 이용 가능하지만, 신규 전략과 분자 메커니즘을 이용하고, 입수 가능하며, 설정하기 쉽고, 확장성이 있으며, 진핵세포 게놈 및 트랜스크립톰 내의 다수의 위치를 표적화할 수 있는 새로운 게놈 및 트랜스크립톰 조작 기술에 대한 필요성이 계속 남아 있다. 이는 게놈 조작 및 생명공학에서 새로운 응용 분야에 대한 주요 자원을 제공할 것이다.
박테리아 및 고박테리아의(archaeal) 적응 면역의 CRISPR-Cas 시스템은 단백질 조성 및 게놈 유전자좌 구조의 극단적인 다양성을 나타낸다. CRISPR-Cas 시스템 유전자좌는 50 개 초과의 유전자 패밀리를 가지며, 유전자좌 구조의 빠른 진화 및 극단적인 다양성을 나타내는 엄격한 보편적 유전자는 존재하지 않는다. 지금까지는, 다면적인 접근법을 채택하여, 93 개의 Cas 단백질에 대해 약 395 개의 프로파일의 포괄적인 cas 유전자 확인이 있다. 분류는 유전자 프로파일의 특징 및 유전자좌 구조의 특징을 포함한다. CRISPR-Cas 시스템의 새로운 분류가 제안되어 있으며, 여기서 이들 시스템은 광범위하게 2 개의 부류, 즉 다수 서브유닛 이펙터 복합체를 갖는 클래스 1 및 Cas9 단백질로 예시되는 단일-서브유닛 이펙터 모듈을 갖는 클래스 2로 나뉜다. 클래스 2 CRISPR-Cas 시스템과 연관된 신규 이펙터 단백질은 강력한 게놈 설계 제작 도구로서 개발될 수 있으며, 추정상의 신규 이펙터 단백질 및 이의 설계 제작 및 최적화의 예측이 중요하다.
CRISPR-Cas 적응 면역 시스템은 DNA 또는 RNA-DNA 간섭을 통해 외래 유전 요소에 대항하여 미생물을 방어한다. 최근, 클래스 2 제VI형 단일-성분 CRISPR-Cas 이펙터 C2c2(문헌[Shmakov et al.(2015) "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems"; Molecular Cell 60:1-13; doi: http://dx.doi.org/10.1016/j.molcel.2015.10.008])는 RNA-가이드된 알엔아제로 특징 확인되었다(문헌[Abudayyeh et al. (2016), Science, [인쇄 전 전자간행], June 2; "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector"; doi: 10.1126/science.aaf5573]). C2c2(예를 들어 렙토트리키아 샤히(Leptotrichia shahii) 유래)가 RNA 파지 감염에 대항하여 견고한 간섭을 제공함이 입증되었다. 시험관내 생화학 분석 및 생체내 분석을 통해, C2c2가 3'H(G가 아님) PAM 측면에 배치된 프로토스페이서를 갖는 ssRNA 표적을 절단하도록 프로그래밍될 수 있음이 나타났다. 절단은 촉매적으로 비활성인 RNA-결합 단백질을 생성하는 돌연변이인 C2c2의 2 개의 보존된 HEPN 도메인에서 촉매성 잔기에 의해 매개된다. C2c2는 단일 가이드에 의해 가이드되며 생체내 특정 mRNA를 손실시키도록 재프로그래밍될 수 있다. LshC2c2는 관심 있는 특정 부위에 표적화될 수 있고 일단 동족 표적 RNA로 프라이밍되면 비-특이적인 알엔아제 활성을 수행할 수 있음이 나타났다. 이들 결과는 CRISPR-Cas 시스템에 대한 이해를 넓히고 광범위한 RNA-표적화 도구 세트를 개발하기 위해 C2c2를 활용할 가능성을 입증한다.
C2c2는 현재 Cas13a로 알려져 있다. 본 명세서에서 용어 "C2c2"는 "Cas13a"와 상호 교환 가능하게 사용되는 것으로 이해될 것이다.
이 출원에서의 임의의 문헌의 인용 또는 확인은 이러한 문헌이 본 발명의 선행 기술로서 이용 가능함을 인정하는 것이 아니다.
핵산 또는 폴리뉴클레오티드(예를 들어, DNA 또는 RNA 또는 그의 임의의 하이브리드 또는 유도체)를 넓은 적용, 구체적으로 진핵 생물 시스템, 더욱 구체적으로 포유류 시스템에서 표적화하기 위한 대안적이고 견고한 시스템 및 기법에 대한 절실한 필요성이 존재한다. 본 발명은 이 필요성을 해결하고 관련 이점을 제공한다. 본 출원의 신규한 RNA-표적화 시스템을 게놈, 트랜스크립톰 및 후성유전체 표적화 기법의 목록에 추가하는 것은, 구체적으로 진핵 생물 시스템, 더욱 구체적으로 포유류 시스템(세포, 기관, 조직 또는 생물을 포함) 및 식물 시스템에서의, 직접 검출, 분석 및 조작을 통해 특정 표적 부위의 연구 및 변동 또는 편집을 변환시킬 수 있다. 유해 효과없이 RNA 표적화를 위해 본 출원의 RNA-표적화 시스템을 효과적으로 활용하기 위해서는, 이들 RNA 표적화 도구의 설계 제작 측면 및 최적화 측면을 이해하는 것이 중요하다.
CRISPR-Cas13 패밀리는 CRISPR 시스템의 특징에 대한 박테리아 게놈의 컴퓨터 마이닝(문헌[Shmakov, S. et al. Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems. Mol Cell 60, 385-397, doi:10.1016/j.molcel.2015.10.008 (2015)])에 의해 단일-이펙터 RNA-가이드된 알엔아제 Cas13a/C2c2(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]) 및 이후에 단일-이펙터 RNA-가이드된 알엔아제 Cas13b(문헌[Shmakov, S. et al. Diversity and evolution of class 2 CRISPR-Cas systems. Nat Rev Microbiol 15, 169-182, doi:10.1038/nrmicro.2016.184 (2017)]; 문헌[Smargon, A. A. et al. Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28. Mol Cell 65, 618-630 e617, doi:10.1016/j.molcel.2016.12.023 (2017)])를 밝혀내며 발견되었다. Cas13a라고도 알려진, 클래스 2 제VI형의 이펙터 단백질 C2c2는 ssRNA를 분해하도록 효율적으로 프로그래밍될 수 있는 RNA-가이드된 알엔아제이다. C2c2(Cas13a)는 CRISPR-Cas 시스템에서 발견되는 다른 알려진 알엔아제의 촉매 메커니즘과 달리 2 개의 HEPN 도메인 내에 보존된 염기성 잔기를 통해 RNA 절단을 달성한다. 4 개의 예상되는 HEPN 도메인 촉매성 잔기 중 임의의 것에서의 (예를 들어, 알라닌) 치환과 같은, HEPN 도메인의 돌연변이는 C2c2를 비활성 프로그래밍 가능한 RNA-결합 단백질(dC2c2, dCas9와 유사)로 전환시킨다.
RNA-가이드된 알엔아제 Cas13의 프로그래밍 가능성 및 특이성은 그것을 트랜스크립톰 조작을 위한 이상적인 플랫폼으로 만들 것이다. 출원인은 포유류 전사물 녹다운 및 결합 도구로 사용하기 위해 Cas13a를 개발한다. 렙토트리키아 샤히 유래의 Cas13a(LshCas13a)는 프로그래밍 가능한 crRNA를 사용하여 촉매적으로 비활성 버전으로 견고한 RNA 절단 및 결합을 할 수 있고 그 절단은 동일성 H(구아닌이 아님)를 갖는 프로토스페이서 측면 부위(PFS)로 알려진 바로 3'-인접 모티프에 의존한다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). RNA 절단 시, 활성화된 LshCas13a는 구성적 알엔아제 활성이 비-표적화된 RNA를 절단하는 "부수적 활성"에 참여한다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 이 crRNA-프로그밍된 부수적 활성은 감염의 확산을 막기 위해 박테리아에 의해 생체내 프로그래밍된 세포 사멸을 가능하게 하고(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]), 시험관내 핵산의 특이적 검출에 적용되었다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]; 문헌[East-Seletsky, A. et al. Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection. Nature 538, 270-273, doi:10.1038/nature19802 (2016)]). 부수적 활성은 최근 많은 임상 진단에 유용한 SHERLOCK이라고 지칭되는 매우 민감하고 특이적인 핵산 검출 플랫폼에 대해 영향을 받았다(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 356, 438-442 (2017)]).
박테리아에서의 Cas13a 오솔로그(ortholog) 스크리닝 및 후속 생화학적 특징 확인을 통해, 출원인은 RNA 엔도뉴클레아제 활성에 대해 최적화된 오솔로그인 렙토트리키아 와데이 유래의 Cas13a(LwaCas13a)를 선택한다. LwaCas13a는 포유류 세포에서 안정적으로 발현되고, 세포 내에서 리포터 및 내인성 전사물 모두를 효과적으로 녹다운하기 위해 재표적화될 수 있고, 관찰 가능한 부수적 활성 없이 RNAi와 비교하여 높은 수준의 표적화 특이성 수준을 달성한다. 또한, 출원인은 촉매적으로 비활성인 LwaCas13a(dCas13a)가 생체내에서 프로그래밍 가능하게 RNA 전사물에 결합하고 세포에서 전사물을 이미징하는 데 사용될 수 있음을 보여준다. dCas13a에 기반한 음성-피드백 이미징 시스템을 설계 제작함으로써, 스트레스 과립의 형성을 살아있는 세포에서 추적할 수 있다.
특정된 서열에 결합하는 dC2c2(dCas13a)의 능력은 본 발명에 따른 몇몇 양태에서 (i) 대규모 스크리닝, 합성 조절 회로 구축 및 기타 목적에 사용될 수 있는, 기능 또는 번역 조절을 위해 특정 전사물로 이펙터 모듈을 가져오고; (ii) 그들의 운행 및/또는 국소화를 시각화하기 위해 특정 RNA를 형광으로 표지하고; (iii) 특정 세포 내 구획에 대한 친화성을 갖는 도메인을 통해 RNA 국소화를 변경하고; (iv) RNA 및 단백질을 포함하는 근접한 분자 파트너에 대해 강화하기 위해 (dC2c2의 직접 풀다운(pull down) 또는 바이오틴 리가제 활성을 특정 전사물로 국소화하기 위한 dC2c2의 사용을 통해) 특정 전사물을 포획하는 것에 사용될 수 있다.
활성 C2c2는 또한 많은 응용을 가져야 한다. 본 발명의 일 양태는 여기에서 RFP를 이용하는 것과 같이, 파괴를 위하여 특정 전사물을 표적화하는 것을 포함한다. 추가적으로, 일단 동족 표적에 의해 프라이밍되면, C2c2는 시험관내에서 다른 (비-상보성) RNA 분자를 절단할 수 있고 생체내에서 세포 성장을 저해할 수 있다. 생물학적으로, 이 잡다한 알엔아제 활성은 제VI형 CRISPR-Cas 시스템의 프로그래밍된 세포 사멸/휴면(PCD/D)-기반 보호 메카니즘을 반영할 수 있다. 따라서, 본 발명의 일 양태에서, 특정 세포-예를 들어 구체적인 전사물을 발현하는 암세포, 주어진 클래스의 뉴런, 특정 병원체에 의해 감염된 세포, 또는 다른 비정상 세포 또는 달리 그 존재를 원하지 않는 세포에서의 PCD 또는 휴면을 유발하기 위해 사용될 수 있다.
본 발명은 하기에 관한 것이다.
[1] 포유류의 관심 표적 유전자좌를 변형시키는 방법으로서, 방법은 하나 이상의 국소화 신호에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 방법.
[2] 하나 이상의 국소화 신호에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 포유류의 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[3] 하나 이상의 국소화 신호에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물의 용도로서, 여기서 적어도 하나 이상의 핵산 성분은 포유류의 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 용도.
[4] [1] 내지 [3] 또는 [58] 및 [59] 중 어느 하나에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 방법, 조성물, 또는 용도.
[5] [1] 내지 [4] 또는 [58] 및 [59] 중 어느 하나에 있어서, 상기 국소화 신호는 핵 국소화 신호(NLS) 또는 핵 방출 신호(NES), 바람직하게는 NES인, 방법, 조성물, 또는 용도.
[6] [1] 내지 [5] 중 어느 하나에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 방법.
[7] [1] 내지 [6] 또는 [58] 및 [59] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 포유류 세포에서의 발현을 위해 코돈 최적화된, 방법, 조성물, 또는 용도.
[8] [1] 내지 [7] 또는 [58] 및 [59] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 방법, 조성물, 또는 용도.
[9] [8]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 방법, 조성물, 또는 용도.
[10] [1] 내지 [9] 또는 [58] 및 [59] 중 어느 하나에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 방법, 조성물, 또는 용도.
[11] [1] 내지 [10] 또는 [58] 및 [59] 중 어느 하나에 있어서, 상기 변형시키는 것은 생체내 또는 생체외에서인, 방법, 조성물, 또는 용도.
[12] [1] 내지 [11] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 방법, 조성물, 또는 용도.
[13] [1] 내지 [12] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 방법, 조성물, 또는 용도.
[14] [1] 내지 [13] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 방법, 조성물, 또는 용도.
[15] [14]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 방법, 조성물, 또는 용도.
[16] [14] 또는 [15]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[17] [14] 또는 [15]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[18] [16] 또는 [17]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[19] [18]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[20] [14] 또는 [15]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [16] 또는 [17]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [1] 내지 [13] 또는 [58] 내지 [59] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 방법, 조성물, 또는 용도.
[21] [1] 내지 [20] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 방법, 조성물, 또는 용도.
[22] [1] 내지 [21] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물.
[23] 하나 이상의 NLS 또는 NES에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 포유류의 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[24] [23]에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 조성물.
[25] [23] 또는 [24]에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 조성물.
[26] [23] 또는 [24]에 있어서, C2c2 이펙터 단백질은 포유류 세포에서의 발현을 위해 코돈 최적화된, 조성물.
[27] [23] 또는 [24]에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 조성물.
[28] [27]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 조성물.
[29] [27] 또는 [28]에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 조성물.
[30] [27] 내지 [29] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 조성물.
[31] [27] 내지 [30] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 조성물.
[32] [27] 내지 [31] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 조성물.
[33] [32]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 조성물.
[34] [32] 또는 [33]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 조성물.
[35] [32] 또는 [33]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 조성물.
[36] [34] 또는 [35]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 조성물.
[37] [36]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 조성물.
[38] [32] 또는 [33]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [34] 또는 [35]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [23] 내지 [31] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 조성물.
[39] [1] 내지 [38] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 조성물.
[40] 하나 이상의 벡터를 포함하는 벡터 시스템으로서, 하나 이상의 벡터는 [1] 내지 [39] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레외드 분자를 포함하는, 벡터 시스템.
[41] [1] 내지 [40] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 전달하도록 구성된 전달 시스템.
[42] [41]에 있어서, 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하고, 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 [1] 내지 [41] 중 어느 하나에 정의된 바와 같은 특징을 갖는 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함하는, 전달 시스템.
[43] 치료의 치료적 방법에서의 사용을 위한, [1] 내지 [42] 또는 [44] 내지 [161] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템.
[44] [1] 내지 [43] 또는 [45] 내지 [161] 중 어느 하나의 조성물 또는 이의 성분을, 선택적으로 유도성으로 또는 구성적으로, 포함하거나 발현하도록 설계 제작되거나, 방법에 따라 변형된 포유류 세포.
[45] [44]에 있어서, 변형은 다음을 초래하는, 포유류 세포:
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포;
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 증가되는 세포; 또는
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 감소되는 세포.
[46] 포유류 세포에서의 생체내 또는 생체외에서 다음 사용을 위한, [1] 내지 [45] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[47] [44] 내지 [45] 중 어느 하나에 따른 세포, 또는 이의 자손의 또는 이를 포함하는 세포주.
[48] [44] 또는 [45]에 따른 하나 이상의 세포를 포함하는 포유동물.
[49] [44] 또는 [45]에 따른 하나 이상의 세포를 포함하는 포유류 모델로서; 상기 세포(들)는 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [48] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 포유류 모델.
[50] [44] 또는 [45]의 세포, 또는 [47] 또는 [48]의 세포주 또는 생물 또는 [49]의 포유류 모델로부터의 생산물로서, 상기 세포 또는 세포주의 세포(들) 또는 포유류 모델의 포유동물은 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [49] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 생산물.
[51] [50]에 있어서, 생산물의 양은 [1] 내지 [50] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물의 양보다 더 많거나 더 적은, 생산물.
[52] [50]에 있어서, 생산물은 [1] 내지 [51] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물과 비교하여 변경된, 생산물.
[53] [1] 내지 [52] 또는 [54] 내지 [161] 중 어느 하나의 시스템 또는 방법 또는 세포를 포함하는 분석, 스크리닝 방법 또는 돌연변이 유발 방법.
[54] RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법으로서, 여기서 개선은 RNA를 사용하는 것 대신에, 방법은 [1] 내지 [53] 중 어느 하나에서와 같은 조성물을 사용하는 것을 포함하는, 방법.
[55] [53]에 있어서, RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법은 RNAi 또는 형광 인 시츄 혼성화 방법인, 방법.
[56] [1] 내지 [55] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 포유류 세포에서의, 바람직하게는 생체내 또는 생체외에서의 다음을 위한 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[57] [1] 내지 [21] 중 어느 하나에 있어서, 상기 방법은 다음을 초래하는, 방법 또는 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[58] 포유류 세포에서의 다음을 위한 방법으로서, [1] 내지 [57] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 표적 세포에서 시험관내, 생체외, 또는 생체내 도입하거나 유도하는 것을 포함하는 방법:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[59] 포유류의 관심 표적 유전자좌의 번역을 조절하는 방법으로서, 방법은 하나 이상의 국소화 신호뿐만 아니라 번역 활성화제 또는 번역 억제제와 같은 (이종) 번역 조절제에 융합된 C2c2 이펙터 단백질; 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌로 전달하는 것을 포함하고; 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하며, 바람직하게는 여기서 상기 이종 도메인은 EIF4, 예를 들어 EIF4E인, 방법.
[60] [59]에 있어서, 상기 C2c2 이펙터 단백질은 촉매적으로 비활성인, 방법.
[61] [1] 내지 [60] 중 어느 하나에 있어서, 상기 C2c2는 렙토트리키아 샤히(Leptotrichia shahii) C2c2, 렙토트리키아 와데이(Leptotrichia wadei) F0279(Lw2) C2c2, 리스테리아 세엘리게리(Listeria seeligeri) C2c2, 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리디움 아미노필룸(Clostridium aminophilum) DSM 10710 C2c2, 카르노박테리움 갈리나룸(Carnobacterium gallinarum) DSM 4847 C2c2, 카르노박테리움 갈리나룸 DSM 4847 C2c2, 팔루디박터 프로피오니시게네스(Paludibacter propionicigenes) WB4 C2c2, 리스테리아 웨이헨스테파넨시스(Listeria weihenstephanensis) FSL R9-0317, C2c2, 리스테리아세아에 박테리움(Listeriaceae bacterium) FSL M6-0635 C2c2, 렙토트리키아 와데이 F0279 C2c2, 로도박터 캅술라투스(Rhodobacter capsulatus) SB 1003 C2c2, 로도박터 캅술라투스R121 C2c2, 로도박터 캅술라투스 DE442 C2c2를 포함하는 군으로부터 선택되는, 방법, 조성물, 용도, 벡터 시스템, 전달 시스템, 세포, 포유동물, 포유류 모델, 생산물, 또는 분석.
[62] [1] 내지 [59] 중 어느 하나에 있어서, 상기 C2c2는 렙토트리키아 와데이 F0279 (Lw 또는 Lw2) C2c2 또는 리스테리아 뉴요켄시스(Listeria newyorkensis) FSL M6-0635 (LbFSL) C2c2인, 방법, 조성물, 용도, 벡터 시스템, 전달 시스템, 세포, 포유동물, 포유류 모델, 생산물, 또는 분석.
[63] (a) 샘플을
i) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질,
ii) 표적 RNA로 혼성화할 수 있는 가이드 RNA, 및
iii) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터와 함께 인큐베이션하는 것,
(b) 상기 RNA-기반 절단 유도성 리포터의 절단에 의해 생성되는 신호에 기반하여 상기 표적 RNA를 검출하는 것을 포함하는,
샘플에서 표적 RNA를 검출하는 방법.
[64] [63]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 C2c2 이펙터 단백질인, 방법.
[65] [63]에 있어서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함하는, 방법.
[66] [63]에 있어서, 샘플은 무-세포 생물학적 샘플을 포함하는, 방법.
[67] [63]에 있어서, 샘플은 세포 샘플을 포함하는, 방법.
[68] [67]에 있어서, 세포 샘플은 식물 세포를 포함하는, 방법.
[69] [67]에 있어서, 세포 샘플은 동물 세포를 포함하는, 방법.
[70] [67]에 있어서, 세포 샘플은 암세포를 포함하는, 방법.
[71] [63]에 있어서, 표적 RNA는 병원체 RNA를 포함하는, 방법.
[72] [71]에 있어서, 병원체는 바이러스, 박테리아, 균류 또는 기생충을 포함하는, 방법.
[73] [63]에 있어서, 표적 RNA 내의 단일 뉴클레오티드 다형성 또는 RNA 전사물의 스플라이스 변이체를 검출하도록 설계된 가이드 RNA를 포함하는, 방법.
[74] [63]에 있어서, 가이드 RNA는 표적 RNA와의 하나 이상 미스 매치되는 뉴클레오티드를 포함하는, 방법.
[75] [63]에 있어서, 가이드 RNA는 질병 상태에 대해 진단적인 표적 분자에 결합하는, 방법.
[76] [75]에 있어서, 질병 상태는 암을 포함하는, 방법.
[77] [75]에 있어서, 질병 상태는 자가면역 질병을 포함하는, 방법.
[78] [63]에 있어서, C2c2 이펙터 단백질은 렙토트리키아(Leptotrichia), 리스테리아(Listeria), 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팍토르(Filifactor), 유박테리움(Eubacterium), 스트렙토코커스(Streptococcus), 락토바실러스(Lactobacillus), 미코플라스마(Mycoplasma), 박테로이데스(Bacteroides), 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루콘아세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코커스(Staphylococcus), 니트라티프락토르(Nitratifractor), 미코플라스마 캄필로박터(Campylobacter)로 구성되는 군으로부터 선택되는 생물 유래인, 방법.
[79] a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질,
b) 표적 RNA에 결합할 수 있는 가이드 RNA, 및
c) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, 리보 핵산(RNA) 검출 시스템.
[80] [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 C2c2 이펙터 단백질인, RNA 검출 시스템.
[81] [79]에 있어서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함하는, RNA 검출 시스템.
[82] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 렙토트리키아 샤히 C2c2, 라크노스피라세아에 박테리움 MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리디움 아미노필룸(DSM 10710) C2c2, 카르노박테리움 갈리나룸(DSM 4847) C2c2, 팔루디박터 프로피오니시게네스(WB4) C2c2, 리스테리아 웨이헨스테파넨시스(FSL R9-0317) C2c2, 리스테리아세아에 박테리움(FSL M6-0635) C2c2, 리스테리아 뉴요켄시스(FSL M6-0635) C2c2, 렙토트리키아 와데이(F0279) C2c2, 로도박터 캅술라투스(SB 1003) C2c2, 로도박터 캅술라투스(R121) C2c2, 로도박터 캅술라투스(DE442) C2c2, 렙토트리키아 와데이(Lw2) C2c2, 또는 리스테리아 세엘리게리 C2c2 중 임의의 것의 야생형 서열에 적어도 80% 서열 상동성을 갖는 아미노산 서열을 포함하는, 방법 또는 RNA 검출 시스템.
[83] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 적어도 하나의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[84] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 2 개의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[85] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 RxxxxH 모티프를 포함하는 적어도 하나의 촉매적으로 활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[86] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 각각 RxxxxH 모티프를 포함하는 2 개의 촉매적으로 활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[87] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 야생형 RxxxxH 모티프의 R 또는 H 중 적어도 하나를 돌연변이시키는 것으로부터 수득되는 적어도 하나의 촉매적으로 비활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[88] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 각각 야생형 RxxxxH 모티프의 R 또는 H 중 적어도 하나를 돌연변이시키는 것으로부터 수득되는 2 개의 촉매적으로 비활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[89] a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, 및
b) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, 키트.
[90] 2 개의 상이한 촉매적으로 비활성의 C2c2 이펙터 단백질을 포함하는 조성물.
[91] [90]에 있어서, 상이한 C2c2 이펙터 단백질 각각은 상이한 리포터 분자에 연결된, 조성물.
[92] [90] 또는 [91]에 있어서, 리포터 분자는 상이한 에피토프 태그 및/또는 형광 분자로부터 개별적으로 선택되는, 조성물. 연구 및 진단 용도 및 바람직하게는 다-색 이미징을 위한 [90] 내지 [92] 중 어느 하나의 조성물의 용도.
[93] 하나 이상의 변형되거나 돌연변이된 아미노산 잔기를 갖는 C2c2 이펙터 단백질로서, 하나 이상의 변형되거나 돌연변이된 아미노산 잔기는, C2c2 컨센서스 넘버링에 따라, K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, L597, V602, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2에서의 것들 중 하나 이상이고, 바람직하게는, C2c2 컨센서스 넘버링에 따라, K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2에서의 것들 중 하나 이상으로부터 선택되며;
하나 이상의 변형되거나 돌연변이된 아미노산 잔기는, 도 67에 표시된 컨센서스 서열에 따라, M35, K36, T38, K39, I57, E65, G66, L68, N84, T86, E88, I103, N105, E123, R128, R129, K139, L152, L194, N196, K198, N201, Y222, D253, I266, F267, S280, I303, N306, R331, Y338, K389, Y390, K391, I434, K435, L458, D459, E462, L463, I478, E479, K494, R495, N498, S501, E519, N524, Y529, V530, G534, K535, Y539, T549, D551, R577, E580, A581, F582, I587, A593, L597, I601, L602, E611, E613, D630, I631, G633, K641, N646, V669, F676, S678, N695, E703, A707, I709, I713, I716, R717, H722, F740, F742, K768, I774, K778, I783, L787, S789, V792, Y796, D799, F812, N818, P820, F821, V822, P823, S824, F825, Y829, K831, D837, L852, F858, E867, A871, L875, K877, Y880, Y881, F884, F888, F896, N901, V903, N915, K916, R918, Q920, E951, P956, Y959, Q964, I969, N994, F1000, I10001, Q1003, F10005, K1007, G1008, F1009, N1019, L1020, K1021, I1023, N1028, E1070, I1075, K1076, F1092, K1097, L1099, L1104, L1107, K1113, Y1114, E1149, E1151, I1153, L1155, L1158, D1166, L1203, D1222, G1224, I1228, R1236, K1243, Y1244, G1245, D1255, K1261, S1263, L1267, E1269, K1274, I1277, E1278, L1289, H1290, A1294, N1320, K1325, E1327, Y1328, I1334, Y1337, K1341, N1342, K1343, N1350, L1352, L1355, L1356, I1359, L1360, R1362, V1363, G1364, Y1365, I1369, R1371, D1372, F1385, E1391, D1459, K1463, K1466, R1509, N1510, I1512, A1513, H1514, N1516, Y1517, L1529, L1530, E1534, L1536, R1537, Y1543, D1544, R1545, K1546, L1547, K1548, N1549, A1550, K1553, S1554, D1557, I1558, L1559, G1563, F1568, I1612, L1651, E1652, K1655, H1658, L1659, K1663, T1673, S1677, E1678, E1679, C1681, V1684, K1685, E1689에 상응하는 C2c2에서의 것들 중 하나 이상이며,
하나 이상의 변형되거나 돌연변이된 아미노산 잔기는, 도 66에 표시된 컨센서스 서열에 따라, K28, K31, R44, E162, E184, K262, E288, K357, E360, K338, R441 (HEPN), H446 (HEPN), E471, K482, K525, K558, D707, R790, K811, R833, E839, R885, E894, R895, D896, K942, R960 (HEPN), H965 (HEPN), D990, K992, K994에 상응하는 C2c2에서의 것들 중 하나 이상인, C2c2 이펙터 단백질.
[94] 관심 표적 유전자좌를 변형시키는 방법으로서, 방법은 [93]에 따른 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 방법.
[95] [1]에 따른 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[96] [93]에 따른 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물의 용도로서, 여기서 적어도 하나 이상의 핵산 성분은 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 용도.
[97] [93] 내지 [96] 중 어느 하나에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 방법, 조성물, 또는 용도.
[98] [93] 내지 [97] 중 어느 하나에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 방법.
[99] [93] 내지 [98] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 진핵 세포에서의 발현을 위해 코돈 최적화된, 방법, 조성물, 또는 용도.
[100] [93] 내지 [99] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 방법, 조성물, 또는 용도.
[101] [100]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 방법, 조성물, 또는 용도.
[102] [93] 내지 [101] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 적어도 하나 이상의 핵 국소화 신호 또는 핵 방출 신호를 포함하는, 방법, 조성물, 또는 용도.
[103] [93] 내지 [102] 중 어느 하나에 있어서, 관심 표적 유전자좌는 시험관내의 핵산 분자에 포함되어 있는, 방법, 조성물, 또는 용도.
[104] [93] 내지 [10] 중 어느 하나에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 방법, 조성물, 또는 용도.
[105] [104]에 있어서, 세포는 원핵 세포를 포함하는, 방법, 조성물, 또는 용도.
[106] [12]에 있어서, 세포는 진핵 세포를 포함하는, 방법.
[107] [93] 내지 [106] 중 어느 하나에 있어서, 상기 변형시키는 것은 시험관내, 생체내 또는 생체외에서인, 방법, 조성물, 또는 용도.
[108] [93] 내지 [107] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 방법, 조성물, 또는 용도.
[109] [93] 내지 [108] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 방법, 조성물, 또는 용도.
[110] [93] 내지 [109] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 방법, 조성물, 또는 용도.
[111] [110]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 방법, 조성물, 또는 용도.
[112] [110] 또는 [111]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[113] [110] 또는 [111]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[114] [112] 또는 [113]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[115] [114]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[116] [110] 내지 [111] 중 어느 하나에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [112] 또는 [113]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [93] 내지 [109] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 방법, 조성물, 또는 용도.
[117] [93] 내지 [116] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 방법, 조성물, 또는 용도.
[118] [93] 내지 [117] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물.
[119] C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[120] [119]에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 조성물.
[121] [119] 또는 [120]에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 조성물.
[122] [119] 또는 [120]에 있어서, C2c2 이펙터 단백질은 진핵 세포에서의 발현을 위해 코돈 최적화된, 조성물.
[123] [119] 또는 [120]에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 조성물.
[124] [123]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 조성물.
[125] [119] 내지 [124] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 적어도 하나 이상의 핵 국소화 신호를 포함하는, 조성물.
[126] [119]에 있어서, 관심 표적 유전자좌는 시험관내의 핵산 분자에 포함되어 있는, 조성물.
[127] [119]에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 조성물.
[128] [127]에 있어서, 세포는 원핵 세포를 포함하는, 조성물.
[129] [127]에 있어서, 세포는 진핵 세포를 포함하는, 조성물.
[130] [119] 내지 [129] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 조성물.
[131] [119] 내지 [130] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 조성물.
[132] [119] 내지 [127] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 조성물.
[133] [128]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 조성물.
[134] [132] 또는 [133]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 조성물.
[135] [132] 또는 [133]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 조성물.
[136] [134] 또는 [135]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 조성물.
[137] [136]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 조성물.
[138] [132] 또는 [133]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [134] 또는 [135]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [119] 내지 [127] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 조성물.
[139] [1] 내지 [138] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 조성물.
[140] 하나 이상의 벡터를 포함하는 벡터 시스템으로서, 하나 이상의 벡터는 [1] 내지 [139] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레외드 분자를 포함하는, 벡터 시스템.
[141] [1] 내지 [140] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 전달하도록 구성된 전달 시스템.
[142] [141]에 있어서, 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하고, 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 [1] 내지 [141] 중 어느 하나에 정의된 바와 같은 특징을 갖는 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함하는, 전달 시스템.
[143] 치료의 치료적 방법에서의 사용을 위한, [1] 내지 [142] 또는 [144] 내지 [161] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템.
[144] [1] 내지 [143] 또는 [145] 내지 [161] 중 어느 하나의 조성물 또는 이의 성분을, 선택적으로 유도성으로 또는 구성적으로, 포함하거나 발현하도록 설계 제작되거나, 방법에 따라 변형된 세포.
[145] [144]에 있어서, 변형은 다음을 초래하는, 세포:
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포;
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 증가되는 세포; 또는
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 감소되는 세포.
[146] [145]에 있어서, 세포는 진핵 세포를 포함하는, 세포.
[147] [144] 또는 [145]에 있어서, 포유류 세포를 포함하는, 세포.
[148] [144]에 있어서, 세포는 원핵 세포를 포함하는, 세포.
[149] 다음에서의 사용을 위한, [1] 내지 [148] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[150] [144] 내지 [148] 중 어느 하나에 따른 세포, 또는 이의 자손의 또는 이를 포함하는 세포주.
[151] [146] 또는 [147]에 따른 하나 이상의 세포를 포함하는 다세포 생물.
[152] [144] 내지 [147] 중 어느 하나에 따른 하나 이상의 세포를 포함하는 식물 또는 동물 모델로서; 상기 세포(들)는 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [151] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 식물 또는 동물 모델.
[153] 어느 하나의 세포, 또는 어느 하나의 세포주 또는 생물, 또는 [144] 내지 [148], [150] 내지 [152] 중 어느 하나의 식물 또는 동물 모델로부터의 생산물로서, 상기 세포 또는 세포주의 세포(들) 또는 생물 또는 식물 또는 동물 모델은 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [152] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 생산물.
[154] [153]에 있어서, 생산물의 양은 [1] 내지 [153] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물의 양보다 더 많거나 더 적은, 생산물.
[155] [153]에 있어서, 생산물은 [1] 내지 [154] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물과 비교하여 변경된, 생산물.
[156] [1] 내지 [155] 또는 [157] 내지 [161] 중 어느 하나의 시스템 또는 방법 또는 세포를 포함하는 분석, 스크리닝 방법 또는 돌연변이 유발 방법.
[157] RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법으로서, 여기서 개선은 RNA를 사용하는 것 대신에, 방법은 [1] 내지 [156] 중 어느 하나에서와 같은 조성물을 사용하는 것을 포함하는, 방법.
[158] [157]에 있어서, RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법은 RNAi 또는 형광 인 시츄 혼성화 방법인, 방법.
[159] [1] 내지 [158] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 다음을 위한 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[160] [93] 내지 [117] 중 어느 하나에 있어서, 상기 방법은 다음을 초래하는, 방법 또는 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[161] 다음을 위한 방법으로서, [1] 내지 [160] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 표적 세포에서 시험관내, 생체외, 또는 생체내 도입하거나 유도하는 것을 포함하는 방법:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
본 발명은 구체적으로 진핵 세포, 조직, 기관, 또는 생물, 더욱 구체적으로 포유류 세포, 조직, 기관, 또는 생물에서 관심 표적 유전자좌의 또는 이와 연관된 핵산 서열을 변형시키는 방법을 제공하며, 방법은 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 또는 이와 연관된 서열의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다. 바람직한 구현예에서, 관심 표적 유전자좌의 또는 이와 연관된 서열은 RNA를 포함하고 이펙터 단백질은 제VI형 CRISPR-Cas 유전자좌에 의해 인코딩된다. 복합체는 시험관내 또는 생체외에서 형성되어 세포 내로 도입되거나 RNA와 접촉될 수 있거나; 생체내에서 형성될 수 있다.
용어 Cas 효소, CRISPR 효소, CRISPR 단백질 Cas 단백질 및 CRISPR Cas는 일반적으로 상호 교환 가능하게 사용되며 본 명세서에서 참고문헌의 모든 포인트에서, 구체적인 Cas9의 참조에 의하는 것과 같이 달리 명백하지 않은 한, 유추에 의해 본 명세서에 추가로 기재되는 신규한 CRISPR 이펙터 단백질을 지칭한다. 본 명세서에 기재된 CRISPR 이펙터 단백질은 바람직하게는 C2c2 이펙터 단백질이다.
본 발명은 관심 표적 유전자좌의 또는 이와 연관된 서열을 표적화(예를 들어 변형)하는 방법을 제공하며, 방법은 상기 유전자좌의 또는 이와 관련된 서열에 C2c2 유전자좌 이펙터 단백질(촉매적으로 활성이거나 대안적으로 촉매적으로 비활성인) 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 있는 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 또는 이와 연관된 서열의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다. 바람직한 구현예에서, C2c2 이펙터 단백질은 하나의 핵산 성분; 유리하게는 설계 제작되거나 비-천연적으로 발생 핵산 성분과 복합체를 형성한다. 복합체는 시험관내 또는 생체외에서 형성되어 세포 내로 도입되거나 RNA와 접촉될 수 있거나; 생체내에서 형성될 수 있다. 관심 표적 유전자좌와 관련되거나 상기 표적 유전자좌에서의 서열의 변형의 도입은 C2c2 이펙터 단백질-핵산으로 가이드될 수 있다. 바람직한 구현예에서, 하나의 핵산 성분은 CRISPR RNA(crRNA)이다. 바람직한 구현예에서, 하나의 핵산 성분은 성숙 crRNA 또는 가이드 RNA이며, 상기 성숙 crRNA 또는 가이드 RNA는 스페이서 서열(또는 가이드 서열) 및 직접 반복 서열 또는 이들의 유도체를 포함한다. 바람직한 구현예에서, 스페이서 서열 또는 이의 유도체는 씨드(seed) 서열을 포함하며, 상기 씨드 서열은 표적 유전자좌에서 서열에 대한 인식 및/또는 혼성화에 중요하다.
본 발명의 일 양태는 하나 이상의 비-천연적으로 발생하거나 설계 제작되거나 변형되거나 최적화된 핵산 성분을 갖는 C2c2 이펙터 단백질 복합체에 관한 것이다. 바람직한 구현예에서, 상기 복합체의 핵산 성분은 직접 반복 서열에 연결된 가이드 서열을 포함할 수 있으며, 상기 직접 반복 서열은 하나 이상의 스템 루프(stem loop) 또는 최적화된 2차 구조를 포함한다. 특정 구현예에서, 직접 반복은 최소한의 길이가 16 nt, 예를 들어 적어도 28 nt이고 단일 스템 루프를 갖는다. 추가 구현예에서, 직접 반복은 길이가 16 nt보다 더 길며, 바람직하게는 17 nt 초과, 에를 들어 적어도 28 nt이고, 하나 초과의 스템 루프 또는 최적화된 2차 구조를 갖는다. 구체적인 구현예에서, 직접 반복은 25 이상 nts, 예를 들어 26 nt, 27 nt, 28 nt 이상, 및 하나 이상의 스템 루프 구조를 갖는다. 바람직한 구현예에서, 직접 반복은 변형되어 하나 이상의 단백질-결합 RNA 압타머를 포함할 수 있다. 바람직한 구현예에서, 최적화된 2차 구조의 일부와 같은 하나 이상의 압타머가 포함될 수 있다. 이와 같은 압타머는 박테리오파지 코트 단백질에 결합할 수 있다. 박테리오파지 코트 단백질은 Qβ, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s 및 PRR1을 포함하는 군으로부터 선택될 수 있다. 바람직한 구현예에서, 박테리오파지 코트 단백질은 MS2이다. 본 발명은 또한 길이가 30 개 이상, 40 개 이상 또는 50 개 이상의 뉴클레오티드인 복합체의 핵산 성분을 제공한다.
본 발명은 제VI형 이펙터 단백질 및/또는 가이드 및 또는 표적 핵산과 이들의 복합체를 포함하는 세포를 제공한다. 특정 구현예에서, 세포는 효모 세포, 식물 세포, 포유류 세포, 동물 세포, 또는 인간 세포를 포함 하나 이에 한정되지 않는, 진핵 세포이다.
본 발명은 또한 구체적으로 진핵 세포, 조직, 기관, 또는 생물, 더욱 구체적으로 포유류 세포, 조직, 기관, 또는 생물에서 관심 표적 유전자좌를 변형시키는 방법을 제공하며, 방법은 C2c2 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다. 복합체는 시험관내 또는 생체외에서 형성되어 세포 내로 도입되거나 RNA와 접촉될 수 있거나; 생체내에서 형성될 수 있다.
이러한 방법에서, 관심 표적 유전자좌는 RNA 분자 내에 포함될 수 있다. 또한, 관심 표적 유전자좌는 DNA 분자 내에 포함될 수 있고, 특정 구현예에서, 전사된 DNA 분자 내에 포함될 수 있다. 이러한 방법에서, 관심 표적 유전자좌는 시험관내 핵산 분자에 포함될 수 있다.
이러한 방법에서 관심 표적 유전자좌는 세포, 구체적으로 포유류 세포 또는 식물 세포와 같은 진핵 세포 내의 핵산 분자에 포함될 수 있다. 포유류 세포는 비인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 세포는 비포유류 진핵 세포, 예를 들어 가금류, 어류 또는 새우일 수 있다. 식물 세포는 농작물, 예를 들어 카사바, 옥수수, 수수, 밀, 또는 벼의 것일 수 있다. 식물 세포는 또한 조류, 수목 또는 채소의 것일 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 생물학적 생성물, 예를 들어 항체, 전분, 알콜 또는 다른 원하는 세포 산출물의 개선된 생성을 위하여 변경되도록 하는 것일 수 있다. 본 발명에 의해 세포에 도입된 변형은 세포 및 세포의 자손이 생성된 생물학적 생성물을 변화시키는 변경을 포함하도록 하는 것일 수 있다.
포유류 세포는 비인간 포유류, 예를 들어 영장류, 소, 양, 돼지, 개, 설치류, 토끼과, 예를 들어 원숭이, 소, 양, 돼지, 개, 토끼, 래트 또는 마우스 세포일수 있다. 세포는 비인간 진핵 세포, 예를 들어 가금류 조류(예를 들어, 닭), 척추동물 어류(예를 들어, 연어) 또는 패류(예를 들어, 굴, 조개, 바닷가재, 새우) 세포일 수 있다. 세포는 또한 식물 세포일 수 있다. 식물 세포는 단자엽식물 또는 쌍자엽식물의 것 또는 작물 또는 곡물 식물, 예를 들어 카사바, 옥수수, 수수, 대두, 밀, 귀리 또는 벼의 것일 수 있다. 식물 세포는 또한 조류, 수목 또는 생산성 식물, 과일 또는 채소(예를 들어, 수목, 예를 들어 감귤 나무, 예를 들어 오렌지, 자몽 또는 레몬 나무; 복숭아 또는 넥타린 나무; 사과 또는 배 나무; 견과류 나무, 예를 들어 아몬드 또는 호두 또는 피스타치오 나무; 가지속 식물; 유채속(Brassica)의 식물; 락투카(Lactuca) 속의 식물; 시금치(Spinacia) 속; 고추속(Capsicum)의 식물; 목화, 담배, 아스파라거스, 당근, 양배추, 브로콜리, 콜리플라워, 토마토, 가지, 후추, 상추, 시금치, 딸기, 블루베리, 라즈베리, 블랙베리, 포도, 커피, 코코아 등)의 것일 수 있다.
본 발명은 관심 표적 유전자좌를 변형시키는 방법을 제공하며, 방법은 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다.
본 발명은 또한 관심 표적 유전자좌를 변형시키는 방법을 제공하며, 방법은 C2c2 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다.
이러한 방법에서, 관심 표적 유전자좌는 시험관내 핵산 분자에 포함될 수 있다. 이러한 방법에서, 관심 표적 유전자좌는 세포내 핵산 분자에 포함될 수 있다. 바람직하게는, 이러한 방법에서, 관심 표적 유전자좌는 시험관내 RNA 분자 내에 포함될 수 있다. 또한 바람직하게는, 이러한 방법에서, 관심 표적 유전자좌는 세포내 RNA 분자 내에 포함될 수 있다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유류 세포일 수 있다. 세포는 설치류 세포일 수 있다. 세포는 마우스 세포일 수 있다.
기재된 방법 중 임의의 것에서, 관심 표적 유전자좌는 관심 있는 게놈 또는 후성유전체 유전자좌일 수 있다. 기재된 방법 중 임의의 것에서, 복합체는 다중화된 사용을 위한 다수의 가이드와 함께 전달될 수 있다. 기재된 방법 중 임의의 것에서 하나 초과의 단백질(들)이 사용될 수 있다.
본 발명의 추가의 양태에서, 핵산 성분은 CRISPR RNA(crRNA) 서열을 포함 할 수 있다. 제한없이, 출원인은 이러한 경우에 pre-crRNA가 성숙 crRNA뿐만 아니라 이펙터 단백질 상으로의 crRNA 로딩을 생산하기 위한 프로세싱에 충분한 2차 구조를 포함할 수 있다고 가정한다. 제한이 아닌 예로서, 이러한 2 차 구조는 pre-crRNA 내의, 더욱 구체적으로는 직접 반복 내의 스템 루프를 포함하거나, 스템 루프로 본질적으로 구성되거나, 스템 루프로 구성될 수 있다.
기재된 방법 중 임의의 것에서, 이펙터 단백질 및 핵산 성분은 단백질 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공될 수 있으며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 단백질 및/또는 핵산 성분(들)을 발현한다. 하나 이상의 폴리뉴클레오티드 분자는 단백질 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함할 수 있다. 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함될 수 있다. 기재된 방법 중 임의의 것에서, 관심 표적 유전자좌는 관심 있는 게놈 또는 후성유전체 유전자좌일 수 있다. 기재된 방법 중 임의의 것에서, 복합체는 다중화된 사용을 위해 다수의 가이드와 함께 전달될 수 있다. 기재된 방법 중 임의의 것에서, 하나보다 많은 단백질(들)이 사용될 수 있다.
조절 요소는 유도성 프로모터를 포함할 수 있다. 폴리뉴클레오티드 및/또는 벡터 시스템은 유도성 시스템을 포함할 수 있다.
기재된 방법 중 임의의 것에서, 하나 이상의 폴리뉴클레오티드 분자가 전달 시스템에 포함될 수 있거나, 하나 이상의 벡터가 전달 시스템에 포함될 수 있다.
기재된 방법 중 임의의 것에서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀, 나노입자를 포함하는 입자, 엑소좀, 미세소포, 유전자총 또는 하나 이상의 바이러스 벡터를 통해 전달될 수 있다.
본 발명은 또한 본 명세서에서 논의되거나 본 명세서에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물을 제공한다.
특정 구현예에서, 본 발명은 따라서, 구체적으로 관심 표적 유전자좌를 변형할 수 있거나 또는 변형하도록 환경 설정된 조성물과 같은, 비-천연적으로 발생하거나 설계 제작된 조성물을 제공하고, 상기 조성물은 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하며, 여기서 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 특정 구현예에서, 이펙터 단백질은 C2c2 유전자좌 이펙터 단백질일 수 있다.
본 발명은 또한 추가의 양태에서, 구체적으로 관심 표적 유전자좌를 변형할 수 있거나 또는 변형하도록 환경 설정된 조성물과 같은, 비-천연적으로 발생하거나 설계 제작된 조성물을 제공하고, 상기 조성물은:(a) 가이드 RNA 분자(또는 다중화용 RNA와 같은, 예를 들어 제1 가이드 RNA 분자 및 제2 가이드 RNA 분자인, 가이드 RNA 분자의 조합) 또는 가이드 RNA 분자를 인코딩하는 핵산(또는 가이드 RNA 분자의 조합을 인코딩하는 하나 이상의 핵산);(b) 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 또는 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질을 인코딩하는 핵산을 포함한다. 특정 구현예에서, 이펙터 단백질은 C2c2 유전자좌 이펙터 단백질일 수 있다.
본 발명은 또한 추가의 양태에서, (a) 가이드 RNA 분자(또는 예를 들어 제1 가이드 RNA 분자 및 제2 가이드 RNA 분자인, 가이드 RNA 분자의 조합) 또는 가이드 RNA 분자를 인코딩하는 핵산(또는 가이드 RNA 분자의 조합을 인코딩하는 하나 이상의 핵산); (b) C2c2 유전자좌 이펙터 단백질을 포함하는, 비-천연적으로 발생하거나 설계 제작된 조성물을 제공한다.
본 발명은 또한 하나 이상의 벡터를 포함하는 벡터 시스템을 제공하며, 하나 이상의 벡터는 본 명세서에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함한다.
본 발명은 또한 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하는 전달 시스템을 제공하며, 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 본 명세서에서 논의되거나 본 명세서에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함한다.
본 발명은 또한 비-천연적으로 발생하거나 설계 제작된 조성물, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 치료의 치료 방법에서 사용하기 위한 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템을 제공한다. 치료의 치료 방법은 유전자 또는 트랜스크립톰 편집, 또는 유전자 요법을 포함할 수 있다.
본 발명은 또한 이펙터 단백질의 하나 이상의 아미노산 잔기가 변형될 수 있는, 예를 들어 설계 제작되거나 비-천연적으로 발생하는 이펙터 단백질 또는 C2c2일 수 있는 방법 및 조성물을 제공한다. 일 구현예에서, 변형은 이펙터 단백질의 하나 이상의 아미노산 잔기의 돌연변이를 포함할 수 있다. 하나 이상의 돌연변이는 이펙터 단백질의 하나 이상의 촉매적으로 활성인 도메인에 존재할 수 있다. 이펙터 단백질은 하나 이상의 돌연변이가 없는 이펙터 단백질과 비교하여 감소되거나 제거된 뉴클레아제 활성을 가질 수 있다. 이펙터 단백질은 관심 표적 유전자좌에서 RNA 가닥의 절단을 지시하지 않을 수 있다. 바람직한 구현예에서, 하나 이상의 돌연변이는 2 개의 돌연변이를 포함할 수 있다. 바람직한 구현예에서, 하나 이상의 아미노산 잔기는 C2c2 이펙터 단백질, 예를 들어 설계 제작되거나 비-천연적으로 발생하는 이펙터 단백질 또는 C2c2에서 변형된다. 구체적인 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 돌연변이 R597A, H602A, R1278A 및 H1283A, 또는 Lsh C2c2 오솔로그에서의 상응하는 아미노산 잔기와 같이, R597, H602, R1278 및 H1283(Lsh C2c2 아미노산 참조)에 상응하는 C2c2에서의 것들 중 하나 이상이다.
구체적인 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는, C2c2 컨센서스 넘버링에 따라, K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, L597, V602, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 R717 및 R1509에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 K2, K39, K535, K1261, R1362, R1372, K1546 및 K1548에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 상기 돌연변이는 변경된 또는 변형된 활성을 갖는 단백질을 초래한다. 특정 구현예에서, 상기 돌연변이는 증가된 특이성과 같은 증가된 활성을 갖는 단백질을 초래한다. 특정 구현예에서, 상기 돌연변이는 감소된 특이성과 같은 감소된 활성을 갖는 단백질을 초래한다. 특정 구현예에서, 상기 돌연변이는 촉매 활성이 없는 단백질(즉, "데드(dead)" C2c2)을 초래한다. 일 구현예에서, 상기 아미노산 잔기는 Lsh C2c2 아미노산 잔기, 또는 상이한 종 유래의 C2c2 단백질의 상응하는 아미노산 잔기에 상응한다.
특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는, 도 3에 표시된, 즉, 렙토트리키아 와데이(Leptotrichia wadei) F0279("Lew2" 또는 "Lw2") 및 리스테리아 뉴요켄시스(Listeria newyorkensis) FSL M6-0635(리스테리아세아에 박테리움(Listeriaceae bacterium) FSL M6-0635으로도 알려짐("Lib" 또는 "LbFSL"))의 정렬에 기반한, 컨센서스 서열을 참고하여, M35, K36, T38, K39, I57, E65, G66, L68, N84, T86, E88, I103, N105, E123, R128, R129, K139, L152, L194, N196, K198, N201, Y222, D253, I266, F267, S280, I303, N306, R331, Y338, K389, Y390, K391, I434, K435, L458, D459, E462, L463, I478, E479, K494, R495, N498, S501, E519, N524, Y529, V530, G534, K535, Y539, T549, D551, R577, E580, A581, F582, I587, A593, L597, I601, L602, E611, E613, D630, I631, G633, K641, N646, V669, F676, S678, N695, E703, A707, I709, I713, I716, R717, H722, F740, F742, K768, I774, K778, I783, L787, S789, V792, Y796, D799, F812, N818, P820, F821, V822, P823, S824, F825, Y829, K831, D837, L852, F858, E867, A871, L875, K877, Y880, Y881, F884, F888, F896, N901, V903, N915, K916, R918, Q920, E951, P956, Y959, Q964, I969, N994, F1000, I10001, Q1003, F10005, K1007, G1008, F1009, N1019, L1020, K1021, I1023, N1028, E1070, I1075, K1076, F1092, K1097, L1099, L1104, L1107, K1113, Y1114, E1149, E1151, I1153, L1155, L1158, D1166, L1203, D1222, G1224, I1228, R1236, K1243, Y1244, G1245, D1255, K1261, S1263, L1267, E1269, K1274, I1277, E1278, L1289, H1290, A1294, N1320, K1325, E1327, Y1328, I1334, Y1337, K1341, N1342, K1343, N1350, L1352, L1355, L1356, I1359, L1360, R1362, V1363, G1364, Y1365, I1369, R1371, D1372, F1385, E1391, D1459, K1463, K1466, R1509, N1510, I1512, A1513, H1514, N1516, Y1517, L1529, L1530, E1534, L1536, R1537, Y1543, D1544, R1545, K1546, L1547, K1548, N1549, A1550, K1553, S1554, D1557, I1558, L1559, G1563, F1568, I1612, L1651, E1652, K1655, H1658, L1659, K1663, T1673, S1677, E1678, E1679, C1681, V1684, K1685, E1689에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 앞서 표시된 바와 같이, 상기 아미노산 잔기 목록에서, R597, H602, R1278 및 H1283(Lsh C2c2 아미노산 참조)에 상응하는 잔기는 제외된다.
특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 하나 이상의 보존된 하전 아미노산 잔기이다. 특정 구현예에서, 상기 아미노산 잔기는 알라닌으로 돌연변이될 수 있다.
특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는, 도 2에 표시된, 즉, 도 1에 표시된 C2c2 오솔로그의 정렬에 기반한, 컨센서스 서열을 참고하여, K28, K31, R44, E162, E184, K262, E288, K357, E360, K338, R441 (HEPN), H446 (HEPN), E471, K482, K525, K558, D707, R790, K811, R833, E839, R885, E894, R895, D896, K942, R960 (HEPN), H965 (HEPN), D990, K992, K994에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 앞서 표시된 바와 같이, 상기 아미노산 잔기 목록에서, R597, H602, R1278 및 H1283(Lsh C2c2 아미노산 참조)에 상응하는 잔기는 제외된다.
본 발명은 또한 하나 이상의 돌연변이 또는 2 개 이상의 돌연변이가 이펙터 단백질의 촉매적 활성 도메인에 존재하는 것을 제공한다. 특정 구현예에서, 하나 이상의 돌연변이 또는 2 개 이상의 돌연변이는 HEPN 도메인, 또는 HEPN 도메인에 상동인 촉매 활성 도메인을 포함하는 이펙터 단백질의 촉매적 활성 도메인에 존재할 수 있다. 이펙터 단백질은 하나 이상의 이종 기능성 도메인을 포함 할 수 있다. 하나 이상의 이종 기능성 도메인은 하나 이상의 핵 국소화 신호(NLS) 도메인을 포함할 수 있다. 하나 이상의 이종 기능성 도메인은 적어도 2 개 이상의 NLS 도메인을 포함할 수 있다. 하나 이상의 NLS 도메인(들)은 이펙터 단백질(예를 들어, C2c2)의 말단에 또는 근처에 또는 근접하게 위치할 수 있고 2 개 이상의 NLS의 경우, 2 개 각각은 이펙터 단백질(예를 들어, C2c2)의 말단에 또는 근처에 또는 근접하게 위치할 수 있다. 하나 이상의 이종 기능성 도메인은 하나 이상의 번역 활성화 도메인을 포함할 수 있다. 다른 구현예에서, 기능성 도메인은 전사 활성화 도메인, 예를 들어 VP64를 포함할 수 있다. 하나 이상의 이종 기능성 도메인은 하나 이상의 전사 억제 도메인을 포함할 수 있다. 특정 구현예에서, 전사 억제 도메인은 KRAB 도메인 또는 SID 도메인(예를 들어, SID4X)을 포함한다. 하나 이상의 이종 기능성 도메인은 하나 이상의 뉴클레아제 도메인을 포함할 수 있다. 바람직한 구현예에서, 뉴클레아제 도메인은 Fok1을 포함한다.
본 발명은 또한 하나 이상의 이종 기능성 도메인이 다음의 활성 중 하나 이상을 갖는 것을 제공한다: 메틸라제 활성, 데메틸라제 활성, 번역 활성화 활성, 번역 억제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, 뉴클레아제 활성, 단일-가닥 RNA 절단 활성, 이중-가닥 RNA 절단 활성, 단일-가닥 DNA 절단 활성, 이중-가닥 DNA 절단 활성 및 핵산 결합 활성. 본 발명의 특정 구현예에서, 하나 이상의 이종 기능성 도메인은 에피토프 태그 또는 리포터를 포함할 수 있다. 에피토프 태그의 비-제한적인 예로는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그, 및 티오레독신(Trx) 태그가 포함된다. 리포터의 예로는 글루타티온-S-트랜스페라제(GST), 홀스래디쉬 페록시다제(HRP), 클로람페니콜 아세틸트랜스페라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시페라제, 녹색 형광 단백질(GFP), HcRed, DcRed, 시안 형광 단백질(CFP), 황색 형광 단백질(YFP), 및 청색 형광 단백질(BFP)을 포함하는 자가 형광 단백질이 포함된다.
적어도 하나 이상의 이종 기능성 도메인은 이펙터 단백질의 아미노-말단에 또는 상기 말단 근처에 존재할 수 있고/있거나 여기서 적어도 하나 이상의 이종 기능성 도메인은 이펙터 단백질의 카르복시-말단에 또는 상기 말단 근처에 존재한다. 하나 이상의 이종 기능성 도메인은 이펙터 단백질과 융합될 수 있다. 하나 이상의 이종 기능성 도메인은 이펙터 단백질에 묶일 수 있다. 하나 이상의 이종 기능성 도메인은 링커 모이어티에 의해 이펙터 단백질에 연결될 수 있다.
본 발명은 또한 스트렙토코커스(Streptococcus), 캄필로박터(Campylobacter), 니트라티프락토르(Nitratifractor), 스타필로코커스(Staphylococcus), 파르비바쿨룸(Parvibaculum), 로세부리아(Roseburia), 네이세리아(Neisseria), 글루콘아세토박터(Gluconacetobacter), 아조스피릴룸(Azospirillum), 스파에로카에타(Sphaerochaeta), 락토바실러스(Lactobacillus), 유박테리움(Eubacterium), 코리네박터(Corynebacter), 카르노박테리움(Carnobacterium), 로도박터(Rhodobacter), 리스테리아(Listeria), 팔루디박터(Paludibacter), 클로스트리디움(Clostridium), 라크노스피라세아에(Lachnospiraceae), 클로스트리디아리디움(Clostridiaridium), 렙토트리키아(Leptotrichia), 프란시셀라(Francisella), 레지오넬라(Legionella), 알리사이클로바실러스(Alicyclobacillus), 메타노메티오필러스(Methanomethyophilus), 포르피로모나스(Porphyromonas), 프레보텔라(Prevotella), 박테로이데테스(Bacteroidetes), 헬코코커스(Helcococcus), 레토스피라(Letospira), 데설포비브리오(Desulfovibrio), 데설포나트로눔(Desulfonatronum), 오피투타세아에(Opitutaceae), 투베리바실러스(Tuberibacillus), 바실러스(Bacillus), 브레비바실러스(Brevibacilus), 메틸로박테리움(Methylobacterium) 또는 아시다미노코커스(Acidaminococcus)를 포함하는 속으로부터의 생물 유래의 이펙터 단백질을 포함하는 이펙터 단백질을 제공한다. 이펙터 단백질은 제1 이펙터 단백질 오솔로그 유래의 제1 단편 및 제2 이펙터 단백질 오솔로그 유래의 제2 단편을 포함하는 키메라 이펙터 단백질을 포함할 수 있으며, 여기서 제1 및 제2 이펙터 단백질 오솔로그는 상이하다. 제1 및 제2 이펙터 단백질 오솔로그 중 적어도 하나는 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바쿨룸, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴룸, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리디움, 라크노스피라세아에, 클로스트리디아리디움, 렙토트리키아, 프란시셀라, 레지오넬라, 알리사이클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 레토스피라, 데설포비브리오, 데설포나트로눔, 오피투타세아에, 투베리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 아시다미노코커스를 포함하는 생물 유래의 이펙터 단백질을 포함할 수 있다.
특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 분류군 알파-프로테오박테리아, 바실리(Bacilli), 클로스트리디아(Clostridia), 푸소박테리아(Fusobacteria) 및 박테로이데테스(Bacteroidetes)에 속하는 박테리아 종으로부터 기원될 수 있거나, 단리될 수 있거나, 유래될 수 있다. 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 라크노스피라세아에, 클로스트리디움, 카르노박테리움, 팔루디박터, 리스테리아, 렙토트리키아, 로도박터로 구성된 군으로부터 선택되는 속에 속하는 박테리아 종으로부터 기원될 수 있거나, 단리될 수 있거나, 유래될 수 있다. 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) MA2020, 라크노스피라세아에 박테리움 NK4A179, 클로스트리디움 아미노필룸(Clostridium aminophilum)(예를 들어, DSM 10710), 라크노스피라세아에 박테리움 NK4A144, 카르노박테리움 갈리나룸(Carnobacterium gallinarum)(예를 들어, DSM 4847 균주 MT44), 팔루디박터 프로피오니시게네스(Paludibacter propionicigenes)(예를 들어, WB4), 리스테리아 세엘리게리(Listeria seeligeri)(예를 들어, 혈청형 1/2b 균주 SLCC3954), 리스테리아 웨이헨스테파넨시스(Listeria weihenstephanensis)(예를 들어, FSL R9-0317 c4), 리스테리아 뉴요켄시스(예를 들어, 균주 FSL M6-0635: 또한 "LbFSL", 렙토트리키아 와데이(예를 들어, F0279: 또한 "Lw" 또는 "Lw2", 렙토트리키아 부칼리스(Leptotrichia buccalis)(예를 들어, DSM 1135), 렙토트리키아 종 오랄(Leptotrichia sp. Oral) 분류군 225(예를 들어, 균주 F0581), 렙토트리키아 종 오랄 분류군 879(예를 들어, 균주 F0557), 렙토트리키아 샤히(Leptotrichia shahii)(예를 들어, DSM 19757), 로도박터 캅술라투스(Rhodobacter capsulatus)(예를 들어, SB 1003, R121, 또는 DE442)로 구성된 군으로부터 선택되는 박테리아 종으로부터 기원될 수 있거나, 단리될 수 있거나, 유래될 수 있다. 특정 바람직한 구현예에서, C2c2 이펙터 단백질은 리스테리아세아에 박테리움 (예를 들어, FSL M6-0635: 또한 "LbFSL", 라크노스피라세아에 박테리움 MA2020, 라크노스피라세아에 박테리움 NK4A179, 클로스트리디움 아미노필룸(예를 들어, DSM 10710), 카르노박테리움 갈리나룸(예를 들어, DSM 4847), 팔루디박터 프로피오니시게네스(예를 들어, WB4), 리스테리아 세엘리게리(예를 들어, 혈청형 ?b 균주 SLCC3954), 리스테리아 웨이헨스테파넨시스(예를 들어, FSL R9-0317 c4), 렙토트리키아 와데이(예를 들어, F0279: 또한 "Lw" 또는 "Lw2", 렙토트리키아 샤히(예를 들어, DSM 19757), 로도박터 캅술라투스(예를 들어, SB 1003, R121, 또는 DE442); 바람직하게는 리스테리아세아에 박테리움 FSL M6-0635(즉, 리스테리아 뉴요켄시스 FSL M6-0635: 도 4 내지 7의 "LbFSL" 또는 렙토트리키아 와데이 F0279(또한 "Lw" 또는 "Lw2")로부터 기원한다.
특정 구현예에서, 본 명세서에서 의도된 제VI형 유전자좌는 Cas1, Cas2 및 C2c2p 이펙터 단백질을 인코딩할 수 있다.
특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 천연 C2c2p와 같은 C2c2p는, 약 1100 내지 약 1400 아미노산 길이와 같은, 약 1000 내지 약 1500 아미노산 길이, 예를 들어 약 1000 내지 약 1100, 약 1100 내지 약 1200 아미노산 길이, 또는 약 1200 내지 약 1300 아미노산 길이, 또는 약 1300 내지 약 1400 아미노산 길이, 또는 약 1400 내지 약 1500 아미노산 길이, 예를 들어 약 1000, 약 1100, 약 1200, 약 1300, 약 1400 또는 약 1500 아미노산 길이일 수 있다.
특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 적어도 하나, 바람직하게는 적어도 2 개, 예를 들어 더욱 바람직하게는 정확히 2 개의 보존된 RxxxxH 모티프를 포함한다. 촉매성 RxxxxH 모티프는 HEPN(고등 진핵 생물 및 원핵 생물 뉴클레오티드-결합, Higher Eukaryotes and Prokaryotes Nucleotide-binding) 도메인의 특징이다. 따라서, 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 적어도 하나 및 바람직하게는 적어도 2 개, 예를 들어 더욱 바람직하게는 정확히 2 개의 HEPN 도메인을 포함한다. 특정 구현예에서, HEPN 도메인은 알엔아제 활성을 보유할 수 있다. 다른 구현예에서, HEPN 도메인은 디엔아제 활성을 보유할 수 있다.
특정 구현예에서, 본 명세서에서 의도된 제VI형 유전자좌는 30 및 40 bp 길이 사이, 더욱 전형적으로 35 및 39 bp 길이 사이, 예를 들어 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 bp 길이의 CRISPR 반복을 포함할 수 있다. 구체적인 구현예에서, 직접 반복은 적어도 25 nt 길이이다.
특정 구현예에서, 프로토스페이서 인접 모티프(PAM) 또는 PAM-유사 모티프는 본 명세서에 개시된 이펙터 단백질 복합체의 관심 표적 유전자좌에의 결합을 지시한다. 일부 구현예에서, PAM은 5' PAM(즉, 프로토스페이서의 5' 말단의 업스트림에 위치)일 수 있다. 다른 구현예에서, PAM은 3' PAM(즉, 프로토스페이서의 5' 말단의 다운스트림에 위치)일 수 있다. 용어 "PAM"은 용어 "PFS" 또는 "프로토스페이서 측면 부위" 또는 "프로토스페이서 측면 서열"과 상호 교환 가능하게 사용할 수 있다.
바람직한 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 3' PAM을 인식할 수 있다. 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 5'H인 3' PAM을 인식할 수 있으며, 여기서 H는 A, C 또는 U 이다. 특정 구현예에서, 이펙터 단백질은 렙토트리키아 샤히 C2c2p, 더욱 바람직하게는 렙토트리키아 샤히DSM 19757 C2c2일 수 있고, 5' PAM은 5'H이다. 특정 구현예에서, 이펙터 단백질은 렙토트리키아 와데이 F0279(Lw2) C2c2일 수 있고, 5' PAM은 H이며, 여기서 H는 C, U 또는 A이다.
특정 구현예에서, CRISPR 효소는 설계 제작되어 뉴클레아제 활성을 감소시키거나 제거하는 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 이웃 잔기, 예를 들어 뉴클레아제 활성에 참여하는 상기 표시된 것들 근처의 아미노산에서 또한 일어날 수 있다. 일부 구현예에서, 오직 하나의 HEPN 도메인이 비활성화되고, 다른 구현예에서, 제2 HEPN 도메인이 비활성화된다.
본 발명의 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 직접 반복 서열 및 가이드 서열 또는 스페이서 서열을 포함하거나, 이로 본질적으로 구성되거나 또는 이로 구성된다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 가이드 서열 또는 스페이서 서열에 연결된 직접 반복 서열을 포함하거나, 이로 본질적으로 구성되거나 이로 구성된다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 19 nt의 부분적 직접 반복 뒤에 따라오는 18, 19, 20, 21, 22, 23, 24, 25 이상 nt의 가이드 서열, 예를 들어 18 내지 25, 19 내지 25, 20 내지 25, 21 내지 25, 22 내지 25, 또는 23 내지 25 nt의 가이드 서열 또는 스페이서 서열을 포함한다. 특정 구현예에서, 이펙터 단백질은 C2c2 이펙터 단백질이며, 검출 가능한 DNA 절단을 달성하기 위하여 적어도 16 nt의 가이드 서열을 필요로 하고 시험관내에서 효율적인 DNA 절단을 달성하기 위해 최소 17 nt의 가이드 서열을 필요로 한다. 구체적인 구현예에서, 이펙터 단백질은 C2c2 단백질이고 검출 가능한 RNA 절단을 달성하기 위하여 적어도 19 nt의 가이드 서열을 필요로 한다. 특정 구현예에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열로부터 업스트림(즉, 5')에 위치된다. 바람직한 구현예에서, C2c2 가이드 RNA의 씨드 서열(즉, 표적 유전자좌의 서열에 대한 인식 및/또는 혼성화에 본질적으로 중요한 서열)은 가이드 서열 또는 스페이서 서열의 5' 말단에서 대략적으로 처음 5 개 nt 내에 존재한다.
본 발명의 바람직한 구현예에서, 성숙 crRNA는 스템 루프 또는 최적화된 스템 루프 구조 또는 최적화된 2차 구조를 포함한다. 바람직한 구현예에서, 성숙 crRNA는 직접 반복 서열에서 스템 루프 또는 최적화된 스템 루프 구조를 포함하며, 여기서 스템 루프 또는 최적화된 스템 루프 구조는 절단 활성에 중요하다. 특정 구현예에서, 성숙 crRNA는 바람직하게 단일 스템 루프를 포함한다. 특정 구현예에서, 직접 반복 서열은 바람직하게 단일 스템 루프를 포함한다. 특정 구현예에서, 이펙터 단백질 복합체의 절단 활성은 스템 루프 RNA 듀플렉스 구조에 영향을 미치는 돌연변이를 도입함으로써 변형된다. 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스를 유지하는 돌연변이가 도입될 수 있으며, 이에 의해 이펙터 단백질 복합체의 절단 활성이 유지된다. 다른 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스 구조를 방해하는 돌연변이가 도입될 수 있으며, 이에 의해 이펙터 단백질 복합체의 절단 활성이 완전히 없어진다.
특정 구현예에서, C2c2 단백질은 Lsh C2c2 이펙터 단백질이고, 성숙 crRNA는 스템 루프 또는 최적화된 스템 루프 구조를 포함한다. 구체적인 구현예에서, crRNA의 직접 반복은 스템 루프를 포함하는 적어도 25 개의 뉴클레오티드를 포함한다. 구체적인 구현예에서, 스템은 개별적인 염기 교환의 여지가 있으나 활성은 대부분의 2 차 구조 변화 또는 crRNA의 절단에 의해 방해된다. 방해 돌연변이의 예로는 스템 뉴클레오티드 중 2 개 초과의 교환, 스템에 쌍을 이루지 않는 뉴클레오티드 부가, 스템 단축(쌍을 이루는 뉴클레오티드 중 하나의 제거에 의해) 또는 스템 연장(쌍을 이루는 뉴클레오티드 하나의 세트 부가에 의해)이 포함된다. 그러나, crRNA는 본 명세서에 기재된 구체적인 응용에 대해 예상되는 바와 같이, 비-기능성 RNA 서열을 포함하기 위해 5' 및/또는 3' 연장의 여지가 있을 수 있다.
본 발명은 또한 본 명세서에 기재된 임의의 방법 또는 조성물에서 진핵생물 또는 진핵 세포에서의 발현을 위해 코돈 최적화된 이펙터 단백질을 인코딩하는 뉴클레오티드 서열을 제공한다. 본 발명의 일 구현예에서, 코돈 최적화된 이펙터 단백질 인코딩 뉴클레오티드 서열은 본 명세서에서 논의된 임의의 C2c2를 인코딩하고 진핵 세포 또는 생물, 예를 들어 본 명세서의 다른 곳에 언급된 바와 같은 세포 또는 생물, 예를 들어, 제한 없이, 효모 세포, 또는 마우스 세포, 래트 세포, 및 인간 세포를 포함하는 포유류 세포 또는 생물, 또는 비-인간 진핵 생물, 예를 들어 식물에서 작동 가능성을 위해 코돈 최적화된다.
본 발명의 특정 구현예에서, 적어도 하나의 핵 국소화 신호(NLS)가 C2c2 이펙터 단백질을 인코딩하는 핵산 서열에 부착된다. 바람직한 구현예에서, 적어도 하나 이상의 C-말단 또는 N-말단 NLS가 부착된다(그리고 이에 따라 C2c2 이펙터 단백질을 코딩하는 핵산 분자(들)는 NLS(들)에 대한 코딩을 포함할 수 있어 발현된 생산물이 부착되거나 연결된 NLS(들)를 갖는다). 본 발명의 특정 구현예에서, 적어도 하나의 핵 방출 신호(NES)는 C2c2 이펙터 단백질을 인코딩하는 핵산 서열에 부착된다. 바람직한 구현예에서, 적어도 하나 이상의 C-말단 또는 N-말단 NES가 부착된다(그리고 이에 따라 C2c2 이펙터 단백질을 코딩하는 핵산 분자(들)는 NES(들)에 대한 코딩을 포함할 수 있어 발현된 생산물이 부착되거나 연결된 NES(들)를 갖는다). 바람직한 구현예에서, C-말단 및/또는 N-말단 NLS 또는 NES는 진핵 세포, 바람직하게는 인간 세포에서 최적 발현 및 핵 표적화를 위해 부착된다. 바람직한 구현예에서, 코돈 최적화된 이펙터 단백질은 C2c2이고 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 특정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 16 개 뉴클레오티드, 예를 들어 적어도 17 개 뉴클레오티드, 바람직하게는 적어도 18 nt, 예를 들어 바람직하게는 적어도 19 nt, 적어도 20 nt, 적어도 21 nt, 또는 적어도 22 nt이다. 특정 구현예에서, 스페이서 길이는 15 nt 내지 17 nt, 17 nt 내지 20 nt, 20 nt 내지 24 nt, 예를 들어, 20 nt, 21 nt, 22 nt, 23 nt, 또는 24 nt, 23 내지 25 nt, 예를 들어 23 nt, 24 nt, 또는 25 nt, 24 nt 내지 27 nt, 27 nt 내지 30 nt, 30 nt 내지 35 nt, 또는 35 nt 이상이다. 본 발명의 특정 구현예에서, 코돈 최적화된 이펙터 단백질은 C2c2이고, 가이드 RNA의 직접 반복 길이는 적어도 16 개의 뉴클레오티드이다. 특정 구현예에서, 코돈 최적화된 이펙터 단백질은 C2c2이고, 가이드 RNA의 직접 반복 길이는 16 nt 내지 20 nt, 예를 들어 16 개, 17 개, 18 개, 19 개, 또는 20 개 뉴클레오티드이다. 바람직한 특정 구현예에서, 가이드 RNA의 직접 반복 길이는 19 개 뉴클레오티드이다.
본 발명은 또한 다수의 핵산 성분을 전달하기 위한 방법을 포함하며, 여기서 각각의 핵산 성분은 상이한 관심 표적 유전자좌에 특이적이고, 이에 의해 다수의 관심 표적 유전자좌를 변형시킨다. 복합체의 핵산 성분은 하나 이상의 단백질-결합 RNA 압타머를 포함할 수 있다. 하나 이상의 압타머는 박테리오파지 코트 단백질을 결합할 수 있다. 박테리오파지 코트 단백질은 Qβ, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s 및 PRR1을 포함하는 군으로부터 선택될 수 있다. 바람직한 구현예에서, 박테리오파지 코트 단백질은 MS2이다. 본 발명은 또한 길이가 30 개 이상, 40 개 이상 또는 50 개 이상의 뉴클레오티드인 복합체의 핵산 성분을 제공한다.
따라서, 출원인이 권리를 유보하도록 임의의 이전에 공지된 생산물, 그 생산물의 제조 공정, 또는 그 생산물의 사용 방법을 본 발명 내에 포함시키지 않으며, 이에 의하여 임의의 이전에 공지된 생산물, 공정, 또는 방법에 대한 권리 포기를 개시하는 것이 본 발명의 목적이다. 본 발명은 출원인이 권리를 유보하도록 USPTO(35 U.S.C. §112, 첫 단락) 또는 EPO(EPC의 83항)의 서면 기재 요건 및 실시 가능 요건을 충족하지 않는, 임의의 생산물, 공정, 또는 그 생산물의 제조 또는 그 생산물의 사용 방법을 본 발명의 범주 내에 포함시키는 것으로 의도되지 않으며, 이에 의하여 임의의 이전에 공지된 생산물, 그 생산물의 제조 공정, 또는 그 생산물의 사용 방법의 권리 포기를 개시함을 추가로 유의한다. 본 발명의 실시에 있어서 Art. 53(c) EPC 및 규칙 28(b) 및(c) EPC에 따르는 것이 유리할 수 있다. 본 명세서에서 어떤 것도 약속으로 해석되어서는 안 된다.
본 개시 내용 및 구체적으로 청구범위 및/또는 단락에서, "포함한다(comprises)", "포함된(comprised)", "포함하는(comprising)" 등과 같은 용어는 미국 특허법에서 이에 귀속된 의미를 가질 수 있음에 유의하며; 예를 들어 이들은 "포함한다(includes)", "포함된(included)", "포함하는(including)" 등을 의미할 수 있고; "본질적으로 구성되는(consisting essentially of)" 및 "본질적으로 구성된다(consists essentially of)"와 같은 용어는 미국 특허법에서 이들에게 할당된 의미를 갖고, 예를 들어 명시적으로 열거되지 않은 요소를 허용하지만, 선행 기술에서 발견되거나 본 발명의 기본적인 또는 신규한 특징에 영향을 미치는 요소는 제외한다.
추가의 양태에서, 본 발명은 변형된 관심 표적 유전자좌의 생성을 보장하는 본 명세서에 기재된 CRISPR 시스템을 인코딩하는 뉴클레오티드 서열을 포함하는 진핵 세포를 제공하며, 여기서 관심 표적 유전자좌는 본 명세서에 기재된 방법 중 임의의 것에 따라 변형된다. 추가의 양태는 상기 세포의 세포주를 제공한다. 또 다른 양태는 하나 이상의 상기 세포를 포함하는 다세포 생물을 제공한다.
특정 구현예에서, 관심 표적 유전자좌의 변형은 적어도 하나의 유전자 산물의 변경된 (단백질) 발현을 포함하는 진핵 세포; 적어도 하나의 유전자 산물의 변경된 (단백질) 발현을 포함하는 진핵 세포로서, 여기서 적어도 하나의 유전자 산물의 (단백질) 발현은 증가되는 것; 적어도 하나의 유전자 산물의 변경된 (단백질) 발현을 포함하는 진핵 세포로서, 여기서 적어도 하나의 유전자 산물의 (단백질) 발현은 감소되는 것, 또는 편집된 트랜스크립톰을 포함하는 진핵 세포를 초래할 수 있다.
특정 구현예에서, 진핵 세포는 포유류 세포 또는 인간 세포일 수 있다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은 RNA 서열-특이적 간섭, 발현(이소형 특이적 발현 포함)의 RNA 서열 특이적 조절, 안정성, 국소화, 기능성(예를 들어, 리보솜 RNA 또는 miRNA) 등을 위해, 또는 이러한 프로세스의 다중화를 위해 사용될 수 있다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은 생물학적 샘플과 같은 샘플에서의 RNA 검출 및/또는 정량화를 위해 사용될 수 있다. 특정 구현예에서, RNA 검출은 세포 내에서이다. 일 구현예에서, 본 발명은 (a) 샘플을 i) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, (ii) 표적 RNA로 혼성화할 수 있는 가이드 RNA, 및 iii) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터와 함께 인큐베이션하는 것, (b) 상기 RNA-기반 절단 유도성 리포터의 절단에 의해 생성되는 신호에 기반하여 상기 표적 RNA를 검출하는 것을 포함하는, 샘플에서 표적 RNA를 검출하는 방법을 제공한다.
일 구현예에서, 제VI형 CRISPR-Cas 이펙터 단백질은 C2c2 이펙터 단백질이다. 일 구현예에서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함한다. 특정 구현예에서, 샘플은 무-세포 생물학적 샘플을 포함한다. 다른 구현예에서, 샘플은 예를 들어, 제한 없이, 식물 세포 또는 동물 세포인 세포 샘플을 포함한다. 본 발명의 일 구현예에서, 표적 RNA는 바이러스, 박테리아, 균류 또는 기생충 유래 표적 RNA를 포함하나 이에 한정되지 않는, 병원체 RNA를 포함한다. 일 구현예에서, 가이드 RNA는 단일 뉴클레오티드 다형성 또는 RNA 전사물의 스플라이스 변이체를 포함하는 표적 RNA를 검출하도록 설계된다. 일 구현예에서, 가이드 RNA는 표적 RNA와의 하나 이상의 미스 매치 뉴클레오티드를 포함한다. 특정 구현예에서, 가이드 RNA는 암 또는 면역 질병과 같지만 이에 한정되지 않는 질병 상태에 대해 진단적인 aa 표적 분자에 혼성화한다.
본 발명은 a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, b) 표적 RNA에 결합할 수 있는 가이드 RNA, 및 c) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, 리보 핵산(RNA) 검출 시스템을 제공한다. 추가로, 본 발명은 a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, b) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, RNA 검출용 키트를 제공한다. 특정 구현예에서, RNA-기반 절단 유도성 리포터 작제물은 형광 색소 및 소광제를 포함한다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은 질병 모델 및/또는 스크리닝 시스템을 생성하기 위해 사용될 수 있다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은: 부위-특이적 트랜스크립톰 편집 또는 변동; 핵산 서열-특이적 간섭; 또는 다중화된 게놈 설계 제작을 위해 사용될 수 있다.
또한, 본 명세서에 기재된 세포, 세포주 또는 생물로부터의 유전자 산물이 제공된다. 특정 구현예에서, 발현된 유전자 산물의 양은 변경된 발현 또는 편집된 게놈을 갖지 않은 세포로부터의 유전자 산물의 양보다 더 많거나 더 적을 수 있다. 특정 구현예에서, 유전자 산물은 변경된 발현 또는 편집된 게놈을 갖지 않은 세포로부터의 유전자 산물과 비교하여 변경될 수 있다.
이들 및 다른 구현예는 하기 상세한 설명에 개시되어 있거나 이로부터 명백해지고 이에 의해 포함된다.
본 발명의 신규 특징은 구체적으로 첨부된 청구범위에 제시되어 있다. 본 발명의 원리가 이용된 예시적인 구현예를 제시하는 하기의 상세한 설명을 참조함으로써 본 발명의 특징 및 이점을 더욱 잘 이해할 것이며, 첨부된 도면은 다음과 같다:
도 1a 내지 1d. C2c2 오솔로그의 세포 국소화. (A) HEK293 세포는 핵 국소화 신호(NLS) 또는 핵 방출 신호(NES)와 함께 또는 없이 mCherry에 융합된 상이한 C2c2 오솔로그로 형질감염하였다. (B) 렙토트리키아 와데이 F0279 C2c2(B1) 및 라크노스피라세아에 박테리움 NK4A179 C2c2(B2)의 NES 융합은 세포질에 위치한다. (C) 렙토트리키아 와데이 F0279 C2c2(C1), 라크노스피라세아에 박테리움 NK4A179 C2c2 (C2), 및 렙토트리키아 샤히 C2c2(C3)의 NLS 융합은 핵에 위치하고 일정치 않게 인에 위치한다. (C) NLS 또는 NES에 융합하지 않은 렙토트리키아 와데이 F0279 C2c2(D1), 라크노스피라세아에 박테리움 NK4A179 C2c2(D2), 및 렙토트리키아 샤히 C2c2(D3)는 일정치 않게 핵 및 세포질에 위치한다. (D) 평가된 4 개의 포유류 LwaCas13a 작제물의 개략도(왼쪽) 및 각각의 설계의 국소화 및 발현을 보여주는 이미징(오른쪽).
도 2a 내지 2c. 포유류 세포에서의 C2c2 녹다운 효율의 평가를 위한 분석. A) C2c2의 녹다운 효율을 결정하기 위해 사용된 이중 루시페라제 리포터 설계의 개략도. 세포는 상이한 플라스미드로 형질감염하였다: 가우시아 루시페라제(Gluc) 및 사이프리디나 루시페라제(Cluc)를 인코딩하는 플라스미드; C2c2를 인코딩하는 플라스미드(NLS 또는 NES가 있거나 없음); 가우시아 루시페라제를 표적화하는 gRNA를 인코딩하는 플라스미드. Gluc의 녹다운 효율은 Gluc 및 Cluc의 비율에 기반하여 결정한다. (B)가우시아 루시페라제 mRNA를 표적화하는 상이한 gRNA의 위치. (C) 포유류 세포에서 C2c2 녹다운 효율을 평가하기위한 분석. 세포는 상이한 플라스미드로 형질감염하였다: EGFP를 인코딩하는 플라스미드; C2c2를 인코딩하는 플라스미드(NLS 또는 NES가 있거나 없음); 및 EGFP를 표적화하는 gRNA를 인코딩하는 플라스미드. EGFP의 녹다운 효율은 유세포분석법에 의해 결정한다.
도 3a 내지 3q. RNA 절단 활성에 대한 제VI형 CRISPR Cas13a 패밀리의 특징 확인. (A) Cas13a 오솔로그에 대한 PFS 특징 확인 스크린의 개략도. (B) Cas13a 단백질 및 crRNA의 발현을 위한 작제물의 개략도. 나타난 길이 및 잔기 번호는 LwaCas13a에 대한 것이다. (C) Cas13a 생체내 활성의 정량. (D) (C)로부터의 생체내 활성의 비율. (E, F) 생존 이.콜라이 집단에서 강화된 플라스미드의 차세대 시퀀싱에 의해 결정된, LshC2c2 및 LwaC2c2에 대한 PFS 모티프 결정. (G) 표적화 및 비-표적화 샘플에서의 LshC2c2 및 LwaC2c2에 대한 PFS 강화의 분포. (H) 생체내 PFS 스크리닝은 LwaCas13a가 최소한의 PFS 선호를 가짐을 나타낸다. (I) LshC2c2 및 LwC2c2에 대한 표적화 및 비-표적화 생물-반복실험(n=2)에서의 정규화된 PFS 수의 분포를 나타내는 박스 플롯. 박스는 거의 사분위수 범위의 1.5 배를 나타내는 제1 내지 제3사분위수까지 포괄한다. 평균값은 빨간색 가로 막대로 표시된다. (J) 정제 단백질을 사용한 LshC2c2 및 LwC2c2 RNA 절단 활성의 비교. LwaCas13a는 LshCas13a보다 더 활성있는 알엔아제 활성을 갖는다. 5' 표지된 RNA 표적을 C2c2 및 상응하는 crRVA와 함께 30 분 동안 인큐베이션시키고 생산물을 겔 전기영동으로 분석하였다. (K) LwaCas13a는 엘. 와데이 CRISPR 유전자좌 유래의 CRISPR 어레이 전사물을 처리할 수 있다. 2 개-스페이서 Lwa 어레이를 LwC2c2와 함께 30 분 동안 인큐베이션한 후 반응을 겔 전기영동으로 분석하였다. (L) 평가된 포유류 LwaCas13a 작제물의 개략도 및 각각의 설계의 국소화 및 발현을 나타내는 이미징. 축척 막대, 10μm. (M) 루시페라제 단백질 판독값으로 녹다운을 평가하기 위해 사용되는 포유류 리포터 시스템의 개략도. (N) LwaCas13a의 설계 제작 된 변이체를 사용한 가우시안 루시페라제(Gluc)의 녹다운. 가이드 및 shRNA에 대한 서열은 위에 나타난다. (O) LwaCas13a를 이용한 3 개의 상이한 내인성 전사물의 녹다운을 상응하는 RNAi 작제물과 비교. (P) 벼(Oryza sativa) 원형질체에서의 전사물의 LwaCas13a 녹다운의 개략도. (Q) 벼 원형질체에서 전사물당 3 개의 표적화 가이드 및 비-표적화 가이드를 사용하여 3 개 전사물의 LwaCas13a 녹다운. 달리 언급되지 않는 한 모든 값은 n=3 인 평균±SEM이다.
도 4a 내지 4b. Gluc에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 루시페라제의 정규화된 단백질 발현. (A) C2c2 오솔로그는 렙토트리키아 와데이 F0279(Lw2)이다. 실험에 사용된 스페이서 서열은 (가이드 1) ATCAGGGCAAACAGAACTTTGACTCCCA; (가이드 2) AGATCCGTGGTCGCGAAGTTGCTGGCCA; (가이드 3) TCGCCTTCGTAGGTGTGGCAGCGTCCTG; 및 (가이드 NP) TAGATTGCTGTTCTACCAAGTAATCCAT이다. (B) C2c2 오솔로그는 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)이다. 실험에 사용된 스페이서 서열은 (가이드 1) TCGCCTTCGTAGGTGTGGCAGCGTCCTG 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다.
도 5a 내지 5b. EGPF에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 GPF의 정규화된 단백질 발현. (A) C2c2 오솔로그는 렙토트리키아 와데이 F0279(Lw2)이다. 실험에 사용된 스페이서 서열은 (가이드 1) tgaacagctcctcgcccttgctcaccat; (가이드 2) tcagcttgccgtaggtggcatcgccctc; (가이드 3) gggtagcggctgaagcactgcacgccgt; (가이드 4) ggtcttgtagttgccgtcgtccttgaag; (가이드 5) tactccagcttgtgccccaggatgttgc; (가이드 6) cacgctgccgtcctcgatgttgtggcgg; (가이드 7) tctttgctcagggcggactgggtgctca; (가이드 8) gacttgtacagctcgtccatgccgagag; 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다. (B) C2c2 오솔로그는 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)이다. 실험에 사용된 스페이서 서열은 (가이드 2) tcagcttgccgtaggtggcatcgccctc; (가이드 3) gggtagcggctgaagcactgcacgccgt; (가이드 4) ggtcttgtagttgccgtcgtccttgaag; (가이드 5) tactccagcttgtgccccaggatgttgc; (가이드 6) cacgctgccgtcctcgatgttgtggcgg; (가이드 7) tctttgctcagggcggactgggtgctca; (가이드 8) gacttgtacagctcgtccatgccgagag; 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다.
도 6a 내지 6e. 포유류 녹다운을 위한 LwaCas13a의 설계 제작 및 최적화. (A) A375s 세포에 형질감염된 다양한 가이드를 이용한 LwCas13a에 의한 Gluc 전사물의 녹다운: (B) LwCas13a의 설계제작된 변이체를 이용한 가우시아 루시페라제(Gluc)의 녹다운. (C) LwaCas13a 및 다양한 길이의 스페이서 Gluc crRNA 1에 의한 가우시아 루시페라제(Gluc)의 녹다운. (D) 다양한 가이드를 이용한 LwaCas13a에 의한 KRAS 전사물의 녹다운. (E) 다양한 가이드를 이용한 LwaCas13a에 의한 PPIB 전사물의 녹다운.
도 7. 각각의 표적 유전자에 대해 향하는 gRNA를 이용하고NES와 융합된 C2c2 렙토트리키아 와데이 F0279를 이용한 표적 유전자의 정규화된 단백질 발현. 각각의 표적 유전자에 대한 gRNA는 ctgctgccacagaccgagaggcttaaaa (CTNNB1); tccttgattacacgatggaatttgctgt (PPIB); tcaaggtggggtcacaggagaagccaaa (mAPK14); atgataatgcaatagcaggacaggatga (CXCR4); gcgtgagccaccgcgcctggccggctgt (TINCR); ccagctgcagatgctgcagtttttggcg (PCAT1); ctggaaatggaagatgccggcatagcca (CAPN1); gatgacacctcacacggaccacccctag (LETMD1); taatactgctccagatatgggtgggcca (MAPK14); catgaagaccgagttatagaatactata (RB1); ggtgaaatattctccatccagtggtttc (TP53); 및 aatttctcgaactaatgtatagaaggca (KRAS)이다.
도 8. Gluc에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 루시페라제의 정규화된 단백질 발현. C2c2 오솔로그는 렙토트리키아 샤히(Lsh), 렙토트리키아 와데이 F0279(Lw2), 클로스트리듐 아미노필룸(Ca), 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL), 라크노스피라세아에 박테리움 NK4A179(LbNk), 및 라크노스피라세아에 박테리움 MA2020(LbM)이다.
도 9. Lw2는 다수의 세포주에서 기능한다. 정규화된 루시페라제 활성은 293FT 세포에 대해 나타난다.
도 10a 내지 10b. Gluc에 대해 향하는 gRNA를 이용하고 촉매적으로 비활성화된 C2c2 오솔로그를 이용한 루시페라제의 상대 단백질 발현. (A) dC2c2 렙토트리키아 와데이(LwC2c2)를 EIF4E, EIF4E 및 NES에 융합했거나 태그가 없다. (B) dC2c2 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)를 NLS 및 EIF4E에 융합했거나 태그가 없다.
도 11a 내지 11c. 베타 액틴을 표적화하는 렙토트리키아 와데이 C2c2 의 세포 국소화는 NaAsO2로 세포를 처리 즉시 스트레스 과립으로 국소화한다;
도 12. 포유류 세포에서의 RNA 녹다운. C2c2는 2 개의 표적 부위에서 shRNA를 능가한다.
도 13. 증가하는 crRNA 형질감염 양은 녹다운을 증가시킨다.
도 14. NES를 갖는 Lw2C2c2(NES-Lw2C2c2)는 tRNA 및 U6 녹다운의 RNA를 효과적으로 절단한다.
도 15a 내지 15b. (A) 단백질 형질감염 양은 녹다운을 포화시킨다. (B) Gluc crRNA 1 및 다양한 양의 형질감염된 LwaCas13a 플라스미드를 이용한 Gluc 전사물의 녹다운.
도 16. U6-구동되는 DR-스페이서-DR-스페이서 표적화 작제물.
도 17. 내인성 유전자 상의 상응하는 표적에 대해 C2c2가 최적화된 shRNA를 능가한다.
도 18. dLw2C2c2-EIF4E 융합은 3 개의 유전자의 번역을 상향 조절할 수 있다; 웨스턴 블롯 상에서 밴드 강도로 측정한 단백질 수준.
도 19. 개별 전사물의 녹다운. Lw2는 더 적은 변동성 및 더 높은 특이성을 나타낸다.
도 20. 포유류 세포에서의 RNA 녹다운.
도 21. 이미징은 GFP의 수퍼폴딩 유도체(sfGFP)에 의해 향상된다. C2c2-mCherry 및 sfGFP-C2c2 융합 단백질을 HEK293FT 세포 및 마우스 배아 줄기 세포(mESC)에서 비교한다.
도 22a. msfGFP-C2c2는 녹다운을 향상시킨다. NLS 또는 NES를 추가로 포함하는, C2c2의 mCherry 또는 msfGFP와의 다양한 융합 단백질에 의한 루시페라제 녹다운을 묘사한다.
도 22b 내지 22d는 C2c2를 이용한 전사 조절을 위한 단백질 태깅 시스템을 도시하고 변형된 C2c2(SunTag)가 포함하는 짧은 펩티드 서열에 결합하는 전사 개시 인자-연결된 scFv의 구성요소를 나타낸다. 도 22c 내지 22d는 시스템의 전사적 효과를 묘사한다.
도 23a 내지 23b. 리포터 단백질(GFP, Venus, Cre 등)의 분할. 각각의 부분은 C2c2에 융합되어 있다(예를 들어 카스파제를 이용한 개략도 슬라이드 참고). 서로에게 근접한 전사물을 표적화하는 2 개의 가이드를 설계함으로써, 분할된 단백질은 전사물의 존재 하에서 재구성된다.
도 24a 내지 24c. C2c2 부수적 알엔아제 활성에 의한 신속한 RNA 검출. (A) 왼쪽 패널: C2c2 crRNA의 가이드 서열에 상보적인 표적 RNA에 의한 C2c2 부수적 비-특이적 알엔아제 활성이 활성화되는 것은 리포터의 절단을 유도한다. 오른쪽 패널: 표적 RNA 부재 시, 부수적 비-특이적 알엔아제 활성이 유도되지 않으므로 리포터의 절단이 없다. (B) LwaCas13a에 의한 부수적 효과의 활성을 검출하기 위한 분석의 개략도. (C) 표적 RNA의 존재 또는 부재 하에 LwaCas13a-crRNA 복합체와 인큐베이션 후 부수적 RNA 표적의 겔 전기 영동.
도 25. 다양한 농도의 C2c2를 이용한 부수적 효과에 의한 렌티바이러스 검출.
도 26. 부수적 효과에 의한 렌티바이러스 검출의 시간 경과.
도 27. C2c2 부수적 알엔아제 활성에 의한 희귀한 RNA 종의 검출. 증가하는 표적 농도 및 표적 절단에는 증가된 비-특이적 표적외 알엔아제 활성이 동반한다.
도 28a 내지 28b. Lw2C2c2 및 LbuC2c2의 정렬.
도 29a 내지 29c. (A) 스페이서 서열에서의 단일 염기-쌍의 미스매치를 갖는 루시페라제 mRNA 녹다운에 대해 표적화된 βLwC2c2. (B) 스페이서 서열에서의 단일 염기-쌍의 미스매치를 갖는 CXCR4 mRNA 녹다운에 대해 표적화된 LwC2c2. (C) 스페이서 서열에서의 단일 및 연속된 두 염기-쌍 미스매치를 갖는 루시페라제 mRNA 녹다운에 대해 표적화된 LwC2c2.
도 29d-a 내지 29d-c. (A) 루시페라제 리포터 mRNA의 녹다운의 특이성. C2c2는 루시페라제 리포터 mRNA의 녹다운에 대한 RNAi보다 더 특이적이다. 왼쪽: shRNA를 위한 루시페라제 녹다운 조건에 비하여, 비-표적화 형질감염된 대조군의 RNA-seq 라이브러리에서의 모든 검출된 유전자(모든 그래프의 X 축)에 대한 log2(백만 당 전사물(TPM)) 값의 발현 수준. 오른쪽: C2c2를 위한 루시페라제 녹다운 조건에 비하여, 비-표적화 형질감염된 대조군의 RNA-seq 라이브러리에서의 모든 검출된 유전자(모든 그래프의 X 축)에 대한 log2(백만 당 전사물(TPM)) 값의 발현 수준. 녹다운에 대해 표적화된 표적 루시페라제 전사물은 빨간색 점으로 표시된다. n=3 생물학적 반복실험으로부터의 평균값이 나타난다. (B) 내인성 KRAS mRNA의 녹다운의 특이성. C2c2는 내인성 KRAS의 녹다운에 대한 RNAi보다 더 특이적이다. 표적 전사물은 빨간색 점으로 표시된다. (C) 내인성 PPIB mRNA의 녹다운의 특이성. C2c2는 내인성 PPIB의 녹다운에 대한 RNAi보다 더 특이적이다. 표적 전사물은 빨간색 점으로 표시된다.
도 29e 내지 29g. (E) 3 개의 상이한 유전자에서 LwaCas13a 녹다운을 shRNA 녹다운과 비교하는 6 개의 RNA-seq 라이브러리의 차등적 유전자 발현 분석(각각 3 회의 생물학적 반복실험으로). 유전자는 비-표적화 대조군과 비교하여 평균 배수 변화가 2 초과 또는 0.75 미만이고 거짓-발견률(FDR) 0.10 미만인 경우 유의미하게 차등적으로 발현된 것으로 고려한다. (F) RNA seq 라이브러리 유래 표적화된 유전자에 대한 평균 녹다운 수준 정량. (G) 왼쪽: 세포 성장을 측정하기 전에 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질 감염시킨 세포에 대한 루시페라제 녹다운. 중간: 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 세포 생존력. 오른쪽: 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 GFP 형광. 모든 값은 n=3 인 평균±SEM이다.
도 30a 내지 30e. RNA 녹다운의 수준 및 특이성의 비교. C2c2는 RNAi와 유사한 수준의 녹다운을 유지하면서 증가된 특이성을 입증한다. (A): 분석된 각각의 RNA-seq 라이브러리에서 유의미하게 차등적으로 조절되는 유전자의 수. 3 개의 상이한 유전자에서 LwaCas13a 녹다운을 shRNA 녹다운과 비교하는 6 개의 RNA-seq 라이브러리의 차등적 유전자 발현 분석(각각 3 회의 생물학적 반복실험으로). 유전자는 비-표적화 대조군과 비교하여 평균 배수 변화가 2 초과 또는 0.75 미만이고 거짓-발견률(FDR) 0.10 미만인 경우 유의미하게 차등적으로 발현된 것으로 고려한다. (B) RNA seq 라이브러리 유래 표적화된 유전자에 대한 평균 녹다운 수준 정량. 정규화된 발현은 표적화 조건에서의 표적화된 유전자의 TPM을 비-표적화 조건에서의 표적화된 유전자의 TPM으로 나눈 값으로서 계산한다. 플롯은 도 28의 RNA-seq 플롯의 누적 데이터에 해당한다. 표적외는 유의미하게 조절되지 않은(2 배 초과) 또는 하향 조절된(0.75 배 미만) 유전자로서 결정된다. (C) 비-선택성 및 블라스트시딘-선택성 버전의 C2c2를 이용하여 72 시간 동안 LwaCas13a로 형질감염된 세포에 대한 루시페라제 녹다운. (D) 항생제 선택이 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포에 대한 세포 생존력. (E) 항생제 선택이 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 GFP 형광.
도 31. C2c2는 다중화된 녹다운이 가능하다. crRNA는 PPIB, CXCR4, KRAS, TINCR, 및 PCAT를 표적화 하도록 설계하였다. 상단 패널은 나타난 다중화된 crRNA 전사물과 왼쪽에서 오른쪽으로 동일한 순서이고 색상으로 구분된 mRNA의 정규화된 발현 수준을 나타낸다. 하단 패널은 단일로 주입된 가이드를 다중화되고 모아진 가이드와 비교한다.
도 32a 내지 32d. gLuc 또는 cLuc의 길이에 따른 가이드 타일링은 전사물 상의 재표적화 가능성 및 취약 영역을 입증한다. (A) LwaCas13a 어레이된 스크리닝의 개략도. (B) 전사물의 길이에 걸쳐 균등하게 타일링된 186 가이드를 이용하여 LwC2c2에 의한 가우시아 루시페라제 mRNA의 녹다운 효율. (C) 전사물의 길이에 걸쳐 균등하게 타일링된 가이드를 이용하여 LwC2c2에 의한 사이프리디나 루시페라제의 어레이된 녹다운 스크린. (D) shRNA 비교를 통한 어레이된 녹다운 스크린으로부터의 상위 3 개 crRNA의 검증.
도 33a 내지 33b. RNA 면역침강(RIP)은 표적 결합의 강화를 나타낸다. HA-태그를 포함하는 dC2c2-msfGFP는 단백질-RNA 복합체의 침강을 위해 제공된다. 결합된 RNA를 qPCR에 의해 정량화하고 입력 RNA(면역 침강이 없는 샘플) 및 음성 대조군 항체를 갖는 면역침강에 비교하여 강화를 결정하였다. 패널 A는 베타-액틴 RNA 표적의 강화를 나타낸다. 패널 B는 루시페라제 표적의 강화를 나타낸다.
도 34. 3T3L1 섬유아세포에서의 베타-액틴에 대한 C2c2 이미징. 표적화 조건(상단 프레임)에서 C2c2 복합체는 핵을 떠나는 액틴 mRNA와 결합하여, 세포질 베타-액틴 mRNA를 드러낸다. 비-표적화 조건에서, NLS-태그된 C2c2가 핵에서 관찰된다. 왼쪽 및 오른쪽 컬럼은 상이한 시각을 구성한다.
도 35. HEK293FT 세포에서의 베타-액틴에 대한 C2c2 이미징. 표적화 조건(상단 프레임)에서 C2c2 복합체는 핵을 떠나는 액틴 mRNA와 결합하여, 세포질 베타-액틴 mRNA를 드러낸다. 비-표적화 조건에서, NLS-태그된 C2c2가 핵에서 관찰된다. 왼쪽 및 오른쪽 컬럼은 상이한 시각을 구성한다.
도 36. Lw2Cas13a의 RNA 절단 동역학에 대한 시험관내 특징 확인. 하프-로그 단계로 연속 희석된 LwaCas13a-crRNA 복합체 복합체를 사용한 5' 말단-표지된 표적 1의 RNA-절단의 0.5 시간 후의 변성 겔.
도 37. Lw2Cas13a의 RNA 절단 동역학에 대한 시험관내 특징 확인. 5' 말단-표지된 표적 1을 사용한 LwaCas13a ssRNA 절단의 시계열의 변성 겔.
도 38. Lw2C2c2 및 crRNA는 RNA-가이드된 ssRNA 절단을 매개한다. 1 시간 인큐베이션 후 Lw2 C2c2에 의한 crRNA-매개 ssRNA 절단을 입증하는 변성 겔. ssRNA 표적은 IRDye 800으로 5' 표지된다. 절단은 crRNA의 존재를 필요로하고 EDTA의 첨가에 의해 파괴된다.
도 39a 내지 39b. Lw2C2c2및 crRNA는 RNA-가이드된 ssRNA 절단을 매개한다. (A) crRNA에 의해 표적화되는 ssRNA 기질의 개략도. 프로토스페이서 영역은 파란색으로 강조표시되고 PFS는 자홍색 막대로 표시된다. (B) 3 시간 인큐베이션 후 PFS에 대한 필요를 입증하는 변성 겔. PFS를 제외하고 동일한 4 개의 ssRNA 기질(개략도에서 자홍색 X로 표시)은 시험관내 절단 반응에 사용하였다. ssRNA 절단 활성은 표적 부위의 바로 3'에 있는 뉴클레오티드에 의존한다.
도 40. 직접 반복 길이는 Lw2C2c2의 RNA-가이드된 알엔아제 활성에 영향을 미친다. 3 시간의 인큐베이션 후 직접 반복 길이의 함수로서 ssRNA 1의 crRNA-가이드된 절단을 보여주는 변성 겔.
도 41. 스페이서 길이는 Lw2C2c2의 RNA-가이드된 알엔아제 활성에 영향을 미친다. 3 시간의 인큐베이션 후 스페이서 길이의 함수로서 ssRNA 1의 crRNA-가이드된 절단을 보여주는 변성 겔.
도 42a 내지 42c. Lw2C2c2 절단 부위는 표적 RNA의 2차 구조 및 서열에 의해 결정된다. (A) LwCas13a 및 crRNA1과의 인큐베이션 후 ssRNA 4 및 ssRNA 5를 나타내는 변성 겔. (B) ssRNA 4(파란색) 및 (C) ssRNA 5;(녹색)은 동일한 프로토스페이서를 갖지만 상이한 서열이 측면에 배치되어 있다. 동일한 프로토스페이서임에도 불구하고, 상이한 측면 배치 서열이 상이한 절단 패턴을 초래했다.
도 43a 내지 43c. (A) 4 개의 가능한 뉴클레오타이드 각각에 대해 강조 표시된 루프(빨간색)에서 호모폴리머 길이를 이용하여 변형된 ssRNA 4의 개략도. crRNA 스페이서 서열은 파란색으로 강조 표시된다. (B) 3 시간 인큐베이션 후 4 개의 가능한 호모폴리머 표적 각각에 대한 Lw2C2c2-crRNA-매개 절단을 나타내는 변성 겔. Lw2C2c2는 C 및 U를 절단한다. (C) LwaCas13a는 엘. 와데이 CRISPR-Cas 유전자좌로부터의 pre-crRNA를 처리할 수 있다.
도 44a 내지 44k. 촉매적으로 비활성인 LwaCas13a(dCas13a)는 포유류 세포에서 전사물에 결합할 수 있다. (A) dCas13a 결합의 이미징 및 평가에 사용된 dCas13a-GFP 작제물의 개략도. (B) dCas13a 결합의 정량화를 위한 RNA 면역 침강의 개략도. (C) dCas13a 표적화 gLuc 전사물은 비-표적화 대조군에 비해 유의미하게 강화된다. RIP에 의한 가우시안 루시페라제 mRNA에 대한 dC2c2-msfGFP 결합의 정량은 대조군 항체 또는 입력 용해물에 대하여 정규화하였다. 값을 비-표적화 가이드에 대하여 정규화하였다(n=3, t-검정에 의해, *, p<0.05; ****, p<0.0001). (D) 음성-피드백 이미징에 사용되는 dCas13a-GFP-KRAB 작제물의 개략도. 표적 및 가이드의 부재시, 리포터 단백질은 자체 전사를 저해한다. (E) Gluc, Cluc, PPIB, 및 KRAS 녹다운은 전사물의 예상되는 폴딩에 의해 측정된 표적 접근 가능성과 부분적으로 상관관계가 있다. (F) b-액틴 이미징를 위한 dCas13-GFP 및 dCas13a-GFP-KRAB 작제물의 국소화 간의 비교. (G) HEK293 세포에서 b-액틴을 표적화하는 다수 가이드를 이용한 dCas13a-GFP-KRAB 이미징의 대표적인 이미지. (H) ACTB를 표적화하는 다수 가이드를 이용한 dCas13a-GFP-KRAB 이미징의 대표적인 이미지. (I) 핵 대 전체-세포 신호의 비율로 측정된, dCas13a-GFP-KRAB의 세포질 전위의 정량. (J) 400 uM 소듐 아르세나이트로 처리된 293FT 세포의 대표적인 고정 면역 형광 이미지. 스트레스 과립은 마커 G3BP1에 대한 염색으로 표시된다. 축척 막대, 5 μm. 축척 막대, 5 μm. (K) G3BP1 및 dCas13a-GFP-KRAB 공동-국소화는 피어슨의 상관관계에 의해 세포당 정량화하였다. 모든 값은 n=3인 평균±SEM이다. **** p<0.0001; *** p<0.001; ** p<0.01; * p<0.05. ns=유의미하지 않음. 한쪽-꼬리 스튜던트 t-검정은 (a)에서의 비교를 위해 사용되었고, 양쪽-꼬리 스튜던트 t-검정은 (I) 및 (K)에서의 비교를 위해 사용되었다.
도 45. 도 43에 나타낸 바와 같이 C2c2-GFP 이미징 단백질을 사용하는 사용하여 β-액틴의 검출. 비-표적화 가이드(오른쪽 패널) 중 표적화 가이드(왼쪽 패널)와 함께 dC2c2-eGFP-ZF-KRAB-NLS를 사용하여 β-액틴을 이미징 하였다.
도 46. GFP-태그된 G3BP1을 이용한 스트레스 과립의 검출.
도 47. 스트레스 과립 및 스트레스 과립 하위구조("코어")에서의 작용 검출. 표적화 작제물이 있거나 없이 및 코어 하위구조를 안정화하기 위한 NaAsO2 처리가 있거나 없이, 액틴 mRNA는 C2c2-eGFP-ZF-KRAB을 이용하여 이미징하였다. 스트레스 과립은 항-G3BP1을 사용하여 표지하였다.
도 48a 내지 48f: dCas13a는 살아있는 세포에서 스트레스 과립 형성을 이미징할 수 있다. (A) 소듐 아르세나이트 처리 즉시 스트레스 과립으로의 β-액틴 mRNA의 국소화를 이미징하기 위해 음성-피드백 dCas13a-msfGFP-KRAB 작제물을 사용하는 것에 대한 개략도. (B) 400 uM 소듐 아르세나이트로 처리된 293FT 세포의 대표적인 고정된 면역 형광 이미지. β-액틴 mRNA 표적화 가이드와 함께 형질감염된 dCas13a-msfGFP-KRAB는 스트레스 과립으로 국소화한다. 스트레스 과립에 대한 G3BP1 마커에 대한 항체로 면역염색된 고정된 HEK293 세포의 대표적인 이미지가 나타난다. (C) 조건당 약 20 개의 세포에 대한 피어슨 상관관계 분석에 의한 스트레스 과립 국소화의 정량 (D): 조건당 약 20 개의 세포에 대한 만데르의 공동국소화 분석에 스트레스 과립 국소화의 정량 (E) 400 uM 소듐 아르세나이트로 처리에 대응한 스트레스 과립 형성에 대한 살아있는 세포 분석으로부터의 대표적인 이미지 (F) 소듐 아르세나이트로 처리에 대응한 스트레스 과립 형성의 정량.
도 49a 내지 49o LwaCas13a는 내인성 포유류 코딩 및 비-코딩 RNA 표적을 표적화하도록 재프로그래밍할 수 있다. (A) KRAS 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (B) PPIB 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (C) LwaCas13a 어레이된 스크리닝의 개략도. (D) Gluc전사물에 걸쳐 균등하게 타일링된 186 개의 가이드의 어레이된 녹다운 스크린. (E) 사이프리디니아 루시페라제(Cluc) 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (F) KRAS 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (G) PPIB 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (H) shRNA 비교를 통한 내인성 어레이된 녹다운 스크린으로부터의 상위 3 개 가이드의 검증. 모든 값은 n=3인 평균±SEM이다. ***p<0.001; **p<0.01. 양쪽-꼬리 스튜던트 T-검정을 비교를 위해 사용하였다. (I) MALAT1전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (J) shRNA 비교를 통한 내인성 어레이된 MALAT1 녹다운 스크린으로부터의 상위 3 개 가이드의 검증. (K) 단일 프로모터의 발현 하에 5 개의 상이한 내인성 유전자에 대한 CRISPR 어레이의 5 개의 가이드를 다중화된 전달하는 것은 견고한 녹다운을 할 수 있다. (L) 3 개의 상이한 내인성 유전자에 대한 3 개의 가이드의 다중화된 전달 또는 각각의 가이드를 비-표적화 서열로 대체한 작제물을 갖는 것은 표적화된 유전자의 특이적인 녹다운을 나타낸다. 모든 값은 n=3인 평균±SEM이다. (M) LwaCas13a를 이용한 3 가지 상이한 내인성 전사물의 녹다운을 상응하는 RNAi 작제물에 대하여 비교. (N) LwaCas13a는 핵 lncRNA 전사물 MALAT1를 녹다운할 수 있다. (O) 3 개의 상이한 내인성 유전자에 대한 3 개의 가이드의 다중화된 전달 또는 각각의 crRNA를 비-표적화 서열로 대체한 작제물을 갖는 것은 표적화된 유전자의 특이적인 녹다운을 나타낸다.
도 50. 21 C2c2 오솔로그 유래의 HEPN서열 모티프.
도 51. 33 C2c2 오솔로그 유래의 HEPN서열 모티프.
도 52. 이펙터 도메인의 연결을 위한 예시적인 위치. 이종 기능성 도메인 (묘사된 mCherry 및 msfGFP)에 대해 C 또는 N 말단에 연결된 C2c2 단백질은 루시페라제 녹다운에 의해 표시되는 바와 같이 기능을 보유한다.
도 53a 내지 53l. (A 내지 K) C2c2 오솔로그의 서열 정렬. (L) HEPN 도메인의 서열 정렬.
도 54. C2c2 오솔로그의 트리 정렬.
도 55a 내지 55b. C2c2 및 Cas13b 오솔로그의 트리 정렬.
도 56a 내지 56f: 포유류 녹다운을 위한 LwaCas13a의 설계 제작 및 최적화. (A) Gluc crRNA 1 및 다양한 양의 형질감염된 LwaCas13a 플라스미드를 이용한 Gluc 전사물의 녹다운. (B) LwaCas13a 및 다양한 양의 형질감염된 Gluc crRNA 1 및 2 플라스미드에 의한 Gluc 전사물의 녹다운. (C) U6 또는 tRNAVal 프로모터로부터 발현된 crRNA를 사용한 Gluc 전사물의 녹다운. (D) U6 또는 tRNAVal 프로모터로부터 발현된 crRNA를 이용한 KRAS 전사물의 녹다운. (E) U6 또는 tRNAVal 프로모터로부터 발현된 가이드를 이용한 KRAS 전사물의 녹다운. (F) XIST 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린.
도 57a 내지 57e: LwaCas13a의 PFS 선호 평가 및 LshCas13a와의 비교. (A) 이 연구에서 평가된 15 개의 Cas13a 오솔로그의 서열 비교 트리. (B) 다양한 손실 임계값에 대하여 손실 임계값 초과하는 LshCas13a 및 LwaCas13a PFS 서열의 수. (C) 표적화 샘플에서, 비-표적화 샘플에 대하여 정규화된, LshCas13a 및 LwaCas13a에 대한 PFS 강화의 분포. (D) 다양한 강화 컷오프 임계값에서 LshCas13a 절단 후 남은 PFS 서열에 대한 서열 로고 및 수. (E) 다양한 강화 컷오프 임계값에서 LshCas13a 절단 후 남은 PFS 서열에 대한 서열 로고 및 수.
도 58a 내지 58d: LwaCas13a 표적화 효율은 전사물에 대한 접근 가능성의 영향을 받는다. (A) 첫 번째 행: 상위 녹다운 가이드는 표적 전사물을 따라 위치에 의해 플롯팅된다. 가이드의 상위 20%는 Gluc 용으로 선택되고 상위 30%의 가이드는Cluc, KRAS 및 PPIB용이다. 두 번째 행: 무작위 귀무-분포(빨간색)와 비교하여 각각의 전사물에 대해 인접한 상위 가이드 사이의 쌍-거리(파란색)에 대한 히스토그램이다. 삽입 그래프는 이들 히스토그램에 대한 누적 빈도 곡선을 나타낸다. 빨간색 곡선(거리의 귀무 부포)의 왼쪽으로의 파란색 곡선(실제 측정된 거리)의 이동은 가이드들이 우연에 의해 예상되는 것보다 서로 근접함을 나타낸다. (B) Gluc, Cluc, PPIB, 및 KRAS 녹다운은 전사물의 예상되는 폴딩에 의해 측정되는 표적 접근 가능성과 부분적으로 상관관계가 있다. (C) 표적 접근 가능성(염기쌍 형성 영역의 확률) 및 LwaCas13a에 의한 녹다운 후의 표적 발현 사이의 상관 관계를 묘사하는 커널 밀도 추정 플롯. (D) 첫 번째 행: 상이한 윈도우 크기(W)에서 및 상이한 k-mer 길이에 대해 측정된 표적 발현과 표적 접근 가능성(염기쌍 형성 영역의 확률) 사이의 상관관계. 두 번째 행: 상이한 윈도우 크기(W)에서 및 상이한 k-mer 길이에 대해 측정된 표적 발현과 표적 접근 가능성(염기쌍 형성 영역의 확률) 사이의 상관관계에 대한 P 값. 색상 기준은 p 값 > 0.05는 빨간색 음영이고 p 값 < 0.05는 파란색 음영이 되도록 설계하였다.
도 59a 내지 59k: 다양한 스페이서 길이에서 crRNA:표적 듀플렉스에서의 미스매치에 대한 LwaCas13a 민감성의 상세 평가. (A) 스페이서 서열에 걸쳐 다양한 위치에서 단일 미스매치를 함유하는 crRNA로 평가된 KRAS의 녹다운. (B) 스페이서 서열에 걸쳐 다양한 위치에서 단일 미스매치를 함유하는 crRNA로 평가된 PPIB의 녹다운 (C) 스페이서 서열에 걸쳐 다양한 위치에서 비-연속 2 개의 미스매치를 함유하는 가이드로 평가된 Gluc의 녹다운. 야생형 서열은 아래에 나타난 미스매치 동일성과 함께 상단에 나타난다. (D) 다양한 스페이서 길이에 대한 ssRNA 1 및 2 상의 부수적 절단 활성(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (E) (D)에서 시험한 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (F) 스페이서를 따라 타일링된 합성 미스매치를 갖는 28 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (G) (F)에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (H) 스페이서를 따라 타일링된 합성 미스매치를 갖는 23 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (I) (H) 에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (J) 스페이서를 따라 타일링된 합성 미스매치를 갖는 20 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (K) (J)에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다).
도 60a 내지 60f: LwaCas13a는 내인성 표적 상의 shRNA 녹다운보다 더 특이적이고 생물학적 잡음에 비교할 만한 변동이 거의 없다. (A) 왼쪽: KRAS-표적화 shRNA(y-축)에 대비한 비-표적화 shRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. KRAS 전사물 데이터 포인트는 빨간색으로 채색된다. 오른쪽: KRAS-표적화 LwaCas13a-crRNA(y-축)에 대비한 비-표적화 LwaCas13a-crRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. KRAS 전사물 데이터 포인트는 빨간색으로 채색된다. (B) 왼쪽: PPIB-표적화 shRNA(y-축)에 대비한 비-표적화 shRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. PPIB 전사물 데이터 포인트는 빨간색으로 채색된다. 오른쪽: PPIB-표적화 LwaCas13a-crRNA(y-축)에 대비한 비-표적화 LwaCas13a-crRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. PPIB 전사물 데이터 포인트는 빨간색으로 채색된다. (C) 비-표적화 shRNA 조건(첫 번째 행) 및 Gluc-표적화 shRNA 조건(두 번째 행)의 개별 반복실험의 비교. (D) 비-표적화 crRNA 조건(첫 번째 행) 및 Gluc-표적화 crRNA 조건(두 번째 행)의 개별 반복실험의 비교. (E) Gluc-표적화 shRNA 조건에 대한 비-표적화 shRNA 조건의 개별 반복실험의 쌍별 비교. (F) Gluc-표적화 crRNA 조건에 대한 비-표적화 crRNA 조건의 개별 반복실험의 쌍별 비교.
도 61a 내지 61c: 모든 샘플에 걸친 LwaCas13a 및 RNAi 녹다운 가변성(표준 편차)에 대한 상세 분석. (A) 루시페라제 리포터 또는 내인성 유전자를 표적화하는 shRNA 또는 crRNA에 대해 표적화 및 비-표적화 반복실험 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 상관 관계(켄달의 타우) 히트 맵. (B) 모든 반복실험 및 변동 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 상관 관계(켄달의 타우) 히트 맵. (C) shRNA 또는 crRNA의 경우 표적화된 각각의 유전자에 대한 표적화 및 비-표적화 반복실험 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 표준 편차 분포.
도 62a 내지 62j: LwaCas13a 녹다운은 측정된 표적외 전사물 상에 아무 활성을 갖지 않고 표적화된 전사물에 특이적이다. (A) Gluc을 타일링한 처음 96 개의 스페이서에 대한 절대 Gluc 신호 히트 맵. (B) Cluc을 타일링한 처음 96 개의 스페이서에 대한 절대 Cluc 신호 히트 맵. (C) 절대 Gluc 신호 및 Gluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (D) 절대 Cluc 신호 및 Gluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (E) 절대 Cluc 신호 및 Cluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (F) 절대 Gluc 신호 및 Cluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (G) PPIB 2-Ct 수준 및 PPIB 타일링 가이드에 대한 PPIB 녹다운 사이의 관계. (H) GAPDH 2-Ct 수준 및 PPIB 타일링 가이드에 대한 PPIB 녹다운 사이의 관계. (I) KRAS 2-Ct 수준 및 PPIB KRAS 가이드에 대한 KRAS 녹다운 사이의 관계. (J) GAPDH 2-Ct 수준 및 PPIB KRAS 가이드에 대한 KRAS 녹다운 사이의 관계.
도 63a 내지 63f: dCas13a는 리포터 유전자 발현을 억제하고 내인성 유전자와 결합한다. (A) Cluc및 Gluc를 분리하는 합성 HBG1 인트론을 통해 타일링된 dCas13a는 번역 개시 부위로부터 특정 거리에서 Gluc 번역을 억제할 수 있다. (B) dCas13a 및 2 개의 표적화 crRNA 및 1 개의 비-표적화 crRNA로 표적화된 β-액틴 mRNA의 RNA 면역 침강 강화. (C) ACTB를 이미징하기 위한 dCas13-GFP 및 dCas13a-GFP-KRAB 작제물의 국소화 사이의 비교. (D) 비-표적화 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야. (E) ACTB 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야. (F) ACTB 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야.
도 64a 내지 64b dCas13a-NF는 살아있는 세포에서 스트레스 과립 형성을 이미징할 수 있다. (A) 상응하는 ACTB-표적화 및 비-표적화 가이드를 갖는 dCas13a-NF-발현 세포에서의 ACTB 전사물의 RNA FISH로부터의 대표적인 이미지. 세포 외곽선은 파선으로 나타난다. (B) 만데르의 중첩 계수(왼쪽) 및 피어슨 상관관계(오른쪽)에 의해 정량화된 ACTB RNA FISH 신호 및 dCas13a-NF 사이의 전체 신호 중첩. 상관 관계 및 신호 중첩은 세포당 기반으로 픽셀 단위로 계산된다. 모든 값은 n=3 인 평균±SEM이다. ****p < 0.0001; ***p < 0.001; **p < 0.01. 양쪽-꼬리 스튜던트 T-검정을 비교에 사용하였다.
도 65a 내지 65c. 발현에 대한 직접 및 부수적 전사물 녹다운. (A) 활성 대 데드 Cas13a에 의한 루시페라제의 녹다운. (B) 내인성 유전자 발현에 대한 활성 대 데드 Cas13a 녹다운. 데드 Cas13a에 의한 녹다운은 번역 차단으로 인하거나 결합으로 인한 전사물의 불안정화로 인할 수 있다. (C) 포유류 세포에서 데드 Cas13a에 의한 부수적 활성의 부재. (A)에서 루시페라제에 대해 데드 Cas13a 및 가이드 1 및 2를 사용하여, 비-표적화 대조군에 비해 전사물 분포 크기에서의 변화는 관찰되지 않는다.
도 66a 내지 66o. 도 53의 상이한 C2C2 오솔로그 서열들의 표시된 컨센서스 서열과의 정렬.
도 67a 내지 67c. 렙토트리키아 와데이 F0279 C2c2("Lew2C2c2") 및 리스테리아 뉴요켄시스 FSL M6-0635 C2c2("LibC2c2")의 정렬.
도 68. 알엔아제 활성을 나타내는 C2c2 HEPN 도메인의 정렬. 상단 정렬 블록은 이전에 기재된 선택된 HEPN 도메인을 포함하고 하단 블록은 C2c2 이펙터 단백질 유래의 촉매 모티프를 포함한다. 각각의 도메인 구조 밑에는 각 단백질 패밀리의 선택된 대표에서 보존된 모티프의 정렬. 촉매성 잔기는 검정색 배경 상의 흰색 글자로 나타나고; 보존된 소수성 잔기는 노란색으로 강조 표시되고; 보존된 작은 잔기는 녹색으로 강조 표시되고; 가교 나선 정렬에서, 양으로 하전된 잔기는 빨간색이다. 2 차 구조 예측은 정렬된 서열의 밑에 나타난다: H는 α-나선을 의미하며 E는 펼쳐진 형태(β-가닥)를 의미한다. 정렬 블록 사이의 불량하게 보존된 스페이서는 숫자로 나타난다.
본 명세서의 도면은 단지 예시적인 목적을 위한 것이며, 반드시 일정한 비율로 그려진 것은 아니다.
일반적으로, WO 2014/093622(PCT/US2013/074667)와 같은 전술한 문헌에서 사용된 CRISPR-Cas 또는 CRISPR 시스템은 전사물 및, Cas유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복" 및 tracrRNA-처리된 부분 직접 반복을 포괄하는), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭되는), 또는 본 명세서에서 사용되는 그 용어와 같은 "RNA"(예를 들어, Cas9와 같은 Cas를 가이드하기 위한 RNA(들), 예를 들어 CRISPR RNA 및 트랜스활성화(tracr) RNA 또는 단일 가이드 RNA(sgRNA)(키메라 RNA)) 또는 CRISPR 유전자좌로부터의 다른 서열 및 전사물을 포함하는, CRISPR-관련("Cas") 유전자의 발현 또는 활성을 지시하는 것에 관여하는 다른 요소를 집합적으로 지칭한다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 촉진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서라고도 지칭됨)를 특징으로 한다. CRISPR 단백질이 C2c2 단백질일 때, tracrRNA는 필요하지 않다.
CRISPR 복합체의 형성 맥락에서, "표적 서열"은 표적 서열과 가이드 서열 사이의 혼성화가 CRISPR 복합체의 형성을 촉진하는, 가이드 서열이 그에 대하여 상보성을 갖도록 설계된 서열을 지칭한다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질에 위치한다. 일부 구현예에서, 직접 반복은 다음 기준 중 임의의 것 또는 전부를 충족시키는 반복 모티프를 검색함으로써 인실리코로 동정될 수 있다: 1. 제II형 CRISPR 유전자좌 측면에 배치된 게놈 서열의 2 Kb 윈도우에서 발견됨; 2. 20 내지 50 bp에 걸침; 및 3. 20 내지 50 bp 만큼의 간격을 둠. 일부 구현예에서, 이들 기준 중 2 개, 예를 들어 1 및 2, 2 및 3, 또는 1 및 3이 사용될 수 있다. 일부 구현예에서, 3 개 기준 모두가 사용될 수 있다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고 표적 서열에 CRISPR 복합체의 서열-특이적 결합을 지시하기 위해 표적 폴리뉴클레오티드 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 용어 "표적화 서열"은 표적 서열과 충분한 상보성을 갖는 가이드 서열의 부분을 의미한다. 일부 구현예에서, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬된 경우, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 그 이상이거나 그보다 크다. 서열을 정렬하기 위한 임의의 적합한 알고리즘으 사용으로 최적 정렬을 결정할 수 있으며, 이의 비-제한적인 예로는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러(Burrows-Wheeler) 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies, www.novocraft.com에서 이용 가능), ELAND(Illumina, 미국 캘리포니아주 샌디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능), 및 Maq(maq.sourceforge.net에서 이용 가능)이 포함된다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75, 또는 그 이상의 뉴클레오티드 길이이거나 그보다 크다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12, 또는 그 이하의 뉴클레오티드 길이보다 작다. 바람직하게, 가이드 서열은 10 30 뉴클레오티드 길이이다. CRISPR 복합체의 표적 서열에 대한 서열-특이적 결합을 지시하는 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험될 가이드 서열을 포함하여, CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은, 예를 들어 CRISPR 서열의 성분을 인코딩하는 벡터로 형질감염시킴으로써, 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있고, 이어서, 예를 들어 본 명세서에 기재된 Surveyor 분석에 의해, 표적 서열 내에서의 선택적인 절단을 평가할 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험될 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는, CRISPR 복합체의 성분을 제공하고, 시험 및 대조군 가이드 서열 반응 사이의 표적 서열에서의 결합 또는 절단 속도를 비교함으로써 시험과에서 평가될 수 있다. 다른 분석이 가능하며 당업자에게 떠오를 것이다.
대표적인 CRISPR-Cas 시스템에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 100%이거나 그보다 클 수 있고; 가이드 또는 RNA 또는 sgRNA는 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75, 또는 그 이상의 뉴클레오티드 길이이거나 그보다 클 수 있거나; 가이드 또는 RNA 또는 sgRNA는 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12, 또는 그 이하의 뉴클레오티드 길이보다 작을 수 있다. 그러나, 본 발명의 일 양태는 표적외 상호 작용을 감소시키는 것, 예를 들어, 낮은 상보성을 갖는 표적 서열과 상호 작용하는 가이드를 감소시키는 것이다. 실제로, 실시예에서, 본 발명은 CRISPR-Cas 시스템이 80% 초과 내지 약 95%의 상보성, 예를 들어, 83% 내지 84% 또는 88 내지 89% 또는 94 내지 95% 상보성을 갖는 표적과 표적외 서열 사이를 구별(예를 들어, 1, 2 또는 3 미스매치를 갖는 18 개 뉴클레오티드의 표적외로부터 18 개 뉴클레오티드를 갖는 표적 간의 구별)할 수 있도록 하는 돌연변이를 포함하는 것으로 나타난다. 따라서, 본 발명의 맥락에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 94.5% 또는 95% 또는 95.5% 또는 96% 또는 96.5% 또는 97% 또는 97.5% 또는 98% 또는 98.5% 또는 99% 또는 99.5% 또는 99.9% 또는 100% 보다 크다. 표적외는 서열과 가이드 사이에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 또는 94% 또는 93% 또는 92% 또는 91% 또는 90% 또는 89% 또는 88% 또는 87% 또는 86% 또는 85% 또는 84% 또는 83% 또는 82% 또는 81% 또는 80% 상보성보다 적고, 표적외가 서열과 가이드 사이에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 상보성인 것이 유리하다.
특정 구현예에서, 절단 효율의 조절은 미스매치, 예를 들어 스페이서/표적을 따라 미스매치의 위치를 포함하여, 스페이서 서열과 표적 서열 사이의 1 또는 2 개의 미스매치와 같은, 1 개 이상의 미스매치의 도입에 의해 개발될 수 있다. 예를 들어 2 개의 미스매치가 더 중심에 있을수록(즉, 3' 또는 5'이 아님), 절단 효율이 더 많이 영향을 받는다. 따라서, 스페이서를 따라 미스매치 위치를 선택함으로써, 절단 효율이 조절될 수 있다. 예로서, 표적의 100% 미만의 절단을 원하는 경우(예를 들어, 세포 집단에서), 스페이스와 표적 서열 사이의 1 개 이상, 예를 들어 바람직하게는 2 개의 미스매치가 스페이서 서열에 도입될 수 있다. 미스매치 위치가 스페이서를 따라 더 중심에 있을수록 절단 백분율은 더 낮아진다.
본 명세서에 기재된 본 발명에 따른 방법은 본 명세서에서 논의된 벡터를 세포에 전달하는 것을 포함하여 본 명세서에서 논의된 진핵 세포(시험관내, 즉 단리된 진핵 세포)에서 하나 이상의 뉴클레오티드 변형을 유도하는 것을 이해한다. 돌연변이(들)는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해 세포(들)의 각각의 표적 서열에의 하나 이상의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 1 내지 75 개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 40, 45, 50, 75, 100, 200, 300, 400 또는 500 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다.
독성 및 표적외 효과의 최소화를 위해, Cas mRNA 또는 단백질 및 전달되는 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. Cas mRNA 또는 단백질 및 가이드 RNA의 최적 농도는 세포 또는 비-인간 진핵생물 동물 모델에서 상이한 농도를 시험하고 잠재적인 표적외 게놈 유전자좌에서 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정할 수 있다.
전형적으로, 내인성 CRISPR 시스템의 맥락에서, CRISPR 복합체(표적 서열에 혼성화되고 하나 이상의 Cas 단백질과 복합체를 이루는 가이드 서열을 포함)의 형성은 표적 서열에서 또는 근처(예를 들어. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 또는 그 이상의 염기쌍 내에)에서 절단을 초래하나, 예를 들어, 구체적으로 RNA 표적의 경우에는 2 차 구조에 의존할 수 있다.
Cas를 인코딩하는 핵산 분자는 유리하게는 코돈 최적화된 Cas이다. 코돈 최적화 서열의 예는, 이 경우에는, 본 명세서에서 논의된 진핵 생물, 예를 들어 인간(즉, 인간에서의 발현을 위해 최적화된), 또는 또 다른 진핵 생물, 동물 또는 포유류에서의 발현을 위해 최적화된 서열이다; 예를 들어 WO2014/093622(PCT/US2013/074667)에서의 SaCas9 인간 코돈 최적화된 서열 참고. 이것이 선호되는 반면, 다른 예가 가능하고 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 특정 기관에 대한 코돈 최적화가 알려져 있음을 이해할 것이다. 일부 구현예에서, Cas를 인코딩하는 효소 코딩 서열은 구체적인 세포, 예를 들어 진핵 세포에서의 발현을 위해 코돈 최적화된다. 진핵 세포는, 인간을 포함하나 이에 한정되지 않는 포유동물, 또는 본 명세서에서 논의된 비-인간 진핵 생물 또는 동물 또는 포유동물, 예를 들어, 마우스, 래트, 토끼, 개, 가축, 또는 비-인간 포유동물 또는 영장류와 같은 구체적인 생물의 것 또는 그로부터 유래한 것일 수 있다. 일부 구현예에서, 인간 또는 동물에게 임의의 실질적인 의학적 이익없이 고통을 초래할 가능성이 있는, 인간의 생식세포 유전적 동일성을 변형하기 위한 공정 및/또는 동물의 유전적 동일성을 변형하기 위한 공정, 및 이러한 공정으로부터 생기는 동물은 또한 제외될 수 있다. 일반적으로, 코돈 최적화는 천연 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개, 또는 그 이상의 코돈이거나 그보다 많은)을 천연 아미노산 서열을 유지하면서 그 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 있는 숙주 세포에서의 향상된 발현을 위해 핵산 서열을 변형시키는 공정을 지칭한다. 다양한 종은 구체적인 아미노산의 특정 코돈에 대해 구체적인 편향을 나타낸다. 코돈 편향(생물 간의 코돈 사용에 있어서의 차이)은 종종 메신저 RNA(mRNA)의 번역 효율과 상관관계가 있고, 이는 결국, 다른 것들 중에서, 번역될 코돈의 특성 및 구체적인 트랜스퍼 RNA(tRNA) 분자의 이용 가능성에 의존하는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩티드 합성에서 가장 빈번하게 사용되는 코돈의 반영이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 생물에서 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는 예를 들어 www.kazusa.orjp/codon/에서 이용 가능한 "코돈 사용 데이터베이스(Codon Usage Database)"에서 쉽게 이용할 수 있으며 이들 표는 많은 방식으로 각색될 수 있다. 문헌[Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)] 참고. 구체적인 숙주 세포에서의 발현을 위해 구체적인 서열을 코돈 최적화하는 컴퓨터 알고리즘 또한 이용 가능하고, 예를 들어 Gene Forge(Aptagen, Jacobus, PA) 또한 이용 가능하다. 일부 구현예에서, Cas를 인코딩하는 서열 중 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50, 또는 그 이상의, 또는 모든 코돈)은 구체적인 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 해당한다.
특정 구현예에서, 본 명세서에 기재된 방법은, 하나 이상의 가이드 RNA를 인코딩하는 하나 이상의 핵산이 제공되거나 하나의 관심 유전자의 프로모터를 포함하는 조절 요소와 작동 가능하게 연결되어 세포 내에 도입된 Cas 유전자 도입 세포를 제공하는 것을 포함할 수 있다. 본 명세서에 사용된 용어 "Cas 유전자 도입 세포"는 Cas 유전자가 게놈으로 통합된, 진핵 세포와 같은, 세포를 지칭한다. 세포의 본성, 유형, 또는 기원은 본 발명에 따라 구체적으로 한정되지 않는다. 또한 Cas 전이 유전자가 세포 내에 도입되는 방식은 다양할 수 있으며 당 업계에 공지된 임의의 방법일 수 있다. 특정 구현예에서, Cas 유전자 도입 세포는 단리된 세포에 Cas 전이 유전자를 도입함으로써 수득된다. 특정 다른 구현예에서, Cas 유전자 도입 세포는 Cas 유전자 도입 생물로부터 세포를 단리함으로써 수득된다. 예로서, 제한 없이, 본 명세서에서 지칭된 Cas 유전자 도입 세포는 Cas 녹-인 진핵 생물과 같은 Cas 유전자 도입 진핵 생물로부터 유래될 수 있다. 본 명세서에 참조로서 포함된 WO2014/093622(PCT/US13/74667)를 참조한다. Rosa 유전자좌를 표적화하는 것에 대한, Sangamo BioSciences, Inc.에 양도된 미국 특허 공보 제20120017290호 및 제20110265198호의 방법은 본 발명의 CRISPR Cas 시스템을 이용하도록 변형될 수 있다. Rosa 유전자좌를 표적화하는 것에 대한, Cellectis에 양도된 미국 특허 공보 제20130236946호의 방법도 본 발명의 CRISPR Cas 시스템을 이용하도록 변형될 수 있다. 추가의 예로서, 본 명세서에 참조로서 포함된, Cas9 녹-인 마우스를 기술하는, 문헌[Platt et. al. (Cell; 159(2):440-455 (2014))]을 참조한다. Cas 전이 유전자는 Lox-정지-폴리A-Lox(LSL) 카세트를 추가로 포함할 수 있어, Cre 재조합 효소에 의해 Cas 발현이 유도되도록 할 수 있다. 대안적으로, Cas 유전자 도입 세포는 단리된 세포에 Cas 전이 유전자를 도입함으로써 수득될 수 있다. 전이 유전자 전달 시스템은 당업계에 잘 알려져 있다. 예로서, Cas 전이 유전자는 본 명세서의 다른 곳에서도 기재된 바와 같이 벡터(예를 들어, AAV, 아데노바이러스, 렌티바이러스) 및/또는 입자 및/또는 나노입자 전달에 의해 예를 들어 진핵 세포에 전달될 수 있다.
당업자는 본 명세서에서 지칭된 Cas 유전자 도입 세포와 같은 세포가, 예를 들어, 제한 없이 문헌[Platt et al. (2014), Chen et al., (2014) or Kumar et al.. (2009)]에 기재된 바와 같이, 통합된 Cas 유전자 또는, 예를 들어 하나 이상의 발암성 돌연변이와 같은, Cas를 표적 유전자좌로 가이드할 수 있는 RNA와 복합체 형성시 Cas의 서열 특이적 작용으로부터 발생하는 돌연변이를 갖는 것 외에 추가적인 게놈 변경을 포함할 수 있음을 이해할 것이다.
일부 구현예에서, Cas 서열은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상, 또는 그 보다 많은 NLS 또는 NES와 같은, 하나 이상의 핵 국소화 서열(NLS) 또는 핵 방출 신호(NES)에 융합된다. 일부 구현예에서, Cas는 아미노 말단에서 또는 근처에서 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상, 또는 그 보다 많은 NLS 또는 NES, 카르복시 말단에서 또는 근처에서 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상, 또는 그 보다 많은 NLS 또는 NES, 또는 이들의 조합(예를 들어, 아미노 말단에 0 또는 적어도 하나 이상의 NLS 또는 NES 및 카르복시 말단에 0 또는 하나 이상의 NLS 또는 NES)을 포함한다. 하나 보다 많은 NLS 또는 NES가 존재할 때, 각각은 다른 것과 독립적으로 선택될 수 있어, 단일 NLS 또는 NES가 하나보다 많은 카피로 존재할 수 있고/있거나 하나 이상의 다른 NLS 또는 NES와 조합하여 하나 이상의 카피로 존재할 수 있다. 본 발명의 바람직한 구현예에서, Cas는 최대 6 개의 NLS를 포함한다. 일부 구현예에서, NLS 또는 NES의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50, 또는 그 이상의 아미노산 내에 있는 경우 NLS 또는 NES는 N- 또는 C-말단 근처로 여겨진다. NLS의 비-제한적 예로는 아미노산 서열 PKKKRKV(SEQ ID NO: X)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민 유래 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 양분 NLS) (SEQ ID NO:X); 아미노산 서열 PAAKRVKLD(SEQ ID NO: X) 또는 RQRRNELKRSP(SEQ ID NO:X)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: X)를 갖는 hRNPA1 M9 NLS; 임포틴-알파 유래의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: X); 근종 T 단백질의 서열VSRKRPRP(SEQ ID NO: X) 및 PPKKARED(SEQ ID NO: X); 인간 p53의 서열 POPKKKPL(SEQ ID NO: X); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: X); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: X) 및 PKQKKRK(SEQ ID NO: X); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: X); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: X); 인간 폴리(ADP-리보스) 폴리메라제의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: X); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: X)로부터 유래된 NLS 서열이 포함된다. NES의 비-제한적인 예는 NES 서열 LYPERLRRILT (ctgtaccctgagcggctgcggcggatcctgacc)를 포함한다. 일반적으로, 하나 이상의 NLS 또는 NES는 진핵 세포의 핵 또는 세포질 각각에서 검출 가능한 양으로 Cas의 축적을 추진하기에 충분한 강도이다. 일반적으로 핵 국소화/방출 활성의 강도는 Cas의 NLS/NES 수, 사용된 구체적인 NLS(들) 또는 NES(들), 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵/세포질에서의 축적의 검출은 임의의 적합한 기법에 의해 수행될 수 있다. 예를 들어, 검출 가능한 마커가 Cas에 융합되어, 예를 들어 핵(예를 들어, DAPI와 같은 핵에 특이적인 염색) 또는 세포질의 위치를 검출하기 위한 수단과 조합하여, 세포 내의 위치가 시각화될 수 있다. 세포 핵은 또한 세포로부터 단리될 수 있으며, 그 다음 그 내용물을 면역조직화학법, 웨스턴 블롯, 또는 효소 활성 분석과 같은 단백질 검출을 위한 임의의 적합한 공정에 의해 분석할 수 있다. 핵 내 축적은 또한 예를 들어, Cas 또는 복합체에 노출되지 않은 대조군, 또는 하나 이상의 NLS 또는 NES가 없는 Cas에 노출된 대조군과 비교하여 CRISPR 복합체 형성 효과에 대한 분석(예를 들어, 표적 서열에서의 DNA 절단 또는 돌연변이에 대한 분석, 또는 CRISPR 복합체 형성 및/또는 Cas 효소 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 분석)에 의해 간접적으로 결정될 수 있다. 특정 구현예에서, 예를 들어, 제한 없이, 미토콘드리아, 플라스티드, 엽록체, 소포, 골지, (핵 또는 세포)막, 리보솜, 인, ER, 세포골격, 공포, 중심체, 뉴클레오솜, 과립, 중심립 등과 같은 세포 기관과 같은 세포의 구체적인 부위에 Cas를 국소화시키기 위하여 다른 국소화 태그를 Cas 단백질에 융합시킬 수 있다.
특정 양태에서, 본 발명은 벡터, 예를 들어 Cas 및/또는 Cas를 표적 유전자좌로 가이드할 수 있는 RNA(즉, 가이드 RNA)를 세포에 전달하거나 도입시키는 것뿐만 아니라, (예를 들어, 원핵 세포에서) 이들 성분을 증식시키는 것을 위한 벡터를 포함한다. 본 명세서에서 사용되는 "벡터"는 한 환경에서 또 다른 환경으로의 실재물의 이동을 가능하게 하거나 용이하게 하는 도구이다. 그것은 플라스미드, 파지, 또는 코즈미드와 같은 레플리콘(replicon)으로, 이 안으로 또 다른 DNA 절편이 삽입되어 삽입된 절편의 복제를 초래할 수 있다. 일반적으로 벡터는 적절한 제어 요소와 연관될 때 복제가 가능한다. 일반적으로, 용어 "벡터"는 그것이 연결된 또 다른 핵산을 운반할 수 있는 핵산 분자를 지칭한다. 벡터는 단일-가닥, 이중-가닥, 또는 부분적으로 이중-가닥인 핵산 분자, 하나 이상의 자유 말단을 포함하는, 자유 말단을 포함하지 않는(예를 들어 원형) 핵산 분자; DNA, RNA 또는 둘 모두를 포함하는 핵산 분자; 및 당업계에 공지된 다른 다양한 폴리뉴클레오티드를 포함하지만 이에 한정되지 않는다. 벡터의 한 유형은 "플라스미드"이며, 이는, 예를 들어 표준 분자 클로닝 기법에 의해, 추가적인 DNA 절편이 삽입될 수 있는 원형 이중 가닥 DNA 루프를 지칭한다. 벡터의 또 다른 유형은 바이러스 벡터이며, 여기서, 바이러스-유래 DNA 또는 RNA 서열이 바이러스로의 패키징을 위해 벡터에 존재한다(예를 들어, 레트로바이러스, 복제 결함 있는 레트로바이러스, 아데노바이러스, 복제 결함 있는 아데노바이러스, 및 아데노-관련 바이러스(AAV)). 바이러스 벡터는 또한 숙주 세포 내로의 형질감염을 위해 바이러스가 가지는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그들이 도입된 숙주 세포에서 자체 복제할 수 있다(예를 들어, 박테리아 복제 기원을 갖는 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입 즉시 숙주 세포의 게놈 안에 통합되어, 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 재조합 DNA 기법에서 효용있는 통상의 발현 벡터는 종종 플라스미드 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있으며, 이는 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 이는 발현될 핵산 서열에 작동 가능하게 연결되는, 발현에 사용되는 숙주 세포에 기반하여 선택될 수 있다. 재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 (예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입되는 경우 숙주 세포에서) 뉴클레오티드 서열의 발현이 가능하게 하는 방식으로 조절 요소(들)에 연결됨을 의미하는 것으로 의도된다. 재조합 및 클로닝 방법과 관련하여, 2004년 9월 2일 US 2004-0171156 A1으로서 공개된 미국 특허 출원 제10/815,730 호에 대하여 언급되며, 그 내용은 전체가 본 명세서에 참조로서 포함된다.
벡터(들)는 조절 요소(들), 예를 들어, 프로모터(들)를 포함할 수 있다. 벡터(들)는 Cas 인코딩 서열, 및/또는 단일, 그러나 또한 가능하게는 적어도 3 또는 8 또는 16 또는 32 또는 48 또는 50 개의 가이드 RNA(들)(예를 들어, sgRNA) 인코딩 서열, 예를 들어1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 3 내지 8, 3 내지 16, 3 내지 30, 3 내지 32, 3 내지 48, 3 내지 50 RNA(들)(예를 들어, sgRNA) 를 포함할 수 있다. 단일 벡터에서, 유리하게는, 약 16 개까지의 RNA(들)가 있는 경우, 각각의 RNA(예를 들어, sgRNA)에 대한 프로모터가 있을 수 있고; 단일 벡터가 16 개 보다 많은 RNA(들)를 제공할 경우, 하나 이상의 프로모터(들)가 하나보다 많은 RNA(들)의 발현을 구동할 수 있으며, 예를 들어, 32 개의 RNA(들)이 있을 경우, 각각의 프로모터는 2 개의 RNA(들)의 발현을 구동할 수 있으며, 48 개의 RNA(들)가 있을 경우 각각의 프로모터는 3 개의 RNA(들)의 발현을 구동할 수 있다. 간단한 산술 및 잘 확립된 클로닝 프로토콜 및 이 개시에서의 교시에 의해, 당업자는 AAV와 같은 적합한 예시적 벡터, 및 U6 프로모터와 같은 적합한 프로모터에 대하여 RNA(들)에 대한 본 발명을 용이하게 실시할 수 있다. 예를 들어, AAV의 패키징 한계는 약 4.7 kb이다. 단일 U6-gRNA(클로닝을 위한 제한 부위 포함)의 길이는 361 bp이다. 따라서, 당업자는 약 12 내지 16 개, 예를 들어, 13 개의 U6-gRNA 카세트를 단일 벡터에 용이하게 맞출 수 있다. 이것은 TALE 조립에 사용되는 골든 게이트 전략(http://www.genome-engineering.org/taleffectors/)과 같은 임의의 적합한 수단에 의해 조립될 수 있다. 당업자는 U6-gRNA의 수를 약 1.5 배만큼 증가시키기 위해, 예를 들어 12 내지 16 개, 예를 들어 13 개로부터 약 18 내지 24 개, 예를 들어 약 19개 U6-gRNA로 증가시키기 위해 직렬 배열 가이드 전략을 사용할 수도 있다. 따라서, 당업자는 단일 벡터, 예를 들어 AAV 벡터 내에서 약 18 개 내지 24 개, 예를 들어 약 19 개의 프로모터-RNA, 예를 들어 U6-gRNA에 용이하게 도달할 수 있다. 벡터 내 프로모터 및 RNA의 수를 증가시키기 위한 추가의 수단은 절단 가능한 서열에 의해 분리된 RNA의 어레이를 발현하는 단일 프로모터(예를 들어, U6)를 사용하는 것이다. 또한 벡터 내 프로모터-RNA의 수를 증가시키는 또 다른 추가의 수단은 코딩 서열 또는 유전자의 인트론에서 절단 가능한 서열에 의해 분리된 프로모터-RNA의 어레이를 발현하는 것이며; 이 경우, 증가된 발현을 가질 수 있고 조직 특이적 방식으로 긴 RNA의 전사를 가능하게 할 수 있는 폴리메라제 II 프로모터를 사용하는 것이 유리하다 (예를 들어, http://nar.oxfordjournals.org/content/34/7/e53.short, http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html 참조). 유리한 구현예에서, AAV는 약 50 개까지의 유전자를 표적화하는 U6 직렬 배열 gRNA를 패키징할 수 있다. 따라서, 당업계의 지식 및 이 개시에서의 교시로부터, 당업자는 벡터(들), 예를 들어, 제어 하에 또는 작동 가능하게 또는 기능적으로 하나 이상의 프로모터에 연결된 다중 RNA 또는 가이드를 발현하는 단일 벡터를, 특히 어떤 과도한 실험 없이 본 명세서에서 논의된 RNA 또는 가이드의 수와 관련하여, 용이하게 제조 및 사용할 수 있다.
가이드 RNA(들) 인코딩 서열 및/또는 Cas 인코딩 서열은 기능적으로 또는 작동 가능하게 조절 요소(들)에 연결될 수 있으며, 따라서 조절 요소(들)는 발현을 추진할 수 있다. 프로모터(들)는 구성적 프로모터(들) 및/또는 조건적 프로모터(들) 및/또는 유도성 프로모터(들) 및/또는 조직 특이적 프로모터일 수 있다. 프로모터는 RNA 폴리메라제, pol I, pol II, pol III, T7, U6, H1, 레트로바이러스 Rous 육종 바이러스(RSV) LTR 프로모터, 사이토메갈로바이러스(CMV) 프로모터, SV40 프로모터, 디하이드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터, 및 EF1α 프로모터로 구성된 군으로부터 선택될 수 있다. 유리한 프로모터는 프로모터가 U6인 것이다.
본 발명의 일 양태는 클래스 2 CRISPR-Cas 시스템과 연관된 신규 이펙터 단백질의 동정 및 설계 제작에 관한 것이다. 바람직한 구현예에서, 이펙터 단백질은 단일-서브유닛 이펙터 모듈을 포함한다. 추가 구현예에서, 이펙터 단백질은 시험관내, 생체내 또는 생체외 적용을 위한 원핵 세포 또는 진핵 세포에서 기능적이다. 본 발명의 일 양태는 새로운 클래스 2 CRISPR-Cas 시스템을 예측하고 그 안에 있는 성분을 동정하기 위한 컴퓨터 방법 및 알고리즘을 포함한다.
일 양태에서, 신규한 클래스 2 CRISPR-Cas 유전자좌를 동정하는 컴퓨터 방법은 다음 단계를 포함한다: Cas1 단백질을 인코딩하는 모든 콘티그(contig)를 검출하는 단계; cas1 유전자의 20 kB 내, 더욱 구체적으로 cas1 유전자의 시작으로부터 20 kb 및 cas1 유전자의 말단으로부터 20 kb 영역 내의 모든 예측된 단백질 코딩 유전자를 동정하는 단계; 동정된 유전자를 Cas 단백질-특이적 프로파일과 비교하고 CRISPR 어레이를 예측하는 단계; 500 아미노산(>500 aa)보다 큰 단백질을 함유하는 부분적 및/또는 분류되지 않은 후보 CRISPR-Cas 유전자좌를 선택하는 단계; PSI-BLAST 및 HHPred를 사용하여 선택된 후보를 분석함으로써 신규한 클래스 2 CRISPR-Cas 유전자좌를 단리하고 동정하는 단계. 상기 언급된 단계에 추가적으로, 추가적인 상동체에 대한 메타게노믹스(metagenomics) 데이터베이스를 검색함으로써 후보의 추가적인 분석을 수행할 수 있다.
일 양태에서, Cas1 단백질을 인코딩하는 모든 콘티그를 검출하는 것은 본 명세서에 참조로서 포함되어 있는 문헌["GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions". John Besemer, Alexandre Lomsadze and Mark Borodovsky, 핵산s Research (2001) 29, pp 2607-2618]에 추가로 기재된 바와 같은 유전자 예측 프로그램인 GenemarkS에 의해 실행된다.
일 양태에서 모든 예측된 단백질 코딩 유전자를 동정하는 것은 동정된 유전자를 Cas 단백질-특이적 프로파일과 비교하고, 오래된 도메인 및 전장 단백질에 대한 주석이 잘 달린 다중 서열 정렬 모델의 집합으로 이루어진 단백질 주석 자료인 NCBI 보존된 도메인 데이터베이스(Conserved Domain Database; CDD)에 따라서 이들에 주석을 붙임으로써 수행된다. 이들은 RPS-BLAST를 통해 단백질 서열 중 보존된 도메인의 빠른 동정을 위한 위치-특이적 스코어 매트릭스(position-specific score matrix; PSSM)로서 이용 가능하다. CDD 내용은 NCBI-큐레이팅된 도메인을 포함하며, 이는 3D-구조 정보를 사용하여 도메인 경계를 한정하고 서열/구조/기능 관계뿐만 아니라 다수의 외부 공급원 데이터베이스(Pfam, SMART, COG, PRK, TIGRFAM)로부터 가져온 도메인 모델에 대한 이해를 제공한다. 추가의 양태에서, 문헌["PILER-CR: fast and accurate identification of CRISPR repeats", Edgar, R.C., BMC Bioinformatics, Jan 20;8:18(2007)](본 명세서에 참조로서 포함되어 있음)에 기재된 바와 같은 CRISPR 반복부를 발견하기 위한 공개 도메인 소프트웨어인 PILER-CR 프로그램을 사용하여 CRISPR 어레이를 예측하였다.
추가의 양태에서, 사례별 분석은 PSI-BLAST(Position-Specific Iterative Basic Local Alignment Search Tool; 위치-특이적 반복 기본 국소 정렬 검색 도구)를 사용하여 실행한다. PSI-BLAST는 단백질-단백질 BLAST를 사용하여 주어진 스코어 임계값 초과로 검출된 서열의 다중 서열 정렬로부터 위치-특이적 스코어 매트릭스(position-specific scoring matrix; PSSM) 또는 프로파일을 유도한다. PSSM은 새로운 매치에 대한 데이터베이스를 추가로 검색하는 데 사용되며, 이들 새로 검출된 서열을 이용하여 후속 반복을 위해 업데이트된다. 따라서, PSI-BLAST는 단백질 간 거리가 있는 관계를 검출하는 수단을 제공한다.
또 다른 양태에서, 사례별 분석은 BLAST 또는 PSI-BLAST와 같이 사용하기 쉽고 동시에 원격 상동체를 찾는 데 훨씬 더 민감한 서열 데이터베이스 검색 및 구조 예측을 위한 방법인 HHpred를 사용하여 실행된다. 사실, HHpred의 민감도는 현재 이용 가능한 구조 예측을 위한 가장 강력한 서버와 경쟁적이다. HHpred는 프로파일 은닉 마르코프 모델(hidden Markov model; HMM)의 쌍별 비교를 기반으로 하는 첫 번째 서버이다. 대부분의 종래 서열 검색 방법이 UniProt 또는 NR과 같은 서열 데이터베이스, HHpred 검색 정렬 데이터베이스, 예를 들어 Pfam 또는 SMART를 검색한다. 이는 단일 서열의 클러터(clutter) 대신에 다수의 서열 패밀리에 대한 히트 목록이 크게 단순화된다. 모든 공개적으로 이용 가능한 주요 프로파일 및 정렬 데이터베이스는 HHpred를 통해 이용 가능하다. HHpred는 입력값으로서 단일 질의 서열 또는 다중 정렬을 허용한다. 단지 몇 분 이내에, PSI-BLAST와 유사한 읽기 쉬운 포맷으로 검색 결과를 가져온다. 검색 옵션은 국소 또는 전체 정렬 및 2차 구조 유사성의 스코어를 포함한다. HHpred는 쌍별 질의-주형 서열 정렬, 병합된 질의-주형 다중 정렬(예를 들어, 이행성 검색을 위함)뿐만 아니라, HHpred 정렬로부터 MODELLER 소프트웨어에 의해 계산된 3D 구조 모델을 생성할 수 있다.
용어 "핵산-표적화 시스템", 여기서, 핵산은 DNA 또는 RNA이고, 일부 양태에서는 또한 DNA-RNA 하이브리드 또는 이의 유도체를 지칭할 수 있음은 DNA 또는 RNA-표적화 CRISPR-관련된("Cas") 유전자의 발현 또는 이의 활성의 유도에 포함되는 전사물 및 다른 요소를 집합적으로 지칭하며, 이는 DNA 또는 RNA-표적화 Cas 단백질을 인코딩하는 서열 및 CRISPR RNA(crRNA) 서열을 포함하는 DNA 또는 RNA-표적화 가이드 RNA 및 (모든 시스템 아닌 일부 시스템에서) 트랜스-활성화 CRISPR/Cas 시스템 RNA(tracrRNA) 서열, 또는 DNA 또는 RNA-표적화 CRISPR 유전자좌로부터의 다른 서열 및 전사물을 포함할 수 있다. 일반적으로, RNA-표적화 시스템은 표적 DNA 또는 RNA 서열의 부위에서 DNA 또는 RNA-표적화 복합체의 형성을 촉진하는 요소들에 의해 특징지어진다. DNA 또는 RNA-표적화 복합체의 형성의 맥락에서, "표적 서열"은 DNA 또는 RNA-표적화 가이드 RNA가 그에 대한 상보성을 갖도록 설계된 DNA 또는 RNA 서열을 지칭하며, 여기서 표적 서열과 RNA-표적화 가이드 RNA 사이에서의 혼성화는 RNA-표적화 복합체의 형성을 촉진한다. 일부 구현예에서, 표적 서열은 세포의 핵 내 또는 세포질 내에 위치된다.
본 발명의 일 양태에서, 본 출원의 RNA- 또는 RNA-표적화 CRISPR/Cas 또는 CRISPR-Cas 시스템 RNA-표적화 시스템으로도 지칭되는 신규한 RNA 표적화 시스템은 동정된 제VI형 Cas 단백질에 기반하며, 이는 특정 RNA 서열을 표적화하기 위해 맞춤화된 단백질을 생성할 필요가 없고 오히려 단일 효소는 특정 RNA 표적을 인식하기 위해 RNA 분자에 의해 프로그래밍될 수 있고, 즉, 효소가 상기 RNA 분자를 사용하여 특정 RNA 표적에 모집될 수 있다.
본 발명의 일 양태에서, 본 출원의 DNA- 또는 DNA-표적화 CRISPR/Cas 또는 CRISPR-Cas 시스템 RNA-표적화 시스템으로도 지칭되는 신규한 DNA 표적화 시스템은 동정된 제VI형 Cas 단백질에 기반하며, 이는 특정 RNA 서열을 표적화하기 위해 맞춤화된 단백질을 생성할 필요가 없고 오히려 단일 효소는 특정 DNA 표적을 인식하기 위해 RNA 분자에 의해 프로그래밍될 수 있고, 즉, 효소가 상기 RNA 분자를 사용하여 특정 DNA 표적에 모집될 수 있다.
본 명세서에 기재된 핵산-표적화 시스템, 벡터 시스템, 벡터 및 조성물은 다양한 핵산-표적화 응용, 유전자 생성물, 예를 들어 단백질의 합성 변경 또는 변형, 핵산 절단, 핵산 편집, 핵산 스플라이싱; 표적 핵산의 수송, 표적 핵산의 추적, 표적 핵산의 단리, 표적 핵산의 시각화 등에 사용될 수 있다.
본 명세서에서 사용된 Cas 단백질 또는 CRISPR 효소는 CRISPR-Cas 시스템의 새로운 분류에 제시되는 단백질 중 임의의 것을 지칭한다.
C2c2 뉴클레아제
클래스 2 제VI형 이펙터 단백질 C2c2는 ssRNA를 분해하도록 효율적으로 프로그래밍될 수 있는 RNA-가이드된 알엔아제이다. 본 발명의 C2c2 이펙터 단백질은 다음의 21 개 오솔로그 종을 제한 없이 포함한다(다중 CRISPR 유전자좌 포함하여: 렙토트리키아 샤히; 렙토트리키아 와데이(Lw2); 리스테리아 세엘리게리; 라크노스피라세아에 박테리움 MA2020; 라크노스피라세아에 박테리움 NK4A179; [클로스트리디움] 아미노필룸 DSM 10710; 카르노박테리움 갈리나룸 DSM 4847; 카르노박테리움 갈리나룸 DSM 4847 (제2 CRISPR 유전자좌); 팔루디박터 프로피오니시게네스 WB4; 리스테리아 웨이헨스테파넨시스 FSL R9-0317; 리스테리아세아에 박테리움 FSL M6-0635; 렙토트리키아 와데이 F0279; 로도박터 캅술라투스 SB 1003; 로도박터 캅술라투스 R121; 로도박터 캅술라투스 DE442; 렙토트리키아 부칼리스 C-1013-b; 헤르비닉스 헤미셀룰로실리티카(Herbinix hemicellulosilytica); [유박테리움] 렉탈레([Eubacterium] rectale); 유박테리아세아에 박테리움(Eubacteriaceae bacterium) CHKCI004; 블라우티아 종 마르세일레(Blautia sp. Marseille)-P2398; 및 렙토트리키아 종 오랄 분류군 879 균주 F0557. 12 개의 추가 비-제한적 예는: 라크노스피라세아에 박테리움 NK4A144; 클로로플렉서스 아그레간스(Chloroflexus aggregans); 데메퀴나 아우란티아카(Demequina aurantiaca); 탈라쏘스피라 종(Thalassospira sp.) TSL5-1; 슈도부티리비브리오 종(Pseudobutyrivibrio sp.) OR37; 부티리비브리오 종(Butyrivibrio sp.) YAB3001; 블라우티아 종 마르세일레-P2398; 렙토트리키아 종 마르세일레(Leptotrichia sp. Marseille)-P3007; 박테로이데스 이후아에(Bacteroides ihuae); 포르피로모나다세아에 박테리움(Porphyromonadaceae bacterium) KH3CP3RA; 리스테리아 리파리아(Listeria riparia); 및 인솔리티스피릴룸 페레그리눔(Insolitispirillum peregrinum)이다.
C2c2는 그의 2 개의 HEPN 도메인 내의 보존된 염기성 잔기를 통해 RNA 절단을 달성한다. 예측된 HEPN 도메인 촉매성 잔기의(예를 들어, 알라닌) 치환과 같은 HEPN 도메인의 돌연변이는 C2c2를 비활성 프로그래밍 가능한 RNA-결합 단백질(dC2c2, dCas9에 유사)로 전환시키는 데 사용될 수 있다.
본 발명에 따르면, 다수의 C2c2 오솔로그로부터 컨센서스 서열이 생성될 수 있으며, 이는 C2c2 기능을 매개하는 C2c2 오솔로그 내에 촉매성 잔기 및 HEPN 모티프를 포함하지만 이에 한정되지 않는, 보존된 아미노산 잔기 및 모티프를 위치시키는 데 도움이 될 수 있다. Geneious 정렬을 사용하여 상기 언급된 33 개의 오솔로그로부터 생성된 하나의 이러한 컨센서스 서열은: MKISKVXXXVXKKXXXGKLXKXVNERNRXAKRLSNXLBKYIXXIDKIXKKEXXKKFXAXEEITLKLNQXXXBXLXKAXXDLRKDNXYSXJKKILHNEDINXEEXELLINDXLEKLXKIESXKYSYQKXXXNYXMSVQEHSKKSIXRIXESAKRNKEALDKFLKEYAXLDPRMEXLAKLRKLLELYFYFKNDXIXXEEEXNVXXHKXLKENHPDFVEXXXNKENAELNXYAIEXKKJLKYYFPXKXAKNSNDKIFEKQELKKXWIHQJENAVERILLXXGKVXYKLQXGYLAELWKIRINEIFIKYIXVGKAVAXFALRNXXKBENDILGGKIXKKLNGITSFXYEKIKAEEILQREXAVEVAFAANXLYAXDLXXIRXSILQFFGGASNWDXFLFFHFATSXISDKKWNAELIXXKKJGLVIREKLYSNNVAMFYSKDDLEKLLNXLXXFXLRASQVPSFKKVYVRXBFPQNLLKKFNDEKDDEAYSAXYYLLKEIYYNXFLPYFSANNXFFFXVKNLVLKANKDKFXXAFXDIREMNXGSPIEYLXXTQXNXXNEGRKKEEKEXDFIKFLLQIFXKGFDDYLKNNXXFILKFIPEPTEXIEIXXELQAWYIVGKFLNARKXNLLGXFXSYLKLLDDIELRALRNENIKYQSSNXEKEVLEXCLELIGLLSLDLNDYFBDEXDFAXYJGKXLDFEKKXMKDLAELXPYDQNDGENPIVNRNIXLAKKYGTLNLLEKJXDKVSEKEIKEYYELKKEIEEYXXKGEELHEEWXQXKNRVEXRDILEYXEELXGQIINYNXLXNKVLLYFQLGLHYLLLDILGRLVGYTGIWERDAXLYQIAAMYXNGLPEYIXXKKNDKYKDGQIVGXKINXFKXDKKXLYNAGLELFENXNEHKNIXIRNYIAHFNYLSKAESSLLXYSENLRXLFSYDRKLKNAVXKSLINILLRHGMVLKFKFGTDKKSVXIRSXKKIXHLKSIAKKLYYPEVXVSKEYCKLVKXLLKYK이다.
상기 오솔로그로부터 동정된 HEPN 서열 모티프가 처음 21 개의 오솔로그 및 모든 33 개의 오솔로그 각각을 기초로 하여 도 49 및 도 50에 제공된다. 촉매적으로 데드 C2c2 돌연변이체를 생성하기 위해 돌연변이될 수 있는 아미노산 잔기의 비-제한적인 예는, 상기 컨센서스를 기반으로, HEPN1에 또는 근처에 D372, R377, Q/H382, 및 F383 또는 오솔로그의 상응하는 아미노산, 및 HEPN2에 또는 근처에 K893, N894, R898, N899, H903, F904, Y906, Y927, D928, K930, K932 또는 오솔로그의 상응하는 아미노산을 포함한다.
또 다른 비-제한적인 예에서, 컨센서스 서열의 생성 및 보존된 잔기의 확인을 돕기 위한 서열 정렬 도구는 MUSCLE 정렬 도구(www.ebi.ac.uk/Tools/msa/muscle/)이다. 예를 들어, MUSCLE을 사용하여, C2c2 오솔로그들 사이에서 보존된 다음의 아미노산 위치를 렙토트리키아 와데이 C2c2에서 확인할 수 있다: K2; K5; V6; E301; L331; I335; N341; G351; K352; E375; L392; L396; D403; F446; I466; I470; R474 (HEPN); H475; H479 (HEPN), E508; P556; L561; I595; Y596; F600; Y669; I673; F681; L685; Y761; L676; L779; Y782; L836; D847; Y863; L869; I872; K879; I933; L954; I958; R961; Y965; E970; R971; D972; R1046 (HEPN), H1051 (HEPN), Y1075; D1076; K1078; K1080; I1083; I1090.
도 52a 내지 52k는 C2c2 오솔로그의 정렬을 나타낸다. 도 52l은 HEPN 도메인의 예시적인 서열 정렬 및 고도로 보존된 잔기를 나타낸다.
C2c2 HEPN은 또한 DNA, 또는 잠재적으로 DNA 및/또는 RNA를 표적화할 수 있다. C2c2의 HEPN 도메인이 적어도 결합할 수 있고 야생형 형태에서 RNA를 절단할 수 있다는 점을 근거로 하여, C2c2 이펙터 단백질은 알엔아제 기능을 갖는 것이 선호된다. 또한, 또는 대안적으로, 디엔아제 기능을 가질 수 있다.
따라서, 일부 구현예에서, 이펙터 단백질은 예를 들어 전사 활성화제 또는 억제제 도메인, NLS 또는 기타 기능성 도메인으로 본 명세서에 기재된 바와 같이 선택적으로 기능화될 수 있는, 데드-Cas 타입 이펙터 단백질과 같은 RNA-결합 단백질일 수 있다. 일부 구현예에서, 이펙터 단백질은 RNA의 단일 가닥을 절단하는 RNA-결합 단백질일 수 있다. 결합된 RNA가 ssRNA인 경우, ssRNA는 완전히 절단된다. 일부 구현예에서, 이펙터 단백질은, 예를 들어 2 개의 알엔아제 도메인을 포함하는 경우, RNA의 이중 가닥을 절단하는 RNA-결합 단백질일 수 있다. 결합된 RNA가 dsRNA인 경우, dsRNA는 완전히 절단된다.
CRISPR 시스템에서의 알엔아제 기능은 알려져 있으며, 예를 들어 mRNA 표적화는 특정 제III형 CRISPR-Cas 시스템(문헌[Hale et al., 2014, Genes Dev, vol. 28, 2432-2443; Hale et al., 2009, Cell, vol. 139, 945-956; Peng et al., 2015, Nucleic acids research, vol. 43, 406-417])에 대하여 보고되었고 상당한 이점을 제공한다. 스태필로코커스 에피더미스(Staphylococcus epidermis) 제III-A형 시스템에서, 표적에 걸친 전사는 Cas10-Csm 리보핵산단백질 이펙터 복합체 내의 독립적인 활성 부위에 의해 매개되는, 표적 DNA 및 그 전사물의 절단을 초래한다(Samai et al., 2015, Cell, vol. 151, 1164-1174 참고). 따라서, 본 이펙터 단백질을 통해 RNA를 표적화하는 CRISPR-Cas 시스템, 조성물 또는 방법이 제공된다.
표적 RNA, 즉 관심 RNA는 표적 RNA상의 관심 표적 부위로의 모집, 및 이펙터 단백질의 결합을 유도하는, 본 발명에 의해 표적화될 RNA이다. 표적 RNA는 임의의 적합한 형태의 RNA 일 수 있다. 이는 일부 구현예에서 mRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 tRNA 또는 rRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 miRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 siRNA를 포함할 수 있다.
간섭 RNA(RNAi) 및 마이크로RNA(miRNA)
다른 구현예에서, 표적 RNA는 간섭 RNA, 즉 진핵 생물 및 원핵 생물 모두에서 shRNA, siRNA 등과 같은 RNA 간섭 경로에 관여하는 RNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 마이크로RNA(miRNA)를 포함할 수 있다. 간섭 RNA 또는 miRNA에 대한 제어는 생체내 또는 시험관내에서 간섭 RNA 또는 miRNA의 수명을 감소시킴으로써 그러한 접근에서 보이는 표적외 효과(OTE)를 감소시키는 데 도움이 될 수 있다.
특정 구현예에서, 표적은 miRNA 자체가 아니고 miRNA 표적의 miRNA 결합 부위이다.
특정 구현예에서, miRNA는 (예를 들어, 세포 내 재위치되는 것을 포함하여) 격리될 수 있다. 특정 구현예에서, 예를 들어 제한 없이, 헤어핀에서 miRNA는 절단될 수 있다.
특정 구현예에서, miRNA 가공(예를 들어 턴오버 포함)은 증가되거나 감소된다.
이펙터 단백질 및 적합한 가이드가 선택적으로(예를 들어, 적합한 프로모터, 예를 들어 조직- 또는 세포주기-특이적 프로모터 및/또는 인핸서의 제어 하에 공간적으로 또는 시간적으로) 발현되는 경우, 이것은 그들 세포에서 RNAi로부터 (생체내 또는 시험관내) 세포 또는 시스템을 '보호'하는 데 사용될 수 있다. 이것은 RNAi가 필요하지 않은 이웃 조직 또는 세포에서 또는 이펙터 단백질 및 적합한 가이드가 발현되고 발현되지 않는(즉, 각각 RNAi가 제어되지 않는 곳 및 제어되는 곳) 세포 또는 조직의 비교 목적으로 유용할 수 있다. 이펙터 단백질은 리보자임, 리보솜 또는 리보스위치와 같은 RNA를 포함하거나 이로 구성된 분자를 제어하거나 분자에 결합하는 데 사용될 수 있다. 본 발명의 일 구현예에서, RNA 가이드는 이펙터 단백질을 이들 분자에 모집하여 이펙터 단백질이 그들에 결합할 수 있도록 할 수 있다.
본 출원은 정보가 제공된 시스템의 설계 제작을 위한 기초를 제공하므로, 본 발명의 단백질 시스템은, 본 개시 내용으로부터, 과도한 실험없이 치료, 분석 및 다른 응용을 포함하는 RNAi 기술 분야에 적용될 수 있다(예를 들어, 문헌[Guidi et al., PLoS Negl Trop Dis 9(5): e0003801. doi:10.1371/journal.pntd; Crotty et al., In vivo RNAi screens: concepts and applications. Shane Crotty ... 2015 Elsevier Ltd. Published by Elsevier Inc., Pesticide Biochemistry and Physiology (Impact Factor: 2.01). 01/2015; 120. DOI: 10.1016/j.pestbp.2015.01.002] 및 문헌[Makkonen et al., Viruses 2015, 7(4), 2099-2125; doi:10.3390/v7042099] 참고).
리보솜 RNA(rRNA)
예를 들어, 아지트로마이신과 같은 아잘리드 항생제가 잘 알려져 있다. 그들은 50S 리보솜 서브유닛을 표적화하고 파괴한다. 본 이펙터 단백질은 50S 리보솜 서브유닛을 표적화하는 적합한 가이드 RNA와 함께, 일부 구현예에서, 50S 리보솜 서브유닛에 모집 및 결합될 수 있다. 따라서, 리보솜(특히 50s 리보솜 서브유닛) 표적을 향하는 적합한 가이드와 함께 본 이펙터 단백질이 제공된다. 리보솜(특히 50s 리보솜 서브유닛) 표적을 향하는 적합한 가이드와 함께 이 사용 이펙터 단백질의 용도는 항생제 용도를 포함할 수 있다. 구체적으로, 항생제 용도는 아지트로마이신과 같은 아잘리드 항생제의 작용과 유사하다. 일부 구현예에서, 원핵 생물에서의 70S 서브유닛, 상기 언급된 50S 서브유닛, 30S 서브유닛뿐만 아니라 16S 및 5S 서브유닛과 같은 원핵 리보솜 서브유닛이 표적화될 수 있다. 다른 구현예에서, 진핵 세포에서의 80S 서브유닛, 60S 서브유닛, 40S 서브유닛뿐만 아니라 28S, 18S. 5.8S 및 5S서브유닛과 같은 진핵 리보솜 서브유닛이 표적화될 수 있다.
일부 구현예에서, 이펙터 단백질은 본 명세서에 기재된 바와 같이 선택적으로 기능화된, RNA-결합 단백질일 수 있다. 일부 구현예에서, 이펙터 단백질은 RNA의 단일 가닥을 절단하는 RNA-결합 단백질일 수 있다. 두 경우 모두, 구체적으로 RNA-결합 단백질이 RNA의 단일 가닥을 절단하는 경우, 리보솜 기능이 조절되고, 구체적으로 감소되거나 파괴될 수 있다. 이것은 임의의 리보솜 RNA 및 임의의 리보솜 서브유닛에 적용될 수 있으며, rRNA의 서열은 잘 알려져 있다.
따라서, 리보솜 활성의 제어가 리보솜 표적에 대한 적합한 가이드와 함께 본 이펙터 단백질의 사용을 통해 예상된다. 이것은 리보솜의 절단 또는 리보솜에의 결합을 통한 것일 수 있다. 구체적으로, 리보솜 활성의 감소가 예상된다. 이것은 생체내 또는 시험관내에서 리보솜 기능을 분석하는 데 유용할 수 있고, 생체내 또는 시험관내에서 리보솜 활성에 기반한 치료법을 제어하는 수단으로서 또한 유용할 수 있다. 또한, 생체내 또는 시험관내 시스템에서의 단백질 합성의 제어(즉, 감소)가 예상되며, 이러한 제어는 항생제 및 연구 및 진단 용도를 포함한다.
리보스위치
리보스위치(압토자임으로도 알려져 있음)는 소분자를 결합하는 메신저 RNA 분자의 조절 부분이다. 이것은 전형적으로 mRNA에 의해 인코딩된 단백질의 생산을 변화시킨다. 따라서, 리보스위치 표적에 대한 적합한 가이드와 함께 본 이펙터 단백질의 사용을 통해 리보스위치 활성의 제어가 예상된다. 이것은 리보스위치의 절단 또는 리보스위치에의 결합을 통한 것일 수 있다. 구체적으로, 리보스위치 활성의 감소가 예상된다. 이것은 생체내 또는 시험관내에서 리보스위치 기능을 분석하는 데 유용할 수 있고, 생체내 또는 시험관내에서 리보스위치 활성에 기반한 치료법을 제어하는 수단으로서 또한 유용할 수 있다. 또한, 생체내 또는 시험관내 시스템에서의 단백질 합성의 제어(즉, 감소)가 예상된다. 이 제어는, rRNA에서와 같이, 항생제 및 연구 및 진단 용도를 포함할 수 있다.
리보자임
리보자임은 효소(물론 단백질임)와 유사한 촉매 특성을 갖는 RNA 분자이다. 리보자임은, 천연적으로 발생한 것 및 설계 제작된 것 모두, RNA를 포함하거나 RNA로 구성되기 때문에, 본 RNA-결합 이펙터 단백질에 의해 또한 표적화될 수 있다. 일부 구현예에서, 이펙터 단백질은 리보자임을 절단함으로써 이를 불능으로 만드는 RNA-결합 단백질일 수 있다. 따라서, 리보자임 표적에 대한 적합한 가이드와 함께 본 이펙터 단백질의 사용을 통해 리보자임 활성의 제어가 예상된다. 이것은 리보자임의 절단 또는 리보자임에의 결합을 통한 것일 수 있다. 구체적으로, 리보자임 활성의 감소가 예상된다. 이것은 생체내 또는 시험관내에서 리보자임 기능을 분석하는 데 유용할 수 있고, 생체내 또는 시험관내에서 리보자임 활성에 기반한 치료법을 제어하는 수단으로서 또한 유용할 수 있다.
RNA 가공을 포함하는, 유전자 발현
이펙터 단백질은 RNA 가공의 제어를 통하는 것을 포함하여, 적합한 가이드와 함께, 유전자 발현을 표적화하는 데 또한 사용될 수 있다. RNA 가공의 제어는 RNApol; 식물에서의 바이로이드를 포함하는 (구체적으로, 위성 바이러스, 박테리오파지 및 레트로바이러스, 예를 들어, HBV, HBC 및 HIV 및 본 명세서에 나열된 다른 것들의) 바이러스 복제; 및 tRNA 생합성의 표적화를 통해, 대안적 스플라이싱을 포함하는 RNA 스플라이싱과 같은 RNA 가공 반응을 포함할 수 있다. 이펙터 단백질 및 적합한 가이드는 또한 RNA 활성화(RNAa)를 제어하는 데 사용될 수 있다. RNAa는 유전자 발현을 촉진하므로 RNAa의 파괴 또는 감소 그에 따른 유전자 발현의 더 적은 촉진을 통해 그와 같이 유전자 발현의 제어가 달성될 수 있다. 이것은 아래에서 상세히 더 논의된다.
RNAi 스크린
녹다운이 표현형 변화와 관련되는 유전자 산물을 동정하여, RNAi 스크린을 통해 생물학적 경로를 조사하고, 구성 부분을 동정할 수 있다. 스크린에서 RNAi의 활성을 제거 또는 감소시키고 그에 따라 (간섭/억제를 제거 또는 감소시킴으로써) 유전자 산물의 (이전에 간섭된) 활성을 회복시키기 위해 이펙터 단백질 및 적합한 가이드를 사용함으로써 이들 스크린을 통해 또는 그 동안 제어가 또한 작용할 수 있다.
위성 RNA(satRNA) 및 위성 바이러스가 또한 처리될 수 있다.
알엔아제 활성과 관련하여 본 명세서에서의 제어는 일반적으로 감소, 음성적 방해 또는 녹-다운 또는 녹-아웃을 의미한다.
생체내 RNA 응용
유전자 발현의 저해
본 명세서에서 제공된 표적-특이적 알엔아제는 표적 RNA의 매우 특이적인 절단을 가능하게 한다. RNA 수준에서의 간섭은 게놈이 변형되지 않으므로 공간적 및 시간적 둘 모두에서 비-침습적 방식으로 조절을 가능하게 한다.
다수의 질병이 mRNA 표적화에 의해 치료 가능한 것으로 입증되었다. 이들 연구의 대부분은 siRNA의 투여에 관한 것이지만, 본 명세서에서 제공되는 RNA 표적화 이펙터 단백질이 유사한 방식으로 적용될 수 있음은 분명하다.
mRNA 표적(및 상응하는 질병 치료)의 예는 VEGF, VEGF-R1 및 RTP801(AMD 및/또는 DME 치료에서), 카스파제 2(Naion 치료에서) ADRB2(안내압 치료에서), TRPVI(건성 안구 증후군 치료에서, Syk 키나제(천식 치료에서), Apo B(고콜레스테롤혈증 또는 저베타지질단백혈증 치료에서), PLK1, KSP 및 VEGF(고형 종양 치료에서), Ber-Abl(CML 치료에서)(문헌[Burnett and Rossi Chem Biol. 2012, 19(1): 60-71)])이다. 유사하게, RNA 표적화는 HIV(HIV Tet 및 Rev의 표적화), RSV(RSV 뉴클레오캡시드의 표적화) 및 HCV(miR-122의 표적화)와 같은 RNA-바이러스 매개 질병의 치료에 효과적임이 입증되었다(문헌[Burnett and Rossi Chem Biol. 2012, 19(1): 60-71]).
본 발명의 RNA 표적화 이펙터 단백질은 돌연변이 특이적 또는 대립유전자 특이적 녹다운에 사용될 수 있다고 추가로 예상된다. 가이드 RNA는 돌연변이 또는 대립유전자-특이적 서열을 포함하는 전사된 mRNA내의 서열을 특이적으로 표적화하도록 설계될 수 있다. 이러한 특이적인 녹다운은 돌연변이된 또는 대립유전자-특이적 유전자 산물과 관련된 장애에 관한 치료적 적용에 특히 적합하다. 예를 들어, 가족성 저베타지질단백혈증(FHBL)의 대부분 사례는 ApoB 유전자의 돌연변이에 의해 야기된다. 이 유전자는 아포지질단백질 B 단백질의 2 가지 버전인 짧은 버전(ApoB-48) 및 긴 버전(ApoB-100)을 인코딩한다. FHBL를 초래하는 몇몇 ApoB 유전자 돌연변이로 인해 ApoB의 2 가지 버전이 비정상적으로 짧아진다. 본 발명의 RNA 표적화 이펙터 단백질을 이용한 돌연변이된 ApoB mRNA 전사물의 특이적 표적화 및 녹다운은 FHBL의 치료에 유익할 수 있다. 또 다른 예로서, 헌팅턴 질병 (HD)은 헌팅틴 단백질을 코딩하는 유전자에서, 비정상적 단백질을 초래하는, CAG 3 개 반복의 확장에 의해 야기된다. 본 발명의 RNA 표적화 이펙터 단백질을 이용한 돌연변이된 또는 대립유전자-특이적인 헌팅틴 단백질 인코딩 mRNA 전사물의 특이적 표적화 및 녹다운은 HD의 치료에 유익할 수 있다.
이 맥락에서, 그리고 더욱 일반적으로는 본 명세서에 기재된 바와 같은 다양한 응용을 위해서, RNA 표적화 이펙터 단백질의 분할된 버전의 사용이 예상될 수 있음이 언급된다. 실제로, 이것은 특이성을 증가시킬뿐만 아니라 전달에 유리할 수도 있다. C2c2는 C2c2 효소의 두 부분이 기능하는 C2c2를 실질적으로 포함한다는 의미에서 분할된다. 이상적으로, 분할은 항상 촉매성 도메인(들)이 영향을 받지 않도록 되어야 한다. 그 C2c2는 뉴클레아제로서 기능할 수 있거나, 촉매성 도메인에서의 전형적인 돌연변이로 인해 촉매 활성이 거의 없거나 전혀 없는 본질적으로 RNA-결합 단백질인 데드-C2c2일 수 있다.
분할된 C2c2의 각각의 절반은 이량체화 파트너에 융합될 수 있다. 제한없이, 예로서, 라파마이신 민감성 이량체화 도메인을 사용함으로써 C2c2 활성의 시간적 제어를 위한 화학적으로 유도성인 분할된 C2c2 생성이 가능하다. 따라서 C2c2는 2 개의 단편으로 분할됨으로써 화학적으로 유도성이 될 수 있고 그 라파마이신-민감성 이량체화 도메인은 C2c2의 제어된 재조립에 사용될 수 있다. 분할된 C2c2의 두 부분은 분할된 C2c2의 N' 말단 부분 및 C' 말단 부분으로 생각될 수 있다. 융합은 전형적으로 C2c2의 분할 지점에서 있다. 다시 말해서, 분할된 C2c2의 N' 말단 부분의 C' 말단은 이량체 절반 중 하나에 융합되는 반면, C' 말단 부분의 N' 말단은 다른 이량체 절반에 융합된다.
손상이 새롭게 생성된다는 의미에서 C2c2가 분할될 필요는 없다. 분할 지점은 전형적으로 인실리코로 설계되고 작제물로 클로닝된다. 함께, 분할된 C2c2의 두 부분, N' 말단 및 C' 말단 부분은 바람직하게는 야생형 아미노산(또는 이들을 인코딩하는 뉴클레오티드)의 적어도 70% 이상, 바람직하게는 적어도 80% 이상, 바람직하게는 적어도 90% 이상, 바람직하게는 적어도 95% 이상, 및 가장 바람직하게는 적어도 99% 이상의 야생형 아미노산(또는 이들을 인코딩하는 뉴클레오티드)을 포함하는 완전한 C2c2를 형성한다. 일부 트리밍이 가능할 수 있고, 돌연변이체가 예상된다. 비-기능성 도메인은 완전하게 제거될 수 있다. 중요한 것은 두 부분이 병합되어 원하는 C2c2 기능이 회복되거나 재구성될 수 있다는 것이다. 이량체는 동종이량체 또는 이종이량체일 수 있다.
특정 구현예에서, 본 명세서에 기재된 C2c2 이펙터는, 돌연변이-특이적, 또는 대립유전자-특이적 녹다운과 같은, 돌연변이-특이적, 또는 대립유전자-특이적 표적화를 위해 사용될 수 있다.
RNA 표적화 이펙터 단백질은 또한 알엔아제 활성을 증가시키거나 또는 메시지의 추가 분해를 보장하기 위해 상승 작용하는, 비-특이적 알엔아제 또는 아르고노트(Argonaute) 2와 같은 또 다른 기능성 알엔아제 도메인에 융합될 수 있다.
RNA 기능의 조절을 통한 유전자 발현의 조절
mRNA의 절단을 통한 유전자 발현에의 직접적인 영향 외에도, RNA 표적화는 또한 세포 내의 RNA 가공의 특정 측면에 영향을 미치기 위해 사용될 수 있으며, 이는 유전자 발현의 더욱 미세한 조절을 가능하게 할 수 있다. 일반적으로, 조절은 예를 들어 단백질의 결합을 차단하거나 RNA 결합 단백질을 모집하는 것과 같이, RNA에 대한 단백질의 결합을 간섭함으로써 예를 들어 매개될 수 있다. 실제로, mRNA의 스플라이싱, 수송, 국소화, 번역 및 턴오버와 같은 상이한 수준에서 조절이 보장될 수 있다. 유사하게, 치료의 맥락에서, RNA-특이적 표적화 분자를 사용함으로써 이들 각각의 수준에서 기능 부전(병원성)을 처리하는 것이 예상될 수 있다. 이들 구현예에서, RNA 표적화 단백질은, 본 명세서 기재된 c2c2의 돌연변이 형태와 같이, RNA 표적을 절단하는 능력을 잃었지만, 그것에 결합하는 능력을 유지하는 "데드" C2c2 인 것이 많은 사례에서 바람직하다.
A) 대안적인 스플라이싱
다수의 인간 유전자는 대안적인 스플라이싱의 결과로서 다수의 mRNA를 발현한다. 상이한 질병이, 발현된 유전자의 기능 상실 또는 기능 획득을 초래하는 비정상적 스플라이싱에 연결된 것으로 나타났다. 이들 질병 중 일부는 스플라이싱 결함을 야기하는 돌연변이에 의해 유발되지만, 이들 중 다수는 그렇지 않다. 하나의 치료 선택지는 스플라이싱 메커니즘을 직접 표적화하는 것이다. 본 명세서에 기재된 RNA 표적화 이펙터 단백질은 예를 들어 슬라이싱을 차단 또는 촉진하고, 엑손을 포함 또는 제외하고, 특정 이소형의 발현에 영향을 미치고/미치거나 대안적 단백질 생산물의 발현을 자극하는 데 사용될 수 있다. 이러한 적용은 아래에서 상세히 더 기재된다.
표적 RNA에 결합하는 RNA 표적화 이펙터 단백질은 스플라이싱 인자의 RNA 서열에 대한 접근을 입체적으로 차단할 수 있다. 스플라이스 부위로 표적화되는 RNA 표적화 이펙터 단백질은, 선택적으로 인접한 부위로 스플라이싱 방향을 바꾸며, 부위에서의 스플라이싱을 차단할 수 있다. 예를 들어, 5' 스플라이스 부위 결합에 결합하는 RNA 표적화 이펙터 단백질은 스플라이소솜의 U1 성분의 모집을 차단하여, 그 엑손을 건너뛰도록 촉진할 수 있다. 대안적으로, 스플라이싱 인핸서 또는 사일렌서로 표적화되는 RNA 표적화 이펙터 단백질은 표적 부위에서의 트랜스작용 조절 스플라이싱 인자의 결합을 방지하고 스플라이싱을 효과적으로 차단 또는 촉진시킬 수 있다. 엑손 제외는 본 명세서에 기재된 RNA 표적화 이펙터 단백질에 의해 엑손 근처에서 전구체 mRNA로 ILF2/3 모집함으로써 추가로 달성될 수 있다. 또 다른 예로서, 글리신이 풍부한 도메인이 hnRNP A1의 모집 및 엑손 제외를 위해 부착될 수 있다(Del Gatto-Konczak et al. Mol Cell Biol. 1999 Jan;19(1):251-60).
특정 구현예에서, gRNA의 적절한 선택을 통해 다른 스플라이스 변이체는 표적화되지 않으면서, 특정 스플라이스 변이체가 표적화될 수 있다.
일부 경우, RNA 표적화 이펙터 단백질은(예를 들어, 스플라이싱이 결함있는 경우) 슬라이싱을 촉진시키는 데 사용될 수 있다. 예를 들어, RNA 표적화 이펙터 단백질은 추가의 스플라이싱을 위해 스플라이싱 조절 스템-루프를 안정화시킬 수 있는 이펙터와 관련될 수 있다. RNA 표적화 이펙터 단백질은 표적 DNA로 단백질을 모집하기 위해 특정 스플라이싱 인자에 대한 컨센서스 결합 부위 서열에 연결될 수 있다.
비정상적 스플라이싱과 관련된 질병의 예로는, 시냅스에서 기능하는 단백질의 스플라이싱을 조절하는 Nova 단백질의 손실로부터 유래된 부종양성 안진전 간대성근경련 실조(Paraneoplastic Opsoclonus Myoclonus Ataxia, 또는 POMA), 및 낭성 섬유증 막 전도도 조절제의 스플라이싱 결함에 의해 유발되어 비기능성 염화물 채널 생산이 초래되는 낭성 섬유증이 포함된다. 다른 질병에서 비정상적인 RNA 스플라이싱은 기능-획득을 초래한다. 예를 들어, 스플라이싱 결함을 일으키는, mRNA의 3'UTR에서의 CUG 3 개-반복 확장(50 내지 1500 초과 반복)으로 인해 유발되는 근긴장성이영양증에서 그러하다.
RNA 표적화 이펙터 단백질은 원하는 엑손 주위의 인트론 절제를 촉진하기 위해 5' 스플라이싱 부위에 스플라이싱 인자(예를 들어, U1)를 모집함으로써 엑손을 포함시키는 데 사용될 수 있다. 이러한 모집은 스플라이싱 활성화제로서 기능하는 아르기닌/세린 풍부 도메인과의 융합을 통해 매개될 수 있다(문헌[Gravely BR and Maniatis T, Mol Cell. 1998 (5):765-71]).
RNA 표적화 이펙터 단백질이 원하는 유전자좌에서 스플라이싱 시스템을 차단하여 엑손 인식 및 상이한 단백질 산물의 발현 방지를 초래하는 데 사용될 수 있다고 예상된다. 치료될 수 있는 장애의 예는 디스트로핀 단백질을 인코딩하는 유전자의 돌연변이에 의해 유발되는 듀시엔형 근이영양증(Duchenne muscular dystrophy, DMD)이다. 거의 모든 DMD 돌연변이는 프레임쉬프트를 일으켜 디스트로핀 번역의 손상을 초래한다. RNA 표적화 이펙터 단백질은 스플라이스 연결점 또는 엑손 스플라이싱 인핸서(ESE)와 쌍을 이룰 수 있으며, 이로써 엑손 인식을 방지하고 부분적으로 기능하는 단백질의 번역을 초래한다. 이것은 치명적인 듀시엔 표현형을 덜 심한 베커(Becker) 표현형으로 변환시킨다.
B) RNA 변형
RNA 편집은 주어진 서열의 유전자 산물의 다양성이 RNA에서의 사소한 변형에 의해 증가되는 자연적인 과정이다. 전형적으로, 변형은 아데노신(A)의 이노신(I)으로의 변환을 포함하여, 게놈에 의해 인코딩된 것과 상이한 RNA 서열을 초래한다. RNA 변형은 일반적으로 ADAR 효소에 의해 보장되며, 이로써 pre-RNA 표적은 편집될 아데노신을 함유하는 엑손 및 인트론 비-코딩 요소 사이의 염기쌍에 의해 불완전한 듀플렉스 RNA를 형성한다. A-I 편집의 대표적 예는 글루타메이트 수용체 GluR-B mRNA이고, 이로써 변화는 채널의 변형된 전도도 특성을 초래한다(문헌[Higuchi M, et al. Cell. 1993;75:1361-70]).
본 발명에 따르면, 주어진 전사물의 RNA 염기에서 전이(transition)(A<->G 또는 C<-> 변화) 또는 전환(transversion)(임의의 퓨링에서 임의의 피리미딘으로, 역도 또한 같음)를 유도하기 위해 효소적 접근이 사용된다. 전이는 A를 I로 또는 C를 U로 각각 전환시키는 아데닝(ADAR1/2), APOBEC) 또는 시토신 디아미나제(AID)를 이용함으로써 직접적으로 유도될 수 있다. 전환은 관심있는 염기에 반응성 산소 종 손상을 국소화시켜, 구아닌의 옥소-구아닌으로의 전환과 같이, 영향을 받는 염기에 화학적 변형이 부가되도록 함으로써 간접적으로 유도될 수 있다. 옥소-구아닌은 T로 인식되므로 아데닌과 염기쌍을 형성하여 번역이 영향받도록 한다. ROS-매개된 염기 손상에 대해 모집될 수 있는 단백질은 APEX 및 mini-SOG를 포함한다. 두 접근 모두의 경우 이들 이펙터는 촉매적으로 비활성인 C2c2에 융합되어 이들 돌연변이 유형이 필요한 전사물 상의 부위에 모집될 수 있다.
인간에서, ADAR1 유전자의 이형접합의 기능-삭제 돌연변이는 피부 질병, 인간 색소성 유전피부병(문헌[Miyamura Y, et al. Am J Hum Genet. 2003;73:693-9])을 유도한다. 본 발명의 RNA 표적화 이펙터 단백질은 기능 부전의 RNA 변형을 교정하는 데 사용될 수 있다고 예상된다.
RNA 아데노신 메틸라제(N(6)-메틸아데노신)는 본 발명의 RNA 표적화 이펙터 단백질에 융합되고 관심 전사물로 표적화될 수 있다고 예상된다. 이 메틸라제는 가역적인 메틸화를 야기하고 조절 역할을 하며 다수 RNA-관련 세포 경로를 조절함으로써 유전자 발현 및 세포 운명 결정에 영향을 줄 수 있다(문헌[Fu et al Nat Rev Genet. 2014;15(5):293-306]).
C) 폴리아데닐화
mRNA의 폴리아데닐화는 핵 수송, 번역 효율 및 mRNA의 안정성에 중요하며, 이들 모두뿐만 아니라 폴리아데닐화의 과정은 특정 RBP에 의존한다. 대부분의 진핵 mRNA는 전사 후 약 200 개 뉴클레오티드의 3' 폴리(A) 꼬리를 받는다. 폴리아데닐화는 폴리(A)폴리머라제의 활성을 자극하는 상이한 RNA-결합 단백질 복합체를 포함한다(문헌[Minvielle-Sebastia L et al. Curr Opin Cell Biol. 1999;11:352-7]). 본 명세서에서 제공된 RNA-표적화 이펙터 단백질은 RNA-결합 단백질과 RNA 사이의 상호 작용을 간섭하거나 촉진시키는 데 사용될 수 있다고 예상된다.
폴리아데닐화에 관여되는 결함 단백질과 연관된 질병의 예는 안구인두 근이영양증(OPMD)이다(문헌[Brais B, et al. Nat Genet. 1998;18:164-7]).
D) RNA 방출
pre-mRNA 가공 후, mRNA는 핵으로부터 세포질로 방출된다. 이것은 캐리어 복합체의 생성을 포함하는 세포 메카니즘에 의해 보장되며, 그 후 핵 공극을 통해 전위되어 mRNA를 세포질에 방출하고 이어서 캐리어를 재순환시킨다.
RNA의 방출에 역할을 하는 단백질(예를 들어, TAP)의 과도 발현은 그렇지 않으면 Xenopus에서 비효율적으로 방출되는 전사물의 방출을 증가시키는 것으로 밝혀졌다(문헌[Katahira J, et al. EMBO J. 1999;18:2593-609]).
E) mRNA 국소화
mRNA 국소화는 공간적으로 조절된 단백질 생산을 보장한다. 세포의 특정 영역으로의 전사물의 국소화는 국소화 요소에 의해 보장될 수 있다. 구체적인 구현예에서, 본 명세서에 기재된 이펙터 단백질은 관심 있는 RNA로 국소화 요소를 표적화하는 데 사용될 수 있다고 예상된다. 이펙터 단백질은 표적 전사물을 결합하고 그들을 펩티드 신호 태그에 의해 결정된 세포 내 위치로 왕복시키도록 설계될 수 있다. 더욱 구체적으로, 예를 들어, 하나 이상의 핵 국소화 신호(NLS) 및/또는 하나 이상의 핵 방출 신호(NES)에 융합된 RNA 표적화 이펙터 단백질은 RNA 국소화를 변경시키는 데 사용될 수 있다.
국소화 신호의 추가 예로는 몇몇 비대칭 세포 유형에서 세포질로의 β-액틴의 국소화를 보장하는 우편번호 결합 단백질(ZBP1), KDEL 보유 서열(소포체로의 국소화), 핵 방출 신호(세포질로의 국소화), 미토콘드리아 표적화 신호(미토콘드리아로의 국소화), 페록시솜 표적화 신호(페록시솜으로의 국소화) 및 m6A 표지/YTHDF2(p-바디로의 국소화)가 포함된다. 예상되는 다른 접근은 RNA 표적화 이펙터 단백질을 알려진 국소화의 단백질(예를 들어, 막, 시냅스)과 융합하는 것이다.
대안적으로, 본 발명에 따른 이펙터 단백질은 예를 들어 국소화-의존적 녹다운에서 사용될 수 있다. 이펙터 단백질을 적절한 국소화 신호에 융합시킴으로써 이펙터는 구체적인 세포 구획으로 표적화된다. 이 구획에 상주하는 표적 RNA만 효과적으로 표적화되고, 반면, 다른 세포 구획에 상주하지만 그렇지 않으면 동일한 표적은 표적화되지 않을 것이므로, 국소화 의존적 녹다운이 확립될 수 있다.
F) 번역
본 명세서에 기재된 RNA 표적화 이펙터 단백질은 번역을 향상 또는 억제하는 데 사용될 수 있다. 번역을 상향 조절하는 것은 세포 회로를 제어하는 매우 견고한 방식이라고 예상된다. 또한, 기능성 연구를 위해 단백질 번역 스크린은 전사 상향 조절 스크린보다 유리할 수 있는데, 이는 전사물의 상향 조절이 증가된 단백질 생산으로 번역되지 않는다는 단점을 갖는다.
본 명세서에 기재된 RNA 표적화 이펙터 단백질은 번역을 구동하는 관심 메신저 RNA의 5' 비번역 반복(5'UTR) 부근에 EIF4G와 같은 번역 개시 인자를 가져오는 데 사용될 수 있는 것으로 예상된다(비-재프로그래밍 가능 RNA 결합 단백질에 대하여 문헌[De Gregorio et al. EMBO J. 1999;18(17):4865-74]에 기재된 바와 같이). 또 다른 예로서, 세포질 폴리(A) 폴리메라제인 GLD2는 RNA 표적화 이펙터 단백질에 의해 표적 mRNA에 모집될 수 있다. 이것은 표적 mRNA의 지시된 폴리아데닐화를 가능하게 하여 번역을 자극할 것이다.
유사하게, 본 명세서에서 예상된 RNA 표적화 이펙터 단백질은 ZBP1 (문헌[Huttelmaier S, et al. Nature. 2005;438:512-5])과 같은 mRNA의 번역 억제제를 차단하는 데 사용될 수 있다. 표적 RNA의 번역 개시 부위에 결합함으로써 번역이 직접적으로 영향을 받을 수 있다.
추가적으로, 예를 들어 알엔아제 저해제와 같은 그의 분해를 방지함으로써, mRNA를 안정화시키는 단백질에 RNA 표적화 이펙터 단백질을 융합시켜, 관심있는 전사물로부터 단백질 생산을 증가시키는 것이 가능하다.
본 명세서에 기재된 RNA 표적화 이펙터 단백질은 RNA 전사물의 5'UTR 영역에서 결합하고 리보솜 형성 및 번역 시작을 방지함으로써 번역을 억제하는 데 사용될 수 있다고 예상된다.
또한, RNA 표적화 이펙터 단백질은 CCR4-NOT 데아데닐라제 복합체의 성분인 Caf1을 표적 mRNA에 모집하여 표적 전사물의 데아데닐화 및 단백질 번역의 저해를 초래하는 데 사용될 수 있다.
예를 들어, 본 발명의 RNA 표적화 이펙터 단백질은 치료적으로 관련 있는 단백질의 번역을 증가 또는 감소시키는 데 사용될 수 있다. RNA 표적화 이펙터 단백질이 번역을 하향 조절 또는 상향 조절하는 데 사용될 수 있는 치료적 적용의 예는 근위축성 측삭 경화증(ALS) 및 심혈관 장애에 있다. 감소된 수준의 교세포 글루타메이트 트랜스포터 EAAT2가 ALS 운동 피질 및 척수에서 보고되었을 뿐만 아니라 ALS 뇌 조직에서 다수의 비정상적인 EAAT2 mRNA 전사물이 보고되었다. EAAT2 단백질 및 기능의 손실은 ALS에서 흥분 독성의 주요 원인으로 생각되었다. EAAT2 단백질 수준 및 기능의 회복은 치료적 유익을 제공할 수 있다. 따라서, RNA 표적화 이펙터 단백질은, 예를 들어, 상기 기재된 바와 같이 번역 억제제를 차단하거나 mRNA를 안정화시킴으로써, EAAT2 단백질의 발현을 상향 조절하는 데 유익하게 사용될 수 있다. 아포지질단백질 A1은 고밀도 지질단백질(HDL)의 주요 단백질 성분이며 ApoA1 및 HDL은 일반적으로 아테롬성 동맥경화 방지제로서 고려된다. RNA 표적화 이펙터 단백질이, 예를 들어, 상기 기재된 바와 같이 번역 억제제를 차단하거나 mRNA를 안정화시킴으로써, ApoA1의 발현을 상향 조절하는 데 유익하게 사용될 수 있다고 예상된다.
G) mRNA 턴오버
번역은 mRNA 턴오버 및 조절된 mRNA 안정성에 밀접하게 연결된다. 특정 단백질이 전사물의 안정성(예를 들어, 뉴런의 ELAV/Hu 단백질, 문헌[Keene JD, 1999, Proc Natl Acad Sci U S A. 96:5-7]) 및 트리스테트라프롤린(TTP)에 관여한다고 기재되었다. 이들 단백질은 메시지가 세포질에서 분해되는 것을 방지함으로써 표적 mRNA를 안정화시킨다(문헌[Peng SS et al., 1988, EMBO J. 17:3461-70]).
본 발명의 RNA-표적화 이펙터 단백질은 mRNA 전사물을 안정화시키기 위해 작용하는 단백질의 활성을 간섭하거나 촉진하여, mRNA 턴오버가 영향을 받도록 하기 위해 사용될 수 있다고 예상될 수 있다. 예를 들어, RNA 표적화 이펙터 단백질을 사용하여 표적 RNA에 인간 TTP를 모집하는 것은 아데닐레이트-우리딜레이트-풍부한 요소(AU-풍부 요소) 매개되는 번역 억제 및 표적 분해를 가능하게 할 것이다. AU-풍부 요소는 전-암유전자, 핵 전사 인자, 및 사이토카인을 코딩하는 많은 mRNA의 3'UTR에서 발견되고 RNA 안정성을 촉진한다. 또 다른 예로서, RNA 표적화 이펙터 단백질은 또 다른 mRNA 안정화 단백질인 HuR(문헌[Hinman MN 및 Lou H, Cell Mol Life Sci 2008; 65: 3168-81])에 융합되어 표적 전사물에 그것을 모집하고 그의 수명을 연장시키거나 수명이 짧은 mRNA를 안정화시킬 수 있다.
본 명세서에 기재된 RNA-표적화 이펙터 단백질이 표적 전사물의 분해를 촉진시키는 데 사용될 수 있음이 추가로 예상된다. 예를 들어, m6A 메틸트랜스페라제는 표적 전사물에 모집되어 전사물을 P-바디에 국소화시켜 표적의 분해를 유도할 수 있다.
또 다른 예로서, 본 명세서에 기재된 RNA 표적화 이펙터 단백질은 비-특이적 엔도뉴클레아제 도메인 PilT N-말단(PIN)에 융합되어 이를 표적 전사물로 모집하고 그의 분해를 가능하게 할 수 있다.
부종양성 신경 장애(PND)-관련 뇌척수염 및 신경병증을 갖는 환자는 중추 신경계 외부의 종양에서 Hu-단백질에 대한 자가항체를 발생시킨 후(문헌[Szabo A et al. 1991, Cell.;67:325-33] 혈액-뇌 장벽을 건너는 환자이다. 본 발명의 RNA-표적화 이펙터 단백질은 mRNA 전사물에 대한 자가항체의 결합을 간섭하는 데 사용될 수 있다고 예상될 수 있다.
근긴장성 이영양증-단백질 키나제(DMPK) 유전자의 3 'UTR에서 (CUG)n의 확장에 의해 야기되는 이영양증 제1 형(DM1) 환자는 이러한 전사물의 핵 내 축적을 특징으로 한다. (CUG)n 반복으로 표적화되는 엔도뉴클레아제와 융합된 본 발명의 RNA 표적화 이펙터 단백질은 비정상적인 전사물의 이러한 축적을 저해할 수 있다고 예상된다.
H) 다-기능성 단백질과의 상호작용
일부 RNA-결합 단백질은 다양한 과정에서 기능하는 다수의 RNA상의 다수의 부위에 결합한다. 예를 들어, hnRNP A1 단백질은 엑손 스플라이싱 사일렌서 서열과 결합하여 스플라이싱 인자를 길항시키고, 텔로미어 말단과 관련되고(그에 의해 텔로미어 활성을 자극하고) miRNA와 결합하여 Drosha-매개된 가공을 촉진하고 성숙에 영향을 주는 것으로 밝혀졌다. 본 발명의 RNA-결합 이펙터 단백질은 하나 이상의 위치에서 RNA-결합 단백질의 결합을 간섭할 수 있다고 예상된다.
I) RNA 폴딩
RNA는 그의 생물학적 활성을 수행하기 위해 규정된 구조를 취한다. 대안적인 3 차 구조들 사이에서의 형태 전이는 대부분의 RNA-매개 과정에 결정적이다. 그러나, RNA 폴딩은 몇몇의 문제와 관련될 수 있다. 예를 들어, RNA는 부적절한 대안적인 형태로 폴딩되고 유지되는 경향이 있을 수 있고/있거나 올바른 3 차 구조는 대안적 구조보다 열역학적으로 충분히 유리하지 못할 수 있다. 본 발명의 RNA 표적화 이펙터 단백질, 구체적으로 절단-결함 또는 데드 RNA 표적화 단백질은 (m)RNA의 폴딩을 지시하고/하거나 그의 올바른 3 차 구조를 포획하는 데 사용될 수 있다.
세포 상태 조절에서의 RNA-표적화 이펙터 단백질의 사용
특정 구현예에서, crRNA와의 복합체 중의 C2c2는 표적 RNA에 결합 즉시 활성화되고 이어서 임의의 가까운 ssRNA 표적을 절단한다(즉, "부수적" 또는 "구경꾼" 효과). C2c2는 동족 표적에 의해 일단 프라이밍되면, 다른 (비-상보적인) RNA 분자를 절단할 수 있다. 이러한 잡다한 RNA 절단은 잠재적으로 세포 독성을 유발하거나 그렇지 않으면 세포 생리 또는 세포 상태에 영향을 줄 수 있다.
따라서, 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 휴면 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포주기 정지의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 성장 및/또는 세포 증식의 감소를 위해 사용되거나 감소에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 아네르기의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 아폽토시스의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 괴사의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 사멸 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 프로그래밍된 세포 사멸의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다.
특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 휴면 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 주기 정지 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 성장 및/또는 세포 증식을 감소시키는 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 아네르기 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 아폽토시스의 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 괴사 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 사멸 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 프로그래밍된 세포 사멸 유도 방법에 관한 것이다.
본 명세서에 기재된 방법 및 용도는 치료적 또는 예방적일 수 있으며, 구체적인 세포, 세포 (하위)집단, 또는 세포/조직 유형을 표적화할 수 있다. 구체적으로, 본 명세서에 기재된 방법 및 용도는 치료적 또는 예방적일 수 있으며, 하나 이상의 구체적인 표적 RNA(예를 들어, ssRNA)와 같은 하나 이상의 표적 서열을 발현하는 구체적인 세포, 세포 (하위)집단, 또는 세포/조직 유형을 표적화할 수 있다. 제한없이, 표적 세포는 예를 들어 구체적인 전사물을 발현하는 암세포, 예를 들어 주어진 클래스의 뉴런, 예를 들어 자가면역을 야기하는 (면역) 세포, 또는 특정(예를 들어, 바이러스성) 병원체에 감염된 세포 등일 수 있다.
따라서, 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 원하지 않는 세포(숙주 세포)의 존재를 특징으로 하는 병리학적 상태를 치료하는 방법에 관한 것이다. 특정 구현예에서, 본 발명은 원하지 않는 세포(숙주 세포)의 존재를 특징으로 하는 병리학적 상태를 치료하는 것을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 원하지 않는 세포(숙주 세포)의 존재를 특징으로 하는 병리학적 상태를 치료하는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 원하지 않는 세포에 특이적인 표적을 표적화함이 이해되어야 한다. 특정 구현예에서, 본 발명은 암을 치료, 예방 또는 경감시키기 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 암을 치료, 예방 또는 경감시키는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 암을 치료, 예방 또는 경감시키는 방법에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 암세포에 특이적인 표적을 표적화함이 이해되어야 한다. 특정 구현예에서, 본 발명은 병원체에 의한 세포의 감염을 치료, 예방 또는 경감시키기 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 병원체에 의한 세포의 감염을 치료, 예방 또는 경감시키는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 병원체에 의한 세포의 감염을 치료, 예방 또는 경감시키는 방법에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 병원체에 의해 감염된 세포에 특이적인 표적(예를 들어, 병원체 유래 표적)을 표적화함이 이해되어야 한다. 특정 구현예에서, 본 발명은 자가면역 장애를 치료, 예방 또는 경감시키기 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 자가면역 장애를 치료, 예방 또는 경감시키는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 자가면역 장애를 치료, 예방 또는 경감시키는 방법에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 자가면역 장애의 원인이 되는 세포(예를 들어, 특정 면역 세포)에 특이적인 표적을 표적화함이 이해되어야 한다.
RNA 검출 또는 단백질 검출에 있어서의 RNA-표적화 이펙터 단백질의 사용
RNA 표적화 이펙터 단백질이 생물학적 샘플에서 핵산 또는 단백질의 검출에 사용될 수 있음이 더 예상된다. 샘플은 세포 또는 무-세포일 수 있다.
노던 블롯 분석에서. 노던 블롯팅은 크기별로 RNA 샘플을 분리하기 위해 전기 영동의 사용을 포함한다. RNA 표적화 이펙터 단백질은 표적 RNA 서열을 특이적으로 결합 및 검출하는 데 사용될 수 있다.
RNA 표적화 이펙터 단백질은 또한 형광 단백질(예를 들어, GFP)에 융합되어 살아있는 세포에서 RNA 국소화를 추적하는 데 사용될 수 있다. 더욱 구체적으로, RNA 표적화 이펙터 단백질은 더 이상 RNA를 절단하지 않는다는 점에서 비활성화될 수 있다. 구체적인 구현예에서, 더욱 정확한 시각화를 보장하기 위해, 신호가 두 서브단백질 모두의 결합에 의존하는, 분할된 RNA 표적화 이펙터 단백질이 사용될 수 있다고 예상된다. 대안적으로, 다수의 RNA 표적화 이펙터 단백질 복합체가 표적 전사물에 결합할 때 재구성되는 분할된 형광 단백질이 사용될 수 있다. 전사물은 mRNA를 따라 다수의 결합 부위에 표적화되므로 형광 신호가 실제 신호를 증폭시키고 초점 식별이 가능하게 할 수 있다고 추가로 예상된다. 또 다른 대안으로서, 형광 단백질은 분할된 인테인(intein)으로부터 재구성될 수 있다.
RNA 표적화 이펙터 단백질은 예를 들어 RNA 또는 특정 스플라이스 변이체의 국소화, mRNA 전사물의 수준, 전사물의 상향- 또는 하향 조절 및 질병-특이적 진단을 결정하는 데 적합하게 사용된다. RNA 표적화 이펙터 단백질은, 예를 들어 형광 현미경 검사 또는 세포의 고-처리량 스크리닝 및 세포 분류 후 살아있는 세포의 회수를 가능하게 하는 형광-활성화된 세포 분류(FACS)와 같은, 유세포 계측법을 사용하여 (살아있는) 세포 내에서 RNA를 시각화하는 데 사용될 수 있다. 추가적으로, 스트레스, 예를 들어, 세포 상에 분자 저해제 또는 저산소 상태를 이용한 암 성장 저해, 하에서 상이한 전사물의 발현 수준을 동시에 평가할 수 있다. 또 다른 적용은 2 개의 광자 현미경을 사용하여 신경 자극 동안 시냅스 연결으로의 전사물의 국소화를 추적하는 것일 것이다.
특정 구현예에서, 본 명세서에 기재된 본 발명에 따른 성분 또는 복합체는 예를 들어, (형광으로) 표지된 C2c2 이펙터를 사용하여, 다중화된 에러-로버스트 형광 인 시츄(in situ) 혼성화(MERFISH; 문헌[Chen et al. Science; 2015; 348(6233)])에서 사용될 수 있다.
시험관내 apex 표지
세포 과정은 단백질, RNA 및 DNA 간의 분자 상호 작용의 네트워크에 의존한다. 단백질-DNA 및 단백질-RNA 상호 작용의 정확한 검출은 이러한 과정을 이해하기 위한 핵심이다. 시험관내 근접 표지 기술은 시험관내에서 관심 단백질 또는 RNA의 부근의 폴리펩티드 및 RNA를 표지하기 위해, 예를 들어, 광활성화 가능한 프로브와 조합된 친화성 태그를 이용한다. UV 조사 후, 광활성화 가능한 그룹은 태그가 부착된 분자에 매우 근접한 단백질 및 기타 분자와 반응하여 그들을 표지한다. 표지된 상호 작용 분자는 이어서 회수되고 식별될 수 있다. 본 발명의 RNA 표적화 이펙터 단백질은 예를 들어 프로브를 선택된 RNA 서열에 표적화하는 데 사용될 수 있다.
이들 응용은 또한 질병 관련 응용 또는 배양하기 어려운 세포 유형의 생체내 이미징을 위한 동물 모델에 적용될 수 있다.
본 발명은 위험요소 테스트 및 RNA-표적화된 치료법 가이드를 포함하는, 무 세포 RNA의 비-침습성 샘플링을 통한 건강 상태의 진단 및 모니터링을 위한 제제 및 방법을 제공하며, 치료의 신속한 투여가 치료 결과에 중요한 환경에서 유용하다. 일 구현예에서, 본 발명은 통상적인 약물 내성 돌연변이의 재발 및/또는 발생을 모니터링하는 것을 포함하여, 종양 RNA를 순환시키는 암 검출 방법 및 제제를 제공한다. 또 다른 구현예에서, 본 발명은 예를 들어 질병 진행 및 패혈증을 모니터링하기 위해 혈액 또는 혈청으로부터 직접 박테리아 종을 검출 및/또는 동정하기 위한 검출 방법 및 제제를 제공한다. 본 발명의 일 구현예에서, C2c2 단백질 및 유도체는 라이노바이러스 또는 상부 호흡기 감염과 같은 통상적인 질병을 기관지염과 같은 더욱 심각한 감염과 구별하고 진단하기 데 사용될 수 있다.
본 발명은 예를 들어, VKORC1, CYP2C9 및 CYP2C19 유전형 분석에 기반한 심근 경색 또는 뇌졸중 치료 중 항응고제의 투여에 대한 지침을 포함하여, 응급 약물유전체학을 위한 신속한 유전형분석을 위한 방법 및 제제를 제공한다.
본 발명은 식품 생산 및 전달 체인을 따라 모든 지점에서 박테리아에 의한 식품 오염을 모니터링하기 위한 제제 및 방법을 제공한다. 또 다른 구현예에서, 본 발명은, 예를 들어, 식품 출처 확인 및 순도 결정에 의해, 품질 제어 및 모니터링을 제공한다. 하나의 비-제한적인 예에서, 본 발명은 동물 고기 및 해산물 종과 같은, 식품 출처를 식별하거나 확인하는 데 사용될 수 있다.
또 다른 구현예에서, 본 발명은 법의학적 결정에서 사용된다. 예를 들어, 혈액 또는 다른 체액을 함유하는 범죄 현장 샘플. 본 발명의 일 구현예에서, 본 발명은 지문으로부터 핵산 샘플을 동정하는 데 사용된다.
RNA 오리가미(origami)/시험관내 조립 라인-조합론에서의 RNA-표적화 이펙터 단백질의 사용
RNA 오리가미는 RNA를 통합된 주형으로 사용하여 2-차원 또는 3-차원 구조를 생성하기 위한 나노 크기 폴딩된 구조를 지칭한다. 폴딩된 구조는 RNA에서 인코딩되며 결과로 발생한 RNA의 모양은 따라서 합성된 RNA 서열(문헌[Geary, et al. 2014. Science, 345 (6198). pp. 799-804])에 의해 결정된다. RNA 오리가미는 단백질과 같은 다른 성분을 복합체로 배열하기 위한 스캐폴드로서 작용할 수 있다. 본 발명의 RNA 표적화 이펙터 단백질은 예를 들어 적합한 가이드 RNA를 사용하여 관심 단백질을 RNA 오리가미로 표적화하는 데 사용될 수 있다.
RNA 단리 또는 정제, 강화 또는 격감에서의 RNA-표적화 이펙터 단백질의 사용
RNA 표적화 이펙터 단백질이 RNA에 복합체화될 때 RNA를 단리 및/또는 정제하는 데 사용될 수 있다는 것이 또한 예상된다. RNA 표적화 이펙터 단백질은 예를 들어, RNA-RNA 표적화 이펙터 단백질 복합체를 단리 및/또는 정제하는 데 사용될 수 있는 친화성 태그에 융합될 수 있다. 이러한 응용은 예를 들어 세포에서의 유전자 발현 프로파일의 분석에 유용하다. 구체적인 구현예에서, RNA 표적화 이펙터 단백질이 특정 비-코딩 RNA(ncRNA)를 표적화하여 그의 활성을 차단하는 데 사용될 수 있고 유용한 기능적 프로브를 제공할 수 있다고 예상될 수 있다. 특정 구현예에서, 본 명세서에 기재된 이펙터 단백질은 구체적인 RNA에 대해 특이적으로 강화하는 데(안정성 증가 등을 포함하지만 이에 한정되지는 않음), 또는 대안적으로 구체적인 RNA(예를 들어 제한 없이 구체적인 스플라이스 변이체, 이소형 등과 같은)를 특이적으로 격감시키는 데 사용될 수 있다.
lincRNA 기능 및 다른 핵 RNA의 조사
siRNA와 같은 현재의 RNA 녹다운 전략은 단백질 시스템이 기작이 세포액성이기 때문에 주로 세포액의 전사물을 표적화하는 것으로 제한된다는 단점이 있다. 세포 기능에 필수적이지 않은 외인성 시스템인, 본 발명의 RNA 표적화 이펙터 단백질의 이점은 세포 내 임의의 구획에서 사용될 수 있다는 것이다. NLS 신호를 RNA 표적화 이펙터 단백질에 융합함으로써, 핵으로 유도될 수 있고 핵 RNA가 표적화되도록 할 수 있다. 예를 들어 lincRNA의 기능을 조사하는 것이 예상된다. 긴 유전자간 비-코딩 RNA(lincRNA)는 탐구가 덜 된 연구 영역이 대단히 크다. 대부분의 lincRNA는 본 발명의 RNA 표적화 이펙터 단백질을 사용하여 연구될 수 있는 아직 알려지지 않은 기능을 갖는다.
RNA 결합 단백질의 동정
특정 RNA에 결합된 단백질을 동정하는 것은 많은 RNA의 역할을 이해하는 데 유용할 수 있다. 예를 들어, 많은 lincRNA는 전사를 제어하기 위한 전사적 및 후성적 조절제와 관련된다. 어떤 단백질이 주어진 lincRNA에 결합하는지 이해하는 것은 주어진 조절 경로의 성분을 밝히는 데 도움이 될 수 있다. 본 발명의 RNA 표적화 이펙터 단백질은 결합된 단백질을 국소적으로 바이오틴으로 표지하기 위해 특정 전사물에 바이오틴 리가제를 모집하도록 설계될 수 있다. 그 다음 단백질을 풀다운(pull down)하고 질량 분광법으로 분석하여 그들을 동정할 수 있다.
RNA 상의 복합체 조립 및 기질 왕복
본 발명의 RNA 표적화 이펙터 단백질은 RNA상에 복합체를 조립하는 데 추가로 사용될 수 있다. 이것은 다수의 관련 단백질(예를 들어, 구체적인 합성 경로의 성분)로 RNA 표적화 이펙터 단백질을 기능화함으로써 달성될 수 있다. 대안적으로, 다수의 RNA 표적화 이펙터 단백질은 이러한 상이한 관련 단백질로 기능화될 수 있고 동일하거나 인접한 표적 RNA로 표적화될 수 있다. RNA 상에 복합체를 조립하는 것에 대한 유용한 응용은 예를 들어 단백질 간의 기질 왕복을 촉진하는 것이다.
합성 생물학
생물학적 시스템의 개발은 임상적 적용을 포함하여 넓은 유용성을 갖는다. 본 발명의 프로그래밍 가능한 RNA 표적화 이펙터 단백질은 예를 들어 암-연결된 RNA를 표적 전사물로 사용하여 표적화된 세포 사멸을 위해 독성 도메인의 분할된 단백질에 융합되어 사용될 수 있음이 예상된다. 추가로, 예를 들어, 키나제 또는 다른 효소와 같은 적절한 이펙터와의 융합 복합체로, 단백질-단백질 상호 작용을 수반하는 경로가 합성 생물학 시스템에서 영향을 받는다.
단백질 스플라이싱: 인테인
단백질 스플라이싱은 인테인으로 지칭되는, 개입 폴리펩티드가 엑스테인으로 지칭되는, 그 측면에 배치되는 폴리펩티드로부터 자체 절제뿐만 아니라 뒤이은 엑스테인의 연결을 촉매하는 번역-후 과정이다. 2 개 이상의 본 명세서에 기재된 RNA 표적화 이펙터 단백질의 표적 전사물 상의 조립은 분할된 인테인의 방출을 지시함으로써(Topilina and Mills Mob DNA. 2014 Feb 4;5(1):5), mRNA 전사물의 존재에 대한 직접적 계산 및, 대사 효소 또는 (전사 경로의 다운스트림 작동을 위한) 전사 인자와 같은, 단백질 산물의 후속적인 방출이 가능하도록 하는 데 사용될 수 있다. 이 응용은 합성 생물학(상기 참고) 또는 대규모 생물생산(특정 조건에서만 생산물 생산하는)에서 상당한 관련성이 있을 수 있다.
유도성이고, 투여되고 자가-비활성화인 시스템
일 구현예에서, 본 발명의 RNA 표적화 이펙터 단백질 및 이펙터 성분을 포함하는 융합 복합체는 유도성, 예를 들어 광 유도성 또는 화학적 유도성이도록 설계된다. 이러한 유도성은 시간 상 원하는 순간에 이펙터 성분의 활성화를 가능하게 한다.
광 유도성은 예를 들어 융합을 위해 CRY2PHR/CIBN 쌍이 사용되는 융합 복합체를 설계함으로써 달성된다. 이 시스템은 살아있는 세포에서 단백질 상호 작용에 대한 광 유도에 특히 유용하다(문헌[Konermann S, et al. Nature. 2013;500:472-476]).
화학적 유도성은 예를 들어 융합을 위해 FKBP/FRB(FK506 결합 단백질/FKBP 라파마이신 결합) 쌍이 사용되는 융합 복합체를 설계함으로써 제공된다. 이 시스템을 사용하면 라파마이신이 단백질 결합에 필요하다(문헌[Zetsche et al. Nat Biotechnol. 2015;33(2):139-42 describes the use of this system for Cas9]).
추가적으로, DNA로서 세포 내에 도입될 때, 본 발명의 RNA 표적화 이펙터 단백질은 테트라사이클린 또는 독시사이클린 제어되는 전사 활성화(Tet-온 및 Tet-오프 발현 시스템), 예를 들어 엑디손 유도성 유전자 발현 시스템 및 아라비노스-유도성 유전자 발현 시스템과 같은 호르몬 유도성 유전자 발현 시스템과 같은, 유도성 프로모터에 의해 조절될 수 있다. RNA로서 전달될 때, RNA 표적화 이펙터 단백질의 발현은 테트라사이클린과 같은 소분자를 감지할 수 있는 리보스위치를 통해 조절될 수 있다(문헌[Goldfless et al. Nucleic Acids Res. 2012;40(9):e64]에 기재된 바와 같음).
일 구현예에서, 본 발명의 RNA 표적화 이펙터 단백질의 전달은 세포 내의 단백질 또는 crRNA의 양을 변화시키도록 조절될 수 있고, 이에 의해 원하는 효과 또는 임의의 원하지 않는 표적외 효과의 규모를 변화시킬 수 있다.
일 구현예에서, 본 명세서에 기재된 RNA 표적화 이펙터 단백질은 자가-비활성화되도록 설계될 수 있다. mRNA 또는 복제 RNA 치료제(문헌[Wrobleska et al Nat Biotechnol. 2015 Aug; 33(8): 839-841])로서의 RNA로서 세포에 전달될 때, 그들은 자체 RNA를 파괴함으로써 발현 및 후속 효과를 자가-비활성화하고, 이에 의해 상주 및 잠재적인 원하지 않는 효과를 감소시킬 수 있다.
본 명세서에 기재된 RNA 표적화 이펙터 단백질의 추가의 생체내 적용에 대해서는 참조로서 본 명세서에 포함된, 문헌[Mackay JP et al (Nat Struct Mol Biol. 2011 Mar;18(3):256-61), 문헌[Nelles et al (Bioessays. 2015 Jul;37(7):732-9)] 및 문헌[Abil Z and Zhao H (Mol Biosyst. 2015 Oct;11(10):2658-65)])을 참조한다. 구체적으로, 본 발명의 특정 구현예에서, 바람직하게는 촉매적으로 비활성인 C2c2를 사용함으로써 특정 구현예에서 다음의 응용이 예상된다: 번역 향상(예를 들어, C2c2-번역 촉진 인자 융합(예를 들어, eIF4 융합)); 번역 억제(예를 들어, 리보솜 결합 부위를 표적화하는 gRNA); 엑손 건너뛰기(예를 들어, 스플라이스 공여체 및/또는 수용체 부위를 표적화하는 gRNA); 엑손 포함(예를 들어, 구체적인 엑손 스플라이스 공여체 및/또는 수용체 부위를 표적화하는 gRNA가 포함되거나 스플라이소솜 성분(예를 들어, U1 snRNA)에 융합되거나 이를 모집하는 C2c2); RNA 국소화 접근(예를 들어, C2c2-마커 융합(예를 들어, EGFP 융합)); RNA 국소화 변경(예를 들어, C2c2-국소화 신호 융합(예를 들어, NLS 또는 NES 융합)); RNA 분해(이 경우 C2c2의 활성에 의존하는 경우 촉매적으로 비활성인 C2c2는 사용되지 않고, 대안적으로 증가된 특이성을 위해, 분할된 C2c2가 사용될 수 있음); 예를 들어 gRNA의 분해 또는 gRNA의 기능성 부위에의 결합에 의해(아마도 C2c2-신호 서열 융합에 의한 재국소화에 의해 특정 부위에서 적정하는), 비-코딩 RNA 기능의 저해(예를 들어, miRNA)에 의한 억제.
본 명세서에서 이전에 기재되고 실시예에서 입증된 바와 같이, C2c2 기능은 crRNA의 5' 또는 3' 연장 및 crRNA 루프의 연장에 대해 견고하다. 따라서 MS2 루프 및 다른 모집 도메인은, 복합체 형성에 영향을 미치지 않고 표적 전사물에 결합하지 않으면서 crRNA에 부가될 수 있는 것으로 예상된다. 다양한 이펙터 도메인의 모집을 위한 crRNA에 대한 이러한 변형은 상기 기재된 RNA 표적화된 이펙터 단백질의 사용에서 적용 가능하다.
실시예에서 입증된 바와 같이, C2c2, 구체적으로 LshC2c2는 RNA 파지에 대한 저항성을 매개할 수 있다. 따라서, C2c2는, 레트로바이러스(예를 들어, HIV와 같은 렌티바이러스), HCV, 에볼라 바이러스 및 지카(Zika) 바이러스를 포함하나 이에 한정되지 않는 RNA만 갖는 병원체에 대해 예를 들어 동물, 인간 및 식물을 면역화하는 데 사용될 수 있다고 예상된다.
본 발명자는 C2c2가 자체 어레이를 처리(절단)할 수 있음을 보여주었다. 이것은 R597A, H602A, R1278A 및 H1283A로부터 선택되는 하나 이상의 변형과 같은, 하나 이상의 돌연변이된 아미노산 잔기 R597, H602, R1278 및 H1283을 함유하는 야생형 C2c2 단백질 및 돌연변이된 C2c2 단백질 모두에 적용된다. 따라서, 상이한 표적 전사물 및/또는 응용을 위해 설계된 다수의 crRNA가 단일 pre-crRNA로서 또는 하나의 프로모터에 의해 구동되는 단일 전사물로서 전달될 수 있는 것으로 예상된다. 이러한 전달 방법은 실질적으로 더 소형이고, 합성이 더 쉽고, 바이러스 시스템으로 전달하기가 더 쉽다는 이점을 갖는다. 바람직하게, 본 명세서에 기재된 아미노산 넘버링은 Lsh C2c2 단백질을 참조한다. 정확한 아미노산 위치는 Lsh C2c2의 오솔로그들에 대해 달라질 수 있으며, 이는 당업계에 공지되고, 본 명세서의 다른 곳에서 기재된 바와 같이, 단백질 정렬에 의해 적절하게 결정될 수 있음이 이해될 것이다.
본 발명의 일 양태는 또한, 예를 들어 시험관내, 생체내 또는 생체외에서, 원핵 세포 또는 진핵 세포에서 하나 이상의 유전자 또는 하나 이상의 유전자 산물의 (단백질) 발현을 변경하거나 조작하기 위한, 게놈 또는 트랜스크립톰 설계 제작에 있어서 본 명세서에 기재된 조성물 및 시스템의 방법 및 용도를 포함한다.
일 양태에서, 본 발명은 세포에서 표적 RNA의 (단백질) 발현을 조절, 예를 들어 감소시키기 위한 방법 및 조성물을 제공한다. 대상 방법에서, RNA의 전사, 안정성 및/또는 번역을 간섭하는 본 발명의 C2c2 시스템이 제공된다.
특정 구현예에서, 유효량의 C2c2 시스템은 RNA를 절단하거나 그렇지 않으면 RNA 발현을 저해하는 데 사용된다. 이와 관련하여, 시스템은 siRNA 및 shRNA와 유사한 용도를 가지므로 이러한 방법으로 대체될 수도 있다. 방법은, 제한없이, 예를 들어 간섭 리보핵산(예를 들어, siRNA 또는 shRNA) 또는 그의 전사 주형, 예를 들어 shRNA를 인코딩하는 DNA,에 대한 대체물로서의 C2c2 시스템의 사용을 포함한다. C2c2 시스템은 예를 들어 표적 세포를 포함하는 포유류에 투여됨으로써 표적 세포로 도입된다.
유리하게는, 본 발명의 C2c2 시스템은 특이적이다. 예를 들어, 간섭 리보핵산(siRNA 또는 shRNA와 같은) 폴리뉴클레오티드 시스템이 설계 및 안정성 문제 및 표적외 결합에 의해 성가신 반면, 본 발명의 C2c2 시스템은 높은 특이성으로 설계될 수 있다.
불안정화된 C2c2
특정 구현예에서, 본 명세서에 기재된 본 발명에 따른 이펙터 단백질(CRISPR 효소; C2c2)은 불안정화 도메인(DD)과 관련되거나 이에 융합된다. 일부 구현예에서, DD는 ER50이다. 이 DD에 대한 상응하는 안정화 리간드는, 일부 구현예에서, 4HT이다. 이와 같이, 일부 구현예에서, 적어도 하나의 DD 중 하나는 ER50이고 이에 대한 안정화 리간드는 4HT 또는 CMP8이다. 일부 구현예에서, DD는 DHFR50이다. 이 DD에 대한 상응하는 안정화 리간드는, 일부 구현예에서 TMP이다. 이와 같이, 일부 구현예에서, 적어도 하나의 DD 중 하나는 DHFR50이고 이에 대한 안정화 리간드는 TMP이다. 일부 구현예에서, DD는 ER50이다. 이 DD에 대한 상응하는 안정화 리간드는, 일부 구현예에서 CMP8이다. 따라서 CMP8은 ER50 시스템에서 4HT에 대한 대안적인 안정화 리간드일 수 있다. CMP8 및 4HT가 경쟁 물질에서 사용될 수 있거나/사용되어야 하는 것이 가능할 수 있는 동안, 일부 세포 유형은 이들 두 리간드 중 하나 또는 다른 것에 더 민감할 수 있으며, 본 개시내용 및 당업계의 지식으로부터 당업자는 CMP8 및/또는 4HT를 사용할 수 있다.
일부 구현예에서, 하나 또는 2 개의 DD는 CRISPR 효소의 C-말단에 융합되면서 하나 또는 2 개의 DD는 CRISPR 효소의 N-말단에 융합될 수 있다. 일부 구현예에서, 적어도 2 개의 DD가 CRISPR 효소와 관련되고 DD는 동일한 DD, 즉 DD는 상동이다. 따라서, 2 개(또는 둘 이상)의 DD는 ER50 DD일 수 있다. 이는 일부 구현예에서 바람직하다. 대안적으로, 2 개(또는 둘 이상)의 DD는 DHFR50 DD일 수 있다. 이는 또한 일부 구현예에서 바람직하다. 일부 구현예에서, 적어도 2 개의 DD가 CRISPR 효소와 관련되고 DD는 상이한 DD, 즉 DD는 이종성이다. 따라서 DDS 중 하나는 ER50 일 수 있고 하나 이상의 DD 또는 임의의 다른 DD는 DHFR50일 수 있다. 이종성인 2 개 이상의 DD를 갖는 것은 더 큰 수준의 분해 제어를 제공할 것이기 때문에 유리할 수 있다. N 또는 C-말단에 하나 초과의 DD를 직렬 융합한 것은 분해를 향상시킬 수 있고; 이러한 직렬 융합은 예를 들어 ER50-ER50-C2c2 또는 DHFR-DHFR-C2c2일 수 있다. 모든 안정화 리간드의 부재 하에 높은 수준의 분해가 발생하고, 하나의 안정화 리간드의 부재 및 다른(또는 또 다른) 안정화 리간드의 존재 하에 중간 수준의 분해가 발생하고, 2 개(또는 그 이상 중 2 개)의 안정화 리간드 존재 하에 낮은 수준의 분해가 발생할 것임이 예상된다. N-말단 ER50 DD 및 C-말단 DHFR50 DD를 가짐으로써 또한 제어가 제공될 수 있다.
일부 구현예에서, CRISPR 효소의 DD와의 융합은 DD와 CRISPR 효소 사이의 링커를 포함한다. 일부 구현예에서, 링커는 GlySer 링커이다. 일부 구현예에서, DD-CRISPR 효소는 적어도 하나의 핵 방출 신호(NES)를 추가로 포함한다. 일부 구현예에서, DD-CRISPR 효소는 2 개 이상의 NES를 포함한다. 일부 구현예에서, DD-CRISPR 효소는 적어도 하나의 핵 국소화 신호(NLS)를 포함한다. 이것은 NES에 추가될 수 있다. 일부 구현예에서, CRISPR 효소는 CRISPR 효소와 DD 사이의 링커로서 또는 그 일부로서, 국소화(핵 도입 또는 방출) 신호를 포함하거나 이로 본질적으로 구성되거나 이로 구성된다. HA 또는 Flag 태그는 링커로서 본 발명의 범위 내에 또한 있다. 출원인은 NLS 및/또는 NES를 링커로 사용하고 또한 글리신 세린 링커를 GS만큼 짧게부터 (GGGGS)3까지 사용한다.
불안정화 도메인은 광범위한 단백질에 불안정성을 부여하는 일반적인 유용성을 갖는다; 예를 들어, 참조로서 본 명세서에 포함된 문헌[Miyazaki, J Am Chem Soc. Mar 7, 2012; 134(9): 3942-3945] 참고. CMP8 또는 4-하이드록시타목시펜은 불안정화 도메인일 수 있다. 더욱 일반적으로, N-말단 규칙에 의해 불안정화 잔기인, 포유류 DHFR의 온도-민감 돌연변이체(DHFRts)는 허용 온도에서는 안정하지만 37℃에서는 불안정한 것으로 밝혀졌다. DHFRts를 발현하는 세포에 포유류 DHFR에 대한 고-친화성 리간드인 메토트렉세이트를 첨가하면 부분적으로 단백질 분해가 억제되었다. 이것은 소분자 리간드가 그렇지 않으면 세포에서의 분해를 위해 표적화되는 단백질을 안정화시킬 수 있다는 중요한 입증이었다. mTOR(FRB*)의 FRB 도메인의 불안정한 돌연변이체를 안정화시키고 융합된 키나제인 GSK-3β.6,7의 기능을 회복시키는 데 라파마이신 유도체가 사용되었다. 이 시스템은 리간드-의존적 안정성이 복잡한 생물학적 환경에서 특정 단백질의 기능을 조절하는 매력적인 전략에 해당한다는 것을 입증하였다. 단백질 활성을 제어하는 시스템은 라파마이신에 의해 유도되는 FK506-결합 단백질 및 FKBP12의 이량체화에 의해 유비퀴틴 상보성이 발생하는 경우 DD가 기능적으로 되는 것을 포함할 수 있다. 인간 FKBP12 또는 ecDHFR 단백질의 돌연변이체는 각각 그들의 고-친화성 리간드인 Shield-1 또는 트리메토프림(TTP)이 부재하는 경우 대사적으로 불안정해지도록 설계 제작될 수 있다. 이들 돌연변이체는 본 발명의 실시에 유용한 가능한 불안정화 도메인(DD) 중 일부이고, CRISPR 효소와의 융합으로서 DD의 불안정성은 프로테아솜에 의한 전체 융합 단백질의 CRISPR 단백질 분해를 부여한다. Shield-1 및 TMP는 용량-의존적 방식으로 DD에 결합하고 DD를 안정화시킨다. 에스트로겐 수용체 리간드 결합 도메인(ERLBD, ERS1의 305 내지 549 잔기)은 또한 불안정화 도메인으로서 설계 제작될 수 있다. 에스트로겐 수용체 신호 전달 경로는 유방암과 같은 다양한 질병에 관여하기 때문에, 경로는 널리 연구되어 왔으며 수많은 에스트로겐 수용체의 작용제 및 길항제가 개발되었다. 따라서, ERLBD 및 약물의 양립 가능한 쌍이 알려져 있다. ERLBD의 돌연변이체에는 결합하지만 야생형에는 하지 않는 리간드가 있다. 3 개의 돌연변이(L384M, M421G, G521R)12를 인코딩하는 이들 돌연변이체 도메인 중 하나를 사용함으로써 내인성 에스트로겐-민감성 네트워크를 변동시키지 않는 리간드를 사용하여 ERLBD-유래 DD의 안정성을 조절하는 것이 가능하다. ERLBD를 더 불안정화하고 그것을 잠재적인 DD 후보로서 구성하기 위해 추가적인 돌연변이(Y537S)가 도입될 수 있다. 이 4-돌연변이체는 유리한 DD 개발이다. 돌연변이체 ERLBD는 CRISPR 효소에 융합될 수 있으며 그 안정성은 리간드를 사용하여 조절되거나 변동될 수 있고, 이에 의해 CRISPR 효소는 DD를 갖는다. 또 다른 DD는 Shield1 리간드에 의해 안정화된 돌연변이된 FKBP 단백질에 기반한 12-kDa(107-아미노산) 태그일 수 있다; 예를 들어, 문헌[Nature Methods 5,(2008)] 참고. 예를 들어 DD는 합성, 생물학적으로 비활성인 소분자인 Shield-1에 결합하여 이에 의해 가역적으로 안정화되는 변형된 FK506 결합 단백질 12(FKBP12)일 수 있다; 예를 들어, 문헌[Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ. A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules. Cell. 2006;126:995-1004]; 문헌[Banaszynski LA, Sellmyer MA, Contag CH, Wandless TJ, Thorne SH. Chemical control of protein stability and function in living mice. Nat Med. 2008;14:1123-1127]; 문헌[Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules. The Journal of biological chemistry. 2007;282:24866-24872]; 및 문헌[Rodriguez, Chem Biol. Mar 23, 2012; 19(3): 391-398]을 참고-이들 모두는 본 명세서에 참조로서 포함되며 본 발명의 실시에 있어서 CRISPR 효소와 관련시키는 선택된 DD에서 본 발명의 실시에 활용될 수 있다. 알게 될 수 있는 바와 같이, 당업계의 지식은 다수의 DD를 포함하고, DD는 CRISPR 효소와 관련될 수 있고, 예를 들어 유리하게는 링커를 이용하여 이에 융합될 수 있고, 이에 의해 DD는 리간드의 존재 하에 안정화될 수 있고 이것이 부재하는 경우 DD가 불안정화되며, 이에 의해 CRISPR 효소는 완전히 불안정화되거나, DD는 리간드의 부재 하에 안정화될 수 있고 리간드가 존재하는 경우 DD가 불안정화되며; DD는 CRISPR 효소 및 그에 따른 CRISPR-Cas 복합체 또는 시스템이 조절 또는 제어되도록-말하자면 켜지거나 꺼지도록 하여, 이에 의해 예를 들어, 생체내 또는 시험관내 환경에서, 시스템의 조절 또는 제어의 수단을 제공한다. 예를 들어, 관심 단백질이 DD 태그와의 융합으로서 발현되는 경우, 이것은 예를 들어 프로테아솜에 의해 불안정화되고 세포 내에서 급속히 분해된다. 따라서, 안정화 리간드의 부재는 D 관련된 Cas가 분해되도록 한다. 새로운 DD가 관심 단백질에 융합된 경우, 그의 불안정성이 관심 단백질에 부여되어 전체 융합 단백질의 급속한 분해를 초래한다. Cas에 대한 최고조 활성은 표적외 효과를 감소시키기 위해 때때로 유익하다. 따라서, 높은 활성의 짧은 폭발이 선호된다. 본 발명은 이러한 최고조를 제공할 수 있다. 일부 의미에서 시스템은 유도성이다. 일부 다른 의미에서, 시스템은 안정화 리간드의 부재 하에 억제되고 안정화 리간드의 존재 하에 탈-억제된다.
RNA-표적화RNA-표적화-CRISPR 시스템의 식물 및 효모에의 응용
정의:
일반적으로, 용어 "식물"은 특징적으로 세포 분열에 의해 성장하고, 엽록체를 함유하고, 셀룰로스가 포함된 세포벽을 갖는, 식물계의 임의의 다양한 광합성하는, 진핵성, 단세포 또는 다세포 생물에 관한 것이다. 용어, 식물은 단자엽 및 쌍자엽 식물을 포함한다. 구체적으로, 식물은 제한 없이 속씨 식물 및 겉씨 식물, 예를 들어 아카시아, 알팔파, 아마란스, 사과, 살구, 아티초크, 물푸레나무, 아스파라거스, 아보카도, 바나나, 보리, 콩, 비트, 자작나무, 너도밤나무, 블랙베리, 블루베리, 브로콜리, 방울 양배추(Brussel's sprout), 양배추, 카놀라, 칸탈루프, 당근, 카사바, 콜리플라워, 삼나무, 곡물, 셀러리, 밤, 체리, 중국 배추, 감귤류, 클레멘타인, 클로버, 커피, 옥수수, 목화, 동부, 오이, 사이프러스, 가지, 느릅나무, 꽃상추, 유칼립투스, 회향, 무화과, 전나무, 제라늄, 포도, 자몽, 땅콩, 꽈리, 검 헴록(gum hemlock), 히코리(hickory), 케일, 키위, 콜라비, 낙엽송, 상추, 대파, 레몬, 라임, 로커스트(locust), 소나무, 공작고사리(maidenhair), 메이즈, 망고, 단풍나무, 멜론, 기장, 버섯, 겨자, 견과류, 참나무, 귀리, 기름야자, 오크라, 양파, 오렌지, 장식용 식물 또는 꽃 또는 나무, 파파야, 야자, 파슬리, 파스닙(parsnip), 콩, 복숭아, 땅콩, 배, 피트(peat), 후추, 감, 나무콩, 소나무, 파인애플, 플랜테인(plantain), 자두, 석류, 감자, 호박, 라디키오(radicchio), 무, 유채, 라스베리, 벼, 호밀, 수수, 홍화, 갯버들, 대두, 시금치, 가문비 나무, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 고구마, 스위트콘, 귤, 녹차, 담배, 토마토, 나무, 라이밀(triticale), 잔디풀(turf grass), 순무, 포도나무, 호두, 물냉이, 수박, 밀, 참마(yam), 주목나무, 및 주키니를 포함하는 것으로 의도된다. 용어, 식물은 뿌리, 잎 및 고등 식물을 특징짓는 다른 기관의 결여에 의해서 주로 일차적으로 연합된 광독립영양생물인, 조류를 또한 포함한다.
본 명세서에 기재된 RNA-표적화RNA-표적화 시스템을 이용하는 유전자 발현 조절 방법은 원하는 특성을 본질적으로 임의의 식물에 부여하는 데 사용될 수 있다. 광범위한 종류의 식물 및 식물 세포 시스템은, 본 개시 내용의 핵산 작제물 및 상기 언급된 다양한 형질전환 방법을 이용하여 본 명세서에 기재된 원하는 생리학적 및 작물학적 특징들을 위해, 설계 제작될 수 있다. 바람직한 구현예에서, 설계 제작을 위한 표적 식물 및 식물 세포로는, 이에 한정되지 않지만, 단자엽성 및 쌍자엽성 식물이 포함되며, 예를 들어 곡물 작물(예를 들어, 밀, 메이즈, 벼, 기장, 보리), 과실 작물(예를 들어, 토마토, 사과, 배, 딸기, 오렌지), 사료 작물(예를 들어, 알팔파), 뿌리 채소 작물(예를 들어, 당근, 감자, 사탕무, 참마), 옆채류 작물(예를 들어, 상추, 시금치)을 포함하는 작물; 화훼 식물(예를 들어, 페튜니아, 장미, 국화), 침엽수 및 소나무(예를 들어, 소나무, 전나무, 가문비나무); 식물환경복원에 사용되는 식물(예를 들어, 중금속 축적 식물); 기름 작물(예를 들어, 해바라기, 유채씨) 및 실험용 목적으로 사용되는 식물(예를 들어, 아라비돕시스)이 포함된다. 따라서, 방법 및 CRISPR-Cas 시스템은 광범위한 식물, 예를 들어 다음 목에 속하는 쌍자엽 식물과 같은 식물: 마그니오랄레스(Magniolales), 일리시알레스(Illiciales), 녹나무목(Laurales), 후추목(Piperales), 아리스토키알레스(Aristochiales), 수련목(Nymphaeales), 미나리아재비목(Ranunculales), 파프베랄레스(Papeverales), 사라세니아세(Sarraceniaceae), 트로코덴드랄레스(Trochodendrales), 하마멜리달레스(Hamamelidales), 유코미알레스(Eucomiales), 레이트네리알레스(Leitneriales), 마이리칼레스(Myricales), 참나무목(Fagales), 카수아리날레스(Casuarinales), 석죽목(Caryophyllales), 바탈레스(Batales), 마디풀목(Polygonales), 갯질경이목(Plumbaginales), 오이과목(Dilleniales), 테알레스(Theales), 아욱목(Malvales), 쐐기풀목(Urticales), 오예목(Lecythidales), 제비꽃목(Violales), 버드나무목(Salicales), 십자화목(Capparales), 진달래목(Ericales), 디아펜살레스(Diapensales), 에베날레스(Ebenales), 앵초목(Primulales), 장미목(Rosales), 콩목(Fabales), 포도스테말레스(Podostemales), 할로라갈레스(Haloragales), 도금양목(Myrtales), 층층나무목(Cornales), 프로테아목(Proteales), 산 탈레스(San tales), 라플레시알레스(Rafflesiales), 노박덩굴목(Celastrales), 대극목(Euphorbiales), 갈매나무목(Rhamnales), 무환자나무목(Sapindales), 저그란달레스(Juglandales), 쥐손이풀목(Geraniales), 원지목(Polygalales), 움벨랄레스(Umbellales), 용담목(Gentianales), 꽃고비목(Polemoniales), 꿀풀목(Lamiales), 질경이목(Plantaginales), 현삼목(Scrophulariales), 초롱꽃목(Campanulales), 꼭두서니목(Rubiales), 산토끼꽃목(Dipsacales), 및 국화목(Asterales) 에 걸쳐 사용될 수 있으며; 방법 및 CRISPR-Cas 시스템은 다음 목에 속하는 것과 같은 단자엽 식물: 택사목(Alismatales), 자러폰목(Hydrocharitales), 나자달레스(Najadales), 트리우리달레스(Triuridales), 닭의장풀목(Commelinales), 에리오카우랄레스(Eriocaulales), 레스티오날레스(Restionales), 벼목(Poales), 준칼레스(Juncales), 사초목(Cyperales), 타이팔레스(Typhales), 브로멜리알레스(Bromeliales), 생강목(Zingiberales), 아레칼레스(Arecales), 사이클란탈레스(Cyclanthales), 판다너스목(Pandanales), 천남성목(Arales), 릴리알레스(Lilliales), 및 난목(Orchid ales), 또는 겉씨식물문(Gymnospermae)에 속하는 식물, 예를 들어 구과목(Pinales), 은행목(Ginkgoales), 소철목(Cycadales), 아라우카리알레스(Araucariales), 쿠페르살레스(Cupressales) 및 네탈레스(Gnetales) 목에 속하는 것들을 이용하여 사용될 수 있다.
본 명세서에 기재된 RNA-표적화RNA-표적화 CRISPR 시스템 및 사용 방법은 다음의 쌍자엽, 단자엽 또는 겉씨식물속의 비-제한적인 리스트에 포함되는 광범위한 식물 종에 걸쳐 사용될 수 있다: 아트로파(Atropa), 알세오다프네(Alseodaphne), 아나카디움(Anacardium), 땅콩속(Arachis), 베일스미에디아(Beilschmiedia), 배추속(Brassica), 카르타무스(Carthamus), 댕댕이덩굴속(Cocculus), 파두속(Croton), 오이속(Cucumis), 감귤속(Citrus), 수박속(Citrullus), 고추속(Capsicum), 카사란터스(Catharanthus), 코코스(Cocos), 커피나무속(Coffea), 호박속(Cucurbita), 당근속(Daucus), 두그에티아(Duguetia), 에쉬솔지아(Eschscholzia), 피쿠스속(Ficus), 딸기속(Fragaria), 글라우시움(Glaucium), 글리신(Glycine), 고시피움(Gossypium), 해바라기속(Helianthus), 히비어(Hevea), 사리풀속(Hyoscyamus), 상추속(Lactuca), 란돌피아(Landolphia), 아마속(Linum), 릿시(Litsea), 토마토속(Lycopersicon), 루피너스(Lupinus), 마니호트(Manihot), 마요라나(Majorana), 말루스(Malus), 개자리속(Medicago), 담배속(Nicotiana), 올리아(Olea), 파르테늄(Parthenium), 양귀비속(Papaver), 페르세아(Persea), 파세올루스(Phaseolus), 피스타시아(Pistacia), 피섬(Pisum), 파이루스(Pyrus), 살구속(Prunus), 라파누스(Raphanus), 피마자속(Ricinus), 세네시오(Senecio), 방기속(Sinomenium), 스테파니아(Stephania), 시나피스(Sinapis), 가지속(Solanum), 테오브로마(Theobroma), 트리폴리움(Trifolium), 트리고넬라(Trigonella), 나비나물속(Vicia), 빙카속(Vinca), 빌리스(Vilis), 및 비냐(Vigna); 및 파속(Allium), 쇠풀속(Andropogon), 아라그로스티스(Aragrostis), 아스파라거스(Asparagus), 아베나속(Avena), 시노돈(Cynodon), 엘라에이스(Elaeis), 페스투카(Festuca), 페스툴로리움(Festulolium), 헤테로칼리스(Heterocallis), 호르데움(Hordeum), 렘나(Lemna), 롤리움(Lolium), 무사(Musa), 벼속(Oryza), 수수속(Panicum), 파네세툼(Pannesetum), 플레움(Phleum), 포아(Poa), 세칼레(Secale), 소검(Sorghum), 트리티쿰(Triticum), 옥수수속(Zea), 침엽수속(Abies), 컨닝하미아(Cunninghamia), 마황속(Ephedra), 가문비나무속(Picea), 피누스(Pinus), 및 미송속(Pseudotsuga)의 속.
RNA 표적화 CRISPR 시스템 및 사용 방법은 광범위한 범위의 "조류" 또는 "조류 세포"에 걸쳐 사용될 수도 있으며; 예를 들어, 홍조 식물(홍조류), 녹조 식물(녹조류), 갈조 식물(갈조류), 규조 식물(규조류), 유스티그마토파이타(Eustigmatophyta) 및 와편모조류를 포함하는 몇몇 진핵성 문 뿐만 아니라 원핵성 남조문(남조류)으로부터 선택된 조류를 포함한다. 용어 "조류"는 예를 들어 다음으로부터 선택된 조류를 포함한다: 암포라(Amphora), 아나베나(Anabaena), 아닉스트로데스미스(Anikstrodesmis), 보트리오코커스(Botryococcus), 센털돌말속(Chaetoceros), 클라미도모나스(Chlamydomonas), 클로렐라(Chlorella), 클로로코쿰(Chlorococcum), 시클로텔라(Cyclotella), 실린드로테카(Cylindrotheca), 두날리엘라(Dunaliella), 에밀리아나(Emiliana), 유글레나(Euglena), 헤마토코쿠스(Hematococcus), 이소크리시스(Isochrysis), 모노크리시스(Monochrysis), 모노라피디움(Monoraphidium), 나노클로리스(Nannochloris), 나노클로롭시스(Nannnochloropsis), 나비쿨라(Navicula), 네프로클로리스(Nephrochloris), 네프로셀미스(Nephroselmis), 니트치아(Nitzschia), 노듈리아(Nodularia), 노스톡(Nostoc), 오오크로모나스(Oochromonas), 오오시스티스(Oocystis), 오실라토리아(Oscillartoria), 파블로바(Pavlova), 페오닥틸럼(Phaeodactylum), 플레이토모나스(Playtmonas), 플웨로크리시스(Pleurochrysis), 포르히라(Porhyra), 슈도아나바에나(Pseudoanabaena), 피라미모나스(Pyramimonas), 스티코코커스(Stichococcus), 시네코코커스(Synechococcus), 시네코시스티스(Synechocystis), 테트라셀미스(Tetraselmis), 탈라시오시라(Thalassiosira), 및 트리코데스뮴(Trichodesmium).
식물의 부분, 즉 "식물 조직"은 본 발명의 방법에 따라 처리되어 개선된 식물을 생산할 수 있다. 식물 조직은 또한 식물 세포를 포함한다. 본 명세서에서 사용된 용어 "식물 세포"는, 온전한 전체 식물 상태로의, 또는 성장 배지 또는 완충액 내 현탁 상태의, 배지 또는 한천 상에서의 시험관내 조직 배양에서 성장한 단리된 형태 상태로의, 또는 예를 들어 식물 조직, 식물 기관 또는 전체 식물과 같은 고도의 조직화된 단위의 일부로서 중 어느 하나의 살아있는 식물의 개별 단위를 지칭한다.
"원형질체"는 예를 들어 기계적 또는 효소적 수단을 이용하여 그의 보호성 세포벽이 완전히 또는 부분적으로 제거된 식물 세포를 지칭하며, 적절한 성장 조건 하에서 그의 세포벽을 재형성하고, 증식 및 재생하여 전체 식물로 성장할 수 있는, 살아있는 식물의 온전한 생화학적 컴피턴트 단위를 초래한다.
용어 "형질전환"은 식물 숙주가 아그로박테리아 또는 다양한 화학적 또는 물리적 방법 중 하나를 이용하여 DNA의 도입에 의해 유전적으로 변형되도록 하는 공정을 대체로 지칭한다. 본 명세서에 사용된 용어 "식물 숙주"는 식물의 임의의 세포, 조직, 기관 또는 자손을 포함하는 식물을 지칭한다. 많은 적합한 식물 조직 또는 식물 세포가 형질전환될 수 있으며, 이에 한정되지 않지만, 원형질체, 체세포배(somatic embryo), 화분, 잎, 묘목, 줄기, 가피(calli), 기는 줄기(stolon), 미소괴경, 및 싹을 포함할 수 있다. 식물 조직은 또한 유성으로 생성되든 또는 무성으로 생성되든, 이러한 식물, 종자, 자손, 번식체의 임의의 클론, 및 절단물 또는 종자와 같은 이들 중 임의의 후손을 지칭한다.
본 명세서에 사용된 용어 "형질전환된"은, 외래 DNA 분자, 예를 들어 작제물이 그 안으로 도입된 세포, 조직, 기관 또는 생물을 지칭한다. 도입된 DNA 분자는 수령 세포, 조직, 기관 또는 생물의 게놈 DNA 내로 통합될 수 있어서, 도입된 DNA 분자가 이후의 자손에게 전달되도록 한다. 이들 구현예에서, "형질전환된" 또는 "유전자 도입된" 세포 또는 식물은, 세포 또는 식물의 자손, 및 교배에서 부모로서 이러한 형질전환된 식물을 이용하고 도입된 DNA분자의 존재로부터 초래되는 변경된 표현형을 나타내는 육종 프로그램으로부터 생산된 자손을 또한 포함할 수 있다. 바람직하게는, 유전자 도입 식물은 생식력이 있으며, 유성 생식을 통하여 도입된 DNA를 자손에게 전달할 수 있다.
용어 "자손", 예를 들어 유전자 도입 식물의 자손은, 식물 또는 유전자 도입된 식물로부터 태어난, 얻은, 또는 유래된 것이다. 도입된 DNA 분자는 수령 세포 내로 일시적으로 도입되어 도입된 DNA 분자가 이후의 자손에 의해 유전되지 않을 수 있고 따라서 "유전자 도입된"이라고 여겨지지 않는다. 이에 따라, 본 명세서에서 사용된, "비-유전자 도입" 식물 또는 식물 세포는 그의 게놈 내로 안정하게 통합된 외래 DNA를 함유하지 않는 식물이다.
본 명세서에 사용된 용어 "식물 프로모터"는 그의 기원이 식물 세포이든 아니든, 식물 세포에서 전사를 개시할 수 있는 프로모터이다. 예시적인 적합한 식물 프로모터로는, 이에 한정되지 않지만, 식물, 식물 바이러스, 및 박테리아, 예를 들어 식물 세포에서 발현되는 유전자를 포함하는 아그로박테리움 또는 리조비움으로부터 수득되는 것들이 포함된다.
본 명세서에 사용된 "균류 세포"는 균류 계 내에서 임의의 유형의 진핵 세포를 지칭한다. 균류 계 내의 문(phyla)은 자낭균류(Ascomycota), 담자균류(Basidiomycota), 블라스토클라디아균류(Blastocladiomycota), 호상균류(Chytridiomycota), 글로메로균류(Glomeromycota), 미포자충(Microsporidia) 및 네오칼리마스트릭스균류(Neocallimastigomycota)를 포함한다. 균류 세포는 효모, 곰팡이, 및 사상 균류를 포함할 수 있다. 일부 구현예에서, 균류 세포는 효모 세포이다.
본 명세서에 사용된 용어 "효모 세포"는 자낭균류 및 담자균류 문 내의 임의의 균류 세포를 지칭한다. 효모 세포는 출아 효모 세포, 분열 효모 세포, 및 곰팡이 세포를 포함할 수 있다. 이들 생물에 제한되지 않으면서, 실험실 및 산업적 환경에서 사용되는 많은 유형의 효모는 자낭균문의 일부이다. 일부 구현예에서, 효모 세포는 에스. 세레비시에(S. cerervisiae), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 또는 이삿첸키아 오리엔탈리스(Issatchenkia orientalis) 세포이다. 다른 효모 세포는 제한 없이, 칸디다 종(예를 들어, 칸디다 알비칸스(Candida albicans)), 야로이아 종(예를 들어, 야로이아 리폴리티카(Yarrowia lipolytica)), 피키아 종(예를 들어, 피키아 파스토리스(Pichia pastoris)), 클루이베로마이세스 종(예를 들어, 클루이베로마이세스 락티스(Kluyveromyces lactis) 및 클루이베로마이세스 마르시아누스), 뉴로스포라 종(예를 들어, 뉴로스포라 크라사(Neurospora crassa)), 푸사리움 종(예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum)), 및 이삿첸키아 종(예를 들어, 이삿첸키아 오리엔탈리스, a.k.a. 피키아 쿠드리아바제빌(Pichia kudriavzevii) 및 칸디다 아시도테르모필룸(Candida acidothermophilum))을 포함할 수 있다. 일부 구현예에서, 균류 세포는 사상 균류 세포이다. 본 명세서에 사용된 용어 "사상 균류 세포"는 실 모양으로 자라는 임의의 유형의 균류 세포, 즉, 균사 또는 균사체를 지칭한다. 사상 균류 세포의 예로는 제한 없이 누룩곰팡이 종(Aspergillus spp.)(예를 들어, 아스페르길루스 나이거(Aspergillus niger)), 트리코더마 종(Trichoderma spp.)(예를 들어, 트리코더마 리세이(Trichoderma reesei)), 리조푸스 종(Rhizopus spp.)(예를 들어, 리조푸스 오리재(Rhizopus oryzae)), 및 모르티에렐라 종(Mortierella spp.)(예를 들어, 모르티에렐라 이사벨리나)가 포함될 수 있다.
일부 구현예에서, 균류 세포는 산업용 균주이다. 본 명세서에서 사용된 "산업용 균주"는 산업적 공정, 예를 들어 상업적 또는 산업적 규모에서의 생산물의 생산에 사용되거나 그로부터 단리된 균주 세포의 임의의 균주를 지칭한다. 산업용 균주는 산업적 공정에서 전형적으로 사용되는 균류 종을 지칭할 수 있거나, 비-산업적 목적에도 사용될 수 있는(예를 들어, 실험실 연구) 균류 종의 단리물을 지칭할 수 있다. 산업적 공정의 예로는 (예를 들어, 식품 또는 음료 제품의 생산에서의) 발효, 증류, 바이오연료 생산, 화합물의 생산 및 폴리펩티드의 생산이 포함될 수 있다. 산업용 균주의 예는 제한 없이, JAY270 및 ATCC4124를 포함할 수 있다.
일부 구현예에서, 균류 세포는 배수체 세포이다. 본 명세서에서 사용된 "배수체" 세포는 그의 게놈이 하나 초과의 카피로 존재하는 임의의 세포를 지칭할 수 있다. 배수체 세포는 천연적으로 배수체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 배수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다(예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열, 세포질 분열, 또는 DNA 복제의 변형을 통해). 배수체 세포는 그의 전체 게놈이 배수체인 세포를 지칭할 수 있거나, 구체적인 관심 게놈 유전자좌에서 배수체인 세포를 지칭할 수 있다. 이론에 얽매이기 원하지 않지만, 가이드RNA의 풍부는 반수체 세포에서보다 배수체 세포의 게놈 설계 제작에서 더욱 종종 속도-제한 성분일 수 있으며, 이에 따라 본 명세서에 기재된 C2c2 CRISPR 시스템을 사용하는 방법은 특정 균류 세포 유형 사용을 활용할 수 있는 것으로 생각된다.
일부 구현예에서, 균류 세포는 이배체 세포이다. 본 명세서에서 사용된 "이배체" 세포는 그의 게놈이 2 개의 카피로 존재하는 임의의 세포를 지칭할 수 있다. 이배체 세포는 천연적으로 이배체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 이배체 상태로 존재하도록 유도된 세포를 지칭할 수 있다(예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열, 세포질 분열, 또는 DNA 복제의 변형을 통해). 예를 들어, 에스. 세레비시에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 이배체 세포는 그의 전체 게놈이 이배체인 세포를 지칭할 수 있거나, 구체적인 관심 게놈 유전자좌에서 이배체인 세포를 지칭할 수 있다. 일부 구현예에서, 균류 세포는 반수체 세포이다. 본 명세서에서 사용된 "반수체" 세포는 그의 게놈이 하나의 카피로 존재하는 임의의 세포를 지칭할 수 있다. 반수체 세포는 천연적으로 반수체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 반수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다 (예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열, 세포질 분열, 또는 DNA 복제의 변형을 통해). 예를 들어, 에스. 세레비시에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 반수체 세포는 그의 전체 게놈이 반수체인 세포를 지칭할 수 있거나, 구체적인 관심 게놈 유전자좌에서 반수체인 세포를 지칭할 수 있다.
본 명세서에서 사용된 "효모 발현 벡터"는 RNA 및/또는 폴리펩타이드를 인코딩하는 하나 이상의 서열을 함유하는 핵산을 지칭하며, 핵산(들)의 발현을 제어하는 임의의 원하는 요소뿐만 아니라, 효모 세포 내부에서의 발현 벡터의 복제 및 유지를 가능하게 하는 임의의 요소를 추가로 함유할 수 있다. 많은 적합한 효모 발현 벡터 및 그의 특징은 당업계에 알려져 있다; 예를 들어, 다양한 벡터 및 기법이 문헌[Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007)] 및 문헌[Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72]에 예시되어 있다. 효모 벡터는 제한 없이, 동원체(CEN) 서열, 자율 복제 서열(ARS), 프로모터, 예를 들어, 관심 서열 또는 유전자에 작동 가능하게 연결된, RNA 폴리메라제 III 프로모터, RNA 폴라머라제 III 터미네이터와 같은 터미네이터, 복제 기원, 및 마커 유전자(예를 들어, 영양요구성, 항생제, 또는 다른 선택가능한 마커)를 함유할 수 있다. 효모에서의 이용을 위한 발현 벡터의 예로는, 플라스미드, 효모 인공 염색체, 2μ 플라스미드, 효모 통합성 플라스미드, 효모 복제성 플라스미드, 셔틀 벡터, 및 에피솜 플라스미드가 포함될 수 있다.
식물 및 식물 세포의 게놈 내에서의 RNA 표적화 CRISPR 시스템 성분의 안정한 통합
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 성분을 인코딩하는 폴리뉴클레오티드가 식물 세포의 게놈 내로 안정한 통합을 위해 도입되는 것이 예상된다. 이들 구현예에서, 형질전환 벡터 또는 발현 시스템의 설계는, 가이드 RNA 및/또는 RNA 표적화 유전자(들)가 언제, 어디에서 어떤 조건 하에서 발현되는지에 따라 조정될 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 성분을 식물 세포의 게놈 DNA 내로 안정적으로 도입하는 것이 예상된다. 추가적으로 또는 대안적으로, RNA 표적화 CRISPR 시스템의 성분을 식물 세포소기관, 예를 들어 이에 한정되지 않지만, 색소체, 미토콘드리아 또는 엽록체의 DNA 내로 안정한 통합을 위하여 도입하는 것이 예상된다.
식물 세포의 게놈 내로의 안정한 통합을 위한 발현 시스템은 하나 이상의 다음 요소를 함유할 수 있다: 가이드 RNA 및/또는 RNA 표적화 효소를 식물 세포에서 발현하는 데 사용될 수 있는 프로모터 요소; 발현을 향상시키는 5' 비번역 영역; 특정 세포, 예를 들어 단자엽 세포 내 발현을 추가로 향상시키는 인트론 요소; 가이드 RNA 및/또는 RNA 표적화 유전자 서열 및 다른 원하는 요소를 하나 이상 삽입하기 위하여 편리한 제한 부위를 제공하는 다중-클로닝 부위; 및 발현된 전사물의 효율적인 종결을 제공하는 3' 비번역 영역.
발현 시스템의 요소는 플라스미드 또는 형질전환 벡터와 같은 원형, 또는 선형 이중 가닥 DNA와 같은 비-원형 중 어느 하나인 하나 이상의 발현 작제물 상에 있을 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 발현 시스템은 적어도 다음을 포함하며:
(a) 식물에서 표적 서열과 혼성화하는 가이드 RNA(gRNA)를 인코딩하는 뉴클레오티드 서열로, 여기서 가이드 RNA는 가이드 서열 및 직접 반복 서열을 포함하는 것, 및
(b) RNA 표적화 단백질을 인코딩하는 뉴클레오티드 서열,
여기서 성분 (a) 또는 (b)는 동일하거나 상이한 작제물 상에 위치되며, 이로 인해 상이한 뉴클레오티드 서열은 식물 세포 내에서 작동 가능한 동일하거나 상이한 조절 요소의 제어 하에 있을 수 있다.
RNA 표적화 CRISPR 시스템의 성분을 함유하는 DNA 작제물(들), 및 적용가능한 경우, 주형 서열은 각종 통상의 기법에 의해 식물, 식물 일부, 또는 식물 세포의 게놈 내로 도입될 수 있다. 공정은 일반적으로 적합한 숙주 세포 또는 숙주 조직을 선택하는 단계, 작제물(들)을 숙주 세포 또는 숙주 조직 내로 도입하는 단계, 및 식물 세포 또는 그로부터의 식물을 재생하는 단계를 포함한다.
구체적인 구현예에서, DNA 작제물은, 이에 한정되지 않지만, 식물 세포 원형질체의 전기천공, 미세주입, 에어로졸 빔 주사와 같은 기법을 이용하여 식물 세포 내로 도입될 수 있거나, DNA 작제물은 DNA 유전자 총(particle bombardment)과 같은 바이오리스틱 방법을 이용하여 식물 조직에 직접 도입될 수 있다(문헌[Fu et al., Transgenic Res. 2000 Feb;9(1):11-9] 또한 참고). 유전자 총의 기초는 관심 유전자/들로 코팅된 입자를 세포를 향해 가속화하는 것으로, 이는 입자에 의한 원형질의 침투 및 전형적으로 게놈 내로의 안정한 통합을 초래한다(예를 들어, 문헌[Klein et al, Nature (1987), Klein et al, Bio/Technology (1992), Casas et al, Proc. Natl. Acad. Sci. USA (1993)] 참고).
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 성분을 함유하는 DNA 작제물은 아그로박테리움-매개된 형질전환에 의해 식물 내로 도입될 수 있다. DNA 작제물은 적합한 T-DNA 측면 배치 영역과 조합될 수 있으며, 통상의 아그로박테리움 투메파시엔스 숙주 벡터 내로 도입될 수 있다. 외래 DNA는 식물을 감염시킴으로써 또는 하나 이상의 Ti(종양-유도) 플라스미드를 함유하는, 아그로박테리움 박테리아와 함께 식물 원형질체를 인큐베이션함으로써 식물의 게놈 내로 포함될 수 있다(예를 들어, 문헌[Fraley et al., (1985), Rogers et al., (1987) and U.S. Pat. No. 5,563,055] 참고).
식물 프로모터
식물 세포 내 적절한 발현을 보장하기 위하여, 본 명세서에 기재된 C2c2 CRISPR 시스템의 성분은 전형적으로 식물 프로모터, 즉 식물 세포 내에서 작동 가능한 프로모터의 제어 하에 위치된다. 상이한 유형의 프로모터의 이용이 예상된다.
구조적 식물 프로모터는, 오픈 리딩 프레임(open reading frame)(ORF)을 발현할 수 있는 프로모터로, 이는 식물의 모든 또는 거의 모든 발생 단계 동안, 모든 또는 거의 모든 식물 조직에서 제어한다("구조적 발현"으로 지칭됨). 구조적 프로모터의 비-제한적인 일 예는 콜리플라워 모자이크 바이러스 35S 프로모터이다. 본 발명은 RNA 서열을 변형하는 방법을 예상하고 또한 이와 같이 식물 생분자의 발현을 조절하는 것을 예상한다. 따라서 본 발명의 구체적인 구현예에서 조절될 수 있는 프로모터의 제어 하에 하나 이상의 RNA 표적화 CRISPR 시스템 요소를 위치시키는 것이 유리하다. "조절되는 프로모터"는 구조적으로가 아닌, 시간적으로- 및/또는 공간적으로-조절되는 방식으로 유전자 발현을 지시하는 프로모터를 지칭하며, 조직-특이적, 조직-선호된 및 유도성 프로모터를 포함한다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있다. 구체적인 구현예에서, 하나 이상의 RNA 표적화 CRISPR 성분은 구조적 프로모터, 예를 들어 콜리플라워 모자이크 바이러스 35S 프로모터의 제어 하에 발현된다. 조직-선호된 프로모터는 구체적인 식물 조직 내의 특정 세포 유형 내, 예를 들어, 잎 또는 뿌리 내의 맥관 세포 또는 종자의 특정 세포 내에서의 향상된 발현을 표적화하는 데 활용될 수 있다. RNA 표적화 CRISPR 시스템에서의 이용을 위한 구체적인 프로모터의 예는 문헌[Kawamata et al., (1997) Plant Cell Physiol 38:792-803]; 문헌[Yamamoto et al., (1997) Plant J 12:255-65]; 문헌[Hire et al, (1992) Plant Mol Biol 20:207-18], 문헌[Kuster et al, (1995) Plant Mol Biol 29:759-72], 및 문헌[Capana et al., (1994) Plant Mol Biol 25:681-91]에서 발견된다.
유도성이며 유전자 편집 또는 유전자 발현의 시공간적 제어를 가능하게 하는 프로모터의 예는 에너지의 형태를 이용할 수 있다. 에너지의 형태는 이에 한정되지 않지만, 소리 에너지, 전자기 방사, 화학 에너지 및/또는 열 에너지를 포함할 수 있다. 유도성 시스템의 예로는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA, 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬), 예를 들어 서열-특이적 방식으로 전사 활성에서의 변화를 지시하는 광 유도성 전사 이펙터(LITE)가 포함된다. 광 유도성 시스템의 성분은 RNA 표적화 CRISPR 효소, 광-반응성 시토크롬 이형이량체(예를 들어, 애기장대 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 그의 사용 방법의 추가적인 예는 US 61/736465 및 US 61/721,283에 제공되며, 이들은 그 전체로 본 명세서에 참조로서 포함된다.
구체적인 구현예에서, 일시적 또는 유도성 발현은 예를 들어, 화학물질-조절되는 프로모터를 이용함으로써 달성될 수 있으며, 즉 이에 의해 외인성 화학물질의 적용이 유전자 발현을 유도한다. 유전자 발현의 조절은 화학물질-억제성 프로모터에 의해 수득될 수도 있으며, 여기서 화학물질의 적용은 유전자 발현을 억제한다. 화학물질-유도성 프로모터는, 이에 한정되지 않지만, 벤젠 술폰아미드 제초제 약해경감제에 의해 활성화되는, 메이즈 ln2-2 프로모터(문헌[De Veylder et al., (1997) Plant Cell Physiol 38:568-77]), 발아 전 제초제로서 사용된 소수성 친전자성 화합물에 의해 활성화되는, 메이즈 GST 프로모터(GST-ll-27, WO93/01294), 및 살리실산에 의해 활성화되는 담배 PR-1 프로모터(문헌[Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7])를 포함한다. 항생제에 의해 조절되는 프로모터, 예를 들어 테트라사이클린-유도성 및 테트라사이클린-억제성 프로모터(문헌[Gatz et al., (1991) Mol Gen Genet 227:229-37]; 미국 특허 5,814,618 및 5,789,156) 또한 본 명세서에서 사용될 수 있다.
특정 식물 세포소기관으로의 전위 및/또는 그에서의 발현
발현 시스템은 특정 식물 세포소기관으로의 전위 및/또는 식물 세포소기관에서의 발현을 위한 요소를 포함할 수 있다.
엽록체 표적화
구체적인 구현예에서, RNA 표적화 CRISPR 시스템은 엽록체 유전자의 발현 및/또는 번역을 특이적으로 변형시키거나, 엽록체에서의 발현을 보장하는 데 사용되는 것으로 예상된다. 이 목적을 위해, 엽록체 형질전환 방법 또는 RNA 표적화 CRISPR 성분의 엽록체로의 구획화를 이용한다. 예를 들어, 색소체 게놈 내 유전적 변형의 도입은 화분을 통한 유전자 흐름과 같은 생물안전성 문제를 감소시킬 수 있다.
엽록체 형질전환 방법은 당업계에 알려져 있으며 유전자 총, PEG 처리, 및 미세주입을 포함한다. 추가적으로, 형질전환 카세트의 핵 게놈으로부터 색소체로의 전위를 수반하는 방법이 WO2010061186에 기재된 바와 같이 사용될 수 있다.
대안적으로, 하나 이상의 RNA 표적화 CRISPR 성분을 식물 엽록체로 표적화하는 것이 예상된다. 이는 발현 작제물 내로, RNA 표적화 단백질을 인코딩하는 서열의 5' 영역에 작동 가능하게 연결된, 엽록체 수송 펩티드(CTP) 또는 색소체 수송 펩티드를 인코딩하는 서열을 포함시킴으로써 달성된다. CTP는 엽록체 내로의 전위 동안 가공 단계에서 제거된다. 발현된 단백질의 엽록체 표적화는 당업자에게 잘 알려져 있(예를 들어, 문헌[Protein Transport into Chloroplasts, 2010, Annual Review of Plant Biology,Vol. 61: 157-180] 참고). 이러한 구현예에서, 하나 이상의 가이드 RNA를 식물 엽록체로 표적화하는 것이 또한 바람직하다. 엽록체 국소화 서열을 이용하여 가이드 RNA를 엽록체 내로 전위하는 데 사용될 수 있는 방법 및 작제물이 예를 들어 US20040142476에 기재되어 있으며, 이는 본 명세서에 참조로서 포함된다. 작제물의 이러한 변형은 본 발명의 발현 시스템 내로 포함되어 RNA 표적화-가이드 RNA를 효율적으로 전위시킬 수 있다.
CRISPR-RNA 표적화 시스템을 인코딩하는 폴리뉴클레오티드의 조류 세포 내 도입.
유전자 도입 조류(또는 유채와 같은 다른 식물)는 식물성 기름 또는 바이오연료, 예를 들어 알콜(특히 메탄올 및 에탄올), 또는 다른 생산물의 생산에서 특히 유용할 수 있다. 이들은 기름 또는 바이오연료 산업에서의 이용을 위해 높은 수준의 기름 또는 알콜을 발현 또는 과발현하도록 설계 제작될 수 있다.
US8945839는 Cas9를 이용하여 미세-조류(클라미도모나스 레인하티(Chlamydomonas reinhardtii) 세포) 종)을 설계 제작하는 방법을 기재한다. 유사한 도구를 사용하여, 본 명세서에 기재된 RNA 표적화 CRISPR 시스템의 방법은 클라미도모나스 종 및 다른 조류 상에 적용될 수 있다. 구체적인 구현예에서, RNA 표적화 단백질 및 가이드 RNA(들)는 Hsp70A-Rbc S2 또는 Beta2-튜불린과 같은 구조적 프로모터의 제어 하에서 RNA 표적화 단백질을 발현하는 벡터를 사용하여 발현되는 조류 내에 도입된다. 가이드 RNA는 T7 프로모터를 함유하는 벡터를 사용하여 선택적으로 전달된다. 대안적으로, RNA 표적화 mRNA 및 시험관내 전사된 가이드 RNA는 조류 세포로 전달될 수 있다. 전기천공 프로토콜은 GeneArt 클라미도모나스 설계 제작 키트로부터 권장된 표준 프로토콜과 같이, 당업자에게 이용 가능하다.
RNA 표적화 성분을 인코딩하는 폴리뉴클레오티드의 효소 세포 내 도입
구체적인 구현예에서, 본 발명은 효모 세포에서의 RNA 편집을 위한 RNA 표적화 CRISPR 시스템의 이용에 관한 것이다. RNA 표적화 CRISPR 시스템 성분을 인코딩하는 폴리뉴클레오티드를 도입하는 데 사용될 수 있는 효모 세포를 형질전환하는 방법은 당업자에게 잘 알려져 있으며, 문헌[Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403)]에 의해 검토되어 있다. 비-제한적인 예로는 리튬 아세테이트 처리(이는 캐리어 DNA 및 PEG 처리를 추가로 포함할 수 있음), 유전자 총 또는 전기천공에 의한 효모 세포의 형질전환이 포함된다.
식물 및 식물 세포 내에서의 RNA 표적화 CRISP 시스템 성분의 일시적 발현
구체적인 구현예에서, 가이드 RNA 및/또는 RNA 표적화 유전자는 식물 세포 내에서 일시적으로 발현되는 것이 예상된다. 이들 구현예에서, RNA 표적화 CRISPR 시스템은, 가이드 RNA 및 RNA 표적화 단백질 모두가 세포 내에 존재하는 때에만 RNA 표적 분자의 변형을 보장할 수 있어서, 게놈 발현이 추가로 제어될 수 있다. RNA 표적화 효소의 발현이 일시적이므로, 이러한 식물 세포로부터 생성된 식물은 전형적으로 외래 DNA를 함유하지 않는다. 구체적인 구현예에서 RNA 표적화 효소는 식물 세포에 의해 안정하게 발현되고 가이드 서열이 일시적으로 발현된다.
구체적으로 선호되는 구현예에서, RNA 표적화 CRISPR 시스템 성분은 식물 바이러스 벡터를 사용하여 식물 세포 내로 도입될 수 있다(문헌[Scholthof et al. 1996, Annu Rev Phytopathol. 1996;34:299-323]). 추가의 구체적인 구현예에서, 상기 바이러스 벡터는 DNA 바이러스 유래의 벡터이다. 예를 들어, 제미니바이러스(예를 들어, 양배추 잎말림 바이러스, 콩 황색 왜소 바이러스, 밀 왜소 바이러스, 토마토 잎말림 바이러스, 메이즈 줄무늬병 바이러스, 담배 잎말림 바이러스, 또는 토마토 골든 모자이크 바이러스) 또는 나노바이러스(예를 들어, 누에콩 괴사성 황색 바이러스). 다른 구체적인 구현예에서, 상기 바이러스 벡터는 RNA 바이러스 유래의 벡터이다. 예를 들어, 토브라바이러스(tobravirus)(예를 들어, 담배 얼룩 바이러스, 담배 모자이크 바이러스), 포텍스바이러스(potexvirus)(예를 들어, 감자 바이러스 X), 또는 호르데이바이러스(hordeivirus)(예를 들어, 보리 반엽 모자이크 바이러스). 식물 바이러스의 복제 게놈은 비-통합성 벡터이고, 이는 GMO 식물의 생산을 피한다는 맥락에서 관심 대상이다.
구체적인 구현예에서, RNA 표적화 CRISPR 작제물의 일시적 발현에 사용되는 벡터는 예를 들어 pEAQ 벡터이고, 이는 원형질체 내에서 아그로박테리움-매개 일시적 발현을 위해 조정된다(문헌[Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93]). 게놈 위치의 정확한 표적화는, CRISPR 효소를 발현하는 안정한 유전자 도입 식물에서 gRNA를 발현하는 변형된 양배추 잎말림 바이러스(CaLCuV) 벡터를 이용하여 입증되었다(Scientific Reports 5, Article number: 14926 (2015), doi:10.1038/srep14926).
구체적인 구현예에서, 가이드 RNA 및/또는 RNA 표적화 유전자를 인코딩하는 이중-가닥 DNA 단편은 식물 세포 내로 일시적으로 도입될 수 있다. 이러한 구현예에서, 도입된 이중-가닥 DNA 단편은 세포 내 RNA 분자(들)를 변형하기에는 충분한 양으로 제공되지만, 고려된 기간이 지나거나 1 회 이상의 세포 분열 후에는 지속되지 않는다. 식물에서의 직접 DNA 전달 방법은 당업자에 의해 알려져 있다(예를 들어, 문헌[Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85] 참고).
다른 구현예에서, RNA 표적화 단백질을 인코딩하는 RNA 폴리뉴클레오티드는 식물 세포 내로 도입되고, 이는 이후 숙주 세포에 의해 번역되고 가공되어(적어도 하나의 가이드 RNA 존재 하에서) RNA 분자(들) 세포를 변형시키기에 충분한 양의 단백질을 생성하지만 고려된 기간이 지나거나 1 회 이상의 세포 분열 후에는 지속되지 않는다. 일시적 발현을 위하여 mRNA를 식물 원형질체로 도입하는 방법은 당업자에게 알려져 있다(예를 들어, 문헌[Gallie, Plant Cell Reports (1993), 13;119-122] 참고). 상기 기재된 상이한 방법들의 조합이 또한 예상된다.
RNA 표적화 CRISPR 성분의 식물 세포로의 전달
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 하나 이상의 성분을 식물 세포로 직접적으로 전달하는 것이 관심 대상이다. 이것은, 그중에서도, 비-유전자 도입 식물의 생성을 위해 관심 대상이다(아래 참고). 구체적인 구현예에서, 하나 이상의 RNA 표적화 성분이 식물 또는 식물 세포 외부에서 제조되고 세포로 전달된다. 예를 들어 구체적인 구현예에서, RNA 표적화 단백질은 식물 세포로의 도입 전에 시험관내에서 제조된다. RNA 표적화 단백질은 당업자에게 알려진 다양한 방법에 의해 제조될 수 있으며, 재조합 생산을 포함한다. 발현 후, RNA 표적화 단백질이 단리되고, 필요한 경우 재폴딩되고, 정제되고 선택적으로 임의의 정제 태그, 예를 들어 His-태그를 제거하기 위해 처리된다. 미정제의, 부분적으로 정제된, 또는 더욱 완전하게 정제된 RNA 표적화 단백질이 일단 수득되면, 단백질은 식물 세포로 도입될 수 있다.
구체적인 구현예에서, RNA 표적화 단백질은 관심 RNA를 표적화하는 가이드 RNA와 혼합되어 사전-조립된 리보뉴클레오단백질을 형성한다.
개별적인 성분 또는 사전-조립된 리보뉴클레오단백질은 전기 천공을 통해, RNA 표적화-관련된 유전자 산물 코팅된 입자를 이용한 유전자총에 의해, 화학적 형질감염에 의해, 또는 세포막을 통과하여 수송하는 일부 다른 수단에 의해 식물 세포 내로 도입될 수 있다. 예를 들어, 사전-조립된 CRISPR 리보뉴클레오단백질을 이용한 식물 원형질체의 형질감염은 식물 게놈이 표적화된 변형을 보장하는 것으로 입증되었다(문헌[Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389]에 기재된 바와 같음). 이들 방법은 식물에서 RNA 분자의 표적화된 변형을 달성하기 위해 변형될 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 시스템 성분은 나노입자를 사용하여 식물 세포 내로 도입된다. 단백질 또는 핵산으로서, 또는 이의 조합으로 중 어느 하나로, 성분은 나노입자 위에 업로드되거나, 나노입자 내에 패키징되고, 식물에 적용될 수 있다(예를 들어, WO 2008042156 및 US 20130185823에 기재된 것과 같음). 구체적으로, 본 발명의 일 구현예는, WO2015089419에 기재된 바와 같이, RNA 표적화 단백질을 인코딩하는 DNA 분자(들), 가이드 RNA를 인코딩하는 DNA 분자 및/또는 단리된 가이드 RNA로 업로드된 또는 그로 패킹된 나노입자를 포함한다.
RNA 표적화 CRISPR 시스템의 하나 이상의 성분을 식물 세포로 도입하는 추가의 수단은 세포 침투 펩티드(CPP)를 이용하는 것에 의한다. 따라서, 구체적으로 본 발명에서 구현예는 RNA 표적화 단백질에 연결된 세포 침투 펩티드를 포함하는 조성물을 포함한다. 본 발명의 구체적인 구현예에서, RNA 표적화 단백질 및/또는 가이드 RNA(들)는 하나 이상의 CPP에 커플링되어 이들을 식물 원형질체 내부로 효과적으로 수송한다(인간 세포에서의 Cas9에 대한 문헌[Ramakrishna (2014, Genome Res. 2014 Jun;24(6):1020-7)]. 다른 구현예에서, RNA 표적화 유전자 및/또는 가이드 RNA(들)는 식물 원형질체 전달을 위한 하나 이상의 CPP에 커플링되는 하나 이상의 원형 또는 비-원형 DNA 분자(들)에 의해 인코딩된다. 식물 원형질체는 그 후 식물 세포로 그리고 추가로 식물로 재생된다. CPP는 단백질로부터 유래된 또는 수용체 독립적인 방식으로 세포막을 통과하여 생분자를 수송할 수 있는 키메라 서열로부터 유래된, 일반적으로 35 개 미만 아미노산의 짧은 펩티드로서 기재된다. CPP는 양이온 펩티드, 소수성 서열을 갖는 펩티드, 양친매성 펩티드, 프롤린-풍부 및 항균성 서열을 갖는 펩티드, 및 키메라 또는 2부로 구성된 펩티드(Pooga and Langel 2005)일 수 있다. CPP는 생물학적 막을 침투할 수 있고, 그와 같이 다양한 생분자의 세포막을 통과하는 세포질 내로의 이동을 야기하고, 그의 세포내 경로에 따른 수송을 개선시키고, 이에 따라 생분자의 표적과의 상호작용을 촉진한다. CPP의 예로는, 특히: Tat, HIV 제1형에 의해 바이러스 복제에 요구되는 핵 전사 활성화제 단백질, 페네트라틴, 카포시(Kaposi) 섬유아세포 성장 인자(FGF) 신호 펩티드 서열, 인테그린 β3 신호 펩티드 서열; 폴리아르기닌 펩티드 Arg 서열, 구아닌 풍부-분자 수송체, 스위트 애로우(sweet arrow) 펩티드, 등이 포함된다.
식물, 조류 또는 균류 적용을 위해 예상되는 표적 RNA
표적 RNA, 즉 관심 RNA는 본 발명에 의해 표적화될 RNA로서, 표적 RNA상의 관심 표적 부위로의 모집, 및 관심 표적 부위에서의 RNA 표적화 단백질의 결합을 유도한다. 표적 RNA는 임의의 적합한 형태의 RNA 일 수 있다. 이는 일부 구현예에서 mRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 전달 RNA(tRNA) 또는 리보솜 RNA(rRNA)를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 간섭 RNA(RNAi), 마이크로RNA(miRNA), 마이크로스위치, 마이크로자임, 위성 RNA 및 RNA 바이러스를 포함할 수 있다. 표적 RNA는 식물 세포의 세포질 또는 세포핵 또는 미토콘드리아, 엽록체 또는 색소체와 같은 식물 세포 소기관 내에 위치할 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 시스템은 RNA를 절단하거나 그렇지 않으면 RNA 발현을 저해하는 데 사용된다.
RNA 조절을 통한 식물 유전자 발현 조절을 위한 RNA 표적화 CRISPR 시스템의 사용
RNA 표적화 단백질은 또한 RNA 가공의 제어를 통하여 유전자 발현을 표적화하기 위해, 적합한 가이드 RNA와 함께 사용될 수 있다. RNA 가공의 제어는 대안적인 스플라이싱 또는 특정 스플라이스 변이체 또는 이소형을 특이적으로 표적화하는 것을 포함하는, RNA 스플라이싱; 바이러스 복제(구체적으로, 식물 내 바이로이드를 포함하는 식물 바이러스의) 및 tRNA 생합성과 같은 RNA 가공 반응을 포함할 수 있다. 적합한 가이드 RNA와 조합된 RNA 표적화 단백질은 또한 RNA 활성화(RNAa)를 제어하는 데 사용될 수 있다. RNAa는 유전자 발현의 촉진을 유도하므로, 유전자 발현의 제어는 RNAa의 파괴 또는 감소, 이에 따른 유전자 발현의 덜한 촉진을 통하는 방식으로 달성될 수 있다.
본 발명의 RNA 표적화 이펙터 단백질은 식물에서의, 구체적으로 RNA 바이러스에 대한, 항 바이러스 활성을 위해 추가로 사용될 수 있다. 이펙터 단백질은 선택된 바이러스 RNA 서열에 대해 선택적인 적합한 가이드 RNA를 사용하여 바이러스 RNA에 표적화될 수 있다. 구체적으로, 이펙터 단백질은 단일 가닥 RNA와 같은 RNA를 절단하는 활성 뉴클레아제일 수 있다. 따라서, 본 발명의 RNA 표적화 이펙터 단백질의 항 바이러스제로서의 용도가 제공된다. 이 방식으로 중화될 수 있는 바이러스의 예로는 담배 모자이크 바이러스(TMV), 토마토 반점 시듦 바이러스(TSWV), 오이 모자이크 바이러스(CMV), 감자 바이러스 Y(PVY), 콜리플라워 모자이크 바이러스(CaMV)(RT 바이러스), 자두 폭스 바이러스(PPV), 브롬 모자이크 바이러스(BMV) 및 감자 바이러스 X(PVX)가 포함된다.
표적화된 유전자 변형의 대안으로서, 식물, 조류 또는 균류에서 RNA 발현을 조절하는 예가 본 명세서에 추가로 기재되어 있다.
mRNA의 조절되는 절단을 통한 유전자 발현의 조절되는 제어가 구체적인 관심 대상이다. 이것은 본 명세서에 기재된 조절되는 프로모터의 제어 하에 RNA 표적화 요소를 위치시킴으로써 달성될 수 있다.
tRNA 분자의 기능성 획복을 위한 RNA 표적화 CRISPR 시스템의 사용.
Pring 외는 DNA보다 mRNA 서열을 상이한 단백질을 코딩하도록 변경시키는 식물 미토콘드리아 및 엽록체에서의 RNA 편집을 기재하고 있다(문헌[Plant Mol. Biol. (1993) 21 (6): 1163-1170. doi:10.1007/BF00023611]). 본 발명의 구체적인 구현예에서, 미토콘드리아 및 엽록체 mRNA를 특이적으로 표적화하는 RNA 표적화 CRISPR 시스템의 요소는 생체내에서 일어나는 과정을 모방하여 이러한 식물 세포 소기관에서 상이한 단백질을 발현하도록 식물 또는 식물 세포에 도입될 수 있다.
RNA 발현을 저해하는 RNA 간섭에 대한 대안으로서의 RNA 표적화 CRISPR 시스템의 사용.
RNA 표적화 CRISPR 시스템은 RNA 저해 또는 RNA 간섭과 유사한 용도를 가지며, 따라서 이러한 방법으로 대체될 수도 있다. 구체적인 구현예에서, 본 발명의 방법은 예를 들어, 간섭 리보핵산(예를 들어, siRNA 또는 shRNA 또는 dsRNA)에 대한 대체물로서의 RNA 표적화 CRISPR의 사용을 포함한다. 표적화된 유전자 변형의 대안으로서의 식물, 조류 또는 균류에서의 RNA 발현의 저해의 예가 본 명세서에 추가로 기재되어 있다.
RNA 간섭을 제어하기 위한 RNA 표적화 CRISPR 시스템의 사용.
간섭 RNA 또는 miRNA에 대한 제어는 생체내 또는 시험관내에서 간섭 RNA 또는 miRNA의 수명을 감소시킴으로써 그 접근에서 나타나는 표적외 효과(OTE)를 감소시키는 데 도움을 줄 수 있다. 구체적인 구현예에서, 표적 RNA는 간섭 RNA, 즉 shRNA, siRNA 등과 같은 RNA 간섭 경로에 관여하는 RNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 마이크로RNA(miRNA) 또는 이중 가닥 RNA(dsRNA)를 포함할 수 있다.
다른 구체적인 구현예에서, RNA 표적화 단백질 및 적합한 가이드 RNA(들)가 선택적으로(예를 들어 조절되는 프로모터, 예를 들어, 조직- 또는 세포주기-특이적 프로모터 및/또는 인핸서의 제어 하에서 공간적 또는 시간적으로) 발현되는 경우 이것은 그 세포에서 RNAi로부터 세포 또는 시스템(생체내 또는 시험관내)을 '보호'하는 데 사용될 수 있다. 이것은 RNAi가 필요하지 않은 이웃 조직이나 세포에서, 또는 이펙터 단백질 및 적절한 가이드가 발현되는 세포 또는 조직과 발현되지 않는 것(즉, 각각 RNAi가 제어되지 않은 것 및 제어되는 것)의 비교의 목적을 위해 유용할 수 있다. RNA 표적화 단백질은 리보자임, 리보솜 또는 리보스위치와 같은 RNA를 포함하거나 RNA로 구성된 분자를 제어하거나 분자에 결합하는 데 사용될 수 있다. 본 발명의 일 구현예에서, 가이드 RNA는 RNA 표적화 단백질을 이들 분자에 모집하여 RNA 표적화 단백질이 이들에 결합할 수 있다.
본 출원은 정보 제공된 시스템의 설계 제작을 위한 기초를 제공하므로, 본 발명의 RNA 표적화 CRISPR 시스템은 본 기재 내용으로부터 과도한 실험없이, 곤충 해충 관리, 식물 질병 관리 및 제초제 내성의 관리뿐만 아니라 식물 분석에서 및 다른 적용을 위한 것을 포함하는, 식물 내 RNAi 기술 영역에 적용될 수 있다(예를 들어 문헌[Kim et al., in Pesticide Biochemistry and Physiology (Impact Factor: 2.01). 01/2015; 120. DOI: 10.1016/j.pestbp.2015.01.002]; 문헌[Sharma et al. in Academic Journals (2015), Vol.12(18) pp2303-2312)]; 문헌[Green J.M, inPest Management Science, Vol 70(9), pp 1351-1357] 참고).
식물, 조류 및 균류에서 리보스위치를 변형하고 대사 조절을 제어하기 위한 RNA 표적화 CRISPR 시스템의 사용
리보스위치(압토자임으로도 알려짐)는 소분자에 결합하고 교대로 유전자 발현을 조절하는 메신저 RNA의 조절 절편이다. 이 메커니즘은 세포가 이들 소분자의 세포 내 농도를 감지 가능하게 한다. 구체적인 리보스위치는 전형적으로 이 유전자의 전사, 번역 또는 스플라이싱을 변경함으로써 인접한 유전자를 조절한다. 따라서, 본 발명의 구체적인 구현예에서, 리보스위치를 표적화하는 적합한 가이드 RNA와 조합하여 RNA 표적화 단백질의 사용을 통하여 리보스위치 활성의 제어가 예상된다. 이것은 리보스위치의 절단 또는 리보스위치에의 결합을 통한 것일 수 있다. 구체적인 구현예에서, 리보스위치 활성의 감소가 예상된다. 최근, 티아민 피로포스페이트(TPP)에 결합하는 리보스위치가 동정되어 식물 및 조류에서 티아민 생합성을 조절하는 것으로 밝혀졌다. 또한, 이 요소는 식물에서 주요 대사의 필수 조절제인 것으로 보인다(문헌[Bocobza and Aharoni, Plant J. 2014 Aug; 79(4):693-703. doi: 10.1111/tpj.12540. Epub 2014 Jun 17]). TPP 리보스위치는 뉴로스포라 크라싸(Neurospora crassa)와 같은 특정 균류에서도 발견되고, 이는 업스트림 오픈 리딩 프레임(uORF)을 조건부로 생산하기 위한 대안적 스플라이싱을 제어하고, 이에 의해 다운스트림 유전자의 발현에 영향을 미친다(문헌[Cheah MT et al., (2007)Nature 447 (7143): 497-500. doi:10.1038/nature05769]). 본 명세서에 기재된 RNA 표적화 CRISPR 시스템은 식물, 조류 또는 균류에서 내인성 리보스위치 활성을 조작하고, 그와 같이 이에 의해 제어되는 다운스트림 유전자의 발현을 변경시키는 데 사용될 수 있다. 구체적인 구현예에서, RNA 표적화 CRISP 시스템은 생체내 또는 시험관내에서 리보스위치 기능을 분석하고 대사 네트워크에 대한 관련성을 연구하는 데 사용될 수 있다. 구체적인 구현예에서, RNA 표적화 CRISPR 시스템은 잠재적으로 유전자 제어를 위한 식물 및 플랫폼에서의 대사산물 센서로서 리보스위치의 설계 제작을 위해 사용될 수 있다.
식물, 조류 또는 균류를 위한 RNAi 스크린에서의 RNA 표적화 CRISPR 시스템의 사용
녹다운이 표현형 변화와 관련된 유전자 산물을 동정하여, RNAi 스크린을 통해, 생물학적 경로가 조사되고 구성 부분이 동정될 수 있다. 본 발명의 구체적인 구현예에서, 스크린에서의 RNAi의 활성을 제거 또는 감소시키고 이에 따라 (이전에 간섭된) 유전자 산물의 활성을(간섭/억제를 제거하거나 감소시킴으로써) 회복시키기 위해 본 명세서에 기재된 가이드 29 또는 가이드 30 단백질 및 적합한 가이드 RNA를 사용함으로써 이들 스크린을 통해 또는 이들 스크린 동안 제어가 또한 행사될 수 있다.
생체내 및 시험관내 RNA 분자의 시각화를 위한 RNA 표적화 단백질의 사용
구체적인 구현예에서, 본 발명은 핵산 결합 시스템을 제공한다. RNA의 상보적인 프로브와의 인 시츄 혼성화는 강력한 기법이다. 전형적으로 형광 DNA 올리고뉴클레오티드가 혼성화에 의해 핵산을 검출하는 데 사용된다. 고정된 핵산(LNA)과 같은 특정 변형에 의해 증가된 효율이 달성되었지만, 효율적이고 융통성있는 대안에 대한 요구가 여전히 남아있다. 이와 같이, RNA 표적화 시스템의 표지된 요소는 인 시츄 혼성화를 위한 효율적이고 적응 가능한 시스템에 대한 대안으로서 사용될 수 있다.
식물 및 효모에서 RNA 표적화 CRISPR 시스템의 추가의 응용
바이오연료 생산에서 RNA 표적화 CRISPR 시스템의 사용
본 명세서에 기재된 용어 "바이오연료"는 식물 및 식물-유래된 자원으로부터 제조된 대안적인 연료이다. 재생 가능한 바이오연료는, 에너지가 탄소 고정 과정을 통해 수득되거나 바이오매스의 이용 또는 전환을 통하여 만들어진 유기 물질로부터 추출될 수 있다. 이 바이오매스는 바이오연료를 위해 직접 사용될 수 있거나, 열 전환, 화학 전환 및 생화학 전환에 의한 물질을 함유하는 편리한 에너지로 전환될 수 있다. 이 바이오매스 전환은 고체, 액체, 또는 가스 형태의 연료를 초래할 수 있다. 바이오연료에는 두 가지 유형이 있다: 바이오에탄올 및 바이오디젤. 바이오에탄올은 셀룰로스(전분)의 당 발효 공정에 의해 주로 생산되며, 이는 대부분 메이즈 및 사탕수수로부터 유래된다. 한편, 바이오디젤은 유채씨, 야자 및 대두와 같은 기름 작물로부터 주로 생산된다. 바이오연료는 주로 교통에 사용된다.
바이오연료 생산을 위한 식물 특성의 향상
구체적인 구현예에서, 본 명세서에 기재된 RNA 표적화 CRISPR 시스템을 이용하는 방법은, 발효를 위한 당의 더욱 효율적인 방출을 위해 핵심 가수분해제에 의한 접근을 촉진하기 위하여, 세포벽의 특성을 변경하는 데 사용된다. 구체적인 구현예에서, 셀룰로스 및/또는 리그닌의 생합성이 변형된다. 셀룰로스는 세포벽의 주 성분이다. 셀룰로스 및 리그닌의 생합성은 공동-조절된다. 식물에서 리그닌의 비율을 감소시킴으로써 셀룰로스의 비율이 증가될 수 있다. 구체적인 구현예에서, 본 명세서에 기재된 방법은, 발효 가능한 탄수화물을 증가시키기 위하여 식물에서 리그닌 생합성을 하향조절하는 데 사용된다. 더욱 구체적으로, 본 명세서에 기재된 방법은, WO 2008064289 A2에 개시된 바와 같이, 4-쿠마레이트 3-하이드록실라제(C3H), 페닐알라닌 암모니아-리아제(PAL), 신나메이트 4-하이드록실라제(C4H), 하이드록시신나모일 트랜스페라제(HCT), 카페산 O-메틸트랜스페라제(COMT), 카페오일 CoA 3-O-메틸트랜스페라제(CCoAOMT), 페룰레이트 5-하이드록실라제(F5H), 신나밀 알콜 데하이드로게나제(CAD), 신나모일 CoA-리덕타제(CCR), 4-쿠마레이트-CoA 리가제(4CL), 모노리그놀-리그닌-특이적 글리코실트랜스페라제, 및 알데히드 데하이드로게나제(ALDH)로 구성된 군으로부터 선택되는 적어도 제1 리그닌 생합성 유전자를 하향조절하는 데 사용된다.
구체적인 구현예에서, 본 명세서에 기재된 방법은 발효 동안 더욱 낮은 수준의 아세트산을 생산하는 식물 매스를 생산하는 데 사용된다(WO 200096488 또한 참고).
바이오연료 생산을 위한 효모의 변형
구체적인 구현예에서, 본 명세서에서 제공된 RNA 표적화 효소는 재조합 미생물에 의한 바이오에탄올 생산을 위해 사용된다. 예를 들어, RNA 표적화 효소는 미생물, 예를 들어 효모를 설계 제작하여 발효 가능한 당으로부터 바이오연료 또는 생체고분자를 생성하고, 선택적으로 발효 가능한 당 공급원으로서 농업 폐기물로부터 유래된 식물-유래 리그노셀룰로스를 분해시킬 수 있는 데 사용될 수 있다. 더욱 구체적으로, 본 발명은 바이오연료 생산에 요구되는 내인성 유전자의 발현을 변형시키고/시키거나 바이오연료 합성을 간섭할 수 있는 내인성 유전자를 변형시키는 데 RNA 표적화 CRISPR 복합체가 사용되는 방법을 제공한다. 더욱 구체적으로, 방법은 피루베이트의 에탄올 또는 또 다른 관심 생산물로의 전환에 관여하는 효소를 인코딩하는 하나 이상의 뉴클레오티드 서열의, 효모와 같은 미생물 내에서의 발현을 자극하는 것을 포함한다. 구체적인 구현예에서 방법은 미생물이 셀룰로스를 분해 가능하도록 하는 하나 이상의 효소, 예를 들어 셀룰라제의 발현의 자극을 보장하도록 한다. 추가의 구현예에서, RNA 표적화 CRISPR 복합체는 바이오연료 생산 경로와 경쟁하는 내인성 대사 경로를 억제하는 데 사용된다.
식물성-기름 또는 바이오연료의 생산을 위한 조류 및 식물의 변형
유전자 도입 조류 또는 유채와 같은 기타 식물은 구체적으로 예를 들어 식물성 기름 또는 알콜(특히 메탄올 및 에탄올)과 같은 바이오연료의 생산에 유용할 수 있다. 이들은 기름 또는 바이오연료 산업에서의 이용을 위해 높은 수준의 기름 또는 알콜을 발현 또는 과발현하도록 설계 제작될 수 있다.
US8945839는 Cas9를 이용하여 미세-조류(클라미도모나스 레인하티 세포)종)을 설계 제작하는 방법을 기재한다. 유사한 도구를 사용하여, 본 명세서에 기재된 RNA 표적화 CRISPR 시스템의 방법은 클라미도모나스 종 및 다른 조류 상에 적용될 수 있다. 구체적인 구현예에서, RNA 표적화 이펙터 단백질 및 가이드 RNA는 Hsp70A-Rbc S2 또는 Beta2-튜불린과 같은 구조적 프로모터의 제어 하에서 RNA 표적화 이펙터 단백질을 발현하는 벡터를 사용하여 발현되는 조류 내에 도입된다. 가이드 RNA는 T7 프로모터를 함유하는 벡터를 사용하여 전달될 것이다. 대안적으로, 시험관내 전사된 가이드 RNA는 조류 세포로 전달될 수 있다. 전기천공 프로토콜은 GeneArt 클라미도모나스 설계 제작 키트로부터 권장된 표준 프로토콜을 따른다.
식물에서의 RNA 표적화 효소의 구체적인 적용
구체적인 구현예에서, 본 발명은 바이러스 RNA를 절단할 수 있기 때문에 식물 시스템에서 바이러스 제거를 위한 치료법으로서 사용될 수 있다. 인간 시스템에서의 이전의 연구는 단일 가닥 RNA 바이러스인 C형 간염을 표적화하는 것에 CRISPR를 활용하는 것의 성공을 입증하였다(문헌[A. Price, et al., Proc. Natl. Acad. Sci, 2015]). 이들 방법은 또한 식물에서의 RNA 표적화 CRISPR 시스템의 사용을 위하여 조정될 수 있다.
개량된 식물
본 발명은 또한 본 명세서에서 제공된 방법에 의해 수득 가능하고 수득된 식물 및 효모 세포를 제공한다. 본 명세서에 기재된 방법에 의해 수득된 개량된 식물은 예를 들어 식물 해충, 제초제, 가뭄, 저온 또는 고온, 과습 등에 대한 내성을 보장하는 유전자의 변형된 발현을 통해 식품 또는 사료 생산에 유용할 수 있다.
본 명세서에 기재된 방법에 의해 수득된 개량된 식물, 특히 작물 및 조류는 예를 들어, 야생형에서 보통 나타나는 것보다 더 높은 단백질, 탄수화물, 영양소 또는 비타민 수준의 발현을 통해 식품 또는 사료 생산에 유용할 수 있다. 이와 관련하여 개량된 식물, 특히 콩류 및 괴경이 선호된다.
개량된 조류 또는 유채와 같은 기타 식물은 예를 들어 식물성 기름 또는 알콜(특히 메탄올 및 에탄올)과 같은 바이오연료의 생산에 특히 유용할 수 있다. 이들은 기름 또는 바이오연료 산업에서의 이용을 위해 높은 수준의 기름 또는 알콜을 발현 또는 과발현하도록 설계 제작될 수 있다.
본 발명은 또한 식물의 개량된 부분을 제공한다. 식물 부분은 잎, 줄기, 뿌리, 괴경, 종자, 배젖, 배주 및 화분을 포함하지만 이에 한정되지 않는다. 본 명세서에서 예상된 식물 부분은 생존 가능, 비 생존 가능, 재생 가능 및/또는 비-재생 가능일 수 있다.
본 발명의 방법에 따라 생성된 식물 세포 및 식물을 제공하는 것 또한 본 명세서에 포함된다. 전통적인 육종 방법에 의해 생산되는, 유전적 변형을 포함하는 식물의 생식세포, 종자, 접합자 또는 체세포성, 배아, 자손 또는 잡종 또한 본 발명의 범위 내에 포함된다. 이러한 식물은 표적 서열에 또는 표적 서열 대신에 삽입된 이종 또는 외래 DNA 서열을 함유할 수 있다. 대안적으로, 이러한 식물은 하나 이상의 뉴클레오티드에서의 변경(돌연변이, 결실, 삽입, 치환)만을 함유할 수 있다. 이와 같이, 이러한 식물은 오직 구체적인 변형의 존재에 의해 그들의 시조 식물과 상이할 것이다.
본 발명의 일 구현예에서, C2c2 시스템은 예를 들어 박테리아, 균류 또는 바이러스에 의해 유발된 질병에 대한 저항성을 생성시킴으로써 병원체 저항성 식물을 설계 제작하는 데 사용된다. 특정 구현예에서, 병충해 저항성은 곤충 해충에 의해 섭취되어 사망에 이를 C2c2 시스템을 생산하도록 작물을 설계 제작함으로써 달성될 수 있다. 본 발명의 일 구현예에서, C2c2 시스템은 비생물적 스트레스 내성을 설계 제작하는 데 사용된다. 또 다른 구현예에서, C2c2 시스템은 가뭄 스트레스 내성 또는 염 스트레스 내성, 또는 추위 또는 열 스트레스 내성을 설계 제작하는 데 사용된다. 문헌[Younis et al. 2014, Int. J. Biol. Sci. 10;1150]은 식물 육종 방법의 잠재적 표적을 검토하였으며, 이들 모두는 본 명세서에 기재된 C2c2 시스템의 사용을 통해 교정 또는 개선을 할 수 있다. 일부 비-제한적인 표적 작물은, 애기장대(Arabidopsis thaliana), 옥수수(Zea mays), 벼(Oryza sativa L), 자두(Prunus domestica L.), 목화(Gossypium hirsutum), 야생 담배(Nicotiana rustica), 옥수수(Zea mays), 알팔파(Medicago sativa), 담배(Nicotiana benthamiana) 및 애기장대(Arabidopsis thaliana)를 포함한다.
본 발명의 일 구현예에서, C2c2 시스템은 작물 해충의 관리에 사용된다. 예를 들어, 작물 해충에서 작동 가능한 C2c2 시스템은 식물 숙주로부터 발현되거나, 예를 들어 바이러스 벡터를 사용하여, 표적에 직접적으로 전달될 수 있다.
일 구현예에서, 본 발명은 이형접합 비-인간 출발 생물로부터 동형접합 생물을 효율적으로 생산하는 방법을 제공한다. 일 구현예에서, 본 발명은 식물 육종에 사용된다. 또 다른 구현예에서, 본 발명은 동물 육종에 사용된다. 이러한 구현예에서, 식물 또는 동물과 같은 동형접합 생물은 이중 가닥 손상, 염색체 쌍 형성 및/또는 가닥 교환에 관여하는 적어도 하나의 표적 유전자를 간섭하는 것에 의해 재조합을 방지 또는 억제함으로써 제조된다.
최적화된 기능성 RNA 표적화 시스템에서의 C2C2단백질의 적용
일 양태에서, 본 발명은 기능적 성분을 RNA 환경으로 특이적으로 전달하기 위한 시스템을 제공한다. 이것은 상이한 성분의 RNA로의 특이적 표적화를 가능하게 하는 본 발명의 RNA 표적화 이펙터 단백질을 포함하는 CRISPR 시스템을 사용하여 보장될 수 있다. 더욱 구체적으로, 이러한 성분은 RNA 번역, 분해 등의 활성화제 또는 억제제와 같은, 활성화제 또는 억제제를 포함한다. 이 시스템의 적용은 본 명세서의 다른 곳에 기재되어 있다.
일 양태에 따라, 본 발명은 세포의 관심 게놈 유전자좌에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA를 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 제공하며, 여기서 가이드 RNA는 어댑터 단백질에 결합하는 하나 이상의 별개 RNA 서열(들)의 삽입에 의해 변형된다. 구체적인 구현예에서, RNA 서열은 둘 이상의 어댑터 단백질(예를 들어, 압타머)에 결합할 수 있으며, 여기서 각각의 어댑터 단백질은 하나 이상의 기능성 도메인과 회합된다. 본 명세서에 기재된 c2c2 효소의 가이드 RNA는 가이드 서열의 변형이 가능한 것으로 나타난다. 구체적인 구현예에서, 가이드 RNA는 직접 반복 내 직접 반복의 5' 또는 가이드 서열의 3'에 별개의 RNA 서열(들)의 삽입에 의해 변형된다. 하나 초과의 기능성 도메인이 존재하는 경우, 기능성 도메인은 동일하거나 상이할 수 있으며, 예를 들어 동일하거나 상이한 2 개의 활성화제 또는 억제제 중 2 개일 수 있다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 하나 이상의 기능성 도메인이 RNA 표적화 효소에 부착되어 표적 RNA에 결합 즉시 기능성 도메인이 그것의 간주되는 성질의 기능으로 기능할 수 있도록 하는 공간적 방향으로 기능성 도메인이 있게 된다; 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 조성물은 적어도 3 개의 기능성 도메인을 갖는 CRISPR-Cas 복합체를 포함하고, 그 중 적어도 하나는 RNA 표적화 효소와 관련되고 그 중 적어도 2 개는 gRNA와 관련된다.
따라서, 일 양태에서, 본 발명은 본 명세서에서-논의된 가이드 RNA 및 RNA 표적화 효소인 CRISPR 효소를 포함하는, 비-천연적으로 발생하거나 설계 제작된 CRISPR-Cas 복합체 조성물을 제공하며, 여기서 선택적으로 RNA 표적화 효소는 적어도 하나의 돌연변이를 포함하여, RNA 표적화 효소가 적어도 하나의 돌연변이를 갖지 않는 효소의 뉴클레아제 활성의 5% 이하를 가지게 되고, 선택적으로 적어도 하나 이상의 핵 국소화 서열을 포함하는 하나 이상을 포함한다. 구체적인 구현예에서, RNA 표적화 효소의 결합을 여전히 보장하지만 RNA 표적화 효소에 의한 절단을 방지하기 위해(본 명세서의 다른 곳에서 상세히 설명된 바와 같이), 가이드 RNA가 추가적으로 또는 대안적으로 변형된다.
구체적인 구현예에서, RNA 표적화 효소는 적어도 하나의 돌연변이를 갖지 않는 c2c2 효소와 비교하여 적어도 97% 또는 100%의 감소된 뉴클레아제 활성을 갖는 c2c2 효소이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 C2c2 효소는 2 개 이상의 돌연변이를 포함한다. 돌연변이는, 렙토트리키아 샤히 c2c2 단백질 또는 오솔로그의 상응하는 위치에 따라, 예를 들어, 다음의 돌연변이 중 하나 이상과 같은: R597A, H602A, R1278A 및 H1283A, 다음 아미노산 잔기 중 하나 이상에 대한 돌연변이로부터 선택될 수있다: R597, H602, R1278 및 H1283.
구체적인 구현예에서, RNA 표적화 시스템은 2 개 이상의 기능성 도메인을 포함하는 본 명세서에서 상기 기재된 바와 같이 제공된다. 구체적인 구현예에서, 2 개 이상의 기능성 도메인은 이종의 기능성 도메인이다. 구체적인 구현예에서, 시스템은 기능성 도메인을 포함하는 융합 단백질인 어댑터 단백질을 포함하고, 융합 단백질은 선택적으로 어댑터 단백질과 기능성 도메인 사이에 링커를 포함한다. 구체적인 구현예에서, 링커는 GlySer 링커를 포함한다. 추가적으로 또는 대안적으로, 하나 이상의 기능성 도메인이 링커, 선택적으로 GlySer 링커를 통해 RNA 이펙터 단백질에 부착된다. 구체적인 구현예에서, 하나 이상의 기능성 도메인은 HEPN 도메인 중 하나 또는 둘 모두를 통해 RNA 표적화 효소에 부착된다.
일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 어댑터 단백질 또는 RNA 표적화 효소와 회합된 하나 이상의 기능성 도메인은 RNA 번역을 활성화 또는 억제할 수 있는 도메인이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 어댑터 단백질과 회합된 하나 이상의 기능성 도메인 중 적어도 하나는 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성, 또는 분자 스위치 활성 또는 화학적 유도성 또는 광 유도성을 포함하는 하나 이상의 활성을 갖는다.
일 양태에서, 본 발명은 압타머 서열을 포함하는 본 명세서에서-논의된 조성물을 제공한다. 구체적인 구현예에서, 압타머 서열은 동일한 어댑터 단백질에 특이적인 2 개 이상의 압타머 서열이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 압타머 서열은 상이한 어댑터 단백질에 특이적인 2 개 이상의 압타머 서열이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 어댑터 단백질은 MS2, PP7, Qβ F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s, PRR1를 포함한다. 따라서, 구체적인 구현예에서, 압타머는 상기 나열된 어댑터 단백질 중 임의의 하나에 특이적으로 결합하는 결합 단백질로부터 선택된다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 세포는 진핵 세포이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 진핵 세포는 포유류 세포, 식물 세포 또는 효모 세포이고, 포유류 세포는 선택적으로 마우스 세포이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 포유류 세포는 인간 세포이다.
일 양태에서, 본 발명은 상기 본 명세서에서-논의된 조성물을 제공하며, 여기서 하나 초과의 gRNA가 존재하고 gRNA는 상이한 서열을 표적화하여, 조성물이 사용될 때 다중화가 존재한다. 일 양태에서, 본 발명은 조성물을 제공하며, 여기서 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형된 하나 초과의 gRNA가 존재한다.
일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 하나 이상의 기능성 도메인과 회합된 하나 이상의 어댑터 단백질이 존재하고 이는 가이드 RNA(들)에 삽입된 별개의 RNA 서열(들)에 결합된다.
일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 가이드 RNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형되고; 예를 들어, 여기서 적어도 하나의 비-코딩 기능성 루프는 억압성이며; 예를 들어, 여기서 적어도 하나의 비-코딩 기능성 루프는 Alu를 포함한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 하나 이상의 조성물을 숙주에 투여하거나 생체내 숙주에서 발현시키는 것을 포함하는 유전자 발현 변형 방법을 제공한다.
일 양태에서, 본 발명은 조성물 또는 그를 코딩하는 핵산 분자의 전달을 포함하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내 발현되는, 본 명세서에서-논의된 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서-논의된 방법을 제공하며, 여기서 생체내 발현은 렌티바이러스, 아데노바이러스 또는 AAV를 통한 것이다.
일 양태에서, 본 발명은 본 명세서에-논의된 세포의 포유류 세포주를 제공하며, 여기서 세포주는 선택적으로 인간 세포주 또는 마우스 세포주이다. 일 양태에서, 본 발명은 유전자 도입 포유류 모델, 선택적으로 마우스를 제공하며, 여기서 모델은 본 명세서에서-논의된 조성물로 형질전환되었거나 상기 형질전환체의 자손이다.
일 양태에서, 본 발명은 가이드 RNA 또는 RNA 표적화 CRISPR-Cas 복합체 또는 본 명세서에서-논의된 조성물을 인코딩하는 핵산 분자(들)를 제공한다. 일 양태에서, 본 발명은: 세포의 관심 게놈 유전자좌 내 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 인코딩하는 핵산 분자를 포함하는 벡터를 제공하며, 여기서 gRNA의 직접 반복은 2 개 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 각각의 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되거나; 여기서 gRNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형된다. 일 양태에서, 본 발명은: 본 명세서에서-논의된 gRNA 및 RNA 표적화 효소를 포함하는 비-천연적으로 발생하거나 설계 제작된 CRISPR-Cas 복합체 조성물을 인코딩하는 핵산 분자(들)을 포함하는 벡터(들)를 제공하며, 여기서 선택적으로 RNA 표적화 효소는 적어도 하나의 돌연변이를 포함하여, RNA 표적화 효소가 적어도 하나의 돌연변이를 갖지 않는 RNA 표적화 효소의 5% 이하의 뉴클레아제 활성을 갖게 되고, 선택적으로 적어도 하나 이상의 핵 국소화 서열을 포함하는 하나 이상을 포함한다. 일 양태에서, 벡터는 가이드 RNA(gRNA)를 인코딩하는 핵산 분자 및/또는 RNA 표적화 효소를 인코딩하는 핵산 분자 및/또는 선택적인 핵 국소화 서열(들)에 작동 가능하게 연결된 진핵 세포에서 작동 가능한 조절 요소(들)를 추가로 포함할 수 있다.
일 양태에서, 본 발명은 상기 본 명세서에서 기재된 하나 이상의 성분을 포함하는 키트를 제공한다. 일부 구현예에서, 키트는 상기 기재된 벡터 시스템 및 키트를 사용하기 위한 지침서를 포함한다.
일 양태에서, 본 발명은 기능 획득(GOF) 또는 기능 손실(LOF)에 대한 스크리닝 방법 또는 비-코딩 RNA 또는 잠재적 조절 영역(예를 들어, 인핸서, 억제제)을 스크리닝하는 방법을 제공하며, RNA 표적화 효소를 함유하거나 발현하는 본 명세서에서-논의된 세포주 또는 본 명세서에서-논의된 모델의 세포, 및 세포주 또는 모델의 세포 내로 본 명세서에서-논의된 조성물을 도입하여 gRNA가 활성화제 또는 억제제를 포함하게 되는 것, 및 도입된 gRNA가 활성화제를 포함하는 세포에 대하여 또는 도입된 gRNA가 억제제를 포함하는 세포에 대하여 각각 GOF 또는 LOF를 모니터링하는 것을 포함한다.
일 양태에서, 본 발명은 비-천연적으로 발생하거나 설계 제작되는 조성물의 라이브러리를 제공하며, 각각, 세포의 관심 표적 RNA 서열에 혼성화할 수 있는 가이드 서열을 포함하는 RNA 표적화 CRISPR 가이드 RNA(gRNA), RNA 표적화 효소를 포함하며, 여기서 RNA 표적화 효소는 적어도 하나의 돌연변이를 포함하여, RNA 표적화 효소가 적어도 하나의 돌연변이를 갖지 않는 RNA 표적화 효소의 5% 이하의 뉴클레아제 활성을 갖게 되며, 여기서 gRNA는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되며, 여기서 조성물은 하나 이상의 또는 2 개 이상의 어댑터 단백질을 포함하며, 여기서 각각의 단백질은 하나 이상의 기능성 도메인과 회합되며, 여기서 gRNA는 복수의 RNA 표적화 가이드 RNA(gRNA)를 포함하는 전체 게놈에 걸친 라이브러리를 포함한다. 일 양태에서, 본 발명은 본 명세서에서-논의된 라이브러리를 제공하며, 여기서 RNA 표적화 RNA 표적화 효소는 적어도 하나의 돌연변이를 갖지 않는 RNA 표적화 효소와 비교하여 적어도 97% 또는 100%의 감소된 뉴클레아제 활성을 갖는다. 일 양태에서, 본 발명은 본 명세서에서-논의된 라이브러리를 제공하며, 여기서 어댑터 단백질은 기능성 도메인을 포함하는 융합 단백질이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 라이브러리를 제공하며, 여기서 gRNA는 하나 또는 2 개 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되지 않는다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 하나 또는 2 개 이상의 기능성 도메인은 RNA 표적화 효소와 회합된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 세포의 세포 집단은 진핵 세포의 집단이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 진핵 세포는 포유류 세포, 식물 세포 또는 효모 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 포유류 세포는 인간 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 세포 집단은 배아 줄기(ES) 세포의 집단이다.
일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 약 100 개 이상의 RNA 서열에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 약 1000 개 이상의 RNA 서열에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 약 20,000 개 이상의 서열에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 전체 트랜스크립톰에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 관련된 또는 원하는 경로 상에서 초점을 맞춘 표적 서열의 패널에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 경로는 면역 경로이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 경로는 세포 분열 경로이다.
일 양태에서, 본 발명은 변형된 발현을 갖는 유전자를 포함하는 모델 진핵 세포를 생성하는 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 발병할 위험이 증가하는 것과 관련된 임의의 유전자이다. 일부 구현예에서, 방법은 (a) 상기 본 명세서에서 기재된 시스템의 성분을 인코딩하는 하나 이상의 벡터를 진핵 세포 내로 도입시키는 것, 및 (b) CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하여 유전자 발현을 변형시킬 수 있도록 하고, 그에 의해 변형된 유전자 발현을 포함하는 모델 진핵 세포를 생성하는 것을 포함한다.
본 명세서에서 제공된 구조 정보는 표적 RNA 및 RNA 표적화 효소와의 가이드 RNA의 상호 작용의 조사가 가능하게 하여 전체 RNA 표적화 CRISPR-Cas 시스템의 기능성을 최적화하기 위하여 가이드 RNA 구조의 설계 제작 또는 변경을 가능하게 한다. 예를 들어, 가이드 RNA는 RNA에 결합할 수 있는 어댑터 단백질의 삽입에 의해 RNA 표적화 단백질과 충돌하지 않고 연장될 수 있다. 이들 어댑터 단백질은 하나 이상의 기능성 도메인을 포함하는 이펙터 단백질 또는 융합체를 추가로 모집할 수 있다.
본 발명의 일 양태는 상기 요소가 단일 조성물 내에 포함되거나 개별 조성물 내에 포함된다는 것이다. 이들 조성물은 게놈 수준에 기능적 효과를 이끌어 내기 위해 숙주에게 유리하게 적용될 수 있다.
당업자는 어댑터 + 기능성 도메인의 결합은 가능하게 하지만(예를 들어, CRISPR 복합체의 3 차원 구조 내의 입체적 방해로 인해) 어댑터 + 기능성 도메인의 적절한 위치 결정은 가능하지 않게 하는 가이드 RNA로의 변형은 의도되지 않은 변형임을 이해할 것이다. 하나 이상의 변형된 가이드 RNA는 직접 반복 내의 직접 반복의 5', 또는 가이드 서열의 3'에 개별 RNA 서열(들)을 도입함으로써 변형될 수 있다.
변형된 가이드 RNA, 비활성화된 RNA 표적화 효소(기능성 도메인을 갖거나 갖지 않음) 및 하나 이상의 기능성 도메인을 갖는 결합 단백질은 각각 개별적으로 조성물 내에 포함될 수 있고, 개별적으로 또는 일괄적으로 숙주에 투여될 수 있다. 대안적으로, 이들 성분은 숙주에 투여하기 위해 단일 조성물로 제공될 수 있다. 숙주에의 투여는 숙주로의 전달을 위한 당업자에게 알려지거나 본 명세서에 기재된 바이러스 벡터를 통하여 수행될 수 있다(예를 들어, 렌티바이러스 벡터, 아데노바이러스 벡터, AAV 벡터). 본 명세서에 설명된 바와 같이, 상이한 선택 마커(예를 들어, 렌티바이러스 gRNA 선택을 위해) 및 gRNA 농도(예를 들어, 다수의 gRNA가 사용되는지 여부에 의존함)의 사용은 개선된 효과를 유도하는 데 유리할 수 있다.
제공된 조성물을 사용하여, 당업자는 하나 이상의 게놈 이벤트를 유도하기 위해 동일하거나 상이한 기능성 도메인으로 단일 또는 다수 유전자좌를 유리하게 및 특이적으로 표적화할 수 있다. 조성물은 세포의 라이브러리에서의 스크리닝을 위하여 및 생체내 기능 모델링을 위하여 매우 다양한 방법에 적용될 수 있다(예를 들어, lincRNA의 유전자 활성화 및 기능 확인; 기능-획득 모델링; 기능-손실 모델링; 최적화 및 스크리닝 목적의 세포주 및 유전자 도입 동물을 확립하기 위한 본 발명의 조성물의 사용).
현재 발명은 조건적 또는 유도성 CRISPR RNA 표적화 이벤트를 확립하고 활용하기 위한 현재 발명의 조성물의 사용을 용도를 포함한다(예를 들어, 문헌[Platt et al., Cell (2014), http://dx.doi.org/10.1016/j.cell.2014.09.014], 또는 WO 2014/093622(PCT/US2013/074667)과 같은 본 명세서에 인용된 PCT 특허 공보를 참고하며, 이는 본 발명 또는 출원에 대해 선행으로 여겨지지 않음). 예를 들어, 표적 세포는 RNA 표적화 CRISRP 효소를 조건적 또는 유도성으로(예를 들어, Cre 의존적 작제물의 형태로) 및/또는 어댑터 단백질을 조건적 또는 유도성으로 포함하고, 표적 세포로 도입된 벡터의 발현 시 벡터는 표적 세포에서 s RNA 표적화 효소 발현 및/또는 어댑터 발현의 조건을 유도하거나 발생시키는 그것을 발현한다. 현재 발명의 교시 및 조성물을 CRISPR 복합체를 생성시키는 공지된 방법과 함께 적용함으로써, 기능성 도메인에 의해 영향을 받는 유도성 유전자 발현 또한 현재 발명의 양태이다. 대안적으로, 어댑터 단백질은 스크리닝 목적의 효과적인 모델을 제공하기 위하여 조건적 또는 유도성 s RNA 표적화 효소를 갖는 조건적 또는 유도성 요소로서 제공될 수 있으며, 이는 유리하게 매우 많은 적용을 위하여 최소 설계 및 특정 gRNA의 투여만을 필요로 한다.
데드 가이드 서열을 포함하는 본 발명에 따른 가이드 RNA
일 양태에서, 본 발명은 CRISPR 복합체의 형성 및 표적에의 성공적인 결합을 가능하게 하는 반면 동시에 성공적인 뉴클레아제 활성을 가능하지 않게 하는(즉, 뉴클레아제 활성이 없는/인델 활성이 없는) 방식으로 변형된 가이드 서열을 제공한다. 설명 상, 이러한 변형된 가이드 서열은 "데드 가이드" 또는 "데드 가이드 서열"로 지칭된다. 이들 데드 가이드 또는 가이드 서열은 촉매적으로 비활성이거나 뉴클레아제 활성과 관련하여 형태적으로 비활성인 것으로 생각될 수 있다. 실제로, 데드 가이드 서열은 촉매 활성을 촉진시키거나 표적내 및 표적외 결합 활성을 구별하는 능력과 관련하여 생산적인 염기쌍 형성에 충분히 관여하지 않을 수 있다. 간략하게, 분석은 CRISPR 표적 RNA 및 표적 RNA와의 미스매치를 포함하는 가이드 RNA를 합성하는 것, 이들을 RNA 표적화 효소와 조합하는 것 및 절단 산물에 의해 생성된 밴드의 존재에 기반하여 겔 기반 절단을 분석하는 것, 및 상대적 밴드 강도에 기반하여 절단을 정량하는 것을 포함한다.
따라서, 관련된 양태에서, 본 발명은 본 명세서에 기재된 기능성 RNA 표적화 및 가이드 RNA(gRNA)를 포함하는, 비-천연적으로 발생하거나 설계 제작된 RNA 표적화 CRISPR-Cas 시스템 조성물을 제공하고, 여기서 gRNA는 데드 가이드 서열을 포함하여 gRNA는 표적 서열에 혼성화할 수 있고 RNA 표적화 CRISPR-Cas 시스템은 시스템의 비-돌연변이체 RNA 표적화 효소의 검출 가능한 RNA 절단 활성 없이 세포에서 관심 게놈 유전자좌로 향하게 된다. 본 명세서의 다른 곳에 기재된 본 발명에 따른 gRNA 중 임의의 것은 본 명세서의 아래에 기재된 데드 가이드 서열을 포함하는 데드 gRNA/gRNA로서 사용될 수 있음이 이해되어야 한다. 본 명세서의 다른 곳에 기재된 방법, 생산물, 조성물 및 용도 중 임의의 것은 하기에 추가로 상세히 설명되는 데드 가이드 서열을 포함하는 데드 gRNA/gRNA를 이용하여 동등하게 적용 가능하다. 추가의 안내에 의해, 다음의 구체적인 양태 및 구현예가 제공된다.
CRISPR 복합체의 RNA 표적 서열에의 서열-특이적 결합을 지시하는 데드 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험될 데드 가이드 서열을 포함하는, CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은, 예를 들어 CRISPR 서열의 성분을 인코딩하는 벡터로 형질감염시키고 그 후 표적 서열 내의 선택적인 절단의 평가함으로써 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있다. 예를 들어, 표적 서열, 시험될 데드 가이드 서열 및 시험 데드 가이드 서열과 상이한 대조군 가이드 서열을 포함하는, CRISPR 복합체의 성분을 제공하고, 시험 및 대조군 가이드 서열 반응 사이의 표적 서열에서의 결합 및 절단 비율을 비교함으로써, 표적 RNA 폴리뉴클레오티드 서열의 절단이 시험관에서 평가될 수 있다. 다른 분석이 가능하며 당업자에게 떠오를 것이다. 데드 가이드 서열은 임의의 표적 서열을 표적화하기 위해 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다.
본 명세서에서 추가로 설명되는 바와 같이, 몇몇 구조 파라미터는 적절한 프레임워크가 이러한 데드 가이드에 도달 가능하도록 한다. 데드 가이드 서열은 전형적으로 활성 RNA 절단을 초래하는 각각의 가이드 서열보다 짧다. 구체적인 구현예에서, 데드 가이드는 동일한 것으로 향하는 각각의 가이드보다 5%, 10%, 20%, 30%, 40%, 50% 더 짧다.
아래에서 설명되고 당업계에 알려진 바와 같이, gRNA의 일 측면-특이성을 표적화하는 RNA는 직접 반복 서열이며, 이는 이러한 가이드에 적절히 연결되어야 한다. 구체적으로, 이것은 직접 반복 서열이 RNA 표적화 효소의 기원에 의존하여 설계됨을 암시한다. 따라서, 인증된 데드 가이드 서열에 대해 사용 가능한 구조 데이터는 C2c2 특이적 동등물을 설계하는 데 사용될 수 있다. 예를 들어, 2 개 이상의 C2c2 이펙터 단백질의 오솔로그 뉴클레아제 도메인 HEPN 사이의 구조적 유사성이 설계 동등한 데드 가이드를 전달하는 데 사용될 수 있다. 따라서, 본 명세서의 데드 가이드는 길이 및 서열에서 적절하게 변형되어 이러한 C2c2 특이적 동등물을 나타내고, CRISPR 복합체의 형성 및 표적 RNA에의 성공적 결합을 가능하게 하는 반면 동시에 성공적인 뉴클레아제 활성은 가능하지 않게 할 수 있다.
본 명세서뿐만 아니라 당업계 기술 맥락에서 데드 가이드의 사용은 시험관내, 생체외 및 생체내 적용 둘 모두에서 네트워크 생물학 및/또는 시스템 생물학을 위한 놀랍고 예상하지 못한 플랫폼을 제공하며, 다중화된 유전자 표적화, 및 구체적으로 양방향성 다중화된 유전자 표적화가 가능하게 한다. 데드 가이드 사용 전에는, 다수의 표적을 다루는 것이 어려웠고 일부 사례에서는 불가능하였다. 데드 가이드 사용으로, 다수의 표적, 및 이에 따른 다수의 활성이 예를 들어, 동일한 세포에서, 동일한 동물에서, 또는 동일한 환자에서 다뤄질 수 있다. 이러한 다중화는 동시에 발생하거나 원하는 시간에 대해 시차를 둘 수 있다.
예를 들어, 데드 가이드는 뉴클레아제 활성의 결과없이 유전자 표적화를 위한 수단으로서 gRNA를 사용하는 것이 가능하게 하는 동시에 활성화 또는 억제를 위한 지시된 수단을 제공한다. 데드 가이드를 포함하는 가이드 RNA는 유전자 활성의 활성화 또는 억제가 가능하게 하는 방식으로 요소, 구체적으로, 유전자 이펙터(예를 들어, 유전자 활성의 활성화제 또는 억제제)의 기능적인 배치를 가능하게 하는 본 명세서의 다른 곳에 기재된 단백질 어댑터(예를 들어, 압타머)를 더 포함하도록 변형될 수 있다. 일 예는 본 명세서 및 당업계의 기술에서 설명된 바와 같은, 압타머의 포함이다. 단백질-상호작용하는 압타머를 포함하도록 데드 가이드를 포함하는 gRNA를 설계 제작함으로써(문헌[Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136], 참조로서 본 명세서에 포함됨), 다수의 별개의 이펙터 도메인을 조립할 수 있다. 이러한 것은 자연적 과정을 따라 모델화될 수 있다.
따라서, 일 양태는 데드 가이드를 포함하는 본 발명의 gRNA이며, 여기서 gRNA는 본 명세서에 기재된 유전자 활성화 또는 억제를 제공하는 변형을 추가로 포함한다. 데드 gRNA는 하나 이상의 압타머를 포함할 수 있다. 압타머는 유전자 이펙터, 유전자 활성화제 또는 유전자 억제제에 특이적일 수 있다. 대안적으로, 압타머는 차례로 특정 유전자 이펙터, 유전자 활성화제 또는 유전자 억제제에 특이적이고 이를 모집/결합하는 단백질에 특이적일 수 있다. 활성화제 또는 억제제 모집을 위한 다수의 부위가 있는 경우, 부위가 활성화제 또는 억제제에 특이적인 것이 선호된다. 활성화제 또는 억제제 결합을 위한 다수의 부위가 있는 경우, 부위는 동일한 활성화제 또는 동일한 억제제에 특이적일 수 있다. 부위는 또한 상이한 활성화제 또는 상이한 억제제에 특이적일 수 있다. 이펙터, 활성화제, 억제제는 융합 단백질의 형태로 존재할 수 있다.
일 양태에서, 본 발명은 기능화된 CRISPR 시스템을 생물 내의 유전자 좌위로 향하도록 하기 위한 데드 가이드 RNA 표적화 서열을 선택하는 방법을 제공하며, 이는 a) 유전자 좌위에 하나 이상의 CRISPR 모티프를 위치시키는 것; b) 각각의 CRISPR 모티프의 다운스트림에 있는 20 nt서열을 i) 서열의 GC 함량을 결정함으로써; 및 ii) 생물의 게놈에서 서열의 처음 15 nt의 표적외 매치가 있는 여부를 결정함으로써 분석하는 것; c) 서열의 GC 함량이 70% 이하이고 표적외 매치가 확인되지 않으면 가이드 RNA에서의 사용을 위해 서열을 선택하는 것을 포함한다. 일 구현예에서, GC 함량이 50% 이하이면 서열이 선택된다. 일 구현예에서, GC 함량이 40% 이하이면 서열이 선택된다. 일 구현예에서, GC 함량이 30% 이하이면 서열이 선택된다. 일 구현예에서, 2 개 이상의 서열이 분석되고 가장 낮은 GC 함량을 갖는 서열이 선택된다. 일 구현예에서, 표적외 매치는 생물의 조절 서열에서 결정된다. 일 구현예에서, 유전자 좌위는 조절 영역이다. 일 양태는 전술된 방법에 따라 선택된 표적화 서열을 포함하는 데드 가이드 RNA를 제공한다.
일 양태에서, 본 발명은 기능화된 CRISPR 시스템을 생물 내의 유전자 좌위로 표적화하는 데드 가이드 RNA를 제공한다. 본 발명의 일 구현예에서, 데드 가이드 RNA는 표적화 서열을 포함하고 여기서 표적 서열의 CG 함량이 70% 이하이고, 표적화 서열의 처음 15 nt가 생물 내 또 다른 유전자 좌위의 조절 서열 내 CRISPR모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다. 특정 구현예에서, 표적화 서열의 GC 함량은 60% 이하, 55% 이하, 50% 이하, 45% 이하, 40% 이하, 35% 이하 또는 30% 이하. 특정 구현예에서, 표적화 서열의 GC 함량은 70% 내지 60% 또는 60% 내지 50% 또는 50% 내지 40% 또는 40% 내지 30%이다. 일 구현예에서, 표적화 서열은 유전자좌의 잠재적 표적화 서열 중에서 가장 낮은 CG 함량을 갖는다.
본 발명의 일 구현예에서, 데드 가이드의 처음 15 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 14 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 13 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 12 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 11 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 10 nt는 표적 서열과 매치된다. 본 발명의 일 구현예에서, 데드 가이드의 처음 15 nt는 또 다른 유전자 좌위의 조절 영역 내 CRISPR모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다. 다른 구현예에서, 데드 가이드의 처음 14 nt, 또는 데드 가이드의 처음 13 nt, 또는 가이드의 처음 12 nt, 또는 데드 가이드의 처음 11 nt, 또는 데드 가이드의 처음 10 nt는 또 다른 유전자 좌위의 조절 영역 내 CRISPR모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다. 다른 구현예에서, 데드 가이드의 처음 15 nt, 또는 14 nt, 또는 13 nt, 또는 12 nt, 또는 11 nt는 게놈의 CRISPR 모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다.
특정 구현예에서, 데드 가이드 RNA는 표적 서열과 매치되지 않는 3' 말단에 부가적인 뉴클레오티드를 포함한다. 따라서, CRISPR 모티프의 다운스트림에 있는 처음 20 내지 28 nt를 포함하는 데드 가이드 RNA는 3' 말단에서 길이가 연장될 수 있다.
일반적인 준비
일 양태에서, 본 발명은 핵산 결합 시스템을 제공한다. 상보적인 프로브와 RNA의 인 시츄 혼성화는 강력한 기법이다. 전형적으로 형광 DNA 올리고뉴클레오티드가 혼성화에 의해 핵산을 검출하는 데 사용된다. 고정된 핵산(LNA)과 같은 특정 변형에 의해 증가된 효율이 달성되었지만, 효율적이고 융통성 있는 대안에 대한 요구가 여전히 남아있다. 본 발명은 인 시츄 혼성화를 위한 효율적이고 조정 가능한 시스템을 제공한다.
본 발명의 일 구현예에서, 용어 가이드 서열 및 가이드 RNA는 상기 인용된 문헌, 예를 들어 WO 2014/093622(PCT/US2013/074667)에서 상호교환 가능하게 사용된다. 일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 지시하기에, 표적 폴리뉴클레오티드 서열과의 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 이의 해당하는 표적 서열 간의 상보성의 정도는 적합한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적의 정렬은 서열을 정렬하기에 적합한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies; www.novocraft.com에서 이용 가능함), ELAND(Illumina, San Diego, CA), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 일부 구현예에서, 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상이거나 이를 초과한다. 일부 구현예에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드 미만이다. 바람직하게 가이드 서열은 길이가 10 개 내지 30 개 뉴클레오티드이다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 지시하는 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은, CRISPR 서열의 성분을 인코딩하는 벡터를 이용한 형질감염에 의해서와 같이 해당하는 표적 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 서열 내의 우선적인 절단의 평가로 이어질 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 즉 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다. 가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내 서열이다. 예시적인 표적 서열은 표적 게놈에서 특유한 것을 포함한다.
일반적으로, 그리고 본 명세서에 걸쳐서, 용어 "벡터"는 그것이 연결되어 있는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는, 이에 한정되지 않지만, 단일-가닥, 이중-가닥, 또는 부분적 이중-가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단이 없는 핵산 분자(예를 들어, 원형); DNA, RNA 또는 이들 둘 다를 포함하는 핵산 분자; 및 당업계에서 알려진 다른 다양한 폴리뉴클레오티드를 포함한다. 벡터의 일 유형으로 "플라스미드"가 있으며, 이는 원형 이중 가닥 DNA 루프를 지칭하며, 그 안으로 예를 들어 표준 분자 클로닝 기법에 의해서 추가적인 DNA 절편이 삽입될 수 있다. 벡터의 또 다른 유형으로 바이러스 벡터가 있으며, 바이러스-유래된 DNA 또는 RNA 서열이 바이러스(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-관련 바이러스) 내로의 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로의 형질감염을 위한, 바이러스가 보유하는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다(예를 들어, 박테리아 복제 원점을 가진 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이에 의해 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이와 같은 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 진핵 세포에서의 발현을 위한 벡터 및 이를 초래하는 벡터는 본 명세서에서 "진핵 발현 벡터"로 지칭될 수 있다. 재조합 DNA 기법에서 유용성이 있는 통상적인 발현 벡터는 종종 플라스미드 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이는 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 하나 이상의 조절 요소는 발현에 사용될 숙주 세포에 기반하여 선택될 수 있고, 발현될 핵산 서열에 작동 가능하게 연결된다. 재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입된 경우에는 숙주 세포에서) 상기 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 요소(들)에 연결됨을 의미하는 것으로 의도된다.
용어 "조절 요소"는 프로모터, 인핸서, 내부 리보솜 엔트리 부위(internal ribosomal entry site; IRES), 및 다른 발현 제어 요소(예를 들어, 전사 종결 신호, 예를 들어 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 이와 같은 조절 요소는, 예를 들어 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 기재되어 있다. 조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 것들과 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다. 조직-특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특정 장기(예를 들어, 간, 췌장)와 같은 원하는 관심 조직, 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 지시할 수 있다. 조절 요소는 시간-의존적 방식으로, 예를 들어 세포-주기 의존적 또는 발생 단계 의존적 방식으로 발현을 지시할 수 있으며, 이것은 조직 특이적이거나 세포-유형 특이적일 수 있거나, 또한 그렇지 않을 수 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol I 프로모터), 또는 이들의 조합을 포함한다. pol III 프로모터의 예들은, 이에 한정되지 않지만, U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예들은, 이에 한정되지 않지만, 레트로바이러스 라우스 육종 바이러스(Rous sarcoma virus; RSV) LTR 프로모터(선택적으로 RSV 인핸서와 함께), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서와 함께)[예를 들어, 문헌[Boshart et al, Cell, 41:521-530(1985)] 참조], SV40 프로모터, 디하이드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제(phosphoglycerol kinase; PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 또한, 용어 "조절 요소"에는 인핸서 요소, 예를 들어 WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 절편(문헌[Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988]); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(문헌[Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981])이 포함된다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 발현 수준 등과 같은 요인에 따라 달라질 수 있다는 것이 당업자에 의해서 이해될 것이다. 벡터는 숙주 세포에 도입될 수 있고, 이에 의해 본 명세서에 기재된 바와 같이 핵산에 의해서 인코딩된, 융합 단백질 또는 펩티드를 포함하는, 전사물, 단백질 또는 펩티드(예를 들어, 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR) 전사물, 단백질, 효소, 이들의 돌연변이체 형태, 이들의 융합 단백질 등)가 생성될 수 있다.
유리한 벡터로는 렌티바이러스 및 아데노-관련 바이러스를 포함하며, 이와 같은 벡터의 유형은 또한 특정 유형의 세포들의 표적화를 위해 선택될 수 있다.
본 명세서에서 사용된 바와 같이, 제V형 또는 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질의 용어 "crRNA" 또는 "가이드 RNA" 또는 "단일 가이드 RNA" 또는 "sgRNA" 또는 "하나 이상의 핵산 성분"은 표적 핵산 서열과 혼성화하고, 표적 핵산 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하기에, 표적 핵산 서열과의 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다.
특정 구현예에서, 본 명세서에서 제공된 CRISPR 시스템은 crRNA 또는 가이드 서열을 포함하는 유사 폴리뉴클레오티드를 이용할 수 있으며, 여기서 폴리뉴클레오티드는 RNA, DNA 또는 RNA와 DNA의 혼합물이고/이거나 여기서 폴리뉴클레오티드는 하나 이상의 뉴클레오티드 유사체를 포함한다. 서열은 이에 한정되지 않지만 벌지(bulge), 헤어핀 또는 스템 루프 구조와 같은 천연 crRNA의 구조를 포함하는, 임의의 구조를 포함할 수 있다. 특정 구현예에서, 가이드 서열을 포함하는 폴리뉴클레오티드는 RNA 또는 DNA 서열일 수 있는 제2 폴리뉴클레오티드 서열과 듀플렉스를 형성한다.
특정 구현예에서, 본 발명의 가이드는 비-천연적으로 발생하는 핵산 및/또는 비-천연적으로 발생하는 뉴클레오티드 및/또는 뉴클레오티드 유사체, 및/또는 화학적 변형물을 포함한다. 비-천연적으로 발생하는 핵산은 예를 들어, 천연적으로 및 비-천연적으로 발생하는 뉴클레오티드의 혼합물을 포함할 수 있다. 비-천연적으로 발생하는 뉴클레오티드 및/또는 뉴클레오티드 유사체는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 본 발명의 일 구현예에서, 가이드 핵산은 리보뉴클레오티드 및 비-리보뉴클레오티드를 포함한다. 이러한 일 구현예에서, 가이드는 하나 이상의 리보뉴클레오티드 및 하나 이상의 데옥시리보뉴클레오티드를 포함한다. 본 발명의 일 구현예에서, 가이드는 포스포로티오에이트 결합, 보라노포스페이트 결합을 갖는 뉴클레오티드, 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 고정된 핵산(LNA) 뉴클레오티드, 또는 가교 핵산(BNA)과 같은 하나 이상의 비-천연적으로 발생하는 뉴클레오티드 또는 뉴클레오티드 유사체를 포함한다. 변형된 뉴클레오티드의 다른 예로는 2'-O-메틸 유사체, 2'-데옥시 유사체, 2-티오우리딘 유사체, N6-메틸아데노신 유사체, 또는 2'-플루오로 유사체가 포함된다. 변형된 염기의 추가의 예로는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘(Ψ), N1-메틸슈도우리딘(me1Ψ), 5-메톡시우리딘(5moU), 이노신, 7-메틸구아노신이 포함되나 이에 한정되지 않는다.
특정 구현예에서, 화학적으로 변형된 가이드 RNA가 사용된다. 가이드 RNA 화학적 변형의 예로는 제한 없이, 하나 이상의 말단 뉴클레오티드에의 2'-O-메틸(M), 2'-O-메틸 3'포스포로티오에이트(MS), S-구속된 에틸(cEt), 또는 2'-O-메틸 3'티오PACE(MSP)의 포함이 포함된다. 이러한 화학적으로 변형된 가이드 RNA는 변형되지 않은 가이드 RNA와 비교하여 증가된 안정성 및 증가된 활성을 포함할 수 있으나, 그럼에도 표적내 대 표적외 특이성은 예측 가능하지 않다(문헌[Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, 2015년 6월 29일 온라인 간행]; 문헌[Allerson et al., J. Med. Chem. 2005, 48:901-904; Bramsen et al., Front. Genet., 2012, 3:154; Deng et al., PNAS, 2015, 112:11870-11875]; 문헌[Sharma et al., MedChemComm., 2014, 5:1454-1471]; 문헌[Li et al., Nature Biomedical Engineering, 2017, 1, 0066 DOI:10.1038/s41551-017-0066] 참고). 화학적으로 변형된 가이드 RNA는 제한없이, 포스포로티오에이트 결합을 갖는 RNA 및 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 고정된 핵산(LNA) 뉴클레오티드를 추가로 포함한다.
일부 구현예에서, 상보성의 정도는 적합한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies; www.novocraft.com에서 이용 가능함), ELAND(Illumina, 미국 캘리포니아주 샌디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 표적 핵산 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하는(핵산-표적화 가이드 RNA 내) 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 CRISPR 시스템의 성분은, 핵산-표적화 복합체의 성분을 인코딩하는 벡터를 이용한 형질감염에 의해서와 같이 해당하는 표적 핵산 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 핵산 서열 내의 우선적인 표적화(예를 들어, 절단)의 평가로 이어질 수 있다. 유사하게, 표적 핵산 서열의 절단은 표적 핵산 서열, 즉 시험 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 핵산-표적화 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다. 가이드 서열, 따라서 핵산-표적화 가이드 RNA는 임의의 표적 핵산 서열을 표적화하도록 선택될 수 있다. 표적 서열은 DNA일 수 있다. 표적 서열은 임의의 RNA 서열일 수 있다. 일부 구현예에서, 표적 서열은 메신저 RNA(mRNA), pre-mRNA, 리보솜 RNA(rRNA), 운반 RNA(tRNA), 마이크로-RNA(miRNA), 작은 간섭 RNA(siRNA), 소형 핵 RNA(snRNA), 소형 핵소체 RNA(snoRNA), 이중 가닥화 RNA(dsRNA), 비-코딩 RNA(ncRNA), 긴 비-코딩 RNA(lncRNA), 및 소형 세포질 RNA(scRNA)로 구성된 군으로부터 선택되는 RNA 분자 내의 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 mRNA, pre-mRNA, 및 rRNA로 구성된 군으로부터 선택되는 RNA 분자 내의 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 ncRNA, 및 lncRNA로 구성된 군으로부터 선택되는 RNA 분자 내의 서열일 수 있다. 일부 더 바람직한 구현예에서, 표적 서열은 mRNA 분자 또는 pre-mRNA 분자 내의 서열일 수 있다.
일부 구현예에서, 핵산-표적화 가이드 RNA는 RNA-표적화 가이드 RNA 내의 2차 구조 정도를 감소시키도록 선택된다. 일부 구현예에서, 핵산-표적화 가이드 RNA의 뉴클레오티드의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% 이하 또는 이의 미만이 최적으로 폴딩된 경우 자기-상보성 염기 쌍형성에 참여한다. 최적 폴딩은 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스(Gibbs) 자유 에너지 계산을 기반으로 한다. 이와 같은 한 알고리즘의 예는 mFold이며, 이는 문헌[Zuker and Stiegler, Nucleic Acids Res. 9(1981), 133-148]에 기재된 바와 같다. 또 다른 예의 폴딩 알고리즘은, 비엔나 대학의 이론 화학 연구소(Institute for Theoretical Chemistry)에서 개발된, 중심 구조 예측 알고리즘을 사용하는, 온라인 웹서버 RNAfold이다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조).
특정 구현예에서, 가이드 RNA 또는 crRNA는 직접 반복(DR) 서열 및 가이드 서열 또는 스페이서 서열을 포함할 수 있거나, 이로 본질적으로 구성될 수 있거나 이로 구성될 수 있다. 특정 구현예에서, 가이드 RNA 또는 crRNA는 가이드 서열 또는 스페이서 서열에 융합되거나 연결된 직접 반복 서열을 포함할 수 있거나, 이로 본질적으로 구성될 수 있거나 이로 구성될 수 있다. 특정 구현예에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열로부터 업스트림(즉, 5')에 위치할 수 있다. 다른 구현예에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열로부터 다운스트림(즉, 3')에 위치할 수 있다.
특정 구현예에서, crRNA는 스템 루프, 바람직하게는 단일 스템 루프를 포함한다. 특정 구현예에서, 직접 반복 서열은 스템 루프, 바람직하게는 단일 스템 루프를 형성한다.
특정 구현예에서, 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 특정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 15 개 뉴클레오티드, 바람직하게는 적어도 18 nt, 예를 들어 적어도 19, 20, 21, 22 이상 nt이다. 특정 구현예에서, 스페이서 길이는 15 내지 17 nt, 예를 들어 15, 16 또는 17 nt, 17 내지 20 nt, 예를 들어 17, 18, 19 또는 20 nt, 20 내지 24 nt, 예를 들어 20, 21, 22, 23, 또는 24 nt, 23 내지 25 nt, 예를 들어 23, 24 또는 25 nt, 24 내지 27 nt, 예를 들어 24, 25, 26 또는 27 nt, 27 내지 30 nt, 예를 들어 27, 28, 29, 또는 30 nt, 30 내지 35 nt, 예를 들어 30, 31, 32, 33, 34, 또는 35 nt, 또는 35 nt 이상이다.
출원인은 또한 RNA 표적화 및 절단 능력을 검증하기 위한 도전 실험을 실행한다. 이 실험은 StCas9의 이종성 발현을 위한 에스케리키아 콜라이에서의 유사한 연구와 거의 유사하다(문헌[Sapranauskas, R. et al. Nucleic acids Res 39, 9275-9282(2011)]). 출원인은 이종성 에스케리키아 콜라이 내로 PAM 및 내성 유전자 둘 다를 함유하는 플라스미드를 도입한 다음, 해당하는 항생제 상에 플레이팅한다. 플라스미드 전사된 내성 유전자의 RNA 절단이 있는 경우, 출원인은 생존 콜로니를 관찰하지 않는다.
보다 상세하게, DNA 표적에 대하여 분석은 다음과 같으나, RNA 표적에 대하여 그에 따라 조정될 수 있다. 2 가지 에스케리키아 콜라이 균주가 이 분석에서 사용된다. 하나는 박테리아 균주 유래의 내인성 이펙터 단백질 유전자좌를 인코딩하는 플라스미드를 보유한다. 나머지 균주는 빈 플라스미드(예를 들어, pACYC184, 대조 균주)를 보유한다. 가능한 모든 7 bp 또는 8 bp PAM 서열을 항생제 내성 플라스미드(암피실린 내성 유전자를 갖는 pUC19) 상에 제시한다. PAM은 프로토-스페이서 1의 서열(내인성 이펙터 단백질 유전자좌에서 제1 스페이서에 대한 DNA 표적) 옆에 위치한다. 2 개의 PAM 라이브러리를 클로닝하였다. 하나는 프로토-스페이서의 8 랜덤 bp 5'를 갖는다(예를 들어, 총 65536 개의 상이한 PAM 서열 = 복잡성). 나머지 라이브러리는 프로토-스페이서의 7 랜덤 bp 3'를 갖는다(예를 들어, 총 복잡성은 16384 개의 상이한 PAM임). 둘 모두의 라이브러리가 가능한 PAM 당 평균 500 개의 플라스미드를 갖도록 클로닝되었다. 시험 균주 및 대조 균주를 별도의 형질전환에서 5'PAM 및 3'PAM 라이브러리로 형질전환하고, 형질전환된 세포를 암피실린 플레이트 상에 별도로 플레이팅하였다. 플라스미드를 이용한 인식 및 후속 절단/간섭은 세포를 암피실린에 취약하게 만들고 성장을 방지한다. 대략 형질전환 12 시간 후, 시험 및 대조 균주에 의해 형성된 모든 콜로니를 수확하고 플라스미드 DNA를 분리하였다. 플라스미드 DNA를 PCR 증폭 및 후속 딥 시퀀싱을 위한 주형으로서 사용하였다. 비형질전환 라이브러리에서 모든 PAM의 표시는 형질전환된 세포에서의 예상된 PAM의 표시를 나타내었다. 대조 균주에서 발견된 모든 PAM의 표시는 실제 표시를 나타내었다. 시험 균주에서 모든 PAM의 표시는 어떤 PAM이 효소에 의해 인식되지 않는지를 나타내었고 대조 균주와의 비교는 손실된 PAM의 서열을 추출할 수 있게 한다.
독성 및 표적외 효과의 최소화를 위해, 전달되는 핵산-표적화 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. 핵산-표적화 가이드 RNA의 최적 농도는 세포 또는 비-인간 진핵 생물 동물 모델에서 상이한 농도를 시험함으로써, 그리고 잠재적인 표적외 게놈 유전자좌에서의 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정될 수 있다. 표적외 변형 수준을 최소화하면서 표적상 변형의 가장 높은 수준을 제공하는 농도는 생체내 전달을 위해 선택되어야 한다. 핵산-표적화 시스템은 유리하게 제VI형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 내인성 RNA-표적화 시스템을 포함하는 특정 생물로부터 유래한다. 구체적인 구현예에서, 제VI형 RNA-표적화 Cas 효소는 C2c2이다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(또한 Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체, 또는 이의 변형된 형태를 포함한다. 일 구현예에서, 본 명세서에서 지칭된 C2c2와 같은 제VI형 단백질은 또한 C2c2와 같은 제VI형 단백질의 상동체 또는 오솔로그를 포함한다. 용어 "오솔로그(orthologue)"(또한 본 명세서에서 "오솔로그(ortholog)"로 지칭됨) 및 "상동체(homologue)"(또한 본 명세서에서 "상동체(homolog)"로 지칭됨)는 당업계에 잘 공지되어 있다. 추가 지침에 의해, 본 명세서에서 사용된 단백질의 "상동체"는 이의 상동체인 단백질과 동일 또는 유사한 기능을 실행하는 동일 종의 단백질이다. 상동성 단백질은 구조적으로 관련될 수 있지만 관련될 필요는 없거나, 부분적으로만 구조적으로 관련된다. 구체적인 구현예에서, 본 명세서에서 지칭된 C2c2와 같은 제VI형 단백질의 상동체 또는 오솔로그는 C2c2와 같은 제VI형 단백질과 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 예를 들어 적어도 95%와 같은 서열 상동성 또는 동일성을 갖는다. 추가의 구현예에서, 본 명세서에서 지칭된 C2c2와 같은 제VI형 단백질의 상동체 또는 오솔로그는 C2c2와 같은 야생형 제VI형 단백질과 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 예를 들어 적어도 95%와 같은 서열 상동성 또는 동일성을 갖는다.
일 구현예에서, 제VI형 RNA-표적화 Cas 단백질은 렙토트리키아, 리스테리아, 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팍토(Filifactor), 유박테리움, 스트렙토코커스, 락토바실러스(Lactobacillus), 미코플라스마(Mycoplasma), 박테로이데스, 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코커스(Staphylococcus), 니트라티프락토(Nitratifractor), 미코플라스마 캄필로박터를 포함하지만 이에 한정되지 않는 속의 생물의 C2c2 오솔로그일 수 있다. 이러한 속의 생물의 종은 본 명세서에서 다르게 논의될 수 있다.
CRISPR-Cas 시스템 효소의 오솔로그를 확인하는 일부 방법은 관심 게놈에서 tracr 서열을 확인하는 것을 수반할 수 있다. tracr 서열의 확인은 다음 단계와 관련될 수 있다: 데이터베이스에서 직접 반복 또는 tracr 메이트 서열을 검색하여 CRISPR 효소를 포함하는 CRISPR 영역을 확인하는 단계. 센스 및 안티센스 방향 둘 다에서 CRISPR 효소의 측면에 배치하는 CRISPR 영역에서 상동성 서열을 검색하는 단계. 전사 종결자 및 2차 구조를 조사하는 단계. 직접 반복 또는 tracr 메이트 서열은 아니지만, 잠재적인 tracr 서열로서 직접 반복 또는 tracr 메이트 서열에 대해 50% 초과의 동일성을 갖는 임의의 서열을 확인하는 단계. 잠재적인 tracr 서열을 취하고, 이와 연관된 전사 종결자 서열에 대해 분석하는 단계.
본 명세서에서 기재된 임의의 기능성은 다수의 오솔로그 유래의 단편을 포함하는 키메라 효소를 포함하는, 다른 오솔로그 유래의 CRISPR 효소로 조작될 수 있음이 이해될 것이다. 이와 같은 오솔로그의 예는 본 명세서의 다른 곳에 기재되어 있다. 따라서, 키메라 효소는 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팍토르, 유박테리움, 스트렙토코커스, 락토바실러스, 미코플라스마, 박테로이데스, 플라비볼라, 플라보박테리움, 스파에로카에타, 아조스피릴룸, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바쿨룸, 스타필로코커스, 니트라티프락토르, 미코플라스마 및 캄필로박터를 포함하지만, 이에 한정되지 않은 생물의 CRISPR 효소 오솔로그의 단편을 포함할 수 있다. 키메라 효소는 본 명세서에서 언급된 속 또는 본 명세서에서 언급된 종의 생물의 CRISPR 효소 오솔로그일 수 있으며; 유리하게 단편은 상이한 종의 CRISPR 효소 오솔로그 유래의 것이다.
구현예에서, 제VI형 RNA-표적화 이펙터 단백질, 특히 본 명세서에서 언급된 바와 같은 C2c2 단백질은 또한 C2c2의 기능적 변이체 또는 이의 상동체 또는 오솔로그를 포함한다. 본 명세서에서 사용된 바와 같은 단백질의 "기능적 변이체"는 그 단백질의 활성을 적어도 부분적으로 보유하는 단백질의 변이체를 지칭한다. 기능적 변이체는 돌연변이체(이는 삽입, 결실, 또는 치환 돌연변이체일 수 있음)를 포함할 수 있으며, 이는 다형체 등을 포함한다. 또한, 기능적 변이체 내에는 또 다른, 보통 관련되지 않은, 핵산, 단백질, 폴리펩티드 또는 펩티드와 이와 같은 단백질의 융합 생성물이 포함된다. 기능적 변이체는 천연적으로 발생할 수 있거나 인공적일 수 있다. 유리한 구현예는 설계 제작된 또는 비-천연 발생 제VI형 RNA-표적화 이펙터 단백질을 수반할 수 있다.
본 발명의 일 구현예에서, 렙토트리키아 샤히C2c2, 라크노스피라세아에 박테리움 MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리디움 아미노필룸(DSM 10710) C2c2, 카르노박테리움 갈리나룸(DSM 4847) C2c2, 팔루디박터 프로피오니시게네스(WB4) C2c2, 리스테리아 웨이헨스테파넨시스(FSL R9-0317) C2c2, 리스테리아세아에 박테리움(FSL M6-0635) C2c2, 리스테리아 뉴요켄시스(FSL M6-0635) C2c2, 렙토트리키아 와데이(F0279) C2c2, 로도박터 캅술라투스(SB 1003) C2c2, 로도박터 캅술라투스(R121) C2c2, 로도박터 캅술라투스(DE442) C2c2, 렙토트리키아 와데이(Lw2) C2c2, 리스테리아 세엘리게리 C2c2 중 임의의 것의 야생형 서열에 대해 적어도 80% 서열 상동성을 갖는 아미노산 서열을 포함하는 이펙터 단백질이 제공된다.
본 발명의 일 구현예에서, 이펙터 단백질은 본 명세서에 기재된 컨센서스 서열을 포함하지만 이에 한정되지 않는 제VI형 이펙터 단백질 컨센서스 서열에 대해 적어도 80%의 서열 상동성을 갖는 아미노산 서열을 포함한다.
본 발명의 일 구현예에서, 이펙터 단백질은 본 명세서에 기재된 HEPN 도메인, 당업계에 공지된 HEPN 도메인 및 컨센서스 서열 및 모티프와 비교하여 HEPN 도메인으로 인식되는 도메인을 포함하지만 이에 한정되지 않는 적어도 하나의 HEPN 도메인을 포함한다. 몇몇의 이러한 도메인이 본 명세서에 제공된다. 하나의 비-제한적인 예에서, 컨센서스 서열은 본 명세서에서 제공된 C2c2 오솔로그의 서열로부터 유래될 수 있다.
본 발명의 일 구현예에서, 이펙터 단백질은 RxxxxH 모티프 서열을 포함하는 하나 이상의 HEPN 도메인을 포함한다. RxxxxH 모티프 서열은, 제한없이, 본 명세서에 기재된 HEPN 도메인 또는 당업계에 공지된 HEPN 도메인 유래일 수 있다. RxxxxH 모티프 서열은 2 개 이상의 HEPN 도메인의 부분을 조합함으로써 생성된 모티프 서열을 추가로 포함한다. 언급된 바와 같이, 컨센서스 서열은 US 62/432,240(BI-10035)에 개시된 15 개의 오솔로그의 서열로부터 유래될 수 있다. 예를 들어, 상기 서열 정렬로부터, 제1 HEPN 도메인은 R{N/H}xxxH 모티프를 포함하는 반면 제2 HEPN 도메인은 R{N/K}xxxH 모티프를 포함한다.
본 발명의 일 구현예에서, HEPN 도메인은 R{N/H/K}X1X2X3H의 서열을 포함하는 적어도 하나의 RxxxxH 모티프를 포함한다. 본 발명의 일 구현예에서, HEPN 도메인은 R{N/H}X1X2X3H의 서열을 포함하는 RxxxxH 모티프를 포함한다. 본 발명의 일 구현예에서, HEPN 도메인은 R{N/K}X1X2X3H의 서열을 포함한다. 특정 구현예에서, X1는 R, S, D, E, Q, N, G, Y, 또는 H이다. 특정 구현예에서, X2는 I, S, T, V 또는 L이다. 특정 구현예에서, X3은 L, F, N, Y, V, I, S, D, E 또는 A이다.
본 발명에 따른 사용을 위한 추가적인 이펙터는 이에 한정되지 않음에도 예를 들어 cas1 유전자의 시작으로부터 20 kb 및 cas1유전자의 말단으로부터 20 kb 영역 내에서 cas1 유전자와의 근접성에 의해 식별될 수 있다. 특정 구현예에서, 이펙터 단백질은 적어도 1 개의 HEPN 도메인 및 적어도 500 개의 아미노산을 포함하고, 여기서 C2c2 이펙터 단백질은 Cas1 유전자 또는 CRISPR 어레이의 업스트림 또는 다운스트림 20 kb 내의 원핵 게놈에 천연적으로 존재한다.
일 구현예에서, 제VI형 RNA-표적화 이펙터 단백질, 특히 C2c2 또는 이의 오솔로그 또는 상동체를 인코딩하는 핵산 분자(들)는 진핵 세포에서 발현을 위해 코돈 최적화될 수 있다. 진핵 생물은 본 명세서에 논의된 바와 같을 수 있다. 핵산 분자(들)는 설계 제작되거나 비-천연적으로 발생할 수 있다.
일 구현예에서, 제VI형 RNA-표적화 이펙터 단백질, 특히 C2c2 또는 이의 오솔로그 또는 상동체는 하나 이상의 돌연변이를 포함할 수 있다(그리고 따라서 이들을 코딩하는 핵산 분자(들)은 돌연변이(들)를 포함할 수 있다). 돌연변이는 인위적으로 도입된 돌연변이일 수 있으며, 촉매 도메인에 하나 이상의 돌연변이를 포함할 수 있지만, 이에 한정되지 않는다. Cas9 효소에 관한 촉매 도메인의 예는 RuvC I, RuvC II, RuvC III 및 HNH 도메인을 포함할 수 있지만, 이에 한정되지 않는다.
일 구현예에서, C2c2 또는 그의 오솔로그 또는 상동체와 같은 제VI형 단백질은 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 인위적으로 도입된 돌연변이일 수 있으며, 촉매 도메인에서의 하나 이상의 돌연변이를 포함할 수 있으나, 이에 한정되지 않는다. Cas 효소에 관한 촉매 도메인의 예는 HEPN 도메인을 포함할 수 있지만 이에 한정되지 않는다.
일 구현예에서, 제VI형 단백질, 예를 들어 C2c2 또는 이의 오솔로그 또는 상동체는 기능성 도메인에 융합되거나 작동 가능하게 연결된 총칭적인 핵산 결합 단백질로서 사용될 수 있다. 예시적인 기능성 도메인은 번역 개시제, 번역 활성화제, 번역 억제제, 뉴클레아제, 특히 리보뉴클레아제, 스플라이세오좀(spliceosome), 비드, 광 유도성/제어성 도메인 또는 화학적 유도성/제어성 도메인을 포함할 수 있지만, 이에 한정되지 않는다.
일부 구현예에서, 비-변형된 핵산-표적화 이펙터 단백질은 절단 활성을 가질 수 있다. 일부 구현예에서, RNA-표적화 이펙터 단백질은 표적 서열의 위치에서 또는 그 가까이에서, 예를 들어 표적 서열 내 및/또는 표적 서열의 상보체 내 또는 표적 서열과 연관된 서열에서, 1 개 또는 2 개의 핵산(DNA 또는 RNA) 가닥의 절단을 지시할 수 있다. 일부 구현예에서, 핵산-표적화 Cas 단백질은, 표적 서열의 제1 또는 최종 뉴클레오티드로부터의 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기쌍 내에서 1 개 또는 2 개의 DNA 또는 RNA 가닥의 절단을 지시할 수 있다. 일부 구현예에서, 벡터는, 돌연변이된 핵산-표적화 Cas 단백질이 표적 서열을 함유하는 표적 폴리뉴클레오티드의 RNA 가닥을 절단하는 능력이 결여되도록 해당하는 야생형 효소와 관련하여 돌연변이될 수 있는 핵산-표적화 Cas 단백질을 인코딩한다. 추가 예로서, Cas의 2 개 이상의 촉매 도메인(예를 들어, HEPN 도메인)은 돌연변이되어 모든 RNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas를 생성할 수 있다. 일부 실시형태에서, 돌연변이된 효소의 RNA 절단 활성이 효소의 비-돌연변이 형태의 핵산 절단 활성의 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하, 또는 그 미만인 경우, 핵산-표적화 이펙터 단백질은 모든 RNA 절단 활성이 실질적으로 결여된 것으로 간주될 수 있으며; 예는, 돌연변이된 형태의 핵산 절단 활성이 0이거나 비-돌연변이된 형태에 비하여 무시해도 될 정도인 경우일 수 있다. 이펙터 단백질은 제VI형 CRISPR 시스템 유래의 다수 뉴클레아제 도메인을 갖는 가장 큰 뉴클레아제에 대하여 상동성을 공유하는 일반적인 부류의 효소를 참조하여 확인될 수 있다. 가장 바람직하게, 이펙터 단백질은 제VI형 단백질, 예를 들어 C2c2이다. 유래됨은, 유래된 효소가 야생형 효소와 높은 정도의 서열 상동성을 갖는 의미에서 크게 기반으로 하지만, 당업계에 공지되거나 본 명세서에 기재된 바와 같은 일부 방법으로 돌연변이된(변형된) 것을 출원인은 의미한다.
다시, 용어 Cas 및 CRISPR 효소 및 CRISPR 단백질 및 Cas 단백질은 일반적으로 상호교환 가능하게 사용되며, Cas9에 대한 특정 언급에 의한 것과 같이 본 명세서에서 달리 명백하지 않다면, 본 명세서에서의 언급한 모든 점은 본 출원에서 추가로 기재된 신규 CRISPR 이펙터 단백질에 대한 유사성을 언급하는 것으로 이해될 것이다. 상기 언급된 바와 같이, 본 명세서에서 사용된 많은 잔기의 넘버링은 제VI형 CRISPR 유전자좌로부터의 이펙터 단백질을 지칭한다. 그러나, 본 발명은 미생물의 다른 종로부터의 다수의 더 많은 이펙터 단백질을 포함한다는 것이 이해될 것이다. 특정 구현예에서, Cas는 구성적으로 존재하거나 유도성으로 존재하거나, 조건부로 존재하거나 투여되거나 전달될 수 있다. Cas 최적화를 사용하여 기능을 향상시키거나 새로운 기능을 발생시킬 수 있으며, 키메라 Cas 단백질을 생성할 수 있다. 그리고 Cas는 총칭적인 핵산 결합 단백질로 사용될 수 있다.
통상적으로, 내인성 핵산-표적화 시스템의 맥락에서(표적 서열에 혼성화되고 하나 이상의 핵산-표적화 이펙터 단백질과 복합체화된 가이드 RNA를 포함하는), 핵산-표적화 복합체의 형성은, 표적 서열 내 또는 가까이에서(예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500 개 이상의 염기쌍 내) 1 개 또는 2 개의 DNA 또는 RNA 가닥의 절단을 초래한다. 본 명세서에서 사용된 바와 같이, 용어 "관심 표적 유전자와 관련된 서열(들)"은 표적 서열의 부근 가까이의(예를 들어, 표적 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500 개 이상의 염기쌍 내, 여기서 표적 서열은 관심 표적 유전자좌 내에 포함됨) 서열을 지칭한다.
코돈 최적화된 서열의 예는, 이러한 예에서, 진핵생물, 예를 들어 인간(즉, 인간에서의 발현을 위해 최적화됨), 또는 본 명세서에서 논의된 바와 같은 또 다른 진핵생물, 동물 또는 포유류에서의 발현을 위해 최적화된 서열이며; 예를 들어, 코돈 최적화된 서열의 예로서 WO 2014/093622(PCT/US2013/074667)에서의 SaCas9 인간 코돈 최적화 서열을 참조한다(당업계 및 본 개시 내용의 지식으로부터, 특히 이펙터 단백질(예를 들어, C2c2)에 대해, 핵산 분자(들)를 코딩하는 코돈 최적화는 당업자의 범위 내에 있다). 이것이 바람직하지만, 다른 예들도 가능하며, 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 특정 기관에 대한 코돈 최적화가 공지되어 있다는 것이 이해될 것이다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 효소 코딩 서열은 진핵 세포와 같은 특정 세포에서의 발현에 대해 코돈 최적화된다. 진핵 세포는, 구체적인 생물, 예를 들어 인간 또는 본 명세서에서 논의된 바와 같은 비-인간 진핵생물 또는 동물 또는 포유동물, 예를 들어 마우스, 래트, 토끼, 개, 가축 또는 비-인간 포유동물 또는 영장류(이에 한정되지 않음)를 포함하는 포유동물의 것이거나 또는 그로부터 유래될 수 있다. 일부 구현예에서, 인간이나 동물에 임의의 실질적인 의학적 이익 없이 그들을 고통스럽게 할 수 있는 인간의 생식계열 유전자 동일성을 변형하기 위한 과정 및/또는 동물의 유전자 동일성을 변형하기 위한 과정과, 또한 이와 같은 과정으로부터 생긴 동물이 배제될 수 있다. 일반적으로, 코돈 최적화는 고유 아미노산 서열을 유지하면서, 고유 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상, 또는 그를 초과하는 코돈)을 숙주 세포의 유전자에 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써, 관심 숙주 세포에서의 발현의 향상을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대하여 특정 편향을 나타낸다. 코돈 편향(생물 간의 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역의 효율과 상관관계가 있으며, 이는 결국, 특히, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용 가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화를 기반으로 하여 주어진 생물에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는, 예를 들어 www.kazusa.orjp/codon/에서 이용 가능한 "코돈 사용 데이터베이스"에서 용이하게 이용 가능하며, 이 표는 다수의 방식으로 적합하게 될 수 있다. 문헌[Nakamura, Y., et al. “Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292(2000)]을 참조한다. 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘이 또한 이용 가능하며, 예를 들어 Gene Forge(Aptagen; 미국 펜실베이니아주 야코부스)도 또한 이용 가능하다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 서열 내의 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상의, 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 해당한다.
일부 구현예에서, 벡터는 하나 이상의 핵 국소화 서열(NLS) 또는 핵 방출 서열(NES), 예를 들어 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS 또는 NES를 포함하는 C2c2와 같은 핵산-표적화 이펙터 단백질, 또는 이의 오솔로그 또는 상동체를 인코딩한다. 일부 구현예에서, RNA-표적화 이펙터 단백질은 아미노-말단 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS 또는 NES, 카르복시-말단 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS 또는 NES, 또는 이들의 조합(예를 들어 아미노-말단에서 0 개 또는 적어도 1 개 이상의 NLS 또는 NES, 그리고 카르복시 말단에서 0 개 또는 적어도 1 개 이상의 NLS 또는 NES)을 포함한다. 1 개 초과의 NLS 또는 NES가 존재하는 경우, 각각은 단일의 NLS 또는 NES가 1 개 초과의 복제물로 존재하고/존재하거나 1 개 이상의 복제물로 존재하는 1 개 이상의 다른 NLS 또는 NES와 조합될 수 있도록, 다른 것들로부터 독립적으로 선택될 수 있다. 일부 구현예에서, NLS 또는 NES는 NLS 또는 NES의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 개 이상의 아미노산 내에 존재하는 경우, N- 또는 C-말단 근처에 있는 것으로 간주된다. NLS의 비제한적인 예는 하기로부터 유래된 NLS 서열을 포함한다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK. 일반적으로, 하나 이상의 NLS 또는 NES는 진핵 세포의 핵 또는 세포질 각각에서 검출 가능한 양의 DNA/RNA-표적화 Cas 단백질의 축적을 유도하기에 충분한 세기의 것이다. 일반적으로, 핵/세포질 국소화 활성의 세기는 핵산-표적화 이펙터 단백질 내 NLS 또는 NES의 수, 사용되는 특정 NLS(들) 또는 NES(들), 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵/세포질에서의 축적의 검출은 임의의 적합한 기법에 의해 실행될 수 있다. 예를 들어, 검출 가능한 마커는, 예를 들어 핵(예를 들어, 핵에 특이적인 염색제, 예를 들어 DAPI) 또는 세포질의 위치를 검출하기 위한 수단과 함께, 세포 내의 위치가 가시화될 수 있도록, 핵산-표적화 단백질에 융합될 수 있다. 세포 핵을 또한 세포로부터 분리할 수 있으며, 그 다음 이의 내용물을 단백질을 검출하기 위한 임의의 적합한 과정, 예를 들어 면역조직화학, 웨스턴 블롯, 또는 효소 활성 분석에 의해 분석할 수 있다. 또한 핵/세포질에서의 축적은, 핵산-표적화 Cas 단백질 또는 핵산-표적화 복합체에 노출되지 않거나, 하나 이상의 NLS 또는 NES가 결여된 핵산-표적화 Cas 단백질에 노출된 대조군에 비하여, 간접적으로, 예를 들어 핵산-표적화 복합체 형성의 영향에 대한 분석(예를 들어, 표적 서열에서의 RNA 절단 또는 돌연변이에 대한 분석, 또는 RNA-표적화 복합체 형성 및/또는 RNA-표적화 Cas 단백질 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 분석)에 의해 결정될 수 있다. 본 명세서에 기재된 C2c2 이펙터 단백질 복합체 및 시스템의 바람직한 구현예에서, 코돈 최적화된 C2c2 이펙터 단백질은 단백질의 C-말단에 부착된 NLS 또는 NES를 포함한다.
일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소의 발현을 구동하는 하나 이상의 벡터는, 핵산-표적화 시스템의 요소의 발현이 하나 이상의 표적 부위에서 핵산-표적화 복합체의 형성을 지시하도록 숙주 세포 내로 도입된다. 예를 들어, 핵산-표적화 이펙터 효소 및 핵산-표적화 가이드 RNA는 각각 별개의 벡터 상에서 별개의 조절 요소에 작동 가능하게 연결될 수 있다. 핵산-표적화 시스템의 RNA(들)는 유전자 도입 핵산-표적화 이펙터 단백질 동물 또는 포유동물, 예를 들어 핵산-표적화 이펙터 단백질을 구조적으로 또는 유도적으로 또는 조건적으로 발현하는 동물 또는 포유동물; 또는 그렇지 않으면 핵산-표적화 이펙터 단백질을 발현하거나 핵산-표적화 이펙터 단백질을 함유하는 세포를 갖는 동물 또는 포유동물에게, 예를 들어 생체내 핵산-표적화 이펙터 단백질을 코딩하고 발현하는 벡터 또는 벡터들을 이에 사전 투여함으로써 전달될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현된 둘 이상의 요소는, 제1 벡터 내에 포함되지 않은 핵산-표적화 시스템의 임의의 성분을 제공하는 하나 이상의 추가적인 벡터들과 단일 벡터로 조합될 수 있다. 단일 벡터로 조합된 핵산-표적화 시스템 요소는 임의의 적합한 배향으로, 예를 들어 제2의 요소에 대하여 5'(제2의 요소의 "업스트림") 또는 3'(제2의 요소의 "다운스트림")에 위치되어 배열될 수 있다. 하나의 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일한 가닥 또는 반대의 가닥에 위치될 수 있고, 동일하거나 반대의 방향으로 배향될 수 있다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 임베딩된(예를 들어, 상이한 인트론 내 각각, 적어도 하나의 인트론 내 둘 이상, 또는 단일 인트론 내 모두), 핵산-표적화 가이드 RNA 및 핵산-표적화 이펙터 단백질을 인코딩하는 전사물의 발현을 구동한다. 일부 구현예에서, 핵산-표적화 이펙터 단백질 및 핵산-표적화 가이드 RNA는 동일한 프로모터에 작동 가능하게 연결되고 발현될 수 있다. 핵산-표적화 시스템의 하나 이상의 요소의 발현을 위한 전달 비히클, 벡터, 입자, 나노입자, 제형 및 그의 성분은 이전의 문헌, 예를 들어 WO 2014/093622(PCT/US2013/074667)에서 사용된 바와 같다. 일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예를 들어 제한 엔도뉴클레아제 인식 서열(또한 "클로닝 부위"로서 지칭됨)을 포함한다. 일부 구현예에서, 하나 이상의 삽입 부위(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 삽입 부위)가 하나 이상의 벡터의 하나 이상의 서열 요소의 업스트림 및/또는 다운스트림에 위치된다. 일부 구현예에서, 벡터는 2 개 이상의 삽입 부위를 포함하여, 각각의 부위에서 가이드 서열의 삽입이 가능하게 한다. 이러한 배열에서, 2 개 이상의 가이드 서열은 단일 가이드 서열의 2 개 이상의 카피, 2 개 이상의 상이한 가이드 서열 또는 이들의 조합을 포함할 수 있다. 다수의 상이한 가이드 서열이 사용된 경우, 핵산-표적화 활성을 세포 내에서 다수의 상이한 해당하는 표적 서열로 표적화하는 데 단일 발현 작제물이 사용될 수 있다. 예를 들어, 단일 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 개 이상, 또는 이를 초과하는 가이드 서열을 포함할 수 있다. 일부 구현예에서, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 이와 같은 가이드-서열 함유 벡터가 제공될 수 있으며, 선택적으로 세포로 전달될 수 있다. 일부 구현예에서, 벡터는 핵산-표적화 이펙터 단백질을 인코딩하는 효소-코딩 서열에 작동 가능하게 연결된 조절 요소를 포함한다. 핵산-표적화 이펙터 단백질 또는 핵산-표적화 가이드 RNA 또는 RNA(들)는 개별적으로 전달될 수 있으며; 유리하게는 이들 중 적어도 하나가 입자 또는 나노입자 복합체를 통해 전달된다. 핵산-표적화 이펙터 단백질 mRNA는 핵산-표적화 이펙터 단백질이 발현될 시간을 제공하기 위하여 핵산-표적화 가이드 RNA 이전에 전달될 수 있다. 핵산-표적화 이펙터 단백질 mRNA는 핵산-표적화 가이드 RNA의 투여 전 1 시간 내지 12 시간(바람직하게는 약 2 시간 내지 6 시간)에 투여될 수 있을 것이다. 대안적으로, 핵산-표적화 이펙터 단백질 mRNA 및 핵산-표적화 가이드 RNA는 함께 투여될 수 있다. 유리하게, 가이드 RNA의 제2 부스터 용량은 핵산-표적화 이펙터 단백질 mRNA + 가이드 RNA의 초기 투여 후 1 시간 내지 12 시간(바람직하게는 약 2 시간 내지 6 시간)에 투여될 수 있다. 핵산-표적화 이펙터 단백질 mRNA 및/또는 가이드 RNA의 추가적인 투여는 게놈 및/또는 트랜스크립톰 변형의 가장 효율적인 수준을 달성하는 데 유용할 수 있다.
일 양태에서, 본 발명은 핵산-표적화 시스템의 하나 이상의 요소의 사용 방법을 제공한다. 본 발명의 핵산-표적화 복합체는 표적 RNA를 변형시키기 위한 효율적인 수단을 제공한다. 본 발명의 핵산-표적화 복합체는 다수의 세포 유형에서 표적 RNA를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 비활성화시키는, 활성화시키는) 것을 포함하는 매우 다양한 유용성을 갖는다. 이와 같이, 본 발명의 핵산-표적화 복합체는, 예를 들어 유전자 치료법, 약물 스크리닝, 질병 진단 및 예후에서 광범위한 적용을 갖는다. 예시적인 핵산-표적화 복합체는 관심 표적 유전자좌 내의 표적 서열에 혼성화되는 가이드 RNA와 복합체화되는 RNA-표적화 이펙터 단백질을 포함한다.
일 구현예에서, 본 발명은 표적 RNA를 절단하는 방법을 제공한다. 상기 방법은 표적 RNA와 결합하여 상기 표적 RNA의 절단을 행하는 핵산-표적화 복합체를 사용하여 표적 RNA를 변형하는 것을 포함한다. 일 구현예에서, 본 발명의 핵산-표적화 복합체는, 세포 내에 도입되는 경우, RNA 서열 중에 손상(예를 들어, 단일 또는 이중 가닥 손상)을 생성할 수 있다. 예를 들어, 상기 방법은 세포에서 질병 RNA를 절단하기 위하여 사용될 수 있다. 예를 들어, 업스트림 서열과 다운스트림 서열이 측면에 배치된 통합될 서열을 포함하는 외인성 RNA 주형이 세포 내에 도입될 수 있다. 업스트림 서열과 다운스트림 서열은 RNA 내의 통합 부위의 어느 측과 서열 유사성을 공유한다. 원하는 경우, 공여자 RNA는 mRNA일 수 있다. 외인성 RNA 주형은 통합될 서열(예를 들어, 돌연변이된 RNA)을 포함한다. 통합을 위한 서열은 세포에 대해 내인성 또는 외인성인 서열일 수 있다. 통합될 서열의 예는 단백질을 인코딩하는 RNA 또는 비-코딩 RNA(예를 들어, 마이크로RNA)를 포함한다. 따라서, 통합을 위한 서열은 적절한 제어 서열 또는 서열들에 작동 가능하게 연결될 수 있다. 대안적으로, 통합될 서열은 조절 기능을 제공할 수 있다. 외인성 RNA 주형에서 업스트림 및 다운스트림 서열은 관심 RNA 서열과 공여자 RNA 사이의 재조합을 촉진하도록 선택된다. 업스트림 서열은 통합을 위해 표적화된 부위의 업스트림 RNA 서열과 서열 유사성을 공유하는 RNA 서열이다. 유사하게, 다운스트림 서열은 통합의 표적화된 부위의 다운스트림 RNA 서열과 서열 유사성을 공유하는 RNA 서열이다. 외인성 RNA 주형의 업스트림 및 다운스트림 서열은 표적화된 RNA 서열과 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성을 가질 수 있다. 바람직하게, 외인성 RNA 주형의 업스트림 및 다운스트림 서열은 표적화된 RNA 서열과 약 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다. 일부 방법에서, 외인성 RNA 주형의 업스트림 및 다운스트림 서열은 표적화된 RNA 서열과 약 99% 또는 100% 서열 동일성을 갖는다. 업스트림 또는 다운스트림 서열은 약 20 bp 내지 약 2500 bp, 예를 들어 약 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 또는 2500 bp를 포함할 수 있다. 일부 방법에서, 예시적인 업스트림 또는 다운스트림 서열은 약 200 bp 내지 약 2000 bp, 약 600 bp 내지 약 1000 bp, 또는 더 구체적으로 약 700 bp 내지 약 1000 bp를 갖는다. 일부 방법에서, 외인성 RNA 주형은 마커를 추가로 포함할 수 있다. 이와 같은 마커는 표적화된 통합의 스크리닝을 용이하게 할 수 있다. 적합한 마커의 예는 제한 부위, 형광 단백질, 또는 선택성 마커를 포함한다. 본 발명의 외인성 RNA 주형은 재조합 기법을 사용하여 작제될 수 있다(예를 들어, 문헌[Sambrook et al., 2001] 및 문헌[Ausubel et al., 1996] 참조). 외인성 RNA 주형을 통합함으로써 표적 RNA를 변형하는 방법에서, 손상(예를 들어 이중 또는 단일 가닥 DNA 또는 RNA에서 이중 또는 단일 가닥 손상)이 핵산-표적화 복합체에 의해서 DNA 또는 RNA 서열에 도입되며, 이 손상은 주형이 RNA 표적에 통합되도록 외인성 RNA 주형의 상동성 재조합을 통해서 수복된다. 이중-가닥 손상의 존재는 주형의 통합을 촉진한다. 다른 구현예에서, 본 발명은 진핵 세포에서 RNA의 발현을 변형하는 방법을 제공한다. 상기 방법은 RNA(예를 들어, mRNA 또는 pre-mRNA)에 결합하는 핵산-표적화 복합체를 사용하여 표적 폴리뉴클레오티드의 발현을 증가시키거나 감소시키는 단계를 포함한다. 일부 방법에서, 표적 RNA는 세포에서 발현의 변형을 행하기 위해 비활성화될 수 있다. 예를 들어, 세포에서 RNA-표적화 복합체와 표적 서열의 결합시, 표적 RNA가 비활성화되며, 이로써 서열이 번역되지 않거나, 코딩된 단백질이 생성되지 않거나, 또는 서열이 야생형 서열처럼 기능하지 않는다. 예를 들어, 단백질 또는 마이크로RNA 코딩 서열은 단백질 또는 마이크로RNA 또는 예비-마이크로RNA 전사물이 생성되지 않도록 비활성화될 수 있다. RNA-표적화 복합체의 표적 RNA는 진핵 세포에 내인성이거나 외인성인 임의의 RNA일 수 있다. 예를 들어, 표적 RNA는 진핵 세포의 핵에 존재하는 RNA일 수 있다. 표적 RNA는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열(예를 들어, mRNA 또는 pre-mRNA) 또는 비-코딩 서열(예를 들어, ncRNA, lncRNA, tRNA, 또는 rRNA)일 수 있다. 표적 RNA의 예는 신호화 생화학 경로와 연관된 서열, 예를 들어 신호화 생화학적 경로-연관 RNA를 포함한다. 표적 RNA의 예는 질병 관련 RNA를 포함한다. "질병-관련" RNA는 질병이 없는 대조군의 조직 또는 세포에 비하여, 질병-발생 조직으로부터 유래된 세포에서 비정상적인 수준 또는 비정상적인 형태로 번역 산물을 생성하는 임의의 RNA를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자로부터 전사된 RNA일 수 있으며; 그것은 비정상적으로 낮은 수준으로 발현되는 유전자로부터 전사된 RNA일 수 있고, 여기서 변경된 발현은 질병의 발생 및/또는 진행과 상관관계가 있다. 또한, 질병-관련 RNA는 질병의 병인에 직접적인 원인이 있거나, 그에 원인이 있는 유전자(들)와 연관 불균형이 있는 돌연변이(들) 또는 유전적 변이를 갖는 유전자로부터 전사된 RNA를 지칭한다. 번역된 산물은 공지된 것이거나 미공지된 것일 수 있으며, 정상 또는 비정상 수준으로 존재할 수 있다. RNA-표적화 복합체의 표적 RNA는 진핵 세포에 대해 내인성이거나 외인성인 임의의 RNA일 수 있다. 예를 들어, 표적 RNA는 진핵 세포의 핵에 존재하는 RNA일 수 있다. 표적 RNA는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열(예를 들어, mRNA 또는 pre-mRNA) 또는 비-코딩 서열(예를 들어, ncRNA, lncRNA, tRNA, 또는 rRNA)일 수 있다.
일부 구현예에서, 상기 방법은 핵산-표적화 복합체가 표적 RNA에 결합할 수 있게 하여, 상기 표적 RNA의 절단을 초래하여, 그에 의해 표적 RNA를 변형시키는 단계를 포함하며, 핵산-표적화 복합체는 상기 표적 RNA 내의 표적 서열과 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다. 일 양태에서, 본 발명은 진핵 세포에서의 RNA의 발현의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 핵산-표적화 복합체가 RNA에 결합할 수 있게 하여, 상기 결합이 상기 RNA의 증가된 또는 감소된 발현을 초래하게 하는 단계를 포함하며; 여기서 핵산-표적화 복합체는 가이드 RNA와 복합체화되는 핵산-표적화 이펙터 단백질을 포함한다. 유사한 고려사항 및 조건이 표적 RNA를 변형하는 방법을 위해 상기한 바와 같이 적용된다. 사실상, 이들 샘플링, 배양 및 재도입 선택사항은 본 발명의 전 양태에 적용된다. 일 양태에서, 본 발명은 진핵 세포에서 표적 RNA를 변형하는 방법을 제공하며, 이것은 생체내, 생체외 또는 시험관내에서 이루어질 수 있다. 일부 구현예에서, 상기 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 샘플링하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다. 재도입된 세포의 경우, 세포가 줄기 세포인 것이 특히 바람직하다.
실제로, 본 발명의 임의의 양태에서, 핵산-표적화 복합체는 표적 서열과 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함할 수 있다.
본 발명은 핵산-표적화 시스템 및 그의 성분에 관한 RNA 서열 표적화를 수반하는 유전자 발현의 제어에 사용되는 시스템, 방법 및 조성물의 조작 및 최적화에 관한 것이다. 유리한 구현예에서, 이펙터 단백질 효소는 제VI형 단백질, 예를 들어 C2c2이다. 본 방법의 이점은 CRISPR 시스템이 표적외 결합 및 그 결과의 부작용을 최소화시키거나 회피한다는 점이다. 이는 표적 RNA에 대하여 고도의 서열 특이성을 갖도록 배열된 시스템을 사용하여 달성된다.
바람직하게는 핵산-표적화 복합체 또는 시스템과 관련하여, tracr 서열은 하나 이상의 헤어핀을 가지며, 이는 길이가 30 개 이상의 뉴클레오티드, 길이가 40 개 이상의 뉴클레오티드, 또는 길이가 50 개 이상의 뉴클레오티드이고; crRNA 거열은 길이가 10 개 내지 30 개 뉴클레오티드이며, 핵산-표적화 이펙터 단백질은 제VI형 이펙터 단백질이다.
특정 구현예에서, 이펙터 단백질은 리스테리아 종 C2c2p, 바람직하게는 리스테리아 세엘리게리아 C2c2p, 더욱 바람직하게는 리스테리아 세엘리게리아 혈청형 1/2b 균주 SLCC3954 C2c2p일 수 있고 crRNA 서열은, 5' 29-nt 직접 반복(DR) 및 15-nt 내지 18-nt 스페이서를 갖는, 길이가 44 내지 47 뉴클레오티드일 수 있다.
특정 구현예에서, 이펙터 단백질은 렙토트리키아 종 C2c2p, 바람직하게는 렙토트리키아 샤히 C2c2p, 더욱 바람직하게는 렙토트리키아 샤히 DSM 19757 C2c2p일 수 있고, crRNA 서열은, 5' 24 내지 28 nt 직접 반복(DR)과 같은, 적어도 24-nt의 5'직접 반복, 및 14-nt 내지 28-nt 스페이서와 같은, 적어도 14 nt의 스페이서, 또는 19, 20, 21, 22, 이상 nt, 예를 들어 18 내지 28, 19 내지 28, 20 내지 28, 21 내지 28, 또는 22 내지 28 nt와 같은, 적어도 18 nt의 스페이서를 갖는, 길이가 42 내지 58 뉴클레오티드일 수 있다.
더욱 바람직하게, 이펙터 단백질은 렙토트리키아 종, 바람직하게는 렙토트리키아 와데이 F0279, 또는 리스테리아 종. 바람직하게는 리스테리아 뉴요켄시스 FSL M6-0635일 수 있다.
특정 구현예에서, 이펙터 단백질은 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p일 수 있고, crRNA 서열은 길이가 36 내지 63 뉴클레오티드, 바람직하게는 길이가 37-nt 내지 62-nt, 또는 길이가 38-nt 내지 61-nt, 또는 길이가 39-nt 내지 60-nt, 더욱 바람직하게는 길이가 40-nt 내지 59-nt, 또는 길이가 41-nt 내지 58-nt, 가장 바람직하게는 길이가 42-nt 내지 57-nt일 수 있다. 예를 들어, crRNA는 길이가 26-nt 내지 31-nt, 바람직하게는 길이가 27-nt 내지 30-nt, 더욱 더 바람직하게는 길이가 28-nt 또는 29-nt 또는 길이가 적어도 28 또는 29 nt인 직접 반복(DR), 바람직하게는5'DR, 및 길이가 10-nt 내지 32-nt, 바람직하게는 길이가 11-nt 내지 31-nt, 더욱 바람직하게는 길이가 12-nt 내지 30-nt, 더욱 더 바람직하게는 길이가 13-nt 내지 29-nt, 및 가장 바람직하게는 길이가 14-nt 내지 28-nt, 예를 들어 18 내지 28 nt, 19 내지 28 nt, 20 내지 28 nt, 21 내지 28 nt, 또는 22 내지 28 nt의 스페이서를 포함할 수 있거나, 이로 본질적으로 구성될 수 있거나 이로 구성될 수 있다.
특정 구현예에서, 이펙터 단백질은 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로는 C2c2p일 수 있고, tracrRNA 서열(존재하는 경우)은 적어도 60-nt 길이, 예를 들어 길이가 적어도 65-nt, 또는 길이가 적어도 70-nt, 예를 들어 길이가 60-nt 내지 70-nt, 또는 길이가 60-nt 내지 70-nt, 또는 길이가 70-nt 내지 80-nt, 또는 길이가 80-nt 내지 90-nt, 또는 길이가 90-nt 내지 100-nt, 또는 길이가 100-nt 내지 110-nt, 또는 길이가 110-nt 내지 120-nt, 또는 길이가 120-nt 내지 130-nt, 또는 길이가 130-nt 내지 140-nt, 또는 길이가 140-nt 내지 150-nt 또는 길이가 150-nt보다 길 수 있다.
특정 구현예에서, 이펙터 단백질은 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로는 C2c2p일 수 있으며, 절단을 위해 tracrRNA가 요구되지 않을 수 있다.
2 개의 상이한 압타머(각각 별개의 핵산-표적화 가이드 RNA)의 사용은 상이한 핵산-표적화 가이드 RNA를 이용하여, 사용될 활성화제-어댑터 단백질 융합 및 억제제-어댑터 단백질 융합이, 다른 하나는 억제하는 한편 하나의 DNA 또는 RNA의 발현은 활성화시키는 것을 가능하게 한다. 이들은 그들의 상이한 가이드 RNA와 함께, 다중화된 접근법에서 함께, 또는 실질적으로 함께 투여될 수 있다. 이와 같은 변형된 핵산-표적화 가이드 RNA의 다수, 예를 들어 10 개 또는 20 개 또는 30 개 등이 모두 동시에 사용될 수 있고, 한편 비교적 적은 수의 이펙터 단백질 분자로서, 전달되는 이펙터 단백질 분자 중 단지 하나(또는 적어도 최소 수)가 다수의 변형된 가이드와 함께 사용될 수 있다. 어댑터 단백질은 하나 이상의 활성화제 또는 하나 이상의 억제제에 연관(바람직하게는 연결 또는 융합)될 수 있다. 예를 들어, 어댑터 단백질은 제1 활성화제 및 제2 활성화제와 연관될 수 있다. 제1 및 제2 활성화제는 동일할 수 있지만, 이들은 바람직하게 상이한 활성화제이다. 3 개 이상 또는 심지어 4 개 이상의 활성화제(또는 억제제)가 사용될 수 있지만, 패키지 크기는 5 개를 초과하는 개수의 상이한 기능성 도메인은 제한할 수 있다. 어댑터 단백질에 대한 직접 융합에 대하여, 링커가 바람직하게 사용되며, 여기서 2 개 이상의 기능성 도메인은 어댑터 단백질에 연결된다. 적합한 링커는 GlySer 링커를 포함할 수 있다.
또한 핵산-표적화 이펙터 단백질-가이드 RNA 복합체는 전체로서 둘 이상의 기능성 도메인과 회합될 수 있음이 고려된다. 예를 들어, 핵산-표적화 이펙터 단백질과 회합된 둘 이상의 기능성 도메인이 존재할 수 있거나, (하나 이상의 어댑터 단백질을 통해) 가이드 RNA와 회합된 둘 이상의 기능성 도메인이 존재할 수 있거나, (하나 이상의 어댑터 단백질을 통해) 핵산-표적화 이펙터 단백질과 회합된 하나 이상의 기능성 도메인 및 가이드 RNA와 회합된 하나 이상의 기능성 도메인이 존재할 수 있다.
어댑터 단백질과 활성화제 또는 억제제 사이의 융합은 링커를 포함할 수 있다. 예를 들어, GlySer 링커 GGGS가 사용될 수 있다. 이들은 3((GGGGS)3) 또는 6, 9 또는 심지어는 12 이상의 반복부로 사용되어, 필요에 따라 적합한 길이를 제공할 수 있다. 링커는 가이드 RNA와 기능성 도메인(활성화제 또는 억제제) 사이, 또는 핵산-표적화 이펙터 단백질과 기능성 도메인(활성화제 또는 억제제) 사이에서 사용될 수 있다. 사용자는 링커를 "기계적 유연성"의 적절한 양으로 조작한다.
본 발명은 핵산-표적화 이펙터 단백질 및 가이드 RNA를 포함하는 핵산-표적화 복합체를 포괄하며, 여기서 핵산-표적화 이펙터 단백질은 적어도 하나의 돌연변이를 포함하여, 핵산-표적화 Cas 단백질이 적어도 하나의 돌연변이를 갖지 않는 핵산-표적화 Cas 단백질의 활성의 5% 이하, 및 선택적으로 적어도 하나 이상의 핵 국소화 서열을 갖도록 하며; 가이드 RNA는 세포 내 관심 RNA에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하고; 여기서 핵산-표적화 이펙터 단백질은 둘 이상의 기능성 도메인과 회합되거나; 가이드 RNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고; 여기서 어댑터 단백질은 둘 이상의 기능성 도메인과 회합되거나; 핵산-표적화 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고, 가이드 RNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능성 도메인에 회합된다.
전달 일반
C2c2 이펙터 단백질 복합체는 작용 이펙터를 전달할 수 있다
DNA수준에서 유전자를 돌연변이시킴으로써 발현을 영구히 제거하는, CRISPR-Cas-매개된 유전자 녹아웃과 달리, CRISPR-Cas 녹다운은 인공 전사 또는 번역 인자의 사용을 통해 유전자 발현의 일시적 감소를 가능하게 한다. C2c2 단백질의 DNA 또는 RNA 절단 도메인 모두에서 중요 잔기를 돌연변이시키는 것은 촉매적으로 비활성인 C2c2의 생성을 초래한다. 촉매적으로 비활성인 C2c2는 가이드 RNA와 복합체화하고, 도메인을 표적화하는 가이드 RNA에 의해 특정된 RNA 서열에 국소화되지만, 이는 표적 RNA를 절단하지 않는다. 비활성 C2c2 단백질의 이펙터 도메인, 예를 들어 전사 또는 번역 억제 도메인으로의 융합은 이펙터의 가이드 RNA에 의해 특정된 임의의 RNA 부위로의 채용을 가능하게 한다. 특정 구현예에서, C2c2는 전사 억제 도메인에 융합될 수 있고, 유전자의 프로모터 영역에 채용될 수 있다. 특히 유전자 억제의 경우, 내인성 전사 인자의 결합 부위를 차단하는 것은 유전자 발현을 하향조절하는 것을 보조할 것으로 본 명세서에서 고려된다. 또 다른 구현예에서, 비활성 C2c2는 크로마틴 변형 단백질에 융합될 수 있다. 크로마틴 상태의 변경은 표적 유전자의 발현 감소를 초래할 수 있다. 추가의 구현예에서, C2c2는 번역 억제 도메인에 융합될 수 있다.
일 구현예에서, 가이드 RNA 분자는 공지된 전사 반응 요소(예를 들어, 프로모터, 인핸서 등), 공지된 업스트림 활성화 서열, 및/또는 표적 RNA의(단백질) 발현을 제어할 수 있는 것으로 의심되는 미지의 또는 공지된 작용의 서열로 표적화될 수 있다.
일부 방법에서, 표적 폴리뉴클레오티드는 비활성화되어 세포 내에서 발현의 변형을 일으킬 수 있다. 예를 들어, CRISPR 복합체의 세포 내의 표적 서열로의 결합시, 표적 폴리뉴클레오티드는 비활성화되어, 서열이 전사되지 않거나, 코딩된 단백질이 생산되지 않거나, 서열이 야생형 서열이 작용하는 것처럼 작용하지 않게 된다. 예를 들어, 단백질 또는 마이크로RNA 코딩 서열은 비활성화되어 단백질이 생산되지 않게 된다. 일부 방법에서, 표적 폴리뉴클레오티드는 세포에서 발현의 변형을 가져오기 위해 비활성화될 수 있다. 예를 들어, CRISPR 복합체가 세포의 RNA 표적 서열에 결합 즉시, 표적 폴리뉴클레오티드는 비활성화되어 서열이 번역되지 않고 세포에서 단백질의 발현 수준에 영향을 미친다.
특정 구현예에서, CRISPR 효소는 R597A, H602A, R1278A 및 H1283A로 구성된 군으로부터 선택되는 하나 이상의 돌연변이를 포함하고/포함하거나, 하나 이상의 돌연변이는 CRISPR 효소의 HEPN 도메인 내에 있거나, 다르게는 본 명세서에서 논의된 돌연변이다. 일부 구현예에서, CRISPR 효소는 촉매 도메인 내에서 하나 이상의 돌연변이를 갖고, 전사된 경우, 직접 반복 서열은 단일 스템 루프를 형성하고, 가이드 서열은 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며, 여기서 효소는 기능성 도메인을 추가로 포함한다. 일부 구현예에서, 기능성 도메인은. 일부 구현예에서, 기능성 도메인은 전사 억제 도메인, 바람직하게는 KRAB이다. 일부 구현예에서, 전사 억제 도메인은 SID, 또는 SID의 연쇄체(예를 들어, SID4X)이다. 일부 구현예에서, 기능성 도메인은 후성적 변형 도메인으로, 후성적 변형 효소가 제공되도록 한다. 일부 구현예에서, 기능성 도메인은 활성화 도메인으로, 이는 P65 활성화 도메인일 수 있다.
C2c2 이펙터 단백질 복합체 또는 이의 성분의 전달
본 개시 내용 및 당업계의 지식을 통하여, TALE, CRISPR-Cas 시스템, 또는 이의 성분 또는 이의 핵산 분자 또는 이의 성분을 인코딩하거나 제공하는 핵산 분자는 본 명세서에서 일반적으로 그리고 상세하게 기재된 전달 시스템에 의해 전달될 수 있다.
벡터 전달, 예를 들어 플라스미드, 바이러스 전달: CRISPR 효소, 예를 들어 C2c2와 같은 제V형 단백질, 및/또는 본 발명의 임의의 RNA, 예를 들어 가이드 RNA는 임의의 적합한 벡터, 예를 들어 플라스미드 또는 바이러스 벡터, 예를 들어 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 다른 바이러스 벡터 유형, 또는 이의 조합을 사용하여 전달될 수 있다. 이펙터 단백질 및 하나 이상의 가이드 RNA는 하나 이상의 벡터, 예를 들어 플라스미드 또는 바이러스 벡터 내로 패키지될 수 있다. 일부 구현예에서, 벡터, 예를 들어 플라스미드 또는 바이러스 벡터는, 예를 들어 근육내 주사에 의해 관심 조직으로 전달되는 한편, 다른 경우에 전달은 정맥내, 경피, 비강내, 구강, 점막 또는 다른 전달 방법을 통하여 이루어진다. 이와 같은 전달은 단일 용량 또는 다중 용량 중 어느 하나를 통하여 이루어질 수 있다. 당업자는, 본 명세서에서 전달되는 실제 용량은 다양한 인자, 예를 들어 벡터 선택, 표적 세포, 생물, 또는 조직, 치료될 대상체의 일반 상태, 구하는 형질전환/변형의 정도, 투여 경로, 투여 방법, 구하는 형질전환/변형의 형태 등에 따라 크게 달라질 수 있다.
이와 같은 용량은, 예를 들어 담체(물, 식염수, 에탄올, 글리세롤, 락토오스, 수크로오스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 등), 희석제, 약학적으로 허용 가능한 담체(예를 들어, 인산염 완충 식염수), 약학적으로 허용 가능한 부형제, 및/또는 당업계에 알려진 다른 화합물을 추가로 함유할 수 있다. 용량은 하나 이상의 약학적으로 허용 가능한 염, 예를 들어 무기산 염, 예를 들어 염산염, 브롬화수소산염, 인산염, 황산염 등; 및 유기산 염, 예를 들어 아세테이트, 프로피오네이트, 말로네이트, 벤조에이트 등을 추가로 함유할 수 있다. 추가적으로, 보조 성분, 예를 들어 습윤 또는 유화제, pH 완충 성분, 겔 또는 겔화 물질, 풍미제, 착색제, 마이크로스피어, 중합체, 현탁제 등이 또한 본 명세서에서 제시될 수 있다. 추가적으로, 하나 이상의 다른 통상의 약학 성분들, 예를 들어 보존제, 보수제, 현탁화제, 계면활성제, 산화방지제, 케이킹방지제(anticaking agent), 충전제, 킬레이트화제, 코팅제, 화학 안정화제 등이 또한 존재할 수 있으며, 특히 투약 형태는 재구성 가능한 형태이다. 적합한 예시적인 성분으로는, 미세결정성 셀룰로스, 카르복시메틸셀룰로스 나트륨, 폴리소르베이트 80, 페닐에틸 알콜, 클로로부탄올, 칼륨 소르베이트, 소르빈산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 파라클로로페놀, 젤라틴, 알부민 및 이의 조합을 포함한다. 약학적으로 허용 가능한 부형제의 철저한 논의는 문헌[REMINGTON'S PHARMACEUTICAL SCIENCES(Mack Pub. Co., N.J. 1991)]에서 이용 가능하며, 이는 본 명세서에 참조로서 포함된다.
본 명세서의 일 구현예에서, 전달은 아데노바이러스를 통한 것으로, 이는 적어도 1 x 105 개의 입자(입자 단위, pu로서도 지칭됨)의 아데노바이러스 벡터를 함유하는 단일 부스터(booster) 용량일 수 있다. 본 명세서의 일 구현예에서, 용량은 바람직하게 적어도 약 1 x 106 개의 입자(예를 들어, 약 1 x 106 개 내지 1 x 1012 개 입자), 더욱 바람직하게는 적어도 약 1 x 107 개의 입자, 더욱 바람직하게는 적어도 약 1 x 108 개 이상의 입자(예를 들어, 약, 1 x 108 개 내지 1 x 1011 개 입자 또는 약 1 x 108 개 내지 1 x 1012 개 입자), 가장 바람직하게는 적어도 약 1 x 100 개의 입자(예를 들어, 약 1 x 109 개 내지 1 x 1010 개 입자 또는 약 1 x 109 개 내지 1 x 1012 입자), 또는 심지어 적어도 약 1 x 1010 개의 입자(예를 들어, 약 1 x 1010 개 내지 1 x 1012 개 입자)의 아데노바이러스 벡터이다. 대안적으로, 용량은 약 1 x 1014 개 이하의 입자, 바람직하게는 약 1 x 1013 개 이하의 입자, 훨씬 더 바람직하게는 약 1 x 1012 개 이하의 입자, 훨씬 더 바람직하게는 약 1 x 1011 개 이하의 입자, 가장 바람직하게는 약 1 x 1010 개 이하의 입자(예를 들어, 약 1 x 109 개 입자)를 포함한다. 따라서, 용량은 단일 용량의 아데노바이러스 벡터를 함유할 수 있으며, 이는 예를 들어 약 1 x 106 입자 단위(pu), 약 2 x 106 pu, 약 4 x 106 pu, 약 1 x 107 pu, 약 2 x 107 pu, 약 4 x 107 pu, 약 1 x 108 pu, 약 2 x 108 pu, 약 4×108 pu, 약 1 x 109 pu, 약 2 x 109 pu, 약 4 x 109 pu, 약 1 x 1010 pu, 약 2 x 1010 pu, 약 4 x 1010 pu, 약 1 x 1011 pu, 약 2 x 1011 pu, 약 4 x 1011 pu, 약 1 x 1012 pu, 약 2 x 1012 pu, 또는 약 4 x 1012 pu의 아데노바이러스 벡터이다. 예를 들어, 아데노바이러스 벡터에 대해, Nabel외에게, 2013년 6월 4일 수여된, 미국 특허 8,454,972 B2를 참조하며, 이는 본 명세서에 참고로 포함되고, 이의 컬럼 29, 36 내지 58 행의 용량을 참조한다. 본 명세서의 일 구현예에서, 아데노바이러스는 다중 용량을 통해 전달된다.
본 명세서의 일 구현예에서, 전달은 AAV를 통해 이루어진다. 인간에 대한 AAV의 생체내 전달을 위한 치료적으로 유효한 용량은, 용액 ml 당 약 1 x 1010 내지 약 1 x 1010의 작용적 AAV를 함유하는 약 20 ml 내지 약 50 ml 범위의 식염수 용액인 것으로 여겨진다. 용량은 임의의 부작용에 대하여 치료 이익의 균형을 맞추도록 조정될 수 있다. 본 명세서의 일 구현예에서, AAV 용량은 일반적으로 약 1 x 105 내지 1 x 1050 개의 게놈 AAV, 약 1 x 108 내지 1 x 1020 개의 게놈 AAV, 약 1 x 1010 내지 약 1 x 1016 개의 게놈, 또는 약 1 x 1011 내지 약 1 x 1016 개의 게놈 AAV의 농도 범위 내에 있다. 인간 용량은 약 1 x 1013 개의 게놈 AAV이다. 이와 같은 농도는 약 0.001 ml 내지 약 100 ml, 약 0.05 ml 내지 약 50 ml, 또는 약 10 ml 내지 약 25 ml의 담체 용액 중에서 전달될 수 있다. 다른 효과적인 용량은 당업자에 의해, 용량 반응 곡선을 수립하는 일상적 시험을 통해 쉽게 수립될 수 있다. 예를 들어, 2013년 3월 26일 등록된 Hajjar 외의 미국 특허 8,404,658 B2, 27 칼럼 45 내지 60 행을 참조한다.
본 명세서의 일 구현예에서, 전달은 플라스미드를 통해 이루어진다. 이와 같은 플라스미드 조성물에서, 용량은 반응을 유발하는 데 충분한 양의 플라스미드여야 한다. 예를 들어, 플라스미드 조성물 중의 플라스미드 DNA의 적합한 양은 70 kg의 개체 당 약 0.1 mg 내지 약 2 mg, 또는 약 1 μg 내지 약 10 μg일 수 있다. 본 발명의 플라스미드는 일반적으로 (i) 프로모터; (ii) 상기 프로모터에 작동 가능하게 연결된 핵산-표적화 CRISPR 효소를 인코딩하는 서열; (iii) 선택 가능 마커; (iv) 복제 원점; 및 (v) (ii)에 작동 가능하게 연결되는 (ii)의 다운스트림 전사 종결자를 포함할 것이다. 플라스미드는 또한 CRISPR 복합체의 RNA 성분을 인코딩할 수 있지만, 대신에 이들 중 하나 이상은 상이한 벡터 상에서 인코딩될 수 있다.
본 명세서의 용량은 평균 70 kg 개체를 기준으로 한다. 투여 빈도는 해당 분야의 숙련된 의학적 또는 수의학적 실행자(예를 들어, 의사, 수의사) 또는 과학자의 영역 내이다. 또한, 실험에 사용된 마우스는 통상적으로 약 20 g이며, 마우스 실험으로부터 70 kg 개체까지 증대될 수 있음이 주목된다.
일부 구현예에서, 본 발명의 RNA 분자는 리포좀 또는 리포펙틴 제형 등으로 전달되며, 당업자에게 잘 공지된 방법에 의해 제조될 수 있다. 이와 같은 방법은, 예를 들어 미국 특허 5,593,972, 5,589,466, 및 5,580,859에 기재되어 있으며, 이들 특허는 본 명세서에 참조로서 포함된다. 포유류 세포 내로의 siRNA의 향상 및 개선된 전달을 구체적으로 목표로 하는 전달 시스템이 개발되었고(예를 들어, 문헌[Shen et al FEBS Let. 2003, 539:111-114]; [Xia et al., Nat. Biotech. 2002, 20:1006-1010]; [Reich et al., Mol. Vision. 2003, 9: 210-216]; [Sorensen et al., J. Mol. Biol. 2003, 327: 761-766]; [Lewis et al., Nat. Gen. 2002, 32: 107-108] 및 [Simeoni et al., NAR 2003, 31, 11: 2717-2724] 참조), 본 발명에 적용될 수 있다. siRNA는 최근에 영장류에서 유전자 발현의 억제를 위해 성공적으로 사용되었다(예를 들어, 또한 본 발명에 적용될 수 있는 문헌[Tolentino et al., Retina 24(4):660] 참조).
실제로, RNA 전달은 생체내 전달의 유용한 방법이다. 리포좀 또는 입자를 사용하여 핵산-표적화 Cas 단백질 Cas9 및 가이드 RNA gRNA(예를 들어, HR 수복 주형)를 세포 내로 전달할 수 있다. 따라서, CasCas9과 같은 핵산-표적화 Cas 단백질/CRISPR 효소의 전달 및/또는 본 발명의 가이드 RNA의 전달은 RNA 형태로, 그리고 미세소포, 리포좀 또는 입자를 통해 이루어질 수 있다. 예를 들어, Cas mRNA 및 가이드 RNA는 생체내 전달을 위해 리포좀 입자 내로 패키징될 수 있다. Life Technologies로부터의 리포펙타민(Lipofectamine)과 같은 리포좀 형질감염 시약 및 시판 중인 다른 시약은 RNA 분자를 간에 효과적으로 전달할 수 있다.
RNA의 전달 수단은 또한 바람직하게는 나노입자(문헌[Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010]) 또는 엑소좀(문헌[Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641])을 통한 RNA의 전달을 포함한다. 실제로, 엑소좀은 RNA-표적화 시스템과 조금 유사한 시스템인 전달 siRNA에서 특히 유용한 것으로 나타났다. 예를 들어, El-Andaloussi S 외(문헌["Exosomes-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. Epub 2012 Nov 15.])은 엑소좀이 상이한 생물학적 장벽을 가로질러 약물을 전달하기 위한 촉망받는 도구가 되고 시험관내 및 생체내에서 siRNA의 전달을 위해 이용될 수 있는 방법을 기재한다. 이들의 접근법은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하여, 발현 벡터의 형질감염을 통해 표적화된 엑소좀을 생성하는 것이다. 이어서, 엑소좀은 형질감염된 세포 상청액으로부터 정제 및 특성화된 다음, RNA는 엑소좀에 로딩된다. 본 발명에 따른 전달 또는 투여는 엑소좀을 이용하여, 특히 비제한적으로 뇌로 실행될 수 있다. 비타민 E(α-토코페롤)는 핵산-표적화 Cas 단백질과 컨쥬게이트될 수 있고, 예를 들어 뇌에 짧은 간섭 RNA(siRNA)를 전달하기 위해 Uno 외(HUMAN GENE THERAPY 22:711-719(June 2011))에 의해 행해지는 것과 유사한 방식으로 고밀도 지단백질(HDL)과 함께 뇌에 전달될 수 있다. 마우스에 인산염 완충 식염수(PBS) 또는 유리 TocsiBACE 또는 Toc-siBACE/HDL이 충전되고, 뇌 주입 키트 3(Brain Infusion Kit 3)(Alzet)과 연결된 삼투 미니펌프(Osmotic minipump)(모델 1007D; Alzet, 미국 캘리포니아주 쿠퍼티노 소재)를 통해 주입하였다. 뇌 주입 캐뉼라를 등쪽의 제3 뇌실 내로의 주입을 위해 중앙에서 브레그마(bregma)보다 약 0.5 mm 뒤에 위치시켰다. Uno 외는 HDL과 함께 3 nmol만큼 적은 Toc-siRNA가 동일한 ICV 주입 방법에 의해 유사한 정도로 표적 감소를 유도할 수 있었다는 것을 발견하였다. α-토코페롤에 컨쥬게이트되고 뇌에 표적화된 HDL과 동시-투여되는 유사한 용량의 핵산-표적화 이펙터 단백질이 본 발명에서 인간에 대해 고려될 수 있으며, 예를 들어 뇌에 표적화된 약 3 nmol 내지 약 3 μmol의 핵산-표적화 이펙터 단백질이 고려될 수 있다. Zou 외(HUMAN GENE THERAPY 22:465-475(April 2011))는 래트의 척수에서 생체내 유전자 침묵화를 위한 PKCγ를 표적화하는 짧은 헤어핀 RNA의 렌티바이러스-매개의 전달 방법을 기재한다. Zou 외는 척추강내 카테터에 의해 1 x 109 형질도입 단위(TU)/ml의 역가를 갖는 재조합 렌티바이러스 약 10 μl를 투여하였다. 뇌에 표적화된 렌티바이러스 벡터에서 발현된 유사한 용량의 핵산-표적화 이펙터 단백질이 본 발명에서 인간에 대해 고려될 수 있으며, 예를 들어 1 x 109 형질도입 단위(TU)/ ml의 역가를 갖는 렌티바이러스에서 뇌에 표적화된 약 10 ml 내지 50 ml의 핵산-표적화 이펙터 단백질이 고려될 수 있다.
뇌로의 국소 전달에 관하여, 이는 다양한 방법으로 달성될 수 있다. 예를 들어, 물질은, 예를 들어, 주사에 의해 선상체 내로 전달될 수 있다. 주사는 개두술을 통해 정위적으로 실행될 수 있다.
패키징 및 프로모터 일반
생체내에서 게놈 변형을 매개하기 위해 핵산-표적화 이펙터를 코딩하는 핵산 분자, 예를 들어 DNA를 벡터, 예를 들어 바이러스 벡터로 패키징하는 방법은 다음을 포함한다:
NHEJ-매개 유전자 녹아웃을 달성하는 것:
단일 바이러스 벡터:
두 개 이상의 발현 카세트를 함유하는 벡터:
프로모터-핵산 표적화 이펙터 단백질 코딩 핵산 분자-터미네이터
프로모터-가이드 RNA1-터미네이터
프로모터-가이드 RNA(N)-터미네이터(벡터의 크기 제한까지)
이중 바이러스 벡터:
핵산-표적화 이펙터 단백질의 발현을 구동하기 위한 하나의 발현 카세트를 함유하는 벡터 1
프로모터-핵산-표적화 이펙터 단백질 코딩 핵산 분자-터미네이터
하나 이상의 가이드RNA의 발현을 구동하기 위한 하나 이상의 발현 카세트를 함유하는 벡터 2
프로모터-가이드 RNA1-터미네이터
프로모터-가이드 RNA1(N)-터미네이터(벡터의 크기 제한까지)
상동성-지시되는 수선을 매개하는 것.
상기 기재된 단일 및 이중 바이러스 벡터 접근에 추가하여, 상동성-지시되는 수선 주형을 전달하기 위해 추가적인 벡터가 사용된다.
핵산-표적화 이펙터 단백질 코딩 핵산 분자 발현을 구동하기 위해 사용되는 프로모터는 다음을 포함할 수 있다:
AAV ITR은 프로모터로서 역할을 할 수 있다: 이것은(벡터에서 공간을 차지할 수 있는) 추가적인 프로모터 요소에 대한 필요성을 제거하는 데 유리하다. 해방된 추가 공간은 추가적인 요소(gRNA 등)의 발현을 구동하는 데 사용될 수 있다. 또한, ITR 활성은 상대적으로 더 약하므로 핵산-표적화 이펙터 단백질의 과발현으로 인한 잠재적인 독성을 감소시키는 데 사용될 수 있다.
편재하는 발현을 위해, 프로모터: CMV, CAG, CBh, PGK, SV40, 페리틴 중쇄 또는 경쇄 등을 사용할 수 있다.
뇌 또는 다른 CNS 발현에서, 프로모터: 모든 뉴런에 대해 시냅신I, 흥분성 뉴런에 대해 CaMKII알파, GABAergic 뉴런에 대해 GAD67 또는 GAD65 또는 VGAT 등을 사용할 수 있다.
간 발현에서, 알부민 프로모터를 사용할 수 있다.
폐 발현에서, SP-B를 사용할 수 있다.
내피 세포에서, ICAM을 사용할 수 있다.
조혈 세포에서 IFN베타 또는 CD45를 사용할 수 있다.
조골세포에서 OG-2를 사용할 수 있다.
가이드 RNA를 유도하기 위해 사용되는 프로모터는 다음을 포함할 수 있다:
U6 또는 H1과 같은 Pol III 프로모터.
가이드 RNA를 발현시키기 위한 Pol II 프로모터 및 인트론 카세트의 사용.
아데노 관련 바이러스(AAV)
핵산-표적화 이펙터 단백질 및 하나 이상의 가이드 RNA는 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 다른 플라스미드 또는 바이러스 벡터 유형을 사용하여, 특히, 예를 들어, 미국 특허 8,454,972(아데노바이러스에 대한 제형, 용량), 8,404,658(AAV에 대한 제형, 용량) 및 5,846,946(DNA 플라스미드에 대한 제형, 용량)으로부터의 제형 및 용량, 및 렌티바이러스, AAV 및 아데노바이러스를 수반하는 임상 시험 및 임상 시험에 관한 간행물로부터의 제형 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV에 대해, 투여 경로, 제형 및 용량은 미국 특허 8,454,972에서와 같고, AAV를 수반하는 임상 시험에서와 같을 수 있다. 아데노바이러스에 대해, 투여 경로, 제형 및 용량은 미국 특허 8,404,658에서와 같을 수 있고 아데노바이러스를 수반하는 임상 시험에서와 같을 수 있다. 플라스미드 전달에 대해, 투여 경로, 제형 및 용량은 미국 특허 5,846,946에서와 같고, 플라스미드를 수반하는 임상 연구에서와 같을 수 있다. 용량은 평균 70 kg 개체(예를 들어, 성인 남성)를 기준으로 하거나 또는 이로 추정될 수 있고, 상이한 체중 및 종의 환자, 대상체, 포유류에 대해 조정될 수 있다. 투여 빈도는 환자 또는 대상체의 연령, 성별, 일반적 건강상태, 다른 질환 및 다루어질 특정 질환 또는 증상을 포함하는 보통의 인자에 따라서 의학적 또는 수의학적 실행자(예를 들어, 의사, 수의사)의 영역 내에 있다. 바이러스 벡터는 관심 조직 내에 주사될 수 있다. 세포 유형 특이적 게놈/트랜스크립톰 변형을 위해, 핵산-표적화 이펙터 단백질의 발현은 세포 유형 특이적 프로모터에 의해 유도될 수 있다. 예를 들어, 간 특이적 발현은 알부민 프로모터를 사용할 수 있고, 뉴런 특이적 발현(예를 들어, CNS 장애를 표적화하기 위함)은 시냅신 I 프로모터를 사용할 수 있다.
생체내 전달에 관하여, AAV는 몇 가지 이유로 다른 바이러스 벡터에 비하여 유리하다:
Figure pat00001
낮은 독성(이것은 면역 반응을 활성화시킬 수 있는 세포 입자의 초원심분리를 필요로 하지 않는 정제 방법 때문일 수 있음), 및
Figure pat00002
숙주 게놈 내로 통합하지 않기 때문에 삽입 돌연변이유발을 야기할 확률이 낮음.
AAV는 4.5 또는 4.75 Kb의 패키징 한계를 갖는다. 이것은 핵산-표적화 이펙터 단백질(예를 들어 C2c2 같은 제V형 단백질)뿐만 아니라 프로모터 및 전사 터미네이터가 모두 동일한 바이러스 벡터 내에 맞춰져야 함을 의미한다. 따라서, 본 발명의 일 구현예는 더 짧은 핵산-표적화 이펙터 단백질의 상동체를 이용하는 것을 포함한다.
AAV에 관해서, AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적화될 세포에 관한 AAV의 AAV를 선택할 수 있고; 예를 들어, 뇌 또는 뉴런 세포를 표적화하기 위하여 AAV 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있으며; 심장 조직을 표적화하기 위하여 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용하다. 본 명세서의 프로모터 및 벡터는 개별적으로 바람직하다. 이들 세포에 관한 특정 AAV 혈청형의 표 작성(문헌[Grimm, D. et al, J. Virol. 82: 5887-5911(2008)] 참조)은 다음과 같다:
렌티바이러스
렌티바이러스는 유사분열과 유사분열 후 세포 둘 다에서 그들의 유전자를 감염 및 발현시키는 능력을 갖는 복합 레트로바이러스이다. 가장 흔히 알려진 렌티바이러스는 광범위한 세포 유형을 표적화하기 위해 다른 바이러스의 외피 당단백질을 사용하는 인간 면역결핍 바이러스(HIV)이다.
렌티바이러스는 다음과 같이 제조될 수 있다. (렌티바이러스 전달 플라스미드 백본을 함유하는) pCasES10의 클로닝 후에, 낮은 계대(p=5)에서 HEK293FT를 10% 우태아혈청이 있고 항생제가 없는 DMEM 중의 형질감염 전날에 50% 컨플루언스(confluence)까지 T-75 플라스크에 씨딩하였다. 20시간 후에, 배지를 OptiMEM(무혈청) 배지로 바꾸고, 4 시간 후에 형질감염을 행하였다. 세포를 10 μg의 렌티바이러스 전달 플라스미드(pCasES10), 및 5 μg의 pMD2.G(VSV-g 위형), 및 7.5 μg의 psPAX2(gag/pol/rev/tat)의 패키징 플라스미드를 이용하여 형질감염시켰다. 양이온성 지질 전달제(50 μl 리포펙타민 2000 및 100 μl 플러스(Plus) 시약)를 이용하여 4 ml OptiMEM 중에서 형질감염을 행하였다. 6 시간 후, 배지를 10% 우태아혈청이 있는 무항생제 DMEM으로 바꾸었다. 이들 방법은 세포 배양 동안 혈청을 사용하지만, 무혈청 방법이 바람직하다.
렌티바이러스는 다음과 같이 정제될 수 있다. 바이러스 상청액을 48 시간 후에 수집하였다. 상청액을 먼저 데브리스(debris)를 없애고, 0.45 um 저 단백질 결합(PVDF) 필터를 통해 여과시켰다. 이어서, 이들을 24,000 rpm에서 2 시간 동안 초원심분리기에서 회전시켰다. 바이러스 펠렛을 4C에서 밤새 50 ul의 DMEM 중에서 재현탁화시켰다. 이어서 이들을 분주하고 즉시 -80℃에서 즉시 동결시켰다.
또 다른 구현예에서, 말 감염성 빈혈 바이러스(equine infectious anemia virus; EIAV)에 기반한 최소 비-영장류 렌티바이러스 벡터는 또한, 특히 눈 유전자 치료법을 위해 고려된다(예를 들어, 문헌[Balagaan, J Gene Med 2006; 8: 275 - 285] 참조). 또 다른 구현예에서, RetinoStat®, 망(web) 형태의 노인성 황반변성의 치료를 위한 망막하 주사를 통해 전달되는 혈관신생억제 단백질 엔도스타틴 및 앤지오스타틴을 발현시키는 말 감염성 빈혈 바이러스-기반의 렌티바이러스 유전자 치료법 벡터가 또한 고려되며(예를 들어, 문헌[Binley et al., HUMAN GENE THERAPY 23:980-991(September 2012)]), 이러한 벡터는 본 발명의 핵산-표적화 시스템을 위해 변형될 수 있다.
또 다른 구현예에서, HIV tat/rev에 의해 공유되는 공통 엑손을 표적화하는 siRNA, 핵소체-국소화 TAR 데코이(decoy), 및 항-CCR5-특이적 해머헤드(hammerhead) 리보자임을 이용하는 자가-비활성화 렌티바이러스 벡터(예를 들어, 문헌[DiGiusto et al.(2010) Sci Transl Med 2:36ra43] 참조)가 본 발명의 핵산-표적화 시스템에 대해 사용되고/사용되거나 적합하게 될 수 있다. 최소 2.5 x 106 개 CD34+ 세포/킬로그램(환자의 체중)을 수집하고, 2 x 106 개 세포/ml의 밀도에서 2 μmol/L-글루타민, 줄기 세포 인자(100 ng/ml), Flt-3 리간드(Flt-3L)(100 ng/ml), 및 트롬보포이에틴(10 ng/ml)(CellGenix)을 함유하는 X-VIVO 15 배지(Lonza))에서 16 시간 내지 20 시간 동안 사전자극할 수 있다. 사전자극된 세포는 피브로넥틴(25 mg/cm2)으로 코팅된 75-cm2 조직 배양 플라스크에서 16 시간 내지 24 시간 동안 감염다중도 5로 렌티바이러스에 의해 형질도입될 수 있다(RetroNectin, Takara Bio Inc.).
렌티바이러스 벡터는 파킨슨병의 치료에서와 같이 개시되었으며, 예를 들어 미국 특허 공개 20120295960 및 미국 특허 7303910 및 7351585를 참조한다. 렌티바이러스 벡터는 또한 안질환의 치료용으로 개시되었으며, 예를 들어 미국 특허 공개 20060281180, 20090007284, US20110117189; US20090017543; US20070054961, US20100317109를 참조한다. 렌티바이러스 벡터는 또한 뇌에 대한 전달용으로 개시되었으며, 예를 들어 미국 특허 공개 US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 및 미국 특허 US7259015를 참조한다.
RNA 전달
RNA 전달: 핵산-표적화 Cas 단백질, 예를 들어 C2c2와 같은 제V형 단백질, 및/또는 가이드 RNA는 RNA의 형태로 또한 전달될 수 있다. 핵산-표적화 Cas 단백질(예를 들어 C2c2와 같은 제VI형 단백질) mRNA는 시험관내 전사를 이용하여 생성될 수 있다. 예를 들어, 핵산-표적화 이펙터 단백질(예를 들어 C2c2와 같은 제V형 단백질) mRNA는 다음 요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: 베타 글로빈-폴리A 테일(120 개 이상의 아데닌의 스트링(string))로부터의 T7_프로모터-코작 서열(GCCACC)-이펙터 단백질-3' UTR. 카세트는 T7 중합효소에 의한 전사를 위해 사용될 수 있다. 가이드 RNA는 또한 T7_프로모터-GG-가이드 RNA 서열을 함유하는 카세트로부터의 시험관내 전사를 사용하여 전사될 수 있다.
발현을 향상시키고 가능한 독성을 감소시키기 위해, 핵산-표적화 이펙터 단백질-코딩 서열 및/또는 가이드 RNA는, 예를 들어, 슈도-U 또는 5-메틸-C를 사용하여 하나 이상의 변형된 뉴클레오시드를 포함하도록 변형될 수 있다.
mRNA 전달 방법은 현재 간 전달용으로 특히 촉망된다.
RNA 전달에 대한 많은 임상적 연구는 RNAi 또는 안티센스에 집중되어 있으나, 이들 시스템은 본 발명을 이행하기 위하여 RNA의 전달에 적합하게 될 수 있다. 따라서, RNAi 등에 대한 하기의 참고문헌을 확인해야 한다.
입자 전달 시스템 및/또는 제형:
여러 유형의 입자 전달 시스템 및/또는 제형은 다양한 범위의 생체의학 적용에서 유용하다고 알려져 있다. 일반적으로, 입자는 이의 운반 및 특성에 대해서 전체 유닛으로서 거동하는 작은 물체로서 규정된다. 입자는 직경에 따라서 추가로 분류된다. 조립 입자는 2,500 나노미터 내지 10,000 나노미터 사이의 범위를 망라한다. 미세 입자는 100 나노미터 내지 2,500 나노미터 사이의 크기이다. 초미세 입자, 또는 나노입자는 일반적으로 1 나노미터 내지 100 나노미터 크기 사이이다. 100-nm 한계의 근거는 벌크 물질로부터 입자를 구별하는 신규한 특성이 통상적으로 100 nm 미만의 역치 길이 규모에서 발생한다는 사실이다.
본 명세서에서 사용된 바와 같이, 입자 전달 시스템/제형은 본 발명에 따른 입자를 포함하는 임의의 생물학적 전달 시스템/제형으로서 규정된다. 본 발명에 따른 입자는 100 미크론(μm) 미만의 가장 큰 크기(예를 들어, 직경)를 갖는 임의의 개체(entity)이다. 일부 구현예에서, 본 발명의 입자는 10 μm 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 2000 나노미터(nm) 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 1000 나노미터(nm) 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 200 nm, 또는 100 nm 미만의 가장 큰 치수를 갖는다. 통상적으로, 본 발명의 입자는 500 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 250 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 200 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 150 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 100 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 더 작은 입자, 예를 들어 50 nm 이하의 가장 큰 치수를 갖는 더 작은 입자가 본 발명의 일부 구현예에서 사용된다. 일부 구현예에서, 본 발명의 입자는 25 nm 및 200 nm 사이 범위의 가장 큰 치수를 갖는다.
입자 특성화(예를 들어, 형태, 치수 등의 특성화를 포함함)는 상이한 기법을 사용하여 수행된다. 일반적인 기법은 전자 현미경검사법(TEM, SEM), 원자력 현미경검사법(AFM), 동적 광 산란(DLS), X-선 광전자 분광법(XPS), 분말 X-선 회절(XRD), 푸리에 형질전환 적외선 분광광도법(FTIR), 매트릭스-보조 레이저 탈착/이온화 비행시간형 질량 분석기(MALDI-TOF), 자외선-가시 분광법, 이중 분극 간섭계 및 핵 자기 공명(NMR)이다. 특성화(치수 측정)는 본 발명의 임의의 시험관내, 생체외 및/또는 생체내 적용을 위한 전달에 있어서 최적인 크기의 입자를 제공하기 위해 고유 입자(즉, 로딩 이전)에 대해 또는 카고(cargo)의 로딩 후(본 명세서에서 카고는, 예를 들어, 하나 이상의 성분의 CRISPR-Cas 시스템, 예를 들어, CRISPR 효소 또는 mRNA 또는 가이드 RNA, 또는 이들의 임의의 조합을 지칭하며, 추가적인 담체 및/또는 부형제를 포함할 수 있음)에 이루어질 수 있다. 바람직한 특정 구현예에서, 입자 치수(예를 들어, 직경) 특성화는 동적 레이저 산란(DLS)을 사용한 측정을 기반으로 한다. 입자, 이들을 제조하고 사용하는 방법 및 이들의 측정과 관련하여 미국 특허 8,709,843; 미국 특허 6,007,845; 미국 특허 5,855,913; 미국 특허 5,985,309; 미국 특허 5,543,158; 및 2014년 5월 11일에 온라인 공개된 간행물(문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology(2014), doi:10.1038/nnano.2014.84])이 언급된다.
본 발명의 범주 내의 입자 전달 시스템은 고체, 반고체, 에멀젼 또는 콜로이드 입자를 포함하지만 이에 제한되지 않는 임의의 형태로 제공될 수 있다. 예를 들어, 지질-기반 시스템, 리포좀, 미셀, 미세소포, 엑소좀, 또는 유전자총을 포함하지만 이에 제한되지는 않는 본 명세서에 기재된 전달 시스템 중 임의의 전달 시스템이 본 발명의 범주 내의 입자 전달 시스템으로서 제공될 수 있다.
입자
CRISPR 효소 mRNA 및 가이드 RNA는 입자 또는 지질 외피를 사용하여 동시에 전달될 수 있으며; 예를 들어, 복합체로서, 예를 들어 CRISPR 효소 및 본 발명의 RNA는 문헌[Dahlman et al., WO2015089419 A2] 및 거기서 인용된 문헌들에서와 같이 입자, 예를 들어 7C1(예를 들어, 문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology(2014), 2014년 5월 11일 온라인 발행, doi:10.1038/nnano.2014.84])을 통해, 예를 들어 지질 또는 리피도이드(lipidoid) 및 친수성 중합체, 예를 들어 양이온성 지질 및 친수성 중합체를 포함하는 전달 입자를 통해 전달될 수 있으며, 예를 들어 양이온 지질은 1,2-디올레일-3-트리메틸암모늄-프로판(DOTAP) 또는 1,2-디테트라데카노일-sn-글리세로-3-포스포콜린(DMPC)을 포함하고/포함하거나, 여기서 친수성 중합체는 에틸렌 글리콜 또는 폴리에틸렌 글리콜(PEG)을 포함하고/포함하거나; 여기서 입자는 콜레스테롤을 추가로 포함하고(예를 들어, 제형 1 = DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0; 제형 번호 2 = DOTAP 90, DMPC 0, PEG 10, 콜레스테롤 0; 제형 번호 3 = DOTAP 90, DMPC 0, PEG 5, 콜레스테롤 5로부터의 입자), 여기서 입자는 효율적인 다단계 공정을 사용하여 형성되며, 여기서 먼저 이펙터 단백질 및 RNA는 함께, 예를 들어 1:1의 몰 비로, 예를 들어 실온에서, 예를 들어 30 분 동안, 예를 들어 멸균 무-뉴클레아제 1X PBS 중에서 혼합되고; 별도로 제형에 대해 적용가능함에 따라 DOTAP, DMPC, PEG, 및 콜레스테롤을 알콜, 예를 들어 100% 에탄올에 용해시키고; 2 개의 용액을 함께 혼합하여 복합체를 함유하는 입자를 형성한다.
핵산 및 표적화 단백질(예를 들어, C2c2과 같은 제VI형 단백질) mRNA 및 가이드 RNA는 입자 또는 지질 외피를 사용하여 동시에 전달될 수 있다.
예를 들어, 문헌[Su X, Fricke J, Kavanagh DG, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. Epub 2011 Apr 1)]은 인지질 이중층 쉘에 의해 둘러싸인 폴리(β-아미노 에스테르)(PBAE) 코어를 지니는 생분해성 코어-쉘 구조의 입자를 기재한다. 이들은 생체내 mRNA 전달을 위해 개발되었다. pH-반응성 PBAE 성분은 엔도솜 파괴를 촉진하도록 선택되는 한편, 지질 표면층은 다가양이온 코어의 독성을 최소화하도록 선택되었다. 따라서 이와 같은 것은 본 발명의 RNA를 전달하는 데 바람직하다.
일 구현예에서, 모두 뇌로의 펩티드의 구강 전달, 펩티드의 정맥내 전달 및 펩티드의 비강 전달에 적용될 수 있는 생접착성 중합체의 자가 조립에 기반한 입자가 고려된다. 다른 구현예, 예를 들어 소수성 약물의 구강 흡수 및 눈 전달이 또한 고려된다. 분자 외피 기술은 보호되고, 질병의 부위에 전달되는 조작된 중합체 외피를 수반한다(예를 들어, 문헌[Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026]; [Siew, A., et al. Mol Pharm, 2012. 9(1):14-28]; [Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36]; [Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80]; [Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74]; [Garrett, N.L., et al. J Biophotonics, 2012. 5(5-6):458-68]; [Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688]; [Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33]; [Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40]; [Qu, X.,et al. Biomacromolecules, 2006. 7(12):3452-9] 및 [Uchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199] 참조). 표적 조직에 따라, 약 5 ㎎/kg 용량의 단일 또는 다중 용량이 고려된다.
일 구현예에서, MIT의 Dan Anderson 연구소에 의해 개발된 종양 성장을 중단시키기 위해 암 세포에 RNA를 전달할 수 있는 입자가 본 발명의 핵산-표적화 시스템에 대해 사용되고/사용되거나 적합하게 될 수 있다. 특히, Anderson 연구소는 새로운 생체재료 및 나노제형의 합성, 정제, 특성화 및 제형화를 위한 완전히 자동화된 조합 시스템을 개발하였다. 예를 들어, 문헌[Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6]; [Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5]; [Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64]; [Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7]; [Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9] 및 [Lee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93]을 참조한다.
미국 특허 출원 20110293703은 또한 본 발명의 핵산-표적화 시스템을 전달하기 위해 적용될 수 있는 폴리뉴클레오티드의 투여에서 특히 유용한 리피도이드 화합물에 관한 것이다. 일 양태에서, 아미노알콜 리피도이드 화합물은 작용제와 병용되어 세포 또는 대상체에게 전달되어 마이크로입자, 나노입자, 리포좀, 또는 미셀을 형성한다. 입자, 리포좀 또는 미셀에 의해 전달될 작용제는 기체, 액체 또는 고체의 형태일 수 있고, 작용제는 폴리뉴클레오티드, 단백질, 펩티드 또는 소분자일 수 있다. 미노알콜 리피도이드 화합물은 다른 아미노알콜 리피도이드 화합물, 중합체(합성 또는 천연), 계면활성제, 콜레스테롤, 탄수화물, 단백질, 지질 등과 조합되어 입자를 형성할 수 있다. 이어서 이들 입자는 선택적으로 약학적 부형제와 조합되어 약학적 조성물을 형성할 수 있다.
미국 특허 공개 20110293703은 또한 아미노알콜 리피도이드 화합물의 제조 방법을 제공한다. 1 이상의 당량의 아민을 본 발명의 아미노알콜 리피도이드 화합물을 형성하기에 적합한 조건 하에서 에폭시드-말단 화합물의 1 당량 이상과 반응되게 한다. 특정 구현예에서, 아민의 모든 아미노기는 에폭시드-말단 화합물과 완전히 반응되어 3 차 아민을 형성한다. 다른 구현예에서, 아민의 모든 아미노기는 3 차 아민을 형성하기 위하여 에폭시드-말단 화합물과 완전히 반응되지 않으며, 이에 의해 아미노알콜 리피도이드 화합물에서 1 차 또는 2 차 아민이 초래된다. 이들 1 차 또는 2 차 아민은 그대로 남아 있거나, 또 다른 친핵체, 예를 들어 상이한 에폭시드-말단 화합물과 반응할 수 있다. 당업자에 의해 인식될 바와 같이, 아민을 과량 미만의 에폭시드-말단 화합물과 반응시키는 것은 다양한 수의 테일을 지니는 복수의 상이한 아미노알콜 리피도이드 화합물을 초래할 것이다. 특정 아민은 2 개의 에폭시드 유래 화합물 테일로 완전히 작용화될 수 있는 반면, 다른 분자는 에폭시드 유래 화합물 테일에 의해 완전히 작용화되지 않을 것이다. 예를 들어, 디아민 또는 폴리아민은 분자의 다양한 아미노 모이어티를 제거하는 1 개, 2 개, 3 개 또는 4 개의 에폭시드 유래 화합물 테일을 포함하여 1 차, 2 차 및 3 차 아민을 초래할 수 있다. 특정 구현예에서, 모든 아미노기는 완전히 작용화되지 않는다. 특정 구현예에서, 2 가지 동일 유형의 에폭시드 말단 화합물이 사용된다. 다른 구현예에서, 2 개 이상의 상이한 에폭시드 말단 화합물이 사용된다. 아미노알콜 리피도이드 화합물의 합성은 용매와 함께 또는 용매 없이 수행되고, 합성은 30℃ 내지 100℃, 바람직하게는 대략 50℃ 내지 90℃ 범위의 고온에서 실행될 수 있다. 제조된 아미노알콜 리피도이드 화합물은 선택적으로 정제될 수 있다. 예를 들어, 아미노알콜 리피도이드 화합물의 혼합물을 정제하여, 특정 수의 에폭시드 유래 화합물 테일을 지니는 아미노알콜 리피도이드 화합물을 수득할 수 있다. 또는 혼합물을 정제하여 특정 입체 이성질체 또는 구조 이성질체를 수득할 수 있다. 아미노알콜 리피도이드 화합물은 또한 알킬 할로겐화물(예를 들어, 요오드화메틸) 또는 다른 알킬화제를 사용하여 알킬화될 수 있고/있거나 이들은 아실화될 수 있다.
미국 특허 공개 20110293703은 또한 본 발명의 방법에 의해 제조된 아미노알콜 리피도이드 화합물의 라이브러리를 제공한다. 이들 아미노알콜 리피도이드 화합물은 액체 핸들러(handler), 로봇, 마이크로타이터 플레이트, 컴퓨터 등을 수반하는 고처리량 기법을 사용하여 제조 및/또는 스크리닝될 수 있다. 특정 구현예에서, 아미노알콜 리피도이드 화합물을 폴리뉴클레오티드 또는 다른 작용제(예를 들어, 단백질, 펩티드, 소분자)를 세포에 형질감염시키는 이들의 능력에 대해 스크리닝한다.
미국 특허 공개 20130302401은 조합 중합을 사용하여 제조된 폴리(베타-아미노 알콜)(PBAA)의 부류에 관한 것이다. 본 발명의 PBAA는 코팅(예를 들어, 의료장치 또는 이식물에 대한 필름 또는 다중층 필름의 코팅), 첨가제, 재료, 부형제, 비생물오손제(non-biofouling agent), 미세패터닝제 및 세포 캡슐화제로서 생명공학 및 생체의학 적용분야에서 사용될 수 있다. 표면 코팅제로서 사용될 때, 이들 PBAA는 이들의 화학적 구조에 따라서 시험관내와 생체내 둘 다에서 상이한 염증 수준을 유발하였다. 이러한 부류의 물질의 큰 화학적 다양성은 출원인이 시험관내 대식세포 활성화를 억제하는 중합체 코팅제를 확인하게 하였다. 더욱이, 이들 코팅제는 카르복실화된 폴리스티렌 마이크로입자의 피하 이식 후에 염증 세포의 동원을 감소시키고, 섬유증을 감소시킨다. 이들 중합체를 사용하여 세포 캡슐화를 위한 고분자전해질 복합체 캡슐을 형성할 수 있다. 본 발명은 또한 미생물방지 코팅, DNA 또는 siRNA 전달, 및 줄기 세포 조직 조작과 같은 다수의 다른 생물학적 적용분야를 가질 수 있다. 미국 특허 공개 20130302401의 교시는 본 발명의 핵산-표적화 시스템에 적용될 수 있다.
또 다른 구현예에서, 지질 나노입자(LNP)가 고려된다. 항트렌스티레틴(anti트렌스티레틴) 짧은 간섭 RNA는 지질 나노입자에서 캡슐화되고, 인간으로 전달되며(예를 들어, 문헌[Coelho et al., N Engl J Med 2013;369:819-29] 참조), 이와 같은 시스템은 본 발명의 핵산-표적화 시스템에 적합하게 되고, 적용될 수 있다. 정맥내로 투여된 체중 kg 당 약 0.01 ㎎ 내지 약 1 ㎎의 용량이 고려된다. 주입 관련 반응의 위험을 감소시키기 위한 의약이 고려되며, 예를 들어 덱사메타손, 아세탐피노펜, 디펜하이드라민 또는 세티리진 및 라니티딘이 고려된다. 5 회 용량에 있어서 4 주마다 킬로그램 당 약 0.3 ㎎의 다회 용량이 또한 고려된다.
LNP는 siRNA를 간에 전달함에 있어 고도로 효과적인 것으로 나타났으며(예를 들어, 문헌[Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470] 참조), 따라서 핵산-표적화 이펙터 단백질을 인코딩하는 RNA를 간으로 전달하기 위해 고려된다. 2 주마다 6 ㎎/kg의 LNP의 약 4 회 용량의 용량이 고려될 수 있다. Tabernero 외는 0.7 ㎎/kg으로 투약한 LNP의 처음 2 사이클 후에 종양 퇴행을 관찰하였고, 6 사이클의 종료까지 환자는 림프절 전이의 완전한 퇴행 및 간 종양의 실질적 수축으로 부분적 반응을 달성하였음을 입증하였다. 관해가 남아 있는 이러한 환자에서 40 회 용량 후에 완전한 반응을 수득하였고, 26 개월에 걸쳐 용량을 제공한 후에 치료를 완료하였다. VEGF 경로 억제제를 이용한 사전 치료법 후에 진행한 신장, 폐 및 림프절을 포함하는 RCC 및 간외영역 질병을 지니는 2 명의 환자는 대략 8 개월 내지 12 개월 동안 모든 부위에서 안정적인 질병을 가졌고, PNET 및 간 전이를 지니는 환자는 안정적인 질병과 함께 18 개월(36 회 용량) 동안 연장 연구를 계속하였다.
그러나, LNP의 전하를 고려하여야 한다. 양이온성 지질은 세포내 전달을 용이하게 하는 비이중층 구조를 유도하기 위해 음으로 하전된 지질과 조합되기 때문이다. 하전된 LNP는 정맥내 주사 후 순환으로부터 빠르게 제거되기 때문에, 7 미만의 pKa 값을 지니는 이온화 가능한 양이온성 지질을 개발하였다(예를 들어, 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011] 참조). 음으로 하전된 중합체, 예를 들어 RNA는 이온화 가능한 지질이 양전하를 나타내는 경우 낮은 pH 값(예를 들어, pH 4)에서 LNP에 로딩될 수 있다. 그러나, 생리적 pH 값에서, LNP는 더 긴 순환 시간과 양립 가능한 낮은 표면 전하를 나타낸다. 이온화 가능한 양이온성 지질의 4 개 종, 즉, 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시-케토-N,N-디메틸-3-아미노프로판(DLinKDMA), 및 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA)에 중점을 두었다. 이들 지질을 함유하는 LNP siRNA 시스템은 생체내 간세포에서 현저하게 상이한 유전자 침묵화 특성을 나타내는 것으로 나타났고, 효능은 인자 VII 유전자 침묵화 모델을 이용하는 시리즈 DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP에 따라 다르다(예를 들어, 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011] 참조). 특히 DLinKC2-DMA를 함유하는 제형에 대하여, 1 μg/ml의 용량의 LNP 또는 LNP 중의 또는 이와 회합된 CRISPR Cas RNA가 고려될 수 있다.
LNP의 제조 및 CRISPR-Cas 캡슐화가 사용될 수 있고/있거나 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011]으로부터 적합하게 될 수 있다. 양이온성 지질 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시케토-N,N-디메틸-3-아미노프로판(DLinK-DMA), 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA),(3-o-[2"-(메톡시폴리에틸렌글리콜 2000) 숙시노일]-1,2-디미리스토일-sn-글리콜(PEG-S-DMG), 및 R-3-[(ω-메톡시-폴리(에틸렌 글리콜)2000) 카르바모일]-1,2-디미리스틸옥시프로필-3-아민(PEG-C-DOMG)은 Tekmira Pharmaceuticals(캐나다 밴쿠버에 소재)에 의해 제공될 수 있거나 합성될 수 있다. 콜레스테롤은 Sigma(미국 미주리주 세인트루이스 소재)로부터 구입할 수 있다. 특정 핵산-표적화 복합체(CRISPR-Cas) RNA는 DLinDAP, DLinDMA, DLinK-DMA 및 DLinKC2-DMA(40:10:40:10 몰비의 양이온성 지질:DSPC:CHOL: PEGS-DMG 또는 PEG-C-DOMG)를 함유하는 LNP 내에 캡슐화될 수 있다. 필요하다면, 0.2% SP-DiOC18(Invitrogen, 캐나다 벌링턴 소재)을 혼입시켜 세포 흡수, 세포내 전달, 및 생체분포를 평가할 수 있다. 캡슐화는 10 mmol/l의 최종 지질 농도로 양이온성 지질:DSPC:콜레스테롤:PEG-c-DOMG(40:10:40:10 몰비)로 구성된 지질 혼합물을 에탄올 중에 용해함으로써 실행될 수 있다. 이러한 지질의 에탄올 용액을 50 mmol/l 시트르산염, pH 4.0에 적가하여 다중 라멜라 소낭를 형성하여 30% 에탄올 vol/vol의 최종 농도를 생성할 수 있다. 압출기(Northern Lipids, 캐나다 벤쿠버 소재)를 사용하여 2 개의 적층 80 nm Nuclepore 폴리카르보네이트 필터를 통해 다중 라멜라 소낭을 압출한 후 거대 단일 라멜라 소낭이 형성될 수 있다. 30% 에탄올 vol/vol을 함유하는 50 mmol/l 시트르산염, pH 4.0 중에 2 mg/ml로 용해시킨 RNA를 압출된 사전형성된 거대 단일 라멜라 소낭에 적가하고, 0.06/1 wt/wt의 최종 RNA/지질 중량비로 일정하게 혼합하면서 30 분 동안 31℃에서 인큐베이션함으로써 캡슐화를 달성할 수 있다. Spectra/Por 2 재생 셀룰로스 투석막을 사용하여 16 시간 동안 인산염 완충 식염수(PBS), pH 7.4에 대해 투석함으로써 에탄올의 제거 및 제형 완충제의 중화를 실행하였다. NICOMP 370 입도 분석기, 소낭/강도 모드, 및 가우시안(Gaussian) 핏팅(Nicomp Particle Sizing, 미국 캘리포니아주 산타 바바라 소재)을 사용하여 동적 광 산란에 의해 입자 크기 분포를 결정할 수 있다. 3 개 모두의 LNP 시스템에 대한 입자 크기는 직경이 약 70 nm일 수 있다. VivaPureD MiniH 컬럼(Sartorius Stedim Biotech)을 사용하여 투석 전 및 후에 수집한 샘플로부터 유리 RNA를 제거함으로써 RNA 캡슐화 효율을 결정할 수 있다. 캡슐화된 RNA는 용리된 입자로부터 추출되고, 260 nm에서 정량화될 수 있다. RNA 대 지질 비는 Wako Chemicals USA(미국 버지니아주 리치몬드 소재)로부터의 콜레스테롤 E 효소 검정을 사용하여 소낭 내 콜레스테롤 함량의 측정에 의해 결정되었다. LNP 및 PEG 지질의 본 명세서에서의 논의와 함께, PEG화 리포좀 또는 LNP는 마찬가지로 핵산-표적화 시스템 또는 이의 성분의 전달에 적합하다.
거대 LNP의 제조는 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011]으로부터 사용될 수 있고/있거나 이에 적합하게 될 수 있다. 지질 예비혼합 용액(20.4 ㎎/㎖ 총 지질 농도)은 50:10:38.5 몰비로 DLinKC2-DMA, DSPC 및 콜레스테롤을 함유하는 에탄올 중에서 제조될 수 있다. 아세트산나트륨은 0.75:1의 몰비(아세트산나트륨:DLinKC2-DMA)로 지질 예비혼합물에 첨가될 수 있다. 지질은 격렬한 교반과 함께 1.85 부피의 시트르산염 완충제(10 mmol/l, pH 3.0)와 혼합물을 합함으로써 이후에 수화되어, 35% 에탄올을 함유하는 수성 완충제 중의 자발적 리포좀 형성을 초래할 수 있다. 리포좀 용액을 37℃에서 인큐베이션시켜 시간-의존적 입자 크기의 증가를 가능하게 할 수 있다. 분취물을 인큐베이션 동안 다양한 시간에 제거하여, 동적 광 산란에 의해 리포좀 크기의 변화를 조사할 수 있다(Zetasizer Nano ZS, Malvern Instruments, 영국 우스터셔 소재). 일단 원하는 입자 크기가 달성되면, 수성 PEG 지질 용액(원액 = 35%(vol/vol) 에탄올 중의 10 mg/ml PEG-DMG)을 리포좀 혼합물에 첨가하여 3.5%의 총 지질의 최종 PEG 몰 농도를 제공할 수 있다. PEG-지질의 첨가 시, 리포좀을 추가 성장을 효과적으로 켄칭시켜 이들의 크기를 해야 한다. 이어서, RNA를 대략 1:10(wt:wt)의 RNA 대 총 지질 비로 빈 리포좀에 첨가한 후에 37℃에서 30 분 동안 인큐베이션시켜 로딩된 LNP를 형성할 수 있다. 혼합물을 후속적으로 PBS 중에 밤새 투석시키고, 0.45-㎛ 주사기 필터로 여과할 수 있다.
구체 핵산(Spherical Nucleic Acid; SNA™) 작제물 및 다른 입자(특히, 금 입자)는 또한 의도된 표적에 핵산-표적화 시스템을 전달하기 위한 수단으로서 고려된다. 유의한 데이터는 핵산 작용화된 금 입자에 기반한 AuraSense Therapeutics의 구체 핵산(SNA™) 작제물이 유용한 것을 나타낸다.
본 명세서의 교시와 함께 이용될 수 있는 문헌은 문헌[Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257], [Hao et al., Small. 2011 7:3158-3162], [Zhang et al., ACS Nano. 2011 5:6962-6970], [Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391], [Young et al., Nano Lett. 2012 12:3867-71], [Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80], [Mirkin, Nanomedicine 2012 7:635-638], [Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691], [Weintraub, Nature 2013 495:S14-S16], [Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630], [Jensen et al., Sci. Transl. Med. 5, 209ra152(2013)] 및 [Mirkin, et al., Small, 10:186-192]을 포함한다.
RNA를 지니는 자가 조립 입자는, 폴리에틸렌 글리콜(PEG)의 원위 말단에 부착된 Arg-Gly-Asp(RGD) 펩티드 리간드로 PEG화된 폴리에틸렌이민(PEI)을 이용하여 작제될 수 있다. 이러한 시스템은, 예를 들어 인테그린을 발현하는 종양 신생혈관을 표적화하고, 혈관 내피 성장 인자 수용체-2(VEGF R2) 발현을 억제하는 siRNA를 전달하여, 이에 의해, 종양 혈관형성을 달성하기 위한 수단으로 사용된다(예를 들어, 문헌[Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19] 참조). 나노플렉스(nanoplex)를 동일한 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조하여 2 내지 6의 범위에 걸쳐 인산염(핵산)에 대한 순 몰 과량의 이온화 가능한 질소(중합체)를 제공할 수 있다. 양이온성 중합체와 핵산 간의 정전기적 상호작용은 약 100 nm의 평균 입자 크기 분포를 갖는 폴리플렉스(polyplex)의 형성을 초래하며, 따라서 본 명세서에서 나노플렉스로서 지칭된다. Schiffelers외의 자가 조립 입자에서의 전달을 위해 약 100 mg 내지 200 mg의 핵산-표적화 복합체 RNA의 용량이 예상된다.
Bartlett 외(문헌[PNAS, September 25, 2007,vol. 104, no. 39])의 나노플렉스가 또한 본 발명에 적용될 수 있다. Bartlett 외의 나노플렉스는 동일 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조되어 2 내지 6의 범위에 걸쳐 인산염(핵산)에 대한 순 몰 과량의 이온화 가능한 질소(중합체)를 제공한다. 양이온성 중합체와 핵산 간의 정전기적 상호작용은 약 100 nm의 평균 입자 크기 분포를 지니는 폴리플렉스의 형성을 초래하였고, 따라서 본 명세서에서 나노플렉스로서 지칭된다. Bartlett 외의 DOTA-siRNA를 다음과 같이 합성하였다: 1,4,7,10-테트라아자사이클로도데칸-1,4,7,10-테트라아세트산 모노(N-하이드록시숙신이미드 에스테르)(DOTA-NHS에스테르)를 Macrocyclics(미국 텍사스주 달라스 소재)에서 주문하였다. 탄산염 완충제(pH 9) 중의 100 배 몰 과량의 DOTA-NHS-에스테르에 의한 아민 변형 RNA 센스 가닥을 마이크로원심분리 튜브에 첨가하였다. 내용물을 실온에서 4 시간 동안 교반시킴으로써 반응시켰다. DOTA-RNA센스 컨쥬게이트를 에탄올 침전시키고, 수 중에 재현탁화한 다음, 미변형 안티센스 가닥에 어닐링시켜 DOTA-siRNA를 수득하였다. 모든 액체를 Chelex-100(Bio-Rad, 미국 캘리포니아주 허큘러스 소재)으로 전처리하여 미량의 금속 오염물질을 제거하였다. Tf-표적화 및 비표적화 siRNA 입자를 사이클로덱스트린-함유 다가양이온을 사용함으로써 형성할 수 있다. 전형적으로, 입자를 전하비 3(+/-) 및 siRNA 농도 0.5 g/리터로 수 중에서 형성하였다. 표적화된 입자의 표면 상의 아다만탄-PEG 분자의 1%를 Tf로 변형시켰다(아다만탄-PEG-Tf). 입자를 주사용 5%(wt/vol) 글루코스 담체 용액 중에서 현탁화시켰다.
Davis 외(문헌[Nature, Vol 464, 15 April 2010])는 표적화된 입자-전달 시스템(임상 시험 등록 번호 NCT00689065)을 사용하는 RNA 임상 시험을 수행한다. 표준 치료 치료법에 난치성인 고형암을 지니는 환자에게 30 분 정맥내 주입에 의해 21 일 사이클 중 제1 일, 제3 일, 제8 일 및 제10 일에 표적화된 입자의 용량을 투여한다. 입자는 하기를 함유하는 합성 전달 시스템을 포함하거나, 으로 essentially 이루어지거나, 으로 이루어진다:(1) 선형, 사이클로덱스트린-기반 중합체(CDP), (2) 암 세포의 표면 상의 TF 수용체(TFR)에 맞물리는 나노입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드, (3) 친수성 중합체(생물학적 유체 중에서 나노입자 안정성을 촉진하기 위해 사용되는 폴리에틸렌 글리콜(PEG)), 및 (4) RRM2의 발현을 감소시키도록 설계된 siRNA(임상에서 사용한 서열은 앞서 정의한 siR2B+5였음). TFR는 악성 세포에서 상향조절되는 것으로 오랫동안 알려져 있고, RRM2는 확립된 항암 표적이다. 이들 입자(CALAA-01로서 정의된 임상 형태)는 비-인간 영장류에서의 다회 투약 연구에서 잘 용인되는 것으로 나타났다. 만성 골수성 백혈병을 지니는 단일 환자에게 리포좀 전달에 의해 siRNA가 투여되었지만, Davis 외의 임상 시험은 표적화된 전달 시스템을 이용하여 siRNA를 전신으로 전달하기 위한 그리고 고형암을 지니는 환자를 치료하기 위한 초기 인간 시험이다. 표적화된 전달 시스템이 인간 종양으로의 기능성 siRNA의 효과적인 전달을 제공할 수 있는지 여부를 확인하기 위해, Davis 외는 3 개의 상이한 투약 코호트로부터의 3 명 환자로부터의 생검을 조사하였으며; 환자 A, B 및 C는 모두 전이성 흑색종을 가졌고, 각각 18 mg m-2, 24 mg m-2 및 30 ㎎ m-2 siRNA의 CALAA-01 용량을 받았다. 유사한 용량이 또한 본 발명의 핵산-표적화 시스템을 위해 고려될 수 있다. 본 발명의 전달은 선형, 사이클로덱스트린-기반 중합체(CDP), 암세포의 표면 상의 TF 수용체(TFR)에 맞물리는 입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드 및/또는 친수성 중합체(예를 들어, 생물학적 유체 중에서 입자 안정성을 촉진하기 위해 사용되는 폴리에틸렌 글리콜(PEG))를 함유하는 입자에 의해 달성될 수 있다.
본 발명과 관련하여, 입자 또는 지질 외피를 사용하여 핵산-표적화 복합체의 하나 이상의 성분, 예를 들어 핵산-표적화 이펙터 단백질 또는 mRNA, 또는 가이드 RNA가 전달될 수 있는 것이 바람직하다. 다른 전달 시스템 또는 벡터가 본 발명의 입자 양태와 함께 사용될 수 있다.
일반적으로, "나노입자"는 1000 nm 미만의 직경을 갖는 임의의 입자를 나타낸다. 바람직한 특정 구현예에서, 본 발명의 나노입자는 500 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 다른 바람직한 구현예에서, 본 발명의 나노입자는 25 nm 내지 200 nm 범위의 가장 큰 치수를 갖는다. 다른 바람직한 구현에에서, 본 발명의 입자는 100 nm 이하의 가장 큰 치수를 갖는다. 다른 바람직한 구현예에서, 본 발명의 나노입자는 35 nm 내지 60 nm 범위의 가장 큰 치수를 갖는다.
본 발명에 포함된 입자는 상이한 형태, 예를 들어 고체 입자(예를 들어, 금속, 예를 들어 은, 금, 철, 티타늄), 비-금속, 지질-기반 고체, 중합체), 입자의 현탁액, 또는 이들의 조합물로 제공될 수 있다. 금속, 유전체, 및 반도체 입자뿐만 아니라 하이브리드 구조(예를 들어, 코어-쉘 입자)가 제조될 수 있다. 반도체 물질로 제조된 입자는 또한 이들이 전자 에너지 수준의 양자화가 발생하기에 충분히 작은(통상적으로, 10 nm 이하) 경우 양자점으로 표지화될 수 있다. 이와 같은 나노규모 입자는 약물 담체 또는 이미징 작용제로서 생물의학 응용에서 사용되며, 본 발명에서 유사한 목적을 위해 적합하게 될 수 있다.
반고체 및 연성 입자가 제조되었고, 이들은 본 발명의 범주 내에 속한다. 반고체 성질의 프로토타입 입자는 리포좀이다. 다양한 유형의 리포좀 입자가 항암 약물 및 백신을 위한 전달 시스템으로서 현재 임상적으로 사용된다. 절반이 친수성이고, 나머지 절반이 소수성인 입자는 야누스(Janus) 입자로 명명되며, 에멀젼을 안정화시키는 데 특히 효과적이다. 이들은 물/오일 계면에서 자가-조립되며, 고체 계면활성제로 작용할 수 있다.
참고로 본 명세서에 포함되는 미국 특허 제8,709,843 호는 조직, 세포, 및 세포내 구획으로의 치료제-함유 입자의 표적화된 전달을 위한 약물 전달 시스템을 제공한다. 상기 발명은 계면활성제, 친수성 중합체 또는 지질에 컨쥬게이트된 중합체를 포함하는 표적화된 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제6,007,845 호는 다작용성 화합물과 하나 이상의 소수성 중합체 및 하나 이상의 친수성 중합체를 공유적으로 연결시킴으로써 형성된 멀티블록 공중합체의 코어를 갖고, 생물학적으로 활성인 물질을 함유하는 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제5,855,913 호는 폐기관계로의 약물 전달을 위해 표면 상에 계면활성제가 혼입된, 0.4 g/㎤ 미만의 탭 밀도(tap density)와 함께 5 ㎛ 내지 30 ㎛의 평균 직경을 갖는 공기역학적으로 가벼운 입자를 갖는 미립자 조성물을 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제5,985,309 호는 폐기관계로의 전달을 위한 계면활성제 및/또는 양으로 또는 음으로 하전된 치료제 또는 진단제 및 반대 전하로 하전된 분자의 친수성 또는 소수성 복합체가 혼입된 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제5,543,158 호는 표면 상에 폴리(알킬렌 글리콜) 모이어티 및 생물학적 활성 물질을 함유하는 생분해성 고체 코어를 갖는 생분해성 주사가능한 입자를 제공한다.
참고로 본 명세서에 포함되는 WO2012135025(또한 US20120251560으로 공개됨)는 컨쥬게이트된 폴리에틸렌이민(PEI) 중합체 및 컨쥬게이트된 아자-마크로사이클(집합적으로, "컨쥬게이트된 리포머" 또는 "리포머"로 지칭됨)이 기재한다. 특정 구현예에서, 이와 같은 본 명세서에 인용된 문서의 방법 및 물질, 예를 들어, 컨쥬게이트된 리포머가 단백질 발현의 조절을 포함하여 유전자 발현을 변형시키기 위한 시험관내, 생체외 및 생체내 게놈 변동을 달성하기 위해 핵산-표적화 시스템의 상황에서 사용될 수 있음이 계획될 수 있다.
일 구현예에서, 입자는 에폭시드-변형된 지질-중합체, 유리하게는 7C1일 수 있다(예를 들어, 문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology(2014), 2014년 5월 11일 온라인 발행, doi:10.1038/nnano.2014.84] 참조). C71을 14:1의 몰비로 C15 에폭시드-말단 지질과 PEI600을 반응시킴으로써 합성하였고, 적어도 40 일 동안 PBS 용액에서 안정적인 입자(35 nm 내지 60 nm의 직경)를 생성시키기 위해 C14PEG2000과 함께 제형화하였다.
폐, 심혈관 또는 신장 세포로 본 발명의 핵산-표적화 시스템을 전달하기 위해 에폭시드-변형된 지질-중합체가 이용될 수 있으나, 당업자는 다른 표적 기관으로 전달하기 위해 시스템을 적합하게 할 수 있다. 약 0.05 mg/kg내지 약 0.6 mg/kg 범위의 용량이 계획된다. 약 2 mg/kg의 전체 용량의 수 일 또는 수 주에 걸친 용량이 또한 계획된다.
엑소좀
엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 전달하는 내인성 나노-소낭이다. 면역원성을 감소시키기 위해, Alvarez-Erviti외(문헌[2011, Nat Biotechnol 29: 341])는 엑소좀 생성을 위해 자가-유래 수상돌기 세포를 사용하였다. 뉴런-특이적 RVG 펩티드에 융합된 엑소좀 막 단백질인 Lamp2b를 발현하도록 수상돌기 세포를 조작함으로써 뇌로의 표적화를 달성하였다. 정제된 엑소좀에 전기천공법에 의해 외인성 RNA를 로딩하였다. 정맥내로 주사한 RVG-표적화 엑소좀은 뇌 내의 뉴런, 미세아교세포, 희소돌기신경교에 특이적으로 GAPDH siRNA를 전달하여, 특이적 유전자 녹다운을 초래하였다. RVG 엑소좀에 대한 사전 노출은 녹다운을 약화시키지 않았고, 다른 조직에서의 비-특이적 흡수는 관찰되지 않았다. 엑소좀-매개 siRNA 전달의 치료 잠재력은 알츠하이머병에서의 치료 표적인 BACE1의 강력한 mRNA(60%) 및 단백질(62%) 녹다운에 의해 입증되었다.
면역학적으로 비활성인 엑소좀의 풀을 얻기 위해, Alvarez-Erviti외는 상동성 주조직적합성 복합체(MHC) 단상형을 지니는 근친교배 C57BL/6 마우스로부터 골수를 수집하였다. 미성숙 수상돌기 세포가 MHC-II 및 CD86과 같은 T-세포 활성화제가 없는 다량의 엑소좀을 생성하기 때문에, Alvarez-Erviti외는 7 일 동안 과립구/대식세포-콜로니 자극 인자(GM-CSF)를 지니는 수상돌기 세포에 대해 선택하였다. 잘 확립된 초원심분리 프로토콜을 사용하여 다음날 배양 상청액으로부터 엑소좀을 정제하였다. 생성된 엑소좀은 물리적으로 균질하였고, 크기 분포는 입자 트래킹 분석(NTA) 및 전자 현미경에 의해 결정하였을 때, 직경 80 nm에서 최고였다. Alvarez-Erviti외는 106 개 세포당 6 μg 내지 12 μg의 엑소좀(단백질 농도를 기준으로 측정)을 얻었다.
다음에, Alvarez-Erviti외는 나노규모 적용에 적합한 전기천공법 프로토콜을 사용하여 외인성 카고로의 변형된 엑소좀의 로딩 가능성을 조사하였다. 나노미터 규모에서 막 입자에 대한 전기천공법은 제대로 특성화되지 않기 때문에, 비특이적 Cy5-표지화 RNA를 전기천공법 프로토콜의 경험적 최적화를 위해 사용하였다. 캡슐화된 RNA의 양을 엑소좀의 초원심분리 및 용해 후에 분석하였다. 400 V 및 125 μF에서의 전기천공법은 RNA의 가장 큰 보유를 초래하였고, 모든 후속 실험에 대해 사용하였다.
Alvarez-Erviti외는 150 μg의 RVG 엑소좀 중에 캡슐화된 150 μg의 각각의 BACE1 siRNA를 정상 C57BL/6 마우스에게 투여하고, 녹다운 효율을 4 개의 대조군, 즉 미처리 마우스, RVG 엑소좀만을 주사한 마우스, 생체내 양이온성 리포좀 시약에 복합체화된 BACE1 siRNA를 주사한 마우스, 및 siRNA에 정전기적으로 결합된 9 개의 D-아르기닌에 컨쥬게이트된 RVG 펩티드인 RVG-9R에 복합체화된 BACE1 siRNA를 주사한 마우스에 대하여 비교하였다. 투여 3 일 후 피질 조직 샘플을 분석하였고, siRNA-RVG-9R-처리 마우스와 siRNARVG 엑소좀-처리 마우스 둘 다에서 BACE1 mRNA 수준의 상당한 감소(각각 66% [+ 또는 -] 15%, P < 0.001 및 61% [+ 또는 -] 13%, P < 0.01)로부터 초래되는 상당한 단백질 녹다운(45%, P < 0.05, 대 62%, P < 0.01)을 관찰하였다. 게다가, 출원인은 RVG-엑소좀-처리 동물에서 알츠하이머 병증에서의 아밀로이드 플라크의 주요 성분인 총 [베타]-아밀로이드 1 내지 42 수준에서 상당한 감소(55%, P < 0.05)를 입증하였다. 관찰한 감소는 BACE1 억제제의 정맥내 주사 후 정상 마우스에서 입증된 β-아밀로이드 1 내지 40 감소보다 더 컸다. Alvarez-Erviti외는 BACE1 절단 생성물에 대해 cDNA 말단의 5'-신속한 증폭(RACE)을 수행하였는데, 이는 siRNA에 의한 RNAi-매개 녹다운의 증거를 제공하였다.
최종적으로, Alvarez-Erviti 외는 IL-6, IP-10, TNFα 및 IFN-α 혈청 농도를 평가함으로써 RNA-RVG 엑소좀이 생체내 면역 반응을 유도하였는지 여부를 조사하였다. 엑소좀 처리 후에, 모든 사이토카인에서의 중요하지 않은 변화가 IL-6 분비를 강력하게 자극한 siRNA-RVG-9R과 대조적으로 siRNA-형질감염 시약 처리와 유사하게 등록되었는데, 이는 엑소좀 처리의 면역학적 비활성 프로파일을 확인시켜준다. 엑소좀이 단지 20%의 siRNA를 캡슐화하는 것을 고려해 볼 때, RVG-엑소좀에 의한 전달은 비슷한 mRNA 녹다운으로서 RVG-9R 전달보다 더 효율적인 것으로 나타나며, 대응하는 면역 자극 수준 없이, 더 큰 단백질 녹다운이 5 배 더 적은 siRNA에 의해 달성되었다. 이 실험은 신경변성 질병과 관련된 유전자의 장기간 침묵화에 잠재적으로 적합한 RVG-엑소좀 기술의 치료 잠재력을 입증하였다. Alvarez-Erviti 외의 엑소좀 전달 시스템은 치료 표적, 특히 신경변성 질병에 본 발명의 핵산-표적화 시스템을 전달하기 위해 적용될 수 있다. 약 100 mg 내지 1000 mg의 RVG 엑소좀에서 캡슐화된 약 100 mg 내지 1000 mg의 핵산-표적화 시스템의 용량은 본 발명을 위해 고려될 수 있다.
El-Andaloussi 외(Nature Protocols 7,2112-2126(2012))는 배양 세포로부터 유래된 엑소좀이 시험관내 및 생체내 RNA의 전달을 위해 이용될 수 있는 방법을 개시한다. 이 프로토콜은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하는 발현 벡터의 형질감염을 통한 표적화된 엑소좀의 생성을 처음으로 기재한다. 다음에, El-Andaloussi외는 형질감염된 세포 상청액으로부터 엑소좀을 정제하고 특성화하는 방법을 설명한다. 다음에, El-Andaloussi 외는 RNA를 엑소좀에 로딩하기 위한 결정적인 단계를 상술한다. 최종적으로, El-Andaloussi 외는 마우스 뇌에서 시험관내 및 생체내 RNA를 효율적으로 전달하기 위해 엑소좀을 사용하는 방법을 약술한다. 엑소좀-매개 RNA 전달이 기능성 분석 및 영상에 의해 평가되는 예상된 결과의 예가 또한 제공된다. 전체 프로토콜은 약 3 주가 걸린다. 본 발명에 따른 전달 또는 투여는 자가-유래 수상돌기 세포로부터 생성된 엑소좀을 사용하여 실행될 수 있다. 본 명세서의 교시로부터, 이는 본 발명의 실시에 이용될 수 있다.
또 다른 구현예에서, Wahlgren 외(문헌[Nucleic Acids Research, 2012, Vol. 40, No. 17 e130])의 혈장 엑소좀이 고려된다. 엑소좀은 수상돌기 세포(DC), B 세포, T 세포, 비만 세포, 상피 세포 및 종양 세포를 포함하는 다수의 세포 유형에 의해 생성된 나노 크기 소낭(30 nm 내지 90 nm 크기)이다. 이들 소낭은 후기 엔도솜의 안쪽으로 향하는 출아에 의해 형성되며, 이어서 혈장막과 융합시 세포외 환경으로 방출된다. 엑소좀은 천연적으로 세포 간에 RNA를 운반하기 때문에, 이 특성은 유전자 치료법에 유용할 수 있으며, 이러한 개시 내용으로부터, 본 발명의 실시에 이용될 수 있다.
혈장으로부터의 엑소좀은 20 분 동안 900 g에서 버피 코트의 원심분리로 혈장을 분리시킨 다음에 세포 상청액을 수집하고 10 분 동안 300 g에서 그리고 30 분 동안 16 500 g에서 원심분리하여 세포를 제거한 후 0.22 mm 필터를 통해 여과시킴으로써 제조될 수 있다. 엑소좀을 120 000 g에서 70 분 동안 초원심분리에 의해 펠렛화시킨다. siRNA의 엑소좀 내로의 화학적 형질감염을 RNAi 인간/마우스 스타터 키트(Human/Mouse Starter Kit)(Quiagen, 독일 힐덴 소재)에서 제조업자의 지침서에 따라 수행한다. siRNA를 2 mmol/ml의 최종 농도로 100 ml PBS에 첨가한다. HiPerFect 형질감염 시약을 첨가한 후에, 혼합물을 실온에서 10 분 동안 인큐베이션시킨다. 과량의 미셀을 제거하기 위해, 알데하이드/설페이트 라텍스 비드를 사용하여 엑소좀을 재분리시킨다. 엑소좀 내로의 핵산-표적화 시스템의 화학적 형질감염은 siRNA와 유사하게 수행될 수 있다. 엑소좀은 건강한 공여자의 말초혈액으로부터 분리된 림프구 및 단핵구와 동시배양될 수 있다. 따라서, 핵산-표적화 시스템을 함유하는 엑소좀은 인간의 단핵구 및 림프구에 도입될 수 있고 인간에게 자가 조직으로 재도입될 수도 있는 것이 고려될 수 있다. 따라서, 본 발명에 따른 전달 또는 투여는 혈장 엑소좀을 사용하여 실행될 수 있다.
리포좀
본 발명에 따른 전달 또는 투여는 리포좀을 이용하여 실행될 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 이들이 생체적합성, 비독성이기 때문에 약물 전달 담체로서 상당한 관심을 얻었고, 친수성과 친지성 약물 분자를 둘 다 전달할 수 있으며, 혈장 효소에 의한 분해로부터 그들의 카고를 보호하고, 생물학적 막 및 혈액 뇌 장벽(BBB)을 가로질러 그들의 로드를 전달할 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 통상적으로 사용된다. 지질 필름이 수용액과 혼합될 때 리포좀 형성은 자발적이지만, 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용하는 것에 의한 진탕 형태로 힘을 적용함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀의 구조 및 특성을 변형시키기 위해 몇몇 다른 첨가제가 리포좀에 첨가될 수 있다. 예를 들어, 콜레스테롤 또는 스핑고미엘린을 리포좀 혼합물에 첨가하여 리포좀 구조를 안정화시키는 데 도움을 주고 리포좀 내부 카고의 누출을 방지할 수 있다. 추가로, 리포좀을 수소화된 난(egg) 포스파티딜콜린 또는 난 포스파티딜콜린, 콜레스테롤, 및 디세틸 포스페이트로부터 제조하고, 리포좀의 평균 소낭 크기를 약 50 nm 및 100 nm로 조정하였다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀 제형은 주로 천연 인지질 및 지질, 예를 들어 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 난 포스파티딜콜린 및 모노시알로강글리오사이드로 구성될 수 있다. 이 제형은 인지질만으로 구성되기 때문에, 리포좀 제형은 다수의 난제와 마주치는데, 그 중 하나는 혈장 내 불안정성이다. 구체적으로 지질막의 조작에서 이들 난제를 극복하기 위한 몇몇 시도가 이루어졌다. 이들 시도 중 하나는 콜레스테롤의 조작에 집중되어 있다. 통상의 제형으로의 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
특히 유리한 구현예에서, 트로이 목마 리포좀(또한 분자 트로이 목마로 알려져 있음)이 바람직하며, 프로토콜은 http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long에서 찾을 수 있다. 이들 입자는 혈관내 주사 후 전체 뇌로의 전이유전자의 전달을 가능하게 한다. 제한에 의해 구속되지 않고, 표면에 컨쥬게이트된 특이적 항체를 지니는 중성 지질 입자는 엔도시토시스를 통해 혈액 뇌 장벽을 가로지르는 것으로 여겨진다. 출원인은 혈관내 주사를 통해 뇌에 뉴클레아제의 CRISPR 패밀리를 전달하기 위해 트로이 목마 리포좀을 이용하는 것을 가정하는데, 이는 배아 조작에 대한 필요 없이 전체 뇌 유전자 도입 동물을 가능하게 할 것이다. 약 1 g 내지 5 g의 DNA 또는 RNA가 리포좀 내 생체내 투여를 위해 고려될 수 있다.
또 다른 구현예에서, 핵산-표적화 시스템 또는 이의 성분은 안정적인 핵산-지질 입자(SNALP)와 같은 리포좀으로 투여될 수 있다(예를 들어, 문헌[Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005] 참조). SNALP에서 표적화된 특이적 핵산-표적화 시스템의 약 1 mg/kg/일, 3 mg/kg/일 또는 5 mg/kg/일의 매일의 정맥내 주사가 고려된다. 매일의 치료는 약 3 일에 걸쳐 이루어질 수 있고, 이어서 약 5 주 동안 주마다 이루어질 수 있다. 또 다른 구현예에서, 약 1 mg/kg 또는 2.5 mg/kg 의 용량에서 정맥내 주사에 의해 투여되는 특정 핵산-표적화 시스템 캡슐화된 SNALP가 또한 고려된다(예를 들어, 문헌[Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006] 참조). SNALP 제형은 지질 3-N-[(w메톡시폴리(에틸렌 글리콜) 2000) 카바모일]-1,2-디미리스틸옥시-프로필아민(PEG-C-DMA), 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판(DLinDMA), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC) 및 콜레스테롤을 2:40:10:48 몰 백분율 비로 함유할 수 있다(예를 들어, 문헌[Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006] 참조).
또 다른 구현예에서, 안정적인 핵산-지질 입자(SNALP)는 고도로 혈관화된 HepG2-유래 간 종양에 대해 효과적인 전달 분자인 것으로 입증되었지만, 불량하게 혈관화된 HCT-116 유래 간 종양에 대해서는 그렇지 않다(예를 들어, 문헌[Li, Gene Therapy(2012) 19, 775-780] 참조). SNALP 리포좀은 25:1의 지질/siRNA 비 및 48/40/10/2 몰비의 콜레스테롤/D-Lin-DMA/DSPC/PEG-C-DMA를 사용하여 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및 siRNA로 D-Lin-DMA 및 PEG-C-DMA를 제형화함으로써 제조될 수 있다. 생성된 SNALP 리포좀은 크기가 약 80 nm 내지 100 nm이다.
또 다른 구현예에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich, 미국 미주리주 세인트루이스 소재), 디팔미토일포스파티딜콜린(Avanti Polar Lipids, 미국 앨라배마주 앨러배스터 소재), 3-N-[(w-메톡시 폴리(에틸렌 글리콜)2000)카바모일]-1,2-디미레스틸옥시프로필아민, 및 양이온성 1,2-디리놀레일옥시-3-N,N 디메틸아미노프로판(예를 들어, 문헌[Geisbert et al., Lancet 2010; 375: 1896-905] 참조)을 포함할 수 있다. 예를 들어, 볼루스 정맥내 주입으로서 투여되는 용량당 약 2 mg/kg의 총 핵산-표적화 시스템의 용량이 고려될 수 있다.
또 다른 구현예에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC; Avanti Polar Lipids Inc.), PEG-cDMA, 및 1,2-디리놀레일옥시-3-(N;N-디메틸)아미노프로판(DLinDMA)(예를 들어, 문헌[Judge, J. Clin. Invest. 119:661-673(2009)] 참조)을 포함할 수 있다. 생체내 연구를 위해 사용되는 제형은 약 9:1의 최종 지질/RNA 질량비를 포함할 수 있다.
RNAi 나노의학의 안전성 프로파일은 Alnylam Pharmaceuticals의 Barros 및 Gollob에 의해 검토되었다(예를 들어, 문헌[Advanced Drug Delivery Reviews 64(2012) 1730-1737] 참조). 안정적인 핵산 지질 입자(SNALP)는 4 가지 상이한 지질, 즉 낮은 pH에서 양이온성인 이온화 가능한 지질(DLinDMA), 중성 헬퍼 지질, 콜레스테롤, 및 확산성 폴리에틸렌 글리콜(PEG)-지질로 구성된다. 입자는 직경이 대략 80 nm이고, 생리학적 pH에서 중성 전하이다. 제형화 동안, 이온화 가능한 지질은 입자 형성 동안 음이온성 RNA와 지질을 축합하는 작용을 한다. 점점 더 산성인 엔도좀 조건 하에 양으로 하전될 때, 이온화 가능한 지질은 또한 RNA의 세포질 내로의 방출을 가능하게 하는 엔도좀 막과 SNALP의 융합을 매개한다. PEG-지질은 입자를 안정화시키고, 제형화 동안 응집을 감소시키며, 후속적으로 약동학적 특성을 개선시키는 외부의 중성 친수성을 제공한다.
지금까지, RNA가 있는 SNALP 제형을 사용하여 2 가지 임상 프로그램을 개시하였다. Tekmira Pharmaceuticals는 최근에 상승된 LDL 콜레스테롤을 지니는 성인 출원인에서 SNALP-ApoB의 I상 단일 용량 연구를 완료하였다. ApoB는 간 및 공장에서 대부분 발현되며, VLDL 및 LDL의 어셈블리 및 분비에 필수적이다. 17 명의 대상체에 단일 용량의 SNALP-ApoB를 제공하였다(7 가지 용량 수준에 걸친 용량 상승). 간 독성의 증거는 없었다(전임상 연구에 기반한 잠재적 용량 제한 독성으로서 예상). 가장 높은 용량에서(둘 중) 한 명의 대상체는 면역계 자극과 일치되는 감기-유사 증상을 경험하였고, 시험을 끝내는 결정을 하였다.
Alnylam Pharmaceuticals는 상기 기재한 SNALP 기술을 이용하고, TTR 아밀로이드증(ATTR)을 치료하기 위해 돌연변이체와 야생형 TTR 둘 다의 간세포 생성을 표적화하는 유사하게 진보된 ALN-TTR01을 갖는다. 3 가지 ATTR 증후군이 기재되었다: 가족성 아밀로이드성 다발신경병증(FAP) 및 가족성 아밀로이드성 심근증(FAC)(둘 다 TTR에서의 상염색체 우성 돌연변이에 의해 야기됨); 및 야생형 TTR에 의해 야기되는 노인 전신성 아밀로이드증(SSA). ALN-TTR01의 위약 조절, 단일 용량 상승 I상 시험을 ATTR을 지니는 환자에서 최근에 완료하였다. ALN-TTR01을 0.01 mg/kg 내지 1.0 mg/kg(siRNA 기준)의 용량 범위 내에서 31 명의 환자(연구 약물에 의한 23 명 및 위약에 의한 8 명)에 대한 15 분 IV 주입으로서 투여하였다. 간 기능 시험에서 유의한 증가 없이 치료는 잘 용인되었다. 주입 관련 반응은 0.4 mg/kg 이상에서 23 명의 환자 중 3 명에서 언급되었고; 모두 주입 속도의 늦춤에 반응하였으며, 모두 연구를 계속하였다. 1 mg/kg의 가장 높은 용량에서 2 명의 환자에서 혈청 사이토카인 IL-6, IP-10 및 IL-1ra의 최소 및 일시적 상승이 언급되었다(전임상 및 NHP 연구로부터 예상되는 바와 같음). 혈청 TTR의 저하, ALN-TTR01의 예상된 약동학적 효과가 1 mg/kg에서 관찰되었다.
또 다른 구현예에서, SNALP는 양이온성 지질, DSPC, 콜레스테롤 및 PEG-지질을, 예를 들어 각각 40:10:40:10의 몰비로, 예를 들어 에탄올 중에 용해시킴으로써 제조될 수 있다(문헌[Semple et al., Nature Niotechnology, Volume 28 Number 2 February 2010, pp. 172-177] 참조). 지질 혼합물을 혼합하면서, 각각 30%(vol/vol) 및 6.1 mg/ml의 최종 에탄올 및 지질 농도로 수성 완충제(50 mM 시트르산염, pH 4)에 첨가하고, 2 분 동안 22℃에서 평형화되게 한 후 압출시켰다. 수화된 지질을 동적 광 산란 분석에 의해 결정될 때 70 nm 내지 90 nm의 소낭 직경이 수득될 때까지 Lipex Extruder(Northern Lipids)를 사용하여 22℃에서 2층 80 nm 기공 크기 필터(Nuclepore)를 통해 압출하였다. 이는 일반적으로 1 회 내지 3 회의 통과를 필요로 하였다. siRNA(30% 에탄올을 함유하는 50 mM 시트르산염, pH 4 수용액 중에 용해)를 혼합하면서 약 5 ml/분의 속도로 사전 평형화된(35℃) 소낭에 첨가하였다. 0.06(wt/wt)의 최종 표적 siRNA/지질 비에 도달한 후, 혼합물을 35℃에서 추가 30 분 동안 인큐베이션시켜 소낭 재조직화 및 siRNA의 캡슐화를 가능하게 하였다. 이어서, 에탄올을 제거하고, 투석 또는 접선 유동 정용여과에 의해 외부 완충제를 PBS로 대체하였다(155 mM NaCl, 3 mM Na2HPO4, 1 mM KH2PO4, pH 7.5). siRNA를 제어된 계단식 희석 방법 과정을 사용하여 SNALP에서 캡슐화하였다. KC2-SNALP의 지질 성분은 57.1:7.1:34.3:1.4의 몰비로 사용한 DLin-KC2-DMA(양이온성 지질), 디팔미토일포스파티딜콜린(DPPC; Avanti Polar Lipids), 합성 콜레스테롤(Sigma) 및 PEG-C-DMA였다. 로딩된 입자의 형성시에, SNALP를 PBS에 대해 투석하였고, 사용 전 0.2 μm 필터를 통해 멸균 여과시켰다. 평균 입자 크기는 75 nm 내지 85 nm였고, siRNA의 90% 내지 95%는 지질 입자 내에서 캡슐화되었다. 생체내 시험을 위해 사용한 제형 내 최종 siRNA/지질 비는 약 0.15(wt/wt)였다. 인자 VII siRNA를 함유하는 LNP-siRNA 시스템을 사용 직전에 멸균 PBS 중에서 적절한 농도로 희석시켰고, 제형을 총 10 ml/kg의 부피로 옆 꼬리 정맥을 통해 정맥내로 투여하였다. 이러한 방법 및 이들 전달 시스템은 본 발명의 핵산-표적화 시스템에 대해 추론될 수 있다.
다른 지질
다른 양이온성 지질, 예를 들어 아미노 지질 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(DLin-KC2-DMA)은 예를 들어, siRNA와 유사한 핵산-표적화 시스템 또는 이의 성분 또는 이를 코딩하는 핵산 분자(들)를 캡슐화하기 위해 이용될 수 있으며(예를 들어, 문헌[Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529 - 8533] 참조), 이런 이유로, 본 발명의 실시에 이용될 수 있다. 다음의 지질 조성물이 있는 사전 형성된 소낭이 고려될 수 있다: 대략 0.05(w/w)의 FVII siRNA/총 지질 비 및 각각 40/10/40/10의 몰비의 아미노 지질, 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및(R)-2,3-비스(옥타데실옥시) 프로필-1-(메톡시 폴리(에틸렌 글리콜)2000)프로필카바메이트(PEG-지질). 70 nm 내지 90 nm 범위의 좁은 입자 크기 분포 및 0.11±0.04(n=56)의 낮은 다분산지수를 보장하기 위해, 입자를 가이드 RNA를 첨가하기 전에 80 nm 막을 통해 최대 3 회까지 압출시킬 수 있다. 매우 강력한 아미노 지질 16을 함유하는 입자가 사용될 수 있으며, 여기서 4 가지 지질 성분, 16, DSPC, 콜레스테롤 및 PEG-지질의 몰비(50/10/38.5/1.5)는 생체내 활성을 향상시키도록 추가로 최적화될 수 있다.
Michael S D Kormann 외(문헌["Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157(2011)])는 RNA를 전달하기 위한 지질 외피의 사용을 기재한다. 지질 외피의 사용은 또한 본 발명에서 바람직하다.
또 다른 구현예에서, 지질은 본 발명의 핵산-표적화 시스템 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)와 함께 제형화되어 지질 나노입자(LNP)를 형성할 수 있다. 지질은 DLin-KC2-DMA4, C12-200 및 공지질 디스테로일포스파티딜 콜린을 포함하지만 이들로 제한되지 않으며, 콜레스테롤, 및 PEG-DMG는 자발적 소낭 형성 절차를 사용하여 siRNA 대신 RNA-표적화 시스템을 이용하여 제형화될 수 있다(예를 들어, 문헌[Novobrantseva, Molecular Therapy-핵산s(2012) 1, e4; doi:10.1038/mtna.2011.3] 참조). 성분 몰비는 약 50/10/38.5/1.5(DLin-KC2-DMA 또는 C12-200/디스테로일포스파티딜 콜린/콜레스테롤/PEG-DMG)일 수 있다. 최종 지질:siRNA 중량비는 DLin-KC2-DMA 및 C12-200 지질 입자(LNP)의 경우에 각각 약 12:1 및 9:1일 수 있다. 제형은 90% 초과의 포획 효율을 지니는 약 80 nm의 평균 입자 직경을 가질 수 있다. 3 mg/kg 용량이 고려될 수 있다.
Tekmira는 LNP 및 LNP 제형의 다양한 양태와 관련된 미국 및 해외에서의 대략 95 개의 특허 패밀리의 포트폴리오를 가지며(예를 들어, 미국 특허 7,982,027; 7,799,565; 8,058,069; 8,283,333; 7,901,708; 7,745,651; 7,803,397; 8,101,741; 8,188,263; 7,915,399; 8,236,943 및 7,838,658 및 유럽 특허 1766035; 1519714; 1781593 및 1664316 참조), 이들 모두는 본 발명에 대해 사용되고/사용되거나 적합하게 될 수 있다.
핵산-표적화 시스템 또는 이의 성분 또는 이를 코딩하는 핵산 분자(들)는 단백질, 단백질 전구체, 또는 단백질 또는 단백질 전구체의 부분적으로 또는 완전히 가공된 형태를 인코딩할 수 있는 변형된 핵산 분자를 포함하는 조성물의 제형의 양태에 관한 미국 출원 공개 20130252281 및 20130245107 및 20130244279(Moderna Therapeutics 출원)에서 추가로 기재된 것과 같은 PLGA 미소구체에서 캡슐화되어 전달될 수 있다. 제형은 몰비 50:10:38.5:1.5 내지 3.0(양이온성 지질:융합생성 지질:콜레스테롤:PEG 지질)을 가질 수 있다. PEG 지질은 PEG-c-DOMG, PEG-DMG로부터 선택될 수 있지만, 이들로 제한되지 않는다. 융합생성 지질은 DSPC일 수 있다. 또한, Schrum외의 미국 출원 공개 20120251618(Delivery and Formulation of Engineered Nucleic Acids)을 참조한다.
나노머 기술은 저분자량 소수성 약물, 펩티드 및 핵산 기반 치료제(플라스미드, siRNA, miRNA)를 포함하는 광범위한 치료제에 대한 생체이용성 난제를 다룬다. 기술이 명확한 이점을 입증한 특정 투여 경로는 경구 경로, 혈액 뇌 장벽을 가로지르는 전달, 고형 종양으로의 전달뿐만 아니라, 눈으로의 전달을 포함한다. 예를 들어, 문헌[Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26]; 문헌[Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26]; [Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305-10] 및 [Lalatsa et al., 2012, J Control Release. 2012 Jul 20; 161(2):523-36]을 참조한다.
미국 특허 공개 20050019923은 생활성 분자, 예를 들어 폴리뉴클레오티드 분자, 펩티드 및 폴리펩티드 및/또는 약제학적 작용제를 포유류 신체에 전달하기 위한 양이온성 덴드리머를 기재한다. 덴드리머는, 예를 들어 간, 비장, 폐, 신장 또는 심장(또는 심지어 뇌)으로의 생활성 분자의 전달을 표적화하는 데 적합하다. 덴드리머는 단순한 분지형 단량체 단위로부터 단계적 방식으로 제조된 합성 3-차원 거대분자이며, 이의 특성 및 기능성은 용이하게 제어되고 달라질 수 있다. 덴드리머는 다작용성 코어에 대한(합성에 대한 확산적 접근), 또는 다작용성 코어를 향한(합성에 대한 수렴적 접근) 빌딩 블록의 반복된 첨가로부터 합성되고, 빌딩 블록의 3차원 쉘의 각각의 첨가는 덴드리머의 더 고차 세대의 형성을 야기한다. 폴리프로필렌이민 덴드리머는 디아미노부탄 코어로부터 출발하며, 이것에 일차 아민으로의 아크릴로니트릴의 이중 마이클 첨가(Michael addition)에 의해 아미노기 수의 2 배가 첨가된 후, 니트릴이 수소화된다. 이는 아미노기의 배가를 초래한다. 폴리프로필렌이민 덴드리머는 100% 양성자화 가능한 질소 및 최대 64 개의 말단 아미노기를 함유한다(5세대, DAB 64). 양성자화 가능한 기는 보통 중성 pH에서 양성자를 수용할 수 있는 아민기이다. 유전자 전달제로서 덴드리머의 용도는 콘주게이팅 단위로서 각각 아민/아미드 또는 N--P(O2)S의 혼합물과 함께 폴리아미도아민 및 인 함유 화합물의 용도에 크게 집중되어 있는데 유전자 전달을 위한 더 낮은 세대 폴리프로필렌이민 덴드리머의 용도에 대해 보고한 연구는 없었다. 폴리프로필렌이민 덴드리머는 또한 주변 아미노기에 의해 화학적으로 변형될 때 약물 전달을 위해 그리고 게스트 분자의 캡슐화를 위해 pH 감수성 제어 방출 시스템으로서 연구되었다. 세포독성 및 DNA와 폴리프로필렌이민 덴드리머의 상호작용뿐만 아니라 DAB 64의 형질감염 효능이 또한 연구되었다.
미국 특허 공개 20050019923은 이전의 보고와 상반되게 양이온성 덴드리머, 예를 들어 폴리프로필렌이민 덴드리머가 유전 물질과 같은 생활성 분자의 표적화된 전달에서 사용하기 위한 적합한 특성, 예를 들어 특이적 표적화 및 낮은 독성을 나타낸다는 관찰에 기반한다. 추가적으로, 양이온성 덴드리머의 유도체는 또한 생활성 분자의 표적화된 전달을 위한 적합한 특성을 나타낸다. 또한, 미국 출원 공개 20080267903의 생활성 중합체를 참조하며, 이는 "양이온성 폴리아민 중합체 및 덴드리머 중합체를 포함하는 다양한 중합체가 항증식 활성을 갖는 것으로 나타나며, 따라서 신생물 및 종양과 같은 바람직하지 않은 세포 증식을 특징으로 하는 장애, 염증 장애(자가면역 장애를 포함함), 건선 및 아테롬성 동맥경화증의 치료에 유용할 수 있다. 중합체는 단독으로 활성제로서 또는 다른 치료제, 예를 들어 유전자 치료법을 위한 약물 분자 또는 핵산을 위한 전달 비히클로서 사용될 수 있다. 이와 같은 경우에, 중합체 자체의 고유 항종양 활성은 전달될 작용제의 활성을 보완할 수 있다"고 개시한다. 이들 특허 간행물의 개시 내용은 핵산-표적화 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달을 위한 본 발명의 교시와 함께 이용될 수 있다.
초하전(supercharged) 단백질
초하전 단백질은 대단히 높은 양 또는 음의 이론적 순전하를 지니는 조작된 또는 천연적으로 발생하는 단백질의 부류이며, 핵산-표적화 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달에 이용될 수 있다. 초음성으로 하전된 단백질과 초양성으로 하전된 단백질은 둘 모두 열적으로 또는 화학적으로 유도된 응집을 견뎌내는 현저한 능력을 나타낸다. 초양성으로 하전된 단백질은 또한 포유류 세포를 침투할 수 있다. 카고와 이들 단백질, 예를 들어 플라스미드 DNA, RNA 또는 다른 단백질의 회합은 시험관내와 생체내 둘 다에서 포유류 세포 내로 이들 거대분자의 기능적 전달을 가능하게 할 수 있다. David Liu 연구소는 2007년에 초하전 단백질의 생성 및 특성화를 보고하였다(문헌[Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112]).
포유류 세포 내로의 RNA 및 플라스미드 DNA의 비바이러스 전달은 연구와 치료 응용 둘 다에 대해 가치가 있다(문헌[Akinc et al., 2010, Nat. Biotech. 26, 561-569]). 정제된 +36 GFP 단백질(또는 다른 초양성으로 하전된 단백질)은 적절한 무혈청 배지에서 RNA와 혼합되고, 세포에 첨가 전 복합체화되게 한다. 이 단계에서 혈청의 포함은 초하전 단백질-RNA 복합체의 형성을 억제하고, 치료 효능을 감소시킨다. 다음의 프로토콜은 다양한 세포주에 대해 효과적이 되는 것으로 관찰되었다(문헌[McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116]) 그러나, 단백질 및 RNA의 용량을 변화시키는 파일럿 실험은 특정 세포주에 대하여 절차를 최적화하도록 수행되어야 한다.
(1) 처리 하루 전, 48-웰 플레이트에서 웰당 1 x 105 개 세포를 플레이팅함.
(2) 처리일에, 최종 농도 200 nM로 무혈청 배지에서 정제된 +36 GFP 단백질을 희석시킴. RNA를 50 nM의 최종 농도로 첨가함. 와류시켜 혼합하고 실온에서 10 분 동안 인큐베이션시킴.
(3) 인큐베이션 동안, 세포로부터 배지를 흡입하고, PBS로 1 회 세척함.
(4) +36 GFP 및 RNA의 인큐베이션 후에, 단백질-RNA 복합체를 세포에 첨가함.
(5) 37℃에서 4 시간 동안 복합체와 세포를 인큐베이션시킴.
(6) 인큐베이션 후에, 배지를 흡입하고, 20 U/ml 헤파린 PBS로 3 회 세척함. 활성에 대한 검정에 따라 추가 48 시간 또는 그 이상 동안 혈청-함유 배지와 세포를 인큐베이션시킴.
(7) 세포를 면역블롯, qPCR, 표현형 분석 또는 다른 적절한 방법에 의해 분석함.
David Liu 연구소는 다양한 세포에서 +36 GFP가 효과적인 플라스미드 전달 시약인 것으로 추가로 발견하였다. 플라스미드 DNA는 siRNA보다 더 큰 카고이기 때문에, 비례하여 더 많은 +36 GFP 단백질이 효과적으로 플라스미드와 복합체화하는 데 필요로 한다. 효과적인 플라스미드 전달을 위해, 출원인들은 인플루엔자 바이러스 혈구응집소 단백질로부터 유래된 공지된 엔도좀-파괴 펩티드인 C-말단의 HA2 펩티드 태그를 보유하는 +36 GFP의 변이체를 개발하였다. 다음의 프로토콜은 다양한 세포에서 효과적이었지만, 상기와 같이 플라스미드 DNA 및 초하전 단백질 용량이 특정 세포주 및 전달 응용분야를 위해 최적화되는 것이 권장된다.
(1) 처리 하루 전, 48-웰 플레이트에서 웰당 1 x 105 개를 플레이팅함.
(2) 처리일에, 최종 농도 2 mM로 무혈청 배지에서 정제된 þ36 GFP 단백질을 희석시킴. 1 ㎎의 플라스미드 DNA를 첨가함. 와류시켜 혼합하고 실온에서 10 분 동안 인큐베이션시킴.
(3) 인큐베이션 동안, 세포로부터 배지를 흡입하고, PBS로 1 회 세척함.
(4) þ36 GFP 및 플라스미드 DNA의 인큐베이션 후에, 단백질-DNA 복합체를 세포에 온건하게 첨가함.
(5) 37C에서 4 시간 동안 복합체와 세포를 인큐베이션시킴.
(6) 인큐베이션 후에, 배지를 흡입하고, PBS로 세척함. 혈청-함유 배지에서 세포를 인큐베이션시키고 추가 24 시간 내지 48 시간 동안 인큐베이션시킴.
(7) 적절하다면(예를 들어, 플라스미드-유도 유전자 발현에 의해) 플라스미드 전달을 분석함.
또한, 예를 들어, 문헌[McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116(2009)]; [Cronican et al., ACS Chemical Biology 5, 747-752(2010)]; [Cronican et al., Chemistry & Biology 18, 833-838(2011)]; [Thompson et al., Methods in Enzymology 503, 293-319(2012)]; [Thompson, D.B., et al., Chemistry & Biology 19(7), 831-843(2012)]을 참조한다. 초하전된 단백질의 방법은 본 발명의 핵산-표적화 시스템의 전달을 위해 사용되고/사용되거나 이를 위해 적합하게 될 수 있다. Lui 박사 및 본 명세서의 교시와 함께 본 명세서의 문헌의 이들 시스템은 핵산-표적화 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달에 이용될 수 있다.
세포 투과성 펩티드(CPP)
또 다른 구현예에서, 세포 투과성 펩티드(CPP)가 CRISPR Cas 시스템의 전달을 위해 고려된다. CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩티드이다. 본 명세서에서 사용된 바와 같은 용어 "카고"는 치료제, 진단 프로브, 펩티드, 핵산, 안티센스 올리고뉴클레오티드, 플라스미드, 단백질, 나노입자를 포함하는 입자, 리포좀, 발색단, 소분자 및 방사성 물질로 구성된 군을 포함하지만 이에 제한되지 않는다. 본 발명의 일 양태에서, 카고는 또한 CRISPR Cas 시스템의 임의의 성분 또는 전체 기능성 CRISPR Cas 시스템을 포함할 수 있다. 본 발명의 일 양태는 하기를 포함하는, 원하는 카고를 대상체로 전달하는 방법을 제공한다: (a) 본 발명의 세포 투과성 펩티드 및 원하는 카고를 포함하는 복합체를 제조하는 단계, 및 (b) 대상체에게 복합체를 경구, 관절내, 복강내, 척추강내, 동맥내, 비강내, 뇌실내, 피하내, 근육내, 정맥내, 피부, 직장내, 또는 국소투여하는 단계. 카고는 공유 결합을 통한 화학적 결합 또는 비-공유 상호작용을 통해 펩티드와 회합된다.
CPP의 기능은 카고를 세포로 전달하는 것이며, 살아있는 포유류 세포의 엔도솜으로 전달된 카고의 엔도시토시스를 통해 일반적으로 발생하는 공정이다. 세포-침투성 펩티드는 상이한 크기, 아미노산 서열, 및 전하를 가지지만, 모든 CPP가, 혈장 막을 전위시키고 세포질 또는 세포소기관으로 다양한 분자 카고의 전달을 용이하게 하는 능력인 하나의 별개 특징을 갖는다. CPP 전위는 3 개의 주요 엔트리 메커니즘으로 분류될 수 있다: 막에서의 직접 투과, 엔도시토시스-매개 엔트리, 및 일시적 구조의 형성을 통한 전위. CPP는 암을 포함하는 상이한 질병의 치료에서 약물 전달제, 바이러스 억제제뿐만 아니라, 세포 표지화를 위한 조영제로서 의약에서의 많은 적용이 발견되었다. 후자의 예는 GFP에 대한 담체, MRI 조영제, 또는 양자점으로서 작용하는 것을 포함한다. CPP는 연구 및 의약에서의 용도에서 시험관내 및 생체내 전달 벡터로서 훌륭한 잠재성을 보유한다. CPP는 통상적으로 리신 또는 아르기닌과 같은 상대적으로 풍부한 양전하 아미노산을 함유하거나 극성/전하 아미노산 및 비-극성 소수성 아미노산의 교대 패턴을 함유하는 서열을 갖는 아미노산 조성물을 갖는다. 이들 2 가지 유형의 구조는 각각 다가이온성 또는 양친매성으로서 지칭된다. CPP의 세번째 부류는 낮은 순 전하를 갖는 극성 잔기만을 함유하는 소수성 펩티드이거나, 세포 흡수에 결정적인 소수성 아미노산 그룹을 갖는다. 발견된 초기 CPP 중 하나는 배양에서 많은 세포 유형에 의해 배지 주위로부터 효율적으로 취득되어 발견되는 인간 면역결핍 바이러스 1(HIV-1)로부터의 트랜스-활성화 전사 활성화제(Tat)였다. 그 이후부터, 많은 공지된 CPP는 상당히 확장되었으며 더 효과적인 단백질 형질도입 특성을 갖는 소분자 합성 유사체가 생성되었다. CPP는 페너트라틴, Tat(48-60), 트란스포르탄, 및(R-AhX-R4)(Ahx=아미노헥사노일)을 포함하지만 이에 제한되지 않는다.
미국 특허 8,372,951은 높은 세포-투과 효율 및 낮은 독성을 나타내는 호산구 양이온성 단백질(ECP)으로부터 유래된 CPP를 제공한다. 척추동물 대상체로 CPP를 이의 카고와 함께 전달하는 양태가 또한 제공된다. CPP 및 이의 전달의 추가 양태는 미국 특허 8,575,305; 8;614,194 및 8,044,019에 기재되어 있다. CPP는 CRISPR-Cas 시스템 또는 이의 성분을 전달하기 위해 사용될 수 있다. CPP가 CRISPR-Cas 시스템 또는 이의 성분을 전달하기 위해 이용될 수 있는 것은 또한 본 명세서에 전체가 참조로서 포함된, Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor외의 문헌["Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA", Gees.nome R 2014 Apr 2. [인쇄 전 전자논문상태]]에서 제공되며, 여기에서 CPP-컨쥬게이트된 재조합 Cas9 단백질 및 CPP-복합체화 가이드 RNA를 이용한 치료가 인간 세포주에서의 내인성 유전자 파괴를 이끌어냄이 입증되었다. 이 논문에서 Cas9 단백질은 티오에스테르 결합을 통해 CPP에 컨쥬게이트되는 반면, 가이드 RNA는 CPP와 복합체화되어, 축합된 양으로 하전된 입자를 형성한다. 변형된 Cas9 및 가이드 RNA와 함께, 배아 줄기 세포, 피부 섬유아세포, HEK293T 세포, HeLa 세포, 및 배아 암종 세포를 포함하는 인간 세포의 동시 및 순차적 치료가 플라스미드 형질감염에 비하여 감소된 표적외 돌연변이로 효율적인 유전자 파괴를 이끌어냄을 나타내었다.
이식 가능한 장치
또 다른 구현예에서, 핵산-표적화 시스템 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달을 위해 이식 가능한 장치가 또한 고려된다. 예를 들어, 미국 특허 공개 20110195123은 국소적으로 그리고 연장된 기간 동안 약물을 용리하는 이식 가능한 의료 장치(이와 같은 장치의 몇 가지 유형, 실행의 처리 방식 및 이식 방법을 포함함)가 제공됨을 개시한다. 장치는 중합체 기질, 예를 들어 매트릭스, 예를 들어 장치 몸체로서 사용되는 매트릭스, 및 약물, 및 일부 경우에 추가적인 스캐폴딩 재료, 예를 들어 금속 또는 추가적인 중합체, 및 가시성 및 이미징을 향상시키는 재료를 포함한다. 이식 가능한 전달 장치는 국소적인, 그리고 연장된 기간에 걸친 방출을 제공하는 데 유리할 수 있으며, 여기서 약물은, 예를 들어 종양, 염증, 변성과 같은 병에 걸린 영역의 세포외 매트릭스(ECM)로 직접 방출되거나, 증상 목표를 위해, 또는 손상된 평활근 세포에 또는 예방을 위해 방출된다. 한 종류의 약물은 상기 개시된 바와 같은 RNA이며, 이러한 시스템은 본 발명의 핵산-표적화 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다. 일부 구현예에서 이식 방식은 근접 치료법 및 바늘 생검을 포함하는 다른 치료를 위해 오늘날 개발되고 사용되는 기존의 이식 절차이다. 이와 같은 경우에, 본 발명에 기재된 새로운 이식물의 치수는 본래의 이식물과 유사하다. 전형적으로 소수의 장치는 동일한 치료 절차 동안 이식된다.
미국 특허 공개 20110195123은, 복강과 같은 강에 적용 가능한 시스템을 포함하는 약물 전달 이식 가능한 또는 삽입 가능한 시스템 및/또는 임의의 다른 유형의 투여를 제공하며, 여기서, 예를 들어 선택적으로 매트릭스일 수 있는 생체안정성 및/또는 분해가능 및/또는 생체흡수성 중합체성 기질을 포함하는 약물 전달 시스템은 고정 또는 부착되지 않는다. 용어 "삽입"은 또한 이식을 포함하는 것을 주목하여야 한다. 약물 전달 시스템은 바람직하게 미국 특허 공개 20110195123에 기재된 바와 같은 "로더(Loder)"로서 실행된다.
중합체 또는 복수의 중합체는 생체적합성이며, 제어된 속도로 작용제를 방출시킬 수 있는 작용제 및/또는 복수의 작용제를 혼입하며, 중합체성 기질, 예를 들어 일부 구현예에서 매트릭스의 총 부피는, 선택적으로 그리고 바람직하게는 작용제의 치료 수준이 도달되게 하는 최대 부피 이하이다. 비제한적 예로서, 이와 같은 부피는 작용제 로드를 위한 부피에 의해 필요한 바와 같은 바람직하게는 0.1 ㎥ 내지 1000 ㎣ 범위 내에 있다. 로더는, 예를 들어 크기가 기능성에 의해 결정되는 장치, 예를 들어 제한 없이, 무릎 관절, 자궁내 또는 자궁경부 링 등과 함께 혼입될 때, 선택적으로 더 클 수 있다.
(조성물을 전달하기 위한) 약물 전달 시스템은 바람직하게 일부 구현예에서 분해성 중합체를 이용하도록 설계되거나(주요 방출 메카니즘은 벌크 침식(bulk erosion)임); 또는 일부 구현예에서, 비분해성 또는 서서히 분해되는 중합체가 사용되며(주요 방출 메카니즘은 벌크 침식보다는 확산임), 따라서 외부는 막으로서 기능하고, 내부는 약물 저장소로서 기능하는데, 이는 연장된 기간(예를 들어, 약 1 주 내지 약 수 개월) 동안 주변에 의해 실제로 영향받지 않는다. 상이한 방출 메카니즘을 지니는 상이한 중합체의 조합이 또한 선택적으로 사용될 수 있다. 표면에서 농도 기울기는 바람직하게 총 약물 방출 기간의 상당한 기간 동안 효과적으로 일정하게 유지되고, 따라서 확산 속도는 효과적으로 일정하다("제로 방식" 확신으로 지칭됨). 용어 "일정한"은 더 낮은 치료적 유효성의 역치 초과로 바람직하게 유지되지만, 여전히 선택적으로 초기 버스트를 특징으로 하고/하거나 변동할 수 있는, 예를 들어 특정 정도로 증가 및 감소할 수 있는 확산 속도를 의미한다. 확산 속도는 바람직하게 연장된 기간 동안 이렇게 유지되며, 치료적으로 효과적인 기간, 예를 들어 효과적인 침묵화 기간을 최적화하기 위해 특정 수준으로 일정한 것으로 고려될 수 있다.
약물 전달 시스템은 선택적으로 그리고 바람직하게는 성질이 화학물질이든 대상체의 체내의 효소 및 다른 인자로부터의 공격에 기인하든, 분해로부터 뉴클레오티드 기반 치료제를 보호하도록 설계된다.
미국 특허 공개 20110195123의 약물 전달 시스템은 장치의 이식 시 및/또는 이식 후에, 활성화 및/또는 가속화/감속화의 비침습적 및/또는 최소 침습적 방법에 의해 작동되는 감지 및/또는 활성화 기기와 선택적으로 연동되며, 예를 들어 선택적으로 제한되는 것은 아니지만, 열적인 가열 및 냉각, 레이저 빔 및 집속 초음파 및/또는 RF(무선주파수)를 포함하는 초음파 방법 또는 장치를 포함한다.
미국 특허 공개 20110195123의 일부 구현예에 따르면, 국소 전달을 위한 부위는 선택적으로 종양을 포함하는 세포의 고도 비정상 증식, 및 억제된 아폽토시스, 자가면역질병 상태를 포함하는 활성 및 또는 만성 염증 및 감염, 근육 및 신경 조직을 포함하는 변성 조직, 만성 통증, 변성 부위, 및 뼈 골절 위치 및 조직 재생의 향상을 위한 다른 상처 위치, 및 손상된 심근, 평활근 및 횡문근을 특징으로 하는 표적 부위를 포함할 수 있다.
조성물의 이식을 위한 부위, 또는 표적 부위는 바람직하게 표적화된 국소 전달에 충분히 작은 반경, 면적 및/또는 부피를 특징으로 한다. 예를 들어, 표적 부위는 선택적으로 약 0.1 mm 내지 약 5 cm 범위의 직경을 갖는다.
표적 부위의 위치는 바람직하게 최대 치료 효능에 대해 선택된다. 예를 들어, 약물 전달 시스템의 조성물(선택적으로 상기 기재한 바와 같은 이식을 위한 장치와 함께)은 선택적으로 그리고 바람직하게는 종양 환경, 또는 이들의 연관된 혈액 공급 내에서 또는 이에 근접하여 이식된다.
예를 들어 조성물은(선택적으로 장치와 함께) 선택적으로 췌장, 전립선, 유방, 간 내에 또는 그에 근접하여, 니플을 통해, 혈관계 내 등에 이식된다.
표적 위치는(선택적으로 체내의 임의의 부위가 로더를 이식하는 데 적합할 수 있기 때문에 단지 비제한적 예로서): 1. 기저핵, 백질 및 회백질에서 파킨슨병 또는 알츠하이머병에서와 같은 변성 부위의 뇌; 2. 근위축성 측삭경화증(ALS)의 경우에서와 같은 척추; 3. HPV 감염을 예방하기 위한 자궁경부; 4. 활성 및 만성 염증 관절; 5. 건선의 경우에서와 같은 진피; 6. 진통 효과를 위한 교감 및 감각 신경 부위; 7. 골내이식; 8. 급성 및 만성 감염 부위; 9. 질내; 10. 내이--청각기관, 내이의 미로, 전정계; 11. 기관내; 12. 심장내; 관상동맥, 심외막; 13. 방광; 14. 담도계; 15. 신장, 간, 비장을 포함하지만, 이들로 제한되지 않는 실질세포; 16. 림프절; 17. 침샘; 18. 치과용 수지; 19. 관절내(관절 내로); 20. 안내; 21. 뇌조직; 22. 뇌실; 23. 복강을 포함하는 강(예를 들어, 제한되는 것은 아니지만, 난소암); 24. 식도내 및 25. 직장내를 포함하거나, 이로 필수적으로 이루어지거나, 이로 구성된 군으로부터 선택적으로 선택된다.
선택적으로 시스템의 삽입(예를 들어, 조성물을 함유하는 장치)은 표적 부위의 및 이러한 부위 부근의, 국소 pH 및/또는 온도 및/또는 ECM 내 약물의 확산 및/또는 약물 역학에 영향을 미치는 다른 생물학적 인자에 영향을 미치도록 하는 표적 부위 및 해당 부위 부근에서 ECM에 대한 물질의 주사와 연관된다.
선택적으로, 일부 구현예에 따르면, 상기 작용제의 방출은 삽입 전 및/또는 삽입 시 및/또는 삽입 후, 레이저빔, 조사, 열적 가열 및 냉각, 및 집속 초음파 및/또는 RF(무선주파수)를 포함하는 초음파 방법 또는 장치 및 화학적 활성화제를 포함하는 활성화 및/또는 가속화/감속화의 비침습적 및/또는 최소 침습적 및/또는 그 밖의 방법에 의해 작동되는 감지 및/또는 활성화 기기와 연관될 수 있었다.
미국 특허 공개 20110195123의 다른 구현예에 따르면, 약물은 바람직하게, 예를 들어 이하에 기재되는 바와 같이 유방, 췌장, 뇌, 신장, 방광, 폐 및 전립선에서 국소화된 암 경우를 위한 RNA를 포함한다. RNAi로 예시되지만, 약물이 로더 기질, 예를 들어 매트릭스와 함께 캡슐화될 수 있는 한, 다수 약물이 로더에서 캡슐화되어 적용 가능하고, 본 발명과 함께 사용될 수 있으며, 이러한 시스템이 본 발명의 핵산-표적화 시스템을 전달하는 데 사용되고/사용되거나 그에 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 신경 및 근육 변성 질병은 비정상 유전자 발현에 기인하여 발생한다. RNA의 국소 전달은 이와 같은 비정상 유전자 발현을 방해하는 치료적 특성을 가질 수 있다. 작은 약물 및 거대분자를 포함하는 아폽토시스방지, 염증방지 및 변성방지 약물의 국소 전달은 또한 선택적으로 치료적일 수 있다. 이와 같은 경우에, 로더는 일정한 속도로 및/또는 별도로 이식되는 전용 장치를 통해 연장된 방출을 위해 적용된다. 이것 모두는 본 발명의 핵산-표적화 시스템 에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 정신과적 및 인지 장애가 유전자 변형자를 이용하여 치료된다. 유전자 녹다운은 치료적 선택사항이다. 중추 신경계 부위에 작용제를 국소적으로 전달하는 로더는 정신병, 양극성 질병, 신경성 장애 및 행동 병폐를 포함하지만, 이들로 제한되지 않는 정신과적 및 인지 장애에 대한 치료적 선택사항이다. 로더는 또한 특정 뇌 부위에 이식시 작은 약물 및 거대분자를 포함하는 약물을 국소적으로 전달할 수 있었다. 이것 모두는 본 발명의 핵산-표적화 시스템 에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 국소 부위에서 선천성 및/또는 적응성 면역 매개체의 침묵화는 기관 이식 거부를 예방할 수 있다. 이식된 기관 및/또는 이식된 부위에 이식된 로더를 이용한 RNA 및 면역조절 시약의 국소 전달은 이식 기관에 대해 활성화된 CD8과 같은 면역 세포를 퇴치함으로써 국소 면역 억제를 제공한다. 이것 모두는 본 발명의 핵산-표적화 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, VEGF 및 안지오제닌 등을 포함하는 혈관 성장 인자는 신혈관형성에 필수적이다. 인자, 펩티드, 펩티드모방체의 국소 전달 또는 이들의 억제제의 억제는 중요한 치료적 양식이며; 억제제의 침묵화 및 로더를 이용한 혈관형성을 자극하는 인자, 펩티드, 거대분자 및 작은 약물의 국소 전달은 말초, 전신 및 심혈관 질병에 대하여 치료적이다.
이식과 같은 삽입 방법은 선택적으로 다른 유형의 조직 이식을 위해 및/또는 삽입을 위해 및/또는 조직 샘플링을 위해 선택적으로 변형 없이, 또는 대안적으로 선택적으로 이와 같은 방법에서 주요하지 않은 변형만을 이용하여 이전에 사용될 수 있다. 이와 같은 방법은 선택적으로 근접치료 방법, 생검, 초음파와 함께 및/또는 초음파 없이 내시경, 예를 들어 ERCP, 뇌 조직 내로의 정위적 방법, 관절, 복부 기관, 방광벽 및 체강 내로의 복강경의 이식을 포함하는 복강경검사를 포함하지만, 이들로 제한되지 않는다.
본 명세서에서 논의된 이식 가능한 장치 기술이 본 명세서의 교시와 함께 이용될 수 있으며, 이에 따라 본 개시 내용 및 당업계의 지식에 의해, CRISPR-Cas 시스템 또는 이의 성분 또는 이의 핵산 분자 또는 성분의 인코딩 또는 제공이 이식 가능한 장치를 통해 전달될 수 있다.
환자-특이적 스크리닝 방법
RNA, 예를 들어 트리뉴클레오티드 반복부를 표적화하는 핵산-표적화 시스템을 사용하여 이와 같은 반복부의 존재에 대하여 환자 또는 환자 샘플을 스크리닝할 수 있다. 반복부는 핵산-표적화 시스템의 RNA의 표적일 수 있으며, 핵산-표적화 시스템에 의한 이로의 결합이 존재한다면, 결합을 검출하여, 이와 같은 반복부가 존재하는 것을 나타낼 수 있다. 따라서, 핵산-표적화 시스템을 사용하여 환자 또는 환자 샘플을 반복부의 존재에 대하여 스크리닝할 수 있다. 그 다음, 환자에게 질환을 다루기 위한 적합한 화합물(들)을 투여할 수 있거나; 또는 이에 결합하고 삽입, 결실 또는 돌연변이를 야기하며, 질환을 완화시키는 핵산-표적화 시스템을 투여할 수 있다.
본 발명은 핵산을 사용하여 표적 RNA 서열에 결합한다.
CRISPR 이펙터 단백질 mRNA 및 가이드 RNA
CRISPR 이펙터 단백질 mRNA 및 가이드 RNA는 또한 별도로 전달될 수 있다. CRISPR 이펙터 단백질 mRNA는 가이드 RNA 전에 전달되어 CRISPR 이펙터 단백질이 발현될 시간을 제공할 수 있다. CRISPR 이펙터 단백질 mRNA는 가이드 RNA 투여 1 시간 내지 12 시간(바람직하게는, 약 2 시간 내지 6 시간) 전에 투여될 수 있다.
대안적으로, CRISPR 이펙터 단백질 mRNA 및 가이드 RNA는 함께 투여될 수 있다. 유리하게, 가이드 RNA의 제2 부스터 용량은 CRISPR 이펙터 단백질 mRNA + 가이드 RNA의 초기 투여 1 시간 내지 12 시간(바람직하게는, 약 2 시간 내지 6 시간) 이후에 투여될 수 있다.
본 발명의 CRISPR 이펙터 단백질, 즉 C2c2 이펙터 단백질은 때때로 본 명세서에서 CRISPR 효소로 지칭된다. 이펙터 단백질은 효소를 기반으로 하거나 효소로부터 유래되어, 따라서 용어 '이펙터 단백질'은 일부 구현예에서 확실히 '효소'를 포함하는 것으로 이해될 것이다. 그러나, 또한 이펙터 단백질은, 일부 구현예에서 요구되는 바와 같이, DNA 또는 RNA 결합을 가질 수 있지만, 반드시 데드-Cas 이펙터 단백질 기능을 포함하여 절단 또는 닉킹, 활성을 필요로 하는 것은 아님을 이해할 것이다.
CRISPR 이펙터 단백질 mRNA 및/또는 가이드 RNA의 추가적인 투여는 가장 효율적인 수준의 게놈 변형을 달성하기 위해 유용할 수 있다. 일부 구현예에서, 표현형 변경은 특히 치료 방법에서, 바람직하게는 표현형의 교정 또는 변경을 위해 수복 주형이 제공된 경우에서, 바람직하게는 유전적 질병이 표적화된 경우 게놈 변형의 결과이다.
일부 구현예에서, 표적화될 수 있는 질병은 질병-유발 스플라이스 결함과 연관이 있는 것들을 포함한다.
일부 구현예에서, 세포 표적은, 조혈 줄기/선조 세포(CD34+); 인간 T 세포; 및 눈(망막 세포)(예를 들어, 광수용체 전구 세포)를 포함한다.
일부 구현예에서, 유전자 표적은, 인간 베타 글로빈 - HBB((내인성 주형으로서 밀접하게 관련된 HBD 유전자를 사용하여 )유전자-전환을 자극시키는 것을 포함하는, 겸상 적혈구 빈혈증의 치료를 위함); CD3(T-세포); 및 CEP920 - 망막(눈)을 포함한다.
일부 구현예에서, 질병 표적은 또한, 암; 겸상 적혈구 빈혈증(점 돌연변이를 기반으로 함); HIV; 베타-지중해빈혈(Beta-Thalassemia); 및 안과질환 또는 안 질환(예를 들어, 레베르 선천성 흑암시(Leber Congenital Amaurosis; LCA)-유발 스플라이스 결함을 포함한다.
일부 구현예에서, 전달 방법은, 효소-가이드 복합체(리보뉴클레오단백질)의 양이온 지질 매개 "직접" 전달 및 플라스미드 DNA의 전기천공을 포함한다.
본 발명의 방법은, dsODN 또는 ssODN일 수 있는 수복 주형과 같은 주형의 전달을 추가로 포함할 수 있으며, 하기를 참조한다. 주형의 전달은 임의의 또는 모든 CRISPR 이펙터 단백질 또는 가이드의 전달과 함께 또는 이와 분리된 전달을 통해 그리고 동일하거나 상이한 전달 메커니즘을 통한 것일 수 있다. 일부 구현예에서, 주형은 가이드와 함께, 바람직하게는 또한 CRISPR 이펙터 단백질과 함께 전달되는 것이 바람직하다. 예는, AAV 벡터일 수 있다.
본 발명의 방법은 (a) 상기 이중 가닥 손상에 의해 형성된 오버행에 대해 상보적인 오버행을 포함하는 이중-가닥 올리고데옥시뉴클레오티드(dsODN)를 세포로 전달하는 것으로서, 상기 dsODN은 관심 유전자 내로 통합되는 것; 또는 (b) 단일-가닥 올리고데옥시뉴클레오티드(ssODN)를 세포로 전달하는 것으로서, 상기 ssODN은 상기 이중 가닥 손상의 상동 직접 수복을 위한 주형으로서 작용하는 것을 추가로 포함할 수 있다. 본 발병의 방법은 개인에서 질병의 예방 또는 치료를 위한 것일 수 있으며, 선택적으로 상기 질병은 상기 관심 유전자좌에서의 결함에 의해 유발된다. 본 발명의 방법은 개인에서 생체내에서 또는 개인으로부터 취한 세포 상에서 생체외에서 수행될 수 있으며, 여기서 선택적으로 상기 세포는 개인에게 되돌려진다.
독성 및 표적외 효과의 최소화를 위해, 전달되는 CRISPR 이펙터 단백질 mRNA 및 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. CRISPR 이펙터 단백질 mRNA 및 가이드 RNA의 최적 농도는 세포 또는 동물 모델에서 상이한 농도를 시험하고, 잠재적인 표적외 게놈 유전자좌에서 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정될 수 있다. 예를 들어, 인간 게놈의 EMX1 유전자에서 5'-GAGTCCGAGCAGAAGAAGAA-3'를 표적화하는 가이드 서열에 있어서, 딥 시퀀싱을 사용하여 2 가지 표적외 유전자좌, 즉 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' 및 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'에서의 변형 수준을 평가할 수 있다. 표적외 변형의 수준을 최소화하면서 표적상 변형의 가장 높은 수준을 제공하는 농도가 생체내 전달을 위하여 선택되어야 한다.
유도성 시스템
일부 구현예에서, CRISPR 이펙터 단백질은 유도성 시스템의 성분을 형성할 수 있다. 시스템의 유도성 성질은 에너지 형태를 사용하여 유전자 편집 또는 유전자 발현의 시공간적 제어를 가능하게 할 것이다. 에너지의 형태는 이에 한정되지 않지만, 전자기 방사, 음향 에너지, 화학 에너지 및 열 에너지를 포함할 수 있다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬)을 포함한다. 일 구현예에서, CRISPR 이펙터 단백질은 서열-특이적 방식으로 전사 활성에서의 변화를 유도하기 위한 광 유도성 전사 이펙터(LITE)의 일부일 수 있다. 광의 성분은 CRISPR 이펙터 단백질, 광-반응성 시토크롬 이형이량체(예를 들어, 아라비돕시스 탈리아나(Arabidopsis thaliana) 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 이의 사용을 위한 방법의 추가의 예는 미국 특허 제61/736465 호, 미국 특허 제61/721,283호 및 WO 2014018423에서 제공되며, 이는 전체가 참고로 본 명세서에 포함된다.
CRISPR Cas 시스템의 예시적인 방법
본 발명은 비-천연 발생 또는 조작된 조성물, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템의, 생체내, 생체외 또는 시험관내에서 표적 세포를 변형시키는 데 있어서의 이용을 제공하며, 세포를 변경시키는 방식으로 수행되어, 일단 변형되면, CRISPR 변형된 세포의 자손 또는 세포주가 변경된 표현형을 보유하도록 한다. 변형된 세포 및 자손은, 원하는 세포 유형으로의 CRISPR 시스템의 생체외 또는 생체내 적용을 갖는, 식물 또는 동물과 같은 다세포 생물의 일부일 수 있다. CRISPR 발명은 치료 처리 방법일 수 있다. 치료 처리 방법은 유전자 또는 게놈 편집 또는 유전자 치료법을 포함할 수 있다.
CRISPR Cas 시스템 또는 복합체(예를 들어, C2c2-RNA 복합체)를 이용한 표적 변형
일 양태에서, 본 발명은, 생체내, 생체외 또는 시험관내일 수 있는 진핵 세포 내에서 표적 폴리뉴클레오티드를 변형하는 방법을 제공한다. 일부 구현예에서, 본 방법은 인간 또는 비-인간 동물로부터 세포 또는 세포 집단을 샘플링하는 단계 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 비-인간 동물 또는 식물 내로 재도입될 수 있다. 재도입된 세포들의 경우, 세포는 줄기 세포인 것이 특히 바람직하다.
일부 구현예에서, CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하도록 허용하는 것을 포함하여, 상기 표적 폴리뉴클레오티드를 절단시켜, 이에 의해 표적 폴리뉴클레오티드를 변형시키고, 여기서 CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함한다.
일 양태에서, 본 발명은 진핵 세포에서 폴리뉴클레오티드의 발현을 변형시키는 방법을 제공한다. 일부 구현예에서, 본 방법은 CRISPR 복합체가 폴리뉴클레오티드에 결합하도록 허용하는 것을 포함하여, 상기 결합이 상기 폴리뉴클레오티드의 증가된 또는 감소된 발현을 결과로서 초래하도록 하며; 여기서 CRISPR 복합체는 상기 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함한다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형시키는 방법에 대해 상기와 같이 적용된다. 실제로, 이들 샘플링, 배양 및 재도입 옵션은 본 발명의 일 양태에 걸쳐 적용된다.
실제로, 본 발명이 임의의 양태에서, CRISPR 복합체는 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함할 수 있다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형시키는 방법에 대해 상기와 같이 적용된다.
따라서, 본 명세서에서 설명된 임의의 비-천연 발생 CRISPR 이펙터 단백질은 하나 이상의 변형을 포함하고, 이로 인해 이펙터 단백질은 소정의 개선된 능력을 갖는다. 특히, 임의의 이펙터 단백질은 가이드 RNA와의 CRISPR 복합체를 형성할 수 있다. 그러한 복합체가 형성된 경우, 가이드 RNA는 표적 폴리뉴클레오티드 서열에 결합할 수 있고, 이펙터 단백질은 표적 유전자좌를 변형시킬 수 있다. 추가적으로, CRISPR 복합체 내 이펙터 단백질은 비변형된 효소/이펙터 단백질에 비하여, 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력을 갖는다.
추가적으로, 본 명세서에서 설명된 변형된 CRISPR 효소는 효소를 포괄하고, 이로 인해 CRISPR 복합체 내에서 이펙터 단백질은 비변형된 효소/이펙터 단백질에 비하여, 하나 이상의 표적 유전자좌를 변형시킬 수 있는 증가된 능력을 갖는다. 그러한 작용은 개별적으로 제공될 수 있거나 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력인 상기 설명된 작용과 함께 제공될 수 있다. 임의의 그러한 이펙터 단백질에는 본 명세서에서 설명된 바와 같이 CRISPR 이펙터 단백질에 대한 추가의 임의의 변형, 예를 들어 하나 이상의 연관된 상동성 기능성 도메인에 의해 제공된 임의의 활성과 조합된, 뉴클레아제 활성 등을 감소시키는 임의의 추가의 돌연변이가 제공될 수 있다.
본 발명의 유리한 구현예에서, 변형된 CRISPR 이펙터 단백질은 비변형된 효소/이펙터 단백질에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력 및 비변형된 효소/이펙터 단백질에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 증가된 능력이 있다. 이펙터 단백질에 대한 추가의 변형과 조합하여, 현저히 증진된 특이성이 달성될 수 있다. 예를 들어, 그러한 유리한 구현예의 하나 이상의 추가의 돌연변이와의 조합이 제공되며, 여기서 하나 이상의 추가적인 돌연변이는 하나 이상의 촉매적으로 활성인 도메인이다. 그러한 이펙터 단백질에서, 증진된 특이성은 이펙터 단백질 활성 면에서 개선된 특이성으로 인해 달성될 수 있다.
본 명세서에 기재된 변형된 CRISPR 이펙터 단백질로 설계 제작될 수 있는 추가적인 기능은 다음을 포함한다. 1. 단백질 3 차 또는 2 차 구조에 영향을 주지 않으면서 RNA:단백질 상호 작용을 방해하는 변형된 CRISPR 이펙터 단백질. 이것에는 RNA:RNA 듀플렉스의 임의의 부분과 접촉하는 잔기가 포함된다. 2. RNA 결합(표적내 또는 표적외)에 대한 반응으로의 뉴클레아제 절단에 필수적인 형태로 C2c2를 유지하는 단백질 내 상호 작용을 약화시키는 변형된 CRISPR 이펙터 단백질. 예를 들어: HNH 도메인의 뉴클레아제 형태를 약간 저해하지만 여전히 가능하게 하는 변형(분리되기 쉬운 포스페이트에 위치된). 3. RNA 결합(표적내 또는 표적외)에 대한 반응으로의 뉴클레아제 활성을 저해하는 형태로 C2c2를 유지하는 단백질 내 상호 작용을 강화시키는 변형된 CRISPR 이펙터 단백질. 예를 들어, 분리되기 쉬운 포스페이트로부터 멀리 떨어져 있는 형태로 HNH 도메인을 안정화시키는 변형. 임의의 이러한 추가적인 기능 향상은 본 명세서의 다른 부분에서 상세히 기재된 CRISPR 이펙터 단백질에 대한 임의의 다른 변형과 조합하여 제공될 수 있다.
본 명세서에 기재된 개선된 기능성 중 임의의 것은 임의의 CRISPR 이펙터 단백질, 예를 들어 C2c2 이펙터 단백질에게 만들어질 수 있다. 그러나, 본 명세서에 기재된 기능성 중 임의의 것은 다수의 오솔로그 유래의 단편을 포함하는 키메라 이펙터 단백질을 포함하는, 다른 오솔로그로부터의 C2c2 이펙터 단백질로 설계 제작될 수 있음이 이해될 것이다.
본 발명은 표적 DNA 서열에 결합하는 핵산을 사용한다. 이는, 핵산이 단백질보다 생산이 훨씬 더 쉽고 더 저렴하기 때문에 유리하며, 특이성은 상동성이 구해지는 스트레치의 길이에 따라 변화될 수 있다. 다수의 핑거의 복합체 3-D 위치선정은, 예를 들어 요구되지 않는다. 용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환 가능하게 사용된다. 그것들은 임의의 길이의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나, 또는 그의 유사체의 중합체 형태를 지칭한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 다음은 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머. 또한, 상기 용어는 합성 백본이 있는 핵산-유사 구조를 포괄하며, 예를 들어, 문헌 [Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997; 및 Samstag, 1996]을 참조한다. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드, 예를 들어, 메틸화 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 단속될 수 있다. 폴리뉴클레오티드는 중합 후에, 예를 들어, 표지화 성분과의 콘주게이션에 의해 추가로 변형될 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "야생형"은 해당 분야의 숙련자에 의해 이해되는 해당 분야의 용어이며, 그것이 돌연변이체 또는 변이체로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 생물, 균주, 유전자 또는 특징을 의미한다. "야생형"은 기준선일 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특질의 표현을 의미하는 것으로 이해해야 한다. 용어 "비-천연 발생" 또는 "설계 제작된"은 상호교환 가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 언급되는 경우, 핵산 분자 또는 폴리펩티드에 그들이 천연에서 천연적으로 회합되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다. "상보성"은 통상의 왓슨-크릭 염기쌍 형성 또는 기타 비-통상적 유형에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기쌍 형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다(예를 들어, 10 개 중 5, 6, 7, 8, 9, 10 개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성임). "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 동일한 수의 제2 핵산 서열 내의 연속 잔기와 수소 결합할 것임을 의미한다. 본 명세서에 사용되는 바와 같이, "실질적인 상보성"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%인 상보성 정도를 지칭하거나, 엄격한 조건 하에서 혼성화하는 2 개의 핵산을 지칭한다. 본 명세서에 사용되는 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 대하여 상보성을 갖는 핵산 서열이 대개 표적 서열과 혼성화하며, 비-표적 서열에는 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록, 서열이 그의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비제한적인 예는 문헌[Tijssen(1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y]에 상세히 기재되어 있다. 폴리뉴클레오티드 서열이 언급될 때, 상보성 또는 부분 상보성 서열도 생각된다. 이들은 바람직하게 높은 엄격성 조건하에 기준 서열에 혼성화할 수 있다. 일반적으로, 혼성화 속도를 최대화하기 위해서, 상대적으로 낮은 엄격성 혼성화 조건이 선택된다: 열 융점(Tm)보다 약 20 내지 25℃ 낮은 온도. Tm은 특정 표적 서열의 50%가 규정된 이온 세기와 pH에서 용액 중에서 완전히 상보성인 프로브와 혼성화하는 온도이다. 일반적으로, 혼성화된 서열의 적어도 약 85%의 뉴클레오티드 상보성을 요구하기 위해서, 높은 엄격성 세척 조건은 Tm보다 약 5 내지 15℃ 낮도록 선택된다. 혼성화된 서열의 적어도 약 70%의 뉴클레오티드 상보성을 요구하기 위해서, 중등의 엄격성 세척 조건은 Tm보다 약 15 내지 30℃ 낮도록 선택된다. 아주 관대한(매우 낮은 엄격성) 세척 조건은 Tm보다 50℃ 정도 낮을 수 있으며, 이것은 혼성화된 서열들 간에 높은 수준의 미스매칭을 허용한다. 당업자는 표적 서열과 프로브 서열 간 상동성의 특정 수준으로부터 검출 가능한 혼성화 신호의 결과에 영향을 미치기 위해서 혼성화 및 세척 단계에서 다른 물리화학적 변수들도 변경될 수 있다는 것을 인정할 것이다. 바람직한 높은 엄격성 조건은 42℃에서 50% 포름아미드, 5xSSC, 및 1% SDS 인큐베이션, 또는 65℃에서 5xSSC 및 1% SDS 인큐베이션과 65℃에서 0.2xSSC 및 0.1% SDS 세척을 포함한다. "혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기쌍 형성, 훅스타인 결합 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 복합체는 듀플렉스 구조를 형성하는 2 개의 가닥, 다중 가닥 복합체를 형성하는 3 개 이상의 가닥, 단일의 자가 혼성화 가닥 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR의 개시 또는 효소에 의한 폴리뉴클레오티드의 절단과 같은 보다 광범위한 과정에서 하나의 단계를 이룰 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "상보물"로 지칭된다. 본 명세서에서 사용된 용어 "게놈 유전자좌" 또는 "유전자좌"(복수의 유전자좌)는 염색체에서 유전자 또는 DNA 서열의 특정 위치이다. "유전자"는 생물에서 활동하는 기능적 역할을 가진 RNA 사슬 또는 폴리펩티드를 인코딩하는 DNA 또는 RNA의 스트레치로서, 이에 따라, 살아있는 생물에서 유전의 분자 단위를 말한다. 본 발명의 목적을 위해서, 유전자는 이러한 조절 서열이 코딩 서열 및/또는 전사된 서열에 인접하든 아니든 유전자 산물의 생성을 조절하는 영역을 포함하는 것으로 간주될 수 있다. 따라서, 반드시 제한되는 것은 아니지만, 유전자는 프로모터 서열, 종결자, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 번역 조절 서열, 인핸서, 사일렌서, 인슐레이터, 경계 요소, 복제 원점, 매트릭스 부착 부위 및 유전자좌 조절 영역을 포함한다. 본 명세서에서 사용된 "게놈 유전자좌의 발현" 또는 "유전자 발현"은 유전자로부터의 정보가 기능적 유전자 산물의 합성에서 사용되는 과정이다. 유전자 발현의 산물은 주로 단백질이지만, rRNA 유전자 또는 tRNA 유전자와 같은 비-단백질 코딩 유전자에서는 이 산물은 기능적 RNA이다. 유전자 발현 과정은 생존을 위한 기능적 산물들을 생성하기 위해서 모든 알려진 생명체, 즉 진핵생물(다세포 생물 포함), 원핵생물(박테리아 및 고박테리아) 및 바이러스에 의해서 사용된다. 본 명세서에서 사용된 유전자 또는 핵산의 "발현"은 세포 유전자 발현뿐만 아니라 클로닝 시스템 및 임의의 다른 맥락에서 핵산(들)의 전사 및 번역을 포괄한다. 본 명세서에서 사용된 "발현"은 또한 폴리뉴클레오티드가 DNA 주형으로부터(예를 들어, mRNA 또는 다른 RNA 전사물로) 전사되는 과정 및/또는 전사된 mRNA가 이어서 펩티드, 폴리펩티드, 또는 단백질로 번역되는 과정을 말한다. 전사물 및 인코딩된 폴리펩티드는 집합적으로 "유전자 산물"이라고 언급될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된다면, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 본 명세서에서 임의의 길이의 아미노산의 중합체를 지칭하기 위해 상호교환 가능하게 사용된다. 중합체는 선형 또는 분지형일 수 있으며, 그것은 변형된 아미노산을 포함할 수 있고, 그것은 비-아미노산에 의해 단속될 수 있다. 또한, 상기 용어는 변형된 아미노산 중합체; 예를 들어, 이황화 결합 형성, 글리코실화, 지질화(lipidation), 아세틸화, 인산화 또는 임의의 기타 조작, 예를 들어, 표지화 성분과의 콘주게이션을 포함한다. 본 명세서에서 사용되는 바와 같이, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 및 아미노산 유사체 및 펩티드모방체를 포함하는 천연 및/또는 비천연 또는 합성 아미노산을 포함한다. 본 명세서에서 사용된 용어 "도메인" 또는 "단백질 도메인"은 단백질 사슬의 나머지 부분과 독립적으로 존재하며 기능할 수 있는 단백질 서열의 일부를 말한다. 본 발명의 양태에서 설명된 대로, 서열 동일성은 서열 상동성과 연관된다. 상동성 비교는 눈으로, 또는 더 일반적으로는 쉽게 이용 가능한 서열 비교 프로그램의 도움으로 수행될 수 있다. 이들 상업적으로 이용 가능한 컴퓨터 프로그램은 둘 이상의 서열 사이의 상동성 백분율(%)을 계산할 수 있고, 또한 둘 이상의 아미노산 또는 핵산 서열에 의해서 공유된 서열 동일성을 계산할 수 있다.
본 발명의 일 양태에서, 용어 "가이드 RNA"는 하나 이상의 추정되거나 확인된 tracr 서열 및 추정되거나 확인된 crRNA 서열 또는 가이드 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 구체적인 구현예에서, "가이드 RNA"는 추정되거나 확인된 crRNA 서열 또는 가이드 서열을 포함한다. 추가의 구현예에서, 가이드 RNA는 추정되거나 확인된 tracr 서열을 포함하지 않는다.
본 명세서에 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 당업계의 용어이며, 이것이 돌연변이체 또는 변이체 형태로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 생물, 균주, 유전자 또는 특징을 의미한다. "야생형"은 기준선일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특질의 표현을 의미하는 것으로 이해되어야 한다.
용어 "비-천연 발생" 또는 "설계 제작된"은 상호교환 가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 말하는 경우, 핵산 분자 또는 폴리펩티드에 이들이 천연에서 천연적으로 회합되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다. 모든 양태 및 구현예에서, 이들 용어가 포함되는지 아닌지의 여부에 관계없이, 바람직하게는 이는 선택적일 수 있으며, 이에 따라 바람직하게는 포함되거나 또는 바람직하게는 포함되지 않을 수 있는 것으로 이해될 것이다. 추가로, 용어 "비-천연 발생" 및 "설계 제작된"은 상호교환 가능하게 사용될 수 있으며, 따라서 단독으로 또는 조합되어 사용될 수 있고 하나 또는 다른 것들이 함께 언급된 것들을 대체할 수 있다. 특히, "비-천연 발생" 또는 "비-천연 발생 및/또는 설계 제작된" 대신에 "설계 제작된"이 바람직하다.
서열 상동성은 본 분야에 알려진 다수의 컴퓨터 프로그램, 예를 들어 BLAST 또는 FASTA 등의 임의의 것에 의해서 생성될 수 있다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG 위스콘신 베스트핏(Wisconsin Bestfit) 패키지이다(University of Wisconsin, U.S.A; 문헌[Devereux et al., 1984, Nucleic Acids Research 12:387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 이에 한정되지 않지만 BLAST 패키지(상기 문헌[Ausubel et al., 1999] - 18장 참조), FASTA(문헌[Atschul et al., 1990, J. Mol. Biol., 403-410]) 및 GENEWORKS 비교 도구 묶음을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색을 위해 이용할 수 있다(상기 문헌[Ausubel et al., 1999], 페이지 7-58 내지 7-60 참조). 그러나, GCG 베스트핏 프로그램을 사용하는 것이 바람직하다. 서열 상동성 백분율(%)은 연속 서열에 걸쳐서 계산될 수 있는데, 즉 하나의 서열이 다른 서열과 정렬되고, 하나의 서열에서 각 아미노산 또는 뉴클레오티드가 다른 서열에서 상응하는 아미노산 또는 뉴클레오티드와 한번에 하나의 잔기씩 직접 비교된다. 이것은 "비갭"(ungapped) 정렬이라고 불린다. 전형적으로, 이러한 비갭 정렬은 상대적으로 짧은 수의 잔기에 걸쳐서만 수행된다. 이것은 매우 간단하고 일관된 방법이지만, 예를 들어 다른 동일한 쌍의 서열에서, 하나의 삽입 또는 결실이 이후의 아미노산 잔기를 정렬되지 않도록 할 수 있다는 것을 고려하지 않으므로, 전반적 정렬이 수행될 때는 잠재적으로 상동성%에 상당한 감소가 있게 된다. 결론적으로, 대부분의 서열 비교 방법은 전체 상동성 또는 동일성 점수에 과도한 패널티 부과 없이 가능한 삽입과 결실을 고려하는 최적 정렬을 생성하도록 설계된다. 이것은 국소 상동성 또는 동일성을 최대화하도록 시도하도록 서열 정렬에 "갭"을 삽입함으로써 달성된다. 그러나, 이런 더 복잡한 방법은 정렬에서 발생한 각 갭에 "갭 패널티"를 배정하며, 이로써 동일한 수의 동일한 아미노산에 대해, 가능한 적은 갭을 가진 서열 정렬 - 비교된 두 서열 간의 더 높은 연관성 반영 - 이 많은 갭을 가진 것보다 더 높은 점수를 달성할 수 있다. "친화성 갭 점수"가 통상적으로 사용되는데, 이것은 갭의 존재에는 상대적으로 높은 점수를 매기고, 갭의 각 연속 잔기에는 더 적은 패널티를 매긴다. 이것은 가장 흔히 사용되는 갭 점수배정 시스템이다. 높은 갭 패널티는 당연히 갭이 적을수록 최적화된 정렬을 생성할 수 있다. 대부분의 정렬 프로그램은 갭 패널티의 변형을 허용한다. 그러나, 서열 비교에 이러한 소프트웨어를 사용할 때 디폴트 값을 사용하는 것이 바람직하다. 예를 들어, GCG 위스콘신 베스트핏 패키지를 사용할 때, 아미노산 서열에 대한 디폴트 갭 패널티는 갭에 대해 -12 및 각 연장에 대해 -4이다. 따라서, 최대 상동성%의 계산은 먼저 갭 패널티를 고려한 최적 정렬의 생성을 요구한다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG 위스콘신 베스트핏 패키지이다(문헌[Devereux et al., 1984 Nuc. Acids Research 12 p387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 이에 한정되지 않지만, BLAST 패키지(문헌[Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. Chapter 18] 참조), FASTA(문헌[Altschul et al., 1990 J. Mol. Biol. 403-410]) 및 GENEWORKS 비교 도구 묶음을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색으로 이용할 수 있다(문헌[Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 to 7-60] 참조). 그러나, 일부 응용에는, GCG 베스트핏 프로그램을 사용하는 것이 바람직하다. BLAST 2 서열이라고 불리는 새로운 도구도 단백질 및 뉴클레오티드 서열을 비교하는 데 이용할 수 있다(문헌[FEMS Microbiol Lett. 1999 174(2): 247-50]; 문헌[FEMS Microbiol Lett. 1999 177(1): 187-8] 및 National Institutes for Health 웹사이트에서 National Center for Biotechnology 웹사이트 참조). 최종 상동성%는 동일성에 관하여 측정될 수 있지만, 전형적으로 정렬 과정 자체는 양단간의 쌍 비교에 기초하지 않는다. 대신, 축척된 유사성 점수 행렬이 일반적으로 사용되는데, 이것은 화학적 유사성 또는 진화적 거리에 기초하여 각 쌍-방식 비교에 점수를 배정한다. 흔히 사용되는 이러한 행렬의 예는 BLOSUM62 행렬로서, 이것은 BLAST 프로그램 묶음의 디폴트 행렬이다. GCG 위스콘신 프로그램은 일반적으로 공개된 디폴트 값이나 제공되는 경우에는 사용자 지정 기호 비교표(추가의 상세한 설명을 위해 사용자 매뉴얼 참조)를 사용한다. 일부 응용에는, GCG 패키지에 대한 공개된 디폴트 값을 사용하거나, 또는 다른 소프트웨어의 경우에는 BLOSUM62와 같은 디폴트 행렬을 사용하는 것이 바람직하다. 대안적으로, 상동성 백분율은 CLUSTAL과 유사한 알고리즘에 기초한, DNASIS™(Hitachi Software)의 다중 정렬 특징을 사용하여 계산될 수 있다(문헌[Higgins DG & Sharp PM(1988), Gene 73(1), 237-244]). 일단 소프트웨어가 최적 정렬을 생성하면, 상동성%, 바람직하게는 서열 동일성%를 계산하는 것이 가능하다. 소프트웨어는 통상적으로 서열 비교의 일부로서 이것을 행하고, 수치 결과를 생성한다. 서열은 또한 침묵성 변화를 생성하여 기능적으로 동등한 물질을 야기하는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있다. 아미노산 특성(예를 들어, 잔기의 극성, 전하, 용해성, 소수성, 친수성 및/또는 양친매성)의 유사성을 기초로 의도적인 아미노산 치환이 만들어질 수 있으며, 따라서 작용기에 있어서 아미노산을 함께 그룹화하는 데 유용하다. 아미노산은 그것의 측쇄만의 특성에 기초하여 그룹화될 수 있다. 그러나, 돌연변이 데이터를 포함하는 것도 역시 더 유용하다. 이렇게 유도된 아미노산 세트는 구조적 이유로 보존될 수 있다. 이들 세트는 벤다이어그램의 형태로 설명될 수 있다(문헌[Livingstone C.D. and Barton G.J.(1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756])(문헌[Taylor W.R.(1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218]). 보존적 치환은, 예를 들어 일반적으로 용인된 벤다이어그램 아미노산 그룹화를 설명한 아래 표에 따라서 이루어질 수 있다.
용어 "대상체", "개인", 및 "환자"는 본 명세서에서 상호교환 가능하게 사용되어 척추동물, 바람직하게는 포유류, 더 바람직하게는 인간을 지칭한다. 포유류는 이에 한정되지 않지만 뮤린, 유인원, 인간, 농장 동물, 경기용 동물, 및 반려동물을 포함한다. 생체내에서 수득된 또는 시험관내에서 배양된 생물학적 개체의 조직, 세포 및 이들의 자손 또한 포함된다.
용어 "치료제", "치료 가능제" 또는 "처리제"는 상호교환 가능하게 사용되며, 대상체로의 투여에 몇 가지 유익한 효과를 부여하는 분자 또는 화합물을 지칭한다. 유익한 효과는 진단 결정의 가능화; 질병, 증상, 장애, 또는 병리학적 질환의 개선; 질병, 증상, 장애 또는 질환의 개시의 감소 또는 예방; 및 일반적으로 질병, 증상, 장애 또는 병리학적 질환의 대응을 포함한다.
본 명세서에서 사용된 바와 같이, "치료" 또는 "치료하는" 또는 "완화" 또는 "개선하는"은 상호교환 가능하게 사용된다. 이들 용어는 이에 한정되지 않지만 치료 이익 및/또는 예방 이익을 포함하는, 유익하거나 원하는 결과를 수득하기 위한 접근을 지칭한다. 치료적 이익이라 함은, 치료 하에 있는 하나 이상의 질병, 질환, 또는 증상에서의 임의의 치료 관련 개선 또는 이에 대한 효과를 의미한다. 예방적 이익을 위해, 조성물은 특정 질병, 질환, 또는 증상 발전의 위험에 있는 대상체에, 또는 질병, 질환, 또는 증상이 아직 표명되지 않을 수 있다 하더라도 질병의 하나 이상의 생리학적 증상이 보고되는 대상체에게 투여될 수 있다.
용어 "유효량" 또는 "치료적 유효량"은 유익하거나 원하는 결과를 발생시키기에 충분한 제제의 양을 지칭한다. 치료적 유효량은, 치료될 대상체 및 질병 상태, 대상체의 체중 및 연령, 질병 상태의 심각도, 투여 방법 등 중 하나 이상에 따라 달라질 수 있으며, 이는 당업자에 의해 쉽게 결정될 수 있다. 용어는 또한 본 명세서에서 기재된 임의의 하나의 이미지화 방법에 의한 검출을 위한 이미지를 제공할 용량에 적용된다. 특정 용량은, 선택된 특정 제제, 이후 따르는 투약 섭생, 다른 화합물과 조합되어 투여되는지의 여부, 투여 타이밍, 이미징될 조직, 및 용량이 운반되는 물리적 전달 시스템 중 하나 이상에 따라 달라질 수 있다.
본 발명의 실시는, 달리 표시되지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상적인 기법을 사용한다. 문헌[Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989)]; 문헌[CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987))]; 시리즈 문헌[METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995))], 문헌[Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987))] 참고.
본 발명의 일부 양태는 하나 이상의 벡터를 포함하는 벡터 시스템, 또는 이와 같은 벡터에 관한 것이다. 벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질, 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어 에스케리키아 콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포, 또는 포유류 세포에서 발현될 수 있다. 적합한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는, 예를 들어 T7 프로모터 조절 서열 및 T7 중합효소를 사용하여 시험관내에서 전사되고 번역될 수 있다.
본 발명의 일 구현예는, 아미노산의 경우 유사한 것으로의 치환, 예를 들어 염기성을 염기성으로, 산성을 산성으로, 극성을 극성으로 등등의 치환을 일으킬 수 있는 상동성 치환(치환 및 대체는 모두 본 명세서에서 기존 아미노산 잔기 또는 뉴클레오티드의 대안적인 잔기 또는 뉴클레오티드로의 교환을 의미하도록 사용됨)을 포함할 수 있는 서열(폴리뉴클레오티드 또는 폴리펩티드 모두)을 포함한다. 비-상동성 치환, 즉 한 부류의 잔기로부터 다른 부류의 잔기로의 치환, 또는 대안적으로 오르니틴(이후 Z로 언급), 디아미노부티르산 오르니틴(이후 B로 언급), 노르류신 오르니틴(이후 O로 언급), 피리일알라닌, 티에닐알라닌, 나프틸알라닌 및 페닐글리신과 같은 비천연 아미노산의 포함을 수반하는 치환이 일어날 수 있다. 변이체 아미노산 서열은 글리신 또는 β-알라닌 잔기와 같은 아미노산 스페이서에 더하여 메틸, 에틸 또는 프로필기와 같은 알킬기를 포함하는 서열의 임의의 두 아미노산 잔기 사이에 삽입될 수 있는 적합한 스페이서 기를 포함할 수 있다. 펩토이드 형태로 하나 이상의 아미노산 잔기의 존재를 포함하는 추가의 형태의 변형도 해당 분야의 숙련자에게 잘 이해될 수 있다. 의심을 피하기 위해서, "펩토이드 형태"는 α-탄소 치환기가 α-탄소가 아니라 잔기의 질소 원자에 존재하는 변이체 아미노산 잔기를 말하기 위해서 사용된다. 펩토이드 형태로 펩티드를 제조하는 과정은 해당 분야에, 예를 들어 문헌[Simon RJ et al., PNAS(1992) 89(20), 9367-9371] 및 문헌[Horwell DC, Trends Biotechnol.(1995) 13(4), 132-134]에 공지되어 있다.
상동성 모델링: 다른 C2c2 오솔로그에서의 해당 잔기는 문헌 [Zhang et al., 2012(Nature; 490(7421): 556-60) and Chen et al., 2015(PLoS Comput Biol; 11(5): e1004248)]의 방법 - 도메인-모티프 계면에 의해 매개된 상호작용을 예측하는 계산상 단백질-단백질 상호작용(PPI) 방법에 의해 확인될 수 있다. PrePPI(예측 PPI)는 구조 기준 PPI 예측 방법으로, 베이지안(Bayesian) 통계 프레임워크를 이용하여 비-구조적 증거와 구조적 증거를 조합한다. 이 방법은 문의되는 단백질의 쌍을 취하고, 구조적 정렬을 이용하여 그의 실험적으로 결정된 구조 또는 상동성 모델 중 어느 하나에 상응하는 구조적 대표물을 확인하는 것을 포함한다. 구조적 정렬은 전반적인 및 국소의 기하 관계를 고려함으로써 가까운 구조적 이웃 및 먼 구조적 이웃 모두를 확인하는 데 추가로 사용된다. 구조적 대표물의 두 이웃이 단백질 데이터 뱅크에 보고된 복합체를 형성할 때마다, 이는 두 개의 문의되는 단백질 사이의 상호작용을 모델링하기 위한 주형을 정의한다. 복합체의 모델은 대표 작제물을 주형 내에서 그의 상응하는 구조적 이웃에 겹쳐놓음으로써 창출된다. 이러한 접근은 문헌[Dey et al., 2013(Prot Sci; 22: 359-66)]에 추가로 기재되어 있다.
본 발명의 목적을 위하여, 증폭은 타당한 충실도로 표적 서열을 복제할 수 있는 폴리머라제 및 프라이머를 사용하는 임의의 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예를 들어, TaqGold™, T7 DNA 폴리머라제, 이.콜라이(에스케리키아 콜라이) DNA 폴리머라제의 클레나우(Klenow) 단편 및 역전사효소에 의해 수행될 수 있다. 바람직한 증폭 방법은 PCR이다.
특정 양태에서, 본 발명은 벡터를 포함한다. 본 명세서에서 사용된 "벡터"는 개체를 하나의 환경에서 다른 환경으로 전달하는 것을 허용 또는 촉진하는 도구이다. 이는 레플리콘, 예를 들어 플라스미드, 파지, 또는 코스미드로, 다른 DNA 절편이 그 안에 삽입될 수 있어서, 삽입된 절편의 복제를 유발한다. 일반적으로, 벡터는 적절한 제어 요소와 연결된 경우 복제할 수 있다. 일반적으로, 용어 "벡터"는 그것이 연결되어 있는 다른 핵산을 전달할 수 있는 핵산 분자를 지칭한다. 벡터는, 이에 한정되지 않지만, 단일 가닥, 이중 가닥, 또는 부분적으로 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단이 없는 핵산 분자(예를 들어, 원형); DNA, RNA 또는 이들 둘 모두를 포함하는 핵산 분자; 및 해당 분야에서 알려진 다른 각종 폴리뉴클레오티드를 포함한다. 벡터의 일 종류로 "플라스미드"가 있으며, 이는 원형 이중 가닥 DNA 루프를 지칭하며, 그 안으로 예를 들어 표준 분자 클로닝 기술에 의해서 추가의 DNA 절편이 삽입될 수 있다. 벡터의 또 다른 종류로 바이러스 벡터가 있으며, 바이러스-유래된 DNA 또는 RNA 서열이 바이러스(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-관련 바이러스(AAV)) 내로의 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로의 트랜스펙션을 위한, 바이러스가 지니는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다(예를 들어, 박테리아 복제 원점을 가진 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이로써 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 재조합 DNA 기술에서 활용되는 통상적인 발현 벡터는 주로 플라스미드의 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이것은 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 하나 이상의 조절 요소는 발현에 사용될 숙주 세포에 기초하여 선택될 수 있고, 발현될 핵산 서열에 작동 가능하게 연결된다. 재조합 발현 벡터 내에서 "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입된 경우에는 숙주 세포에서) 그 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 요소(들)에 연결됨을 의미하고자 한다. 재조합 및 클로닝 방법에 관련하여, 2004년 9월 2일 간행된 미국 특허 출원 10/815,730이 언급될 수 있으며, 이의 모든 내용은 그 전체로서 본 명세서에 포함된다.
본 발명의 일 양태는 가이드 RNA 및 야생형, 변형된 또는 돌연변이된 CRISPR 이펙터 단백질/효소(예를 들어, C2c2)에 대한 비시스트로닉(bicistronic) 벡터에 관한 것이다. 비시스트로닉 발현 벡터 가이드 RNA 및 야생형, 변형된 또는 돌연변이된 CRISPR 이펙터 단백질/효소(예를 들어, C2c2)가 바람직하다. 일반적으로 그리고 특히 이 구현예에서, 야생형, 변형된 또는 돌연변이된 CRISPR 이펙터 단백질/효소(예를 들어, C2c2)는 바람직하게 CBh 프로모터에 의해서 유도된다. RNA는 바람직하게 Pol III 프로모터, 예를 들어, U6 프로모터에 의해 유도된다. 이상적으로 2 개가 조합된다.
일부 구현예에서, 가이드 RNA에서 루프가 제공된다. 이는 스템 루프 도는 테트라 루프일 수 있다. 이 루프는 바람직하게 GAAA이지만, 이 서열에만 제한되는 것은 아니며, 또는 실제로 단지 4 bp 길이에만 제한되는 것도 아니다. 실제로, 헤어핀 구조에서 사용하기 위한 바람직한 루프 형성 서열은 4 개 뉴클레오티드 길이이고, 가장 바람직하게 서열 GAAA를 갖는다. 그러나, 더 길거나 짧은 루프 서열도 사용될 수 있으며, 대안적인 서열도 사용될 수 있다. 서열은 바람직하게 뉴클레오티드 트리플렛(예를 들어, AAA), 및 추가의 뉴클레오티드(예를 들어, C 또는 G)를 포함한다. 루프 형성 서열의 예들은 CAAA 및 AAAG를 포함한다.
본 명세서에 개시된 임의의 방법을 실시하는 데 있어서, 적합한 벡터가, 이에 한정되지 않지만, 미세주입, 전기천공, 소노포레이션(sonoporation), 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포좀 트랜스펙션, 덴드리머 트랜스펙션, 열 충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포좀, 면역리포좀, 비로좀 또는 인공 비리온을 통한 전달을 포함하는 해당 분야에 알려진 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 미세주입에 의해서 배아에 도입될 수 있다. 벡터 또는 벡터들은 배아의 핵 또는 세포질에 미세주입될 수 있다. 일부 방법에서, 벡터 또는 벡터들은 뉴클레오펙션에 의해서 세포 내로 도입될 수 있다.
용어 "조절 요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(IRES), 및 다른 발현 조절 요소(예를 들어, 전사 종결 신호, 예를 들어 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 이러한 조절 요소는, 예를 들어 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 기재되어 있다. 조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 유도하는 것들과 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 유도하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다. 조직-특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특정 장기(예를 들어, 간, 췌장)와 같은 요망되는 관심 조직, 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 유도할 수 있다. 조절 요소는 시간-의존적 방식으로, 예를 들어 세포-주기 의존적 또는 발생 단계 의존적 방식으로 발현을 유도할 수 있으며, 이것은 조직 특이적이거나 세포-유형 특이적일 수 있거나, 그렇지 않을 수도 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol I 프로모터), 또는 이들의 조합을 포함한다. pol III 프로모터의 예들은, 이에 한정되지 않지만, U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예들은, 이에 한정되지 않지만, 레트로바이러스 라우스 육종 바이러스(RSV) LTR 프로모터(선택적으로 RSV 인핸서와 함께), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서와 함께)[예를 들어, 문헌[Boshart et al, Cell, 41:521-530(1985)] 참조], SV40 프로모터, 디하이드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제(PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 또한, 용어 "조절 요소"에는 인핸서 요소, 예를 들어 WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 절편(문헌[Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988]); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(문헌[Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981])도 포함된다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 요망되는 발현 수준 등과 같은 요인에 따라 달라질 수 있다는 것이 해당 분야의 숙련자에 의해서 인정될 것이다. 벡터는 숙주 세포에 도입될 수 있고, 이로써 본 명세서에 설명된 바와 같이 핵산에 의해서 인코딩된, 융합 단백질 또는 펩티드를 포함하는, 전사물, 단백질 또는 펩티드가 생성될 수 있다(예를 들어, 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR) 전사물, 단백질, 효소, 이들의 돌연변이체 형태, 이들의 융합 단백질 등). 조절 서열과 관련하여, US 특허 출원 10/491,026이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 프로모터와 관련하여, PCT 공보 WO 2011/028929 및 미국 특허 출원 12/511,940이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다.
벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어 이.콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포 또는 포유류 세포에서 발현될 수 있다. 적절한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는 예를 들어, T7 프로모터 조절 서열 및 T7 폴리머라제를 사용하여 시험관내에서 전사되고 번역될 수 있다.
벡터는 원핵생물, 또는 원핵 세포에 도입되고, 그에서 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵 세포로 도입될 벡터 또는 진핵 세포로 도입되는 벡터의 생성에서 중간체 벡터(예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드 증폭)로서 벡터의 복사(copy)를 증폭시키기 위해서 사용된다. 일부 구현예에서, 원핵생물은 벡터의 복사를 증폭시키고, 하나 이상의 핵산을 발현하기 위해, 예를 들어, 숙주 세포 또는 숙주 생물로의 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다. 원핵생물에서의 단백질의 발현은 종종 융합 또는 비-융합 단백질 중 어느 하나의 발현을 유도하는 구성성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 이.콜라이에서 실시된다. 융합 벡터는 거기에서 인코딩된 단백질에, 예를 들어 재조합 단백질의 아미노 말단에 수많은 아미노산을 부가한다. 이러한 융합 벡터는 다음과 같은 하나 이상의 목적을 제공할 수 있다: (i) 재조합 단백질의 발현의 증가; (ii) 재조합 단백질의 용해도의 증가; 및 (iii) 친화성 정제에서 리간드로 작용함으로써 재조합 단백질의 정제의 보조. 종종, 융합 발현 벡터에서, 단백질분해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부에 도입되어, 융합 단백질의 정제 이후에 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 효소 및 그들의 동족 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌[Smith and Johnson, 1988. Gene 67: 31-40]), pMAL(미국 매사추세츠주 비벌리 소재의 뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 pRIT5(미국 뉴저지주 피스카타웨이 소재의 파마시아(Pharmacia))를 포함하며, 이는 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A를 표적 재조합 단백질에 융합시킨다.
적절한 유도성 비-융합 이.콜라이 발현 벡터의 예는 pTrc(문헌[Amrann et al.,(1988) Gene 69:301-315]) 및 pET 11d(문헌[Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990) 60-89])를 포함한다.
일부 구현예에서, 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비시에(Saccharomyces cerevisiae)에서의 발현을 위한 벡터의 예에는 pYepSec1(문헌[Baldari, et al., 1987. EMBO J. 6: 229-234]), pMFa(문헌[Kuijan and Herskowitz, 1982. Cell 30: 933-943]), pJRY88(문헌[Schultz et al., 1987. Gene 54: 113-123]), pYES2(미국 캘리포니아주 샌디에고 소재의 인비트로겐 코포레이션) 및 picZ(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션)가 포함된다.
일부 구현예에서, 벡터는 배큘로바이러스 발현 벡터를 사용하여 곤충 세포에서 단백질 발현을 유도한다. 배양된 곤충 세포(예를 들어, SF9 세포)에서 단백질의 발현에 이용 가능한 배큘로바이러스 벡터는 pAc 시리즈(문헌[Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165]) 및 pVL 시리즈(문헌[Lucklow and Summers, 1989. Virology 170: 31-39])를 포함한다.
일부 구현예에서, 벡터는 포유류 발현 벡터를 사용하여 포유류 세포에서 하나 이상의 서열의 발현을 유도할 수 있다. 포유류 발현 벡터의 예는 pCDM8(문헌[Seed, 1987. Nature 329: 840]) 및 pMT2PC(문헌[Kaufman, et al., 1987. EMBO J. 6: 187-195])를 포함한다. 포유류 세포에서 사용되는 경우, 발현 벡터의 제어 작용은 통상적으로 하나 이상의 조절 요소에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 유인원 바이러스 40 및 본 명세서에 개시되고 당업계에 공지되어 있는 기타의 것으로부터 유래된다. 원핵 및 진핵 세포 둘 모두를 위한 다른 적절한 발현 시스템에 대하여, 예를 들어, 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]의 16 및 17장을 참조한다.
일부 구현예에서, 재조합 포유류 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다(예를 들어, 핵산을 발현하기 위하여 조직-특이적 조절 요소가 사용됨). 조직-특이적 조절 요소는 해당 분야에 공지되어 있다. 적절한 조직-특이적 프로모터의 비제한적인 예에는 알부민 프로모터(간-특이적; 문헌[Pinkert, et al., 1987. Genes Dev. 1: 268-277]), 림프-특이적 프로모터(문헌[Calame and Eaton, 1988. Adv. Immunol. 43: 235-275]), 특히, T 세포 수용체(문헌[Winoto and Baltimore, 1989. EMBO J. 8: 729-733]) 및 면역글로불린의 프로모터(문헌[Baneiji, et al., 1983. Cell 33: 729-740]; 문헌[Queen and Baltimore, 1983. Cell 33: 741-748]), 뉴런-특이적 프로모터(예를 들어, 신경섬유 프로모터; 문헌[Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477]), 췌장-특이적 프로모터(문헌[Edlund, et al., 1985. Science 230: 912-916]) 및 유선-특이적 프로모터(예를 들어, 유장(milk whey) 프로모터; 미국 특허 4,873,316 및 유럽 출원 공보 264,166)가 포함된다. 발생-조절 프로모터, 예를 들어, 뮤린 hox 프로모터(문헌[Kessel and Gruss, 1990. Science 249: 374-379]) 및 α-태아단백질 프로모터(문헌[Campes and Tilghman, 1989. Genes Dev. 3: 537-546])도 또한 포함된다. 이들 원핵 및 진핵 벡터와 관련하여, 미국 특허 제6,750,059 호가 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 본 발명의 다른 구현예들은 바이러스 벡터의 사용에 관한 것일 수 있으며, 이에 관해서는 미국 특허 출원 제13/092,085 호가 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 조직-특이적 조절 요소는 해당 분야에 공지이며, 이에 관해서는 미국 특허 제7,776,321 호이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다.
일부 구현예에서, 조절 요소는 CRISPR 시스템의 하나 이상의 요소에 작동 가능하게 연결되어 CRISPR 시스템의 하나 이상의 요소의 발현을 유도한다. 일반적으로, SPIDR(스페이서 산재된 직접 반복)로도 알려져 는 CRISPR(클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부)은 통상 특정 박테리아 종에 특이적인 DNA 유전자좌의 패밀리를 구성한다. CRISPR 유전자좌는 이.콜라이에서 인식되는 별개의 부류의 산재된 짧은 서열 반복부(SSR) 및 관련 유전자를 포함한다(문헌[Ishino et al., J. Bacteriol., 169:5429-5433 [1987]]; 및 문헌[Nakata et al., J. Bacteriol., 171:3553-3556 [1989]]). 유사한 산재된 SSR이 할로페락스 메디테라네이(Haloferax mediterranei), 스트렙토코커스 피오게네스, 아나바에나(Anabaena) 및 미코박테리움 튜베르큘로시스(Mycobacterium tuberculosis)에서 확인되었다(문헌[Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]]; 문헌[Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]]; 문헌[Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]]; 및 문헌[Mojica et al., Mol. Microbiol., 17:85-93 [1995]] 참조). CRISPR 유전자좌는 통상적으로 SRSR(규칙적으로 산재된 짧은 반복부(short regularly spaced repeat))로 명명된 반복부의 구조가 다른 SSR과 상이하다(문헌[Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]]; 및 문헌[Mojica et al., Mol. Microbiol., 36:244-246 [2000]]). 일반적으로, 반복부는 실질적으로 고정된 길이를 갖는 독특한 개재 서열에 의해 규칙적으로 산재된 클러스터에 존재하는 짧은 요소이다(상기 문헌[Mojica et al., [2000]]). 반복 서열이 균주들 간에 고도로 보존되어 있지만, 산재된 반복부의 수와 스페이서 영역의 서열은 통상적으로 균주마다 상이하다(문헌[van Embden et al., J. Bacteriol., 182:2393-2401 [2000]]). CRISPR 유전자좌는 40 개가 넘는 원핵생물에서 확인되며(예를 들어, Jansen 등의 Mol. Microbiol., 43:1565-1575 [2002]; 및 Mojica 등의 [2005] 참조), 에로피룸(Aeropyrum), 피로박쿨룸(Pyrobaculum), 설포로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로카르쿨라(Halocarcula), 메타노박테리움, 메타노코커스, 메타노사르시나(Methanosarcina), 메타노피루스(Methanopyrus), 피로코커스, 피크로필루스(Picrophilus), 테르모플라스마, 코리네박테리움, 미코박테리움, 스트렙토마이세스, 아퀴펙스, 포르피로모나스, 클로로비움, 테르무스(Thermus), 바실러스, 리스테리아, 스태필로코커스, 클로스트리디움, 테르모언에어로박터, 미코플라스마, 푸소박테리움, 아자르쿠스(Azarcus), 크로모박테리움, 네이세리아, 니트로소모나스, 데술포비브리오(Desulfovibrio), 게오박터(Geobacter), 마익소코커스(Myxococcus), 캄필로박터, 올리넬라(Wolinella), 아시네토박터, 어위니아, 에스케리키아, 레지오넬라, 메틸로코커스, 파스퉤렐라(Pasteurella), 포토박테리움, 살모넬라, 크산토모나스, 여시니아, 트레포모나, 및 테르모토가(Thermotoga)를 포함하지만, 이로 제한되지는 않는다.
일반적으로, 본 출원에서 사용되는 바와 같은 "핵산-표적화 시스템"은 핵산-표적화 CRISPR-회합된("Cas") 유전자(또한, 본 명세서에서 이펙터 단백질로 지칭됨)의 발현 또는 활성을 유도하는 데 수반된 다른 요소 및 전사물을 종합적으로 지칭하며, 이는 핵산-표적화 Cas(이펙터) 단백질 및 가이드 RNA(crRNA 서열 및 트랜스-활성화 CRISPR/Cas 시스템 RNA(tracrRNA) 서열을 포함)를 인코딩하는 서열 또는 핵산-표적화 CRISPR 유전자좌로부터의 전사물 및 다른 서열을 포함한다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 제V형/제VI형 핵산-표적화 CRISPR 시스템으로부터 유도된다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 내인성 핵산-표적화 CRISPR 시스템을 포함하는 특정 생물로부터 유도된다. 일반적으로, 핵산-표적화 시스템은 표적 서열의 부위에서 핵산-표적화 복합체의 형성을 촉진하는 요소에 의해 특징지어진다. 핵산-표적화 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 이에 대해 상보성을 갖도록 설계되는 서열을 지칭하며, 여기서 표적 서열과 가이드 RNA 사이의 혼성화는 DNA 또는 RNA-표적화 복합체의 형성을 촉진한다. 혼성화를 유발하고 핵산-표적화 복합체의 형성을 촉진하기에 충분한 상보성이 있다면, 완전한 상보성이 반드시 요구되지는 않는다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 내 또는 세포질 내에 위치된다. 일부 구현예에서, 표적 서열은 진핵 세포의 세포소기관 내, 예를 들어 미토콘드리아 또는 엽록체에 있을 수 있다. 표적 서열을 포함하는 표적화된 유전자좌 내로의 재조합을 위해 사용될 수 있는 서열 또는 주형은 "편집 주형" 또는 "편집 RNA" 또는 "편집 서열"로 지칭된다. 본 발명의 일 양태에서, 외인성 주형 RNA는 편집 주형으로서 지칭될 수 있다. 본 발명의 일 양태에서 재조합은 상동성 재조합이다.
전형적으로, 내인성 핵산-표적화 시스템의 맥락에서, 핵산-표적화 복합체(표적 서열에 혼성화되고, 하나 이상의 핵산-표적화 이펙터 단백질과 복합체화된 가이드 RNA를 포함함)의 형성은 표적 서열 내 또는 가까이에서(예를 들어, 이로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 개 이상의 염기쌍) 하나 또는 2 개의 RNA 가닥의 절단을 초래한다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소의 발현을 유도하는 하나 이상의 벡터가 숙주 세포 내로 도입되어 핵산-표적화 시스템의 요소의 발현이 하나 이상의 표적 부위에서 핵산-표적화 복합체의 형성을 유도하도록 한다. 예를 들어, 핵산-표적화 이펙터 단백질 및 가이드 RNA는 각각 별개의 벡터 상에서 별개의 조절 요소에 작동 가능하게 연결될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현된 둘 이상의 요소가 단일 벡터 내에 조합될 수 있으며, 핵산-표적화 시스템의 임의의 성분을 제공하는 하나 이상의 추가적인 벡터는 첫번째 벡터에 포함되지 않는다. 단일 벡터 내에서 조합되는 핵산-표적화 시스템 요소는, 예를 들어 제2 요소에 대해 3'(이의 "다운스트림") 또는 제2 요소에 대해 5'(이의 "업스트림")에 위치되는 하나의 요소와 같이, 임의의 적합한 배향으로 배열될 수 있다. 일 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일하거나 반대의 가닥 상에 위치될 수 있거나, 동일하거나 상이한 방향으로 배향된다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 임베딩된 가이드 RNA 및 핵산-표적화 이펙터 단백질을 인코딩하는 전사물의 발현을 유도할 수 있다(예를 들어, 상이한 인트론 내에서 각각, 적어도 하나의 인트론 내에서 둘 이상, 또는 단일 인트론 내에서 모두). 일부 구현예에서, 핵산-표적화 이펙터 단백질 및 가이드 RNA는 동일한 프로모터에 작동 가능하게 연결되고 발현된다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 핵산-표적화 복합체의 표적 서열로의 서열-특이적 결합을 유도하기에 충분한 표적 폴리뉴클레오티드와의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 이의 상응하는 표적 서열 간의 상보성 정도는, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬된 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적 정렬은 정렬 서열에 대한 임의의 적합한 알고리즘을 사용하여 결정될 수 있으며, 이의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies), ELAND(Illumina, 미국 캘리포니아주 샌디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 일부 구현예에서, 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상의 뉴클레오티드이거나 이를 초과한다. 일부 구현예에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드 미만이다. 표적 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하는 가이드 서열의 능력은 임의의 적절한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 시스템의 성분은, 핵산-표적화 서열의 성분을 인코딩하는 벡터를 이용한 형질감염에 의해서와 같이 해당하는 표적 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 서열 내 또는 그 부근에서의 우선적인 절단의 평가로 이어질 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열(또는 이의 부근의 서열)의 절단은 표적 서열, 즉 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 핵산-표적화 복합체의 성분을 제공하고, 표적 서열에서 또는 이 부근에서의 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다.
가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 유전자 전사물 또는 mRNA 내 서열이다.
일부 구현예에서, 표적 서열은 세포의 게놈 내 서열이다.
일부 구현예에서, 가이드 서열은 가이드 서열 내 2차 구조의 정도를 감소시키도록 선택된다. 2차 구조는 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스 자유 에너지 계산을 기반으로 한다. 이와 같은 한 알고리즘의 예는 mFold이며, 이는 문헌[Zuker and Stiegler, Nucleic Acids Res. 9(1981), 133-148]에 기재된 바와 같다. 또 다른 예의 폴딩 알고리즘은, 비엔나 대학의 이론 화학 연구소에서 개발된, 중심 구조 예측 알고리즘을 사용하는, 온라인 웹서버 RNAfold이다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조). 추가의 알고리즘은 미국 출원 일련 번호 TBA(대리인 도켓 44790.11.2022; 브로드 레퍼런스 BI-2013/004A)에서 찾을 수 있으며; 이는 본 명세서에 참조로서 포함된다.
일부 구현예에서, 핵산-표적화 이펙터 단백질은 하나 이상의 이종성 단백질 도메인(예를 들어, 핵산-표적화 이펙터 단백질에 추가적으로, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상 또는 이를 초과하는 도메인)을 포함하는 융합 단백질의 일부이다. 일부 구현예에서, CRISPR 이펙터 단백질/효소는 하나 이상의 이종성 단백질 도메인(예를 들어, CRISPR 효소에 추가적으로, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상 또는 이를 초과하는 도메인)을 포함하는 융합 단백질의 일부이다. CRISPR 이펙터 단백질/효소 융합 단백질은 임의의 추가의 단백질 서열 및 선택적으로 임의의 2 개 도메인 사이의 링커 서열을 포함할 수 있다. 이펙터 단백질에 융합될 수 있는 단백질 도메인의 예는 제한 없이, 에피토프 태그, 리포터 유전자 서열 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는, 이로 한정되지 않지만, 글루타티온-S-트랜스퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함한다. 핵산-표적화 이펙터 단백질은 DNA 분자에 결합하거나, 이에 한정되지 않지만, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합물, GAL4 DNA 결합 도메인 융합물 및 단순 포진 바이러스(HSV) BP16 단백질 융합체물을 포함하는 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 인코딩하는 유전자 서열에 융합될 수 있다. 핵산-표적화 이펙터 단백질을 포함하는 융합 단백질의 부분을 형성할 수 있는 추가의 도메인은 본 명세서에 참고 문헌으로 포함되는 US20110059502에 기재되어 있다. 일부 구현예에서, 태그가 부착된 핵산-표적화 이펙터 단백질을 사용하여 표적 서열의 위치를 확인한다.
일부 구현예에서, CRISPR 효소는 유도성 시스템의 성분을 형성할 수 있다. 이 시스템의 유도성 성질은 에너지 형태를 사용하여 유전자 편집이나 유전자 발현의 시공간적 제어를 가능하게 할 것이다. 에너지의 형태는 이에 한정되지 않이지만, 전자기 방사, 음향 에너지, 화학 에너지 및 열 에너지를 포함할 수 있다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬)을 포함한다. 일 구현예에서, CRISPR 효소는 서열-특이적 방식으로 전사 활성에서의 변화를 유도하기 위한 광 유도성 전사 이펙터(LITE)의 일부일 수 있다. 광의 성분은 CRISPR 효소, 광-반응성 시토크롬 이형이량체(예를 들어, 아라비돕시스 탈리아나 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 이의 사용을 위한 방법의 추가의 예는 US 61/736465 및 US 61/721,283 및 WO 2014/018423 및 US8889418, US8895308, US20140186919, US20140242700, US20140273234, US20140335620, WO2014093635에서 제공되며, 이는 전체가 참조로서 본 명세서에 포함된다.
일부 양태에서, 본 발명은 본 명세서에 기재된 바와 같은 하나 이상의 폴리뉴클레오티드, 하나 이상의 벡터, 하나 이상의 이의 전사물, 및/또는 이로부터의 하나 이상의 단백질을 숙주 세포에 전달하는 것을 포함하는 방법을 제공한다. 일부 양태에서, 본 발명은 이와 같은 방법에 의해 생산된 이와 같은 세포, 및 상기 세포를 포함하거나 상기 세포로부터 생산된 생물(예를 들어, 동물, 식물, 또는 균류)를 제공한다. 일부 구현예에서, 가이드 RNA와 조합된(및 선택적으로 이와 복합체화된) 핵산-표적화 이펙터 단백질은 세포로 전달된다. 통상의 바이러스 및 비-바이러스 기반 유전자 수송 방법이 포유류 세포 또는 표적 조직 내로 핵산을 도입시키는 데 사용될 수 있다. 이와 같은 방법은 핵산-표적화 시스템의 성분을 인코딩하는 핵산을 배양물, 또는 숙주 생물 내 세포로 투여하는 데 사용될 수 있다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들어, 본 명세서에 기재된 벡터의 전사물), 네이키드 핵산, 및 리포좀과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이는 세포로의 전달 후 에피솜 또는 통합된 게놈 중 하나를 갖는다. 유전자 치료법 절차의 검토에 대해서는, 문헌[Anderson, Science 256:808-813(1992)]; [Nabel & Felgner, TIBTECH 11:211-217(1993)]; [Mitani & Caskey, TIBTECH 11:162-166(1993)]; [Dillon, TIBTECH 11:167-175(1993)]; [Miller, Nature 357:455-460(1992)]; [Van Brunt, Biotechnology 6(10):1149-1154(1988)]; [Vigne, Restorative Neurology and Neuroscience 8:35-36(1995)]; [Kremer & Perricaudet, British Medical Bulletin 51(1):31-44(1995)]; [Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Bohm(eds)(1995)]; 및 [Yu et al., Gene Therapy 1:13-26(1994)]을 참조한다.
핵산의 비-바이러스 전달 방법은 리포펙션, 뉴클레오펙션, 미세주입, 바이오리스틱스, 비로좀, 리포좀, 면역리포좀, 다가양이온 또는 지질:핵산 컨쥬게이트, 네이키드 DNA, 인공 비리온, 및 DNA의 제제-향상 흡수를 포함한다. 리포펙션은, 예를 들어 미국 특허 5,049,386, 4,946,787; 및 4,897,355에 기재되어 있으며, 리포펙션 시약은 상업적으로 판매된다(예를 들어, 형질감염am™ 및 Lipofectin™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 대해 적합한 양이온성 및 중성 지질은 Felgner의 WO 91/17424; WO 91/16024의 것을 포함한다. 전달은 세포(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직(예를 들어, 생체내 투여)으로 이루어질 수 있다.
면역지질 복합체와 같은 표적화된 리포좀을 포함하는, 지질:핵산 복합체의 제조는 당업자에게 잘 알려져 있다(예를 들어, 문헌[Crystal, Science 270:404-410(1995)]; [Blaese et al., Cancer Gene Ther. 2:291-297(1995)]; [Behr et al., Bioconjugate Chem. 5:382-389(1994)]; [Remy et al., Bioconjugate Chem. 5:647-654(1994)]; [Gao et al., Gene Therapy 2:710-722(1995)]; [Ahmad et al., Cancer Res. 52:4817-4820(1992)]; 미국 특허 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787 참조).
핵산 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 체내 특정 세포로 표적화하고, 핵으로의 바이러스 페이로드(payload)를 수송하기 위한 매우 진화된 공정을 이용한다. 바이러스 벡터는 환자에게 직접(생체내) 투여될 수 있거나, 또는 이들은 시험관내에서 세포를 처리하는 데 사용될 수 있고, 변형된 세포는 환자에게 선택적으로 투여될 수 있다(생체외). 통상의 바이러스 기반 시스템은 유전자 운반을 위해 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 단순포진 바이러스 벡터를 포함할 수 있다. 숙주 게놈 내 통합은 레트로바이러스, 렌티바이러스, 및 아데노-관련 바이러스 유전자 운반 방법에서 가능하며, 이는 종종 삽입된 전이유전자의 장기간 발현을 초래한다. 추가적으로, 높은 형질도입 효능은 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 친화성은 외부 외피 단백질을 통합하여 변경될 수 있으며, 이는 표적 세포의 잠재적 표적 집단을 확장한다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염하고 통상적으로 높은 바이러스 역가를 생산할 수 있는 레트로바이러스 벡터이다. 그러므로, 레트로바이러스 유전자 이동 시스템의 선택은 표적 조직에 의존할 것이다. 레트로바이러스 벡터는 최대 6 kb 내지 10 kb까지의 외부 서열에 대한 패키징 능력을 갖는 cis-작용의 긴 말단 반복부로 구성된다. 최소한의 cis-작용 LTR은 벡터의 복제 및 패키징에 대하여 충분하며, 이들은 그 후 표적 세포 내로 치료적 유전자를 통합하는 데 사용되어 영구적인 전이유전자 발현을 제공한다. 널리 사용된 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 기본 유인원(gibbon ape) 백혈병 바이러스(GaLV), 원숭이 면역결핍 바이러스(SIV), 인간 면역결핍 바이러스(HIV), 및 이들의 조합을 기반으로 한 벡터를 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739(1992)]; [Johann et al., J. Virol. 66:1635-1640(1992)]; [Sommnerfelt et al., Virol. 176:58-59(1990)]; [Wilson et al., J. Virol. 63:2374-2378(1989)]; [Miller et al., J. Virol. 65:2220-2224(1991)]; PCT/US94/05700 참조). 일시적인 발현이 바람직한 적용에서, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가능하게 하며 세포 분열을 필요로 하지 않는다. 이와 같은 벡터로, 높은 역가 및 발현 수준이 수득되었다. 이 벡터는 상대적으로 간단한 시스템에서 다량으로 생산될 수 있다. 아데노-관련 바이러스("AAV") 벡터는 또한, 예를 들어 핵산 및 펩티드의 시험관내 생산에서, 그리고 생체내 및 생체외 유전자 치료법 과정을 위해 세포를 표적 핵산으로 세포 형질도입시키는 데 사용될 수 있다(예를 들어, 문헌[West et al., Virology 160:38-47(1987)]; 미국 특허 4,797,368; WO 93/24641; 문헌[Kotin, Human Gene Therapy 5:793-801(1994)]; [Muzyczka, J. Clin. Invest. 94:1351(1994)] 참조). 재조합 AAV 벡터의 구성은 미국 특허 5,173,414; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260(1985)]; [Tratschin, et al., Mol. Cell. Biol. 4:2072-2081(1984)]; [Hermonat & Muzyczka, PNAS 81:6466-6470(1984)]; 및 [Samulski et al., J. Virol. 63:03822-3828(1989)]을 포함하여, 다수의 간행물에 기재되어 있다.
유전적 및 후성적 조건의 모델
본 발명의 방법은, 예를 들어 관심 돌연변이의 모델 또는 질병 모델을 통하여, 질병 모델로서 사용될 수 있는 식물, 동물 또는 세포를 형성하고/형성하거나 관심 유전적 또는 후성적 질환을 연구하는 데 사용될 수 있다. 본 명세서에서 사용된 바와 같이 "질병"은 대상체에서 질병, 장애 또는 징후를 지칭한다. 예를 들어, 본 발명의 방법은 질병과 연관된 하나 이상의 핵산 서열에서의 변형을 포함하는 동물 또는 세포, 또는 질병과 연관된 하나 이상의 핵산 서열의 발현이 변경된 식물, 동물 또는 세포를 만드는 데 사용될 수 있다. 그러한 핵산 서열은 질병 관련 단백질 서열을 인코딩할 수 있거나, 질병 관련 제어 서열일 수 있다. 이에 따라, 본 발명의 일 구현예에서, 식물, 대상체, 환자, 생물 또는 세포는 비-인간 대상, 환자, 생물 또는 세포일 수 있는 것으로 이해된다. 따라서, 본 발명은 본 발명에 의해 생산된, 식물, 동물 또는 세포, 또는 그의 자손을 제공한다. 그 자손은 생산된 식물 또는 동물의 클론일 수 있거나, 추가의 바람직한 특성을 그의 자손에게 유전자 이입(introgress)하기 위해 동일 종의 다른 개체와의 교잡에 의한 유성 생식으로부터의 것일 수 있다. 세포는 다세포 생물, 특히 동물 또는 식물의 경우 생체내 또는 생체외일 수 있다. 세포가 배양된 경우, 적절한 배양 조건이 맞추어지고 바람직하게는 세포가 이러한 목적을 위해 적합하게 조정되는 경우 세포주가 수립될 수 있다(예를 들어, 줄기 세포). 본 발명에 의해 생산된 박테리아 세포주가 또한 고려된다. 이에 따라, 세포주 또한 고려된다.
일부 방법에서, 질병 모델은 동물 또는 세포에서 돌연변이의 효과 및 질병 연구에서 흔히 사용되는 기준을 이용하여 질병의 발생 및/또는 진전을 연구하는 데 사용될 수 있다. 대안적으로, 그러한 질병 모델은 약학 활성 화합물의 질병에 대한 효과를 연구하는 데 유용하다.
일부 방법에서, 질병 모델은 잠재적인 유전자 치료 전략의 효능을 평가하는데 사용될 수 있다. 즉, 질병-관련 유전자 또는 폴리뉴클레오티드는 질병 발생 및/또는 진전이 저해 또는 감소되도록 변형될 수 있다. 특히, 방법은 변경된 단백질이 생산되고, 그 결과 동물 또는 세포가 변경된 반응을 갖도록 질병 관련 유전자 또는 폴리뉴클레오티드를 변형시키는 것을 포함한다. 따라서, 일부 방법에서, 유전학적으로 변형된 동물은, 유전자 치료법 이벤트의 효과가 평가될 수 있도록, 질병이 발생되기 쉬운 동물에 비교될 수 있다.
또 다른 구현예에서, 본 발명은, 질병 유전자와 연관된 세포 신호화 이벤트를 조절하는 생물학적 활성제의 개발 방법을 제공한다. 본 방법은 하나 이상의 CRISPR 효소, 및 가이드 서열에 연결된 직접 반복 서열의 발현을 유도하는 하나 이상의 벡터를 포함하는 세포와 시험 화합물을 접촉시키는 단계; 및 예를 들어 세포 내에 포함된 질병 유전자 내 돌연변이와 연관된 세포 신호화 이벤트의 감소 또는 증강을 나타내는 판독값에서의 변화를 검출하는 단계를 포함한다.
세포 모델 또는 동물 모델은 세포 작용 변화를 스크리닝하기 위한 본 발명의 방법과 조합되어 구축될 수 있다. 그러한 모델은 본 발명의 CRISPR 복합체에 의해 변형된 게놈 서열의 관심 세포 작용에 대한 효과를 연구하는 데 사용될 수 있다. 예를 들어, 세포 작용 모델은 변형된 게놈 서열의 세포내 신호화 또는 세포외 신호화에 대한 효과를 연구하는 데 사용될 수 있다. 대안적으로, 세포 작용 모델은 변형된 게놈 서열의 감각 인지에 대한 효과를 연구하는 데 사용될 수 있다. 그러한 일부 모델에서, 모델 내 신호화 생화학 경로와 연관된 하나 이상의 게놈 서열은 변형된다.
몇몇 질병 모델은 특히 연구되어 왔다. 이들은 새로운 자폐증 위험 유전자 CHD8, KATNAL2, 및 SCN2A; 및 증후군성 자폐증(엔젤만(Angelman) 증후군) 유전자 UBE3A를 포함한다. 이들 유전자 및 결과의 자폐증 모델은 물론 바람직하지만, 유전자 및 상응하는 모델에 걸친 본 발명의 광범위한 적용성을 나타내는 역할을 한다.
신호화 생화학 경로와 연관된 하나 이상의 게놈 서열의 변경된 발현은, 시험 모델 세포와 대조구 세포들이 후보물질과 접촉되는 경우, 시험 모델 세포와 대조구 세포들 간의 상응 유전자의 mRNA 수준에서의 차이에 대한 분석에 의해 결정될 수 있다. 대안적으로, 신호화 생화학 경로와 연관된 서열의 차등 발현은 인코딩된 폴리뉴클레오티드 또는 유전자 생성물의 수준에서의 차이를 검출함으로써 결정된다.
mRNA 전사물 또는 상응하는 폴리뉴클레오티드의 수준에서 약제-유도된 변경을 분석하기 위하여, 샘플 내 포함된 핵산을 먼저 해당 분야의 표준 방법에 따라 추출한다. 예를 들어, mRNA는 문헌 [Sambrook et al.(1989)]에 설명된 절차에 따라 각종 용균 효소 또는 화학 용액을 이용하여 분리될 수 있거나, 제조자에 의해 제공된 첨부 안내서에 따라 핵산-결합 수지에 의해 추출될 수 있다. 추출된 핵산 샘플 내에 포함된 mRNA는 이후 당 분야에서 공지된 방법 또는 본 명세서에서 예시된 방법에 기초한, 증폭 절차 또는 통상의 혼성화 분석(예를 들어, 노던 블롯 분석)에 의해 검출된다.
본 발명의 목적을 위하여, 증폭은 타당한 충실도로 표적 서열을 복제할 수 있는 폴리머라제 및 프라이머를 사용하는 임의의 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예를 들어, TaqGold™, T7 DNA 폴리머라제, 이.콜라이 DNA 폴리머라제의 클레나우 단편 및 역전사효소에 의해 수행될 수 있다. 바람직한 증폭 방법은 PCR이다. 특히, 분리된 RNA는 신호화 생화학 경로와 연관된 서열의 발현 수준을 정량화하기 위하여 정량적 폴리머라제 연쇄반응과 연결된 역전사 분석(RT-PCR) 처리될 수 있다.
유전자 발현의 검출은 증폭 분석에서 실시간으로 수행될 수 있다. 일 양태에서, 증폭된 생성물은 이에 한정되지 않지만 DNA 삽입제 및 DNA 홈 결합제를 포함하는 형광 DNA-결합제로 직접 시각화될 수 있다. 이중-가닥 DNA 분자 내로 혼입된 삽입제의 양은 통상적으로 증폭된 DNA 생성물의 양에 비례하기 때문에, 증폭된 생성물의 양은 해당 분야의 통상적인 광학 시스템을 이용하여 삽입된 염료의 형광을 정량화함으로써 편리하게 결정될 수 있다. 본 적용에 적합한 DNA-결합 염료는 SYBR 녹색, SYBR 청색, DAPI, 프리디늄 요오드, 회스트(Hoeste), SYBR 금색, 에티디윰 브로마이드, 아크리딘, 프로플라빈, 아크리딘 오렌지, 아크리플라빈, 플루오르쿠마린, 엘립티신, 다우노마이신, 클로로퀸, 디스타마이신 D, 크로모마이신, 호미디윰, 미트라마이신, 루테늄 폴리피리딜스, 안트라마이신 등을 포함한다.
또 다른 양태에서, 서열 특이적 프로브와 같은 기타 형광 표지는, 증폭된 생성물의 검출 및 정량화를 촉진하기 위하여 증폭 반응에서 사용될 수 있다. 프로브-기준 정량적 증폭은 원하는 증폭 생성물의 서열-특이적 검출에 의존한다. 이는 형광, 표적-특이적 프로브(예를 들어, TaqMan® 프로브)를 이용하여, 그 결과 특이성 및 감도를 증가시킨다. 프로브-기준 정량적 증폭의 수행 방법은 당 기술 분야에서 잘 확립되어 있으며, 미국 특허 제5,210,015 호에 교시되어 있다.
그러나 또 다른 양태에서, 신호화 생화학 경로와 연관된 서열과 상동성을 공유하는 혼성화 프로브를 이용하는 통상의 혼성화 분석이 수행될 수 있다. 전형적으로, 프로브는, 혼성화 반응에서 시험 대상체로부터 유래된 생물학적 샘플 내에 포함된 신호화 생화학 경로와 연관된 서열과 안정한 복합체를 형성하는 것을 가능하게 한다. 안티센스가 프로브 핵산으로서 사용된 경우, 샘플 내에 제공된 표적 폴리뉴클레오티드는 그 안티센스 핵산의 서열에 상보적이도록 선택됨을 해당 분야의 숙련자는 이해할 것이다. 역으로, 뉴클레오티드 프로브가 센스 핵산인 경우, 표적 폴리뉴클레오티드는 센스 핵산의 서열에 상보적이도록 선택된다.
혼성화는 각종 엄격성 조건 하에서 수행될 수 있다. 본 발명의 실시에 적합한 혼성화 조건은 프로브와 신호화 생화학 경로와 연관된 서열 간의 인식 상호작용이 충분히 특이적이고 충분히 안정적이도록 하는 것이다. 혼성화 반응의 엄격성을 증가시키는 조건은 해당 기술 분야에서 공지 및 공개되어 있다. 예를 들어, 문헌[(Sambrook, et al.,(1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition)] 참조. 혼성화 분석은, 이에 한정되지 않지만 니트로셀룰로스, 유리, 규소, 및 각종 유전자 어레이를 포함하는 임의의 고체 기재 상에 고정화된 프로브를 이용하여 형성될 수 있다. 바람직한 혼성화 분석은 미국 특허 5,445,934에 기재된 바와 같은 고밀도 유전자 칩 상에서 수행된다.
혼성화 분석 동안 형성된 프로브-표적 복합체의 편리한 검출을 위하여, 뉴클레오티드 프로브는 검출 가능한 표지에 컨쥬게이트된다. 본 발명에서의 이용에 적합한 검출 가능한 표지는 광화학, 생화학, 분광학 면역 화학, 전기, 광학 또는 화학적 수단에 의해 검출 가능한 임의의 조성물을 포함한다. 광범위한 종류의 적절한 검출 가능한 표지는 해당 분야에서 알려져 있으며, 이는 형광 또는 화학발광 표지, 방사성 동위원소 표지, 효소 또는 기타 리간드를 포함한다. 바람직한 구현예에서, 형광 표지 또는 효소 태그, 예를 들어 디곡시제닌, β-갈락토시다제, 우레아제, 알칼리성 포스파타제 또는 퍼옥시다제, 아비딘/바이오틴 복합체가 바람직하게 사용될 것이다.
혼성화 또는 강도를 검출 또는 정량화하는 데 사용되는 검출 방법은 통상적으로 상기 선택된 표지에 따라 달라질 것이다. 예를 들어, 방사성표지는 사진 필름 또는 포스포이미저(phosphoimager)를 이용하여 검출될 수 있다. 형광 마커는 방출된 광을 검출하기 위한 광검출기를 이용하여 검출 및 정량화될 수 있다. 효소 표지는 통상적으로 효소에 기재를 제공하고, 효소의 작용에 의해 기재 상에 생성된 반응 생산물을 측정하여 검출되고; 최종적으로 비색성 표지는 착색된 표지를 단순히 시각화함으로써 검출된다.
신호화 생화학 경로와 연관된 서열의 발현에서의 약제-유도된 변화는 상응하는 유전자 생성물을 검사함으로써 결정될 수도 있다. 단백질 수준의 결정은 통상적으로, a) 생물학적 샘플 내에 포함된 단백질을, 신호화 생화학 경로와 연관된 단백질에 특이적으로 결합하는 약제와 접촉시키는 단계; 및 b) 그렇게 형성된 어떤 약제:단백질 복합체를 확인하는 확인하는 단계를 포함한다. 이러한 구현예의 일 양태에서, 신호화 생화학 경로와 연관된 단백질에 특이적으로 결합하는 약제는 항체, 바람직하게는 단일클론성 항체이다.
반응은 그 약제를, 시험 샘플로부터 유래된 신호화 생화학 경로와 연관된 단백질의 샘플과, 그 약제와 신호화 생화학 경로와 연관된 단백질간에 복합체가 형성되는 것을 가능하게 하는 조건 하에서 접촉시킴으로써 수행된다. 복합체의 형성은 해당 기술 분야의 표준 절차에 따라 직접적으로 또는 간접적으로 검출될 수 있다. 직접 검출 방법에서, 약제에는 검출 가능한 표지가 공급되고, 미반응된 약제는 복합체로부터 제거될 수 있으며; 따라서 남아있는 표지의 양은 형성된 복합체의 양을 나타낸다. 그러한 방법의 경우, 엄격한 세척 조건 동안에도 약제에 부착된 채로 잔류하는 표지를 선택하는 것이 바람직하다. 표지는 결합 반응을 간섭하지 않는 것이 바람직하다. 대안에서, 간접적 검출 절차는, 화학적으로 또는 효소적으로 도입된 표지를 함유하는 약제를 사용할 수 있다. 바람직한 표지는 일반적으로 결합 또는 그 결과의 약제:폴리펩티드 복합체의 안정성을 간섭하지 않는다. 그러나, 표지는 전형적으로 효과적인 결합 및 그에 따라 검출 가능한 신호를 생성하기 위하여 항체에 접근 가능하도록 설계된다.
단백질 수준을 검출하는 데 적합한 광범위한 각종 표지는 당 기술 분야에서 알려져 있다. 비제한적인 예로는 방사성동위원소, 효소, 콜로이드성 금속, 형광 화합물, 생물발광 화합물, 및 화학발광 화합물이 포함된다.
결합 반응 동안 형성된 약제:폴리펩티드 복합체의 양은 표준 정량 분석에 의해 정량화될 수 있다. 상기 예시된 바와 같이, 약제:폴리펩티드 복합체의 형성은 결합 부위에서 유지된 표지의 양에 의해 직접적으로 측정될 수 있다. 대안에서, 신호화 생화학 경로와 연관된 단백질은, 특정 약제 상의 결합 부위에 대해 표지된 유사체와 경쟁하는 그의 능력에 대해 시험된다. 이러한 경쟁적 분석에서, 포착된 표지의 양은 시험 샘플에 존재하는 신호화 생화학 경로와 연관된 단백질 서열의 양에 역비례한다.
상기 개괄된 일반 원칙을 기준으로 한 다수의 단백질 분석 기술은 해당 기술분야에서 이용 가능하다. 그들은 이에 한정되지 않지만, 방사성면역분석, ELISA(효소 결합 면역흡착 분석), "샌드위치" 면역분석, 면역방사계 분석, 제위치 면역분석(예를 들어, 콜로이드성 금, 효소 또는 방사성동위원소 표지를 이용), 웨스턴 블롯 분석, 면역침강 분석, 면역형광 분석, 및 SDS-PAGE를 포함한다.
신호화 생화학 경로와 연관된 단백질을 특이적으로 인식 또는 결합하는 항체는 상기 언급된 단백질 분석을 수행하는 것이 바람직하다. 바람직한 경우, 번역후 변형의 특이적 유형(예를 들어, 신호화 생물학 경로 유도성 변형)을 인식하는 항체가 사용될 수 있다. 번역후 변형은 이에 한정되지 않지만, 글리코실화, 지질화, 아세틸화 및 인산화를 포함한다. 이들 항체는 판매업체로부터 구매할 수 있다. 예를 들어, 티로신-포스포릴화 단백질을 특이적으로 인식하는 항-포스포티로신 항체가 Invitrogen 및 Perkin Elmer를 포함하는 다수의 판매사로부터 입수 가능하다. 항 포스포티로신 항체는, 특히 ER 스트레스에 반응하여 그의 티로신 잔기 상에서 별도로 포스포릴화된 단백질을 검출하는 데 있어서 특히 이용 가능하다. 그러한 단백질은 이에 한정되지 않지만, 진핵성 번역 개시 인자 2 알파(eIF-2α)가 포함된다. 대안적으로, 이들 항체는 통상의 다클론성 또는 단일클론성 항체 기술을 이용하여, 숙주 동물 또는 항체-생산 세포를 바람직한 번역후 변형을 나타내는 표적 단백질로 면역화함으로써 생성될 수 있다.
본 방법을 실시하는 데 있어서, 상이한 신체 조직에서, 상이한 세포 유형에서, 및/또는 상이한 하위세포 작제물에서 신호화 생화학 경로와 연관된 단백질의 발현 패턴을 식별하는 것이 바람직할 수 있다. 이들 연구는, 특정 조직, 세포 유형 또는 하위 구조 내에서 우선적으로 발현되는 단백질 마커에 결합할 수 있는 조직-특이적, 세포-특이적 또는 하위세포 구조 특이적 항체를 이용하여 수행될 수 있다.
신호화 생화학 경로와 연관된 유전자의 변경된 발현은 또한 제어 세포에 대하여 유전자 생성물의 활성에서의 변화를 시험함으로써 결정될 수 있다. 신호화 생화학 경로와 연관된 단백질의 활성에서의 약제-유도된 변화에 대한 분석은, 연구 중에 있는 생물학적 활성 및/또는 신호 형질도입 경로에 의존할 것이다. 예를 들어, 단백질이 키나아제인 경우, 다운스트림 기재(들)를 포스포릴화하는 그의 능력에서의 변화는 해당 기술에서 알려진 각종 분석에 의해 결정될 수 있다. 대표적인 분석으로는 이에 한정되지 않이지만, 포스포릴화 단백질을 인식하는 포스포릴화 항-포스포티로신 항체와 같은 항체를 이용하는 면역블롯팅 및 면역침강이 포함된다. 추가적으로, 키나아제 활성은, AlphaScreen™(Perkin Elmer로부터 입수 가능) 및 eTag™ 분석(문헌[Chan-Hui, et al.(2003) Clinical Immunology 111: 162-174])와 같은 고처리량(high throughput) 화학발광 분석에 의해 검출될 수 있다.
신호화 생화학 경로와 연관된 단백질이 세포 내 pH 조건의 동요를 일으키는 신호화 캐스케이드(cascade) 반응의 일부인 경우, 형광 pH 염료와 같은 pH 민감성 분자가 리포터 분자로서 사용될 수 있다. 또 다른 예에서, 신호화 생화학 경로와 연관된 단백질이 이온 채널인 경우, 막 전위 및/또는 세포내 이온 농도에서의 동요는 모니터링될 수 있다. 다수의 상용 키트 및 고속 처리 장치는 이온 채널의 조절제에 대한 신속하고 강건한 스크리닝에 특히 적합하다. 대표적인 기기로는 FLIPRTM(Molecular Devices, Inc.) 및 VIPR(Aurora Biosciences)가 포함된다. 이들 기기는 마이크로플레이트의 1000 개가 넘는 샘플 웰 내 반응들을 검출할 수 있고, 1 초 또는 심지어 밀리 초(minisecond) 내의 실시간 측정 및 작용 데이터를 제공할 수 있다.
본 명세서에 개시된 임의의 방법의 실시에 있어서, 적합한 벡터가, 이에 한정되지 않지만, 미세주입, 전기천공, 소노포레이션(sonoporation), 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포좀 트랜스펙션, 덴드리머 트랜스펙션, 열 충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포좀, 면역리포좀, 비로좀 또는 인공 비리온을 통한 전달을 포함하는 해당 분야에 알려진 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 미세주입에 의해 배아 내로 도입된다. 벡터 또는 벡터들은 핵 내로 또는 배아의 세포질 내로 미세주입될 수 있다. 일부 방법에서, 벡터 또는 벡터들은 뉴클레오펙션(nucleofection)에 의해 세포 내로 도입될 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내생 또는 외인성 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵 내에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물을 코딩하는 서열(예를 들어, 단백질) 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다.
표적 폴리뉴클레오티드의 예는 신호화 생화학 경로, 예를 들어 신호화 생화학 경로와 연관된 서열, 예를 들어 신호화 생화학 경로-연관 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 관련 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-관련된" 유전자 또는 폴리뉴클레오티드는, 비-질병 대조군의 조직 또는 세포에 비하여 질병-발생된 조직으로부터 유도된 세포에서의 비정상 수준 또는 비정상 형태의 전사 또는 번역 생성물을 산출하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현된 유전자일 수 있고; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진전과 상관관계가 있다. 질병-관련 유전자는 또한, 질병의 병인론에 책임이 있는 유전자(들)와의 연결 불균형 상태 또는 직접적으로 책임이 있는 유전자 가공 돌연변이(들) 또는 유전 변이를 지칭한다. 전사된 또는 번역된 생성물은 공지되거나 공지되지 않은 것일 수 있으며, 정상 또는 비정상 수준일 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내인성 또는 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵 내에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다. 이론에 의해 구애되고자 하지 않지만, 표적 서열은 PAM(프로토스페이서 인접 모티프)와 연관되어야 하는 것으로 여겨지며; 이는 CRISPR 복합체에 의해 인식된 짧은 서열이다. PAM에 대한 정확한 서열 및 길이 요구사항은 사용된 CRISPR 효소에 따라 다르지만, PAM은 프로토스페이서(즉, 표적 서열)에 인접한 통상적으로 2 내지 5 개의 염기쌍 서열이다. PAM 서열의 예는 하기 예의 섹션에서 제공되며, 숙련자는 주어진 CRISPR 효소와의 이용을 위한 추가의 PAM 서열을 확인할 수 있을 것이다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 다수의 질병-관련 유전자 및 폴리뉴클레오티드뿐만 아니라, 신호화 생화학 경로-관련 유전자 및 폴리뉴클레오티드를 포함할 수 있으며, 이는 각각 "SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION"라는 명칭으로 2012년 12월 12일 및 2013년 1월 2일에 출원된 미국 임시 출원 61/736,527 및 61/748,427, 및 "DELIVERY, ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS"라는 명칭으로 2013년 12월 12일에 출원된 PCT 출원 PCT/US2013/074667에 열거된 바와 같으며, 이들의 모든 내용은 본 명세서에 전체가 참조로서 포함된이다.
표적 폴리뉴클레오티드의 예로는 신호화 생화학 경로, 예를 들어 신호화 생화학 경로-연관 유전자 또는 폴리뉴클레오티드와 연관된 서열을 포함한다. 표적 폴리뉴클레오티드의 예로는 질병 관련 유전자 또는 폴리뉴클레오티드가 포함된다. "질병-관련" 유전자 또는 폴리뉴클레오티드는, 비-질병 대조구의 조직 또는 세포에 비하여 질병-발생된 조직으로부터 유도된 세포에서의 비정상 수준 또는 비정상 형태의 전사 또는 번역 생성물을 산출하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현된 유전자일 수 있고; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진전에 상관한다. 질병-관련 유전자는 또한, 질병의 병인론에 책임이 있는 유전자(들)과의 연결 불균형 상태 또는 직접적으로 책임이 있는 유전자 가공 돌연변이(들) 또는 유전적 변이를 또한 지칭한다. 전사된 또는 번역된 생성물은 기지 또는 미지일 수 있으며, 정상 또는 비정상 수준일 수 있다.
트랜스크립톰 전체에 걸친 녹-다운 스크리닝
본 명세서에 설명된 CRISPR 이펙터 단백질 복합체는 효율적이며 비용효과적인 기능성 트랜스크립톰 스크리닝을 수행하는 데 사용될 수 있다. 그러한 스크리닝은 CRISPR 이펙터 단백질 기반 트랜스크립톰 전체에 걸친 라이브러리를 이용할 수 있다. 그러한 스크리닝 및 라이브러리는 유전자의 작용을 결정하는 데 제공될 수 있고, 세포 경로 유전자가 관련되고, 유전자 발현에서 임의의 변경은 어떠하게 특정 생물학적 공정을 결과로서 초래할 수 있다. 본 발명의 장점은 CRISPR 시스템이 표적외 결합 및 그 결과로 인한 부작용을 회피한다는 것이다. 이는 표적 DNA에 대한 고도의 서열 특이성을 갖도록 배열된 시스템을 이용하여 달성된다. 본 발명의 바람직한 구현예에서, CRISPR 이펙터 단백질 복합체는 C2c2 이펙터 단백질 복합체이다.
본 발명의 구현예에서, 트랜스크립톰 전체에 걸친 라이브러리는 본 명세서에서 설명된 바와 같이, 복수의 C2c2 가이드 RNA를 포함할 수 있으며, 이는 진핵 세포의 집단 내 복수의 유전자좌에서 복수의 표적 서열을 표적화할 수 있는 가이드 서열을 포함한다. 세포의 집단은 배아 줄기(ES) 세포의 집단일 수 있다. 유전자좌 내 표적 서열은 비코딩 서열일 수 있다. 비코딩 서열은 인트론, 조절 서열, 스플라이스 부위, 3' UTR, 5' UTR, 또는 폴리아데닐화 신호일 수 있다. 하나 이상의 유전자 생성물의 유전자 기능은 상기 표적화에 의해 변경될 수 있다. 표적화는 유전자 기능의 녹아웃을 결과로서 초래할 수 있다. 유전자 생성물의 표적화는 하나 초과의 가이드 RNA를 포함할 수 있다. 유전자 생성물은 유전자 당, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 가이드 RNA, 바람직하게는 3 내지 4 개의 가이드 RNA에 의해 표적될 수 있다. 표적외 변형은 C2c2 이펙터 단백질 복합체에 의해 생성된 엇갈린 이중 가닥 손상을 이용함으로써 또는 CRISPR-Cas9 시스템에서 사용된 것과 유사한 방법을 이용함으로써 최소화될 수 있다(예를 들어, 본 명세서에 참조로 포함된 문헌[DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647(2013)] 참조). 표적화는 약 100 개 이상의 서열일 수 있다. 표적화는 약 1000 개 이상의 서열일 수 있다. 표적화는 약 20,000 개 이상의 서열일 수 있다. 표적화는 전체 게놈일 수 있다. 표적화는 관련 또는 바람직한 경로에 집중된 일단의 표적 서열들일 수 있다. 경로는 면역 경로일 수 있다. 경로는 세포 분열 경로일 수 있다.
본 발명이 일 양태는 복수의 유전자좌에서 복수의 표적 서열을 표적화할 수 있는 가이드 서열을 포함할 수 있는 복수의 C2c2 가이드 RNA를 포함할 수 있는 트랜스크립톰 전체에 걸친 라이브러리를 포함하며, 여기서 상기 표적화는 유전자 기능의 녹다운을 결과로서 초래한다. 이러한 라이브러리는 생물의 게놈 내 각각 및 모든 유전자를 표적화하는 가이드 RNA를 잠재적으로 포함할 수 있다.
본 발명의 일부 구현예예서, 생물 또는 대상체는 진핵 생물(인간을 포함하는 포유류 포함) 또는 비-인간 진핵 생물 또는 비-인간 동물 또는 비-인간 포유류다. 일부 구현예에서, 생물 또는 대상체는 비-인간 동물이며, 예를 들어 곤충과 같은 절지 동물일 수 있거나, 선충일 수 있다. 본 발명의 일부 방법에서, 생물 또는 대상체는 식물이다. 본 발명의 일부 방법에서, 생물 또는 대상체는 포유류 또는 비-인간 포유류다. 비-인간 포유류는, 예를 들어 설치류(바람직하게는 마우스), 유제류, 또는 영장류일 수 있다. 본 발명의 일부 방법에서, 생물 또는 대상체는 미세조류를 포함하는 조류, 또는 균류이다.
유전자 기능의 녹다운은: I. C2c2 이펙터 단백질, 및 II. 하나 이상의 가이드 RNA를 포함하는 조작된, 비-천연 발생 C2c2 이펙터 단백질 시스템을 포함하는 하나 이상의 벡터의 벡터 시스템을, 세포 집단 내 각각의 세포로 도입시키는 단계로서, 여기서 성분 I 및 성분 II는 시스템의 동일하거나 상이한 벡터일 수 있는 단계, 성분 I 및 II를 각각의 세포로 통합하는 단계로서, 여기서 성분 I 및 성분 II는 시스템의 동일하거나 상이한 벡터인 단계; 성분 I 및 II를 각각의 세포로 통합하는 단계로서, 여기서 가이드 서열은 각각의 세포 내 독특한 유전자를 표적화하고, 여기서 C2c2 이펙터 단백질은 조절 요소에 작동 가능하게 연결되고, 전사된 경우, 가이드 서열을 포함하는 가이드 RNA가 C2c2 이펙터 단백질 시스템의 독특한 유전자의 게놈 유전자좌 내의 표적 서열로의 서열-특이적 결합을 유도하는 단계; C2c2 이펙터 단백질에 의해 게놈 유전자좌의 절단을 유도하는 단계; 및 세포 집단의 각각의 세포에서 다수의 독특한 유전자에서 상이한 녹다운 이벤트를 확인하여, 이에 의해 유전자 녹다운 세포 라이브러리를 생성하는 단계를 포함할 수 있다. 본 발명은 세포 집단이 진핵 세포의 집단인 것을 포함하며, 바람직한 구현예에서, 세포들의 집단은 배아 줄기(ES) 세포의 집단이다.
하나 이상의 벡터는 플라스미드 벡터이다. 벡터는 C2c2 이펙터 단백질, sgRNA, 및 선택적으로 표적 서열 내로의 선택 마커를 포함하는 단일 벡터일 수 있다. 이론에 구애되지는 않지만, 단일 벡터를 통하여 C2c2 이펙터 단백질 및 sgRNA를 동시에 전달하는 능력은, C2c2 이펙터 단백질을 발현하는 세포주를 먼저 생성할 필요 없이, 임의의 관심 세포 유형에의 적용을 가능하게 한다. 조절 요소는 유도성 프로모터일 수 있다. 유도성 프로모터는 독시사이클린 유도성 프로모터일 수 있다. 본 발명의 일부 방법에서, 가이드 서열의 발현은 T7 프로모터의 제어 하에 있으며, T7 폴리머라제의 발현에 의해 유도된다. 상이한 녹다운 이벤트의 확인은 전체 트랜스크립톰 시퀀싱에 의할 수 있다. 녹다운 이벤트는 100 개 이상의 독특한 유전자에서 달성될 수 있다. 녹다운 이벤트는 1000 개 이상의 독특한 유전자에서 달성될 수 있다. 녹다운 이벤트는 20,000 개 이상의 독특한 유전자에서 달성될 수 있다. 녹다운 이벤트는 전체 트랜스크립톰에서 달성될 수 있다. 유전자 기능의 녹다운은 특정 생리학적 경로 또는 조건에서 작용하는 복수의 독특한 유전자에서 달성될 수 있다. 경로 또는 조건은 면역 경로 또는 조건일 수 있다. 경로 또는 조건은 세포 분열 경로 또는 조건일 수 있다.
본 발명은 본 명세서에서 언급된 트랜스크립톰 전체에 걸친 라이브러리를 포함하는 키트를 또한 제공한다. 키트는 본 발명의 라이브러리를 포함하는 벡터 또는 플라스미드를 포함하는 단일 용기를 포함할 수 있다. 키트는 또한 본 발명의 라이브러리로부터의 가이드 서열을 포함하는 독특한 C2c2 이펙터 단백질 시스템 가이드 RNA의 선택을 포함하는 패널을 포함할 수 있으며, 여기서 선택은 특정 생리학적 조건을 나타낸다. 본 발명은, 표적화가 약 100 개 이상의 서열, 약 1000 개 이상의 서열 또는 약 20,000 개 이상의 서열 또는 전체 트랜스크립톰인 것을 포함한다. 추가로, 일단의 표적 서열은, 면역 경로 또는 세포 분열과 같은 관련 또는 바람직한 경로에 집중될 수 있다.
본 발명의 추가의 양태에서, C2c2 이펙터 단백질은 하나 이상의 돌연변이를 포함할 수 있고, 기능성 도메인에 대한 융합 또는 융합 없이 일반적인 RNA 결합 단백질로서 사용될 수 있다. 돌연변이는 인공적으로 도입된 돌연변이 또는 기능 획득 돌연변이 또는 기능 손실 돌연변이일 수 있다. 돌연변이가 본 명세서에 기재된 바와 같이 특징화된다. 본 발명의 일 양태에서, 기능성 도메인은 VP64일 수 있는 전사 활성화 도메인일 수 있다. 본 발명의 일 양태에서, 기능성 도메인은 KRAB 또는 SID4X일 수 있는 전사 억제제 도메인일 수 있다. 다른 양태에서, 본 발명은 이에 한정되지 않지만, 전사 활성화제, 억제제, 재조합효소, 트랜스포사제, 히스톤 림델러, 데메틸라제, DNA 메틸트랜스퍼라제, 크립토크롬, 광 유도성/제어성 도메인 또는 화학적으로 유도성/제어성 도메인을 포함하는 도메인에 융합되는 돌연변이된 C2c2 이펙터 단백질 효소에 관한 것이다. 본 발명의 일부 방법은 표적된 유전자의 발현의 유도를 포함할 수 있다. 일 구현예에서, 진핵 세포의 집단에서 복수의 게놈 유전자좌의 복수의 표적 서열을 표적화함에 의한 발현 유도는 기능성 도메인의 이용에 의한다.
C2c2 3이펙터 단백질 복합체를 이용하는 본 발명의 실시에서 CRISPR-Cas9 시스템에 사용되는 방법이 유용하며, 하기가 참고된다:
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12.(2013). [Epub ahead of print]; Published in final edited form as: Science. 2014 Jan 3; 343(6166): 84-87.
Shalem 외는 게놈-전체에 걸친 규모에서 유전자 기능을 질의하기 위한 새로운 방식을 이용한다. 그들의 연구는 64,751 개의 독특한 가이드 서열을 이용하여 18,080 개 유전자를 표적화시킨 게놈-규모의 CRISPR-Cas9 녹아웃(GeCKO) 라이브러리의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능하게 하는 것을 보여주었다. 먼저, 상기 저자는 암 및 만능성 줄기 세포에서 세포 생존력에 필수적인 유전자를 확인하기 위한 GeCKO 라이브러리의 사용을 보여주었다. 다음으로, 흑색종 모델에서, 상기 저자는 유전자의 소실이 돌연변이 단백질 키나아제 BRAF를 억제하는 치료제인 베무라페닙(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 그들의 연구는 가장 높은 순위의 후보물질이 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트(hit) NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.
미국 특허 공개 번호 US20140357530; 및 PCT 특허 공보 WO2014093701을 참조하며, 이들은 본 명세서에 참고문헌으로 통합된다.
기능성 변경 및 스크리닝
또 다른 양태에서, 본 발명은 유전자의 기능성 평가 및 스크리닝 방법을 제공한다. 기능성 도메인을 정확하게 전달하거나, 유전자를 활성화 또는 억제하거나 관심 특정 유전자좌 상에서 메틸화 부위를 정확하게 변경시킴으로써 후성적 상태를 변경시키기 위한 본 발명의 CRISPR 시스템의 사용은, 생체외 또는 생체내에서 복수의 가이드 RNA(sgRNA)를 포함하는 라이브러리의 투여 또는 발현을 포함하는 세포의 풀(pool) 중 게놈에 적용되는 라이브러리와 함께이거나 단일 세포 또는 세포 집단에 적용되는 하나 이상의 가이드 RNA와 함께일 수 있으며, 여기서 스크리닝은 C2c2 이펙터 단백질의 사용을 추가로 포함하고, C2c2 이펙터 단백질을 포함하는 CRISPR 복합체는 변형되어 이종 기능성 도메인을 포함한다. 일 양태에서, 본 발명은 숙주로의 투여 또는 라이브러리의 숙주에서의 생체내 발현을 포함하는 게놈/트랜스크립톰의 스크리닝 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같이, 숙주로 투여되거나 숙주 내에서 발현되는 활성화제를 추가로 포함하는 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 C2c2 이펙터 단백질에 부착된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 C2c2 이펙터 단백질의 N 말단 또는 C 말단에 부착된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 sgRNA 루프에 부착된다. 일 양태에서, 본 발명은 숙주에 투여되거나 숙주에서 발현되는 억제제를 추가로 포함하는, 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 스크리닝은 유전자좌에서의 유전자 활성화, 유전자 억제, 또는 절단에 영향을 미치거나 검출하는 것을 포함한다.
일 양태에서, 본 발명은 효율적인 표적상 활성을 제공하고, 표적외 활성은 최소화한다. 일 양태에서, 본 발명은 C2c2 이펙터 단백질에 의한 효율적인 표적상 절단을 제공하고, C2c2 이펙터 단백질에 의한 표적외 절단은 최소화한다. 일 양태에서, 본 발명은 DNA 절단 없이, 유전자좌에서의 C2c2 이펙터 단백질의 가이드 특이적 결합을 제공한다. 따라서, 일 양태에서, 본 발명은 표적-특이적 유전자 조절을 제공한다. 일 양태에서, 본 발명은 DNA 절단 없이 유전자좌에서 C2c2 이펙터 단백질의 가이드 특이적 결합을 제공한다. 따라서, 일 양태에서, 본 발명은 단일 C2c2 이펙터 단백질을 사용하여 하나의 유전자좌에서의 절단 및 상이한 유전자좌에서의 유전자 조절을 제공한다. 일 양태에서, 본 발명은 하나 이상의 C2c2 이펙터 단백질 및/또는 효소를 사용하여 다수의 표적의 직교(orthogonal) 활성화 및/또는 억제 및/또는 절단을 제공한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 숙주는 진핵 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 숙주는 포유류 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 숙주는 비-인간 진핵 생물이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 비-인간 진핵 생물은 비-인간 포유동물이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 비-인간 포유동물은 마우스이다. 일 양태에서, 본 발명은 C2c2 이펙터 단백질 복합체 또는 이의 성분(들) 또는 이에 대해 코딩하는 핵산 분자(들)의 전달을 포함하는, 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내에서 발현된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 생체내 발현은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 전달은 입자, 나노입자, 지질 또는 세포 투과 펩티드(CPP)를 통한 것이다.
일 양태에서, 본 발명은 C2c2 이펙터 단백질을 포함하는 CRISPR 복합체의 쌍을 제공하며, 이들 각각은 세포에서 관심 게놈 유전자좌에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(sgRNA)를 포함하며, 여기서 각 sgRNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되고, 여기서 각각의 C2c2 이펙터 단백질 복합체의 각각의 sgRNA는 DNA 절단 활성을 갖는 기능성 도메인을 포함한다.
일 양태에서, 본 발명은 C2c2 이펙터 단백질 복합체의 세포 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)로의 전달을 포함하는, 관심 유전자좌에서 표적 서열을 절단하는 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내 발현된다. 일 양태에서, 본 발명은 상기 논의된 바와 같은 방법을 제공하고, 여기서 전달은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 라이브러리, 방법 또는 복합체를 제공하며, 여기서 sgRNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형되고, 예를 들어 여기서 적어도 하나의 비-코딩 기능성 루프는 반복적이고; 예를 들어 여기서 적어도 하나의 비-코딩 기능성 루프는 Alu를 포함한다.
일 양태에서, 본 발명은 유전자 생성물의 발현을 변경 또는 변형하는 방법을 제공한다. 상기 방법은 유전자 생성물을 인코딩하는 DNA 분자를 함유 및 발현하는 세포 내로 C2c2 이펙터 단백질 및 그 RNA 분자를 표적화하는 가이드 RNA를 포함하는 조작된 비-천연 발생 CRISPR 시스템을 도입시키는 것을 포함할 수 있으며, 이로 인해 가이드 RNA는 유전자 생성물을 인코딩하는 RNA 표적 분자를 표적화하고, C2c2 이펙터 단백질은 유전자 생성물을 인코딩하는 RNA 분자를 절단하고, 이로 인해 유전자 생성물의 발현이 변경되고; 여기서 C2c2 이펙터 단백질 및 가이드 RNA는 함께 자연적으로 발생하지 않는다. 본 발명은 직접 반복 서열에 연결된 가이드 서열을 포함하는 가이드 RNA를 포괄한다. 본 발명은 진핵 세포에서 발현에 대해 최적화된 코돈인 C2c2 이펙터 단백질을 추가로 포괄한다. 바람직한 구현예에서, 진핵 세포는 포유류 세포이고, 더 바람직한 구현예에서 포유류 세포는 인간 세포이다. 본 발명의 추가 구현예에서, 유전자 생성물의 발현은 감소된다.
일부 구현예에서, 하나 이상의 기능성 도메인은 C2c2 이펙터 단백질과 연관된다. 일부 구현예에서, 예를 들어, 문헌 [Konnerman et al.(Nature 517, 583-588, 29 January 2015)]의 변형된 가이드와 함께 사용된 바와 같이, 하나 이상의 기능성 도메인은 어댑터 단백질과 연관된다. 일부 구현예에서, 하나 이상의 기능성 도메인은 데드 sgRNA(dRNA)와 연관된다. 일부 구현예에서, 활성 C2c2 이펙터 단백질과의 dRNA 복합체는 유전자좌 상에서 기능성 도메인에 의한 유전자 조절을 유도하는 한편, sgRNA는 또 다른 유전자좌에서 활성 C2c2 이펙터 단백질에 의한 DNA 절단을 유도하며, 예를 들어, 이는 문헌[Dahlman et al., 'Orthogonal gene control with a catalytically active Cas9 nuclease' Nature Biotechnology 33, p. 1159-61(November, 2015)]에 의한 CRISPR-Cas9 시스템에서 유사하게 기재된 바와 같다. 일부 구현예에서, dRNA는 표적외 조절에 비하여 관심 유전자좌에 대한 조절의 선택성을 최대화하도록 선택된다. 일부 구현예에서, dRNA는 표적 유전자 조절을 최대화하고 표적 절단은 최소화하도록 선택된다.
하기 논의의 목적을 위하여, 기능성 도메인에 대한 기준은 C2c2 이펙터 단백질과 연관된 기능성 도메인 또는 어댑터 단백질과 연관된 기능성 도메인일 수 있다.
일부 구현예에서, 하나 이상의 기능성 도메인은 NLS(핵 국소화 서열) 또는 NES(핵외 수송 신호)이다. 일부 구현예에서, 하나 이상의 기능성 도메인은 전사 활성화 도메인으로, VP64, p65, MyoD1, HSF1, RTA, SET7/9 및 히스톤 아세틸트랜스퍼라제를 포함한다. CRISPR 효소와 연관된 것들에 대하여 활성화(또는 활성화제) 도메인에 대한 기타 참조는 임의의 기지의 전사 활성화 도메인을 포함하며, 특히 VP64, p65, MyoD1, HSF1, RTA, SET7/9 또는 히스톤 아세틸트랜스퍼라제.
일부 구현예에서, 하나 이상의 기능성 도메인은 전사 억제제 도메인이다. 일부 구현예에서, 전사 억제제 도메인은 KRAB 도메인이다. 일부 구현예에서, 전사 억제제 도메인은 NuE 도메인, NcoR 도메인, SID 도메인 또는 SID4X 도메인이다.
일부 구현예에서, 하나 이상의 기능성 도메인은 번역 활성화 활성, 번역 억제 활성, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, DNA 통합 활성 또는 핵산 결합 활성을 포함하는 하나 이상의 활성을 갖는다.
히스톤 변형 도메인 또한 일부 구현예에서 바람직하다. 예시적인 히스톤 변형 도메인이 하기에서 논의된다. 트랜스포사제 도메인, HR(상동성 재조합) 기구 도메인, 재조합효소 도메인, 및/또는 인테그라제 도메인이 본 발명의 기능성 도메인으로서 또한 바람직하다. 일부 구현예에서, DNA 통합 활성은 HR 기구 도메인, 인테그라제 도메인, 재조합효소 도메인 및/또는 트랜스포사제 도메인을 포함한다. 히스톤 아세틸트랜스퍼라제가 일부 구현예에서 바람직하다.
일부 구현예에서, DNA 절단 활성은 뉴클레아제로 인한 것이다. 일부 구현예에서, 뉴클레아제는 Fok1 뉴클레아제를 포함한다. 문헌 ["Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77(2014) 참조]은 연장된 서열을 인식하고, 인간 세포에서 고효율로 내인성 유전자를 편집할 수 있는, 이량체성 RNA-가이드된 FokI 뉴클레아제에 관한 것이다.
일부 구현예에서, 하나 이상의 기능성 도메인은 C2c2 이펙터 단백질에 부착되어, sgRNA 및 표적에 대한 결합 시, 기능성 도메인은 그 기능성 도메인이 그에 귀속된 작용으로 작용하는 것을 가능하게 하는 공간 배향으로 존재하도록 한다.
일부 구현예에서, 하나 이상의 기능성 도메인은 어댑터 단백질에 부착되며, C2c2 이펙터 단백질의 sgRNA 및 표적에 대한 결합 시, 기능성 도메인은 그 기능성 도메인이 그에 귀속된 작용으로 작용하는 것을 가능하게 하는 공간 배향으로 존재하도록 한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 조성물을 제공하며, 여기서 하나 이상의 기능성 도메인은, 본 명세서에서 논의된 바와 같은, 링커, 선택적으로 GlySer 링커를 통해 C2c2 이펙터 단백질 또는 어댑터 단백질에 부착된다.
또한 예를 들어 번역, 안정성 등과 관련된 내인성(조절) 제어 요소를 표적화하는 것이 선호된다. 공지된 제어 요소의 표적화는 관심 유전자를 활성화 또는 억제하는 데 사용될 수 있다. 한편 추정적인 제어 요소의 표적화는 그러한 요소를 확인하는(관심 유전자의 번역을 측정함으로써) 또는 신규 제어 요소를 검출하는 수단으로서 사용될 수 있다. 추가적으로, 추정적인 제어 요소의 표적화는 질병의 유전적 원인을 이해하는 맥락에서 유용할 수 있다. 질병 표현형과 연관된 많은 돌연변이 및 일반 SNP 변이체는 코딩 영역 외부에 위치된다. 본 명세서에서 설명된 활성화 또는 저해 시스템 중 어느 하나를 이용한 그러한 영역의 표적화에 이어, a) 추정적인 표적의 세트(예를 들어, 제어 요소의 최근접부에 위치된 유전자의 세트) 또는 b) 예를 들어, RNAseq 또는 마이크로어레이에 의한, 전체-트랜스크립톰 판독 중 어느 하나의 전사 판독에 뒤따를 수 있다. 이는 질병 표현형과 관련된 가능성 있는 후보 유전자의 확인을 가능하게 할 것이다. 그러한 후보 유전자는 신규 약물 표적으로서 유용할 수 있다.
히스톤 아세틸트랜스퍼라제(HAT) 억제제가 본 명세서에 언급된다. 그러나, 대안적인 일부 구현예에서 하나 이상의 기능성 도메인이 아세틸트랜스퍼라제, 바람직하게는 히스톤 아세틸트랜스퍼라제를 포함하는 것이다. 이들은 후성유전학(epigenomics) 분야, 예를 들어 후성유전자에서 정보를 얻는 방법에서 유용하다. 표적화 후성유전자 서열은 후성유전자 표적 서열로 유도되는 가이드를 포함할 수 있다. 후성유전자 표적화는 일부 구현예에서, 프로모터, 사일렌서 또는 인핸서 서열을 포함할 수 있다.
본 명세서에서 설명된 바와 같이 후성유전자 서열을 표적하기 위한 C2c2 이펙터 단백질, 바람직하게는 데드-C2c2 이펙터 단백질, 더욱 바람직하게는 데드-FnC2c2 이펙터 단백질에 연결된 기능성 도메인의 이용은 프로모터, 사일렌서 또는 인핸서를 활성화 또는 억제하는 데 사용될 수 있다.
아세틸트랜스퍼라제의 예는 알려져 있지만, 일부 구현예에서, 히스톤 아세틸트랜스퍼라제를 포함할 수 있다. 일부 구현예에서, 히스톤 아세틸트랜스퍼라제는 인간 아세틸트랜스퍼라제 p300의 촉매 중심을 포함할 수 있다(Gjerbasch & Reddy, Nature Biotech, 2015년 4월 6일).
일부 바람직한 구현예에서, 기능성 도메인은 데드-C2c2 이펙터 단백질에 연결되어 프로모터 또는 인핸서와 같은 후성유전자 서열을 표적 및 활성화한다. 그러한 프로모터 또는 인핸서로 유도된 하나 이상의 가이드는 또한 CRISPR 효소의 그러한 프로모터 또는 인핸서로의 결합을 유도하기 위해 제공될 수 있다.  
특정 구현예에서, 본 발명의 RNA 표적화 이펙터 단백질은 DNA/염색질 구조의 공동-전사 변형, RNA-지시되는 DNA 메틸화, 또는 RNA-지시되는 DNA/염색질의 침묵화/활성화를 간섭하는 데 사용될 수 있다. RNA-지시되는 DNA 메틸화(RdDM)는 식물에서 최초로 발견된 후성적 과정이다. RdDM 동안 이중-가닥 RNA(dsRNA)는 21 내지 24 개의 뉴클레오티드 소형 간섭 RNA(siRNA)로 처리되고 상동성 DNA 유전자좌의 메틸화를 가이드한다. RNA 분자 외에도 아르고노트, DNA 메틸트랜스페라제, 염색질 리모델링 복합체 및 식물-특이적 PolIV 및 PolV와 같이, RdDM의 확립에 많은 단백질이 관여한다. 이들 모두는 시토신의 5' 위치에 메틸기를 부가하기 위해 협력하여 작용한다. 소형 RNA는 아르고노트-함유 복합체를 상보적인 신생 (비-코딩) RNA 전사물로 가이드함으로써 염색질 구조를 변형시키고 전사를 침묵화할 수 있다. 그 후 히스톤 및 DNA 메틸트랜스페라제를 포함하는, 염색질-변형 복합체의 모집이 매개된다. 본 발명의 RNA 표적화 이펙터 단백질은 이러한 소형 RNA를 표적화하고 이들 소형 RNA와 신생의 비-코딩 전사물 사이의 상호 작용을 간섭하는 데 사용될 수 있다.
용어 "회합된"이 기능성 도메인의 C2c2 이펙터 단백질 또는 어댑터 단백질로의 연결에 관하여 본 명세서에서 사용된다. 이는 어떻게 하나의 분자가 다른 하나에 대해서, 예를 들어 어댑터 단백질과 기능성 도메인 사이에서 또는 C2c2 이펙터 단백질과 기능성 도메인 사이에서 '회합되는'지에 관하여 사용된다. 이와 같은 단백질-단백질 상호 작용의 경우, 이러한 회합은 항체가 에피토프를 인식하는 방식에서의 인식이라는 면에서 생각될 수 있다. 대안적으로, 하나의 단백질은, 둘 예를 들어 다른 서브유닛에 융합되는 하나의 서브유닛의 융합을 통해 또 다른 단백질과 회합될 수 있다. 융합은 예를 들어 각각의 단백질 또는 서브유닛을 인코딩하는 뉴클레오티드 서열을 함께 스플라이싱을 통해, 통상적으로 하나의 아미노산 서열의 다른 아미노산 서열로의 부가에 의해 일어난다. 대안적으로, 이는 본질적으로 두 개의 분자간의 결합 또는 직접 연결, 예를 들어 융합 단백질로서 생각될 수 있다. 어쨌든, 융합 단백질은 관심의 두 서브유닛 사이(즉, 효소와 기능성 도메인 또는 어댑터 단백질와 기능성 도메인 사이)의 링커를 포함할 수 있다. 따라서, 일부 구현예에서, C2c2 이펙터 단백질 또는 어댑터 단백질은 거기 결합함으로써 기능성 도메인과 회합된다. 다른 구현예에서, C2c2 이펙터 단백질 또는 어댑터 단백질은 기능성 도메인과 함께 회합되는데, 이는 이들 둘이 함께, 선택적으로 중간체 링커를 통해 융합되기 때문이다.
포화(saturating) 돌연변이 유발
본 명세서에 기재된 C2c2 이펙터 단백질 시스템(들)은, 예를 들어 유전자 발현, 약물 내성 및 질병의 전환에 요구되는 작용 요소의 개별 취약성 및 임계 최소 특징의 결정을 위해 세포 표현형과 함께 게놈 유전자좌의 포화 또는 딥 스캐닝 돌연변이 유발을 수행하는 데 사용될 수 있다. 포화 또는 딥 스캐닝 돌연변이 유발이라 함은 모든 또는 본질적으로 모든 RNA 염기가 게놈 유전자좌 내에서 절단됨을 의미한다. C2c2 이펙터 단백질 가이드 RNA의 라이브러리는 세포의 집단 내로 도입될 수 있다. 라이브러리가 도입될 수 있어서, 각각의 세포는 단일 가이드 RNA(sgRNA)를 수령하게 된다. 라이브러리가 본 명세서에서 설명된 바와 같은 바이러스 벡터의 형질도입에 의해 도입되는 경우, 낮은 감염 다중도(MOI)가 사용된다. 라이브러리는 게놈 유전자좌에서(프로토스페서 인접 모티프)(PAM) 서열의 업스트림에 있는 모든 서열을 표적화하는 sgRNA를 포함할 수 있다. 라이브러리는 게놈 유전자좌 내의 모든 1000 개의 베이스 염기쌍에 대해 PAM의 업스트림에서 100 개 이상의 비-중복 게놈 서열을 포함할 수 있다. 라이브러리는 하나 이상의 상이한 PAM 서열의 업스트림에서 서열을 표적화하는 sgRNA를 포함할 수 있다. C2c2 이펙터 단백질 시스템은 하나 초과의 C2c2 단백질을 포함할 수 있다. 본 명세서에서 기재된 바와 같은, 상이한 PAM 서열을 인식하는 오솔로그 또는 설계 제작된 C2c2 이펙터 단백질을 포함하는, 임의의 C2c2 이펙터 단백질이 사용될 수 있다. sgRNA에 대한 표적외 부위의 빈도는 500 개 미만일 수 있다. 표적외 점수는 최저 표적외 부위를 갖는 sgRNA를 선택하기 위해 생성될 수 있다. sgRNA 표적 부위에서의 절단과 연관되는 것으로 결정된 임의의 표현형은 sgRNA의 표적화를 단일 시험에서 동일한 부위를 이용함으로써 확인될 수 있다. 표적 부위의 확인은 본 명세서에서 설명된 바와 같은, 변형된 C2c2 이펙터 단백질, 및 관심 게놈 부위를 표적화하는 두 개의 sgRNA를 이용함으로써 수행될 수도 있다. 이론에 구애되고자 하지는 않지만, 표현형에서의 변화가 확인 실험에서 관찰된다면, 표적 부위가 제대로 확인된 것이다.
포화 또는 딥 스캐닝 돌연변이 유발을 위한 C2c2 이펙터 단백질 시스템(들)은 세포의 집단에서 사용될 수 있다. C2c2 이펙터 단백질 시스템(들)은, 이에 한정되지 않지만, 포유류 및 식물 세포를 포함하는 진핵 세포에서 사용될 수 있다. 세포의 집단은 원핵 세포일 수 있다. 진핵 세포의 집단은 배아 줄기(ES) 세포, 뉴런 세포, 상피 세포, 면역 세포, 내분비 세포, 근육 세포, 적혈구, 림프구, 식물 세포 또는 효모 세포의 집단일 수 있다.
일 양태에서, 본 발명은 표현형에서의 변화와 연관된 작용 요소에 대한 스크리닝 방법을 제공한다. 라이브러리는 C2c2 이펙터 단백질을 함유하도록 조정된 세포 집단 내로 도입될 수 있다. 세포는 표현형을 기준으로 둘 이상의 군으로 분류될 수 있다. 표현형은 유전자, 세포 성장, 또는 세포 생육력의 발현일 수 있다. 각 군에 존재하는 가이드 RNA의 상대적 표시가 결정되며, 이로 인해 표현형에서의 변화와 연관된 게놈 부위는 각 군에 존재하는 가이드 RNA의 표시에 의해 결정될 수 있다. 표현형에서의 변화는 관심 유전자의 발현에서의 변화일 수 있다. 관심 유전자는 상향조절, 하향조절, 또는 녹아웃될 수 있다. 세포는 고발현 군과 저발현 군으로 분류될 수 있다. 세포 집단은 표현형을 결정하는 데 사용되는 리포터 작제물을 포함할 수 있다. 리포터 작제물은 검출 가능한 마커를 포함할 수 있다. 세포는 검출 가능한 마커의 이용에 의해 분류될 수 있다.
또 다른 양태에서, 본 발명은 화학 화합물에 대한 내성과 관련된 유전자좌의 스크리닝 방법을 제공한다. 화학 화합물은 약물 또는 살충제일 수 있다. 라이브러리는 C2c2 이펙터 단백질을 함유하도록 조절된 세포 집단 내로 도입될 수 있으며, 여기서 집단의 세포 각각은 단지 하나의 가이드 RNA를 함유하며, 세포 집단은 화학 화합물로 처리되며; 가이드 RNA의 표시는 초기 시점에 비하여, 이후의 시점에서 화학 화합물로 처리 후에 결정되며, 이로 인해 화학 화합물에 대한 내성과 연관된 부위는 가이드 RNA의 풍부화에 의해 결정된다. sgRNA의 표시는 딥 시퀀싱 방법에 의해 결정될 수 있다.
C2c2 이펙터 단백질 복합체를 이용하는 본 발명의 실시에 있어서 CRISPR-Cas9 시스템에서 사용되는 방법이 유용하고, Cas9-매개된 동일계내 포화 돌연변이유발에의한 BCL11A 인핸서 절제(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis)라는 명칭의 논문이 언급된다. 논문[Canver, M.C., Smith, E.C., Sher, F., Pinello, L., Sanjana, N.E., Shalem, O., Chen, D.D., Schupp, P.G., Vinjamur, D.S., Garcia, S.P., Luc, S., Kurita, R., Nakamura, Y., Fujiwara, Y., Maeda, T., Yuan, G., Zhang, F., Orkin, S.H., & Bauer, D.E. DOI:10.1038/nature15521, 2015년 9월 16일 간행]은 참고문헌으로 본 명세서에 통합되고, 아래 간략히 논의된다:
Canver 외의 문헌은, 이전에 태아 헤모글로빈(HbF) 수준과 연관된 인핸서로서, 그의 마우스 오솔로그가 적혈구 BCL11A 발현에 필요한 것으로 확인된, 인간 및 마우스 BCL11A 적혈구 인핸서의 현장 포화 돌연변이 유발을 수행하기 위하여 신규 풀화된(pooled) CRISPR-Cas9 가이드 RNA 라이브러리를 수반한다. 이 시도는 이들 인핸서의 임계 최소 특징 및 개별 취약성을 밝혔다. 1 차 인간 조상 및 마우스 유전자 도입의 편집을 통해, 저자는 BCL11A 적혈구 인핸서를 HbF 재도입을 위한 표적으로서 확인하였다. 저자는 치료적 게놈 편집을 알려주는 상세한 인핸서 맵을 생성하였다.
세포 또는 생물을 변형시키기 위하여 C2c2 시스템을 이용하는 방법
일부 구현예에서 본 발명은 세포 또는 생물을 변형시키는 방법을 포함한다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유류 세포일 수 있다. 포유류 세포는 많은 경우 비-인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 세포는 가금류, 어류 또는 새우와 같은 비-포유류 진핵 세포일 수 있다. 세포는 식물일 수도 있다. 식물 세포는 카사바, 옥수수, 수수, 밀 또는 벼와 같은 작물 식물의 것일 수 있다. 식물 세포는 또한 조류, 나무 또는 채소일 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 항체, 전분, 알콜 또는 기타 바람직한 세포 산출물과 같은 생물학적 생성물의 개선된 생산에 대해 변경되도록 할 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 생산된 생물학적 생성물을 변화시키는 변경을 포함하도록 할 수 있다.
시스템은 하나 이상의 상이한 벡터를 포함할 수 있다. 본 발명의 일 양태에서, 이펙터 단백질은 바람직한 세포 유형, 우선적으로는 진핵 세포, 바람직하게는 포유류 세포 또는 인간 세포의 발현에 대해 코돈 최적화된다.
세포를 패키징하는 것은 통상적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이와 같은 세포는, 아데노바이러스를 패키징하는 293 개의 세포를 포함하고, 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에서 사용되는 바이러스 벡터는 보통 핵산 벡터를 바이러스 입자로 패키징하는 세포주를 생성함으로써 생성된다. 벡터는 통상적으로 숙주로의 패키징 및 후속 통합에 요구되는 최소 바이러스 서열을 함유하고, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 있어서 발현 카세트에 의해 대체된다. 누락된 바이러스 작용은 통상적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에서 사용되는 AAV 벡터는 통상적으로 숙주 게놈으로의 패키징 및 통합에 요구되는, AAV 게놈 유래의 ITR 서열만을 갖는다. 바이러스 DNA는 세포주에서 패키징되고, 이는 다른 AAV 유전자를 인코딩하는 헬퍼 플라스미드, 즉 rep 및 cap를 함유하지만, ITR 서열은 결여되어 있다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인하여 상당한 양으로 패키징되지 않는다. 아데노바이러스로 인한 오염은, 예를 들어 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다. 핵산의 세포로의 전달을 위한 추가적인 방법은 당업자들에게 알려져 있다. 예를 들어, 본 명세서에 참조로서 포함된 US20030087817을 참조한다.
일부 구현예에서, 숙주 세포는 본 명세서에 기재된 하나 이상의 벡터로 일시적으로 또는 비-일시적으로 형질감염된다. 일부 구현예에서, 세포는 대상체에서 자연적으로 발생하기 때문에 형질감염된다. 일부 구현예에서, 형질감염된 세포는 대상체로부터 취한다. 일부 구현예에서, 세포는 대상체로부터 취한 세포로부터 유래되며, 예를 들어 세포주이다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 알려져 있다. 세포주의 예로는 이에 한정되지 않이지만, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피세포, BALB/ 3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR, 및 이들의 유전자 도입 변형들을 포함한다. 세포주는 당업자에게 알려진 다양한 공급원으로부터 입수 가능하다(예를 들어, 미국 균주 은행(American Type Culture Collection; ATCC)(미국 버지니아주 매나서스 소재) 참조). 일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터로 형질감염된 세포는 하나 이상의 벡터-유래된 서열을 포함하는 신규 세포주를 구축하는 데 사용된다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 핵산-표적화 시스템의 성분으로 일시적으로 형질감염되고(예를 들어, 하나 이상의 벡터의 일시 형질감염, 또는 RNA를 이용한 형질감염에 의해), 핵산-표적화 복합체의 활성을 통하여 변형된 세포는 변형을 포함하지만 임의의 다른 외인성 서열은 결여한 세포를 포함하는 새로운 세포주를 수립하는 데 사용된다. 일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터를 이용하여 일시적으로 또는 비-일시적으로 형질감염된 세포, 또는 이와 같은 세포로부터 유래된 세포주는 하나 이상의 시험 화합물을 평가하는 데 사용된다.
일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터가 비-인간 유전자 도입 동물 또는 유전자 도입 식물을 생산하는 데 사용된다. 일부 구현예에서, 유전자 도입 동물은 포유류, 예를 들어 마우스, 래트 또는 토끼다. 특정 구현예에서, 생물 또는 대상체는 식물이다. 특정 구현예에서, 생물 또는 대상체 또는 식물은 조류이다. 유전자 도입 식물 및 동물을 생산하는 방법은 당업계에 공지되어 있으며, 일반적으로 본 명세서에 기재된 바와 같은 세포 형질 감염 방법으로 시작한다.
일 양태에서, 본 발명은 진핵 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법을 제공한다. 일부 구현예에서, 방법은 핵산-표적화 복합체가 표적 폴리뉴클레오티드에 결합 가능하게 하여 상기 표적 폴리뉴클레오티드의 절단을 가져옴으로써 표적 폴리뉴클레오티드를 변형시키는 것을 포함하며, 여기서 핵산-표적화 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다.
일 양태에서, 본 발명은 진핵 세포에서 폴리뉴클레오티드의 발현을 변형시키는 방법을 제공한다. 일부 구현예에서, 방법은 핵산-표적화 복합체가 폴리뉴클레오티드에 결합 가능하게 하여 상기 결합이 상기 폴리뉴클레오티드의 증가되거나 감소된 발현을 초래하는 것을 포함하며; 여기서 핵산-표적화 복합체는 상기 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다.
C2c2 이펙터 단백질 복합체는 식물에서 사용될 수 있다
C2c2 이펙터 단백질 시스템(들)(예를 들어, 단일 또는 다중화된)은 작물 유전체학에서의 최근의 진전과 함께 사용될 수 있다. 본 명세서에 기재된 시스템은 효율적 및 비용 효과적으로 식물 유전자 또는 게놈 측정 또는 편집 또는 조작(예를 들어, 식물 유전자 또는 게놈의 신속한 조사 및/또는 선택 및/또는 측정 및/또는 비교 및/또는 조작 및/또는 형질전환)을 실행하는 데 사용될 수 있으며; 예를 들어 특성(들) 또는 특징(들)을 형성, 확인, 발생, 최적화 또는 식물(들)에게 부여 또는 식물 게놈을 형질전환한다. 따라서 식물, 특성 또는 특징의 새로운 조합을 갖는 새로운 식물 또는 향상된 특성을 갖는 새로운 식물의 개선된 생산이 있을 수 있다. 그러한 C2c2 이펙터 단백질 시스템(들)은 식물에 대하여 부위-유도된 통합(SDI) 또는 유전자 편집(GE) 또는 임의의 근접 역전 브리딩(NRB) 또는 역전 브리딩(RB) 기법에서 사용될 수 있다. 본 명세서에 기재된 C2c2 이펙터 단백질 시스템의 이용 양태는 식물에서 CRISPR-Cas(예를 들어, CRISPR-Cas9) 시스템의 사용과 유사할 수 있으며, 아리조나 대학 웹사이트 "CRISPR-PLANT"(http://www.genome.arizona.edu/crispr/)(Penn State 및 AGI 후원)가 언급된다. 본 발명의 일 구현예는 식물에서 또는 RNAi 또는 유사한 게놈 편집 기술이 이미 사용된 곳에서 게놈 편집에 사용될 수 있다; 예를 들어, 문헌 [Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR-Cas system," Plant Methods 2013, 9:39(doi:10.1186/1746-4811-9-39)]; 문헌 [Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR-Cas9 system," Plant Physiology September 2014 pp 114.247577]; 문헌 [Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system," Nature Biotechnology 31, 686-688(2013)]; 문헌 [Feng, "Efficient genome editing in plants using a CRISPR/Cas system," Cell Research(2013) 23:1229-1232. doi:10.1038/cr.2013.114; 2013년 8월 20일 온라인 간행됨]; 문헌 [Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system," Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. 2013년 8월 17일 전자출판]; 문헌 [Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice," Rice 2014, 7:5(2014)]; 문헌 [Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy," New Phytologist(2015)(Forum) 1-4(www.newphytologist.com에서만 온라인으로만 이용 가능)]; 문헌 [Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome, NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989]; 미국 특허 제6,603,061 호 - Agrobacterium-Mediated Plant Transformation Method; 미국 특허 제7,868,149 호 - Plant Genome Sequences and Uses Thereof, 및 미국 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits 참조, 이들 각각의 내용 및 개시 내용 모두는 그 전체로 본 명세서에 참고문헌으로 포함된다. 본 발명의 실시에서, 문헌 [Morrell et al "Crop genomics: advances and applications," Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용 및 개시 내용; 이들 각각은, 본 명세서의 구현예가 식물에 대하여 어떻게 사용되는지를 포함하여, 본 명세서에서 참고문헌으로 통합된다. 따라서, 동물 세포에 대한 본 명세서의 참고문헌 또한 달리 명백하지 않은 경우, 식물 세포에 또한 적절한 변형을 가하여 적용될 수 있고; 본 명세서에서 감소된 표적외 효과를 갖는 효소 및 그러한 효소를 사용하는 시스템은, 본 명세서에서 언급된 것들을 포함하여, 식물 응용분야에서 사용될 수 있다.
Sugano 외(Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18)는, 육상 식물 진화를 연구하기 위한 모델 종으로서 떠오른, 우산이끼 마르찬티아 폴리모파 L(Marchantia polymorpha L.)에서의 표적화된 돌연변이유발에 CRISPR-Cas9의 적용을 보고한다. 마르찬티아 폴리모파의 U6 프로모터가 확인되고, 클로닝되어 gRNA를 발현하였다. gRNA의 표적 서열은 마르찬티아 폴리모파에서 옥신 반응 인자 1(ARF1)을 인코딩하는 유전자를 파괴하도록 설계되었다. 아그로박테리움-매개 형질전환을 사용하여, Sugano외는 마르찬티아 폴리모파의 배우체 생성에서 안정적인 돌연변이체를 분리하였다. 생체내에서 CRISPR-Cas9-기반 부위-특이적 돌연변이유발은, 콜리플라워 모자이크 바이러스 35S 또는 마르찬티아 폴리모파 EF1α 프로모터 중 어느 하나를 사용하여 Cas9를 발현하도록 달성되었다. 옥신-내성 표현형을 나타내는 분리된 돌연변이체 개체는 키메라가 아니었다. 나아가, 안정적인 돌연변이체는 T1 식물의 무성 생식에 의해 생산되었다. arf1 겹대립형질(multiple allele)은 CRIPSR/Cas9-기반의 표적화된 돌연변이유발을 사용하여 용이하게 수립되었다. 본 발명의 C2c2 시스템은 동일뿐만 아니라 다른 유전자를 조절하는 데 사용될 수 있으며, RNAi 및 siRNA와 같은 발현 제어 시스템과 같이 본 발명의 방법은 유도성 및 가역성일 수 있다.
Kabadi 외(Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13)는, 편리한 골든 게이트 클로닝 방법에 의하여 벡터 내로 혼입된 독립된 RNA 중합효소 III 프로모터로부터, Cas9 변이체, 리포터 유전자 및 최대 4 개의 sgRNA를 발현시키기 위하여 단일 렌티바이러스 시스템을 개발하였다. 각각의 sgRNA는 효율적으로 발현되었고, 불사화된 일차 인간 세포에서 다중화 유전자 편집 및 지속된 전사 활성화를 매개할 수 있다. 본 발명은 Kabadi의 식물 유전자를 조절하는 데 사용될 수 있다.
Xing 외(BMC Plant Biology 2014, 14:327)는, pGreen 또는 pCAMBIA 백본뿐만 아니라, gRNA를 기반으로 한 CRISPR-Cas9 바이너리 벡터 세트를 개발하였다. 이러한 도구 키트(toolkit)는 최소한 하나의 클로닝 단계에서 메이즈(maize)-코돈 최적화된 Cas9 및 하나 이상의 gRNA를 품고 있는 최종 작제물을 고효율로 생성하기 위해, BsaI 외의 제한 효소를 필요로 하지 않는다. 도구 키트는 메이즈 원형질, 유전자 도입 메이즈 계통, 및 유전자 도입 아라비돕시스 계통을 사용하여 확인되었으며, 높은 효율 및 특이성을 보이는 것으로 나타났다. 더욱 중요하게는, 이러한 도구 키트를 사용하여, 3 개의 아라비돕시스 유전자의 표적화된 돌연변이가 T1 세대의 유전자 도입 묘목에서 검출되었다. 또한, 다중-유전자 돌연변이가 그 다음 세대로 유전될 수 있었다. 식물에서 다중화 게놈 편집을 위한 도구 키트로서, (가이드 RNA) 모듈 벡터 세트. 본 발명의 C2c2 시스템 및 단백질은 Xing에 의해 표적화된 유전자를 표적화하는 데 사용될 수 있다.
본 발명의 C2c2 CRISPR 시스템은 식물 바이러스의 검출에 사용될 수 있다. Gambino 외(Phytopathology. 2006 Nov;96(11):1223-9. doi: 10.1094/PHYTO-96-1223)는 9 개의 포도덩굴 바이러스의 동시 검출을 위해 증폭 및 다중 PCR에 의존하였다. 본 발명의 C2c2 시스템 및 단백질은 유사하게 숙주에서 다수의 표적을 검출하는 데 사용될 수 있다. 더욱이, 본 발명의 시스템은 가치가 큰 품종에서의 바이러스 유전자 발현을 동시에 녹다운시키고 발현된 바이러스 RNA를 표적화함으로써 활성화 또는 추가 감염을 방지하는 데 사용될 수 있다.
Murray 외(Proc Biol Sci. 2013 Jun 26;280(1765):20130965. doi: 10.1098/rspb.2013.0965; 2013월 8월 22일 간행)는 12 종의 식물 RNA 바이러스를 분석하여 진화 속도를 조사하였으며 아마도 상이한 숙주 유전자형 또는 종 사이에서의 이동으로 인한 우발적 선택의 증거를 밝혀냈다. 본 발명의 C2c2 시스템 및 단백질은 숙주에서 이러한 바이러스에 대해 표적화 또는 면역화하는 데 사용될 수 있다. 예를 들어, 본 발명의 시스템은 바이러스 RNA 발현 이에 따른 복제를 차단하는 데 사용될 수 있다. 또한, 본 발명은 절단을 위해 핵산을 표적화하는 것뿐만 아니라 발현 또는 활성화를 표적화하는 데 사용될 수 있다. 더욱이, 본 발명의 시스템은 다수의 표적 또는 동일한 바이러스의 다수의 단리물을 공격하도록 다중화될 수 있다.
Ma 외(Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007)는 단자엽 및 쌍자엽 식물에서 편리하고 고효율의 다중화된 게놈 편집을 위해, 식물 코돈 최적화된 Cas9 유전자를 활용하는, 견고한 CRISPR-Cas9 벡터 시스템을 보고한다. Ma 외는 다수의 sgRNA 발현 카세트를 신속하게 생성하기 위해 PCR-기반 절차를 설계하였으며, 이는 골든 게이트 연결 또는 Gibson 조립에 의한 한 차례의 클로닝에서 2 부분으로 이루어진 CRISPR-Cas9 벡터 내로 조립될 수 있다. 이 시스템을 이용하여, Ma 외는, 평균 85.4%의 돌연변이율로, 대부분 2-대립형질 및 동형 접합 상태로, 벼의 46 개 표적 부위를 편집하였다. Ma 외는 유전자 패밀리의 다수의(8 개까지) 구성원, 생합성 경로에서의 다수의 유전자, 또는 단일 유전자에서 다수의 부위의 동시 표적화에 의해 T0 벼 및 T1 애기장대 식물에서 기능-손실 유전자 돌연변이의 예를 제공한다. 유사하게, 본 발명의 C2c2 시스템은 다수의 유전자의 발현을 동시에 효율적으로 표적화할 수 있다.
Lowder 외(Plant Physiol. 2015 Aug 21. pii: pp.00636.2015) 또한 CRISPR-Cas9 툴박스(toolbox)를 개발하여 식물에서 발현된, 침묵화된 또는 비-코딩 유전자의 다중화된 게놈 편집 및 전사 조절을 가능하게 한다. 이 툴박스는 골든 게이트 및 게이트웨이 클로닝 방법을 사용하여 단자엽 및 쌍자엽에 대한 기능성 CRISPR-Cas9 T-DNA 작제물을 빠르고 효율적으로 조립하기 위한 프로토콜 및 시약을 연구원에게 제공한다. 그것은 다중화된 유전자 편집 및 식물 내인성 유전자의 전사 활성화 또는 억제를 포함하는 전체 세트의 성능을 제공한다. T-DNA 기반의 형질 전환 기술은 현대 식물 생명 공학, 유전학, 분자 생물학 및 생리학의 기본이다. 이와 같이 Cas9(WT, 니카제 또는 dCas9) 및 gRNA(들)를 관심 T-DNA 목적-벡터에 조립하는 방법을 개발하였다. 조립 방법은 골든 게이트 조립 및 MultiSite 게이트웨이 재조합 모두를 기반으로 한다. 조립을 위해서 3 개의 모듈이 요구된다. 제1 모듈은 Cas9 엔트리 벡터이며, 이는 attL1 및 attR5 부위의 측면에 배치되는 프로모터 없는 Cas9 또는 이의 유도체 유전자를 함유한다. 제2 모듈은 attL5 및 attL2 부위의 측면에 배치되는 엔트리 gRNA 발현 카세트를 함유하는 gRNA 엔트리 벡터이다. 제3 모듈은 Cas9 발현을 위한 선택의 프로모터를 제공하는, attR1-attR2-함유 목적 T-DNA 벡터를 포함한다. Lowder 외의 툴박스는 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
효모 및 미세 조류와 같은 생물은 합성 생물학에 널리 사용된다. Stovicek 외(Metab. Eng. Comm., 2015; 2:13는 산업적 생산용 견고한 균주를 효율적으로 생산하기 위한 산업 효모, 예를 들어, 사카로마이세스 세레비사에의 게놈 편집을 기재하고 있다. Stovicek은 동시에 내인성 유전자의 두 대립유전자 모두를 파괴하고 이종 유전자를 녹인하기 위해 효모에 대해 코돈-최적화된 CRISPR-Cas9 시스템을 사용하였다. Cas9 및 gRNA는 게놈 또는 에피솜 2 μ-기반 벡터 위치로부터 발현되었다. 저자는 또한 Cas9 및 gRNA 발현 수준을 최적화함으로써 유전자 파괴 효율이 향상될 수 있음을 보여주었다. Hlavovα 외(Biotechnol. Adv. 2015)는 삽입 돌연변이유발 및 스크리닝을 위해 핵 및 엽록체 유전자를 표적화하는 CRISPR과 같은 기법을 사용하는 미세 조류의 종 또는 균주의 개발에 대해 논의한다. 동일한 플라스미드 및 벡터가 본 발명의 C2c2 시스템에 적용될 수 있다.
Petersen("Towards precisely glycol engineered plants," Plant Biotech Denmark Annual meeting 2015, Copenhagen, Denmark)은 아라비돕시스에서 게놈 변화를 조작하기 위하여, 예를 들어 원하는 번역후 변형을 갖는 생성물 및 단백질의 생산을 위해 아라비돕시스를 글리코 조작하기 위하여, CRISPR/Cas9를 사용하는 방법을 개발하였다. Hebelstrup 외(Front Plant Sci. 2015 Apr 23; 6:247)은 식물체 내 전분 생물공학을 개괄하며, 전분 변형 효소를 발현하고, 전분의 산업적 화학적 및/또는 물리적 처리에 의해 보통 제조되는 생성물을 직접 생산하는 작물을 제공한다. Petersen 및 Hebelstrup의 방법은 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
Kurth 외, J Virol. 2012 Jun;86(11):6002-9. doi: 10.1128/JVI.00436-12. Epub 2012 Mar 21)는 게놈에 대한 유전적 변형없이 포도덩굴에 원하는 형질을 도입하기 위해 RNA 바이러스-기반 벡터를 개발하였다. 벡터는 바이러스-유도된 유전자 침묵에 의해 내인성 유전자의 발현을 조절하는 능력을 제공하였다. 본 발명의 C2c2 시스템 및 단백질은 게놈에 대한 유전적 변형없이 유전자 및 단백질을 침묵시키는 데 사용될 수 있다.
일 구현예에서, 식물은 콩과 식물일 수 있다. 본 발명은 예를 들어 제한 없이 대두, 완두콩 및 땅콩을 탐구 및 변형하기 위하여 본 명세서에 개시된 CRISP-Cas 시스템을 이용할 수 있다. Curtin 외는 콩과 식물 기능 유전체학을 위한 툴박스를 제공한다(Curtin et al., "A genome engineering toolbox for legume Functional genomics," International Plant and Animal Genome Conference XXII 2014 참고). Curtin은 털이 많은 뿌리 및 전체 식물 시스템 모두에서 단일 카피 및 복제된 콩과 식물 유전자를 녹-아웃/다운하기 위해 CRISPR의 유전 형질 변환을 이용하였다. 표적 유전자 중 일부는 녹-아웃/다운 시스템의 특징을 탐구 및 최적화하기 위해 선택된 것인 반면(예를 들어, 피토엔 불포화화 효소), 다른 것들은 애기장대 다이서-유사 유전자에 대한 대두 상동성에 의해 또는 개자리속(Medicago)의 마디 생성에 대한 게놈-전체에 걸친 관련성 연구에 의해 확인되었다. 본 발명의 C2c2 시스템 및 단백질은 시스템을 녹아웃/녹다운시키는 데 사용될 수 있다.
땅콩 알레르기 및 콩과 식물에 대한 알레르기는 일반적으로 실제적이고 심각한 건강 상의 문제이다. 본 발명의 C2c2 이펙터 단백질 시스템은 이러한 콩과 식물의 알레르기 유발 단백질을 인코딩하는 유전자를 동정하고 그 후 편집하거나 침묵시키는 데 사용될 수 있다. 이러한 유전자 및 단백질에 대한 제한 없이, Nicolaou 외는 땅콩, 대두, 렌틸, 완두콩, 루핀, 껍질콩 및 녹두에서 알레르기 유발 단백질을 확인한다. 문헌[Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222)] 참고.
유리한 구현예에서, 식물은 나무일 수 있다. 본 발명은 또한 본 명세서에서 개시된 CRISPR Cas 시스템을 초본경에 이용할 수 있다(예를 들어, 문헌[Belhaj et al., Plant Methods 9: 39] 및 문헌[Harrison et al., Genes & Development 28: 1859-1872] 참조). 특히 유리한 구현예에서, 본 발명의 CRISPR Cas 시스템은 나무에서 단일 뉴클레오티드 다형성(SNP)을 표적화할 수 있다(예를 들어, 문헌[Zhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015] 참조). Zhou 외의 연구에서, 저자는, 케이스 연구로서 4-쿠마레이트:CoA 리가제(4CL) 유전자 패밀리를 사용하여 다년생 목본 사시나무속(Populus)에서 CRISPR Cas 시스템을 적용하고, 표적화된 2 개의 4CL 유전자에 대해 100% 돌연변이 효율을 달성하였으며, 검사한 모든 형질전환체는 이중대립형질 변형을 가졌다. Zhou 외의 연구에서, CRISPR-Cas9 시스템은 단일 뉴클레오티드 다형성(SNP)에 대해 고도로 민감하였으며, 제3의 4CL 유전자에 대한 절단은 표적 서열 내 SNP로 인해 삭제되었다. 이러한 방법은 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
Zhou 외의 방법(New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015)은 본 발명에 다음과 같이 적용될 수 있다. 리그닌 및 플라보노이드 생합성에 연관된, 2 개의 4CL 유전자, 즉 4CL1 및 4CL2는 각각 CRISPR-Cas9 편집에 대해 표적화된다. 형질전환에 일상적으로 사용되는 포퓰러스 트레뮬라(Populus tremula) x alba 클론 717-1B4는 게놈-시퀀싱된 포퓰러스 트리코카르파(Populus trichocarpa)로부터 분기된다. 따라서, 기준 게놈으로부터 설계된 4CL1 및 4CL2 gRNA는 인-하우스 717 RNA-Seq 데이터로 질의되어 Cas 효율을 제한할 수 있는 SNP의 부재를 보장한다. 4CL1의 게놈 복제물인, 4CL5에 대해 설계된 제3 gRNA 또한 포함된다. 상응하는 717 서열은 PAM 가까이/내의 각각의 대립형질에서 하나의 SNP를 포함하며, 이들 모두는 4CL5-gRNA에 의한 표적화를 제거하는 것으로 예상된다. 3 개의 gRNA 표적 부위 모두는 제1 엑손 내에 위치된다. 717 형질전환의 경우, gRNA는 바이너리 벡터 내 CaMV 35S 프로모터의 제어 하에, 인간 코돈-최적화된 Cas와 함께 개자리(Medicago) U6.6 프로모터로부터 발현된다. Cas-만의 벡터를 이용한 형질전환은 대조군으로서 제공될 수 있다. 무작위로 선택된 4CL1 및 4CL2 계통은 앰플리콘-시퀀싱 처리된다. 그 데이터는 이후 가공되고, 이중대립형질 돌연변이는 모든 경우에서 확인된다. 이들 방법은 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
식물에서, 병원균은 종종 숙주-특이적이다. 예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum) f. sp. 리코페르시시(lycopersici)는 토마토의 시듬을 유발하지만 토마토만을 공격하고, F. 옥시스포룸 f. 다이안티 푸치니아 그라미니스(dianthii Puccinia graminis) f. sp. 트리티시(tritici)는 밀만 공격한다. 식물은 대부분의 병원균에 견디는 기존 및 유도된 방어를 갖는다. 식물 세대에 걸친 돌연변이 및 재조합 사건은, 특히 병원균이 식물보다 더욱 높은 빈도로 번식함에 따라, 감수성이 증가되는 유전적 변동성을 일으킨다. 식물에서는, 비-숙주 내성이 존재할 수 있으며, 예를 들어 숙주 및 병원균은 비양립성이다. 통상적으로 많은 유전자에 의해 제어되는, 수평 내성, 예를 들어 병원균의 모든 종족에 대하여 부분 내성, 및 통상적으로 몇몇 유전자에 의해 제어되는, 수직 내성, 예를 들어 다른 종족은 아니지만 일부 종족의 병원균에 대해 완전한 내성이 또한 존재할 수 있다. 유전자 대 유전자 수준에서, 식물 및 병원균은 함께 진화하며, 하나의 균형에서의 유전적 변화는 다른 하나에서 변화를 일으킨다. 따라서, 자연적 변동성을 사용하여, 품종 개량자는, 산출량, 품질, 균일성, 강인성(hardiness), 내성에 대해 가장 유용한 유전자를 조합한다. 내성 유전자 공급원은 천연 또는 외래의 변종들, 토종(Heirloom Varieties), 야생 근연 식물, 및 유도된 돌연변이, 예를 들어 돌연변이원성 제제를 이용한 식물 재료 처리를 포함한다. 본 발명을 사용하여, 식물 품종 개량자는 돌연변이를 유도하는 새로운 도구를 제공받는다. 따라서, 당업자는 내성 유전자의 게놈을 분석할 수 있고, 원하는 특징 또는 특성을 갖는 변종들에서, 이전의 돌연변이원성 제제보다 더욱 정확하고, 이에 따라 식물 품종 개량 프로그램을 가속화하고 개선하는 내성 유전자의 증가를 유도하기 위하여 본 발명을 이용할 수 있다.
본 명세서에서 및 상기에서 달리 논의된 식물 외에도, 이펙터 단백질 및 적합한 가이드에 의해 변형된 설계 제작된 식물 및 그의 자손이 제공된다. 이들에는 밀, 보리, 벼, 대두 또는 옥수수와 같은 질병 또는 가뭄 저항성 작물; 자가 수분 능력을 제거 또는 감소시키기 위해 변형된 식물(그러나 대신 할 수 있고, 선택적으로 대신 혼성화할 수 있음); 및 면역원성 단백질이 이펙터 단백질 및 적합한 가이드를 통해 표적화됨으로써 장애, 파괴 또는 방해된, 땅콩 및 견과류와 같은 알레르기 유발 식품이 포함될 수 있다.
치료적 처리
본 출원이 시스템의 정보 제공된 설계 제작을 위한 기초를 제공하므로, 본 발명의 시스템은 본 개시 내용으로부터 과도한 실험없이, 치료, 분석 및 다른 응용을 포함하여, 이전의 RNA 절단 기술 분야에 적용될 수 있다. 본 발명은 RNA 과발현, 독성 RNA 및/또는 돌연변이된 RNA(예를 들어, 스플라이싱 결함 또는 절단과 같은)에 의해 야기되는 질병의 치료적 처리를 제공한다. 독성 RNA의 발현은 뇌, 심장 또는 골격근에서 핵 봉입 형성 및 후기-개시되는 퇴행성 변화와 관련될 수 있다. 가장 잘 연구된 예인 근긴장성 이영양증에서, 독성 RNA의 주요 병원성 효과는 결합 단백질을 격리시키고 대안적 스플라이싱의 조절을 손상시키는 것으로 보인다(문헌[Hum. Mol. Genet. (2006) 15 (suppl 2): R162-R169]). 근긴장성 이영양증 [dystrophia myotonica(DM)]은 극히 광범위한 임상 특징을 생산하기 때문에 유전학자들에게 특히 관심 대상이다. 부분적인 목록에는 근육 소모, 백내장, 인슐린 내성, 고환 위축, 심장 전도 감속, 피부 종양 및 인지에 대한 영향이 포함될 것이다. 현재 DM 제1형(DM1)으로 불리는 DM의 전형적인 형태는 시토졸 단백질 키나제를 인코딩하는 유전자인 DMPK의 3'-비번역 영역(UTR)에서 CTG 반복의 확장에 의해 야기된다.
하기 표는 DM1 골격근, 심장 또는 뇌에서 잘못 조절된 대안적 스플라이싱을 갖는 것으로 나타난 엑손의 목록을 나타낸다.
본 발명의 효소는 과발현된 RNA 또는 독성 RNA, 예를 들어 DMPK 유전자 또는, 예를 들어 상기 표에서, DM1 골격근, 심장 또는 뇌에서의 잘못 조절된 대안적 스플라이싱 중 임의의 것과 같은 것을 표적화할 수 있다.
본 발명의 효소는 또한 하기 표에 나타난 바와 같은 질병을 유발하는 RNA-의존적 기능(문헌[Cell. 2009 Feb 20; 136(4): 777-793]에 요약됨)에 영향을 미치는 트랜스-작용 돌연변이를 표적화할 수 있다.
본 발명의 효소는 또한 AD와 유사한 NFT를 갖지만 플라크는 없는, 일차 연령-관련 타우병증(PART)/신경섬유 매듭-우세한 노인성 치매, 권투선수치매(만성 외상 뇌병증), 진행핵상마비, 피질기저 변성, 염색체 17에 연관된 전측두엽 치매 및 파킨슨병, 리티코-보디그 병(lytico-Bodig disease)(괌의 파킨슨-치매 복합), 신경절교종 및 신경절세포종, 수막혈관종증, 뇌염후 파킨슨병, 아급성경화범뇌염, 뿐만 아니라 납중독뇌병증, 결절경화증, 할러포르덴-스파츠병(Hallervorden-Spatz disease), 및 리포푸신증, 알츠하이머 병과 같은 일차 및 이차 타우병증을 비롯한 다양한 타우병증(tauopathy)의 치료에 사용될 수 있다. 본 발명의 효소는 또한 스플라이싱 결함 및 질병을 야기하는 시스-작용 스플라이싱 코드 방해 돌연변이를 표적화할 수있다(문헌[Cell. 2009 Feb 20; 136(4): 777-793]에 요약됨). 운동 뉴런 퇴행성 질병 SMA는 SMN1 유전자의 결실로부터 기인한다. 나머지 SMN2 유전자는 엑손 스플라이싱 인핸서(ESE)를 비활성화하고 엑손 스플라이싱 사일렌서(ESS)를 생성하는 엑손 7에서의 C->T 치환을 갖고 있으며, 이는 엑손 7 건너뛰기 및 절단된 단백질(SMNΔ7)을 유도한다. 디스트로핀 유전자의 엑손 31에서의 T->A 치환은 미성숙 종료 코돈(STOP) 및 ESS를 동시에 생성하여 엑손 31 건너뛰기를 유도한다. 엑손 31이 결여된 mRNA는 부분적으로 기능적인 단백질을 생산하기 때문에 이 돌연변이는 DMD의 경미한 형태를 유발한다. 타우 단백질을 인코딩하는 MAPT 유전자의 엑손 10내의 및 이의 다운스트림의 돌연변이는 스플라이싱 조절 요소에 영향을 미치고 엑손 10을 포함하거나 제외하는 mRNA의 정상 1:1 비율을 방해한다. 이것은 4 개 또는 3 개의 미세소관-결합 도메인(4R-타우 및 3R-타우, 각각)을 함유하는 타우 단백질들 사이에서 변동된 균형을 초래하여, 신경병리학적 장애 FTDP-17을 유발한다. 나타난 예는 엑손 10 포함을 촉진하고 증가된 4R-타우 쪽으로 균형을 이동시키는 ESE 기능을 향상시키는 N279K 돌연변이이다. CFTR 유전자 엑손 9의 3' 스플라이스 부위 내의 다형성 (UG)m(U)n 영역은 엑손 9 포함 정도 및 전장 기능성 단백질의 수준에 영향을 주어, CFTR 유전자의 다른 곳에 있는 돌연변이에 의해 유발되는 낭포성 섬유증(CF)의 중증도를 변형시킨다.
선천 면역 시스템은 감염된 세포 내에서 바이러스 핵산을 인식함으로써 바이러스 감염을 일차적으로 검출하는데, 이는 DNA 또는 RNA 감지로 지칭된다. 시험관내 RNA 감지 분석은 특정 RNA 기질을 검출하는 데 사용될 수 있다. RNA 표적화 이펙터 단백질은 예를 들어 살아있는 세포에서의 RNA-기반 감지에 사용될 수 있다. 응용의 예는 예를 들어 질병-특이적 RNA의 감지에 의한 진단이다.
본 발명의 RNA 표적화 이펙터 단백질은, 구체적으로 RNA 바이러스에 대한, 항 바이러스 활성에 추가로 사용될 수 있다. 이펙터 단백질은 선택된 바이러스 RNA 서열에 대해 선택적인 적합한 가이드 RNA를 사용하여 바이러스 RNA에 표적화될 수 있다. 구체적으로, 이펙터 단백질은 단일 가닥 RNA와 같은 RNA를 절단하는 활성 뉴클레아제일 수 있다. 따라서, 항 바이러스제로서의 본 발명의 RNA 표적화 이펙터 단백질의 용도가 제공된다.
RNA 상기 언급된 RNA를 표적화하는 본 발명의 효소 시스템의 치료적 투여량은 약 0.1 내지 약 2 mg/kg 인 것으로 고려되며, 투여량은 모니터링된 반응과 함께 순차적으로 투여될 수 있고, 필요한 경우, 환자 당 약 7 내지 10 투여량까지 투여량 반복될 수 있다. 유리하게는, 치료의 효과를 확인하기 위해 치료 요법 동안 각각의 환자로부터 샘플을 수집한다. 예를 들어, RNA 샘플을 단리하고 정량하여 발현이 감소되거나 개선되는지 여부를 결정할 수 있다. 이러한 진단은 당업자의 이해 범위 내에 있다.
전사물 검출 방법
본 발명의 이펙터 단백질 및 시스템은 세포 또는 다른 샘플에서 RNA의 특이적 검출에 유용하다. 관심 RNA 표적의 존재 하에서, 가이드-의존적 C2c2 뉴클레아제 활성은 부수적 표적에 대한 비-특이적 알엔아제 활성에 의해 수반될 수 있다. 알엔아제 활성을 이용하기 위해서, 필요한 모든 것은 검출 가능하게 절단될 수 있는 리포터 기질이다. 예를 들어, 리포터 분자는 한쪽 끝에 형광 리포터 분자(플루오르)로 다른 쪽에는 소광제로 태깅된 RNA를 포함할 수 있다. C2c2 알엔아제 활성이 부재하는 경우, 소광제의 물리적 근접성은 형광을 플루오르로부터 낮은 수준으로 약화시킨다. C2c2 표적 특이적 절단이 관심 있는 RNA 표적 및 적합한 가이드 RNA의 존재에 의해 활성화될 때, RNA-함유 리포터 분자는 비-특이적으로 절단되고 플루오르 및 소광제는 공간적으로 분리된다. 이것은 적절한 파장의 빛에 의해 여기될 때 플루오르가 검출 가능한 신호를 방출하도록 한다.
일 양태에서, 본 발명은 RNA 표적화 이펙터, 상응하는 RNA 표적에 결합하도록 설계된 하나 이상의 가이드 RNA; 및 RNA-기반 절단 유도성 리포터 작제물을 포함하는 (표적) RNA 검출 시스템에 관한 것이다. 또 다른 양태에서, 본 발명은 RNA 표적화 이펙터, 상기 (표적) RNA에 결합하도록 설계된 하나 이상의 가이드 RNA, 및 RNA-기반 절단 유도성 리포터 작제물을 상기 샘플에 첨가하는 것을 포함하는, 샘플에서 (표적) RNA 검출하는 방법에 관한 것이다. 추가의 양태에서, 본 발명은 본 명세서에서 정의된 (표적) RNA 검출 시스템을 포함하는 키트 또는 장치, 또는 적어도 RNA 표적화 이펙터 및 RNA-기반 절단 유도성 리포터 작제물을 포함하는 키트 또는 장치에 관한 것이다. 추가의 양태에서, 본 발명은 (표적) RNA 검출을 위한 본 명세서에서 정의된 RNA 표적화 시스템 또는 키트 또는 장치의 용도에 관한 것이다. 특정 구현예에서 RNA 표적화 이펙터는 RNA 가이드된 알엔아제이다. 특정 구현예에서, RNA 표적화 이펙터는 CRISPR 이펙터이다. 특정 구현예에서, RNA 표적화 이펙터는 클래스 2 CRISPR 이펙터이다. 특정 구현예에서, RNA 표적화 이펙터는 클래스 2, 제VI형 CRISPR 이펙터이다. 선호되는 구현예에서, RNA 표적화 이펙터는 C2c2이다. 특정 구현예에서, RNA 표적화 이펙터, 바람직하게 C2c2는 본 명세서의 다른 곳에 기재된 종으로부터 유래된다. 본 명세서에 기재된 바와 같이 상기 (표적) RNA에 결합하도록 설계된 가이드 RNA는 RNA 표적화 이펙터와 복합체를 형성할 수 있고 여기서 상기 복합체 내의 가이드 RNA는 표적 RNA 분자에 결합할 수 있어, 역시 본 명세서의 다른 곳에 기재된 바와 같이, 표적 RNA가 절단된다는 것이 이해될 것이다. 가이드 RNA는 전형적으로 본 명세서의 다른 곳에 기재된, 가이드 서열 및 직접 반복을 포함하는 것으로 이해될 것이다. 특정 구현예에서, 하나 이상의 가이드 RNA는 질병 상태에 대해 진단적인 하나 이상의 표적 분자에 결합하도록 설계된다. 특정 구현예에서, 질병 상태는 바이러스, 박테리아, 균류 또는 기생충 감염과 같은 감염이다. 특정 구현예에서, 질병 상태는 비정상적 (표적) RNA 발현을 특징으로 한다. 특정 구현예에서, 질병 상태는 암이다. 특정 구현예에서, 질병 상태는 자가면역 질병이다. RNA-기반 절단 유도성 리포터 작제물은 RNA를 포함하고, RNA의 절단은 검출 가능한 판독 결과를 초래하고, 즉 검출 가능한 신호가 RNA의 절단 즉시 생성된다. 특정 구현예에서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함한다. 당업자는 상이한 유형의 형광색소 및 상응하는 소광제가 사용될 수 있음을 이해할 것이다. 당업자는 본 RNA 절단 리포터 작제물에서의 사용을 위해 조정될 수 있는 다른 유형의 유도성 리포터 시스템을 용이하게 예상할 것이다.
하나의 예시적인 분석 방법에서, C2c2 이펙터, 관심 표적-특이적 가이드 RNA, 및 리포터 분자가 세포 샘플에 첨가된다. 형광의 증가는 관심 RNA 표적의 존재를 암시한다. 또 다른 예시적인 방법에서, 검출 어레이가 제공된다. 어레이의 각각의 위치는 C2c2 이펙터, 리포터 분자, 및 관심 표적-특이적 가이드 RNA로 제공된다. 수행되는 분석에 따라, 어레이의 각각의 위치에서의 관심 표적-특이적 가이드 RNA는 동일하거나 상이할 수 있거나 이들의 조합일 수 있다. 예를 들어, 단일 출처 샘플에서 하나 이상의 표적을 시험하고자 할 때, 상이한 관심 표적-특이적 가이드 RNA가 제공될 수 있다. 예를 들어, 동일한 표적에 대해 다수의 샘플을 시험하고자 할 때, 각각의 위치에서 동일한 관심 표적-특이적 가이드 RNA가 제공될 수 있다.
본 명세서에 사용된 "마스킹 작제물"은 본 명세서에 기재된 활성화된 CRISPR 시스템 이펙터 단백질에 의해 절단되거나 그렇지 않으면 탈활성화될 수 있는 분자를 지칭한다. 특정 예시적 구현예에서, 마스킹 작제물은 RNA-기반 마스킹 작제물이다. 마스킹 작제물은 양성의 검출 가능한 신호의 생성 또는 검출을 방지한다. 양성의 검출 가능한 신호는 당업계에 공지된 광학, 형광, 화학발광, 전기화학적 또는 다른 검출 방법을 사용하여 검출될 수 있는 임의의 신호일 수 있다. 마스킹 작제물은 마스킹 작제물인 제거되거나 그렇지 않으면 침묵될 때까지 검출 가능한 양성 신호의 생성을 방지하거나 검출 가능한 양성 신호의 존재를 마스킹할 수 있다. 용어 "양성의 검출 가능 신호"는 마스킹 작제물의 존재 하에서 검출될 수 있는 다른 검출 가능한 신호와 구별하기 위해 사용된다. 예를 들어, 특정 구현예에서, 마스킹 제제가 존재할 때 제1 신호가 검출될 수 있으며(즉, 음성의 검출 가능한 신호), 그 후 이는 활성화된 CRISPR 이펙터 단백질에 의한 표적 분자의 검출 및 마스킹 제제의 절단 또는 탈활성화 즉시 제2 신호(예를 들어, 양성의 검출 가능한 신호)로 전환된다.
특정 예시적 구현예에서, 마스킹 작제물은 유전자 산물의 생성을 억제할 수 있다. 유전자 산물은 샘플에 첨가되는 리포터 작제물에 의해 인코딩될 수 있다. 마스킹 작제물은 shRHN 또는 siRNA와 같은 RNA 간섭 경로에 관여되는 간섭 RNA일 수 있다. 마스킹 작제물은 또한 마이크로RNA(miRNA)를 포함할 수 있다. 존재하는 동안, 마스킹 작제물은 유전자 산물의 발현을 억제한다. 유전자 산물은 형광 단백질일 수 있거나 마스킹 작제물의 존재가 없었다면 표지된 프로브 또는 항체에 의해 검출 가능할 다른 RNA 전사물 또는 단백질일 수 있다. 이펙터 단백질의 활성화 즉시 마스킹 작제물은 절단되거나 그렇지 않으면 침묵되어 양성의 검출 가능한 신호로서 유전자 산물의 발현 및 검출을 가능하게 한다.
특정 예시적 구현예에서, 마스킹 작제물은 검출 가능한 양성 신호를 생성하는 데 필요한 하나 이상의 시약을 격리하여, 마스킹 작제물로부터의 하나 이상의 시약의 방출이 검출 가능한 양성 신호의 생성을 초래하도록 할 수 있다. 하나 이상의 시약은 결합하여 비색 신호, 화학발광 신호, 형광 신호 또는 임의의 다른 검출 가능한 신호를 생산할 수 있으며, 이러한 목적에 적합한 것으로 알려진 임의의 시약을 포함할 수 있다. 특정 예시적 구현예에서, 하나 이상의 시약은 하나 이상의 시약에 결합하는 RNA 압타머에 의해 격리된다. 하나 이상의 시약은 표적 분자의 검출 즉시 이펙터 단백질이 활성화될 때 방출된다. 특정 예시적 구현예에서, 하나 이상의 시약은, 하나 이상의 RNA 압타머가 단백질에 결합함으로써 단백질이 검출 가능한 신호를 생성할 수 없도록 저해되거나 격리된, 비색, 화학발광 또는 형광 신호와 같은 검출 가능한 신호의 생성을 촉진시킬 수 있는, 효소와 같은 단백질이다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, RNA 압타머는 검출 가능 신호를 생성하는 단백질의 능력을 더 이상 저해하지 않는 정도까지 절단되거나 분해된다.
일 구현예에서, 트롬빈은 예를 들어 다음의 서열을 갖는 저해성 압타머와 함께 신호 증폭 효소로서 사용된다:GGGAACAAAGCUGAAGUACUUACCC. 이 압타머가 절단되면 트롬빈은 활성화되어 펩티드 비색 기질(예를 들어, www.sigmaaldrich.com/catalog/product/sigma/t3068?lang=en&region=US 참고) 또는 형광 기질(예를 들어, www.sigmaaldrich.com/catalog/product/sigma/b9385?lang=en&region=US 참고)을 절단할 것이다. 비색 기질, 파라-니트로아닐리드(pNA),는 트롬빈을 위한 펩티드 기질에 공유 결합된다. 트롬빈에 의한 절단 시, pNA는 방출되어 황색으로 되고 쉽게 눈으로 볼 수 있다. 형광 기질은 유사한 원리에 의해 작동하며 트롬빈에 의한 절단 즉시 형광 검출기를 사용하여 검출될 수 있는 청색 형광단인 7-아미노-4-메틸쿠마린을 방출한다. 트롬빈의 대안으로는 유사하게 비색 또는 형광 신호를 생성하는 데 사용될 수 있고 저해성 압타머에 의해 저해될 수 있는 홀스라디시 페록시다제(HRP), β-갈락토시다제 및 송아지 알칼라인 포스파타제(CAP)가 포함된다.
특정 예시적 구현예에서, 마스킹 작제물은 개별 분리된 부피로(아래에서 추가로 정의됨) 고체 기질 상에 고정화될 수 있고 단일 시약을 격리할 수 있다. 예를 들어, 시약은 염료를 포함하는 비드일 수 있다. 고정된 시약에 의해 격리될 때, 개별 비드는 검출 가능한 신호를 생성하기에 너무 분산되어 있지만, 마스킹 작제물로부터의 방출 시, 예를 들어 응집 또는 용액 농도의 단순한 증가에 의해 검출 가능한 신호를 생성할 수 있다. 특정 예시적 구현예에서, 고정화된 마스킹 제제는 표적 분자의 검출 시 활성화된 이펙터 단백질에 의해 절단될 수 있는 RNA-기반의 압타머이다.
특정 다른 예시적 구현예에서, 마스킹 작제물은 용액 중 고정화된 시약에 결합함으로써 시약이 용액 중 유리된 별도의 표지된 결합 파트너에 결합하는 능력을 차단한다. 따라서, 샘플에 세척 단계 적용 시, 표지된 결합 파트너는 표적 분자의 부재 하에 샘플로부터 세척될 수 있다. 그러나, 이펙터 단백질이 활성화되면, 마스킹 작제물은 마스킹 작제물이 시약에 결합하는 능력을 간섭하기에 충분한 정도로 절단되어, 표지된 결합 파트너가 고정화된 시약에 결합할 수 있게 한다. 따라서, 표지된 결합 파트너는 세척 단계 후에 남아있고, 이는 샘플 내 표적 분자의 존재를 나타낸다. 특정 양태에서, 고정화된 시약에 결합하는 마스킹 작제물은 RNA 압타머이다. 고정화된 시약은 단백질일 수 있고, 표지된 결합 파트너는 표지된 항체일 수 있다. 대안적으로, 고정화된 시약은 스트렙타비딘일 수 있고, 표지된 결합 파트너는 바이오틴 표지될 수 있다. 상기 구현예에서 사용된 결합 파트너 상의 표지는 당업계에 공지된 임의의 검출 가능한 표지일 수 있다. 추가적으로 본 명세서에 기재된 전체적인 설계에 따라 다른 공지된 결합 파트너가 사용될 수 있다.
특정 예시적 구현예에서, 마스킹 작제물은 리보자임을 포함할 수 있다. 리보자임은 촉매 특성을 갖는 RNA 분자이다. 리보자임은 천연적인 것 및 설계 제작된 것 모두, RNA를 포함하거나 RNA로 구성되므로, 본 명세서에 개시된 이펙터 단백질에 의해 표적화될 수 있다. 리보자임은 음성의 검출 가능한 신호를 생성하거나 양성의 제어 신호의 생성을 방지하는 반응을 촉매하도록 선택되거나 설계 제작될 수 있다. 활성화된 이펙터 단백질 분자에 의한 리보자임의 탈활성화 시, 음성의 제어 신호를 생성하거나 양성의 검출 가능한 신호의 생성을 방지하는 반응이 제거되어, 양성의 검출 가능한 신호가 검출 가능하게 한다. 일 예시적 구현예에서, 리보자임은 용액이 제1 색으로 보이도록 하는 비색 반응을 촉매할 수 있다. 리보자임이 탈활성화되면, 그 후 용액은 제2 색으로 변하고, 제2 색은 검출 가능한 양성 신호이다. 리보자임이 비색 반응을 촉매하는 데 어떻게 사용될 수 있는지에 대한 예가 문헌[Zhao et al. "Signal amplification of glucosamine-6-phosphate based on ribozyme glmS," Biosens Bioelectron. 2014; 16:337-42]에 기재되어 있고, 이러한 시스템이 어떻게 본 명세서에 개시된 구현예들의 맥락에서 작동하도록 변형될 수 있는지에 대한 예를 제공한다. 대안적으로, 리보자임은, 존재하는 경우, 예를 들어 RNA 전 사물의 절단 산물을 생성할 수 있다. 따라서, 양성의 검출 가능한 신호의 검출은 리보자임의 부재 하에만 생성되는 비-절단 RNA 전사물의 검출을 포함할 수 있다
일 예시적 구현예에서, 마스킹 작제물은 검출 제제가 용액 중 응집되거나 분산되는지 여부에 따라 색을 변화시키는 검출 제제를 포함한다. 예를 들어, 콜로이드 금과 같은 특정 나노입자는 응집체에서 분산된 입자로 이동할 때 가시적인 보라색에서 빨간색으로의 변화를 겪는다. 따라서, 특정 예시적 구현예에서, 이러한 검출 제제는 하나 이상의 가교 분자에 의해 응집체로 유지될 수 있다. 가교 분자의 적어도 일부는 RNA를 포함한다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, 가교 분자의 RNA 부분이 절단되어 검출 제제가 분산되고 대응하는 색 변화를 초래하도록 한다. 특정 예시적 구현예에서, 가교 분자는 RNA 분자이다. 특정 예시적 구현예에서, 검출 제제는 콜로이드성 금속이다. 콜로이드성 금속 물질은 수-불용성 금속 입자 또는 액체 중 분산된 금속 화합물, 하이드로졸 또는 금속 졸을 포함할 수 있다. 콜로이드성 금속은 주기율표의 IA, IB, IIB 및 IIIB 족의 금속뿐만 아니라 전이 금속, 특히 VIII 족의 것들로부터 선택될 수 있다. 선호되는 금속은 금, 은, 알루미늄, 루테늄, 아연, 철, 니켈 및 칼슘을 포함한다. 다른 적합한 금속은 또한 모든 다양한 산화 상태에서의 다음을 포함한다: 리튬, 소듐, 마그네슘, 포타슘, 스칸듐, 티타늄, 바나듐, 크롬, 망간, 코발트, 구리, 갈륨, 스트론튬, 니오븀, 몰리브덴, 팔라듐, 인듐, 주석, 텅스텐, 레늄, 백금 및 가돌리늄. 금속은 바람직하게는 적절한 금속 화합물 유래의 이온 형태, 예를 들어 A13+, Ru3+, Zn2+, Fe3+, Ni2+ 및 Ca2+ 이온으로 제공된다.
특정 다른 예시적 구현예에서, 마스킹 작제물은 검출 가능한 표지에 부착된 RNA 올리고뉴클레오티드 및 그 검출 가능한 표지의 마스킹 제제를 포함할 수 있다. 이러한 검출 가능한 표지/마스킹 제제 쌍의 예는 형광단 및 형광단의 소광제이다. 형광단의 소광은 형광단과 또 다른 형광단 사이의 비-형광 복합체 또는 비-형광 분자의 형성의 결과로서 발생할 수 있다. 이 메커니즘은 기저-상태 복합체 형성, 정적 소광 또는 접촉 소광으로 알려져 있다. 따라서, RNA 올리고뉴클레오티드는 형광단 및 소광제가 접촉 소광이 일어나기에 충분히 근접하도록 설계될 수 있다. 형광단 및 이의 동족 소광제는 당업계에 공지되어 있고 당업자에 의해 이 목적으로 선택될 수 있다. 구체적인 형광단/소광제 쌍은, 형광단/소광제 쌍의 선택이 형광단의 마스킹을 보장하는 것을 제외하고는, 본 발명의 맥락에서 중요하지 않다. 본 명세서에 개시된 이펙터 단백질의 활성화 즉시, RNA 올리고뉴클레오티드는 절단됨으로써 접촉 소광 효과를 유지하는 데 필요한 형광단과 소광제 사이의 근접성을 단절한다. 따라서, 형광단의 검출은 샘플 내의 표적 분자의 존재를 결정하는 데 사용될 수 있다.
일 예시적 구현예에서, 마스킹 작제물은 양자점을 포함할 수 있다. 양자점은 표면에 부착된 다수의 링커 분자를 가질 수 있다. 링커 분자의 적어도 일부는 RNA를 포함한다. 링커 분자는 한 쪽 말단은 양자점에 부착되고 링커의 길이를 따라 또는 끝 말단들은 하나 이상의 소광제에 부착되어 양자점의 소광이 발생하기에 충분히 근접하게 소광제를 유지시킨다. 링커는 분지될 수 있다. 위와 같이 양자점/소광제 쌍의 선택이 형광단의 마스킹을 보장하는 것을 제외하고는, 양자점/소광제 쌍은 중요하지 않다. 양자점 및 이의 동족 소광제는 당업계에 공지되어 있고 당업자에 의해 이 목적으로 선택될 수 있다. 본 명세서에 개시된 이펙터 단백질의 활성화 즉시, 링커 분자의 RNA 부분은 절단됨으로써 소광 효과를 유지하는 데 필요한 양자점과 하나 이상의 소광제 사이의 근접성을 제거한다. 일 구현예에서, 양자점은 Qdot® 625 스트렙타비딘 컨쥬게이트(www.thermofisher.com/order/catalog/product/A10196)와 같이 스트렙타비딘 컨쥬게이트된다. RNA는 바이오틴 링커를 통해 부착되고 /5Biosg/UCUCGUACGUUC/3IAbRQSp/ 또는 /5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/ 서열로 소광 분자를 모집하며, 여기서 /5Biosg/는 바이오틴 태그이고 /3IAbRQSp/는 아이오와 검정 소광제이다. 절단 시, 소광제가 방출되고 양자점이 가시적으로 형광을 낼 것이다.
유사한 방식으로, 형광 에너지 전달(FRET)이 검출 가능한 양성 신호를 생성하는 데 사용될 수 있다. FRET은 에너지적으로 여기된 형광단(즉, "공여자 형광단")으로부터의 광자가 또 다른 분자(즉, "수용자")의 전자의 에너지 상태를 더욱 높은 진동 수준의 여기된 단일항 상태로 상승시키는 비-방사성 과정이다. 공여자 형광단은 그 형광단의 형광 특징을 방출하지 않고 기저 상태로 돌아간다. 수용자는 또 다른 형광단 또는 비-형광 분자일 수 있다. 수용자가 형광단인 경우, 전달된 에너지는 그 형광단의 형광 특징으로 방출된다. 수용자가 비-형광 분자인 경우 흡수된 에너지는 열로 손실된다. 따라서, 본 명세서에 개시된 구현예의 맥락에서, 형광단/소광제 쌍은 올리고뉴클레오티드 분자에 부착된 공여자 형광단/수용자 쌍으로 대체된다. 원래의 경우, 마스킹 작제물은 수용자로부터 방출된 형광 또는 열에 의해 검출되는 제1 신호(음성의 검출 가능한 신호)를 생성한다. 본 명세서에 개시된 이펙터 단백질의 활성화 즉시, RNA 올리고뉴클레오티드는 절단되고 FRET는 파괴되어 공여자 형광단의 형광이 이제 검출되게 된다(양성의 검출 가능한 신호).
알엔아제의 검출을 위한 비색 판독결과의 일 방식은 인터칼레이팅 염료에 기반한 것이고, 이는 긴 RNA의 짧은 뉴클레오티드로의 절단에 반응하여 그들의 흡광도를 변화시킨다. 이들 특성을 갖는 몇몇의 기존 염료가 존재한다. Wagner(1983)로부터, 피로닌-Y는 RNA와 복합체화하고 572 nm에서 흡광도를 갖는 복합체를 형성할 것이고; RNA의 절단은 흡광도 손실 및 색 변화를 초래한다. Greiner-Stoeffele(1996)는 유사한 방식으로 메틸렌 블루를 사용하였으며, 알엔아제 활성에 따라 688 nm에서 흡광도가 변하였다.
비색 판독결과의 또 다른 방식은 절단 즉시 색이 변화하는 핵산 기질을 포함한다. Witmer(1991)는, 절단 후 리포터 기를 방출하는, 합성 리보뉴클레오티드 기질인 U-3'-BCIP를 이용하여 650 nm에서의 흡광도 생성을 초래하였다.
CRISPR-Cas 시스템, 그의 성분 및 이러한 성분의 전달에 대한, 양 및 제형에 관한, 본 발명의 실시에 유용한 모든 것 포함하여, 방법, 재료, 전달 비히클, 벡터, 입자, AAV 및 이들의 제조 및 사용을 포함하는, 일반적인 정보 관련하여, 다음을 참조한다: 미국 특허 번호 8,999,641, 8,993,233, 8,945,839, 8,932,814, 8,906,616, 8,895,308, 8,889,418, 8,889,356, 8,871,445, 8,865,406, 8,795,965, 8,771,945 및 8,697,359; 미국 특허 공보 US 2014-0310830(미국 출원 번호 14/105,031), US 2014-0287938 A1(미국 출원 번호 14/213,991), US 2014-0273234 A1(미국 출원 번호 14/293,674), US2014-0273232 A1(미국 출원 번호 14/290,575), US 2014-0273231(미국 출원 번호 14/259,420), US 2014-0256046 A1(미국 출원 번호 14/226,274), US 2014-0248702 A1(미국 출원 번호 14/258,458), US 2014-0242700 A1(미국 출원 번호 14/222,930), US 2014-0242699 A1(미국 출원 번호 14/183,512), US 2014-0242664 A1(미국 출원 번호 14/104,990), US 2014-0234972 A1(미국 출원 번호 14/183,471), US 2014-0227787 A1(미국 출원 번호 14/256,912), US 2014-0189896 A1(미국 출원 번호 14/105,035), US 2014-0186958(미국 출원 번호 14/105,017), US 2014-0186919 A1(미국 출원 번호 14/104,977), US 2014-0186843 A1(미국 출원 번호 14/104,900), US 2014-0179770 A1(미국 출원 번호 14/104,837) 및 US 2014-0179006 A1(미국 출원 번호 14/183,486), US 2014-0170753(미국 출원 번호 14/183,429); 유럽 특허 EP 2 784 162 B1 및 EP 2 771 468 B1; 유럽 특허 출원 EP 2 771 468(EP13818570.7), EP 2 764 103(EP13824232.6), 및 EP 2 784 162(EP14170383.5); 및 PCT 특허 공보 PCT 특허 공보 WO 2014/093661(PCT/US2013/074743), WO 2014/093694(PCT/US2013/074790), WO 2014/093595(PCT/US2013/074611), WO 2014/093718(PCT/US2013/074825), WO 2014/093709(PCT/US2013/074812), WO 2014/093622(PCT/US2013/074667), WO 2014/093635(PCT/US2013/074691), WO 2014/093655(PCT/US2013/074736), WO 2014/093712(PCT/US2013/074819), WO 2014/093701(PCT/US2013/074800), WO 2014/018423(PCT/US2013/051418), WO 2014/204723(PCT/US2014/041790), WO 2014/204724(PCT/US2014/041800), WO 2014/204725(PCT/US2014/041803), WO 2014/204726(PCT/US2014/041804), WO 2014/204727(PCT/US2014/041806), WO 2014/204728(PCT/US2014/041808), WO 2014/204729(PCT/US2014/041809). 또한 다음을 참조한다: 미국 임시 특허 출원 61/758,468; 61/802,174; 61/806,375; 61/814,263; 61/819,803 및 61/828,130, 각각 2013년 1월 30일; 2013년 3월 15일; 2013년 3월 28일; 2013년 4월 20일; 2013년 5월 6일 및 2013년 5월 28일에 출원. 또한 2013년 6월 17일에 출원된 미국 임시 특허 출원 61/836,123을 참조한다. 추가적으로 다음을 참조한다: 미국 임시 특허 출원 61/835,931, 61/835,936, 61/836,127, 61/836,101, 61/836,080 및 61/835,973, 각각 2013년 6월 17일에 출원. 추가로 다음을 참조한다: 2013년 8월 5일 출원된 미국 임시 특허 출원 61/862,468 및 61/862,355; 2013년 8월 28일에 출원된 61/871,301; 2013년 9월 25일에 출원된 61/960,777, 및2013년 10월 28일에 출원된 61/961,980. 더욱 추가적으로 다음을 참조한다: PCT 특허 출원 번호: PCT/US2014/041803, PCT/US2014/041800, PCT/US2014/041809, PCT/US2014/041804 및 PCT/US2014/041806, 각각 2014년 6월 10일에 출원 6/10/14; 2014년 6월 11일에 출원된 PCT/US2014/041808; 및 2014년 10월 28일에 출원된 PCT/US2014/62558, 및 미국 임시 특허 출원 번호: 61/915,150, 61/915,301, 61/915,267 및 61/915,260, 각각 2013년 12월 12일에 출원; 2013년 1월 29일 및 2013년 2월 25일에 출원된 61/757,972 및 61/768,959; 2013년 6월 17일에 출원된 61/835,936, 61/836,127, 61/836,101, 61/836,080, 61/835,973, 및 61/835,931; 62/010,888 및 62/010,879, 둘 다 2014년 6월 11일에 출원; 62/010,329 및 62/010,441, 각각 2014년 6월 10일에 출원; 61/939,228 및 61/939,242, 각각 2014년 2월 12일에 출원; 2014년 4월 15일에 출원된 61/980,012; 2014년 8월 17일에 출원된 62/038,358; 62/054,490, 62/055,484, 62/055,460 및 62/055,487, 각각 2014년 9월 25일에 출원; 및 2014년 10월 27일에 출원된 62/069,243. 또한 다음을 참조한다: 2014년 9월 25일에 출원된 미국 임시 특허 출원 번호 62/055,484, 62/055,460, 및 62/055,487; 2014년 4월 15일에 출원된 미국 임시 특허 출원 61/980,012; 및 2014년 2월 12일에 출원된 미국 임시 특허 출원 61/939,242. 그 중에서도, 미국을 지정한 PCT 출원, 2014년 6월 10일에 출원된 출원 번호 PCT/US14/41806을 참조한다. 2014년 1월 22일에 출원된 미국 임시 특허 출원 61/930,214를 참조한다. 각각 2013년 12월 12일에 출원된 미국 임시 특허 출원 61/915,251; 61/915,260 및 61/915,267를 참조한다. 2014년 4월 15일에 출원된 미국 임시 특허 출원 USSN 61/980,012를 참조한다. 그 중에서도, 미국을 지정한 PCT 출원, 2014년 6월 10일에 출원된 출원 번호 PCT/US14/41806를 참조한다. 2014년 1월 22일에 출원된 미국 임시 특허 출원 61/930,214를 참조한다. 각각 2013년 12월 12일에 출원된 미국 임시 특허 출원 61/915,251; 61/915,260 및 61/915,267를 참조한다.
또한 다음에 대하여 언급된다: 미국 출원 62/091,455, 12-Dec-14 출원, PROTECTED GUIDE RNAS(PGRNAS); 미국 출원 62/096,708, 24-Dec-14, PROTECTED GUIDE RNAS(PGRNAS); 미국 출원 62/091,462, 12-Dec-14, DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; 미국 출원 62/096,324, 23-Dec-14, DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; 미국 출원 62/091,456, 12-Dec-14, ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS; 미국 출원 62/091,461, 12-Dec-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs); 미국 출원 62/094,903, 19-Dec-14, UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING; 미국 출원 62/096,761, 24-Dec-14, ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION; 미국 출원 62/098,059, 30-Dec-14, RNA-TARGETING SYSTEM; 미국 출원 62/096,656, 24-Dec-14, CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS; 미국 출원 62/096,697, 24-Dec-14, CRISPR HAVING OR ASSOCIATED WITH AAV; 미국 출원 62/098,158, 30-Dec-14, ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS; 미국 출원 62/151,052, 22-Apr-15, CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING; 미국 출원 62/054,490, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS; 미국 출원 62/055,484, 25-Sep-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/087,537, 4-Dec-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/054,651, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; 미국 출원 62/067,886, 23-Oct-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; 미국 출원 62/054,675, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES; 미국 출원 62/054,528, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS; 미국 출원 62/055,454, 25-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES(CPP); 미국 출원 62/055,460, 25-Sep-14, MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; 미국 출원 62/087,475, 4-Dec-14, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/055,487, 25-Sep-14, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/087,546, 4-Dec-14, MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; 및 미국 출원 62/098,285, 30-Dec-14, CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS.
이들 특허, 특허 공보 및 출원 각각, 및 그 안에 또는 그들 절차 중에 인용된 모든 문헌("출원 인용 문헌") 및 상기 출원 인용 문헌에 인용되거나 참조된 모든 문헌은 상기 그 안에 또는 그 안의 및 본 명세서에 참조로서 포함된 임의의 문헌에서 언급된 임의의 제품에 대한 임의의 지침서, 설명서, 제품 명세서, 및 제품 시트와 함께, 참조로서 본 명세서에 포함되며, 본 발명의 실시에 이용될 수 있다. 모든 문헌(예를 들어, 이들 특허, 특허 공보 및 출원 및 출원 인용 문헌)은 각각의 개별적 문헌이 참조로서 포함되는 것으로 구체적이고 개별적으로 표시된 것과 같이 동일한 정도로 참조로서 본 명세서에 포함된다.
또한 CRISPR-Cas 시스템에 관한 일반적인 정보와 관련하여,(또한 본 명세서에서 참조로서 포함되는) 다음이 언급된다:
Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013);
RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang W., Bikard D., Cox D., Zhang F, Marraffini LA. Nat Biotechnol Mar;31(3):233-9 (2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013);
Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, FA., Hsu, PD., Lin, CY., Gootenberg, JS., Konermann, S., Trevino, AE., Scott, DA., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013);
Genome engineering using the CRISPR-Cas9 system. Ran, FA., Hsu, PD., Wright, J., Agarwala, V., Scott, DA., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print];
Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F., Cell. Jun 5;157(6):1262-78 (2014).
Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014);
In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015).
A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015 (multiplex screen in mouse), and
In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015).
Shalem et al., "High-throughput functional genomics using CRISPR-Cas9," Nature Reviews Genetics 16, 299-311 (May 2015).
Xu et al., "Sequence determinants of improved CRISPR sgRNA design," Genome Research 25, 1147-1157 (August 2015).
Parnas et al., "A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks," Cell 162, 675-686 (July 30, 2015).
Ramanan et al., CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus," Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)
Nishimasu et al., "Crystal Structure of Staphylococcus aureus Cas9," Cell 162, 1113-1126 (Aug. 27, 2015)
Zetsche et al. (2015), "Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system," Cell 163, 759-771 (Oct. 22, 2015) doi: 10.1016/j.cell.2015.09.038. Epub Sep. 25, 2015
Shmakov et al. (2015), "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems," Molecular Cell 60, 385-397 (Nov. 5, 2015) doi: 10.1016/j.molcel.2015.10.008. Epub Oct 22, 2015
Dahlman et al., "Orthogonal gene control with a catalytically active Cas9 nuclease," Nature Biotechnology 33, 1159-1161 (November, 2015)
Gao et al, "Engineered Cpf1 Enzymes with Altered PAM Specificities," bioRxiv 091611; doi: http://dx.doi.org/10.1101/091611 Epub Dec. 4, 2016
Smargon et al. (2017), "Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28," Molecular Cell 65, 618-630 (Feb. 16, 2017) doi: 10.1016/j.molcel.2016.12.023. Epub Jan 5, 2017
이들 각각은 본 명세서에 참조로서 포함되고, 본 발명의 실시에서 고려될 수 있으며, 아래에서 간략히 논의된다:
Cong 외는 스트렙토코커스 테르모필루스 Cas9 및 또한 스트렙토코커스 피오게네스 Cas9 둘 모두를 기초로 하여 진핵 세포에서 사용하기 위해 II형 CRISPR/Cas 시스템을 조작하였고, Cas9 뉴클레아제가 짧은 RNA에 의해 유도되어 인간 및 마우스 세포에서 DNA의 정밀한 절단을 유도할 수 있는 것을 입증하였다. 이들의 연구는 닉킹 효소로 전환됨에 따라 Cas9가 최소의 돌연변이유발 활성을 갖는 진핵 세포에서 상동성-유도된 수복을 촉진하는 데 이용될 수 있음을 추가로 보여준다. 또한, 그들의 연구는 다수의 가이드 서열이 단일의 CRISPR 어레이로 인코딩되어 포유류 게놈 내의 내인성 게놈 유전자좌 위치에서 몇몇의 동시 편집을 가능하게 할 수 있음을 입증하였으며, 이는 RNA-안내된 뉴클레아제 기술의 용이한 프로그램화가능성 및 폭넓은 응용 가능성을 입증한다. 세포에서 서열 특이적 DNA 절단을 프로그램화하기 위해 RNA를 이용하는 이러한 능력은 게놈 조작 도구의 새로운 부류를 규정하였다. 이들 연구는 다른 CRISPR 유전자좌가 포유류 세포로 이식될 수 있고, 또한 포유류 게놈 절단을 매개할 수 있음을 추가로 보여준다. 중요하게는, CRISPR/Cas 시스템의 여러 양태가 그의 효능 및 다능성을 증가시키기 위해 추가로 개선될 수 있음이 예견될 수 있다.
Jiang 외는 스트렙토코커스 뉴모니애 및 에스케리키아 콜라이의 게놈에서 정밀한 돌연변이를 도입시키기 위해 이중-RNA와 복합체화된 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-회합된 Cas9 엔도뉴클레아제를 이용하였다. 상기 접근법은 돌연변이되지 않은 세포를 사멸시키기 위해 표적화된 게놈 부위에서의 이중-RNA:Cas9-유도된 절단에 의존하며, 선택 마커 또는 반대-선택 시스템의 필요를 회피한다. 상기 연구는 편집 주형에서 수행되는 단일- 및 다중 뉴클레오티드 변화를 만들기 위해 짧은 CRISPR RNA(crRNA)의 서열을 변화시킴에 의한 이중-RNA:Cas9 특이성의 재프로그램화를 보고하였다. 상기 연구는 2 개의 crRNA의 동시 사용이 다중화 돌연변이유발을 가능하게 하는 것을 보여준다. 또한, 상기 접근법이 리컴비니어링(recombineering)과 병용하여 이용된 경우, 스트렙토코커스 뉴모니애에서 기재된 접근법을 이용하여 회수된 세포의 거의 100%가 요망되는 돌연변이를 함유하였고, 에스케리키아 콜라이에서, 회수된 65%가 돌연변이를 함유하였다.
Wang 외는(2013) 배아 줄기 세포에서의 순차적인 재조합 및/또는 많은 시간이 걸리는, 단일 돌연변이를 갖는 마우스의 이종교배에 의한 전통적으로 다수의 단계로 생성된 다수의 유전자에서의 돌연변이를 함유한 마우스들의 일-단계 생성을 위해 CRISPR/Cas 시스템을 사용하였다. CRISPR/Cas 시스템은 작용적으로 중복인 유전자 및 상위 유전자 상호작용의 생체내 연구를 크게 촉진할 것이다.
Konermann 외는(2013) DNA-결합 도메인 기반 CRISPR Cas9 효소 및 또한 전사 활성화제 유사 이펙터의 광학적 및 화학적 조절을 가능하게 하는 다능성이고 강력한 기술에 대한 해당 분야의 요구를 다루었다.
Ran 외는(2013-A) 표적화된 이중-가닥 손상을 도입시키기 위해 쌍을 형성하는 가이드 RNA와 Cas9 닉카아제 돌연변이체를 병용한 접근법을 기재하였다. 이는 가이드 서열에 의해 특정 게놈 유전자좌로 표적되는 미생물 CRISPR-Cas 시스템으로부터의 Cas9 뉴클레아제의 문제를 다루며, 이는 DNA 표적으로의 특정 미스매치를 용인할 수 있고, 이에 의해 바람직하지 않은 표적외 돌연변이유발을 촉진할 수 있다. 게놈 내의 개별의 닉은 높은 정확도로 수복되므로, 적절한 오프셋 가이드 RNA를 통한 동시 닉킹이 이중-가닥 손상에 필요하고, 표적 절단을 위한 특이적으로 인식된 염기의 수를 연장시킨다. 상기 저자는 쌍을 형성한 닉킹을 이용하는 것이 세포주에서 50 내지 1,500 배까지 표적외 활성을 감소시킬 수 있고, 표적에 대한 절단 효율을 희생시키지 않고 마우스 스플라이싱체에서 유전자 녹아웃을 촉진하는 것을 입증하였다. 이러한 다능성 전략은 높은 특이성을 필요로 하는 매우 다양한 게놈 편집 응용을 가능하게 한다.
Hsu 외는(2013) 표적 부위의 선택을 알아내고, 표적외 효과를 피하기 위해 인간 세포에서 SpCas9 표적화 특이성을 특성화하였다. 상기 연구는 293T 및 293FT 세포에서 100 개 초과의 예측 게놈 표적외 유전자좌에서 SpCas9-유도된 삽입-결실 돌연변이 수준 및 700 개 초과의 가이드 RNA 변이체를 평가하였다. 상기 저자는 SpCas9가 미스매치의 수, 위치 및 분포에 민감한 서열-의존성 방식으로 상이한 위치에서 가이드 RNA와 표적 DNA 사이의 미스매치를 용인하는 것을 보고하였다. 상기 저자는 SpCas9-매개 절단이 DNA 메틸화에 의해 영향을 받지 않고, SpCas9 및 sgRNA의 용량을 적정하여 표적외 변형을 최소화시킬 수 있음을 추가로 나타내었다. 또한, 포유류 게놈 조작 응용을 용이하게 하기 위해, 상기 저자는 표적 서열의 선택 및 확인뿐만 아니라 표적외 분석을 안내하기 위해 웹-기반 소프트웨어 도구를 제공한 것을 보고하였다.
Ran 외는(2013-B) 포유류 세포에서 비-상동성 말단 연결(NHEJ) 또는 상동성-유도 수복(HDR)뿐만 아니라 다운스트림 기능성 연구를 위한 변형된 세포주의 생성을 통한 Cas9-매개 게놈 편집을 위한 일련의 도구를 기재하였다. 표적외 절단을 최소화시키기 위해, 상기 저자는 쌍을 형성한 가이드 RNA와 함께 Cas9 닉카아제 돌연변이체를 이용한 이중-닉킹 전략을 추가로 기재하였다. 상기 저자에 의해 제공된 프로토콜은 표적 부위의 선택, 절단 효율의 평가 및 표적외 활성의 분석을 위한 가이드를 실험적으로 유래하였다. 상기 연구는 표적 설계로 시작하여, 유전자 변형은 1 내지 2 주만큼 적은 기간 내에 달성될 수 있고, 변형된 클론성 세포주가 2 내지 3 주 내에 유래될 수 있음을 나타내었다.
Shalem 외는 게놈-전체에 걸친 규모에서 유전자 기능을 질의하기 위한 새로운 방식을 기재한다. 그들의 연구는 64,751 개의 독특한 가이드 서열을 이용하여 18,080 개 유전자를 표적화시킨 게놈-규모의 CRISPR-Cas9 녹아웃(GeCKO) 라이브러리의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능하게 하는 것을 보여주었다. 먼저, 상기 저자는 암 및 만능성 줄기 세포에서세포 생존력에 필수적인 유전자를 확인하기 위한 GeCKO 라이브러리의 사용을 보여주었다. 다음으로, 흑색종 모델에서, 상기 저자는 유전자의 소실이 돌연변이 단백질 키나제 BRAF를 억제하는 치료제인 베무라페닙(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 그들의 연구는 가장 높은 순위의 후보물질이 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트(hit) NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.
Nishimasu 외는 2.5 A°해상도로 sgRNA 및 그의 표적 DNA와의 복합체에서 스트렙토코커스 피오게네스 Cas9의 결정 구조를 보고하였다. 상기 구조는 그들의 계면에서 양으로 하전된 홈에서 sgRNA:DNA 이형이중가닥을 수용하는 표적 인식 및 뉴클레아제 엽으로 구성된 2 엽 구조를 나타내었다. 인식 엽이 sgRNA 및 DNA 결합에 필수적인 반면, 뉴클레아제 엽은 각각 표적 DNA의 상보적 및 비-상보적 가닥의 절단을 위해 적절하게 위치된 HNH 및 RuvC 뉴클레아제 도메인을 함유한다. 뉴클레아제 엽은 또한 프로토스페이서 인접 모티프(PAM)와의 상호작용을 담당하는 카르복실-말단 도메인을 함유한다. 이러한 고-해상도 구조 및 수반하는 기능 분석은 Cas9에 의한 RNA-안내된 DNA 표적화의 분자 메카니즘을 나타내었고, 이에 따라 새로운 다능성 게놈-편집 기술의 합리적 설계를 용이하게 한다.
Wu 외는 마우스 배아 줄기 세포(mESC)에서 단일 가이드 RNA(sgRNA)가 로딩된 스트렙토코커스 피오게네스 유래의 촉매적 비활성 Cas9(dCas9)의 게놈-와이드 결합 부위를 맵핑하였다. 저자는 4 개의 sgRNA 각각이 NGG 프로토스페이서 인접 모티프(PAM) 및 sgRNA 내의 5-뉴클레오티드 씨드 영역을 종종 특징으로 하는 수십 내지 수천 개의 게놈 부위에 대하여 표적 dCas9를 시험한 것을 보여주었다. 염색질 비접근성은 씨드 서열과 일치하는 다른 부위로의 dCas9 결합을 감소시키고; 따라서 표적외 부위의 70%가 유전자와 회합된다. 상기 저자는 촉매적 활성 Cas9로 트랜스펙션된 mESC 내의 295 개의 dCas9 결합 부위의 표적화된 시퀀싱에 의해, 백그라운드 수준 초과로 돌연변이된 단지 하나의 부위가 확인된 것을 나타내었다. 상기 저자는 씨드 매치가 결합을 촉발하나, 표적 DNA와의 광범위한 쌍형성이 절단에 필요한 Cas9 결합 및 절단을 위한 2-상태 모델을 제안하였다.
Platt 외는 Cre-의존성 Cas9 낙인 마우스를 수립하였다. 저자는 뉴런, 면역 세포, 및 상피 세포에서 가이드 RNA의 아데노-관련 바이러스(AAV)-, 렌티바이러스-, 또는 입자-매개된 전달을 이용하여 생체내 및 생체외 게놈 편집을 증명하였다.
Hsu 외는(2014) 요거트부터 세포의 유전적 스크리닝을 포함하는 게놈 편집까지 CRISPR-Cas9 전력를 일반적으로 논의하는 리뷰 기사이다.
Wang 외는(2014) 게놈-규모 렌티바이러스 단일 가이드 RNA(sgRNA) 라이브러리를 이용하는 양성 및 음성 선택 모두에 적합한 풀화된(pooled) 기능 손실 유전학적 스크리닝 시도에 관한 것이다.
Doench 외는 6 개의 내인성 마우스 및 3 개의 내인성 인간 유전자의 패널의 모든 가능한 표적 부위에 걸쳐 타일링하는(tiling) sgRNA의 풀을 만들고, 항체 염색 및 유세포분석기에 의해 표적 유전자의 널 대립형질을 생산하는 그의 능력을 정량적으로 평가하였다. 저자들은 PAM 개선된 활성의 최적화를 보였으며, sgRNA의 설계를 위한 온라인 도구를 또한 제공하였다.
Swiech 외는 AAV-매개된 SpCas9 게놈 편집이 뇌 내 유전자 기능의 역전 유전적 구조를 가능하게 할 수 있음을 증명하였다.
Konermann 외는(2015) 다수의 이펙터 도메인, 예를 들어 전사 활성화제, 예를 들어 작용적 및 후성유전자적 조절제를 링커 없이 또는 링커와 함께 줄기 또는 테트라루프와 같은 가이드 상에서 적절한 위치에 부착시키는 능력을 논의한다.
Zetsche 외는 Cas9 효소가 둘로 분열될 수 있고, 이에 따라 활성화를 위한 Cas9 조립이 제어될 수 있음을 증명한다.
Chen 외는 마우스들에서 게놈-와이드 생체내 CRISPR-Cas9 스크린은 폐 전이를 조절하는 유전자를 드러냄을 증명함에 의한 다중화 스크리닝에 관한 것이다.
Ran 외는(2015) SaCas9 및 게놈을 편집하는 그의 능력에 관한 것으로, 생화학 분석으로부터 추론할 수 없음을 증명한다. Shalem 외(2015)는 촉매적으로 비활성인 Cas9(dCas9) 융합체가 합성적으로 발현을 억제(CRISPRi) 또는 활성화(CRISPRa)하는 데 사용되는 방법을 기재하였고, 이는, 어레이된 및 모아진 스크린을 포함하는, 게놈-규모 스크린, 게놈 유전자좌를 비활성화시키는 녹아웃 접근 및 전사 활성을 조절하는 전략에 Cas9를 사용하는 진보를 보여준다.
Shalem 외는(2015), 촉매적으로 비활성인 Cas9(dCas9) 융합물이 발현을 합성적으로 저해(CRISPRi) 또는 활성(CRISPRa)하는 데 사용되는 방법을 설명하며, 이는 배열되고 풀화된 스크린을 포함하는, 게놈-규모 스크린을 위해 Cas9를 이용하는 진전, 비활성 게놈 유전자좌를 비활성화하는 녹아웃 시도 및 전사 활성을 조절하는 전략을 보여준다.
Xu 외는(2015) CRISPR-기반 스크린에서 단일 가이드 RNA(sgRNA) 효율에 기여하는 DNA 서열 특징을 평가하였다. 저자들은 CRISPR/Cas9 녹아웃 및 절단 부위에서 뉴클레오티드 선호성을 탐구하였다. 저자들은 또한 CRISPRi/a에 대한 서열 선호성이 CRISPR/Cas9 녹아웃에 대한 선호와 실질적으로 상이함을 발견하였다.
Parnas 외는(2015) 박테리아성 지질다당류(LPS)에 의해 종양 괴사 인자(Tnf)의 유도를 제어하는 유전자를 확인하기 위하여 게놈-와이드 풀화된 CRISPR-Cas9 라이브러리를 수지상 세포(DC) 내로 도입하였다. Tlr4 신호화의 알려진 조절자 및 이전에 알려지지 않은 후보물질들이 확인되었으며, LPS에 대한 정규 반응에 대한 구별된 효과를 갖는 3 개의 작용 모듈로 확인되었다.
Ramanan 외는(2015) 감염된 세포에서 바이러스 에피좀성 DNA(cccDNA)의 절단을 증명하였다. HBV 게놈은 공유결합 폐환형 DNA(cccDNA)로도 명명되는 3.2 kb의 이중-가닥 에피좀 DNA 종으로서 감염된 간세포의 핵에 존재하고, 그의 복제가 현재 치료법에 의해 억제되지 않는 HBV 생애 주기에서 주요 성분이다. HBV의 고도로 보존된 영역을 특이적으로 표적화하는 sgRNA가 바이러스 복제 및 손실 된 cccDNA를 저해함을 보여주었다.
Nishimasu 외는(2015) 5'-TTGAAT-3' PAM 및 5'-TTGGGT-3' PAM을 함유하는 단일 가이드 RNA(sgRNA) 및 그의 이중-가닥 DNA 표적과 함께 복합체화되는 SaCas9의 결정 구조를 보고하였다. SpCas9 와 SaCas9의 구조 비교는 구조적 보존 및 다양성 모두에서 강조표시하였으며, 이는 그들의 구별되는 PAM 특이성 및 오솔로그성 sgRNA 인식을 설명한다.
Zetsche 외(2015)는 추정되는 클래스 2 CRISPR 이펙터인 Cpf1의 특징 확인을 보고하였다. Cpf1이 Cas9와 구별되는 특징을 갖는 견고한 DNA 간섭을 매개함이 입증되었다. 이 간섭 메커니즘의 확인은 CRISPR-Cas 시스템에 대한 이해를 넓히고 게놈 편집 응용을 발전시킨다.
Shmakov 외(2015)는 3 가지 별개의 클래스 2 CRISPR-Cas 시스템의 특징 확인을 보고하였다. 확인된 시스템 중 2 개의 이펙터인 C2c1 및 C2c3은 Cpf1과 멀리 관련된 RuvC 유사 엔도뉴클레아제 도메인을 함유한다. 세 번째 시스템 인 C2c2는 2 개의 예측된 HEPN 알엔아제 도메인을 갖는 이펙터를 함유한다.
Gao 외(2016)는 Cpf1의 표적화 범위를 증가시키기 위해 구조-가이드되는 포화 돌연변이 유발 스크린을 사용하여 보고하였다. Cpf1 변이체는 돌연변이 S542R/K607R 및 S542R/K548V/N552R로 설계 제작 되어, 시험관내 및 인간 세포에서 향상된 활성으로 각각 TYCV/CCCC 및 TATV PAM을 갖는 표적 부위를 절단할 수 있다.
또한, 문헌 ["Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77(2014)]은, 연장된 서열을 인식하고 인간 세포에서 높은 효율을 갖는 내인성 유전자를 편집할 수 있는 이량체성 RNA-가이드된 FokI 뉴클레아제에 관한 것이다.
추가적으로, 제목이 "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS인 PCT 출원 PCT/US14/70057, 대리인 참조 47627.99.2060 및 BI-2013/107(2014년 9월 24일에 출원된 미국 임시 특허 출원 62/054,490, 2014년 6월 10일에 출원된 62/010,441 및 각각 2013년 12월 12일에 출원된 61/915,118, 61/915,215 및 61/915,148 중 하나 이상 또는 모두로부터 우선권 주장)("입자 전달 PCT")이 언급되며, 이는 본 명세서에 참조로서 포함되고, 이는 sgRNA 및 Cas9 단백질 (및 선택적으로 HDR 주형)을 포함하는 혼합물을, 계면활성제, 인지질, 생분해성 중합체, 지질단백질 및 알콜를 포함하거나 이로 본질적으로 구성되거나 이로 구성되는 혼합물과 혼합하는 것을 포함하는, sgRNA-및-Cas9 단백질 함유 입자를 제조하는 방법 및 이러한 공정으로부터의 입자에 관한 것이다. 예를 들어, 여기서 Cas9 단백질 및 sgRNA는 적합한, 예를 들어 3:1 내지 1:3 또는 2:1 내지 1:2 또는 1:1의 몰비로, 적합한 온도에서, 예를 들어 15 내지 30 C, 예를 들어 20 내지 25 C, 예를 들어 실온에서, 적합한 시간동안 예를 들어 15 내지 45, 예를 들어 30 분, 유리하게는 멸균된 뉴클레아제 없는 완충액, 예를 들어, 1X PBS에서 함께 혼합되었다. 별도로, 계면 활성제, 예를 들어 양이온성 지질, 예를 들어 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP); 인지질, 예를 들어 디미리스토일포스파티딜콜린(DMPC); 생분해성 중합체, 예를 들어 에틸렌-글리콜 중합체 또는 PEG, 및 지질단백질, 예를 들어 저-밀도 지질단백질, 예를 들어 콜레스테롤과 같은 또는 이를 포함하는 입자 성분이 알코올, 유리하게는 C1-6 알킬 알콜, 예를 들어 메탄올, 에탄올, 이소프로판올, 예를 들어 100% 에탄올에 용해되었다. 두 용액을 함께 혼합하여 Cas9-sgRNA 복합체를 함유하는 입자를 형성시켰다. 따라서, sgRNA는 입자 내 전체 복합체를 만들기 전에 Cas9 단백질과 미리 복합체화될 수 있다. 제형은 세포 내로의 핵산 전달을 촉진시키는 것으로 알려진 상이한 성분의 상이한 몰 비로 제조될 수 있다(예를 들어, 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP), 1,2-디테트라데카노일-sn-글리세로-3-포스포콜린(DMPC), 폴리에틸렌 글리콜(PEG) 및 콜레스테롤). 예를 들어 DOTAP:DMPC:PEG:콜레스테롤 몰 비는 DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0; 또는 DOTAP 90, DMPC 0, PEG 10, 콜레스테롤 0; 또는 DOTAP 90, DMPC 0, PEG 5, 콜레스테롤 5일 수 있다. DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0. 따라서 그 적용은 sgRNA, Cas9 단백질 및 입자를 형성하는 성분을 혼합하는 것;뿐만 아니라 이러한 혼합으로부터의 입자를 포함한다. 본 발명의 일 양태는 입자를 포함할 수 있고; 예를 들어 입자는 예를 들어, 본 발명에서와 같은 sgRNA 및/또는 Cas9를 포함하는 혼합물 및 예를 들어, 입자 전달 PCT에서와 같은, 입자를 형성하는 성분을 혼합함으로써, 입자 전달 PCT의 그것과 유사한 공정을 사용하여, 이러한 혼합으로부터 입자 및 입자들을 형성한다(또는 물론, 본 발명에서와 같은 sgRNA 및/또는 Cas9를 포함하는 다른 입자).
실시예
실시예 1: Cas13a 패밀리의 특징 확인
출원인은 암피실린 내성 박테리아 분석(도 3a)을 사용하여 PFS 선호도 및 활성(도 57a)에 대해 15 개의 Cas13a 오솔로그를 포괄적으로 평가하였다. 간략하게, Cas13a는 무작위 PFS 뉴클레오티드가 측면에 배치된 β-락타마제 전사물 상의 5' 범위의 서열을 표적화하도록 프로그램한다. Cas13a 절단 활성은 암피실린 선택 하에서 박테리아의 사멸을 초래하고, 그 다음에 PFS 손실은 차세대 시퀀싱에 의해 분석한다. 오솔로그 간의 양적 비교를 가능하게 하기 위해, 출원인은 pJ23119 작은 RNA 프로모터의 발현 하에 있는 근처의 단일-스페이서 CRISPR 어레이와 함께 pLac 프로모터 하에 각각의 Cas13a 오솔로그를 클로닝하였다. 이.콜라이에서 Cas13a 오솔로그 플라스미드 각각과 PFS 플라스미드 라이브러리의 동시 형질전환 후, 출원인은 형질 전환체 계수를 통해 박테리아 생존을 측정하였고 렙토트리키아 와데이(LwaCas13a) 유래 Cas13a 오솔로그가 가장 활성있고 렙토트리키아 샤히 Cas13a(LshCas13a)가 그 뒤를 따른다는 것을 발견하였다(도 3c, 3d). LwaCas13a 및 LshCas13a 스크린으로부터의 PFS 분포에 대한 차세대 시퀀싱 분석으로 대부분의 LwCas13a PFS 서열이 손실되었음을 밝혔으며(도 3g 및 57b, 57c), 이는 강력한 LwCas13a RNA 절단 활성을 시사한다. 실제로, 다양한 임계값에서 손실된 PFS 서열에 대한 모티프 분석은 LshCas13a의 예상 3 'H 모티프를 밝혔지만 LwCas13a에 대해서는 유의미한 PFS 모티프가 없었다(도 3h, 56d, 56e). 핵산 검출을 위한 LwCas13a에 대한 최근 발전에서, 출원인은 LwCas13a가 LshCas13a보다 더 활성있음을 발견했으며, 생화학적 특징 확인에 의해 약한 3'H PFS를 발견하였다. LwCas13a는 시험된 15 개의 Cas13a 오솔로그 중 가장 활성있고 박테리아에서 PFS를 갖지 않는 것으로 밝혀졌다.
실시예 2: 진핵 세포에서의 C2c2 발현
다음의 C2c2 오솔로그는 포유류 세포에서의 발현을 위해 코돈 최적화하였다.
상기 종의 단백질 서열을 하기 표에 나열한다.
mCherry 및 선택적으로 NLS 또는 NES와의 C2c2 오솔로그 각각의 융합 작제물을 제조하고 포유류 발현 벡터(도 1a)에 클로닝하였다. 다양한 C2c2 오솔로그를 HEK293T 세포에 형질감염하였고 세포 국소화는 mCherry 발현에 기반하여 평가하였다. C-말단 및 N-말단 NES에 융합될 때, C-말단 및 N-말단 NLS에 융합될 때, 또는 NES 또는 NLS 융합이 없을 때 상이한 C2c2 오솔로그의 대표적인 국소화를 도 1b,c, 및 d에 각각 나타내었다. NES 융합은 효율적으로 C2c2 단백질의 세포질 국소화를 초래하였다. NLS 융합은 효율적으로 C2c2 단백질의 핵 국소화를 초래하였다. 가변적으로, 인 국소화 또한 NLS 융합으로 관찰될 수 있다. C2c2가 NLS 또는 NES에 융합되지 않았을 때, 가변적인 세포질/핵 국소화가 관찰되었다.
실시예 3: 진핵세포에서의 C2c2(Cas13a)의 활성
루시페라제 표적화 분석은 Gluc에 대해 안내되는 상이한 gRNA를 사용하여 도 2에 나타난 바와 같이 수행하였다. C2c2 오솔로그 렙토트리키아 와데이 F0279(Lw2) 및 리스테리아 뉴요켄시스(리스테리아 뉴요켄시스) FSL M6-0635(LbFSL)는 NLS 또는 NES에 융합하였거나 대안적으로 국소화 신호에 융합하지 않았다. 루시페라제의 정규화된 단백질 발현을 결정하고 비 표적화(NT) gRNA와 비교하였다. 결과는 도 4에 나타내었다. 효율적인 녹다운이 명백하였다. 도 4a 및 도 4b에 기술된 실험에서 사용된 스페이서 서열은 다음과 같다:
도 4a
가이드 1 ATCAGGGCAAACAGAACTTTGACTCCca
가이드 2 AGATCCGTGGTCGCGAAGTTGCTGGCCA
가이드 3 TCGCCTTCGTAGGTGTGGCAGCGTCCTG
가이드 NT tagattgctgttctaccaagtaatccat
도 4b
가이드 1 TCGCCTTCGTAGGTGTGGCAGCGTCCTG
가이드 NT tagattgctgttctaccaagtaatccat
GFP 발현에 기반한 표적화 분석은 EGFP에 대해 안내되는 상이한 gRNA를 사용하여 도 2c에 나타난 바와 같이 수행하였다. C2c2 오솔로그 렙토트리키아 와데이 F0279(Lw2) 및 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)는NLS 또는 NES에 융합하였거나 대안적으로 국소화 신호에 융합하지 않았다. GFP의 정규화된 발현을 결정하고 비 표적화(NT) gRNA와 비교하였다. 결과는 도 5에 나타내었다. 효율적인 녹다운이 명백하였다. 도 5a 및 도 5b에 기술된 실험에서 사용된 스페이서 서열은 다음과 같다:
도 5a
가이드 1 tgaacagctcctcgcccttgctcaccat
가이드 2 tcagcttgccgtaggtggcatcgccctc
가이드 3 gggtagcggctgaagcactgcacgccgt
가이드 4 ggtcttgtagttgccgtcgtccttgaag
가이드 5 tactccagcttgtgccccaggatgttgc
가이드 6 cacgctgccgtcctcgatgttgtggcgg
가이드 7 tctttgctcagggcggactgggtgctca
가이드 8 gacttgtacagctcgtccatgccgagag
가이드 NT tagattgctgttctaccaagtaatccat
도 5b
가이드 2 tcagcttgccgtaggtggcatcgccctc
가이드 3 gggtagcggctgaagcactgcacgccgt
가이드 4 ggtcttgtagttgccgtcgtccttgaag
가이드 5 tactccagcttgtgccccaggatgttgc
가이드 6 cacgctgccgtcctcgatgttgtggcgg
가이드 7 tctttgctcagggcggactgggtgctca
가이드 8 gacttgtacagctcgtccatgccgagag
가이드 NT tagattgctgttctaccaagtaatccat
표적화 분석은 내인성 표적 유전자에 대해 안내되는 gRNA를 사용하여 HEK293 세포에서 상이한 내인성 표적 유전자에 대해 수행하였다. C2c2 렙토트리키아 와데이F0279(Lw2)를 NES에 융합하였다. 각각의 표적 유전자의 정규화된 단백질 발현을 결정하였다(비 표적화(NT) gRNA와 비교). 결과는 도 7에 나타내었다. 효율적인 녹다운이 명백하였다. 도 7에 기술된 실험에서 사용된 스페이서 서열은 다음과 같다:
도 7
CTNNB1 ctgctgccacagaccgagaggcttaaaa
PPIB tccttgattacacgatggaatttgctgt
mAPK14 tcaaggtggggtcacaggagaagccaaa
CXCR4 atgataatgcaatagcaggacaggatga
TINCR gcgtgagccaccgcgcctggccggctgt
PCAT1 ccagctgcagatgctgcagtttttggcg
CAPN1 ctggaaatggaagatgccggcatagcca
LETMD1 gatgacacctcacacggaccacccctag
MAPK14 taatactgctccagatatgggtgggcca
RB1 catgaagaccgagttatagaatactata
TP53 ggtgaaatattctccatccagtggtttc
KRAS aatttctcgaactaatgtatagaaggca
실시예 4: 번역 활성화제/프로모터에 융합된 촉매적으로 비활성인 C2c2를 이용한 진핵 세포에서의 번역 상향조절
촉매적으로 비활성인 C2c2 오솔로그 렙토트리키아 와데이 F0279(Lw) 및 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)를 생성하였다.
Lw C2c2를 NES에 또는 국소화 신호없이 및 선택적으로 EIF4E에 융합하였다.
LbFSL을 NLS 및 선택적으로 EIF4E에 융합하였다.
Gluc를 표적화하였다(도 2 참조).
상대 단백질 발현은 EIF4E를 갖거나 갖지 않는 C2c2로 표적화하는 것 간의 비교에 기반하여 평가하였다.
결과를 도 10에 나타내었다.
효율적인 번역 상향조절이 명백하였다. 도 10에 기술된 실험에서 사용된 스페이서 서열은 tagattgctgttctaccaagtaatccat이고, 표적은 이 스페이서에 대한 3x 결합 부위를 갖는다.
실시예 5: NaASO 2 처리시 C2c2 및 이의 표적 베타-액틴의 동시-국소화
소듐 아르세나이트(NaAsO2)의 영향 하에 베타-액틴을 표적화하는 C2c2의 국소화를 조사하였다. 렙토트리키아 와데이 C2c2의 mCherry 및 NES와의 융합 작제물을 제조하고 베타-액틴 표적화 가이드 또는 비-표적화 가이드와 함께 포유류 발현 벡터에 클로닝하였다. C2c2의 세포 국소화는 mCherry 발현에 기반하여 평가하였고, 스트레스 과립은 G3BP1-GFP로 표지하였다. 베타 액틴을 표적화하는 Lw C2c2는 NaAsO2 처리시 스트레스 과립으로 국소화하는 것으로 밝혀졌다(도 11a). 이 국소화는 베타-액팅 표적화 가이드에서만 보였고 비-표적화 가이드에서는 아니었으므로 가이드-의존적이었다(도 11b,c).
실시예 6: 녹다운 활성을 촉진하기 위해 대안적 crRNA 프로모터를 사용함
간섭 효과를 추가로 증가시키기 위해, crRNA를 U6 프로모터 제어 하에 두었다.
C2c2에 의한 간섭 효율을 향상시킬 목적으로, tRNA-crRNA 및 U6로 구동되는 crRNA 및 shRNA를 사용하여 표적화된 유전자의 발현을 비교하였다. 신뢰성있는 표적 유전자의 녹다운이 shRNA와 비슷한 효율로 관찰되었다(도 12, 도 14). 추가의 실험은 crRNA 형질감염 양의 증가(도 13), 단백질 형질전환 양의 증가(도 15)의 효과 및 DR-스페이서-DR-스페이서 작제물의 효과를 결정하기 위해 수행하였다(도 16). C2c2는 내인성 유전자 상의 상응하는 표적에 대해 최적화된 shRNA를 능가하는 것으로 밝혀졌다.
실시예 7: C2c2와의 융합 작제물
도 18에서 입증된 바와 같이, dLw2C2c2-EIF4E 융합은 3 가지 유전자의 번역을 상향 조절할 수 있다; 웨스턴 블롯에서 밴드 강도로 측정되는 단백질 수준.
실시예 8: 표적 유도된 비-특이적 알엔아제 활성
C2c2 표적 유도된 비-특이적 알엔아제 활성은 표본에서 RNA 종을 검출하는 데 유용하다. 관심 RNA 표적이 존재하면, 부수적 표적에 대한 비-특이적 알엔아제 활성은 가이드-의존적 C2c2 뉴클레아제 활성을 동반한다. 예를 들어, 형광 모이어티 및 형광 소광제를 포함하는 리포터 RNA는 활성화된 C2c2에 의해 비-특이적으로 절단된다. RNA 기질은 한쪽 끝에 형광 리포터 분자(플루오르)로 다른 쪽에 소광제로 표시한다. C2c2 알엔아제 활성이 부재하면, 소광제의 물리적 근접성은 플루오르로부터의 형광을 낮은 수준으로 약화시킨다. C2c2 표적 특이적 절단이 활성화될 때, RNA 기질은 비-특이적으로 절단되고 플루오르 및 소광제는 공간적으로 분리된다. 이것은 적절한 파장 길이의 빛에 의해 여기될 때 플루오르로 하여금 신호를 방출하게 한다. 이러한 분석의 개략도가 도 24a에 나타난다.
실시예 9: Lw2C2c2(LwaCas13a)의 생화학적 특징 확인
방법론은 본질적으로 문헌[Abudayyeh et al. (2016) "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector"; Science 353(6299), DOI: 10.1126/science.aaf5573]에 기재된 바와 같고; 본 명세서에 참고로서 포함된다.
박테리아 세포에서의 LwaCas13a의 원하는 절단 활성 때문에, 출원인은 포유류 세포에서의 시험 전에 이의 절단을 더 잘 이해하기 위해 추가의 생화학적 특징 확인을 탐구하였다. LshCas13a 및 LwaCas13a 둘 모두를 사용한 시험관내 절단 반응은 LshCas13a보다 LwaCas13a 효율의 생체내 증가를 확인하는 것뿐만 아니라 28 nt 스페이서를 인코딩하는 가이드를 사용하는 프로그래밍 가능한 표적 절단 및 Mg2+에 대한 필요(도 3i)를 입증하였다. 단일 가닥 RNA 표적(ssRNA 1)의 LwaCas13a 및 가이드와의 인큐베이션은 30 분의 인큐베이션 후 거의 완전한 절단으로 2 분 내에 검출 가능한 절단을 나타낸 반면, 가이드 없는 LwaCas13a에는 관찰 가능한 절단이 없었고(도 37), 절단은 LwaC2c2-가이드 복합체 수준으로 용량 의존적이었다(도 36). 스테레오타입의 절단 생산물의 외관을 고려하여 출원인은 LshCas13a 절단 패턴이 LshCas13a와 유사하게, 표적-의존적이라는 가설을 세웠다(Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)). 다양한 인실리코-예측된 2차 구조(도 42)를 갖는 다수의 RNA 표적과의 인큐베이션은 실질적으로 상이한 절단 패턴을 나타내었다(도 42). LwaCas13a 절단이 표적 상의 노출된 단일 가닥 부위에서의 염기 동일성에 의존하는지 여부를 결정하기 위해, 출원인은 표적 상 LwaCas13a(변형된 ssRNA 표적 4)를 루프 상의 호모폴리머 치환과 인큐베이션하였다(도 43). 출원인은 C 또는 U 치환에서 표적에 대해 더 강한 절단을 발견하였으며(도 43), 이는 LwaCas13a가 U 잔기에서 우선적으로 절단하는 LshCas13a보다 기질 유연성이 더 많음을 나타낸다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 표적 알엔아제 활성에 더하여, Cas13 패밀리는 엘.와디에 유래의 자체 상응하는 pre-crRNA 전사물을 처리하는 것으로 보고되었다(도 43c)(문헌[East-Seletsky, A. et al. Two district RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection, Nature 538, 270-273 (2016)]). 출원인은 또한 스페이서 또는 직접 반복(DR) 서열을 절단함으로써 LwaCas13a 절단에 대한 가이드 제한을 탐구하였다. 출원인은 LwaCas13a가 20 nt만큼 짧은 스페이서 길이로 시험관내 절단 활성을 유지하고(도 41), 27 nt만큼 짧은 DR 절단으로 절단할 수 있으며(도 40), 하나의 DR 길이 절단(32 nt)이 활성을 제거하는 것으로 보일지라도 아마도 2차 구조 변동에 기인함을 발견하였다. 20 nt 미만의 가이드 길이는 더 이상 촉매 활성을 나타내지 않지만, LwaCas13-가이드 복합체는 여전히 결합 활성을 유지할 수 있어 단일 촉매 효소와의 직교 적용이 가능하게 한다(문헌[Dahlman, J. E. et al. Orthogonal gene knockout and activation with a catalytically active Cas9 nuclease. Nat Biotechnol 33, 1159-1161, doi:10.1038/nbt.3390 (2015)]).
Cas13 패밀리는 Cpf1과 유사한 방식으로(문헌[Fonfara, I., Richter, H., Bratovic, M., Le Rhun, A. & Charpentier, E. The CRISPR-associated DNA-cleaving enzyme Cpf1 also processes precursor CRISPR RNA. Nature 532, 517-521, doi:10.1038/nature17945 (2016)]; 문헌[Zetsche, B. et al. Multiplex gene editing by CRISPR-Cpf1 using a single guide array. Nat Biotechnol 35, 31-34, doi:10.1038/nbt.3737 (2017)]), 전장 CRISPR 전사물의 처리를 위한 이중 알엔아제 활성을 갖는 것으로 밝혀졌다(문헌[East-Seletsky, A. et al. Two distinct RNase activities of CRISPR-C2c2 enable guide processing and RNA detection. Nature 538, 270-273, doi:10.1038/nature19802 (2016)]). 출원인은 LwaCas13a가 엘.와데이 유래의 상응하는 CRISPR 스페이서 전사물을 절단할 수 있고(도 3j),이 절단은 농도 의존적임(도 15b)을 밝혀냈다. 또한, LwaCas13a는 겔 전기영동에 의해 분리된 RNA 생산물(도 24c)에 부수적 활성을 나타내어(도 24b), 소광된 형광단 절단에 의해 부수적 활성에 대한 이전의 특징을 확인하였다(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)]).
렙토트리키아 와데이 F0279(Lwa2) C2c2는 절단 동역학(도 36 내지 37), 양이온의 존재에 대한 절단 활성의 의존성(도 38), PFS 선호(도 39), 직접 반복 길이의 효과(도 40), 스페이서 길이의 효과(도 41), 표적 RNA 서열 및 2차 구조의 효과(도 42) 및 뉴클레오티드 컷 선호(도 43)를 평가하기 위한 시험관내 분석에서 사용하였다.
실시예 10: LwaCas13a는 리포터 mRNA를 녹다운하기 위해 재프로그래밍될 수 있다.
LwaCas13a의 강력한 RNA 절단 활성 및 유연한 서열 선호를 고려할 때, 출원인은 포유류 세포에서 전사물을 절단하는 능력을 평가하기로 결정하였다. 출원인은 먼저 포유류 코돈 최적화된 LwaCas13a를 C- 또는 N-말단 상의 msfGFP 융합 및 이중 인접 핵 방출 서열(NES) 또는 핵 국소화 서열(NLS) 중 하나와 함께 포유류 발현 벡터로 클로닝하고 발현 및 국소화를 평가하였다(도 1d). 출원인은 msfGFP-융합된 LwaCas13a 작제물이 잘 발현되고 국소화 서열에 따라 세포질 또는 핵으로 효과적으로 국소화됨을 밝혔다. LwaCas13a의 생체내 절단 활성을 평가하기 위해 출원인은 가우시아(Gaussia) 루시페라제(Gluc) 및 사이프리디니아(Cypridinia) 루시페라제(Cluc) 모두를 동일 벡터 상의 상이한 프로모터 하에서 발현하는, 이중 루시페라제 리포터 시스템을 개발하여, 하나의 전사물이 Cas13a 표적으로 역할하고 다른 것은 용량 대조군으로 역할하도록 하였다(도 2a). 그 후 출원인은 Gluc에 대한 가이드를 설계하고 tRNAVal-프로모터-발현 가이드 벡터로 이들을 클로닝하였다. 출원인은 LwaCas13a 발현 벡터, 가이드 벡터, 및 이중-루시페라제 작제물을 HEK293FT로 형질감염시키고 형질감염 48 시간 후에 루시페라제 활성을 측정하였다. 출원인은 핵-국소화된 LwaCas13a-msfGFP가 위치 매치된 shRNA 대조군에 유사하게(가이드 1의 경우 78.3%, 가이드 2의 경우 51.1%), 가장 높은 수준의 녹다운을 초래했으며(가이드 1의 경우 75.7%, 가이드 2의 경우 72.9%)(도 6b), 이는 표적 영역에서의 접근 가능성 및 서열을 제어한다. LwaCas13a-msfGFP-NLS 작제물의 우수한 절단 때문에, 출원인은 모든 추가의 녹다운 실험에 이 설계를 사용하였다. 핵 국소화된 LwaCas13a-msfGFP는 또한, 아마도 msfGFP에 의해 제공되는 향상된 안정성으로 인해, mCherry 융합 버전보다 더 좋은 성능을 나타냈다. 설계 제작된 융합에 의해 LwaCas13a 활성을 조작하는 능력은 Cas13a 도구의 유연성을 강조한다. LwaCas13a는 또한 A375 흑색종 세포주에서 녹다운할 수 있어(도 6a, 도 9), Cas13의 다목적성을 입증한다. 출원인은 또한 LwaCas13a가 28 nt의 스페이서 길이로 최상의 Gluc 녹다운을 생산함(73.8%)(도 6c) 및 녹다운은 단백질 및 가이드 또는 crRNA 형질감염된 벡터 양 모두에 용량-반응적임(도 56a,b)을 밝혔다. 가이드 발현은 프로모터 선택에 민감하지 않으며, tRNAVal 또는 U6 프로모터로부터 발현된 가이드 또는 crRNA는 유사한 수준의 Gluc 녹다운을 초래한다(tRNAval의 경우 66.3%, U6의 경우 74.5%)을 초래한다(도 56c).
출원인은 다음으로 3 가지 내인성 유전자인 KRAS, CXCR4 및 PPIB에 대한 녹다운을 시험하였고, 다양한 수준의 녹다운을 밝혔고, 3 가지 유전자 중 2 가지에 대해, LwaCas13a 녹다운(PPIB의 경우 40.4%, CXCR4의 경우 83.9%, KRAS의 경우 57.5%)은 위치 매치된 shRNA를 사용한 RNAi(PPIB의 경우 63.0%, CXCR4의 경우 73.9%, KRAS의 경우 44.3%)와 유사하였다(도 3o). 출원인은 또한 내인성 유전자 녹다운이 tRNAVal 또는 U6 프로모터로부터 발현된 가이드에 대해 유사한 수준의 녹다운으로(tRNAVal에 대해서 86.7%, U6에 대해서 77.6%), 가이드 프로모터 선택에 유연하다는 것을 밝혔다(도 56d). 출원인은 또한 LwaCas13a가 A375 흑색종 세포주에서 녹다운할 수 있음을 밝혔다(도 56e). LwaCas13a 녹다운의 다목적성을 확장하기 위해, 출원인은 벼(Oryza sativa) 유전자 EPSPS, HCT 및 PDS에 대한 전사물에 대한 가이드를 설계하고 LwaCas13a 및 가이드 벡터를 오.사티바 원형질체로 동시 형질감염시켰다(도 3p). 형질감염 후, 출원인은 시험된 3 가지 유전자 모두 및 9 개의 가이드 중 7 개에 대해 50% 초과의 녹다운을 관찰하였고 최고 녹다운은 78.0%였다(도 3q). 함께, 이들 결과는 LwaCas13a가 RNAi와 유사한 수준의 RNA 녹다운을 매개할 수 있음을 시사한다. Cas13 패밀리의 추가적인 구성원에 대한 추가 탐구는 더욱 강력한 녹다운 효과를 달성할 수 있는 단백질을 밝힐 수 있다.
실시예 11: 리포터 및 내인성 전사물에 대한 LwaCas13a 녹다운 스크리닝
LwaCas13a 녹다운의 효율에 대한 RNA 맥락 의존성을 포괄적으로 특징 확인하기 위해, 출원인은 Gluc, KRAS, PPIB 또는 Cluc 전사물의 길이를 따라 가이드를 타일링하기 위한 LwaCas13a의 프로그래밍 가능성을 이용하였다(도 32a). Gluc 및 Cluc 스크린은 60%보다 높은 녹다운을 갖는 가이드를 나타냈고(도 32), Gluc 표적화 가이드 중 대부분은 최대 83%까지의 녹다운으로 50%보다 많은 녹다운을 가졌다. LwaCas13a 녹다운을 RNAi와 비교하기 위해, 출원인은 Gluc 및 Cluc에 대한 상위 3 개 성능 가이드를 선택하고 그들을 위치 매치된 shRNA와 비교하였다. 출원인은 상위 6 개 성능 가이드 중 5 개가 그들의 매치된 shRNA보다 유의미하게 더 높은 수준의 녹다운(p < 0.05)을 달성함을 밝혔다(도 32d).
리포터 유전자에 대한 강력한 녹다운을 입증하여, 출원인은 다음으로 Cas13a가 KRAS 및 PPIB 2 가지 유전자의 타일링을 통해 내인성 전사물을 표적화하도록 설계 제작될 수 있는지 여부를 탐구하였다. 출원인은 녹다운 효율이 전사물 의존적인 반면, 출원인이 KRAS 및 PPIB에 대해 각각 85% 및 75%의 최대 녹다운으로 각 표적에 대해 50% 녹다운을 달성할 수 있는 가이드를 여전히 찾을 수 있음을 밝혔다(도 49a,b). 출원인은 또한 내인성 유전자 녹다운이 tRNAVal 또는 U6 프로모터로부터 발현된 crRNA에 대해 유사한 수준의 녹다운으로, 가이드 발현 설계에 유연함을 밝혔다(도 56d).
LwaCas13 녹다운 대 RNAi 효율을 더 이해하기 위해, 출원인은 동일한 표적 영역에 위치 매치된 shRNA 작제물에 다양한 가이드를 비교하였다. 출원인은 내인성 타일링 스크린(KRAS 및 PPIB) 각각으로부터 상위 3 개의 가이드를 선택하고 shRNA 녹다운(61.8% 내지 95.2%)에 의해 달성된 수준에 동등한 Cas13a를 이용한 강력한 녹다운(53.7% 내지 88.8%)을 관찰하였고, 6 개 가이드 중 2 개에 대해서는 shRNA이 더 좋았고(p<0.01) 6 개 가이드 중 2 개에 대해서는 Cas13a가 더 좋았다(p<0.01)(도 49h).
실시예 12: LwaCas13a 녹다운은 표적 전사물 내의 접근 가능한 부위에서 최적임
출원인은 LshCas13a 활성이 이.콜라이에서 표적 접근 가능성에 의해 좌우됨을 발견했기 때문에(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]), 출원인은 가이드 타일링 스크린에서 표적화된 4 개의 전사물을 따라 접근 가능성의 영역에 위치하는 가이드에 대해 LwaCas13a 활성이 증가했는지 여부를 조사하기로 결정하였다. 출원인은 먼저 가장 효과적인 가이드가 정의된 영역으로 클러스터를 이루는 것처럼 보임을 발견했고(도 58a) 효과적인 가이드 사이의 쌍 거리를 귀무 분포와 비교함으로써 출원인은 4 개 전사물 모두에 대해 관찰된 가이드가 우연에 의해 예상되는 것보다 유의미하게 더 서로 가깝다는 것을 밝혔다(도 58a). 이들 초기 클러스터링 결과는 접근 가능성의 영역이 더 나은 LwaCas13a 절단 활성을 위해 강화될 수 있음을 시사한다.
전사물 접근 가능성이 LwaCas13a 활성에 영향을 주는지 확인하기 위해, 출원인은 전사물 각각에 걸친 모든 표적 영역의 접근 가능성을 컴퓨터로 예측하고, 이들 컴퓨터 예측이 부분적으로는 녹다운 효율과 상관관계가 있음을 밝혔다(도 58b 내지 58d). 4 개의 표적화된 전사물에 걸쳐, 예측된 표적 접근 가능성은 표적화 효능에서의 변동(녹다운에 있어서 4.4% 내지 16%의 변동)의 일부를 설명할 수 있으며, 이는 접근 가능성이 녹다운 효율의 결정 요인인 반면 염기 동일성, 서열 특성 및 RNA에의 단백질 결합과 같은 다른 인자 또한 표적화 효능에 중요한 역할을 할 수 있음을 나타낸다. 미래에 더욱 광범위한 스크리닝으로 이들 메커니즘을 보다 명확하게 설명할 수 있을 가능성이 있을 것이다.
실시예 13: 내인성 전사물에 대한 LwaCas13a 녹다운 및 RNAi의 비교
LwaCas13 녹다운 대 RNAi 효율을 더 이해하기 위해, 출원인은 동일한 표적 영역에 매치된 shRNA 작제물에 다양한 가이드를 비교하였다. 출원인은 먼저 내인성 타일링 스크린(KRAS 및 PPIB) 각각으로부터 상위 3 개의 가이드를 선택하고, 거의 모든 가이드에 대해 shRNA에 동등한 녹다운으로 Cas13a를 이용한 강력한 녹다운을 관찰하였다(도 49c). shRNA와 추가로 비교하기 위해 출원인은 또한 KRAS, PPIB 및 CXCR4에 대해 RNAx 알고리즘에 의해 예측된 접근 가능성 영역에서의 Cas13a crRNA를 설계했으며 shRNA에 유사한 수준의 녹다운을 발견하였다(도 48d).
실시예 14: MALAT1 IncRNA에 대한LwaCas13a 녹다운 스크리닝
LwaCas13a는 세포 국소화를 위해 설계 제작될 수 있기 때문에, RNA 녹다운을 위해 표적화될 수 있는 세포의 구획에 대하여 다목적성을 갖는다. 출원인은 핵 국소화된 전체 lncRNA MALAT1 전사물에 걸쳐 고르게 타일링된 93 개의 가이드를 설계하고 이들 가이드를 핵 국소화된 LwaCas13a로 형질 감염시켰다. 출원인은 하나의 실험에서 약 40% 내지 50%의 녹다운 만큼까지로, 다양한 수준의 녹다운을 발견하였다(도 49e). 검출 가능한 녹다운을 나타내지 않았던(p > 0.05) 위치 매치된 shRNA와 비교하여, Cas13a는 유의미하게 더 높은 수준의 녹다운(39.0 내지 66.5%, p < 0.05)을 달성하였다(도 49j). 출원인은 또한 lncRNA XIST 전사물을 타일링하여 모든 가이드에 걸쳐 평균 22.0% 및 최대 83.9%의 녹다운을 발견하였다(도 56f).
실시예 15: 내인성 전사물에 대한 다중화된 녹다운
Cpf1과 같은, CRISPR 어레이 처리 활성을 갖는 다른 CRISPR 이펙터는 하나의 프로모터 하에서 다수의 가이드를 발현함으로써 다중화된 유전자 편집을 위해 영향받았다(Zetsche, B. et al. Multiplex gene editing by CRISPR-Cpf1 using a single guide array. Nat Biotechnol 35, 31-34, doi:10.1038/nbt.3737 (2017)). LwaCas13a는 자체 어레이를 처리할 수 있기 때문에 출원인은 단일 프로모터 하에서 발현되는 CRISPR 어레이로서 LwaCas13a 가이드의 다중화된 전달을 시험하기로 결정하였다. 출원인은 내인성 PPIB, CXCR4, KRAS, TINCR, 및 PCAT 전사물에 대해 5 개의 상이한 가이드를 설계하였고, U6 프로모터의 발현 하의, 처리되지 않은 DR 및 절단된 스페이서에 해당하는, 36 nt 직접 반복(DR)이 측면에 배치된 28 nt 가이드를 갖는 CRISPR 어레이로서 표적화 시스템을 전달하였다. 이 접근으로, 출원인은 단일 또는 집단의 가이드 대조군에 유사한, 각각의 유전자에 대한 녹다운 수준을 발견 하였다(도 49f).
표적외 LwaCas13a 활성이 CRISPR 어레이에 의해 표적화된 5 개 전사물의 비-특이적 녹다운을 일으킬 수 있다는 우려 때문에, 출원인은 PPIB, CXCR4 및 KRAS에 대한 3 개 가이드 및 3 개의 가이드 중 각각의 하나가 비-표적화 가이드로 대체된 3 가지 변이체의 다중화된 전달로 실험을 설계하였다. 출원인은 가이드가 어레이에 부재한 각각의 경우에, 누락된 가이드에 의해 표적화된 전사물의 유의미한 녹다운이 없었으며 오직 표적화된 전사물만 LwaCas13a에 의해 녹다운되었음을 밝혔고, 이는 녹다운이 전사물의 비특이적 분해에 기인한 것이 아니고 사실은 LwaCas13a에 의한 특이적, 다중화된 녹다운에 기인한 것임을 입증한다(도 49g).
실시예 16: LwaCas13a 녹다운은 미스매치에 민감함
특이성은 핵산 표적화 도구에 대한 중요 우려이고, RNAi 및 Cas9 DNA-표적화 시스템 모두의 특이성(문헌[Mali, P. et al. CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol 31, 833-838, doi:10.1038/nbt.2675 (2013)]; 문헌[Fu, Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826, doi:10.1038/nbt.2623 (2013)]; 문헌[Pattanayak, V. et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity. Nat Biotechnol 31, 839-843, doi:10.1038/nbt.2673 (2013)]; 문헌[Hsu, P. D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-832, doi:10.1038/nbt.2647 (2013)]; 문헌[Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nat Biotechnol 34, 184-191, doi:10.1038/nbt.3437 (2016)])은 광범위하게 특징 확인되었다. LshCas13a의 초기 특징 확인은 시험관내에서 겨우 2 개의 미스 매치에도 민감할 수 있음을 보여주었고(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]), 부수적 효과를 통한 LwaCas13a의 특이성 프로파일링(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)])은 식별이, 가이드:표적 듀플렉스의 씨드 영역에서는 단일-뉴클레오티드 해상도이면서, 2 개 뉴클레오티드 해상도에서 달성될 수 있음을 밝혔다. 생체내에서 Cas13a의 특이성을 조사하기 위해, 출원인은 Gluc(도 29a) 또는 내인성 유전자 CXCR4, KRAS 및 PPIB(도 29b, 도 59a 내지 59b)를 표적화하는 가이드에 미스 매치를 도입하였다. 출원인은 Cas13a 특이성에 대한 이전의 시험관내 특징 확인과 일치하여, 모든 전사물에 대해, 가이드:표적 듀플렉스의 중심 영역이 단일 미스매치에 가장 민감함을 밝혔다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 씨드 영역에서는 녹다운이 감소된 반면, 출원인은 단일 미스매치가 Gluc와 같은 일부 표적 상의 실질적인 수준의 특이성에 충분하지 않음을 밝혔다. Gluc에 대한 스페이서에 대한 연속적인 2 개 미스매치의 타일링은(도 29a) 2 개 미스매치가 8 배까지의 활성 감소를 초래하였음을 밝혔고, 이는 특이적 생체내 표적화 도구로서의 Cas13a의 장래성을 나타낸다. 출원인은 또한 비-연속적인 2 개 미스매치의 효과를 조사하여 대부분의 2 개 미스매치가, 가이드 서열의 5' 또는 3' 말단에 위치하는 2 개 미스매치를 제외하고는, 80.4%에서 60% 미만으로 녹다운을 감소시킴을 밝혔다(도 59c).
시험관내 다중 특이성 파라미터에 걸쳐 Cas13a의 추가 특징 확인을 위해, 출원인은 직접적 Cas13a 활성에 대한 대용물로서 부수적 활성의 검출(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)])을 사용하였다. 더 짧은 스페이서 길이에 의해 특이성이 증가할 수 있음을 나타낸 Cas9 실험 결과를 고려할 때(문헌[Fu, Y., Sander, J. D., Reyon, D., Cascio, V. M. & Joung, J. K. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs. Nat Biotechnol 32, 279-284, doi:10.1038/nbt.2808 (2014)]), 출원인은 스페이서 길이가 단일 미스매치에 의해 상이한 2 개의 표적에 대한 Cas13a 특이성에 영향을 미쳤는지 여부가 궁금하였다. 출원인은 더 짧은 스페이서는 감소된 활성을 갖는 반면(도 59d), 생체내 LwaCas13a 결과로부터 기대되는 바와 같이, 더 짧은 스페이서는 또한 단일 염기-미스매치 구별을 개선함을 밝혔다(도 59d, 59e). 출원인은 이 접근이 LwaCas13a를 이용한 시험관내 단일-미스매치 구별에 성공적으로 사용되었기 때문에(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)]), 다음으로 스페이서 서열에서의 추가적인 합성 미스매치를 설계함으로써 특이성이 개선될 수 있는지 여부를 탐구하였다. 출원인은, 전장 스페이서(도 59f, 59g)와 비교하여, 23 nt(59h, 59i) 또는 20 nt(도 59j, 59k)로 절단된 스페이서는 전체 활성은 더 적지만 실질적으로 증가된 특이성을 가짐을 밝혔다. 종합하면, LwaCas13a의 시험관내 및 생체내 설계 제작은 특이적 녹다운 도구로서 이의 사용에 대한 장래성을 나타낸다. 단일-염기 특이성을 부여하기 위해 가이드를 설계 제작하는 능력은 LwaCas13a에 의한 대립 유전자-특이적 전사물 녹다운을 용이하게 할 것이다.
실시예 17: LwaCas13a를 이용한 전사물 녹다운은 매우 특이적임
LwaCas13a 녹다운의 표적외 효과가 있는지 여부를 포괄적으로 이해하기 위해, 출원인은 트랜스크립톰-전체에 걸친 mRNA 시퀀싱을 수행하였다. 출원인은 LwaCas13a 또는 위치 매치된 shRNA 작제물로 Gluc 전사물을 표적화하고, 표적 전사물의 유의미한 녹다운을 발견하였다(도 29b-a). KRAS 및 PPIB의 2 가지 내인성 유전자 상에서의 동일한 비교에 대해서도 유사한 결과가 발견되었다(도 29b-b, 29b-c). shRNA 조건은 LwaCas13a 조건보다 표적화 및 비-표적화 대조군 간에 더 많은 트랜스크립톰-전체에 걸친 변이 및 약한 상관관계를 가졌으며, 이는 shRNA 표적화 실험에서의 더 많은 표적외를 시사한다. 출원인은 차등 발현 분석에 의해 유의미한 표적외 수를 추가로 특징 확인하고 shRNA 조건 각각에서 수백 개의 표적외를 발견하였으나, 표적 전사물의 유사한 수준의 녹다운에도 불구하고(Gluc, KRAS, 및 PPIB 각각에 대하여, shRNA에서는 30.5%, 43.5%, 및 64.7%, Cas13a에서는 62.6%, 27.1%, 및 29.2%)(도 30b), LwaCas13a 조건에서는 표적외를 0 개 발견하였다(도 30a). 출원인은 Gluc 표적화 RNA-seq 비교에 대한 추가적인 분석을 수행하였고, shRNA 조건에서의 가변성의 주된 출처가 개별 반복실험에서의 표적화 및 비-표적화 조건 간의 차이에 기인함을 밝혔다(평균 켄달 타우=0.917)(도 60c 내지 60e). 동일한 조건의 개별 반복실험을 비교할 때 훨씬 높은 상관 관계 및 더 적은 가변성이 있었으며(평균 켄달 타우=0.941), 이는 관찰된 변이가 주어진 shRNA 작제물의 일관된 표적외 효과로부터 나온 것임을 나타낸다. 이 분석을 3 가지 유전자에 대해 분석된 모든 RNA-seq 라이브러리에 걸쳐 적용하면, 모든 LwaCas13a 조건은 전사물 분포의 좁은 다양성으로 인해 상이한 가이드 서열에도 불구하고 서로 높은 상관 관계를 갖는다. 대조적으로, shRNA 조건 각각에 대한 3 가지 반복실험 세트는 각각의 상이한 shRNA 서열에 대한 표적외 변이 양으로 인해 shRNA 조건들 사이보다 세트 내 상관 관계가 더 높다(도 61a, 61b). 또한, 각각의 가이드 조건에 대한 표준 편차의 분포를 3 개의 전사물에 걸쳐 각각의 shRNA 조건에 비교할 때, shRNA 조건에서 유의미하게 더 많은 변이가 관찰된다(p<10-192, 양측 K-S 테스트)(도 61c).
실시예 18: LwaCas13a는 포유류 세포에서 관찰할 수 있는 부수적 활성을 나타내지 않음
Cas13a의 부수적 활성은 시험관내에서 생화학적으로 직접적으로 관찰되고 박테리아에서의 성장 억제를 통해 간접적으로 관찰되었다. 다중화된 단일 제거법(leave-one-out) 및 RNA-seq 분석은 비-특이적 RNA 분해의 결여 및 따라서 포유류 세포에서의 부수적 활성의 결여를 시사하기 때문에 출원인은 부수적 활성으로 인한 전체 표적외 발현의 감소가 녹다운 실험에서 발생했는지 여부를 알아보고 싶었다. 출원인은 표적 전사물 녹다운의 결과로서 대조군에서의 변이가 있었는지 여부를 알아보기 위하여 루시페라제 및 내인성 녹다운 실험에서 유전자 대조군을 분석하였다. 초기 Gluc 타일링 실험으로부터, 많은 가이드가 Gluc의 유의미한 녹다운을 나타낸 반면 Cluc 수준에서는 변이가 거의 없었음이 분명하였다(도 62a, 62b). 그 다음 출원인은 표적내 발현에 대한 표적내 녹다운 또는 표적외 발현에 대한 표적내 녹다운(내인성 표적화의 경우에는 루시페라제 대조군 또는 GAPDH) 간의 상관 관계를 분석하기로 결정하였다. 출원인은 4 가지 표적 각각에 대해, 표적내 녹다운 및 대조군 유전자 발현 사이에 상관 관계는 훨씬 약하거나 없는 반면(Gluc: R=-0.078, p>0.05; PPIB: R=-0.058, p>0.05; KRAS: R=-0.51, p<0.0001)(도 61c 내지 61j), 표적내 녹다운 및 표적내 발현 사이에는 유의미한 양의 상관관계가 있음(Gluc: R=0.89, p<0.0001; PPIB: R=0.81, p<0.0001; KRAS: R=0.52, p<0.0001)을 밝혔으며, 이는 검출 가능한 표적외 녹다운이 없음을 나타낸다.
대조군 발현 및 녹다운 사이의 유의미한 상관 관계의 결여는 포유류 세포에서 LwaCas13a의 부수적 활성이 거의 없거나 전혀 없음을 시사한다. 출원인은 전사물 녹다운 동안의 세포의 성장 제한이 이전에 박테리아에서 관찰된 바와 같이 나타나는지를 알아봄으로써 이것을 더 조사하고자 하였다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 출원인은 Gluc에 대한 다수의 가이드로 선택하거나 선택하지 않고 LwaCas13a를 72 시간 동안 형질감염한 다음 녹다운을 측정한 직후 GFP 형광을 통해 세포 생존력 및 LwaCas13a 발현을 측정하였다. 출원인은 5 개의 모든 Gluc 표적화 가이드에 대해 유의미한 수준의 녹다운을 관찰하였으나(도 30c), 표적화 가이드 및 비-표적화 가이드 대조군 사이에 세포 성장 또는 GFP 형광에서의 유의미한 차이는 없었다(도 30d, 30e).
Cas13a의 부수적 활성은 시험관내에서 생화학적으로 직접적으로 및 박테리아에서 성장 억제를 통해 간접적으로 관찰되었으나, 포유류 세포에서의 이러한 활성의 정도는 불명확하다. 출원인은 RNA 시퀀싱 실험에서 서열-특이적 표적외 LwaCas13a 활성을 발견하지 못했고, 표적화된 전사물의 LwaCas13a-매개된 녹다운은 유사한 수준의 LwaCas13a를 발현하는 포유류 세포의 성장에 영향을 미치지 않았다(도 29g). 추가적으로, 검출 가능한 유전자 발현 변화가 없었으며, 이는 LwaCas13a 표적화의 존재가 트랜스크립톰 수준에서 관찰 가능한 세포 스트레스 반응을 유도하지 않음을 나타낸다(도 29a, 도 60a, 60b)(문헌[Subramanian, A. et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles, Proc. Natl. Acad. Sci USA 102, 15545-15550 (2005)]). 요약하면, 출원인은 낮은 수준의 균일한 부수적 활성 절단이 발생할 수 있는 가능성을 배제할 수 없지만, 출원인은 4 개의 다음 관찰에 걸쳐 검출 가능한 부수적 활성을 발견하지 못했다: 1) 모든 타일링 실험에서, 출원인은 표적 전사물 녹다운 및 인-라인(in-line) 대조군 유전자 녹다운 사이에 유의미한 상관 관계를 관찰하지 못했고(도 62), 2) 출원인은 RNA 시퀀싱 분석에서 트랜스크립톰에 대한 최소한의 변동을 관찰하였으며 유의미한 표적외를 관찰하지 못했고(도 29a), 3) 단일 제거 다중화 실험에서 출원인은 제외된 유전자의 녹다운을 관찰하지 못했고(도 49l), 4) 출원인은 LwaCas13a 표적화로 인한 세포 성장 또는 스트레스에 대한 표현형 효과를 관찰하지 못했다(도 29g).
실시예 19: 포유류 세포에서 dCas13a는 프로그래밍 가능하게 전사물에 결합함
프로그래밍 가능한 RNA-결합 단백질이 광범위한 적용을 위한 기초로서 역할할 수 있기 때문에, 출원인은 LwaCas13a가 촉매적으로 비활성인 변이체(dCas13a)로서 설계 제작될 수 있는지 여부를 탐구하였다. 이전의 연구들은 촉매성 잔기의 돌연변이를 통한 LshCas13a의 비활성화가 알엔아제 활성을 제거하면서도 RNA-결합을 유지함을 입증하였다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 출원인은 LwaCas13a에서 촉매적 아르기닌 잔기를 돌연변이시켜 dCas13a를 생성하였으며(도 44a), 리포터 코딩 서열의 5' UTR 업스트림으로의 dCas13a의 표적화가 번역 및 리포터 유전자 발현의 감소를 초래함을 밝혔다(도 63a). dCas13a에 의한 RNA 결합을 정량하기 위해, 출원인은 36 nt DR 및 28 nt 스페이서를 함유하는 가이드를 사용하여 RNA 면역침강(RIP)을 수행하였고(도 58b) 루시페라제 전사물(도 44a) 또는 ACTB mRNA(도 63b) 중 하나에 표적화되는 dCas13a의 풀다운이 비-표적화 대조군 대비 상응하는 표적의 유의미한 강화를 초래하였음을 밝혔고(루시페라제에 대해 7.8 내지 11.2x 강화 및 ACTB에 대해 2.1 내지 3x 강화; p<0.05), 이는 재프로그래밍 가능한 RNA 결합 단백질로서의 dCas13a를 인증하는 것이다.
실시예 20: dCas13a를 이용한 전사물의 음성 패드백 이미징
생체내 이미징을 위해 dCas13a를 설계 제작하고 미결합 단백질로 인한 배경 잡음을 감소시키기 위해, 출원인은 징크 핑거 자가-표적화 및 KRAB 도메인 억제에 기반한 음성-피드백 시스템을 포함시켰다(문헌[Gross, G. G. et al. Recombinant probes for visualizing endogenous synaptic proteins in living neurons. Neuron 78, 971-985, doi:10.1016/j.neuron.2013.04.017 (2013)])(도 44b). 징크 핑거, KRAB 도메인 및 NLS의 dCas13a에의 융합은 음성 피드백 작제물(dCas13a-NF)을 초래하였다. dCas13a-NF가 표적 전사물에 결합하지 않을 경우, 그것은 핵으로 국소화되며 자체 발현을 억제한다. 전사물 결합 시, 새롭게 번역된 dCas13a-NF가 세포질 내에 계속 머무르는 것 또한 가능하나, dCas13a-NF는 세포질 내로 방출되어 발현을 증가시킨다. 전사물 결합의 결과로 보통 수준의 세포질 전위(또는 유지)를 나타내는 dCas13a와 비교하여, dCas13a-NF는 ACTB mRNA에 표적화될 때 효과적으로 전위 또는 재-국소화되었다(도 63e). dCas13a-NF의 전위 정도를 추가로 특징 확인하기 위해, 출원인은 2 개의 가이드로 ACTB 전사물을 표적화하고 두 가이드가 비-표적화 가이드에 비해 전위를 증가시켰음을 밝혔다(3.1 내지 3.7x 세포/핵 신호 비율, p<0.0001)(도 44c, 도 11c 내지 11e). 전위의 정량화는 표적화 가이드가 비-표적화 가이드보다 세포질에서 유의미하게 더 많은 형광 분획을 초래하였음을 나타냈고, 이는 전사물 이미징 도구로서의 dCas13a-NF의 유용성을 보여주었다. dCas13a-NF 이미징을 추가로 검증하기 위해, 출원인은 ACTB mRNA 형광 인 시츄 혼성화(FISH) 신호에 대한 dCas13a-NF 신호의 상관 관계를 분석하였고(도 64a), 표적화 가이드 대 비-표적화 가이드 조건에 대하여 유의미한 상관 관계 및 신호 중첩이 있음을 밝혔다(가이드 1 및 2에 대해 각각 R=0.27 및 0.30, 및 비-표적화 가이드 조건에 대해 R=0.00; p<0.0001(도 64b).
실시예 21: 살아있는 세포에서의 스트레스 과립에 대한 dCas13a 이미징
산화 스트레스는 폴리아데닐화된 전사물 및 단백질을 세포질 내의 스트레스 과립으로 응집되게 하고(문헌[Nelles, D. A. et al. Programmable RNA Tracking in Live Cells with CRISPR/Cas9. Cell 165, 488-496, doi:10.1016/j.cell.2016.02.054 (2016)]; 문헌[Unsworth, H., Raguz, S., Edwards, H. J., Higgins, C. F. & Yague, E. mRNA escape from stress granule sequestration is dictated by localization to the endoplasmic reticulum. FASEB J 24, 3370-3380, doi:10.1096/fj.09-151142 (2010)]), 스트레스 과립의 발달은 암, 신경 퇴행성 질병, 및 근병증을 포함한 많은 병리학과 관련되어 있다(문헌[Wyss-Coray, T. Ageing, neurodegeneration and brain rejuvenation. Nature 539, 180-186, doi:10.1038/nature20411 (2016)]; 문헌[Protter, D. S. & Parker, R. Principles and Properties of Stress Granules. Trends Cell Biol 26, 668-679, doi:10.1016/j.tcb.2016.05.004 (2016)]). 출원인은 스트레스 과립, G3BP1의 잘 알려진 마커(문헌[Tourriere, H. et al. The RasGAP-associated endoribonuclease G3BP assembles stress granules. J Cell Biol 160, 823-831, doi:10.1083/jcb.200212128 (2003)])의 시각화와 전사물의 dCas13a-NF 이미징을 조합함으로써 mRNA의 스트레스 과립으로의 축적을 조사하였다(도 48a). 고정된 샘플에서 mRNA 추적을 확인하기 위해, 출원인은 2 개의 ACTB를 표적화하는 crRNA 또는 가이드 중 하나를 dCas13a-NF와 함께 동시 형질감염하고, 소듐 아르세나이트로 스트레스 과립 형성을 유도하고, 면역 형광으로 G3BP1을 시각화하였다(도 48b). dCas13a-NF는 예상되는 바와 같이 표적화 조건에 대해 세포질 내로 전위되거나 재-국소화되었고, 출원인은 비-표적화 대조군과 비교하여 dCas13a-NF 신호 및 G3BP1 형광 사이에 유의미한 상관 관계를 밝혔으며(가이드 1 및 가이드 2의 경우 각각 R=0.49 및 0.50, 및 비-표적화 가이드의 경우 0.08; p<0.001)(도 48c, 48d), 이는 스트레스 과립 형성을 추적하는 dCas13a-NF의 능력을 시사한다. 고정된 샘플에서의 공동-국소화를 고려할 때, 출원인은 다음으로 살아있는 세포에서 스트레스 과립 추적을 수행하였다. 출원인은 ACTB 표적화 가이드 및 비-표적화 가이드를 dCas13a-NF와 함께 형질 감염시켰으며, 형질 감염 24 시간 후 소듐 아르세나이트로 스트레스 과립 형성을 유도하고, 시간 경과에 따라 살아있는 세포를 이미징하였다(도 48e). 스트레스 과립 마커로서 G3BP1-RFP 융합을 사용하여, 출원인은 ACTB에 표적화되는 dCas13a-NF가 상응하는 비-표적화 대조군보다 시간에 따라 세포 당 유의미하게 더 많은 스트레스 과립으로 국소화함을 밝혔다(p<0.05)(도 48f).
실시예 22: 논의
클래스 2 제VI형 CRISPR-Cas 이펙터 Cas13a는 포유류 세포에서 녹다운하거나 전사물에 결합하는 crRNA 또는 가이드로 효과적으로 재프로그래밍될 수 있다. 출원인은 박테리아에서 RNA 절단을 위한 15 가지 Cas13a 오솔로그 중 가장 활성인 것으로 LwaCas13a를 동정하고 RNAi에 유사한 수준으로의 포유류 RNA 녹다운을 위해 이를 이용하였다. 출원인은 박테리아 스크리닝을 통해 검출 가능한 PFS가 없으며 가이드 활성이 PFS에 의해 영향을 받지 않음을 밝혔다. LwaCas13a는 생체내 스페이서:표적 듀플렉스에서의 미스매치에 민감하며, 이 민감성은 RNAi에 비해 높은 특이성의 녹다운으로 번역된다. 출원인은 또한 RNA 녹다운 도구로서의 LwaCas13a의, 단백질을 추가로 설계 제작하고 최적화할 수 있는 능력, 가이드의 다중화된 전달, 및 핵 lncRNA의 녹다운을 포함하는, 특유의 특성을 자세히 보여주었다. 중요하게는, 출원인은 LwaCas13a의 부수적 활성을 관찰하지 못하였으며, 이 특징은 시험관내에서 매우 활성있고 진단과 같은 많은 응용에 유용하다(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)]). 또한, 출원인은 LwaCas13a가 촉매적으로 비활성으로 되어, 프로그램 가능한 RNA 결합 플랫폼으로서 사용될 수 있음을 보여주고, 출원인은 살아있는 세포에서 스트레스 과립에의 전사물 축적을 추적하기 위한 이의 유용성을 입증하였다.
중요하게도, 출원인은 포유류 세포에서 LwaCas13a의 부수적 활성을 관찰하지 못했고, 이는 출원인이 시험관내에서 관찰하여 진단 응용을 위해 이용한 특징이다(문헌[Gootenberg, J.S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2, Science, 인쇄중 (2017)]). 부수적 활성은 집단으로부터 감염된 세포를 제거하거나 감염된 세포에게 감염에 적응하고 극복할 시간을 제공하는, 본래 박테리아 세포에서의 프로그램된 세포 사멸/휴지 경로의 일부로 추정되었고, 이는 Cas13a 의 표적내 바이러스 전사물 절단 활성을 보충한다. 포유류 세포에서의 부수적 활성의 결여는 본래의 세포 맥락에서 이의 존재 가능성을 배제하지 않는다.
Cas13 패밀리 구성원에 기반한 RNA-표적화 도구의 개선 및 다양화를 위한 많은 기회가 있다. Cas13b(문헌[Smargon, A. A. et al. Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28. Mol Cell 65, 618-630 e617, doi:10.1016/j.molcel.2016.12.023 (2017)]) 또는 Cas13c(문헌[Shmakov, S. et al. Diversity and evolution of class 2 CRISPR-Cas systems. Nat Rev Microbiol 15, 169-182, doi:10.1038/nrmicro.2016.184 (2017)])와 같은 추가적인 Cas13 단백질의 생체내 특징 확인은 절단 또는 결합 능력의 추가 개선을 산출할 수 있으며, 다중 색상 이미징을 포함하는, 직교 RNA 결합 단백질을 필요로 하는 응용을 가능하게 할 수 있다. 추가적으로, 더 작은 오솔로그는 아데노-관련 바이러스 벡터와 같은 크기-제한적 전달 선택지를 가능하게 할 것이다(문헌[Ran, F. A. et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191, doi:10.1038/nature14299, nature14299 [pii] (2015)]). 마지막으로, 증가된 구조 데이터(문헌[Liu, L. et al. Two Distant Catalytic Sites Are Responsible for C2c2 RNase Activities. Cell 168, 121-134 e112, doi:10.1016/j.cell.2016.12.031 (2017)])와 결합된 Cas13 구성원의 다양성에 대한 탐구는 생물 정보학-(문헌[Zinn, E. et al. In Silico Reconstruction of the Viral Evolutionary Lineage Yields a Potent Gene Therapy Vector. Cell Rep 12, 1056-1068, doi:10.1016/j.celrep.2015.07.019 (2015)]) 또는 구조-(문헌[Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 529, 490-495, doi:10.1038/nature16526 (2016)]; 문헌[Slaymaker, I. M. et al. Rationally engineered Cas9 nucleases with improved specificity. Science 351, 84-88, doi:10.1126/science.aad5227 (2016)]) 안내되는 합리적 설계를 가능하게 할 수 있다. 개선된 RNA 결합 도구는 분할된 형광단의 재구성을 통한 이미징(문헌[Ozawa, T., Natori, Y., Sato, M. & Umezawa, Y. Imaging dynamics of endogenous mitochondrial RNA in single living cells. Nat Methods 4, 413-419, doi:10.1038/nmeth1030 (2007)]), 번역 조절(문헌[De Gregorio, E., Preiss, T. & Hentze, M. W. Translation driven by an eIF4G core domain in vivo. EMBO J 18, 4865-4874, doi:10.1093/emboj/18.17.4865 (1999)]; 문헌[Adamala, K. P., Martin-Alarcon, D. A. & Boyden, E. S. Programmable RNA-binding protein composed of repeats of a single modular unit. Proc Natl Acad Sci U S A 113, E2579-2588, doi:10.1073/pnas.1519368113 (2016)]; 문헌[Campbell, Z. T., Valley, C. T. & Wickens, M. A protein-RNA specificity code enables targeted activation of an endogenous human transcript. Nat Struct Mol Biol 21, 732-738, doi:10.1038/nsmb.2847 (2014)]; 문헌[Cao, J. et al. Light-inducible activation of target mRNA translation in mammalian cells. Chem Commun (Camb) 49, 8338-8340, doi:10.1039/c3cc44866e (2013)]; 문헌[Cooke, A., Prigge, A., Opperman, L. & Wickens, M. Targeted translational regulation using the PUF protein family scaffold. Proc Natl Acad Sci U S A 108, 15870-15875, doi:10.1073/pnas.1105151108 (2011)]), RNA 염기 편집(문헌[Nishikura, K. A-to-I editing of coding and non-coding RNAs by ADARs. Nat Rev Mol Cell Biol 17, 83-96, doi:10.1038/nrm.2015.4 (2016)]; 문헌[Wedekind, J. E., Dance, G. S., Sowden, M. P. & Smith, H. C. Messenger RNA editing in mammals: new members of the APOBEC family seeking roles in the family business. Trends Genet 19, 207-216, doi:10.1016/S0168-9525(03)00054-4 (2003)]), 후성트랜스크립톰 변동(문헌[Harcourt, E. M., Kietrys, A. M. & Kool, E. T. Chemical and structural effects of base modifications in messenger RNA. Nature 541, 339-346, doi:10.1038/nature21351 (2017)]), RNA 발현 수준에 기반한 아폽토시스의 표적화된 유도(문헌[Rider, T. H. et al. Broad-spectrum antiviral therapeutics. PLoS One 6, e22572, doi:10.1371/journal.pone.0022572 (2011)]), 또는 스플라이싱 조절(문헌[Wang, Y., Cheong, C. G., Hall, T. M. & Wang, Z. Engineering splicing factors with designed specificities. Nat Methods 6, 825-830, doi:10.1038/nmeth.1379 (2009)])을 포함하는, 추가적인 기능화를 가능하게 할 것이다.
Cas13a를 이용한 RNA 녹다운은 게놈-전체에 걸쳐 모아진(pooled) 녹다운 스크리닝, lncRNA 및 발생기 전사물 기능에 대한 조사, 대립 유전자-특이적 녹다운, 및 RNA 바이러스 치료제를 포함하는, 다수의 생물학적 맥락에서 RNA를 변동시키는 데 적용될 수 있다. 추가적으로, dCas13a 및 유도체는 RNA-단백질 상호 작용 연구, 살아있는 세포에서 전사물 추적, 및 RNA 수준에 기반한 세포의 표적화된 파괴를 위해 RNA 풀다운을 가능하게 하며, 이는 특정 세포 집단을 연구하거나 암세포를 죽이는 데 유용할 것이다. 출원인은 Cas13이 포유류 및 식물 세포에서 프로그래밍 가능한 녹다운 및 RNA 결합 모두를 위한 견고한 플랫폼임을 보여주었으며, 이 플랫폼은 다른 진핵 생물으로도 확장될 수 있다. 창조적인 설계 제작 접근과 결합된 CRISPR-Cas13은 핵산 기반 진단 및 치료제를 위한 강력한 플랫폼이 될 것이며 트랜스크립톰 연구에 혁명을 불러올 수 있다.
실시예 23: 아폽토시스를 위한 분할 설계
특정 세포 유형의 역할을 연구하기 위한 기초 생물학 적용 또는 암 또는 노화 세포 청소와 같은 치료적 적용을 위해, 전사적 특징 또는 특정 유전자 발현에 기반하여 세포를 손실시키거나 사멸시키는 것이 종종 바람직하다(문헌[Baker, D.J., Childs, B.G., Durik, M., Wijers, M.E., Sieben, C.J., Zhong, J., Saltness, R.A., Jeganathan, K.B., Verzosa, G.C., Pezeshki, A., et al. (2016). Naturally occurring p16(Ink4a)-positive cells shorten healthy lifespan. Nature 530, 184-189]). 이 표적화된 세포 사멸은 분할된 아폽토시스 도메인을 Cas13 단백질에 융합시킴으로써 달성될 수 있는데, 이는 전사물에 결합 즉시 재구성되어, 표적화된 유전자 또는 유전자 세트를 특이적으로 발현하는 세포의 사멸을 유도한다. 특정 구현예에서, 아폽토시스 도메인은 분할된 카스파제 3일 수 있다(문헌[Chelur, D.S., and Chalfie, M. (2007). Targeted cell killing by reconstituted caspases. Proc. Natl. Acad. Sci. U. S. A. 104, 2283-2288]). 다른 가능성으로는 Cas13 결합을 통해 2 개의 카스파제 8(문헌[Pajvani, U.B., Trujillo, M.E., Combs, T.P., Iyengar, P., Jelicks, L., Roth, K.A., Kitsis, R.N., and Scherer, P.E. (2005). Fat apoptosis through targeted activation of caspase 8: a new mouse model of inducible and reversible lipoatrophy. Nat. Med. 11, 797-803]) 또는 카스파제 9(문헌[Straathof, K.C., Pule, M.A., Yotnda, P., Dotti, G., Vanin, E.F., Brenner, M.K., Heslop, H.E., Spencer, D.M., and Rooney, C.M. (2005). An inducible caspase 9 safety switch for T-cell therapy. Blood 105, 4247-4254]) 이펙터를 근접하게 가져오는 것과 같은, 카스파제의 결집이다. 전사물 상의 Cas13 결합을 통해 분할된 TEV를 재구성하는 것도 또한 가능하다(문헌[Gray, D.C., Mahrus, S., and Wells, J.A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease. Cell 142, 637-646]). 이 분할된 TEV는 발광 및 형광 판독을 포함하는, 다양한 판독에서 사용될 수 있다(문헌[Wehr, M.C., Laage, R., Bolz, U., Fischer, T.M., Grunewald, S., Scheek, S., Bach, A., Nave, K.-A., and Rossner, M.J. (2006). Monitoring regulated protein-protein interactions using split TEV. Nat. Methods 3, 985-993]). 일 구현예는, 세포 사멸을 초래하는, 변형된 프로-카스파제 3 또는 프로-카스파제 7을 절단하기 위한 이 분할된 TEV의 재구성을 수반한다(문헌[Gray, D.C., Mahrus, S., and Wells, J.A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease. Cell 142, 637-646]).
실시예 24: 이미징을 위한 분할 설계
현재의 출원에서 언급되었지만, 2 개의 Cas13 단백질이 전사물에 결합한 즉시 분할된 형광단의 재구성을 통한 감소된 배경을 갖는 이미징을 위해 추가적인 분할된-형광단 작제물을 설계하였다. 이들 분할된 단백질로는 iSplit(문헌[Filonov, G.S., and Verkhusha, V.V. (2013). A near-infrared BiFC reporter for in vivo imaging of protein-protein interactions. Chem. Biol. 20, 1078-1086.)], Split Venus(문헌[Wu, B., Chen, J., and Singer, R.H. (2014). Background free imaging of single mRNAs in live cells using split fluorescent proteins. Sci. Rep. 4, 3615.]), 및 Split 초양성 GFP(문헌[Blakeley, B.D., Chapman, A.M., and McNaughton, B.R. (2012). Split-superpositive GFP reassembly is a fast, efficient, and robust method for detecting protein-protein interactions in vivo. Mol. Biosyst. 8, 2036-2040.])가 포함된다.
실시예 25: 추가적인 전사 활성, 루시페라제를 위한 분할 설계
Cas13 단백질에 의해 구성될 수 있는 추가적인 가능한 분할 융합은 발광 이미징을 위한 루시페라제(문헌[Kim, S.B., Ozawa, T., Watanabe, S., and Umezawa, Y. (2004). High-throughput sensing and noninvasive imaging of protein nuclear transport by using reconstitution of split Renilla luciferase. Proc. Natl. Acad. Sci. U. S. A. 101, 11542-11547]) 또는 RNA-감지 기반 방식의 유전자 회로의 유전자 발현을 구동하기 위한 분할된 전사 인자를 포함할 수 있다. 가능한 분할된 전사 인자로는, 분할된-유비퀴틴-LexA 시스템과 같은 분할된-유비퀴틴 기반 시스템(문헌[Petschnigg, J., Groisman, B., Kotlyar, M., Taipale, M., Zheng, Y., Kurat, C.F., Sayad, A., Sierra, J.R., Mattiazzi Usaj, M., Snider, J., et al. (2014). The mammalian-membrane two-hybrid assay (MaMTH) for probing membrane-protein interactions in human cells. Nat. Methods 11, 585-592])이 포함된다.
실시예 26: C2c2 오솔로그의 동정
하기 C2c2 오솔로그는 포유류 세포에서 발현을 위해 코돈 최적화될 수 있다.
상기 종의 단백질 서열을 하기 표에 나열한다.
실시예 27: C2c2 오솔로그의 동정
특정 Cas13b 오솔로그는 놀랍게도 C2c2와 유사하다. 도 54는 C2c2 및 Cas13b 단백질의 트리 정렬을 제공한다. 다음의 Cas13b 단백질은 포유류 세포에서 발현을 위해 코돈 최적화될 수 있다.
실시예 28: C2c2 오솔로그의 식별
C2c2 효소의 특성을 개선하거나 달리 변경하기 위해, 아미노산의 변형을 수행한다. 변화 가능한 잔기는 보존된 하전 잔기의 서브세트로 확인된다. 이들 잔기는 도 53의 정렬에서 80% 초과의 보존을 갖는다. 이들은 비하전 잔기(전형적으로 알라닌)로 변화될 수 있다. 표시된 잔기 중 하나 이상이 돌연변이되었다. 아미노산 잔기 넘버링은 도 66(맨윗 줄)에 표시된 컨센서스 넘버링에 상응하며, 아래에 재현되었다:
MWISIKTLIHHLGVLFFCDMGNLFGHMKIXKVXHEKRXAKXKXPXKKVXVKRKYSGGGLLLNYNENPNKNKSXENILIKKKISFXXLKSSSKLBKTINKPDXKKXXXXLQWFLSEIVKKINRRNGLVLSDMLSVDKRXXEKIXEKXXXLKYFXXXXXXLXKLHQEKPSKKLFNLKDLKEXEEXVLFLKXKFKNEJXYXXENDXXKDIEKILXEXLRXGFXPADKKLKXKFLIEXXWGIFSXXXKLEPYXIQEDFXEXYIEDFKKLNKXKXJXKSIENNKIVSQKSSDSQIYEXGKNIIMSXXGXIESIIEXXSKRKXXLDKYATXXLXEKLLLDEXLXIEQXXXNXXEXXDKLASNLKXYXLXKLYFYVKXDKKKSXXEVAKAAVSAAKDXNKDKYQNEVWXXHEXRKEDKRDFIXXXLEIXXIXKXIXKVKXXIXKXAXXEAXEXIKXXNIGKYRXXJDLFELEEDNXLNQFXXFVNIEXXKFFXHYXPNXIKRIXXXKNDAXAXXLKXGELXKKVEKQLKNGALSIYXIXXGKAVYYXXFAMKXLADSDYWTXKDLEXIKISEAFLRKFIGACSFAYXSLXAXNILQPECXXDILGKGDLLXKATVNIXQXXSEHIMYLGKLRHNDIDXLLXFKEDIAKSTXKXGXGXLXKNLIQFFGGESTWDNKIFXAAYXXXLXGXXENEDFLGWALRGAIXSIRNEXFHSFKIKKHXXXXFLNIXNFIXXKLXEFEKXXXXKXKEXXHXXXTSYXXXLIKKLFXNEXXKXXLPXXIKELKLKSSGVXMYYSXDDLKKLLENIYFKFSLLKIXEENXEXAXFVPSFKKVYXRADGVKGFDYQXXXTRXHAYXLKLXPFFDXEEXEXEAFNARYYLLKXIYYNXILEXXXEENEXXXXFLPKFXXXNNXAFREXXNFXADXIEXYYKRLQINKKKGAXKXXKKKXQXKVXNXYNRKXFAYAFENIRXMXFXETPREYMQYIQSEYXIENNGKEXKKSXXENKRNKDXFXHXEKFLLQVFIKGFDXYJDXRXENFXFILXPEPQNGTKEYLYEEXXAILDEXXXXNXLRXXXITXNKXLKLXEFJPEXKSDIKVXPXLVEEIYDYIKKIKINKIKKDXEJAFWQDAALYLFCEKLLDARHLSXXLRXELIKYKQFXKDIKXRAXXNGNXINHSXXXNXXXVXECTDELEIIELXLLLNDRXSNDFKDYFDDEEAXIXXXXLCRIIFYAEYLXKYXKEEDDXXXXAEXXXFXALEPFCQSDTAREAKNDIYXDGGXNPELRVPILNRGIXQXKKIYGTEXXLEKLFDKNXLFBIDGXBIPXFKVSEEXAIIXEXXEKKXEIXEXSQYKXRGELHTEWXQKAREIEEYXXXXXKXKFXKKPQNXXFEKRFIEKHGQEYKKAXXXIXEYXWLKNKVEXNXLNELHELLIXLLGRLIGYSALFERDLQYFXNGFHYXCLNNDXEKLAXYXNJSXVXXKNRXIXKAXLYQIFAMYXXGLPFYSKDXDXXXAXXSGXKXSXXXXSXXTAGXGKKJKKFKKYSXYXLIXXXLXXDXSKKLDXYLAGLELFENXEEHDNXTEXIRNYIAHFNYLXXAGXXADXSLLELYNXLRDRLXSYDRKLKNAVSKSLIDILDRHGMILKFKFKXXXKLIGXNDXXXXAIKHKDXARITIXEPNGVTSEXFTYKLLXXVAALEIXSLEPKKIRHLXXXARLLYYPKXATAQSQPDQKXXXKXKKKNIXKGYIERXTNQVSSNQEEYCELVKKLLETXXLXXLAVXGVAXBIGLHISRLRRIREDAIIVGRRYRFRVEIYVPPKSNTSKLNAADLVRID
MUSCLE 정렬(www.ebi.ac.uk/Tools/msa/muscle/)을 사용하여 컨센서스 서열에 기반한 돌연변이된 잔기. Lsh의 상응하는 위치가 표시된다.
상기 아미노산 잔기 중 임의의 하나 이상을 단독으로 또는 조합하여 갖는, 돌연변이된 C2c2 단백질은 변형된 특이성 및/또는 활성 및/또는 대안적인 PAM 인식을 나타낸다.
실시예 29:
Lw2 및 FSL의 정렬(도 67)에 기반하여, 다음의 보존된 잔기가 확인되었다:
표시된 잔기 중 하나 이상이 돌연변이되었다. 아미노산 잔기 넘버링은 도 67(동일한 잔기를 나타내는 2 개의 오솔로그 정렬된 서열 사이의 중앙선)에 표시된 넘버링에 상응한다.
Lew2 C2c2 및 Lib C2c2간에 동일한, 도 67에 표시된 잔기 중 임의의 하나 이상을 C2c2 단백질 활성, 특이성 또는 기능성을 변형하기 위해 돌연변이한다. 돌연변이된 상기 아미노산 잔기 중 임의의 하나 이상을 단독으로 또는 조합하여 갖는 C2c2 단백질은 변경된 특이성 및/또는 활성 및/또는 대안적 PAM 인식을 나타낸다.
실시예 30: 방법
활성 스크리닝 및 재조합 발현을 위한 오솔로그 클로닝
15 개의 Cas13a 오솔로그(Genscript, Jiangsu, China)(보충 표 9)의 인간 코돈-최적화된 버전을 합성하고 pLac 프로모터에 의한 발현 하에 이들을 pACYC184로 클로닝하였다. Cas13a 발현 카세트에 인접하여, 베타-락타마제 표적화 또는 비-표적화 스페이서 측면에 배치되는 오솔로그의 상응하는 직접 반복을 클로닝하였다. 스페이서 어레이 발현은 J23119 프로모터에 의해 구동하였다.
LwaCas13a의 정제를 위해, 포유류 코돈-최적화된 LwaCas13a 서열을 단백질 정제용 박테리아 발현 벡터에 클로닝하였다(6x His/Twin Strep SUMO, Ilya Finkelstein(텍사스 대학교 오스틴 캠퍼스)로부터 선물로 받은 pET-기반 발현 벡터).
이 연구에서 사용된 모든 플라스미드는 보충 표 1에 나열되어 있다.
Cas13a 활성 및 PFS 동일성을 위한 박테리아 생체내 시험
스크린은 다음과 같이 기능한다. 간략하게, Cas13a는 무작위 PFS 뉴클레오티드가 측면에 배치된 β-락타마제 전사물 상의 5' 범위의 서열을 표적화하도록 프로그래밍한다. Cas13a 절단 활성은 암피실린 선택 하에 박테리아의 사멸을 초래하고, 그 다음에 PFS 손실은 차세대 시퀀싱으로 분석한다. 오솔로그 사이의 양적 비교를 가능하게 하기 위해, pJ23119 작은 RNA 프로모터의 발현 하에 있는 근처의 단일-스페이서 CRISPR 어레이와 함께 pLac 프로모터 하에 각각의 Cas13a 오솔로그를 클로닝하였다.
Cas13a 오솔로그의 활성을 시험하기 위해, 표적화 또는 비-표적화 가이드를 갖는 90 ng의 오솔로그 발현 플라스미드를 이전에 기재된 베타-락타마제 표적 플라스미드 25 ng과 함께 NovaBlue Singles 수용성 세포(Millipore) 내로 동시-형질전환하였다. 형질전환 후, 세포를 희석하고, 100 μg/uL 암피실린 및 25 μg/uL 클로람페니콜로 보충된 LB-한천에 플레이팅하고, 하룻밤 동안 37℃에서 인큐베이션하였다. 다음날 형질전환체를 계수하였다.
LshCas13a 및 LwaCas13a PFS 동일성의 결정을 위해, 표적화 또는 비-표적화 스페이서를 갖는 40 ng의 오솔로그 발현 플라스미드를 생물학적 복제 당 2 분취물의 NovaBlue GigaSingles(Millipore) 내로 25 ng의 베타-락타마제 표적 플라스미드와 함께 동시-형질전환하였다. 2 개의 생물학적 복제를 수행하였다. 형질전환 후, 세포를 1 시간 동안 생물학적 복제 당 500 uL의 SOC(ThermoFisher Scientific)에서 37℃에서 회수하고, 100 μg/uL 암피실린 및 25 μg/uL의 클로람페니콜로 보충된 LB-한천(Affymetrix)을 갖는 바이오-분석 플레이트(코닝)에 플레이팅하고, 37℃에서 16 시간 동안 인큐베이션하였다. 그 다음 콜로니를 스크래핑으로 수확하고 다음의 시퀀싱을 위해 플라스미드 DNA를 NuceloBond Xtra EF(Macherey-Nagel)로 정제하였다.
수확된 플라스미드 샘플을 NEBNext High Fidelity 2X 마스터 믹스(New England Biosciences)를 사용하여 바코딩 프라이머 및 Illumina 유동 세포 핸들을 갖는 PCR에 의한 차세대 시퀀싱을 위해 제조하였다. PCR 생산물을 모으고 Zymoclean 겔 추출 키트(Zymo Research)를 사용하여 겔 추출하고 MiSeq 차세대 시퀀싱 기기(Illumina)를 사용하여 시퀀싱하였다.
PFS의 컴퓨터 분석
LshCas13a 및 LwaCas13a PFS 스크리닝 라이브러리의 차세대 시퀀싱으로부터, 무작위 PFS 영역 측면에 배치된 서열을 정렬하고 PFS 동일성을 추출하였다. 서열 적용 범위를 향상시키기 위해 PFS 동일성을 4 뉴클레오티드로 접고, 각각의 고유 PFS의 빈도를 계수하고, 가짜수(pseudocount)를 1로 하여 각각의 라이브러리에 대한 총 판독 수로 정규화하였다. 도 1e에 표시된 각각의 분포의 강화는 -log2(f조건/fpACYC184)로서 pACYC184 대조군(단백질 없음/가이드 유전자좌)에 대해 계산하였으며, 여기서 f조건은 실험 조건에서의 PFS 동일성의 빈도이며 fpACYC184는 pACYC184 대조군에서의 PFS 동일성의 빈도이다. 보존된 PFS 모티프의 분석을 위해, 다음과 같이 각각의 조건에서의 비-표적화 대조군을 사용하여 최고 손실된 PFS 동일성을 계산하였다: -log2(fi,표적화/fi,비-표적화) 여기서 fi,표적화는 표적화 스페이스를 갖는 조건 i에서의 PFS 동일성의 빈도이고 fi,비-표적화는 비-표적화 스페이서를 갖는 조건 i에서의 PFS 동일성의 빈도이다. 확장된 데이터 도 1d, 1e에 나타난 바와 같이 PFS 모티프를 임계값의 범위에 대해 분석하였다.
LwaCas13a의 정제
LwaCas13a의 정제는 이전에 기재된 바와 같이 수행하였다. 간랸하게, LwaCas13a 박테리아 발현 벡터를 Rosetta 2(DE3)pLysS singles 수용성 세포(Millipore) 내로 형질전환시키고 Terrific Broth 4 성장 배지(TB) 4 L를 출발 배양으로 씨딩하였다. 세포 단백질 발현을 IPTG로 유도하고 하룻밤 동안 성장시킨 후, 세포 펠렛을 수확하여 -80℃에서 보관하였다. 세포 용해 후, 단백질은 StrepTactin Sepharose 수지(GE)를 사용하여 결합시키고 단백질은 SUMO 프로테아제 분해(ThermoFisher)로 용출시켰다. 단백질은 HiTrap SP HP 양이온 교환 컬럼(GE Healthcare Life Sciences)을 사용하여 양이온 교환하고 이어서 Superdex 200 Increase 10/300 GL 컬럼(GE Healthcare Life Sciences)을 사용하여 겔 여과하며, 두 단계 모두 FPLC(AKTA PURE, GE Healthcare Life Sciences)를 통하여 추가 정제하였다. LwaCas13a 단백질을 함유하는 최종 분획을 모으고 저장 완충액(600 mM NaCl, 50 mM Tris-HCl pH 7.5, 5% 글리세롤, 2 mM DTT)에 농축시키고, 분취물을 장기 저장을 위해 -80℃에서 동결시켰다.
포유류 발현 작제물 클로닝
인간 코돈 최적화된 Cas13a 유전자를 합성하고(Genscript) EF1-α 프로모터에 의한 발현 하에 핵 방출 서열(NES) 또는 핵 국소화 서열(NLS)을 갖는 포유류 발현 벡터 내로 클로닝 하였다. 단량체-수퍼-폴드 GFP(msfGFP)에 의해 부여된 안정성 때문에, msfGFP를 LwaCas13a의 C 말단에 융합시켰다. LwaCas13a의 전장 직접-반복은 U6 프로모터 하에서의 발현으로 가이드 백본 플라스미드를 클로닝하는 데 사용하였다. 촉매적으로 비활성인 LwaCas13a-msfGFP 작제물(데드 Cas13a 또는 dCas13a)은 2 개의 HEPN 도메인에 R474A 및 R1046A 돌연변이를 도입함으로써 생성하였다. LwaCas13a-msfGFP의 약물-선택성 버전은 2 A 펩티드 서열을 통해 C-말단에 연결된 블라스티시딘 선택 마커를 갖는 백본에 단백질을 클로닝함으로써 생성하였다. dCas13a-msfGFP 작제물의 음성 피드백 버전은 dCas13a-msfGFP의 프로모터 업스트림에 징크-핑거 결합 부위를 클로닝하고 징크 핑거 및 KRAB 도메인을 C-말단에 융합시킴으로써 생성하였다.
리포터 루시페라제 작제물은 CMV에 의한 발현 하에 사이프리디니아 루시페라제(Cluc) 및 EF1-α에 의한 발현 하에 가우시아 루시페라제(Gluc)를 둘 모두 단일 벡터 상에 클로닝함으로써 생성하였다. 단일 벡터 상의 두 루시페라제 모두의 발현은 하나의 루시페라제가 다른 루시페라제의 녹다운의 정규화를 위한 용량 대조군으로서 작용할 수 있도록 하여, 형질감염 조건으로 인한 변동을 제어한다.
도 1g의 내인성 녹다운 실험에 있어서, RNAxs siRNA 설계 알고리즘을 사용하여 가이드 및 shRNA를 설계하였다. shRNA를 설계하기 위해 예측 툴을 사용하였고 shRNA 및 Cas13a 녹다운 사이의 비교를 가능하게 하기 위하여 가이드는 동일한 위치에서 설계하였다.
벼 액틴 프로모터(pOsActin)를 pANIC6A로부터 PCR 증폭시키고 각각의 Cas13a를 기존 Cas13a 작제물로부터 PCR 증폭시켰다. 이들 단편을 기존의 식물 발현 플라스미드 내에 결찰하여 각각의 Cas13a가 벼 액틴 프로모터에 의해 구동되고 전사가 HSP 터미네이터에 의해 종결되도록 하였다. Cas13a gRNA는 벼 U6 프로모터(pOsU6)로부터 발현하였다. gRNA 표적 서열은 각각의 유전자에 대해 동일했으나 스캐폴드 서열은 Cas13a-특이적이었다. 이들 실험에서 글리포세이트-기반 제초제의 표적인 5-에놀피루빌쉬키메이트-3-포스페이트 신타제(OsEPSPS) 유전자 및, 적절한 식물 성장을 위해 필요한 벼 히드록시신나모일-CoA 쉬키메이트/퀴네이트 히드록시신나모일 트랜스페라제(OsHCT) 유전자를 표적화했다.
이 연구에서 사용된 모든 가이드 및 shRNA는 보충 표 2 및 3에 나열되어 있다.
원형질체 제조
녹색 벼 원형질체(Oryza sativa L. ssp. japonica var. Nipponbare)를 약간 변형하여 이전에 기재된 바와 같이 제조하였다. 모종을 14 일 동안 성장시키고, 원형질체를 0.1 M CaCl2를 함유하는 MMG 완충액에 재현탁시켰다. WI 완충액 대용으로뿐만 아니라 새로운 40% PEG 완충액을 제조하기 위해 이 변형된 MMG 완충액을 사용하였다. 마지막으로, 원형질체는 형질전환 후 48 시간 동안 전체 암흑 상태에서 유지하였다. 다른 모든 조건은 이전에 기재된 바와 같았다.
시험관내 반응 및 부수적 활성을 위한 핵산 표적 및 crRNA 제조
핵산 표적의 생성을 위해, 올리고뉴클레오티드를 KAPA Hifi Hot Start(Kapa Biosystems)로 PCR 증폭시켰다. dsDNA 앰플리콘을 겔 추출하고 MinElute 겔 추출 키트(Qiagen)를 사용하여 정제하였다. 초래된 정제 dsDNA는 HiScribe T7 Quick High Yield RNA 합성 키트(New England Biolabs)를 사용하여 30℃에서 하룻밤 동안 인큐베이션을 통해 전사시켰다. 전사된 RNA는 MEGAclear Transciption Clean-up 키트(Thermo Fisher)를 사용하여 정제하였다. 이 연구에서 사용 된 모든 RNA 표적은 보충 표 4 및 6에 나열되어 있다.
crRNA를 생성하기 위해, 올리고뉴클레오티드를 추가적인 5' T7 프로모터 서열을 갖는 DNA(Integrated DNA Technologies)로서 주문하였다. crRNA 주형 DNA를 T7 프라이머(최종 농도 10 μM)로 어닐링시킨 후 HiScribe T7 Quick High Yield RNA 합성 키트(New England Biolabs)로 37℃에서 하룻밤 동안 인큐베이션하여 전사시켰다. 초래된 전사 crRNA를, 추가적인 1.8x 비율의 이소프로판올(Sigma)로 보충되고, 2x 비율의 비드 대 반응물 부피를 사용하여, RNAXP 클린 비드(Beckman Coulter)로 정제하였다. 시험관내 실험 연구에 사용된 crRNA 작제물은 보충 표 5에 나열되어 있으며 부수적 검출에 사용된 crRNA 작제물은 보충 표 6에 나열되어 있다.
LwaCas13a 절단 및 부수적 활성 검출
LwaCas13a의 생화학적 특징 확인을 위해, 이전에 기재된 바와 같이 분석을 수행하였다. 간략하게, 달리 표시되지 않는 한, 160 nM의 말단-표지된 ssRNA 표적, 200 nM의 정제된 LwaCas13a, 및 100 nM crRNA로 뉴클레아제 분석을 수행하였다. 모든 분석은 뉴클레아제 분석 완충액(40 mM Tris-HCl, 60 mM NaCl, 6 mM MgCl2, pH 7.3)에서 수행하였다. 어레이 프로세싱을 위해, 100 ng의 시험관내 전사된 어레이를 뉴클레아제 분석마다 사용하였다. 반응은 37℃에서 1 시간 동안 진행하도록 두었고(달리 표시하지 않는 한), 프로테이나제 완충액(프로테이나제 K, 60 mM EDTA, 및 4 M 우레아)으로 37℃에서 15 분 동안 소멸시켰다. 그 다음 95℃에서 5 분 동안 4.5 M 우레아 변성 완충액으로 반응물을 변성시켰다. 샘플을 45℃에서 10% PAGE TBE-우레아(Invitrogen) 상의 변성 겔 전기영동 실행에 의해 분석하였다. 겔은 Odyssey 스캐너(LI-COR Biosciences)를 사용하여 이미징하였다.
부수적 활성 검출 분석은 이전에 기재된 바와 같이 수행하였다. 간략하게, 반응은, 달리 표시되지 않는 한, 뉴클레아제 분석 완충액(40 mM Tris-HCl, 60 mM NaCl, 6 mM MgCl2, pH 7.3)내에 45 nM 정제된 LwCas13a, 22.5 nM crRNA, 125 nM 소광된 형광 RNA 리포터(알엔아제 Alert v2, Thermo Scientific), 2 μL 쥐 알엔아제 저해제(New England Biolabs), 100 ng의 배경 총 인간 RNA(HEK293FT 배양으로부터 정제), 및 가변하는 양의 입력 핵산 표적으로 구성되었다. 반응은 매 5 분마다 형광 동력학이 측정되는 형광 플레이트 리더(BioTek) 상에서 37℃에서 1 내지 3 시간 동안(달리 표시되지 않는 한) 진행되도록 두었다.
RNA 추출 및 qRT-PCR
트리졸 및 첨부 프로토콜을 사용하여 48 시간의 인큐베이션 후 전체 RNA를 단리하였다. SuperScript III Plantinum SYBR Green One-Step qRT-PCR 키트(Invitrogen)에서 첨부된 프로토콜을 사용하여 총 RNA 중 1 나노그램을 사용하였다. 모든 샘플은 LightCycler 480 Instrument(Roche) 상에서 384-웰 포맷으로 3 개의 생물학적 반복실험에 대한 기술적 3 회로 실행하였다. 모든 PCR 프라이머는 용융 곡선 분석에 기반하여 특이적인 것으로 인증되었고 다음과 같다: OsEPSPS (Os06g04280), 5' - TTG CCA TGA CCC TTG CCG TTG TTG - 3' 및 5' - TGA TGA TGC AGT AGT CAG GAC CTT - 3'; OsHCT (Os11g07960), 5' - CAA GTT TGT GTA CCC GAG GAT TTG - 3' 및 5' - AGC TAG TCC CAA TAA ATA TGC GCT - 3'; OsEF1a (Os03g08020), 5' - CTG TAG TCG TTG GCT GTG GT - 3' 및 5' - CAG CGT TCC CCA AGA AGA GT - 3'. OsEF1a에 대한 프라이머는 이전에 기재되었다. 모든 데이터는 EF1a의 발현에 비례하여 각각의 샘플을 이용한 평균±표준 오차로 나타난다.
타일링 가이드 스크린의 클로닝
타일링 가이드 스크린을 위하여, 스페이서는 전사물의 전체 길이를 완전히 커버하기 위하여 균일한 간격으로 mRNA 전사물을 표적화하도록 설계하였다. 스페이서는 IDT로부터 주문하여, 어닐링하고, Gluc 및 Cluc 스크린용 tRNAval 프로모터 또는 모든 내인성 스크린용 U6 프로모터를 갖는 LwaCas13a 가이드 발현 작제물 내로 골든-게이트 클로닝하였다.
LwaCas13a를 이용한 녹다운을 위한 포유류 세포 배양 및 형질감염
달리 언급되지 않는 한, 모든 포유류 세포 실험을 HEK293FT 라인(ATCC)에서 수행하였다. HEK293FT 세포를 10% 태아 소 혈청(VWR Seradigm) 및 1X 페니실린-스트렙토마이신(Thermo Fisher Scientific)으로 보충된, 고 글루코스, 소듐 피루베이트, 및 GlutaMAX(Thermo Fisher Scientific)를 갖는 Dulbecco's Modified Eagle 배지에서 배양하였다. 세포를 70% 미만의 컨플루언시(confluency)를 유지하기 위해 계대시켰다. A375(ATCC)를 포함하는 실험을 위해, 세포를 9% 태아 소 혈청(VWR Seradigm) 및 1X 페니실린-스트렙토마이신(Thermo Fisher Scientific)으로 보충된 RPMI 배지 1640(Thermo Fisher Scientific)에서 배양하였다.
내인성 유전자의 녹다운을 시험하기 위해, 달리 언급되지 않는 한, 웰당 150 ng의 LwaCas13a 플라스미드 및 250 ng의 가이드 플라스미드를 사용하여 리포펙타민 2000(Thermo Fisher Scientific) 형질감염을 수행하였다. 리포터 플라스미드의 녹다운 시험 실험은 웰당 12.5 ng 리포터 작제물로 보충하였다. 형질감염 16 시간 전에, 세포를 96-웰 플레이트에 약 20,000 세포/웰로 플레이팅하고, 하룻밤 동안 90% 컨플루언시로 성장하도록 두었다. 각각의 웰에 대해 플라스미드를 Opti-MEM® I 환원 혈청 배지(Thermo Fisher)와 조합하여 총 25 uL로 하고, 개별적으로 0.5 uL의 리포펙타민 2000을 24.5 uL의 Opti-MEM과 조합하였다. 그 다음 플라스미드 및 리포펙타민 용액을 조합하고, 5 분 동안 인큐베이션하고, 파쇄를 막기 위해 천천히 세포 상에 피펫팅하였다.
녹색 벼 원형질체의 형질전환
녹색 벼 실험을 위해, 각각의 Cas13a를 발현하는 플라스미드 및 상응하는 gRNA를 등몰비로 혼합하여 총 30 mg의 DNA를 사용하여 형질전환당 총 200,000 개의 원형질체를 형질전환시켰다.
루시페라제 활성의 측정
달리 언급되지 않는 한, 형질감염 후 48 시간에 분비된 루시페라제를 함유하는 배지를 수확하였다. 배지를 PBS로 1:5로 희석한 다음 주입 프로토콜로 Biotek Synergy 4 플레이트 판독기 상에서 NEB 사이프리디니아 및 가우시아 루시페라제 측정 키트를 사용하여 루시페라제 활성을 측정하였다. 모든 반복실험은 생물학적 반복실험으로 수행하였다.
총 RNA의 수확 및 정량적 PCR
형질감염 48 시간 후, 세포 수확 및 cDNA 생성을 위한 역전사는 시판되는 Cells-to-Ct 키트(Thermo Fisher Scientific)의 이전에 기재된 변형92을 사용하여 수행하였다. 그 다음 전사물 발현은 Fast Advanced Master Mix(Thermo Fisher Scientific) 및 GAPDH 대조군 프로브(Thermo Fisher Scientific)를 갖는 TaqMan qPCR 프로브(Thermo Fisher Scientific, 보충 표 7 및 8)를 사용하여 qPCR로 정량화하였다. 모든 qPCR 반응은 384-웰 포맷에서 4 기술적 반복실험으로 5 uL 반응에서 수행하였고, LightCycler 480 Instrument II(Roche)를 사용하여 판독하였다. 다중화된 표적화 반응의 경우, 상이한 표적의 판독은 별도의 웰에서 수행하였다.
발현 수준은 표적 Ct 값으로부터 하우스키핑 대조군(GAPDH) Ct 값을 빼는 것으로 계산하여 총 입력에 대해 정규화하고, ΔCt 수준을 얻었다. 상대적 전사물 존재량은 2^(-ΔCt)로 계산하였다. 모든 반복실험은 생물학적 반복실험으로 수행하였다.
표적 접근 가능성에 대한 컴퓨터 분석
먼저 표적 접근 가능성을 분석하기 위해, 타일링 스크린으로부터 상위 가이드를 분석하였고, 접근 가능성의 영역이 있다면 그 영역에서 다수의 가이드가 매우 활성있을 것임을 기대할 수 있다는 가정 하에, 그들이 예상보다 서로 가깝게 그룹화하였는지 여부를 결정하였다. Gluc 타일링 스크린에 대해서는 상위 20% 성능 가이드 및 Cluc, KRAS 및 PPIB 타일링 스크린에 대해서는 상위 30% 성능 가이드로 상위 가이드를 정의하였다. 무작위로 시뮬레이션된 10,000 개의 가이드 위치에 의하여 가이드 간 쌍 거리에 대한 귀무 확률 분포를 생성한 다음 실험적으로 결정된 상위 가이드 쌍 거리를 비교하였다.
접근 가능성은 Vienna RNA 소프트웨어 세트93에서 RNApl 폴드 알고리즘을 사용하여 예측하였다. 70 nt의 기본 윈도우 크기를 사용하였고 쌍이 되지 않은 표적 영역의 확률은 표적 영역에 걸친 28 개의 단일-뉴클레오티드 쌍 없는 확률의 평균으로 계산하였다. 이들 접근 가능성 곡선을 스무딩하고 4 개 전사물 각각에 걸쳐 스무딩된 녹다운 곡선과 비교하였고, 두 인자 간의 상관 관계를 피어슨 상관 계수를 사용하여 계산하였다. 이들 두 인자의 확률 공간은 또한 두 변수에 걸쳐 2D 커널 밀도 추정을 수행하여 시각화하였다.
RNA 시퀀싱 및 분석
LwaCas13a 녹다운의 특이성을 결정하기 위해, LwaCas13a 및 shRNA 작제물 모두를 포함하는 녹다운 실험 유래의 mRNA상에서 RNA 시퀀싱을 수행하였다. 총 RNA는 Qiagen RNeasy Plus Mini mit를 사용하여 48 시간 후 형질감염 실험으로부터 제조하였다. 그 다음 NEBNext® Poly(A) mRNA 자기 단리 모듈을 사용하여 mRNA를 추출하고 Illumina®를 위한 NEBNext® Ultra™ 방향성 RNA 라이브러리 프렙 키트를 사용하여 RNA-seq 라이브러리를 제조하였다. RNA-시퀀싱 라이브러리는 Illumina NextSeq 장비 상에서 라이브러리당 적어도 10 M 리드(read)로 시퀀싱하였다.
RefSeq GRCh38 어셈블리를 사용하여 인덱스를 생성하고 디폴트 파라미터94를 사용하여 Bowtie 및 RSEM v1.2.31을 사용하여 리드를 정렬하고 정량하였다. 발현 수를 위해 백만 당 전사물(TPM) 값을 사용하였고 log2(TPM+1)를 취하여 로그-공간으로 변환하였다.
차등적으로 발현된 유전자를 찾기 위해, 3 개의 표적화 반복실험 대 3 개의 비-표적화 반복실험에 대하여 스튜던트 t-검정을 수행하였다. 통계 분석은 6 개의 반복실험 중 적어도 2 개에서 log2(TPM+1) 값이 2.5 초과인 유전자에 대해서만 수행하였다. 차등적 발현이 2보다 크거나 0.75보다 작고, 0.10 미만의 거짓 발견율인 유전자만이 유의미하게 차등적으로 발현되는 것으로 보고되었다.
반복실험과 반복실험의 평균 사이의 교차 상관은 켄달의 타우 계수를 사용하여 수행하였다. shRNA 대 Cas13a 라이브러리의 변동은 6 개의 반복실험(3 개의 표적화 및 3 개의 비-표적화 반복실험)에 걸친 유전자 발현에 대한 표준 편차의 분포를 고려하여 분석하고 바이올린 플롯으로 플로팅하였다.
포유류 세포에서의 부수적 활성에 대한 LwaCas13a 평가
LwaCas13a는 임의의 잠재적인 성장 제한 효과에 대해 시험함으로써 부수적 활성에 대해 추가적으로 평가하였다. 포유류 세포를 루시퍼라제 리포터 표적, 가이드 플라스미드, 및 LwaCas13a 또는 약물-선택성 LwaCas13a중 하나로 형질감염시켰다. 형질감염 24 시간 후, 세포를 새 배지로 1:5 분할하고 약물-선택성 LwaCas13a 샘플을 10 ug/mL 블라스티시딘 에스(Thermo Fisher Scientific)로 보충하였다. 추가 성장 48 시간 후, 루시페라제 녹다운, 다중모드 플레이트 판독기(Biotek Neo2) 상의 GFP 형광 측정을 통한 LwaCas13a 발현 유지, 및 CellTiter-Glo® 발광 세포 생존력 분석(Promega)에 의한 세포 성장에 대하여 세포를 분석하였다.
RIP를 이용한 dCas13a 결합 정량화
RNA 면역침강 실험을 위해, HEK293FT 세포를 6-웰 플레이트에 플레이팅하고, 리포터 표적화를 수반하는 조건의 경우 추가적인 150 ng의 리포터 플라스미드와 함께, 1.3 ug의 dCas13a 발현 플라스미드 및 1.7 ug의 가이드 플라스미드로 형질감염시켰다. 형질감염 48 시간 후, 세포를 얼음-냉각시킨 PBS(Sigma)로 2 회 세척하고 실온에서 15 분 동안 PBS 중의 0.2% 파라포름알데히드(Electron Microscopy Sciences)로 고정시켰다. 고정 후, 파라포름알데히드를 제거하고, PBS 중의 125 mM 글리신을 첨가하여 가교 결합을 소멸시키고, 세포를 10 분 동안 인큐베이션하였다. 세포를 얼음-냉각시킨 PBS로 다시 2 회 세척하고, 스크래핑하여 수확하고, 세포 현탁액을 800g에서 4 분 동안 원심분리하여 세포를 펠렛화하였다. 상청액을 제거하고 펠렛을 용해 전에 PBS로 세척하였다. 세포를 cOmplete™ ULTRA Tablets, EDTA-없음(Sigma) 및 리보뉴클레아제 저해제(Sigma R1158)로 보충된 1X RIPA 완충액(Cell Signaling) 200 uL로 용해시켰다. 세포를 얼음 위에서 10 분 동안 용해되도록 둔 다음 Bioruptor 초음파 분쇄기(Diagenode)상에서 저 강도에서 30 초 켜기/30 초 끄기 주기로 2 분 동안 초음파처리 하였다. 불용성 물질을 4C에서 16,000 g에서 10 분 동안 원심분리하여 펠렛화하고, 맑아진 용해물을 함유하는 상청액을 자성 비드를 이용하여 풀다운하기 위해 사용하였다.
항체를 자기 비드에 스플라이싱시키기 위해, 면역침강을 위한 Dynabeads® 단백질 A(Thermo Fisher Scientific) 샘플당 100 μL 를 자석을 적용하여 펠렛화하고, 상청액을 제거하였다. 비드를 200 μL의 세척 완충액(0.02% Tween-20(Sigma)으로 보충된 PBS)에 재현탁시키고 5 μg의 토끼 항-마우스 IgG(Sigma M7023)를 첨가하였다. 샘플을 회전기 상에서 실온에서 10 분 동안 인큐베이션하여 항체가 비드에 스플라이싱되도록 하였다. 인큐베이션 후, 비드를 자석을 통해 펠렛화하고, 상청액을 제거하고, 비드를 세척 완충액으로 2 회 세척하였다. 펠렛을 100 μL 세척 완충액에 재현탁하고 항-HA 항체(Thermo Fisher Scientific 26183) 또는 IgG 항체 대조군(Sigma I5381)의 스플라이싱을 위해 2 개의 50 μL 부피로 분할하였다. 각각의 항체에 대해 2.5 μg의 항체를 200 μL 세척 완충액과 함께 첨가하고 회전기 상에서 실온에서 10 분 동안 인큐베이션하였다. 인큐베이션 후, 비드를 자석을 통해 펠렛화하고 세척 완충액으로 2 회 세척하고 리보뉴클레아제 저해제(Sigma R1158) 및 프로테아제 저해제 칵테일(Sigma P8340)을 포함하는 200 μL 1X RIPA에 재현탁하였다. 샘플 용해물 100 μL를 비드에 첨가하고 4℃에서 하룻밤 동안 회전시켰다.
샘플 용해물과 함께 인큐베이션 후, 비드를 펠렛화하고, 1X RIPA, 0.02% Tween-20으로 3 회 세척한 다음, 디엔아제 완충액(350 mM Tris-HCl [pH 6.5]; 50 mM MgCl2; 5 mM DTT)으로 세척하였다. 비드를 디엔아제 완충액에 재현탁시키고, TURBO 디엔아제(Life Technologies)를 0.08 유닛/μl의 최종 농도로 첨가하였다. 디엔아제를 회전기상에서 37℃에서 30 분 동안 인큐베이션하였다. 그 다음 0.1 유닛/μl의 최종 농도로 프로테이나제 K(New England Biosciences)를 첨가하여 단백질을 분해하고 37℃에서 추가 30 분 동안 회전하며 인큐베이션하였다. 변성 및 정제를 위해 우레아(Sigma)를 최종 농도 2.5 M로 첨가하고 샘플을 30 분 동안 인큐베이션하고, Direct-Zol RNA 미니프렙(Zymo Research)을 사용하여 RNA를 정제하였다. 정제된 RNA는 qScript Flex cDNA(Quantabio)를 사용하여 cDNA로 역전사하였고, 풀다운은 Fast Advanced Master Mix 및 TaqMan qPCR 프로브(보충 표 7 및 8)를 사용하여 qPCR로 정량되었다. 모든 qPCR 반응은 384-웰 포맷에서 4 회 기술적 반복실험으로 5 μL 반응으로 수행하였고, LightCycler 480 Instrument II를 사용하여 판독하였다. 강화는 매치되는 IgG 항체 대조군과 비교하여 샘플에 대하여 정량하였다.
LwaCas13a 및 LwaCas13a-NF의 전위 측정
HEK293FT 세포를 폴리-D-리신 커버슬립(Corning) 상의 24-웰 조직 배양 플레이트에 플레이팅하고 ACTB 이미징을 위한 dCas13a-NF 벡터 150 ng 및 300 ng의 가이드로 형질감염시켰다. 전위 실험을 위해서, 세포를 4% PFA로 고정시키고 48 시간 후에 0.2% Triton X-100으로 투과성을 높이고 DAPI(Vectashield)를 갖는 안티페이드 마운팅(antiface mounting) 매질을 사용하여 마운팅하였다. 공초점 현미경 관찰은 Andor Yokagawa Spinning disk Revolution WD 시스템을 갖는 Nikon Eclipse Ti1을 사용하여 수행하였다.
ACTB mRNA를 표적화하는 가이드를 갖는 dCas13a-NF-msfGFP의 핵 방출을 평균 세포질 및 핵 msfGFP 형광을 측정하고 표적화 및 비-표적화 조건 간의 많은 세포에 걸친 비율을 비교함으로써 분석하였다.
ACTB 전사물의 형광 인 시츄 혼성화(FISH)
HEK293FT 세포를 폴리-D-리신 커버슬립(코닝)상의 24-웰 조직 배양 플레이트에 플레이팅하고 ACTB를 이미징하기 위한 dCas13a-NF 벡터 75 ng 및 가이드 250 ng으로 형질감염시켰다. 48 시간 후, 세포를 4% PFA로 45 분 동안 고정시켰다. QuantiGene viewRNA ISH 세포 분석 키트(Affymetrix)는 세포 샘플 상에서 FISH를 수행하기 위해 사용하였으며 프로토콜은 제조업자에 의해 기재된 바대로 따랐다. FISH 절차를 완료한 후, 안티페이드 마운팅 매질(Vectashield)을 사용하여 커버슬립을 마운팅하였다. 공초점 현미경 관찰은 Andor Yokagawa Spinning disk Revolution WD 시스템을 갖는 Nikon Eclipse Ti1을 사용하여 수행하였다.
스트레스 과립에 대한 LwaCas13a 추적
HEK293FT 세포를 폴리-D-리신 커버슬립(코닝) 상의 24-웰 조직 배양 플레이트에 플레이팅하고 ACTB를 이미징하기 위한 dCas13a-NF 벡터 75 ng 및 250 ng 가이드로 형질감염시켰다. 스트레스 과립 실험을 위해, 세포를 고정시키고 투과성 높이기 전에 200 μM 소듐 아르세나이트를 1 시간 동안 적용하였다. G3BP1의 면역형광을 위해, 세포를 20% 염소 혈청으로 차단하고, 항-G3BP1 일차 항체(Abnova H00010146-B01P)로 실온에서 하룻밤 동안 인큐베이션하였다. 그 다음 세포를 Alexa 플루오르 594로 표지된 이차 항체와 함께 인큐베이션하고 DAPI(Vectashield)가 있는 안티페이드 마운팅 매질을 사용하여 마운팅하였다. 공초점 현미경 관찰은 Andor Yokagawa Spinning disk Revolution WD 시스템을 갖는 Nikon Eclipse Ti1을 사용하여 수행하였다.
스트레스 과립의 dCas13a-NF-msfGFP와의 공동-국소화는 피어슨 상관 계수를 사용한 세포당 평균 msfGFP 및 G3BP1 신호를 사용하여 계산하였다. 공동국소화 분석은 Coloc 2 플러그인을 사용하여 이미지 분석 소프트웨어 FIJI95에서 수행하였다.
라이브 이미징 실험을 위해, HEK293FT 세포를 96-웰 조직 배양 플레이트에 플레이팅하고 ACTB 이미징을 위한 150 ng dCas13a-NF 벡터, 300 ng의 가이드, 및 5 ng의 G3BP1-RFP 리포터로 형질감염하였다. 48 시간 후, 세포를 0 μM 또는 400 μM 소듐 아르세나이트를 겪게 하고 20x 물 대물렌즈를 갖는 회전 디스크 공초점 세팅을 사용하여 Opera Phenix™ 고 함량 스크리닝 시스템(PerkinElmer) 상에서 매 2 시간마다 매 15 분마다 이미징하였다. 세포를 50% CO2를 갖는 가습 챔버에서 37℃로 유지시켰다. 스트레스 과립에서살아있는 세포 dCas13a-NF-msfGFP의 G3BP1-RFP와의 공동국소화는 Opera Phenix Harmony 소프트웨어(PerkinElmer)를 사용하여 측정하였다.
표적 접근 가능성 및 녹다운의 상관관계
출원인은 LshCas13a가 우연에 의해 예상되는 것보다 더 근접하게 함께 그룹화된 매우 효과적인 가이드로 한정된 위치에서 MS2 ssRNA 게놈을 표적화함을 보여주었다1. 출원인은 효과적인 가이드의 클러스터가 표적 결합의 입체 배치 및 이용 가능성으로 인해 LshCas13a에 의해 더 잘 표적화되는 접근 가능성 영역으로부터 발생할 수 있다고 추정하였다. 이들 결과가 LwCas13a를 이용한 포유류 mRNA의 표적화에까지 확장될 지 여부를 분석하고자 하였고 그래서 가이드로 타일링한 4 개 유전자: Gluc, Cluc, KRAS 및 PPIB에 대해 유사한 분석을 수행하였다. 먼저 효과적인 가이드를 녹다운 효율에 의해 측정된 바와 같이 Gluc에 대해서는 상위 20%의 가이드 및 다른 3 개 유전자에 대해서는 상위 30%의 가이드로 정의하였다(Gluc보다 50% 더 적은 가이드로 타일링하였으므로 Cluc, KRAS 및 PPIB에 대한 임계값에 대해 더 관대하다는 것을 주의). 이들 임계값을 사용하여 정의된 가장 효과적인 가이드만 분석함에 있어서, 그들은 우연에 의해 예상되는 것보다 더 근접하게 함께 모여있는 것으로 나타났다.
다음으로, Vienna RNA 소프트웨어 모음으로부터 RNAplfold 알고리즘을 사용하여 표적 전사물의 접근 가능성을 모델링하고자 하였다. 윈도우 크기 70(기본값)에 걸쳐 접근 가능성 및 전사물 상의 주어진 뉴클레오티드 위치가 쌍이 없을 확률을 계산하였다. 그 다음, 주어진 가이드에 대해, 주어진 가이드 표적이 쌍이 없고 따라서 접근 가능할 평균 확률을 얻기 위해 28 nt에 걸친 확률을 평균화할 수 있다. 이 계산을 표적 접근 가능성에 대한 측정으로서 취하고 각각의 가이드에 대한 표적 발현에 대하여 비교한다. 가이드별로 발생하는 변동 때문에, 특히 유전자를 조밀하게 타일링하지 않았기 때문에, 표적 접근 가능성 및 표적 발현 곡선 모두를 스무딩하기로 결정하였다. 이들 곡선을 플롯팅하고 상관관계를 분석함으로써 표적 접근 가능성이 표적 발현과 유의미한 상관관계가 있고 표적 발현에서의 변동의 4.4% 내지 16%를 설명할 수 있음을 밝혔다. 스무딩의 거짓 효과를 상쇄하기 위해 커널 밀도 추정을 사용하여 확률 공간에서의 확률 대 녹다운 데이터를 또한 분석하였다. 이 분석은 염기쌍 형성된 표적 영역의 확률 및 표적 발현 사이에 유사한 양의 관계를 밝혔다. 마지막으로, 염기쌍 형성 확률에 대한 거짓 상관관계를 만드는 RNAplfold의 임의의 파라미터-특이적 측면을 상쇄하기 위해, 윈도우 크기 및 k-mer 크기의 파라미터 그리드에 대해 쌍이 없을 확률을 계산했다. 처음에 1의 k-mer에 대한 확률 즉, 주어진 위치가 쌍이 없고 28 nt 표적 영역에 걸쳐 평균화된 확률만을 계산하였다. k=2에서, 뉴클레오티드 쌍이 쌍이 없을 확률을 계산하고 28 nt 영역에 걸쳐 그들을 평균화하고 28까지의 k에 대하여 계속한다. 이 분석은 각각의 전사물에 대해 양의 상관 관계를 만드는 파라미터 영역을 밝혔고 이는 상관관계를 제공하는 것은 특정 파라미터 세트만이 아니라는 확신을 더 제공한다. 예상할 수 있듯이, KRAS와 같은 더 큰 전사물은 더 큰 윈도우 크기에 대해 양의 상관관계를 갖고 PPIB와 같은 더 작은 전사물은 훨씬 더 작은 윈도우 크기에 대해 양의 상관관계를 갖는다.
shRNA 및 Cas13a 사이의 표적 녹다운 특이성 비교
shRNA 및 Cas13a 전사물 녹다운 특이성 사이의 엄밀한 비교를 위해, 표적화 및 비-표적화 대조군 사이에 비교된 트랜스크립톰 전체에 걸친 변동의 효과를 평가하고자 하였다. 표적외는 동일성 라인에서부터 편차로서 나타날 것이며, 리포터 작제물을 표적화할 때 Cas13a보다 shRNA에 대해 더 많은 표적외가 발생함은 명백하다. 유사한 증가된 편차가 내인성 유전자에 대해 발생한다. 내인성 전사물의 녹다운이 생물학적 기능의 변화로 인한 추가적인 유전자 발현 변화를 초래할 것으로 예상될 수 있는 반면, Cas13a를 이용한 PPIB 및 KRAS 녹다운은 발현 변화를 초래하지 않았음을 발견하였고, 이는 아마도 녹다운의 수준이 실질적인 다운스트림 효과에 충분하지 않기 때문이다.
다음으로, 차등적 유전자 발현을 통해 표적외의 수를 정량화하였다: 표적외 전사물은 적어도 100% 상향 조절 또는 25% 하향 조절을 갖는 유전자로 정의한다. 그 다음, 유의미한 표적외를 표적화 및 비-표적화 조건 사이에서 스튜던트 t-검정에 의해0.1의 FDR로 Benjamini-Hochberg 절차를 통해 보정된 다중 비교로 비교하였다. 시험된 3 개 전사물 모두에서 shRNA 표적화의 결과로 수백 개의 유의미한 표적외 전사물이 있었으나, Cas13a 표적화의 결과로는 유의미한 표적외가 없었음을 밝혔다.
표적화 및 비-표적화 조건 사이의 shRNA 변동에서의 큰 변동은, 생물학적 반복실험 사이에 유사한 편차를 초래할, 증가된 전체 유전자 발현 변이로 인한 것이거나, 동일 조건에 대한 반복실험 사이에서 증가된 상관관계로 나타날, 재현가능하고 일관된 표적외로 인한 것일 수 있다. Gluc 변동에 대해 비-표적화 및 표적화 반복실험을 서로와 비교하면서, 반복실험 사이에는 거의 변동이 없음을 발견하였다. 그러나, shRNA 또는 Cas13a에 대해 표적화 조건 대 모든 비-표적화 조건의 개별 반복실험을 비교하였을 때, 반복실험 간의 비교는 평균 측정에서 보여진 표적외를 재정리했음을 발견하였다. 반복실험 간의 상관 관계를 정량화하기 위해, 리포터 및 내인성 유전자 전반에 걸쳐 표적화 및 비-표적화 조건에 대한 모든 반복실험을 비교하였다. shRNA 샘플은 비-표적화 및 표적화 조건 사이보다 반복실험 내에서 더 높은 상관 관계를 보였으나, Cas13a 샘플 간의 상관 관계는 표적화 및 비-표적화 변동 사이에서 더 적은 변동을 가졌다. 그 다음, 모든 샘플을 서로 비교하여 shRNA 샘플이 샘플 간에 더 낮은 상관관계를 갖고 Cas13a내에서 보다 Cas13a와 더 낮은 상관관계를 가짐을 밝혔고, 이는 Cas13a가 더 일관성이 있음을 나타낸다. 마지막으로, 표적화 및 비-표적화 반복실험 모두에 걸쳐 유전자 당 표준 편차를 계산하였고, 표준 편차의 분포는 트랜스크립톰에 걸쳐 shRNA 변동에서보다 Cas13a 변동에서 더 낮음을 밝혔다. 전체적으로, 이 증거는 Cas13a 표적화가 트랜스크립톰 전체에 걸친 변동을 더 적게 초래함을 나타낸다.
포유류 세포에서 부수적 활성 결여에 대한 증거
LshCas13a 및 LwCas13a는 시험관내에서 견고한 부수적 활성을 나타내는 것으로 보인다. 부수적 효과로 인한 세포 건강 및 LwCas13a 녹다운의 특이성에 대한 우려때문에, 부수적 효과가 포유류 세포에서 실제로 존재하는지 여부를 연구하려고 시도하였다. 원고 전체에 걸쳐 LwCas13a에 대한 부수적 활성의 결여를 시사하는 데이터를 수집하고, 여기서 모든 증거 조각을 모아 상세하게 논의한다.
1. RNA 시퀀싱: RNA 시퀀싱을 수행하여 LwCas13a 녹다운의 특이성을 결정하였고, LwCas13a가 RNAi보다 훨씬 더 높은 특이성을 나타냄을 발견하였다. 차등적 발현 분석에서, 표적 전사물의 유의미한 녹다운에도 불구하고, 분석된 임의의 LwCas13a 조건에 대해 유의미한 차등적 발현된 표적외가 없었다. 인간 트랜스크립톰에서 모든 전사물의 균일한 녹다운이 없었다고 가정할 때, 이는 LwCas13a에 의한 녹다운이 특이적이고 포유류 세포에서 부수적 효과가 없다는 실질적 증거를 제공하는 것으로 여겨진다.
2. 타일링 스크린: 수행한 4 가지 유전자 타일링 스크린에서, 정규화에 사용된 대조군 유전자의 녹다운을 보지 못하였다. 이것은 트랜스크립톰이 아닌 하나의 다른 유전자에만 초점을 맞춤에도 불구하고 RNA 시퀀싱 유사한 분석이다. 그러나 시험된 수백 개의 가이드에 걸쳐 부수적 활성을 보지 못했기 때문에, LwCas13a가 생체내에서 부수적 활성을 강력하게 나타내지 않는다는 확신을 제공하면서, 이 결과는 중요하다.
3. 단일 제거 다중화: 다중화 실험에서 유전자 녹다운의 특이성을 확인하기 위해, 3 개의 상이한 유전자에 대한 가이드를 함유하는 가이드 발현 어레이에서 각각의 유전자-표적화 가이드가 비-표적화 가이드로 대체되는 실험을 설계했다. 부재한 가이드에 의해 표적화된 유전자에 대한 유전자 발현에 유의미한 변화가 없음을 발견하였다. 가이드의 존재 유무에도 불구하고 3 가지 유전자 모두 항상 녹다운을 나타낼 것으로 기대되기 때문에, 이는 또한 포유류 세포에서의 부수적 활성의 결여에 대한 좋은 입증으로 여겨진다.
4. 성장 실험: 이전에, 출원인은 LshCas13a가 유전자 녹다운 동안 박테리아에서 성장 제한을 야기함을 보였다1. 포유류 세포에서의 녹다운의 성장 효과가 있는지 여부를 측정하기 위한 간단한 실험을 설계하였다. Gluc를 표적화하는 LwCas13a를 갖는 세포를 72 시간 동안 성장하도록 둔 다음 세포 생존력을 측정하였고 표적화 및 비-표적화 가이드 조건 사이에 성장에서의 차이가 없음을 발견하였다. C-말단 msfGFP 융합의 형광을 관찰함으로써 LwCas13a 발현에 대해 추가로 제어하였고 발현은 모든 조건에 걸쳐 동일했고 잠재적으로 해로운 표현형으로 인해 선택되지 않음을 밝혔다. RNA 세포질 밀도, 사이토졸 조성, 및 절단된 전사물의 가공 메커니즘에서의 차이를 포함하여, 박테리아 성장 억제에 대한 이전 관찰에도 불구하고 포유류 세포에서 성장 저해의 결여에 대한 많은 가능한 원인이 있다.
포인트 1 내지 3은 표적화된 유전자 녹다운이 표적화된 유전자 이외의 다른 유전자에 영향을 미치지 않음을 총괄하여 나타내고 포인트 4는 유전자 녹다운에 대한 관찰 가능한 부작용이 없음을 나타낸다. 이 데이터는 모두 포유류 세포에서의 LwCas13a 부수적 활성의 결여에 대한 실질적인 증거이며 Cas13 녹다운은 매우 특이적인 것으로 여겨진다.
dCas13a 이미징을 위한 음성-피드백 작제물의 중요성
살아있는 세포 이미징을 위해, 높은 신호 대 잡음 비를 유지하고 배경을 감소시키는 것이 중요하다. dCas13a와 같은 형광단-표지된 작제물의 경우, 결합되지 않은 dCas13a는 세포에서 제거될 수 없거나 결합된 단백질과 구별될 수 없기 때문에, 배경에 대한 우려가 특히 중요하다. 배경을 감소시키는 한 가지 접근법은 핵 국소화 신호(NLS) 태그를 통해 핵에 단백질을 격리하는 것이고; 발생기 전사물 결합 즉시 단백질은 일시적으로 세포질로 방출된다. 이 기술은 MS2 시스템에서 활용되었지만, 표적외 핵 유출 및 표적내 핵 탈출로 인하여 이것은 불완전함을 발견하였다. 출원인은 NLS-태깅만 있는 경우의 신호 대 잡음을 향상시키기 위해, 핵 상주 단백질이 dCas13a의 추가 발현을 저해할 음성 피드백 시스템을 포함시켰다. 음성 피드백 조절은 세포질로의 가짜 전위를 감소시키고 표적화 조건과 비교하여 비-표적화 조건에서의 dCas13a-NF 수준의 전체적인 수준의 감소를 유도함으로써 이미징 도구로서의 dCas13a의 활용성을 증가시킴을 밝혔다.
보충 표
[보충 표 1]
[보충 표 2]
[보충 표 3]
[보충 표 4]
[보충 표 5]
[보충 표 6]
[보충 표 7]
[보충 표 8]
[보충 표 9]
* * *
본 발명의 선호되는 구현예가 본 명세서에 나타나고 기재되었지만, 이러한 구현예가 단지 예로서 제공된 것임이 당업자에게 자명할 것이다. 이제 본 발명을 벗어나지 않으면서 많은 변이, 변화, 및 치환이 당업자에게 떠오를 것이다. 본 명세서에 기재된 본 발명의 일 구현예에 대한 다양한 대안이 본 발명을 실시함에 있어서 이용될 수 있음이 이해되어야 한다. 다음의 청구항이 본 발명의 범위를 규정하고 이들 청구항의 범위 내의 방법 및 구조 및 이들의 균등물이 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING <110> THE BROAD INSTITUTE INC. MASSACHUSETTS INSTITUTE OF TECHNOLOGY PRESIDENT AND FELLOWS OF HARVARD COLLEGE <120> NOVEL TYPE VI CRISPR ORTHOLOGS AND SYSTEMS <130> 47627.99.2133 <140> PCT/US2017/038154 <141> 2017-06-19 <150> 62/484,786 <151> 2017-04-12 <150> 62/471,792 <151> 2017-03-15 <150> 62/432,240 <151> 2016-12-09 <150> 62/410,366 <151> 2016-10-19 <150> 62/376,377 <151> 2016-08-17 <150> 62/351,803 <151> 2016-06-17 <150> 62/351,662 <151> 2016-06-17 <160> 577 <170> PatentIn version 3.5 <210> 1 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 1 atcagggcaa acagaacttt gactccca 28 <210> 2 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 2 agatccgtgg tcgcgaagtt gctggcca 28 <210> 3 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 3 tcgccttcgt aggtgtggca gcgtcctg 28 <210> 4 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 4 tagattgctg ttctaccaag taatccat 28 <210> 5 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 5 tcgccttcgt aggtgtggca gcgtcctg 28 <210> 6 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 6 tagattgctg ttctaccaag taatccat 28 <210> 7 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 7 tgaacagctc ctcgcccttg ctcaccat 28 <210> 8 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 8 tcagcttgcc gtaggtggca tcgccctc 28 <210> 9 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 9 gggtagcggc tgaagcactg cacgccgt 28 <210> 10 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 10 ggtcttgtag ttgccgtcgt ccttgaag 28 <210> 11 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 11 tactccagct tgtgccccag gatgttgc 28 <210> 12 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 12 cacgctgccg tcctcgatgt tgtggcgg 28 <210> 13 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 13 tctttgctca gggcggactg ggtgctca 28 <210> 14 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 14 gacttgtaca gctcgtccat gccgagag 28 <210> 15 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 15 ctgctgccac agaccgagag gcttaaaa 28 <210> 16 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 16 tccttgatta cacgatggaa tttgctgt 28 <210> 17 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 17 tcaaggtggg gtcacaggag aagccaaa 28 <210> 18 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 18 atgataatgc aatagcagga caggatga 28 <210> 19 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 19 gcgtgagcca ccgcgcctgg ccggctgt 28 <210> 20 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 20 ccagctgcag atgctgcagt ttttggcg 28 <210> 21 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 21 ctggaaatgg aagatgccgg catagcca 28 <210> 22 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 22 gatgacacct cacacggacc acccctag 28 <210> 23 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 23 taatactgct ccagatatgg gtgggcca 28 <210> 24 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 24 catgaagacc gagttataga atactata 28 <210> 25 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 25 ggtgaaatat tctccatcca gtggtttc 28 <210> 26 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 26 aatttctcga actaatgtat agaaggca 28 <210> 27 <211> 7 <212> PRT <213> Simian virus 40 <400> 27 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 28 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Nucleoplasmin bipartite NLS sequence" <400> 28 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 29 <211> 9 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: C-myc NLS sequence" <400> 29 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 30 <211> 11 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: C-myc NLS sequence" <400> 30 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 31 <211> 38 <212> PRT <213> Homo sapiens <400> 31 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 32 <211> 42 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: IBB domain from importin-alpha sequence" <400> 32 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 33 <211> 8 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Myoma T protein sequence" <400> 33 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 34 <211> 8 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Myoma T protein sequence" <400> 34 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 35 <211> 8 <212> PRT <213> Homo sapiens <400> 35 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 36 <211> 12 <212> PRT <213> Mus musculus <400> 36 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 37 <211> 5 <212> PRT <213> Influenza virus <400> 37 Asp Arg Leu Arg Arg 1 5 <210> 38 <211> 7 <212> PRT <213> Influenza virus <400> 38 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 39 <211> 10 <212> PRT <213> Hepatitis delta virus <400> 39 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 40 <211> 10 <212> PRT <213> Mus musculus <400> 40 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 41 <211> 20 <212> PRT <213> Homo sapiens <400> 41 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 42 <211> 17 <212> PRT <213> Homo sapiens <400> 42 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 43 <211> 11 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: NES sequence" <400> 43 Leu Tyr Pro Glu Arg Leu Arg Arg Ile Leu Thr 1 5 10 <210> 44 <211> 33 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: NES sequence" <400> 44 ctgtaccctg agcggctgcg gcggatcctg acc 33 <210> 45 <211> 1001 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic consensus sequence" <220> <221> MOD_RES <222> (7)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(16) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (22)..(22) <223> Any amino acid <220> <221> MOD_RES <222> (29)..(29) <223> Any amino acid <220> <221> MOD_RES <222> (36)..(36) <223> Any amino acid <220> <221> MOD_RES <222> (42)..(43) <223> Any amino acid <220> <221> MOD_RES <222> (48)..(48) <223> Any amino acid <220> <221> MOD_RES <222> (52)..(53) <223> Any amino acid <220> <221> MOD_RES <222> (57)..(57) <223> Any amino acid <220> <221> MOD_RES <222> (59)..(59) <223> Any amino acid <220> <221> MOD_RES <222> (69)..(71) <223> Any amino acid <220> <221> MOD_RES <222> (73)..(73) <223> Any amino acid <220> <221> MOD_RES <222> (75)..(75) <223> Any amino acid <220> <221> MOD_RES <222> (78)..(79) <223> Any amino acid <220> <221> MOD_RES <222> (86)..(86) <223> Any amino acid <220> <221> MOD_RES <222> (89)..(89) <223> Any amino acid <220> <221> VARIANT <222> (90)..(90) <223> /replace="Ile" <220> <221> MOD_RES <222> (101)..(101) <223> Any amino acid <220> <221> MOD_RES <222> (104)..(104) <223> Any amino acid <220> <221> MOD_RES <222> (111)..(111) <223> Any amino acid <220> <221> MOD_RES <222> (116)..(116) <223> Any amino acid <220> <221> MOD_RES <222> (121)..(121) <223> Any amino acid <220> <221> MOD_RES <222> (128)..(130) <223> Any amino acid <220> <221> MOD_RES <222> (133)..(133) <223> Any amino acid <220> <221> MOD_RES <222> (145)..(145) <223> Any amino acid <220> <221> MOD_RES <222> (148)..(148) <223> Any amino acid <220> <221> MOD_RES <222> (167)..(167) <223> Any amino acid <220> <221> MOD_RES <222> (174)..(174) <223> Any amino acid <220> <221> MOD_RES <222> (192)..(192) <223> Any amino acid <220> <221> MOD_RES <222> (194)..(195) <223> Any amino acid <220> <221> MOD_RES <222> (199)..(199) <223> Any amino acid <220> <221> MOD_RES <222> (202)..(203) <223> Any amino acid <220> <221> MOD_RES <222> (206)..(206) <223> Any amino acid <220> <221> MOD_RES <222> (217)..(219) <223> Any amino acid <220> <221> MOD_RES <222> (228)..(228) <223> Any amino acid <220> <221> MOD_RES <222> (233)..(233) <223> Any amino acid <220> <221> VARIANT <222> (236)..(236) <223> /replace="Ile" <220> <221> MOD_RES <222> (243)..(243) <223> Any amino acid <220> <221> MOD_RES <222> (245)..(245) <223> Any amino acid <220> <221> MOD_RES <222> (262)..(262) <223> Any amino acid <220> <221> VARIANT <222> (267)..(267) <223> /replace="Ile" <220> <221> MOD_RES <222> (277)..(278) <223> Any amino acid <220> <221> MOD_RES <222> (282)..(282) <223> Any amino acid <220> <221> MOD_RES <222> (287)..(287) <223> Any amino acid <220> <221> MOD_RES <222> (307)..(307) <223> Any amino acid <220> <221> MOD_RES <222> (314)..(314) <223> Any amino acid <220> <221> MOD_RES <222> (320)..(321) <223> Any amino acid <220> <221> MOD_RES <222> (333)..(333) <223> Any amino acid <220> <221> MOD_RES <222> (343)..(343) <223> Any amino acid <220> <221> MOD_RES <222> (357)..(357) <223> Any amino acid <220> <221> MOD_RES <222> (367)..(367) <223> Any amino acid <220> <221> MOD_RES <222> (371)..(371) <223> Any amino acid <220> <221> MOD_RES <222> (374)..(375) <223> Any amino acid <220> <221> MOD_RES <222> (378)..(378) <223> Any amino acid <220> <221> MOD_RES <222> (392)..(392) <223> Any amino acid <220> <221> MOD_RES <222> (402)..(402) <223> Any amino acid <220> <221> MOD_RES <222> (414)..(415) <223> Any amino acid <220> <221> VARIANT <222> (418)..(418) <223> /replace="Ile" <220> <221> MOD_RES <222> (446)..(446) <223> Any amino acid <220> <221> MOD_RES <222> (448)..(449) <223> Any amino acid <220> <221> MOD_RES <222> (451)..(451) <223> Any amino acid <220> <221> MOD_RES <222> (467)..(467) <223> Any amino acid <220> <221> MOD_RES <222> (489)..(489) <223> Any amino acid <220> <221> MOD_RES <222> (500)..(500) <223> Any amino acid <220> <221> MOD_RES <222> (510)..(510) <223> Any amino acid <220> <221> MOD_RES <222> (514)..(514) <223> Any amino acid <220> <221> MOD_RES <222> (528)..(529) <223> Any amino acid <220> <221> MOD_RES <222> (532)..(532) <223> Any amino acid <220> <221> MOD_RES <222> (539)..(539) <223> Any amino acid <220> <221> MOD_RES <222> (547)..(548) <223> Any amino acid <220> <221> MOD_RES <222> (551)..(551) <223> Any amino acid <220> <221> MOD_RES <222> (553)..(554) <223> Any amino acid <220> <221> MOD_RES <222> (565)..(565) <223> Any amino acid <220> <221> MOD_RES <222> (576)..(576) <223> Any amino acid <220> <221> MOD_RES <222> (587)..(588) <223> Any amino acid <220> <221> MOD_RES <222> (600)..(600) <223> Any amino acid <220> <221> MOD_RES <222> (604)..(605) <223> Any amino acid <220> <221> MOD_RES <222> (622)..(622) <223> Any amino acid <220> <221> MOD_RES <222> (627)..(627) <223> Any amino acid <220> <221> MOD_RES <222> (629)..(629) <223> Any amino acid <220> <221> MOD_RES <222> (655)..(655) <223> Any amino acid <220> <221> MOD_RES <222> (662)..(662) <223> Any amino acid <220> <221> MOD_RES <222> (682)..(682) <223> Any amino acid <220> <221> MOD_RES <222> (686)..(686) <223> Any amino acid <220> <221> VARIANT <222> (688)..(688) <223> /replace="Ile" <220> <221> MOD_RES <222> (691)..(691) <223> Any amino acid <220> <221> MOD_RES <222> (698)..(698) <223> Any amino acid <220> <221> MOD_RES <222> (706)..(706) <223> Any amino acid <220> <221> MOD_RES <222> (723)..(723) <223> Any amino acid <220> <221> VARIANT <222> (737)..(737) <223> /replace="Ile" <220> <221> MOD_RES <222> (738)..(738) <223> Any amino acid <220> <221> MOD_RES <222> (760)..(761) <223> Any amino acid <220> <221> MOD_RES <222> (771)..(771) <223> Any amino acid <220> <221> MOD_RES <222> (773)..(773) <223> Any amino acid <220> <221> MOD_RES <222> (779)..(779) <223> Any amino acid <220> <221> MOD_RES <222> (786)..(786) <223> Any amino acid <220> <221> MOD_RES <222> (790)..(790) <223> Any amino acid <220> <221> MOD_RES <222> (798)..(798) <223> Any amino acid <220> <221> MOD_RES <222> (800)..(800) <223> Any amino acid <220> <221> MOD_RES <222> (834)..(834) <223> Any amino acid <220> <221> MOD_RES <222> (843)..(843) <223> Any amino acid <220> <221> MOD_RES <222> (851)..(852) <223> Any amino acid <220> <221> MOD_RES <222> (866)..(866) <223> Any amino acid <220> <221> MOD_RES <222> (870)..(870) <223> Any amino acid <220> <221> MOD_RES <222> (873)..(873) <223> Any amino acid <220> <221> MOD_RES <222> (877)..(877) <223> Any amino acid <220> <221> MOD_RES <222> (889)..(889) <223> Any amino acid <220> <221> MOD_RES <222> (896)..(896) <223> Any amino acid <220> <221> MOD_RES <222> (916)..(916) <223> Any amino acid <220> <221> MOD_RES <222> (923)..(923) <223> Any amino acid <220> <221> MOD_RES <222> (936)..(936) <223> Any amino acid <220> <221> MOD_RES <222> (962)..(962) <223> Any amino acid <220> <221> MOD_RES <222> (966)..(966) <223> Any amino acid <220> <221> MOD_RES <222> (970)..(970) <223> Any amino acid <220> <221> MOD_RES <222> (985)..(985) <223> Any amino acid <220> <221> MOD_RES <222> (996)..(996) <223> Any amino acid <220> <221> MISC_FEATURE <222> (1)..(1001) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 45 Met Lys Ile Ser Lys Val Xaa Xaa Xaa Val Xaa Lys Lys Xaa Xaa Xaa 1 5 10 15 Gly Lys Leu Xaa Lys Xaa Val Asn Glu Arg Asn Arg Xaa Ala Lys Arg 20 25 30 Leu Ser Asn Xaa Leu Asx Lys Tyr Ile Xaa Xaa Ile Asp Lys Ile Xaa 35 40 45 Lys Lys Glu Xaa Xaa Lys Lys Phe Xaa Ala Xaa Glu Glu Ile Thr Leu 50 55 60 Lys Leu Asn Gln Xaa Xaa Xaa Asx Xaa Leu Xaa Lys Ala Xaa Xaa Asp 65 70 75 80 Leu Arg Lys Asp Asn Xaa Tyr Ser Xaa Leu Lys Lys Ile Leu His Asn 85 90 95 Glu Asp Ile Asn Xaa Glu Glu Xaa Glu Leu Leu Ile Asn Asp Xaa Leu 100 105 110 Glu Lys Leu Xaa Lys Ile Glu Ser Xaa Lys Tyr Ser Tyr Gln Lys Xaa 115 120 125 Xaa Xaa Asn Tyr Xaa Met Ser Val Gln Glu His Ser Lys Lys Ser Ile 130 135 140 Xaa Arg Ile Xaa Glu Ser Ala Lys Arg Asn Lys Glu Ala Leu Asp Lys 145 150 155 160 Phe Leu Lys Glu Tyr Ala Xaa Leu Asp Pro Arg Met Glu Xaa Leu Ala 165 170 175 Lys Leu Arg Lys Leu Leu Glu Leu Tyr Phe Tyr Phe Lys Asn Asp Xaa 180 185 190 Ile Xaa Xaa Glu Glu Glu Xaa Asn Val Xaa Xaa His Lys Xaa Leu Lys 195 200 205 Glu Asn His Pro Asp Phe Val Glu Xaa Xaa Xaa Asn Lys Glu Asn Ala 210 215 220 Glu Leu Asn Xaa Tyr Ala Ile Glu Xaa Lys Lys Leu Leu Lys Tyr Tyr 225 230 235 240 Phe Pro Xaa Lys Xaa Ala Lys Asn Ser Asn Asp Lys Ile Phe Glu Lys 245 250 255 Gln Glu Leu Lys Lys Xaa Trp Ile His Gln Leu Glu Asn Ala Val Glu 260 265 270 Arg Ile Leu Leu Xaa Xaa Gly Lys Val Xaa Tyr Lys Leu Gln Xaa Gly 275 280 285 Tyr Leu Ala Glu Leu Trp Lys Ile Arg Ile Asn Glu Ile Phe Ile Lys 290 295 300 Tyr Ile Xaa Val Gly Lys Ala Val Ala Xaa Phe Ala Leu Arg Asn Xaa 305 310 315 320 Xaa Lys Asx Glu Asn Asp Ile Leu Gly Gly Lys Ile Xaa Lys Lys Leu 325 330 335 Asn Gly Ile Thr Ser Phe Xaa Tyr Glu Lys Ile Lys Ala Glu Glu Ile 340 345 350 Leu Gln Arg Glu Xaa Ala Val Glu Val Ala Phe Ala Ala Asn Xaa Leu 355 360 365 Tyr Ala Xaa Asp Leu Xaa Xaa Ile Arg Xaa Ser Ile Leu Gln Phe Phe 370 375 380 Gly Gly Ala Ser Asn Trp Asp Xaa Phe Leu Phe Phe His Phe Ala Thr 385 390 395 400 Ser Xaa Ile Ser Asp Lys Lys Trp Asn Ala Glu Leu Ile Xaa Xaa Lys 405 410 415 Lys Leu Gly Leu Val Ile Arg Glu Lys Leu Tyr Ser Asn Asn Val Ala 420 425 430 Met Phe Tyr Ser Lys Asp Asp Leu Glu Lys Leu Leu Asn Xaa Leu Xaa 435 440 445 Xaa Phe Xaa Leu Arg Ala Ser Gln Val Pro Ser Phe Lys Lys Val Tyr 450 455 460 Val Arg Xaa Asx Phe Pro Gln Asn Leu Leu Lys Lys Phe Asn Asp Glu 465 470 475 480 Lys Asp Asp Glu Ala Tyr Ser Ala Xaa Tyr Tyr Leu Leu Lys Glu Ile 485 490 495 Tyr Tyr Asn Xaa Phe Leu Pro Tyr Phe Ser Ala Asn Asn Xaa Phe Phe 500 505 510 Phe Xaa Val Lys Asn Leu Val Leu Lys Ala Asn Lys Asp Lys Phe Xaa 515 520 525 Xaa Ala Phe Xaa Asp Ile Arg Glu Met Asn Xaa Gly Ser Pro Ile Glu 530 535 540 Tyr Leu Xaa Xaa Thr Gln Xaa Asn Xaa Xaa Asn Glu Gly Arg Lys Lys 545 550 555 560 Glu Glu Lys Glu Xaa Asp Phe Ile Lys Phe Leu Leu Gln Ile Phe Xaa 565 570 575 Lys Gly Phe Asp Asp Tyr Leu Lys Asn Asn Xaa Xaa Phe Ile Leu Lys 580 585 590 Phe Ile Pro Glu Pro Thr Glu Xaa Ile Glu Ile Xaa Xaa Glu Leu Gln 595 600 605 Ala Trp Tyr Ile Val Gly Lys Phe Leu Asn Ala Arg Lys Xaa Asn Leu 610 615 620 Leu Gly Xaa Phe Xaa Ser Tyr Leu Lys Leu Leu Asp Asp Ile Glu Leu 625 630 635 640 Arg Ala Leu Arg Asn Glu Asn Ile Lys Tyr Gln Ser Ser Asn Xaa Glu 645 650 655 Lys Glu Val Leu Glu Xaa Cys Leu Glu Leu Ile Gly Leu Leu Ser Leu 660 665 670 Asp Leu Asn Asp Tyr Phe Asx Asp Glu Xaa Asp Phe Ala Xaa Tyr Leu 675 680 685 Gly Lys Xaa Leu Asp Phe Glu Lys Lys Xaa Met Lys Asp Leu Ala Glu 690 695 700 Leu Xaa Pro Tyr Asp Gln Asn Asp Gly Glu Asn Pro Ile Val Asn Arg 705 710 715 720 Asn Ile Xaa Leu Ala Lys Lys Tyr Gly Thr Leu Asn Leu Leu Glu Lys 725 730 735 Leu Xaa Asp Lys Val Ser Glu Lys Glu Ile Lys Glu Tyr Tyr Glu Leu 740 745 750 Lys Lys Glu Ile Glu Glu Tyr Xaa Xaa Lys Gly Glu Glu Leu His Glu 755 760 765 Glu Trp Xaa Gln Xaa Lys Asn Arg Val Glu Xaa Arg Asp Ile Leu Glu 770 775 780 Tyr Xaa Glu Glu Leu Xaa Gly Gln Ile Ile Asn Tyr Asn Xaa Leu Xaa 785 790 795 800 Asn Lys Val Leu Leu Tyr Phe Gln Leu Gly Leu His Tyr Leu Leu Leu 805 810 815 Asp Ile Leu Gly Arg Leu Val Gly Tyr Thr Gly Ile Trp Glu Arg Asp 820 825 830 Ala Xaa Leu Tyr Gln Ile Ala Ala Met Tyr Xaa Asn Gly Leu Pro Glu 835 840 845 Tyr Ile Xaa Xaa Lys Lys Asn Asp Lys Tyr Lys Asp Gly Gln Ile Val 850 855 860 Gly Xaa Lys Ile Asn Xaa Phe Lys Xaa Asp Lys Lys Xaa Leu Tyr Asn 865 870 875 880 Ala Gly Leu Glu Leu Phe Glu Asn Xaa Asn Glu His Lys Asn Ile Xaa 885 890 895 Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Leu Ser Lys Ala Glu Ser 900 905 910 Ser Leu Leu Xaa Tyr Ser Glu Asn Leu Arg Xaa Leu Phe Ser Tyr Asp 915 920 925 Arg Lys Leu Lys Asn Ala Val Xaa Lys Ser Leu Ile Asn Ile Leu Leu 930 935 940 Arg His Gly Met Val Leu Lys Phe Lys Phe Gly Thr Asp Lys Lys Ser 945 950 955 960 Val Xaa Ile Arg Ser Xaa Lys Lys Ile Xaa His Leu Lys Ser Ile Ala 965 970 975 Lys Lys Leu Tyr Tyr Pro Glu Val Xaa Val Ser Lys Glu Tyr Cys Lys 980 985 990 Leu Val Lys Xaa Leu Leu Lys Tyr Lys 995 1000 <210> 46 <211> 15 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 46 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 47 <211> 4 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: 'KDEL' motif sequence" <400> 47 Lys Asp Glu Leu 1 <210> 48 <211> 4 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 48 Gly Gly Gly Ser 1 <210> 49 <211> 30 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 49 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 30 <210> 50 <211> 45 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 50 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 35 40 45 <210> 51 <211> 60 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 51 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 50 55 60 <210> 52 <211> 12 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2)..(2) <223> Aminohexanoyl <220> <221> MOD_RES <222> (5)..(5) <223> Aminohexanoyl <220> <221> MOD_RES <222> (8)..(8) <223> Aminohexanoyl <220> <221> MOD_RES <222> (11)..(11) <223> Aminohexanoyl <400> 52 Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg 1 5 10 <210> 53 <211> 20 <212> DNA <213> Homo sapiens <400> 53 gagtccgagc agaagaagaa 20 <210> 54 <211> 20 <212> DNA <213> Homo sapiens <400> 54 gagtcctagc aggagaagaa 20 <210> 55 <211> 20 <212> DNA <213> Homo sapiens <400> 55 gagtctaagc agaagaagaa 20 <210> 56 <211> 25 <212> RNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Thrombin sequence" <400> 56 gggaacaaag cugaaguacu uaccc 25 <210> 57 <211> 12 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 57 ucucguacgu uc 12 <210> 58 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 58 ucucguacgu ucucucguac guuc 24 <210> 59 <211> 1340 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 59 Met Gln Ile Ser Lys Val Asn His Lys His Val Ala Val Gly Gln Lys 1 5 10 15 Asp Arg Glu Arg Ile Thr Gly Phe Ile Tyr Asn Asp Pro Val Gly Asp 20 25 30 Glu Lys Ser Leu Glu Asp Val Val Ala Lys Arg Ala Asn Asp Thr Lys 35 40 45 Val Leu Phe Asn Val Phe Asn Thr Lys Asp Leu Tyr Asp Ser Gln Glu 50 55 60 Ser Asp Lys Ser Glu Lys Asp Lys Glu Ile Ile Ser Lys Gly Ala Lys 65 70 75 80 Phe Val Ala Lys Ser Phe Asn Ser Ala Ile Thr Ile Leu Lys Lys Gln 85 90 95 Asn Lys Ile Tyr Ser Thr Leu Thr Ser Gln Gln Val Ile Lys Glu Leu 100 105 110 Lys Asp Lys Phe Gly Gly Ala Arg Ile Tyr Asp Asp Asp Ile Glu Glu 115 120 125 Ala Leu Thr Glu Thr Leu Lys Lys Ser Phe Arg Lys Glu Asn Val Arg 130 135 140 Asn Ser Ile Lys Val Leu Ile Glu Asn Ala Ala Gly Ile Arg Ser Ser 145 150 155 160 Leu Ser Lys Asp Glu Glu Glu Leu Ile Gln Glu Tyr Phe Val Lys Gln 165 170 175 Leu Val Glu Glu Tyr Thr Lys Thr Lys Leu Gln Lys Asn Val Val Lys 180 185 190 Ser Ile Lys Asn Gln Asn Met Val Ile Gln Pro Asp Ser Asp Ser Gln 195 200 205 Val Leu Ser Leu Ser Glu Ser Arg Arg Glu Lys Gln Ser Ser Ala Val 210 215 220 Ser Ser Asp Thr Leu Val Asn Cys Lys Glu Lys Asp Val Leu Lys Ala 225 230 235 240 Phe Leu Thr Asp Tyr Ala Val Leu Asp Glu Asp Glu Arg Asn Ser Leu 245 250 255 Leu Trp Lys Leu Arg Asn Leu Val Asn Leu Tyr Phe Tyr Gly Ser Glu 260 265 270 Ser Ile Arg Asp Tyr Ser Tyr Thr Lys Glu Lys Ser Val Trp Lys Glu 275 280 285 His Asp Glu Gln Lys Ala Asn Lys Thr Leu Phe Ile Asp Glu Ile Cys 290 295 300 His Ile Thr Lys Ile Gly Lys Asn Gly Lys Glu Gln Lys Val Leu Asp 305 310 315 320 Tyr Glu Glu Asn Arg Ser Arg Cys Arg Lys Gln Asn Ile Asn Tyr Tyr 325 330 335 Arg Ser Ala Leu Asn Tyr Ala Lys Asn Asn Thr Ser Gly Ile Phe Glu 340 345 350 Asn Glu Asp Ser Asn His Phe Trp Ile His Leu Ile Glu Asn Glu Val 355 360 365 Glu Arg Leu Tyr Asn Gly Ile Glu Asn Gly Glu Glu Phe Lys Phe Glu 370 375 380 Thr Gly Tyr Ile Ser Glu Lys Val Trp Lys Ala Val Ile Asn His Leu 385 390 395 400 Ser Ile Lys Tyr Ile Ala Leu Gly Lys Ala Val Tyr Asn Tyr Ala Met 405 410 415 Lys Glu Leu Ser Ser Pro Gly Asp Ile Glu Pro Gly Lys Ile Asp Asp 420 425 430 Ser Tyr Ile Asn Gly Ile Thr Ser Phe Asp Tyr Glu Ile Ile Lys Ala 435 440 445 Glu Glu Ser Leu Gln Arg Asp Ile Ser Met Asn Val Val Phe Ala Thr 450 455 460 Asn Tyr Leu Ala Cys Ala Thr Val Asp Thr Asp Lys Asp Phe Leu Leu 465 470 475 480 Phe Ser Lys Glu Asp Ile Arg Ser Cys Thr Lys Lys Asp Gly Asn Leu 485 490 495 Cys Lys Asn Ile Met Gln Phe Trp Gly Gly Tyr Ser Thr Trp Lys Asn 500 505 510 Phe Cys Glu Glu Tyr Leu Lys Asp Asp Lys Asp Ala Leu Glu Leu Leu 515 520 525 Tyr Ser Leu Lys Ser Met Leu Tyr Ser Met Arg Asn Ser Ser Phe His 530 535 540 Phe Ser Thr Glu Asn Val Asp Asn Gly Ser Trp Asp Thr Glu Leu Ile 545 550 555 560 Gly Lys Leu Phe Glu Glu Asp Cys Asn Arg Ala Ala Arg Ile Glu Lys 565 570 575 Glu Lys Phe Tyr Asn Asn Asn Leu His Met Phe Tyr Ser Ser Ser Leu 580 585 590 Leu Glu Lys Val Leu Glu Arg Leu Tyr Ser Ser His His Glu Arg Ala 595 600 605 Ser Gln Val Pro Ser Phe Asn Arg Val Phe Val Arg Lys Asn Phe Pro 610 615 620 Ser Ser Leu Ser Glu Gln Arg Ile Thr Pro Lys Phe Thr Asp Ser Lys 625 630 635 640 Asp Glu Gln Ile Trp Gln Ser Ala Val Tyr Tyr Leu Cys Lys Glu Ile 645 650 655 Tyr Tyr Asn Asp Phe Leu Gln Ser Lys Glu Ala Tyr Lys Leu Phe Arg 660 665 670 Glu Gly Val Lys Asn Leu Asp Lys Asn Asp Ile Asn Asn Gln Lys Ala 675 680 685 Ala Asp Ser Phe Lys Gln Ala Val Val Tyr Tyr Gly Lys Ala Ile Gly 690 695 700 Asn Ala Thr Leu Ser Gln Val Cys Gln Ala Ile Met Thr Glu Tyr Asn 705 710 715 720 Arg Gln Asn Asn Asp Gly Leu Lys Lys Lys Ser Ala Tyr Ala Glu Lys 725 730 735 Gln Asn Ser Asn Lys Tyr Lys His Tyr Pro Leu Phe Leu Lys Gln Val 740 745 750 Leu Gln Ser Ala Phe Trp Glu Tyr Leu Asp Glu Asn Lys Glu Ile Tyr 755 760 765 Gly Phe Ile Ser Ala Gln Ile His Lys Ser Asn Val Glu Ile Lys Ala 770 775 780 Glu Asp Phe Ile Ala Asn Tyr Ser Ser Gln Gln Tyr Lys Lys Leu Val 785 790 795 800 Asp Lys Val Lys Lys Thr Pro Glu Leu Gln Lys Trp Tyr Thr Leu Gly 805 810 815 Arg Leu Ile Asn Pro Arg Gln Ala Asn Gln Phe Leu Gly Ser Ile Arg 820 825 830 Asn Tyr Val Gln Phe Val Lys Asp Ile Gln Arg Arg Ala Lys Glu Asn 835 840 845 Gly Asn Pro Ile Arg Asn Tyr Tyr Glu Val Leu Glu Ser Asp Ser Ile 850 855 860 Ile Lys Ile Leu Glu Met Cys Thr Lys Leu Asn Gly Thr Thr Ser Asn 865 870 875 880 Asp Ile His Asp Tyr Phe Arg Asp Glu Asp Glu Tyr Ala Glu Tyr Ile 885 890 895 Ser Gln Phe Val Asn Phe Gly Asp Val His Ser Gly Ala Ala Leu Asn 900 905 910 Ala Phe Cys Asn Ser Glu Ser Glu Gly Lys Lys Asn Gly Ile Tyr Tyr 915 920 925 Asp Gly Ile Asn Pro Ile Val Asn Arg Asn Trp Val Leu Cys Lys Leu 930 935 940 Tyr Gly Ser Pro Asp Leu Ile Ser Lys Ile Ile Ser Arg Val Asn Glu 945 950 955 960 Asn Met Ile His Asp Phe His Lys Gln Glu Asp Leu Ile Arg Glu Tyr 965 970 975 Gln Ile Lys Gly Ile Cys Ser Asn Lys Lys Glu Gln Gln Asp Leu Arg 980 985 990 Thr Phe Gln Val Leu Lys Asn Arg Val Glu Leu Arg Asp Ile Val Glu 995 1000 1005 Tyr Ser Glu Ile Ile Asn Glu Leu Tyr Gly Gln Leu Ile Lys Trp 1010 1015 1020 Cys Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln Leu Gly Phe 1025 1030 1035 His Tyr Leu Cys Leu Asn Asn Ala Ser Ser Lys Glu Ala Asp Tyr 1040 1045 1050 Ile Lys Ile Asn Val Asp Asp Arg Asn Ile Ser Gly Ala Ile Leu 1055 1060 1065 Tyr Gln Ile Ala Ala Met Tyr Ile Asn Gly Leu Pro Val Tyr Tyr 1070 1075 1080 Lys Lys Asp Asp Met Tyr Val Ala Leu Lys Ser Gly Lys Lys Ala 1085 1090 1095 Ser Asp Glu Leu Asn Ser Asn Glu Gln Thr Ser Lys Lys Ile Asn 1100 1105 1110 Tyr Phe Leu Lys Tyr Gly Asn Asn Ile Leu Gly Asp Lys Lys Asp 1115 1120 1125 Gln Leu Tyr Leu Ala Gly Leu Glu Leu Phe Glu Asn Val Ala Glu 1130 1135 1140 His Glu Asn Ile Ile Ile Phe Arg Asn Glu Ile Asp His Phe His 1145 1150 1155 Tyr Phe Tyr Asp Arg Asp Arg Ser Met Leu Asp Leu Tyr Ser Glu 1160 1165 1170 Val Phe Asp Arg Phe Phe Thr Tyr Asp Met Lys Leu Arg Lys Asn 1175 1180 1185 Val Val Asn Met Leu Tyr Asn Ile Leu Leu Asp His Asn Ile Val 1190 1195 1200 Ser Ser Phe Val Phe Glu Thr Gly Glu Lys Lys Val Gly Arg Gly 1205 1210 1215 Asp Ser Glu Val Ile Lys Pro Ser Ala Lys Ile Arg Leu Arg Ala 1220 1225 1230 Asn Asn Gly Val Ser Ser Asp Val Phe Thr Tyr Lys Val Gly Ser 1235 1240 1245 Lys Asp Glu Leu Lys Ile Ala Thr Leu Pro Ala Lys Asn Glu Glu 1250 1255 1260 Phe Leu Leu Asn Val Ala Arg Leu Ile Tyr Tyr Pro Asp Met Glu 1265 1270 1275 Ala Val Ser Glu Asn Met Val Arg Glu Gly Val Val Lys Val Glu 1280 1285 1290 Lys Ser Asn Asp Lys Lys Gly Lys Ile Ser Arg Gly Ser Asn Thr 1295 1300 1305 Arg Ser Ser Asn Gln Ser Lys Tyr Asn Asn Lys Ser Lys Asn Arg 1310 1315 1320 Met Asn Tyr Ser Met Gly Ser Ile Phe Glu Lys Met Asp Leu Lys 1325 1330 1335 Phe Asp 1340 <210> 60 <211> 1437 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 60 Met Lys Ile Ser Lys Val Arg Glu Glu Asn Arg Gly Ala Lys Leu Thr 1 5 10 15 Val Asn Ala Lys Thr Ala Val Val Ser Glu Asn Arg Ser Gln Glu Gly 20 25 30 Ile Leu Tyr Asn Asp Pro Ser Arg Tyr Gly Lys Ser Arg Lys Asn Asp 35 40 45 Glu Asp Arg Asp Arg Tyr Ile Glu Ser Arg Leu Lys Ser Ser Gly Lys 50 55 60 Leu Tyr Arg Ile Phe Asn Glu Asp Lys Asn Lys Arg Glu Thr Asp Glu 65 70 75 80 Leu Gln Trp Phe Leu Ser Glu Ile Val Lys Lys Ile Asn Arg Arg Asn 85 90 95 Gly Leu Val Leu Ser Asp Met Leu Ser Val Asp Asp Arg Ala Phe Glu 100 105 110 Lys Ala Phe Glu Lys Tyr Ala Glu Leu Ser Tyr Thr Asn Arg Arg Asn 115 120 125 Lys Val Ser Gly Ser Pro Ala Phe Glu Thr Cys Gly Val Asp Ala Ala 130 135 140 Thr Ala Glu Arg Leu Lys Gly Ile Ile Ser Glu Thr Asn Phe Ile Asn 145 150 155 160 Arg Ile Lys Asn Asn Ile Asp Asn Lys Val Ser Glu Asp Ile Ile Asp 165 170 175 Arg Ile Ile Ala Lys Tyr Leu Lys Lys Ser Leu Cys Arg Glu Arg Val 180 185 190 Lys Arg Gly Leu Lys Lys Leu Leu Met Asn Ala Phe Asp Leu Pro Tyr 195 200 205 Ser Asp Pro Asp Ile Asp Val Gln Arg Asp Phe Ile Asp Tyr Val Leu 210 215 220 Glu Asp Phe Tyr His Val Arg Ala Lys Ser Gln Val Ser Arg Ser Ile 225 230 235 240 Lys Asn Met Asn Met Pro Val Gln Pro Glu Gly Asp Gly Lys Phe Ala 245 250 255 Ile Thr Val Ser Lys Gly Gly Thr Glu Ser Gly Asn Lys Arg Ser Ala 260 265 270 Glu Lys Glu Ala Phe Lys Lys Phe Leu Ser Asp Tyr Ala Ser Leu Asp 275 280 285 Glu Arg Val Arg Asp Asp Met Leu Arg Arg Met Arg Arg Leu Val Val 290 295 300 Leu Tyr Phe Tyr Gly Ser Asp Asp Ser Lys Leu Ser Asp Val Asn Glu 305 310 315 320 Lys Phe Asp Val Trp Glu Asp His Ala Ala Arg Arg Val Asp Asn Arg 325 330 335 Glu Phe Ile Lys Leu Pro Leu Glu Asn Lys Leu Ala Asn Gly Lys Thr 340 345 350 Asp Lys Asp Ala Glu Arg Ile Arg Lys Asn Thr Val Lys Glu Leu Tyr 355 360 365 Arg Asn Gln Asn Ile Gly Cys Tyr Arg Gln Ala Val Lys Ala Val Glu 370 375 380 Glu Asp Asn Asn Gly Arg Tyr Phe Asp Asp Lys Met Leu Asn Met Phe 385 390 395 400 Phe Ile His Arg Ile Glu Tyr Gly Val Glu Lys Ile Tyr Ala Asn Leu 405 410 415 Lys Gln Val Thr Glu Phe Lys Ala Arg Thr Gly Tyr Leu Ser Glu Lys 420 425 430 Ile Trp Lys Asp Leu Ile Asn Tyr Ile Ser Ile Lys Tyr Ile Ala Met 435 440 445 Gly Lys Ala Val Tyr Asn Tyr Ala Met Asp Glu Leu Asn Ala Ser Asp 450 455 460 Lys Lys Glu Ile Glu Leu Gly Lys Ile Ser Glu Glu Tyr Leu Ser Gly 465 470 475 480 Ile Ser Ser Phe Asp Tyr Glu Leu Ile Lys Ala Glu Glu Met Leu Gln 485 490 495 Arg Glu Thr Ala Val Tyr Val Ala Phe Ala Ala Arg His Leu Ser Ser 500 505 510 Gln Thr Val Glu Leu Asp Ser Glu Asn Ser Asp Phe Leu Leu Leu Lys 515 520 525 Pro Lys Gly Thr Met Asp Lys Asn Asp Lys Asn Lys Leu Ala Ser Asn 530 535 540 Asn Ile Leu Asn Phe Leu Lys Asp Lys Glu Thr Leu Arg Asp Thr Ile 545 550 555 560 Leu Gln Tyr Phe Gly Gly His Ser Leu Trp Thr Asp Phe Pro Phe Asp 565 570 575 Lys Tyr Leu Ala Gly Gly Lys Asp Asp Val Asp Phe Leu Thr Asp Leu 580 585 590 Lys Asp Val Ile Tyr Ser Met Arg Asn Asp Ser Phe His Tyr Ala Thr 595 600 605 Glu Asn His Asn Asn Gly Lys Trp Asn Lys Glu Leu Ile Ser Ala Met 610 615 620 Phe Glu His Glu Thr Glu Arg Met Thr Val Val Met Lys Asp Lys Phe 625 630 635 640 Tyr Ser Asn Asn Leu Pro Met Phe Tyr Lys Asn Asp Asp Leu Lys Lys 645 650 655 Leu Leu Ile Asp Leu Tyr Lys Asp Asn Val Glu Arg Ala Ser Gln Val 660 665 670 Pro Ser Phe Asn Lys Val Phe Val Arg Lys Asn Phe Pro Ala Leu Val 675 680 685 Arg Asp Lys Asp Asn Leu Gly Ile Glu Leu Asp Leu Lys Ala Asp Ala 690 695 700 Asp Lys Gly Glu Asn Glu Leu Lys Phe Tyr Asn Ala Leu Tyr Tyr Met 705 710 715 720 Phe Lys Glu Ile Tyr Tyr Asn Ala Phe Leu Asn Asp Lys Asn Val Arg 725 730 735 Glu Arg Phe Ile Thr Lys Ala Thr Lys Val Ala Asp Asn Tyr Asp Arg 740 745 750 Asn Lys Glu Arg Asn Leu Lys Asp Arg Ile Lys Ser Ala Gly Ser Asp 755 760 765 Glu Lys Lys Lys Leu Arg Glu Gln Leu Gln Asn Tyr Ile Ala Glu Asn 770 775 780 Asp Phe Gly Gln Arg Ile Lys Asn Ile Val Gln Val Asn Pro Asp Tyr 785 790 795 800 Thr Leu Ala Gln Ile Cys Gln Leu Ile Met Thr Glu Tyr Asn Gln Gln 805 810 815 Asn Asn Gly Cys Met Gln Lys Lys Ser Ala Ala Arg Lys Asp Ile Asn 820 825 830 Lys Asp Ser Tyr Gln His Tyr Lys Met Leu Leu Leu Val Asn Leu Arg 835 840 845 Lys Ala Phe Leu Glu Phe Ile Lys Glu Asn Tyr Ala Phe Val Leu Lys 850 855 860 Pro Tyr Lys His Asp Leu Cys Asp Lys Ala Asp Phe Val Pro Asp Phe 865 870 875 880 Ala Lys Tyr Val Lys Pro Tyr Ala Gly Leu Ile Ser Arg Val Ala Gly 885 890 895 Ser Ser Glu Leu Gln Lys Trp Tyr Ile Val Ser Arg Phe Leu Ser Pro 900 905 910 Ala Gln Ala Asn His Met Leu Gly Phe Leu His Ser Tyr Lys Gln Tyr 915 920 925 Val Trp Asp Ile Tyr Arg Arg Ala Ser Glu Thr Gly Thr Glu Ile Asn 930 935 940 His Ser Ile Ala Glu Asp Lys Ile Ala Gly Val Asp Ile Thr Asp Val 945 950 955 960 Asp Ala Val Ile Asp Leu Ser Val Lys Leu Cys Gly Thr Ile Ser Ser 965 970 975 Glu Ile Ser Asp Tyr Phe Lys Asp Asp Glu Val Tyr Ala Glu Tyr Ile 980 985 990 Ser Ser Tyr Leu Asp Phe Glu Tyr Asp Gly Gly Asn Tyr Lys Asp Ser 995 1000 1005 Leu Asn Arg Phe Cys Asn Ser Asp Ala Val Asn Asp Gln Lys Val 1010 1015 1020 Ala Leu Tyr Tyr Asp Gly Glu His Pro Lys Leu Asn Arg Asn Ile 1025 1030 1035 Ile Leu Ser Lys Leu Tyr Gly Glu Arg Arg Phe Leu Glu Lys Ile 1040 1045 1050 Thr Asp Arg Val Ser Arg Ser Asp Ile Val Glu Tyr Tyr Lys Leu 1055 1060 1065 Lys Lys Glu Thr Ser Gln Tyr Gln Thr Lys Gly Ile Phe Asp Ser 1070 1075 1080 Glu Asp Glu Gln Lys Asn Ile Lys Lys Phe Gln Glu Met Lys Asn 1085 1090 1095 Ile Val Glu Phe Arg Asp Leu Met Asp Tyr Ser Glu Ile Ala Asp 1100 1105 1110 Glu Leu Gln Gly Gln Leu Ile Asn Trp Ile Tyr Leu Arg Glu Arg 1115 1120 1125 Asp Leu Met Asn Phe Gln Leu Gly Tyr His Tyr Ala Cys Leu Asn 1130 1135 1140 Asn Asp Ser Asn Lys Gln Ala Thr Tyr Val Thr Leu Asp Tyr Gln 1145 1150 1155 Gly Lys Lys Asn Arg Lys Ile Asn Gly Ala Ile Leu Tyr Gln Ile 1160 1165 1170 Cys Ala Met Tyr Ile Asn Gly Leu Pro Leu Tyr Tyr Val Asp Lys 1175 1180 1185 Asp Ser Ser Glu Trp Thr Val Ser Asp Gly Lys Glu Ser Thr Gly 1190 1195 1200 Ala Lys Ile Gly Glu Phe Tyr Arg Tyr Ala Lys Ser Phe Glu Asn 1205 1210 1215 Thr Ser Asp Cys Tyr Ala Ser Gly Leu Glu Ile Phe Glu Asn Ile 1220 1225 1230 Ser Glu His Asp Asn Ile Thr Glu Leu Arg Asn Tyr Ile Glu His 1235 1240 1245 Phe Arg Tyr Tyr Ser Ser Phe Asp Arg Ser Phe Leu Gly Ile Tyr 1250 1255 1260 Ser Glu Val Phe Asp Arg Phe Phe Thr Tyr Asp Leu Lys Tyr Arg 1265 1270 1275 Lys Asn Val Pro Thr Ile Leu Tyr Asn Ile Leu Leu Gln His Phe 1280 1285 1290 Val Asn Val Arg Phe Glu Phe Val Ser Gly Lys Lys Met Ile Gly 1295 1300 1305 Ile Asp Lys Lys Asp Arg Lys Ile Ala Lys Glu Lys Glu Cys Ala 1310 1315 1320 Arg Ile Thr Ile Arg Glu Lys Asn Gly Val Tyr Ser Glu Gln Phe 1325 1330 1335 Thr Tyr Lys Leu Lys Asn Gly Thr Val Tyr Val Asp Ala Arg Asp 1340 1345 1350 Lys Arg Tyr Leu Gln Ser Ile Ile Arg Leu Leu Phe Tyr Pro Glu 1355 1360 1365 Lys Val Asn Met Asp Glu Met Ile Glu Val Lys Glu Lys Lys Lys 1370 1375 1380 Pro Ser Asp Asn Asn Thr Gly Lys Gly Tyr Ser Lys Arg Asp Arg 1385 1390 1395 Gln Gln Asp Arg Lys Glu Tyr Asp Lys Tyr Lys Glu Lys Lys Lys 1400 1405 1410 Lys Glu Gly Asn Phe Leu Ser Gly Met Gly Gly Asn Ile Asn Trp 1415 1420 1425 Asp Glu Ile Asn Ala Gln Leu Lys Asn 1430 1435 <210> 61 <211> 1385 <212> PRT <213> Clostridium aminophilum <400> 61 Met Lys Phe Ser Lys Val Asp His Thr Arg Ser Ala Val Gly Ile Gln 1 5 10 15 Lys Ala Thr Asp Ser Val His Gly Met Leu Tyr Thr Asp Pro Lys Lys 20 25 30 Gln Glu Val Asn Asp Leu Asp Lys Arg Phe Asp Gln Leu Asn Val Lys 35 40 45 Ala Lys Arg Leu Tyr Asn Val Phe Asn Gln Ser Lys Ala Glu Glu Asp 50 55 60 Asp Asp Glu Lys Arg Phe Gly Lys Val Val Lys Lys Leu Asn Arg Glu 65 70 75 80 Leu Lys Asp Leu Leu Phe His Arg Glu Val Ser Arg Tyr Asn Ser Ile 85 90 95 Gly Asn Ala Lys Tyr Asn Tyr Tyr Gly Ile Lys Ser Asn Pro Glu Glu 100 105 110 Ile Val Ser Asn Leu Gly Met Val Glu Ser Leu Lys Gly Glu Arg Asp 115 120 125 Pro Gln Lys Val Ile Ser Lys Leu Leu Leu Tyr Tyr Leu Arg Lys Gly 130 135 140 Leu Lys Pro Gly Thr Asp Gly Leu Arg Met Ile Leu Glu Ala Ser Cys 145 150 155 160 Gly Leu Arg Lys Leu Ser Gly Asp Glu Lys Glu Leu Lys Val Phe Leu 165 170 175 Gln Thr Leu Asp Glu Asp Phe Glu Lys Lys Thr Phe Lys Lys Asn Leu 180 185 190 Ile Arg Ser Ile Glu Asn Gln Asn Met Ala Val Gln Pro Ser Asn Glu 195 200 205 Gly Asp Pro Ile Ile Gly Ile Thr Gln Gly Arg Phe Asn Ser Gln Lys 210 215 220 Asn Glu Glu Lys Ser Ala Ile Glu Arg Met Met Ser Met Tyr Ala Asp 225 230 235 240 Leu Asn Glu Asp His Arg Glu Asp Val Leu Arg Lys Leu Arg Arg Leu 245 250 255 Asn Val Leu Tyr Phe Asn Val Asp Thr Glu Lys Thr Glu Glu Pro Thr 260 265 270 Leu Pro Gly Glu Val Asp Thr Asn Pro Val Phe Glu Val Trp His Asp 275 280 285 His Glu Lys Gly Lys Glu Asn Asp Arg Gln Phe Ala Thr Phe Ala Lys 290 295 300 Ile Leu Thr Glu Asp Arg Glu Thr Arg Lys Lys Glu Lys Leu Ala Val 305 310 315 320 Lys Glu Ala Leu Asn Asp Leu Lys Ser Ala Ile Arg Asp His Asn Ile 325 330 335 Met Ala Tyr Arg Cys Ser Ile Lys Val Thr Glu Gln Asp Lys Asp Gly 340 345 350 Leu Phe Phe Glu Asp Gln Arg Ile Asn Arg Phe Trp Ile His His Ile 355 360 365 Glu Ser Ala Val Glu Arg Ile Leu Ala Ser Ile Asn Pro Glu Lys Leu 370 375 380 Tyr Lys Leu Arg Ile Gly Tyr Leu Gly Glu Lys Val Trp Lys Asp Leu 385 390 395 400 Leu Asn Tyr Leu Ser Ile Lys Tyr Ile Ala Val Gly Lys Ala Val Phe 405 410 415 His Phe Ala Met Glu Asp Leu Gly Lys Thr Gly Gln Asp Ile Glu Leu 420 425 430 Gly Lys Leu Ser Asn Ser Val Ser Gly Gly Leu Thr Ser Phe Asp Tyr 435 440 445 Glu Gln Ile Arg Ala Asp Glu Thr Leu Gln Arg Gln Leu Ser Val Glu 450 455 460 Val Ala Phe Ala Ala Asn Asn Leu Phe Arg Ala Val Val Gly Gln Thr 465 470 475 480 Gly Lys Lys Ile Glu Gln Ser Lys Ser Glu Glu Asn Glu Glu Asp Phe 485 490 495 Leu Leu Trp Lys Ala Glu Lys Ile Ala Glu Ser Ile Lys Lys Glu Gly 500 505 510 Glu Gly Asn Thr Leu Lys Ser Ile Leu Gln Phe Phe Gly Gly Ala Ser 515 520 525 Ser Trp Asp Leu Asn His Phe Cys Ala Ala Tyr Gly Asn Glu Ser Ser 530 535 540 Ala Leu Gly Tyr Glu Thr Lys Phe Ala Asp Asp Leu Arg Lys Ala Ile 545 550 555 560 Tyr Ser Leu Arg Asn Glu Thr Phe His Phe Thr Thr Leu Asn Lys Gly 565 570 575 Ser Phe Asp Trp Asn Ala Lys Leu Ile Gly Asp Met Phe Ser His Glu 580 585 590 Ala Ala Thr Gly Ile Ala Val Glu Arg Thr Arg Phe Tyr Ser Asn Asn 595 600 605 Leu Pro Met Phe Tyr Arg Glu Ser Asp Leu Lys Arg Ile Met Asp His 610 615 620 Leu Tyr Asn Thr Tyr His Pro Arg Ala Ser Gln Val Pro Ser Phe Asn 625 630 635 640 Ser Val Phe Val Arg Lys Asn Phe Arg Leu Phe Leu Ser Asn Thr Leu 645 650 655 Asn Thr Asn Thr Ser Phe Asp Thr Glu Val Tyr Gln Lys Trp Glu Ser 660 665 670 Gly Val Tyr Tyr Leu Phe Lys Glu Ile Tyr Tyr Asn Ser Phe Leu Pro 675 680 685 Ser Gly Asp Ala His His Leu Phe Phe Glu Gly Leu Arg Arg Ile Arg 690 695 700 Lys Glu Ala Asp Asn Leu Pro Ile Val Gly Lys Glu Ala Lys Lys Arg 705 710 715 720 Asn Ala Val Gln Asp Phe Gly Arg Arg Cys Asp Glu Leu Lys Asn Leu 725 730 735 Ser Leu Ser Ala Ile Cys Gln Met Ile Met Thr Glu Tyr Asn Glu Gln 740 745 750 Asn Asn Gly Asn Arg Lys Val Lys Ser Thr Arg Glu Asp Lys Arg Lys 755 760 765 Pro Asp Ile Phe Gln His Tyr Lys Met Leu Leu Leu Arg Thr Leu Gln 770 775 780 Glu Ala Phe Ala Ile Tyr Ile Arg Arg Glu Glu Phe Lys Phe Ile Phe 785 790 795 800 Asp Leu Pro Lys Thr Leu Tyr Val Met Lys Pro Val Glu Glu Phe Leu 805 810 815 Pro Asn Trp Lys Ser Gly Met Phe Asp Ser Leu Val Glu Arg Val Lys 820 825 830 Gln Ser Pro Asp Leu Gln Arg Trp Tyr Val Leu Cys Lys Phe Leu Asn 835 840 845 Gly Arg Leu Leu Asn Gln Leu Ser Gly Val Ile Arg Ser Tyr Ile Gln 850 855 860 Phe Ala Gly Asp Ile Gln Arg Arg Ala Lys Ala Asn His Asn Arg Leu 865 870 875 880 Tyr Met Asp Asn Thr Gln Arg Val Glu Tyr Tyr Ser Asn Val Leu Glu 885 890 895 Val Val Asp Phe Cys Ile Lys Gly Thr Ser Arg Phe Ser Asn Val Phe 900 905 910 Ser Asp Tyr Phe Arg Asp Glu Asp Ala Tyr Ala Asp Tyr Leu Asp Asn 915 920 925 Tyr Leu Gln Phe Lys Asp Glu Lys Ile Ala Glu Val Ser Ser Phe Ala 930 935 940 Ala Leu Lys Thr Phe Cys Asn Glu Glu Glu Val Lys Ala Gly Ile Tyr 945 950 955 960 Met Asp Gly Glu Asn Pro Val Met Gln Arg Asn Ile Val Met Ala Lys 965 970 975 Leu Phe Gly Pro Asp Glu Val Leu Lys Asn Val Val Pro Lys Val Thr 980 985 990 Arg Glu Glu Ile Glu Glu Tyr Tyr Gln Leu Glu Lys Gln Ile Ala Pro 995 1000 1005 Tyr Arg Gln Asn Gly Tyr Cys Lys Ser Glu Glu Asp Gln Lys Lys 1010 1015 1020 Leu Leu Arg Phe Gln Arg Ile Lys Asn Arg Val Glu Phe Gln Thr 1025 1030 1035 Ile Thr Glu Phe Ser Glu Ile Ile Asn Glu Leu Leu Gly Gln Leu 1040 1045 1050 Ile Ser Trp Ser Phe Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln 1055 1060 1065 Leu Gly Phe His Tyr Leu Cys Leu His Asn Asp Thr Glu Lys Pro 1070 1075 1080 Ala Glu Tyr Lys Glu Ile Ser Arg Glu Asp Gly Thr Val Ile Arg 1085 1090 1095 Asn Ala Ile Leu His Gln Val Ala Ala Met Tyr Val Gly Gly Leu 1100 1105 1110 Pro Val Tyr Thr Leu Ala Asp Lys Lys Leu Ala Ala Phe Glu Lys 1115 1120 1125 Gly Glu Ala Asp Cys Lys Leu Ser Ile Ser Lys Asp Thr Ala Gly 1130 1135 1140 Ala Gly Lys Lys Ile Lys Asp Phe Phe Arg Tyr Ser Lys Tyr Val 1145 1150 1155 Leu Ile Lys Asp Arg Met Leu Thr Asp Gln Asn Gln Lys Tyr Thr 1160 1165 1170 Ile Tyr Leu Ala Gly Leu Glu Leu Phe Glu Asn Thr Asp Glu His 1175 1180 1185 Asp Asn Ile Thr Asp Val Arg Lys Tyr Val Asp His Phe Lys Tyr 1190 1195 1200 Tyr Ala Thr Ser Asp Glu Asn Ala Met Ser Ile Leu Asp Leu Tyr 1205 1210 1215 Ser Glu Ile His Asp Arg Phe Phe Thr Tyr Asp Met Lys Tyr Gln 1220 1225 1230 Lys Asn Val Ala Asn Met Leu Glu Asn Ile Leu Leu Arg His Phe 1235 1240 1245 Val Leu Ile Arg Pro Glu Phe Phe Thr Gly Ser Lys Lys Val Gly 1250 1255 1260 Glu Gly Lys Lys Ile Thr Cys Lys Ala Arg Ala Gln Ile Glu Ile 1265 1270 1275 Ala Glu Asn Gly Met Arg Ser Glu Asp Phe Thr Tyr Lys Leu Ser 1280 1285 1290 Asp Gly Lys Lys Asn Ile Ser Thr Cys Met Ile Ala Ala Arg Asp 1295 1300 1305 Gln Lys Tyr Leu Asn Thr Val Ala Arg Leu Leu Tyr Tyr Pro His 1310 1315 1320 Glu Ala Lys Lys Ser Ile Val Asp Thr Arg Glu Lys Lys Asn Asn 1325 1330 1335 Lys Lys Thr Asn Arg Gly Asp Gly Thr Phe Asn Lys Gln Lys Gly 1340 1345 1350 Thr Ala Arg Lys Glu Lys Asp Asn Gly Pro Arg Glu Phe Asn Asp 1355 1360 1365 Thr Gly Phe Ser Asn Thr Pro Phe Ala Gly Phe Asp Pro Phe Arg 1370 1375 1380 Asn Ser 1385 <210> 62 <211> 1175 <212> PRT <213> Carnobacterium gallinarum <400> 62 Met Arg Ile Thr Lys Val Lys Ile Lys Leu Asp Asn Lys Leu Tyr Gln 1 5 10 15 Val Thr Met Gln Lys Glu Glu Lys Tyr Gly Thr Leu Lys Leu Asn Glu 20 25 30 Glu Ser Arg Lys Ser Thr Ala Glu Ile Leu Arg Leu Lys Lys Ala Ser 35 40 45 Phe Asn Lys Ser Phe His Ser Lys Thr Ile Asn Ser Gln Lys Glu Asn 50 55 60 Lys Asn Ala Thr Ile Lys Lys Asn Gly Asp Tyr Ile Ser Gln Ile Phe 65 70 75 80 Glu Lys Leu Val Gly Val Asp Thr Asn Lys Asn Ile Arg Lys Pro Lys 85 90 95 Met Ser Leu Thr Asp Leu Lys Asp Leu Pro Lys Lys Asp Leu Ala Leu 100 105 110 Phe Ile Lys Arg Lys Phe Lys Asn Asp Asp Ile Val Glu Ile Lys Asn 115 120 125 Leu Asp Leu Ile Ser Leu Phe Tyr Asn Ala Leu Gln Lys Val Pro Gly 130 135 140 Glu His Phe Thr Asp Glu Ser Trp Ala Asp Phe Cys Gln Glu Met Met 145 150 155 160 Pro Tyr Arg Glu Tyr Lys Asn Lys Phe Ile Glu Arg Lys Ile Ile Leu 165 170 175 Leu Ala Asn Ser Ile Glu Gln Asn Lys Gly Phe Ser Ile Asn Pro Glu 180 185 190 Thr Phe Ser Lys Arg Lys Arg Val Leu His Gln Trp Ala Ile Glu Val 195 200 205 Gln Glu Arg Gly Asp Phe Ser Ile Leu Asp Glu Lys Leu Ser Lys Leu 210 215 220 Ala Glu Ile Tyr Asn Phe Lys Lys Met Cys Lys Arg Val Gln Asp Glu 225 230 235 240 Leu Asn Asp Leu Glu Lys Ser Met Lys Lys Gly Lys Asn Pro Glu Lys 245 250 255 Glu Lys Glu Ala Tyr Lys Lys Gln Lys Asn Phe Lys Ile Lys Thr Ile 260 265 270 Trp Lys Asp Tyr Pro Tyr Lys Thr His Ile Gly Leu Ile Glu Lys Ile 275 280 285 Lys Glu Asn Glu Glu Leu Asn Gln Phe Asn Ile Glu Ile Gly Lys Tyr 290 295 300 Phe Glu His Tyr Phe Pro Ile Lys Lys Glu Arg Cys Thr Glu Asp Glu 305 310 315 320 Pro Tyr Tyr Leu Asn Ser Glu Thr Ile Ala Thr Thr Val Asn Tyr Gln 325 330 335 Leu Lys Asn Ala Leu Ile Ser Tyr Leu Met Gln Ile Gly Lys Tyr Lys 340 345 350 Gln Phe Gly Leu Glu Asn Gln Val Leu Asp Ser Lys Lys Leu Gln Glu 355 360 365 Ile Gly Ile Tyr Glu Gly Phe Gln Thr Lys Phe Met Asp Ala Cys Val 370 375 380 Phe Ala Thr Ser Ser Leu Lys Asn Ile Ile Glu Pro Met Arg Ser Gly 385 390 395 400 Asp Ile Leu Gly Lys Arg Glu Phe Lys Glu Ala Ile Ala Thr Ser Ser 405 410 415 Phe Val Asn Tyr His His Phe Phe Pro Tyr Phe Pro Phe Glu Leu Lys 420 425 430 Gly Met Lys Asp Arg Glu Ser Glu Leu Ile Pro Phe Gly Glu Gln Thr 435 440 445 Glu Ala Lys Gln Met Gln Asn Ile Trp Ala Leu Arg Gly Ser Val Gln 450 455 460 Gln Ile Arg Asn Glu Ile Phe His Ser Phe Asp Lys Asn Gln Lys Phe 465 470 475 480 Asn Leu Pro Gln Leu Asp Lys Ser Asn Phe Glu Phe Asp Ala Ser Glu 485 490 495 Asn Ser Thr Gly Lys Ser Gln Ser Tyr Ile Glu Thr Asp Tyr Lys Phe 500 505 510 Leu Phe Glu Ala Glu Lys Asn Gln Leu Glu Gln Phe Phe Ile Glu Arg 515 520 525 Ile Lys Ser Ser Gly Ala Leu Glu Tyr Tyr Pro Leu Lys Ser Leu Glu 530 535 540 Lys Leu Phe Ala Lys Lys Glu Met Lys Phe Ser Leu Gly Ser Gln Val 545 550 555 560 Val Ala Phe Ala Pro Ser Tyr Lys Lys Leu Val Lys Lys Gly His Ser 565 570 575 Tyr Gln Thr Ala Thr Glu Gly Thr Ala Asn Tyr Leu Gly Leu Ser Tyr 580 585 590 Tyr Asn Arg Tyr Glu Leu Lys Glu Glu Ser Phe Gln Ala Gln Tyr Tyr 595 600 605 Leu Leu Lys Leu Ile Tyr Gln Tyr Val Phe Leu Pro Asn Phe Ser Gln 610 615 620 Gly Asn Ser Pro Ala Phe Arg Glu Thr Val Lys Ala Ile Leu Arg Ile 625 630 635 640 Asn Lys Asp Glu Ala Arg Lys Lys Met Lys Lys Asn Lys Lys Phe Leu 645 650 655 Arg Lys Tyr Ala Phe Glu Gln Val Arg Glu Met Glu Phe Lys Glu Thr 660 665 670 Pro Asp Gln Tyr Met Ser Tyr Leu Gln Ser Glu Met Arg Glu Glu Lys 675 680 685 Val Arg Lys Ala Glu Lys Asn Asp Lys Gly Phe Glu Lys Asn Ile Thr 690 695 700 Met Asn Phe Glu Lys Leu Leu Met Gln Ile Phe Val Lys Gly Phe Asp 705 710 715 720 Val Phe Leu Thr Thr Phe Ala Gly Lys Glu Leu Leu Leu Ser Ser Glu 725 730 735 Glu Lys Val Ile Lys Glu Thr Glu Ile Ser Leu Ser Lys Lys Ile Asn 740 745 750 Glu Arg Glu Lys Thr Leu Lys Ala Ser Ile Gln Val Glu His Gln Leu 755 760 765 Val Ala Thr Asn Ser Ala Ile Ser Tyr Trp Leu Phe Cys Lys Leu Leu 770 775 780 Asp Ser Arg His Leu Asn Glu Leu Arg Asn Glu Met Ile Lys Phe Lys 785 790 795 800 Gln Ser Arg Ile Lys Phe Asn His Thr Gln His Ala Glu Leu Ile Gln 805 810 815 Asn Leu Leu Pro Ile Val Glu Leu Thr Ile Leu Ser Asn Asp Tyr Asp 820 825 830 Glu Lys Asn Asp Ser Gln Asn Val Asp Val Ser Ala Tyr Phe Glu Asp 835 840 845 Lys Ser Leu Tyr Glu Thr Ala Pro Tyr Val Gln Thr Asp Asp Arg Thr 850 855 860 Arg Val Ser Phe Arg Pro Ile Leu Lys Leu Glu Lys Tyr His Thr Lys 865 870 875 880 Ser Leu Ile Glu Ala Leu Leu Lys Asp Asn Pro Gln Phe Arg Val Ala 885 890 895 Ala Thr Asp Ile Gln Glu Trp Met His Lys Arg Glu Glu Ile Gly Glu 900 905 910 Leu Val Glu Lys Arg Lys Asn Leu His Thr Glu Trp Ala Glu Gly Gln 915 920 925 Gln Thr Leu Gly Ala Glu Lys Arg Glu Glu Tyr Arg Asp Tyr Cys Lys 930 935 940 Lys Ile Asp Arg Phe Asn Trp Lys Ala Asn Lys Val Thr Leu Thr Tyr 945 950 955 960 Leu Ser Gln Leu His Tyr Leu Ile Thr Asp Leu Leu Gly Arg Met Val 965 970 975 Gly Phe Ser Ala Leu Phe Glu Arg Asp Leu Val Tyr Phe Ser Arg Ser 980 985 990 Phe Ser Glu Leu Gly Gly Glu Thr Tyr His Ile Ser Asp Tyr Lys Asn 995 1000 1005 Leu Ser Gly Val Leu Arg Leu Asn Ala Glu Val Lys Pro Ile Lys 1010 1015 1020 Ile Lys Asn Ile Lys Val Ile Asp Asn Glu Glu Asn Pro Tyr Lys 1025 1030 1035 Gly Asn Glu Pro Glu Val Lys Pro Phe Leu Asp Arg Leu His Ala 1040 1045 1050 Tyr Leu Glu Asn Val Ile Gly Ile Lys Ala Val His Gly Lys Ile 1055 1060 1065 Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu Leu Ser 1070 1075 1080 Met Ile Glu Ser Met Asn Asn Leu Arg Asp Leu Met Ala Tyr Asp 1085 1090 1095 Arg Lys Leu Lys Asn Ala Val Thr Lys Ser Met Ile Lys Ile Leu 1100 1105 1110 Asp Lys His Gly Met Ile Leu Lys Leu Lys Ile Asp Glu Asn His 1115 1120 1125 Lys Asn Phe Glu Ile Glu Ser Leu Ile Pro Lys Glu Ile Ile His 1130 1135 1140 Leu Lys Asp Lys Ala Ile Lys Thr Asn Gln Val Ser Glu Glu Tyr 1145 1150 1155 Cys Gln Leu Val Leu Ala Leu Leu Thr Thr Asn Pro Gly Asn Gln 1160 1165 1170 Leu Asn 1175 <210> 63 <211> 1164 <212> PRT <213> Carnobacterium gallinarum <400> 63 Met Arg Met Thr Lys Val Lys Ile Asn Gly Ser Pro Val Ser Met Asn 1 5 10 15 Arg Ser Lys Leu Asn Gly His Leu Val Trp Asn Gly Thr Thr Asn Thr 20 25 30 Val Asn Ile Leu Thr Lys Lys Glu Gln Ser Phe Ala Ala Ser Phe Leu 35 40 45 Asn Lys Thr Leu Val Lys Ala Asp Gln Val Lys Gly Tyr Lys Val Leu 50 55 60 Ala Glu Asn Ile Phe Ile Ile Phe Glu Gln Leu Glu Lys Ser Asn Ser 65 70 75 80 Glu Lys Pro Ser Val Tyr Leu Asn Asn Ile Arg Arg Leu Lys Glu Ala 85 90 95 Gly Leu Lys Arg Phe Phe Lys Ser Lys Tyr His Glu Glu Ile Lys Tyr 100 105 110 Thr Ser Glu Lys Asn Gln Ser Val Pro Thr Lys Leu Asn Leu Ile Pro 115 120 125 Leu Phe Phe Asn Ala Val Asp Arg Ile Gln Glu Asp Lys Phe Asp Glu 130 135 140 Lys Asn Trp Ser Tyr Phe Cys Lys Glu Met Ser Pro Tyr Leu Asp Tyr 145 150 155 160 Lys Lys Ser Tyr Leu Asn Arg Lys Lys Glu Ile Leu Ala Asn Ser Ile 165 170 175 Gln Gln Asn Arg Gly Phe Ser Met Pro Thr Ala Glu Glu Pro Asn Leu 180 185 190 Leu Ser Lys Arg Lys Gln Leu Phe Gln Gln Trp Ala Met Lys Phe Gln 195 200 205 Glu Ser Pro Leu Ile Gln Gln Asn Asn Phe Ala Val Glu Gln Phe Asn 210 215 220 Lys Glu Phe Ala Asn Lys Ile Asn Glu Leu Ala Ala Val Tyr Asn Val 225 230 235 240 Asp Glu Leu Cys Thr Ala Ile Thr Glu Lys Leu Met Asn Phe Asp Lys 245 250 255 Asp Lys Ser Asn Lys Thr Arg Asn Phe Glu Ile Lys Lys Leu Trp Lys 260 265 270 Gln His Pro His Asn Lys Asp Lys Ala Leu Ile Lys Leu Phe Asn Gln 275 280 285 Glu Gly Asn Glu Ala Leu Asn Gln Phe Asn Ile Glu Leu Gly Lys Tyr 290 295 300 Phe Glu His Tyr Phe Pro Lys Thr Gly Lys Lys Glu Ser Ala Glu Ser 305 310 315 320 Tyr Tyr Leu Asn Pro Gln Thr Ile Ile Lys Thr Val Gly Tyr Gln Leu 325 330 335 Arg Asn Ala Phe Val Gln Tyr Leu Leu Gln Val Gly Lys Leu His Gln 340 345 350 Tyr Asn Lys Gly Val Leu Asp Ser Gln Thr Leu Gln Glu Ile Gly Met 355 360 365 Tyr Glu Gly Phe Gln Thr Lys Phe Met Asp Ala Cys Val Phe Ala Ser 370 375 380 Ser Ser Leu Arg Asn Ile Ile Gln Ala Thr Thr Asn Glu Asp Ile Leu 385 390 395 400 Thr Arg Glu Lys Phe Lys Lys Glu Leu Glu Lys Asn Val Glu Leu Lys 405 410 415 His Asp Leu Phe Phe Lys Thr Glu Ile Val Glu Glu Arg Asp Glu Asn 420 425 430 Pro Ala Lys Lys Ile Ala Met Thr Pro Asn Glu Leu Asp Leu Trp Ala 435 440 445 Ile Arg Gly Ala Val Gln Arg Val Arg Asn Gln Ile Phe His Gln Gln 450 455 460 Ile Asn Lys Arg His Glu Pro Asn Gln Leu Lys Val Gly Ser Phe Glu 465 470 475 480 Asn Gly Asp Leu Gly Asn Val Ser Tyr Gln Lys Thr Ile Tyr Gln Lys 485 490 495 Leu Phe Asp Ala Glu Ile Lys Asp Ile Glu Ile Tyr Phe Ala Glu Lys 500 505 510 Ile Lys Ser Ser Gly Ala Leu Glu Gln Tyr Ser Met Lys Asp Leu Glu 515 520 525 Lys Leu Phe Ser Asn Lys Glu Leu Thr Leu Ser Leu Gly Gly Gln Val 530 535 540 Val Ala Phe Ala Pro Ser Tyr Lys Lys Leu Tyr Lys Gln Gly Tyr Phe 545 550 555 560 Tyr Gln Asn Glu Lys Thr Ile Glu Leu Glu Gln Phe Thr Asp Tyr Asp 565 570 575 Phe Ser Asn Asp Val Phe Lys Ala Asn Tyr Tyr Leu Ile Lys Leu Ile 580 585 590 Tyr His Tyr Val Phe Leu Pro Gln Phe Ser Gln Ala Asn Asn Lys Leu 595 600 605 Phe Lys Asp Thr Val His Tyr Val Ile Gln Gln Asn Lys Glu Leu Asn 610 615 620 Thr Thr Glu Lys Asp Lys Lys Asn Asn Lys Lys Ile Arg Lys Tyr Ala 625 630 635 640 Phe Glu Gln Val Lys Leu Met Lys Asn Glu Ser Pro Glu Lys Tyr Met 645 650 655 Gln Tyr Leu Gln Arg Glu Met Gln Glu Glu Arg Thr Ile Lys Glu Ala 660 665 670 Lys Lys Thr Asn Glu Glu Lys Pro Asn Tyr Asn Phe Glu Lys Leu Leu 675 680 685 Ile Gln Ile Phe Ile Lys Gly Phe Asp Thr Phe Leu Arg Asn Phe Asp 690 695 700 Leu Asn Leu Asn Pro Ala Glu Glu Leu Val Gly Thr Val Lys Glu Lys 705 710 715 720 Ala Glu Gly Leu Arg Lys Arg Lys Glu Arg Ile Ala Lys Ile Leu Asn 725 730 735 Val Asp Glu Gln Ile Lys Thr Gly Asp Glu Glu Ile Ala Phe Trp Ile 740 745 750 Phe Ala Lys Leu Leu Asp Ala Arg His Leu Ser Glu Leu Arg Asn Glu 755 760 765 Met Ile Lys Phe Lys Gln Ser Ser Val Lys Lys Gly Leu Ile Lys Asn 770 775 780 Gly Asp Leu Ile Glu Gln Met Gln Pro Ile Leu Glu Leu Cys Ile Leu 785 790 795 800 Ser Asn Asp Ser Glu Ser Met Glu Lys Glu Ser Phe Asp Lys Ile Glu 805 810 815 Val Phe Leu Glu Lys Val Glu Leu Ala Lys Asn Glu Pro Tyr Met Gln 820 825 830 Glu Asp Lys Leu Thr Pro Val Lys Phe Arg Phe Met Lys Gln Leu Glu 835 840 845 Lys Tyr Gln Thr Arg Asn Phe Ile Glu Asn Leu Val Ile Glu Asn Pro 850 855 860 Glu Phe Lys Val Ser Glu Lys Ile Val Leu Asn Trp His Glu Glu Lys 865 870 875 880 Glu Lys Ile Ala Asp Leu Val Asp Lys Arg Thr Lys Leu His Glu Glu 885 890 895 Trp Ala Ser Lys Ala Arg Glu Ile Glu Glu Tyr Asn Glu Lys Ile Lys 900 905 910 Lys Asn Lys Ser Lys Lys Leu Asp Lys Pro Ala Glu Phe Ala Lys Phe 915 920 925 Ala Glu Tyr Lys Ile Ile Cys Glu Ala Ile Glu Asn Phe Asn Arg Leu 930 935 940 Asp His Lys Val Arg Leu Thr Tyr Leu Lys Asn Leu His Tyr Leu Met 945 950 955 960 Ile Asp Leu Met Gly Arg Met Val Gly Phe Ser Val Leu Phe Glu Arg 965 970 975 Asp Phe Val Tyr Met Gly Arg Ser Tyr Ser Ala Leu Lys Lys Gln Ser 980 985 990 Ile Tyr Leu Asn Asp Tyr Asp Thr Phe Ala Asn Ile Arg Asp Trp Glu 995 1000 1005 Val Asn Glu Asn Lys His Leu Phe Gly Thr Ser Ser Ser Asp Leu 1010 1015 1020 Thr Phe Gln Glu Thr Ala Glu Phe Lys Asn Leu Lys Lys Pro Met 1025 1030 1035 Glu Asn Gln Leu Lys Ala Leu Leu Gly Val Thr Asn His Ser Phe 1040 1045 1050 Glu Ile Arg Asn Asn Ile Ala His Leu His Val Leu Arg Asn Asp 1055 1060 1065 Gly Lys Gly Glu Gly Val Ser Leu Leu Ser Cys Met Asn Asp Leu 1070 1075 1080 Arg Lys Leu Met Ser Tyr Asp Arg Lys Leu Lys Asn Ala Val Thr 1085 1090 1095 Lys Ala Ile Ile Lys Ile Leu Asp Lys His Gly Met Ile Leu Lys 1100 1105 1110 Leu Thr Asn Asn Asp His Thr Lys Pro Phe Glu Ile Glu Ser Leu 1115 1120 1125 Lys Pro Lys Lys Ile Ile His Leu Glu Lys Ser Asn His Ser Phe 1130 1135 1140 Pro Met Asp Gln Val Ser Gln Glu Tyr Cys Asp Leu Val Lys Lys 1145 1150 1155 Met Leu Val Phe Thr Asn 1160 <210> 64 <211> 1154 <212> PRT <213> Paludibacter propionicigenes <400> 64 Met Arg Val Ser Lys Val Lys Val Lys Asp Gly Gly Lys Asp Lys Met 1 5 10 15 Val Leu Val His Arg Lys Thr Thr Gly Ala Gln Leu Val Tyr Ser Gly 20 25 30 Gln Pro Val Ser Asn Glu Thr Ser Asn Ile Leu Pro Glu Lys Lys Arg 35 40 45 Gln Ser Phe Asp Leu Ser Thr Leu Asn Lys Thr Ile Ile Lys Phe Asp 50 55 60 Thr Ala Lys Lys Gln Lys Leu Asn Val Asp Gln Tyr Lys Ile Val Glu 65 70 75 80 Lys Ile Phe Lys Tyr Pro Lys Gln Glu Leu Pro Lys Gln Ile Lys Ala 85 90 95 Glu Glu Ile Leu Pro Phe Leu Asn His Lys Phe Gln Glu Pro Val Lys 100 105 110 Tyr Trp Lys Asn Gly Lys Glu Glu Ser Phe Asn Leu Thr Leu Leu Ile 115 120 125 Val Glu Ala Val Gln Ala Gln Asp Lys Arg Lys Leu Gln Pro Tyr Tyr 130 135 140 Asp Trp Lys Thr Trp Tyr Ile Gln Thr Lys Ser Asp Leu Leu Lys Lys 145 150 155 160 Ser Ile Glu Asn Asn Arg Ile Asp Leu Thr Glu Asn Leu Ser Lys Arg 165 170 175 Lys Lys Ala Leu Leu Ala Trp Glu Thr Glu Phe Thr Ala Ser Gly Ser 180 185 190 Ile Asp Leu Thr His Tyr His Lys Val Tyr Met Thr Asp Val Leu Cys 195 200 205 Lys Met Leu Gln Asp Val Lys Pro Leu Thr Asp Asp Lys Gly Lys Ile 210 215 220 Asn Thr Asn Ala Tyr His Arg Gly Leu Lys Lys Ala Leu Gln Asn His 225 230 235 240 Gln Pro Ala Ile Phe Gly Thr Arg Glu Val Pro Asn Glu Ala Asn Arg 245 250 255 Ala Asp Asn Gln Leu Ser Ile Tyr His Leu Glu Val Val Lys Tyr Leu 260 265 270 Glu His Tyr Phe Pro Ile Lys Thr Ser Lys Arg Arg Asn Thr Ala Asp 275 280 285 Asp Ile Ala His Tyr Leu Lys Ala Gln Thr Leu Lys Thr Thr Ile Glu 290 295 300 Lys Gln Leu Val Asn Ala Ile Arg Ala Asn Ile Ile Gln Gln Gly Lys 305 310 315 320 Thr Asn His His Glu Leu Lys Ala Asp Thr Thr Ser Asn Asp Leu Ile 325 330 335 Arg Ile Lys Thr Asn Glu Ala Phe Val Leu Asn Leu Thr Gly Thr Cys 340 345 350 Ala Phe Ala Ala Asn Asn Ile Arg Asn Met Val Asp Asn Glu Gln Thr 355 360 365 Asn Asp Ile Leu Gly Lys Gly Asp Phe Ile Lys Ser Leu Leu Lys Asp 370 375 380 Asn Thr Asn Ser Gln Leu Tyr Ser Phe Phe Phe Gly Glu Gly Leu Ser 385 390 395 400 Thr Asn Lys Ala Glu Lys Glu Thr Gln Leu Trp Gly Ile Arg Gly Ala 405 410 415 Val Gln Gln Ile Arg Asn Asn Val Asn His Tyr Lys Lys Asp Ala Leu 420 425 430 Lys Thr Val Phe Asn Ile Ser Asn Phe Glu Asn Pro Thr Ile Thr Asp 435 440 445 Pro Lys Gln Gln Thr Asn Tyr Ala Asp Thr Ile Tyr Lys Ala Arg Phe 450 455 460 Ile Asn Glu Leu Glu Lys Ile Pro Glu Ala Phe Ala Gln Gln Leu Lys 465 470 475 480 Thr Gly Gly Ala Val Ser Tyr Tyr Thr Ile Glu Asn Leu Lys Ser Leu 485 490 495 Leu Thr Thr Phe Gln Phe Ser Leu Cys Arg Ser Thr Ile Pro Phe Ala 500 505 510 Pro Gly Phe Lys Lys Val Phe Asn Gly Gly Ile Asn Tyr Gln Asn Ala 515 520 525 Lys Gln Asp Glu Ser Phe Tyr Glu Leu Met Leu Glu Gln Tyr Leu Arg 530 535 540 Lys Glu Asn Phe Ala Glu Glu Ser Tyr Asn Ala Arg Tyr Phe Met Leu 545 550 555 560 Lys Leu Ile Tyr Asn Asn Leu Phe Leu Pro Gly Phe Thr Thr Asp Arg 565 570 575 Lys Ala Phe Ala Asp Ser Val Gly Phe Val Gln Met Gln Asn Lys Lys 580 585 590 Gln Ala Glu Lys Val Asn Pro Arg Lys Lys Glu Ala Tyr Ala Phe Glu 595 600 605 Ala Val Arg Pro Met Thr Ala Ala Asp Ser Ile Ala Asp Tyr Met Ala 610 615 620 Tyr Val Gln Ser Glu Leu Met Gln Glu Gln Asn Lys Lys Glu Glu Lys 625 630 635 640 Val Ala Glu Glu Thr Arg Ile Asn Phe Glu Lys Phe Val Leu Gln Val 645 650 655 Phe Ile Lys Gly Phe Asp Ser Phe Leu Arg Ala Lys Glu Phe Asp Phe 660 665 670 Val Gln Met Pro Gln Pro Gln Leu Thr Ala Thr Ala Ser Asn Gln Gln 675 680 685 Lys Ala Asp Lys Leu Asn Gln Leu Glu Ala Ser Ile Thr Ala Asp Cys 690 695 700 Lys Leu Thr Pro Gln Tyr Ala Lys Ala Asp Asp Ala Thr His Ile Ala 705 710 715 720 Phe Tyr Val Phe Cys Lys Leu Leu Asp Ala Ala His Leu Ser Asn Leu 725 730 735 Arg Asn Glu Leu Ile Lys Phe Arg Glu Ser Val Asn Glu Phe Lys Phe 740 745 750 His His Leu Leu Glu Ile Ile Glu Ile Cys Leu Leu Ser Ala Asp Val 755 760 765 Val Pro Thr Asp Tyr Arg Asp Leu Tyr Ser Ser Glu Ala Asp Cys Leu 770 775 780 Ala Arg Leu Arg Pro Phe Ile Glu Gln Gly Ala Asp Ile Thr Asn Trp 785 790 795 800 Ser Asp Leu Phe Val Gln Ser Asp Lys His Ser Pro Val Ile His Ala 805 810 815 Asn Ile Glu Leu Ser Val Lys Tyr Gly Thr Thr Lys Leu Leu Glu Gln 820 825 830 Ile Ile Asn Lys Asp Thr Gln Phe Lys Thr Thr Glu Ala Asn Phe Thr 835 840 845 Ala Trp Asn Thr Ala Gln Lys Ser Ile Glu Gln Leu Ile Lys Gln Arg 850 855 860 Glu Asp His His Glu Gln Trp Val Lys Ala Lys Asn Ala Asp Asp Lys 865 870 875 880 Glu Lys Gln Glu Arg Lys Arg Glu Lys Ser Asn Phe Ala Gln Lys Phe 885 890 895 Ile Glu Lys His Gly Asp Asp Tyr Leu Asp Ile Cys Asp Tyr Ile Asn 900 905 910 Thr Tyr Asn Trp Leu Asp Asn Lys Met His Phe Val His Leu Asn Arg 915 920 925 Leu His Gly Leu Thr Ile Glu Leu Leu Gly Arg Met Ala Gly Phe Val 930 935 940 Ala Leu Phe Asp Arg Asp Phe Gln Phe Phe Asp Glu Gln Gln Ile Ala 945 950 955 960 Asp Glu Phe Lys Leu His Gly Phe Val Asn Leu His Ser Ile Asp Lys 965 970 975 Lys Leu Asn Glu Val Pro Thr Lys Lys Ile Lys Glu Ile Tyr Asp Ile 980 985 990 Arg Asn Lys Ile Ile Gln Ile Asn Gly Asn Lys Ile Asn Glu Ser Val 995 1000 1005 Arg Ala Asn Leu Ile Gln Phe Ile Ser Ser Lys Arg Asn Tyr Tyr 1010 1015 1020 Asn Asn Ala Phe Leu His Val Ser Asn Asp Glu Ile Lys Glu Lys 1025 1030 1035 Gln Met Tyr Asp Ile Arg Asn His Ile Ala His Phe Asn Tyr Leu 1040 1045 1050 Thr Lys Asp Ala Ala Asp Phe Ser Leu Ile Asp Leu Ile Asn Glu 1055 1060 1065 Leu Arg Glu Leu Leu His Tyr Asp Arg Lys Leu Lys Asn Ala Val 1070 1075 1080 Ser Lys Ala Phe Ile Asp Leu Phe Asp Lys His Gly Met Ile Leu 1085 1090 1095 Lys Leu Lys Leu Asn Ala Asp His Lys Leu Lys Val Glu Ser Leu 1100 1105 1110 Glu Pro Lys Lys Ile Tyr His Leu Gly Ser Ser Ala Lys Asp Lys 1115 1120 1125 Pro Glu Tyr Gln Tyr Cys Thr Asn Gln Val Met Met Ala Tyr Cys 1130 1135 1140 Asn Met Cys Arg Ser Leu Leu Glu Met Lys Lys 1145 1150 <210> 65 <211> 970 <212> PRT <213> Listeria weihenstephanensis <400> 65 Met Leu Ala Leu Leu His Gln Glu Val Pro Ser Gln Lys Leu His Asn 1 5 10 15 Leu Lys Ser Leu Asn Thr Glu Ser Leu Thr Lys Leu Phe Lys Pro Lys 20 25 30 Phe Gln Asn Met Ile Ser Tyr Pro Pro Ser Lys Gly Ala Glu His Val 35 40 45 Gln Phe Cys Leu Thr Asp Ile Ala Val Pro Ala Ile Arg Asp Leu Asp 50 55 60 Glu Ile Lys Pro Asp Trp Gly Ile Phe Phe Glu Lys Leu Lys Pro Tyr 65 70 75 80 Thr Asp Trp Ala Glu Ser Tyr Ile His Tyr Lys Gln Thr Thr Ile Gln 85 90 95 Lys Ser Ile Glu Gln Asn Lys Ile Gln Ser Pro Asp Ser Pro Arg Lys 100 105 110 Leu Val Leu Gln Lys Tyr Val Thr Ala Phe Leu Asn Gly Glu Pro Leu 115 120 125 Gly Leu Asp Leu Val Ala Lys Lys Tyr Lys Leu Ala Asp Leu Ala Glu 130 135 140 Ser Phe Lys Val Val Asp Leu Asn Glu Asp Lys Ser Ala Asn Tyr Lys 145 150 155 160 Ile Lys Ala Cys Leu Gln Gln His Gln Arg Asn Ile Leu Asp Glu Leu 165 170 175 Lys Glu Asp Pro Glu Leu Asn Gln Tyr Gly Ile Glu Val Lys Lys Tyr 180 185 190 Ile Gln Arg Tyr Phe Pro Ile Lys Arg Ala Pro Asn Arg Ser Lys His 195 200 205 Ala Arg Ala Asp Phe Leu Lys Lys Glu Leu Ile Glu Ser Thr Val Glu 210 215 220 Gln Gln Phe Lys Asn Ala Val Tyr His Tyr Val Leu Glu Gln Gly Lys 225 230 235 240 Met Glu Ala Tyr Glu Leu Thr Asp Pro Lys Thr Lys Asp Leu Gln Asp 245 250 255 Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile Asn Ala Cys Ala 260 265 270 Phe Ala Ser Asn Asn Leu Lys Met Ile Leu Asn Pro Glu Cys Glu Lys 275 280 285 Asp Ile Leu Gly Lys Gly Asp Phe Lys Lys Asn Leu Pro Asn Ser Thr 290 295 300 Thr Gln Ser Asp Val Val Lys Lys Met Ile Pro Phe Phe Ser Asp Glu 305 310 315 320 Ile Gln Asn Val Asn Phe Asp Glu Ala Ile Trp Ala Ile Arg Gly Ser 325 330 335 Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys Lys Lys His Ser Trp 340 345 350 Lys Ser Ile Leu Lys Ile Lys Gly Phe Glu Phe Glu Pro Asn Asn Met 355 360 365 Lys Tyr Thr Asp Ser Asp Met Gln Lys Leu Met Asp Lys Asp Ile Ala 370 375 380 Lys Ile Pro Asp Phe Ile Glu Glu Lys Leu Lys Ser Ser Gly Ile Ile 385 390 395 400 Arg Phe Tyr Ser His Asp Lys Leu Gln Ser Ile Trp Glu Met Lys Gln 405 410 415 Gly Phe Ser Leu Leu Thr Thr Asn Ala Pro Phe Val Pro Ser Phe Lys 420 425 430 Arg Val Tyr Ala Lys Gly His Asp Tyr Gln Thr Ser Lys Asn Arg Tyr 435 440 445 Tyr Asp Leu Gly Leu Thr Thr Phe Asp Ile Leu Glu Tyr Gly Glu Glu 450 455 460 Asp Phe Arg Ala Arg Tyr Phe Leu Thr Lys Leu Val Tyr Tyr Gln Gln 465 470 475 480 Phe Met Pro Trp Phe Thr Ala Asp Asn Asn Ala Phe Arg Asp Ala Ala 485 490 495 Asn Phe Val Leu Arg Leu Asn Lys Asn Arg Gln Gln Asp Ala Lys Ala 500 505 510 Phe Ile Asn Ile Arg Glu Val Glu Glu Gly Glu Met Pro Arg Asp Tyr 515 520 525 Met Gly Tyr Val Gln Gly Gln Ile Ala Ile His Glu Asp Ser Thr Glu 530 535 540 Asp Thr Pro Asn His Phe Glu Lys Phe Ile Ser Gln Val Phe Ile Lys 545 550 555 560 Gly Phe Asp Ser His Met Arg Ser Ala Asp Leu Lys Phe Ile Lys Asn 565 570 575 Pro Arg Asn Gln Gly Leu Glu Gln Ser Glu Ile Glu Glu Met Ser Phe 580 585 590 Asp Ile Lys Val Glu Pro Ser Phe Leu Lys Asn Lys Asp Asp Tyr Ile 595 600 605 Ala Phe Trp Thr Phe Cys Lys Met Leu Asp Ala Arg His Leu Ser Glu 610 615 620 Leu Arg Asn Glu Met Ile Lys Tyr Asp Gly His Leu Thr Gly Glu Gln 625 630 635 640 Glu Ile Ile Gly Leu Ala Leu Leu Gly Val Asp Ser Arg Glu Asn Asp 645 650 655 Trp Lys Gln Phe Phe Ser Ser Glu Arg Glu Tyr Glu Lys Ile Met Lys 660 665 670 Gly Tyr Val Gly Glu Glu Leu Tyr Gln Arg Glu Pro Tyr Arg Gln Ser 675 680 685 Asp Gly Lys Thr Pro Ile Leu Phe Arg Gly Val Glu Gln Ala Arg Lys 690 695 700 Tyr Gly Thr Glu Thr Val Ile Gln Arg Leu Phe Asp Ala Ser Pro Glu 705 710 715 720 Phe Lys Val Ser Lys Cys Asn Ile Thr Glu Trp Glu Arg Gln Lys Glu 725 730 735 Thr Ile Glu Glu Thr Ile Glu Arg Arg Lys Glu Leu His Asn Glu Trp 740 745 750 Glu Lys Asn Pro Lys Lys Pro Gln Asn Asn Ala Phe Phe Lys Glu Tyr 755 760 765 Lys Glu Cys Cys Asp Ala Ile Asp Ala Tyr Asn Trp His Lys Asn Lys 770 775 780 Thr Thr Leu Val Tyr Val Asn Glu Leu His His Leu Leu Ile Glu Ile 785 790 795 800 Leu Gly Arg Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe Gln 805 810 815 Cys Met Ala Asn Gln Tyr Phe Lys His Ser Gly Ile Thr Glu Arg Val 820 825 830 Glu Tyr Trp Gly Asp Asn Arg Leu Lys Ser Ile Lys Lys Leu Asp Thr 835 840 845 Phe Leu Lys Lys Glu Gly Leu Phe Val Ser Glu Lys Asn Ala Arg Asn 850 855 860 His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys Ser Glu Cys Thr Leu 865 870 875 880 Leu Tyr Leu Ser Glu Arg Leu Arg Glu Ile Phe Lys Tyr Asp Arg Lys 885 890 895 Leu Lys Asn Ala Val Ser Lys Ser Leu Ile Asp Ile Leu Asp Arg His 900 905 910 Gly Met Ser Val Val Phe Ala Asn Leu Lys Glu Asn Lys His Arg Leu 915 920 925 Val Ile Lys Ser Leu Glu Pro Lys Lys Leu Arg His Leu Gly Glu Lys 930 935 940 Lys Ile Asp Asn Gly Tyr Ile Glu Thr Asn Gln Val Ser Glu Glu Tyr 945 950 955 960 Cys Gly Ile Val Lys Arg Leu Leu Glu Ile 965 970 <210> 66 <211> 1051 <212> PRT <213> Listeriaceae bacterium <400> 66 Met Lys Ile Thr Lys Met Arg Val Asp Gly Arg Thr Ile Val Met Glu 1 5 10 15 Arg Thr Ser Lys Glu Gly Gln Leu Gly Tyr Glu Gly Ile Asp Gly Asn 20 25 30 Lys Thr Thr Glu Ile Ile Phe Asp Lys Lys Lys Glu Ser Phe Tyr Lys 35 40 45 Ser Ile Leu Asn Lys Thr Val Arg Lys Pro Asp Glu Lys Glu Lys Asn 50 55 60 Arg Arg Lys Gln Ala Ile Asn Lys Ala Ile Asn Lys Glu Ile Thr Glu 65 70 75 80 Leu Met Leu Ala Val Leu His Gln Glu Val Pro Ser Gln Lys Leu His 85 90 95 Asn Leu Lys Ser Leu Asn Thr Glu Ser Leu Thr Lys Leu Phe Lys Pro 100 105 110 Lys Phe Gln Asn Met Ile Ser Tyr Pro Pro Ser Lys Gly Ala Glu His 115 120 125 Val Gln Phe Cys Leu Thr Asp Ile Ala Val Pro Ala Ile Arg Asp Leu 130 135 140 Asp Glu Ile Lys Pro Asp Trp Gly Ile Phe Phe Glu Lys Leu Lys Pro 145 150 155 160 Tyr Thr Asp Trp Ala Glu Ser Tyr Ile His Tyr Lys Gln Thr Thr Ile 165 170 175 Gln Lys Ser Ile Glu Gln Asn Lys Ile Gln Ser Pro Asp Ser Pro Arg 180 185 190 Lys Leu Val Leu Gln Lys Tyr Val Thr Ala Phe Leu Asn Gly Glu Pro 195 200 205 Leu Gly Leu Asp Leu Val Ala Lys Lys Tyr Lys Leu Ala Asp Leu Ala 210 215 220 Glu Ser Phe Lys Leu Val Asp Leu Asn Glu Asp Lys Ser Ala Asn Tyr 225 230 235 240 Lys Ile Lys Ala Cys Leu Gln Gln His Gln Arg Asn Ile Leu Asp Glu 245 250 255 Leu Lys Glu Asp Pro Glu Leu Asn Gln Tyr Gly Ile Glu Val Lys Lys 260 265 270 Tyr Ile Gln Arg Tyr Phe Pro Ile Lys Arg Ala Pro Asn Arg Ser Lys 275 280 285 His Ala Arg Ala Asp Phe Leu Lys Lys Glu Leu Ile Glu Ser Thr Val 290 295 300 Glu Gln Gln Phe Lys Asn Ala Val Tyr His Tyr Val Leu Glu Gln Gly 305 310 315 320 Lys Met Glu Ala Tyr Glu Leu Thr Asp Pro Lys Thr Lys Asp Leu Gln 325 330 335 Asp Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile Asn Ala Cys 340 345 350 Ala Phe Ala Ser Asn Asn Leu Lys Met Ile Leu Asn Pro Glu Cys Glu 355 360 365 Lys Asp Ile Leu Gly Lys Gly Asn Phe Lys Lys Asn Leu Pro Asn Ser 370 375 380 Thr Thr Arg Ser Asp Val Val Lys Lys Met Ile Pro Phe Phe Ser Asp 385 390 395 400 Glu Leu Gln Asn Val Asn Phe Asp Glu Ala Ile Trp Ala Ile Arg Gly 405 410 415 Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys Lys Lys His Ser 420 425 430 Trp Lys Ser Ile Leu Lys Ile Lys Gly Phe Glu Phe Glu Pro Asn Asn 435 440 445 Met Lys Tyr Ala Asp Ser Asp Met Gln Lys Leu Met Asp Lys Asp Ile 450 455 460 Ala Lys Ile Pro Glu Phe Ile Glu Glu Lys Leu Lys Ser Ser Gly Val 465 470 475 480 Val Arg Phe Tyr Arg His Asp Glu Leu Gln Ser Ile Trp Glu Met Lys 485 490 495 Gln Gly Phe Ser Leu Leu Thr Thr Asn Ala Pro Phe Val Pro Ser Phe 500 505 510 Lys Arg Val Tyr Ala Lys Gly His Asp Tyr Gln Thr Ser Lys Asn Arg 515 520 525 Tyr Tyr Asn Leu Asp Leu Thr Thr Phe Asp Ile Leu Glu Tyr Gly Glu 530 535 540 Glu Asp Phe Arg Ala Arg Tyr Phe Leu Thr Lys Leu Val Tyr Tyr Gln 545 550 555 560 Gln Phe Met Pro Trp Phe Thr Ala Asp Asn Asn Ala Phe Arg Asp Ala 565 570 575 Ala Asn Phe Val Leu Arg Leu Asn Lys Asn Arg Gln Gln Asp Ala Lys 580 585 590 Ala Phe Ile Asn Ile Arg Glu Val Glu Glu Gly Glu Met Pro Arg Asp 595 600 605 Tyr Met Gly Tyr Val Gln Gly Gln Ile Ala Ile His Glu Asp Ser Ile 610 615 620 Glu Asp Thr Pro Asn His Phe Glu Lys Phe Ile Ser Gln Val Phe Ile 625 630 635 640 Lys Gly Phe Asp Arg His Met Arg Ser Ala Asn Leu Lys Phe Ile Lys 645 650 655 Asn Pro Arg Asn Gln Gly Leu Glu Gln Ser Glu Ile Glu Glu Met Ser 660 665 670 Phe Asp Ile Lys Val Glu Pro Ser Phe Leu Lys Asn Lys Asp Asp Tyr 675 680 685 Ile Ala Phe Trp Ile Phe Cys Lys Met Leu Asp Ala Arg His Leu Ser 690 695 700 Glu Leu Arg Asn Glu Met Ile Lys Tyr Asp Gly His Leu Thr Gly Glu 705 710 715 720 Gln Glu Ile Ile Gly Leu Ala Leu Leu Gly Val Asp Ser Arg Glu Asn 725 730 735 Asp Trp Lys Gln Phe Phe Ser Ser Glu Arg Glu Tyr Glu Lys Ile Met 740 745 750 Lys Gly Tyr Val Val Glu Glu Leu Tyr Gln Arg Glu Pro Tyr Arg Gln 755 760 765 Ser Asp Gly Lys Thr Pro Ile Leu Phe Arg Gly Val Glu Gln Ala Arg 770 775 780 Lys Tyr Gly Thr Glu Thr Val Ile Gln Arg Leu Phe Asp Ala Asn Pro 785 790 795 800 Glu Phe Lys Val Ser Lys Cys Asn Leu Ala Glu Trp Glu Arg Gln Lys 805 810 815 Glu Thr Ile Glu Glu Thr Ile Lys Arg Arg Lys Glu Leu His Asn Glu 820 825 830 Trp Ala Lys Asn Pro Lys Lys Pro Gln Asn Asn Ala Phe Phe Lys Glu 835 840 845 Tyr Lys Glu Cys Cys Asp Ala Ile Asp Ala Tyr Asn Trp His Lys Asn 850 855 860 Lys Thr Thr Leu Ala Tyr Val Asn Glu Leu His His Leu Leu Ile Glu 865 870 875 880 Ile Leu Gly Arg Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe 885 890 895 Gln Cys Met Ala Asn Gln Tyr Phe Lys His Ser Gly Ile Thr Glu Arg 900 905 910 Val Glu Tyr Trp Gly Asp Asn Arg Leu Lys Ser Ile Lys Lys Leu Asp 915 920 925 Thr Phe Leu Lys Lys Glu Gly Leu Phe Val Ser Glu Lys Asn Ala Arg 930 935 940 Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys Ser Glu Cys Thr 945 950 955 960 Leu Leu Tyr Leu Ser Glu Arg Leu Arg Glu Ile Phe Lys Tyr Asp Arg 965 970 975 Lys Leu Lys Asn Ala Val Ser Lys Ser Leu Ile Asp Ile Leu Asp Arg 980 985 990 His Gly Met Ser Val Val Phe Ala Asn Leu Lys Glu Asn Lys His Arg 995 1000 1005 Leu Val Ile Lys Ser Leu Glu Pro Lys Lys Leu Arg His Leu Gly 1010 1015 1020 Gly Lys Lys Ile Asp Gly Gly Tyr Ile Glu Thr Asn Gln Val Ser 1025 1030 1035 Glu Glu Tyr Cys Gly Ile Val Lys Arg Leu Leu Glu Met 1040 1045 1050 <210> 67 <211> 1152 <212> PRT <213> Leptotrichia wadei <400> 67 Met Lys Val Thr Lys Val Asp Gly Ile Ser His Lys Lys Tyr Ile Glu 1 5 10 15 Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Arg Thr Ser Glu 20 25 30 Arg Leu Ser Glu Leu Leu Ser Ile Arg Leu Asp Ile Tyr Ile Lys Asn 35 40 45 Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu 50 55 60 Lys Lys Phe Phe Ser Asn Lys Val Leu His Leu Lys Asp Ser Val Leu 65 70 75 80 Tyr Leu Lys Asn Arg Lys Glu Lys Asn Ala Val Gln Asp Lys Asn Tyr 85 90 95 Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Ser Phe 100 105 110 Ser Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Val Asn Ser Glu Glu 115 120 125 Leu Glu Ile Phe Arg Lys Asp Val Glu Ala Lys Leu Asn Lys Ile Asn 130 135 140 Ser Leu Lys Tyr Ser Phe Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile 145 150 155 160 Asn Glu Asn Asn Val Glu Lys Val Gly Gly Lys Ser Lys Arg Asn Ile 165 170 175 Ile Tyr Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asn Asp Tyr Ile Asn 180 185 190 Asn Val Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu 195 200 205 Lys Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys 210 215 220 Ile Arg Glu Tyr Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu 225 230 235 240 Asn Phe Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Ile 245 250 255 Lys Glu Leu Ile Glu Lys Ile Pro Asp Met Ser Glu Leu Lys Lys Ser 260 265 270 Gln Val Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys 275 280 285 Asn Ile Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln 290 295 300 Leu Leu Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp 305 310 315 320 Lys Ile Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu 325 330 335 Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys 340 345 350 Tyr Asn Tyr Tyr Leu Gln Val Gly Glu Ile Ala Thr Ser Asp Phe Ile 355 360 365 Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val 370 375 380 Ser Ser Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn 385 390 395 400 Glu Asn Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn 405 410 415 Lys Gly Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn 420 425 430 Glu Asn Lys Gln Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser 435 440 445 Tyr Asp Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala 450 455 460 Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 465 470 475 480 Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala 485 490 495 Pro Ser Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys 500 505 510 Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe 515 520 525 Asn Tyr Tyr Glu Lys Asp Val Ile Ile Lys Tyr Leu Lys Asn Thr Lys 530 535 540 Phe Asn Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys 545 550 555 560 Leu Tyr Asn Lys Ile Glu Asp Leu Arg Asn Thr Leu Lys Phe Phe Trp 565 570 575 Ser Val Pro Lys Asp Lys Glu Glu Lys Asp Ala Gln Ile Tyr Leu Leu 580 585 590 Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Lys Phe Val Lys Asn Ser 595 600 605 Lys Val Phe Phe Lys Ile Thr Asn Glu Val Ile Lys Ile Asn Lys Gln 610 615 620 Arg Asn Gln Lys Thr Gly His Tyr Lys Tyr Gln Lys Phe Glu Asn Ile 625 630 635 640 Glu Lys Thr Val Pro Val Glu Tyr Leu Ala Ile Ile Gln Ser Arg Glu 645 650 655 Met Ile Asn Asn Gln Asp Lys Glu Glu Lys Asn Thr Tyr Ile Asp Phe 660 665 670 Ile Gln Gln Ile Phe Leu Lys Gly Phe Ile Asp Tyr Leu Asn Lys Asn 675 680 685 Asn Leu Lys Tyr Ile Glu Ser Asn Asn Asn Asn Asp Asn Asn Asp Ile 690 695 700 Phe Ser Lys Ile Lys Ile Lys Lys Asp Asn Lys Glu Lys Tyr Asp Lys 705 710 715 720 Ile Leu Lys Asn Tyr Glu Lys His Asn Arg Asn Lys Glu Ile Pro His 725 730 735 Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly Lys Ile Leu Lys 740 745 750 Tyr Thr Glu Asn Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu Leu Asn 755 760 765 His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr Gln Ser 770 775 780 Ala Asn Lys Glu Glu Thr Phe Ser Asp Glu Leu Glu Leu Ile Asn Leu 785 790 795 800 Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu Glu Ala 805 810 815 Asn Glu Ile Gly Lys Phe Leu Asp Phe Asn Glu Asn Lys Ile Lys Asp 820 825 830 Arg Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe Asp Gly 835 840 845 Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys Tyr Gly 850 855 860 Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Lys Tyr Lys Ile 865 870 875 880 Ser Leu Lys Glu Leu Lys Glu Tyr Ser Asn Lys Lys Asn Glu Ile Glu 885 890 895 Lys Asn Tyr Thr Met Gln Gln Asn Leu His Arg Lys Tyr Ala Arg Pro 900 905 910 Lys Lys Asp Glu Lys Phe Asn Asp Glu Asp Tyr Lys Glu Tyr Glu Lys 915 920 925 Ala Ile Gly Asn Ile Gln Lys Tyr Thr His Leu Lys Asn Lys Val Glu 930 935 940 Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Lys Ile Leu His 945 950 955 960 Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg 965 970 975 Leu Lys Gly Glu Phe Pro Glu Asn His Tyr Ile Glu Glu Ile Phe Asn 980 985 990 Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Ser Gly Gln Ile Val Glu 995 1000 1005 Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys Asp Asn Val Glu 1010 1015 1020 Lys Arg Ser Ile Tyr Ser Asp Lys Lys Val Lys Lys Leu Lys Gln 1025 1030 1035 Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn 1040 1045 1050 Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu Glu Asn 1055 1060 1065 Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala Ile 1070 1075 1080 Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr Gly Phe Val Ala 1085 1090 1095 Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Glu Ile Gln Thr Leu 1100 1105 1110 Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys Lys Lys 1115 1120 1125 Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Glu Leu Val Lys 1130 1135 1140 Val Met Phe Glu Tyr Lys Ala Leu Glu 1145 1150 <210> 68 <211> 1285 <212> PRT <213> Rhodobacter capsulatus <400> 68 Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp 1 5 10 15 Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg 20 25 30 Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly 35 40 45 Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg 50 55 60 Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln 65 70 75 80 Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser 85 90 95 Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg 100 105 110 Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys 115 120 125 Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg 130 135 140 Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala 145 150 155 160 Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly 165 170 175 Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val 180 185 190 Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met 195 200 205 Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe 210 215 220 Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val 225 230 235 240 Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser 245 250 255 Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val 260 265 270 Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val 275 280 285 Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala 290 295 300 Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu 305 310 315 320 Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met 325 330 335 Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp 340 345 350 Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys 355 360 365 Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala 370 375 380 Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn 385 390 395 400 Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln 405 410 415 Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly 420 425 430 Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly 435 440 445 Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg 450 455 460 Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile 465 470 475 480 Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu 485 490 495 His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile 500 505 510 Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser 515 520 525 Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu 530 535 540 Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser 545 550 555 560 Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg 565 570 575 Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr 580 585 590 Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr 595 600 605 Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg 610 615 620 Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala 625 630 635 640 Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr 645 650 655 Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Thr Ser Arg Leu Arg Pro 660 665 670 Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly 675 680 685 Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser 690 695 700 Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp 705 710 715 720 Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp 725 730 735 Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro 740 745 750 Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln 755 760 765 Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser 770 775 780 Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr 785 790 795 800 Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg 805 810 815 Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe 820 825 830 Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp 835 840 845 Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg 850 855 860 Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro 865 870 875 880 Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu 885 890 895 Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser 900 905 910 Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu 915 920 925 Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala 930 935 940 Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro 945 950 955 960 Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys 965 970 975 Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp 980 985 990 His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile 995 1000 1005 Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile 1010 1015 1020 Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr 1025 1030 1035 Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys 1040 1045 1050 Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro 1055 1060 1065 Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr 1070 1075 1080 Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met 1085 1090 1095 Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His 1100 1105 1110 Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu 1115 1120 1125 Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu 1130 1135 1140 Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe 1145 1150 1155 Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly 1160 1165 1170 Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln 1175 1180 1185 Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg 1190 1195 1200 Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val 1205 1210 1215 Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly 1220 1225 1230 Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile 1235 1240 1245 Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val 1250 1255 1260 Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala 1265 1270 1275 Ala Asp Leu Val Arg Ile Asp 1280 1285 <210> 69 <211> 1285 <212> PRT <213> Rhodobacter capsulatus <400> 69 Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp 1 5 10 15 Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg 20 25 30 Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly 35 40 45 Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg 50 55 60 Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln 65 70 75 80 Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser 85 90 95 Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg 100 105 110 Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys 115 120 125 Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg 130 135 140 Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala 145 150 155 160 Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly 165 170 175 Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val 180 185 190 Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met 195 200 205 Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe 210 215 220 Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val 225 230 235 240 Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser 245 250 255 Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val 260 265 270 Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val 275 280 285 Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala 290 295 300 Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu 305 310 315 320 Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met 325 330 335 Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp 340 345 350 Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys 355 360 365 Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala 370 375 380 Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn 385 390 395 400 Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln 405 410 415 Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly 420 425 430 Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly 435 440 445 Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg 450 455 460 Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile 465 470 475 480 Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu 485 490 495 His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile 500 505 510 Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser 515 520 525 Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu 530 535 540 Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser 545 550 555 560 Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg 565 570 575 Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr 580 585 590 Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr 595 600 605 Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg 610 615 620 Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala 625 630 635 640 Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr 645 650 655 Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Ser Ser Arg Leu Arg Pro 660 665 670 Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly 675 680 685 Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser 690 695 700 Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp 705 710 715 720 Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp 725 730 735 Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro 740 745 750 Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln 755 760 765 Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser 770 775 780 Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr 785 790 795 800 Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg 805 810 815 Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe 820 825 830 Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp 835 840 845 Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg 850 855 860 Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro 865 870 875 880 Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu 885 890 895 Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser 900 905 910 Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu 915 920 925 Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala 930 935 940 Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro 945 950 955 960 Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys 965 970 975 Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp 980 985 990 His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile 995 1000 1005 Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile 1010 1015 1020 Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr 1025 1030 1035 Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys 1040 1045 1050 Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro 1055 1060 1065 Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr 1070 1075 1080 Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met 1085 1090 1095 Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His 1100 1105 1110 Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu 1115 1120 1125 Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu 1130 1135 1140 Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe 1145 1150 1155 Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly 1160 1165 1170 Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln 1175 1180 1185 Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg 1190 1195 1200 Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val 1205 1210 1215 Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly 1220 1225 1230 Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile 1235 1240 1245 Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val 1250 1255 1260 Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala 1265 1270 1275 Ala Asp Leu Val Arg Ile Asp 1280 1285 <210> 70 <211> 1285 <212> PRT <213> Rhodobacter capsulatus <400> 70 Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp 1 5 10 15 Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg 20 25 30 Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly 35 40 45 Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg 50 55 60 Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln 65 70 75 80 Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser 85 90 95 Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg 100 105 110 Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys 115 120 125 Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg 130 135 140 Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala 145 150 155 160 Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly 165 170 175 Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val 180 185 190 Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met 195 200 205 Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe 210 215 220 Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val 225 230 235 240 Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser 245 250 255 Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val 260 265 270 Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val 275 280 285 Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala 290 295 300 Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu 305 310 315 320 Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met 325 330 335 Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp 340 345 350 Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys 355 360 365 Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala 370 375 380 Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn 385 390 395 400 Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln 405 410 415 Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly 420 425 430 Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly 435 440 445 Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg 450 455 460 Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile 465 470 475 480 Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu 485 490 495 His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile 500 505 510 Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser 515 520 525 Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu 530 535 540 Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser 545 550 555 560 Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg 565 570 575 Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr 580 585 590 Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr 595 600 605 Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg 610 615 620 Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala 625 630 635 640 Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr 645 650 655 Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Ser Ser Arg Leu Arg Pro 660 665 670 Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly 675 680 685 Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser 690 695 700 Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp 705 710 715 720 Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp 725 730 735 Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro 740 745 750 Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln 755 760 765 Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser 770 775 780 Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr 785 790 795 800 Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg 805 810 815 Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe 820 825 830 Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp 835 840 845 Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg 850 855 860 Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro 865 870 875 880 Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu 885 890 895 Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser 900 905 910 Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu 915 920 925 Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala 930 935 940 Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro 945 950 955 960 Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys 965 970 975 Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp 980 985 990 His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile 995 1000 1005 Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile 1010 1015 1020 Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr 1025 1030 1035 Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys 1040 1045 1050 Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro 1055 1060 1065 Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr 1070 1075 1080 Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met 1085 1090 1095 Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His 1100 1105 1110 Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu 1115 1120 1125 Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu 1130 1135 1140 Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe 1145 1150 1155 Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly 1160 1165 1170 Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln 1175 1180 1185 Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg 1190 1195 1200 Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val 1205 1210 1215 Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly 1220 1225 1230 Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile 1235 1240 1245 Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val 1250 1255 1260 Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala 1265 1270 1275 Ala Asp Leu Val Arg Ile Asp 1280 1285 <210> 71 <211> 1389 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: C2c2 orthologue sequence" <400> 71 Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys 1 5 10 15 Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp 20 25 30 Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys 35 40 45 Ile Asp Asn Asn Lys Phe Ile Arg Lys Tyr Ile Asn Tyr Lys Lys Asn 50 55 60 Asp Asn Ile Leu Lys Glu Phe Thr Arg Lys Phe His Ala Gly Asn Ile 65 70 75 80 Leu Phe Lys Leu Lys Gly Lys Glu Gly Ile Ile Arg Ile Glu Asn Asn 85 90 95 Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Ala Tyr 100 105 110 Gly Lys Ser Glu Lys Leu Lys Ala Leu Gly Ile Thr Lys Lys Lys Ile 115 120 125 Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile 130 135 140 Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg 145 150 155 160 Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg 165 170 175 Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile 180 185 190 Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile 195 200 205 Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His 210 215 220 Leu Arg Glu Lys Leu Leu Lys Asp Asp Lys Ile Asp Val Ile Leu Thr 225 230 235 240 Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Leu 245 250 255 Gly Phe Val Lys Phe Tyr Leu Asn Val Gly Gly Asp Lys Lys Lys Ser 260 265 270 Lys Asn Lys Lys Met Leu Val Glu Lys Ile Leu Asn Ile Asn Val Asp 275 280 285 Leu Thr Val Glu Asp Ile Ala Asp Phe Val Ile Lys Glu Leu Glu Phe 290 295 300 Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Val Asn Asn Glu 305 310 315 320 Phe Leu Glu Lys Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu 325 330 335 Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp 340 345 350 Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys 355 360 365 Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asp Glu Leu Ile 370 375 380 Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile 385 390 395 400 Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys 405 410 415 Phe Ser Lys Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr 420 425 430 Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys 435 440 445 Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn 450 455 460 Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr 465 470 475 480 Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Asp 485 490 495 Met Thr Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu 500 505 510 Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu 515 520 525 Leu Asn Lys Ile Phe Ser Arg Glu Asn Ile Asn Asn Asp Glu Asn Ile 530 535 540 Asp Phe Phe Gly Gly Asp Arg Glu Lys Asn Tyr Val Leu Asp Lys Lys 545 550 555 560 Ile Leu Asn Ser Lys Ile Lys Ile Ile Arg Asp Leu Asp Phe Ile Asp 565 570 575 Asn Lys Asn Asn Ile Thr Asn Asn Phe Ile Arg Lys Phe Thr Lys Ile 580 585 590 Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala Ile Ser Lys Glu Arg 595 600 605 Asp Leu Gln Gly Thr Gln Asp Asp Tyr Asn Lys Val Ile Asn Ile Ile 610 615 620 Gln Asn Leu Lys Ile Ser Asp Glu Glu Val Ser Lys Ala Leu Asn Leu 625 630 635 640 Asp Val Val Phe Lys Asp Lys Lys Asn Ile Ile Thr Lys Ile Asn Asp 645 650 655 Ile Lys Ile Ser Glu Glu Asn Asn Asn Asp Ile Lys Tyr Leu Pro Ser 660 665 670 Phe Ser Lys Val Leu Pro Glu Ile Leu Asn Leu Tyr Arg Asn Asn Pro 675 680 685 Lys Asn Glu Pro Phe Asp Thr Ile Glu Thr Glu Lys Ile Val Leu Asn 690 695 700 Ala Leu Ile Tyr Val Asn Lys Glu Leu Tyr Lys Lys Leu Ile Leu Glu 705 710 715 720 Asp Asp Leu Glu Glu Asn Glu Ser Lys Asn Ile Phe Leu Gln Glu Leu 725 730 735 Lys Lys Thr Leu Gly Asn Ile Asp Glu Ile Asp Glu Asn Ile Ile Glu 740 745 750 Asn Tyr Tyr Lys Asn Ala Gln Ile Ser Ala Ser Lys Gly Asn Asn Lys 755 760 765 Ala Ile Lys Lys Tyr Gln Lys Lys Val Ile Glu Cys Tyr Ile Gly Tyr 770 775 780 Leu Arg Lys Asn Tyr Glu Glu Leu Phe Asp Phe Ser Asp Phe Lys Met 785 790 795 800 Asn Ile Gln Glu Ile Lys Lys Gln Ile Lys Asp Ile Asn Asp Asn Lys 805 810 815 Thr Tyr Glu Arg Ile Thr Val Lys Thr Ser Asp Lys Thr Ile Val Ile 820 825 830 Asn Asp Asp Phe Glu Tyr Ile Ile Ser Ile Phe Ala Leu Leu Asn Ser 835 840 845 Asn Ala Val Ile Asn Lys Ile Arg Asn Arg Phe Phe Ala Thr Ser Val 850 855 860 Trp Leu Asn Thr Ser Glu Tyr Gln Asn Ile Ile Asp Ile Leu Asp Glu 865 870 875 880 Ile Met Gln Leu Asn Thr Leu Arg Asn Glu Cys Ile Thr Glu Asn Trp 885 890 895 Asn Leu Asn Leu Glu Glu Phe Ile Gln Lys Met Lys Glu Ile Glu Lys 900 905 910 Asp Phe Asp Asp Phe Lys Ile Gln Thr Lys Lys Glu Ile Phe Asn Asn 915 920 925 Tyr Tyr Glu Asp Ile Lys Asn Asn Ile Leu Thr Glu Phe Lys Asp Asp 930 935 940 Ile Asn Gly Cys Asp Val Leu Glu Lys Lys Leu Glu Lys Ile Val Ile 945 950 955 960 Phe Asp Asp Glu Thr Lys Phe Glu Ile Asp Lys Lys Ser Asn Ile Leu 965 970 975 Gln Asp Glu Gln Arg Lys Leu Ser Asn Ile Asn Lys Lys Asp Leu Lys 980 985 990 Lys Lys Val Asp Gln Tyr Ile Lys Asp Lys Asp Gln Glu Ile Lys Ser 995 1000 1005 Lys Ile Leu Cys Arg Ile Ile Phe Asn Ser Asp Phe Leu Lys Lys 1010 1015 1020 Tyr Lys Lys Glu Ile Asp Asn Leu Ile Glu Asp Met Glu Ser Glu 1025 1030 1035 Asn Glu Asn Lys Phe Gln Glu Ile Tyr Tyr Pro Lys Glu Arg Lys 1040 1045 1050 Asn Glu Leu Tyr Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly 1055 1060 1065 Asn Pro Asn Phe Asp Lys Ile Tyr Gly Leu Ile Ser Asn Asp Ile 1070 1075 1080 Lys Met Ala Asp Ala Lys Phe Leu Phe Asn Ile Asp Gly Lys Asn 1085 1090 1095 Ile Arg Lys Asn Lys Ile Ser Glu Ile Asp Ala Ile Leu Lys Asn 1100 1105 1110 Leu Asn Asp Lys Leu Asn Gly Tyr Ser Lys Glu Tyr Lys Glu Lys 1115 1120 1125 Tyr Ile Lys Lys Leu Lys Glu Asn Asp Asp Phe Phe Ala Lys Asn 1130 1135 1140 Ile Gln Asn Lys Asn Tyr Lys Ser Phe Glu Lys Asp Tyr Asn Arg 1145 1150 1155 Val Ser Glu Tyr Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr 1160 1165 1170 Leu Asn Lys Ile Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu 1175 1180 1185 Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val 1190 1195 1200 Asn Gly Leu Arg Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn 1205 1210 1215 Thr Gly Ile Ser Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly 1220 1225 1230 Phe Tyr Thr Thr Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser 1235 1240 1245 Tyr Lys Lys Phe Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu 1250 1255 1260 Ser Glu Asn Ser Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg 1265 1270 1275 Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp 1280 1285 1290 Tyr Ser Ile Ala Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser 1295 1300 1305 Tyr Ser Thr Arg Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu 1310 1315 1320 Val Phe Lys Lys Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys 1325 1330 1335 Lys Phe Lys Leu Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met 1340 1345 1350 Lys Pro Lys Lys Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser 1355 1360 1365 Asp Tyr Ile Lys Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu 1370 1375 1380 Asn Thr Asn Asp Thr Leu 1385 <210> 72 <211> 1197 <212> PRT <213> Leptotrichia wadei <400> 72 Met Lys Val Thr Lys Val Asp Gly Ile Ser His Lys Lys Tyr Ile Glu 1 5 10 15 Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Arg Thr Ser Glu 20 25 30 Arg Leu Ser Glu Leu Leu Ser Ile Arg Leu Asp Ile Tyr Ile Lys Asn 35 40 45 Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu 50 55 60 Lys Lys Phe Phe Ser Asn Lys Val Leu His Leu Lys Asp Ser Val Leu 65 70 75 80 Tyr Leu Lys Asn Arg Lys Glu Lys Asn Ala Val Gln Asp Lys Asn Tyr 85 90 95 Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Ser Phe 100 105 110 Ser Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Val Asn Ser Glu Glu 115 120 125 Leu Glu Ile Phe Arg Lys Asp Val Glu Ala Lys Leu Asn Lys Ile Asn 130 135 140 Ser Leu Lys Tyr Ser Phe Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile 145 150 155 160 Asn Glu Asn Asn Val Glu Lys Val Gly Gly Lys Ser Lys Arg Asn Ile 165 170 175 Ile Tyr Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asn Asp Tyr Ile Asn 180 185 190 Asn Val Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu 195 200 205 Lys Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys 210 215 220 Ile Arg Glu Tyr Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu 225 230 235 240 Asn Phe Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Ile 245 250 255 Lys Glu Leu Ile Glu Lys Ile Pro Asp Met Ser Glu Leu Lys Lys Ser 260 265 270 Gln Val Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys 275 280 285 Asn Ile Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln 290 295 300 Leu Leu Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp 305 310 315 320 Lys Ile Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu 325 330 335 Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys 340 345 350 Tyr Asn Tyr Tyr Leu Gln Val Gly Glu Ile Ala Thr Ser Asp Phe Ile 355 360 365 Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val 370 375 380 Ser Ser Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn 385 390 395 400 Glu Asn Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn 405 410 415 Lys Gly Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn 420 425 430 Glu Asn Lys Gln Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser 435 440 445 Tyr Asp Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala 450 455 460 Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 465 470 475 480 Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala 485 490 495 Pro Ser Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys 500 505 510 Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe 515 520 525 Asn Tyr Tyr Glu Lys Asp Val Ile Ile Lys Tyr Leu Lys Asn Thr Lys 530 535 540 Phe Asn Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys 545 550 555 560 Leu Tyr Asn Lys Ile Glu Asp Leu Arg Asn Thr Leu Lys Phe Phe Trp 565 570 575 Ser Val Pro Lys Asp Lys Glu Glu Lys Asp Ala Gln Ile Tyr Leu Leu 580 585 590 Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Lys Phe Val Lys Asn Ser 595 600 605 Lys Val Phe Phe Lys Ile Thr Asn Glu Val Ile Lys Ile Asn Lys Gln 610 615 620 Arg Asn Gln Lys Thr Gly His Tyr Lys Tyr Gln Lys Phe Glu Asn Ile 625 630 635 640 Glu Lys Thr Val Pro Val Glu Tyr Leu Ala Ile Ile Gln Ser Arg Glu 645 650 655 Met Ile Asn Asn Gln Asp Lys Glu Glu Lys Asn Thr Tyr Ile Asp Phe 660 665 670 Ile Gln Gln Ile Phe Leu Lys Gly Phe Ile Asp Tyr Leu Asn Lys Asn 675 680 685 Asn Leu Lys Tyr Ile Glu Ser Asn Asn Asn Asn Asp Asn Asn Asp Ile 690 695 700 Phe Ser Lys Ile Lys Ile Lys Lys Asp Asn Lys Glu Lys Tyr Asp Lys 705 710 715 720 Ile Leu Lys Asn Tyr Glu Lys His Asn Arg Asn Lys Glu Ile Pro His 725 730 735 Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly Lys Ile Leu Lys 740 745 750 Tyr Thr Glu Asn Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu Leu Asn 755 760 765 His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr Gln Ser 770 775 780 Ala Asn Lys Glu Glu Thr Phe Ser Asp Glu Leu Glu Leu Ile Asn Leu 785 790 795 800 Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu Glu Ala 805 810 815 Asn Glu Ile Gly Lys Phe Leu Asp Phe Asn Glu Asn Lys Ile Lys Asp 820 825 830 Arg Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe Asp Gly 835 840 845 Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys Tyr Gly 850 855 860 Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Lys Tyr Lys Ile 865 870 875 880 Ser Leu Lys Glu Leu Lys Glu Tyr Ser Asn Lys Lys Asn Glu Ile Glu 885 890 895 Lys Asn Tyr Thr Met Gln Gln Asn Leu His Arg Lys Tyr Ala Arg Pro 900 905 910 Lys Lys Asp Glu Lys Phe Asn Asp Glu Asp Tyr Lys Glu Tyr Glu Lys 915 920 925 Ala Ile Gly Asn Ile Gln Lys Tyr Thr His Leu Lys Asn Lys Val Glu 930 935 940 Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Lys Ile Leu His 945 950 955 960 Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg 965 970 975 Leu Lys Gly Glu Phe Pro Glu Asn His Tyr Ile Glu Glu Ile Phe Asn 980 985 990 Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Ser Gly Gln Ile Val Glu 995 1000 1005 Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys Asp Asn Val Glu 1010 1015 1020 Lys Arg Ser Ile Tyr Ser Asp Lys Lys Val Lys Lys Leu Lys Gln 1025 1030 1035 Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn 1040 1045 1050 Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu Glu Asn 1055 1060 1065 Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala Ile 1070 1075 1080 Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr Gly Phe Val Ala 1085 1090 1095 Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Glu Ile Gln Thr Leu 1100 1105 1110 Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys Lys Lys 1115 1120 1125 Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Glu Leu Val Lys 1130 1135 1140 Val Met Phe Glu Tyr Lys Ala Leu Glu Lys Arg Pro Ala Ala Thr 1145 1150 1155 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr 1160 1165 1170 Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1175 1180 1185 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1190 1195 <210> 73 <211> 1120 <212> PRT <213> Listeria seeligeri <400> 73 Met Trp Ile Ser Ile Lys Thr Leu Ile His His Leu Gly Val Leu Phe 1 5 10 15 Phe Cys Asp Tyr Met Tyr Asn Arg Arg Glu Lys Lys Ile Ile Glu Val 20 25 30 Lys Thr Met Arg Ile Thr Lys Val Glu Val Asp Arg Lys Lys Val Leu 35 40 45 Ile Ser Arg Asp Lys Asn Gly Gly Lys Leu Val Tyr Glu Asn Glu Met 50 55 60 Gln Asp Asn Thr Glu Gln Ile Met His His Lys Lys Ser Ser Phe Tyr 65 70 75 80 Lys Ser Val Val Asn Lys Thr Ile Cys Arg Pro Glu Gln Lys Gln Met 85 90 95 Lys Lys Leu Val His Gly Leu Leu Gln Glu Asn Ser Gln Glu Lys Ile 100 105 110 Lys Val Ser Asp Val Thr Lys Leu Asn Ile Ser Asn Phe Leu Asn His 115 120 125 Arg Phe Lys Lys Ser Leu Tyr Tyr Phe Pro Glu Asn Ser Pro Asp Lys 130 135 140 Ser Glu Glu Tyr Arg Ile Glu Ile Asn Leu Ser Gln Leu Leu Glu Asp 145 150 155 160 Ser Leu Lys Lys Gln Gln Gly Thr Phe Ile Cys Trp Glu Ser Phe Ser 165 170 175 Lys Asp Met Glu Leu Tyr Ile Asn Trp Ala Glu Asn Tyr Ile Ser Ser 180 185 190 Lys Thr Lys Leu Ile Lys Lys Ser Ile Arg Asn Asn Arg Ile Gln Ser 195 200 205 Thr Glu Ser Arg Ser Gly Gln Leu Met Asp Arg Tyr Met Lys Asp Ile 210 215 220 Leu Asn Lys Asn Lys Pro Phe Asp Ile Gln Ser Val Ser Glu Lys Tyr 225 230 235 240 Gln Leu Glu Lys Leu Thr Ser Ala Leu Lys Ala Thr Phe Lys Glu Ala 245 250 255 Lys Lys Asn Asp Lys Glu Ile Asn Tyr Lys Leu Lys Ser Thr Leu Gln 260 265 270 Asn His Glu Arg Gln Ile Ile Glu Glu Leu Lys Glu Asn Ser Glu Leu 275 280 285 Asn Gln Phe Asn Ile Glu Ile Arg Lys His Leu Glu Thr Tyr Phe Pro 290 295 300 Ile Lys Lys Thr Asn Arg Lys Val Gly Asp Ile Arg Asn Leu Glu Ile 305 310 315 320 Gly Glu Ile Gln Lys Ile Val Asn His Arg Leu Lys Asn Lys Ile Val 325 330 335 Gln Arg Ile Leu Gln Glu Gly Lys Leu Ala Ser Tyr Glu Ile Glu Ser 340 345 350 Thr Val Asn Ser Asn Ser Leu Gln Lys Ile Lys Ile Glu Glu Ala Phe 355 360 365 Ala Leu Lys Phe Ile Asn Ala Cys Leu Phe Ala Ser Asn Asn Leu Arg 370 375 380 Asn Met Val Tyr Pro Val Cys Lys Lys Asp Ile Leu Met Ile Gly Glu 385 390 395 400 Phe Lys Asn Ser Phe Lys Glu Ile Lys His Lys Lys Phe Ile Arg Gln 405 410 415 Trp Ser Gln Phe Phe Ser Gln Glu Ile Thr Val Asp Asp Ile Glu Leu 420 425 430 Ala Ser Trp Gly Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile 435 440 445 Ile His Leu Lys Lys His Ser Trp Lys Lys Phe Phe Asn Asn Pro Thr 450 455 460 Phe Lys Val Lys Lys Ser Lys Ile Ile Asn Gly Lys Thr Lys Asp Val 465 470 475 480 Thr Ser Glu Phe Leu Tyr Lys Glu Thr Leu Phe Lys Asp Tyr Phe Tyr 485 490 495 Ser Glu Leu Asp Ser Val Pro Glu Leu Ile Ile Asn Lys Met Glu Ser 500 505 510 Ser Lys Ile Leu Asp Tyr Tyr Ser Ser Asp Gln Leu Asn Gln Val Phe 515 520 525 Thr Ile Pro Asn Phe Glu Leu Ser Leu Leu Thr Ser Ala Val Pro Phe 530 535 540 Ala Pro Ser Phe Lys Arg Val Tyr Leu Lys Gly Phe Asp Tyr Gln Asn 545 550 555 560 Gln Asp Glu Ala Gln Pro Asp Tyr Asn Leu Lys Leu Asn Ile Tyr Asn 565 570 575 Glu Lys Ala Phe Asn Ser Glu Ala Phe Gln Ala Gln Tyr Ser Leu Phe 580 585 590 Lys Met Val Tyr Tyr Gln Val Phe Leu Pro Gln Phe Thr Thr Asn Asn 595 600 605 Asp Leu Phe Lys Ser Ser Val Asp Phe Ile Leu Thr Leu Asn Lys Glu 610 615 620 Arg Lys Gly Tyr Ala Lys Ala Phe Gln Asp Ile Arg Lys Met Asn Lys 625 630 635 640 Asp Glu Lys Pro Ser Glu Tyr Met Ser Tyr Ile Gln Ser Gln Leu Met 645 650 655 Leu Tyr Gln Lys Lys Gln Glu Glu Lys Glu Lys Ile Asn His Phe Glu 660 665 670 Lys Phe Ile Asn Gln Val Phe Ile Lys Gly Phe Asn Ser Phe Ile Glu 675 680 685 Lys Asn Arg Leu Thr Tyr Ile Cys His Pro Thr Lys Asn Thr Val Pro 690 695 700 Glu Asn Asp Asn Ile Glu Ile Pro Phe His Thr Asp Met Asp Asp Ser 705 710 715 720 Asn Ile Ala Phe Trp Leu Met Cys Lys Leu Leu Asp Ala Lys Gln Leu 725 730 735 Ser Glu Leu Arg Asn Glu Met Ile Lys Phe Ser Cys Ser Leu Gln Ser 740 745 750 Thr Glu Glu Ile Ser Thr Phe Thr Lys Ala Arg Glu Val Ile Gly Leu 755 760 765 Ala Leu Leu Asn Gly Glu Lys Gly Cys Asn Asp Trp Lys Glu Leu Phe 770 775 780 Asp Asp Lys Glu Ala Trp Lys Lys Asn Met Ser Leu Tyr Val Ser Glu 785 790 795 800 Glu Leu Leu Gln Ser Leu Pro Tyr Thr Gln Glu Asp Gly Gln Thr Pro 805 810 815 Val Ile Asn Arg Ser Ile Asp Leu Val Lys Lys Tyr Gly Thr Glu Thr 820 825 830 Ile Leu Glu Lys Leu Phe Ser Ser Ser Asp Asp Tyr Lys Val Ser Ala 835 840 845 Lys Asp Ile Ala Lys Leu His Glu Tyr Asp Val Thr Glu Lys Ile Ala 850 855 860 Gln Gln Glu Ser Leu His Lys Gln Trp Ile Glu Lys Pro Gly Leu Ala 865 870 875 880 Arg Asp Ser Ala Trp Thr Lys Lys Tyr Gln Asn Val Ile Asn Asp Ile 885 890 895 Ser Asn Tyr Gln Trp Ala Lys Thr Lys Val Glu Leu Thr Gln Val Arg 900 905 910 His Leu His Gln Leu Thr Ile Asp Leu Leu Ser Arg Leu Ala Gly Tyr 915 920 925 Met Ser Ile Ala Asp Arg Asp Phe Gln Phe Ser Ser Asn Tyr Ile Leu 930 935 940 Glu Arg Glu Asn Ser Glu Tyr Arg Val Thr Ser Trp Ile Leu Leu Ser 945 950 955 960 Glu Asn Lys Asn Lys Asn Lys Tyr Asn Asp Tyr Glu Leu Tyr Asn Leu 965 970 975 Lys Asn Ala Ser Ile Lys Val Ser Ser Lys Asn Asp Pro Gln Leu Lys 980 985 990 Val Asp Leu Lys Gln Leu Arg Leu Thr Leu Glu Tyr Leu Glu Leu Phe 995 1000 1005 Asp Asn Arg Leu Lys Glu Lys Arg Asn Asn Ile Ser His Phe Asn 1010 1015 1020 Tyr Leu Asn Gly Gln Leu Gly Asn Ser Ile Leu Glu Leu Phe Asp 1025 1030 1035 Asp Ala Arg Asp Val Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala 1040 1045 1050 Val Ser Lys Ser Leu Lys Glu Ile Leu Ser Ser His Gly Met Glu 1055 1060 1065 Val Thr Phe Lys Pro Leu Tyr Gln Thr Asn His His Leu Lys Ile 1070 1075 1080 Asp Lys Leu Gln Pro Lys Lys Ile His His Leu Gly Glu Lys Ser 1085 1090 1095 Thr Val Ser Ser Asn Gln Val Ser Asn Glu Tyr Cys Gln Leu Val 1100 1105 1110 Arg Thr Leu Leu Thr Met Lys 1115 1120 <210> 74 <211> 1159 <212> PRT <213> Leptotrichia buccalis <400> 74 Met Lys Val Thr Lys Val Gly Gly Ile Ser His Lys Lys Tyr Thr Ser 1 5 10 15 Glu Gly Arg Leu Val Lys Ser Glu Ser Glu Glu Asn Arg Thr Asp Glu 20 25 30 Arg Leu Ser Ala Leu Leu Asn Met Arg Leu Asp Met Tyr Ile Lys Asn 35 40 45 Pro Ser Ser Thr Glu Thr Lys Glu Asn Gln Lys Arg Ile Gly Lys Leu 50 55 60 Lys Lys Phe Phe Ser Asn Lys Met Val Tyr Leu Lys Asp Asn Thr Leu 65 70 75 80 Ser Leu Lys Asn Gly Lys Lys Glu Asn Ile Asp Arg Glu Tyr Ser Glu 85 90 95 Thr Asp Ile Leu Glu Ser Asp Val Arg Asp Lys Lys Asn Phe Ala Val 100 105 110 Leu Lys Lys Ile Tyr Leu Asn Glu Asn Val Asn Ser Glu Glu Leu Glu 115 120 125 Val Phe Arg Asn Asp Ile Lys Lys Lys Leu Asn Lys Ile Asn Ser Leu 130 135 140 Lys Tyr Ser Phe Glu Lys Asn Lys Ala Asn Tyr Gln Lys Ile Asn Glu 145 150 155 160 Asn Asn Ile Glu Lys Val Glu Gly Lys Ser Lys Arg Asn Ile Ile Tyr 165 170 175 Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asp Ala Tyr Val Ser Asn Val 180 185 190 Lys Glu Ala Phe Asp Lys Leu Tyr Lys Glu Glu Asp Ile Ala Lys Leu 195 200 205 Val Leu Glu Ile Glu Asn Leu Thr Lys Leu Glu Lys Tyr Lys Ile Arg 210 215 220 Glu Phe Tyr His Glu Ile Ile Gly Arg Lys Asn Asp Lys Glu Asn Phe 225 230 235 240 Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Met Lys Glu 245 250 255 Leu Ile Glu Lys Val Pro Asp Met Ser Glu Leu Lys Lys Ser Gln Val 260 265 270 Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys Asn Ile 275 280 285 Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln Leu Leu 290 295 300 Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp Lys Ile 305 310 315 320 Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu Asn Lys 325 330 335 Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys Tyr Asn 340 345 350 Tyr Tyr Leu Gln Asp Gly Glu Ile Ala Thr Ser Asp Phe Ile Ala Arg 355 360 365 Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val Ser Ser 370 375 380 Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn Glu Asn 385 390 395 400 Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn Lys Gly 405 410 415 Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn Glu Asn 420 425 430 Lys Lys Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser Tyr Asp 435 440 445 Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala Asn Ile 450 455 460 Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe Asn Leu 465 470 475 480 Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala Pro Ser 485 490 495 Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys Lys Leu 500 505 510 Lys Leu Lys Ile Phe Arg Gln Leu Asn Ser Ala Asn Val Phe Arg Tyr 515 520 525 Leu Glu Lys Tyr Lys Ile Leu Asn Tyr Leu Lys Arg Thr Arg Phe Glu 530 535 540 Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys Leu Tyr 545 550 555 560 Ser Arg Ile Asp Asp Leu Lys Asn Ser Leu Gly Ile Tyr Trp Lys Thr 565 570 575 Pro Lys Thr Asn Asp Asp Asn Lys Thr Lys Glu Ile Ile Asp Ala Gln 580 585 590 Ile Tyr Leu Leu Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Tyr Phe 595 600 605 Met Ser Asn Asn Gly Asn Phe Phe Glu Ile Ser Lys Glu Ile Ile Glu 610 615 620 Leu Asn Lys Asn Asp Lys Arg Asn Leu Lys Thr Gly Phe Tyr Lys Leu 625 630 635 640 Gln Lys Phe Glu Asp Ile Gln Glu Lys Ile Pro Lys Glu Tyr Leu Ala 645 650 655 Asn Ile Gln Ser Leu Tyr Met Ile Asn Ala Gly Asn Gln Asp Glu Glu 660 665 670 Glu Lys Asp Thr Tyr Ile Asp Phe Ile Gln Lys Ile Phe Leu Lys Gly 675 680 685 Phe Met Thr Tyr Leu Ala Asn Asn Gly Arg Leu Ser Leu Ile Tyr Ile 690 695 700 Gly Ser Asp Glu Glu Thr Asn Thr Ser Leu Ala Glu Lys Lys Gln Glu 705 710 715 720 Phe Asp Lys Phe Leu Lys Lys Tyr Glu Gln Asn Asn Asn Ile Lys Ile 725 730 735 Pro Tyr Glu Ile Asn Glu Phe Leu Arg Glu Ile Lys Leu Gly Asn Ile 740 745 750 Leu Lys Tyr Thr Glu Arg Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu 755 760 765 Leu Asn His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr 770 775 780 Gln Ser Ala Asn Lys Glu Glu Ala Phe Ser Asp Gln Leu Glu Leu Ile 785 790 795 800 Asn Leu Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu 805 810 815 Glu Ala Asp Glu Ile Gly Lys Phe Leu Asp Phe Asn Gly Asn Lys Val 820 825 830 Lys Asp Asn Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe 835 840 845 Asp Gly Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys 850 855 860 Tyr Gly Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Gly Tyr 865 870 875 880 Lys Ile Ser Ile Glu Glu Leu Lys Lys Tyr Ser Asn Lys Lys Asn Glu 885 890 895 Ile Glu Lys Asn His Lys Met Gln Glu Asn Leu His Arg Lys Tyr Ala 900 905 910 Arg Pro Arg Lys Asp Glu Lys Phe Thr Asp Glu Asp Tyr Glu Ser Tyr 915 920 925 Lys Gln Ala Ile Glu Asn Ile Glu Glu Tyr Thr His Leu Lys Asn Lys 930 935 940 Val Glu Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Arg Ile 945 950 955 960 Leu His Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg 965 970 975 Phe Arg Leu Lys Gly Glu Phe Pro Glu Asn Gln Tyr Ile Glu Glu Ile 980 985 990 Phe Asn Phe Glu Asn Lys Lys Asn Val Lys Tyr Lys Gly Gly Gln Ile 995 1000 1005 Val Glu Lys Tyr Ile Lys Phe Tyr Lys Glu Leu His Gln Asn Asp 1010 1015 1020 Glu Val Lys Ile Asn Lys Tyr Ser Ser Ala Asn Ile Lys Val Leu 1025 1030 1035 Lys Gln Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His 1040 1045 1050 Phe Asn Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu 1055 1060 1065 Glu Asn Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn 1070 1075 1080 Ala Val Met Lys Ser Val Val Asp Ile Leu Lys Glu Tyr Gly Phe 1085 1090 1095 Val Ala Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Gly Ile Gln 1100 1105 1110 Thr Leu Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys 1115 1120 1125 Lys Lys Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Lys Leu 1130 1135 1140 Val Lys Ile Met Phe Glu Tyr Lys Met Glu Glu Lys Lys Ser Glu 1145 1150 1155 Asn <210> 75 <211> 1285 <212> PRT <213> Herbinix hemicellulosilytica <400> 75 Met Lys Leu Thr Arg Arg Arg Ile Ser Gly Asn Ser Val Asp Gln Lys 1 5 10 15 Ile Thr Ala Ala Phe Tyr Arg Asp Met Ser Gln Gly Leu Leu Tyr Tyr 20 25 30 Asp Ser Glu Asp Asn Asp Cys Thr Asp Lys Val Ile Glu Ser Met Asp 35 40 45 Phe Glu Arg Ser Trp Arg Gly Arg Ile Leu Lys Asn Gly Glu Asp Asp 50 55 60 Lys Asn Pro Phe Tyr Met Phe Val Lys Gly Leu Val Gly Ser Asn Asp 65 70 75 80 Lys Ile Val Cys Glu Pro Ile Asp Val Asp Ser Asp Pro Asp Asn Leu 85 90 95 Asp Ile Leu Ile Asn Lys Asn Leu Thr Gly Phe Gly Arg Asn Leu Lys 100 105 110 Ala Pro Asp Ser Asn Asp Thr Leu Glu Asn Leu Ile Arg Lys Ile Gln 115 120 125 Ala Gly Ile Pro Glu Glu Glu Val Leu Pro Glu Leu Lys Lys Ile Lys 130 135 140 Glu Met Ile Gln Lys Asp Ile Val Asn Arg Lys Glu Gln Leu Leu Lys 145 150 155 160 Ser Ile Lys Asn Asn Arg Ile Pro Phe Ser Leu Glu Gly Ser Lys Leu 165 170 175 Val Pro Ser Thr Lys Lys Met Lys Trp Leu Phe Lys Leu Ile Asp Val 180 185 190 Pro Asn Lys Thr Phe Asn Glu Lys Met Leu Glu Lys Tyr Trp Glu Ile 195 200 205 Tyr Asp Tyr Asp Lys Leu Lys Ala Asn Ile Thr Asn Arg Leu Asp Lys 210 215 220 Thr Asp Lys Lys Ala Arg Ser Ile Ser Arg Ala Val Ser Glu Glu Leu 225 230 235 240 Arg Glu Tyr His Lys Asn Leu Arg Thr Asn Tyr Asn Arg Phe Val Ser 245 250 255 Gly Asp Arg Pro Ala Ala Gly Leu Asp Asn Gly Gly Ser Ala Lys Tyr 260 265 270 Asn Pro Asp Lys Glu Glu Phe Leu Leu Phe Leu Lys Glu Val Glu Gln 275 280 285 Tyr Phe Lys Lys Tyr Phe Pro Val Lys Ser Lys His Ser Asn Lys Ser 290 295 300 Lys Asp Lys Ser Leu Val Asp Lys Tyr Lys Asn Tyr Cys Ser Tyr Lys 305 310 315 320 Val Val Lys Lys Glu Val Asn Arg Ser Ile Ile Asn Gln Leu Val Ala 325 330 335 Gly Leu Ile Gln Gln Gly Lys Leu Leu Tyr Tyr Phe Tyr Tyr Asn Asp 340 345 350 Thr Trp Gln Glu Asp Phe Leu Asn Ser Tyr Gly Leu Ser Tyr Ile Gln 355 360 365 Val Glu Glu Ala Phe Lys Lys Ser Val Met Thr Ser Leu Ser Trp Gly 370 375 380 Ile Asn Arg Leu Thr Ser Phe Phe Ile Asp Asp Ser Asn Thr Val Lys 385 390 395 400 Phe Asp Asp Ile Thr Thr Lys Lys Ala Lys Glu Ala Ile Glu Ser Asn 405 410 415 Tyr Phe Asn Lys Leu Arg Thr Cys Ser Arg Met Gln Asp His Phe Lys 420 425 430 Glu Lys Leu Ala Phe Phe Tyr Pro Val Tyr Val Lys Asp Lys Lys Asp 435 440 445 Arg Pro Asp Asp Asp Ile Glu Asn Leu Ile Val Leu Val Lys Asn Ala 450 455 460 Ile Glu Ser Val Ser Tyr Leu Arg Asn Arg Thr Phe His Phe Lys Glu 465 470 475 480 Ser Ser Leu Leu Glu Leu Leu Lys Glu Leu Asp Asp Lys Asn Ser Gly 485 490 495 Gln Asn Lys Ile Asp Tyr Ser Val Ala Ala Glu Phe Ile Lys Arg Asp 500 505 510 Ile Glu Asn Leu Tyr Asp Val Phe Arg Glu Gln Ile Arg Ser Leu Gly 515 520 525 Ile Ala Glu Tyr Tyr Lys Ala Asp Met Ile Ser Asp Cys Phe Lys Thr 530 535 540 Cys Gly Leu Glu Phe Ala Leu Tyr Ser Pro Lys Asn Ser Leu Met Pro 545 550 555 560 Ala Phe Lys Asn Val Tyr Lys Arg Gly Ala Asn Leu Asn Lys Ala Tyr 565 570 575 Ile Arg Asp Lys Gly Pro Lys Glu Thr Gly Asp Gln Gly Gln Asn Ser 580 585 590 Tyr Lys Ala Leu Glu Glu Tyr Arg Glu Leu Thr Trp Tyr Ile Glu Val 595 600 605 Lys Asn Asn Asp Gln Ser Tyr Asn Ala Tyr Lys Asn Leu Leu Gln Leu 610 615 620 Ile Tyr Tyr His Ala Phe Leu Pro Glu Val Arg Glu Asn Glu Ala Leu 625 630 635 640 Ile Thr Asp Phe Ile Asn Arg Thr Lys Glu Trp Asn Arg Lys Glu Thr 645 650 655 Glu Glu Arg Leu Asn Thr Lys Asn Asn Lys Lys His Lys Asn Phe Asp 660 665 670 Glu Asn Asp Asp Ile Thr Val Asn Thr Tyr Arg Tyr Glu Ser Ile Pro 675 680 685 Asp Tyr Gln Gly Glu Ser Leu Asp Asp Tyr Leu Lys Val Leu Gln Arg 690 695 700 Lys Gln Met Ala Arg Ala Lys Glu Val Asn Glu Lys Glu Glu Gly Asn 705 710 715 720 Asn Asn Tyr Ile Gln Phe Ile Arg Asp Val Val Val Trp Ala Phe Gly 725 730 735 Ala Tyr Leu Glu Asn Lys Leu Lys Asn Tyr Lys Asn Glu Leu Gln Pro 740 745 750 Pro Leu Ser Lys Glu Asn Ile Gly Leu Asn Asp Thr Leu Lys Glu Leu 755 760 765 Phe Pro Glu Glu Lys Val Lys Ser Pro Phe Asn Ile Lys Cys Arg Phe 770 775 780 Ser Ile Ser Thr Phe Ile Asp Asn Lys Gly Lys Ser Thr Asp Asn Thr 785 790 795 800 Ser Ala Glu Ala Val Lys Thr Asp Gly Lys Glu Asp Glu Lys Asp Lys 805 810 815 Lys Asn Ile Lys Arg Lys Asp Leu Leu Cys Phe Tyr Leu Phe Leu Arg 820 825 830 Leu Leu Asp Glu Asn Glu Ile Cys Lys Leu Gln His Gln Phe Ile Lys 835 840 845 Tyr Arg Cys Ser Leu Lys Glu Arg Arg Phe Pro Gly Asn Arg Thr Lys 850 855 860 Leu Glu Lys Glu Thr Glu Leu Leu Ala Glu Leu Glu Glu Leu Met Glu 865 870 875 880 Leu Val Arg Phe Thr Met Pro Ser Ile Pro Glu Ile Ser Ala Lys Ala 885 890 895 Glu Ser Gly Tyr Asp Thr Met Ile Lys Lys Tyr Phe Lys Asp Phe Ile 900 905 910 Glu Lys Lys Val Phe Lys Asn Pro Lys Thr Ser Asn Leu Tyr Tyr His 915 920 925 Ser Asp Ser Lys Thr Pro Val Thr Arg Lys Tyr Met Ala Leu Leu Met 930 935 940 Arg Ser Ala Pro Leu His Leu Tyr Lys Asp Ile Phe Lys Gly Tyr Tyr 945 950 955 960 Leu Ile Thr Lys Lys Glu Cys Leu Glu Tyr Ile Lys Leu Ser Asn Ile 965 970 975 Ile Lys Asp Tyr Gln Asn Ser Leu Asn Glu Leu His Glu Gln Leu Glu 980 985 990 Arg Ile Lys Leu Lys Ser Glu Lys Gln Asn Gly Lys Asp Ser Leu Tyr 995 1000 1005 Leu Asp Lys Lys Asp Phe Tyr Lys Val Lys Glu Tyr Val Glu Asn 1010 1015 1020 Leu Glu Gln Val Ala Arg Tyr Lys His Leu Gln His Lys Ile Asn 1025 1030 1035 Phe Glu Ser Leu Tyr Arg Ile Phe Arg Ile His Val Asp Ile Ala 1040 1045 1050 Ala Arg Met Val Gly Tyr Thr Gln Asp Trp Glu Arg Asp Met His 1055 1060 1065 Phe Leu Phe Lys Ala Leu Val Tyr Asn Gly Val Leu Glu Glu Arg 1070 1075 1080 Arg Phe Glu Ala Ile Phe Asn Asn Asn Asp Asp Asn Asn Asp Gly 1085 1090 1095 Arg Ile Val Lys Lys Ile Gln Asn Asn Leu Asn Asn Lys Asn Arg 1100 1105 1110 Glu Leu Val Ser Met Leu Cys Trp Asn Lys Lys Leu Asn Lys Asn 1115 1120 1125 Glu Phe Gly Ala Ile Ile Trp Lys Arg Asn Pro Ile Ala His Leu 1130 1135 1140 Asn His Phe Thr Gln Thr Glu Gln Asn Ser Lys Ser Ser Leu Glu 1145 1150 1155 Ser Leu Ile Asn Ser Leu Arg Ile Leu Leu Ala Tyr Asp Arg Lys 1160 1165 1170 Arg Gln Asn Ala Val Thr Lys Thr Ile Asn Asp Leu Leu Leu Asn 1175 1180 1185 Asp Tyr His Ile Arg Ile Lys Trp Glu Gly Arg Val Asp Glu Gly 1190 1195 1200 Gln Ile Tyr Phe Asn Ile Lys Glu Lys Glu Asp Ile Glu Asn Glu 1205 1210 1215 Pro Ile Ile His Leu Lys His Leu His Lys Lys Asp Cys Tyr Ile 1220 1225 1230 Tyr Lys Asn Ser Tyr Met Phe Asp Lys Gln Lys Glu Trp Ile Cys 1235 1240 1245 Asn Gly Ile Lys Glu Glu Val Tyr Asp Lys Ser Ile Leu Lys Cys 1250 1255 1260 Ile Gly Asn Leu Phe Lys Phe Asp Tyr Glu Asp Lys Asn Lys Ser 1265 1270 1275 Ser Ala Asn Pro Lys His Thr 1280 1285 <210> 76 <211> 1344 <212> PRT <213> Eubacterium rectale <400> 76 Met Leu Arg Arg Asp Lys Glu Val Lys Lys Leu Tyr Asn Val Phe Asn 1 5 10 15 Gln Ile Gln Val Gly Thr Lys Pro Lys Lys Trp Asn Asn Asp Glu Lys 20 25 30 Leu Ser Pro Glu Glu Asn Glu Arg Arg Ala Gln Gln Lys Asn Ile Lys 35 40 45 Met Lys Asn Tyr Lys Trp Arg Glu Ala Cys Ser Lys Tyr Val Glu Ser 50 55 60 Ser Gln Arg Ile Ile Asn Asp Val Ile Phe Tyr Ser Tyr Arg Lys Ala 65 70 75 80 Lys Asn Lys Leu Arg Tyr Met Arg Lys Asn Glu Asp Ile Leu Lys Lys 85 90 95 Met Gln Glu Ala Glu Lys Leu Ser Lys Phe Ser Gly Gly Lys Leu Glu 100 105 110 Asp Phe Val Ala Tyr Thr Leu Arg Lys Ser Leu Val Val Ser Lys Tyr 115 120 125 Asp Thr Gln Glu Phe Asp Ser Leu Ala Ala Met Val Val Phe Leu Glu 130 135 140 Cys Ile Gly Lys Asn Asn Ile Ser Asp His Glu Arg Glu Ile Val Cys 145 150 155 160 Lys Leu Leu Glu Leu Ile Arg Lys Asp Phe Ser Lys Leu Asp Pro Asn 165 170 175 Val Lys Gly Ser Gln Gly Ala Asn Ile Val Arg Ser Val Arg Asn Gln 180 185 190 Asn Met Ile Val Gln Pro Gln Gly Asp Arg Phe Leu Phe Pro Gln Val 195 200 205 Tyr Ala Lys Glu Asn Glu Thr Val Thr Asn Lys Asn Val Glu Lys Glu 210 215 220 Gly Leu Asn Glu Phe Leu Leu Asn Tyr Ala Asn Leu Asp Asp Glu Lys 225 230 235 240 Arg Ala Glu Ser Leu Arg Lys Leu Arg Arg Ile Leu Asp Val Tyr Phe 245 250 255 Ser Ala Pro Asn His Tyr Glu Lys Asp Met Asp Ile Thr Leu Ser Asp 260 265 270 Asn Ile Glu Lys Glu Lys Phe Asn Val Trp Glu Lys His Glu Cys Gly 275 280 285 Lys Lys Glu Thr Gly Leu Phe Val Asp Ile Pro Asp Val Leu Met Glu 290 295 300 Ala Glu Ala Glu Asn Ile Lys Leu Asp Ala Val Val Glu Lys Arg Glu 305 310 315 320 Arg Lys Val Leu Asn Asp Arg Val Arg Lys Gln Asn Ile Ile Cys Tyr 325 330 335 Arg Tyr Thr Arg Ala Val Val Glu Lys Tyr Asn Ser Asn Glu Pro Leu 340 345 350 Phe Phe Glu Asn Asn Ala Ile Asn Gln Tyr Trp Ile His His Ile Glu 355 360 365 Asn Ala Val Glu Arg Ile Leu Lys Asn Cys Lys Ala Gly Lys Leu Phe 370 375 380 Lys Leu Arg Lys Gly Tyr Leu Ala Glu Lys Val Trp Lys Asp Ala Ile 385 390 395 400 Asn Leu Ile Ser Ile Lys Tyr Ile Ala Leu Gly Lys Ala Val Tyr Asn 405 410 415 Phe Ala Leu Asp Asp Ile Trp Lys Asp Lys Lys Asn Lys Glu Leu Gly 420 425 430 Ile Val Asp Glu Arg Ile Arg Asn Gly Ile Thr Ser Phe Asp Tyr Glu 435 440 445 Met Ile Lys Ala His Glu Asn Leu Gln Arg Glu Leu Ala Val Asp Ile 450 455 460 Ala Phe Ser Val Asn Asn Leu Ala Arg Ala Val Cys Asp Met Ser Asn 465 470 475 480 Leu Gly Asn Lys Glu Ser Asp Phe Leu Leu Trp Lys Arg Asn Asp Ile 485 490 495 Ala Asp Lys Leu Lys Asn Lys Asp Asp Met Ala Ser Val Ser Ala Val 500 505 510 Leu Gln Phe Phe Gly Gly Lys Ser Ser Trp Asp Ile Asn Ile Phe Lys 515 520 525 Asp Ala Tyr Lys Gly Lys Lys Lys Tyr Asn Tyr Glu Val Arg Phe Ile 530 535 540 Asp Asp Leu Arg Lys Ala Ile Tyr Cys Ala Arg Asn Glu Asn Phe His 545 550 555 560 Phe Lys Thr Ala Leu Val Asn Asp Glu Lys Trp Asn Thr Glu Leu Phe 565 570 575 Gly Lys Ile Phe Glu Arg Glu Thr Glu Phe Cys Leu Asn Val Glu Lys 580 585 590 Asp Arg Phe Tyr Ser Asn Asn Leu Tyr Met Phe Tyr Gln Val Ser Glu 595 600 605 Leu Arg Asn Met Leu Asp His Leu Tyr Ser Arg Ser Val Ser Arg Ala 610 615 620 Ala Gln Val Pro Ser Tyr Asn Ser Val Ile Val Arg Thr Ala Phe Pro 625 630 635 640 Glu Tyr Ile Thr Asn Val Leu Gly Tyr Gln Lys Pro Ser Tyr Asp Ala 645 650 655 Asp Thr Leu Gly Lys Trp Tyr Ser Ala Cys Tyr Tyr Leu Leu Lys Glu 660 665 670 Ile Tyr Tyr Asn Ser Phe Leu Gln Ser Asp Arg Ala Leu Gln Leu Phe 675 680 685 Glu Lys Ser Val Lys Thr Leu Ser Trp Asp Asp Lys Lys Gln Gln Arg 690 695 700 Ala Val Asp Asn Phe Lys Asp His Phe Ser Asp Ile Lys Ser Ala Cys 705 710 715 720 Thr Ser Leu Ala Gln Val Cys Gln Ile Tyr Met Thr Glu Tyr Asn Gln 725 730 735 Gln Asn Asn Gln Ile Lys Lys Val Arg Ser Ser Asn Asp Ser Ile Phe 740 745 750 Asp Gln Pro Val Tyr Gln His Tyr Lys Val Leu Leu Lys Lys Ala Ile 755 760 765 Ala Asn Ala Phe Ala Asp Tyr Leu Lys Asn Asn Lys Asp Leu Phe Gly 770 775 780 Phe Ile Gly Lys Pro Phe Lys Ala Asn Glu Ile Arg Glu Ile Asp Lys 785 790 795 800 Glu Gln Phe Leu Pro Asp Trp Thr Ser Arg Lys Tyr Glu Ala Leu Cys 805 810 815 Ile Glu Val Ser Gly Ser Gln Glu Leu Gln Lys Trp Tyr Ile Val Gly 820 825 830 Lys Phe Leu Asn Ala Arg Ser Leu Asn Leu Met Val Gly Ser Met Arg 835 840 845 Ser Tyr Ile Gln Tyr Val Thr Asp Ile Lys Arg Arg Ala Ala Ser Ile 850 855 860 Gly Asn Glu Leu His Val Ser Val His Asp Val Glu Lys Val Glu Lys 865 870 875 880 Trp Val Gln Val Ile Glu Val Cys Ser Leu Leu Ala Ser Arg Thr Ser 885 890 895 Asn Gln Phe Glu Asp Tyr Phe Asn Asp Lys Asp Asp Tyr Ala Arg Tyr 900 905 910 Leu Lys Ser Tyr Val Asp Phe Ser Asn Val Asp Met Pro Ser Glu Tyr 915 920 925 Ser Ala Leu Val Asp Phe Ser Asn Glu Glu Gln Ser Asp Leu Tyr Val 930 935 940 Asp Pro Lys Asn Pro Lys Val Asn Arg Asn Ile Val His Ser Lys Leu 945 950 955 960 Phe Ala Ala Asp His Ile Leu Arg Asp Ile Val Glu Pro Val Ser Lys 965 970 975 Asp Asn Ile Glu Glu Phe Tyr Ser Gln Lys Ala Glu Ile Ala Tyr Cys 980 985 990 Lys Ile Lys Gly Lys Glu Ile Thr Ala Glu Glu Gln Lys Ala Val Leu 995 1000 1005 Lys Tyr Gln Lys Leu Lys Asn Arg Val Glu Leu Arg Asp Ile Val 1010 1015 1020 Glu Tyr Gly Glu Ile Ile Asn Glu Leu Leu Gly Gln Leu Ile Asn 1025 1030 1035 Trp Ser Phe Met Arg Glu Arg Asp Leu Leu Tyr Phe Gln Leu Gly 1040 1045 1050 Phe His Tyr Asp Cys Leu Arg Asn Asp Ser Lys Lys Pro Glu Gly 1055 1060 1065 Tyr Lys Asn Ile Lys Val Asp Glu Asn Ser Ile Lys Asp Ala Ile 1070 1075 1080 Leu Tyr Gln Ile Ile Gly Met Tyr Val Asn Gly Val Thr Val Tyr 1085 1090 1095 Ala Pro Glu Lys Asp Gly Asp Lys Leu Lys Glu Gln Cys Val Lys 1100 1105 1110 Gly Gly Val Gly Val Lys Val Ser Ala Phe His Arg Tyr Ser Lys 1115 1120 1125 Tyr Leu Gly Leu Asn Glu Lys Thr Leu Tyr Asn Ala Gly Leu Glu 1130 1135 1140 Ile Phe Glu Val Val Ala Glu His Glu Asp Ile Ile Asn Leu Arg 1145 1150 1155 Asn Gly Ile Asp His Phe Lys Tyr Tyr Leu Gly Asp Tyr Arg Ser 1160 1165 1170 Met Leu Ser Ile Tyr Ser Glu Val Phe Asp Arg Phe Phe Thr Tyr 1175 1180 1185 Asp Ile Lys Tyr Gln Lys Asn Val Leu Asn Leu Leu Gln Asn Ile 1190 1195 1200 Leu Leu Arg His Asn Val Ile Val Glu Pro Ile Leu Glu Ser Gly 1205 1210 1215 Phe Lys Thr Ile Gly Glu Gln Thr Lys Pro Gly Ala Lys Leu Ser 1220 1225 1230 Ile Arg Ser Ile Lys Ser Asp Thr Phe Gln Tyr Lys Val Lys Gly 1235 1240 1245 Gly Thr Leu Ile Thr Asp Ala Lys Asp Glu Arg Tyr Leu Glu Thr 1250 1255 1260 Ile Arg Lys Ile Leu Tyr Tyr Ala Glu Asn Glu Glu Asp Asn Leu 1265 1270 1275 Lys Lys Ser Val Val Val Thr Asn Ala Asp Lys Tyr Glu Lys Asn 1280 1285 1290 Lys Glu Ser Asp Asp Gln Asn Lys Gln Lys Glu Lys Lys Asn Lys 1295 1300 1305 Asp Asn Lys Gly Lys Lys Asn Glu Glu Thr Lys Ser Asp Ala Glu 1310 1315 1320 Lys Asn Asn Asn Glu Arg Leu Ser Tyr Asn Pro Phe Ala Asn Leu 1325 1330 1335 Asn Phe Lys Leu Ser Asn 1340 <210> 77 <211> 1373 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Eubacteriaceae bacterium sequence" <400> 77 Met Lys Ile Ser Lys Glu Ser His Lys Arg Thr Ala Val Ala Val Met 1 5 10 15 Glu Asp Arg Val Gly Gly Val Val Tyr Val Pro Gly Gly Ser Gly Ile 20 25 30 Asp Leu Ser Asn Asn Leu Lys Lys Arg Ser Met Asp Thr Lys Ser Leu 35 40 45 Tyr Asn Val Phe Asn Gln Ile Gln Ala Gly Thr Ala Pro Ser Glu Tyr 50 55 60 Glu Trp Lys Asp Tyr Leu Ser Glu Ala Glu Asn Lys Lys Arg Glu Ala 65 70 75 80 Gln Lys Met Ile Gln Lys Ala Asn Tyr Glu Leu Arg Arg Glu Cys Glu 85 90 95 Asp Tyr Ala Lys Lys Ala Asn Leu Ala Val Ser Arg Ile Ile Phe Ser 100 105 110 Lys Lys Pro Lys Lys Ile Phe Ser Asp Asp Asp Ile Ile Ser His Met 115 120 125 Lys Lys Gln Arg Leu Ser Lys Phe Lys Gly Arg Met Glu Asp Phe Val 130 135 140 Leu Ile Ala Leu Arg Lys Ser Leu Val Val Ser Thr Tyr Asn Gln Glu 145 150 155 160 Val Phe Asp Ser Arg Lys Ala Ala Thr Val Phe Leu Lys Asn Ile Gly 165 170 175 Lys Lys Asn Ile Ser Ala Asp Asp Glu Arg Gln Ile Lys Gln Leu Met 180 185 190 Ala Leu Ile Arg Glu Asp Tyr Asp Lys Trp Asn Pro Asp Lys Asp Ser 195 200 205 Ser Asp Lys Lys Glu Ser Ser Gly Thr Lys Val Ile Arg Ser Ile Glu 210 215 220 His Gln Asn Met Val Ile Gln Pro Glu Lys Asn Lys Leu Ser Leu Ser 225 230 235 240 Lys Ile Ser Asn Val Gly Lys Lys Thr Lys Thr Lys Gln Lys Glu Lys 245 250 255 Ala Gly Leu Asp Ala Phe Leu Lys Glu Tyr Ala Gln Ile Asp Glu Asn 260 265 270 Ser Arg Met Glu Tyr Leu Lys Lys Leu Arg Arg Leu Leu Asp Thr Tyr 275 280 285 Phe Ala Ala Pro Ser Ser Tyr Ile Lys Gly Ala Ala Val Ser Leu Pro 290 295 300 Glu Asn Ile Asn Phe Ser Ser Glu Leu Asn Val Trp Glu Arg His Glu 305 310 315 320 Ala Ala Lys Lys Val Asn Ile Asn Phe Val Glu Ile Pro Glu Ser Leu 325 330 335 Leu Asn Ala Glu Gln Asn Asn Asn Lys Ile Asn Lys Val Glu Gln Glu 340 345 350 His Ser Leu Glu Gln Leu Arg Thr Asp Ile Arg Arg Arg Asn Ile Thr 355 360 365 Cys Tyr His Phe Ala Asn Ala Leu Ala Ala Asp Glu Arg Tyr His Thr 370 375 380 Leu Phe Phe Glu Asn Met Ala Met Asn Gln Phe Trp Ile His His Met 385 390 395 400 Glu Asn Ala Val Glu Arg Ile Leu Lys Lys Cys Asn Val Gly Thr Leu 405 410 415 Phe Lys Leu Arg Ile Gly Tyr Leu Ser Glu Lys Val Trp Lys Asp Met 420 425 430 Leu Asn Leu Leu Ser Ile Lys Tyr Ile Ala Leu Gly Lys Ala Val Tyr 435 440 445 His Phe Ala Leu Asp Asp Ile Trp Lys Ala Asp Ile Trp Lys Asp Ala 450 455 460 Ser Asp Lys Asn Ser Gly Lys Ile Asn Asp Leu Thr Leu Lys Gly Ile 465 470 475 480 Ser Ser Phe Asp Tyr Glu Met Val Lys Ala Gln Glu Asp Leu Gln Arg 485 490 495 Glu Met Ala Val Gly Val Ala Phe Ser Thr Asn Asn Leu Ala Arg Val 500 505 510 Thr Cys Lys Met Asp Asp Leu Ser Asp Ala Glu Ser Asp Phe Leu Leu 515 520 525 Trp Asn Lys Glu Ala Ile Arg Arg His Val Lys Tyr Thr Glu Lys Gly 530 535 540 Glu Ile Leu Ser Ala Ile Leu Gln Phe Phe Gly Gly Arg Ser Leu Trp 545 550 555 560 Asp Glu Ser Leu Phe Glu Lys Ala Tyr Ser Asp Ser Asn Tyr Glu Leu 565 570 575 Lys Phe Leu Asp Asp Leu Lys Arg Ala Ile Tyr Ala Ala Arg Asn Glu 580 585 590 Thr Phe His Phe Lys Thr Ala Ala Ile Asp Gly Gly Ser Trp Asn Thr 595 600 605 Arg Leu Phe Gly Ser Leu Phe Glu Lys Glu Ala Gly Leu Cys Leu Asn 610 615 620 Val Glu Lys Asn Lys Phe Tyr Ser Asn Asn Leu Val Leu Phe Tyr Lys 625 630 635 640 Gln Glu Asp Leu Arg Val Phe Leu Asp Lys Leu Tyr Gly Lys Glu Cys 645 650 655 Ser Arg Ala Ala Gln Ile Pro Ser Tyr Asn Thr Ile Leu Pro Arg Lys 660 665 670 Ser Phe Ser Asp Phe Met Lys Gln Leu Leu Gly Leu Lys Glu Pro Val 675 680 685 Tyr Gly Ser Ala Ile Leu Asp Gln Trp Tyr Ser Ala Cys Tyr Tyr Leu 690 695 700 Phe Lys Glu Val Tyr Tyr Asn Leu Phe Leu Gln Asp Ser Ser Ala Lys 705 710 715 720 Ala Leu Phe Glu Lys Ala Val Lys Ala Leu Lys Gly Ala Asp Lys Lys 725 730 735 Gln Glu Lys Ala Val Glu Ser Phe Arg Lys Arg Tyr Trp Glu Ile Ser 740 745 750 Lys Asn Ala Ser Leu Ala Glu Ile Cys Gln Ser Tyr Ile Thr Glu Tyr 755 760 765 Asn Gln Gln Asn Asn Lys Glu Arg Lys Val Arg Ser Ala Asn Asp Gly 770 775 780 Met Phe Asn Glu Pro Ile Tyr Gln His Tyr Lys Met Leu Leu Lys Glu 785 790 795 800 Ala Leu Lys Met Ala Phe Ala Ser Tyr Ile Lys Asn Asp Lys Glu Leu 805 810 815 Lys Phe Val Tyr Lys Pro Thr Glu Lys Leu Phe Glu Val Ser Gln Asp 820 825 830 Asn Phe Leu Pro Asn Trp Asn Ser Glu Lys Tyr Asn Thr Leu Ile Ser 835 840 845 Glu Val Lys Asn Ser Pro Asp Leu Gln Lys Trp Tyr Ile Val Gly Lys 850 855 860 Phe Met Asn Ala Arg Met Leu Asn Leu Leu Leu Gly Ser Met Arg Ser 865 870 875 880 Tyr Leu Gln Tyr Val Ser Asp Ile Gln Lys Arg Ala Ala Gly Leu Gly 885 890 895 Glu Asn Gln Leu His Leu Ser Ala Glu Asn Val Gly Gln Val Lys Lys 900 905 910 Trp Ile Gln Val Leu Glu Val Cys Leu Leu Leu Ser Val Arg Ile Ser 915 920 925 Asp Lys Phe Thr Asp Tyr Phe Lys Asp Glu Glu Glu Tyr Ala Ser Tyr 930 935 940 Leu Lys Glu Tyr Val Asp Phe Glu Asp Ser Ala Met Pro Ser Asp Tyr 945 950 955 960 Ser Ala Leu Leu Ala Phe Ser Asn Glu Gly Lys Ile Asp Leu Tyr Val 965 970 975 Asp Ala Ser Asn Pro Lys Val Asn Arg Asn Ile Ile Gln Ala Lys Leu 980 985 990 Tyr Ala Pro Asp Met Val Leu Lys Lys Val Val Lys Lys Ile Ser Gln 995 1000 1005 Asp Glu Cys Lys Glu Phe Asn Glu Lys Lys Glu Gln Ile Met Gln 1010 1015 1020 Phe Lys Asn Lys Gly Asp Glu Val Ser Trp Glu Glu Gln Gln Lys 1025 1030 1035 Ile Leu Glu Tyr Gln Lys Leu Lys Asn Arg Val Glu Leu Arg Asp 1040 1045 1050 Leu Ser Glu Tyr Gly Glu Leu Ile Asn Glu Leu Leu Gly Gln Leu 1055 1060 1065 Ile Asn Trp Ser Tyr Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln 1070 1075 1080 Leu Gly Phe His Tyr Ser Cys Leu Met Asn Glu Ser Lys Lys Pro 1085 1090 1095 Asp Ala Tyr Lys Thr Ile Arg Arg Gly Thr Val Ser Ile Glu Asn 1100 1105 1110 Ala Val Leu Tyr Gln Ile Ile Ala Met Tyr Ile Asn Gly Phe Pro 1115 1120 1125 Val Tyr Ala Pro Glu Lys Gly Glu Leu Lys Pro Gln Cys Lys Thr 1130 1135 1140 Gly Ser Ala Gly Gln Lys Ile Arg Ala Phe Cys Gln Trp Ala Ser 1145 1150 1155 Met Val Glu Lys Lys Lys Tyr Glu Leu Tyr Asn Ala Gly Leu Glu 1160 1165 1170 Leu Phe Glu Val Val Lys Glu His Asp Asn Ile Ile Asp Leu Arg 1175 1180 1185 Asn Lys Ile Asp His Phe Lys Tyr Tyr Gln Gly Asn Asp Ser Ile 1190 1195 1200 Leu Ala Leu Tyr Gly Glu Ile Phe Asp Arg Phe Phe Thr Tyr Asp 1205 1210 1215 Met Lys Tyr Arg Asn Asn Val Leu Asn His Leu Gln Asn Ile Leu 1220 1225 1230 Leu Arg His Asn Val Ile Ile Lys Pro Ile Ile Ser Lys Asp Lys 1235 1240 1245 Lys Glu Val Gly Arg Gly Lys Met Lys Asp Arg Ala Ala Phe Leu 1250 1255 1260 Leu Glu Glu Val Ser Ser Asp Arg Phe Thr Tyr Lys Val Lys Glu 1265 1270 1275 Gly Glu Arg Lys Ile Asp Ala Lys Asn Arg Leu Tyr Leu Glu Thr 1280 1285 1290 Val Arg Asp Ile Leu Tyr Phe Pro Asn Arg Ala Val Asn Asp Lys 1295 1300 1305 Gly Glu Asp Val Ile Ile Cys Ser Lys Lys Ala Gln Asp Leu Asn 1310 1315 1320 Glu Lys Lys Ala Asp Arg Asp Lys Asn His Asp Lys Ser Lys Asp 1325 1330 1335 Thr Asn Gln Lys Lys Glu Gly Lys Asn Gln Glu Glu Lys Ser Glu 1340 1345 1350 Asn Lys Glu Pro Tyr Ser Asp Arg Met Thr Trp Lys Pro Phe Ala 1355 1360 1365 Gly Ile Lys Leu Glu 1370 <210> 78 <211> 1276 <212> PRT <213> Blautia sp. <400> 78 Met Lys Ile Ser Lys Val Asp His Val Lys Ser Gly Ile Asp Gln Lys 1 5 10 15 Leu Ser Ser Gln Arg Gly Met Leu Tyr Lys Gln Pro Gln Lys Lys Tyr 20 25 30 Glu Gly Lys Gln Leu Glu Glu His Val Arg Asn Leu Ser Arg Lys Ala 35 40 45 Lys Ala Leu Tyr Gln Val Phe Pro Val Ser Gly Asn Ser Lys Met Glu 50 55 60 Lys Glu Leu Gln Ile Ile Asn Ser Phe Ile Lys Asn Ile Leu Leu Arg 65 70 75 80 Leu Asp Ser Gly Lys Thr Ser Glu Glu Ile Val Gly Tyr Ile Asn Thr 85 90 95 Tyr Ser Val Ala Ser Gln Ile Ser Gly Asp His Ile Gln Glu Leu Val 100 105 110 Asp Gln His Leu Lys Glu Ser Leu Arg Lys Tyr Thr Cys Val Gly Asp 115 120 125 Lys Arg Ile Tyr Val Pro Asp Ile Ile Val Ala Leu Leu Lys Ser Lys 130 135 140 Phe Asn Ser Glu Thr Leu Gln Tyr Asp Asn Ser Glu Leu Lys Ile Leu 145 150 155 160 Ile Asp Phe Ile Arg Glu Asp Tyr Leu Lys Glu Lys Gln Ile Lys Gln 165 170 175 Ile Val His Ser Ile Glu Asn Asn Ser Thr Pro Leu Arg Ile Ala Glu 180 185 190 Ile Asn Gly Gln Lys Arg Leu Ile Pro Ala Asn Val Asp Asn Pro Lys 195 200 205 Lys Ser Tyr Ile Phe Glu Phe Leu Lys Glu Tyr Ala Gln Ser Asp Pro 210 215 220 Lys Gly Gln Glu Ser Leu Leu Gln His Met Arg Tyr Leu Ile Leu Leu 225 230 235 240 Tyr Leu Tyr Gly Pro Asp Lys Ile Thr Asp Asp Tyr Cys Glu Glu Ile 245 250 255 Glu Ala Trp Asn Phe Gly Ser Ile Val Met Asp Asn Glu Gln Leu Phe 260 265 270 Ser Glu Glu Ala Ser Met Leu Ile Gln Asp Arg Ile Tyr Val Asn Gln 275 280 285 Gln Ile Glu Glu Gly Arg Gln Ser Lys Asp Thr Ala Lys Val Lys Lys 290 295 300 Asn Lys Ser Lys Tyr Arg Met Leu Gly Asp Lys Ile Glu His Ser Ile 305 310 315 320 Asn Glu Ser Val Val Lys His Tyr Gln Glu Ala Cys Lys Ala Val Glu 325 330 335 Glu Lys Asp Ile Pro Trp Ile Lys Tyr Ile Ser Asp His Val Met Ser 340 345 350 Val Tyr Ser Ser Lys Asn Arg Val Asp Leu Asp Lys Leu Ser Leu Pro 355 360 365 Tyr Leu Ala Lys Asn Thr Trp Asn Thr Trp Ile Ser Phe Ile Ala Met 370 375 380 Lys Tyr Val Asp Met Gly Lys Gly Val Tyr His Phe Ala Met Ser Asp 385 390 395 400 Val Asp Lys Val Gly Lys Gln Asp Asn Leu Ile Ile Gly Gln Ile Asp 405 410 415 Pro Lys Phe Ser Asp Gly Ile Ser Ser Phe Asp Tyr Glu Arg Ile Lys 420 425 430 Ala Glu Asp Asp Leu His Arg Ser Met Ser Gly Tyr Ile Ala Phe Ala 435 440 445 Val Asn Asn Phe Ala Arg Ala Ile Cys Ser Asp Glu Phe Arg Lys Lys 450 455 460 Asn Arg Lys Glu Asp Val Leu Thr Val Gly Leu Asp Glu Ile Pro Leu 465 470 475 480 Tyr Asp Asn Val Lys Arg Lys Leu Leu Gln Tyr Phe Gly Gly Ala Ser 485 490 495 Asn Trp Asp Asp Ser Ile Ile Asp Ile Ile Asp Asp Lys Asp Leu Val 500 505 510 Ala Cys Ile Lys Glu Asn Leu Tyr Val Ala Arg Asn Val Asn Phe His 515 520 525 Phe Ala Gly Ser Glu Lys Val Gln Lys Lys Gln Asp Asp Ile Leu Glu 530 535 540 Glu Ile Val Arg Lys Glu Thr Arg Asp Ile Gly Lys His Tyr Arg Lys 545 550 555 560 Val Phe Tyr Ser Asn Asn Val Ala Val Phe Tyr Cys Asp Glu Asp Ile 565 570 575 Ile Lys Leu Met Asn His Leu Tyr Gln Arg Glu Lys Pro Tyr Gln Ala 580 585 590 Gln Ile Pro Ser Tyr Asn Lys Val Ile Ser Lys Thr Tyr Leu Pro Asp 595 600 605 Leu Ile Phe Met Leu Leu Lys Gly Lys Asn Arg Thr Lys Ile Ser Asp 610 615 620 Pro Ser Ile Met Asn Met Phe Arg Gly Thr Phe Tyr Phe Leu Leu Lys 625 630 635 640 Glu Ile Tyr Tyr Asn Asp Phe Leu Gln Ala Ser Asn Leu Lys Glu Met 645 650 655 Phe Cys Glu Gly Leu Lys Asn Asn Val Lys Asn Lys Lys Ser Glu Lys 660 665 670 Pro Tyr Gln Asn Phe Met Arg Arg Phe Glu Glu Leu Glu Asn Met Gly 675 680 685 Met Asp Phe Gly Glu Ile Cys Gln Gln Ile Met Thr Asp Tyr Glu Gln 690 695 700 Gln Asn Lys Gln Lys Lys Lys Thr Ala Thr Ala Val Met Ser Glu Lys 705 710 715 720 Asp Lys Lys Ile Arg Thr Leu Asp Asn Asp Thr Gln Lys Tyr Lys His 725 730 735 Phe Arg Thr Leu Leu Tyr Ile Gly Leu Arg Glu Ala Phe Ile Ile Tyr 740 745 750 Leu Lys Asp Glu Lys Asn Lys Glu Trp Tyr Glu Phe Leu Arg Glu Pro 755 760 765 Val Lys Arg Glu Gln Pro Glu Glu Lys Glu Phe Val Asn Lys Trp Lys 770 775 780 Leu Asn Gln Tyr Ser Asp Cys Ser Glu Leu Ile Leu Lys Asp Ser Leu 785 790 795 800 Ala Ala Ala Trp Tyr Val Val Ala His Phe Ile Asn Gln Ala Gln Leu 805 810 815 Asn His Leu Ile Gly Asp Ile Lys Asn Tyr Ile Gln Phe Ile Ser Asp 820 825 830 Ile Asp Arg Arg Ala Lys Ser Thr Gly Asn Pro Val Ser Glu Ser Thr 835 840 845 Glu Ile Gln Ile Glu Arg Tyr Arg Lys Ile Leu Arg Val Leu Glu Phe 850 855 860 Ala Lys Phe Phe Cys Gly Gln Ile Thr Asn Val Leu Thr Asp Tyr Tyr 865 870 875 880 Gln Asp Glu Asn Asp Phe Ser Thr His Val Gly His Tyr Val Lys Phe 885 890 895 Glu Lys Lys Asn Met Glu Pro Ala His Ala Leu Gln Ala Phe Ser Asn 900 905 910 Ser Leu Tyr Ala Cys Gly Lys Glu Lys Lys Lys Ala Gly Phe Tyr Tyr 915 920 925 Asp Gly Met Asn Pro Ile Val Asn Arg Asn Ile Thr Leu Ala Ser Met 930 935 940 Tyr Gly Asn Lys Lys Leu Leu Glu Asn Ala Met Asn Pro Val Thr Glu 945 950 955 960 Gln Asp Ile Arg Lys Tyr Tyr Ser Leu Met Ala Glu Leu Asp Ser Val 965 970 975 Leu Lys Asn Gly Ala Val Cys Lys Ser Glu Asp Glu Gln Lys Asn Leu 980 985 990 Arg His Phe Gln Asn Leu Lys Asn Arg Ile Glu Leu Val Asp Val Leu 995 1000 1005 Thr Leu Ser Glu Leu Val Asn Asp Leu Val Ala Gln Leu Ile Gly 1010 1015 1020 Trp Val Tyr Ile Arg Glu Arg Asp Met Met Tyr Leu Gln Leu Gly 1025 1030 1035 Leu His Tyr Ile Lys Leu Tyr Phe Thr Asp Ser Val Ala Glu Asp 1040 1045 1050 Ser Tyr Leu Arg Thr Leu Asp Leu Glu Glu Gly Ser Ile Ala Asp 1055 1060 1065 Gly Ala Val Leu Tyr Gln Ile Ala Ser Leu Tyr Ser Phe Asn Leu 1070 1075 1080 Pro Met Tyr Val Lys Pro Asn Lys Ser Ser Val Tyr Cys Lys Lys 1085 1090 1095 His Val Asn Ser Val Ala Thr Lys Phe Asp Ile Phe Glu Lys Glu 1100 1105 1110 Tyr Cys Asn Gly Asp Glu Thr Val Ile Glu Asn Gly Leu Arg Leu 1115 1120 1125 Phe Glu Asn Ile Asn Leu His Lys Asp Met Val Lys Phe Arg Asp 1130 1135 1140 Tyr Leu Ala His Phe Lys Tyr Phe Ala Lys Leu Asp Glu Ser Ile 1145 1150 1155 Leu Glu Leu Tyr Ser Lys Ala Tyr Asp Phe Phe Phe Ser Tyr Asn 1160 1165 1170 Ile Lys Leu Lys Lys Ser Val Ser Tyr Val Leu Thr Asn Val Leu 1175 1180 1185 Leu Ser Tyr Phe Ile Asn Ala Lys Leu Ser Phe Ser Thr Tyr Lys 1190 1195 1200 Ser Ser Gly Asn Lys Thr Val Gln His Arg Thr Thr Lys Ile Ser 1205 1210 1215 Val Val Ala Gln Thr Asp Tyr Phe Thr Tyr Lys Leu Arg Ser Ile 1220 1225 1230 Val Lys Asn Lys Asn Gly Val Glu Ser Ile Glu Asn Asp Asp Arg 1235 1240 1245 Arg Cys Glu Val Val Asn Ile Ala Ala Arg Asp Lys Glu Phe Val 1250 1255 1260 Asp Glu Val Cys Asn Val Ile Asn Tyr Asn Ser Asp Lys 1265 1270 1275 <210> 79 <211> 1385 <212> PRT <213> Leptotrichia sp. <400> 79 Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys 1 5 10 15 Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp 20 25 30 Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys 35 40 45 Ile Asp Asn Asn Lys Phe Ile Gly Glu Phe Val Asn Tyr Lys Lys Asn 50 55 60 Asn Asn Val Leu Lys Glu Phe Lys Arg Lys Phe His Ala Gly Asn Ile 65 70 75 80 Leu Phe Lys Leu Lys Gly Lys Glu Glu Ile Ile Arg Ile Glu Asn Asn 85 90 95 Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Val Tyr 100 105 110 Gly Lys Ser Glu Lys Leu Lys Ala Leu Glu Ile Thr Lys Lys Lys Ile 115 120 125 Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile 130 135 140 Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg 145 150 155 160 Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg 165 170 175 Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile 180 185 190 Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile 195 200 205 Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His 210 215 220 Leu Arg Glu Lys Leu Leu Lys Asp Asn Lys Ile Asp Val Ile Leu Thr 225 230 235 240 Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Met 245 250 255 Gly Phe Val Lys Phe Tyr Leu Asn Val Ser Gly Asp Lys Lys Lys Ser 260 265 270 Glu Asn Lys Lys Met Phe Val Glu Lys Ile Leu Asn Thr Asn Val Asp 275 280 285 Leu Thr Val Glu Asp Ile Val Asp Phe Ile Val Lys Glu Leu Lys Phe 290 295 300 Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Phe Asn Asn Glu 305 310 315 320 Phe Leu Glu Asn Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu 325 330 335 Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp 340 345 350 Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys 355 360 365 Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asn Glu Leu Ile 370 375 380 Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile 385 390 395 400 Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys 405 410 415 Phe Ser Asn Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr 420 425 430 Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys 435 440 445 Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn 450 455 460 Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr 465 470 475 480 Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Val 485 490 495 Lys Met Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu 500 505 510 Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu 515 520 525 Leu Asn Lys Ile Phe Asn Gly Lys Glu Lys Val Thr Asp Phe Phe Gly 530 535 540 Phe Asn Leu Asn Gly Gln Lys Ile Thr Leu Lys Glu Lys Val Pro Ser 545 550 555 560 Phe Lys Leu Asn Ile Leu Lys Lys Leu Asn Phe Ile Asn Asn Glu Asn 565 570 575 Asn Ile Asp Glu Lys Leu Ser His Phe Tyr Ser Phe Gln Lys Glu Gly 580 585 590 Tyr Leu Leu Arg Asn Lys Ile Leu His Asn Ser Tyr Gly Asn Ile Gln 595 600 605 Glu Thr Lys Asn Leu Lys Gly Glu Tyr Glu Asn Val Glu Lys Leu Ile 610 615 620 Lys Glu Leu Lys Val Ser Asp Glu Glu Ile Ser Lys Ser Leu Ser Leu 625 630 635 640 Asp Val Ile Phe Glu Gly Lys Val Asp Ile Ile Asn Lys Ile Asn Ser 645 650 655 Leu Lys Ile Gly Glu Tyr Lys Asp Lys Lys Tyr Leu Pro Ser Phe Ser 660 665 670 Lys Ile Val Leu Glu Ile Thr Arg Lys Phe Arg Glu Ile Asn Lys Asp 675 680 685 Lys Leu Phe Asp Ile Glu Ser Glu Lys Ile Ile Leu Asn Ala Val Lys 690 695 700 Tyr Val Asn Lys Ile Leu Tyr Glu Lys Ile Thr Ser Asn Glu Glu Asn 705 710 715 720 Glu Phe Leu Lys Thr Leu Pro Asp Lys Leu Val Lys Lys Ser Asn Asn 725 730 735 Lys Lys Glu Asn Lys Asn Leu Leu Ser Ile Glu Glu Tyr Tyr Lys Asn 740 745 750 Ala Gln Val Ser Ser Ser Lys Gly Asp Lys Lys Ala Ile Lys Lys Tyr 755 760 765 Gln Asn Lys Val Thr Asn Ala Tyr Leu Glu Tyr Leu Glu Asn Thr Phe 770 775 780 Thr Glu Ile Ile Asp Phe Ser Lys Phe Asn Leu Asn Tyr Asp Glu Ile 785 790 795 800 Lys Thr Lys Ile Glu Glu Arg Lys Asp Asn Lys Ser Lys Ile Ile Ile 805 810 815 Asp Ser Ile Ser Thr Asn Ile Asn Ile Thr Asn Asp Ile Glu Tyr Ile 820 825 830 Ile Ser Ile Phe Ala Leu Leu Asn Ser Asn Thr Tyr Ile Asn Lys Ile 835 840 845 Arg Asn Arg Phe Phe Ala Thr Ser Val Trp Leu Glu Lys Gln Asn Gly 850 855 860 Thr Lys Glu Tyr Asp Tyr Glu Asn Ile Ile Ser Ile Leu Asp Glu Val 865 870 875 880 Leu Leu Ile Asn Leu Leu Arg Glu Asn Asn Ile Thr Asp Ile Leu Asp 885 890 895 Leu Lys Asn Ala Ile Ile Asp Ala Lys Ile Val Glu Asn Asp Glu Thr 900 905 910 Tyr Ile Lys Asn Tyr Ile Phe Glu Ser Asn Glu Glu Lys Leu Lys Lys 915 920 925 Arg Leu Phe Cys Glu Glu Leu Val Asp Lys Glu Asp Ile Arg Lys Ile 930 935 940 Phe Glu Asp Glu Asn Phe Lys Phe Lys Ser Phe Ile Lys Lys Asn Glu 945 950 955 960 Ile Gly Asn Phe Lys Ile Asn Phe Gly Ile Leu Ser Asn Leu Glu Cys 965 970 975 Asn Ser Glu Val Glu Ala Lys Lys Ile Ile Gly Lys Asn Ser Lys Lys 980 985 990 Leu Glu Ser Phe Ile Gln Asn Ile Ile Asp Glu Tyr Lys Ser Asn Ile 995 1000 1005 Arg Thr Leu Phe Ser Ser Glu Phe Leu Glu Lys Tyr Lys Glu Glu 1010 1015 1020 Ile Asp Asn Leu Val Glu Asp Thr Glu Ser Glu Asn Lys Asn Lys 1025 1030 1035 Phe Glu Lys Ile Tyr Tyr Pro Lys Glu His Lys Asn Glu Leu Tyr 1040 1045 1050 Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly Asn Pro Asn Phe 1055 1060 1065 Asp Lys Ile Tyr Gly Leu Ile Ser Lys Asp Ile Lys Asn Val Asp 1070 1075 1080 Thr Lys Ile Leu Phe Asp Asp Asp Ile Lys Lys Asn Lys Ile Ser 1085 1090 1095 Glu Ile Asp Ala Ile Leu Lys Asn Leu Asn Asp Lys Leu Asn Gly 1100 1105 1110 Tyr Ser Asn Asp Tyr Lys Ala Lys Tyr Val Asn Lys Leu Lys Glu 1115 1120 1125 Asn Asp Asp Phe Phe Ala Lys Asn Ile Gln Asn Glu Asn Tyr Ser 1130 1135 1140 Ser Phe Gly Glu Phe Glu Lys Asp Tyr Asn Lys Val Ser Glu Tyr 1145 1150 1155 Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr Leu Asn Lys Ile 1160 1165 1170 Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu Ala Ile Gln Met 1175 1180 1185 Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val Asn Gly Leu Arg 1190 1195 1200 Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn Thr Gly Ile Ser 1205 1210 1215 Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly Phe Tyr Thr Thr 1220 1225 1230 Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser Tyr Lys Lys Phe 1235 1240 1245 Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu Ser Glu Asn Ser 1250 1255 1260 Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg Asn Tyr Ile Ser 1265 1270 1275 His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp Tyr Ser Ile Ala 1280 1285 1290 Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser Tyr Ser Thr Arg 1295 1300 1305 Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu Val Phe Lys Lys 1310 1315 1320 Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys Lys Phe Arg Leu 1325 1330 1335 Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met Lys Pro Lys Lys 1340 1345 1350 Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser Asp Tyr Ile Lys 1355 1360 1365 Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu Asn Thr Asn Asp 1370 1375 1380 Thr Leu 1385 <210> 80 <211> 1334 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 80 Met Lys Ile Ser Lys Val Asp His Thr Arg Met Ala Val Ala Lys Gly 1 5 10 15 Asn Gln His Arg Arg Asp Glu Ile Ser Gly Ile Leu Tyr Lys Asp Pro 20 25 30 Thr Lys Thr Gly Ser Ile Asp Phe Asp Glu Arg Phe Lys Lys Leu Asn 35 40 45 Cys Ser Ala Lys Ile Leu Tyr His Val Phe Asn Gly Ile Ala Glu Gly 50 55 60 Ser Asn Lys Tyr Lys Asn Ile Val Asp Lys Val Asn Asn Asn Leu Asp 65 70 75 80 Arg Val Leu Phe Thr Gly Lys Ser Tyr Asp Arg Lys Ser Ile Ile Asp 85 90 95 Ile Asp Thr Val Leu Arg Asn Val Glu Lys Ile Asn Ala Phe Asp Arg 100 105 110 Ile Ser Thr Glu Glu Arg Glu Gln Ile Ile Asp Asp Leu Leu Glu Ile 115 120 125 Gln Leu Arg Lys Gly Leu Arg Lys Gly Lys Ala Gly Leu Arg Glu Val 130 135 140 Leu Leu Ile Gly Ala Gly Val Ile Val Arg Thr Asp Lys Lys Gln Glu 145 150 155 160 Ile Ala Asp Phe Leu Glu Ile Leu Asp Glu Asp Phe Asn Lys Thr Asn 165 170 175 Gln Ala Lys Asn Ile Lys Leu Ser Ile Glu Asn Gln Gly Leu Val Val 180 185 190 Ser Pro Val Ser Arg Gly Glu Glu Arg Ile Phe Asp Val Ser Gly Ala 195 200 205 Gln Lys Gly Lys Ser Ser Lys Lys Ala Gln Glu Lys Glu Ala Leu Ser 210 215 220 Ala Phe Leu Leu Asp Tyr Ala Asp Leu Asp Lys Asn Val Arg Phe Glu 225 230 235 240 Tyr Leu Arg Lys Ile Arg Arg Leu Ile Asn Leu Tyr Phe Tyr Val Lys 245 250 255 Asn Asp Asp Val Met Ser Leu Thr Glu Ile Pro Ala Glu Val Asn Leu 260 265 270 Glu Lys Asp Phe Asp Ile Trp Arg Asp His Glu Gln Arg Lys Glu Glu 275 280 285 Asn Gly Asp Phe Val Gly Cys Pro Asp Ile Leu Leu Ala Asp Arg Asp 290 295 300 Val Lys Lys Ser Asn Ser Lys Gln Val Lys Ile Ala Glu Arg Gln Leu 305 310 315 320 Arg Glu Ser Ile Arg Glu Lys Asn Ile Lys Arg Tyr Arg Phe Ser Ile 325 330 335 Lys Thr Ile Glu Lys Asp Asp Gly Thr Tyr Phe Phe Ala Asn Lys Gln 340 345 350 Ile Ser Val Phe Trp Ile His Arg Ile Glu Asn Ala Val Glu Arg Ile 355 360 365 Leu Gly Ser Ile Asn Asp Lys Lys Leu Tyr Arg Leu Arg Leu Gly Tyr 370 375 380 Leu Gly Glu Lys Val Trp Lys Asp Ile Leu Asn Phe Leu Ser Ile Lys 385 390 395 400 Tyr Ile Ala Val Gly Lys Ala Val Phe Asn Phe Ala Met Asp Asp Leu 405 410 415 Gln Glu Lys Asp Arg Asp Ile Glu Pro Gly Lys Ile Ser Glu Asn Ala 420 425 430 Val Asn Gly Leu Thr Ser Phe Asp Tyr Glu Gln Ile Lys Ala Asp Glu 435 440 445 Met Leu Gln Arg Glu Val Ala Val Asn Val Ala Phe Ala Ala Asn Asn 450 455 460 Leu Ala Arg Val Thr Val Asp Ile Pro Gln Asn Gly Glu Lys Glu Asp 465 470 475 480 Ile Leu Leu Trp Asn Lys Ser Asp Ile Lys Lys Tyr Lys Lys Asn Ser 485 490 495 Lys Lys Gly Ile Leu Lys Ser Ile Leu Gln Phe Phe Gly Gly Ala Ser 500 505 510 Thr Trp Asn Met Lys Met Phe Glu Ile Ala Tyr His Asp Gln Pro Gly 515 520 525 Asp Tyr Glu Glu Asn Tyr Leu Tyr Asp Ile Ile Gln Ile Ile Tyr Ser 530 535 540 Leu Arg Asn Lys Ser Phe His Phe Lys Thr Tyr Asp His Gly Asp Lys 545 550 555 560 Asn Trp Asn Arg Glu Leu Ile Gly Lys Met Ile Glu His Asp Ala Glu 565 570 575 Arg Val Ile Ser Val Glu Arg Glu Lys Phe His Ser Asn Asn Leu Pro 580 585 590 Met Phe Tyr Lys Asp Ala Asp Leu Lys Lys Ile Leu Asp Leu Leu Tyr 595 600 605 Ser Asp Tyr Ala Gly Arg Ala Ser Gln Val Pro Ala Phe Asn Thr Val 610 615 620 Leu Val Arg Lys Asn Phe Pro Glu Phe Leu Arg Lys Asp Met Gly Tyr 625 630 635 640 Lys Val His Phe Asn Asn Pro Glu Val Glu Asn Gln Trp His Ser Ala 645 650 655 Val Tyr Tyr Leu Tyr Lys Glu Ile Tyr Tyr Asn Leu Phe Leu Arg Asp 660 665 670 Lys Glu Val Lys Asn Leu Phe Tyr Thr Ser Leu Lys Asn Ile Arg Ser 675 680 685 Glu Val Ser Asp Lys Lys Gln Lys Leu Ala Ser Asp Asp Phe Ala Ser 690 695 700 Arg Cys Glu Glu Ile Glu Asp Arg Ser Leu Pro Glu Ile Cys Gln Ile 705 710 715 720 Ile Met Thr Glu Tyr Asn Ala Gln Asn Phe Gly Asn Arg Lys Val Lys 725 730 735 Ser Gln Arg Val Ile Glu Lys Asn Lys Asp Ile Phe Arg His Tyr Lys 740 745 750 Met Leu Leu Ile Lys Thr Leu Ala Gly Ala Phe Ser Leu Tyr Leu Lys 755 760 765 Gln Glu Arg Phe Ala Phe Ile Gly Lys Ala Thr Pro Ile Pro Tyr Glu 770 775 780 Thr Thr Asp Val Lys Asn Phe Leu Pro Glu Trp Lys Ser Gly Met Tyr 785 790 795 800 Ala Ser Phe Val Glu Glu Ile Lys Asn Asn Leu Asp Leu Gln Glu Trp 805 810 815 Tyr Ile Val Gly Arg Phe Leu Asn Gly Arg Met Leu Asn Gln Leu Ala 820 825 830 Gly Ser Leu Arg Ser Tyr Ile Gln Tyr Ala Glu Asp Ile Glu Arg Arg 835 840 845 Ala Ala Glu Asn Arg Asn Lys Leu Phe Ser Lys Pro Asp Glu Lys Ile 850 855 860 Glu Ala Cys Lys Lys Ala Val Arg Val Leu Asp Leu Cys Ile Lys Ile 865 870 875 880 Ser Thr Arg Ile Ser Ala Glu Phe Thr Asp Tyr Phe Asp Ser Glu Asp 885 890 895 Asp Tyr Ala Asp Tyr Leu Glu Lys Tyr Leu Lys Tyr Gln Asp Asp Ala 900 905 910 Ile Lys Glu Leu Ser Gly Ser Ser Tyr Ala Ala Leu Asp His Phe Cys 915 920 925 Asn Lys Asp Asp Leu Lys Phe Asp Ile Tyr Val Asn Ala Gly Gln Lys 930 935 940 Pro Ile Leu Gln Arg Asn Ile Val Met Ala Lys Leu Phe Gly Pro Asp 945 950 955 960 Asn Ile Leu Ser Glu Val Met Glu Lys Val Thr Glu Ser Ala Ile Arg 965 970 975 Glu Tyr Tyr Asp Tyr Leu Lys Lys Val Ser Gly Tyr Arg Val Arg Gly 980 985 990 Lys Cys Ser Thr Glu Lys Glu Gln Glu Asp Leu Leu Lys Phe Gln Arg 995 1000 1005 Leu Lys Asn Ala Val Glu Phe Arg Asp Val Thr Glu Tyr Ala Glu 1010 1015 1020 Val Ile Asn Glu Leu Leu Gly Gln Leu Ile Ser Trp Ser Tyr Leu 1025 1030 1035 Arg Glu Arg Asp Leu Leu Tyr Phe Gln Leu Gly Phe His Tyr Met 1040 1045 1050 Cys Leu Lys Asn Lys Ser Phe Lys Pro Ala Glu Tyr Val Asp Ile 1055 1060 1065 Arg Arg Asn Asn Gly Thr Ile Ile His Asn Ala Ile Leu Tyr Gln 1070 1075 1080 Ile Val Ser Met Tyr Ile Asn Gly Leu Asp Phe Tyr Ser Cys Asp 1085 1090 1095 Lys Glu Gly Lys Thr Leu Lys Pro Ile Glu Thr Gly Lys Gly Val 1100 1105 1110 Gly Ser Lys Ile Gly Gln Phe Ile Lys Tyr Ser Gln Tyr Leu Tyr 1115 1120 1125 Asn Asp Pro Ser Tyr Lys Leu Glu Ile Tyr Asn Ala Gly Leu Glu 1130 1135 1140 Val Phe Glu Asn Ile Asp Glu His Asp Asn Ile Thr Asp Leu Arg 1145 1150 1155 Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Tyr Gly Asn Lys Met 1160 1165 1170 Ser Leu Leu Asp Leu Tyr Ser Glu Phe Phe Asp Arg Phe Phe Thr 1175 1180 1185 Tyr Asp Met Lys Tyr Gln Lys Asn Val Val Asn Val Leu Glu Asn 1190 1195 1200 Ile Leu Leu Arg His Phe Val Ile Phe Tyr Pro Lys Phe Gly Ser 1205 1210 1215 Gly Lys Lys Asp Val Gly Ile Arg Asp Cys Lys Lys Glu Arg Ala 1220 1225 1230 Gln Ile Glu Ile Ser Glu Gln Ser Leu Thr Ser Glu Asp Phe Met 1235 1240 1245 Phe Lys Leu Asp Asp Lys Ala Gly Glu Glu Ala Lys Lys Phe Pro 1250 1255 1260 Ala Arg Asp Glu Arg Tyr Leu Gln Thr Ile Ala Lys Leu Leu Tyr 1265 1270 1275 Tyr Pro Asn Glu Ile Glu Asp Met Asn Arg Phe Met Lys Lys Gly 1280 1285 1290 Glu Thr Ile Asn Lys Lys Val Gln Phe Asn Arg Lys Lys Lys Ile 1295 1300 1305 Thr Arg Lys Gln Lys Asn Asn Ser Ser Asn Glu Val Leu Ser Ser 1310 1315 1320 Thr Met Gly Tyr Leu Phe Lys Asn Ile Lys Leu 1325 1330 <210> 81 <211> 500 <212> PRT <213> Chloroflexus aggregans <400> 81 Met Thr Asp Gln Val Arg Arg Glu Glu Val Ala Ala Gly Glu Leu Ala 1 5 10 15 Asp Thr Pro Leu Ala Ala Ala Gln Thr Pro Ala Ala Asp Ala Ala Val 20 25 30 Ala Ala Thr Pro Ala Pro Ala Glu Ala Val Ala Pro Thr Pro Glu Gln 35 40 45 Ala Val Asp Gln Pro Ala Thr Thr Gly Glu Ser Glu Ala Pro Val Thr 50 55 60 Thr Ala Gln Ala Ala Ala His Glu Ala Glu Pro Ala Glu Ala Thr Gly 65 70 75 80 Ala Ser Phe Thr Pro Val Ser Glu Gln Gln Pro Gln Lys Pro Arg Arg 85 90 95 Leu Lys Asp Leu Gln Pro Gly Met Glu Leu Glu Gly Lys Val Thr Ser 100 105 110 Ile Ala Leu Tyr Gly Ile Phe Val Asp Val Gly Val Gly Arg Asp Gly 115 120 125 Leu Val His Ile Ser Glu Met Ser Asp Arg Arg Ile Asp Thr Pro Ser 130 135 140 Glu Leu Val Gln Ile Gly Asp Thr Val Lys Val Trp Val Lys Ser Val 145 150 155 160 Asp Leu Asp Ala Arg Arg Ile Ser Leu Thr Met Leu Asn Pro Ser Arg 165 170 175 Gly Glu Lys Pro Arg Arg Ser Arg Gln Ser Gln Pro Ala Gln Pro Gln 180 185 190 Pro Arg Arg Gln Glu Val Asp Arg Glu Lys Leu Ala Ser Leu Lys Val 195 200 205 Gly Glu Ile Val Glu Gly Val Ile Thr Gly Phe Ala Pro Phe Gly Ala 210 215 220 Phe Ala Asp Ile Gly Val Gly Lys Asp Gly Leu Ile His Ile Ser Glu 225 230 235 240 Leu Ser Glu Gly Arg Val Glu Lys Pro Glu Asp Ala Val Lys Val Gly 245 250 255 Glu Arg Tyr Gln Phe Lys Val Leu Glu Ile Asp Gly Glu Gly Thr Arg 260 265 270 Ile Ser Leu Ser Leu Arg Arg Ala Gln Arg Thr Gln Arg Met Gln Gln 275 280 285 Leu Glu Pro Gly Gln Ile Ile Glu Gly Thr Val Ser Gly Ile Ala Thr 290 295 300 Phe Gly Ala Phe Val Asp Ile Gly Val Gly Arg Asp Gly Leu Val His 305 310 315 320 Ile Ser Ala Leu Ala Pro His Arg Val Ala Lys Val Glu Asp Val Val 325 330 335 Lys Val Gly Asp Lys Val Lys Val Lys Val Leu Gly Val Asp Pro Gln 340 345 350 Ser Lys Arg Ile Ser Leu Thr Met Arg Leu Glu Glu Glu Gln Pro Ala 355 360 365 Thr Thr Ala Gly Asp Glu Ala Ala Glu Pro Ala Glu Glu Val Thr Pro 370 375 380 Thr Arg Arg Gly Asn Leu Glu Arg Phe Ala Ala Ala Ala Gln Thr Ala 385 390 395 400 Arg Glu Arg Ser Glu Arg Gly Glu Arg Ser Glu Arg Gly Glu Arg Arg 405 410 415 Glu Arg Arg Glu Arg Arg Pro Ala Gln Ser Ser Pro Asp Thr Tyr Ile 420 425 430 Val Gly Glu Asp Asp Asp Glu Ser Phe Glu Gly Asn Ala Thr Ile Glu 435 440 445 Asp Leu Leu Thr Lys Phe Gly Gly Ser Ser Ser Arg Arg Asp Arg Asp 450 455 460 Arg Arg Arg Arg His Glu Asp Asp Asp Asp Glu Glu Met Glu Arg Pro 465 470 475 480 Ser Asn Arg Arg Gln Arg Glu Ala Ile Arg Arg Thr Leu Gln Gln Ile 485 490 495 Gly Tyr Asp Glu 500 <210> 82 <211> 249 <212> PRT <213> Demequina aurantiaca <400> 82 Met Asp Leu Thr Trp His Ala Leu Leu Ile Leu Phe Ile Val Ala Leu 1 5 10 15 Leu Ala Gly Phe Leu Asp Thr Leu Ala Gly Gly Gly Gly Leu Leu Thr 20 25 30 Val Pro Ala Leu Leu Leu Thr Gly Ile Pro Pro Leu Gln Ala Leu Gly 35 40 45 Thr Asn Lys Leu Gln Ser Ser Phe Gly Thr Gly Met Ala Thr Tyr Gln 50 55 60 Val Ile Arg Lys Lys Arg Val His Trp Arg Asp Val Arg Trp Pro Met 65 70 75 80 Val Trp Ala Phe Leu Gly Ser Ala Ala Gly Ala Val Ala Val Gln Phe 85 90 95 Ile Asp Thr Asp Ala Leu Leu Ile Ile Ile Pro Val Val Leu Ala Leu 100 105 110 Val Ala Ala Tyr Phe Leu Phe Val Pro Lys Ser His Leu Pro Pro Pro 115 120 125 Glu Pro Arg Met Ser Asp Pro Ala Tyr Glu Ala Thr Leu Val Pro Ile 130 135 140 Ile Gly Ala Tyr Asp Gly Ala Phe Gly Pro Gly Thr Gly Ser Leu Tyr 145 150 155 160 Ala Leu Ser Gly Val Ala Leu Arg Ala Lys Thr Leu Val Gln Ser Thr 165 170 175 Ala Ile Ala Lys Thr Leu Asn Phe Ala Thr Asn Phe Ala Ala Leu Leu 180 185 190 Val Phe Ala Phe Ala Gly His Met Leu Trp Thr Val Gly Ala Val Met 195 200 205 Ile Ala Gly Gln Leu Ile Gly Ala Tyr Ala Gly Ser His Met Leu Phe 210 215 220 Arg Val Asn Pro Leu Val Leu Arg Val Leu Ile Val Val Met Ser Leu 225 230 235 240 Gly Met Leu Ile Arg Val Leu Leu Asp 245 <210> 83 <211> 1235 <212> PRT <213> Thalassospira sp. <400> 83 Met Arg Ile Ile Lys Pro Tyr Gly Arg Ser His Val Glu Gly Val Ala 1 5 10 15 Thr Gln Glu Pro Arg Arg Lys Leu Arg Leu Asn Ser Ser Pro Asp Ile 20 25 30 Ser Arg Asp Ile Pro Gly Phe Ala Gln Ser His Asp Ala Leu Ile Ile 35 40 45 Ala Gln Trp Ile Ser Ala Ile Asp Lys Ile Ala Thr Lys Pro Lys Pro 50 55 60 Asp Lys Lys Pro Thr Gln Ala Gln Ile Asn Leu Arg Thr Thr Leu Gly 65 70 75 80 Asp Ala Ala Trp Gln His Val Met Ala Glu Asn Leu Leu Pro Ala Ala 85 90 95 Thr Asp Pro Ala Ile Arg Glu Lys Leu His Leu Ile Trp Gln Ser Lys 100 105 110 Ile Ala Pro Trp Gly Thr Ala Arg Pro Gln Ala Glu Lys Asp Gly Lys 115 120 125 Pro Thr Pro Lys Gly Gly Trp Tyr Glu Arg Phe Cys Gly Val Leu Ser 130 135 140 Pro Glu Ala Ile Thr Gln Asn Val Ala Arg Gln Ile Ala Lys Asp Ile 145 150 155 160 Tyr Asp His Leu His Val Ala Ala Lys Arg Lys Gly Arg Glu Pro Ala 165 170 175 Lys Gln Gly Glu Ser Ser Asn Lys Pro Gly Lys Phe Lys Pro Asp Arg 180 185 190 Lys Arg Gly Leu Ile Glu Glu Arg Ala Glu Ser Ile Ala Lys Asn Ala 195 200 205 Leu Arg Pro Gly Ser His Ala Pro Cys Pro Trp Gly Pro Asp Asp Gln 210 215 220 Ala Thr Tyr Glu Gln Ala Gly Asp Val Ala Gly Gln Ile Tyr Ala Ala 225 230 235 240 Ala Arg Asp Cys Leu Glu Glu Lys Lys Arg Arg Ser Gly Asn Arg Asn 245 250 255 Thr Ser Ser Val Gln Tyr Leu Pro Arg Asp Leu Ala Ala Lys Ile Leu 260 265 270 Tyr Ala Gln Tyr Gly Arg Val Phe Gly Pro Asp Thr Thr Ile Lys Ala 275 280 285 Ala Leu Asp Glu Gln Pro Ser Leu Phe Ala Leu His Lys Ala Ile Lys 290 295 300 Asp Cys Tyr His Arg Leu Ile Asn Asp Ala Arg Lys Arg Asp Ile Leu 305 310 315 320 Arg Ile Leu Pro Arg Asn Met Ala Ala Leu Phe Arg Leu Val Arg Ala 325 330 335 Gln Tyr Asp Asn Arg Asp Ile Asn Ala Leu Ile Arg Leu Gly Lys Val 340 345 350 Ile His Tyr His Ala Ser Glu Gln Gly Lys Ser Glu His His Gly Ile 355 360 365 Arg Asp Tyr Trp Pro Ser Gln Gln Asp Ile Gln Asn Ser Arg Phe Trp 370 375 380 Gly Ser Asp Gly Gln Ala Asp Ile Lys Arg His Glu Ala Phe Ser Arg 385 390 395 400 Ile Trp Arg His Ile Ile Ala Leu Ala Ser Arg Thr Leu His Asp Trp 405 410 415 Ala Asp Pro His Ser Gln Lys Phe Ser Gly Glu Asn Asp Asp Ile Leu 420 425 430 Leu Leu Ala Lys Asp Ala Ile Glu Asp Asp Val Phe Lys Ala Gly His 435 440 445 Tyr Glu Arg Lys Cys Asp Val Leu Phe Gly Ala Gln Ala Ser Leu Phe 450 455 460 Cys Gly Ala Glu Asp Phe Glu Lys Ala Ile Leu Lys Gln Ala Ile Thr 465 470 475 480 Gly Thr Gly Asn Leu Arg Asn Ala Thr Phe His Phe Lys Gly Lys Val 485 490 495 Arg Phe Glu Lys Glu Leu Gln Glu Leu Thr Lys Asp Val Pro Val Glu 500 505 510 Val Gln Ser Ala Ile Ala Ala Leu Trp Gln Lys Asp Ala Glu Gly Arg 515 520 525 Thr Arg Gln Ile Ala Glu Thr Leu Gln Ala Val Leu Ala Gly His Phe 530 535 540 Leu Thr Glu Glu Gln Asn Arg His Ile Phe Ala Ala Leu Thr Ala Ala 545 550 555 560 Met Ala Gln Pro Gly Asp Val Pro Leu Pro Arg Leu Arg Arg Val Leu 565 570 575 Ala Arg His Asp Ser Ile Cys Gln Arg Gly Arg Ile Leu Pro Leu Ser 580 585 590 Pro Cys Pro Asp Arg Ala Lys Leu Glu Glu Ser Pro Ala Leu Thr Cys 595 600 605 Gln Tyr Thr Val Leu Lys Met Leu Tyr Asp Gly Pro Phe Arg Ala Trp 610 615 620 Leu Ala Gln Gln Asn Ser Thr Ile Leu Asn His Tyr Ile Asp Ser Thr 625 630 635 640 Ile Ala Arg Thr Asp Lys Ala Ala Arg Asp Met Asn Gly Arg Lys Leu 645 650 655 Ala Gln Ala Glu Lys Asp Leu Ile Thr Ser Arg Ala Ala Asp Leu Pro 660 665 670 Arg Leu Ser Val Asp Glu Lys Met Gly Asp Phe Leu Ala Arg Leu Thr 675 680 685 Ala Ala Thr Ala Thr Glu Met Arg Val Gln Arg Gly Tyr Gln Ser Asp 690 695 700 Gly Glu Asn Ala Gln Lys Gln Ala Ala Phe Ile Gly Gln Phe Glu Cys 705 710 715 720 Asp Val Ile Gly Arg Ala Phe Ala Asp Phe Leu Asn Gln Ser Gly Phe 725 730 735 Asp Phe Val Leu Lys Leu Lys Ala Asp Thr Pro Gln Pro Asp Ala Ala 740 745 750 Gln Cys Asp Val Thr Ala Leu Ile Ala Pro Asp Asp Ile Ser Val Ser 755 760 765 Pro Pro Gln Ala Trp Gln Gln Val Leu Tyr Phe Ile Leu His Leu Val 770 775 780 Pro Val Asp Asp Ala Ser His Leu Leu His Gln Ile Arg Lys Trp Gln 785 790 795 800 Val Leu Glu Gly Lys Glu Lys Pro Ala Gln Ile Ala His Asp Val Gln 805 810 815 Ser Val Leu Met Leu Tyr Leu Asp Met His Asp Ala Lys Phe Thr Gly 820 825 830 Gly Ala Ala Leu His Gly Ile Glu Lys Phe Ala Glu Phe Phe Ala His 835 840 845 Ala Ala Asp Phe Arg Ala Val Phe Pro Pro Gln Ser Leu Gln Asp Gln 850 855 860 Asp Arg Ser Ile Pro Arg Arg Gly Leu Arg Glu Ile Val Arg Phe Gly 865 870 875 880 His Leu Pro Leu Leu Gln His Met Ser Gly Thr Val Gln Ile Thr His 885 890 895 Asp Asn Val Val Ala Trp Gln Ala Ala Arg Thr Ala Gly Ala Thr Gly 900 905 910 Met Ser Pro Ile Ala Arg Arg Gln Lys Gln Arg Glu Glu Leu His Ala 915 920 925 Leu Ala Val Glu Arg Thr Ala Arg Phe Arg Asn Ala Asp Leu Gln Asn 930 935 940 Tyr Met His Ala Leu Val Asp Val Ile Lys His Arg Gln Leu Ser Ala 945 950 955 960 Gln Val Thr Leu Ser Asp Gln Val Arg Leu His Arg Leu Met Met Gly 965 970 975 Val Leu Gly Arg Leu Val Asp Tyr Ala Gly Leu Trp Glu Arg Asp Leu 980 985 990 Tyr Phe Val Val Leu Ala Leu Leu Tyr His His Gly Ala Thr Pro Asp 995 1000 1005 Asp Val Phe Lys Gly Gln Gly Lys Lys Asn Leu Ala Asp Gly Gln 1010 1015 1020 Val Val Ala Ala Leu Lys Pro Lys Asn Arg Lys Ala Ala Ala Pro 1025 1030 1035 Val Gly Val Phe Asp Asp Leu Asp His Tyr Gly Ile Tyr Gln Asp 1040 1045 1050 Asp Arg Gln Ser Ile Arg Asn Gly Leu Ser His Phe Asn Met Leu 1055 1060 1065 Arg Gly Gly Lys Ala Pro Asp Leu Ser His Trp Val Asn Gln Thr 1070 1075 1080 Arg Ser Leu Val Ala His Asp Arg Lys Leu Lys Asn Ala Val Ala 1085 1090 1095 Lys Ser Val Ile Glu Met Leu Ala Arg Glu Gly Phe Asp Leu Asp 1100 1105 1110 Trp Gly Ile Gln Thr Asp Arg Gly Gln His Ile Leu Ser His Gly 1115 1120 1125 Lys Ile Arg Thr Arg Gln Ala Gln His Phe Gln Lys Ser Arg Leu 1130 1135 1140 His Ile Val Lys Lys Ser Ala Lys Pro Asp Lys Asn Asp Thr Val 1145 1150 1155 Lys Ile Arg Glu Asn Leu His Gly Asp Ala Met Val Glu Arg Val 1160 1165 1170 Val Gln Leu Phe Ala Ala Gln Val Gln Lys Arg Tyr Asp Ile Thr 1175 1180 1185 Val Glu Lys Arg Leu Asp His Leu Phe Leu Lys Pro Gln Asp Gln 1190 1195 1200 Lys Gly Lys Asn Gly Ile His Thr His Asn Gly Trp Ser Lys Thr 1205 1210 1215 Glu Lys Lys Arg Arg Pro Ser Arg Glu Asn Arg Lys Gly Asn His 1220 1225 1230 Glu Asn 1235 <210> 84 <211> 1312 <212> PRT <213> Pseudobutyrivibrio sp. <400> 84 Met Lys Phe Ser Lys Glu Ser His Arg Lys Thr Ala Val Gly Val Thr 1 5 10 15 Glu Ser Asn Gly Ile Ile Gly Leu Leu Tyr Lys Asp Pro Leu Asn Glu 20 25 30 Lys Glu Lys Ile Glu Asp Val Val Asn Gln Arg Ala Asn Ser Thr Lys 35 40 45 Arg Leu Phe Asn Leu Phe Gly Thr Glu Ala Thr Ser Lys Asp Ile Ser 50 55 60 Arg Ala Ser Lys Asp Leu Ala Lys Val Val Asn Lys Ala Ile Gly Asn 65 70 75 80 Leu Lys Gly Asn Lys Lys Phe Asn Lys Lys Glu Gln Ile Thr Lys Gly 85 90 95 Leu Asn Thr Lys Ile Ile Val Glu Glu Leu Lys Asn Val Leu Lys Asp 100 105 110 Glu Lys Lys Leu Ile Val Asn Lys Asp Ile Ile Asp Glu Ala Cys Ser 115 120 125 Arg Leu Leu Lys Thr Ser Phe Arg Thr Ala Lys Thr Lys Gln Ala Val 130 135 140 Lys Met Ile Leu Thr Ala Val Leu Ile Glu Asn Thr Asn Leu Ser Lys 145 150 155 160 Glu Asp Glu Ala Phe Val His Glu Tyr Phe Val Lys Lys Leu Val Asn 165 170 175 Glu Tyr Asn Lys Thr Ser Val Lys Lys Gln Ile Pro Val Ala Leu Ser 180 185 190 Asn Gln Asn Met Val Ile Gln Pro Asn Ser Val Asn Gly Thr Leu Glu 195 200 205 Ile Ser Glu Thr Lys Lys Ser Lys Glu Thr Lys Thr Thr Glu Lys Asp 210 215 220 Ala Phe Arg Ala Phe Leu Arg Asp Tyr Ala Thr Leu Asp Glu Asn Arg 225 230 235 240 Arg His Lys Met Arg Leu Cys Leu Arg Asn Leu Val Asn Leu Tyr Phe 245 250 255 Tyr Gly Glu Thr Ser Val Ser Lys Asp Asp Phe Asp Glu Trp Arg Asp 260 265 270 His Glu Asp Lys Lys Gln Asn Asp Glu Leu Phe Val Lys Lys Ile Val 275 280 285 Ser Ile Lys Thr Asp Arg Lys Gly Asn Val Lys Glu Val Leu Asp Val 290 295 300 Asp Ala Thr Ile Asp Ala Ile Arg Thr Asn Asn Ile Ala Cys Tyr Arg 305 310 315 320 Arg Ala Leu Ala Tyr Ala Asn Glu Asn Pro Asp Val Phe Phe Ser Asp 325 330 335 Thr Met Leu Asn Lys Phe Trp Ile His His Val Glu Asn Glu Val Glu 340 345 350 Arg Ile Tyr Gly His Ile Asn Asn Asn Thr Gly Asp Tyr Lys Tyr Gln 355 360 365 Leu Gly Tyr Leu Ser Glu Lys Val Trp Lys Gly Ile Ile Asn Tyr Leu 370 375 380 Ser Ile Lys Tyr Ile Ala Glu Gly Lys Ala Val Tyr Asn Tyr Ala Met 385 390 395 400 Asn Ala Leu Ala Lys Asp Asn Asn Ser Asn Ala Phe Gly Lys Leu Asp 405 410 415 Glu Lys Phe Val Asn Gly Ile Thr Ser Phe Glu Tyr Glu Arg Ile Lys 420 425 430 Ala Glu Glu Thr Leu Gln Arg Glu Cys Ala Val Asn Ile Ala Phe Ala 435 440 445 Ala Asn His Leu Ala Asn Ala Thr Val Asp Leu Asn Glu Lys Asp Ser 450 455 460 Asp Phe Leu Leu Leu Lys His Glu Asp Asn Lys Asp Thr Leu Gly Ala 465 470 475 480 Val Ala Arg Pro Asn Ile Leu Arg Asn Ile Leu Gln Phe Phe Gly Gly 485 490 495 Lys Ser Arg Trp Asn Asp Phe Asp Phe Ser Gly Ile Asp Glu Ile Gln 500 505 510 Leu Leu Asp Asp Leu Arg Lys Met Ile Tyr Ser Leu Arg Asn Ser Ser 515 520 525 Phe His Phe Lys Thr Glu Asn Ile Asp Asn Asp Ser Trp Asn Thr Lys 530 535 540 Leu Ile Gly Asp Met Phe Ala Tyr Asp Phe Asn Met Ala Gly Asn Val 545 550 555 560 Gln Lys Asp Lys Met Tyr Ser Asn Asn Val Pro Met Phe Tyr Ser Thr 565 570 575 Ser Asp Ile Glu Lys Met Leu Asp Arg Leu Tyr Ala Glu Val His Glu 580 585 590 Arg Ala Ser Gln Val Pro Ser Phe Asn Ser Val Phe Val Arg Lys Asn 595 600 605 Phe Pro Asp Tyr Leu Lys Asn Asp Leu Lys Ile Thr Ser Ala Phe Gly 610 615 620 Val Asp Asp Ala Leu Lys Trp Gln Ser Ala Val Tyr Tyr Val Cys Lys 625 630 635 640 Glu Ile Tyr Tyr Asn Asp Phe Leu Gln Asn Pro Glu Thr Phe Thr Met 645 650 655 Leu Lys Asp Tyr Val Gln Cys Leu Pro Ile Asp Ile Asp Lys Ser Met 660 665 670 Asp Gln Lys Leu Lys Ser Glu Arg Asn Ala His Lys Asn Phe Lys Glu 675 680 685 Ala Phe Ala Thr Tyr Cys Lys Glu Cys Asp Ser Leu Ser Ala Ile Cys 690 695 700 Gln Met Ile Met Thr Glu Tyr Asn Asn Gln Asn Lys Gly Asn Arg Lys 705 710 715 720 Val Ile Ser Ala Arg Thr Lys Asp Gly Asp Lys Leu Ile Tyr Lys His 725 730 735 Tyr Lys Met Ile Leu Phe Glu Ala Leu Lys Asn Val Phe Thr Ile Tyr 740 745 750 Leu Glu Lys Asn Ile Asn Thr Tyr Gly Phe Leu Lys Lys Pro Lys Leu 755 760 765 Ile Asn Asn Val Pro Ala Ile Glu Glu Phe Leu Pro Asn Tyr Asn Gly 770 775 780 Arg Gln Tyr Glu Thr Leu Val Asn Arg Ile Thr Glu Glu Thr Glu Leu 785 790 795 800 Gln Lys Trp Tyr Ile Val Gly Arg Leu Leu Asn Pro Lys Gln Val Asn 805 810 815 Gln Leu Ile Gly Asn Phe Arg Ser Tyr Val Gln Tyr Val Asn Asp Val 820 825 830 Ala Arg Arg Ala Lys Gln Thr Gly Asn Asn Leu Ser Asn Asp Asn Ile 835 840 845 Ala Trp Asp Val Lys Asn Ile Ile Gln Ile Phe Asp Val Cys Thr Lys 850 855 860 Leu Asn Gly Val Thr Ser Asn Ile Leu Glu Asp Tyr Phe Asp Asp Gly 865 870 875 880 Asp Asp Tyr Ala Arg Tyr Leu Lys Asn Phe Val Asp Tyr Thr Asn Lys 885 890 895 Asn Asn Asp His Ser Ala Thr Leu Leu Gly Asp Phe Cys Ala Lys Glu 900 905 910 Ile Asp Gly Ile Lys Ile Gly Ile Tyr His Asp Gly Thr Asn Pro Ile 915 920 925 Val Asn Arg Asn Ile Ile Gln Cys Lys Leu Tyr Gly Ala Thr Gly Ile 930 935 940 Ile Ser Asp Leu Thr Lys Asp Gly Ser Ile Leu Ser Val Asp Tyr Glu 945 950 955 960 Ile Ile Lys Lys Tyr Met Gln Met Gln Lys Glu Ile Lys Val Tyr Gln 965 970 975 Gln Lys Gly Ile Cys Lys Thr Lys Glu Glu Gln Gln Asn Leu Lys Lys 980 985 990 Tyr Gln Glu Leu Lys Asn Ile Val Glu Leu Arg Asn Ile Ile Asp Tyr 995 1000 1005 Ser Glu Ile Leu Asp Glu Leu Gln Gly Gln Leu Ile Asn Trp Gly 1010 1015 1020 Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln Leu Gly Phe His 1025 1030 1035 Tyr Leu Cys Leu His Asn Glu Ser Lys Lys Pro Val Gly Tyr Asn 1040 1045 1050 Asn Ala Gly Asp Ile Ser Gly Ala Val Leu Tyr Gln Ile Val Ala 1055 1060 1065 Met Tyr Thr Asn Gly Leu Ser Leu Ile Asp Ala Asn Gly Lys Ser 1070 1075 1080 Lys Lys Asn Ala Lys Ala Ser Ala Gly Ala Lys Val Gly Ser Phe 1085 1090 1095 Cys Ser Tyr Ser Lys Glu Ile Arg Gly Val Asp Lys Asp Thr Lys 1100 1105 1110 Glu Asp Asp Asp Pro Ile Tyr Leu Ala Gly Val Glu Leu Phe Glu 1115 1120 1125 Asn Ile Asn Glu His Gln Gln Cys Ile Asn Leu Arg Asn Tyr Ile 1130 1135 1140 Glu His Phe His Tyr Tyr Ala Lys His Asp Arg Ser Met Leu Asp 1145 1150 1155 Leu Tyr Ser Glu Val Phe Asp Arg Phe Phe Thr Tyr Asp Met Lys 1160 1165 1170 Tyr Thr Lys Asn Val Pro Asn Met Met Tyr Asn Ile Leu Leu Gln 1175 1180 1185 His Leu Val Val Pro Ala Phe Glu Phe Gly Ser Ser Glu Lys Arg 1190 1195 1200 Leu Asp Asp Asn Asp Glu Gln Thr Lys Pro Arg Ala Met Phe Thr 1205 1210 1215 Leu Arg Glu Lys Asn Gly Leu Ser Ser Glu Gln Phe Thr Tyr Arg 1220 1225 1230 Leu Gly Asp Gly Asn Ser Thr Val Lys Leu Ser Ala Arg Gly Asp 1235 1240 1245 Asp Tyr Leu Arg Ala Val Ala Ser Leu Leu Tyr Tyr Pro Asp Arg 1250 1255 1260 Ala Pro Glu Gly Leu Ile Arg Asp Ala Glu Ala Glu Asp Lys Phe 1265 1270 1275 Ala Lys Ile Asn His Ser Asn Pro Lys Ser Asp Asn Arg Asn Asn 1280 1285 1290 Arg Gly Asn Phe Lys Asn Pro Lys Val Gln Trp Tyr Asn Asn Lys 1295 1300 1305 Thr Lys Arg Lys 1310 <210> 85 <211> 1343 <212> PRT <213> Butyrivibrio sp. <400> 85 Met Lys Ile Ser Lys Val Asp His Arg Lys Thr Ala Val Lys Ile Thr 1 5 10 15 Asp Asn Lys Gly Ala Glu Gly Phe Ile Tyr Gln Asp Pro Thr Arg Asp 20 25 30 Ser Ser Thr Met Glu Gln Ile Ile Ser Asn Arg Ala Arg Ser Ser Lys 35 40 45 Val Leu Phe Asn Ile Phe Gly Asp Thr Lys Lys Ser Lys Asp Leu Asn 50 55 60 Lys Tyr Thr Glu Ser Leu Ile Ile Tyr Val Asn Lys Ala Ile Lys Ser 65 70 75 80 Leu Lys Gly Asp Lys Arg Asn Asn Lys Tyr Glu Glu Ile Thr Glu Ser 85 90 95 Leu Lys Thr Glu Arg Val Leu Asn Ala Leu Ile Gln Ala Gly Asn Glu 100 105 110 Phe Thr Cys Ser Glu Asn Asn Ile Glu Asp Ala Leu Asn Lys Tyr Leu 115 120 125 Lys Lys Ser Phe Arg Val Gly Asn Thr Lys Ser Ala Leu Lys Lys Leu 130 135 140 Leu Met Ala Ala Tyr Cys Gly Tyr Lys Leu Ser Ile Glu Glu Lys Glu 145 150 155 160 Glu Ile Gln Asn Tyr Phe Val Asp Lys Leu Val Lys Glu Tyr Asn Lys 165 170 175 Asp Thr Val Leu Lys Tyr Thr Ala Lys Ser Leu Lys His Gln Asn Met 180 185 190 Val Val Gln Pro Asp Thr Asp Asn His Val Phe Leu Pro Ser Arg Ile 195 200 205 Ala Gly Ala Thr Gln Asn Lys Met Ser Glu Lys Glu Ala Leu Thr Glu 210 215 220 Phe Leu Lys Ala Tyr Ala Val Leu Asp Glu Glu Lys Arg His Asn Leu 225 230 235 240 Arg Ile Ile Leu Arg Lys Leu Val Asn Leu Tyr Phe Tyr Glu Ser Pro 245 250 255 Asp Phe Ile Tyr Pro Glu Asn Asn Glu Trp Lys Glu His Asp Asp Arg 260 265 270 Lys Asn Lys Thr Glu Thr Phe Val Ser Pro Val Lys Val Asn Glu Glu 275 280 285 Lys Asn Gly Lys Thr Phe Val Lys Ile Asp Val Pro Ala Thr Lys Asp 290 295 300 Leu Ile Arg Leu Lys Asn Ile Glu Cys Tyr Arg Arg Ser Val Ala Glu 305 310 315 320 Thr Ala Gly Asn Pro Ile Thr Tyr Phe Thr Asp His Asn Ile Ser Lys 325 330 335 Phe Trp Ile His His Ile Glu Asn Glu Val Glu Lys Ile Phe Ala Leu 340 345 350 Leu Lys Ser Asn Trp Lys Asp Tyr Gln Phe Ser Val Gly Tyr Ile Ser 355 360 365 Glu Lys Val Trp Lys Glu Ile Ile Asn Tyr Leu Ser Ile Lys Tyr Ile 370 375 380 Ala Ile Gly Lys Ala Val Tyr Asn Tyr Ala Leu Glu Asp Ile Lys Lys 385 390 395 400 Asn Asp Gly Thr Leu Asn Phe Gly Val Ile Asp Pro Ser Phe Tyr Asp 405 410 415 Gly Ile Asn Ser Phe Glu Tyr Glu Lys Ile Lys Ala Glu Glu Thr Phe 420 425 430 Gln Arg Glu Val Ala Val Tyr Val Ser Phe Ala Val Asn His Leu Ser 435 440 445 Ser Ala Thr Val Lys Leu Ser Glu Ala Gln Ser Asp Met Leu Val Leu 450 455 460 Asn Lys Asn Asp Ile Glu Lys Ile Ala Tyr Gly Asn Thr Lys Arg Asn 465 470 475 480 Ile Leu Gln Phe Phe Gly Gly Gln Ser Lys Trp Lys Glu Phe Asp Phe 485 490 495 Asp Arg Tyr Ile Asn Pro Val Asn Tyr Thr Asp Ile Asp Phe Leu Phe 500 505 510 Asp Ile Lys Lys Met Val Tyr Ser Leu Arg Asn Glu Ser Phe His Phe 515 520 525 Thr Thr Thr Asp Thr Glu Ser Asp Trp Asn Lys Asn Leu Ile Ser Ala 530 535 540 Met Phe Glu Tyr Glu Cys Arg Arg Ile Ser Thr Val Gln Lys Asn Lys 545 550 555 560 Phe Phe Ser Asn Asn Leu Pro Leu Phe Tyr Gly Glu Asn Ser Leu Glu 565 570 575 Arg Val Leu His Lys Leu Tyr Asp Asp Tyr Val Asp Arg Met Ser Gln 580 585 590 Val Pro Ser Phe Gly Asn Val Phe Val Arg Lys Lys Phe Pro Asp Tyr 595 600 605 Met Lys Glu Ile Gly Ile Lys His Asn Leu Ser Ser Glu Asp Asn Leu 610 615 620 Lys Leu Gln Gly Ala Leu Tyr Phe Leu Tyr Lys Glu Ile Tyr Tyr Asn 625 630 635 640 Ala Phe Ile Ser Ser Glu Lys Ala Met Lys Ile Phe Val Asp Leu Val 645 650 655 Asn Lys Leu Asp Thr Asn Ala Arg Asp Asp Lys Gly Arg Ile Thr His 660 665 670 Glu Ala Met Ala His Lys Asn Phe Lys Asp Ala Ile Ser His Tyr Met 675 680 685 Thr His Asp Cys Ser Leu Ala Asp Ile Cys Gln Lys Ile Met Thr Glu 690 695 700 Tyr Asn Gln Gln Asn Thr Gly His Arg Lys Lys Gln Thr Thr Tyr Ser 705 710 715 720 Ser Glu Lys Asn Pro Glu Ile Phe Arg His Tyr Lys Met Ile Leu Phe 725 730 735 Met Leu Leu Gln Lys Ala Met Thr Glu Tyr Ile Ser Ser Glu Glu Ile 740 745 750 Phe Asp Phe Ile Met Lys Pro Asn Ser Pro Lys Thr Asp Ile Lys Glu 755 760 765 Glu Glu Phe Leu Pro Gln Tyr Lys Ser Cys Ala Tyr Asp Asn Leu Ile 770 775 780 Lys Leu Ile Ala Asp Asn Val Glu Leu Gln Lys Trp Tyr Ile Thr Ala 785 790 795 800 Arg Leu Leu Ser Pro Arg Glu Val Asn Gln Leu Ile Gly Ser Phe Arg 805 810 815 Ser Tyr Lys Gln Phe Val Ser Asp Ile Glu Arg Arg Ala Lys Glu Thr 820 825 830 Asn Asn Ser Leu Ser Lys Ser Gly Met Thr Val Asp Val Glu Asn Ile 835 840 845 Thr Lys Val Leu Asp Leu Cys Thr Lys Leu Asn Gly Arg Phe Ser Asn 850 855 860 Glu Leu Thr Asp Tyr Phe Asp Ser Lys Asp Asp Tyr Ala Val Tyr Val 865 870 875 880 Ser Lys Phe Leu Asp Phe Gly Phe Lys Ile Asp Glu Lys Phe Pro Ala 885 890 895 Ala Leu Leu Gly Glu Phe Cys Asn Lys Glu Glu Asn Gly Lys Lys Ile 900 905 910 Gly Ile Tyr His Asn Gly Thr Glu Pro Ile Leu Asn Ser Asn Ile Ile 915 920 925 Lys Ser Lys Leu Tyr Gly Ile Thr Asp Val Val Ser Arg Ala Val Lys 930 935 940 Pro Val Ser Glu Lys Leu Ile Arg Glu Tyr Leu Gln Gln Glu Val Lys 945 950 955 960 Ile Lys Pro Tyr Leu Glu Asn Gly Val Cys Lys Asn Lys Glu Glu Gln 965 970 975 Ala Ala Leu Arg Lys Tyr Gln Glu Leu Lys Asn Arg Ile Glu Phe Arg 980 985 990 Asp Ile Val Glu Tyr Ser Glu Ile Ile Asn Glu Leu Met Gly Gln Leu 995 1000 1005 Ile Asn Phe Ser Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln 1010 1015 1020 Leu Gly Phe His Tyr Leu Cys Leu Asn Asn Tyr Gly Ala Lys Pro 1025 1030 1035 Glu Gly Tyr Tyr Ser Ile Val Asn Asp Lys Arg Thr Ile Lys Gly 1040 1045 1050 Ala Ile Leu Tyr Gln Ile Val Ala Met Tyr Thr Tyr Gly Leu Pro 1055 1060 1065 Ile Tyr His Tyr Val Asp Gly Thr Ile Ser Asp Arg Arg Lys Asn 1070 1075 1080 Lys Lys Thr Val Leu Asp Thr Leu Asn Ser Ser Glu Thr Val Gly 1085 1090 1095 Ala Lys Ile Lys Tyr Phe Ile Tyr Tyr Ser Asp Glu Leu Phe Asn 1100 1105 1110 Asp Ser Leu Ile Leu Tyr Asn Ala Gly Leu Glu Leu Phe Glu Asn 1115 1120 1125 Ile Asn Glu His Glu Asn Ile Val Asn Leu Arg Lys Tyr Ile Asp 1130 1135 1140 His Phe Lys Tyr Tyr Val Ser Gln Asp Arg Ser Leu Leu Asp Ile 1145 1150 1155 Tyr Ser Glu Val Phe Asp Arg Tyr Phe Thr Tyr Asp Arg Lys Tyr 1160 1165 1170 Lys Lys Asn Val Met Asn Leu Phe Ser Asn Ile Met Leu Lys His 1175 1180 1185 Phe Ile Ile Thr Asp Phe Glu Phe Ser Thr Gly Glu Lys Thr Ile 1190 1195 1200 Gly Glu Lys Asn Thr Ala Lys Lys Glu Cys Ala Lys Val Arg Ile 1205 1210 1215 Lys Arg Gly Gly Leu Ser Ser Asp Lys Phe Thr Tyr Lys Phe Lys 1220 1225 1230 Asp Ala Lys Pro Ile Glu Leu Ser Ala Lys Asn Thr Glu Phe Leu 1235 1240 1245 Asp Gly Val Ala Arg Ile Leu Tyr Tyr Pro Glu Asn Val Val Leu 1250 1255 1260 Thr Asp Leu Val Arg Asn Ser Glu Val Glu Asp Glu Lys Arg Ile 1265 1270 1275 Glu Lys Tyr Asp Arg Asn His Asn Ser Ser Pro Thr Arg Lys Asp 1280 1285 1290 Lys Thr Tyr Lys Gln Asp Val Lys Lys Asn Tyr Asn Lys Lys Thr 1295 1300 1305 Ser Lys Ala Phe Asp Ser Ser Lys Leu Asp Thr Lys Ser Val Gly 1310 1315 1320 Asn Asn Leu Ser Asp Asn Pro Val Leu Lys Gln Phe Leu Ser Glu 1325 1330 1335 Ser Lys Lys Lys Arg 1340 <210> 86 <211> 1276 <212> PRT <213> Blautia sp. <400> 86 Met Lys Ile Ser Lys Val Asp His Val Lys Ser Gly Ile Asp Gln Lys 1 5 10 15 Leu Ser Ser Gln Arg Gly Met Leu Tyr Lys Gln Pro Gln Lys Lys Tyr 20 25 30 Glu Gly Lys Gln Leu Glu Glu His Val Arg Asn Leu Ser Arg Lys Ala 35 40 45 Lys Ala Leu Tyr Gln Val Phe Pro Val Ser Gly Asn Ser Lys Met Glu 50 55 60 Lys Glu Leu Gln Ile Ile Asn Ser Phe Ile Lys Asn Ile Leu Leu Arg 65 70 75 80 Leu Asp Ser Gly Lys Thr Ser Glu Glu Ile Val Gly Tyr Ile Asn Thr 85 90 95 Tyr Ser Val Ala Ser Gln Ile Ser Gly Asp His Ile Gln Glu Leu Val 100 105 110 Asp Gln His Leu Lys Glu Ser Leu Arg Lys Tyr Thr Cys Val Gly Asp 115 120 125 Lys Arg Ile Tyr Val Pro Asp Ile Ile Val Ala Leu Leu Lys Ser Lys 130 135 140 Phe Asn Ser Glu Thr Leu Gln Tyr Asp Asn Ser Glu Leu Lys Ile Leu 145 150 155 160 Ile Asp Phe Ile Arg Glu Asp Tyr Leu Lys Glu Lys Gln Ile Lys Gln 165 170 175 Ile Val His Ser Ile Glu Asn Asn Ser Thr Pro Leu Arg Ile Ala Glu 180 185 190 Ile Asn Gly Gln Lys Arg Leu Ile Pro Ala Asn Val Asp Asn Pro Lys 195 200 205 Lys Ser Tyr Ile Phe Glu Phe Leu Lys Glu Tyr Ala Gln Ser Asp Pro 210 215 220 Lys Gly Gln Glu Ser Leu Leu Gln His Met Arg Tyr Leu Ile Leu Leu 225 230 235 240 Tyr Leu Tyr Gly Pro Asp Lys Ile Thr Asp Asp Tyr Cys Glu Glu Ile 245 250 255 Glu Ala Trp Asn Phe Gly Ser Ile Val Met Asp Asn Glu Gln Leu Phe 260 265 270 Ser Glu Glu Ala Ser Met Leu Ile Gln Asp Arg Ile Tyr Val Asn Gln 275 280 285 Gln Ile Glu Glu Gly Arg Gln Ser Lys Asp Thr Ala Lys Val Lys Lys 290 295 300 Asn Lys Ser Lys Tyr Arg Met Leu Gly Asp Lys Ile Glu His Ser Ile 305 310 315 320 Asn Glu Ser Val Val Lys His Tyr Gln Glu Ala Cys Lys Ala Val Glu 325 330 335 Glu Lys Asp Ile Pro Trp Ile Lys Tyr Ile Ser Asp His Val Met Ser 340 345 350 Val Tyr Ser Ser Lys Asn Arg Val Asp Leu Asp Lys Leu Ser Leu Pro 355 360 365 Tyr Leu Ala Lys Asn Thr Trp Asn Thr Trp Ile Ser Phe Ile Ala Met 370 375 380 Lys Tyr Val Asp Met Gly Lys Gly Val Tyr His Phe Ala Met Ser Asp 385 390 395 400 Val Asp Lys Val Gly Lys Gln Asp Asn Leu Ile Ile Gly Gln Ile Asp 405 410 415 Pro Lys Phe Ser Asp Gly Ile Ser Ser Phe Asp Tyr Glu Arg Ile Lys 420 425 430 Ala Glu Asp Asp Leu His Arg Ser Met Ser Gly Tyr Ile Ala Phe Ala 435 440 445 Val Asn Asn Phe Ala Arg Ala Ile Cys Ser Asp Glu Phe Arg Lys Lys 450 455 460 Asn Arg Lys Glu Asp Val Leu Thr Val Gly Leu Asp Glu Ile Pro Leu 465 470 475 480 Tyr Asp Asn Val Lys Arg Lys Leu Leu Gln Tyr Phe Gly Gly Ala Ser 485 490 495 Asn Trp Asp Asp Ser Ile Ile Asp Ile Ile Asp Asp Lys Asp Leu Val 500 505 510 Ala Cys Ile Lys Glu Asn Leu Tyr Val Ala Arg Asn Val Asn Phe His 515 520 525 Phe Ala Gly Ser Glu Lys Val Gln Lys Lys Gln Asp Asp Ile Leu Glu 530 535 540 Glu Ile Val Arg Lys Glu Thr Arg Asp Ile Gly Lys His Tyr Arg Lys 545 550 555 560 Val Phe Tyr Ser Asn Asn Val Ala Val Phe Tyr Cys Asp Glu Asp Ile 565 570 575 Ile Lys Leu Met Asn His Leu Tyr Gln Arg Glu Lys Pro Tyr Gln Ala 580 585 590 Gln Ile Pro Ser Tyr Asn Lys Val Ile Ser Lys Thr Tyr Leu Pro Asp 595 600 605 Leu Ile Phe Met Leu Leu Lys Gly Lys Asn Arg Thr Lys Ile Ser Asp 610 615 620 Pro Ser Ile Met Asn Met Phe Arg Gly Thr Phe Tyr Phe Leu Leu Lys 625 630 635 640 Glu Ile Tyr Tyr Asn Asp Phe Leu Gln Ala Ser Asn Leu Lys Glu Met 645 650 655 Phe Cys Glu Gly Leu Lys Asn Asn Val Lys Asn Lys Lys Ser Glu Lys 660 665 670 Pro Tyr Gln Asn Phe Met Arg Arg Phe Glu Glu Leu Glu Asn Met Gly 675 680 685 Met Asp Phe Gly Glu Ile Cys Gln Gln Ile Met Thr Asp Tyr Glu Gln 690 695 700 Gln Asn Lys Gln Lys Lys Lys Thr Ala Thr Ala Val Met Ser Glu Lys 705 710 715 720 Asp Lys Lys Ile Arg Thr Leu Asp Asn Asp Thr Gln Lys Tyr Lys His 725 730 735 Phe Arg Thr Leu Leu Tyr Ile Gly Leu Arg Glu Ala Phe Ile Ile Tyr 740 745 750 Leu Lys Asp Glu Lys Asn Lys Glu Trp Tyr Glu Phe Leu Arg Glu Pro 755 760 765 Val Lys Arg Glu Gln Pro Glu Glu Lys Glu Phe Val Asn Lys Trp Lys 770 775 780 Leu Asn Gln Tyr Ser Asp Cys Ser Glu Leu Ile Leu Lys Asp Ser Leu 785 790 795 800 Ala Ala Ala Trp Tyr Val Val Ala His Phe Ile Asn Gln Ala Gln Leu 805 810 815 Asn His Leu Ile Gly Asp Ile Lys Asn Tyr Ile Gln Phe Ile Ser Asp 820 825 830 Ile Asp Arg Arg Ala Lys Ser Thr Gly Asn Pro Val Ser Glu Ser Thr 835 840 845 Glu Ile Gln Ile Glu Arg Tyr Arg Lys Ile Leu Arg Val Leu Glu Phe 850 855 860 Ala Lys Phe Phe Cys Gly Gln Ile Thr Asn Val Leu Thr Asp Tyr Tyr 865 870 875 880 Gln Asp Glu Asn Asp Phe Ser Thr His Val Gly His Tyr Val Lys Phe 885 890 895 Glu Lys Lys Asn Met Glu Pro Ala His Ala Leu Gln Ala Phe Ser Asn 900 905 910 Ser Leu Tyr Ala Cys Gly Lys Glu Lys Lys Lys Ala Gly Phe Tyr Tyr 915 920 925 Asp Gly Met Asn Pro Ile Val Asn Arg Asn Ile Thr Leu Ala Ser Met 930 935 940 Tyr Gly Asn Lys Lys Leu Leu Glu Asn Ala Met Asn Pro Val Thr Glu 945 950 955 960 Gln Asp Ile Arg Lys Tyr Tyr Ser Leu Met Ala Glu Leu Asp Ser Val 965 970 975 Leu Lys Asn Gly Ala Val Cys Lys Ser Glu Asp Glu Gln Lys Asn Leu 980 985 990 Arg His Phe Gln Asn Leu Lys Asn Arg Ile Glu Leu Val Asp Val Leu 995 1000 1005 Thr Leu Ser Glu Leu Val Asn Asp Leu Val Ala Gln Leu Ile Gly 1010 1015 1020 Trp Val Tyr Ile Arg Glu Arg Asp Met Met Tyr Leu Gln Leu Gly 1025 1030 1035 Leu His Tyr Ile Lys Leu Tyr Phe Thr Asp Ser Val Ala Glu Asp 1040 1045 1050 Ser Tyr Leu Arg Thr Leu Asp Leu Glu Glu Gly Ser Ile Ala Asp 1055 1060 1065 Gly Ala Val Leu Tyr Gln Ile Ala Ser Leu Tyr Ser Phe Asn Leu 1070 1075 1080 Pro Met Tyr Val Lys Pro Asn Lys Ser Ser Val Tyr Cys Lys Lys 1085 1090 1095 His Val Asn Ser Val Ala Thr Lys Phe Asp Ile Phe Glu Lys Glu 1100 1105 1110 Tyr Cys Asn Gly Asp Glu Thr Val Ile Glu Asn Gly Leu Arg Leu 1115 1120 1125 Phe Glu Asn Ile Asn Leu His Lys Asp Met Val Lys Phe Arg Asp 1130 1135 1140 Tyr Leu Ala His Phe Lys Tyr Phe Ala Lys Leu Asp Glu Ser Ile 1145 1150 1155 Leu Glu Leu Tyr Ser Lys Ala Tyr Asp Phe Phe Phe Ser Tyr Asn 1160 1165 1170 Ile Lys Leu Lys Lys Ser Val Ser Tyr Val Leu Thr Asn Val Leu 1175 1180 1185 Leu Ser Tyr Phe Ile Asn Ala Lys Leu Ser Phe Ser Thr Tyr Lys 1190 1195 1200 Ser Ser Gly Asn Lys Thr Val Gln His Arg Thr Thr Lys Ile Ser 1205 1210 1215 Val Val Ala Gln Thr Asp Tyr Phe Thr Tyr Lys Leu Arg Ser Ile 1220 1225 1230 Val Lys Asn Lys Asn Gly Val Glu Ser Ile Glu Asn Asp Asp Arg 1235 1240 1245 Arg Cys Glu Val Val Asn Ile Ala Ala Arg Asp Lys Glu Phe Val 1250 1255 1260 Asp Glu Val Cys Asn Val Ile Asn Tyr Asn Ser Asp Lys 1265 1270 1275 <210> 87 <211> 1168 <212> PRT <213> Leptotrichia sp. <400> 87 Met Lys Ile Thr Lys Ile Asp Gly Ile Ser His Lys Lys Tyr Ile Lys 1 5 10 15 Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Lys Thr Asp Glu 20 25 30 Arg Leu Ser Glu Leu Leu Thr Ile Arg Leu Asp Thr Tyr Ile Lys Asn 35 40 45 Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu 50 55 60 Lys Glu Phe Phe Ser Asn Lys Val Leu Tyr Leu Lys Asp Gly Ile Leu 65 70 75 80 Tyr Leu Lys Asp Arg Arg Glu Lys Asn Gln Leu Gln Asn Lys Asn Tyr 85 90 95 Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Asn Phe 100 105 110 Leu Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Ile Asn Ser Glu Glu 115 120 125 Leu Glu Ile Phe Arg Asn Asp Phe Glu Lys Lys Leu Asp Lys Ile Asn 130 135 140 Ser Leu Lys Tyr Ser Leu Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile 145 150 155 160 Asn Glu Asn Asn Ile Lys Lys Val Glu Gly Lys Ser Lys Arg Asn Ile 165 170 175 Phe Tyr Asn Tyr Tyr Lys Asp Ser Ala Lys Arg Asn Asp Tyr Ile Asn 180 185 190 Asn Ile Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu 195 200 205 Asn Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys 210 215 220 Ile Arg Glu Cys Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu 225 230 235 240 Asn Phe Ala Thr Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Met 245 250 255 Lys Glu Leu Ile Glu Lys Val Pro Asn Val Ser Glu Leu Lys Lys Ser 260 265 270 Gln Val Phe Tyr Lys Tyr Tyr Leu Asn Lys Glu Lys Leu Asn Asp Glu 275 280 285 Asn Ile Lys Tyr Val Phe Cys His Phe Val Glu Ile Glu Met Ser Lys 290 295 300 Leu Leu Lys Asn Tyr Val Tyr Lys Lys Pro Ser Asn Ile Ser Asn Asp 305 310 315 320 Lys Val Lys Arg Ile Phe Glu Tyr Gln Ser Leu Lys Lys Leu Ile Glu 325 330 335 Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys 340 345 350 Tyr Ser Phe Tyr Leu Gln Asp Gly Glu Ile Ala Thr Ser Asp Phe Ile 355 360 365 Val Gly Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val 370 375 380 Ser Ser Thr Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn 385 390 395 400 Glu Asn Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn 405 410 415 Lys Gly Glu Glu Lys Tyr Ile Ser Gly Glu Ile Asp Lys Leu Tyr Asp 420 425 430 Asn Asn Lys Gln Asn Glu Val Lys Lys Asn Leu Lys Met Phe Tyr Ser 435 440 445 Tyr Asp Phe Asn Met Asn Ser Lys Lys Glu Ile Glu Asp Phe Phe Ser 450 455 460 Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 465 470 475 480 Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Thr Phe Lys Asn Ile Val 485 490 495 Pro Ser Gln Ile Ser Lys Lys Met Phe His Asp Glu Ile Asn Glu Lys 500 505 510 Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe 515 520 525 Arg Tyr Leu Glu Lys Tyr Lys Ile Leu Asn Tyr Leu Asn Arg Thr Arg 530 535 540 Phe Glu Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys 545 550 555 560 Leu Tyr Ser Arg Ile Asp Asp Leu Lys Asn Ser Leu Gly Ile Tyr Trp 565 570 575 Lys Thr Pro Lys Thr Asn Asp Asp Asn Lys Thr Lys Glu Ile Thr Asp 580 585 590 Ala Gln Ile Tyr Leu Leu Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn 595 600 605 Tyr Phe Met Ser Asn Asn Gly Asn Phe Phe Glu Ile Thr Lys Glu Ile 610 615 620 Ile Glu Leu Asn Lys Asn Asp Lys Arg Asn Leu Lys Thr Gly Phe Tyr 625 630 635 640 Lys Leu Gln Lys Phe Glu Asn Leu Gln Glu Lys Thr Pro Lys Glu Tyr 645 650 655 Leu Ala Asn Ile Gln Ser Leu Tyr Met Ile Asn Ala Gly Asn Gln Asp 660 665 670 Glu Glu Glu Lys Asp Thr Tyr Ile Asp Phe Ile Gln Lys Ile Phe Leu 675 680 685 Lys Gly Phe Met Thr Tyr Leu Ala Asn Asn Gly Arg Leu Ser Leu Ile 690 695 700 Tyr Ile Gly Ser Asp Glu Glu Thr Asn Thr Ser Leu Ala Glu Lys Lys 705 710 715 720 Gln Glu Phe Asp Lys Phe Leu Lys Lys Tyr Glu Gln Asn Asn Asn Ile 725 730 735 Glu Ile Pro Tyr Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly 740 745 750 Lys Ile Leu Lys Tyr Thr Glu Arg Leu Asn Met Phe Tyr Leu Ile Leu 755 760 765 Lys Leu Leu Asn His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu 770 775 780 Lys Tyr Gln Ser Ala Asn Lys Glu Glu Ala Phe Ser Asp Gln Leu Glu 785 790 795 800 Leu Ile Asn Leu Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe 805 810 815 Glu Leu Glu Ala Asp Glu Ile Gly Lys Phe Leu Asp Phe Asn Gly Asn 820 825 830 Lys Val Lys Asp Asn Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile 835 840 845 Tyr Phe Asp Gly Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile 850 855 860 Lys Lys Tyr Gly Met Leu Asn Leu Leu Glu Lys Ile Ser Asp Glu Ala 865 870 875 880 Lys Tyr Lys Ile Ser Ile Glu Glu Leu Lys Asn Tyr Ser Lys Lys Lys 885 890 895 Asn Glu Ile Glu Glu Asn His Thr Thr Gln Glu Asn Leu His Arg Lys 900 905 910 Tyr Ala Arg Pro Arg Lys Asp Glu Lys Phe Thr Asp Glu Asp Tyr Lys 915 920 925 Lys Tyr Glu Lys Ala Ile Arg Asn Ile Gln Gln Tyr Thr His Leu Lys 930 935 940 Asn Lys Val Glu Phe Asn Glu Leu Asn Leu Leu Gln Ser Leu Leu Leu 945 950 955 960 Arg Ile Leu His Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp 965 970 975 Leu Arg Phe Arg Leu Lys Gly Glu Phe Pro Glu Asn Gln Tyr Ile Glu 980 985 990 Glu Ile Phe Asn Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Asn Gly 995 1000 1005 Gln Ile Val Glu Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys 1010 1015 1020 Asp Asp Thr Glu Lys Ile Ser Ile Tyr Ser Asp Lys Lys Val Lys 1025 1030 1035 Glu Leu Lys Lys Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile 1040 1045 1050 Ala His Phe Asn Tyr Ile Pro Asn Ala Glu Ile Ser Leu Leu Glu 1055 1060 1065 Met Leu Glu Asn Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu 1070 1075 1080 Lys Asn Ala Ile Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr 1085 1090 1095 Gly Phe Val Val Thr Phe Lys Ile Glu Lys Asp Lys Lys Ile Arg 1100 1105 1110 Ile Glu Ser Leu Lys Ser Glu Glu Val Val His Leu Lys Lys Leu 1115 1120 1125 Lys Leu Lys Asp Asn Asp Lys Lys Lys Glu Pro Ile Lys Thr Tyr 1130 1135 1140 Arg Asn Ser Lys Glu Leu Cys Lys Leu Val Lys Val Met Phe Glu 1145 1150 1155 Tyr Lys Met Lys Glu Lys Lys Ser Glu Asn 1160 1165 <210> 88 <211> 1138 <212> PRT <213> Bacteroides ihuae <400> 88 Met Arg Ile Thr Lys Val Lys Val Lys Glu Ser Ser Asp Gln Lys Asp 1 5 10 15 Lys Met Val Leu Ile His Arg Lys Val Gly Glu Gly Thr Leu Val Leu 20 25 30 Asp Glu Asn Leu Ala Asp Leu Thr Ala Pro Ile Ile Asp Lys Tyr Lys 35 40 45 Asp Lys Ser Phe Glu Leu Ser Leu Leu Lys Gln Thr Leu Val Ser Glu 50 55 60 Lys Glu Met Asn Ile Pro Lys Cys Asp Lys Cys Thr Ala Lys Glu Arg 65 70 75 80 Cys Leu Ser Cys Lys Gln Arg Glu Lys Arg Leu Lys Glu Val Arg Gly 85 90 95 Ala Ile Glu Lys Thr Ile Gly Ala Val Ile Ala Gly Arg Asp Ile Ile 100 105 110 Pro Arg Leu Asn Ile Phe Asn Glu Asp Glu Ile Cys Trp Leu Ile Lys 115 120 125 Pro Lys Leu Arg Asn Glu Phe Thr Phe Lys Asp Val Asn Lys Gln Val 130 135 140 Val Lys Leu Asn Leu Pro Lys Val Leu Val Glu Tyr Ser Lys Lys Asn 145 150 155 160 Asp Pro Thr Leu Phe Leu Ala Tyr Gln Gln Trp Ile Ala Ala Tyr Leu 165 170 175 Lys Asn Lys Lys Gly His Ile Lys Lys Ser Ile Leu Asn Asn Arg Val 180 185 190 Val Ile Asp Tyr Ser Asp Glu Ser Lys Leu Ser Lys Arg Lys Gln Ala 195 200 205 Leu Glu Leu Trp Gly Glu Glu Tyr Glu Thr Asn Gln Arg Ile Ala Leu 210 215 220 Glu Ser Tyr His Thr Ser Tyr Asn Ile Gly Glu Leu Val Thr Leu Leu 225 230 235 240 Pro Asn Pro Glu Glu Tyr Val Ser Asp Lys Gly Glu Ile Arg Pro Ala 245 250 255 Phe His Tyr Lys Leu Lys Asn Val Leu Gln Met His Gln Ser Thr Val 260 265 270 Phe Gly Thr Asn Glu Ile Leu Cys Ile Asn Pro Ile Phe Asn Glu Asn 275 280 285 Arg Ala Asn Ile Gln Leu Ser Ala Tyr Asn Leu Glu Val Val Lys Tyr 290 295 300 Phe Glu His Tyr Phe Pro Ile Lys Lys Lys Lys Lys Asn Leu Ser Leu 305 310 315 320 Asn Gln Ala Ile Tyr Tyr Leu Lys Val Glu Thr Leu Lys Glu Arg Leu 325 330 335 Ser Leu Gln Leu Glu Asn Ala Leu Arg Met Asn Leu Leu Gln Lys Gly 340 345 350 Lys Ile Lys Lys His Glu Phe Asp Lys Asn Thr Cys Ser Asn Thr Leu 355 360 365 Ser Gln Ile Lys Arg Asp Glu Phe Phe Val Leu Asn Leu Val Glu Met 370 375 380 Cys Ala Phe Ala Ala Asn Asn Ile Arg Asn Ile Val Asp Lys Glu Gln 385 390 395 400 Val Asn Glu Ile Leu Ser Lys Lys Asp Leu Cys Asn Ser Leu Ser Lys 405 410 415 Asn Thr Ile Asp Lys Glu Leu Cys Thr Lys Phe Tyr Gly Ala Asp Phe 420 425 430 Ser Gln Ile Pro Val Ala Ile Trp Ala Met Arg Gly Ser Val Gln Gln 435 440 445 Ile Arg Asn Glu Ile Val His Tyr Lys Ala Glu Ala Ile Asp Lys Ile 450 455 460 Phe Ala Leu Lys Thr Phe Glu Tyr Asp Asp Met Glu Lys Asp Tyr Ser 465 470 475 480 Asp Thr Pro Phe Lys Gln Tyr Leu Glu Leu Ser Ile Glu Lys Ile Asp 485 490 495 Ser Phe Phe Ile Glu Gln Leu Ser Ser Asn Asp Val Leu Asn Tyr Tyr 500 505 510 Cys Thr Glu Asp Val Asn Lys Leu Leu Asn Lys Cys Lys Leu Ser Leu 515 520 525 Arg Arg Thr Ser Ile Pro Phe Ala Pro Gly Phe Lys Thr Ile Tyr Glu 530 535 540 Leu Gly Cys His Leu Gln Asp Ser Ser Asn Thr Tyr Arg Ile Gly His 545 550 555 560 Tyr Leu Met Leu Ile Gly Gly Arg Val Ala Asn Ser Thr Val Thr Lys 565 570 575 Ala Ser Lys Ala Tyr Pro Ala Tyr Arg Phe Met Leu Lys Leu Ile Tyr 580 585 590 Asn His Leu Phe Leu Asn Lys Phe Leu Asp Asn His Asn Lys Arg Phe 595 600 605 Phe Met Lys Ala Val Ala Phe Val Leu Lys Asp Asn Arg Glu Asn Ala 610 615 620 Arg Asn Lys Phe Gln Tyr Ala Phe Lys Glu Ile Arg Met Met Asn Asn 625 630 635 640 Asp Glu Ser Ile Ala Ser Tyr Met Ser Tyr Ile His Ser Leu Ser Val 645 650 655 Gln Glu Gln Glu Lys Lys Gly Asp Lys Asn Asp Lys Val Arg Tyr Asn 660 665 670 Thr Glu Lys Phe Ile Glu Lys Val Phe Val Lys Gly Phe Asp Asp Phe 675 680 685 Leu Ser Trp Leu Gly Val Glu Phe Ile Leu Ser Pro Asn Gln Glu Glu 690 695 700 Arg Asp Lys Thr Val Thr Arg Glu Glu Tyr Glu Asn Leu Met Ile Lys 705 710 715 720 Asp Arg Val Glu His Ser Ile Asn Ser Asn Gln Glu Ser His Ile Ala 725 730 735 Phe Phe Thr Phe Cys Lys Leu Leu Asp Ala Asn His Leu Ser Asp Leu 740 745 750 Arg Asn Glu Trp Ile Lys Phe Arg Ser Ser Gly Asp Lys Glu Gly Phe 755 760 765 Ser Tyr Asn Phe Ala Ile Asp Ile Ile Glu Leu Cys Leu Leu Thr Val 770 775 780 Asp Arg Val Glu Gln Arg Arg Asp Gly Tyr Lys Glu Gln Thr Glu Leu 785 790 795 800 Lys Glu Tyr Leu Ser Phe Phe Ile Lys Gly Asn Glu Ser Glu Asn Thr 805 810 815 Val Trp Lys Gly Phe Tyr Phe Gln Gln Asp Asn Tyr Thr Pro Val Leu 820 825 830 Tyr Ser Pro Ile Glu Leu Ile Arg Lys Tyr Gly Thr Leu Glu Leu Leu 835 840 845 Lys Leu Ile Ile Val Asp Glu Asp Lys Ile Thr Gln Gly Glu Phe Glu 850 855 860 Glu Trp Gln Thr Leu Lys Lys Val Val Glu Asp Lys Val Thr Arg Arg 865 870 875 880 Asn Glu Leu His Gln Glu Trp Glu Asp Met Lys Asn Lys Ser Ser Phe 885 890 895 Ser Gln Glu Lys Cys Ser Ile Tyr Gln Lys Leu Cys Arg Asp Ile Asp 900 905 910 Arg Tyr Asn Trp Leu Asp Asn Lys Leu His Leu Val His Leu Arg Lys 915 920 925 Leu His Asn Leu Val Ile Gln Ile Leu Ser Arg Met Ala Arg Phe Ile 930 935 940 Ala Leu Trp Asp Arg Asp Phe Val Leu Leu Asp Ala Ser Arg Ala Asn 945 950 955 960 Asp Asp Tyr Lys Leu Leu Ser Phe Phe Asn Phe Arg Asp Phe Ile Asn 965 970 975 Ala Lys Lys Thr Lys Thr Asp Asp Glu Leu Leu Ala Glu Phe Gly Ser 980 985 990 Lys Ile Glu Lys Lys Asn Ala Pro Phe Ile Lys Ala Glu Asp Val Pro 995 1000 1005 Leu Met Val Glu Cys Ile Glu Ala Lys Arg Ser Phe Tyr Gln Lys 1010 1015 1020 Val Phe Phe Arg Asn Asn Leu Gln Val Leu Ala Asp Arg Asn Phe 1025 1030 1035 Ile Ala His Tyr Asn Tyr Ile Ser Lys Thr Ala Lys Cys Ser Leu 1040 1045 1050 Phe Glu Met Ile Ile Lys Leu Arg Thr Leu Met Tyr Tyr Asp Arg 1055 1060 1065 Lys Leu Arg Asn Ala Val Val Lys Ser Ile Ala Asn Val Phe Asp 1070 1075 1080 Gln Asn Gly Met Val Leu Gln Leu Ser Leu Asp Asp Ser His Glu 1085 1090 1095 Leu Lys Val Asp Lys Val Ile Ser Lys Arg Ile Val His Leu Lys 1100 1105 1110 Asn Asn Asn Ile Met Thr Asp Gln Val Pro Glu Glu Tyr Tyr Lys 1115 1120 1125 Ile Cys Arg Arg Leu Leu Glu Met Lys Lys 1130 1135 <210> 89 <211> 697 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Porphyromonadaceae bacterium sequence" <400> 89 Met Glu Phe Arg Asp Ser Ile Phe Lys Ser Leu Leu Gln Lys Glu Ile 1 5 10 15 Glu Lys Ala Pro Leu Cys Phe Ala Glu Lys Leu Ile Ser Gly Gly Val 20 25 30 Phe Ser Tyr Tyr Pro Ser Glu Arg Leu Lys Glu Phe Val Gly Asn His 35 40 45 Pro Phe Ser Leu Phe Arg Lys Thr Met Pro Phe Ser Pro Gly Phe Lys 50 55 60 Arg Val Met Lys Ser Gly Gly Asn Tyr Gln Asn Ala Asn Arg Asp Gly 65 70 75 80 Arg Phe Tyr Asp Leu Asp Ile Gly Val Tyr Leu Pro Lys Asp Gly Phe 85 90 95 Gly Asp Glu Glu Trp Asn Ala Arg Tyr Phe Leu Met Lys Leu Ile Tyr 100 105 110 Asn Gln Leu Phe Leu Pro Tyr Phe Ala Asp Ala Glu Asn His Leu Phe 115 120 125 Arg Glu Cys Val Asp Phe Val Lys Arg Val Asn Arg Asp Tyr Asn Cys 130 135 140 Lys Asn Asn Asn Ser Glu Glu Gln Ala Phe Ile Asp Ile Arg Ser Met 145 150 155 160 Arg Glu Asp Glu Ser Ile Ala Asp Tyr Leu Ala Phe Ile Gln Ser Asn 165 170 175 Ile Ile Ile Glu Glu Asn Lys Lys Lys Glu Thr Asn Lys Glu Gly Gln 180 185 190 Ile Asn Phe Asn Lys Phe Leu Leu Gln Val Phe Val Lys Gly Phe Asp 195 200 205 Ser Phe Leu Lys Asp Arg Thr Glu Leu Asn Phe Leu Gln Leu Pro Glu 210 215 220 Leu Gln Gly Asp Gly Thr Arg Gly Asp Asp Leu Glu Ser Leu Asp Lys 225 230 235 240 Leu Gly Ala Val Val Ala Val Asp Leu Lys Leu Asp Ala Thr Gly Ile 245 250 255 Asp Ala Asp Leu Asn Glu Asn Ile Ser Phe Tyr Thr Phe Cys Lys Leu 260 265 270 Leu Asp Ser Asn His Leu Ser Arg Leu Arg Asn Glu Ile Ile Lys Tyr 275 280 285 Gln Ser Ala Asn Ser Asp Phe Ser His Asn Glu Asp Phe Asp Tyr Asp 290 295 300 Arg Ile Ile Ser Ile Ile Glu Leu Cys Met Leu Ser Ala Asp His Val 305 310 315 320 Ser Thr Asn Asp Asn Glu Ser Ile Phe Pro Asn Asn Asp Lys Asp Phe 325 330 335 Ser Gly Ile Arg Pro Tyr Leu Ser Thr Asp Ala Lys Val Glu Thr Phe 340 345 350 Glu Asp Leu Tyr Val His Ser Asp Ala Lys Thr Pro Ile Thr Asn Ala 355 360 365 Thr Met Val Leu Asn Trp Lys Tyr Gly Thr Asp Lys Leu Phe Glu Arg 370 375 380 Leu Met Ile Ser Asp Gln Asp Phe Leu Val Thr Glu Lys Asp Tyr Phe 385 390 395 400 Val Trp Lys Glu Leu Lys Lys Asp Ile Glu Glu Lys Ile Lys Leu Arg 405 410 415 Glu Glu Leu His Ser Leu Trp Val Asn Thr Pro Lys Gly Lys Lys Gly 420 425 430 Ala Lys Lys Lys Asn Gly Arg Glu Thr Thr Gly Glu Phe Ser Glu Glu 435 440 445 Asn Lys Lys Glu Tyr Leu Glu Val Cys Arg Glu Ile Asp Arg Tyr Val 450 455 460 Asn Leu Asp Asn Lys Leu His Phe Val His Leu Lys Arg Met His Ser 465 470 475 480 Leu Leu Ile Glu Leu Leu Gly Arg Phe Val Gly Phe Thr Tyr Leu Phe 485 490 495 Glu Arg Asp Tyr Gln Tyr Tyr His Leu Glu Ile Arg Ser Arg Arg Asn 500 505 510 Lys Asp Ala Gly Val Val Asp Lys Leu Glu Tyr Asn Lys Ile Lys Asp 515 520 525 Gln Asn Lys Tyr Asp Lys Asp Asp Phe Phe Ala Cys Thr Phe Leu Tyr 530 535 540 Glu Lys Ala Asn Lys Val Arg Asn Phe Ile Ala His Phe Asn Tyr Leu 545 550 555 560 Thr Met Trp Asn Ser Pro Gln Glu Glu Glu His Asn Ser Asn Leu Ser 565 570 575 Gly Ala Lys Asn Ser Ser Gly Arg Gln Asn Leu Lys Cys Ser Leu Thr 580 585 590 Glu Leu Ile Asn Glu Leu Arg Glu Val Met Ser Tyr Asp Arg Lys Leu 595 600 605 Lys Asn Ala Val Thr Lys Ala Val Ile Asp Leu Phe Asp Lys His Gly 610 615 620 Met Val Ile Lys Phe Arg Ile Val Asn Asn Asn Asn Asn Asp Asn Lys 625 630 635 640 Asn Lys His His Leu Glu Leu Asp Asp Ile Val Pro Lys Lys Ile Met 645 650 655 His Leu Arg Gly Ile Lys Leu Lys Arg Gln Asp Gly Lys Pro Ile Pro 660 665 670 Ile Gln Thr Asp Ser Val Asp Pro Leu Tyr Cys Arg Met Trp Lys Lys 675 680 685 Leu Leu Asp Leu Lys Pro Thr Pro Phe 690 695 <210> 90 <211> 204 <212> PRT <213> Listeria riparia <400> 90 Met His Asp Ala Trp Ala Glu Asn Pro Lys Lys Pro Gln Ser Asp Ala 1 5 10 15 Phe Leu Lys Glu Tyr Lys Ala Cys Cys Glu Ala Ile Asp Thr Tyr Asn 20 25 30 Trp His Lys Asn Lys Ala Thr Leu Val Tyr Val Asn Glu Leu His His 35 40 45 Leu Leu Ile Asp Ile Leu Gly Arg Leu Val Gly Tyr Val Ala Ile Ala 50 55 60 Asp Arg Asp Phe Gln Cys Met Ala Asn Gln Tyr Leu Lys Ser Ser Gly 65 70 75 80 His Thr Glu Arg Val Asp Ser Trp Ile Asn Thr Ile Arg Lys Asn Arg 85 90 95 Pro Asp Tyr Ile Glu Lys Leu Asp Ile Phe Met Asn Lys Ala Gly Leu 100 105 110 Phe Val Ser Glu Lys Asn Gly Arg Asn Tyr Ile Ala His Leu Asn Tyr 115 120 125 Leu Ser Pro Lys His Lys Tyr Ser Leu Leu Tyr Leu Phe Glu Lys Leu 130 135 140 Arg Glu Met Leu Lys Tyr Asp Arg Lys Leu Lys Asn Ala Val Thr Lys 145 150 155 160 Ser Leu Ile Asp Leu Leu Asp Lys His Gly Met Cys Val Val Phe Ala 165 170 175 Asn Leu Lys Asn Asn Lys His Arg Leu Val Ile Ala Ser Leu Lys Pro 180 185 190 Lys Lys Ile Glu Thr Phe Lys Trp Lys Lys Ile Lys 195 200 <210> 91 <211> 1082 <212> PRT <213> Insolitispirillum peregrinum <400> 91 Met Arg Ile Ile Arg Pro Tyr Gly Ser Ser Thr Val Ala Ser Pro Ser 1 5 10 15 Pro Gln Asp Ala Gln Pro Leu Arg Ser Leu Gln Arg Gln Asn Gly Thr 20 25 30 Phe Asp Val Ala Glu Phe Ser Arg Arg His Pro Glu Leu Val Leu Ala 35 40 45 Gln Trp Val Ala Met Leu Asp Lys Ile Ile Arg Lys Pro Ala Pro Gly 50 55 60 Lys Asn Ser Thr Ala Leu Pro Arg Pro Thr Ala Glu Gln Arg Arg Leu 65 70 75 80 Arg Gln Gln Val Gly Ala Ala Leu Trp Ala Glu Met Gln Arg His Thr 85 90 95 Pro Val Pro Pro Glu Leu Lys Ala Val Trp Asp Ser Lys Val His Pro 100 105 110 Tyr Ser Lys Asp Asn Ala Pro Ala Thr Ala Lys Thr Pro Ser His Arg 115 120 125 Gly Arg Trp Tyr Asp Arg Phe Gly Asp Pro Glu Thr Ser Ala Ala Thr 130 135 140 Val Ala Glu Gly Val Arg Arg His Leu Leu Asp Ser Ala Gln Pro Phe 145 150 155 160 Arg Ala Asn Gly Gly Gln Pro Lys Gly Lys Gly Val Ile Glu His Arg 165 170 175 Ala Leu Thr Ile Gln Asn Gly Thr Leu Leu His His His Gln Ser Glu 180 185 190 Lys Ala Gly Pro Leu Pro Glu Asp Trp Ser Thr Tyr Arg Ala Asp Glu 195 200 205 Leu Val Ser Thr Ile Gly Lys Asp Ala Arg Trp Ile Lys Val Ala Ala 210 215 220 Ser Leu Tyr Gln His Tyr Gly Arg Ile Phe Gly Pro Thr Thr Pro Ile 225 230 235 240 Ser Glu Ala Gln Thr Arg Pro Glu Phe Val Leu His Thr Ala Val Lys 245 250 255 Ala Tyr Tyr Arg Arg Leu Phe Lys Glu Arg Lys Leu Pro Ala Glu Arg 260 265 270 Leu Glu Arg Leu Leu Pro Arg Thr Gly Glu Ala Leu Arg His Ala Val 275 280 285 Thr Val Gln His Gly Asn Arg Ser Leu Ala Asp Ala Val Arg Ile Gly 290 295 300 Lys Ile Leu His Tyr Gly Trp Leu Gln Asn Gly Glu Pro Asp Pro Trp 305 310 315 320 Pro Asp Asp Ala Ala Leu Tyr Ser Ser Arg Tyr Trp Gly Ser Asp Gly 325 330 335 Gln Thr Asp Ile Lys His Ser Glu Ala Val Ser Arg Val Trp Arg Arg 340 345 350 Ala Leu Thr Ala Ala Gln Arg Thr Leu Thr Ser Trp Leu Tyr Pro Ala 355 360 365 Gly Thr Asp Ala Gly Asp Ile Leu Leu Ile Gly Gln Lys Pro Asp Ser 370 375 380 Ile Asp Arg Asn Arg Leu Pro Leu Leu Tyr Gly Asp Ser Thr Arg His 385 390 395 400 Trp Thr Arg Ser Pro Gly Asp Val Trp Leu Phe Leu Lys Gln Thr Leu 405 410 415 Glu Asn Leu Arg Asn Ser Ser Phe His Phe Lys Thr Leu Ser Ala Phe 420 425 430 Thr Ser His Leu Asp Gly Thr Cys Glu Ser Glu Pro Ala Glu Gln Gln 435 440 445 Ala Ala Gln Ala Leu Trp Gln Asp Asp Arg Gln Gln Asp His Gln Gln 450 455 460 Val Phe Leu Ser Leu Arg Ala Leu Asp Ala Thr Thr Tyr Leu Pro Thr 465 470 475 480 Gly Pro Leu His Arg Ile Val Asn Ala Val Gln Ser Thr Asp Ala Thr 485 490 495 Leu Pro Leu Pro Arg Phe Arg Arg Val Val Thr Arg Ala Ala Asn Thr 500 505 510 Arg Leu Lys Gly Phe Pro Val Glu Pro Val Asn Arg Arg Thr Met Glu 515 520 525 Asp Asp Pro Leu Leu Arg Cys Arg Tyr Gly Val Leu Lys Leu Leu Tyr 530 535 540 Glu Arg Gly Phe Arg Ala Trp Leu Glu Thr Arg Pro Ser Ile Ala Ser 545 550 555 560 Cys Leu Asp Gln Ser Leu Lys Arg Ser Thr Lys Ala Ala Gln Thr Ile 565 570 575 Asn Gly Lys Asn Ser Pro Gln Gly Val Glu Ile Leu Ser Arg Ala Thr 580 585 590 Lys Leu Leu Gln Ala Glu Gly Gly Gly Gly His Gly Ile His Asp Leu 595 600 605 Phe Asp Arg Leu Tyr Ala Ala Thr Ala Arg Glu Met Arg Val Gln Val 610 615 620 Gly Tyr His His Asp Ala Glu Ala Ala Arg Gln Gln Ala Glu Phe Ile 625 630 635 640 Glu Asp Leu Lys Cys Glu Val Val Ala Arg Ala Phe Cys Ala Tyr Leu 645 650 655 Lys Thr Leu Gly Ile Gln Gly Asp Thr Phe Arg Arg Gln Pro Glu Pro 660 665 670 Leu Pro Thr Trp Pro Asp Leu Pro Asp Leu Pro Ser Ser Thr Ile Gly 675 680 685 Thr Ala Gln Ala Ala Leu Tyr Ser Val Leu His Leu Met Pro Val Glu 690 695 700 Asp Val Gly Ser Leu Leu His Gln Leu Arg Arg Trp Leu Val Ala Leu 705 710 715 720 Gln Ala Arg Gly Gly Glu Asp Gly Thr Ala Ile Thr Ala Thr Ile Pro 725 730 735 Leu Leu Glu Leu Tyr Leu Asn Arg His Asp Ala Lys Phe Ser Gly Gly 740 745 750 Gly Ala Gly Thr Gly Leu Arg Trp Asp Asp Trp Gln Val Phe Phe Asp 755 760 765 Cys Gln Ala Thr Phe Asp Arg Val Phe Pro Pro Gly Pro Ala Leu Asp 770 775 780 Ser His Arg Leu Pro Leu Arg Gly Leu Arg Glu Val Leu Arg Phe Gly 785 790 795 800 Arg Val Asn Asp Leu Ala Ala Leu Ile Gly Gln Asp Lys Ile Thr Ala 805 810 815 Ala Glu Val Asp Arg Trp His Thr Ala Glu Gln Thr Ile Ala Ala Gln 820 825 830 Gln Gln Arg Arg Glu Ala Leu His Glu Gln Leu Ser Arg Lys Lys Gly 835 840 845 Thr Asp Ala Glu Val Asp Glu Tyr Arg Ala Leu Val Thr Ala Ile Ala 850 855 860 Asp His Arg His Leu Thr Ala His Val Thr Leu Ser Asn Val Val Arg 865 870 875 880 Leu His Arg Leu Met Thr Thr Val Leu Gly Arg Leu Val Asp Tyr Gly 885 890 895 Gly Leu Trp Glu Arg Asp Leu Thr Phe Val Thr Leu Tyr Glu Ala His 900 905 910 Arg Leu Gly Gly Leu Arg Asn Leu Leu Ser Glu Ser Arg Val Asn Lys 915 920 925 Phe Leu Asp Gly Gln Thr Pro Ala Ala Leu Ser Lys Lys Asn Asn Ala 930 935 940 Glu Glu Asn Gly Met Ile Ser Lys Val Leu Gly Asp Lys Ala Arg Arg 945 950 955 960 Gln Ile Arg Asn Asp Phe Ala His Phe Asn Met Leu Gln Gln Gly Lys 965 970 975 Lys Thr Ile Asn Leu Thr Asp Glu Ile Asn Asn Ala Arg Lys Leu Met 980 985 990 Ala His Asp Arg Lys Leu Lys Asn Ala Ile Thr Arg Ser Val Thr Thr 995 1000 1005 Leu Leu Gln Gln Asp Gly Leu Asp Ile Val Trp Thr Met Asp Ala 1010 1015 1020 Ser His Arg Leu Thr Asp Ala Lys Ile Asp Ser Arg Asn Ala Ile 1025 1030 1035 His Leu His Lys Thr His Asn Arg Ala Asn Ile Arg Glu Pro Leu 1040 1045 1050 His Gly Lys Ser Tyr Cys Arg Trp Val Ala Ala Leu Phe Gly Ala 1055 1060 1065 Thr Ser Thr Pro Ser Ala Thr Lys Lys Ser Asp Lys Ile Arg 1070 1075 1080 <210> 92 <211> 1224 <212> PRT <213> Bergeyella zoohelcum <400> 92 Met Glu Asn Lys Thr Ser Leu Gly Asn Asn Ile Tyr Tyr Asn Pro Phe 1 5 10 15 Lys Pro Gln Asp Lys Ser Tyr Phe Ala Gly Tyr Phe Asn Ala Ala Met 20 25 30 Glu Asn Thr Asp Ser Val Phe Arg Glu Leu Gly Lys Arg Leu Lys Gly 35 40 45 Lys Glu Tyr Thr Ser Glu Asn Phe Phe Asp Ala Ile Phe Lys Glu Asn 50 55 60 Ile Ser Leu Val Glu Tyr Glu Arg Tyr Val Lys Leu Leu Ser Asp Tyr 65 70 75 80 Phe Pro Met Ala Arg Leu Leu Asp Lys Lys Glu Val Pro Ile Lys Glu 85 90 95 Arg Lys Glu Asn Phe Lys Lys Asn Phe Lys Gly Ile Ile Lys Ala Val 100 105 110 Arg Asp Leu Arg Asn Phe Tyr Thr His Lys Glu His Gly Glu Val Glu 115 120 125 Ile Thr Asp Glu Ile Phe Gly Val Leu Asp Glu Met Leu Lys Ser Thr 130 135 140 Val Leu Thr Val Lys Lys Lys Lys Val Lys Thr Asp Lys Thr Lys Glu 145 150 155 160 Ile Leu Lys Lys Ser Ile Glu Lys Gln Leu Asp Ile Leu Cys Gln Lys 165 170 175 Lys Leu Glu Tyr Leu Arg Asp Thr Ala Arg Lys Ile Glu Glu Lys Arg 180 185 190 Arg Asn Gln Arg Glu Arg Gly Glu Lys Glu Leu Val Ala Pro Phe Lys 195 200 205 Tyr Ser Asp Lys Arg Asp Asp Leu Ile Ala Ala Ile Tyr Asn Asp Ala 210 215 220 Phe Asp Val Tyr Ile Asp Lys Lys Lys Asp Ser Leu Lys Glu Ser Ser 225 230 235 240 Lys Ala Lys Tyr Asn Thr Lys Ser Asp Pro Gln Gln Glu Glu Gly Asp 245 250 255 Leu Lys Ile Pro Ile Ser Lys Asn Gly Val Val Phe Leu Leu Ser Leu 260 265 270 Phe Leu Thr Lys Gln Glu Ile His Ala Phe Lys Ser Lys Ile Ala Gly 275 280 285 Phe Lys Ala Thr Val Ile Asp Glu Ala Thr Val Ser Glu Ala Thr Val 290 295 300 Ser His Gly Lys Asn Ser Ile Cys Phe Met Ala Thr His Glu Ile Phe 305 310 315 320 Ser His Leu Ala Tyr Lys Lys Leu Lys Arg Lys Val Arg Thr Ala Glu 325 330 335 Ile Asn Tyr Gly Glu Ala Glu Asn Ala Glu Gln Leu Ser Val Tyr Ala 340 345 350 Lys Glu Thr Leu Met Met Gln Met Leu Asp Glu Leu Ser Lys Val Pro 355 360 365 Asp Val Val Tyr Gln Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile 370 375 380 Glu Asp Trp Asn Glu Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr 385 390 395 400 Met Glu Glu Glu Gln Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu 405 410 415 Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln 420 425 430 Phe Pro Thr Leu Arg Phe Gln Val His Leu Gly Asn Tyr Leu His Asp 435 440 445 Ser Arg Pro Lys Glu Asn Leu Ile Ser Asp Arg Arg Ile Lys Glu Lys 450 455 460 Ile Thr Val Phe Gly Arg Leu Ser Glu Leu Glu His Lys Lys Ala Leu 465 470 475 480 Phe Ile Lys Asn Thr Glu Thr Asn Glu Asp Arg Glu His Tyr Trp Glu 485 490 495 Ile Phe Pro Asn Pro Asn Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val 500 505 510 Asn Asp Lys Asp Phe Pro Ile Ala Gly Ser Ile Leu Asp Arg Glu Lys 515 520 525 Gln Pro Val Ala Gly Lys Ile Gly Ile Lys Val Lys Leu Leu Asn Gln 530 535 540 Gln Tyr Val Ser Glu Val Asp Lys Ala Val Lys Ala His Gln Leu Lys 545 550 555 560 Gln Arg Lys Ala Ser Lys Pro Ser Ile Gln Asn Ile Ile Glu Glu Ile 565 570 575 Val Pro Ile Asn Glu Ser Asn Pro Lys Glu Ala Ile Val Phe Gly Gly 580 585 590 Gln Pro Thr Ala Tyr Leu Ser Met Asn Asp Ile His Ser Ile Leu Tyr 595 600 605 Glu Phe Phe Asp Lys Trp Glu Lys Lys Lys Glu Lys Leu Glu Lys Lys 610 615 620 Gly Glu Lys Glu Leu Arg Lys Glu Ile Gly Lys Glu Leu Glu Lys Lys 625 630 635 640 Ile Val Gly Lys Ile Gln Ala Gln Ile Gln Gln Ile Ile Asp Lys Asp 645 650 655 Thr Asn Ala Lys Ile Leu Lys Pro Tyr Gln Asp Gly Asn Ser Thr Ala 660 665 670 Ile Asp Lys Glu Lys Leu Ile Lys Asp Leu Lys Gln Glu Gln Asn Ile 675 680 685 Leu Gln Lys Leu Lys Asp Glu Gln Thr Val Arg Glu Lys Glu Tyr Asn 690 695 700 Asp Phe Ile Ala Tyr Gln Asp Lys Asn Arg Glu Ile Asn Lys Val Arg 705 710 715 720 Asp Arg Asn His Lys Gln Tyr Leu Lys Asp Asn Leu Lys Arg Lys Tyr 725 730 735 Pro Glu Ala Pro Ala Arg Lys Glu Val Leu Tyr Tyr Arg Glu Lys Gly 740 745 750 Lys Val Ala Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Thr 755 760 765 Asp Phe Lys Asn Glu Trp Lys Gly Glu Gln His Ser Leu Leu Gln Lys 770 775 780 Ser Leu Ala Tyr Tyr Glu Gln Cys Lys Glu Glu Leu Lys Asn Leu Leu 785 790 795 800 Pro Glu Lys Val Phe Gln His Leu Pro Phe Lys Leu Gly Gly Tyr Phe 805 810 815 Gln Gln Lys Tyr Leu Tyr Gln Phe Tyr Thr Cys Tyr Leu Asp Lys Arg 820 825 830 Leu Glu Tyr Ile Ser Gly Leu Val Gln Gln Ala Glu Asn Phe Lys Ser 835 840 845 Glu Asn Lys Val Phe Lys Lys Val Glu Asn Glu Cys Phe Lys Phe Leu 850 855 860 Lys Lys Gln Asn Tyr Thr His Lys Glu Leu Asp Ala Arg Val Gln Ser 865 870 875 880 Ile Leu Gly Tyr Pro Ile Phe Leu Glu Arg Gly Phe Met Asp Glu Lys 885 890 895 Pro Thr Ile Ile Lys Gly Lys Thr Phe Lys Gly Asn Glu Ala Leu Phe 900 905 910 Ala Asp Trp Phe Arg Tyr Tyr Lys Glu Tyr Gln Asn Phe Gln Thr Phe 915 920 925 Tyr Asp Thr Glu Asn Tyr Pro Leu Val Glu Leu Glu Lys Lys Gln Ala 930 935 940 Asp Arg Lys Arg Lys Thr Lys Ile Tyr Gln Gln Lys Lys Asn Asp Val 945 950 955 960 Phe Thr Leu Leu Met Ala Lys His Ile Phe Lys Ser Val Phe Lys Gln 965 970 975 Asp Ser Ile Asp Gln Phe Ser Leu Glu Asp Leu Tyr Gln Ser Arg Glu 980 985 990 Glu Arg Leu Gly Asn Gln Glu Arg Ala Arg Gln Thr Gly Glu Arg Asn 995 1000 1005 Thr Asn Tyr Ile Trp Asn Lys Thr Val Asp Leu Lys Leu Cys Asp 1010 1015 1020 Gly Lys Ile Thr Val Glu Asn Val Lys Leu Lys Asn Val Gly Asp 1025 1030 1035 Phe Ile Lys Tyr Glu Tyr Asp Gln Arg Val Gln Ala Phe Leu Lys 1040 1045 1050 Tyr Glu Glu Asn Ile Glu Trp Gln Ala Phe Leu Ile Lys Glu Ser 1055 1060 1065 Lys Glu Glu Glu Asn Tyr Pro Tyr Val Val Glu Arg Glu Ile Glu 1070 1075 1080 Gln Tyr Glu Lys Val Arg Arg Glu Glu Leu Leu Lys Glu Val His 1085 1090 1095 Leu Ile Glu Glu Tyr Ile Leu Glu Lys Val Lys Asp Lys Glu Ile 1100 1105 1110 Leu Lys Lys Gly Asp Asn Gln Asn Phe Lys Tyr Tyr Ile Leu Asn 1115 1120 1125 Gly Leu Leu Lys Gln Leu Lys Asn Glu Asp Val Glu Ser Tyr Lys 1130 1135 1140 Val Phe Asn Leu Asn Thr Glu Pro Glu Asp Val Asn Ile Asn Gln 1145 1150 1155 Leu Lys Gln Glu Ala Thr Asp Leu Glu Gln Lys Ala Phe Val Leu 1160 1165 1170 Thr Tyr Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Lys Lys 1175 1180 1185 Glu Phe Trp Asp Tyr Cys Gln Glu Lys Tyr Gly Lys Ile Glu Lys 1190 1195 1200 Glu Lys Thr Tyr Ala Glu Tyr Phe Ala Glu Val Phe Lys Lys Glu 1205 1210 1215 Lys Glu Ala Leu Ile Lys 1220 <210> 93 <211> 1126 <212> PRT <213> Prevotella intermedia <400> 93 Met Glu Asp Asp Lys Lys Thr Thr Asp Ser Ile Arg Tyr Glu Leu Lys 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Glu Glu Gly Glu Ile 35 40 45 Asn Arg Asp Gly Tyr Glu Thr Thr Leu Lys Asn Thr Trp Asn Glu Ile 50 55 60 Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile Lys His 65 70 75 80 Phe Pro Phe Leu Glu Ala Ala Thr Tyr Arg Leu Asn Pro Thr Asp Thr 85 90 95 Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu Glu Ser 100 105 110 Leu Arg Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp Leu Arg 115 120 125 Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg Pro Lys 130 135 140 Phe Glu Glu Gly Leu Leu Glu Lys Met Tyr Asn Ile Phe Asn Ala Ser 145 150 155 160 Ile Arg Leu Val Lys Glu Asp Tyr Gln Tyr Asn Lys Asp Ile Asn Pro 165 170 175 Asp Glu Asp Phe Lys His Leu Asp Arg Thr Glu Glu Glu Phe Asn Tyr 180 185 190 Tyr Phe Thr Lys Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu 195 200 205 Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Met Gln 210 215 220 Gln Lys Leu Arg Gly Phe Lys Asp Asn Arg Glu Asn Lys Lys Lys Met 225 230 235 240 Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg 245 250 255 Leu Gln Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn 260 265 270 Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Arg Glu Glu 275 280 285 Asp Arg Glu Lys Phe Arg Val Pro Ile Glu Ile Ala Asp Glu Asp Tyr 290 295 300 Asp Ala Glu Gln Glu Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp 305 310 315 320 Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe 325 330 335 Thr Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile 340 345 350 Tyr Lys Lys Gln Ile Gly Asp Tyr Lys Glu Ser His His Leu Thr His 355 360 365 Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Thr Lys Gln Asn Arg 370 375 380 Pro Asp Glu Trp Arg Lys Phe Val Lys Thr Phe Asn Ser Phe Glu Thr 385 390 395 400 Ser Lys Glu Pro Tyr Ile Pro Glu Thr Thr Pro His Tyr His Leu Glu 405 410 415 Asn Gln Lys Ile Gly Ile Arg Phe Arg Asn Asp Asn Asp Lys Ile Trp 420 425 430 Pro Ser Leu Lys Thr Asn Ser Glu Lys Asn Glu Lys Ser Lys Tyr Lys 435 440 445 Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu 450 455 460 Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu Asn Thr Asp 465 470 475 480 Asn Asp Asn Glu Ile Glu Thr Lys Lys Lys Glu Asn Lys Asn Asp Lys 485 490 495 Gln Glu Lys His Lys Ile Glu Glu Ile Ile Glu Asn Lys Ile Thr Glu 500 505 510 Ile Tyr Ala Leu Tyr Asp Thr Phe Ala Asn Gly Glu Ile Lys Ser Ile 515 520 525 Asp Glu Leu Glu Glu Tyr Cys Lys Gly Lys Asp Ile Glu Ile Gly His 530 535 540 Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Asp Glu His Lys Val Met 545 550 555 560 Ala Thr Glu Ala Glu Arg Lys Gln Glu Glu Met Leu Val Asp Val Gln 565 570 575 Lys Ser Leu Glu Ser Leu Asp Asn Gln Ile Asn Glu Glu Ile Glu Asn 580 585 590 Val Glu Arg Lys Asn Ser Ser Leu Lys Ser Gly Lys Ile Ala Ser Trp 595 600 605 Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu 610 615 620 Gly Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Leu 625 630 635 640 Leu Gln Arg Thr Leu Ala Phe Phe Gly Ser Glu His Glu Arg Leu Ala 645 650 655 Pro Tyr Phe Lys Gln Thr Lys Leu Ile Glu Ser Ser Asn Pro His Pro 660 665 670 Phe Leu Lys Asp Thr Glu Trp Glu Lys Cys Asn Asn Ile Leu Ser Phe 675 680 685 Tyr Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu Ser Leu Lys 690 695 700 Pro Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro 705 710 715 720 Lys Thr Lys Pro Lys Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn 725 730 735 Leu Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Lys 740 745 750 His Arg Glu Asn Ile Thr Val Ala Glu Leu Lys Arg Val Gly Leu Val 755 760 765 Ala Lys Val Ile Pro Leu Phe Phe Ser Glu Glu Tyr Lys Asp Ser Val 770 775 780 Gln Pro Phe Tyr Asn Tyr His Phe Asn Val Gly Asn Ile Asn Lys Pro 785 790 795 800 Asp Glu Lys Asn Phe Leu Asn Cys Glu Glu Arg Arg Glu Leu Leu Arg 805 810 815 Lys Lys Lys Asp Glu Phe Lys Lys Met Thr Asp Lys Glu Lys Glu Glu 820 825 830 Asn Pro Ser Tyr Leu Glu Phe Lys Ser Trp Asn Lys Phe Glu Arg Glu 835 840 845 Leu Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Met 850 855 860 Glu Leu Phe Asn Lys Lys Lys Ile Lys Glu Leu Asn Val Glu Lys Ile 865 870 875 880 Tyr Leu Lys Asn Ile Asn Thr Asn Thr Thr Lys Lys Glu Lys Asn Thr 885 890 895 Glu Glu Lys Asn Gly Glu Glu Lys Asn Ile Lys Glu Lys Asn Asn Ile 900 905 910 Leu Asn Arg Ile Met Pro Met Arg Leu Pro Ile Lys Val Tyr Gly Arg 915 920 925 Glu Asn Phe Ser Lys Asn Lys Lys Lys Lys Ile Arg Arg Asn Thr Phe 930 935 940 Phe Thr Val Tyr Ile Glu Glu Lys Gly Thr Lys Leu Leu Lys Gln Gly 945 950 955 960 Asn Phe Lys Ala Leu Glu Arg Asp Arg Arg Leu Gly Gly Leu Phe Ser 965 970 975 Phe Val Lys Thr Pro Ser Lys Ala Glu Ser Lys Ser Asn Thr Ile Ser 980 985 990 Lys Leu Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Lys Ala Arg Ile 995 1000 1005 Glu Ile Ile Lys Asp Met Leu Ala Leu Glu Lys Thr Leu Ile Asp 1010 1015 1020 Lys Tyr Asn Ser Leu Asp Thr Asp Asn Phe Asn Lys Met Leu Thr 1025 1030 1035 Asp Trp Leu Glu Leu Lys Gly Glu Pro Asp Lys Ala Ser Phe Gln 1040 1045 1050 Asn Asp Val Asp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His 1055 1060 1065 Asn Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn 1070 1075 1080 Pro Phe Ser Leu Ser Ser Ala Asn Thr Ser Glu Glu Lys Gly Leu 1085 1090 1095 Gly Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Thr Ile Glu 1100 1105 1110 Lys Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu 1115 1120 1125 <210> 94 <211> 1127 <212> PRT <213> Prevotella buccae <400> 94 Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile 1 5 10 15 Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Lys Glu Lys Pro 20 25 30 Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe 35 40 45 Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn 50 55 60 Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Gly 65 70 75 80 Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val 85 90 95 Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala 100 105 110 Ala Tyr Glu Met Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg 115 120 125 Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val 130 135 140 Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser 145 150 155 160 His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser 165 170 175 Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val 180 185 190 Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe 195 200 205 Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile 210 215 220 Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met 225 230 235 240 Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys 245 250 255 Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg 260 265 270 Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile 275 280 285 Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met 290 295 300 Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr 305 310 315 320 Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp 325 330 335 Ile Phe Ser Asp Asp Tyr Asn Ala Glu Glu Glu Pro Phe Lys Asn Thr 340 345 350 Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe 355 360 365 Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly 370 375 380 Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu 385 390 395 400 Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp 405 410 415 Phe Ala Pro Gln Asn Gln Pro Glu Glu Trp Arg Lys Leu Val Lys Asp 420 425 430 Leu Asp His Phe Glu Thr Ser Gln Glu Pro Tyr Ile Ser Lys Thr Ala 435 440 445 Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser 450 455 460 Ala His Asn Asn Leu Phe Pro Ser Leu Gln Thr Asp Lys Thr Cys Asn 465 470 475 480 Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe 485 490 495 Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu 500 505 510 Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile 515 520 525 Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala 530 535 540 Asn Asn Glu Ile Asn Ser Ile Ala Asp Leu Thr Arg Arg Leu Gln Asn 545 550 555 560 Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu 565 570 575 Lys Gly Arg Gln Lys Asp Met Gly Lys Glu Ala Glu Arg Lys Ile Gly 580 585 590 Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln 595 600 605 Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys 610 615 620 Ser Gly Lys Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln 625 630 635 640 Pro Val Gln Lys Asp Gln Asn Asn Ile Pro Ile Asn Asn Ser Lys Ala 645 650 655 Asn Ser Thr Glu Tyr Arg Met Leu Gln Arg Ala Leu Ala Leu Phe Gly 660 665 670 Ser Glu Asn Phe Arg Leu Lys Ala Tyr Phe Asn Gln Met Asn Leu Val 675 680 685 Gly Asn Asp Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His 690 695 700 Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys 705 710 715 720 Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His 725 730 735 Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr 740 745 750 Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro 755 760 765 Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp 770 775 780 Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro 785 790 795 800 Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp 805 810 815 Tyr Pro Phe Asn Ile Gly Asn Arg Leu Lys Pro Lys Lys Arg Gln Phe 820 825 830 Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu 835 840 845 Phe Lys Asn Tyr Pro Ser Glu Lys Lys Lys Thr Asp Leu Ala Tyr Leu 850 855 860 Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys 865 870 875 880 Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Asn Met 885 890 895 Ala Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile 900 905 910 Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile 915 920 925 Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly 930 935 940 Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr 945 950 955 960 Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp 965 970 975 Arg Arg Leu Asn Gly Leu Phe Ser Phe Ala Glu Thr Thr Asp Leu Asn 980 985 990 Leu Glu Glu His Pro Ile Ser Lys Leu Ser Val Asp Leu Glu Leu Ile 995 1000 1005 Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly 1010 1015 1020 Leu Glu Lys Lys Leu Ile Asp Lys Tyr Ser Thr Leu Pro Thr Asp 1025 1030 1035 Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn 1040 1045 1050 Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg 1055 1060 1065 Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu 1070 1075 1080 Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr 1085 1090 1095 Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val 1100 1105 1110 Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn 1115 1120 1125 <210> 95 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 95 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Val Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Phe Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asp Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Gly Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Ile Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Val Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 96 <211> 1115 <212> PRT <213> Bacteroides pyogenes <400> 96 Met Glu Ser Ile Lys Asn Ser Gln Lys Ser Thr Gly Lys Thr Leu Gln 1 5 10 15 Lys Asp Pro Pro Tyr Phe Gly Leu Tyr Leu Asn Met Ala Leu Leu Asn 20 25 30 Val Arg Lys Val Glu Asn His Ile Arg Lys Trp Leu Gly Asp Val Ala 35 40 45 Leu Leu Pro Glu Lys Ser Gly Phe His Ser Leu Leu Thr Thr Asp Asn 50 55 60 Leu Ser Ser Ala Lys Trp Thr Arg Phe Tyr Tyr Lys Ser Arg Lys Phe 65 70 75 80 Leu Pro Phe Leu Glu Met Phe Asp Ser Asp Lys Lys Ser Tyr Glu Asn 85 90 95 Arg Arg Glu Thr Ala Glu Cys Leu Asp Thr Ile Asp Arg Gln Lys Ile 100 105 110 Ser Ser Leu Leu Lys Glu Val Tyr Gly Lys Leu Gln Asp Ile Arg Asn 115 120 125 Ala Phe Ser His Tyr His Ile Asp Asp Gln Ser Val Lys His Thr Ala 130 135 140 Leu Ile Ile Ser Ser Glu Met His Arg Phe Ile Glu Asn Ala Tyr Ser 145 150 155 160 Phe Ala Leu Gln Lys Thr Arg Ala Arg Phe Thr Gly Val Phe Val Glu 165 170 175 Thr Asp Phe Leu Gln Ala Glu Glu Lys Gly Asp Asn Lys Lys Phe Phe 180 185 190 Ala Ile Gly Gly Asn Glu Gly Ile Lys Leu Lys Asp Asn Ala Leu Ile 195 200 205 Phe Leu Ile Cys Leu Phe Leu Asp Arg Glu Glu Ala Phe Lys Phe Leu 210 215 220 Ser Arg Ala Thr Gly Phe Lys Ser Thr Lys Glu Lys Gly Phe Leu Ala 225 230 235 240 Val Arg Glu Thr Phe Cys Ala Leu Cys Cys Arg Gln Pro His Glu Arg 245 250 255 Leu Leu Ser Val Asn Pro Arg Glu Ala Leu Leu Met Asp Met Leu Asn 260 265 270 Glu Leu Asn Arg Cys Pro Asp Ile Leu Phe Glu Met Leu Asp Glu Lys 275 280 285 Asp Gln Lys Ser Phe Leu Pro Leu Leu Gly Glu Glu Glu Gln Ala His 290 295 300 Ile Leu Glu Asn Ser Leu Asn Asp Glu Leu Cys Glu Ala Ile Asp Asp 305 310 315 320 Pro Phe Glu Met Ile Ala Ser Leu Ser Lys Arg Val Arg Tyr Lys Asn 325 330 335 Arg Phe Pro Tyr Leu Met Leu Arg Tyr Ile Glu Glu Lys Asn Leu Leu 340 345 350 Pro Phe Ile Arg Phe Arg Ile Asp Leu Gly Cys Leu Glu Leu Ala Ser 355 360 365 Tyr Pro Lys Lys Met Gly Glu Glu Asn Asn Tyr Glu Arg Ser Val Thr 370 375 380 Asp His Ala Met Ala Phe Gly Arg Leu Thr Asp Phe His Asn Glu Asp 385 390 395 400 Ala Val Leu Gln Gln Ile Thr Lys Gly Ile Thr Asp Glu Val Arg Phe 405 410 415 Ser Leu Tyr Ala Pro Arg Tyr Ala Ile Tyr Asn Asn Lys Ile Gly Phe 420 425 430 Val Arg Thr Ser Gly Ser Asp Lys Ile Ser Phe Pro Thr Leu Lys Lys 435 440 445 Lys Gly Gly Glu Gly His Cys Val Ala Tyr Thr Leu Gln Asn Thr Lys 450 455 460 Ser Phe Gly Phe Ile Ser Ile Tyr Asp Leu Arg Lys Ile Leu Leu Leu 465 470 475 480 Ser Phe Leu Asp Lys Asp Lys Ala Lys Asn Ile Val Ser Gly Leu Leu 485 490 495 Glu Gln Cys Glu Lys His Trp Lys Asp Leu Ser Glu Asn Leu Phe Asp 500 505 510 Ala Ile Arg Thr Glu Leu Gln Lys Glu Phe Pro Val Pro Leu Ile Arg 515 520 525 Tyr Thr Leu Pro Arg Ser Lys Gly Gly Lys Leu Val Ser Ser Lys Leu 530 535 540 Ala Asp Lys Gln Glu Lys Tyr Glu Ser Glu Phe Glu Arg Arg Lys Glu 545 550 555 560 Lys Leu Thr Glu Ile Leu Ser Glu Lys Asp Phe Asp Leu Ser Gln Ile 565 570 575 Pro Arg Arg Met Ile Asp Glu Trp Leu Asn Val Leu Pro Thr Ser Arg 580 585 590 Glu Lys Lys Leu Lys Gly Tyr Val Glu Thr Leu Lys Leu Asp Cys Arg 595 600 605 Glu Arg Leu Arg Val Phe Glu Lys Arg Glu Lys Gly Glu His Pro Leu 610 615 620 Pro Pro Arg Ile Gly Glu Met Ala Thr Asp Leu Ala Lys Asp Ile Ile 625 630 635 640 Arg Met Val Ile Asp Gln Gly Val Lys Gln Arg Ile Thr Ser Ala Tyr 645 650 655 Tyr Ser Glu Ile Gln Arg Cys Leu Ala Gln Tyr Ala Gly Asp Asp Asn 660 665 670 Arg Arg His Leu Asp Ser Ile Ile Arg Glu Leu Arg Leu Lys Asp Thr 675 680 685 Lys Asn Gly His Pro Phe Leu Gly Lys Val Leu Arg Pro Gly Leu Gly 690 695 700 His Thr Glu Lys Leu Tyr Gln Arg Tyr Phe Glu Glu Lys Lys Glu Trp 705 710 715 720 Leu Glu Ala Thr Phe Tyr Pro Ala Ala Ser Pro Lys Arg Val Pro Arg 725 730 735 Phe Val Asn Pro Pro Thr Gly Lys Gln Lys Glu Leu Pro Leu Ile Ile 740 745 750 Arg Asn Leu Met Lys Glu Arg Pro Glu Trp Arg Asp Trp Lys Gln Arg 755 760 765 Lys Asn Ser His Pro Ile Asp Leu Pro Ser Gln Leu Phe Glu Asn Glu 770 775 780 Ile Cys Arg Leu Leu Lys Asp Lys Ile Gly Lys Glu Pro Ser Gly Lys 785 790 795 800 Leu Lys Trp Asn Glu Met Phe Lys Leu Tyr Trp Asp Lys Glu Phe Pro 805 810 815 Asn Gly Met Gln Arg Phe Tyr Arg Cys Lys Arg Arg Val Glu Val Phe 820 825 830 Asp Lys Val Val Glu Tyr Glu Tyr Ser Glu Glu Gly Gly Asn Tyr Lys 835 840 845 Lys Tyr Tyr Glu Ala Leu Ile Asp Glu Val Val Arg Gln Lys Ile Ser 850 855 860 Ser Ser Lys Glu Lys Ser Lys Leu Gln Val Glu Asp Leu Thr Leu Ser 865 870 875 880 Val Arg Arg Val Phe Lys Arg Ala Ile Asn Glu Lys Glu Tyr Gln Leu 885 890 895 Arg Leu Leu Cys Glu Asp Asp Arg Leu Leu Phe Met Ala Val Arg Asp 900 905 910 Leu Tyr Asp Trp Lys Glu Ala Gln Leu Asp Leu Asp Lys Ile Asp Asn 915 920 925 Met Leu Gly Glu Pro Val Ser Val Ser Gln Val Ile Gln Leu Glu Gly 930 935 940 Gly Gln Pro Asp Ala Val Ile Lys Ala Glu Cys Lys Leu Lys Asp Val 945 950 955 960 Ser Lys Leu Met Arg Tyr Cys Tyr Asp Gly Arg Val Lys Gly Leu Met 965 970 975 Pro Tyr Phe Ala Asn His Glu Ala Thr Gln Glu Gln Val Glu Met Glu 980 985 990 Leu Arg His Tyr Glu Asp His Arg Arg Arg Val Phe Asn Trp Val Phe 995 1000 1005 Ala Leu Glu Lys Ser Val Leu Lys Asn Glu Lys Leu Arg Arg Phe 1010 1015 1020 Tyr Glu Glu Ser Gln Gly Gly Cys Glu His Arg Arg Cys Ile Asp 1025 1030 1035 Ala Leu Arg Lys Ala Ser Leu Val Ser Glu Glu Glu Tyr Glu Phe 1040 1045 1050 Leu Val His Ile Arg Asn Lys Ser Ala His Asn Gln Phe Pro Asp 1055 1060 1065 Leu Glu Ile Gly Lys Leu Pro Pro Asn Val Thr Ser Gly Phe Cys 1070 1075 1080 Glu Cys Ile Trp Ser Lys Tyr Lys Ala Ile Ile Cys Arg Ile Ile 1085 1090 1095 Pro Phe Ile Asp Pro Glu Arg Arg Phe Phe Gly Lys Leu Leu Glu 1100 1105 1110 Gln Lys 1115 <210> 97 <211> 953 <212> PRT <213> Alistipes sp. <400> 97 Met Ser Asn Glu Ile Gly Ala Phe Arg Glu His Gln Phe Ala Tyr Ala 1 5 10 15 Pro Gly Asn Glu Lys Gln Glu Glu Ala Thr Phe Ala Thr Tyr Phe Asn 20 25 30 Leu Ala Leu Ser Asn Val Glu Gly Met Met Phe Gly Glu Val Glu Ser 35 40 45 Asn Pro Asp Lys Ile Glu Lys Ser Leu Asp Thr Leu Pro Pro Ala Ile 50 55 60 Leu Arg Gln Ile Ala Ser Phe Ile Trp Leu Ser Lys Glu Asp His Pro 65 70 75 80 Asp Lys Ala Tyr Ser Thr Glu Glu Val Lys Val Ile Val Thr Asp Leu 85 90 95 Val Arg Arg Leu Cys Phe Tyr Arg Asn Tyr Phe Ser His Cys Phe Tyr 100 105 110 Leu Asp Thr Gln Tyr Phe Tyr Ser Asp Glu Leu Val Asp Thr Thr Ala 115 120 125 Ile Gly Glu Lys Leu Pro Tyr Asn Phe His His Phe Ile Thr Asn Arg 130 135 140 Leu Phe Arg Tyr Ser Leu Pro Glu Ile Thr Leu Phe Arg Trp Asn Glu 145 150 155 160 Gly Glu Arg Lys Tyr Glu Ile Leu Arg Asp Gly Leu Ile Phe Phe Cys 165 170 175 Cys Leu Phe Leu Lys Arg Gly Gln Ala Glu Arg Phe Leu Asn Glu Leu 180 185 190 Arg Phe Phe Lys Arg Thr Asp Glu Glu Gly Arg Ile Lys Arg Thr Ile 195 200 205 Phe Thr Lys Tyr Cys Thr Arg Glu Ser His Lys His Ile Gly Ile Glu 210 215 220 Glu Gln Asp Phe Leu Ile Phe Gln Asp Ile Ile Gly Asp Leu Asn Arg 225 230 235 240 Val Pro Lys Val Cys Asp Gly Val Val Asp Leu Ser Lys Glu Asn Glu 245 250 255 Arg Tyr Ile Lys Asn Arg Glu Thr Ser Asn Glu Ser Asp Glu Asn Lys 260 265 270 Ala Arg Tyr Arg Leu Leu Ile Arg Glu Lys Asp Lys Phe Pro Tyr Tyr 275 280 285 Leu Met Arg Tyr Ile Val Asp Phe Gly Val Leu Pro Cys Ile Thr Phe 290 295 300 Lys Gln Asn Asp Tyr Ser Thr Lys Glu Gly Arg Gly Gln Phe His Tyr 305 310 315 320 Gln Asp Ala Ala Val Ala Gln Glu Glu Arg Cys Tyr Asn Phe Val Val 325 330 335 Arg Asn Gly Asn Val Tyr Tyr Ser Tyr Met Pro Gln Ala Gln Asn Val 340 345 350 Val Arg Ile Ser Glu Leu Gln Gly Thr Ile Ser Val Glu Glu Leu Arg 355 360 365 Asn Met Val Tyr Ala Ser Ile Asn Gly Lys Asp Val Asn Lys Ser Val 370 375 380 Glu Gln Tyr Leu Tyr His Leu His Leu Leu Tyr Glu Lys Ile Leu Thr 385 390 395 400 Ile Ser Gly Gln Thr Ile Lys Glu Gly Arg Val Asp Val Glu Asp Tyr 405 410 415 Arg Pro Leu Leu Asp Lys Leu Leu Leu Arg Pro Ala Ser Asn Gly Glu 420 425 430 Glu Leu Arg Arg Glu Leu Arg Lys Leu Leu Pro Lys Arg Val Cys Asp 435 440 445 Leu Leu Ser Asn Arg Phe Asp Cys Ser Glu Gly Val Ser Ala Val Glu 450 455 460 Lys Arg Leu Lys Ala Ile Leu Leu Arg His Glu Gln Leu Leu Leu Ser 465 470 475 480 Gln Asn Pro Ala Leu His Ile Asp Lys Ile Lys Ser Val Ile Asp Tyr 485 490 495 Leu Tyr Leu Phe Phe Ser Asp Asp Glu Lys Phe Arg Gln Gln Pro Thr 500 505 510 Glu Lys Ala His Arg Gly Leu Lys Asp Glu Glu Phe Gln Met Tyr His 515 520 525 Tyr Leu Val Gly Asp Tyr Asp Ser His Pro Leu Ala Leu Trp Lys Glu 530 535 540 Leu Glu Ala Ser Gly Arg Leu Lys Pro Glu Met Arg Lys Leu Thr Ser 545 550 555 560 Ala Thr Ser Leu His Gly Leu Tyr Met Leu Cys Leu Lys Gly Thr Val 565 570 575 Glu Trp Cys Arg Lys Gln Leu Met Ser Ile Gly Lys Gly Thr Ala Lys 580 585 590 Val Glu Ala Ile Ala Asp Arg Val Gly Leu Lys Leu Tyr Asp Lys Leu 595 600 605 Lys Glu Tyr Thr Pro Glu Gln Leu Glu Arg Glu Val Lys Leu Val Val 610 615 620 Met His Gly Tyr Ala Ala Ala Ala Thr Pro Lys Pro Lys Ala Gln Ala 625 630 635 640 Ala Ile Pro Ser Lys Leu Thr Glu Leu Arg Phe Tyr Ser Phe Leu Gly 645 650 655 Lys Arg Glu Met Ser Phe Ala Ala Phe Ile Arg Gln Asp Lys Lys Ala 660 665 670 Gln Lys Leu Trp Leu Arg Asn Phe Tyr Thr Val Glu Asn Ile Lys Thr 675 680 685 Leu Gln Lys Arg Gln Ala Ala Ala Asp Ala Ala Cys Lys Lys Leu Tyr 690 695 700 Asn Leu Val Gly Glu Val Glu Arg Val His Thr Asn Asp Lys Val Leu 705 710 715 720 Val Leu Val Ala Gln Arg Tyr Arg Glu Arg Leu Leu Asn Val Gly Ser 725 730 735 Lys Cys Ala Val Thr Leu Asp Asn Pro Glu Arg Gln Gln Lys Leu Ala 740 745 750 Asp Val Tyr Glu Val Gln Asn Ala Trp Leu Ser Ile Arg Phe Asp Asp 755 760 765 Leu Asp Phe Thr Leu Thr His Val Asn Leu Ser Asn Leu Arg Lys Ala 770 775 780 Tyr Asn Leu Ile Pro Arg Lys His Ile Leu Ala Phe Lys Glu Tyr Leu 785 790 795 800 Asp Asn Arg Val Lys Gln Lys Leu Cys Glu Glu Cys Arg Asn Val Arg 805 810 815 Arg Lys Glu Asp Leu Cys Thr Cys Cys Ser Pro Arg Tyr Ser Asn Leu 820 825 830 Thr Ser Trp Leu Lys Glu Asn His Ser Glu Ser Ser Ile Glu Arg Glu 835 840 845 Ala Ala Thr Met Met Leu Leu Asp Val Glu Arg Lys Leu Leu Ser Phe 850 855 860 Leu Leu Asp Glu Arg Arg Lys Ala Ile Ile Glu Tyr Gly Lys Phe Ile 865 870 875 880 Pro Phe Ser Ala Leu Val Lys Glu Cys Arg Leu Ala Asp Ala Gly Leu 885 890 895 Cys Gly Ile Arg Asn Asp Val Leu His Asp Asn Val Ile Ser Tyr Ala 900 905 910 Asp Ala Ile Gly Lys Leu Ser Ala Tyr Phe Pro Lys Glu Ala Ser Glu 915 920 925 Ala Val Glu Tyr Ile Arg Arg Thr Lys Glu Val Arg Glu Gln Arg Arg 930 935 940 Glu Glu Leu Met Ala Asn Ser Ser Gln 945 950 <210> 98 <211> 1322 <212> PRT <213> Prevotella sp. <400> 98 Met Ser Lys Glu Cys Lys Lys Gln Arg Gln Glu Lys Lys Arg Arg Leu 1 5 10 15 Gln Lys Ala Asn Phe Ser Ile Ser Leu Thr Gly Lys His Val Phe Gly 20 25 30 Ala Tyr Phe Asn Met Ala Arg Thr Asn Phe Val Lys Thr Ile Asn Tyr 35 40 45 Ile Leu Pro Ile Ala Gly Val Arg Gly Asn Tyr Ser Glu Asn Gln Ile 50 55 60 Asn Lys Met Leu His Ala Leu Phe Leu Ile Gln Ala Gly Arg Asn Glu 65 70 75 80 Glu Leu Thr Thr Glu Gln Lys Gln Trp Glu Lys Lys Leu Arg Leu Asn 85 90 95 Pro Glu Gln Gln Thr Lys Phe Gln Lys Leu Leu Phe Lys His Phe Pro 100 105 110 Val Leu Gly Pro Met Met Ala Asp Val Ala Asp His Lys Ala Tyr Leu 115 120 125 Asn Lys Lys Lys Ser Thr Val Gln Thr Glu Asp Glu Thr Phe Ala Met 130 135 140 Leu Lys Gly Val Ser Leu Ala Asp Cys Leu Asp Ile Ile Cys Leu Met 145 150 155 160 Ala Asp Thr Leu Thr Glu Cys Arg Asn Phe Tyr Thr His Lys Asp Pro 165 170 175 Tyr Asn Lys Pro Ser Gln Leu Ala Asp Gln Tyr Leu His Gln Glu Met 180 185 190 Ile Ala Lys Lys Leu Asp Lys Val Val Val Ala Ser Arg Arg Ile Leu 195 200 205 Lys Asp Arg Glu Gly Leu Ser Val Asn Glu Val Glu Phe Leu Thr Gly 210 215 220 Ile Asp His Leu His Gln Glu Val Leu Lys Asp Glu Phe Gly Asn Ala 225 230 235 240 Lys Val Lys Asp Gly Lys Val Met Lys Thr Phe Val Glu Tyr Asp Asp 245 250 255 Phe Tyr Phe Lys Ile Ser Gly Lys Arg Leu Val Asn Gly Tyr Thr Val 260 265 270 Thr Thr Lys Asp Asp Lys Pro Val Asn Val Asn Thr Met Leu Pro Ala 275 280 285 Leu Ser Asp Phe Gly Leu Leu Tyr Phe Cys Val Leu Phe Leu Ser Lys 290 295 300 Pro Tyr Ala Lys Leu Phe Ile Asp Glu Val Arg Leu Phe Glu Tyr Ser 305 310 315 320 Pro Phe Asp Asp Lys Glu Asn Met Ile Met Ser Glu Met Leu Ser Ile 325 330 335 Tyr Arg Ile Arg Thr Pro Arg Leu His Lys Ile Asp Ser His Asp Ser 340 345 350 Lys Ala Thr Leu Ala Met Asp Ile Phe Gly Glu Leu Arg Arg Cys Pro 355 360 365 Met Glu Leu Tyr Asn Leu Leu Asp Lys Asn Ala Gly Gln Pro Phe Phe 370 375 380 His Asp Glu Val Lys His Pro Asn Ser His Thr Pro Asp Val Ser Lys 385 390 395 400 Arg Leu Arg Tyr Asp Asp Arg Phe Pro Thr Leu Ala Leu Arg Tyr Ile 405 410 415 Asp Glu Thr Glu Leu Phe Lys Arg Ile Arg Phe Gln Leu Gln Leu Gly 420 425 430 Ser Phe Arg Tyr Lys Phe Tyr Asp Lys Glu Asn Cys Ile Asp Gly Arg 435 440 445 Val Arg Val Arg Arg Ile Gln Lys Glu Ile Asn Gly Tyr Gly Arg Met 450 455 460 Gln Glu Val Ala Asp Lys Arg Met Asp Lys Trp Gly Asp Leu Ile Gln 465 470 475 480 Lys Arg Glu Glu Arg Ser Val Lys Leu Glu His Glu Glu Leu Tyr Ile 485 490 495 Asn Leu Asp Gln Phe Leu Glu Asp Thr Ala Asp Ser Thr Pro Tyr Val 500 505 510 Thr Asp Arg Arg Pro Ala Tyr Asn Ile His Ala Asn Arg Ile Gly Leu 515 520 525 Tyr Trp Glu Asp Ser Gln Asn Pro Lys Gln Tyr Lys Val Phe Asp Glu 530 535 540 Asn Gly Met Tyr Ile Pro Glu Leu Val Val Thr Glu Asp Lys Lys Ala 545 550 555 560 Pro Ile Lys Met Pro Ala Pro Arg Cys Ala Leu Ser Val Tyr Asp Leu 565 570 575 Pro Ala Met Leu Phe Tyr Glu Tyr Leu Arg Glu Gln Gln Asp Asn Glu 580 585 590 Phe Pro Ser Ala Glu Gln Val Ile Ile Glu Tyr Glu Asp Asp Tyr Arg 595 600 605 Lys Phe Phe Lys Ala Val Ala Glu Gly Lys Leu Lys Pro Phe Lys Arg 610 615 620 Pro Lys Glu Phe Arg Asp Phe Leu Lys Lys Glu Tyr Pro Lys Leu Arg 625 630 635 640 Met Ala Asp Ile Pro Lys Lys Leu Gln Leu Phe Leu Cys Ser His Gly 645 650 655 Leu Cys Tyr Asn Asn Lys Pro Glu Thr Val Tyr Glu Arg Leu Asp Arg 660 665 670 Leu Thr Leu Gln His Leu Glu Glu Arg Glu Leu His Ile Gln Asn Arg 675 680 685 Leu Glu His Tyr Gln Lys Asp Arg Asp Met Ile Gly Asn Lys Asp Asn 690 695 700 Gln Tyr Gly Lys Lys Ser Phe Ser Asp Val Arg His Gly Ala Leu Ala 705 710 715 720 Arg Tyr Leu Ala Gln Ser Met Met Glu Trp Gln Pro Thr Lys Leu Lys 725 730 735 Asp Lys Glu Lys Gly His Asp Lys Leu Thr Gly Leu Asn Tyr Asn Val 740 745 750 Leu Thr Ala Tyr Leu Ala Thr Tyr Gly His Pro Gln Val Pro Glu Glu 755 760 765 Gly Phe Thr Pro Arg Thr Leu Glu Gln Val Leu Ile Asn Ala His Leu 770 775 780 Ile Gly Gly Ser Asn Pro His Pro Phe Ile Asn Lys Val Leu Ala Leu 785 790 795 800 Gly Asn Arg Asn Ile Glu Glu Leu Tyr Leu His Tyr Leu Glu Glu Glu 805 810 815 Leu Lys His Ile Arg Ser Arg Ile Gln Ser Leu Ser Ser Asn Pro Ser 820 825 830 Asp Lys Ala Leu Ser Ala Leu Pro Phe Ile His His Asp Arg Met Arg 835 840 845 Tyr His Glu Arg Thr Ser Glu Glu Met Met Ala Leu Ala Ala Arg Tyr 850 855 860 Thr Thr Ile Gln Leu Pro Asp Gly Leu Phe Thr Pro Tyr Ile Leu Glu 865 870 875 880 Ile Leu Gln Lys His Tyr Thr Glu Asn Ser Asp Leu Gln Asn Ala Leu 885 890 895 Ser Gln Asp Val Pro Val Lys Leu Asn Pro Thr Cys Asn Ala Ala Tyr 900 905 910 Leu Ile Thr Leu Phe Tyr Gln Thr Val Leu Lys Asp Asn Ala Gln Pro 915 920 925 Phe Tyr Leu Ser Asp Lys Thr Tyr Thr Arg Asn Lys Asp Gly Glu Lys 930 935 940 Ala Glu Ser Phe Ser Phe Lys Arg Ala Tyr Glu Leu Phe Ser Val Leu 945 950 955 960 Asn Asn Asn Lys Lys Asp Thr Phe Pro Phe Glu Met Ile Pro Leu Phe 965 970 975 Leu Thr Ser Asp Glu Ile Gln Glu Arg Leu Ser Ala Lys Leu Leu Asp 980 985 990 Gly Asp Gly Asn Pro Val Pro Glu Val Gly Glu Lys Gly Lys Pro Ala 995 1000 1005 Thr Asp Ser Gln Gly Asn Thr Ile Trp Lys Arg Arg Ile Tyr Ser 1010 1015 1020 Glu Val Asp Asp Tyr Ala Glu Lys Leu Thr Asp Arg Asp Met Lys 1025 1030 1035 Ile Ser Phe Lys Gly Glu Trp Glu Lys Leu Pro Arg Trp Lys Gln 1040 1045 1050 Asp Lys Ile Ile Lys Arg Arg Asp Glu Thr Arg Arg Gln Met Arg 1055 1060 1065 Asp Glu Leu Leu Gln Arg Met Pro Arg Tyr Ile Arg Asp Ile Lys 1070 1075 1080 Asp Asn Glu Arg Thr Leu Arg Arg Tyr Lys Thr Gln Asp Met Val 1085 1090 1095 Leu Phe Leu Leu Ala Glu Lys Met Phe Thr Asn Ile Ile Ser Glu 1100 1105 1110 Gln Ser Ser Glu Phe Asn Trp Lys Gln Met Arg Leu Ser Lys Val 1115 1120 1125 Cys Asn Glu Ala Phe Leu Arg Gln Thr Leu Thr Phe Arg Val Pro 1130 1135 1140 Val Thr Val Gly Glu Thr Thr Ile Tyr Val Glu Gln Glu Asn Met 1145 1150 1155 Ser Leu Lys Asn Tyr Gly Glu Phe Tyr Arg Phe Leu Thr Asp Asp 1160 1165 1170 Arg Leu Met Ser Leu Leu Asn Asn Ile Val Glu Thr Leu Lys Pro 1175 1180 1185 Asn Glu Asn Gly Asp Leu Val Ile Arg His Thr Asp Leu Met Ser 1190 1195 1200 Glu Leu Ala Ala Tyr Asp Gln Tyr Arg Ser Thr Ile Phe Met Leu 1205 1210 1215 Ile Gln Ser Ile Glu Asn Leu Ile Ile Thr Asn Asn Ala Val Leu 1220 1225 1230 Asp Asp Pro Asp Ala Asp Gly Phe Trp Val Arg Glu Asp Leu Pro 1235 1240 1245 Lys Arg Asn Asn Phe Ala Ser Leu Leu Glu Leu Ile Asn Gln Leu 1250 1255 1260 Asn Asn Val Glu Leu Thr Asp Asp Glu Arg Lys Leu Leu Val Ala 1265 1270 1275 Ile Arg Asn Ala Phe Ser His Asn Ser Tyr Asn Ile Asp Phe Ser 1280 1285 1290 Leu Ile Lys Asp Val Lys His Leu Pro Glu Val Ala Lys Gly Ile 1295 1300 1305 Leu Gln His Leu Gln Ser Met Leu Gly Val Glu Ile Thr Lys 1310 1315 1320 <210> 99 <211> 1322 <212> PRT <213> Prevotella sp. <400> 99 Met Ser Lys Glu Cys Lys Lys Gln Arg Gln Glu Lys Lys Arg Arg Leu 1 5 10 15 Gln Lys Ala Asn Phe Ser Ile Ser Leu Thr Gly Lys His Val Phe Gly 20 25 30 Ala Tyr Phe Asn Met Ala Arg Thr Asn Phe Val Lys Thr Ile Asn Tyr 35 40 45 Ile Leu Pro Ile Ala Gly Val Arg Gly Asn Tyr Ser Glu Asn Gln Ile 50 55 60 Asn Lys Met Leu His Ala Leu Phe Leu Ile Gln Ala Gly Arg Asn Glu 65 70 75 80 Glu Leu Thr Thr Glu Gln Lys Gln Trp Glu Lys Lys Leu Arg Leu Asn 85 90 95 Pro Glu Gln Gln Thr Lys Phe Gln Lys Leu Leu Phe Lys His Phe Pro 100 105 110 Val Leu Gly Pro Met Met Ala Asp Val Ala Asp His Lys Ala Tyr Leu 115 120 125 Asn Lys Lys Lys Ser Thr Val Gln Thr Glu Asp Glu Thr Phe Ala Met 130 135 140 Leu Lys Gly Val Ser Leu Ala Asp Cys Leu Asp Ile Ile Cys Leu Met 145 150 155 160 Ala Asp Thr Leu Thr Glu Cys Arg Asn Phe Tyr Thr His Lys Asp Pro 165 170 175 Tyr Asn Lys Pro Ser Gln Leu Ala Asp Gln Tyr Leu His Gln Glu Met 180 185 190 Ile Ala Lys Lys Leu Asp Lys Val Val Val Ala Ser Arg Arg Ile Leu 195 200 205 Lys Asp Arg Glu Gly Leu Ser Val Asn Glu Val Glu Phe Leu Thr Gly 210 215 220 Ile Asp His Leu His Gln Glu Val Leu Lys Asp Glu Phe Gly Asn Ala 225 230 235 240 Lys Val Lys Asp Gly Lys Val Met Lys Thr Phe Val Glu Tyr Asp Asp 245 250 255 Phe Tyr Phe Lys Ile Ser Gly Lys Arg Leu Val Asn Gly Tyr Thr Val 260 265 270 Thr Thr Lys Asp Asp Lys Pro Val Asn Val Asn Thr Met Leu Pro Ala 275 280 285 Leu Ser Asp Phe Gly Leu Leu Tyr Phe Cys Val Leu Phe Leu Ser Lys 290 295 300 Pro Tyr Ala Lys Leu Phe Ile Asp Glu Val Arg Leu Phe Glu Tyr Ser 305 310 315 320 Pro Phe Asp Asp Lys Glu Asn Met Ile Met Ser Glu Met Leu Ser Ile 325 330 335 Tyr Arg Ile Arg Thr Pro Arg Leu His Lys Ile Asp Ser His Asp Ser 340 345 350 Lys Ala Thr Leu Ala Met Asp Ile Phe Gly Glu Leu Arg Arg Cys Pro 355 360 365 Met Glu Leu Tyr Asn Leu Leu Asp Lys Asn Ala Gly Gln Pro Phe Phe 370 375 380 His Asp Glu Val Lys His Pro Asn Ser His Thr Pro Asp Val Ser Lys 385 390 395 400 Arg Leu Arg Tyr Asp Asp Arg Phe Pro Thr Leu Ala Leu Arg Tyr Ile 405 410 415 Asp Glu Thr Glu Leu Phe Lys Arg Ile Arg Phe Gln Leu Gln Leu Gly 420 425 430 Ser Phe Arg Tyr Lys Phe Tyr Asp Lys Glu Asn Cys Ile Asp Gly Arg 435 440 445 Val Arg Val Arg Arg Ile Gln Lys Glu Ile Asn Gly Tyr Gly Arg Met 450 455 460 Gln Glu Val Ala Asp Lys Arg Met Asp Lys Trp Gly Asp Leu Ile Gln 465 470 475 480 Lys Arg Glu Glu Arg Ser Val Lys Leu Glu His Glu Glu Leu Tyr Ile 485 490 495 Asn Leu Asp Gln Phe Leu Glu Asp Thr Ala Asp Ser Thr Pro Tyr Val 500 505 510 Thr Asp Arg Arg Pro Ala Tyr Asn Ile His Ala Asn Arg Ile Gly Leu 515 520 525 Tyr Trp Glu Asp Ser Gln Asn Pro Lys Gln Tyr Lys Val Phe Asp Glu 530 535 540 Asn Gly Met Tyr Ile Pro Glu Leu Val Val Thr Glu Asp Lys Lys Ala 545 550 555 560 Pro Ile Lys Met Pro Ala Pro Arg Cys Ala Leu Ser Val Tyr Asp Leu 565 570 575 Pro Ala Met Leu Phe Tyr Glu Tyr Leu Arg Glu Gln Gln Asp Asn Glu 580 585 590 Phe Pro Ser Ala Glu Gln Val Ile Ile Glu Tyr Glu Asp Asp Tyr Arg 595 600 605 Lys Phe Phe Lys Ala Val Ala Glu Gly Lys Leu Lys Pro Phe Lys Arg 610 615 620 Pro Lys Glu Phe Arg Asp Phe Leu Lys Lys Glu Tyr Pro Lys Leu Arg 625 630 635 640 Met Ala Asp Ile Pro Lys Lys Leu Gln Leu Phe Leu Cys Ser His Gly 645 650 655 Leu Cys Tyr Asn Asn Lys Pro Glu Thr Val Tyr Glu Arg Leu Asp Arg 660 665 670 Leu Thr Leu Gln His Leu Glu Glu Arg Glu Leu His Ile Gln Asn Arg 675 680 685 Leu Glu His Tyr Gln Lys Asp Arg Asp Met Ile Gly Asn Lys Asp Asn 690 695 700 Gln Tyr Gly Lys Lys Ser Phe Ser Asp Val Arg His Gly Ala Leu Ala 705 710 715 720 Arg Tyr Leu Ala Gln Ser Met Met Glu Trp Gln Pro Thr Lys Leu Lys 725 730 735 Asp Lys Glu Lys Gly His Asp Lys Leu Thr Gly Leu Asn Tyr Asn Val 740 745 750 Leu Thr Ala Tyr Leu Ala Thr Tyr Gly His Pro Gln Val Pro Glu Glu 755 760 765 Gly Phe Thr Pro Arg Thr Leu Glu Gln Val Leu Ile Asn Ala His Leu 770 775 780 Ile Gly Gly Ser Asn Pro His Pro Phe Ile Asn Lys Val Leu Ala Leu 785 790 795 800 Gly Asn Arg Asn Ile Glu Glu Leu Tyr Leu His Tyr Leu Glu Glu Glu 805 810 815 Leu Lys His Ile Arg Ser Arg Ile Gln Ser Leu Ser Ser Asn Pro Ser 820 825 830 Asp Lys Ala Leu Ser Ala Leu Pro Phe Ile His His Asp Arg Met Arg 835 840 845 Tyr His Glu Arg Thr Ser Glu Glu Met Met Ala Leu Ala Ala Arg Tyr 850 855 860 Thr Thr Ile Gln Leu Pro Asp Gly Leu Phe Thr Pro Tyr Ile Leu Glu 865 870 875 880 Ile Leu Gln Lys His Tyr Thr Glu Asn Ser Asp Leu Gln Asn Ala Leu 885 890 895 Ser Gln Asp Val Pro Val Lys Leu Asn Pro Thr Cys Asn Ala Ala Tyr 900 905 910 Leu Ile Thr Leu Phe Tyr Gln Thr Val Leu Lys Asp Asn Ala Gln Pro 915 920 925 Phe Tyr Leu Ser Asp Lys Thr Tyr Thr Arg Asn Lys Asp Gly Glu Lys 930 935 940 Ala Glu Ser Phe Ser Phe Lys Arg Ala Tyr Glu Leu Phe Ser Val Leu 945 950 955 960 Asn Asn Asn Lys Lys Asp Thr Phe Pro Phe Glu Met Ile Pro Leu Phe 965 970 975 Leu Thr Ser Asp Glu Ile Gln Glu Arg Leu Ser Ala Lys Leu Leu Asp 980 985 990 Gly Asp Gly Asn Pro Val Pro Glu Val Gly Glu Lys Gly Lys Pro Ala 995 1000 1005 Thr Asp Ser Gln Gly Asn Thr Ile Trp Lys Arg Arg Ile Tyr Ser 1010 1015 1020 Glu Val Asp Asp Tyr Ala Glu Lys Leu Thr Asp Arg Asp Met Lys 1025 1030 1035 Ile Ser Phe Lys Gly Glu Trp Glu Lys Leu Pro Arg Trp Lys Gln 1040 1045 1050 Asp Lys Ile Ile Lys Arg Arg Asp Glu Thr Arg Arg Gln Met Arg 1055 1060 1065 Asp Glu Leu Leu Gln Arg Met Pro Arg Tyr Ile Arg Asp Ile Lys 1070 1075 1080 Asp Asn Glu Arg Thr Leu Arg Arg Tyr Lys Thr Gln Asp Met Val 1085 1090 1095 Leu Phe Leu Leu Ala Glu Lys Met Phe Thr Asn Ile Ile Ser Glu 1100 1105 1110 Gln Ser Ser Glu Phe Asn Trp Lys Gln Met Arg Leu Ser Lys Val 1115 1120 1125 Cys Asn Glu Ala Phe Leu Arg Gln Thr Leu Thr Phe Arg Val Pro 1130 1135 1140 Val Thr Val Gly Glu Thr Thr Ile Tyr Val Glu Gln Glu Asn Met 1145 1150 1155 Ser Leu Lys Asn Tyr Gly Glu Phe Tyr Arg Phe Leu Thr Asp Asp 1160 1165 1170 Arg Leu Met Ser Leu Leu Asn Asn Ile Val Glu Thr Leu Lys Pro 1175 1180 1185 Asn Glu Asn Gly Asp Leu Val Ile Arg His Thr Asp Leu Met Ser 1190 1195 1200 Glu Leu Ala Ala Tyr Asp Gln Tyr Arg Ser Thr Ile Phe Met Leu 1205 1210 1215 Ile Gln Ser Ile Glu Asn Leu Ile Ile Thr Asn Asn Ala Val Leu 1220 1225 1230 Asp Asp Pro Asp Ala Asp Gly Phe Trp Val Arg Glu Asp Leu Pro 1235 1240 1245 Lys Arg Asn Asn Phe Ala Ser Leu Leu Glu Leu Ile Asn Gln Leu 1250 1255 1260 Asn Asn Val Glu Leu Thr Asp Asp Glu Arg Lys Leu Leu Val Ala 1265 1270 1275 Ile Arg Asn Ala Phe Ser His Asn Ser Tyr Asn Ile Asp Phe Ser 1280 1285 1290 Leu Ile Lys Asp Val Lys His Leu Pro Glu Val Ala Lys Gly Ile 1295 1300 1305 Leu Gln His Leu Gln Ser Met Leu Gly Val Glu Ile Thr Lys 1310 1315 1320 <210> 100 <211> 1095 <212> PRT <213> Riemerella anatipestifer <400> 100 Met Glu Lys Pro Leu Leu Pro Asn Val Tyr Thr Leu Lys His Lys Phe 1 5 10 15 Phe Trp Gly Ala Phe Leu Asn Ile Ala Arg His Asn Ala Phe Ile Thr 20 25 30 Ile Cys His Ile Asn Glu Gln Leu Gly Leu Lys Thr Pro Ser Asn Asp 35 40 45 Asp Lys Ile Val Asp Val Val Cys Glu Thr Trp Asn Asn Ile Leu Asn 50 55 60 Asn Asp His Asp Leu Leu Lys Lys Ser Gln Leu Thr Glu Leu Ile Leu 65 70 75 80 Lys His Phe Pro Phe Leu Thr Ala Met Cys Tyr His Pro Pro Lys Lys 85 90 95 Glu Gly Lys Lys Lys Gly His Gln Lys Glu Gln Gln Lys Glu Lys Glu 100 105 110 Ser Glu Ala Gln Ser Gln Ala Glu Ala Leu Asn Pro Ser Lys Leu Ile 115 120 125 Glu Ala Leu Glu Ile Leu Val Asn Gln Leu His Ser Leu Arg Asn Tyr 130 135 140 Tyr Ser His Tyr Lys His Lys Lys Pro Asp Ala Glu Lys Asp Ile Phe 145 150 155 160 Lys His Leu Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu 165 170 175 Asp Tyr Lys Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His 180 185 190 Leu Asn Arg Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg 195 200 205 Tyr Arg Phe Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe 210 215 220 Phe Thr Asn Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys 225 230 235 240 Lys Val Ser Gly Phe Lys Ala Ser His Lys Gln Arg Glu Lys Met Thr 245 250 255 Thr Glu Val Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu 260 265 270 Glu Ser Arg Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu 275 280 285 Leu Ser Arg Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asn 290 295 300 Lys Lys His Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu 305 310 315 320 Glu Glu Gln Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg 325 330 335 Phe Pro Tyr Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys 340 345 350 Ser Ile Arg Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr 355 360 365 Asp Lys Lys Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr 370 375 380 Leu Leu Ser Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro 385 390 395 400 Gln Glu Trp Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser 405 410 415 Asn Gln Pro Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp 420 425 430 Asn Lys Ile Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser 435 440 445 Leu Glu Ile Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn 450 455 460 Ser Gly Phe Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro 465 470 475 480 Leu Met Phe Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys 485 490 495 Glu Thr Val Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu 500 505 510 Arg Ile Asn Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu 515 520 525 Pro Leu Gly Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys 530 535 540 Gln Pro Asp Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile 545 550 555 560 Ala Glu Thr Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser 565 570 575 Ser Pro Lys Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val 580 585 590 Leu Ala Asp Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala 595 600 605 Tyr Asp Ala Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr 610 615 620 Glu Phe Trp Phe Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys 625 630 635 640 Asn Arg Leu Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr 645 650 655 Asn Pro His Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn 660 665 670 Leu Val Asp Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu 675 680 685 Glu Ala Ile Lys Asn Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu 690 695 700 Leu Lys Ile Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu 705 710 715 720 Gln Gly Gly Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg 725 730 735 Glu Thr Leu Ser Glu Asp Leu Met Leu Ser Lys Pro Ile Arg Lys Glu 740 745 750 Ile Lys Lys His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu 755 760 765 Tyr Phe Lys Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu 770 775 780 Ser Tyr Lys Leu Glu Ala Lys Ala Pro Leu Leu Lys Arg Glu Glu His 785 790 795 800 Tyr Glu Tyr Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln 805 810 815 Arg Leu Glu Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr 820 825 830 Lys Arg Trp Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln 835 840 845 Asp Val Met Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe 850 855 860 Lys Glu Leu Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala 865 870 875 880 Val Asn Val Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr 885 890 895 Leu Pro Met Val Leu Pro Val Lys Val Tyr Pro Ala Thr Ala Phe Gly 900 905 910 Glu Val Gln Tyr His Lys Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu 915 920 925 Glu His Thr Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys 930 935 940 Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp 945 950 955 960 Thr Gln Lys His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu 965 970 975 Ile Tyr Gln Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu 980 985 990 Glu Glu Lys Leu Leu Asn Lys His Thr Ser Leu Ser Ser Leu Glu Asn 995 1000 1005 Glu Phe Arg Ala Leu Leu Glu Glu Trp Lys Lys Glu Tyr Ala Ala 1010 1015 1020 Ser Ser Met Val Thr Asp Glu His Ile Ala Phe Ile Ala Ser Val 1025 1030 1035 Arg Asn Ala Phe Cys His Asn Gln Tyr Pro Phe Tyr Lys Glu Ala 1040 1045 1050 Leu His Ala Pro Ile Pro Leu Phe Thr Val Ala Gln Pro Thr Thr 1055 1060 1065 Glu Glu Lys Asp Gly Leu Gly Ile Ala Glu Ala Leu Leu Lys Val 1070 1075 1080 Leu Arg Glu Tyr Cys Glu Ile Val Lys Ser Gln Ile 1085 1090 1095 <210> 101 <211> 1124 <212> PRT <213> Prevotella aurantiaca <400> 101 Met Glu Asp Asp Lys Lys Thr Thr Gly Ser Ile Ser Tyr Glu Leu Lys 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Ile Asn His Ile Asn Lys Leu Leu Glu Ile Arg Glu Ile 35 40 45 Asp Asn Asp Glu Lys Val Leu Asp Ile Lys Thr Leu Trp Gln Lys Gly 50 55 60 Asn Lys Asp Leu Asn Gln Lys Ala Arg Leu Arg Glu Leu Met Thr Lys 65 70 75 80 His Phe Pro Phe Leu Glu Thr Ala Ile Tyr Thr Lys Asn Lys Glu Asp 85 90 95 Lys Lys Glu Val Lys Gln Glu Lys Gln Ala Glu Ala Gln Ser Leu Glu 100 105 110 Ser Leu Lys Asp Cys Leu Phe Leu Phe Leu Asp Lys Leu Gln Glu Ala 115 120 125 Arg Asn Tyr Tyr Ser His Tyr Lys Tyr Ser Glu Phe Ser Lys Glu Pro 130 135 140 Glu Phe Glu Glu Gly Leu Leu Glu Lys Met Tyr Asn Ile Phe Gly Asn 145 150 155 160 Asn Ile Gln Leu Val Ile Asn Asp Tyr Gln His Asn Lys Asp Ile Asn 165 170 175 Pro Asp Glu Asp Phe Lys His Leu Asp Arg Lys Gly Gln Phe Lys Tyr 180 185 190 Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu Phe 195 200 205 Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Met Gln Gln 210 215 220 Lys Leu Asn Gly Phe Lys Asp Asn Leu Glu Asn Lys Lys Lys Met Thr 225 230 235 240 His Glu Val Phe Cys Arg Ser Arg Ile Leu Met Pro Lys Leu Arg Leu 245 250 255 Glu Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn Glu 260 265 270 Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Gln Gly Asp Asp 275 280 285 Arg Glu Lys Phe Lys Val Pro Phe Asp Pro Ala Asp Glu Asp Tyr Asn 290 295 300 Ala Glu Gln Glu Pro Phe Lys Asn Thr Leu Ile Arg His Gln Asp Arg 305 310 315 320 Phe Pro Tyr Phe Val Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe Lys 325 330 335 Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile Tyr 340 345 350 Lys Lys Leu Ile Gly Gly Gln Lys Glu Asp Arg His Leu Thr His Lys 355 360 365 Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Ala Lys Gln Asn Arg Pro 370 375 380 Asp Glu Trp Lys Ala Ile Val Lys Asp Leu Asp Thr Tyr Glu Thr Ser 385 390 395 400 Asn Lys Arg Tyr Ile Ser Glu Thr Thr Pro His Tyr His Leu Glu Asn 405 410 415 Gln Lys Ile Gly Ile Arg Phe Arg Asn Gly Asn Lys Glu Ile Trp Pro 420 425 430 Ser Leu Lys Thr Asn Asp Glu Asn Asn Glu Lys Ser Lys Tyr Lys Leu 435 440 445 Asp Lys Gln Tyr Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu Leu 450 455 460 Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Lys Glu Lys Pro Asn Asn 465 470 475 480 Asp Glu Ile Asn Ala Ser Ile Val Glu Gly Phe Ile Lys Arg Glu Ile 485 490 495 Arg Asn Ile Phe Lys Leu Tyr Asp Ala Phe Ala Asn Gly Glu Ile Asn 500 505 510 Asn Ile Asp Asp Leu Glu Lys Tyr Cys Ala Asp Lys Gly Ile Pro Lys 515 520 525 Arg His Leu Pro Lys Gln Met Val Ala Ile Leu Tyr Asp Glu His Lys 530 535 540 Asp Met Val Lys Glu Ala Lys Arg Lys Gln Lys Glu Met Val Lys Asp 545 550 555 560 Thr Lys Lys Leu Leu Ala Thr Leu Glu Lys Gln Thr Gln Lys Glu Lys 565 570 575 Glu Asp Asp Gly Arg Asn Val Lys Leu Leu Lys Ser Gly Glu Ile Ala 580 585 590 Arg Trp Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp 595 600 605 Asn Glu Gly Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr 610 615 620 Gln Met Leu Gln Arg Ser Leu Ala Leu Tyr Asn Asn Glu Glu Lys Pro 625 630 635 640 Thr Arg Tyr Phe Arg Gln Val Asn Leu Ile Glu Ser Asn Asn Pro His 645 650 655 Pro Phe Leu Lys Trp Thr Lys Trp Glu Glu Cys Asn Asn Ile Leu Thr 660 665 670 Phe Tyr Tyr Ser Tyr Leu Thr Lys Lys Ile Glu Phe Leu Asn Lys Leu 675 680 685 Lys Pro Glu Asp Trp Lys Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu 690 695 700 Pro Lys Thr Asn Arg Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe 705 710 715 720 Asn Leu Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Glu Trp Phe Lys 725 730 735 Arg His Gln Asn Asn Ser Lys Glu Tyr Glu Lys Val Glu Ala Leu Asp 740 745 750 Arg Val Gly Leu Val Thr Lys Val Ile Pro Leu Phe Phe Lys Glu Glu 755 760 765 Tyr Phe Lys Asp Lys Glu Glu Asn Phe Lys Glu Asp Thr Gln Lys Glu 770 775 780 Ile Asn Asp Cys Val Gln Pro Phe Tyr Asn Phe Pro Tyr Asn Val Gly 785 790 795 800 Asn Ile His Lys Pro Lys Glu Lys Asp Phe Leu His Arg Glu Glu Arg 805 810 815 Ile Glu Leu Trp Asp Lys Lys Lys Asp Lys Phe Lys Gly Tyr Lys Glu 820 825 830 Lys Ile Lys Ser Lys Lys Leu Thr Glu Lys Asp Lys Glu Glu Phe Arg 835 840 845 Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg 850 855 860 Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Lys Glu Leu 865 870 875 880 Ile Asp Lys Leu Lys Ile Asp Glu Leu Asn Ile Glu Glu Leu Lys Lys 885 890 895 Leu Arg Leu Asn Asn Ile Asp Thr Asp Thr Ala Lys Lys Glu Lys Asn 900 905 910 Asn Ile Leu Asn Arg Val Met Pro Met Glu Leu Pro Val Thr Val Tyr 915 920 925 Glu Ile Asp Asp Ser His Lys Ile Val Lys Asp Lys Pro Leu His Thr 930 935 940 Ile Tyr Ile Lys Glu Ala Glu Thr Lys Leu Leu Lys Gln Gly Asn Phe 945 950 955 960 Lys Ala Leu Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Val 965 970 975 Lys Thr Asn Ser Glu Ala Glu Ser Lys Arg Asn Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Glu Ala Arg Ile Glu Ile 995 1000 1005 Ile Gln Asp Met Leu Ala Leu Glu Glu Lys Leu Ile Asn Lys Tyr 1010 1015 1020 Lys Asp Leu Pro Thr Asn Lys Phe Ser Glu Met Leu Asn Ser Trp 1025 1030 1035 Leu Glu Gly Lys Asp Glu Ala Asp Lys Ala Arg Phe Gln Asn Asp 1040 1045 1050 Val Asp Phe Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln 1055 1060 1065 Tyr Pro Met His Asn Lys Ile Glu Phe Ala Asn Ile Lys Pro Phe 1070 1075 1080 Ser Leu Tyr Thr Ala Asn Asn Ser Glu Glu Lys Gly Leu Gly Ile 1085 1090 1095 Ala Asn Gln Leu Lys Asp Lys Thr Lys Glu Thr Thr Asp Lys Ile 1100 1105 1110 Lys Lys Ile Glu Lys Pro Ile Glu Thr Lys Glu 1115 1120 <210> 102 <211> 1151 <212> PRT <213> Prevotella saccharolytica <400> 102 Met Glu Asp Lys Pro Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His 1 5 10 15 Asn Val Tyr Leu Thr Val Asn His Ile Asn Lys Leu Leu Asp Leu Glu 20 25 30 Lys Leu Tyr Asp Glu Gly Lys His Lys Glu Ile Phe Glu Arg Glu Asp 35 40 45 Ile Phe Asn Ile Ser Asp Asp Val Met Asn Asp Ala Asn Ser Asn Gly 50 55 60 Lys Lys Arg Lys Leu Asp Ile Lys Lys Ile Trp Asp Asp Leu Asp Thr 65 70 75 80 Asp Leu Thr Arg Lys Tyr Gln Leu Arg Glu Leu Ile Leu Lys His Phe 85 90 95 Pro Phe Ile Gln Pro Ala Ile Ile Gly Ala Gln Thr Lys Glu Arg Thr 100 105 110 Thr Ile Asp Lys Asp Lys Arg Ser Thr Ser Thr Ser Asn Asp Ser Leu 115 120 125 Lys Gln Thr Gly Glu Gly Asp Ile Asn Asp Leu Leu Ser Leu Ser Asn 130 135 140 Val Lys Ser Met Phe Phe Arg Leu Leu Gln Ile Leu Glu Gln Leu Arg 145 150 155 160 Asn Tyr Tyr Ser His Val Lys His Ser Lys Ser Ala Thr Met Pro Asn 165 170 175 Phe Asp Glu Asp Leu Leu Asn Trp Met Arg Tyr Ile Phe Ile Asp Ser 180 185 190 Val Asn Lys Val Lys Glu Asp Tyr Ser Ser Asn Ser Val Ile Asp Pro 195 200 205 Asn Thr Ser Phe Ser His Leu Ile Tyr Lys Asp Glu Gln Gly Lys Ile 210 215 220 Lys Pro Cys Arg Tyr Pro Phe Thr Ser Lys Asp Gly Ser Ile Asn Ala 225 230 235 240 Phe Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu Lys Gln Asp Ser 245 250 255 Ile Trp Met Gln Lys Lys Ile Pro Gly Phe Lys Lys Ala Ser Glu Asn 260 265 270 Tyr Met Lys Met Thr Asn Glu Val Phe Cys Arg Asn His Ile Leu Leu 275 280 285 Pro Lys Ile Arg Leu Glu Thr Val Tyr Asp Lys Asp Trp Met Leu Leu 290 295 300 Asp Met Leu Asn Glu Val Val Arg Cys Pro Leu Ser Leu Tyr Lys Arg 305 310 315 320 Leu Thr Pro Ala Ala Gln Asn Lys Phe Lys Val Pro Glu Lys Ser Ser 325 330 335 Asp Asn Ala Asn Arg Gln Glu Asp Asp Asn Pro Phe Ser Arg Ile Leu 340 345 350 Val Arg His Gln Asn Arg Phe Pro Tyr Phe Val Leu Arg Phe Phe Asp 355 360 365 Leu Asn Glu Val Phe Thr Thr Leu Arg Phe Gln Ile Asn Leu Gly Cys 370 375 380 Tyr His Phe Ala Ile Cys Lys Lys Gln Ile Gly Asp Lys Lys Glu Val 385 390 395 400 His His Leu Ile Arg Thr Leu Tyr Gly Phe Ser Arg Leu Gln Asn Phe 405 410 415 Thr Gln Asn Thr Arg Pro Glu Glu Trp Asn Thr Leu Val Lys Thr Thr 420 425 430 Glu Pro Ser Ser Gly Asn Asp Gly Lys Thr Val Gln Gly Val Pro Leu 435 440 445 Pro Tyr Ile Ser Tyr Thr Ile Pro His Tyr Gln Ile Glu Asn Glu Lys 450 455 460 Ile Gly Ile Lys Ile Phe Asp Gly Asp Thr Ala Val Asp Thr Asp Ile 465 470 475 480 Trp Pro Ser Val Ser Thr Glu Lys Gln Leu Asn Lys Pro Asp Lys Tyr 485 490 495 Thr Leu Thr Pro Gly Phe Lys Ala Asp Val Phe Leu Ser Val His Glu 500 505 510 Leu Leu Pro Met Met Phe Tyr Tyr Gln Leu Leu Leu Cys Glu Gly Met 515 520 525 Leu Lys Thr Asp Ala Gly Asn Ala Val Glu Lys Val Leu Ile Asp Thr 530 535 540 Arg Asn Ala Ile Phe Asn Leu Tyr Asp Ala Phe Val Gln Glu Lys Ile 545 550 555 560 Asn Thr Ile Thr Asp Leu Glu Asn Tyr Leu Gln Asp Lys Pro Ile Leu 565 570 575 Ile Gly His Leu Pro Lys Gln Met Ile Asp Leu Leu Lys Gly His Gln 580 585 590 Arg Asp Met Leu Lys Ala Val Glu Gln Lys Lys Ala Met Leu Ile Lys 595 600 605 Asp Thr Glu Arg Arg Leu Lys Leu Leu Asp Lys Gln Leu Lys Gln Glu 610 615 620 Thr Asp Val Ala Ala Lys Asn Thr Gly Thr Leu Leu Lys Asn Gly Gln 625 630 635 640 Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Lys 645 650 655 Arg Asp Lys Glu Gly Asn Pro Ile Asn Cys Ser Lys Ala Asn Ser Thr 660 665 670 Glu Tyr Gln Met Leu Gln Arg Ala Phe Ala Phe Tyr Ala Thr Asp Ser 675 680 685 Cys Arg Leu Ser Arg Tyr Phe Thr Gln Leu His Leu Ile His Ser Asp 690 695 700 Asn Ser His Leu Phe Leu Ser Arg Phe Glu Tyr Asp Lys Gln Pro Asn 705 710 715 720 Leu Ile Ala Phe Tyr Ala Ala Tyr Leu Lys Ala Lys Leu Glu Phe Leu 725 730 735 Asn Glu Leu Gln Pro Gln Asn Trp Ala Ser Asp Asn Tyr Phe Leu Leu 740 745 750 Leu Arg Ala Pro Lys Asn Asp Arg Gln Lys Leu Ala Glu Gly Trp Lys 755 760 765 Asn Gly Phe Asn Leu Pro Arg Gly Leu Phe Thr Glu Lys Ile Lys Thr 770 775 780 Trp Phe Asn Glu His Lys Thr Ile Val Asp Ile Ser Asp Cys Asp Ile 785 790 795 800 Phe Lys Asn Arg Val Gly Gln Val Ala Arg Leu Ile Pro Val Phe Phe 805 810 815 Asp Lys Lys Phe Lys Asp His Ser Gln Pro Phe Tyr Arg Tyr Asp Phe 820 825 830 Asn Val Gly Asn Val Ser Lys Pro Thr Glu Ala Asn Tyr Leu Ser Lys 835 840 845 Gly Lys Arg Glu Glu Leu Phe Lys Ser Tyr Gln Asn Lys Phe Lys Asn 850 855 860 Asn Ile Pro Ala Glu Lys Thr Lys Glu Tyr Arg Glu Tyr Lys Asn Phe 865 870 875 880 Ser Leu Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys Asn Gln 885 890 895 Asp Ile Leu Ile Trp Leu Met Cys Lys Asn Leu Phe Asp Glu Lys Ile 900 905 910 Lys Pro Lys Lys Asp Ile Leu Glu Pro Arg Ile Ala Val Ser Tyr Ile 915 920 925 Lys Leu Asp Ser Leu Gln Thr Asn Thr Ser Thr Ala Gly Ser Leu Asn 930 935 940 Ala Leu Ala Lys Val Val Pro Met Thr Leu Ala Ile His Ile Asp Ser 945 950 955 960 Pro Lys Pro Lys Gly Lys Ala Gly Asn Asn Glu Lys Glu Asn Lys Glu 965 970 975 Phe Thr Val Tyr Ile Lys Glu Glu Gly Thr Lys Leu Leu Lys Trp Gly 980 985 990 Asn Phe Lys Thr Leu Leu Ala Asp Arg Arg Ile Lys Gly Leu Phe Ser 995 1000 1005 Tyr Ile Glu His Asp Asp Ile Asp Leu Lys Gln His Pro Leu Thr 1010 1015 1020 Lys Arg Arg Val Asp Leu Glu Leu Asp Leu Tyr Gln Thr Cys Arg 1025 1030 1035 Ile Asp Ile Phe Gln Gln Thr Leu Gly Leu Glu Ala Gln Leu Leu 1040 1045 1050 Asp Lys Tyr Ser Asp Leu Asn Thr Asp Asn Phe Tyr Gln Met Leu 1055 1060 1065 Ile Gly Trp Arg Lys Lys Glu Gly Ile Pro Arg Asn Ile Lys Glu 1070 1075 1080 Asp Thr Asp Phe Leu Lys Asp Val Arg Asn Ala Phe Ser His Asn 1085 1090 1095 Gln Tyr Pro Asp Ser Lys Lys Ile Ala Phe Arg Arg Ile Arg Lys 1100 1105 1110 Phe Asn Pro Lys Glu Leu Ile Leu Glu Glu Glu Glu Gly Leu Gly 1115 1120 1125 Ile Ala Thr Gln Met Tyr Lys Glu Val Glu Lys Val Val Asn Arg 1130 1135 1140 Ile Lys Arg Ile Glu Leu Phe Asp 1145 1150 <210> 103 <211> 1159 <212> PRT <213> Myroides odoratimimus <400> 103 Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe 1 5 10 15 Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn 20 25 30 Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg 35 40 45 Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn 50 55 60 Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu 65 70 75 80 Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val 85 90 95 Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu 100 105 110 Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr 115 120 125 Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Asp 130 135 140 Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Phe Val 145 150 155 160 Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr 165 170 175 Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile 180 185 190 Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys 195 200 205 Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe 210 215 220 Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Asp Lys Glu Thr Val 225 230 235 240 Val Ala Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser 245 250 255 Asn Asp Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr 260 265 270 Leu Leu Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala 275 280 285 Asn Leu Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser 290 295 300 Ile Lys Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg 305 310 315 320 Gly Leu Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr 325 330 335 Leu Leu Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val 340 345 350 Tyr Gln His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp 355 360 365 Asn Glu Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu 370 375 380 Ser Arg Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe 385 390 395 400 Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr 405 410 415 Leu Arg Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr 420 425 430 Lys Gln Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val 435 440 445 Thr Val Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr 450 455 460 Phe His Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp 465 470 475 480 Thr Leu Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu 485 490 495 Gln His Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val 500 505 510 Lys Leu Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala 515 520 525 Arg Lys Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys 530 535 540 Tyr Asp Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser 545 550 555 560 Glu Lys Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met 565 570 575 Asn Asp Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu 580 585 590 Leu Lys Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile 595 600 605 Gly Lys Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile 610 615 620 Leu Lys Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys 625 630 635 640 Ile Thr Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile 645 650 655 Leu Glu Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr 660 665 670 Lys Phe Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn 675 680 685 Ala Glu Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg 690 695 700 Phe Met Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Thr 705 710 715 720 Glu Leu Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu 725 730 735 Glu Leu Ile Leu Ser Asn Met Val Met Val Lys Asp Tyr Pro Ile Glu 740 745 750 Leu Ile Asp Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn 755 760 765 Lys Tyr Leu Glu Ala Arg Leu Glu Tyr Ile Glu Asn Val Ile Thr Arg 770 775 780 Val Lys Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu 785 790 795 800 Cys Phe Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp 805 810 815 Lys Gln Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly 820 825 830 Phe Met Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Lys Gln 835 840 845 His Lys Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser 850 855 860 Asn Tyr Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu 865 870 875 880 Asp Lys Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln 885 890 895 Lys Asn Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu 900 905 910 Val Leu Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr 915 920 925 Gln Thr Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr 930 935 940 Gln Glu Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln 945 950 955 960 Leu Cys Asp Gly Leu Val His Ile Asp Asn Val Lys Leu Lys Asp Ile 965 970 975 Gly Asn Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu 980 985 990 Thr Tyr Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val 995 1000 1005 Asp Ser Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr 1010 1015 1020 Glu Ser Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile 1025 1030 1035 Glu Cys Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys 1040 1045 1050 Gln Ser Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu 1055 1060 1065 Leu Pro Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr 1070 1075 1080 Asp Val Lys Phe Lys Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala 1085 1090 1095 Gly Glu Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn 1100 1105 1110 Lys Phe Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe 1115 1120 1125 Cys Glu Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala 1130 1135 1140 Glu Tyr Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala 1145 1150 1155 Asn <210> 104 <211> 1120 <212> PRT <213> Prevotella intermedia <400> 104 Met Glu Asp Asp Lys Lys Thr Thr Asp Ser Ile Arg Tyr Glu Leu Lys 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Glu Glu Asp Glu Ile 35 40 45 Asn Arg Asp Gly Tyr Glu Asn Thr Leu Glu Asn Ser Trp Asn Glu Ile 50 55 60 Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile Lys His 65 70 75 80 Phe Pro Phe Leu Glu Ala Thr Thr Tyr Arg Gln Asn Pro Thr Asp Thr 85 90 95 Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu Glu Ser 100 105 110 Leu Lys Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp Leu Arg 115 120 125 Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg Pro Lys 130 135 140 Phe Glu Glu Asp Leu Gln Asn Lys Met Tyr Asn Ile Phe Asp Val Ser 145 150 155 160 Ile Gln Phe Val Lys Glu Asp Tyr Lys His Asn Thr Asp Ile Asn Pro 165 170 175 Lys Lys Asp Phe Lys His Leu Asp Arg Lys Arg Lys Gly Lys Phe His 180 185 190 Tyr Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu 195 200 205 Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Val Gln 210 215 220 Lys Lys Leu Glu Gly Phe Lys Cys Ser Asn Lys Ser Tyr Gln Lys Met 225 230 235 240 Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg 245 250 255 Leu Glu Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn 260 265 270 Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Gln Gly Val 275 280 285 Asn Arg Lys Lys Phe Tyr Val Ser Phe Asp Pro Ala Asp Glu Asp Tyr 290 295 300 Asp Ala Glu Gln Glu Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp 305 310 315 320 Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Val Phe 325 330 335 Ala Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile 340 345 350 Tyr Lys Lys Leu Ile Gly Gly Gln Lys Glu Asp Arg His Leu Thr His 355 360 365 Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Asp Lys Gln Asn Arg 370 375 380 Pro Asp Glu Trp Lys Ala Ile Val Lys Asp Ser Asp Thr Phe Lys Lys 385 390 395 400 Lys Glu Glu Lys Glu Glu Glu Lys Pro Tyr Ile Ser Glu Thr Thr Pro 405 410 415 His Tyr His Leu Glu Asn Lys Lys Ile Gly Ile Ala Phe Lys Asn His 420 425 430 Asn Ile Trp Pro Ser Thr Gln Thr Glu Leu Thr Asn Asn Lys Arg Lys 435 440 445 Lys Tyr Asn Leu Gly Thr Ser Ile Lys Ala Glu Ala Phe Leu Ser Val 450 455 460 His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu 465 470 475 480 Asn Thr Lys Asn Asp Asn Lys Val Gly Gly Lys Lys Glu Thr Lys Lys 485 490 495 Gln Gly Lys His Lys Ile Glu Ala Ile Ile Glu Ser Lys Ile Lys Asp 500 505 510 Ile Tyr Ala Leu Tyr Asp Ala Phe Ala Asn Gly Glu Ile Asn Ser Glu 515 520 525 Asp Glu Leu Lys Glu Tyr Leu Lys Gly Lys Asp Ile Lys Ile Val His 530 535 540 Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Asn Glu His Lys Asp Met 545 550 555 560 Ala Glu Lys Ala Glu Ala Lys Gln Glu Lys Met Lys Leu Ala Thr Glu 565 570 575 Asn Arg Leu Lys Thr Leu Asp Lys Gln Leu Lys Gly Lys Ile Gln Asn 580 585 590 Gly Lys Arg Tyr Asn Ser Ala Pro Lys Ser Gly Glu Ile Ala Ser Trp 595 600 605 Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Glu Asn 610 615 620 Gly Glu Ser Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Leu 625 630 635 640 Leu Gln Arg Thr Leu Ala Phe Phe Gly Ser Glu His Glu Arg Leu Ala 645 650 655 Pro Tyr Phe Lys Gln Thr Lys Leu Ile Glu Ser Ser Asn Pro His Pro 660 665 670 Phe Leu Asn Asp Thr Glu Trp Glu Lys Cys Ser Asn Ile Leu Ser Phe 675 680 685 Tyr Arg Ser Tyr Leu Lys Ala Arg Lys Asn Phe Leu Glu Ser Leu Lys 690 695 700 Pro Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro 705 710 715 720 Lys Thr Asn Arg Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn 725 730 735 Leu Pro Arg Gly Phe Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Glu 740 745 750 His Trp Lys Ser Ile Lys Val Asp Asp Leu Lys Arg Val Gly Leu Val 755 760 765 Ala Lys Val Thr Pro Leu Phe Phe Ser Glu Lys Tyr Lys Asp Ser Val 770 775 780 Gln Pro Phe Tyr Asn Tyr Pro Phe Asn Val Gly Asp Val Asn Lys Pro 785 790 795 800 Lys Glu Glu Asp Phe Leu His Arg Glu Glu Arg Ile Glu Leu Trp Asp 805 810 815 Lys Lys Lys Asp Lys Phe Lys Gly Tyr Lys Ala Lys Lys Lys Phe Lys 820 825 830 Glu Met Thr Asp Lys Glu Lys Glu Glu His Arg Ser Tyr Leu Glu Phe 835 840 845 Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln 850 855 860 Asp Ile Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys 865 870 875 880 Ile Asp Glu Leu Asn Ile Lys Glu Leu Lys Lys Leu Arg Leu Lys Asp 885 890 895 Ile Asn Thr Asp Thr Ala Lys Lys Glu Lys Asn Asn Ile Leu Asn Arg 900 905 910 Val Met Pro Met Glu Leu Pro Val Thr Val Tyr Lys Val Asn Lys Gly 915 920 925 Gly Tyr Ile Ile Lys Asn Lys Pro Leu His Thr Ile Tyr Ile Lys Glu 930 935 940 Ala Glu Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys 945 950 955 960 Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Lys Thr Pro Ser Glu 965 970 975 Ala Glu Ser Glu Ser Asn Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 980 985 990 Leu Gly Lys Tyr Gln Asn Ala Arg Leu Asp Ile Ile Glu Asp Met Leu 995 1000 1005 Ala Leu Glu Lys Lys Leu Ile Asp Lys Tyr Asn Ser Leu Asp Thr 1010 1015 1020 Asp Asn Phe His Asn Met Leu Thr Gly Trp Leu Glu Leu Lys Gly 1025 1030 1035 Glu Ala Lys Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Thr 1040 1045 1050 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1055 1060 1065 Glu Asn Leu Phe Gly Asn Ile Glu Arg Phe Ser Leu Ser Ser Ser 1070 1075 1080 Asn Ile Ile Glu Ser Lys Gly Leu Asp Ile Ala Ala Lys Leu Lys 1085 1090 1095 Glu Glu Val Ser Lys Ala Ala Lys Lys Ile Gln Asn Glu Glu Asp 1100 1105 1110 Asn Lys Lys Glu Lys Glu Thr 1115 1120 <210> 105 <211> 1199 <212> PRT <213> Capnocytophaga canimorsus <400> 105 Met Lys Asn Ile Gln Arg Leu Gly Lys Gly Asn Glu Phe Ser Pro Phe 1 5 10 15 Lys Lys Glu Asp Lys Phe Tyr Phe Gly Gly Phe Leu Asn Leu Ala Asn 20 25 30 Asn Asn Ile Glu Asp Phe Phe Lys Glu Ile Ile Thr Arg Phe Gly Ile 35 40 45 Val Ile Thr Asp Glu Asn Lys Lys Pro Lys Glu Thr Phe Gly Glu Lys 50 55 60 Ile Leu Asn Glu Ile Phe Lys Lys Asp Ile Ser Ile Val Asp Tyr Glu 65 70 75 80 Lys Trp Val Asn Ile Phe Ala Asp Tyr Phe Pro Phe Thr Lys Tyr Leu 85 90 95 Ser Leu Tyr Leu Glu Glu Met Gln Phe Lys Asn Arg Val Ile Cys Phe 100 105 110 Arg Asp Val Met Lys Glu Leu Leu Lys Thr Val Glu Ala Leu Arg Asn 115 120 125 Phe Tyr Thr His Tyr Asp His Glu Pro Ile Lys Ile Glu Asp Arg Val 130 135 140 Phe Tyr Phe Leu Asp Lys Val Leu Leu Asp Val Ser Leu Thr Val Lys 145 150 155 160 Asn Lys Tyr Leu Lys Thr Asp Lys Thr Lys Glu Phe Leu Asn Gln His 165 170 175 Ile Gly Glu Glu Leu Lys Glu Leu Cys Lys Gln Arg Lys Asp Tyr Leu 180 185 190 Val Gly Lys Gly Lys Arg Ile Asp Lys Glu Ser Glu Ile Ile Asn Gly 195 200 205 Ile Tyr Asn Asn Ala Phe Lys Asp Phe Ile Cys Lys Arg Glu Lys Gln 210 215 220 Asp Asp Lys Glu Asn His Asn Ser Val Glu Lys Ile Leu Cys Asn Lys 225 230 235 240 Glu Pro Gln Asn Lys Lys Gln Lys Ser Ser Ala Thr Val Trp Glu Leu 245 250 255 Cys Ser Lys Ser Ser Ser Lys Tyr Thr Glu Lys Ser Phe Pro Asn Arg 260 265 270 Glu Asn Asp Lys His Cys Leu Glu Val Pro Ile Ser Gln Lys Gly Ile 275 280 285 Val Phe Leu Leu Ser Phe Phe Leu Asn Lys Gly Glu Ile Tyr Ala Leu 290 295 300 Thr Ser Asn Ile Lys Gly Phe Lys Ala Lys Ile Thr Lys Glu Glu Pro 305 310 315 320 Val Thr Tyr Asp Lys Asn Ser Ile Arg Tyr Met Ala Thr His Arg Met 325 330 335 Phe Ser Phe Leu Ala Tyr Lys Gly Leu Lys Arg Lys Ile Arg Thr Ser 340 345 350 Glu Ile Asn Tyr Asn Glu Asp Gly Gln Ala Ser Ser Thr Tyr Glu Lys 355 360 365 Glu Thr Leu Met Leu Gln Met Leu Asp Glu Leu Asn Lys Val Pro Asp 370 375 380 Val Val Tyr Gln Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile Glu 385 390 395 400 Asp Trp Asn Glu Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr Met 405 410 415 Glu Glu Glu Gln Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp 420 425 430 Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln Phe 435 440 445 Pro Thr Leu Arg Phe Gln Val His Leu Gly Asn Tyr Leu Cys Asp Lys 450 455 460 Arg Thr Lys Gln Ile Cys Asp Thr Thr Thr Glu Arg Glu Val Lys Lys 465 470 475 480 Lys Ile Thr Val Phe Gly Arg Leu Ser Glu Leu Glu Asn Lys Lys Ala 485 490 495 Ile Phe Leu Asn Glu Arg Glu Glu Ile Lys Gly Trp Glu Val Phe Pro 500 505 510 Asn Pro Ser Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val Asn Tyr Lys 515 520 525 Asp Phe Pro Ile Val Gly Ser Ile Leu Asp Arg Glu Lys Gln Pro Val 530 535 540 Ser Asn Lys Ile Gly Ile Arg Val Lys Ile Ala Asp Glu Leu Gln Arg 545 550 555 560 Glu Ile Asp Lys Ala Ile Lys Glu Lys Lys Leu Arg Asn Pro Lys Asn 565 570 575 Arg Lys Ala Asn Gln Asp Glu Lys Gln Lys Glu Arg Leu Val Asn Glu 580 585 590 Ile Val Ser Thr Asn Ser Asn Glu Gln Gly Glu Pro Val Val Phe Ile 595 600 605 Gly Gln Pro Thr Ala Tyr Leu Ser Met Asn Asp Ile His Ser Val Leu 610 615 620 Tyr Glu Phe Leu Ile Asn Lys Ile Ser Gly Glu Ala Leu Glu Thr Lys 625 630 635 640 Ile Val Glu Lys Ile Glu Thr Gln Ile Lys Gln Ile Ile Gly Lys Asp 645 650 655 Ala Thr Thr Lys Ile Leu Lys Pro Tyr Thr Asn Ala Asn Ser Asn Ser 660 665 670 Ile Asn Arg Glu Lys Leu Leu Arg Asp Leu Glu Gln Glu Gln Gln Ile 675 680 685 Leu Lys Thr Leu Leu Glu Glu Gln Gln Gln Arg Glu Lys Asp Lys Lys 690 695 700 Asp Lys Lys Ser Lys Arg Lys His Glu Leu Tyr Pro Ser Glu Lys Gly 705 710 715 720 Lys Val Ala Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Lys 725 730 735 Ala Phe Lys Glu Gln Trp Arg Gly Tyr His His Ser Leu Leu Gln Lys 740 745 750 Tyr Leu Ala Tyr Tyr Glu Gln Ser Lys Glu Glu Leu Lys Asn Leu Leu 755 760 765 Pro Lys Glu Val Phe Lys His Phe Pro Phe Lys Leu Lys Gly Tyr Phe 770 775 780 Gln Gln Gln Tyr Leu Asn Gln Phe Tyr Thr Asp Tyr Leu Lys Arg Arg 785 790 795 800 Leu Ser Tyr Val Asn Glu Leu Leu Leu Asn Ile Gln Asn Phe Lys Asn 805 810 815 Asp Lys Asp Ala Leu Lys Ala Thr Glu Lys Glu Cys Phe Lys Phe Phe 820 825 830 Arg Lys Gln Asn Tyr Ile Ile Asn Pro Ile Asn Ile Gln Ile Gln Ser 835 840 845 Ile Leu Val Tyr Pro Ile Phe Leu Lys Arg Gly Phe Leu Asp Glu Lys 850 855 860 Pro Thr Met Ile Asp Arg Glu Lys Phe Lys Glu Asn Lys Asp Thr Glu 865 870 875 880 Leu Ala Asp Trp Phe Met His Tyr Lys Asn Tyr Lys Glu Asp Asn Tyr 885 890 895 Gln Lys Phe Tyr Ala Tyr Pro Leu Glu Lys Val Glu Glu Lys Glu Lys 900 905 910 Phe Lys Arg Asn Lys Gln Ile Asn Lys Gln Lys Lys Asn Asp Val Tyr 915 920 925 Thr Leu Met Met Val Glu Tyr Ile Ile Gln Lys Ile Phe Gly Asp Lys 930 935 940 Phe Val Glu Glu Asn Pro Leu Val Leu Lys Gly Ile Phe Gln Ser Lys 945 950 955 960 Ala Glu Arg Gln Gln Asn Asn Thr His Ala Ala Thr Thr Gln Glu Arg 965 970 975 Asn Leu Asn Gly Ile Leu Asn Gln Pro Lys Asp Ile Lys Ile Gln Gly 980 985 990 Lys Ile Thr Val Lys Gly Val Lys Leu Lys Asp Ile Gly Asn Phe Arg 995 1000 1005 Lys Tyr Glu Ile Asp Gln Arg Val Asn Thr Phe Leu Asp Tyr Glu 1010 1015 1020 Pro Arg Lys Glu Trp Met Ala Tyr Leu Pro Asn Asp Trp Lys Glu 1025 1030 1035 Lys Glu Lys Gln Gly Gln Leu Pro Pro Asn Asn Val Ile Asp Arg 1040 1045 1050 Gln Ile Ser Lys Tyr Glu Thr Val Arg Ser Lys Ile Leu Leu Lys 1055 1060 1065 Asp Val Gln Glu Leu Glu Lys Ile Ile Ser Asp Glu Ile Lys Glu 1070 1075 1080 Glu His Arg His Asp Leu Lys Gln Gly Lys Tyr Tyr Asn Phe Lys 1085 1090 1095 Tyr Tyr Ile Leu Asn Gly Leu Leu Arg Gln Leu Lys Asn Glu Asn 1100 1105 1110 Val Glu Asn Tyr Lys Val Phe Lys Leu Asn Thr Asn Pro Glu Lys 1115 1120 1125 Val Asn Ile Thr Gln Leu Lys Gln Glu Ala Thr Asp Leu Glu Gln 1130 1135 1140 Lys Ala Phe Val Leu Thr Tyr Ile Arg Asn Lys Phe Ala His Asn 1145 1150 1155 Gln Leu Pro Lys Lys Glu Phe Trp Asp Tyr Cys Gln Glu Lys Tyr 1160 1165 1170 Gly Lys Ile Glu Lys Glu Lys Thr Tyr Ala Glu Tyr Phe Ala Glu 1175 1180 1185 Val Phe Lys Arg Glu Lys Glu Ala Leu Ile Lys 1190 1195 <210> 106 <211> 1175 <212> PRT <213> Porphyromonas gulae <400> 106 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Ile Asp His Glu His Asn Asp Glu Val 180 185 190 Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Met Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Ser Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Met Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Ala Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly His Asp Glu Val Ala Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser Tyr Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Arg Ile Asn Leu Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro 945 950 955 960 Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr 1055 1060 1065 Leu Arg Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 107 <211> 1090 <212> PRT <213> Prevotella sp. <400> 107 Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr 1 5 10 15 Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile 20 25 30 Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn 35 40 45 Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly 50 55 60 Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln 65 70 75 80 Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr 85 90 95 Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp 100 105 110 Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg 115 120 125 Asp Leu Thr Asn His Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly 130 135 140 Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn 145 150 155 160 Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr 165 170 175 Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val 180 185 190 Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe 195 200 205 Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu 210 215 220 Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln 225 230 235 240 Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn 245 250 255 Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn 260 265 270 Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys 275 280 285 Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu 290 295 300 Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile 305 310 315 320 Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe 325 330 335 Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His 340 345 350 Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala 355 360 365 Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln 370 375 380 Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys 385 390 395 400 Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe 405 410 415 Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile 420 425 430 Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met 435 440 445 Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu 450 455 460 Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr 465 470 475 480 Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys 485 490 495 Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu 500 505 510 Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser 515 520 525 Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile 530 535 540 Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr 545 550 555 560 Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys 565 570 575 Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg 580 585 590 Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys 595 600 605 Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile 610 615 620 Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp 625 630 635 640 Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu 645 650 655 Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu 660 665 670 Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr 675 680 685 Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn 690 695 700 Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp 705 710 715 720 Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr 725 730 735 Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu 740 745 750 Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe 755 760 765 Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val 770 775 780 Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg 785 790 795 800 Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln 805 810 815 His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg 820 825 830 Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg 835 840 845 Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile 850 855 860 Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu 865 870 875 880 Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu 885 890 895 Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe 900 905 910 Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu 915 920 925 Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr 930 935 940 Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val 945 950 955 960 Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser 965 970 975 Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp 980 985 990 Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp 995 1000 1005 Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu 1010 1015 1020 Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn 1025 1030 1035 Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg 1040 1045 1050 Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Val Val Glu 1055 1060 1065 Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe 1070 1075 1080 Gly Glu Tyr Ala Ile Met Lys 1085 1090 <210> 108 <211> 1150 <212> PRT <213> Flavobacterium branchiophilum <400> 108 Met Glu Asn Leu Asn Lys Ile Leu Asp Lys Glu Asn Glu Ile Cys Ile 1 5 10 15 Ser Lys Ile Phe Asn Thr Lys Gly Ile Ala Ala Pro Ile Thr Glu Lys 20 25 30 Ala Leu Asp Asn Ile Lys Ser Lys Gln Lys Asn Asp Leu Asn Lys Glu 35 40 45 Ala Arg Leu His Tyr Phe Ser Ile Gly His Ser Phe Lys Gln Ile Asp 50 55 60 Thr Lys Lys Val Phe Asp Tyr Val Leu Ile Glu Glu Leu Lys Asp Glu 65 70 75 80 Lys Pro Leu Lys Phe Ile Thr Leu Gln Lys Asp Phe Phe Thr Lys Glu 85 90 95 Phe Ser Ile Lys Leu Gln Lys Leu Ile Asn Ser Ile Arg Asn Ile Asn 100 105 110 Asn His Tyr Val His Asn Phe Asn Asp Ile Asn Leu Asn Lys Ile Asp 115 120 125 Ser Asn Val Phe His Phe Leu Lys Glu Ser Phe Glu Leu Ala Ile Ile 130 135 140 Glu Lys Tyr Tyr Lys Val Asn Lys Lys Tyr Pro Leu Asp Asn Glu Ile 145 150 155 160 Val Leu Phe Leu Lys Glu Leu Phe Ile Lys Asp Glu Asn Thr Ala Leu 165 170 175 Leu Asn Tyr Phe Thr Asn Leu Ser Lys Asp Glu Ala Ile Glu Tyr Ile 180 185 190 Leu Thr Phe Thr Ile Thr Glu Asn Lys Ile Trp Asn Ile Asn Asn Glu 195 200 205 His Asn Ile Leu Asn Ile Glu Lys Gly Lys Tyr Leu Thr Phe Glu Ala 210 215 220 Met Leu Phe Leu Ile Thr Ile Phe Leu Tyr Lys Asn Glu Ala Asn His 225 230 235 240 Leu Leu Pro Lys Leu Tyr Asp Phe Lys Asn Asn Lys Ser Lys Gln Glu 245 250 255 Leu Phe Thr Phe Phe Ser Lys Lys Phe Thr Ser Gln Asp Ile Asp Ala 260 265 270 Glu Glu Gly His Leu Ile Lys Phe Arg Asp Met Ile Gln Tyr Leu Asn 275 280 285 His Tyr Pro Thr Ala Trp Asn Asn Asp Leu Lys Leu Glu Ser Glu Asn 290 295 300 Lys Asn Lys Ile Met Thr Thr Lys Leu Ile Asp Ser Ile Ile Glu Phe 305 310 315 320 Glu Leu Asn Ser Asn Tyr Pro Ser Phe Ala Thr Asp Ile Gln Phe Lys 325 330 335 Lys Glu Ala Lys Ala Phe Leu Phe Ala Ser Asn Lys Lys Arg Asn Gln 340 345 350 Thr Ser Phe Ser Asn Lys Ser Tyr Asn Glu Glu Ile Arg His Asn Pro 355 360 365 His Ile Lys Gln Tyr Arg Asp Glu Ile Ala Ser Ala Leu Thr Pro Ile 370 375 380 Ser Phe Asn Val Lys Glu Asp Lys Phe Lys Ile Phe Val Lys Lys His 385 390 395 400 Val Leu Glu Glu Tyr Phe Pro Asn Ser Ile Gly Tyr Glu Lys Phe Leu 405 410 415 Glu Tyr Asn Asp Phe Thr Glu Lys Glu Lys Glu Asp Phe Gly Leu Lys 420 425 430 Leu Tyr Ser Asn Pro Lys Thr Asn Lys Leu Ile Glu Arg Ile Asp Asn 435 440 445 His Lys Leu Val Lys Ser His Gly Arg Asn Gln Asp Arg Phe Met Asp 450 455 460 Phe Ser Met Arg Phe Leu Ala Glu Asn Asn Tyr Phe Gly Lys Asp Ala 465 470 475 480 Phe Phe Lys Cys Tyr Lys Phe Tyr Asp Thr Gln Glu Gln Asp Glu Phe 485 490 495 Leu Gln Ser Asn Glu Asn Asn Asp Asp Val Lys Phe His Lys Gly Lys 500 505 510 Val Thr Thr Tyr Ile Lys Tyr Glu Glu His Leu Lys Asn Tyr Ser Tyr 515 520 525 Trp Asp Cys Pro Phe Val Glu Glu Asn Asn Ser Met Ser Val Lys Ile 530 535 540 Ser Ile Gly Ser Glu Glu Lys Ile Leu Lys Ile Gln Arg Asn Leu Met 545 550 555 560 Ile Tyr Phe Leu Glu Asn Ala Leu Tyr Asn Glu Asn Val Glu Asn Gln 565 570 575 Gly Tyr Lys Leu Val Asn Asn Tyr Tyr Arg Glu Leu Lys Lys Asp Val 580 585 590 Glu Glu Ser Ile Ala Ser Leu Asp Leu Ile Lys Ser Asn Pro Asp Phe 595 600 605 Lys Ser Lys Tyr Lys Lys Ile Leu Pro Lys Arg Leu Leu His Asn Tyr 610 615 620 Ala Pro Ala Lys Gln Asp Lys Ala Pro Glu Asn Ala Phe Glu Thr Leu 625 630 635 640 Leu Lys Lys Ala Asp Phe Arg Glu Glu Gln Tyr Lys Lys Leu Leu Lys 645 650 655 Lys Ala Glu His Glu Lys Asn Lys Glu Asp Phe Val Lys Arg Asn Lys 660 665 670 Gly Lys Gln Phe Lys Leu His Phe Ile Arg Lys Ala Cys Gln Met Met 675 680 685 Tyr Phe Lys Glu Lys Tyr Asn Thr Leu Lys Glu Gly Asn Ala Ala Phe 690 695 700 Glu Lys Lys Asp Pro Val Ile Glu Lys Arg Lys Asn Lys Glu His Glu 705 710 715 720 Phe Gly His His Lys Asn Leu Asn Ile Thr Arg Glu Glu Phe Asn Asp 725 730 735 Tyr Cys Lys Trp Met Phe Ala Phe Asn Gly Asn Asp Ser Tyr Lys Lys 740 745 750 Tyr Leu Arg Asp Leu Phe Ser Glu Lys His Phe Phe Asp Asn Gln Glu 755 760 765 Tyr Lys Asn Leu Phe Glu Ser Ser Val Asn Leu Glu Ala Phe Tyr Ala 770 775 780 Lys Thr Lys Glu Leu Phe Lys Lys Trp Ile Glu Thr Asn Lys Pro Thr 785 790 795 800 Asn Asn Glu Asn Arg Tyr Thr Leu Glu Asn Tyr Lys Asn Leu Ile Leu 805 810 815 Gln Lys Gln Val Phe Ile Asn Val Tyr His Phe Ser Lys Tyr Leu Ile 820 825 830 Asp Lys Asn Leu Leu Asn Ser Glu Asn Asn Val Ile Gln Tyr Lys Ser 835 840 845 Leu Glu Asn Val Glu Tyr Leu Ile Ser Asp Phe Tyr Phe Gln Ser Lys 850 855 860 Leu Ser Ile Asp Gln Tyr Lys Thr Cys Gly Lys Leu Phe Asn Lys Leu 865 870 875 880 Lys Ser Asn Lys Leu Glu Asp Cys Leu Leu Tyr Glu Ile Ala Tyr Asn 885 890 895 Tyr Ile Asp Lys Lys Asn Val His Lys Ile Asp Ile Gln Lys Ile Leu 900 905 910 Thr Ser Lys Ile Ile Leu Thr Ile Asn Asp Ala Asn Thr Pro Tyr Lys 915 920 925 Ile Ser Val Pro Phe Asn Lys Leu Glu Arg Tyr Thr Glu Met Ile Ala 930 935 940 Ile Lys Asn Gln Asn Asn Leu Lys Ala Arg Phe Leu Ile Asp Leu Pro 945 950 955 960 Leu Tyr Leu Ser Lys Asn Lys Ile Lys Lys Gly Lys Asp Ser Ala Gly 965 970 975 Tyr Glu Ile Ile Ile Lys Asn Asp Leu Glu Ile Glu Asp Ile Asn Thr 980 985 990 Ile Asn Asn Lys Ile Ile Asn Asp Ser Val Lys Phe Thr Glu Val Leu 995 1000 1005 Met Glu Leu Glu Lys Tyr Phe Ile Leu Lys Asp Lys Cys Ile Leu 1010 1015 1020 Ser Lys Asn Tyr Ile Asp Asn Ser Glu Ile Pro Ser Leu Lys Gln 1025 1030 1035 Phe Ser Lys Val Trp Ile Lys Glu Asn Glu Asn Glu Ile Ile Asn 1040 1045 1050 Tyr Arg Asn Ile Ala Cys His Phe His Leu Pro Leu Leu Glu Thr 1055 1060 1065 Phe Asp Asn Leu Leu Leu Asn Val Glu Gln Lys Phe Ile Lys Glu 1070 1075 1080 Glu Leu Gln Asn Val Ser Thr Ile Asn Asp Leu Ser Lys Pro Gln 1085 1090 1095 Glu Tyr Leu Ile Leu Leu Phe Ile Lys Phe Lys His Asn Asn Phe 1100 1105 1110 Tyr Leu Asn Leu Phe Asn Lys Asn Glu Ser Lys Thr Ile Lys Asn 1115 1120 1125 Asp Lys Glu Val Lys Lys Asn Arg Val Leu Gln Lys Phe Ile Asn 1130 1135 1140 Gln Val Ile Leu Lys Lys Lys 1145 1150 <210> 109 <211> 1159 <212> PRT <213> Myroides odoratimimus <400> 109 Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe 1 5 10 15 Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn 20 25 30 Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg 35 40 45 Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn 50 55 60 Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu 65 70 75 80 Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val 85 90 95 Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu 100 105 110 Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr 115 120 125 Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Asp 130 135 140 Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Phe Val 145 150 155 160 Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr 165 170 175 Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile 180 185 190 Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys 195 200 205 Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe 210 215 220 Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Asp Lys Glu Thr Val 225 230 235 240 Val Ala Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser 245 250 255 Asn Asp Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr 260 265 270 Leu Leu Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala 275 280 285 Asn Leu Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser 290 295 300 Ile Lys Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg 305 310 315 320 Gly Leu Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr 325 330 335 Leu Leu Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val 340 345 350 Tyr Gln His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp 355 360 365 Asn Glu Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu 370 375 380 Ser Arg Val Thr His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe 385 390 395 400 Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr 405 410 415 Leu Arg Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr 420 425 430 Lys Gln Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val 435 440 445 Thr Val Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr 450 455 460 Phe His Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp 465 470 475 480 Thr Leu Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu 485 490 495 Gln His Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val 500 505 510 Lys Leu Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala 515 520 525 Arg Lys Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys 530 535 540 Tyr Asp Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser 545 550 555 560 Glu Lys Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met 565 570 575 Asn Asp Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu 580 585 590 Leu Lys Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile 595 600 605 Gly Lys Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile 610 615 620 Leu Lys Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys 625 630 635 640 Ile Thr Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile 645 650 655 Leu Glu Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr 660 665 670 Lys Phe Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn 675 680 685 Ala Glu Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg 690 695 700 Phe Met Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Ile 705 710 715 720 Glu Leu Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu 725 730 735 Glu Leu Ile Leu Ser Asn Met Val Met Val Lys Asp Tyr Pro Ile Glu 740 745 750 Leu Ile Asp Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn 755 760 765 Lys Tyr Leu Glu Ala Arg Leu Glu Tyr Ile Glu Asn Val Ile Thr Arg 770 775 780 Val Lys Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu 785 790 795 800 Cys Phe Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp 805 810 815 Lys Gln Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly 820 825 830 Phe Met Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Lys Gln 835 840 845 His Lys Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser 850 855 860 Asn Tyr Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu 865 870 875 880 Asp Lys Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln 885 890 895 Lys Asn Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu 900 905 910 Val Leu Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr 915 920 925 Gln Thr Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr 930 935 940 Gln Glu Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln 945 950 955 960 Leu Cys Asp Gly Leu Val His Ile Asp Asn Val Lys Leu Lys Asp Ile 965 970 975 Gly Asn Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu 980 985 990 Thr Tyr Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val 995 1000 1005 Asp Ser Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr 1010 1015 1020 Glu Ser Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile 1025 1030 1035 Glu Cys Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys 1040 1045 1050 Gln Ser Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu 1055 1060 1065 Leu Pro Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr 1070 1075 1080 Asp Val Lys Phe Lys Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala 1085 1090 1095 Gly Glu Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn 1100 1105 1110 Lys Phe Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe 1115 1120 1125 Cys Glu Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala 1130 1135 1140 Glu Tyr Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala 1145 1150 1155 Asn <210> 110 <211> 1214 <212> PRT <213> Flavobacterium columnare <400> 110 Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His 1 5 10 15 Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala 20 25 30 Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn 35 40 45 Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe 50 55 60 Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu 65 70 75 80 Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His 85 90 95 Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile 100 105 110 Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr 115 120 125 Ile Asn Pro Lys Ile Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val 130 135 140 Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu 145 150 155 160 Leu Leu Lys Glu Lys Leu Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln 165 170 175 Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn 180 185 190 Leu Glu Asn Ala Val Phe Asn His Cys Leu Ile Pro Phe Leu Glu Glu 195 200 205 Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr 210 215 220 Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser 225 230 235 240 Gly Leu Val Phe Leu Met Ser Phe Phe Leu His Arg Lys Glu Phe Gln 245 250 255 Val Phe Thr Ser Gly Leu Glu Arg Phe Lys Ala Lys Val Asn Thr Ile 260 265 270 Lys Glu Glu Glu Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile 275 280 285 Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg 290 295 300 Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr 305 310 315 320 His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile 325 330 335 Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser 340 345 350 Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg 355 360 365 Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His 370 375 380 Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met 385 390 395 400 Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val 405 410 415 Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser 420 425 430 Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe 435 440 445 Glu Lys Leu Ser Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys 450 455 460 Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Asn Pro 465 470 475 480 Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg 485 490 495 Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser 500 505 510 Gln Asn Lys Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln 515 520 525 Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys 530 535 540 Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu 545 550 555 560 Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu 565 570 575 Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile 580 585 590 Arg Asp Phe Thr Leu Asp Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr 595 600 605 Leu Ile Lys Thr Ile Asn Thr Asp Ser Ser Val Thr Phe Glu Asn Gln 610 615 620 Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Leu Gln Lys Glu Leu Thr 625 630 635 640 Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Glu His Glu Ile Glu Val 645 650 655 Asp Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro 660 665 670 Lys Asn Lys Val Asp Asp Lys Lys Leu Gln Arg Lys Tyr Val Phe Tyr 675 680 685 Arg Asn Glu Ile Arg Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile 690 695 700 His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu 705 710 715 720 Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile 725 730 735 Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr 740 745 750 Lys Gly Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe 755 760 765 Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Ser Thr Glu Ser 770 775 780 Thr Phe Leu Glu Asn Gly Phe Ile Gly Leu Pro Pro Lys Ile Leu Lys 785 790 795 800 Lys Glu Leu Ser Lys Arg Leu Lys Tyr Ile Phe Ile Val Phe Gln Lys 805 810 815 Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr 820 825 830 Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr 835 840 845 Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe 850 855 860 Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr 865 870 875 880 Pro Asp Ile Val Glu Arg Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg 885 890 895 Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val 900 905 910 Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu 915 920 925 Ser Asp Phe Tyr Val Ser Lys Ala Glu Arg Glu Lys Ile Lys Ala Asp 930 935 940 Ala Lys Ala Tyr Gln Lys Leu Asn Asp Ser Ser Leu Trp Asn Lys Val 945 950 955 960 Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu 965 970 975 Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala 980 985 990 Thr Leu Leu Thr Tyr Asp Ala Arg Thr Trp Thr Tyr Ala Leu Gln Lys 995 1000 1005 Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr 1010 1015 1020 Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys 1025 1030 1035 Glu Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Lys Ile Leu Asp 1040 1045 1050 Lys Phe Tyr Asp Phe Ser Asn Asn Ala Ser His Pro Glu Asp Leu 1055 1060 1065 Glu Ile Glu Asp Lys Lys Gly Lys Arg His Pro Asn Phe Lys Leu 1070 1075 1080 Tyr Ile Thr Lys Ala Leu Leu Lys Asn Glu Ser Glu Ile Ile Asn 1085 1090 1095 Leu Glu Asn Ile Asp Ile Glu Ile Leu Leu Lys Tyr Tyr Asp Tyr 1100 1105 1110 Asn Thr Glu Glu Leu Lys Glu Lys Ile Lys Asn Met Asp Glu Asp 1115 1120 1125 Glu Lys Ala Lys Ile Ile Asn Thr Lys Glu Asn Tyr Asn Lys Ile 1130 1135 1140 Thr Asn Val Leu Ile Lys Lys Ala Leu Val Leu Ile Ile Ile Arg 1145 1150 1155 Asn Lys Met Ala His Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp 1160 1165 1170 Leu Ala Asn Arg Phe Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala 1175 1180 1185 Thr Tyr Phe Asn Arg Val Phe Glu Thr Ile Thr Lys Glu Leu Trp 1190 1195 1200 Glu Asn Lys Glu Lys Lys Asp Lys Thr Gln Val 1205 1210 <210> 111 <211> 1119 <212> PRT <213> Porphyromonas gingivalis <400> 111 Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Ser Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Lys Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Gly Thr Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Val Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Glu Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Ser Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Lys Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val Gln Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr 1010 1015 1020 Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Gly Asn Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Thr Leu Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Val 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 112 <211> 1175 <212> PRT <213> Porphyromonas sp. <400> 112 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu Arg Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn Cys Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Asp Arg Ala Glu Glu Trp Glu Arg Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Lys Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro 945 950 955 960 Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr 1055 1060 1065 Leu Arg Leu Glu Glu Ser Leu Leu Ser Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 113 <211> 1132 <212> PRT <213> Prevotella intermedia <400> 113 Met Glu Asp Asp Lys Lys Thr Lys Glu Ser Thr Asn Met Leu Asp Asn 1 5 10 15 Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val Tyr 20 25 30 Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn Lys Lys 35 40 45 Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile Lys 50 55 60 Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu Arg Leu 65 70 75 80 Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala Ile Tyr 85 90 95 Thr Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys Gln Ala 100 105 110 Lys Ala Gln Ser Phe Asp Ser Leu Lys His Cys Leu Phe Leu Phe Leu 115 120 125 Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys Tyr Ser 130 135 140 Glu Ser Thr Lys Glu Pro Met Leu Glu Lys Glu Leu Leu Lys Lys Met 145 150 155 160 Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp Tyr Gln 165 170 175 His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu Asp Arg 180 185 190 Thr Glu Glu Glu Phe Asn Tyr Tyr Phe Thr Thr Asn Lys Lys Gly Asn 195 200 205 Ile Thr Ala Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu Lys 210 215 220 Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Arg Gly Phe Lys Asp Asn 225 230 235 240 Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg Ser Arg 245 250 255 Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp Trp 260 265 270 Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser Leu 275 280 285 Tyr Glu Arg Leu Gln Gly Glu Tyr Arg Lys Lys Phe Asn Val Pro Phe 290 295 300 Asp Ser Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys Asn 305 310 315 320 Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg Tyr 325 330 335 Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp Leu 340 345 350 Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Gln Lys 355 360 365 Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile Gln 370 375 380 Glu Phe Ala Lys Gln Asn Arg Thr Asp Glu Trp Lys Ala Ile Val Lys 385 390 395 400 Asp Phe Asp Thr Tyr Glu Thr Ser Glu Glu Pro Tyr Ile Ser Glu Thr 405 410 415 Ala Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe Arg 420 425 430 Asn Asp Asn Asp Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu Asn 435 440 445 Asn Glu Lys Arg Lys Tyr Lys Leu Asp Lys Gln Tyr Gln Ala Glu Ala 450 455 460 Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu 465 470 475 480 Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser Ile Val 485 490 495 Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Ile Tyr Lys Leu Tyr Asp 500 505 510 Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Asp Asp Leu Glu Lys Tyr 515 520 525 Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln Met Val 530 535 540 Ala Ile Leu Tyr Asp Glu His Lys Asp Met Ala Glu Glu Ala Lys Arg 545 550 555 560 Lys Gln Lys Glu Met Val Lys Asp Thr Lys Lys Leu Leu Ala Thr Leu 565 570 575 Glu Lys Gln Thr Gln Gly Glu Ile Glu Asp Gly Gly Arg Asn Ile Arg 580 585 590 Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met Met 595 600 605 Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu Asn Asn 610 615 620 Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu Ala 625 630 635 640 Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val Asn 645 650 655 Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr Lys Trp 660 665 670 Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Ser Tyr Leu Thr Lys 675 680 685 Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu Lys Asn 690 695 700 Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu Thr Leu 705 710 715 720 Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe Thr 725 730 735 Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser Glu Glu 740 745 750 Tyr Glu Lys Val Glu Thr Leu Asp Arg Val Gly Leu Val Thr Lys Val 755 760 765 Ile Pro Leu Phe Phe Lys Lys Glu Asp Ser Lys Asp Lys Glu Glu Tyr 770 775 780 Leu Lys Lys Asp Ala Gln Lys Glu Ile Asn Asn Cys Val Gln Pro Phe 785 790 795 800 Tyr Gly Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro Asp Glu Lys 805 810 815 Asp Phe Leu Pro Ser Glu Glu Arg Lys Lys Leu Trp Gly Asp Lys Lys 820 825 830 Tyr Lys Phe Lys Gly Tyr Lys Ala Lys Val Lys Ser Lys Lys Leu Thr 835 840 845 Asp Lys Glu Lys Glu Glu Tyr Arg Ser Tyr Leu Glu Phe Gln Ser Trp 850 855 860 Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp Ile Val 865 870 875 880 Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys Val Glu Gly 885 890 895 Leu Asn Val Glu Glu Leu Lys Lys Leu Arg Leu Lys Asp Ile Asp Thr 900 905 910 Asp Thr Ala Lys Gln Glu Lys Asn Asn Ile Leu Asn Arg Val Met Pro 915 920 925 Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Asp Ser His Asn Ile 930 935 940 Val Lys Asp Arg Pro Leu His Thr Val Tyr Ile Glu Glu Thr Lys Thr 945 950 955 960 Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp Arg Arg 965 970 975 Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Ser Ser Glu Thr Glu Leu 980 985 990 Lys Ser Asn Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu Gly Glu 995 1000 1005 Tyr Gln Asn Ala Arg Ile Glu Thr Ile Lys Asp Met Leu Leu Leu 1010 1015 1020 Glu Glu Thr Leu Ile Glu Lys Tyr Lys Thr Leu Pro Thr Asp Asn 1025 1030 1035 Phe Ser Asp Met Leu Asn Gly Trp Leu Glu Gly Lys Asp Glu Ala 1040 1045 1050 Asp Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Val Ala Val 1055 1060 1065 Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asn Arg Ile 1070 1075 1080 Ala Phe Ala Asn Ile Asn Pro Phe Ser Leu Ser Ser Ala Asp Thr 1085 1090 1095 Ser Glu Glu Lys Lys Leu Asp Ile Ala Asn Gln Leu Lys Asp Lys 1100 1105 1110 Thr His Lys Ile Ile Lys Arg Ile Ile Glu Ile Glu Lys Pro Ile 1115 1120 1125 Glu Thr Lys Glu 1130 <210> 114 <211> 1134 <212> PRT <213> Prevotella intermedia <400> 114 Met Lys Met Glu Asp Asp Lys Lys Thr Lys Glu Ser Thr Asn Met Leu 1 5 10 15 Asp Asn Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Val Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn 35 40 45 Lys Lys Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala 50 55 60 Ile Lys Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu 65 70 75 80 Arg Leu Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala 85 90 95 Ile Tyr Thr Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys 100 105 110 Gln Ala Lys Ala Gln Ser Phe Asp Ser Leu Lys His Cys Leu Phe Leu 115 120 125 Phe Leu Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys 130 135 140 Tyr Ser Glu Ser Thr Lys Glu Pro Met Leu Glu Lys Glu Leu Leu Lys 145 150 155 160 Lys Met Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp 165 170 175 Tyr Gln His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu 180 185 190 Asp Arg Thr Glu Glu Glu Phe Asn Tyr Tyr Phe Thr Thr Asn Lys Lys 195 200 205 Gly Asn Ile Thr Ala Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu 210 215 220 Glu Lys Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Arg Gly Phe Lys 225 230 235 240 Asp Asn Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg 245 250 255 Ser Arg Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln 260 265 270 Asp Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys 275 280 285 Ser Leu Tyr Glu Arg Leu Gln Gly Glu Tyr Arg Lys Lys Phe Asn Val 290 295 300 Pro Phe Asp Ser Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe 305 310 315 320 Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu 325 330 335 Arg Tyr Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile 340 345 350 Asp Leu Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly 355 360 365 Gln Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg 370 375 380 Ile Gln Glu Phe Ala Lys Gln Asn Arg Thr Asp Glu Trp Lys Ala Ile 385 390 395 400 Val Lys Asp Phe Asp Thr Tyr Glu Thr Ser Glu Glu Pro Tyr Ile Ser 405 410 415 Glu Thr Ala Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg 420 425 430 Phe Arg Asn Asp Asn Asp Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly 435 440 445 Glu Asn Asn Glu Lys Arg Lys Tyr Lys Leu Asp Lys Gln Tyr Gln Ala 450 455 460 Glu Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr 465 470 475 480 Leu Leu Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser 485 490 495 Ile Val Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Ile Tyr Lys Leu 500 505 510 Tyr Asp Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Asp Asp Leu Glu 515 520 525 Lys Tyr Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln 530 535 540 Met Val Ala Ile Leu Tyr Asp Glu His Lys Asp Met Ala Glu Glu Ala 545 550 555 560 Lys Arg Lys Gln Lys Glu Met Val Lys Asp Thr Lys Lys Leu Leu Ala 565 570 575 Thr Leu Glu Lys Gln Thr Gln Gly Glu Ile Glu Asp Gly Gly Arg Asn 580 585 590 Ile Arg Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp 595 600 605 Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu 610 615 620 Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser 625 630 635 640 Leu Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln 645 650 655 Val Asn Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr 660 665 670 Lys Trp Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Ser Tyr Leu 675 680 685 Thr Lys Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu 690 695 700 Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu 705 710 715 720 Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile 725 730 735 Phe Thr Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser 740 745 750 Glu Glu Tyr Glu Lys Val Glu Thr Leu Asp Arg Val Gly Leu Val Thr 755 760 765 Lys Val Ile Pro Leu Phe Phe Lys Lys Glu Asp Ser Lys Asp Lys Glu 770 775 780 Glu Tyr Leu Lys Lys Asp Ala Gln Lys Glu Ile Asn Asn Cys Val Gln 785 790 795 800 Pro Phe Tyr Gly Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro Asp 805 810 815 Glu Lys Asp Phe Leu Pro Ser Glu Glu Arg Lys Lys Leu Trp Gly Asp 820 825 830 Lys Lys Tyr Lys Phe Lys Gly Tyr Lys Ala Lys Val Lys Ser Lys Lys 835 840 845 Leu Thr Asp Lys Glu Lys Glu Glu Tyr Arg Ser Tyr Leu Glu Phe Gln 850 855 860 Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp 865 870 875 880 Ile Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys Val 885 890 895 Glu Gly Leu Asn Val Glu Glu Leu Lys Lys Leu Arg Leu Lys Asp Ile 900 905 910 Asp Thr Asp Thr Ala Lys Gln Glu Lys Asn Asn Ile Leu Asn Arg Val 915 920 925 Met Pro Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Asp Ser His 930 935 940 Asn Ile Val Lys Asp Arg Pro Leu His Thr Val Tyr Ile Glu Glu Thr 945 950 955 960 Lys Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp 965 970 975 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Ser Ser Glu Thr 980 985 990 Glu Leu Lys Ser Asn Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu 995 1000 1005 Gly Glu Tyr Gln Asn Ala Arg Ile Glu Thr Ile Lys Asp Met Leu 1010 1015 1020 Leu Leu Glu Glu Thr Leu Ile Glu Lys Tyr Lys Thr Leu Pro Thr 1025 1030 1035 Asp Asn Phe Ser Asp Met Leu Asn Gly Trp Leu Glu Gly Lys Asp 1040 1045 1050 Glu Ala Asp Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Val 1055 1060 1065 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asn 1070 1075 1080 Arg Ile Ala Phe Ala Asn Ile Asn Pro Phe Ser Leu Ser Ser Ala 1085 1090 1095 Asp Thr Ser Glu Glu Lys Lys Leu Asp Ile Ala Asn Gln Leu Lys 1100 1105 1110 Asp Lys Thr His Lys Ile Ile Lys Arg Ile Ile Glu Ile Glu Lys 1115 1120 1125 Pro Ile Glu Thr Lys Glu 1130 <210> 115 <211> 1133 <212> PRT <213> Prevotella intermedia <400> 115 Met Glu Asp Asp Lys Lys Thr Thr Asp Ser Ile Ser Tyr Glu Leu Lys 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn Lys 35 40 45 Lys Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile 50 55 60 Lys Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu Arg 65 70 75 80 Leu Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala Ile 85 90 95 Tyr Ser Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys Gln 100 105 110 Ala Lys Ala Gln Ser Phe Asp Ser Leu Lys His Cys Leu Phe Leu Phe 115 120 125 Leu Glu Lys Leu Gln Glu Thr Arg Asn Tyr Tyr Ser His Tyr Lys Tyr 130 135 140 Ser Glu Ser Thr Lys Glu Pro Met Leu Glu Lys Glu Leu Leu Lys Lys 145 150 155 160 Met Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp Tyr 165 170 175 Gln His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu Asp 180 185 190 Arg Thr Glu Glu Asp Phe Asn Tyr Tyr Phe Thr Arg Asn Lys Lys Gly 195 200 205 Asn Ile Thr Glu Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu 210 215 220 Lys Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Arg Gly Phe Lys Asp 225 230 235 240 Asn Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg Ser 245 250 255 Arg Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp 260 265 270 Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser 275 280 285 Leu Tyr Glu Arg Leu Gln Gly Glu Asp Arg Glu Lys Phe Lys Val Pro 290 295 300 Phe Asp Pro Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys 305 310 315 320 Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg 325 330 335 Tyr Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp 340 345 350 Leu Gly Thr Phe His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Gln 355 360 365 Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile 370 375 380 Gln Glu Phe Ala Lys Gln Asn Arg Pro Asp Glu Trp Lys Ala Ile Val 385 390 395 400 Lys Asp Leu Asp Thr Tyr Glu Thr Ser Asn Glu Arg Tyr Ile Ser Glu 405 410 415 Thr Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe 420 425 430 Arg Asn Asp Asn Asp Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu 435 440 445 Asn Asn Glu Lys Ser Lys Tyr Lys Leu Asp Lys Gln Tyr Gln Ala Glu 450 455 460 Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu 465 470 475 480 Leu Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser Ile 485 490 495 Val Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Met Tyr Lys Leu Tyr 500 505 510 Asp Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Asp Asp Leu Glu Lys 515 520 525 Tyr Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln Met 530 535 540 Val Ala Ile Leu Tyr Asp Glu His Lys Asp Met Val Lys Glu Ala Lys 545 550 555 560 Arg Lys Gln Arg Lys Met Val Lys Asp Thr Glu Lys Leu Leu Ala Ala 565 570 575 Leu Glu Lys Gln Thr Gln Glu Lys Thr Glu Asp Gly Gly Arg Asn Ile 580 585 590 Arg Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met 595 600 605 Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu Asn 610 615 620 Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu 625 630 635 640 Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val 645 650 655 Asn Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr Lys 660 665 670 Trp Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Ser Tyr Leu Thr 675 680 685 Lys Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu Lys 690 695 700 Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu Thr 705 710 715 720 Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe 725 730 735 Thr Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser Lys 740 745 750 Glu Tyr Glu Lys Val Glu Ala Leu Asp Arg Val Gly Leu Val Thr Lys 755 760 765 Val Ile Pro Leu Phe Phe Lys Lys Glu Asp Ser Lys Asp Lys Glu Glu 770 775 780 Asp Leu Lys Lys Asp Ala Gln Lys Glu Ile Asn Asn Cys Val Gln Pro 785 790 795 800 Phe Tyr Ser Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro Asp Glu 805 810 815 Lys Asp Phe Leu His Arg Glu Glu Arg Ile Glu Leu Trp Asp Lys Lys 820 825 830 Lys Asp Lys Phe Lys Gly Tyr Lys Ala Lys Val Lys Ser Lys Lys Leu 835 840 845 Thr Asp Lys Glu Lys Glu Glu Tyr Arg Ser Tyr Leu Glu Phe Gln Ser 850 855 860 Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp Ile 865 870 875 880 Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys Val Glu 885 890 895 Gly Leu Asn Val Glu Glu Leu Lys Lys Leu Arg Leu Lys Asp Ile Asp 900 905 910 Thr Asp Thr Ala Lys Gln Glu Lys Asn Asn Ile Leu Asn Arg Val Met 915 920 925 Pro Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Asp Ser His Asn 930 935 940 Ile Val Lys Asp Arg Pro Leu His Thr Val Tyr Ile Glu Glu Thr Lys 945 950 955 960 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp Arg 965 970 975 Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Ser Ser Glu Ala Glu 980 985 990 Leu Lys Ser Asn Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu Gly 995 1000 1005 Glu Tyr Gln Asn Ala Arg Ile Glu Thr Ile Lys Asp Met Leu Leu 1010 1015 1020 Leu Glu Glu Thr Leu Ile Glu Lys Tyr Lys Asn Leu Pro Thr Asp 1025 1030 1035 Asn Phe Ser Asp Met Leu Asn Gly Trp Leu Glu Gly Lys Asp Glu 1040 1045 1050 Ala Asp Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Val Ala 1055 1060 1065 Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asn Arg 1070 1075 1080 Ile Ala Phe Ala Asn Ile Asn Pro Phe Ser Leu Ser Ser Ala Asp 1085 1090 1095 Thr Ser Glu Glu Lys Lys Leu Asp Ile Ala Asn Gln Leu Lys Asp 1100 1105 1110 Lys Thr His Lys Ile Ile Lys Arg Ile Ile Glu Ile Glu Lys Pro 1115 1120 1125 Ile Glu Thr Lys Glu 1130 <210> 116 <211> 1127 <212> PRT <213> Prevotella buccae <400> 116 Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile 1 5 10 15 Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Lys Glu Lys Pro 20 25 30 Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe 35 40 45 Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn 50 55 60 Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Gly 65 70 75 80 Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val 85 90 95 Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala 100 105 110 Ala Tyr Glu Met Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg 115 120 125 Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val 130 135 140 Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser 145 150 155 160 His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser 165 170 175 Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val 180 185 190 Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe 195 200 205 Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile 210 215 220 Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met 225 230 235 240 Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys 245 250 255 Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg 260 265 270 Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile 275 280 285 Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met 290 295 300 Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr 305 310 315 320 Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp 325 330 335 Ile Phe Ser Asp Asp Tyr Asn Ala Glu Glu Glu Pro Phe Lys Asn Thr 340 345 350 Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe 355 360 365 Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly 370 375 380 Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu 385 390 395 400 Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp 405 410 415 Phe Ala Pro Gln Asn Gln Pro Glu Glu Trp Arg Lys Leu Val Lys Asp 420 425 430 Leu Asp His Phe Glu Thr Ser Gln Glu Pro Tyr Ile Ser Lys Thr Ala 435 440 445 Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser 450 455 460 Ala His Asn Asn Leu Phe Pro Ser Leu Gln Thr Asp Lys Thr Cys Asn 465 470 475 480 Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe 485 490 495 Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu 500 505 510 Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile 515 520 525 Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala 530 535 540 Asn Asn Glu Ile Asn Ser Ile Ala Asp Leu Thr Arg Arg Leu Gln Asn 545 550 555 560 Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu 565 570 575 Lys Gly Arg Gln Lys Asp Met Gly Lys Glu Ala Glu Arg Lys Ile Gly 580 585 590 Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln 595 600 605 Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys 610 615 620 Ser Gly Lys Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln 625 630 635 640 Pro Val Gln Lys Asp Gln Asn Asn Ile Pro Ile Asn Asn Ser Lys Ala 645 650 655 Asn Ser Thr Glu Tyr Arg Met Leu Gln Arg Ala Leu Ala Leu Phe Gly 660 665 670 Ser Glu Asn Phe Arg Leu Lys Ala Tyr Phe Asn Gln Met Asn Leu Val 675 680 685 Gly Asn Asp Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His 690 695 700 Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys 705 710 715 720 Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His 725 730 735 Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr 740 745 750 Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro 755 760 765 Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp 770 775 780 Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro 785 790 795 800 Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp 805 810 815 Tyr Pro Phe Asn Ile Gly Asn Arg Leu Lys Pro Lys Lys Arg Gln Phe 820 825 830 Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu 835 840 845 Phe Lys Asn Tyr Pro Ser Glu Lys Lys Lys Thr Asp Leu Ala Tyr Leu 850 855 860 Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys 865 870 875 880 Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Asn Met 885 890 895 Ala Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile 900 905 910 Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile 915 920 925 Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly 930 935 940 Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr 945 950 955 960 Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp 965 970 975 Arg Arg Leu Asn Gly Leu Phe Ser Phe Ala Glu Thr Thr Asp Leu Asn 980 985 990 Leu Glu Glu His Pro Ile Ser Lys Leu Ser Val Asp Leu Glu Leu Ile 995 1000 1005 Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly 1010 1015 1020 Leu Glu Lys Lys Leu Ile Asp Lys Tyr Ser Thr Leu Pro Thr Asp 1025 1030 1035 Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn 1040 1045 1050 Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg 1055 1060 1065 Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu 1070 1075 1080 Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr 1085 1090 1095 Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val 1100 1105 1110 Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn 1115 1120 1125 <210> 117 <211> 1125 <212> PRT <213> Prevotella pallens <400> 117 Met Lys Glu Glu Glu Lys Gly Lys Thr Pro Val Val Ser Thr Tyr Asn 1 5 10 15 Lys Asp Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His 20 25 30 Asn Val Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Gly Glu Gly 35 40 45 Glu Ile Asn Arg Asp Gly Tyr Glu Asn Thr Leu Glu Lys Ser Trp Asn 50 55 60 Glu Ile Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile 65 70 75 80 Lys His Phe Pro Phe Leu Glu Val Thr Thr Tyr Gln Arg Asn Ser Ala 85 90 95 Asp Thr Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu 100 105 110 Glu Ser Leu Lys Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp 115 120 125 Leu Arg Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg 130 135 140 Pro Lys Phe Glu Glu Asp Leu Gln Glu Lys Met Tyr Asn Ile Phe Asp 145 150 155 160 Ala Ser Ile Gln Leu Val Lys Glu Asp Tyr Lys His Asn Thr Asp Ile 165 170 175 Lys Thr Glu Glu Asp Phe Lys His Leu Asp Arg Lys Gly Gln Phe Lys 180 185 190 Tyr Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu 195 200 205 Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Val Gln 210 215 220 Lys Lys Leu Glu Gly Phe Lys Cys Ser Asn Glu Ser Tyr Gln Lys Met 225 230 235 240 Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg 245 250 255 Leu Gln Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn 260 265 270 Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Arg Glu Glu 275 280 285 Asp Arg Lys Lys Phe Arg Val Pro Ile Glu Ile Ala Asp Glu Asp Tyr 290 295 300 Asp Ala Glu Gln Glu Pro Phe Lys Asn Ala Leu Val Arg His Gln Asp 305 310 315 320 Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe 325 330 335 Thr Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile 340 345 350 Tyr Lys Lys Gln Ile Gly Asp Tyr Lys Glu Ser His His Leu Thr His 355 360 365 Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Thr Lys Gln Asn Arg 370 375 380 Pro Asp Glu Trp Arg Lys Phe Val Lys Thr Phe Asn Ser Phe Glu Thr 385 390 395 400 Ser Lys Glu Pro Tyr Ile Pro Glu Thr Thr Pro His Tyr His Leu Glu 405 410 415 Asn Gln Lys Ile Gly Ile Arg Phe Arg Asn Asp Asn Asp Lys Ile Trp 420 425 430 Pro Ser Leu Lys Thr Asn Ser Glu Lys Asn Glu Lys Ser Lys Tyr Lys 435 440 445 Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu 450 455 460 Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu Asn Thr Asp 465 470 475 480 Asn Asp Asn Glu Ile Glu Thr Lys Lys Lys Glu Asn Lys Asn Asp Lys 485 490 495 Gln Glu Lys His Lys Ile Glu Glu Ile Ile Glu Asn Lys Ile Thr Glu 500 505 510 Ile Tyr Ala Leu Tyr Asp Ala Phe Ala Asn Gly Lys Ile Asn Ser Ile 515 520 525 Asp Lys Leu Glu Glu Tyr Cys Lys Gly Lys Asp Ile Glu Ile Gly His 530 535 540 Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Ser Glu His Lys Asp Met 545 550 555 560 Ala Thr Glu Ala Lys Arg Lys Gln Glu Glu Met Leu Ala Asp Val Gln 565 570 575 Lys Ser Leu Glu Ser Leu Asp Asn Gln Ile Asn Glu Glu Ile Glu Asn 580 585 590 Val Glu Arg Lys Asn Ser Ser Leu Lys Ser Gly Glu Ile Ala Ser Trp 595 600 605 Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu 610 615 620 Gly Asn Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met 625 630 635 640 Leu Gln Arg Ser Leu Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg 645 650 655 Tyr Phe Arg Gln Val Asn Leu Ile Glu Ser Ser Asn Pro His Pro Phe 660 665 670 Leu Asn Asn Thr Glu Trp Glu Lys Cys Asn Asn Ile Leu Ser Phe Tyr 675 680 685 Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu Ser Leu Lys Pro 690 695 700 Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro Lys 705 710 715 720 Thr Asn Cys Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu 725 730 735 Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Glu His 740 745 750 Arg Lys Asn Ile Thr Val Ala Glu Leu Lys Arg Val Gly Leu Val Ala 755 760 765 Lys Val Ile Pro Leu Phe Phe Ser Glu Glu Tyr Lys Asp Ser Val Gln 770 775 780 Pro Phe Tyr Asn Tyr Leu Phe Asn Val Gly Asn Ile Asn Lys Pro Asp 785 790 795 800 Glu Lys Asn Phe Leu Asn Cys Glu Glu Arg Arg Glu Leu Leu Arg Lys 805 810 815 Lys Lys Asp Glu Phe Lys Lys Met Thr Asp Lys Glu Lys Glu Glu Asn 820 825 830 Pro Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu 835 840 845 Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Met Glu 850 855 860 Leu Phe Asn Lys Lys Lys Ile Lys Glu Leu Asn Val Glu Lys Ile Tyr 865 870 875 880 Leu Lys Asn Ile Asn Thr Asn Thr Thr Lys Lys Glu Lys Asn Thr Glu 885 890 895 Glu Lys Asn Gly Glu Glu Lys Ile Ile Lys Glu Lys Asn Asn Ile Leu 900 905 910 Asn Arg Ile Met Pro Met Arg Leu Pro Ile Lys Val Tyr Gly Arg Glu 915 920 925 Asn Phe Ser Lys Asn Lys Lys Lys Lys Ile Arg Arg Asn Thr Phe Phe 930 935 940 Thr Val Tyr Ile Glu Glu Lys Gly Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ala Leu Glu Arg Asp Arg Arg Leu Gly Gly Leu Phe Ser Phe 965 970 975 Val Lys Thr His Ser Lys Ala Glu Ser Lys Ser Asn Thr Ile Ser Lys 980 985 990 Ser Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Lys Ala Arg Ile Glu 995 1000 1005 Ile Ile Lys Asp Met Leu Ala Leu Glu Glu Thr Leu Ile Asp Lys 1010 1015 1020 Tyr Asn Ser Leu Asp Thr Asp Asn Phe His Asn Met Leu Thr Gly 1025 1030 1035 Trp Leu Lys Leu Lys Asp Glu Pro Asp Lys Ala Ser Phe Gln Asn 1040 1045 1050 Asp Val Asp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn 1055 1060 1065 Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn Pro 1070 1075 1080 Phe Ser Leu Ser Ser Ala Asn Thr Ser Glu Glu Lys Gly Leu Gly 1085 1090 1095 Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Thr Ile Glu Lys 1100 1105 1110 Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu 1115 1120 1125 <210> 118 <211> 1157 <212> PRT <213> Myroides odoratimimus <400> 118 Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe 1 5 10 15 Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn 20 25 30 Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg 35 40 45 Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn 50 55 60 Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu 65 70 75 80 Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val 85 90 95 Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu 100 105 110 Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr 115 120 125 Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu 130 135 140 Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val 145 150 155 160 Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr 165 170 175 Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile 180 185 190 Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys 195 200 205 Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe 210 215 220 Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala 225 230 235 240 Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp 245 250 255 Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu 260 265 270 Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu 275 280 285 Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys 290 295 300 Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu 305 310 315 320 Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu 325 330 335 Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln 340 345 350 His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu 355 360 365 Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg 370 375 380 Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr 385 390 395 400 Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg 405 410 415 Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln 420 425 430 Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val 435 440 445 Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Asn Tyr Phe His 450 455 460 Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu 465 470 475 480 Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His 485 490 495 Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu 500 505 510 Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys 515 520 525 Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp 530 535 540 Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys 545 550 555 560 Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp 565 570 575 Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys 580 585 590 Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys 595 600 605 Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys 610 615 620 Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr 625 630 635 640 Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu 645 650 655 Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe 660 665 670 Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu 675 680 685 Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met 690 695 700 Thr Glu Glu Phe Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu 705 710 715 720 Gln Lys Leu Phe Ala Tyr Tyr Asp Thr Ser Lys Ser Asp Leu Asp Leu 725 730 735 Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile 740 745 750 Ala Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr 755 760 765 Leu Glu Ala Arg Leu Gly Tyr Met Glu Asn Val Ile Thr Arg Val Lys 770 775 780 Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe 785 790 795 800 Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp Lys Gln 805 810 815 Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met 820 825 830 Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys 835 840 845 Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr 850 855 860 Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu Asp Lys 865 870 875 880 Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn 885 890 895 Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu 900 905 910 Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr 915 920 925 Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu 930 935 940 Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys 945 950 955 960 Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn 965 970 975 Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr 980 985 990 Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val Asp Ser 995 1000 1005 Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser 1010 1015 1020 Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys 1025 1030 1035 Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser 1040 1045 1050 Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Val Pro 1055 1060 1065 Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val 1070 1075 1080 Lys Phe Ile Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala Gly Glu 1085 1090 1095 Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe 1100 1105 1110 Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu 1115 1120 1125 Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr 1130 1135 1140 Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Thr Ser 1145 1150 1155 <210> 119 <211> 1157 <212> PRT <213> Myroides odoratimimus <400> 119 Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe 1 5 10 15 Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn 20 25 30 Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg 35 40 45 Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn 50 55 60 Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu 65 70 75 80 Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val 85 90 95 Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu 100 105 110 Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr 115 120 125 Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu 130 135 140 Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val 145 150 155 160 Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr 165 170 175 Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile 180 185 190 Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys 195 200 205 Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe 210 215 220 Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala 225 230 235 240 Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp 245 250 255 Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu 260 265 270 Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu 275 280 285 Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys 290 295 300 Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu 305 310 315 320 Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu 325 330 335 Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln 340 345 350 His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu 355 360 365 Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg 370 375 380 Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr 385 390 395 400 Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg 405 410 415 Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln 420 425 430 Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val 435 440 445 Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr Phe His 450 455 460 Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu 465 470 475 480 Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His 485 490 495 Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu 500 505 510 Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys 515 520 525 Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp 530 535 540 Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys 545 550 555 560 Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp 565 570 575 Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys 580 585 590 Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys 595 600 605 Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys 610 615 620 Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr 625 630 635 640 Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu 645 650 655 Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe 660 665 670 Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu 675 680 685 Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met 690 695 700 Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu 705 710 715 720 Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu Glu Leu 725 730 735 Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile 740 745 750 Asp Leu Val Arg Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr 755 760 765 Leu Glu Ala Arg Leu Gly Tyr Ile Glu Asn Val Ile Thr Arg Val Lys 770 775 780 Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe 785 790 795 800 Ala Phe Leu Lys Glu Ser Asn Tyr Thr Val Ala Ser Leu Asp Lys Gln 805 810 815 Ile Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met 820 825 830 Asp Ser Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys 835 840 845 Glu Asp Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr 850 855 860 Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Ile Thr Glu Asp Lys 865 870 875 880 Arg Glu Gln Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn 885 890 895 Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu 900 905 910 Lys Leu Pro Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr 915 920 925 Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu 930 935 940 Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys 945 950 955 960 Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn 965 970 975 Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr 980 985 990 Gln Ser Asp Ile Val Trp Ser Gly Tyr Leu Ser Asn Glu Val Asp Ser 995 1000 1005 Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser 1010 1015 1020 Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys 1025 1030 1035 Ile Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser 1040 1045 1050 Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Leu Pro 1055 1060 1065 Arg Gly Thr Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val 1070 1075 1080 Lys Phe Lys Lys Glu Glu Ile Met Gln Leu Gly Gln Val Arg Glu 1085 1090 1095 Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe 1100 1105 1110 Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu 1115 1120 1125 Asn Asn Tyr Arg Pro Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr 1130 1135 1140 Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala Ser 1145 1150 1155 <210> 120 <211> 1224 <212> PRT <213> Bergeyella zoohelcum <400> 120 Met Glu Asn Lys Thr Ser Leu Gly Asn Asn Ile Tyr Tyr Asn Pro Phe 1 5 10 15 Lys Pro Gln Asp Lys Ser Tyr Phe Ala Gly Tyr Phe Asn Ala Ala Met 20 25 30 Glu Asn Thr Asp Ser Val Phe Arg Glu Leu Gly Lys Arg Leu Lys Gly 35 40 45 Lys Glu Tyr Thr Ser Glu Asn Phe Phe Asp Ala Ile Phe Lys Glu Asn 50 55 60 Ile Ser Leu Val Glu Tyr Glu Arg Tyr Val Lys Leu Leu Ser Asp Tyr 65 70 75 80 Phe Pro Met Ala Arg Leu Leu Asp Lys Lys Glu Val Pro Ile Lys Glu 85 90 95 Arg Lys Glu Asn Phe Lys Lys Asn Phe Lys Gly Ile Ile Lys Ala Val 100 105 110 Arg Asp Leu Arg Asn Phe Tyr Thr His Lys Glu His Gly Glu Val Glu 115 120 125 Ile Thr Asp Glu Ile Phe Gly Val Leu Asp Glu Met Leu Lys Ser Thr 130 135 140 Val Leu Thr Val Lys Lys Lys Lys Val Lys Thr Asp Lys Thr Lys Glu 145 150 155 160 Ile Leu Lys Lys Ser Ile Glu Lys Gln Leu Asp Ile Leu Cys Gln Lys 165 170 175 Lys Leu Glu Tyr Leu Arg Asp Thr Ala Arg Lys Ile Glu Glu Lys Arg 180 185 190 Arg Asn Gln Arg Glu Arg Gly Glu Lys Glu Leu Val Ala Pro Phe Lys 195 200 205 Tyr Ser Asp Lys Arg Asp Asp Leu Ile Ala Ala Ile Tyr Asn Asp Ala 210 215 220 Phe Asp Val Tyr Ile Asp Lys Lys Lys Asp Ser Leu Lys Glu Ser Ser 225 230 235 240 Lys Ala Lys Tyr Asn Thr Lys Ser Asp Pro Gln Gln Glu Glu Gly Asp 245 250 255 Leu Lys Ile Pro Ile Ser Lys Asn Gly Val Val Phe Leu Leu Ser Leu 260 265 270 Phe Leu Thr Lys Gln Glu Ile His Ala Phe Lys Ser Lys Ile Ala Gly 275 280 285 Phe Lys Ala Thr Val Ile Asp Glu Ala Thr Val Ser Glu Ala Thr Val 290 295 300 Ser His Gly Lys Asn Ser Ile Cys Phe Met Ala Thr His Glu Ile Phe 305 310 315 320 Ser His Leu Ala Tyr Lys Lys Leu Lys Arg Lys Val Arg Thr Ala Glu 325 330 335 Ile Asn Tyr Gly Glu Ala Glu Asn Ala Glu Gln Leu Ser Val Tyr Ala 340 345 350 Lys Glu Thr Leu Met Met Gln Met Leu Asp Glu Leu Ser Lys Val Pro 355 360 365 Asp Val Val Tyr Gln Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile 370 375 380 Glu Asp Trp Asn Glu Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr 385 390 395 400 Met Glu Glu Glu Gln Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu 405 410 415 Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln 420 425 430 Phe Pro Thr Leu Arg Phe Gln Val His Leu Gly Asn Tyr Leu His Asp 435 440 445 Ser Arg Pro Lys Glu Asn Leu Ile Ser Asp Arg Arg Ile Lys Glu Lys 450 455 460 Ile Thr Val Phe Gly Arg Leu Ser Glu Leu Glu His Lys Lys Ala Leu 465 470 475 480 Phe Ile Lys Asn Thr Glu Thr Asn Glu Asp Arg Glu His Tyr Trp Glu 485 490 495 Ile Phe Pro Asn Pro Asn Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val 500 505 510 Asn Asp Lys Asp Phe Pro Ile Ala Gly Ser Ile Leu Asp Arg Glu Lys 515 520 525 Gln Pro Val Ala Gly Lys Ile Gly Ile Lys Val Lys Leu Leu Asn Gln 530 535 540 Gln Tyr Val Ser Glu Val Asp Lys Ala Val Lys Ala His Gln Leu Lys 545 550 555 560 Gln Arg Lys Ala Ser Lys Pro Ser Ile Gln Asn Ile Ile Glu Glu Ile 565 570 575 Val Pro Ile Asn Glu Ser Asn Pro Lys Glu Ala Ile Val Phe Gly Gly 580 585 590 Gln Pro Thr Ala Tyr Leu Ser Met Asn Asp Ile His Ser Ile Leu Tyr 595 600 605 Glu Phe Phe Asp Lys Trp Glu Lys Lys Lys Glu Lys Leu Glu Lys Lys 610 615 620 Gly Glu Lys Glu Leu Arg Lys Glu Ile Gly Lys Glu Leu Glu Lys Lys 625 630 635 640 Ile Val Gly Lys Ile Gln Ala Gln Ile Gln Gln Ile Ile Asp Lys Asp 645 650 655 Thr Asn Ala Lys Ile Leu Lys Pro Tyr Gln Asp Gly Asn Ser Thr Ala 660 665 670 Ile Asp Lys Glu Lys Leu Ile Lys Asp Leu Lys Gln Glu Gln Asn Ile 675 680 685 Leu Gln Lys Leu Lys Asp Glu Gln Thr Val Arg Glu Lys Glu Tyr Asn 690 695 700 Asp Phe Ile Ala Tyr Gln Asp Lys Asn Arg Glu Ile Asn Lys Val Arg 705 710 715 720 Asp Arg Asn His Lys Gln Tyr Leu Lys Asp Asn Leu Lys Arg Lys Tyr 725 730 735 Pro Glu Ala Pro Ala Arg Lys Glu Val Leu Tyr Tyr Arg Glu Lys Gly 740 745 750 Lys Val Ala Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Thr 755 760 765 Asp Phe Lys Asn Glu Trp Lys Gly Glu Gln His Ser Leu Leu Gln Lys 770 775 780 Ser Leu Ala Tyr Tyr Glu Gln Cys Lys Glu Glu Leu Lys Asn Leu Leu 785 790 795 800 Pro Glu Lys Val Phe Gln His Leu Pro Phe Lys Leu Gly Gly Tyr Phe 805 810 815 Gln Gln Lys Tyr Leu Tyr Gln Phe Tyr Thr Cys Tyr Leu Asp Lys Arg 820 825 830 Leu Glu Tyr Ile Ser Gly Leu Val Gln Gln Ala Glu Asn Phe Lys Ser 835 840 845 Glu Asn Lys Val Phe Lys Lys Val Glu Asn Glu Cys Phe Lys Phe Leu 850 855 860 Lys Lys Gln Asn Tyr Thr His Lys Glu Leu Asp Ala Arg Val Gln Ser 865 870 875 880 Ile Leu Gly Tyr Pro Ile Phe Leu Glu Arg Gly Phe Met Asp Glu Lys 885 890 895 Pro Thr Ile Ile Lys Gly Lys Thr Phe Lys Gly Asn Glu Ala Leu Phe 900 905 910 Ala Asp Trp Phe Arg Tyr Tyr Lys Glu Tyr Gln Asn Phe Gln Thr Phe 915 920 925 Tyr Asp Thr Glu Asn Tyr Pro Leu Val Glu Leu Glu Lys Lys Gln Ala 930 935 940 Asp Arg Lys Arg Lys Thr Lys Ile Tyr Gln Gln Lys Lys Asn Asp Val 945 950 955 960 Phe Thr Leu Leu Met Ala Lys His Ile Phe Lys Ser Val Phe Lys Gln 965 970 975 Asp Ser Ile Asp Gln Phe Ser Leu Glu Asp Leu Tyr Gln Ser Arg Glu 980 985 990 Glu Arg Leu Gly Asn Gln Glu Arg Ala Arg Gln Thr Gly Glu Arg Asn 995 1000 1005 Thr Asn Tyr Ile Trp Asn Lys Thr Val Asp Leu Lys Leu Cys Asp 1010 1015 1020 Gly Lys Ile Thr Val Glu Asn Val Lys Leu Lys Asn Val Gly Asp 1025 1030 1035 Phe Ile Lys Tyr Glu Tyr Asp Gln Arg Val Gln Ala Phe Leu Lys 1040 1045 1050 Tyr Glu Glu Asn Ile Glu Trp Gln Ala Phe Leu Ile Lys Glu Ser 1055 1060 1065 Lys Glu Glu Glu Asn Tyr Pro Tyr Val Val Glu Arg Glu Ile Glu 1070 1075 1080 Gln Tyr Glu Lys Val Arg Arg Glu Glu Leu Leu Lys Glu Val His 1085 1090 1095 Leu Ile Glu Glu Tyr Ile Leu Glu Lys Val Lys Asp Lys Glu Ile 1100 1105 1110 Leu Lys Lys Gly Asp Asn Gln Asn Phe Lys Tyr Tyr Ile Leu Asn 1115 1120 1125 Gly Leu Leu Lys Gln Leu Lys Asn Glu Asp Val Glu Ser Tyr Lys 1130 1135 1140 Val Phe Asn Leu Asn Thr Glu Pro Glu Asp Val Asn Ile Asn Gln 1145 1150 1155 Leu Lys Gln Glu Ala Thr Asp Leu Glu Gln Lys Ala Phe Val Leu 1160 1165 1170 Thr Tyr Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Lys Lys 1175 1180 1185 Glu Phe Trp Asp Tyr Cys Gln Glu Lys Tyr Gly Lys Ile Glu Lys 1190 1195 1200 Glu Lys Thr Tyr Ala Glu Tyr Phe Ala Glu Val Phe Lys Lys Glu 1205 1210 1215 Lys Glu Ala Leu Ile Lys 1220 <210> 121 <211> 1150 <212> PRT <213> Prevotella saccharolytica <400> 121 Met Met Glu Lys Glu Asn Val Gln Gly Ser His Ile Tyr Tyr Glu Pro 1 5 10 15 Thr Asp Lys Cys Phe Trp Ala Ala Phe Tyr Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Leu Thr Ile Ala His Ile Asn Ser Phe Val Asn Ser Lys Lys 35 40 45 Gly Ile Asn Asn Asp Asp Lys Val Leu Asp Ile Ile Asp Asp Trp Ser 50 55 60 Lys Phe Asp Asn Asp Leu Leu Met Gly Ala Arg Leu Asn Lys Leu Ile 65 70 75 80 Leu Lys His Phe Pro Phe Leu Lys Ala Pro Leu Tyr Gln Leu Ala Lys 85 90 95 Arg Lys Thr Arg Lys Gln Gln Gly Lys Glu Gln Gln Asp Tyr Glu Lys 100 105 110 Lys Gly Asp Glu Asp Pro Glu Val Ile Gln Glu Ala Ile Ala Asn Ala 115 120 125 Phe Lys Met Ala Asn Val Arg Lys Thr Leu His Ala Phe Leu Lys Gln 130 135 140 Leu Glu Asp Leu Arg Asn His Phe Ser His Tyr Asn Tyr Asn Ser Pro 145 150 155 160 Ala Lys Lys Met Glu Val Lys Phe Asp Asp Gly Phe Cys Asn Lys Leu 165 170 175 Tyr Tyr Val Phe Asp Ala Ala Leu Gln Met Val Lys Asp Asp Asn Arg 180 185 190 Met Asn Pro Glu Ile Asn Met Gln Thr Asp Phe Glu His Leu Val Arg 195 200 205 Leu Gly Arg Asn Arg Lys Ile Pro Asn Thr Phe Lys Tyr Asn Phe Thr 210 215 220 Asn Ser Asp Gly Thr Ile Asn Asn Asn Gly Leu Leu Phe Phe Val Ser 225 230 235 240 Leu Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Lys 245 250 255 Gly Phe Lys Gly Gly Thr Glu Asn Tyr Met Arg Met Thr Asn Glu Val 260 265 270 Phe Cys Arg Asn Arg Met Val Ile Pro Lys Leu Arg Leu Glu Thr Asp 275 280 285 Tyr Asp Asn His Gln Leu Met Phe Asp Met Leu Asn Glu Leu Val Arg 290 295 300 Cys Pro Leu Ser Leu Tyr Lys Arg Leu Lys Gln Glu Asp Gln Asp Lys 305 310 315 320 Phe Arg Val Pro Ile Glu Phe Leu Asp Glu Asp Asn Glu Ala Asp Asn 325 330 335 Pro Tyr Gln Glu Asn Ala Asn Ser Asp Glu Asn Pro Thr Glu Glu Thr 340 345 350 Asp Pro Leu Lys Asn Thr Leu Val Arg His Gln His Arg Phe Pro Tyr 355 360 365 Phe Val Leu Arg Tyr Phe Asp Leu Asn Glu Val Phe Lys Gln Leu Arg 370 375 380 Phe Gln Ile Asn Leu Gly Cys Tyr His Phe Ser Ile Tyr Asp Lys Thr 385 390 395 400 Ile Gly Glu Arg Thr Glu Lys Arg His Leu Thr Arg Thr Leu Phe Gly 405 410 415 Phe Asp Arg Leu Gln Asn Phe Ser Val Lys Leu Gln Pro Glu His Trp 420 425 430 Lys Asn Met Val Lys His Leu Asp Thr Glu Glu Ser Ser Asp Lys Pro 435 440 445 Tyr Leu Ser Asp Ala Met Pro His Tyr Gln Ile Glu Asn Glu Lys Ile 450 455 460 Gly Ile His Phe Leu Lys Thr Asp Thr Glu Lys Lys Glu Thr Val Trp 465 470 475 480 Pro Ser Leu Glu Val Glu Glu Val Ser Ser Asn Arg Asn Lys Tyr Lys 485 490 495 Ser Glu Lys Asn Leu Thr Ala Asp Ala Phe Leu Ser Thr His Glu Leu 500 505 510 Leu Pro Met Met Phe Tyr Tyr Gln Leu Leu Ser Ser Glu Glu Lys Thr 515 520 525 Arg Ala Ala Ala Gly Asp Lys Val Gln Gly Val Leu Gln Ser Tyr Arg 530 535 540 Lys Lys Ile Phe Asp Ile Tyr Asp Asp Phe Ala Asn Gly Thr Ile Asn 545 550 555 560 Ser Met Gln Lys Leu Asp Glu Arg Leu Ala Lys Asp Asn Leu Leu Arg 565 570 575 Gly Asn Met Pro Gln Gln Met Leu Ala Ile Leu Glu His Gln Glu Pro 580 585 590 Asp Met Glu Gln Lys Ala Lys Glu Lys Leu Asp Arg Leu Ile Thr Glu 595 600 605 Thr Lys Lys Arg Ile Gly Lys Leu Glu Asp Gln Phe Lys Gln Lys Val 610 615 620 Arg Ile Gly Lys Arg Arg Ala Asp Leu Pro Lys Val Gly Ser Ile Ala 625 630 635 640 Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln Pro Ala Lys Arg Asn 645 650 655 Ala Asp Asn Thr Gly Val Pro Asp Ser Lys Ala Asn Ser Thr Glu Tyr 660 665 670 Arg Leu Leu Gln Glu Ala Leu Ala Phe Tyr Ser Ala Tyr Lys Asp Arg 675 680 685 Leu Glu Pro Tyr Phe Arg Gln Val Asn Leu Ile Gly Gly Thr Asn Pro 690 695 700 His Pro Phe Leu His Arg Val Asp Trp Lys Lys Cys Asn His Leu Leu 705 710 715 720 Ser Phe Tyr His Asp Tyr Leu Glu Ala Lys Glu Gln Tyr Leu Ser His 725 730 735 Leu Ser Pro Ala Asp Trp Gln Lys His Gln His Phe Leu Leu Leu Lys 740 745 750 Val Arg Lys Asp Ile Gln Asn Glu Lys Lys Asp Trp Lys Lys Ser Leu 755 760 765 Val Ala Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Leu Phe Thr 770 775 780 Glu Ser Ile Lys Thr Trp Phe Ser Thr Asp Ala Asp Lys Val Gln Ile 785 790 795 800 Thr Asp Thr Lys Leu Phe Glu Asn Arg Val Gly Leu Ile Ala Lys Leu 805 810 815 Ile Pro Leu Tyr Tyr Asp Lys Val Tyr Asn Asp Lys Pro Gln Pro Phe 820 825 830 Tyr Gln Tyr Pro Phe Asn Ile Asn Asp Arg Tyr Lys Pro Glu Asp Thr 835 840 845 Arg Lys Arg Phe Thr Ala Ala Ser Ser Lys Leu Trp Asn Glu Lys Lys 850 855 860 Met Leu Tyr Lys Asn Ala Gln Pro Asp Ser Ser Asp Lys Ile Glu Tyr 865 870 875 880 Pro Gln Tyr Leu Asp Phe Leu Ser Trp Lys Lys Leu Glu Arg Glu Leu 885 890 895 Arg Met Leu Arg Asn Gln Asp Met Met Val Trp Leu Met Cys Lys Asp 900 905 910 Leu Phe Ala Gln Cys Thr Val Glu Gly Val Glu Phe Ala Asp Leu Lys 915 920 925 Leu Ser Gln Leu Glu Val Asp Val Asn Val Gln Asp Asn Leu Asn Val 930 935 940 Leu Asn Asn Val Ser Ser Met Ile Leu Pro Leu Ser Val Tyr Pro Ser 945 950 955 960 Asp Ala Gln Gly Asn Val Leu Arg Asn Ser Lys Pro Leu His Thr Val 965 970 975 Tyr Val Gln Glu Asn Asn Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys 980 985 990 Ser Leu Leu Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Ile Ala 995 1000 1005 Ala Glu Gly Glu Asp Leu Gln Gln His Pro Leu Thr Lys Asn Arg 1010 1015 1020 Leu Glu Tyr Glu Leu Ser Ile Tyr Gln Thr Met Arg Ile Ser Val 1025 1030 1035 Phe Glu Gln Thr Leu Gln Leu Glu Lys Ala Ile Leu Thr Arg Asn 1040 1045 1050 Lys Thr Leu Cys Gly Asn Asn Phe Asn Asn Leu Leu Asn Ser Trp 1055 1060 1065 Ser Glu His Arg Thr Asp Lys Lys Thr Leu Gln Pro Asp Ile Asp 1070 1075 1080 Phe Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro 1085 1090 1095 Met Ser Thr Asn Thr Val Met Gln Gly Ile Glu Lys Phe Asn Ile 1100 1105 1110 Gln Thr Pro Lys Leu Glu Glu Lys Asp Gly Leu Gly Ile Ala Ser 1115 1120 1125 Gln Leu Ala Lys Lys Thr Lys Asp Ala Ala Ser Arg Leu Gln Asn 1130 1135 1140 Ile Ile Asn Gly Gly Thr Asn 1145 1150 <210> 122 <211> 1175 <212> PRT <213> Porphyromonas gingivalis <400> 122 Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Cys Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln Leu Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala 500 505 510 Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asp Thr Leu Asp 530 535 540 Arg Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Asn Ala Ser Arg Glu Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr Leu Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr 945 950 955 960 Asp Val His Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Gln Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr 1055 1060 1065 Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Asp Lys Trp Pro Asp Leu His Gly Asn Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Thr Leu Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Met Val Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 123 <211> 1115 <212> PRT <213> Bacteroides pyogenes <400> 123 Met Glu Ser Ile Lys Asn Ser Gln Lys Ser Thr Gly Lys Thr Leu Gln 1 5 10 15 Lys Asp Pro Pro Tyr Phe Gly Leu Tyr Leu Asn Met Ala Leu Leu Asn 20 25 30 Val Arg Lys Val Glu Asn His Ile Arg Lys Trp Leu Gly Asp Val Ala 35 40 45 Leu Leu Pro Glu Lys Ser Gly Phe His Ser Leu Leu Thr Thr Asp Asn 50 55 60 Leu Ser Ser Ala Lys Trp Thr Arg Phe Tyr Tyr Lys Ser Arg Lys Phe 65 70 75 80 Leu Pro Phe Leu Glu Met Phe Asp Ser Asp Lys Lys Ser Tyr Glu Asn 85 90 95 Arg Arg Glu Thr Thr Glu Cys Leu Asp Thr Ile Asp Arg Gln Lys Ile 100 105 110 Ser Ser Leu Leu Lys Glu Val Tyr Gly Lys Leu Gln Asp Ile Arg Asn 115 120 125 Ala Phe Ser His Tyr His Ile Asp Asp Gln Ser Val Lys His Thr Ala 130 135 140 Leu Ile Ile Ser Ser Glu Met His Arg Phe Ile Glu Asn Ala Tyr Ser 145 150 155 160 Phe Ala Leu Gln Lys Thr Arg Ala Arg Phe Thr Gly Val Phe Val Glu 165 170 175 Thr Asp Phe Leu Gln Ala Glu Glu Lys Gly Asp Asn Lys Lys Phe Phe 180 185 190 Ala Ile Gly Gly Asn Glu Gly Ile Lys Leu Lys Asp Asn Ala Leu Ile 195 200 205 Phe Leu Ile Cys Leu Phe Leu Asp Arg Glu Glu Ala Phe Lys Phe Leu 210 215 220 Ser Arg Ala Thr Gly Phe Lys Ser Thr Lys Glu Lys Gly Phe Leu Ala 225 230 235 240 Val Arg Glu Thr Phe Cys Ala Leu Cys Cys Arg Gln Pro His Glu Arg 245 250 255 Leu Leu Ser Val Asn Pro Arg Glu Ala Leu Leu Met Asp Met Leu Asn 260 265 270 Glu Leu Asn Arg Cys Pro Asp Ile Leu Phe Glu Met Leu Asp Glu Lys 275 280 285 Asp Gln Lys Ser Phe Leu Pro Leu Leu Gly Glu Glu Glu Gln Ala His 290 295 300 Ile Leu Glu Asn Ser Leu Asn Asp Glu Leu Cys Glu Ala Ile Asp Asp 305 310 315 320 Pro Phe Glu Met Ile Ala Ser Leu Ser Lys Arg Val Arg Tyr Lys Asn 325 330 335 Arg Phe Pro Tyr Leu Met Leu Arg Tyr Ile Glu Glu Lys Asn Leu Leu 340 345 350 Pro Phe Ile Arg Phe Arg Ile Asp Leu Gly Cys Leu Glu Leu Ala Ser 355 360 365 Tyr Pro Lys Lys Met Gly Glu Glu Asn Asn Tyr Glu Arg Ser Val Thr 370 375 380 Asp His Ala Met Ala Phe Gly Arg Leu Thr Asp Phe His Asn Glu Asp 385 390 395 400 Ala Val Leu Gln Gln Ile Thr Lys Gly Ile Thr Asp Glu Val Arg Phe 405 410 415 Ser Leu Tyr Ala Pro Arg Tyr Ala Ile Tyr Asn Asn Lys Ile Gly Phe 420 425 430 Val Arg Thr Gly Gly Ser Asp Lys Ile Ser Phe Pro Thr Leu Lys Lys 435 440 445 Lys Gly Gly Glu Gly His Cys Val Ala Tyr Thr Leu Gln Asn Thr Lys 450 455 460 Ser Phe Gly Phe Ile Ser Ile Tyr Asp Leu Arg Lys Ile Leu Leu Leu 465 470 475 480 Ser Phe Leu Asp Lys Asp Lys Ala Lys Asn Ile Val Ser Gly Leu Leu 485 490 495 Glu Gln Cys Glu Lys His Trp Lys Asp Leu Ser Glu Asn Leu Phe Asp 500 505 510 Ala Ile Arg Thr Glu Leu Gln Lys Glu Phe Pro Val Pro Leu Ile Arg 515 520 525 Tyr Thr Leu Pro Arg Ser Lys Gly Gly Lys Leu Val Ser Ser Lys Leu 530 535 540 Ala Asp Lys Gln Glu Lys Tyr Glu Ser Glu Phe Glu Arg Arg Lys Glu 545 550 555 560 Lys Leu Thr Glu Ile Leu Ser Glu Lys Asp Phe Asp Leu Ser Gln Ile 565 570 575 Pro Arg Arg Met Ile Asp Glu Trp Leu Asn Val Leu Pro Thr Ser Arg 580 585 590 Glu Lys Lys Leu Lys Gly Tyr Val Glu Thr Leu Lys Leu Asp Cys Arg 595 600 605 Glu Arg Leu Arg Val Phe Glu Lys Arg Glu Lys Gly Glu His Pro Val 610 615 620 Pro Pro Arg Ile Gly Glu Met Ala Thr Asp Leu Ala Lys Asp Ile Ile 625 630 635 640 Arg Met Val Ile Asp Gln Gly Val Lys Gln Arg Ile Thr Ser Ala Tyr 645 650 655 Tyr Ser Glu Ile Gln Arg Cys Leu Ala Gln Tyr Ala Gly Asp Asp Asn 660 665 670 Arg Arg His Leu Asp Ser Ile Ile Arg Glu Leu Arg Leu Lys Asp Thr 675 680 685 Lys Asn Gly His Pro Phe Leu Gly Lys Val Leu Arg Pro Gly Leu Gly 690 695 700 His Thr Glu Lys Leu Tyr Gln Arg Tyr Phe Glu Glu Lys Lys Glu Trp 705 710 715 720 Leu Glu Ala Thr Phe Tyr Pro Ala Ala Ser Pro Lys Arg Val Pro Arg 725 730 735 Phe Val Asn Pro Pro Thr Gly Lys Gln Lys Glu Leu Pro Leu Ile Ile 740 745 750 Arg Asn Leu Met Lys Glu Arg Pro Glu Trp Arg Asp Trp Lys Gln Arg 755 760 765 Lys Asn Ser His Pro Ile Asp Leu Pro Ser Gln Leu Phe Glu Asn Glu 770 775 780 Ile Cys Arg Leu Leu Lys Asp Lys Ile Gly Lys Glu Pro Ser Gly Lys 785 790 795 800 Leu Lys Trp Asn Glu Met Phe Lys Leu Tyr Trp Asp Lys Glu Phe Pro 805 810 815 Asn Gly Met Gln Arg Phe Tyr Arg Cys Lys Arg Arg Val Glu Val Phe 820 825 830 Asp Lys Val Val Glu Tyr Glu Tyr Ser Glu Glu Gly Gly Asn Tyr Lys 835 840 845 Lys Tyr Tyr Glu Ala Leu Ile Asp Glu Val Val Arg Gln Lys Ile Ser 850 855 860 Ser Ser Lys Glu Lys Ser Lys Leu Gln Val Glu Asp Leu Thr Leu Ser 865 870 875 880 Val Arg Arg Val Phe Lys Arg Ala Ile Asn Glu Lys Glu Tyr Gln Leu 885 890 895 Arg Leu Leu Cys Glu Asp Asp Arg Leu Leu Phe Met Ala Val Arg Asp 900 905 910 Leu Tyr Asp Trp Lys Glu Ala Gln Leu Asp Leu Asp Lys Ile Asp Asn 915 920 925 Met Leu Gly Glu Pro Val Ser Val Ser Gln Val Ile Gln Leu Glu Gly 930 935 940 Gly Gln Pro Asp Ala Val Ile Lys Ala Glu Cys Lys Leu Lys Asp Val 945 950 955 960 Ser Lys Leu Met Arg Tyr Cys Tyr Asp Gly Arg Val Lys Gly Leu Met 965 970 975 Pro Tyr Phe Ala Asn His Glu Ala Thr Gln Glu Gln Val Glu Met Glu 980 985 990 Leu Arg His Tyr Glu Asp His Arg Arg Arg Val Phe Asn Trp Val Phe 995 1000 1005 Ala Leu Glu Lys Ser Val Leu Lys Asn Glu Lys Leu Arg Arg Phe 1010 1015 1020 Tyr Glu Glu Ser Gln Gly Gly Cys Glu His Arg Arg Cys Ile Asp 1025 1030 1035 Ala Leu Arg Lys Ala Ser Leu Val Ser Glu Glu Glu Tyr Glu Phe 1040 1045 1050 Leu Val His Ile Arg Asn Lys Ser Ala His Asn Gln Phe Pro Asp 1055 1060 1065 Leu Glu Ile Gly Lys Leu Pro Pro Asn Val Thr Ser Gly Phe Cys 1070 1075 1080 Glu Cys Ile Trp Ser Lys Tyr Lys Ala Ile Ile Cys Arg Ile Ile 1085 1090 1095 Pro Phe Ile Asp Pro Glu Arg Arg Phe Phe Gly Lys Leu Leu Glu 1100 1105 1110 Gln Lys 1115 <210> 124 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 124 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 125 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 125 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 126 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 126 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Val Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Tyr Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Ile Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Ile Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 127 <211> 1125 <212> PRT <213> Prevotella intermedia <400> 127 Met Lys Met Glu Asp Asp Lys Lys Thr Thr Glu Ser Thr Asn Met Leu 1 5 10 15 Asp Asn Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Val Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn 35 40 45 Lys Lys Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala 50 55 60 Ile Lys Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu 65 70 75 80 Arg Leu Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala 85 90 95 Ile Tyr Thr Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys 100 105 110 Gln Ala Glu Ala Gln Ser Leu Glu Ser Leu Lys Asp Cys Leu Phe Leu 115 120 125 Phe Leu Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys 130 135 140 Tyr Ser Glu Ser Thr Lys Glu Pro Met Leu Glu Glu Gly Leu Leu Glu 145 150 155 160 Lys Met Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp 165 170 175 Tyr Gln His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu 180 185 190 Asp Arg Lys Gly Gln Phe Lys Tyr Ser Phe Ala Asp Asn Glu Gly Asn 195 200 205 Ile Thr Glu Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu Lys 210 215 220 Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Thr Gly Phe Lys Asp Asn 225 230 235 240 Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg Arg Arg 245 250 255 Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp Trp 260 265 270 Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser Leu 275 280 285 Tyr Glu Arg Leu Gln Gly Glu Tyr Arg Lys Lys Phe Asn Val Pro Phe 290 295 300 Asp Ser Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys Asn 305 310 315 320 Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg Tyr 325 330 335 Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp Leu 340 345 350 Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Gln Lys 355 360 365 Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile Gln 370 375 380 Glu Phe Ala Lys Gln Asn Arg Pro Asp Glu Trp Lys Ala Leu Val Lys 385 390 395 400 Asp Leu Asp Thr Tyr Glu Thr Ser Asn Glu Arg Tyr Ile Ser Glu Thr 405 410 415 Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe Arg 420 425 430 Asn Gly Asn Lys Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu Asn 435 440 445 Asn Glu Lys Ser Lys Tyr Lys Leu Asp Lys Pro Tyr Gln Ala Glu Ala 450 455 460 Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu 465 470 475 480 Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser Ile Val 485 490 495 Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Met Tyr Lys Leu Tyr Asp 500 505 510 Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Gly Asp Leu Glu Lys Tyr 515 520 525 Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln Met Val 530 535 540 Ala Ile Leu Tyr Asp Glu Pro Lys Asp Met Val Lys Glu Ala Lys Arg 545 550 555 560 Lys Gln Lys Glu Met Val Lys Asp Thr Lys Lys Leu Leu Ala Thr Leu 565 570 575 Glu Lys Gln Thr Gln Glu Glu Ile Glu Asp Gly Gly Arg Asn Ile Arg 580 585 590 Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met Met 595 600 605 Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu Asn Asn 610 615 620 Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu Ala 625 630 635 640 Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val Asn 645 650 655 Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr Lys Trp 660 665 670 Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Thr Lys 675 680 685 Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu Lys Asn 690 695 700 Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu Thr Leu 705 710 715 720 Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe Thr 725 730 735 Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser Lys Glu 740 745 750 Tyr Glu Lys Val Glu Ala Leu Lys Arg Val Gly Leu Val Thr Lys Val 755 760 765 Ile Pro Leu Phe Phe Lys Glu Glu Tyr Phe Lys Glu Asp Ala Gln Lys 770 775 780 Glu Ile Asn Asn Cys Val Gln Pro Phe Tyr Ser Phe Pro Tyr Asn Val 785 790 795 800 Gly Asn Ile His Lys Pro Asp Glu Lys Asp Phe Leu Pro Ser Glu Glu 805 810 815 Arg Lys Lys Leu Trp Gly Asp Lys Lys Asp Lys Phe Lys Gly Tyr Lys 820 825 830 Ala Lys Val Lys Ser Lys Lys Leu Thr Asp Lys Glu Lys Glu Glu Tyr 835 840 845 Arg Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu 850 855 860 Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Thr Glu 865 870 875 880 Leu Ile Asp Lys Met Lys Val Glu Gly Leu Asn Val Glu Glu Leu Gln 885 890 895 Lys Leu Arg Leu Lys Asp Ile Asp Thr Asp Thr Ala Lys Gln Glu Lys 900 905 910 Asn Asn Ile Leu Asn Arg Ile Met Pro Met Gln Leu Pro Val Thr Val 915 920 925 Tyr Glu Ile Asp Asp Ser His Asn Ile Val Lys Asp Arg Pro Leu His 930 935 940 Thr Val Tyr Ile Glu Glu Thr Lys Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ala Leu Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Ser Ser Lys Ala Glu Leu Lys Asp Lys Pro Ile Ser Lys 980 985 990 Ser Val Val Glu Tyr Glu Leu Gly Glu Tyr Gln Asn Ala Arg Ile Glu 995 1000 1005 Thr Ile Lys Asp Met Leu Leu Leu Glu Lys Thr Leu Ile Lys Lys 1010 1015 1020 Tyr Glu Lys Leu Pro Thr Asp Asn Phe Ser Asp Met Leu Asn Gly 1025 1030 1035 Trp Leu Glu Gly Lys Asp Glu Ser Asp Lys Ala Arg Phe Gln Asn 1040 1045 1050 Asp Val Lys Leu Leu Val Ala Val Arg Asn Ala Phe Ser His Asn 1055 1060 1065 Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn Pro 1070 1075 1080 Phe Ser Leu Ser Ser Ala Asp Ile Ser Glu Glu Lys Lys Leu Asp 1085 1090 1095 Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Ile Ile Lys Lys 1100 1105 1110 Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu 1115 1120 1125 <210> 128 <211> 1161 <212> PRT <213> Bacteroidetes bacterium <400> 128 Met Glu Asn Gln Thr Gln Lys Gly Lys Gly Ile Tyr Tyr Tyr Tyr Thr 1 5 10 15 Lys Asn Glu Asp Lys His Tyr Phe Gly Ser Phe Leu Asn Leu Ala Asn 20 25 30 Asn Asn Ile Glu Gln Ile Ile Glu Glu Phe Arg Ile Arg Leu Ser Leu 35 40 45 Lys Asp Glu Lys Asn Ile Lys Glu Ile Ile Asn Asn Tyr Phe Thr Asp 50 55 60 Lys Lys Ser Tyr Thr Asp Trp Glu Arg Gly Ile Asn Ile Leu Lys Glu 65 70 75 80 Tyr Leu Pro Val Ile Asp Tyr Leu Asp Leu Ala Ile Thr Asp Lys Glu 85 90 95 Phe Glu Lys Ile Asp Leu Lys Gln Lys Glu Thr Ala Lys Arg Lys Tyr 100 105 110 Phe Arg Thr Asn Phe Ser Leu Leu Ile Asp Thr Ile Ile Asp Leu Arg 115 120 125 Asn Phe Tyr Thr His Tyr Phe His Lys Pro Ile Ser Ile Asn Pro Asp 130 135 140 Val Ala Lys Phe Leu Asp Lys Asn Leu Leu Asn Val Cys Leu Asp Ile 145 150 155 160 Lys Lys Gln Lys Met Lys Thr Asp Lys Thr Lys Gln Ala Leu Lys Asp 165 170 175 Gly Leu Asp Lys Glu Leu Lys Lys Leu Ile Glu Leu Lys Lys Ala Glu 180 185 190 Leu Lys Glu Lys Lys Ile Lys Thr Trp Asn Ile Thr Glu Asn Val Glu 195 200 205 Gly Ala Val Tyr Asn Asp Ala Phe Asn His Met Val Tyr Lys Asn Asn 210 215 220 Ala Gly Val Thr Ile Leu Lys Asp Tyr His Lys Ser Ile Leu Pro Asp 225 230 235 240 Asp Lys Ile Asp Ser Glu Leu Lys Leu Asn Phe Ser Ile Ser Gly Leu 245 250 255 Val Phe Leu Leu Ser Met Phe Leu Ser Lys Lys Glu Ile Glu Gln Phe 260 265 270 Lys Ser Asn Leu Glu Gly Phe Lys Gly Lys Val Ile Gly Glu Asn Gly 275 280 285 Glu Tyr Glu Ile Ser Lys Phe Asn Asn Ser Leu Lys Tyr Met Ala Thr 290 295 300 His Trp Ile Phe Ser Tyr Leu Thr Phe Lys Gly Leu Lys Gln Arg Val 305 310 315 320 Lys Asn Thr Phe Asp Lys Glu Thr Leu Leu Met Gln Met Ile Asp Glu 325 330 335 Leu Asn Lys Val Pro His Glu Val Tyr Gln Thr Leu Ser Lys Glu Gln 340 345 350 Gln Asn Glu Phe Leu Glu Asp Ile Asn Glu Tyr Val Gln Asp Asn Glu 355 360 365 Glu Asn Lys Lys Ser Met Glu Asn Ser Ile Val Val His Pro Val Ile 370 375 380 Arg Lys Arg Tyr Asp Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu 385 390 395 400 Asp Glu Phe Ala Asn Phe Pro Thr Leu Lys Phe Phe Val Thr Ala Gly 405 410 415 Asn Phe Val His Asp Lys Arg Glu Lys Gln Ile Gln Gly Ser Met Leu 420 425 430 Thr Ser Asp Arg Met Ile Lys Glu Lys Ile Asn Val Phe Gly Lys Leu 435 440 445 Thr Glu Ile Ala Lys Tyr Lys Ser Asp Tyr Phe Ser Asn Glu Asn Thr 450 455 460 Leu Glu Thr Ser Glu Trp Glu Leu Phe Pro Asn Pro Ser Tyr Leu Leu 465 470 475 480 Ile Gln Asn Asn Ile Pro Val His Ile Asp Leu Ile His Asn Thr Glu 485 490 495 Glu Ala Lys Gln Cys Gln Ile Ala Ile Asp Arg Ile Lys Cys Thr Thr 500 505 510 Asn Pro Ala Lys Lys Arg Asn Thr Arg Lys Ser Lys Glu Glu Ile Ile 515 520 525 Lys Ile Ile Tyr Gln Lys Asn Lys Asn Ile Lys Tyr Gly Asp Pro Thr 530 535 540 Ala Leu Leu Ser Ser Asn Glu Leu Pro Ala Leu Ile Tyr Glu Leu Leu 545 550 555 560 Val Asn Lys Lys Ser Gly Lys Glu Leu Glu Asn Ile Ile Val Glu Lys 565 570 575 Ile Val Asn Gln Tyr Lys Thr Ile Ala Gly Phe Glu Lys Gly Gln Asn 580 585 590 Leu Ser Asn Ser Leu Ile Thr Lys Lys Leu Lys Lys Ser Glu Pro Asn 595 600 605 Glu Asp Lys Ile Asn Ala Glu Lys Ile Ile Leu Ala Ile Asn Arg Glu 610 615 620 Leu Glu Ile Thr Glu Asn Lys Leu Asn Ile Ile Lys Asn Asn Arg Ala 625 630 635 640 Glu Phe Arg Thr Gly Ala Lys Arg Lys His Ile Phe Tyr Ser Lys Glu 645 650 655 Leu Gly Gln Glu Ala Thr Trp Ile Ala Tyr Asp Leu Lys Arg Phe Met 660 665 670 Pro Glu Ala Ser Arg Lys Glu Trp Lys Gly Phe His His Ser Glu Leu 675 680 685 Gln Lys Phe Leu Ala Phe Tyr Asp Arg Asn Lys Asn Asp Ala Lys Ala 690 695 700 Leu Leu Asn Met Phe Trp Asn Phe Asp Asn Asp Gln Leu Ile Gly Asn 705 710 715 720 Asp Leu Asn Ser Ala Phe Arg Glu Phe His Phe Asp Lys Phe Tyr Glu 725 730 735 Lys Tyr Leu Ile Lys Arg Asp Glu Ile Leu Glu Gly Phe Lys Ser Phe 740 745 750 Ile Ser Asn Phe Lys Asp Glu Pro Lys Leu Leu Lys Lys Gly Ile Lys 755 760 765 Asp Ile Tyr Arg Val Phe Asp Lys Arg Tyr Tyr Ile Ile Lys Ser Thr 770 775 780 Asn Ala Gln Lys Glu Gln Leu Leu Ser Lys Pro Ile Cys Leu Pro Arg 785 790 795 800 Gly Ile Phe Asp Asn Lys Pro Thr Tyr Ile Glu Gly Val Lys Val Glu 805 810 815 Ser Asn Ser Ala Leu Phe Ala Asp Trp Tyr Gln Tyr Thr Tyr Ser Asp 820 825 830 Lys His Glu Phe Gln Ser Phe Tyr Asp Met Pro Arg Asp Tyr Lys Glu 835 840 845 Gln Phe Glu Lys Phe Glu Leu Asn Asn Ile Lys Ser Ile Gln Asn Lys 850 855 860 Lys Asn Leu Asn Lys Ser Asp Lys Phe Ile Tyr Phe Arg Tyr Lys Gln 865 870 875 880 Asp Leu Lys Ile Lys Gln Ile Lys Ser Gln Asp Leu Phe Ile Lys Leu 885 890 895 Met Val Asp Glu Leu Phe Asn Val Val Phe Lys Asn Asn Ile Glu Leu 900 905 910 Asn Leu Lys Lys Leu Tyr Gln Thr Ser Asp Glu Arg Phe Lys Asn Gln 915 920 925 Leu Ile Ala Asp Val Gln Lys Asn Arg Glu Lys Gly Asp Thr Ser Asp 930 935 940 Asn Lys Met Asn Glu Asn Phe Ile Trp Asn Met Thr Ile Pro Leu Ser 945 950 955 960 Leu Cys Asn Gly Gln Ile Glu Glu Pro Lys Val Lys Leu Lys Asp Ile 965 970 975 Gly Lys Phe Arg Lys Leu Glu Thr Asp Asp Lys Val Ile Gln Leu Leu 980 985 990 Glu Tyr Asp Lys Ser Lys Val Trp Lys Lys Leu Glu Ile Glu Asp Glu 995 1000 1005 Leu Glu Asn Met Pro Asn Ser Tyr Glu Arg Ile Arg Arg Glu Lys 1010 1015 1020 Leu Leu Lys Gly Ile Gln Glu Phe Glu His Phe Leu Leu Glu Lys 1025 1030 1035 Glu Lys Phe Asp Gly Ile Asn His Pro Lys His Phe Glu Gln Asp 1040 1045 1050 Leu Asn Pro Asn Phe Lys Thr Tyr Val Ile Asn Gly Val Leu Arg 1055 1060 1065 Lys Asn Ser Lys Leu Asn Tyr Thr Glu Ile Asp Lys Leu Leu Asp 1070 1075 1080 Leu Glu His Ile Ser Ile Lys Asp Ile Glu Thr Ser Ala Lys Glu 1085 1090 1095 Ile His Leu Ala Tyr Phe Leu Ile His Val Arg Asn Lys Phe Gly 1100 1105 1110 His Asn Gln Leu Pro Lys Leu Glu Ala Phe Glu Leu Met Lys Lys 1115 1120 1125 Tyr Tyr Lys Lys Asn Asn Glu Glu Thr Tyr Ala Glu Tyr Phe His 1130 1135 1140 Lys Val Ser Ser Gln Ile Val Asn Glu Phe Lys Asn Ser Leu Glu 1145 1150 1155 Lys His Ser 1160 <210> 129 <211> 1165 <212> PRT <213> Chryseobacterium jejuense <400> 129 Met Glu Lys Thr Gln Thr Gly Leu Gly Ile Tyr Tyr Asp His Thr Lys 1 5 10 15 Leu Gln Asp Lys Tyr Phe Phe Gly Gly Phe Phe Asn Leu Ala Gln Asn 20 25 30 Asn Ile Asp Asn Val Ile Lys Ala Phe Ile Ile Lys Phe Phe Pro Glu 35 40 45 Arg Lys Asp Lys Asp Ile Asn Ile Ala Gln Phe Leu Asp Ile Cys Phe 50 55 60 Lys Asp Asn Asp Ala Asp Ser Asp Phe Gln Lys Lys Asn Lys Phe Leu 65 70 75 80 Arg Ile His Phe Pro Val Ile Gly Phe Leu Thr Ser Asp Asn Asp Lys 85 90 95 Ala Gly Phe Lys Lys Lys Phe Ala Leu Leu Leu Lys Thr Ile Ser Glu 100 105 110 Leu Arg Asn Phe Tyr Thr His Tyr Tyr His Lys Ser Ile Glu Phe Pro 115 120 125 Ser Glu Leu Phe Glu Leu Leu Asp Asp Ile Phe Val Lys Thr Thr Ser 130 135 140 Glu Ile Lys Lys Leu Lys Lys Lys Asp Asp Lys Thr Gln Gln Leu Leu 145 150 155 160 Asn Lys Asn Leu Ser Glu Glu Tyr Asp Ile Arg Tyr Gln Gln Gln Ile 165 170 175 Glu Arg Leu Lys Glu Leu Lys Ala Gln Gly Lys Arg Val Ser Leu Thr 180 185 190 Asp Glu Thr Ala Ile Arg Asn Gly Val Phe Asn Ala Ala Phe Asn His 195 200 205 Leu Ile Tyr Arg Asp Gly Glu Asn Val Lys Pro Ser Arg Leu Tyr Gln 210 215 220 Ser Ser Tyr Ser Glu Pro Asp Pro Ala Glu Asn Gly Ile Ser Leu Ser 225 230 235 240 Gln Asn Ser Ile Leu Phe Leu Leu Ser Met Phe Leu Glu Arg Lys Glu 245 250 255 Thr Glu Asp Leu Lys Ser Arg Val Lys Gly Phe Lys Ala Lys Ile Ile 260 265 270 Lys Gln Gly Glu Glu Gln Ile Ser Gly Leu Lys Phe Met Ala Thr His 275 280 285 Trp Val Phe Ser Tyr Leu Cys Phe Lys Gly Ile Lys Gln Lys Leu Ser 290 295 300 Thr Glu Phe His Glu Glu Thr Leu Leu Ile Gln Ile Ile Asp Glu Leu 305 310 315 320 Ser Lys Val Pro Asp Glu Val Tyr Ser Ala Phe Asp Ser Lys Thr Lys 325 330 335 Glu Lys Phe Leu Glu Asp Ile Asn Glu Tyr Met Lys Glu Gly Asn Ala 340 345 350 Asp Leu Ser Leu Glu Asp Ser Lys Val Ile His Pro Val Ile Arg Lys 355 360 365 Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu 370 375 380 Tyr Leu Ser Ser Thr Ser Leu Lys Phe Gln Val His Val Gly Asn Tyr 385 390 395 400 Val His Asp Arg Arg Val Lys His Ile Asn Gly Thr Gly Phe Gln Thr 405 410 415 Glu Arg Ile Val Lys Asp Arg Ile Lys Val Phe Gly Arg Leu Ser Asn 420 425 430 Ile Ser Asn Leu Lys Ala Asp Tyr Ile Lys Glu Gln Leu Glu Leu Pro 435 440 445 Asn Asp Ser Asn Gly Trp Glu Ile Phe Pro Asn Pro Ser Tyr Ile Phe 450 455 460 Ile Asp Asn Asn Val Pro Ile His Val Leu Ala Asp Glu Ala Thr Lys 465 470 475 480 Lys Gly Ile Glu Leu Phe Lys Asp Lys Arg Arg Lys Glu Gln Pro Glu 485 490 495 Glu Leu Gln Lys Arg Lys Gly Lys Ile Ser Lys Tyr Asn Ile Val Ser 500 505 510 Met Ile Tyr Lys Glu Ala Lys Gly Lys Asp Lys Leu Arg Ile Asp Glu 515 520 525 Pro Leu Ala Leu Leu Ser Leu Asn Glu Ile Pro Ala Leu Leu Tyr Gln 530 535 540 Ile Leu Glu Lys Gly Ala Thr Pro Lys Asp Ile Glu Leu Ile Ile Lys 545 550 555 560 Asn Lys Leu Thr Glu Arg Phe Glu Lys Ile Lys Asn Tyr Asp Pro Glu 565 570 575 Thr Pro Ala Pro Ala Ser Gln Ile Ser Lys Arg Leu Arg Asn Asn Thr 580 585 590 Thr Ala Lys Gly Gln Glu Ala Leu Asn Ala Glu Lys Leu Ser Leu Leu 595 600 605 Ile Glu Arg Glu Ile Glu Asn Thr Glu Thr Lys Leu Ser Ser Ile Glu 610 615 620 Glu Lys Arg Leu Lys Ala Lys Lys Glu Gln Arg Arg Asn Thr Pro Gln 625 630 635 640 Arg Ser Ile Phe Ser Asn Ser Asp Leu Gly Arg Ile Ala Ala Trp Leu 645 650 655 Ala Asp Asp Ile Lys Arg Phe Met Pro Ala Glu Gln Arg Lys Asn Trp 660 665 670 Lys Gly Tyr Gln His Ser Gln Leu Gln Gln Ser Leu Ala Tyr Phe Glu 675 680 685 Lys Arg Pro Gln Glu Ala Phe Leu Leu Leu Lys Glu Gly Trp Asp Thr 690 695 700 Ser Asp Gly Ser Ser Tyr Trp Asn Asn Trp Val Met Asn Ser Phe Leu 705 710 715 720 Glu Asn Asn His Phe Glu Lys Phe Tyr Lys Asn Tyr Leu Met Lys Arg 725 730 735 Val Lys Tyr Phe Ser Glu Leu Ala Gly Asn Ile Lys Gln His Thr His 740 745 750 Asn Thr Lys Phe Leu Arg Lys Phe Ile Lys Gln Gln Met Pro Ala Asp 755 760 765 Leu Phe Pro Lys Arg His Tyr Ile Leu Lys Asp Leu Glu Thr Glu Lys 770 775 780 Asn Lys Val Leu Ser Lys Pro Leu Val Phe Ser Arg Gly Leu Phe Asp 785 790 795 800 Asn Asn Pro Thr Phe Ile Lys Gly Val Lys Val Thr Glu Asn Pro Glu 805 810 815 Leu Phe Ala Glu Trp Tyr Ser Tyr Gly Tyr Lys Thr Glu His Val Phe 820 825 830 Gln His Phe Tyr Gly Trp Glu Arg Asp Tyr Asn Glu Leu Leu Asp Ser 835 840 845 Glu Leu Gln Lys Gly Asn Ser Phe Ala Lys Asn Ser Ile Tyr Tyr Asn 850 855 860 Arg Glu Ser Gln Leu Asp Leu Ile Lys Leu Lys Gln Asp Leu Lys Ile 865 870 875 880 Lys Lys Ile Lys Ile Gln Asp Leu Phe Leu Lys Arg Ile Ala Glu Lys 885 890 895 Leu Phe Glu Asn Val Phe Asn Tyr Pro Thr Thr Leu Ser Leu Asp Glu 900 905 910 Phe Tyr Leu Thr Gln Glu Glu Arg Ala Glu Lys Glu Arg Ile Ala Leu 915 920 925 Ala Gln Ser Leu Arg Glu Glu Gly Asp Asn Ser Pro Asn Ile Ile Lys 930 935 940 Asp Asp Phe Ile Trp Ser Lys Thr Ile Ala Phe Arg Ser Lys Gln Ile 945 950 955 960 Tyr Glu Pro Ala Ile Lys Leu Lys Asp Ile Gly Lys Phe Asn Arg Phe 965 970 975 Val Leu Asp Asp Glu Glu Ser Lys Ala Ser Lys Leu Leu Ser Tyr Asp 980 985 990 Lys Asn Lys Ile Trp Asn Lys Glu Gln Leu Glu Arg Glu Leu Ser Ile 995 1000 1005 Gly Glu Asn Ser Tyr Glu Val Ile Arg Arg Glu Lys Leu Phe Lys 1010 1015 1020 Glu Ile Gln Asn Leu Glu Leu Gln Ile Leu Ser Asn Trp Ser Trp 1025 1030 1035 Asp Gly Ile Asn His Pro Arg Glu Phe Glu Met Glu Asp Gln Lys 1040 1045 1050 Asn Thr Arg His Pro Asn Phe Lys Met Tyr Leu Val Asn Gly Ile 1055 1060 1065 Leu Arg Lys Asn Ile Asn Leu Tyr Lys Glu Asp Glu Asp Phe Trp 1070 1075 1080 Leu Glu Ser Leu Lys Glu Asn Asp Phe Lys Thr Leu Pro Ser Glu 1085 1090 1095 Val Leu Glu Thr Lys Ser Glu Met Val Gln Leu Leu Phe Leu Val 1100 1105 1110 Ile Leu Ile Arg Asn Gln Phe Ala His Asn Gln Leu Pro Glu Ile 1115 1120 1125 Gln Phe Tyr Asn Phe Ile Arg Lys Asn Tyr Pro Glu Ile Gln Asn 1130 1135 1140 Asn Thr Val Ala Glu Leu Tyr Leu Asn Leu Ile Lys Leu Ala Val 1145 1150 1155 Gln Lys Leu Lys Asp Asn Ser 1160 1165 <210> 130 <211> 1156 <212> PRT <213> Chryseobacterium carnipullorum <400> 130 Met Asn Thr Arg Val Thr Gly Met Gly Val Ser Tyr Asp His Thr Lys 1 5 10 15 Lys Glu Asp Lys His Phe Phe Gly Gly Phe Leu Asn Leu Ala Gln Asp 20 25 30 Asn Ile Thr Ala Val Ile Lys Ala Phe Cys Ile Lys Phe Asp Lys Asn 35 40 45 Pro Met Ser Ser Val Gln Phe Ala Glu Ser Cys Phe Thr Asp Lys Asp 50 55 60 Ser Asp Thr Asp Phe Gln Asn Lys Val Arg Tyr Val Arg Thr His Leu 65 70 75 80 Pro Val Ile Gly Tyr Leu Asn Tyr Gly Gly Asp Arg Asn Thr Phe Arg 85 90 95 Gln Lys Leu Ser Thr Leu Leu Lys Ala Val Asp Ser Leu Arg Asn Phe 100 105 110 Tyr Thr His Tyr Tyr His Ser Pro Leu Ala Leu Ser Thr Glu Leu Phe 115 120 125 Glu Leu Leu Asp Thr Val Phe Ala Ser Val Ala Val Glu Val Lys Gln 130 135 140 His Lys Met Lys Asp Asp Lys Thr Arg Gln Leu Leu Ser Lys Ser Leu 145 150 155 160 Ala Glu Glu Leu Asp Ile Arg Tyr Lys Gln Gln Leu Glu Arg Leu Lys 165 170 175 Glu Leu Lys Glu Gln Gly Lys Asn Ile Asp Leu Arg Asp Glu Ala Gly 180 185 190 Ile Arg Asn Gly Val Leu Asn Ala Ala Phe Asn His Leu Ile Tyr Lys 195 200 205 Glu Gly Glu Ile Ala Lys Pro Thr Leu Ser Tyr Ser Ser Phe Tyr Tyr 210 215 220 Gly Ala Asp Ser Ala Glu Asn Gly Ile Thr Ile Ser Gln Ser Gly Leu 225 230 235 240 Leu Phe Leu Leu Ser Met Phe Leu Gly Lys Lys Glu Ile Glu Asp Leu 245 250 255 Lys Ser Arg Ile Arg Gly Phe Lys Ala Lys Ile Val Arg Asp Gly Glu 260 265 270 Glu Asn Ile Ser Gly Leu Lys Phe Met Ala Thr His Trp Ile Phe Ser 275 280 285 Tyr Leu Ser Phe Lys Gly Met Lys Gln Arg Leu Ser Thr Asp Phe His 290 295 300 Glu Glu Thr Leu Leu Ile Gln Ile Ile Asp Glu Leu Ser Lys Val Pro 305 310 315 320 Asp Glu Val Tyr His Asp Phe Asp Thr Ala Thr Arg Glu Lys Phe Val 325 330 335 Glu Asp Ile Asn Glu Tyr Ile Arg Glu Gly Asn Glu Asp Phe Ser Leu 340 345 350 Gly Asp Ser Thr Ile Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asn 355 360 365 Lys Phe Asn Tyr Phe Ala Val Arg Phe Leu Asp Glu Phe Ile Lys Phe 370 375 380 Pro Ser Leu Arg Phe Gln Val His Leu Gly Asn Phe Val His Asp Arg 385 390 395 400 Arg Ile Lys Asp Ile His Gly Thr Gly Phe Gln Thr Glu Arg Val Val 405 410 415 Lys Asp Arg Ile Lys Val Phe Gly Lys Leu Ser Glu Ile Ser Ser Leu 420 425 430 Lys Thr Glu Tyr Ile Glu Lys Glu Leu Asp Leu Asp Ser Asp Thr Gly 435 440 445 Trp Glu Ile Phe Pro Asn Pro Ser Tyr Val Phe Ile Asp Asn Asn Ile 450 455 460 Pro Ile Tyr Ile Ser Thr Asn Lys Thr Phe Lys Asn Gly Ser Ser Glu 465 470 475 480 Phe Ile Lys Leu Arg Arg Lys Glu Lys Pro Glu Glu Met Lys Met Arg 485 490 495 Gly Glu Asp Lys Lys Glu Lys Arg Asp Ile Ala Ser Met Ile Gly Asn 500 505 510 Ala Gly Ser Leu Asn Ser Lys Thr Pro Leu Ala Met Leu Ser Leu Asn 515 520 525 Glu Met Pro Ala Leu Leu Tyr Glu Ile Leu Val Lys Lys Thr Thr Pro 530 535 540 Glu Glu Ile Glu Leu Ile Ile Lys Glu Lys Leu Asp Ser His Phe Glu 545 550 555 560 Asn Ile Lys Asn Tyr Asp Pro Glu Lys Pro Leu Pro Ala Ser Gln Ile 565 570 575 Ser Lys Arg Leu Arg Asn Asn Thr Thr Asp Lys Gly Lys Lys Val Ile 580 585 590 Asn Pro Glu Lys Leu Ile His Leu Ile Asn Lys Glu Ile Asp Ala Thr 595 600 605 Glu Ala Lys Phe Ala Leu Leu Ala Lys Asn Arg Lys Glu Leu Lys Glu 610 615 620 Lys Phe Arg Gly Lys Pro Leu Arg Gln Thr Ile Phe Ser Asn Met Glu 625 630 635 640 Leu Gly Arg Glu Ala Thr Trp Leu Ala Asp Asp Ile Lys Arg Phe Met 645 650 655 Pro Asp Ile Leu Arg Lys Asn Trp Lys Gly Tyr Gln His Asn Gln Leu 660 665 670 Gln Gln Ser Leu Ala Phe Phe Asn Ser Arg Pro Lys Glu Ala Phe Thr 675 680 685 Ile Leu Gln Asp Gly Trp Asp Phe Ala Asp Gly Ser Ser Phe Trp Asn 690 695 700 Gly Trp Ile Ile Asn Ser Phe Val Lys Asn Arg Ser Phe Glu Tyr Phe 705 710 715 720 Tyr Glu Ala Tyr Phe Glu Gly Arg Lys Glu Tyr Phe Ser Ser Leu Ala 725 730 735 Glu Asn Ile Lys Gln His Thr Ser Asn His Arg Asn Leu Arg Arg Phe 740 745 750 Ile Asp Gln Gln Met Pro Lys Gly Leu Phe Glu Asn Arg His Tyr Leu 755 760 765 Leu Glu Asn Leu Glu Thr Glu Lys Asn Lys Ile Leu Ser Lys Pro Leu 770 775 780 Val Phe Pro Arg Gly Leu Phe Asp Thr Lys Pro Thr Phe Ile Lys Gly 785 790 795 800 Ile Lys Val Asp Glu Gln Pro Glu Leu Phe Ala Glu Trp Tyr Gln Tyr 805 810 815 Gly Tyr Ser Thr Glu His Val Phe Gln Asn Phe Tyr Gly Trp Glu Arg 820 825 830 Asp Tyr Asn Asp Leu Leu Glu Ser Glu Leu Glu Lys Asp Asn Asp Phe 835 840 845 Ser Lys Asn Ser Ile His Tyr Ser Arg Thr Ser Gln Leu Glu Leu Ile 850 855 860 Lys Leu Lys Gln Asp Leu Lys Ile Lys Lys Ile Lys Ile Gln Asp Leu 865 870 875 880 Phe Leu Lys Leu Ile Ala Gly His Ile Phe Glu Asn Ile Phe Lys Tyr 885 890 895 Pro Ala Ser Phe Ser Leu Asp Glu Leu Tyr Leu Thr Gln Glu Glu Arg 900 905 910 Leu Asn Lys Glu Gln Glu Ala Leu Ile Gln Ser Gln Arg Lys Glu Gly 915 920 925 Asp His Ser Asp Asn Ile Ile Lys Asp Asn Phe Ile Gly Ser Lys Thr 930 935 940 Val Thr Tyr Glu Ser Lys Gln Ile Ser Glu Pro Asn Val Lys Leu Lys 945 950 955 960 Asp Ile Gly Lys Phe Asn Arg Phe Leu Leu Asp Asp Lys Val Lys Thr 965 970 975 Leu Leu Ser Tyr Asn Glu Asp Lys Val Trp Asn Lys Asn Asp Leu Asp 980 985 990 Leu Glu Leu Ser Ile Gly Glu Asn Ser Tyr Glu Val Ile Arg Arg Glu 995 1000 1005 Lys Leu Phe Lys Lys Ile Gln Asn Phe Glu Leu Gln Thr Leu Thr 1010 1015 1020 Asp Trp Pro Trp Asn Gly Thr Asp His Pro Glu Glu Phe Gly Thr 1025 1030 1035 Thr Asp Asn Lys Gly Val Asn His Pro Asn Phe Lys Met Tyr Val 1040 1045 1050 Val Asn Gly Ile Leu Arg Lys His Thr Asp Trp Phe Lys Glu Gly 1055 1060 1065 Glu Asp Asn Trp Leu Glu Asn Leu Asn Glu Thr His Phe Lys Asn 1070 1075 1080 Leu Ser Phe Gln Glu Leu Glu Thr Lys Ser Lys Ser Ile Gln Thr 1085 1090 1095 Ala Phe Leu Ile Ile Met Ile Arg Asn Gln Phe Ala His Asn Gln 1100 1105 1110 Leu Pro Ala Val Gln Phe Phe Glu Phe Ile Gln Lys Lys Tyr Pro 1115 1120 1125 Glu Ile Gln Gly Ser Thr Thr Ser Glu Leu Tyr Leu Asn Phe Ile 1130 1135 1140 Asn Leu Ala Val Val Glu Leu Leu Glu Leu Leu Glu Lys 1145 1150 1155 <210> 131 <211> 1036 <212> PRT <213> Chryseobacterium ureilyticum <400> 131 Met Glu Thr Gln Ile Leu Gly Asn Gly Ile Ser Tyr Asp His Thr Lys 1 5 10 15 Thr Glu Asp Lys His Phe Phe Gly Gly Phe Leu Asn Thr Ala Gln Asn 20 25 30 Asn Ile Asp Leu Leu Ile Lys Ala Tyr Ile Ser Lys Phe Glu Ser Ser 35 40 45 Pro Arg Lys Leu Asn Ser Val Gln Phe Pro Asp Val Cys Phe Lys Lys 50 55 60 Asn Asp Ser Asp Ala Asp Phe Gln His Lys Leu Gln Phe Ile Arg Lys 65 70 75 80 His Leu Pro Val Ile Gln Tyr Leu Lys Tyr Gly Gly Asn Arg Glu Val 85 90 95 Leu Lys Glu Lys Phe Arg Leu Leu Leu Gln Ala Val Asp Ser Leu Arg 100 105 110 Asn Phe Tyr Thr His Phe Tyr His Lys Pro Ile Gln Leu Pro Asn Glu 115 120 125 Leu Leu Thr Leu Leu Asp Thr Ile Phe Gly Glu Ile Gly Asn Glu Val 130 135 140 Arg Gln Asn Lys Met Lys Asp Asp Lys Thr Arg His Leu Leu Lys Lys 145 150 155 160 Asn Leu Ser Glu Glu Leu Asp Phe Arg Tyr Gln Glu Gln Leu Glu Arg 165 170 175 Leu Arg Lys Leu Lys Ser Glu Gly Lys Lys Val Asp Leu Arg Asp Thr 180 185 190 Glu Ala Ile Arg Asn Gly Val Leu Asn Ala Ala Phe Asn His Leu Ile 195 200 205 Phe Lys Asp Ala Glu Asp Phe Lys Pro Thr Val Ser Tyr Ser Ser Tyr 210 215 220 Tyr Tyr Asp Ser Asp Thr Ala Glu Asn Gly Ile Ser Ile Ser Gln Ser 225 230 235 240 Gly Leu Leu Phe Leu Leu Ser Met Phe Leu Gly Arg Arg Glu Met Glu 245 250 255 Asp Leu Lys Ser Arg Val Arg Gly Phe Lys Ala Arg Ile Ile Lys His 260 265 270 Glu Glu Gln His Val Ser Gly Leu Lys Phe Met Ala Thr His Trp Val 275 280 285 Phe Ser Glu Phe Cys Phe Lys Gly Ile Lys Thr Arg Leu Asn Ala Asp 290 295 300 Tyr His Glu Glu Thr Leu Leu Ile Gln Leu Ile Asp Glu Leu Ser Lys 305 310 315 320 Val Pro Asp Glu Leu Tyr Arg Ser Phe Asp Val Ala Thr Arg Glu Arg 325 330 335 Phe Ile Glu Asp Ile Asn Glu Tyr Ile Arg Asp Gly Lys Glu Asp Lys 340 345 350 Ser Leu Ile Glu Ser Lys Ile Val His Pro Val Ile Arg Lys Arg Tyr 355 360 365 Glu Ser Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Val 370 375 380 Asn Phe Pro Thr Leu Arg Phe Gln Val His Ala Gly Asn Tyr Val His 385 390 395 400 Asp Arg Arg Ile Lys Ser Ile Glu Gly Thr Gly Phe Lys Thr Glu Arg 405 410 415 Leu Val Lys Asp Arg Ile Lys Val Phe Gly Lys Leu Ser Thr Ile Ser 420 425 430 Ser Leu Lys Ala Glu Tyr Leu Ala Lys Ala Val Asn Ile Thr Asp Asp 435 440 445 Thr Gly Trp Glu Leu Leu Pro His Pro Ser Tyr Val Phe Ile Asp Asn 450 455 460 Asn Ile Pro Ile His Leu Thr Val Asp Pro Ser Phe Lys Asn Gly Val 465 470 475 480 Lys Glu Tyr Gln Glu Lys Arg Lys Leu Gln Lys Pro Glu Glu Met Lys 485 490 495 Asn Arg Gln Gly Gly Asp Lys Met His Lys Pro Ala Ile Ser Ser Lys 500 505 510 Ile Gly Lys Ser Lys Asp Ile Asn Pro Glu Ser Pro Val Ala Leu Leu 515 520 525 Ser Met Asn Glu Ile Pro Ala Leu Leu Tyr Glu Ile Leu Val Lys Lys 530 535 540 Ala Ser Pro Glu Glu Val Glu Ala Lys Ile Arg Gln Lys Leu Thr Ala 545 550 555 560 Val Phe Glu Arg Ile Arg Asp Tyr Asp Pro Lys Val Pro Leu Pro Ala 565 570 575 Ser Gln Val Ser Lys Arg Leu Arg Asn Asn Thr Asp Thr Leu Ser Tyr 580 585 590 Asn Lys Glu Lys Leu Val Glu Leu Ala Asn Lys Glu Val Glu Gln Thr 595 600 605 Glu Arg Lys Leu Ala Leu Ile Thr Lys Asn Arg Arg Glu Cys Arg Glu 610 615 620 Lys Val Lys Gly Lys Phe Lys Arg Gln Lys Val Phe Lys Asn Ala Glu 625 630 635 640 Leu Gly Thr Glu Ala Thr Trp Leu Ala Asn Asp Ile Lys Arg Phe Met 645 650 655 Pro Glu Glu Gln Lys Lys Asn Trp Lys Gly Tyr Gln His Ser Gln Leu 660 665 670 Gln Gln Ser Leu Ala Phe Phe Glu Ser Arg Pro Gly Glu Ala Arg Ser 675 680 685 Leu Leu Gln Ala Gly Trp Asp Phe Ser Asp Gly Ser Ser Phe Trp Asn 690 695 700 Gly Trp Val Met Asn Ser Phe Ala Arg Asp Asn Thr Phe Asp Gly Phe 705 710 715 720 Tyr Glu Ser Tyr Leu Asn Gly Arg Met Lys Tyr Phe Leu Arg Leu Ala 725 730 735 Asp Asn Ile Ala Gln Gln Ser Ser Thr Asn Lys Leu Ile Ser Asn Phe 740 745 750 Ile Lys Gln Gln Met Pro Lys Gly Leu Phe Asp Arg Arg Leu Tyr Met 755 760 765 Leu Glu Asp Leu Ala Thr Glu Lys Asn Lys Ile Leu Ser Lys Pro Leu 770 775 780 Ile Phe Pro Arg Gly Ile Phe Asp Asp Lys Pro Thr Phe Lys Lys Gly 785 790 795 800 Val Gln Val Ser Glu Glu Pro Glu Ala Phe Ala Asp Trp Tyr Ser Tyr 805 810 815 Gly Tyr Asp Val Lys His Lys Phe Gln Glu Phe Tyr Ala Trp Asp Arg 820 825 830 Asp Tyr Glu Glu Leu Leu Arg Glu Glu Leu Glu Lys Asp Thr Ala Phe 835 840 845 Thr Lys Asn Ser Ile His Tyr Ser Arg Glu Ser Gln Ile Glu Leu Leu 850 855 860 Ala Lys Lys Gln Asp Leu Lys Val Lys Lys Val Arg Ile Gln Asp Leu 865 870 875 880 Tyr Leu Lys Leu Met Ala Glu Phe Leu Phe Glu Asn Val Phe Gly His 885 890 895 Glu Leu Ala Leu Pro Leu Asp Gln Phe Tyr Leu Thr Gln Glu Glu Arg 900 905 910 Leu Lys Gln Glu Gln Glu Ala Ile Val Gln Ser Gln Arg Pro Lys Gly 915 920 925 Asp Asp Ser Pro Asn Ile Val Lys Glu Asn Phe Ile Trp Ser Lys Thr 930 935 940 Ile Pro Phe Lys Ser Gly Arg Val Phe Glu Pro Asn Val Lys Leu Lys 945 950 955 960 Asp Ile Gly Lys Phe Arg Asn Leu Leu Thr Asp Glu Lys Val Asp Ile 965 970 975 Leu Leu Ser Tyr Asn Asn Thr Glu Ile Gly Lys Gln Val Ile Glu Asn 980 985 990 Glu Leu Ile Ile Gly Ala Gly Ser Tyr Glu Phe Ile Arg Arg Glu Gln 995 1000 1005 Leu Phe Lys Glu Ile Gln Gln Met Lys Arg Leu Ser Leu Arg Ser 1010 1015 1020 Val Arg Gly Met Gly Val Pro Ile Arg Leu Asn Leu Lys 1025 1030 1035 <210> 132 <211> 1127 <212> PRT <213> Prevotella buccae <400> 132 Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile 1 5 10 15 Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Gln Glu Lys Pro 20 25 30 Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe 35 40 45 Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn 50 55 60 Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Asp 65 70 75 80 Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val 85 90 95 Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala 100 105 110 Ala Tyr Glu Ile Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg 115 120 125 Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val 130 135 140 Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser 145 150 155 160 His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser 165 170 175 Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val 180 185 190 Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe 195 200 205 Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile 210 215 220 Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met 225 230 235 240 Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys 245 250 255 Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg 260 265 270 Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile 275 280 285 Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met 290 295 300 Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr 305 310 315 320 Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp 325 330 335 Ile Phe Ser Asp Asp Tyr Asp Ala Glu Glu Glu Pro Phe Lys Asn Thr 340 345 350 Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe 355 360 365 Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly 370 375 380 Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu 385 390 395 400 Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp 405 410 415 Phe Ala Gln Gln Asn Gln Pro Glu Val Trp Arg Lys Leu Val Lys Asp 420 425 430 Leu Asp Tyr Phe Glu Ala Ser Gln Glu Pro Tyr Ile Pro Lys Thr Ala 435 440 445 Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser 450 455 460 Thr His Asn Asn Leu Phe Pro Ser Leu Lys Thr Glu Lys Thr Cys Asn 465 470 475 480 Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe 485 490 495 Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu 500 505 510 Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile 515 520 525 Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala 530 535 540 Asn Gly Glu Ile Asn Ser Ile Ala Asp Leu Thr Cys Arg Leu Gln Lys 545 550 555 560 Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu 565 570 575 Glu Gly Arg Gln Lys Asp Met Glu Lys Glu Ala Glu Arg Lys Ile Gly 580 585 590 Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln 595 600 605 Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys 610 615 620 Ser Gly Lys Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln 625 630 635 640 Pro Val Gln Lys Asp Gln Asn Asn Ile Pro Ile Asn Asn Ser Lys Ala 645 650 655 Asn Ser Thr Glu Tyr Arg Met Leu Gln Arg Ala Leu Ala Leu Phe Gly 660 665 670 Ser Glu Asn Phe Arg Leu Lys Ala Tyr Phe Asn Gln Met Asn Leu Val 675 680 685 Gly Asn Asp Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His 690 695 700 Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys 705 710 715 720 Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His 725 730 735 Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr 740 745 750 Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro 755 760 765 Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp 770 775 780 Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro 785 790 795 800 Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp 805 810 815 Tyr Pro Phe Asn Ile Gly Asn Lys Leu Lys Pro Gln Lys Gly Gln Phe 820 825 830 Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu 835 840 845 Phe Lys Asn Tyr Pro Ser Glu Lys Lys Lys Thr Asp Leu Ala Tyr Leu 850 855 860 Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys 865 870 875 880 Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Asn Met 885 890 895 Ala Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile 900 905 910 Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile 915 920 925 Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly 930 935 940 Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr 945 950 955 960 Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Val Leu Ala Lys Asp 965 970 975 Arg Arg Leu Asn Gly Leu Leu Ser Phe Ala Glu Thr Thr Asp Ile Asp 980 985 990 Leu Glu Lys Asn Pro Ile Thr Lys Leu Ser Val Asp His Glu Leu Ile 995 1000 1005 Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly 1010 1015 1020 Leu Glu Lys Lys Leu Ile Asn Lys Tyr Pro Thr Leu Pro Thr Asp 1025 1030 1035 Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn 1040 1045 1050 Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg 1055 1060 1065 Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu 1070 1075 1080 Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr 1085 1090 1095 Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val 1100 1105 1110 Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn 1115 1120 1125 <210> 133 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 133 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asn Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 134 <211> 1175 <212> PRT <213> Porphyromonas gingivalis <400> 134 Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Lys Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln Leu Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Val Gly Ile Glu Tyr Ala Ser Trp Glu Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr 945 950 955 960 Asp Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr 1055 1060 1065 Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Asp Lys Trp Pro Asp Leu Gln Arg Glu Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Thr Ile Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Leu 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Leu Ala Lys Glu Met Val Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 135 <211> 1125 <212> PRT <213> Prevotella pallens <400> 135 Met Lys Glu Glu Glu Lys Gly Lys Thr Pro Val Val Ser Thr Tyr Asn 1 5 10 15 Lys Asp Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His 20 25 30 Asn Val Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Gly Glu Gly 35 40 45 Glu Ile Asn Arg Asp Gly Tyr Glu Asn Thr Leu Glu Lys Ser Trp Asn 50 55 60 Glu Ile Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile 65 70 75 80 Lys His Phe Pro Phe Leu Glu Val Thr Thr Tyr Gln Arg Asn Ser Ala 85 90 95 Asp Thr Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu 100 105 110 Glu Ser Leu Lys Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp 115 120 125 Leu Arg Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg 130 135 140 Pro Lys Phe Glu Glu Asp Leu Gln Glu Lys Met Tyr Asn Ile Phe Asp 145 150 155 160 Ala Ser Ile Gln Leu Val Lys Glu Asp Tyr Lys His Asn Thr Asp Ile 165 170 175 Lys Thr Glu Glu Asp Phe Lys His Leu Asp Arg Lys Gly Gln Phe Lys 180 185 190 Tyr Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu 195 200 205 Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Val Gln 210 215 220 Lys Lys Leu Glu Gly Phe Lys Cys Ser Asn Glu Ser Tyr Gln Lys Met 225 230 235 240 Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg 245 250 255 Leu Gln Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn 260 265 270 Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Arg Glu Glu 275 280 285 Asp Arg Lys Lys Phe Arg Val Pro Ile Glu Ile Ala Asp Glu Asp Tyr 290 295 300 Asp Ala Glu Gln Glu Pro Phe Lys Asn Ala Leu Val Arg His Gln Asp 305 310 315 320 Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe 325 330 335 Thr Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile 340 345 350 Tyr Lys Lys Gln Ile Gly Asp Tyr Lys Glu Ser His His Leu Thr His 355 360 365 Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Thr Lys Gln Asn Arg 370 375 380 Pro Asp Glu Trp Arg Lys Phe Val Lys Thr Phe Asn Ser Phe Glu Thr 385 390 395 400 Ser Lys Glu Pro Tyr Ile Pro Glu Thr Thr Pro His Tyr His Leu Glu 405 410 415 Asn Gln Lys Ile Gly Ile Arg Phe Arg Asn Asp Asn Asp Lys Ile Trp 420 425 430 Pro Ser Leu Lys Thr Asn Ser Glu Lys Asn Glu Lys Ser Lys Tyr Lys 435 440 445 Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu 450 455 460 Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu Asn Thr Asp 465 470 475 480 Asn Asp Asn Glu Ile Glu Thr Lys Lys Lys Glu Asn Lys Asn Asp Lys 485 490 495 Gln Glu Lys His Lys Ile Glu Glu Ile Ile Glu Asn Lys Ile Thr Glu 500 505 510 Ile Tyr Ala Leu Tyr Asp Ala Phe Ala Asn Gly Lys Ile Asn Ser Ile 515 520 525 Asp Lys Leu Glu Glu Tyr Cys Lys Gly Lys Asp Ile Glu Ile Gly His 530 535 540 Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Ser Glu His Lys Asp Met 545 550 555 560 Ala Thr Glu Ala Lys Arg Lys Gln Glu Glu Met Leu Ala Asp Val Gln 565 570 575 Lys Ser Leu Glu Ser Leu Asp Asn Gln Ile Asn Glu Glu Ile Glu Asn 580 585 590 Val Glu Arg Lys Asn Ser Ser Leu Lys Ser Gly Glu Ile Ala Ser Trp 595 600 605 Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu 610 615 620 Gly Asn Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met 625 630 635 640 Leu Gln Arg Ser Leu Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg 645 650 655 Tyr Phe Arg Gln Val Asn Leu Ile Glu Ser Ser Asn Pro His Pro Phe 660 665 670 Leu Asn Asn Thr Glu Trp Glu Lys Cys Asn Asn Ile Leu Ser Phe Tyr 675 680 685 Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu Ser Leu Lys Pro 690 695 700 Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro Lys 705 710 715 720 Thr Asn Cys Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu 725 730 735 Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Glu His 740 745 750 Arg Lys Asn Ile Thr Val Ala Glu Leu Lys Arg Val Gly Leu Val Ala 755 760 765 Lys Val Ile Pro Leu Phe Phe Ser Glu Glu Tyr Lys Asp Ser Val Gln 770 775 780 Pro Phe Tyr Asn Tyr Leu Phe Asn Val Gly Asn Ile Asn Lys Pro Asp 785 790 795 800 Glu Lys Asn Phe Leu Asn Cys Glu Glu Arg Arg Glu Leu Leu Arg Lys 805 810 815 Lys Lys Asp Glu Phe Lys Lys Met Thr Asp Lys Glu Lys Glu Glu Asn 820 825 830 Pro Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu 835 840 845 Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Met Glu 850 855 860 Leu Phe Asn Lys Lys Lys Ile Lys Glu Leu Asn Val Glu Lys Ile Tyr 865 870 875 880 Leu Lys Asn Ile Asn Thr Asn Thr Thr Lys Lys Glu Lys Asn Thr Glu 885 890 895 Glu Lys Asn Gly Glu Glu Lys Ile Ile Lys Glu Lys Asn Asn Ile Leu 900 905 910 Asn Arg Ile Met Pro Met Arg Leu Pro Ile Lys Val Tyr Gly Arg Glu 915 920 925 Asn Phe Ser Lys Asn Lys Lys Lys Lys Ile Arg Arg Asn Thr Phe Phe 930 935 940 Thr Val Tyr Ile Glu Glu Lys Gly Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ala Leu Glu Arg Asp Arg Arg Leu Gly Gly Leu Phe Ser Phe 965 970 975 Val Lys Thr His Ser Lys Ala Glu Ser Lys Ser Asn Thr Ile Ser Lys 980 985 990 Ser Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Lys Ala Arg Ile Glu 995 1000 1005 Ile Ile Lys Asp Met Leu Ala Leu Glu Glu Thr Leu Ile Asp Lys 1010 1015 1020 Tyr Asn Ser Leu Asp Thr Asp Asn Phe His Asn Met Leu Thr Gly 1025 1030 1035 Trp Leu Lys Leu Lys Asp Glu Pro Asp Lys Ala Ser Phe Gln Asn 1040 1045 1050 Asp Val Asp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn 1055 1060 1065 Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn Pro 1070 1075 1080 Phe Ser Leu Ser Ser Ala Asn Thr Ser Glu Glu Lys Gly Leu Gly 1085 1090 1095 Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Thr Ile Glu Lys 1100 1105 1110 Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu 1115 1120 1125 <210> 136 <211> 1157 <212> PRT <213> Myroides odoratimimus <400> 136 Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe 1 5 10 15 Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn 20 25 30 Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg 35 40 45 Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn 50 55 60 Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu 65 70 75 80 Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val 85 90 95 Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu 100 105 110 Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr 115 120 125 Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu 130 135 140 Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val 145 150 155 160 Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr 165 170 175 Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile 180 185 190 Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys 195 200 205 Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe 210 215 220 Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala 225 230 235 240 Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp 245 250 255 Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu 260 265 270 Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu 275 280 285 Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys 290 295 300 Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu 305 310 315 320 Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu 325 330 335 Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln 340 345 350 His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu 355 360 365 Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg 370 375 380 Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr 385 390 395 400 Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg 405 410 415 Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln 420 425 430 Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val 435 440 445 Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Asn Tyr Phe His 450 455 460 Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu 465 470 475 480 Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His 485 490 495 Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu 500 505 510 Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys 515 520 525 Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp 530 535 540 Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys 545 550 555 560 Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp 565 570 575 Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys 580 585 590 Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys 595 600 605 Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys 610 615 620 Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr 625 630 635 640 Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu 645 650 655 Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe 660 665 670 Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu 675 680 685 Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met 690 695 700 Thr Glu Glu Phe Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu 705 710 715 720 Gln Lys Leu Phe Ala Tyr Tyr Asp Thr Ser Lys Ser Asp Leu Asp Leu 725 730 735 Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile 740 745 750 Ala Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr 755 760 765 Leu Glu Ala Arg Leu Gly Tyr Met Glu Asn Val Ile Thr Arg Val Lys 770 775 780 Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe 785 790 795 800 Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp Lys Gln 805 810 815 Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met 820 825 830 Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys 835 840 845 Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr 850 855 860 Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu Asp Lys 865 870 875 880 Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn 885 890 895 Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu 900 905 910 Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr 915 920 925 Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu 930 935 940 Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys 945 950 955 960 Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn 965 970 975 Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr 980 985 990 Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val Asp Ser 995 1000 1005 Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser 1010 1015 1020 Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys 1025 1030 1035 Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser 1040 1045 1050 Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Val Pro 1055 1060 1065 Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val 1070 1075 1080 Lys Phe Ile Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala Gly Glu 1085 1090 1095 Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe 1100 1105 1110 Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu 1115 1120 1125 Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr 1130 1135 1140 Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Thr Ser 1145 1150 1155 <210> 137 <211> 1157 <212> PRT <213> Myroides odoratimimus <400> 137 Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe 1 5 10 15 Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn 20 25 30 Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg 35 40 45 Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn 50 55 60 Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu 65 70 75 80 Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val 85 90 95 Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu 100 105 110 Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr 115 120 125 Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu 130 135 140 Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val 145 150 155 160 Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr 165 170 175 Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile 180 185 190 Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys 195 200 205 Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe 210 215 220 Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala 225 230 235 240 Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp 245 250 255 Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu 260 265 270 Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu 275 280 285 Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys 290 295 300 Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu 305 310 315 320 Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu 325 330 335 Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln 340 345 350 His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu 355 360 365 Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg 370 375 380 Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr 385 390 395 400 Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg 405 410 415 Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln 420 425 430 Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val 435 440 445 Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr Phe His 450 455 460 Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu 465 470 475 480 Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His 485 490 495 Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu 500 505 510 Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys 515 520 525 Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp 530 535 540 Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys 545 550 555 560 Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp 565 570 575 Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys 580 585 590 Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys 595 600 605 Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys 610 615 620 Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr 625 630 635 640 Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu 645 650 655 Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe 660 665 670 Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu 675 680 685 Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met 690 695 700 Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu 705 710 715 720 Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu Glu Leu 725 730 735 Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile 740 745 750 Asp Leu Val Arg Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr 755 760 765 Leu Glu Ala Arg Leu Gly Tyr Ile Glu Asn Val Ile Thr Arg Val Lys 770 775 780 Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe 785 790 795 800 Ala Phe Leu Lys Glu Ser Asn Tyr Thr Val Ala Ser Leu Asp Lys Gln 805 810 815 Ile Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met 820 825 830 Asp Ser Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys 835 840 845 Glu Asp Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr 850 855 860 Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Ile Thr Glu Asp Lys 865 870 875 880 Arg Glu Gln Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn 885 890 895 Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu 900 905 910 Lys Leu Pro Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr 915 920 925 Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu 930 935 940 Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys 945 950 955 960 Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn 965 970 975 Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr 980 985 990 Gln Ser Asp Ile Val Trp Ser Gly Tyr Leu Ser Asn Glu Val Asp Ser 995 1000 1005 Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser 1010 1015 1020 Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys 1025 1030 1035 Ile Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser 1040 1045 1050 Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Leu Pro 1055 1060 1065 Arg Gly Thr Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val 1070 1075 1080 Lys Phe Lys Lys Glu Glu Ile Met Gln Leu Gly Gln Val Arg Glu 1085 1090 1095 Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe 1100 1105 1110 Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu 1115 1120 1125 Asn Asn Tyr Arg Pro Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr 1130 1135 1140 Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala Ser 1145 1150 1155 <210> 138 <211> 1127 <212> PRT <213> Prevotella sp. <400> 138 Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile 1 5 10 15 Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Gln Glu Lys Pro 20 25 30 Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe 35 40 45 Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn 50 55 60 Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Gly 65 70 75 80 Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val 85 90 95 Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala 100 105 110 Ala Tyr Glu Ile Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg 115 120 125 Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val 130 135 140 Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser 145 150 155 160 His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser 165 170 175 Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val 180 185 190 Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe 195 200 205 Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile 210 215 220 Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met 225 230 235 240 Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys 245 250 255 Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg 260 265 270 Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile 275 280 285 Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met 290 295 300 Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr 305 310 315 320 Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp 325 330 335 Ile Phe Ser Asp Asp Tyr Asp Ala Glu Glu Glu Pro Phe Lys Asn Thr 340 345 350 Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe 355 360 365 Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly 370 375 380 Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu 385 390 395 400 Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp 405 410 415 Phe Ala Pro Gln Asn Gln Pro Glu Glu Trp Arg Lys Leu Val Lys Asp 420 425 430 Leu Asp His Phe Glu Thr Ser Gln Glu Pro Tyr Ile Ser Lys Thr Ala 435 440 445 Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser 450 455 460 Thr His Asn Asn Leu Phe Pro Ser Leu Lys Arg Glu Lys Thr Cys Asn 465 470 475 480 Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe 485 490 495 Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu 500 505 510 Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile 515 520 525 Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala 530 535 540 Asn Asn Glu Ile Asn Ser Ile Ala Asp Leu Thr Cys Arg Leu Gln Lys 545 550 555 560 Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu 565 570 575 Glu Gly Arg Gln Lys Asp Met Glu Lys Glu Ala Glu Arg Lys Ile Gly 580 585 590 Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln 595 600 605 Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys 610 615 620 Ser Gly Lys Ile Ala Asp Trp Leu Val Ser Asp Met Met Arg Phe Gln 625 630 635 640 Pro Val Gln Lys Asp Thr Asn Asn Ala Pro Ile Asn Asn Ser Lys Ala 645 650 655 Asn Ser Thr Glu Tyr Arg Met Leu Gln His Ala Leu Ala Leu Phe Gly 660 665 670 Ser Glu Ser Ser Arg Leu Lys Ala Tyr Phe Arg Gln Met Asn Leu Val 675 680 685 Gly Asn Ala Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His 690 695 700 Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys 705 710 715 720 Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His 725 730 735 Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr 740 745 750 Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro 755 760 765 Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp 770 775 780 Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro 785 790 795 800 Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp 805 810 815 Tyr Pro Phe Asn Ile Gly Asn Lys Leu Lys Pro Gln Lys Gly Gln Phe 820 825 830 Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu 835 840 845 Phe Lys Asn Tyr Pro Ser Glu Lys Asn Lys Thr Asp Leu Ala Tyr Leu 850 855 860 Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys 865 870 875 880 Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Lys Thr 885 890 895 Thr Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile 900 905 910 Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile 915 920 925 Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly 930 935 940 Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr 945 950 955 960 Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Val Leu Ala Lys Asp 965 970 975 Arg Arg Leu Asn Gly Leu Leu Ser Phe Ala Glu Thr Thr Asp Ile Asp 980 985 990 Leu Glu Lys Asn Pro Ile Thr Lys Leu Ser Val Asp Tyr Glu Leu Ile 995 1000 1005 Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly 1010 1015 1020 Leu Glu Lys Lys Leu Ile Asp Lys Tyr Ser Thr Leu Pro Thr Asp 1025 1030 1035 Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn 1040 1045 1050 Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg 1055 1060 1065 Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu 1070 1075 1080 Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr 1085 1090 1095 Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val 1100 1105 1110 Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn 1115 1120 1125 <210> 139 <211> 1119 <212> PRT <213> Porphyromonas gingivalis <400> 139 Met Thr Glu Gln Asn Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Asp Glu Ala 500 505 510 Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Val Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Ile Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val Gln Glu Gln Gly Asn Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr 1010 1015 1020 Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Gly Asn Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 140 <211> 1154 <212> PRT <213> Paludibacter propionicigenes <400> 140 Met Lys Thr Ser Ala Asn Asn Ile Tyr Phe Asn Gly Ile Asn Ser Phe 1 5 10 15 Lys Lys Ile Phe Asp Ser Lys Gly Ala Ile Ala Pro Ile Ala Glu Lys 20 25 30 Ser Cys Arg Asn Phe Asp Ile Lys Ala Gln Asn Asp Val Asn Lys Glu 35 40 45 Gln Arg Ile His Tyr Phe Ala Val Gly His Thr Phe Lys Gln Leu Asp 50 55 60 Thr Glu Asn Leu Phe Glu Tyr Val Leu Asp Glu Asn Leu Arg Ala Lys 65 70 75 80 Arg Pro Thr Arg Phe Ile Ser Leu Gln Gln Phe Asp Lys Glu Phe Ile 85 90 95 Glu Asn Ile Lys Arg Leu Ile Ser Asp Ile Arg Asn Ile Asn Ser His 100 105 110 Tyr Ile His Arg Phe Asp Pro Leu Lys Ile Asp Ala Val Pro Thr Asn 115 120 125 Ile Ile Asp Phe Leu Lys Glu Ser Phe Glu Leu Ala Val Ile Gln Ile 130 135 140 Tyr Leu Lys Glu Lys Gly Ile Asn Tyr Leu Gln Phe Ser Glu Asn Pro 145 150 155 160 His Ala Asp Gln Lys Leu Val Ala Phe Leu His Asp Lys Phe Leu Pro 165 170 175 Leu Asp Glu Lys Lys Thr Ser Met Leu Gln Asn Glu Thr Pro Gln Leu 180 185 190 Lys Glu Tyr Lys Glu Tyr Arg Lys Tyr Phe Lys Thr Leu Ser Lys Gln 195 200 205 Ala Ala Ile Asp Gln Leu Leu Phe Ala Glu Lys Glu Thr Asp Tyr Ile 210 215 220 Trp Asn Leu Phe Asp Ser His Pro Val Leu Thr Ile Ser Ala Gly Lys 225 230 235 240 Tyr Leu Ser Phe Tyr Ser Cys Leu Phe Leu Leu Ser Met Phe Leu Tyr 245 250 255 Lys Ser Glu Ala Asn Gln Leu Ile Ser Lys Ile Lys Gly Phe Lys Lys 260 265 270 Asn Thr Thr Glu Glu Glu Lys Ser Lys Arg Glu Ile Phe Thr Phe Phe 275 280 285 Ser Lys Arg Phe Asn Ser Met Asp Ile Asp Ser Glu Glu Asn Gln Leu 290 295 300 Val Lys Phe Arg Asp Leu Ile Leu Tyr Leu Asn His Tyr Pro Val Ala 305 310 315 320 Trp Asn Lys Asp Leu Glu Leu Asp Ser Ser Asn Pro Ala Met Thr Asp 325 330 335 Lys Leu Lys Ser Lys Ile Ile Glu Leu Glu Ile Asn Arg Ser Phe Pro 340 345 350 Leu Tyr Glu Gly Asn Glu Arg Phe Ala Thr Phe Ala Lys Tyr Gln Ile 355 360 365 Trp Gly Lys Lys His Leu Gly Lys Ser Ile Glu Lys Glu Tyr Ile Asn 370 375 380 Ala Ser Phe Thr Asp Glu Glu Ile Thr Ala Tyr Thr Tyr Glu Thr Asp 385 390 395 400 Thr Cys Pro Glu Leu Lys Asp Ala His Lys Lys Leu Ala Asp Leu Lys 405 410 415 Ala Ala Lys Gly Leu Phe Gly Lys Arg Lys Glu Lys Asn Glu Ser Asp 420 425 430 Ile Lys Lys Thr Glu Thr Ser Ile Arg Glu Leu Gln His Glu Pro Asn 435 440 445 Pro Ile Lys Asp Lys Leu Ile Gln Arg Ile Glu Lys Asn Leu Leu Thr 450 455 460 Val Ser Tyr Gly Arg Asn Gln Asp Arg Phe Met Asp Phe Ser Ala Arg 465 470 475 480 Phe Leu Ala Glu Ile Asn Tyr Phe Gly Gln Asp Ala Ser Phe Lys Met 485 490 495 Tyr His Phe Tyr Ala Thr Asp Glu Gln Asn Ser Glu Leu Glu Lys Tyr 500 505 510 Glu Leu Pro Lys Asp Lys Lys Lys Tyr Asp Ser Leu Lys Phe His Gln 515 520 525 Gly Lys Leu Val His Phe Ile Ser Tyr Lys Glu His Leu Lys Arg Tyr 530 535 540 Glu Ser Trp Asp Asp Ala Phe Val Ile Glu Asn Asn Ala Ile Gln Leu 545 550 555 560 Lys Leu Ser Phe Asp Gly Val Glu Asn Thr Val Thr Ile Gln Arg Ala 565 570 575 Leu Leu Ile Tyr Leu Leu Glu Asp Ala Leu Arg Asn Ile Gln Asn Asn 580 585 590 Thr Ala Glu Asn Ala Gly Lys Gln Leu Leu Gln Glu Tyr Tyr Ser His 595 600 605 Asn Lys Ala Asp Leu Ser Ala Phe Lys Gln Ile Leu Thr Gln Gln Asp 610 615 620 Ser Ile Glu Pro Gln Gln Lys Thr Glu Phe Lys Lys Leu Leu Pro Arg 625 630 635 640 Arg Leu Leu Asn Asn Tyr Ser Pro Ala Ile Asn His Leu Gln Thr Pro 645 650 655 His Ser Ser Leu Pro Leu Ile Leu Glu Lys Ala Leu Leu Ala Glu Lys 660 665 670 Arg Tyr Cys Ser Leu Val Val Lys Ala Lys Ala Glu Gly Asn Tyr Asp 675 680 685 Asp Phe Ile Lys Arg Asn Lys Gly Lys Gln Phe Lys Leu Gln Phe Ile 690 695 700 Arg Lys Ala Trp Asn Leu Met Tyr Phe Arg Asn Ser Tyr Leu Gln Asn 705 710 715 720 Val Gln Ala Ala Gly His His Lys Ser Phe His Ile Glu Arg Asp Glu 725 730 735 Phe Asn Asp Phe Ser Arg Tyr Met Phe Ala Phe Glu Glu Leu Ser Gln 740 745 750 Tyr Lys Tyr Tyr Leu Asn Glu Met Phe Glu Lys Lys Gly Phe Phe Glu 755 760 765 Asn Asn Glu Phe Lys Ile Leu Phe Gln Ser Gly Thr Ser Leu Glu Asn 770 775 780 Leu Tyr Glu Lys Thr Lys Gln Lys Phe Glu Ile Trp Leu Ala Ser Asn 785 790 795 800 Thr Ala Lys Thr Asn Lys Pro Asp Asn Tyr His Leu Asn Asn Tyr Glu 805 810 815 Gln Gln Phe Ser Asn Gln Leu Phe Phe Ile Asn Leu Ser His Phe Ile 820 825 830 Asn Tyr Leu Lys Ser Thr Gly Lys Leu Gln Thr Asp Ala Asn Gly Gln 835 840 845 Ile Ile Tyr Glu Ala Leu Asn Asn Val Gln Tyr Leu Ile Pro Glu Tyr 850 855 860 Tyr Tyr Thr Asp Lys Pro Glu Arg Ser Glu Ser Lys Ser Gly Asn Lys 865 870 875 880 Leu Tyr Asn Lys Leu Lys Ala Thr Lys Leu Glu Asp Ala Leu Leu Tyr 885 890 895 Glu Met Ala Met Cys Tyr Leu Lys Ala Asp Lys Gln Ile Ala Asp Lys 900 905 910 Ala Lys His Pro Ile Thr Lys Leu Leu Thr Ser Asp Val Glu Phe Asn 915 920 925 Ile Thr Asn Lys Glu Gly Ile Gln Leu Tyr His Leu Leu Val Pro Phe 930 935 940 Lys Lys Ile Asp Ala Phe Ile Gly Leu Lys Met His Lys Glu Gln Gln 945 950 955 960 Asp Lys Lys His Pro Thr Ser Phe Leu Ala Asn Ile Val Asn Tyr Leu 965 970 975 Glu Leu Val Lys Asn Asp Lys Asp Ile Arg Lys Thr Tyr Glu Ala Phe 980 985 990 Ser Thr Asn Pro Val Lys Arg Thr Leu Thr Tyr Asp Asp Leu Ala Lys 995 1000 1005 Ile Asp Gly His Leu Ile Ser Lys Ser Ile Lys Phe Thr Asn Val 1010 1015 1020 Thr Leu Glu Leu Glu Arg Tyr Phe Ile Phe Lys Glu Ser Leu Ile 1025 1030 1035 Val Lys Lys Gly Asn Asn Ile Asp Phe Lys Tyr Ile Lys Gly Leu 1040 1045 1050 Arg Asn Tyr Tyr Asn Asn Glu Lys Lys Lys Asn Glu Gly Ile Arg 1055 1060 1065 Asn Lys Ala Phe His Phe Gly Ile Pro Asp Ser Lys Ser Tyr Asp 1070 1075 1080 Gln Leu Ile Arg Asp Ala Glu Val Met Phe Ile Ala Asn Glu Val 1085 1090 1095 Lys Pro Thr His Ala Thr Lys Tyr Thr Asp Leu Asn Lys Gln Leu 1100 1105 1110 His Thr Val Cys Asp Lys Leu Met Glu Thr Val His Asn Asp Tyr 1115 1120 1125 Phe Ser Lys Glu Gly Asp Gly Lys Lys Lys Arg Glu Ala Ala Gly 1130 1135 1140 Gln Lys Tyr Phe Glu Asn Ile Ile Ser Ala Lys 1145 1150 <210> 141 <211> 1119 <212> PRT <213> Porphyromonas gingivalis <400> 141 Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Gly Thr Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Glu Asp Thr Asp Gly Ala 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Ala His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala 500 505 510 Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Met Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Trp Val Gln Pro 785 790 795 800 Phe Tyr Asn Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Ile Cys 865 870 875 880 Gly Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val Gln Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Cys 1010 1015 1020 Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Arg Lys Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Phe Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 142 <211> 1179 <212> PRT <213> Flavobacterium columnare <400> 142 Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His 1 5 10 15 Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala 20 25 30 Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn 35 40 45 Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe 50 55 60 Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu 65 70 75 80 Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His 85 90 95 Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile 100 105 110 Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr 115 120 125 Ile Asn Pro Lys Ile Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val 130 135 140 Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu 145 150 155 160 Leu Leu Lys Glu Lys Leu Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln 165 170 175 Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn 180 185 190 Leu Glu Asn Ala Val Phe Asn His Cys Leu Arg Pro Phe Leu Glu Glu 195 200 205 Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr 210 215 220 Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser 225 230 235 240 Gly Leu Val Phe Leu Met Ser Phe Phe Leu His Arg Lys Glu Phe Gln 245 250 255 Val Phe Thr Ser Gly Leu Glu Gly Phe Lys Ala Lys Val Asn Thr Ile 260 265 270 Lys Glu Glu Glu Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile 275 280 285 Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg 290 295 300 Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr 305 310 315 320 His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile 325 330 335 Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser 340 345 350 Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg 355 360 365 Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His 370 375 380 Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met 385 390 395 400 Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val 405 410 415 Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser 420 425 430 Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe 435 440 445 Glu Lys Leu Ser Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys 450 455 460 Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Asn Pro 465 470 475 480 Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg 485 490 495 Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser 500 505 510 Gln Asn Lys Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln 515 520 525 Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys 530 535 540 Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu 545 550 555 560 Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu 565 570 575 Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile 580 585 590 Arg Asp Phe Thr Leu Asp Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr 595 600 605 Leu Ile Lys Thr Ile Asn Thr Asp Ser Ser Val Thr Phe Glu Asn Gln 610 615 620 Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Ile Gln Lys Glu Leu Thr 625 630 635 640 Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Glu His Glu Ile Glu Val 645 650 655 Asp Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro 660 665 670 Lys Asn Lys Val Asp Asp Lys Lys Leu Gln Arg Lys Tyr Val Phe Tyr 675 680 685 Arg Asn Glu Ile Arg Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile 690 695 700 His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu 705 710 715 720 Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile 725 730 735 Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr 740 745 750 Lys Gly Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe 755 760 765 Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Asn Thr Glu Ser 770 775 780 Thr Phe Leu Glu Asn Gly Leu Ile Gly Leu Pro Pro Lys Ile Leu Lys 785 790 795 800 Lys Glu Leu Ser Lys Arg Phe Lys Tyr Ile Phe Ile Val Phe Gln Lys 805 810 815 Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr 820 825 830 Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr 835 840 845 Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe 850 855 860 Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr 865 870 875 880 Pro Asp Ile Val Glu Arg Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg 885 890 895 Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val 900 905 910 Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu 915 920 925 Ser Asp Phe Tyr Val Ser Lys Ala Glu Arg Glu Lys Ile Lys Ala Asp 930 935 940 Ala Lys Ala Tyr Gln Lys Arg Asn Asp Ser Ser Leu Trp Asn Lys Val 945 950 955 960 Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu 965 970 975 Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala 980 985 990 Thr Leu Leu Thr Tyr Asp Asp Arg Thr Trp Thr Tyr Ala Leu Gln Lys 995 1000 1005 Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr 1010 1015 1020 Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys 1025 1030 1035 Glu Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Gln Ile Leu Glu 1040 1045 1050 Glu Tyr Thr Asp Phe Leu Ser Thr Gln Ile His Pro Ala Asp Phe 1055 1060 1065 Glu Arg Glu Gly Asn Pro Asn Phe Lys Lys Tyr Leu Ala His Ser 1070 1075 1080 Ile Leu Glu Asn Glu Asp Asp Leu Asp Lys Leu Pro Glu Lys Val 1085 1090 1095 Glu Ala Met Arg Glu Leu Asp Glu Thr Ile Thr Asn Pro Ile Ile 1100 1105 1110 Lys Lys Ala Ile Val Leu Ile Ile Ile Arg Asn Lys Met Ala His 1115 1120 1125 Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp Leu Ala Asn Arg Phe 1130 1135 1140 Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala Thr Tyr Phe Asn Arg 1145 1150 1155 Val Phe Glu Thr Ile Thr Lys Glu Leu Trp Glu Asn Lys Glu Lys 1160 1165 1170 Lys Asp Lys Thr Gln Val 1175 <210> 143 <211> 1145 <212> PRT <213> Psychroflexus torquis <400> 143 Met Glu Ser Ile Ile Gly Leu Gly Leu Ser Phe Asn Pro Tyr Lys Thr 1 5 10 15 Ala Asp Lys His Tyr Phe Gly Ser Phe Leu Asn Leu Val Glu Asn Asn 20 25 30 Leu Asn Ala Val Phe Ala Glu Phe Lys Glu Arg Ile Ser Tyr Lys Ala 35 40 45 Lys Asp Glu Asn Ile Ser Ser Leu Ile Glu Lys His Phe Ile Asp Asn 50 55 60 Met Ser Ile Val Asp Tyr Glu Lys Lys Ile Ser Ile Leu Asn Gly Tyr 65 70 75 80 Leu Pro Ile Ile Asp Phe Leu Asp Asp Glu Leu Glu Asn Asn Leu Asn 85 90 95 Thr Arg Val Lys Asn Phe Lys Lys Asn Phe Ile Ile Leu Ala Glu Ala 100 105 110 Ile Glu Lys Leu Arg Asp Tyr Tyr Thr His Phe Tyr His Asp Pro Ile 115 120 125 Thr Phe Glu Asp Asn Lys Glu Pro Leu Leu Glu Leu Leu Asp Glu Val 130 135 140 Leu Leu Lys Thr Ile Leu Asp Val Lys Lys Lys Tyr Leu Lys Thr Asp 145 150 155 160 Lys Thr Lys Glu Ile Leu Lys Asp Ser Leu Arg Glu Glu Met Asp Leu 165 170 175 Leu Val Ile Arg Lys Thr Asp Glu Leu Arg Glu Lys Lys Lys Thr Asn 180 185 190 Pro Lys Ile Gln His Thr Asp Ser Ser Gln Ile Lys Asn Ser Ile Phe 195 200 205 Asn Asp Ala Phe Gln Gly Leu Leu Tyr Glu Asp Lys Gly Asn Asn Lys 210 215 220 Lys Thr Gln Val Ser His Arg Ala Lys Thr Arg Leu Asn Pro Lys Asp 225 230 235 240 Ile His Lys Gln Glu Glu Arg Asp Phe Glu Ile Pro Leu Ser Thr Ser 245 250 255 Gly Leu Val Phe Leu Met Ser Leu Phe Leu Ser Lys Lys Glu Ile Glu 260 265 270 Asp Phe Lys Ser Asn Ile Lys Gly Phe Lys Gly Lys Val Val Lys Asp 275 280 285 Glu Asn His Asn Ser Leu Lys Tyr Met Ala Thr His Arg Val Tyr Ser 290 295 300 Ile Leu Ala Phe Lys Gly Leu Lys Tyr Arg Ile Lys Thr Asp Thr Phe 305 310 315 320 Ser Lys Glu Thr Leu Met Met Gln Met Ile Asp Glu Leu Ser Lys Val 325 330 335 Pro Asp Cys Val Tyr Gln Asn Leu Ser Glu Thr Lys Gln Lys Asp Phe 340 345 350 Ile Glu Asp Trp Asn Glu Tyr Phe Lys Asp Asn Glu Glu Asn Thr Glu 355 360 365 Asn Leu Glu Asn Ser Arg Val Val His Pro Val Ile Arg Lys Arg Tyr 370 375 380 Glu Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala 385 390 395 400 Asn Phe Lys Thr Leu Lys Phe Gln Val Phe Met Gly Tyr Tyr Ile His 405 410 415 Asp Gln Arg Thr Lys Thr Ile Gly Thr Thr Asn Ile Thr Thr Glu Arg 420 425 430 Thr Val Lys Glu Lys Ile Asn Val Phe Gly Lys Leu Ser Lys Met Asp 435 440 445 Asn Leu Lys Lys His Phe Phe Ser Gln Leu Ser Asp Asp Glu Asn Thr 450 455 460 Asp Trp Glu Phe Phe Pro Asn Pro Ser Tyr Asn Phe Leu Thr Gln Ala 465 470 475 480 Asp Asn Ser Pro Ala Asn Asn Ile Pro Ile Tyr Leu Glu Leu Lys Asn 485 490 495 Gln Gln Ile Ile Lys Glu Lys Asp Ala Ile Lys Ala Glu Val Asn Gln 500 505 510 Thr Gln Asn Arg Asn Pro Asn Lys Pro Ser Lys Arg Asp Leu Leu Asn 515 520 525 Lys Ile Leu Lys Thr Tyr Glu Asp Phe His Gln Gly Asp Pro Thr Ala 530 535 540 Ile Leu Ser Leu Asn Glu Ile Pro Ala Leu Leu His Leu Phe Leu Val 545 550 555 560 Lys Pro Asn Asn Lys Thr Gly Gln Gln Ile Glu Asn Ile Ile Arg Ile 565 570 575 Lys Ile Glu Lys Gln Phe Lys Ala Ile Asn His Pro Ser Lys Asn Asn 580 585 590 Lys Gly Ile Pro Lys Ser Leu Phe Ala Asp Thr Asn Val Arg Val Asn 595 600 605 Ala Ile Lys Leu Lys Lys Asp Leu Glu Ala Glu Leu Asp Met Leu Asn 610 615 620 Lys Lys His Ile Ala Phe Lys Glu Asn Gln Lys Ala Ser Ser Asn Tyr 625 630 635 640 Asp Lys Leu Leu Lys Glu His Gln Phe Thr Pro Lys Asn Lys Arg Pro 645 650 655 Glu Leu Arg Lys Tyr Val Phe Tyr Lys Ser Glu Lys Gly Glu Glu Ala 660 665 670 Thr Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Lys Asp Phe Lys 675 680 685 Thr Lys Trp Lys Gly Cys Gln His Ser Glu Leu Gln Arg Lys Leu Ala 690 695 700 Phe Tyr Asp Arg His Thr Lys Gln Asp Ile Lys Glu Leu Leu Ser Gly 705 710 715 720 Cys Glu Phe Asp His Ser Leu Leu Asp Ile Asn Ala Tyr Phe Gln Lys 725 730 735 Asp Asn Phe Glu Asp Phe Phe Ser Lys Tyr Leu Glu Asn Arg Ile Glu 740 745 750 Thr Leu Glu Gly Val Leu Lys Lys Leu His Asp Phe Lys Asn Glu Pro 755 760 765 Thr Pro Leu Lys Gly Val Phe Lys Asn Cys Phe Lys Phe Leu Lys Arg 770 775 780 Gln Asn Tyr Val Thr Glu Ser Pro Glu Ile Ile Lys Lys Arg Ile Leu 785 790 795 800 Ala Lys Pro Thr Phe Leu Pro Arg Gly Val Phe Asp Glu Arg Pro Thr 805 810 815 Met Lys Lys Gly Lys Asn Pro Leu Lys Asp Lys Asn Glu Phe Ala Glu 820 825 830 Trp Phe Val Glu Tyr Leu Glu Asn Lys Asp Tyr Gln Lys Phe Tyr Asn 835 840 845 Ala Glu Glu Tyr Arg Met Arg Asp Ala Asp Phe Lys Lys Asn Ala Val 850 855 860 Ile Lys Lys Gln Lys Leu Lys Asp Phe Tyr Thr Leu Gln Met Val Asn 865 870 875 880 Tyr Leu Leu Lys Glu Val Phe Gly Lys Asp Glu Met Asn Leu Gln Leu 885 890 895 Ser Glu Leu Phe Gln Thr Arg Gln Glu Arg Leu Lys Leu Gln Gly Ile 900 905 910 Ala Lys Lys Gln Met Asn Lys Glu Thr Gly Asp Ser Ser Glu Asn Thr 915 920 925 Arg Asn Gln Thr Tyr Ile Trp Asn Lys Asp Val Pro Val Ser Phe Phe 930 935 940 Asn Gly Lys Val Thr Ile Asp Lys Val Lys Leu Lys Asn Ile Gly Lys 945 950 955 960 Tyr Lys Arg Tyr Glu Arg Asp Glu Arg Val Lys Thr Phe Ile Gly Tyr 965 970 975 Glu Val Asp Glu Lys Trp Met Met Tyr Leu Pro His Asn Trp Lys Asp 980 985 990 Arg Tyr Ser Val Lys Pro Ile Asn Val Ile Asp Leu Gln Ile Gln Glu 995 1000 1005 Tyr Glu Glu Ile Arg Ser His Glu Leu Leu Lys Glu Ile Gln Asn 1010 1015 1020 Leu Glu Gln Tyr Ile Tyr Asp His Thr Thr Asp Lys Asn Ile Leu 1025 1030 1035 Leu Gln Asp Gly Asn Pro Asn Phe Lys Met Tyr Val Leu Asn Gly 1040 1045 1050 Leu Leu Ile Gly Ile Lys Gln Val Asn Ile Pro Asp Phe Ile Val 1055 1060 1065 Leu Lys Gln Asn Thr Asn Phe Asp Lys Ile Asp Phe Thr Gly Ile 1070 1075 1080 Ala Ser Cys Ser Glu Leu Glu Lys Lys Thr Ile Ile Leu Ile Ala 1085 1090 1095 Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Asn Lys Met Ile 1100 1105 1110 Tyr Asp Leu Ala Asn Glu Phe Leu Lys Ile Glu Lys Asn Glu Thr 1115 1120 1125 Tyr Ala Asn Tyr Tyr Leu Lys Val Leu Lys Lys Met Ile Ser Asp 1130 1135 1140 Leu Ala 1145 <210> 144 <211> 948 <212> PRT <213> Riemerella anatipestifer <400> 144 Met Phe Phe Ser Phe His Asn Ala Gln Arg Val Ile Phe Lys His Leu 1 5 10 15 Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu Asp Tyr Lys 20 25 30 Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His Leu Asn Arg 35 40 45 Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg Tyr Arg Phe 50 55 60 Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe Phe Thr Asn 65 70 75 80 Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys Lys Val Ser 85 90 95 Gly Phe Lys Ala Ser His Lys Gln Arg Glu Lys Met Thr Thr Glu Val 100 105 110 Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu Glu Ser Arg 115 120 125 Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu Leu Ser Arg 130 135 140 Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asn Lys Lys His 145 150 155 160 Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu Glu Glu Gln 165 170 175 Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg Phe Pro Tyr 180 185 190 Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys Ser Ile Arg 195 200 205 Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr Asp Lys Lys 210 215 220 Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr Leu Leu Ser 225 230 235 240 Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro Gln Glu Trp 245 250 255 Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser Asn Gln Pro 260 265 270 Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp Asn Lys Ile 275 280 285 Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser Leu Glu Ile 290 295 300 Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn Ser Gly Phe 305 310 315 320 Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro Leu Met Phe 325 330 335 Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys Glu Thr Val 340 345 350 Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu Arg Ile Asn 355 360 365 Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu Pro Leu Gly 370 375 380 Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys Gln Pro Asp 385 390 395 400 Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile Ala Glu Thr 405 410 415 Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser Ser Pro Lys 420 425 430 Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val Leu Ala Asp 435 440 445 Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala Tyr Asp Ala 450 455 460 Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr Glu Phe Trp 465 470 475 480 Phe Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys Asn Arg Leu 485 490 495 Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr Asn Pro His 500 505 510 Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn Leu Val Asp 515 520 525 Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu Glu Ala Ile 530 535 540 Lys His Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu Leu Lys Val 545 550 555 560 Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu Gln Gly Gly 565 570 575 Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg Glu Thr Leu 580 585 590 Ser Lys Asp Leu Thr Leu Ser Lys Pro Ile Arg Lys Glu Ile Lys Lys 595 600 605 His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu Tyr Phe Lys 610 615 620 Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu Ser Tyr Lys 625 630 635 640 Leu Glu Ala Lys Ala Pro Leu Leu Lys Lys Glu Glu His Tyr Glu Tyr 645 650 655 Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln Arg Leu Glu 660 665 670 Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr Lys Arg Trp 675 680 685 Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln Asp Ile Met 690 695 700 Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe Lys Glu Leu 705 710 715 720 Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala Val Asn Val 725 730 735 Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr Leu Pro Met 740 745 750 Val Leu Pro Val Lys Val Tyr Pro Thr Thr Ala Phe Gly Glu Val Gln 755 760 765 Tyr His Glu Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu Glu Gln Thr 770 775 780 Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys Asp Arg Arg 785 790 795 800 Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp Thr Gln Lys 805 810 815 His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu Ile Tyr Gln 820 825 830 Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu Glu Glu Lys 835 840 845 Leu Leu Asn Lys His Ala Ser Leu Ser Ser Leu Glu Asn Glu Phe Arg 850 855 860 Thr Leu Leu Glu Glu Trp Lys Lys Lys Tyr Ala Ala Ser Ser Met Val 865 870 875 880 Thr Asp Lys His Ile Ala Phe Ile Ala Ser Val Arg Asn Ala Phe Cys 885 890 895 His Asn Gln Tyr Pro Phe Tyr Lys Glu Thr Leu His Ala Pro Ile Leu 900 905 910 Leu Phe Thr Val Ala Gln Pro Thr Thr Glu Glu Lys Asp Gly Leu Gly 915 920 925 Ile Ala Glu Ala Leu Leu Lys Val Leu Arg Glu Tyr Cys Glu Ile Val 930 935 940 Lys Ser Gln Ile 945 <210> 145 <211> 1139 <212> PRT <213> Prevotella pleuritidis <400> 145 Met Glu Asn Asp Lys Arg Leu Glu Glu Ser Ala Cys Tyr Thr Leu Asn 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Val Asn His Ile Asn Lys Thr Leu Glu Leu Lys Asn Lys 35 40 45 Lys Asn Gln Glu Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile 50 55 60 Lys Thr His Trp Ala Lys Val Asn Gly Asp Leu Asn Lys Thr Asp Arg 65 70 75 80 Leu Arg Glu Leu Met Ile Lys His Phe Pro Phe Leu Glu Ala Ala Ile 85 90 95 Tyr Ser Asn Asn Lys Glu Asp Lys Glu Glu Val Lys Glu Glu Lys Gln 100 105 110 Ala Lys Ala Gln Ser Phe Lys Ser Leu Lys Asp Cys Leu Phe Leu Phe 115 120 125 Leu Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys Tyr 130 135 140 Ser Glu Ser Ser Lys Glu Pro Glu Phe Glu Glu Gly Leu Leu Glu Lys 145 150 155 160 Met Tyr Asn Thr Phe Asp Ala Ser Ile Arg Leu Val Lys Glu Asp Tyr 165 170 175 Gln Tyr Asn Lys Asp Ile Asp Pro Glu Lys Asp Phe Lys His Leu Glu 180 185 190 Arg Lys Glu Asp Phe Asn Tyr Leu Phe Thr Asp Lys Asp Asn Lys Gly 195 200 205 Lys Ile Thr Lys Asn Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu 210 215 220 Lys Lys Asp Ala Ile Trp Met Gln Gln Lys Phe Arg Gly Phe Lys Asp 225 230 235 240 Asn Arg Gly Asn Lys Glu Lys Met Thr His Glu Val Phe Cys Arg Ser 245 250 255 Arg Met Leu Leu Pro Lys Ile Arg Leu Glu Ser Thr Gln Thr Gln Asp 260 265 270 Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser 275 280 285 Leu Tyr Glu Arg Leu Gln Gly Ala Tyr Arg Glu Lys Phe Lys Val Pro 290 295 300 Phe Asp Ser Ile Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Arg 305 310 315 320 Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg 325 330 335 Tyr Phe Asp Tyr Asn Glu Ile Phe Lys Asn Leu Arg Phe Gln Ile Asp 340 345 350 Leu Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Lys 355 360 365 Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile 370 375 380 Gln Glu Phe Thr Lys Gln Asn Arg Pro Asp Lys Trp Gln Ala Ile Ile 385 390 395 400 Lys Asp Leu Asp Thr Tyr Glu Thr Ser Asn Glu Arg Tyr Ile Ser Glu 405 410 415 Thr Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe 420 425 430 Arg Asn Asp Asn Asn Asp Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu 435 440 445 Lys Asn Glu Lys Ser Lys Tyr Asn Leu Asp Lys Pro Tyr Gln Ala Glu 450 455 460 Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu 465 470 475 480 Leu Leu Lys Met Glu Asn Thr Asp Asn Asp Lys Glu Asp Asn Glu Val 485 490 495 Gly Thr Lys Lys Lys Gly Asn Lys Asn Asn Lys Gln Glu Lys His Lys 500 505 510 Ile Glu Glu Ile Ile Glu Asn Lys Ile Lys Asp Ile Tyr Ala Leu Tyr 515 520 525 Asp Ala Phe Thr Asn Gly Glu Ile Asn Ser Ile Asp Glu Leu Ala Glu 530 535 540 Gln Arg Glu Gly Lys Asp Ile Glu Ile Gly His Leu Pro Lys Gln Leu 545 550 555 560 Ile Val Ile Leu Lys Asn Lys Ser Lys Asp Met Ala Glu Lys Ala Asn 565 570 575 Arg Lys Gln Lys Glu Met Ile Lys Asp Thr Lys Lys Arg Leu Ala Thr 580 585 590 Leu Asp Lys Gln Val Lys Gly Glu Ile Glu Asp Gly Gly Arg Asn Ile 595 600 605 Arg Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met 610 615 620 Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Lys Pro Leu Asn 625 630 635 640 Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu 645 650 655 Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val 660 665 670 Asn Leu Ile Lys Ser Ser Asn Pro His Pro Phe Leu Glu Asp Thr Lys 675 680 685 Trp Glu Glu Cys Tyr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Lys 690 695 700 Ala Lys Ile Lys Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Lys Lys 705 710 715 720 Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro Lys Thr Asn Arg Lys Thr 725 730 735 Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe 740 745 750 Thr Glu Pro Ile Lys Glu Trp Phe Lys Arg His Gln Asn Asp Ser Glu 755 760 765 Glu Tyr Lys Lys Val Glu Ala Leu Asp Arg Val Gly Leu Val Ala Lys 770 775 780 Val Ile Pro Leu Phe Phe Lys Glu Glu Tyr Phe Lys Glu Asp Ala Gln 785 790 795 800 Lys Glu Ile Asn Asn Cys Val Gln Pro Phe Tyr Ser Phe Pro Tyr Asn 805 810 815 Val Gly Asn Ile His Lys Pro Glu Glu Lys Asn Phe Leu His Cys Glu 820 825 830 Glu Arg Arg Lys Leu Trp Asp Lys Lys Lys Asp Lys Phe Lys Gly Tyr 835 840 845 Lys Ala Lys Glu Lys Ser Lys Lys Met Thr Asp Lys Glu Lys Glu Glu 850 855 860 His Arg Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu 865 870 875 880 Leu Arg Leu Val Arg Asn Gln Asp Ile Leu Thr Trp Leu Leu Cys Thr 885 890 895 Lys Leu Ile Asp Lys Leu Lys Ile Asp Glu Leu Asn Ile Glu Glu Leu 900 905 910 Gln Lys Leu Arg Leu Lys Asp Ile Asp Thr Asp Thr Ala Lys Lys Glu 915 920 925 Lys Asn Asn Ile Leu Asn Arg Val Met Pro Met Arg Leu Pro Val Thr 930 935 940 Val Tyr Glu Ile Asp Lys Ser Phe Asn Ile Val Lys Asp Lys Pro Leu 945 950 955 960 His Thr Val Tyr Ile Glu Glu Thr Gly Thr Lys Leu Leu Lys Gln Gly 965 970 975 Asn Phe Lys Ala Leu Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser 980 985 990 Phe Val Lys Thr Ser Ser Glu Ala Glu Ser Lys Ser Lys Pro Ile Ser 995 1000 1005 Lys Leu Arg Val Glu Tyr Glu Leu Gly Ala Tyr Gln Lys Ala Arg 1010 1015 1020 Ile Asp Ile Ile Lys Asp Met Leu Ala Leu Glu Lys Thr Leu Ile 1025 1030 1035 Asp Asn Asp Glu Asn Leu Pro Thr Asn Lys Phe Ser Asp Met Leu 1040 1045 1050 Lys Ser Trp Leu Lys Gly Lys Gly Glu Ala Asn Lys Ala Arg Leu 1055 1060 1065 Gln Asn Asp Val Gly Leu Leu Val Ala Val Arg Asn Ala Phe Ser 1070 1075 1080 His Asn Gln Tyr Pro Met Tyr Asn Ser Glu Val Phe Lys Gly Met 1085 1090 1095 Lys Leu Leu Ser Leu Ser Ser Asp Ile Pro Glu Lys Glu Gly Leu 1100 1105 1110 Gly Ile Ala Lys Gln Leu Lys Asp Lys Ile Lys Glu Thr Ile Glu 1115 1120 1125 Arg Ile Ile Glu Ile Glu Lys Glu Ile Arg Asn 1130 1135 <210> 146 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 146 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 147 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 147 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asn Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 148 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 148 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 149 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 149 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Val Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Tyr Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Ile Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Ile Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 150 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 150 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 151 <211> 1133 <212> PRT <213> Prevotella falsenii <400> 151 Met Lys Asn Asp Asn Asn Ser Thr Lys Ser Thr Asp Tyr Thr Leu Gly 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn Lys 35 40 45 Lys Asp Gln Glu Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile 50 55 60 Lys Thr Leu Trp Gly Lys Val Asp Thr Asp Ile Asn Lys Lys Asp Arg 65 70 75 80 Leu Arg Glu Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala Thr 85 90 95 Tyr Gln Gln Ser Ser Thr Asn Asn Thr Lys Gln Lys Glu Glu Glu Gln 100 105 110 Ala Lys Ala Gln Ser Phe Glu Ser Leu Lys Asp Cys Leu Phe Leu Phe 115 120 125 Leu Glu Lys Leu Arg Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys His 130 135 140 Ser Lys Ser Leu Glu Glu Pro Lys Leu Glu Glu Lys Leu Leu Glu Asn 145 150 155 160 Met Tyr Asn Ile Phe Asp Thr Asn Val Gln Leu Val Ile Lys Asp Tyr 165 170 175 Glu His Asn Lys Asp Ile Asn Pro Glu Glu Asp Phe Lys His Leu Gly 180 185 190 Arg Ala Glu Gly Glu Phe Asn Tyr Tyr Phe Thr Arg Asn Lys Lys Gly 195 200 205 Asn Ile Thr Glu Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu 210 215 220 Lys Lys Asp Ala Ile Trp Ala Gln Thr Lys Ile Lys Gly Phe Lys Asp 225 230 235 240 Asn Arg Glu Asn Lys Gln Lys Met Thr His Glu Val Phe Cys Arg Ser 245 250 255 Arg Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp 260 265 270 Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser 275 280 285 Leu Tyr Lys Arg Leu Gln Gly Glu Lys Arg Glu Lys Phe Arg Val Pro 290 295 300 Phe Asp Pro Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys 305 310 315 320 Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg 325 330 335 Tyr Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp 340 345 350 Leu Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Gln Ile Gly Asp Lys 355 360 365 Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile 370 375 380 Gln Glu Phe Ala Lys Glu Asn Arg Pro Asp Glu Trp Lys Ala Leu Val 385 390 395 400 Lys Asp Leu Asp Thr Phe Glu Glu Ser Asn Glu Pro Tyr Ile Ser Glu 405 410 415 Thr Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Asn 420 425 430 Lys Asn Lys Lys Lys Lys Lys Thr Ile Trp Pro Ser Leu Glu Thr Lys 435 440 445 Thr Thr Val Asn Glu Arg Ser Lys Tyr Asn Leu Gly Lys Ser Phe Lys 450 455 460 Ala Glu Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr 465 470 475 480 Tyr Leu Leu Leu Asn Lys Glu Glu Pro Asn Asn Gly Lys Ile Asn Ala 485 490 495 Ser Lys Val Glu Gly Ile Ile Glu Lys Lys Ile Arg Asp Ile Tyr Lys 500 505 510 Leu Tyr Gly Ala Phe Ala Asn Glu Glu Ile Asn Asn Glu Glu Glu Leu 515 520 525 Lys Glu Tyr Cys Glu Gly Lys Asp Ile Ala Ile Arg His Leu Pro Lys 530 535 540 Gln Met Ile Ala Ile Leu Lys Asn Glu Tyr Lys Asp Met Ala Lys Lys 545 550 555 560 Ala Glu Asp Lys Gln Lys Lys Met Ile Lys Asp Thr Lys Lys Arg Leu 565 570 575 Ala Ala Leu Asp Lys Gln Val Lys Gly Glu Val Glu Asp Gly Gly Arg 580 585 590 Asn Ile Lys Pro Leu Lys Ser Gly Arg Ile Ala Ser Trp Leu Val Asn 595 600 605 Asp Met Met Arg Phe Gln Pro Val Gln Arg Asp Arg Asp Gly Tyr Pro 610 615 620 Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Leu Leu Gln Arg 625 630 635 640 Thr Leu Ala Leu Phe Gly Ser Glu Arg Glu Arg Leu Ala Pro Tyr Phe 645 650 655 Arg Gln Met Asn Leu Ile Gly Lys Asp Asn Pro His Pro Phe Leu Lys 660 665 670 Asp Thr Lys Trp Lys Glu His Asn Asn Ile Leu Ser Phe Tyr Arg Ser 675 680 685 Tyr Leu Glu Ala Lys Lys Asn Phe Leu Gly Ser Leu Lys Pro Glu Asp 690 695 700 Trp Lys Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn 705 710 715 720 Arg Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg 725 730 735 Gly Ile Phe Thr Glu Pro Ile Arg Glu Trp Phe Ile Arg His Gln Asn 740 745 750 Glu Ser Glu Glu Tyr Lys Lys Val Lys Asp Phe Asp Arg Ile Gly Leu 755 760 765 Val Ala Lys Val Ile Pro Leu Phe Phe Lys Glu Asp Tyr Gln Lys Glu 770 775 780 Ile Glu Asp Tyr Val Gln Pro Phe Tyr Gly Tyr Pro Phe Asn Val Gly 785 790 795 800 Asn Ile His Asn Ser Gln Glu Gly Thr Phe Leu Asn Lys Lys Glu Arg 805 810 815 Glu Glu Leu Trp Lys Gly Asn Lys Thr Lys Phe Lys Asp Tyr Lys Thr 820 825 830 Lys Glu Lys Asn Lys Glu Lys Thr Asn Lys Asp Lys Phe Lys Lys Lys 835 840 845 Thr Asp Glu Glu Lys Glu Glu Phe Arg Ser Tyr Leu Asp Phe Gln Ser 850 855 860 Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp Ile 865 870 875 880 Val Thr Trp Leu Leu Cys Met Glu Leu Ile Asp Lys Leu Lys Ile Asp 885 890 895 Glu Leu Asn Ile Glu Glu Leu Gln Lys Leu Arg Leu Lys Asp Ile Asp 900 905 910 Thr Asp Thr Ala Lys Lys Glu Lys Asn Asn Ile Leu Asn Arg Ile Met 915 920 925 Pro Met Glu Leu Pro Val Thr Val Tyr Glu Thr Asp Asp Ser Asn Asn 930 935 940 Ile Ile Lys Asp Lys Pro Leu His Thr Ile Tyr Ile Lys Glu Ala Glu 945 950 955 960 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp Arg 965 970 975 Arg Leu Asn Gly Leu Phe Ser Phe Val Glu Thr Ser Ser Glu Ala Glu 980 985 990 Leu Lys Ser Lys Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu Gly 995 1000 1005 Glu Tyr Gln Arg Ala Arg Val Glu Ile Ile Lys Asp Met Leu Arg 1010 1015 1020 Leu Glu Glu Thr Leu Ile Gly Asn Asp Glu Lys Leu Pro Thr Asn 1025 1030 1035 Lys Phe Arg Gln Met Leu Asp Lys Trp Leu Glu His Lys Lys Glu 1040 1045 1050 Thr Asp Asp Thr Asp Leu Lys Asn Asp Val Lys Leu Leu Thr Glu 1055 1060 1065 Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asp Arg 1070 1075 1080 Ile Ala Phe Ala Asn Ile Lys Pro Phe Ser Leu Ser Ser Ala Asn 1085 1090 1095 Thr Ser Asn Glu Glu Gly Leu Gly Ile Ala Lys Lys Leu Lys Asp 1100 1105 1110 Lys Thr Lys Glu Thr Ile Asp Arg Ile Ile Glu Ile Glu Glu Gln 1115 1120 1125 Thr Ala Thr Lys Arg 1130 <210> 152 <211> 1116 <212> PRT <213> Prevotella pleuritidis <400> 152 Met Glu Asn Asp Lys Arg Leu Glu Glu Ser Thr Cys Tyr Thr Leu Asn 1 5 10 15 Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val 20 25 30 Tyr Ile Thr Ile Asn His Ile Asn Lys Leu Leu Glu Ile Arg Gln Ile 35 40 45 Asp Asn Asp Glu Lys Val Leu Asp Ile Lys Ala Leu Trp Gln Lys Val 50 55 60 Asp Lys Asp Ile Asn Gln Lys Ala Arg Leu Arg Glu Leu Met Ile Lys 65 70 75 80 His Phe Pro Phe Leu Glu Ala Ala Ile Tyr Ser Asn Asn Lys Glu Asp 85 90 95 Lys Glu Glu Val Lys Glu Glu Lys Gln Ala Lys Ala Gln Ser Phe Lys 100 105 110 Ser Leu Lys Asp Cys Leu Phe Leu Phe Leu Glu Lys Leu Gln Glu Ala 115 120 125 Arg Asn Tyr Tyr Ser His Tyr Lys Ser Ser Glu Ser Ser Lys Glu Pro 130 135 140 Glu Phe Glu Glu Gly Leu Leu Glu Lys Met Tyr Asn Thr Phe Gly Val 145 150 155 160 Ser Ile Arg Leu Val Lys Glu Asp Tyr Gln Tyr Asn Lys Asp Ile Asp 165 170 175 Pro Glu Lys Asp Phe Lys His Leu Glu Arg Lys Glu Asp Phe Asn Tyr 180 185 190 Leu Phe Thr Asp Lys Asp Asn Lys Gly Lys Ile Thr Lys Asn Gly Leu 195 200 205 Leu Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Met 210 215 220 Gln Gln Lys Leu Arg Gly Phe Lys Asp Asn Arg Gly Asn Lys Glu Lys 225 230 235 240 Met Thr His Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Ile 245 250 255 Arg Leu Glu Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu 260 265 270 Asn Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Gln Gly 275 280 285 Ala Tyr Arg Glu Lys Phe Lys Val Pro Phe Asp Ser Ile Asp Glu Asp 290 295 300 Tyr Asp Ala Glu Gln Glu Pro Phe Arg Asn Thr Leu Val Arg His Gln 305 310 315 320 Asp Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile 325 330 335 Phe Lys Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser 340 345 350 Ile Tyr Lys Lys Leu Ile Gly Asp Asn Lys Glu Asp Arg His Leu Thr 355 360 365 His Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Ala Lys Gln Lys 370 375 380 Arg Pro Asn Glu Trp Gln Ala Leu Val Lys Asp Leu Asp Ile Tyr Glu 385 390 395 400 Thr Ser Asn Glu Gln Tyr Ile Ser Glu Thr Thr Pro His Tyr His Leu 405 410 415 Glu Asn Gln Lys Ile Gly Ile Arg Phe Lys Asn Lys Lys Asp Lys Ile 420 425 430 Trp Pro Ser Leu Glu Thr Asn Gly Lys Glu Asn Glu Lys Ser Lys Tyr 435 440 445 Asn Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Ile His Glu 450 455 460 Leu Leu Pro Met Met Phe Tyr Asp Leu Leu Leu Lys Lys Glu Glu Pro 465 470 475 480 Asn Asn Asp Glu Lys Asn Ala Ser Ile Val Glu Gly Phe Ile Lys Lys 485 490 495 Glu Ile Lys Arg Met Tyr Ala Ile Tyr Asp Ala Phe Ala Asn Glu Glu 500 505 510 Ile Asn Ser Lys Glu Gly Leu Glu Glu Tyr Cys Lys Asn Lys Gly Phe 515 520 525 Gln Glu Arg His Leu Pro Lys Gln Met Ile Ala Ile Leu Thr Asn Lys 530 535 540 Ser Lys Asn Met Ala Glu Lys Ala Lys Arg Lys Gln Lys Glu Met Ile 545 550 555 560 Lys Asp Thr Lys Lys Arg Leu Ala Thr Leu Asp Lys Gln Val Lys Gly 565 570 575 Glu Ile Glu Asp Gly Gly Arg Asn Ile Arg Leu Leu Lys Ser Gly Glu 580 585 590 Ile Ala Arg Trp Leu Val Asn Asp Met Met Arg Phe Gln Ser Val Gln 595 600 605 Lys Asp Lys Glu Gly Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr 610 615 620 Glu Tyr Gln Met Leu Gln Arg Ser Leu Ala Leu Tyr Asn Lys Glu Gln 625 630 635 640 Lys Pro Thr Pro Tyr Phe Ile Gln Val Asn Leu Ile Lys Ser Ser Asn 645 650 655 Pro His Pro Phe Leu Glu Glu Thr Lys Trp Glu Glu Cys Asn Asn Ile 660 665 670 Leu Ser Phe Tyr Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu 675 680 685 Ser Leu Lys Pro Glu Asp Trp Lys Lys Asn Gln Tyr Phe Leu Met Leu 690 695 700 Lys Glu Pro Lys Thr Asn Arg Lys Thr Leu Val Gln Gly Trp Lys Asn 705 710 715 720 Gly Phe Asn Leu Pro Arg Gly Ile Phe Thr Glu Pro Ile Lys Glu Trp 725 730 735 Phe Lys Arg His Gln Asn Asp Ser Glu Glu Tyr Lys Lys Val Glu Ala 740 745 750 Leu Asp Arg Val Gly Leu Val Ala Lys Val Ile Pro Leu Phe Phe Lys 755 760 765 Glu Glu Tyr Phe Lys Glu Asp Ala Gln Lys Glu Ile Asn Asn Cys Val 770 775 780 Gln Pro Phe Tyr Ser Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro 785 790 795 800 Glu Glu Lys Asn Phe Leu His Cys Glu Glu Arg Arg Lys Leu Trp Asp 805 810 815 Lys Lys Lys Asp Lys Phe Lys Gly Tyr Lys Ala Lys Glu Lys Ser Lys 820 825 830 Lys Met Thr Asp Lys Glu Lys Glu Glu His Arg Ser Tyr Leu Glu Phe 835 840 845 Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln 850 855 860 Asp Ile Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys 865 870 875 880 Ile Asp Glu Leu Asn Ile Glu Glu Leu Gln Lys Leu Arg Leu Lys Asp 885 890 895 Ile Asp Thr Asp Thr Ala Lys Lys Glu Lys Asn Asn Ile Leu Asn Arg 900 905 910 Ile Met Pro Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Lys Ser 915 920 925 Phe Asn Ile Val Lys Asp Lys Pro Leu His Thr Ile Tyr Ile Glu Glu 930 935 940 Thr Gly Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys 945 950 955 960 Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Lys Thr Ser Ser Glu 965 970 975 Ala Glu Ser Lys Ser Lys Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 980 985 990 Leu Gly Ala Tyr Gln Lys Ala Arg Ile Asp Ile Ile Lys Asp Met Leu 995 1000 1005 Ala Leu Glu Lys Thr Leu Ile Asp Asn Asp Glu Asn Leu Pro Thr 1010 1015 1020 Asn Lys Phe Ser Asp Met Leu Lys Ser Trp Leu Lys Gly Lys Gly 1025 1030 1035 Glu Ala Asn Lys Ala Arg Leu Gln Asn Asp Val Asp Leu Leu Val 1040 1045 1050 Ala Ile Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asn 1055 1060 1065 Ser Glu Val Phe Lys Gly Met Lys Leu Leu Ser Leu Ser Ser Asp 1070 1075 1080 Ile Pro Glu Lys Glu Gly Leu Gly Ile Ala Lys Gln Leu Lys Asp 1085 1090 1095 Lys Ile Lys Glu Thr Ile Glu Arg Ile Ile Glu Ile Glu Lys Glu 1100 1105 1110 Ile Arg Asn 1115 <210> 153 <211> 1119 <212> PRT <213> Porphyromonas gingivalis <400> 153 Met Thr Glu Gln Asn Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Gly Thr Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Ile Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asp Thr Leu Asp 530 535 540 Arg Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val His Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr 1010 1015 1020 Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Arg Lys Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala 1100 1105 1110 Glu Arg Ile Ile Gln Val 1115 <210> 154 <211> 1175 <212> PRT <213> Porphyromonas gulae <400> 154 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Met Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Ser Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asn Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Ala Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Asp Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Met Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr 945 950 955 960 Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr 1055 1060 1065 Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 155 <211> 1119 <212> PRT <213> Porphyromonas gulae <400> 155 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Val Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asn Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu Asp Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Gln Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Pro Asn Val Gln Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Glu Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Gly Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val 995 1000 1005 Phe Glu Leu Thr Leu Arg Leu Glu Glu Ser Leu Leu Ser Arg Tyr 1010 1015 1020 Pro His Leu Pro Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 156 <211> 1119 <212> PRT <213> Porphyromonas gulae <400> 156 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Gly Pro Tyr Glu Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Lys Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Ala Cys Ser Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asn Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu Asp Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Asn Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Lys Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val His Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Gly Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr 1010 1015 1020 Pro His Leu Pro Asp Glu Asn Phe Arg Glu Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Gly Lys Trp Pro Asp Leu His Gly Lys Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 157 <211> 1175 <212> PRT <213> Porphyromonas gulae <400> 157 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Ser Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Lys Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Met Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro 945 950 955 960 Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr 1055 1060 1065 Leu Arg Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Ser Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile 1160 1165 1170 Gln Val 1175 <210> 158 <211> 1119 <212> PRT <213> Porphyromonas gulae <400> 158 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Phe Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Glu Val 180 185 190 Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Pro Tyr Glu Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu Arg Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn Cys Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Gln Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Pro Asn Val Gln Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Glu Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr 1010 1015 1020 Pro His Leu Pro Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Thr Lys Trp Pro Glu Leu His Gly Lys Val 1040 1045 1050 Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Trp Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Ile 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 159 <211> 1174 <212> PRT <213> Porphyromonas gulae <400> 159 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Gly Pro Tyr Glu Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Leu Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Cys Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Thr Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Thr Ile Leu Ser Gln Glu Arg Lys Asp Met Lys 565 570 575 Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Ala Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn Cys Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Asp Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Asp Arg Ala Glu Glu Trp Glu Arg Gly 820 825 830 Met Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Lys Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro 945 950 955 960 Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asn Thr 995 1000 1005 Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp Arg 1010 1015 1020 Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu Ala 1025 1030 1035 Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu Leu 1040 1045 1050 Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr Leu 1055 1060 1065 Arg Leu Glu Glu Ser Leu Leu Ser Arg Tyr Pro His Leu Pro Asp 1070 1075 1080 Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu Leu 1085 1090 1095 Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile Ala 1100 1105 1110 Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Glu 1115 1120 1125 Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro Asp 1130 1135 1140 Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu Ser 1145 1150 1155 Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile Gln 1160 1165 1170 Ala <210> 160 <211> 1135 <212> PRT <213> Porphyromonas gulae <400> 160 Met Asn Thr Val Pro Ala Thr Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Ile Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Cys Phe Asp Pro Asp Ser Gly Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Lys Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Ala Tyr Thr Phe Ala Cys Glu Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Leu Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Phe Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Tyr Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 161 <211> 1218 <212> PRT <213> Capnocytophaga cynodegmi <400> 161 Met Glu Asn Lys Thr Ser Leu Gly Asn Asn Ile Tyr Tyr Asn Pro Phe 1 5 10 15 Lys Pro Gln Asp Lys Ser Tyr Phe Ala Gly Tyr Leu Asn Ala Ala Met 20 25 30 Glu Asn Ile Asp Ser Val Phe Arg Glu Leu Gly Lys Arg Leu Lys Gly 35 40 45 Lys Glu Tyr Thr Ser Glu Asn Phe Phe Asp Ala Ile Phe Lys Glu Asn 50 55 60 Ile Ser Leu Val Glu Tyr Glu Arg Tyr Val Lys Leu Leu Ser Asp Tyr 65 70 75 80 Phe Pro Met Ala Arg Leu Leu Asp Lys Lys Glu Val Pro Ile Lys Glu 85 90 95 Arg Lys Glu Asn Phe Lys Lys Asn Phe Arg Gly Ile Ile Lys Ala Val 100 105 110 Arg Asp Leu Arg Asn Phe Tyr Thr His Lys Glu His Gly Glu Val Glu 115 120 125 Ile Thr Asp Glu Ile Phe Gly Val Leu Asp Glu Met Leu Lys Ser Thr 130 135 140 Val Leu Thr Val Lys Lys Lys Lys Ile Lys Thr Asp Lys Thr Lys Glu 145 150 155 160 Ile Leu Lys Lys Ser Ile Glu Lys Gln Leu Asp Ile Leu Cys Gln Lys 165 170 175 Lys Leu Glu Tyr Leu Lys Asp Thr Ala Arg Lys Ile Glu Glu Lys Arg 180 185 190 Arg Asn Gln Arg Glu Arg Gly Glu Lys Lys Leu Val Pro Arg Phe Glu 195 200 205 Tyr Ser Asp Arg Arg Asp Asp Leu Ile Ala Ala Ile Tyr Asn Asp Ala 210 215 220 Phe Asp Val Tyr Ile Asp Lys Lys Lys Asp Ser Leu Lys Glu Ser Ser 225 230 235 240 Lys Thr Lys Tyr Asn Thr Glu Ser Tyr Pro Gln Gln Glu Glu Gly Asp 245 250 255 Leu Lys Ile Pro Ile Ser Lys Asn Gly Val Val Phe Leu Leu Ser Leu 260 265 270 Phe Leu Ser Lys Gln Glu Val His Ala Phe Lys Ser Lys Ile Ala Gly 275 280 285 Phe Lys Ala Thr Val Ile Asp Glu Ala Thr Val Ser His Arg Lys Asn 290 295 300 Ser Ile Cys Phe Met Ala Thr His Glu Ile Phe Ser His Leu Ala Tyr 305 310 315 320 Lys Lys Leu Lys Arg Lys Val Arg Thr Ala Glu Ile Asn Tyr Ser Glu 325 330 335 Ala Glu Asn Ala Glu Gln Leu Ser Ile Tyr Ala Lys Glu Thr Leu Met 340 345 350 Met Gln Met Leu Asp Glu Leu Ser Lys Val Pro Asp Val Val Tyr Gln 355 360 365 Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile Glu Asp Trp Asn Glu 370 375 380 Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr Met Glu Glu Glu Gln 385 390 395 400 Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Lys Phe Asn Tyr 405 410 415 Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln Phe Pro Thr Leu Arg 420 425 430 Phe Gln Val His Leu Gly Asn Tyr Leu His Asp Ser Arg Pro Lys Glu 435 440 445 His Leu Ile Ser Asp Arg Arg Ile Lys Glu Lys Ile Thr Val Phe Gly 450 455 460 Arg Leu Ser Glu Leu Glu His Lys Lys Ala Leu Phe Ile Lys Asn Thr 465 470 475 480 Glu Thr Asn Glu Asp Arg Lys His Tyr Trp Glu Val Phe Pro Asn Pro 485 490 495 Asn Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val Asn Asp Lys Asp Phe 500 505 510 Pro Ile Ala Gly Ser Ile Leu Asp Arg Glu Lys Gln Pro Thr Ala Gly 515 520 525 Lys Ile Gly Ile Lys Val Asn Leu Leu Asn Gln Lys Tyr Ile Ser Glu 530 535 540 Val Asp Lys Ala Val Lys Ala His Gln Leu Lys Gln Arg Asn Asn Lys 545 550 555 560 Pro Ser Ile Gln Asn Ile Ile Glu Glu Ile Val Pro Ile Asn Gly Ser 565 570 575 Asn Pro Lys Glu Ile Ile Val Phe Gly Gly Gln Pro Thr Ala Tyr Leu 580 585 590 Ser Met Asn Asp Ile His Ser Ile Leu Tyr Glu Phe Phe Asp Lys Trp 595 600 605 Glu Lys Lys Lys Glu Lys Leu Glu Lys Lys Gly Glu Lys Glu Leu Arg 610 615 620 Lys Glu Ile Gly Lys Glu Leu Glu Glu Lys Ile Val Gly Lys Ile Gln 625 630 635 640 Thr Gln Ile Gln Gln Ile Ile Asp Lys Asp Ile Asn Ala Lys Ile Leu 645 650 655 Lys Pro Tyr Gln Asp Asp Asp Ser Thr Ala Ile Asp Lys Glu Lys Leu 660 665 670 Ile Lys Asp Leu Lys Gln Glu Gln Lys Ile Leu Gln Lys Leu Lys Asn 675 680 685 Glu Gln Thr Ala Arg Glu Lys Glu Tyr Gln Glu Cys Ile Ala Tyr Gln 690 695 700 Glu Glu Ser Arg Lys Ile Lys Arg Ser Asp Lys Ser Arg Gln Lys Tyr 705 710 715 720 Leu Arg Asn Gln Leu Lys Arg Lys Tyr Pro Glu Val Pro Thr Arg Lys 725 730 735 Glu Ile Leu Tyr Tyr Gln Glu Lys Gly Lys Val Ala Val Trp Leu Ala 740 745 750 Asn Asp Ile Lys Arg Phe Met Pro Thr Asp Phe Lys Asn Glu Trp Lys 755 760 765 Gly Glu Gln His Ser Leu Leu Gln Lys Ser Leu Ala Tyr Tyr Glu Gln 770 775 780 Cys Lys Glu Glu Leu Lys Asn Leu Leu Pro Gln Gln Lys Val Phe Lys 785 790 795 800 His Leu Pro Phe Glu Leu Gly Gly His Phe Gln Gln Lys Tyr Leu Tyr 805 810 815 Gln Phe Tyr Thr Arg Tyr Leu Asp Lys Arg Leu Glu His Ile Ser Gly 820 825 830 Leu Val Gln Gln Ala Glu Asn Phe Lys Asn Glu Asn Lys Val Phe Lys 835 840 845 Lys Val Glu Asn Glu Cys Phe Lys Phe Leu Lys Lys Gln Asn Tyr Thr 850 855 860 His Lys Gly Leu Asp Ala Gln Ala Gln Ser Val Leu Gly Tyr Pro Ile 865 870 875 880 Phe Leu Glu Arg Gly Phe Met Asp Glu Lys Pro Thr Ile Ile Lys Gly 885 890 895 Lys Thr Phe Lys Gly Asn Glu Ser Leu Phe Thr Asp Trp Phe Arg Tyr 900 905 910 Tyr Lys Glu Tyr Gln Asn Phe Gln Thr Phe Tyr Asp Thr Glu Asn Tyr 915 920 925 Pro Leu Val Glu Leu Glu Lys Lys Gln Ala Asp Arg Lys Arg Glu Thr 930 935 940 Lys Ile Tyr Gln Gln Lys Lys Asn Asp Val Phe Thr Leu Leu Met Ala 945 950 955 960 Lys His Ile Phe Lys Ser Val Phe Lys Gln Asp Ser Ile Asp Arg Phe 965 970 975 Ser Leu Glu Asp Leu Tyr Gln Ser Arg Glu Glu Arg Leu Glu Asn Gln 980 985 990 Glu Lys Ala Lys Gln Thr Gly Glu Arg Asn Thr Asn Tyr Ile Trp Asn 995 1000 1005 Lys Thr Val Asp Leu Asn Leu Cys Asp Gly Lys Val Thr Val Glu 1010 1015 1020 Asn Val Lys Leu Lys Asn Val Gly Asn Phe Ile Lys Tyr Glu Tyr 1025 1030 1035 Asp Gln Arg Val Gln Thr Phe Leu Lys Tyr Glu Glu Asn Ile Lys 1040 1045 1050 Trp Gln Ala Phe Leu Ile Lys Glu Ser Lys Glu Glu Glu Asn Tyr 1055 1060 1065 Pro Tyr Ile Val Glu Arg Glu Ile Glu Gln Tyr Glu Lys Val Arg 1070 1075 1080 Arg Glu Glu Leu Leu Lys Glu Val His Leu Ile Glu Glu Tyr Ile 1085 1090 1095 Leu Glu Lys Val Lys Asp Lys Glu Ile Leu Lys Lys Gly Asp Asn 1100 1105 1110 Gln Asn Phe Lys Tyr Tyr Ile Leu Asn Gly Leu Leu Lys Gln Leu 1115 1120 1125 Lys Asn Glu Asp Val Glu Ser Tyr Lys Val Phe Asn Leu Asn Thr 1130 1135 1140 Lys Pro Glu Asp Val Asn Ile Asn Gln Leu Lys Gln Glu Ala Thr 1145 1150 1155 Asp Leu Glu Gln Lys Ala Phe Val Leu Thr Tyr Ile Arg Asn Lys 1160 1165 1170 Phe Ala His Asn Gln Leu Pro Lys Lys Glu Phe Trp Asp Tyr Cys 1175 1180 1185 Gln Glu Lys Tyr Gly Lys Ile Glu Lys Glu Lys Thr Tyr Ala Glu 1190 1195 1200 Tyr Phe Ala Glu Val Phe Lys Arg Glu Lys Glu Ala Leu Met Lys 1205 1210 1215 <210> 162 <211> 1090 <212> PRT <213> Prevotella sp. <400> 162 Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr 1 5 10 15 Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile 20 25 30 Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn 35 40 45 Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly 50 55 60 Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln 65 70 75 80 Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr 85 90 95 Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp 100 105 110 Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg 115 120 125 Asp Leu Thr Asn His Tyr Lys Thr Tyr Glu Glu Lys Leu Ile Asp Gly 130 135 140 Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Ser 145 150 155 160 Lys Tyr Tyr Thr Val Ala Leu Arg Asn Thr Lys Glu Arg Tyr Gly Tyr 165 170 175 Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Asn Ile Lys Lys Ile Thr 180 185 190 Lys Asp Ala Tyr Gly Lys Arg Lys Ser Gln Val Asn Thr Gly Phe Phe 195 200 205 Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu 210 215 220 Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln 225 230 235 240 Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn 245 250 255 Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn 260 265 270 Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys 275 280 285 Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu 290 295 300 Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile 305 310 315 320 Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Thr Asp Arg Phe 325 330 335 Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His 340 345 350 Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala 355 360 365 Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln 370 375 380 Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys 385 390 395 400 Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe 405 410 415 Glu Asn Val Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile 420 425 430 Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met 435 440 445 Phe Ile Ser Asp Lys Gly Ser Ser Ala Pro Leu Leu Pro Leu Ile Glu 450 455 460 Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr 465 470 475 480 Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys 485 490 495 Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu 500 505 510 Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser 515 520 525 Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile 530 535 540 Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr 545 550 555 560 Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys 565 570 575 Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg 580 585 590 Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys 595 600 605 Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile 610 615 620 Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp 625 630 635 640 Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu 645 650 655 Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu 660 665 670 Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Asp Phe Tyr 675 680 685 Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Cys Asn 690 695 700 Glu Ile Lys Arg Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp 705 710 715 720 Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr 725 730 735 Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu 740 745 750 Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe 755 760 765 Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val 770 775 780 Leu Asn Asp Asp Phe Gln Thr Phe Tyr Gln Trp Lys Arg Asn Tyr His 785 790 795 800 Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln 805 810 815 His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg 820 825 830 Ala Ser Arg Thr Glu Arg Tyr Arg Lys Leu Ala Ser Asn Lys Ile Arg 835 840 845 Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile 850 855 860 Leu Asp Lys Arg Leu Ser Asn Cys Arg Asn Glu Tyr Gln Lys Ser Glu 865 870 875 880 Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu 885 890 895 Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe 900 905 910 Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu 915 920 925 Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr 930 935 940 Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val 945 950 955 960 Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser 965 970 975 Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp 980 985 990 Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp 995 1000 1005 Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu 1010 1015 1020 Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn 1025 1030 1035 Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg 1040 1045 1050 Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Ile Val Glu 1055 1060 1065 Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe 1070 1075 1080 Gly Glu Tyr Ala Ile Met Lys 1085 1090 <210> 163 <211> 1090 <212> PRT <213> Prevotella sp. <400> 163 Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr 1 5 10 15 Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile 20 25 30 Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn 35 40 45 Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly 50 55 60 Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln 65 70 75 80 Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr 85 90 95 Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp 100 105 110 Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg 115 120 125 Asp Gln Ala Ser His Tyr Lys Thr Tyr Asp Glu Lys Leu Ile Asp Gly 130 135 140 Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn 145 150 155 160 Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr 165 170 175 Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val 180 185 190 Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe 195 200 205 Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu 210 215 220 Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln 225 230 235 240 Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn 245 250 255 Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn 260 265 270 Ser Ile Lys Gln Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys 275 280 285 Ser Val Ala Met Asp Met Leu Asn Glu Ile Lys Arg Cys Pro Asn Glu 290 295 300 Leu Phe Glu Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile 305 310 315 320 Ser Asn Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe 325 330 335 Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His 340 345 350 Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala 355 360 365 Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln 370 375 380 Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Val Glu Thr Met Arg Lys 385 390 395 400 Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe 405 410 415 Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile 420 425 430 Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met 435 440 445 Phe Ile Ser Asp Glu Glu Thr Pro Ala Pro Leu Leu Pro Val Ile Glu 450 455 460 Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr 465 470 475 480 Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys 485 490 495 Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu 500 505 510 Phe Lys Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser 515 520 525 Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Ile Asp Leu Ile 530 535 540 Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr 545 550 555 560 Val Asp Asp Met Leu Ala Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys 565 570 575 Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg 580 585 590 Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys 595 600 605 Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile 610 615 620 Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asn 625 630 635 640 Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu 645 650 655 Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu 660 665 670 Tyr Lys Val Phe Val Arg Ser Ile Pro Ala Asn Ala Val Asp Phe Tyr 675 680 685 Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Ile Gly Leu Ser Asn 690 695 700 Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp 705 710 715 720 Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr 725 730 735 Asp Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu 740 745 750 Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe 755 760 765 Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val 770 775 780 Leu Asn Asp Asp Phe Gln Thr Phe Tyr Gln Trp Lys Arg Asn Tyr Arg 785 790 795 800 Tyr Met Asp Met Leu Arg Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln 805 810 815 Ser Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg 820 825 830 Ala Ser Arg Thr Glu Arg Tyr Arg Lys Leu Ala Ser Asn Lys Ile Arg 835 840 845 Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile 850 855 860 Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu 865 870 875 880 Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu 885 890 895 Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe 900 905 910 Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu 915 920 925 Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr 930 935 940 Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val 945 950 955 960 Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser 965 970 975 Asp Thr Val Ser Lys Glu Asp Ile Met Glu Glu Phe Lys Lys Tyr Asp 980 985 990 Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp 995 1000 1005 Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu 1010 1015 1020 Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn 1025 1030 1035 Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg 1040 1045 1050 Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Val Val Glu 1055 1060 1065 Ile Arg Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe 1070 1075 1080 Gly Glu Tyr Ala Ile Met Lys 1085 1090 <210> 164 <211> 1090 <212> PRT <213> Prevotella sp. <400> 164 Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr 1 5 10 15 Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile 20 25 30 Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn 35 40 45 Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly 50 55 60 Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln 65 70 75 80 Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr 85 90 95 Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp 100 105 110 Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg 115 120 125 Asp Leu Thr Asn His Tyr Lys Thr Tyr Glu Glu Lys Leu Ile Asp Gly 130 135 140 Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Phe Ser Gly Met Ile Ser 145 150 155 160 Lys Tyr Tyr Thr Val Ala Leu Arg Asn Thr Lys Glu Arg Tyr Gly Tyr 165 170 175 Lys Ala Glu Asp Leu Ala Phe Ile Gln Asp Asn Arg Tyr Lys Phe Thr 180 185 190 Lys Asp Ala Tyr Gly Lys Arg Lys Ser Gln Val Asn Thr Gly Ser Phe 195 200 205 Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Thr Lys Lys Leu His Leu 210 215 220 Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln 225 230 235 240 Tyr Ile Asn Leu Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn 245 250 255 Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn 260 265 270 Ser Ile Lys Gln Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys 275 280 285 Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu 290 295 300 Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile 305 310 315 320 Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe 325 330 335 Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His 340 345 350 Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala 355 360 365 Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln 370 375 380 Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Val Glu Thr Met Arg Lys 385 390 395 400 Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe 405 410 415 Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile 420 425 430 Val Glu Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met 435 440 445 Phe Ile Ser Asp Glu Glu Asn Pro Thr Pro Leu Leu Pro Val Ile Glu 450 455 460 Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr 465 470 475 480 Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Glu 485 490 495 Lys Thr Glu Lys Leu Ile Ile Asp Val His Asp Arg Tyr Lys Arg Leu 500 505 510 Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser 515 520 525 Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Met Asp Leu Ile 530 535 540 Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr 545 550 555 560 Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys 565 570 575 Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg 580 585 590 Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys 595 600 605 Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile 610 615 620 Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp 625 630 635 640 Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu 645 650 655 Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu 660 665 670 Tyr Lys Val Phe Val Arg Ser Ile Pro Ala Asn Ala Val Asp Phe Tyr 675 680 685 Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Ile Gly Leu Ser Asn 690 695 700 Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp 705 710 715 720 Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr 725 730 735 Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu 740 745 750 Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe 755 760 765 Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val 770 775 780 Leu Asn Asp Asp Phe Gln Thr Phe Tyr Gln Trp Lys Arg Asn Tyr Arg 785 790 795 800 Tyr Met Asp Met Leu Arg Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln 805 810 815 His Cys Phe Thr Ser Ile Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg 820 825 830 Ala Ser Arg Thr Glu Arg Tyr Arg Lys Leu Ala Ser Asn Lys Ile Arg 835 840 845 Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile 850 855 860 Leu Asp Lys Arg Leu Ser Asn Cys Arg Asn Glu Tyr Gln Lys Ser Glu 865 870 875 880 Lys Ile Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu 885 890 895 Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe 900 905 910 Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu 915 920 925 Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Ile Tyr Thr 930 935 940 Ile Thr Ser Gly Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val 945 950 955 960 Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser 965 970 975 Asn Thr Val Ser Lys Glu Asp Ile Met Glu Glu Phe Lys Lys Tyr Asp 980 985 990 Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp 995 1000 1005 Ala Phe Asp Thr Tyr Pro Glu Leu Pro Ala Arg Val Asp Arg Lys 1010 1015 1020 Glu Lys Val Asp Phe Trp Ser Ile Leu Asp Val Leu Ser Asn Asn 1025 1030 1035 Lys Asp Ile Asn Asn Glu Gln Ser Tyr Ile Leu Arg Lys Ile Arg 1040 1045 1050 Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Ile Val Glu 1055 1060 1065 Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe 1070 1075 1080 Gly Glu Tyr Ala Ile Met Lys 1085 1090 <210> 165 <211> 1131 <212> PRT <213> Phaeodactylibacter xiamenensis <400> 165 Met Thr Asn Thr Pro Lys Arg Arg Thr Leu His Arg His Pro Ser Tyr 1 5 10 15 Phe Gly Ala Phe Leu Asn Ile Ala Arg His Asn Ala Phe Met Ile Met 20 25 30 Glu His Leu Ser Thr Lys Tyr Asp Met Glu Asp Lys Asn Thr Leu Asp 35 40 45 Glu Ala Gln Leu Pro Asn Ala Lys Leu Phe Gly Cys Leu Lys Lys Arg 50 55 60 Tyr Gly Lys Pro Asp Val Thr Glu Gly Val Ser Arg Asp Leu Arg Arg 65 70 75 80 Tyr Phe Pro Phe Leu Asn Tyr Pro Leu Phe Leu His Leu Glu Lys Gln 85 90 95 Gln Asn Ala Glu Gln Ala Ala Thr Tyr Asp Ile Asn Pro Glu Asp Ile 100 105 110 Glu Phe Thr Leu Lys Gly Phe Phe Arg Leu Leu Asn Gln Met Arg Asn 115 120 125 Asn Tyr Ser His Tyr Ile Ser Asn Thr Asp Tyr Gly Lys Phe Asp Lys 130 135 140 Leu Pro Val Gln Asp Ile Tyr Glu Ala Ala Ile Phe Arg Leu Leu Asp 145 150 155 160 Arg Gly Lys His Thr Lys Arg Phe Asp Val Phe Glu Ser Lys His Thr 165 170 175 Arg His Leu Glu Ser Asn Asn Ser Glu Tyr Arg Pro Arg Ser Leu Ala 180 185 190 Asn Ser Pro Asp His Glu Asn Thr Val Ala Phe Val Thr Cys Leu Phe 195 200 205 Leu Glu Arg Lys Tyr Ala Phe Pro Phe Leu Ser Arg Leu Asp Cys Phe 210 215 220 Arg Ser Thr Asn Asp Ala Ala Glu Gly Asp Pro Leu Ile Arg Lys Ala 225 230 235 240 Ser His Glu Cys Tyr Thr Met Phe Cys Cys Arg Leu Pro Gln Pro Lys 245 250 255 Leu Glu Ser Ser Asp Ile Leu Leu Asp Met Val Asn Glu Leu Gly Arg 260 265 270 Cys Pro Ser Ala Leu Tyr Asn Leu Leu Ser Glu Glu Asp Gln Ala Arg 275 280 285 Phe His Ile Lys Arg Glu Glu Ile Thr Gly Phe Glu Glu Asp Pro Asp 290 295 300 Glu Glu Leu Glu Gln Glu Ile Val Leu Lys Arg His Ser Asp Arg Phe 305 310 315 320 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Asp Thr Glu Ala Phe Gln Thr 325 330 335 Leu Arg Phe Asp Val Tyr Leu Gly Arg Trp Arg Thr Lys Pro Val Tyr 340 345 350 Lys Lys Arg Ile Tyr Gly Gln Glu Arg Asp Arg Val Leu Thr Gln Ser 355 360 365 Ile Arg Thr Phe Thr Arg Leu Ser Arg Leu Leu Pro Ile Tyr Glu Asn 370 375 380 Val Lys His Asp Ala Val Arg Gln Asn Glu Glu Asp Gly Lys Leu Val 385 390 395 400 Asn Pro Asp Val Thr Ser Gln Phe His Lys Ser Trp Ile Gln Ile Glu 405 410 415 Ser Asp Asp Arg Ala Phe Leu Ser Asp Arg Ile Glu His Phe Ser Pro 420 425 430 His Tyr Asn Phe Gly Asp Gln Val Ile Gly Leu Lys Phe Ile Asn Pro 435 440 445 Asp Arg Tyr Ala Ala Ile Gln Asn Val Phe Pro Lys Leu Pro Gly Glu 450 455 460 Glu Lys Lys Asp Lys Asp Ala Lys Leu Val Asn Glu Thr Ala Asp Ala 465 470 475 480 Ile Ile Ser Thr His Glu Ile Arg Ser Leu Phe Leu Tyr His Tyr Leu 485 490 495 Ser Lys Lys Pro Ile Ser Ala Gly Asp Glu Arg Arg Phe Ile Gln Val 500 505 510 Asp Thr Glu Thr Phe Ile Lys Gln Tyr Ile Asp Thr Ile Lys Leu Phe 515 520 525 Phe Glu Asp Ile Lys Ser Gly Glu Leu Gln Pro Ile Ala Asp Pro Pro 530 535 540 Asn Tyr Gln Lys Asn Glu Pro Leu Pro Tyr Val Arg Gly Asp Lys Glu 545 550 555 560 Lys Thr Gln Glu Glu Arg Ala Gln Tyr Arg Glu Arg Gln Lys Glu Ile 565 570 575 Lys Glu Arg Arg Lys Glu Leu Asn Thr Leu Leu Gln Asn Arg Tyr Gly 580 585 590 Leu Ser Ile Gln Tyr Ile Pro Ser Arg Leu Arg Glu Tyr Leu Leu Gly 595 600 605 Tyr Lys Lys Val Pro Tyr Glu Lys Leu Ala Leu Gln Lys Leu Arg Ala 610 615 620 Gln Arg Lys Glu Val Lys Lys Arg Ile Lys Asp Ile Glu Lys Met Arg 625 630 635 640 Thr Pro Arg Val Gly Glu Gln Ala Thr Trp Leu Ala Glu Asp Ile Val 645 650 655 Phe Leu Thr Pro Pro Lys Met His Thr Pro Glu Arg Lys Thr Thr Lys 660 665 670 His Pro Gln Lys Leu Asn Asn Asp Gln Phe Arg Ile Met Gln Ser Ser 675 680 685 Leu Ala Tyr Phe Ser Val Asn Lys Lys Ala Ile Lys Lys Phe Phe Gln 690 695 700 Lys Glu Thr Gly Ile Gly Leu Ser Asn Arg Glu Thr Ser His Pro Phe 705 710 715 720 Leu Tyr Arg Ile Asp Val Gly Arg Cys Arg Gly Ile Leu Asp Phe Tyr 725 730 735 Thr Gly Tyr Leu Lys Tyr Lys Met Asp Trp Leu Asp Asp Ala Ile Lys 740 745 750 Lys Val Asp Asn Arg Lys His Gly Lys Lys Glu Ala Lys Lys Tyr Glu 755 760 765 Lys Tyr Leu Pro Ser Ser Ile Gln His Lys Thr Pro Leu Glu Leu Asp 770 775 780 Tyr Thr Arg Leu Pro Val Tyr Leu Pro Arg Gly Leu Phe Lys Lys Ala 785 790 795 800 Ile Val Lys Ala Leu Ala Ala His Ala Asp Phe Gln Val Glu Pro Glu 805 810 815 Glu Asp Asn Val Ile Phe Cys Leu Asp Gln Leu Leu Asp Gly Asp Thr 820 825 830 Gln Asp Phe Tyr Asn Trp Gln Arg Tyr Tyr Arg Ser Ala Leu Thr Glu 835 840 845 Lys Glu Thr Asp Asn Gln Leu Val Leu Ala His Pro Tyr Ala Glu Gln 850 855 860 Ile Leu Gly Thr Ile Lys Thr Leu Glu Gly Lys Gln Lys Asn Asn Lys 865 870 875 880 Leu Gly Asn Lys Ala Lys Gln Lys Ile Lys Asp Glu Leu Ile Asp Leu 885 890 895 Lys Arg Ala Lys Arg Arg Leu Leu Asp Arg Glu Gln Tyr Leu Arg Ala 900 905 910 Val Gln Ala Glu Asp Arg Ala Leu Trp Leu Met Ile Gln Glu Arg Gln 915 920 925 Lys Gln Lys Ala Glu His Glu Glu Ile Ala Phe Asp Gln Leu Asp Leu 930 935 940 Lys Asn Ile Thr Lys Ile Leu Thr Glu Ser Ile Asp Ala Arg Leu Arg 945 950 955 960 Ile Pro Asp Thr Lys Val Asp Ile Thr Asp Lys Leu Pro Leu Arg Arg 965 970 975 Tyr Gly Asp Leu Arg Arg Val Ala Lys Asp Arg Arg Leu Val Asn Leu 980 985 990 Ala Ser Tyr Tyr His Val Ala Gly Leu Ser Glu Ile Pro Tyr Asp Leu 995 1000 1005 Val Lys Lys Glu Leu Glu Glu Tyr Asp Arg Arg Arg Val Ala Phe 1010 1015 1020 Phe Glu His Val Tyr Gln Phe Glu Lys Glu Val Tyr Asp Arg Tyr 1025 1030 1035 Ala Ala Glu Leu Arg Asn Glu Asn Pro Lys Gly Glu Ser Thr Tyr 1040 1045 1050 Phe Ser His Trp Glu Tyr Val Ala Val Ala Val Lys His Ser Ala 1055 1060 1065 Asp Thr His Phe Asn Glu Leu Phe Lys Glu Lys Val Met Gln Leu 1070 1075 1080 Arg Asn Lys Phe His His Asn Glu Phe Pro Tyr Phe Asp Trp Leu 1085 1090 1095 Leu Pro Glu Val Glu Lys Ala Ser Ala Ala Leu Tyr Ala Asp Arg 1100 1105 1110 Val Phe Asp Val Ala Glu Gly Tyr Tyr Gln Lys Met Arg Lys Leu 1115 1120 1125 Met Arg Gln 1130 <210> 166 <211> 1155 <212> PRT <213> Flavobacterium sp. <400> 166 Met Asp Asn Asn Ile Thr Val Glu Lys Thr Glu Leu Gly Leu Gly Ile 1 5 10 15 Thr Tyr Asn His Asp Lys Val Glu Asp Lys His Tyr Phe Gly Gly Phe 20 25 30 Phe Asn Leu Ala Gln Asn Asn Ile Asp Leu Val Ala Gln Glu Phe Lys 35 40 45 Lys Arg Leu Leu Ile Gln Gly Lys Asp Ser Ile Asn Ile Phe Ala Asn 50 55 60 Tyr Phe Ser Asp Gln Cys Ser Ile Thr Asn Leu Glu Arg Gly Ile Lys 65 70 75 80 Ile Leu Ala Glu Tyr Phe Pro Val Val Ser Tyr Ile Asp Leu Asp Glu 85 90 95 Lys Asn Lys Ser Lys Ser Ile Arg Glu His Leu Ile Leu Leu Leu Glu 100 105 110 Thr Ile Asn Asn Leu Arg Asn Tyr Tyr Thr His Tyr Tyr His Lys Lys 115 120 125 Ile Ile Ile Asp Gly Ser Leu Phe Pro Leu Leu Asp Thr Ile Leu Leu 130 135 140 Lys Val Val Leu Glu Ile Lys Lys Lys Lys Leu Lys Glu Asp Lys Thr 145 150 155 160 Lys Gln Leu Leu Lys Lys Gly Leu Glu Lys Glu Met Thr Ile Leu Phe 165 170 175 Asn Leu Met Lys Ala Glu Gln Lys Glu Lys Lys Ile Lys Gly Trp Asn 180 185 190 Ile Asp Glu Asn Ile Lys Gly Ala Val Leu Asn Arg Ala Phe Ser His 195 200 205 Leu Leu Tyr Asn Asp Glu Leu Ser Asp Tyr Arg Lys Ser Lys Tyr Asn 210 215 220 Thr Glu Asp Glu Thr Leu Lys Asp Thr Leu Thr Glu Ser Gly Ile Leu 225 230 235 240 Phe Leu Leu Ser Phe Phe Leu Asn Lys Lys Glu Gln Glu Gln Leu Lys 245 250 255 Ala Asn Ile Lys Gly Tyr Lys Gly Lys Ile Ala Ser Ile Pro Asp Glu 260 265 270 Glu Ile Thr Leu Lys Asn Asn Ser Leu Arg Asn Met Ala Thr His Trp 275 280 285 Thr Tyr Ser His Leu Thr Tyr Lys Gly Leu Lys His Arg Ile Lys Thr 290 295 300 Asp His Glu Lys Glu Thr Leu Leu Val Asn Met Val Asp Tyr Leu Ser 305 310 315 320 Lys Val Pro His Glu Ile Tyr Gln Asn Leu Ser Glu Gln Asn Lys Ser 325 330 335 Leu Phe Leu Glu Asp Ile Asn Glu Tyr Met Arg Asp Asn Glu Glu Asn 340 345 350 His Asp Ser Ser Glu Ala Ser Arg Val Ile His Pro Val Ile Arg Lys 355 360 365 Arg Tyr Glu Asn Lys Phe Ala Tyr Phe Ala Ile Arg Phe Leu Asp Glu 370 375 380 Phe Ala Glu Phe Pro Thr Leu Arg Phe Met Val Asn Val Gly Asn Tyr 385 390 395 400 Ile His Asp Asn Arg Lys Lys Asp Ile Gly Gly Thr Ser Leu Ile Thr 405 410 415 Asn Arg Thr Ile Lys Gln Gln Ile Asn Val Phe Gly Asn Leu Thr Glu 420 425 430 Ile His Lys Lys Lys Asn Asp Tyr Phe Glu Lys Glu Glu Asn Lys Glu 435 440 445 Lys Thr Leu Glu Trp Glu Leu Phe Pro Asn Pro Ser Tyr His Phe Gln 450 455 460 Lys Glu Asn Ile Pro Ile Phe Ile Asp Leu Glu Lys Ser Lys Glu Thr 465 470 475 480 Asn Asp Leu Ala Lys Glu Tyr Ala Lys Glu Lys Lys Lys Ile Phe Gly 485 490 495 Ser Ser Arg Lys Lys Gln Gln Asn Thr Ala Lys Lys Asn Arg Glu Thr 500 505 510 Ile Ile Asn Leu Val Phe Asp Lys Tyr Lys Thr Ser Asp Arg Lys Thr 515 520 525 Val Thr Phe Glu Gln Pro Thr Ala Leu Leu Ser Phe Asn Glu Leu Asn 530 535 540 Ser Phe Leu Tyr Ala Phe Leu Val Glu Asn Lys Thr Gly Lys Glu Leu 545 550 555 560 Glu Lys Ile Ile Ile Glu Lys Ile Ala Asn Gln Tyr Gln Ile Leu Lys 565 570 575 Asn Cys Ser Ser Thr Val Asp Lys Thr Asn Asp Asn Ile Pro Lys Ser 580 585 590 Ile Lys Lys Ile Val Asn Thr Thr Thr Asp Ser Phe Tyr Phe Glu Gly 595 600 605 Lys Lys Ile Asp Ile Glu Lys Leu Glu Lys Asp Ile Thr Ile Glu Ile 610 615 620 Glu Lys Thr Asn Glu Lys Leu Glu Thr Ile Lys Glu Asn Glu Glu Ser 625 630 635 640 Ala Gln Asn Tyr Lys Arg Asn Glu Arg Asn Thr Gln Lys Arg Lys Leu 645 650 655 Tyr Arg Lys Tyr Val Phe Phe Thr Asn Glu Ile Gly Ile Glu Ala Thr 660 665 670 Trp Ile Thr Asn Asp Ile Leu Arg Phe Leu Asp Asn Lys Glu Asn Trp 675 680 685 Lys Gly Tyr Gln His Ser Glu Leu Gln Lys Phe Ile Ser Gln Tyr Asp 690 695 700 Asn Tyr Lys Lys Glu Ala Leu Gly Leu Leu Glu Ser Glu Trp Asn Leu 705 710 715 720 Glu Ser Asp Ala Phe Phe Gly Gln Asn Leu Lys Arg Met Phe Gln Ser 725 730 735 Asn Ser Thr Phe Glu Thr Phe Tyr Lys Lys Tyr Leu Asp Asn Arg Lys 740 745 750 Asn Thr Leu Glu Thr Tyr Leu Ser Ala Ile Glu Asn Leu Lys Thr Met 755 760 765 Thr Asp Val Arg Pro Lys Val Leu Lys Lys Lys Trp Thr Glu Leu Phe 770 775 780 Arg Phe Phe Asp Lys Lys Ile Tyr Leu Leu Ser Thr Ile Glu Thr Lys 785 790 795 800 Ile Asn Glu Leu Ile Thr Lys Pro Ile Asn Leu Ser Arg Gly Ile Phe 805 810 815 Glu Glu Lys Pro Thr Phe Ile Asn Gly Lys Asn Pro Asn Lys Glu Asn 820 825 830 Asn Gln His Leu Phe Ala Asn Trp Phe Ile Tyr Ala Lys Lys Gln Thr 835 840 845 Ile Leu Gln Asp Phe Tyr Asn Leu Pro Leu Glu Gln Pro Lys Ala Ile 850 855 860 Thr Asn Leu Lys Lys His Lys Tyr Lys Leu Glu Arg Ser Ile Asn Asn 865 870 875 880 Leu Lys Ile Glu Asp Ile Tyr Ile Lys Gln Met Val Asp Phe Leu Tyr 885 890 895 Gln Lys Leu Phe Glu Gln Ser Phe Ile Gly Ser Leu Gln Asp Leu Tyr 900 905 910 Thr Ser Lys Glu Lys Arg Glu Ile Glu Lys Gly Lys Ala Lys Asn Glu 915 920 925 Gln Thr Pro Asp Glu Ser Phe Ile Trp Lys Lys Gln Val Glu Ile Asn 930 935 940 Thr His Asn Gly Arg Ile Ile Ala Lys Thr Lys Ile Lys Asp Ile Gly 945 950 955 960 Lys Phe Lys Asn Leu Leu Thr Asp Asn Lys Ile Ala His Leu Ile Ser 965 970 975 Tyr Asp Asp Arg Ile Trp Asp Phe Ser Leu Asn Asn Asp Gly Asp Ile 980 985 990 Thr Lys Lys Leu Tyr Ser Ile Asn Thr Glu Leu Glu Ser Tyr Glu Thr 995 1000 1005 Ile Arg Arg Glu Lys Leu Leu Lys Gln Ile Gln Gln Phe Glu Gln 1010 1015 1020 Phe Leu Leu Glu Gln Glu Thr Glu Tyr Ser Ala Glu Arg Lys His 1025 1030 1035 Pro Glu Lys Phe Glu Lys Asp Cys Asn Pro Asn Phe Lys Lys Tyr 1040 1045 1050 Ile Ile Glu Gly Val Leu Asn Lys Ile Ile Pro Asn His Glu Ile 1055 1060 1065 Glu Glu Ile Glu Ile Leu Lys Ser Lys Glu Asp Val Phe Lys Ile 1070 1075 1080 Asn Phe Ser Asp Ile Leu Ile Leu Asn Asn Asp Asn Ile Lys Lys 1085 1090 1095 Gly Tyr Leu Leu Ile Met Ile Arg Asn Lys Phe Ala His Asn Gln 1100 1105 1110 Leu Ile Asp Lys Asn Leu Phe Asn Phe Ser Leu Gln Leu Tyr Ser 1115 1120 1125 Lys Asn Glu Asn Glu Asn Phe Ser Glu Tyr Leu Asn Lys Val Cys 1130 1135 1140 Gln Asn Ile Ile Gln Glu Phe Lys Glu Lys Leu Lys 1145 1150 1155 <210> 167 <211> 1175 <212> PRT <213> Porphyromonas gulae <400> 167 Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp 50 55 60 Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp 210 215 220 Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly 325 330 335 Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Lys Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Lys Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg 705 710 715 720 Ser Asp Arg Met Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro 945 950 955 960 Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr 1055 1060 1065 Leu Arg Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Ser Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile 1160 1165 1170 Gln Val 1175 <210> 168 <211> 1145 <212> PRT <213> Chryseobacterium sp. <400> 168 Met Glu Thr Gln Thr Ile Gly His Gly Ile Ala Tyr Asp His Ser Lys 1 5 10 15 Ile Gln Asp Lys His Phe Phe Gly Gly Phe Leu Asn Leu Ala Glu Asn 20 25 30 Asn Ile Lys Ala Val Leu Lys Ala Phe Ser Glu Lys Phe Asn Val Gly 35 40 45 Asn Val Asp Val Lys Gln Phe Ala Asp Val Ser Leu Lys Asp Asn Leu 50 55 60 Pro Asp Asn Asp Phe Gln Lys Arg Val Ser Phe Leu Lys Met Tyr Phe 65 70 75 80 Pro Val Val Asp Phe Ile Asn Ile Pro Asn Asn Arg Ala Lys Phe Arg 85 90 95 Ser Asp Leu Thr Thr Leu Phe Lys Ser Val Asp Gln Leu Arg Asn Phe 100 105 110 Tyr Thr His Tyr Tyr His Lys Pro Leu Asp Phe Asp Ala Ser Leu Phe 115 120 125 Ile Leu Leu Asp Asp Ile Phe Ala Arg Thr Ala Lys Glu Val Arg Asp 130 135 140 Gln Lys Met Lys Asp Asp Lys Thr Arg Gln Leu Leu Ser Lys Ser Leu 145 150 155 160 Ser Glu Glu Leu Gln Lys Gly Tyr Glu Leu Gln Leu Glu Arg Leu Lys 165 170 175 Glu Leu Asn Arg Leu Gly Lys Lys Val Asn Ile His Asp Gln Leu Gly 180 185 190 Ile Lys Asn Gly Val Leu Asn Asn Ala Phe Asn His Leu Ile Tyr Lys 195 200 205 Asp Gly Glu Ser Phe Lys Thr Lys Leu Thr Tyr Ser Ser Ala Leu Thr 210 215 220 Ser Phe Glu Ser Ala Glu Asn Gly Ile Glu Ile Ser Gln Ser Gly Leu 225 230 235 240 Leu Phe Leu Leu Ser Met Phe Leu Lys Arg Lys Glu Ile Glu Asp Leu 245 250 255 Lys Asn Arg Asn Lys Gly Phe Lys Ala Lys Val Val Ile Asp Glu Asp 260 265 270 Gly Lys Val Asn Gly Leu Lys Phe Met Ala Thr His Trp Val Phe Ser 275 280 285 Tyr Leu Cys Phe Lys Gly Leu Lys Ser Lys Leu Ser Thr Glu Phe His 290 295 300 Glu Glu Thr Leu Leu Ile Gln Ile Ile Asp Glu Leu Ser Lys Val Pro 305 310 315 320 Asp Glu Leu Tyr Cys Ala Phe Asp Lys Glu Thr Arg Asp Lys Phe Ile 325 330 335 Glu Asp Ile Asn Glu Tyr Val Lys Glu Gly His Gln Asp Phe Ser Leu 340 345 350 Glu Asp Ala Lys Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asn 355 360 365 Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Val Lys Phe 370 375 380 Pro Ser Leu Arg Phe Gln Val His Val Gly Asn Tyr Val His Asp Arg 385 390 395 400 Arg Ile Lys Asn Ile Asp Gly Thr Thr Phe Glu Thr Glu Arg Val Val 405 410 415 Lys Asp Arg Ile Lys Val Phe Gly Arg Leu Ser Glu Ile Ser Ser Tyr 420 425 430 Lys Ala Gln Tyr Leu Ser Ser Val Ser Asp Lys His Asp Glu Thr Gly 435 440 445 Trp Glu Ile Phe Pro Asn Pro Ser Tyr Val Phe Ile Asn Asn Asn Ile 450 455 460 Pro Ile His Ile Ser Val Asp Thr Ser Phe Lys Lys Glu Ile Ala Asp 465 470 475 480 Phe Lys Lys Leu Arg Arg Ala Gln Val Pro Asp Glu Leu Lys Ile Arg 485 490 495 Gly Ala Glu Lys Lys Arg Lys Phe Glu Ile Thr Gln Met Ile Gly Ser 500 505 510 Lys Ser Val Leu Asn Gln Glu Glu Pro Ile Ala Leu Leu Ser Leu Asn 515 520 525 Glu Ile Pro Ala Leu Leu Tyr Glu Ile Leu Ile Asn Gly Lys Glu Pro 530 535 540 Ala Glu Ile Glu Arg Ile Ile Lys Asp Lys Leu Asn Glu Arg Gln Asp 545 550 555 560 Val Ile Lys Asn Tyr Asn Pro Glu Asn Trp Leu Pro Ala Ser Gln Ile 565 570 575 Ser Arg Arg Leu Arg Ser Asn Lys Gly Glu Arg Ile Ile Asn Thr Asp 580 585 590 Lys Leu Leu Gln Leu Val Thr Lys Glu Leu Leu Val Thr Glu Gln Lys 595 600 605 Leu Lys Ile Ile Ser Asp Asn Arg Glu Ala Leu Lys Gln Lys Lys Glu 610 615 620 Gly Lys Tyr Ile Arg Lys Phe Ile Phe Thr Asn Ser Glu Leu Gly Arg 625 630 635 640 Glu Ala Ile Trp Leu Ala Asp Asp Ile Lys Arg Phe Met Pro Ala Asp 645 650 655 Val Arg Lys Glu Trp Lys Gly Tyr Gln His Ser Gln Leu Gln Gln Ser 660 665 670 Leu Ala Phe Tyr Asn Ser Arg Pro Lys Glu Ala Leu Ala Ile Leu Glu 675 680 685 Ser Ser Trp Asn Leu Lys Asp Glu Lys Ile Ile Trp Asn Glu Trp Ile 690 695 700 Leu Lys Ser Phe Thr Gln Asn Lys Phe Phe Asp Ala Phe Tyr Asn Glu 705 710 715 720 Tyr Leu Lys Gly Arg Lys Lys Tyr Phe Ala Phe Leu Ser Glu His Ile 725 730 735 Val Gln Tyr Thr Ser Asn Ala Lys Asn Leu Gln Lys Phe Ile Lys Gln 740 745 750 Gln Met Pro Lys Asp Leu Phe Glu Lys Arg His Tyr Ile Ile Glu Asp 755 760 765 Leu Gln Thr Glu Lys Asn Lys Ile Leu Ser Lys Pro Phe Ile Phe Pro 770 775 780 Arg Gly Ile Phe Asp Lys Lys Pro Thr Phe Ile Lys Gly Val Lys Val 785 790 795 800 Glu Asp Ser Pro Glu Ser Phe Ala Asn Trp Tyr Gln Tyr Gly Tyr Gln 805 810 815 Lys Asp His Gln Phe Gln Lys Phe Tyr Asp Trp Lys Arg Asp Tyr Ser 820 825 830 Asp Val Phe Leu Glu His Leu Gly Lys Pro Phe Ile Asn Asn Gly Asp 835 840 845 Arg Arg Thr Leu Gly Met Glu Glu Leu Lys Glu Arg Ile Ile Ile Lys 850 855 860 Gln Asp Leu Lys Ile Lys Lys Ile Lys Ile Gln Asp Leu Phe Leu Arg 865 870 875 880 Leu Ile Ala Glu Asn Leu Phe Gln Lys Val Phe Lys Tyr Ser Ala Lys 885 890 895 Leu Pro Leu Ser Asp Phe Tyr Leu Thr Gln Glu Glu Arg Met Glu Lys 900 905 910 Glu Asn Met Ala Ala Leu Gln Asn Val Arg Glu Glu Gly Asp Lys Ser 915 920 925 Pro Asn Ile Ile Lys Asp Asn Phe Ile Trp Ser Lys Met Ile Pro Tyr 930 935 940 Lys Lys Gly Gln Ile Ile Glu Asn Ala Val Lys Leu Lys Asp Ile Gly 945 950 955 960 Lys Leu Asn Val Leu Ser Leu Asp Asp Lys Val Gln Thr Leu Leu Ser 965 970 975 Tyr Asp Asp Ala Lys Pro Trp Ser Lys Ile Ala Leu Glu Asn Glu Phe 980 985 990 Ser Ile Gly Glu Asn Ser Tyr Glu Val Ile Arg Arg Glu Lys Leu Phe 995 1000 1005 Lys Glu Ile Gln Gln Phe Glu Ser Glu Ile Leu Phe Arg Ser Gly 1010 1015 1020 Trp Asp Gly Ile Asn His Pro Ala Gln Leu Glu Asp Asn Arg Asn 1025 1030 1035 Pro Lys Phe Lys Met Tyr Ile Val Asn Gly Ile Leu Arg Lys Ser 1040 1045 1050 Ala Gly Leu Tyr Ser Gln Gly Glu Asp Ile Trp Phe Glu Tyr Asn 1055 1060 1065 Ala Asp Phe Asn Asn Leu Asp Ala Asp Val Leu Glu Thr Lys Ser 1070 1075 1080 Glu Leu Val Gln Leu Ala Phe Leu Val Thr Ala Ile Arg Asn Lys 1085 1090 1095 Phe Ala His Asn Gln Leu Pro Ala Lys Glu Phe Tyr Phe Tyr Ile 1100 1105 1110 Arg Ala Lys Tyr Gly Phe Ala Asp Glu Pro Ser Val Ala Leu Val 1115 1120 1125 Tyr Leu Asn Phe Thr Lys Tyr Ala Ile Asn Glu Phe Lys Lys Val 1130 1135 1140 Met Ile 1145 <210> 169 <211> 948 <212> PRT <213> Riemerella anatipestifer <400> 169 Met Phe Phe Ser Phe His Asn Ala Gln Arg Val Ile Phe Lys His Leu 1 5 10 15 Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu Asp Tyr Lys 20 25 30 Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His Leu Asn Arg 35 40 45 Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg Tyr Arg Phe 50 55 60 Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe Phe Thr Asn 65 70 75 80 Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys Lys Val Ser 85 90 95 Gly Phe Lys Ala Ser His Lys Gln Arg Glu Lys Met Thr Thr Glu Val 100 105 110 Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu Glu Ser Arg 115 120 125 Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu Leu Ser Arg 130 135 140 Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asn Lys Lys His 145 150 155 160 Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu Glu Glu Gln 165 170 175 Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg Phe Pro Tyr 180 185 190 Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys Ser Ile Arg 195 200 205 Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr Asp Lys Lys 210 215 220 Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr Leu Leu Ser 225 230 235 240 Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro Gln Glu Trp 245 250 255 Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser Asn Gln Pro 260 265 270 Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp Asn Lys Ile 275 280 285 Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser Leu Glu Ile 290 295 300 Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn Ser Gly Phe 305 310 315 320 Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro Leu Met Phe 325 330 335 Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys Glu Thr Val 340 345 350 Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu Arg Ile Asn 355 360 365 Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu Pro Leu Gly 370 375 380 Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys Gln Pro Asp 385 390 395 400 Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile Ala Glu Thr 405 410 415 Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser Ser Pro Lys 420 425 430 Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val Leu Ala Asp 435 440 445 Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala Tyr Asp Ala 450 455 460 Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr Glu Phe Trp 465 470 475 480 Phe Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys Asn Arg Leu 485 490 495 Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr Asn Pro His 500 505 510 Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn Leu Val Asp 515 520 525 Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu Glu Ala Ile 530 535 540 Lys Asn Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu Leu Lys Ile 545 550 555 560 Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu Gln Gly Gly 565 570 575 Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg Glu Thr Leu 580 585 590 Ser Glu Asp Leu Met Leu Ser Lys Pro Ile Arg Lys Glu Ile Lys Lys 595 600 605 His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu Tyr Phe Lys 610 615 620 Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu Ser Tyr Lys 625 630 635 640 Leu Glu Ala Lys Ala Pro Leu Leu Lys Arg Glu Glu His Tyr Glu Tyr 645 650 655 Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln Arg Leu Glu 660 665 670 Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr Lys Arg Trp 675 680 685 Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln Asp Val Met 690 695 700 Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe Lys Glu Leu 705 710 715 720 Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala Val Asn Val 725 730 735 Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr Leu Pro Met 740 745 750 Val Leu Pro Val Lys Val Tyr Pro Ala Thr Ala Phe Gly Glu Val Gln 755 760 765 Tyr His Lys Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu Glu His Thr 770 775 780 Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys Asp Arg Arg 785 790 795 800 Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp Thr Gln Lys 805 810 815 His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu Ile Tyr Gln 820 825 830 Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu Glu Glu Lys 835 840 845 Leu Leu Asn Lys His Thr Ser Leu Ser Ser Leu Glu Asn Glu Phe Arg 850 855 860 Ala Leu Leu Glu Glu Trp Lys Lys Glu Tyr Ala Ala Ser Ser Met Val 865 870 875 880 Thr Asp Glu His Ile Ala Phe Ile Ala Ser Val Arg Asn Ala Phe Cys 885 890 895 His Asn Gln Tyr Pro Phe Tyr Lys Glu Ala Leu His Ala Pro Ile Pro 900 905 910 Leu Phe Thr Val Ala Gln Pro Thr Thr Glu Glu Lys Asp Gly Leu Gly 915 920 925 Ile Ala Glu Ala Leu Leu Lys Val Leu Arg Glu Tyr Cys Glu Ile Val 930 935 940 Lys Ser Gln Ile 945 <210> 170 <211> 1175 <212> PRT <213> Porphyromonas gingivalis <400> 170 Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Lys Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Leu Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln Leu Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Val Gly Ile Glu Tyr Ala Ser Trp Glu Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr His Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr 945 950 955 960 Asp Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr 1055 1060 1065 Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Asp Lys Trp Pro Asp Leu Gln Arg Glu Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Thr Ile Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Leu 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Leu Ala Lys Glu Met Val Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 171 <211> 1175 <212> PRT <213> Porphyromonas gingivalis <400> 171 Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Lys Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Met Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Cys Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Gly Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Cys Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Ala 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Cys Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp 530 535 540 Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Lys His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg 835 840 845 Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Asn Ala Ser Arg Glu Asn 850 855 860 Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr 865 870 875 880 Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys 885 890 895 Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr Leu Asp Phe 900 905 910 Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln 915 920 925 Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys 930 935 940 Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr 945 950 955 960 Asp Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro 965 970 975 Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val 980 985 990 His Lys Glu Gln Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp 995 1000 1005 Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp 1010 1015 1020 Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu 1025 1030 1035 Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu 1040 1045 1050 Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr 1055 1060 1065 Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro 1070 1075 1080 Asp Glu Asn Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu 1085 1090 1095 Leu Asp Lys Trp Pro Asp Leu His Arg Lys Val Arg Leu Leu Ile 1100 1105 1110 Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp 1115 1120 1125 Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro 1130 1135 1140 Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu 1145 1150 1155 Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala Glu Arg Ile Ile 1160 1165 1170 Gln Ala 1175 <210> 172 <211> 1213 <212> PRT <213> Flavobacterium columnare <400> 172 Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His 1 5 10 15 Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala 20 25 30 Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn 35 40 45 Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe 50 55 60 Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu 65 70 75 80 Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His 85 90 95 Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile 100 105 110 Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr 115 120 125 Ile Asn Pro Lys Val Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val 130 135 140 Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu 145 150 155 160 Leu Leu Lys Glu Lys Phe Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln 165 170 175 Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn 180 185 190 Leu Glu Asn Ala Val Phe Asn His Cys Leu Arg Pro Phe Leu Glu Glu 195 200 205 Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr 210 215 220 Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser 225 230 235 240 Gly Leu Val Phe Leu Ile Ser Phe Phe Leu His Arg Lys Glu Phe Gln 245 250 255 Val Phe Thr Ser Gly Leu Glu Gly Phe Lys Ala Lys Val Asn Thr Ile 260 265 270 Lys Glu Glu Glu Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile 275 280 285 Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg 290 295 300 Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr 305 310 315 320 His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile 325 330 335 Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser 340 345 350 Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg 355 360 365 Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His 370 375 380 Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met 385 390 395 400 Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val 405 410 415 Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser 420 425 430 Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe 435 440 445 Glu Lys Leu Gly Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys 450 455 460 Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Ser Pro 465 470 475 480 Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg 485 490 495 Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser 500 505 510 Gln Asn Arg Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln 515 520 525 Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys 530 535 540 Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu 545 550 555 560 Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu 565 570 575 Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile 580 585 590 Arg Asp Phe Thr Leu Asp Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr 595 600 605 Leu Thr Lys Thr Ile Ser Thr Asp Thr Ser Val Thr Phe Glu Asn Gln 610 615 620 Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Leu Gln Lys Glu Leu Thr 625 630 635 640 Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Gln His Glu Ile Glu Val 645 650 655 Asp Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro 660 665 670 Lys Asp Lys Val Asp Asp Asn Lys Leu Gln Arg Lys Tyr Val Phe Tyr 675 680 685 Arg Asn Glu Ile Gly Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile 690 695 700 His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu 705 710 715 720 Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile 725 730 735 Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr 740 745 750 Lys Asp Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe 755 760 765 Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Asn Thr Glu Ser 770 775 780 Thr Phe Leu Glu Asn Gly Phe Ile Gly Leu Pro Pro Lys Ile Leu Lys 785 790 795 800 Lys Glu Leu Ser Lys Arg Leu Asn Tyr Ile Phe Ile Val Phe Gln Lys 805 810 815 Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr 820 825 830 Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr 835 840 845 Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe 850 855 860 Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr 865 870 875 880 Pro Asp Lys Ile Glu Asn Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg 885 890 895 Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val 900 905 910 Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu 915 920 925 Ser Asp Phe Tyr Val Ser Lys Thr Asp Arg Glu Lys Ile Lys Ala Asp 930 935 940 Ala Lys Ala Tyr Gln Lys Arg Asn Asp Ser Phe Leu Trp Asn Lys Val 945 950 955 960 Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu 965 970 975 Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala 980 985 990 Thr Leu Leu Thr Tyr Asp Asp Arg Thr Trp Thr Tyr Ala Leu Gln Lys 995 1000 1005 Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr 1010 1015 1020 Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys 1025 1030 1035 Lys Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Gln Ile Leu Asp 1040 1045 1050 Lys Phe Tyr Asp Phe Ser Asn Asn Ala Thr His Pro Glu Asp Leu 1055 1060 1065 Glu Ile Glu Asp Lys Lys Gly Lys Arg His Pro Asn Phe Lys Leu 1070 1075 1080 Tyr Ile Thr Lys Ala Leu Leu Lys Asn Glu Ser Glu Ile Ile Asn 1085 1090 1095 Leu Glu Asn Ile Asp Ile Glu Ile Leu Ile Lys Tyr Tyr Asp Tyr 1100 1105 1110 Asn Thr Glu Lys Leu Lys Glu Lys Ile Lys Asn Met Asp Glu Asp 1115 1120 1125 Glu Lys Ala Lys Ile Val Asn Thr Lys Glu Asn Tyr Asn Lys Ile 1130 1135 1140 Thr Asn Val Leu Ile Lys Lys Ala Leu Val Leu Ile Ile Ile Arg 1145 1150 1155 Asn Lys Met Ala His Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp 1160 1165 1170 Leu Ala Thr Arg Phe Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala 1175 1180 1185 Cys Tyr Phe Asn Arg Val Phe Glu Thr Ile Thr Thr Glu Leu Trp 1190 1195 1200 Glu Asn Lys Lys Lys Ala Lys Glu Ile Val 1205 1210 <210> 173 <211> 1119 <212> PRT <213> Porphyromonas gingivalis <400> 173 Met Thr Glu Gln Asn Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu 1 5 10 15 Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn 20 25 30 Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys 35 40 45 Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp 50 55 60 Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu 65 70 75 80 Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys 85 90 95 Leu Phe Glu Asn Lys Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu 100 105 110 Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu 115 120 125 Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp 130 135 140 Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu 145 150 155 160 Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp 165 170 175 Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val 180 185 190 Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp 195 200 205 Arg Cys Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp 210 215 220 Arg Glu Gly Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu 225 230 235 240 Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly 245 250 255 Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe 260 265 270 Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg 275 280 285 Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys 290 295 300 Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe 305 310 315 320 Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr 325 330 335 Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe 340 345 350 Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser 355 360 365 Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys 370 375 380 Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu 385 390 395 400 Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu 405 410 415 Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp 420 425 430 Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly 435 440 445 Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser 450 455 460 Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp 465 470 475 480 Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro 485 490 495 Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val 500 505 510 Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val 515 520 525 Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asp Thr Leu Asp 530 535 540 Arg Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu 545 550 555 560 Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu 565 570 575 Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His 580 585 590 Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly 595 600 605 Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu 610 615 620 Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly 625 630 635 640 Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu 645 650 655 Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro 660 665 670 Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe 675 680 685 Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr 690 695 700 Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg 705 710 715 720 Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys 725 730 735 Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu 740 745 750 Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met 755 760 765 Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys 770 775 780 Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro 785 790 795 800 Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys 805 810 815 Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly 820 825 830 Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala 835 840 845 Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg 850 855 860 Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys 865 870 875 880 Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr 885 890 895 Leu Tyr Leu Lys Asp Ile Arg Thr Glu Val Gln Glu Gln Gly Ser Leu 900 905 910 Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr 915 920 925 Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala 930 935 940 Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn 945 950 955 960 Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe 965 970 975 Val Asp Thr Gly Gly Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu 980 985 990 Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala 995 1000 1005 Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Cys 1010 1015 1020 Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp 1025 1030 1035 Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu Gln Arg Glu Val 1040 1045 1050 Trp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr 1055 1060 1065 Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp 1070 1075 1080 Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile 1085 1090 1095 Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala 1100 1105 1110 Glu Arg Ile Ile Gln Ala 1115 <210> 174 <211> 1135 <212> PRT <213> Porphyromonas gingivalis <400> 174 Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val 1 5 10 15 Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu 20 25 30 Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys 35 40 45 Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu 50 55 60 Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr 65 70 75 80 Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp 85 90 95 His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile 100 105 110 Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His 115 120 125 Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp 130 135 140 Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala 145 150 155 160 Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala 165 170 175 Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys 180 185 190 Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg 195 200 205 Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr 210 215 220 Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys 225 230 235 240 Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala 245 250 255 Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu 260 265 270 Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu 275 280 285 Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu 290 295 300 Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr 305 310 315 320 Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe 325 330 335 Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu 340 345 350 Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly 355 360 365 Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu 370 375 380 Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu 385 390 395 400 Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile 405 410 415 Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro 420 425 430 Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met 435 440 445 Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu 450 455 460 Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys 465 470 475 480 Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser 485 490 495 Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro 500 505 510 Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr 515 520 525 Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu 530 535 540 Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp 545 550 555 560 Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr 565 570 575 Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe 580 585 590 Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu 595 600 605 Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu 610 615 620 Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg 625 630 635 640 Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala 645 650 655 Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe 660 665 670 Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr 675 680 685 Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr 690 695 700 Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe 705 710 715 720 Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg 725 730 735 Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln 740 745 750 Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met 755 760 765 Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe 770 775 780 Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr 785 790 795 800 Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile 805 810 815 Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu 820 825 830 Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro 835 840 845 Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala 850 855 860 Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg 865 870 875 880 Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp 885 890 895 Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn 900 905 910 Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu 915 920 925 Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys 930 935 940 Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg 945 950 955 960 Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu 965 970 975 Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys 980 985 990 Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg 995 1000 1005 Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys 1010 1015 1020 Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys 1025 1030 1035 Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg 1040 1045 1050 Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro 1055 1060 1065 Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly 1070 1075 1080 Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser 1085 1090 1095 Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile 1100 1105 1110 Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met 1115 1120 1125 Ser Gln Pro Ile Asn Asp Leu 1130 1135 <210> 175 <211> 950 <212> PRT <213> Riemerella anatipestifer <400> 175 Met Phe Phe Ser Phe His Asn Ala Gln Arg Val Ile Phe Lys His Leu 1 5 10 15 Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu Asp Tyr Lys 20 25 30 Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His Leu Asn Arg 35 40 45 Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg Tyr Arg Phe 50 55 60 Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe Phe Thr Asn 65 70 75 80 Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys Lys Val Ser 85 90 95 Gly Phe Lys Ala Ser His Lys Gln Ser Glu Lys Met Thr Thr Glu Val 100 105 110 Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu Glu Ser Arg 115 120 125 Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu Leu Ser Arg 130 135 140 Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Lys Asp Lys Lys Cys 145 150 155 160 Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu Glu Glu Gln 165 170 175 Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg Phe Pro Tyr 180 185 190 Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys Ser Ile Arg 195 200 205 Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr Asp Lys Lys 210 215 220 Ile Gly Tyr Glu Gln Glu Lys Arg His Leu Thr Arg Thr Leu Leu Asn 225 230 235 240 Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro Gln Glu Trp 245 250 255 Lys Ala Leu Thr Lys Asp Leu Asp Tyr Asn Glu Thr Ser Asn Gln Pro 260 265 270 Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp Asn Lys Ile 275 280 285 Gly Phe Arg Leu Arg Thr Ser Lys Glu Leu Tyr Pro Ser Leu Glu Val 290 295 300 Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn Ser Asp Phe 305 310 315 320 Val Ala His Ala Phe Ile Ser Ile Ser Val His Glu Leu Leu Pro Leu 325 330 335 Met Phe Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys Glu 340 345 350 Thr Val Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu Arg 355 360 365 Ile Asn Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu Pro 370 375 380 Leu Gly Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys Gln 385 390 395 400 Pro Asp Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile Ala 405 410 415 Glu Thr Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser Ser 420 425 430 Pro Lys Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val Leu 435 440 445 Ala Asp Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Val Tyr 450 455 460 Asp Ala Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr Glu 465 470 475 480 Ser Arg Leu Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys Asn 485 490 495 Arg Leu Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr Asn 500 505 510 Pro His Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn Leu 515 520 525 Val Asp Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu Glu 530 535 540 Ala Ile Lys His Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu Leu 545 550 555 560 Lys Val Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu Gln 565 570 575 Gly Gly Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg Glu 580 585 590 Thr Leu Ser Lys Asp Leu Thr Leu Ser Lys Pro Ile Arg Lys Glu Ile 595 600 605 Lys Lys His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu Tyr 610 615 620 Phe Lys Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu Ser 625 630 635 640 Tyr Lys Leu Glu Ala Lys Ala Pro Leu Leu Lys Lys Glu Glu His Tyr 645 650 655 Glu Tyr Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln Arg 660 665 670 Leu Glu Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr Lys 675 680 685 Arg Trp Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln Asp 690 695 700 Ile Met Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe Lys 705 710 715 720 Glu Leu Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala Val 725 730 735 Asn Val Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr Leu 740 745 750 Pro Met Val Leu Pro Val Lys Val Tyr Pro Thr Thr Ala Phe Gly Glu 755 760 765 Val Gln Tyr His Glu Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu Glu 770 775 780 Gln Thr Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys Asp 785 790 795 800 Arg His Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp Thr 805 810 815 Gln Lys His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu Ile 820 825 830 Tyr Gln Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu Glu 835 840 845 Glu Lys Leu Leu Asn Lys His Ala Ser Leu Ser Ser Leu Glu Asn Glu 850 855 860 Phe Arg Thr Leu Leu Glu Glu Trp Lys Lys Lys Tyr Ala Ala Ser Ser 865 870 875 880 Met Val Thr Asp Lys His Ile Ala Phe Ile Ala Ser Val Arg Asn Ala 885 890 895 Phe Cys His Asn Gln Tyr Pro Phe Tyr Lys Glu Thr Leu His Ala Pro 900 905 910 Ile Leu Leu Phe Thr Val Ala Gln Pro Thr Thr Glu Glu Lys Asp Gly 915 920 925 Leu Gly Ile Ala Glu Ala Leu Leu Arg Val Leu Arg Glu Tyr Cys Glu 930 935 940 Ile Val Lys Ser Gln Ile 945 950 <210> 176 <211> 1213 <212> PRT <213> Flavobacterium columnare <400> 176 Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His 1 5 10 15 Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala 20 25 30 Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn 35 40 45 Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe 50 55 60 Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu 65 70 75 80 Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His 85 90 95 Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile 100 105 110 Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr 115 120 125 Ile Asn Pro Lys Ile Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val 130 135 140 Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu 145 150 155 160 Leu Leu Lys Glu Lys Leu Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln 165 170 175 Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn 180 185 190 Leu Glu Asn Ala Val Phe Asn His Cys Leu Arg Pro Phe Leu Glu Glu 195 200 205 Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr 210 215 220 Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser 225 230 235 240 Gly Leu Val Phe Leu Met Ser Phe Phe Leu His Arg Lys Glu Phe Gln 245 250 255 Val Phe Thr Ser Gly Leu Glu Gly Phe Lys Ala Lys Val Asn Thr Ile 260 265 270 Lys Glu Glu Lys Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile 275 280 285 Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg 290 295 300 Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr 305 310 315 320 His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile 325 330 335 Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser 340 345 350 Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg 355 360 365 Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His 370 375 380 Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met 385 390 395 400 Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val 405 410 415 Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser 420 425 430 Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe 435 440 445 Glu Lys Leu Gly Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys 450 455 460 Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Ser Pro 465 470 475 480 Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg 485 490 495 Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser 500 505 510 Gln Asn Arg Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln 515 520 525 Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys 530 535 540 Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu 545 550 555 560 Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu 565 570 575 Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile 580 585 590 Arg Asp Phe Thr Leu Asn Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr 595 600 605 Leu Ile Lys Thr Ile Ser Thr Asp Thr Ser Val Thr Phe Glu Asn Gln 610 615 620 Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Ile Gln Lys Glu Leu Ala 625 630 635 640 Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Gln His Glu Ile Glu Val 645 650 655 Asn Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro 660 665 670 Lys Asp Lys Val Asp Asp Asn Lys Leu Gln Arg Lys Tyr Val Phe Tyr 675 680 685 Arg Asn Glu Ile Gly Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile 690 695 700 His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu 705 710 715 720 Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile 725 730 735 Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr 740 745 750 Lys Asp Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe 755 760 765 Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Asn Thr Glu Ser 770 775 780 Thr Phe Leu Glu Asn Gly Phe Ile Gly Leu Pro Pro Lys Ile Leu Lys 785 790 795 800 Lys Glu Leu Ser Lys Arg Leu Asn Tyr Ile Phe Ile Val Phe Gln Lys 805 810 815 Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr 820 825 830 Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr 835 840 845 Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe 850 855 860 Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr 865 870 875 880 Pro Asp Lys Ile Glu Asn Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg 885 890 895 Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val 900 905 910 Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu 915 920 925 Ser Asp Phe Tyr Val Ser Lys Thr Asp Arg Glu Lys Ile Lys Ala Asp 930 935 940 Ala Lys Ala Tyr Gln Lys Arg Asn Asp Ser Phe Leu Trp Asn Lys Val 945 950 955 960 Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu 965 970 975 Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala 980 985 990 Thr Leu Leu Thr Tyr Asp Asp Arg Thr Trp Thr Tyr Ala Leu Gln Lys 995 1000 1005 Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr 1010 1015 1020 Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys 1025 1030 1035 Lys Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Gln Ile Leu Asp 1040 1045 1050 Lys Phe Tyr Asp Phe Ser Asn Asn Ala Thr His Pro Glu Asp Leu 1055 1060 1065 Glu Ile Glu Asp Lys Lys Gly Lys Arg His Pro Asn Phe Lys Leu 1070 1075 1080 Tyr Ile Thr Lys Ala Leu Leu Lys Asn Glu Ser Glu Ile Ile Asn 1085 1090 1095 Leu Glu Asn Ile Asp Ile Glu Ile Leu Ile Lys Tyr Tyr Asp Tyr 1100 1105 1110 Asn Thr Glu Lys Leu Lys Glu Lys Ile Lys Asn Met Asp Glu Asp 1115 1120 1125 Glu Lys Ala Lys Ile Val Asn Thr Lys Glu Asn Tyr Asn Lys Ile 1130 1135 1140 Thr Asn Val Leu Ile Lys Lys Ala Leu Val Leu Ile Ile Ile Arg 1145 1150 1155 Asn Lys Met Ala His Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp 1160 1165 1170 Leu Ala Thr Arg Phe Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala 1175 1180 1185 Cys Tyr Phe Asn Arg Val Phe Glu Thr Ile Thr Thr Glu Leu Trp 1190 1195 1200 Glu Asn Lys Lys Lys Ala Lys Glu Ile Val 1205 1210 <210> 177 <211> 1095 <212> PRT <213> Riemerella anatipestifer <400> 177 Met Glu Lys Pro Leu Pro Pro Asn Val Tyr Thr Leu Lys His Lys Phe 1 5 10 15 Phe Trp Gly Ala Phe Leu Asn Ile Ala Arg His Asn Ala Phe Ile Thr 20 25 30 Ile Cys His Ile Asn Glu Gln Leu Gly Leu Thr Thr Pro Pro Asn Asp 35 40 45 Asp Lys Ile Ala Asp Val Val Cys Gly Thr Trp Asn Asn Ile Leu Asn 50 55 60 Asn Asp His Asp Leu Leu Lys Lys Ser Gln Leu Thr Glu Leu Ile Leu 65 70 75 80 Lys His Phe Pro Phe Leu Ala Ala Met Cys Tyr His Pro Pro Lys Lys 85 90 95 Glu Gly Lys Lys Lys Gly Ser Gln Lys Glu Gln Gln Lys Glu Lys Glu 100 105 110 Asn Glu Ala Gln Ser Gln Ala Glu Ala Leu Asn Pro Ser Glu Leu Ile 115 120 125 Lys Val Leu Lys Thr Leu Val Lys Gln Leu Arg Thr Leu Arg Asn Tyr 130 135 140 Tyr Ser His His Ser His Lys Lys Pro Asp Ala Glu Lys Asp Ile Phe 145 150 155 160 Lys His Leu Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu 165 170 175 Asp Tyr Lys Ala His Phe Thr Val Asn Leu Thr Gln Asp Phe Ala His 180 185 190 Leu Asn Arg Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asp Arg 195 200 205 Tyr Arg Phe Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe 210 215 220 Phe Thr Asn Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys 225 230 235 240 Lys Val Ser Gly Phe Lys Ala Ser His Lys Gln Ser Glu Lys Met Thr 245 250 255 Thr Glu Val Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu 260 265 270 Glu Ser Arg Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu 275 280 285 Leu Ser Arg Tyr Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asp 290 295 300 Lys Lys Arg Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu 305 310 315 320 Glu Glu Gln Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg 325 330 335 Phe Pro Tyr Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys 340 345 350 Ser Ile Arg Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr 355 360 365 Asp Lys Lys Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr 370 375 380 Leu Leu Ser Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro 385 390 395 400 Gln Glu Trp Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser 405 410 415 Lys Gln Pro Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp 420 425 430 Asn Lys Ile Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser 435 440 445 Leu Glu Val Lys Asp Gly Ala Asn Arg Ile Ala Gln Tyr Pro Tyr Asn 450 455 460 Ser Asp Phe Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro 465 470 475 480 Leu Met Phe Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys 485 490 495 Glu Thr Val Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu 500 505 510 Arg Ile Asn Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu 515 520 525 Pro Leu Gly Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys 530 535 540 Gln Pro Asp Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile 545 550 555 560 Ala Glu Thr Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser 565 570 575 Ser Pro Lys Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val 580 585 590 Leu Ala Asp Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala 595 600 605 Tyr Asp Ala Gln Asn Gln Pro Ile Glu Ser Ser Lys Ala Asn Ser Thr 610 615 620 Glu Phe Gln Leu Ile Gln Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys 625 630 635 640 Asn Arg Leu Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr 645 650 655 Asn Pro His Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn 660 665 670 Leu Val Asp Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu 675 680 685 Glu Ala Ile Lys Asn Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu 690 695 700 Leu Lys Ile Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu 705 710 715 720 Gln Gly Gly Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg 725 730 735 Glu Thr Leu Ser Lys Asp Leu Thr Leu Ser Lys Pro Ile Arg Lys Glu 740 745 750 Ile Lys Lys His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu 755 760 765 Tyr Phe Arg Glu Lys Tyr Gln Asp Asp His Gln Ser Phe Tyr Asp Leu 770 775 780 Pro Tyr Lys Leu Glu Ala Lys Ala Ser Pro Leu Pro Lys Lys Glu His 785 790 795 800 Tyr Glu Tyr Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Leu Gln 805 810 815 Arg Leu Glu Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr 820 825 830 Lys Arg Trp Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln 835 840 845 Asp Val Met Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe 850 855 860 Lys Glu Leu Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala 865 870 875 880 Val Asn Val Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr 885 890 895 Leu Pro Met Val Leu Pro Val Lys Val Tyr Pro Ala Thr Ala Phe Gly 900 905 910 Glu Val Gln Tyr Gln Glu Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu 915 920 925 Glu Gln Thr Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys 930 935 940 Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp 945 950 955 960 Thr Gln Lys His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu 965 970 975 Ile Tyr Gln Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Asn Leu 980 985 990 Glu Glu Lys Leu Leu Lys Lys His Thr Ser Leu Ser Ser Val Glu Asn 995 1000 1005 Lys Phe Arg Ile Leu Leu Glu Glu Trp Lys Lys Glu Tyr Ala Ala 1010 1015 1020 Ser Ser Met Val Thr Asp Glu His Ile Ala Phe Ile Ala Ser Val 1025 1030 1035 Arg Asn Ala Phe Cys His Asn Gln Tyr Pro Phe Tyr Glu Glu Ala 1040 1045 1050 Leu His Ala Pro Ile Pro Leu Phe Thr Val Ala Gln Gln Thr Thr 1055 1060 1065 Glu Glu Lys Asp Gly Leu Gly Ile Ala Glu Ala Leu Leu Arg Val 1070 1075 1080 Leu Arg Glu Tyr Cys Glu Ile Val Lys Ser Gln Ile 1085 1090 1095 <210> 178 <211> 1149 <212> PRT <213> Sinomicrobium oceani <400> 178 Met Glu Ser Thr Thr Thr Leu Gly Leu His Leu Lys Tyr Gln His Asp 1 5 10 15 Leu Phe Glu Asp Lys His Tyr Phe Gly Gly Gly Val Asn Leu Ala Val 20 25 30 Gln Asn Ile Glu Ser Ile Phe Gln Ala Phe Ala Glu Arg Tyr Gly Ile 35 40 45 Gln Asn Pro Leu Arg Lys Asn Gly Val Pro Ala Ile Asn Asn Ile Phe 50 55 60 His Asp Asn Ile Ser Ile Ser Asn Tyr Lys Glu Tyr Leu Lys Phe Leu 65 70 75 80 Lys Gln Tyr Leu Pro Val Val Gly Phe Leu Glu Lys Ser Asn Glu Ile 85 90 95 Asn Ile Phe Glu Phe Arg Glu Asp Phe Glu Ile Leu Ile Asn Ala Ile 100 105 110 Tyr Lys Leu Arg His Phe Tyr Thr His Tyr Tyr His Ser Pro Ile Lys 115 120 125 Leu Glu Asp Arg Phe Tyr Thr Cys Leu Asn Glu Leu Phe Val Ala Val 130 135 140 Ala Ile Gln Val Lys Lys His Lys Met Lys Ser Asp Lys Thr Arg Gln 145 150 155 160 Leu Leu Asn Lys Asn Leu His Gln Leu Leu Gln Gln Leu Ile Glu Gln 165 170 175 Lys Arg Glu Lys Leu Lys Asp Lys Lys Ala Glu Gly Glu Lys Val Ser 180 185 190 Leu Asp Thr Lys Ser Ile Glu Asn Ala Val Leu Asn Asp Ala Phe Val 195 200 205 His Leu Leu Asp Lys Asp Glu Asn Ile Arg Leu Asn Tyr Ser Ser Arg 210 215 220 Leu Ser Glu Asp Ile Ile Thr Lys Asn Gly Ile Thr Leu Ser Ile Ser 225 230 235 240 Gly Leu Leu Phe Leu Leu Ser Leu Phe Leu Gln Arg Lys Glu Ala Glu 245 250 255 Asp Leu Arg Ser Arg Ile Glu Gly Phe Lys Gly Lys Gly Asn Glu Leu 260 265 270 Arg Phe Met Ala Thr His Trp Val Phe Ser Tyr Leu Asn Val Lys Arg 275 280 285 Ile Lys His Arg Leu Asn Thr Asp Phe Gln Lys Glu Thr Leu Leu Ile 290 295 300 Gln Ile Ala Asp Glu Leu Ser Lys Val Pro Asp Glu Val Tyr Lys Thr 305 310 315 320 Leu Asp His Glu Asn Arg Ser Lys Phe Leu Glu Asp Ile Asn Glu Tyr 325 330 335 Ile Arg Glu Gly Asn Glu Asp Ala Ser Leu Asn Glu Ser Thr Val Val 340 345 350 His Gly Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe His Tyr Leu Val 355 360 365 Leu Arg Tyr Leu Asp Glu Phe Val Asp Phe Pro Ser Leu Arg Phe Gln 370 375 380 Val His Leu Gly Asn Tyr Ile His Asp Arg Arg Asp Lys Val Ile Asp 385 390 395 400 Gly Thr Asn Phe Ile Thr Asn Arg Val Ile Lys Glu Pro Ile Lys Val 405 410 415 Phe Gly Lys Leu Ser His Val Ser Lys Leu Lys Ser Asp Tyr Met Glu 420 425 430 Ser Leu Ser Arg Glu His Lys Asn Gly Trp Asp Val Phe Pro Asn Pro 435 440 445 Ser Tyr Asn Phe Val Gly His Asn Ile Pro Ile Phe Ile Asn Leu Arg 450 455 460 Ser Ala Ser Ser Lys Gly Lys Glu Leu Tyr Arg Asp Leu Met Lys Ile 465 470 475 480 Lys Ser Glu Lys Lys Lys Lys Ser Arg Glu Glu Gly Ile Pro Met Glu 485 490 495 Arg Arg Asp Gly Lys Pro Thr Lys Ile Glu Ile Ser Asn Gln Ile Asp 500 505 510 Arg Asn Ile Lys Asp Asn Asn Phe Lys Asp Ile Tyr Pro Gly Glu Pro 515 520 525 Leu Ala Met Leu Ser Leu Asn Glu Leu Pro Ala Leu Leu Phe Glu Leu 530 535 540 Leu Arg Arg Pro Ser Ile Thr Pro Gln Asp Ile Glu Asp Arg Met Val 545 550 555 560 Glu Lys Leu Tyr Glu Arg Phe Gln Ile Ile Arg Asp Tyr Lys Pro Gly 565 570 575 Asp Gly Leu Ser Thr Ser Lys Ile Ser Lys Lys Leu Arg Lys Ala Asp 580 585 590 Asn Ser Thr Arg Leu Asp Gly Lys Lys Leu Leu Arg Ala Ile Gln Thr 595 600 605 Glu Thr Arg Asn Ala Arg Glu Lys Leu His Thr Leu Glu Glu Asn Lys 610 615 620 Ala Leu Gln Lys Asn Arg Lys Arg Arg Thr Val Tyr Thr Thr Arg Glu 625 630 635 640 Gln Gly Arg Glu Ala Ser Trp Leu Ala Gln Asp Leu Lys Arg Phe Met 645 650 655 Pro Ile Ala Ser Arg Lys Glu Trp Arg Gly Tyr His His Ser Gln Leu 660 665 670 Gln Gln Ile Leu Ala Phe Tyr Asp Gln Asn Pro Lys Gln Pro Leu Glu 675 680 685 Leu Leu Glu Gln Phe Trp Asp Leu Lys Glu Asp Thr Tyr Val Trp Asn 690 695 700 Ser Trp Ile His Lys Ser Leu Ser Gln His Asn Gly Phe Val Pro Met 705 710 715 720 Tyr Glu Gly Tyr Leu Lys Gly Arg Leu Gly Tyr Tyr Lys Lys Leu Glu 725 730 735 Ser Asp Ile Ile Gly Phe Leu Glu Glu His Lys Val Leu Lys Arg Tyr 740 745 750 Tyr Thr Gln Gln His Leu Asn Val Ile Phe Arg Glu Arg Leu Tyr Phe 755 760 765 Ile Lys Thr Glu Thr Lys Gln Lys Leu Glu Leu Leu Ala Arg Pro Leu 770 775 780 Val Phe Pro Arg Gly Ile Phe Asp Asp Lys Pro Thr Phe Val Gln Asp 785 790 795 800 Lys Lys Val Val Asp His Pro Glu Leu Phe Ala Asp Trp Tyr Val Tyr 805 810 815 Ser Tyr Lys Asp Asp His Ser Phe Gln Glu Phe Tyr His Tyr Lys Arg 820 825 830 Asp Tyr Asn Glu Ile Phe Glu Thr Glu Leu Ser Trp Asp Ile Asp Phe 835 840 845 Lys Asp Asn Lys Arg Gln Leu Asn Pro Ser Glu Gln Met Asp Leu Phe 850 855 860 Arg Met Lys Trp Asp Leu Lys Ile Lys Lys Ile Lys Ile Gln Asp Ile 865 870 875 880 Phe Leu Lys Ile Val Ala Glu Asp Ile Tyr Leu Lys Ile Phe Gly His 885 890 895 Lys Ile Pro Leu Ser Leu Ser Asp Phe Tyr Ile Ser Arg Gln Glu Arg 900 905 910 Leu Thr Leu Asp Glu Gln Ala Val Ala Gln Ser Met Arg Leu Pro Gly 915 920 925 Asp Thr Ser Glu Asn Gln Ile Lys Glu Ser Asn Leu Trp Gln Thr Thr 930 935 940 Val Pro Tyr Glu Lys Glu Gln Ile Arg Glu Pro Lys Ile Lys Leu Lys 945 950 955 960 Asp Ile Gly Lys Phe Lys Tyr Phe Leu Gln Gln Gln Lys Val Leu Asn 965 970 975 Leu Leu Lys Tyr Asp Pro Gln His Val Trp Thr Lys Ala Glu Leu Glu 980 985 990 Glu Glu Leu Tyr Ile Gly Lys His Ser Tyr Glu Val Val Arg Arg Glu 995 1000 1005 Met Leu Leu Gln Lys Cys His Gln Leu Glu Lys His Ile Leu Glu 1010 1015 1020 Gln Phe Arg Phe Asp Gly Ser Asn His Pro Arg Glu Leu Glu Gln 1025 1030 1035 Gly Asn His Pro Asn Phe Lys Met Tyr Ile Val Asn Gly Ile Leu 1040 1045 1050 Thr Lys Arg Gly Glu Leu Glu Ile Glu Ala Glu Asn Trp Trp Leu 1055 1060 1065 Glu Leu Gly Asn Ser Lys Asn Ser Leu Asp Lys Val Glu Val Glu 1070 1075 1080 Leu Leu Thr Met Lys Thr Ile Pro Glu Gln Lys Ala Phe Leu Leu 1085 1090 1095 Ile Leu Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Ala Asp 1100 1105 1110 Asn Tyr Phe His Tyr Ala Ser Asn Leu Met Asn Leu Lys Lys Ser 1115 1120 1125 Asp Thr Tyr Ser Leu Phe Trp Phe Thr Val Ala Asp Thr Ile Val 1130 1135 1140 Gln Glu Phe Met Ser Leu 1145 <210> 179 <211> 1133 <212> PRT <213> Reichenbachiella agariperforans <400> 179 Met Lys Thr Asn Pro Leu Ile Ala Ser Ser Gly Glu Lys Pro Asn Tyr 1 5 10 15 Lys Lys Phe Asn Thr Glu Ser Asp Lys Ser Phe Lys Lys Ile Phe Gln 20 25 30 Asn Lys Gly Ser Ile Ala Pro Ile Ala Glu Lys Ala Cys Lys Asn Phe 35 40 45 Glu Ile Lys Ser Lys Ser Pro Val Asn Arg Asp Gly Arg Leu His Tyr 50 55 60 Phe Ser Val Gly His Ala Phe Lys Asn Ile Asp Ser Lys Asn Val Phe 65 70 75 80 Arg Tyr Glu Leu Asp Glu Ser Gln Met Asp Met Lys Pro Thr Gln Phe 85 90 95 Leu Ala Leu Gln Lys Glu Phe Phe Asp Phe Gln Gly Ala Leu Asn Gly 100 105 110 Leu Leu Lys His Ile Arg Asn Val Asn Ser His Tyr Val His Thr Phe 115 120 125 Glu Lys Leu Glu Ile Gln Ser Ile Asn Gln Lys Leu Ile Thr Phe Leu 130 135 140 Ile Glu Ala Phe Glu Leu Ala Val Ile His Ser Tyr Leu Asn Glu Glu 145 150 155 160 Glu Leu Ser Tyr Glu Ala Tyr Lys Asp Asp Pro Gln Ser Gly Gln Lys 165 170 175 Leu Val Gln Phe Leu Cys Asp Lys Phe Tyr Pro Asn Lys Glu His Glu 180 185 190 Val Glu Glu Arg Lys Thr Ile Leu Ala Lys Asn Lys Arg Gln Ala Leu 195 200 205 Glu His Leu Leu Phe Ile Glu Val Thr Ser Asp Ile Asp Trp Lys Leu 210 215 220 Phe Glu Lys His Lys Val Phe Thr Ile Ser Asn Gly Lys Tyr Leu Ser 225 230 235 240 Phe His Ala Cys Leu Phe Leu Leu Ser Leu Phe Leu Tyr Lys Ser Glu 245 250 255 Ala Asn Gln Leu Ile Ser Lys Ile Lys Gly Phe Lys Arg Asn Asp Asp 260 265 270 Asn Gln Tyr Arg Ser Lys Arg Gln Ile Phe Thr Phe Phe Ser Lys Lys 275 280 285 Phe Thr Ser Gln Asp Val Asn Ser Glu Glu Gln His Leu Val Lys Phe 290 295 300 Arg Asp Val Ile Gln Tyr Leu Asn His Tyr Pro Ser Ala Trp Asn Lys 305 310 315 320 His Leu Glu Leu Lys Ser Gly Tyr Pro Gln Met Thr Asp Lys Leu Met 325 330 335 Arg Tyr Ile Val Glu Ala Glu Ile Tyr Arg Ser Phe Pro Asp Gln Thr 340 345 350 Asp Asn His Arg Phe Leu Leu Phe Ala Ile Arg Glu Phe Phe Gly Gln 355 360 365 Ser Cys Leu Asp Thr Trp Thr Gly Asn Thr Pro Ile Asn Phe Ser Asn 370 375 380 Gln Glu Gln Lys Gly Phe Ser Tyr Glu Ile Asn Thr Ser Ala Glu Ile 385 390 395 400 Lys Asp Ile Glu Thr Lys Leu Lys Ala Leu Val Leu Lys Gly Pro Leu 405 410 415 Asn Phe Lys Glu Lys Lys Glu Gln Asn Arg Leu Glu Lys Asp Leu Arg 420 425 430 Arg Glu Lys Lys Glu Gln Pro Thr Asn Arg Val Lys Glu Lys Leu Leu 435 440 445 Thr Arg Ile Gln His Asn Met Leu Tyr Val Ser Tyr Gly Arg Asn Gln 450 455 460 Asp Arg Phe Met Asp Phe Ala Ala Arg Phe Leu Ala Glu Thr Asp Tyr 465 470 475 480 Phe Gly Lys Asp Ala Lys Phe Lys Met Tyr Gln Phe Tyr Thr Ser Asp 485 490 495 Glu Gln Arg Asp His Leu Lys Glu Gln Lys Lys Glu Leu Pro Lys Lys 500 505 510 Glu Phe Glu Lys Leu Lys Tyr His Gln Ser Lys Leu Val Asp Tyr Phe 515 520 525 Thr Tyr Ala Glu Gln Gln Ala Arg Tyr Pro Asp Trp Asp Thr Pro Phe 530 535 540 Val Val Glu Asn Asn Ala Ile Gln Ile Lys Val Thr Leu Phe Asn Gly 545 550 555 560 Ala Lys Lys Ile Val Ser Val Gln Arg Asn Leu Met Leu Tyr Leu Leu 565 570 575 Glu Asp Ala Leu Tyr Ser Glu Lys Arg Glu Asn Ala Gly Lys Gly Leu 580 585 590 Ile Ser Gly Tyr Phe Val His His Gln Lys Glu Leu Lys Asp Gln Leu 595 600 605 Asp Ile Leu Glu Lys Glu Thr Glu Ile Ser Arg Glu Gln Lys Arg Glu 610 615 620 Phe Lys Lys Leu Leu Pro Lys Arg Leu Leu His Arg Tyr Ser Pro Ala 625 630 635 640 Gln Ile Asn Asp Thr Thr Glu Trp Asn Pro Met Glu Val Ile Leu Glu 645 650 655 Glu Ala Lys Ala Gln Glu Gln Arg Tyr Gln Leu Leu Leu Glu Lys Ala 660 665 670 Ile Leu His Gln Thr Glu Glu Asp Phe Leu Lys Arg Asn Lys Gly Lys 675 680 685 Gln Phe Lys Leu Arg Phe Val Arg Lys Ala Trp His Leu Met Tyr Leu 690 695 700 Lys Glu Leu Tyr Met Asn Lys Val Ala Glu His Gly His His Lys Ser 705 710 715 720 Phe His Ile Thr Lys Glu Glu Phe Asn Asp Phe Cys Arg Trp Met Phe 725 730 735 Ala Phe Asp Glu Val Pro Lys Tyr Lys Glu Tyr Leu Cys Asp Tyr Phe 740 745 750 Ser Gln Lys Gly Phe Phe Asn Asn Ala Glu Phe Lys Asp Leu Ile Glu 755 760 765 Ser Ser Thr Ser Leu Asn Asp Leu Tyr Glu Lys Thr Lys Gln Arg Phe 770 775 780 Glu Gly Trp Ser Lys Asp Leu Thr Lys Gln Ser Asp Glu Asn Lys Tyr 785 790 795 800 Leu Leu Ala Asn Tyr Glu Ser Met Leu Lys Asp Asp Met Leu Tyr Val 805 810 815 Asn Ile Ser His Phe Ile Ser Tyr Leu Glu Ser Lys Gly Lys Ile Asn 820 825 830 Arg Asn Ala His Gly His Ile Ala Tyr Lys Ala Leu Asn Asn Val Pro 835 840 845 His Leu Ile Glu Glu Tyr Tyr Tyr Lys Asp Arg Leu Ala Pro Glu Glu 850 855 860 Tyr Lys Ser His Gly Lys Leu Tyr Asn Lys Leu Lys Thr Val Lys Leu 865 870 875 880 Glu Asp Ala Leu Leu Tyr Glu Met Ala Met His Tyr Leu Ser Leu Glu 885 890 895 Pro Ala Leu Val Pro Lys Val Lys Thr Lys Val Lys Asp Ile Leu Ser 900 905 910 Ser Asn Ile Ala Phe Asp Ile Lys Asp Ala Ala Gly His His Leu Tyr 915 920 925 His Leu Leu Ile Pro Phe His Lys Ile Asp Ser Phe Val Ala Leu Ile 930 935 940 Asn His Gln Ser Gln Gln Glu Lys Asp Pro Asp Lys Thr Ser Phe Leu 945 950 955 960 Ala Lys Ile Gln Pro Tyr Leu Glu Lys Val Lys Asn Ser Lys Asp Leu 965 970 975 Lys Ala Val Tyr His Tyr Tyr Lys Asp Thr Pro His Thr Leu Arg Tyr 980 985 990 Glu Asp Leu Asn Met Ile His Ser His Ile Val Ser Gln Ser Val Gln 995 1000 1005 Phe Thr Lys Val Ala Leu Lys Leu Glu Glu Tyr Phe Ile Ala Lys 1010 1015 1020 Lys Ser Ile Thr Leu Gln Ile Ala Arg Gln Ile Ser Tyr Ser Glu 1025 1030 1035 Ile Ala Asp Leu Ser Asn Tyr Phe Thr Asp Glu Val Arg Asn Thr 1040 1045 1050 Ala Phe His Phe Asp Val Pro Glu Thr Ala Tyr Ser Met Ile Leu 1055 1060 1065 Gln Gly Ile Glu Ser Glu Phe Leu Asp Arg Glu Ile Lys Pro Gln 1070 1075 1080 Lys Pro Lys Ser Leu Ser Glu Leu Ser Thr Gln Gln Val Ser Val 1085 1090 1095 Cys Thr Ala Phe Leu Glu Thr Leu His Asn Asn Leu Phe Asp Arg 1100 1105 1110 Lys Asp Asp Lys Lys Glu Arg Leu Ser Lys Ala Arg Glu Arg Tyr 1115 1120 1125 Phe Glu Gln Ile Asn 1130 <210> 180 <211> 1816 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic consensus sequence" <220> <221> MOD_RES <222> (30)..(30) <223> Any amino acid <220> <221> MOD_RES <222> (33)..(33) <223> Any amino acid <220> <221> MOD_RES <222> (38)..(38) <223> Any amino acid <220> <221> MOD_RES <222> (41)..(41) <223> Any amino acid <220> <221> MOD_RES <222> (43)..(43) <223> Any amino acid <220> <221> MOD_RES <222> (45)..(45) <223> Any amino acid <220> <221> MOD_RES <222> (49)..(49) <223> Any amino acid <220> <221> MOD_RES <222> (73)..(73) <223> Any amino acid <220> <221> MOD_RES <222> (85)..(86) <223> Any amino acid <220> <221> MOD_RES <222> (102)..(102) <223> Any amino acid <220> <221> MOD_RES <222> (105)..(108) <223> Any amino acid <220> <221> MOD_RES <222> (138)..(139) <223> Any amino acid <220> <221> MOD_RES <222> (143)..(143) <223> Any amino acid <220> <221> MOD_RES <222> (146)..(148) <223> Any amino acid <220> <221> MOD_RES <222> (153)..(158) <223> Any amino acid <220> <221> MOD_RES <222> (160)..(160) <223> Any amino acid <220> <221> MOD_RES <222> (180)..(180) <223> Any amino acid <220> <221> MOD_RES <222> (183)..(183) <223> Any amino acid <220> <221> MOD_RES <222> (189)..(189) <223> Any amino acid <220> <221> VARIANT <222> (195)..(195) <223> /replace="Ile" <220> <221> MOD_RES <222> (196)..(196) <223> Any amino acid <220> <221> MOD_RES <222> (198)..(199) <223> Any amino acid <220> <221> MOD_RES <222> (203)..(204) <223> Any amino acid <220> <221> MOD_RES <222> (212)..(212) <223> Any amino acid <220> <221> MOD_RES <222> (214)..(214) <223> Any amino acid <220> <221> MOD_RES <222> (217)..(217) <223> Any amino acid <220> <221> MOD_RES <222> (220)..(220) <223> Any amino acid <220> <221> MOD_RES <222> (228)..(228) <223> Any amino acid <220> <221> MOD_RES <222> (234)..(235) <223> Any amino acid <220> <221> MOD_RES <222> (241)..(243) <223> Any amino acid <220> <221> MOD_RES <222> (249)..(249) <223> Any amino acid <220> <221> MOD_RES <222> (255)..(255) <223> Any amino acid <220> <221> MOD_RES <222> (257)..(257) <223> Any amino acid <220> <221> MOD_RES <222> (268)..(268) <223> Any amino acid <220> <221> MOD_RES <222> (270)..(270) <223> Any amino acid <220> <221> VARIANT <222> (271)..(271) <223> /replace="Ile" <220> <221> MOD_RES <222> (272)..(272) <223> Any amino acid <220> <221> MOD_RES <222> (293)..(293) <223> Any amino acid <220> <221> MOD_RES <222> (301)..(302) <223> Any amino acid <220> <221> MOD_RES <222> (304)..(304) <223> Any amino acid <220> <221> MOD_RES <222> (311)..(312) <223> Any amino acid <220> <221> MOD_RES <222> (317)..(318) <223> Any amino acid <220> <221> MOD_RES <222> (325)..(326) <223> Any amino acid <220> <221> MOD_RES <222> (328)..(328) <223> Any amino acid <220> <221> MOD_RES <222> (336)..(336) <223> Any amino acid <220> <221> MOD_RES <222> (338)..(338) <223> Any amino acid <220> <221> MOD_RES <222> (342)..(344) <223> Any amino acid <220> <221> MOD_RES <222> (346)..(347) <223> Any amino acid <220> <221> MOD_RES <222> (349)..(350) <223> Any amino acid <220> <221> MOD_RES <222> (359)..(359) <223> Any amino acid <220> <221> MOD_RES <222> (361)..(361) <223> Any amino acid <220> <221> MOD_RES <222> (363)..(363) <223> Any amino acid <220> <221> MOD_RES <222> (371)..(371) <223> Any amino acid <220> <221> MOD_RES <222> (377)..(378) <223> Any amino acid <220> <221> MOD_RES <222> (391)..(391) <223> Any amino acid <220> <221> MOD_RES <222> (402)..(403) <223> Any amino acid <220> <221> MOD_RES <222> (406)..(406) <223> Any amino acid <220> <221> MOD_RES <222> (416)..(418) <223> Any amino acid <220> <221> MOD_RES <222> (422)..(423) <223> Any amino acid <220> <221> MOD_RES <222> (425)..(425) <223> Any amino acid <220> <221> MOD_RES <222> (427)..(427) <223> Any amino acid <220> <221> MOD_RES <222> (429)..(429) <223> Any amino acid <220> <221> MOD_RES <222> (433)..(434) <223> Any amino acid <220> <221> MOD_RES <222> (436)..(436) <223> Any amino acid <220> <221> MOD_RES <222> (438)..(438) <223> Any amino acid <220> <221> MOD_RES <222> (440)..(441) <223> Any amino acid <220> <221> MOD_RES <222> (444)..(444) <223> Any amino acid <220> <221> MOD_RES <222> (446)..(446) <223> Any amino acid <220> <221> MOD_RES <222> (449)..(450) <223> Any amino acid <220> <221> MOD_RES <222> (457)..(458) <223> Any amino acid <220> <221> VARIANT <222> (459)..(459) <223> /replace="Ile" <220> <221> MOD_RES <222> (469)..(469) <223> Any amino acid <220> <221> MOD_RES <222> (474)..(475) <223> Any amino acid <220> <221> MOD_RES <222> (481)..(482) <223> Any amino acid <220> <221> MOD_RES <222> (486)..(486) <223> Any amino acid <220> <221> MOD_RES <222> (489)..(489) <223> Any amino acid <220> <221> MOD_RES <222> (492)..(492) <223> Any amino acid <220> <221> MOD_RES <222> (497)..(499) <223> Any amino acid <220> <221> MOD_RES <222> (504)..(504) <223> Any amino acid <220> <221> MOD_RES <222> (506)..(507) <223> Any amino acid <220> <221> MOD_RES <222> (510)..(510) <223> Any amino acid <220> <221> MOD_RES <222> (514)..(514) <223> Any amino acid <220> <221> MOD_RES <222> (530)..(530) <223> Any amino acid <220> <221> MOD_RES <222> (532)..(533) <223> Any amino acid <220> <221> MOD_RES <222> (540)..(541) <223> Any amino acid <220> <221> MOD_RES <222> (546)..(546) <223> Any amino acid <220> <221> MOD_RES <222> (555)..(555) <223> Any amino acid <220> <221> MOD_RES <222> (560)..(560) <223> Any amino acid <220> <221> MOD_RES <222> (580)..(580) <223> Any amino acid <220> <221> MOD_RES <222> (583)..(583) <223> Any amino acid <220> <221> MOD_RES <222> (585)..(585) <223> Any amino acid <220> <221> MOD_RES <222> (593)..(594) <223> Any amino acid <220> <221> MOD_RES <222> (604)..(604) <223> Any amino acid <220> <221> MOD_RES <222> (611)..(611) <223> Any amino acid <220> <221> MOD_RES <222> (613)..(614) <223> Any amino acid <220> <221> MOD_RES <222> (631)..(631) <223> Any amino acid <220> <221> MOD_RES <222> (634)..(634) <223> Any amino acid <220> <221> MOD_RES <222> (644)..(644) <223> Any amino acid <220> <221> MOD_RES <222> (646)..(646) <223> Any amino acid <220> <221> MOD_RES <222> (648)..(648) <223> Any amino acid <220> <221> MOD_RES <222> (650)..(650) <223> Any amino acid <220> <221> MOD_RES <222> (652)..(652) <223> Any amino acid <220> <221> MOD_RES <222> (671)..(671) <223> Any amino acid <220> <221> MOD_RES <222> (675)..(677) <223> Any amino acid <220> <221> MOD_RES <222> (679)..(679) <223> Any amino acid <220> <221> MOD_RES <222> (681)..(682) <223> Any amino acid <220> <221> MOD_RES <222> (697)..(697) <223> Any amino acid <220> <221> MOD_RES <222> (703)..(703) <223> Any amino acid <220> <221> MOD_RES <222> (713)..(716) <223> Any amino acid <220> <221> MOD_RES <222> (721)..(721) <223> Any amino acid <220> <221> MOD_RES <222> (725)..(726) <223> Any amino acid <220> <221> MOD_RES <222> (729)..(729) <223> Any amino acid <220> <221> MOD_RES <222> (734)..(737) <223> Any amino acid <220> <221> MOD_RES <222> (739)..(739) <223> Any amino acid <220> <221> MOD_RES <222> (742)..(743) <223> Any amino acid <220> <221> MOD_RES <222> (745)..(747) <223> Any amino acid <220> <221> MOD_RES <222> (751)..(753) <223> Any amino acid <220> <221> MOD_RES <222> (760)..(760) <223> Any amino acid <220> <221> MOD_RES <222> (763)..(764) <223> Any amino acid <220> <221> MOD_RES <222> (766)..(767) <223> Any amino acid <220> <221> MOD_RES <222> (770)..(771) <223> Any amino acid <220> <221> MOD_RES <222> (783)..(783) <223> Any amino acid <220> <221> MOD_RES <222> (788)..(788) <223> Any amino acid <220> <221> MOD_RES <222> (808)..(808) <223> Any amino acid <220> <221> MOD_RES <222> (812)..(812) <223> Any amino acid <220> <221> MOD_RES <222> (814)..(814) <223> Any amino acid <220> <221> MOD_RES <222> (816)..(816) <223> Any amino acid <220> <221> MOD_RES <222> (826)..(826) <223> Any amino acid <220> <221> MOD_RES <222> (838)..(840) <223> Any amino acid <220> <221> MOD_RES <222> (843)..(843) <223> Any amino acid <220> <221> MOD_RES <222> (847)..(847) <223> Any amino acid <220> <221> MOD_RES <222> (851)..(851) <223> Any amino acid <220> <221> MOD_RES <222> (856)..(856) <223> Any amino acid <220> <221> MOD_RES <222> (859)..(859) <223> Any amino acid <220> <221> MOD_RES <222> (861)..(861) <223> Any amino acid <220> <221> MOD_RES <222> (873)..(873) <223> Any amino acid <220> <221> MOD_RES <222> (878)..(878) <223> Any amino acid <220> <221> MOD_RES <222> (882)..(884) <223> Any amino acid <220> <221> MOD_RES <222> (889)..(892) <223> Any amino acid <220> <221> MOD_RES <222> (898)..(900) <223> Any amino acid <220> <221> MOD_RES <222> (903)..(903) <223> Any amino acid <220> <221> MOD_RES <222> (908)..(909) <223> Any amino acid <220> <221> MOD_RES <222> (912)..(912) <223> Any amino acid <220> <221> MOD_RES <222> (915)..(915) <223> Any amino acid <220> <221> MOD_RES <222> (918)..(918) <223> Any amino acid <220> <221> MOD_RES <222> (932)..(932) <223> Any amino acid <220> <221> MOD_RES <222> (934)..(935) <223> Any amino acid <220> <221> MOD_RES <222> (939)..(939) <223> Any amino acid <220> <221> MOD_RES <222> (941)..(941) <223> Any amino acid <220> <221> MOD_RES <222> (944)..(944) <223> Any amino acid <220> <221> MOD_RES <222> (946)..(946) <223> Any amino acid <220> <221> MOD_RES <222> (951)..(951) <223> Any amino acid <220> <221> MOD_RES <222> (961)..(961) <223> Any amino acid <220> <221> MOD_RES <222> (963)..(963) <223> Any amino acid <220> <221> MOD_RES <222> (965)..(965) <223> Any amino acid <220> <221> MOD_RES <222> (980)..(980) <223> Any amino acid <220> <221> MOD_RES <222> (988)..(988) <223> Any amino acid <220> <221> MOD_RES <222> (992)..(993) <223> Any amino acid <220> <221> MOD_RES <222> (1001)..(1001) <223> Any amino acid <220> <221> MOD_RES <222> (1003)..(1003) <223> Any amino acid <220> <221> MOD_RES <222> (1005)..(1005) <223> Any amino acid <220> <221> MOD_RES <222> (1019)..(1019) <223> Any amino acid <220> <221> VARIANT <222> (1021)..(1021) <223> /replace="Ile" <220> <221> MOD_RES <222> (1023)..(1023) <223> Any amino acid <220> <221> MOD_RES <222> (1025)..(1025) <223> Any amino acid <220> <221> MOD_RES <222> (1029)..(1029) <223> Any amino acid <220> <221> MOD_RES <222> (1033)..(1033) <223> Any amino acid <220> <221> MOD_RES <222> (1048)..(1049) <223> Any amino acid <220> <221> MOD_RES <222> (1055)..(1058) <223> Any amino acid <220> <221> MOD_RES <222> (1060)..(1060) <223> Any amino acid <220> <221> MOD_RES <222> (1063)..(1065) <223> Any amino acid <220> <221> MOD_RES <222> (1068)..(1068) <223> Any amino acid <220> <221> MOD_RES <222> (1071)..(1071) <223> Any amino acid <220> <221> MOD_RES <222> (1075)..(1075) <223> Any amino acid <220> <221> VARIANT <222> (1078)..(1078) <223> /replace="Ile" <220> <221> MOD_RES <222> (1081)..(1081) <223> Any amino acid <220> <221> MOD_RES <222> (1088)..(1088) <223> Any amino acid <220> <221> MOD_RES <222> (1090)..(1090) <223> Any amino acid <220> <221> MOD_RES <222> (1111)..(1111) <223> Any amino acid <220> <221> VARIANT <222> (1113)..(1113) <223> /replace="Ile" <220> <221> MOD_RES <222> (1136)..(1137) <223> Any amino acid <220> <221> MOD_RES <222> (1140)..(1140) <223> Any amino acid <220> <221> MOD_RES <222> (1149)..(1149) <223> Any amino acid <220> <221> MOD_RES <222> (1154)..(1154) <223> Any amino acid <220> <221> MOD_RES <222> (1157)..(1158) <223> Any amino acid <220> <221> MOD_RES <222> (1162)..(1162) <223> Any amino acid <220> <221> MOD_RES <222> (1167)..(1169) <223> Any amino acid <220> <221> MOD_RES <222> (1171)..(1173) <223> Any amino acid <220> <221> MOD_RES <222> (1175)..(1175) <223> Any amino acid <220> <221> MOD_RES <222> (1187)..(1187) <223> Any amino acid <220> <221> MOD_RES <222> (1194)..(1194) <223> Any amino acid <220> <221> MOD_RES <222> (1208)..(1208) <223> Any amino acid <220> <221> MOD_RES <222> (1210)..(1213) <223> Any amino acid <220> <221> MOD_RES <222> (1225)..(1225) <223> Any amino acid <220> <221> MOD_RES <222> (1228)..(1228) <223> Any amino acid <220> <221> MOD_RES <222> (1234)..(1237) <223> Any amino acid <220> <221> MOD_RES <222> (1240)..(1242) <223> Any amino acid <220> <221> MOD_RES <222> (1244)..(1244) <223> Any amino acid <220> <221> MOD_RES <222> (1264)..(1264) <223> Any amino acid <220> <221> MOD_RES <222> (1268)..(1268) <223> Any amino acid <220> <221> MOD_RES <222> (1282)..(1282) <223> Any amino acid <220> <221> MOD_RES <222> (1284)..(1284) <223> Any amino acid <220> <221> MOD_RES <222> (1292)..(1293) <223> Any amino acid <220> <221> MOD_RES <222> (1302)..(1302) <223> Any amino acid <220> <221> MOD_RES <222> (1309)..(1309) <223> Any amino acid <220> <221> MOD_RES <222> (1313)..(1313) <223> Any amino acid <220> <221> MOD_RES <222> (1320)..(1320) <223> Any amino acid <220> <221> MOD_RES <222> (1324)..(1324) <223> Any amino acid <220> <221> MOD_RES <222> (1326)..(1327) <223> Any amino acid <220> <221> MOD_RES <222> (1331)..(1331) <223> Any amino acid <220> <221> MOD_RES <222> (1334)..(1334) <223> Any amino acid <220> <221> MOD_RES <222> (1336)..(1336) <223> Any amino acid <220> <221> MOD_RES <222> (1341)..(1341) <223> Any amino acid <220> <221> MOD_RES <222> (1350)..(1350) <223> Any amino acid <220> <221> MOD_RES <222> (1360)..(1364) <223> Any amino acid <220> <221> MOD_RES <222> (1366)..(1366) <223> Any amino acid <220> <221> MOD_RES <222> (1369)..(1369) <223> Any amino acid <220> <221> MOD_RES <222> (1375)..(1376) <223> Any amino acid <220> <221> MOD_RES <222> (1393)..(1395) <223> Any amino acid <220> <221> MOD_RES <222> (1397)..(1397) <223> Any amino acid <220> <221> MOD_RES <222> (1400)..(1400) <223> Any amino acid <220> <221> MOD_RES <222> (1408)..(1408) <223> Any amino acid <220> <221> MOD_RES <222> (1410)..(1410) <223> Any amino acid <220> <221> MOD_RES <222> (1420)..(1420) <223> Any amino acid <220> <221> MOD_RES <222> (1440)..(1440) <223> Any amino acid <220> <221> MOD_RES <222> (1446)..(1446) <223> Any amino acid <220> <221> MOD_RES <222> (1452)..(1452) <223> Any amino acid <220> <221> MOD_RES <222> (1457)..(1457) <223> Any amino acid <220> <221> MOD_RES <222> (1459)..(1459) <223> Any amino acid <220> <221> VARIANT <222> (1461)..(1461) <223> /replace="Ile" <220> <221> MOD_RES <222> (1463)..(1463) <223> Any amino acid <220> <221> MOD_RES <222> (1465)..(1466) <223> Any amino acid <220> <221> MOD_RES <222> (1470)..(1470) <223> Any amino acid <220> <221> MOD_RES <222> (1472)..(1472) <223> Any amino acid <220> <221> MOD_RES <222> (1475)..(1475) <223> Any amino acid <220> <221> MOD_RES <222> (1484)..(1485) <223> Any amino acid <220> <221> MOD_RES <222> (1494)..(1494) <223> Any amino acid <220> <221> MOD_RES <222> (1496)..(1498) <223> Any amino acid <220> <221> MOD_RES <222> (1500)..(1501) <223> Any amino acid <220> <221> MOD_RES <222> (1504)..(1504) <223> Any amino acid <220> <221> MOD_RES <222> (1506)..(1506) <223> Any amino acid <220> <221> MOD_RES <222> (1508)..(1511) <223> Any amino acid <220> <221> MOD_RES <222> (1513)..(1514) <223> Any amino acid <220> <221> MOD_RES <222> (1518)..(1518) <223> Any amino acid <220> <221> VARIANT <222> (1522)..(1522) <223> /replace="Ile" <220> <221> MOD_RES <222> (1530)..(1530) <223> Any amino acid <220> <221> MOD_RES <222> (1532)..(1532) <223> Any amino acid <220> <221> MOD_RES <222> (1535)..(1537) <223> Any amino acid <220> <221> MOD_RES <222> (1539)..(1540) <223> Any amino acid <220> <221> MOD_RES <222> (1542)..(1542) <223> Any amino acid <220> <221> MOD_RES <222> (1548)..(1548) <223> Any amino acid <220> <221> MOD_RES <222> (1559)..(1559) <223> Any amino acid <220> <221> MOD_RES <222> (1565)..(1565) <223> Any amino acid <220> <221> MOD_RES <222> (1568)..(1568) <223> Any amino acid <220> <221> MOD_RES <222> (1580)..(1581) <223> Any amino acid <220> <221> MOD_RES <222> (1584)..(1585) <223> Any amino acid <220> <221> MOD_RES <222> (1588)..(1588) <223> Any amino acid <220> <221> MOD_RES <222> (1596)..(1596) <223> Any amino acid <220> <221> MOD_RES <222> (1602)..(1602) <223> Any amino acid <220> <221> MOD_RES <222> (1633)..(1635) <223> Any amino acid <220> <221> MOD_RES <222> (1640)..(1640) <223> Any amino acid <220> <221> MOD_RES <222> (1643)..(1646) <223> Any amino acid <220> <221> MOD_RES <222> (1653)..(1653) <223> Any amino acid <220> <221> MOD_RES <222> (1659)..(1659) <223> Any amino acid <220> <221> MOD_RES <222> (1668)..(1668) <223> Any amino acid <220> <221> MOD_RES <222> (1675)..(1676) <223> Any amino acid <220> <221> MOD_RES <222> (1683)..(1683) <223> Any amino acid <220> <221> MOD_RES <222> (1694)..(1696) <223> Any amino acid <220> <221> MOD_RES <222> (1705)..(1705) <223> Any amino acid <220> <221> MOD_RES <222> (1716)..(1718) <223> Any amino acid <220> <221> MOD_RES <222> (1720)..(1720) <223> Any amino acid <220> <221> MOD_RES <222> (1726)..(1726) <223> Any amino acid <220> <221> MOD_RES <222> (1733)..(1733) <223> Any amino acid <220> <221> MOD_RES <222> (1755)..(1756) <223> Any amino acid <220> <221> MOD_RES <222> (1758)..(1759) <223> Any amino acid <220> <221> MOD_RES <222> (1763)..(1763) <223> Any amino acid <220> <221> MOD_RES <222> (1767)..(1767) <223> Any amino acid <220> <221> MISC_FEATURE <222> (1)..(1816) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 180 Met Trp Ile Ser Ile Lys Thr Leu Ile His His Leu Gly Val Leu Phe 1 5 10 15 Phe Cys Asp Met Gly Asn Leu Phe Gly His Met Lys Ile Xaa Lys Val 20 25 30 Xaa His Glu Lys Arg Xaa Ala Lys Xaa Lys Xaa Pro Xaa Lys Lys Val 35 40 45 Xaa Val Lys Arg Lys Tyr Ser Gly Gly Gly Leu Leu Leu Asn Tyr Asn 50 55 60 Glu Asn Pro Asn Lys Asn Lys Ser Xaa Glu Asn Ile Leu Ile Lys Lys 65 70 75 80 Lys Ile Ser Phe Xaa Xaa Leu Lys Ser Ser Ser Lys Leu Asx Lys Thr 85 90 95 Ile Asn Lys Pro Asp Xaa Lys Lys Xaa Xaa Xaa Xaa Leu Gln Trp Phe 100 105 110 Leu Ser Glu Ile Val Lys Lys Ile Asn Arg Arg Asn Gly Leu Val Leu 115 120 125 Ser Asp Met Leu Ser Val Asp Lys Arg Xaa Xaa Glu Lys Ile Xaa Glu 130 135 140 Lys Xaa Xaa Xaa Leu Lys Tyr Phe Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa 145 150 155 160 Lys Leu His Gln Glu Lys Pro Ser Lys Lys Leu Phe Asn Leu Lys Asp 165 170 175 Leu Lys Glu Xaa Glu Glu Xaa Val Leu Phe Leu Lys Xaa Lys Phe Lys 180 185 190 Asn Glu Leu Xaa Tyr Xaa Xaa Glu Asn Asp Xaa Xaa Lys Asp Ile Glu 195 200 205 Lys Ile Leu Xaa Glu Xaa Leu Arg Xaa Gly Phe Xaa Pro Ala Asp Lys 210 215 220 Lys Leu Lys Xaa Lys Phe Leu Ile Glu Xaa Xaa Trp Gly Ile Phe Ser 225 230 235 240 Xaa Xaa Xaa Lys Leu Glu Pro Tyr Xaa Ile Gln Glu Asp Phe Xaa Glu 245 250 255 Xaa Tyr Ile Glu Asp Phe Lys Lys Leu Asn Lys Xaa Lys Xaa Leu Xaa 260 265 270 Lys Ser Ile Glu Asn Asn Lys Ile Val Ser Gln Lys Ser Ser Asp Ser 275 280 285 Gln Ile Tyr Glu Xaa Gly Lys Asn Ile Ile Met Ser Xaa Xaa Gly Xaa 290 295 300 Ile Glu Ser Ile Ile Glu Xaa Xaa Ser Lys Arg Lys Xaa Xaa Leu Asp 305 310 315 320 Lys Tyr Ala Thr Xaa Xaa Leu Xaa Glu Lys Leu Leu Leu Asp Glu Xaa 325 330 335 Leu Xaa Ile Glu Gln Xaa Xaa Xaa Asn Xaa Xaa Glu Xaa Xaa Asp Lys 340 345 350 Leu Ala Ser Asn Leu Lys Xaa Tyr Xaa Leu Xaa Lys Leu Tyr Phe Tyr 355 360 365 Val Lys Xaa Asp Lys Lys Lys Ser Xaa Xaa Glu Val Ala Lys Ala Ala 370 375 380 Val Ser Ala Ala Lys Asp Xaa Asn Lys Asp Lys Tyr Gln Asn Glu Val 385 390 395 400 Trp Xaa Xaa His Glu Xaa Arg Lys Glu Asp Lys Arg Asp Phe Ile Xaa 405 410 415 Xaa Xaa Leu Glu Ile Xaa Xaa Ile Xaa Lys Xaa Ile Xaa Lys Val Lys 420 425 430 Xaa Xaa Ile Xaa Lys Xaa Ala Xaa Xaa Glu Ala Xaa Glu Xaa Ile Lys 435 440 445 Xaa Xaa Asn Ile Gly Lys Tyr Arg Xaa Xaa Leu Asp Leu Phe Glu Leu 450 455 460 Glu Glu Asp Asn Xaa Leu Asn Gln Phe Xaa Xaa Phe Val Asn Ile Glu 465 470 475 480 Xaa Xaa Lys Phe Phe Xaa His Tyr Xaa Pro Asn Xaa Ile Lys Arg Ile 485 490 495 Xaa Xaa Xaa Lys Asn Asp Ala Xaa Ala Xaa Xaa Leu Lys Xaa Gly Glu 500 505 510 Leu Xaa Lys Lys Val Glu Lys Gln Leu Lys Asn Gly Ala Leu Ser Ile 515 520 525 Tyr Xaa Ile Xaa Xaa Gly Lys Ala Val Tyr Tyr Xaa Xaa Phe Ala Met 530 535 540 Lys Xaa Leu Ala Asp Ser Asp Tyr Trp Thr Xaa Lys Asp Leu Glu Xaa 545 550 555 560 Ile Lys Ile Ser Glu Ala Phe Leu Arg Lys Phe Ile Gly Ala Cys Ser 565 570 575 Phe Ala Tyr Xaa Ser Leu Xaa Ala Xaa Asn Ile Leu Gln Pro Glu Cys 580 585 590 Xaa Xaa Asp Ile Leu Gly Lys Gly Asp Leu Leu Xaa Lys Ala Thr Val 595 600 605 Asn Ile Xaa Gln Xaa Xaa Ser Glu His Ile Met Tyr Leu Gly Lys Leu 610 615 620 Arg His Asn Asp Ile Asp Xaa Leu Leu Xaa Phe Lys Glu Asp Ile Ala 625 630 635 640 Lys Ser Thr Xaa Lys Xaa Gly Xaa Gly Xaa Leu Xaa Lys Asn Leu Ile 645 650 655 Gln Phe Phe Gly Gly Glu Ser Thr Trp Asp Asn Lys Ile Phe Xaa Ala 660 665 670 Ala Tyr Xaa Xaa Xaa Leu Xaa Gly Xaa Xaa Glu Asn Glu Asp Phe Leu 675 680 685 Gly Trp Ala Leu Arg Gly Ala Ile Xaa Ser Ile Arg Asn Glu Xaa Phe 690 695 700 His Ser Phe Lys Ile Lys Lys His Xaa Xaa Xaa Xaa Phe Leu Asn Ile 705 710 715 720 Xaa Asn Phe Ile Xaa Xaa Lys Leu Xaa Glu Phe Glu Lys Xaa Xaa Xaa 725 730 735 Xaa Lys Xaa Lys Glu Xaa Xaa His Xaa Xaa Xaa Thr Ser Tyr Xaa Xaa 740 745 750 Xaa Leu Ile Lys Lys Leu Phe Xaa Asn Glu Xaa Xaa Lys Xaa Xaa Leu 755 760 765 Pro Xaa Xaa Ile Lys Glu Leu Lys Leu Lys Ser Ser Gly Val Xaa Met 770 775 780 Tyr Tyr Ser Xaa Asp Asp Leu Lys Lys Leu Leu Glu Asn Ile Tyr Phe 785 790 795 800 Lys Phe Ser Leu Leu Lys Ile Xaa Glu Glu Asn Xaa Glu Xaa Ala Xaa 805 810 815 Phe Val Pro Ser Phe Lys Lys Val Tyr Xaa Arg Ala Asp Gly Val Lys 820 825 830 Gly Phe Asp Tyr Gln Xaa Xaa Xaa Thr Arg Xaa His Ala Tyr Xaa Leu 835 840 845 Lys Leu Xaa Pro Phe Phe Asp Xaa Glu Glu Xaa Glu Xaa Glu Ala Phe 850 855 860 Asn Ala Arg Tyr Tyr Leu Leu Lys Xaa Ile Tyr Tyr Asn Xaa Ile Leu 865 870 875 880 Glu Xaa Xaa Xaa Glu Glu Asn Glu Xaa Xaa Xaa Xaa Phe Leu Pro Lys 885 890 895 Phe Xaa Xaa Xaa Asn Asn Xaa Ala Phe Arg Glu Xaa Xaa Asn Phe Xaa 900 905 910 Ala Asp Xaa Ile Glu Xaa Tyr Tyr Lys Arg Leu Gln Ile Asn Lys Lys 915 920 925 Lys Gly Ala Xaa Lys Xaa Xaa Lys Lys Lys Xaa Gln Xaa Lys Val Xaa 930 935 940 Asn Xaa Tyr Asn Arg Lys Xaa Phe Ala Tyr Ala Phe Glu Asn Ile Arg 945 950 955 960 Xaa Met Xaa Phe Xaa Glu Thr Pro Arg Glu Tyr Met Gln Tyr Ile Gln 965 970 975 Ser Glu Tyr Xaa Ile Glu Asn Asn Gly Lys Glu Xaa Lys Lys Ser Xaa 980 985 990 Xaa Glu Asn Lys Arg Asn Lys Asp Xaa Phe Xaa His Xaa Glu Lys Phe 995 1000 1005 Leu Leu Gln Val Phe Ile Lys Gly Phe Asp Xaa Tyr Leu Asp Xaa 1010 1015 1020 Arg Xaa Glu Asn Phe Xaa Phe Ile Leu Xaa Pro Glu Pro Gln Asn 1025 1030 1035 Gly Thr Lys Glu Tyr Leu Tyr Glu Glu Xaa Xaa Ala Ile Leu Asp 1040 1045 1050 Glu Xaa Xaa Xaa Xaa Asn Xaa Leu Arg Xaa Xaa Xaa Ile Thr Xaa 1055 1060 1065 Asn Lys Xaa Leu Lys Leu Xaa Glu Phe Leu Pro Glu Xaa Lys Ser 1070 1075 1080 Asp Ile Lys Val Xaa Pro Xaa Leu Val Glu Glu Ile Tyr Asp Tyr 1085 1090 1095 Ile Lys Lys Ile Lys Ile Asn Lys Ile Lys Lys Asp Xaa Glu Leu 1100 1105 1110 Ala Phe Trp Gln Asp Ala Ala Leu Tyr Leu Phe Cys Glu Lys Leu 1115 1120 1125 Leu Asp Ala Arg His Leu Ser Xaa Xaa Leu Arg Xaa Glu Leu Ile 1130 1135 1140 Lys Tyr Lys Gln Phe Xaa Lys Asp Ile Lys Xaa Arg Ala Xaa Xaa 1145 1150 1155 Asn Gly Asn Xaa Ile Asn His Ser Xaa Xaa Xaa Asn Xaa Xaa Xaa 1160 1165 1170 Val Xaa Glu Cys Thr Asp Glu Leu Glu Ile Ile Glu Leu Xaa Leu 1175 1180 1185 Leu Leu Asn Asp Arg Xaa Ser Asn Asp Phe Lys Asp Tyr Phe Asp 1190 1195 1200 Asp Glu Glu Ala Xaa Ile Xaa Xaa Xaa Xaa Leu Cys Arg Ile Ile 1205 1210 1215 Phe Tyr Ala Glu Tyr Leu Xaa Lys Tyr Xaa Lys Glu Glu Asp Asp 1220 1225 1230 Xaa Xaa Xaa Xaa Ala Glu Xaa Xaa Xaa Phe Xaa Ala Leu Glu Pro 1235 1240 1245 Phe Cys Gln Ser Asp Thr Ala Arg Glu Ala Lys Asn Asp Ile Tyr 1250 1255 1260 Xaa Asp Gly Gly Xaa Asn Pro Glu Leu Arg Val Pro Ile Leu Asn 1265 1270 1275 Arg Gly Ile Xaa Gln Xaa Lys Lys Ile Tyr Gly Thr Glu Xaa Xaa 1280 1285 1290 Leu Glu Lys Leu Phe Asp Lys Asn Xaa Leu Phe Asx Ile Asp Gly 1295 1300 1305 Xaa Asx Ile Pro Xaa Phe Lys Val Ser Glu Glu Xaa Ala Ile Ile 1310 1315 1320 Xaa Glu Xaa Xaa Glu Lys Lys Xaa Glu Ile Xaa Glu Xaa Ser Gln 1325 1330 1335 Tyr Lys Xaa Arg Gly Glu Leu His Thr Glu Trp Xaa Gln Lys Ala 1340 1345 1350 Arg Glu Ile Glu Glu Tyr Xaa Xaa Xaa Xaa Xaa Lys Xaa Lys Phe 1355 1360 1365 Xaa Lys Lys Pro Gln Asn Xaa Xaa Phe Glu Lys Arg Phe Ile Glu 1370 1375 1380 Lys His Gly Gln Glu Tyr Lys Lys Ala Xaa Xaa Xaa Ile Xaa Glu 1385 1390 1395 Tyr Xaa Trp Leu Lys Asn Lys Val Glu Xaa Asn Xaa Leu Asn Glu 1400 1405 1410 Leu His Glu Leu Leu Ile Xaa Leu Leu Gly Arg Leu Ile Gly Tyr 1415 1420 1425 Ser Ala Leu Phe Glu Arg Asp Leu Gln Tyr Phe Xaa Asn Gly Phe 1430 1435 1440 His Tyr Xaa Cys Leu Asn Asn Asp Xaa Glu Lys Leu Ala Xaa Tyr 1445 1450 1455 Xaa Asn Leu Ser Xaa Val Xaa Xaa Lys Asn Arg Xaa Ile Xaa Lys 1460 1465 1470 Ala Xaa Leu Tyr Gln Ile Phe Ala Met Tyr Xaa Xaa Gly Leu Pro 1475 1480 1485 Phe Tyr Ser Lys Asp Xaa Asp Xaa Xaa Xaa Ala Xaa Xaa Ser Gly 1490 1495 1500 Xaa Lys Xaa Ser Xaa Xaa Xaa Xaa Ser Xaa Xaa Thr Ala Gly Xaa 1505 1510 1515 Gly Lys Lys Leu Lys Lys Phe Lys Lys Tyr Ser Xaa Tyr Xaa Leu 1520 1525 1530 Ile Xaa Xaa Xaa Leu Xaa Xaa Asp Xaa Ser Lys Lys Leu Asp Xaa 1535 1540 1545 Tyr Leu Ala Gly Leu Glu Leu Phe Glu Asn Xaa Glu Glu His Asp 1550 1555 1560 Asn Xaa Thr Glu Xaa Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr 1565 1570 1575 Leu Xaa Xaa Ala Gly Xaa Xaa Ala Asp Xaa Ser Leu Leu Glu Leu 1580 1585 1590 Tyr Asn Xaa Leu Arg Asp Arg Leu Xaa Ser Tyr Asp Arg Lys Leu 1595 1600 1605 Lys Asn Ala Val Ser Lys Ser Leu Ile Asp Ile Leu Asp Arg His 1610 1615 1620 Gly Met Ile Leu Lys Phe Lys Phe Lys Xaa Xaa Xaa Lys Leu Ile 1625 1630 1635 Gly Xaa Asn Asp Xaa Xaa Xaa Xaa Ala Ile Lys His Lys Asp Xaa 1640 1645 1650 Ala Arg Ile Thr Ile Xaa Glu Pro Asn Gly Val Thr Ser Glu Xaa 1655 1660 1665 Phe Thr Tyr Lys Leu Leu Xaa Xaa Val Ala Ala Leu Glu Ile Xaa 1670 1675 1680 Ser Leu Glu Pro Lys Lys Ile Arg His Leu Xaa Xaa Xaa Ala Arg 1685 1690 1695 Leu Leu Tyr Tyr Pro Lys Xaa Ala Thr Ala Gln Ser Gln Pro Asp 1700 1705 1710 Gln Lys Xaa Xaa Xaa Lys Xaa Lys Lys Lys Asn Ile Xaa Lys Gly 1715 1720 1725 Tyr Ile Glu Arg Xaa Thr Asn Gln Val Ser Ser Asn Gln Glu Glu 1730 1735 1740 Tyr Cys Glu Leu Val Lys Lys Leu Leu Glu Thr Xaa Xaa Leu Xaa 1745 1750 1755 Xaa Leu Ala Val Xaa Gly Val Ala Xaa Asx Ile Gly Leu His Ile 1760 1765 1770 Ser Arg Leu Arg Arg Ile Arg Glu Asp Ala Ile Ile Val Gly Arg 1775 1780 1785 Arg Tyr Arg Phe Arg Val Glu Ile Tyr Val Pro Pro Lys Ser Asn 1790 1795 1800 Thr Ser Lys Leu Asn Ala Ala Asp Leu Val Arg Ile Asp 1805 1810 1815 <210> 181 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 181 ttgccatgac ccttgccgtt gttg 24 <210> 182 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 182 tgatgatgca gtagtcagga cctt 24 <210> 183 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 183 caagtttgtg tacccgagga tttg 24 <210> 184 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 184 agctagtccc aataaatatg cgct 24 <210> 185 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 185 ctgtagtcgt tggctgtggt 20 <210> 186 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 186 cagcgttccc caagaagagt 20 <210> 187 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 187 agattgctgt tctaccaagt aatccata 28 <210> 188 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 188 tatggattac ttggtagaac agcaatct 28 <210> 189 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 189 atcagggcaa acagaacttt gactccca 28 <210> 190 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 190 gtgcagccag ctttccgggc attggctt 28 <210> 191 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 191 tagattgctg ttctaccaag taatccat 28 <210> 192 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 192 tccttgatta cacgatggaa tttgctgt 28 <210> 193 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 193 atgataatgc aatagcagga caggatga 28 <210> 194 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 194 aatttctcga actaatgtat agaaggca 28 <210> 195 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 195 ccaccaccac cgcctcccgc cgcccccg 28 <210> 196 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 196 tgctcccatc atctcaagta cctcagca 28 <210> 197 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 197 cccttgacac gaacaggtgg gcattcag 28 <210> 198 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 198 agaaggtcac ctgtacggcg agcacggc 28 <210> 199 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 199 cagatccgct tgagggtggc gatctggt 28 <210> 200 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 200 ccggacgatc gggcatcccc gccatctc 28 <210> 201 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 201 gactgagcac aaagcttccc agatagaa 28 <210> 202 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 202 accatccaag aatgccatct tagaacca 28 <210> 203 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 203 cctggcaaac aacctgtaga gcaccgag 28 <210> 204 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 204 tagattgctg tttcacacag atatgcat 28 <210> 205 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 205 tataatggtg aatatcttca aatgattt 28 <210> 206 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 206 atgtatagaa ggcatcatca acaccctg 28 <210> 207 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 207 ggttaaaaat ttacagattg tgctgagc 28 <210> 208 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 208 gtagatgctc tttcctcctg tgccatct 28 <210> 209 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 209 cagtttgaag ttctcatcgg ggaagcgc 28 <210> 210 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 210 cagtgttggt aggagtttgt tacaaaag 28 <210> 211 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 211 cttggccaag tctgttatgt tcacctga 28 <210> 212 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 212 caaaatgtac tcagcttcaa tcacaaat 28 <210> 213 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 213 ggttatagct tgacaagcaa ttaacttt 28 <210> 214 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 214 tccttgatta cacgatggaa tttgctgt 28 <210> 215 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 215 atgataatgc aatagcagga caggatga 28 <210> 216 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 216 aatttctcga actaatgtat agaaggca 28 <210> 217 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 217 gcgtgagcca ccgcgcctgg ccggctgt 28 <210> 218 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 218 ccagctgcag atgctgcagt ttttggcg 28 <210> 219 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 219 atcagggcaa acagaacttt gactccca 28 <210> 220 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 220 ttcagggcaa acagaacttt gactccca 28 <210> 221 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 221 atctgggcaa acagaacttt gactccca 28 <210> 222 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 222 atcaggccaa acagaacttt gactccca 28 <210> 223 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 223 atcagggcat acagaacttt gactccca 28 <210> 224 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 224 atcagggcaa actgaacttt gactccca 28 <210> 225 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 225 atcagggcaa acagatcttt gactccca 28 <210> 226 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 226 atcagggcaa acagaactat gactccca 28 <210> 227 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 227 atcagggcaa acagaacttt gtctccca 28 <210> 228 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 228 atcagggcaa acagaacttt gactgcca 28 <210> 229 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 229 atcagggcaa acagaacttt gactccct 28 <210> 230 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 230 atgataatgc aatagcagga caggatga 28 <210> 231 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 231 ttgataatgc aatagcagga caggatga 28 <210> 232 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 232 atgttaatgc aatagcagga caggatga 28 <210> 233 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 233 atgatattgc aatagcagga caggatga 28 <210> 234 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 234 atgataatgg aatagcagga caggatga 28 <210> 235 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 235 atgataatgc aaaagcagga caggatga 28 <210> 236 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 236 atgataatgc aataggagga caggatga 28 <210> 237 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 237 atgataatgc aatagcagca caggatga 28 <210> 238 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 238 atgataatgc aatagcagga ctggatga 28 <210> 239 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 239 atgataatgc aatagcagga caggttga 28 <210> 240 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 240 atgataatgc aatagcagga caggatgt 28 <210> 241 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 241 gtgcagccag ctttccgggc attggctt 28 <210> 242 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 242 ctgcagccag ctttccgggc attggctt 28 <210> 243 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 243 gtggagccag ctttccgggc attggctt 28 <210> 244 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 244 gtgcaggcag ctttccgggc attggctt 28 <210> 245 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 245 gtgcagccac ctttccgggc attggctt 28 <210> 246 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 246 gtgcagccag ctatccgggc attggctt 28 <210> 247 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 247 gtgcagccag ctttcggggc attggctt 28 <210> 248 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 248 gtgcagccag ctttccggcc attggctt 28 <210> 249 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 249 gtgcagccag ctttccgggc aatggctt 28 <210> 250 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 250 gtgcagccag ctttccgggc attgcctt 28 <210> 251 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 251 gtgcagccag ctttccgggc attggcta 28 <210> 252 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 252 tataatggtg aatatcttca aatgattt 28 <210> 253 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 253 aataatggtg aatatcttca aatgattt 28 <210> 254 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 254 tattatggtg aatatcttca aatgattt 28 <210> 255 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 255 tataatcgtg aatatcttca aatgattt 28 <210> 256 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 256 tataatggtc aatatcttca aatgattt 28 <210> 257 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 257 tataatggtg aaaatcttca aatgattt 28 <210> 258 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 258 tataatggtg aatatgttca aatgattt 28 <210> 259 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 259 tataatggtg aatatcttga aatgattt 28 <210> 260 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 260 tataatggtg aatatcttca attgattt 28 <210> 261 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 261 tataatggtg aatatcttca aatgtttt 28 <210> 262 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 262 tataatggtg aatatcttca aatgatta 28 <210> 263 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 263 gtagatgctc tttcctcctg tgccatct 28 <210> 264 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 264 ctagatgctc tttcctcctg tgccatct 28 <210> 265 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 265 gtacatgctc tttcctcctg tgccatct 28 <210> 266 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 266 gtagatcctc tttcctcctg tgccatct 28 <210> 267 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 267 gtagatgctg tttcctcctg tgccatct 28 <210> 268 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 268 gtagatgctc ttacctcctg tgccatct 28 <210> 269 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 269 gtagatgctc tttccacctg tgccatct 28 <210> 270 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 270 gtagatgctc tttcctccag tgccatct 28 <210> 271 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 271 gtagatgctc tttcctcctg tcccatct 28 <210> 272 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 272 gtagatgctc tttcctcctg tgccttct 28 <210> 273 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 273 gtagatgctc tttcctcctg tgccatca 28 <210> 274 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 274 gtgcagccag ctttccgggc attggctt 28 <210> 275 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 275 cagcagccag ctttccgggc attggctt 28 <210> 276 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 276 gtggtgccag ctttccgggc attggctt 28 <210> 277 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 277 gtgcagggag ctttccgggc attggctt 28 <210> 278 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 278 gtgcagccac gtttccgggc attggctt 28 <210> 279 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 279 gtgcagccag ctaaccgggc attggctt 28 <210> 280 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 280 gtgcagccag ctttcgcggc attggctt 28 <210> 281 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 281 gtgcagccag ctttccggcg attggctt 28 <210> 282 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 282 gtgcagccag ctttccgggc aaaggctt 28 <210> 283 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 283 gtgcagccag ctttccgggc attgcgtt 28 <210> 284 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 284 ctgctgccag ctttccgggc attggctt 28 <210> 285 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 285 ctgcagcctg ctttccgggc attggctt 28 <210> 286 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 286 ctgcagccag ctatccgggc attggctt 28 <210> 287 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 287 ctgcagccag ctttcccggc attggctt 28 <210> 288 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 288 gtggagcgag ctttccgggc attggctt 28 <210> 289 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 289 gtggagccag cattccgggc attggctt 28 <210> 290 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 290 gtggagccag ctttcggggc attggctt 28 <210> 291 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 291 gtggagccag ctttccgggg attggctt 28 <210> 292 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 292 gtgcaggcag gtttccgggc attggctt 28 <210> 293 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 293 gtgcaggcag ctttgcgggc attggctt 28 <210> 294 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 294 gtgcaggcag ctttccggcc attggctt 28 <210> 295 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 295 gtgcaggcag ctttccgggc ataggctt 28 <210> 296 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 296 gtgcagccac cttaccgggc attggctt 28 <210> 297 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 297 gtgcagccac ctttccgcgc attggctt 28 <210> 298 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 298 gtgcagccac ctttccgggc aatggctt 28 <210> 299 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 299 gtgcagccac ctttccgggc attgggtt 28 <210> 300 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 300 gtgcagccag ctatcccggc attggctt 28 <210> 301 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 301 gtgcagccag ctatccgggc tttggctt 28 <210> 302 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 302 gtgcagccag ctatccgggc attgcctt 28 <210> 303 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 303 gtgcagccag ctttcggggg attggctt 28 <210> 304 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 304 gtgcagccag ctttcggggc attcgctt 28 <210> 305 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 305 gtgcagccag ctttcggggc attggcta 28 <210> 306 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 306 gtgcagccag ctttccggcc ataggctt 28 <210> 307 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 307 gtgcagccag ctttccggcc attggcat 28 <210> 308 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 308 atcagggcaa acagaacttt gactccca 28 <210> 309 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 309 gctgtaataa ttaggtaaca tttatttc 28 <210> 310 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 310 gtcagtgttg gtaggagttt gttacaaa 28 <210> 311 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 311 gtgcagccag ctttccgggc attggctt 28 <210> 312 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 312 ctggcggcgg gtgtggacgg gcggcgga 28 <210> 313 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 313 gagccacacg cagctcattg tagaaggt 28 <210> 314 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 314 aaaguucugu uugcccugau ccucgaggau cagggcaaac agaacuuu 48 <210> 315 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 315 aagccaaugc ccggaaagcu gcucgagcag cuuuccgggc auuggcuu 48 <210> 316 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 316 uagauugcug uucuaccaag ucucgagacu ugguagaaca gcaaucua 48 <210> 317 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 317 acagcaaauu ccaucgugua acucgaguua cacgauggaa uuugcugu 48 <210> 318 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 318 auccuguccu gcuauugcau ucucgagaau gcaauagcag gacaggau 48 <210> 319 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 319 ccuucuauac auuaguucga gcucgagcuc gaacuaaugu auagaagg 48 <210> 320 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 320 aagccaaugc ccggaaagcu gcucgagcag cuuuccgggc auuggcuu 48 <210> 321 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 321 agauuccugg guucaaggac ucucgagagu ccuugaaccc aggaaucu 48 <210> 322 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 322 aaaguucugu uugcccugau ccucgaggau cagggcaaac agaacuuu 48 <210> 323 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 323 aaguggcugg agacaucauu gcucgagcaa ugaugucucc agccacuu 48 <210> 324 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 324 aagccguguc cgucccguac acucgagugu acgggacgga cacggcuu 48 <210> 325 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 325 aagaccuuaa uucuugccgu ucucgagaac ggcaagaauu aaggucuu 48 <210> 326 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 326 aaucauuuga agauauucac ccucgagggu gaauaucuuc aaaugauu 48 <210> 327 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 327 aggguguuga ugaugccuuc ucucgagaga aggcaucauc aacacccu 48 <210> 328 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 328 aaucuguaaa uuuuuaaccu acucgaguag guuaaaaauu uacagauu 48 <210> 329 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 329 agauggcaca ggaggaaaga gcucgagcuc uuuccuccug ugccaucu 48 <210> 330 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 330 agcgcuuccc cgaugagaac ucucgagagu ucucaucggg gaagcgcu 48 <210> 331 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 331 aacauaacag acuuggccaa gcucgagcuu ggccaagucu guuauguu 48 <210> 332 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 332 aagcugagua cauuuugcug gcucgagcca gcaaaaugua cucagcuu 48 <210> 333 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 333 aaguuaauug cuugucaagc ucucgagagc uugacaagca auuaacuu 48 <210> 334 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 334 aaaguucugu uugcccugau ccucgaggau cagggcaaac agaacuuu 48 <210> 335 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 335 uguuaccuaa uuauuacagc ccucgagggc uguaauaauu agguaaca 48 <210> 336 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 336 aacuccuacc aacacugacc acucgagugg ucaguguugg uaggaguu 48 <210> 337 <211> 48 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 337 aacuucgcga ccacggaucu ccucgaggag auccgugguc gcgaaguu 48 <210> 338 <211> 176 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 338 gggggccagu gaauucgagc ucgguacccg gggauccucu agaaauaugg auuacuuggu 60 agaacagcaa ucuacucgac cugcaggcau gcaagcuugg cguaaucaug gucauagcug 120 uuuccugugu uuauccgcuc acaauuccac acaacauacg agccggaagc auaaag 176 <210> 339 <211> 176 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 339 ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60 agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuuccagac 120 uuuacgaaac acggaaaccg aagaccauuc auguuguugc ugccggaagc auaaag 176 <210> 340 <211> 176 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 340 gggccccucc guucgcguuu acgcggacgg ugagacugaa gauaauaugg auuacuuggu 60 agaacagcaa ucuaaacuca uucucuuuaa aauaucguuc gaacuggacu cccggucguu 120 uuaacucgac uggggccaaa acgaaacagu ggcacuaccc cgccggaagc auaaag 176 <210> 341 <211> 174 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 341 ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60 agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuuguuuua 120 aaucaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174 <210> 342 <211> 174 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 342 ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60 agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuugcccca 120 aaccaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174 <210> 343 <211> 174 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 343 ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60 agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuuggggga 120 aagcaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174 <210> 344 <211> 174 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 344 ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60 agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuugaaaaa 120 aaacaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174 <210> 345 <211> 178 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 345 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu uucuuuucuu cgauguggau 60 ugguuuacca ggauuuagac uaccccaaaa acgaagggga cuaaaacgua aaauagauac 120 aauaacuucu ucuacaugau uuagacuacc ccaaaaacga aggggacuaa aacgcgcg 178 <210> 346 <211> 67 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 346 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aatccat 67 <210> 347 <211> 68 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 347 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aatccata 68 <210> 348 <211> 66 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 348 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aatcca 66 <210> 349 <211> 65 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 349 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aatcc 65 <210> 350 <211> 64 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 350 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aatc 64 <210> 351 <211> 63 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 351 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aat 63 <210> 352 <211> 62 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 352 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 aa 62 <210> 353 <211> 61 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 353 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 a 61 <210> 354 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 354 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60 <210> 355 <211> 59 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 355 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaag 59 <210> 356 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 356 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaa 58 <210> 357 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 357 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctacca 57 <210> 358 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 358 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctacc 56 <210> 359 <211> 55 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 359 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctac 55 <210> 360 <211> 54 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 360 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tcta 54 <210> 361 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 361 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tct 53 <210> 362 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 362 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tc 52 <210> 363 <211> 51 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 363 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt t 51 <210> 364 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 364 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt 50 <210> 365 <211> 49 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 365 ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctg 49 <210> 366 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 366 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 aauccau 67 <210> 367 <211> 66 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 367 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 aaucca 66 <210> 368 <211> 65 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 368 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 aaucc 65 <210> 369 <211> 64 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 369 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 aauc 64 <210> 370 <211> 63 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 370 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 aau 63 <210> 371 <211> 62 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 371 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 aa 62 <210> 372 <211> 61 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 372 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 a 61 <210> 373 <211> 60 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 373 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60 <210> 374 <211> 59 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 374 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaag 59 <210> 375 <211> 58 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 375 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaa 58 <210> 376 <211> 57 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 376 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuacca 57 <210> 377 <211> 56 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 377 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuacc 56 <210> 378 <211> 55 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 378 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuac 55 <210> 379 <211> 54 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 379 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucua 54 <210> 380 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 380 ggggauuuag acuaccccaa aaacgaaggg gacuaaaaca agauugcugu ucuaccaagu 60 aauccau 67 <210> 381 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 381 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu acauugcugu ucuaccaagu 60 aauccau 67 <210> 382 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 382 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agaaugcugu ucuaccaagu 60 aauccau 67 <210> 383 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 383 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauuccugu ucuaccaagu 60 aauccau 67 <210> 384 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 384 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcagu ucuaccaagu 60 aauccau 67 <210> 385 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 385 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcuga ucuaccaagu 60 aauccau 67 <210> 386 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 386 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu uguaccaagu 60 aauccau 67 <210> 387 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 387 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuuccaagu 60 aauccau 67 <210> 388 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 388 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuacgaagu 60 aauccau 67 <210> 389 <211> 67 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 389 ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaugu 60 aauccau 67 <210> 390 <211> 176 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 390 gggggccagu gaauucgagc ucgguacccg gggauccucu agaaauaugg auuacuuggu 60 agaacagcaa ucuacucgac cugcaggcau gcaagcuugg cguaaucaug gucauagcug 120 uuuccugugu uuauccgcuc acaauuccac acaacauacg agccggaagc auaaag 176 <210> 391 <211> 176 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 391 gggggccagu gaauucgagc ucgguacccg gggauccucu agaaauaugg auuacuuggu 60 agaacagcaa uguacucgac cugcaggcau gcaagcuugg cguaaucaug gucauagcug 120 uuuccugugu uuauccgcuc acaauuccac acaacauacg agccggaagc auaaag 176 <210> 392 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic probe" <400> 392 ccgagaacaa cga 13 <210> 393 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 393 aagttctgtt tgccctgatc t 21 <210> 394 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 394 ggccacgatg ttgaagtct 19 <210> 395 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 395 ccaccccaat atcgaagggg actaaaac 28 <210> 396 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 396 gatttagact accccaaaaa cgaaggggac taaaac 36 <210> 397 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 397 gtaagagact acctctatat gaaagaggac taaaac 36 <210> 398 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 398 gtattgagaa aagccagata tagttggcaa tagac 35 <210> 399 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 399 gttgatgaga agagcccaag atagagggca ataac 35 <210> 400 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 400 gtctattgcc ctctatatcg ggctgttctc caaac 35 <210> 401 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 401 attaaagact acctctaaat gtaagaggac tataac 36 <210> 402 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 402 aatataaact acctctaaat gtaagaggac tataac 36 <210> 403 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 403 cttgtggatt atcccaaaat tgaagggaac tacaac 36 <210> 404 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 404 gatttagagt acctcaaaat agaagaggtc taaaac 36 <210> 405 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 405 gatttagagt acctcaaaac aaaagaggac taaaac 36 <210> 406 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 406 gatatagata accccaaaaa cgaagggatc taaaac 36 <210> 407 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 407 gcctcacatc accgccaaga cgacggcgga ctgaac 36 <210> 408 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 408 gcctcacatc accgccaaga cgacggcgga ctgaac 36 <210> 409 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 409 gcctcacatc accgccaaga cgacggcgga ctgaac 36 <210> 410 <211> 36 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 410 augggaguca aaguucuguu ugcccugauc ugcauc 36 <210> 411 <211> 36 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 411 auggaagcca augcccggaa agcuggcugc accagg 36 <210> 412 <211> 1152 <212> PRT <213> Leptotrichia wadei <400> 412 Met Lys Val Thr Lys Val Asp Gly Ile Ser His Lys Lys Tyr Ile Glu 1 5 10 15 Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Arg Thr Ser Glu 20 25 30 Arg Leu Ser Glu Leu Leu Ser Ile Arg Leu Asp Ile Tyr Ile Lys Asn 35 40 45 Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu 50 55 60 Lys Lys Phe Phe Ser Asn Lys Val Leu His Leu Lys Asp Ser Val Leu 65 70 75 80 Tyr Leu Lys Asn Arg Lys Glu Lys Asn Ala Val Gln Asp Lys Asn Tyr 85 90 95 Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Ser Phe 100 105 110 Ser Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Val Asn Ser Glu Glu 115 120 125 Leu Glu Ile Phe Arg Lys Asp Val Glu Ala Lys Leu Asn Lys Ile Asn 130 135 140 Ser Leu Lys Tyr Ser Phe Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile 145 150 155 160 Asn Glu Asn Asn Val Glu Lys Val Gly Gly Lys Ser Lys Arg Asn Ile 165 170 175 Ile Tyr Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asn Asp Tyr Ile Asn 180 185 190 Asn Val Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu 195 200 205 Lys Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys 210 215 220 Ile Arg Glu Tyr Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu 225 230 235 240 Asn Phe Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Ile 245 250 255 Lys Glu Leu Ile Glu Lys Ile Pro Asp Met Ser Glu Leu Lys Lys Ser 260 265 270 Gln Val Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys 275 280 285 Asn Ile Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln 290 295 300 Leu Leu Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp 305 310 315 320 Lys Ile Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu 325 330 335 Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys 340 345 350 Tyr Asn Tyr Tyr Leu Gln Val Gly Glu Ile Ala Thr Ser Asp Phe Ile 355 360 365 Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val 370 375 380 Ser Ser Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn 385 390 395 400 Glu Asn Gly Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn 405 410 415 Lys Gly Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn 420 425 430 Glu Asn Lys Gln Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser 435 440 445 Tyr Asp Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala 450 455 460 Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 465 470 475 480 Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala 485 490 495 Pro Ser Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys 500 505 510 Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe 515 520 525 Asn Tyr Tyr Glu Lys Asp Val Ile Ile Lys Tyr Leu Lys Asn Thr Lys 530 535 540 Phe Asn Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys 545 550 555 560 Leu Tyr Asn Lys Ile Glu Asp Leu Arg Asn Thr Leu Lys Phe Phe Trp 565 570 575 Ser Val Pro Lys Asp Lys Glu Glu Lys Asp Ala Gln Ile Tyr Leu Leu 580 585 590 Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Lys Phe Val Lys Asn Ser 595 600 605 Lys Val Phe Phe Lys Ile Thr Asn Glu Val Ile Lys Ile Asn Lys Gln 610 615 620 Arg Asn Gln Lys Thr Gly His Tyr Lys Tyr Gln Lys Phe Glu Asn Ile 625 630 635 640 Glu Lys Thr Val Pro Val Glu Tyr Leu Ala Ile Ile Gln Ser Arg Glu 645 650 655 Met Ile Asn Asn Gln Asp Lys Glu Glu Lys Asn Thr Tyr Ile Asp Phe 660 665 670 Ile Gln Gln Ile Phe Leu Lys Gly Phe Ile Asp Tyr Leu Asn Lys Asn 675 680 685 Asn Leu Lys Tyr Ile Glu Ser Asn Asn Asn Asn Asp Asn Asn Asp Ile 690 695 700 Phe Ser Lys Ile Lys Ile Lys Lys Asp Asn Lys Glu Lys Tyr Asp Lys 705 710 715 720 Ile Leu Lys Asn Tyr Glu Lys His Asn Arg Asn Lys Glu Ile Pro His 725 730 735 Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly Lys Ile Leu Lys 740 745 750 Tyr Thr Glu Asn Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu Leu Asn 755 760 765 His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr Gln Ser 770 775 780 Ala Asn Lys Glu Glu Thr Phe Ser Asp Glu Leu Glu Leu Ile Asn Leu 785 790 795 800 Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu Glu Ala 805 810 815 Asn Glu Ile Gly Lys Phe Leu Asp Phe Asn Glu Asn Lys Ile Lys Asp 820 825 830 Arg Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe Asp Gly 835 840 845 Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys Tyr Gly 850 855 860 Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Lys Tyr Lys Ile 865 870 875 880 Ser Leu Lys Glu Leu Lys Glu Tyr Ser Asn Lys Lys Asn Glu Ile Glu 885 890 895 Lys Asn Tyr Thr Met Gln Gln Asn Leu His Arg Lys Tyr Ala Arg Pro 900 905 910 Lys Lys Asp Glu Lys Phe Asn Asp Glu Asp Tyr Lys Glu Tyr Glu Lys 915 920 925 Ala Ile Gly Asn Ile Gln Lys Tyr Thr His Leu Lys Asn Lys Val Glu 930 935 940 Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Lys Ile Leu His 945 950 955 960 Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg 965 970 975 Leu Lys Gly Glu Phe Pro Glu Asn His Tyr Ile Glu Glu Ile Phe Asn 980 985 990 Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Ser Gly Gln Ile Val Glu 995 1000 1005 Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys Asp Asn Val Glu 1010 1015 1020 Lys Arg Ser Ile Tyr Ser Asp Lys Lys Val Lys Lys Leu Lys Gln 1025 1030 1035 Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn 1040 1045 1050 Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu Glu Asn 1055 1060 1065 Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala Ile 1070 1075 1080 Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr Gly Phe Val Ala 1085 1090 1095 Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Glu Ile Gln Thr Leu 1100 1105 1110 Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys Lys Lys 1115 1120 1125 Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Glu Leu Val Lys 1130 1135 1140 Val Met Phe Glu Tyr Lys Ala Leu Glu 1145 1150 <210> 413 <211> 40 <212> DNA <213> Leptotrichia wadei <400> 413 tctgtttgcc ctgatctgca tcgctgtggc cgaggccaag 40 <210> 414 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 414 actagacgta gcgacaccgg ctccggtt 28 <210> 415 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 415 gggactagac gtagcgacac cggctccg 28 <210> 416 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 416 aacgggacta gacgtagcga caccggct 28 <210> 417 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 417 caaacgggac tagacgtagc gacaccgg 28 <210> 418 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 418 agacaaacgg gactagacgt agcgacac 28 <210> 419 <211> 70 <212> RNA <213> Leptotrichia wadei <400> 419 uacccgggga uccucuagaa auauggauua cuugguagaa cagcaaucua cucgaccugc 60 aggcaugcaa 70 <210> 420 <211> 56 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 420 ccaccccaau aucgaagggg acuaaaacua gauugcuguu cuaccaagua auccau 56 <210> 421 <211> 65 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 421 gauuuagacu accccaaaaa cgaaggggac uaaaacuaga uugcuguucu accaaguaau 60 ccaua 65 <210> 422 <211> 24 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 422 uagauugcug uucuaccaag uaau 24 <210> 423 <211> 23 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 423 uagauugcug uucuaccaag uaa 23 <210> 424 <211> 10 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 424 uagauugcug 10 <210> 425 <211> 1197 <212> PRT <213> Leptotrichia wadei <400> 425 Met Lys Val Thr Lys Ile Asp Gly Leu Ser His Lys Lys Phe Glu Asp 1 5 10 15 Glu Gly Lys Leu Val Lys Phe Arg Asn Asn Lys Asn Ile Asn Glu Ile 20 25 30 Lys Glu Arg Leu Lys Lys Leu Lys Glu Leu Lys Leu Asp Asn Tyr Ile 35 40 45 Lys Asn Pro Glu Asn Val Lys Asn Lys Asp Lys Asp Ala Glu Lys Glu 50 55 60 Thr Lys Ile Arg Arg Thr Asn Leu Lys Lys Tyr Phe Ser Glu Ile Ile 65 70 75 80 Leu Arg Lys Glu Asp Glu Lys Tyr Ile Leu Lys Lys Thr Lys Lys Phe 85 90 95 Lys Asp Ile Asn Gln Glu Ile Asp Tyr Tyr Asp Val Lys Ser Lys Lys 100 105 110 Asn Gln Gln Glu Ile Phe Asp Val Leu Lys Glu Ile Leu Glu Leu Lys 115 120 125 Ile Lys Glu Thr Glu Lys Glu Glu Ile Ile Thr Phe Asp Ser Glu Lys 130 135 140 Leu Lys Lys Val Phe Gly Glu Asp Phe Val Lys Lys Glu Ala Lys Ile 145 150 155 160 Lys Ala Ile Glu Lys Ser Leu Lys Ile Asn Lys Ala Asn Tyr Lys Lys 165 170 175 Asp Ser Ile Lys Ile Gly Asp Asp Lys Tyr Ser Asn Val Lys Gly Glu 180 185 190 Asn Lys Arg Ser Arg Ile Tyr Glu Tyr Tyr Lys Lys Ser Glu Asn Leu 195 200 205 Lys Lys Phe Glu Glu Asn Ile Arg Glu Ala Phe Glu Lys Leu Tyr Thr 210 215 220 Glu Glu Asn Ile Lys Glu Leu Tyr Ser Lys Ile Glu Glu Ile Leu Lys 225 230 235 240 Lys Thr His Leu Lys Ser Ile Val Arg Glu Phe Tyr Gln Asn Glu Ile 245 250 255 Ile Gly Glu Ser Glu Phe Ser Lys Lys Asn Gly Asp Gly Ile Ser Ile 260 265 270 Leu Tyr Asn Gln Ile Lys Asp Ser Ile Lys Lys Glu Glu Asn Phe Ile 275 280 285 Glu Phe Ile Glu Asn Thr Gly Asn Leu Glu Leu Lys Glu Leu Thr Lys 290 295 300 Ser Gln Ile Phe Tyr Lys Tyr Phe Leu Glu Asn Glu Glu Leu Asn Asp 305 310 315 320 Glu Asn Ile Lys Phe Ala Phe Cys Tyr Phe Val Glu Ile Glu Val Asn 325 330 335 Asn Leu Leu Lys Glu Asn Val Tyr Lys Ile Lys Arg Phe Asn Glu Ser 340 345 350 Asn Lys Lys Arg Ile Glu Asn Ile Phe Glu Tyr Gly Lys Leu Lys Lys 355 360 365 Leu Ile Val Tyr Lys Leu Glu Asn Lys Leu Asn Asn Tyr Val Arg Asn 370 375 380 Cys Gly Lys Tyr Asn Tyr His Met Glu Asn Gly Asp Ile Ala Thr Ser 385 390 395 400 Asp Ile Asn Met Arg Asn Arg Gln Thr Glu Ala Phe Leu Arg Ser Ile 405 410 415 Ile Gly Val Ser Ser Phe Gly Tyr Phe Ser Leu Arg Asn Ile Leu Gly 420 425 430 Val Asn Asp Asp Asp Phe Tyr Glu Thr Glu Glu Asp Leu Thr Lys Lys 435 440 445 Glu Arg Arg Asn Leu Glu Lys Ala Lys Glu Asp Ile Thr Ile Lys Asn 450 455 460 Thr Phe Asp Glu Val Val Val Lys Ser Phe Gln Lys Lys Gly Ile Tyr 465 470 475 480 Asn Ile Lys Glu Asn Leu Lys Met Phe Tyr Gly Asp Ser Phe Asp Asn 485 490 495 Ala Asp Lys Asp Glu Leu Lys Gln Phe Phe Val Asn Met Leu Asn Ala 500 505 510 Ile Thr Ser Ile Arg His Arg Val Val His Tyr Asn Met Asn Thr Asn 515 520 525 Ser Glu Asn Ile Phe Asn Phe Ser Gly Ile Glu Val Ser Lys Leu Leu 530 535 540 Lys Ser Ile Phe Glu Lys Glu Thr Asp Lys Arg Glu Leu Lys Leu Lys 545 550 555 560 Ile Phe Arg Gln Leu Asn Ser Ala Gly Val Phe Asp Tyr Trp Glu Asn 565 570 575 Arg Lys Ile Asp Lys Tyr Leu Glu Asn Ile Glu Phe Lys Phe Val Asn 580 585 590 Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys Leu Tyr Asn Arg Ile 595 600 605 Asp Asn Leu Lys Gly Asn Asn Ala Leu Asn Leu Gly Tyr Ile Asn Ile 610 615 620 Pro Lys Arg Lys Glu Ala Arg Asp Ser Gln Ile Tyr Leu Leu Lys Asn 625 630 635 640 Ile Tyr Tyr Gly Glu Phe Val Glu Lys Phe Val Asn Asn Asn Asp Asn 645 650 655 Phe Glu Lys Ile Phe Arg Glu Ile Ile Glu Ile Asn Lys Lys Asp Gly 660 665 670 Thr Asn Thr Lys Thr Lys Phe Tyr Lys Leu Glu Lys Phe Glu Thr Leu 675 680 685 Lys Ala Asn Ala Pro Ile Glu Tyr Leu Glu Lys Leu Gln Ser Leu His 690 695 700 Gln Ile Asn Tyr Asn Arg Glu Lys Val Glu Glu Asp Lys Asp Ile Tyr 705 710 715 720 Val Asp Phe Val Gln Lys Ile Phe Leu Lys Gly Phe Ile Asn Tyr Leu 725 730 735 Gln Gly Ser Asp Leu Leu Lys Ser Leu Asn Leu Leu Asn Leu Lys Lys 740 745 750 Asp Glu Ala Ile Ala Asn Lys Lys Ser Phe Tyr Asp Glu Lys Leu Lys 755 760 765 Leu Trp Gln Asn Asn Gly Ser Asn Leu Ser Lys Met Pro Glu Glu Ile 770 775 780 Tyr Asp Tyr Ile Lys Lys Ile Lys Ile Asn Lys Ile Asn Tyr Ser Asp 785 790 795 800 Arg Met Ser Ile Phe Tyr Leu Leu Leu Lys Leu Ile Asp His Lys Glu 805 810 815 Leu Thr Asn Leu Arg Gly Asn Leu Glu Lys Tyr Val Ser Met Asn Lys 820 825 830 Asn Lys Ile Tyr Ser Glu Glu Leu Asn Ile Val Asn Leu Val Ser Leu 835 840 845 Asp Asn Asn Lys Val Arg Ala Asn Phe Asn Leu Lys Pro Glu Asp Ile 850 855 860 Gly Lys Phe Leu Lys Thr Glu Thr Ser Ile Arg Asn Ile Asn Gln Leu 865 870 875 880 Asn Asn Phe Ser Glu Ile Phe Ala Asp Gly Glu Asn Val Ile Lys His 885 890 895 Arg Ser Phe Tyr Asn Ile Lys Lys Tyr Gly Ile Leu Asp Leu Leu Glu 900 905 910 Lys Ile Val Asp Lys Ala Asp Leu Lys Ile Thr Lys Glu Glu Ile Lys 915 920 925 Lys Tyr Glu Asn Leu Gln Asn Glu Leu Lys Arg Asn Asp Phe Tyr Lys 930 935 940 Ile Gln Glu Arg Ile His Arg Asn Tyr Asn Gln Lys Pro Phe Leu Ile 945 950 955 960 Lys Asn Asn Glu Lys Asp Phe Asn Asp Tyr Lys Lys Ala Ile Glu Asn 965 970 975 Ile Gln Asn Tyr Thr Gln Leu Lys Asn Lys Ile Glu Phe Asn Asp Leu 980 985 990 Asn Leu Leu Gln Ser Leu Leu Phe Arg Ile Leu His Arg Leu Ala Gly 995 1000 1005 Tyr Thr Ser Leu Trp Glu Arg Asp Leu Gln Phe Lys Leu Lys Gly 1010 1015 1020 Glu Tyr Pro Glu Asn Lys Tyr Ile Asp Glu Ile Phe Asn Phe Asp 1025 1030 1035 Asn Ser Lys Asn Lys Ile Tyr Asn Glu Lys Asn Glu Arg Gly Gly 1040 1045 1050 Ser Val Val Ser Lys Tyr Gly Tyr Phe Leu Val Glu Lys Asp Gly 1055 1060 1065 Glu Ile Gln Arg Lys Asn Ala Arg Asp Lys Lys Lys Asn Lys Ile 1070 1075 1080 Ile Lys Lys Glu Gly Leu Glu Ile Arg Asn Tyr Ile Ala His Phe 1085 1090 1095 Asn Tyr Ile Pro Asp Ala Thr Lys Ser Ile Leu Glu Ile Leu Glu 1100 1105 1110 Glu Leu Arg Asn Leu Leu Lys Tyr Asp Arg Lys Leu Lys Asn Ala 1115 1120 1125 Val Met Lys Ser Ile Lys Asp Ile Phe Lys Glu Tyr Gly Leu Ile 1130 1135 1140 Ile Glu Phe Lys Ile Ser His Val Asn Asn Ser Glu Lys Ile Glu 1145 1150 1155 Val Leu Asn Val Asp Ser Glu Lys Ile Lys His Leu Lys Asn Asn 1160 1165 1170 Gly Leu Val Thr Thr Arg Asn Ser Glu Asp Leu Cys Glu Leu Ile 1175 1180 1185 Lys Met Met Leu Glu Tyr Lys Lys Ser 1190 1195 <210> 426 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 426 gtgcagccag ctttccgggc attggctt 28 <210> 427 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 427 ctgctgccag ctttccgggc attggctt 28 <210> 428 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 428 ctgcagcctg ctttccgggc attggctt 28 <210> 429 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 429 ctgcagccag ctatccgggc attggctt 28 <210> 430 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 430 ctgcagccag ctttcccggc attggctt 28 <210> 431 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 431 gtggagcgag ctttccgggc attggctt 28 <210> 432 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 432 gtggagccag cattccgggc attggctt 28 <210> 433 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 433 gtggagccag ctttcggggc attggctt 28 <210> 434 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 434 gtggagccag ctttccgggg attggctt 28 <210> 435 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 435 gtgcaggcag gtttccgggc attggctt 28 <210> 436 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 436 gtgcaggcag ctttgcgggc attggctt 28 <210> 437 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 437 gtgcaggcag ctttccggcc attggctt 28 <210> 438 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 438 gtgcaggcag ctttccgggc ataggctt 28 <210> 439 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 439 gtgcagccac cttaccgggc attggctt 28 <210> 440 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 440 gtgcagccac ctttccgcgc attggctt 28 <210> 441 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 441 gtgcagccac ctttccgggc aatggctt 28 <210> 442 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 442 gtgcagccac ctttccgggc attgggtt 28 <210> 443 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 443 gtgcagccag ctatcccggc attggctt 28 <210> 444 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 444 gtgcagccag ctatccgggc tttggctt 28 <210> 445 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 445 gtgcagccag ctatccgggc attgcctt 28 <210> 446 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 446 gtgcagccag ctttcggggg attggctt 28 <210> 447 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 447 gtgcagccag ctttcggggc attcgctt 28 <210> 448 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 448 gtgcagccag ctttcggggc attggcta 28 <210> 449 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 449 gtgcagccag ctttccggcc ataggctt 28 <210> 450 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 450 gtgcagccag ctttccggcc attggcat 28 <210> 451 <211> 16 <212> PRT <213> Lactococcus lactis <400> 451 Leu Gln Lys Phe Thr Gly Asp Ile Glu Asn Leu Val Lys Ala Ser Leu 1 5 10 15 <210> 452 <211> 15 <212> PRT <213> Lactococcus lactis <400> 452 Trp Ile Arg Ala Gly Trp Phe Ile Arg Asn Arg Ser Ala His Tyr 1 5 10 15 <210> 453 <211> 16 <212> PRT <213> Lactococcus lactis <400> 453 Leu Gln Lys Phe Thr Gly Asp Ile Glu Asn Leu Val Lys Ala Ser Leu 1 5 10 15 <210> 454 <211> 15 <212> PRT <213> Lactococcus lactis <400> 454 Trp Ile Arg Ala Gly Trp Phe Ile Arg Asn Arg Ser Ala His Tyr 1 5 10 15 <210> 455 <211> 16 <212> PRT <213> Thermus aquaticus <400> 455 Pro Leu Glu Glu Arg Gly Val Ala Glu Ala Trp Leu Asn Ala Lys Val 1 5 10 15 <210> 456 <211> 10 <212> PRT <213> Thermus aquaticus <400> 456 Ala Asp Leu Arg Asn Asp Val Ala His Ala 1 5 10 <210> 457 <211> 16 <212> PRT <213> Thermus aquaticus <400> 457 Pro Leu Glu Glu Arg Gly Val Ala Glu Ala Trp Leu Asn Ala Lys Val 1 5 10 15 <210> 458 <211> 10 <212> PRT <213> Thermus aquaticus <400> 458 Ala Asp Leu Arg Asn Asp Val Ala His Ala 1 5 10 <210> 459 <211> 16 <212> PRT <213> Mycobacterium tuberculosis <400> 459 Arg Ser Ala Thr Pro Ala Ile Thr Ile Val Leu Arg Ala Ala Val Ala 1 5 10 15 <210> 460 <211> 15 <212> PRT <213> Mycobacterium tuberculosis <400> 460 Leu Gly Arg Phe Glu Ser Arg Val Arg Asn Thr Ala Ala His Glu 1 5 10 15 <210> 461 <211> 16 <212> PRT <213> Mycobacterium tuberculosis <400> 461 Arg Ser Ala Thr Pro Ala Ile Thr Ile Val Leu Arg Ala Ala Val Ala 1 5 10 15 <210> 462 <211> 15 <212> PRT <213> Mycobacterium tuberculosis <400> 462 Leu Gly Arg Phe Glu Ser Arg Val Arg Asn Thr Ala Ala His Glu 1 5 10 15 <210> 463 <211> 16 <212> PRT <213> Escherichia coli <400> 463 Leu Tyr Pro Glu Leu Arg Thr Ile Glu Gly Val Leu Lys Ser Lys Met 1 5 10 15 <210> 464 <211> 14 <212> PRT <213> Escherichia coli <400> 464 Ala Tyr Thr Phe Phe Asn Val Glu Arg His Ser Leu Phe His 1 5 10 <210> 465 <211> 16 <212> PRT <213> Escherichia coli <400> 465 Leu Tyr Pro Glu Leu Arg Thr Ile Glu Gly Val Leu Lys Ser Lys Met 1 5 10 15 <210> 466 <211> 14 <212> PRT <213> Escherichia coli <400> 466 Ala Tyr Thr Phe Phe Asn Val Glu Arg His Ser Leu Phe His 1 5 10 <210> 467 <211> 16 <212> PRT <213> Homo sapiens <400> 467 Gly Asn Glu Leu Pro Leu Ala Val Ala Ser Thr Ala Asp Leu Ile Arg 1 5 10 15 <210> 468 <211> 15 <212> PRT <213> Homo sapiens <400> 468 Ile Pro Asp Trp Ile Val Asp Leu Arg His Glu Leu Thr His Lys 1 5 10 15 <210> 469 <211> 16 <212> PRT <213> Homo sapiens <400> 469 Gly Asn Glu Leu Pro Leu Ala Val Ala Ser Thr Ala Asp Leu Ile Arg 1 5 10 15 <210> 470 <211> 15 <212> PRT <213> Homo sapiens <400> 470 Ile Pro Asp Trp Ile Val Asp Leu Arg His Glu Leu Thr His Lys 1 5 10 15 <210> 471 <211> 16 <212> PRT <213> Thermus thermophilus <400> 471 Ile Gln Arg Phe Glu Tyr Thr Phe Glu Ala Phe Trp Lys Ala Leu Gln 1 5 10 15 <210> 472 <211> 15 <212> PRT <213> Thermus thermophilus <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 472 Leu Ala Leu Gly Xaa Val Asp Asp Arg Ser Leu Thr Val His Thr 1 5 10 15 <210> 473 <211> 16 <212> PRT <213> Thermus thermophilus <400> 473 Ile Gln Arg Phe Glu Tyr Thr Phe Glu Ala Phe Trp Lys Ala Leu Gln 1 5 10 15 <210> 474 <211> 15 <212> PRT <213> Thermus thermophilus <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 474 Leu Ala Leu Gly Xaa Val Asp Asp Arg Ser Leu Thr Val His Thr 1 5 10 15 <210> 475 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 475 Asp Tyr Glu Ile Ile Lys Ala Glu Glu Ser Leu Gln Arg Asp Ile Ser 1 5 10 15 <210> 476 <211> 15 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 476 Leu Lys Ser Met Leu Tyr Ser Met Arg Asn Ser Ser Phe His Phe 1 5 10 15 <210> 477 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 477 Leu Ile Lys Trp Cys Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln 1 5 10 15 <210> 478 <211> 14 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 478 Phe Arg Asn Glu Ile Asp His Phe His Tyr Phe Tyr Asp Arg 1 5 10 <210> 479 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 479 Asp Tyr Glu Leu Ile Lys Ala Glu Glu Met Leu Gln Arg Glu Thr Ala 1 5 10 15 <210> 480 <211> 15 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 480 Leu Lys Asp Val Ile Tyr Ser Met Arg Asn Asp Ser Phe His Tyr 1 5 10 15 <210> 481 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 481 Leu Ile Asn Trp Ile Tyr Leu Arg Glu Arg Asp Leu Met Asn Phe Gln 1 5 10 15 <210> 482 <211> 14 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 482 Leu Arg Asn Tyr Ile Glu His Phe Arg Tyr Tyr Ser Ser Phe 1 5 10 <210> 483 <211> 16 <212> PRT <213> Clostridium aminophilum <400> 483 Asp Tyr Glu Gln Ile Arg Ala Asp Glu Thr Leu Gln Arg Gln Leu Ser 1 5 10 15 <210> 484 <211> 15 <212> PRT <213> Clostridium aminophilum <400> 484 Leu Arg Lys Ala Ile Tyr Ser Leu Arg Asn Glu Thr Phe His Phe 1 5 10 15 <210> 485 <211> 16 <212> PRT <213> Clostridium aminophilum <400> 485 Leu Ile Ser Trp Ser Phe Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln 1 5 10 15 <210> 486 <211> 14 <212> PRT <213> Clostridium aminophilum <400> 486 Val Arg Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Thr Ser 1 5 10 <210> 487 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 487 Asp Tyr Glu Gln Ile Lys Ala Asp Glu Met Leu Gln Arg Glu Val Ala 1 5 10 15 <210> 488 <211> 15 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 488 Ile Ile Gln Ile Ile Tyr Ser Leu Arg Asn Lys Ser Phe His Phe 1 5 10 15 <210> 489 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 489 Leu Ile Ser Trp Ser Tyr Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln 1 5 10 15 <210> 490 <211> 14 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium sequence" <400> 490 Leu Arg Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Tyr Gly 1 5 10 <210> 491 <211> 16 <212> PRT <213> Carnobacterium gallinarum <400> 491 Lys Leu Gln Glu Ile Gly Ile Tyr Glu Gly Phe Gln Thr Lys Phe Met 1 5 10 15 <210> 492 <211> 15 <212> PRT <213> Carnobacterium gallinarum <400> 492 Leu Arg Gly Ser Val Gln Gln Ile Arg Asn Glu Ile Phe His Ser 1 5 10 15 <210> 493 <211> 16 <212> PRT <213> Carnobacterium gallinarum <400> 493 Met Val Gly Phe Ser Ala Leu Phe Glu Arg Asp Leu Val Tyr Phe Ser 1 5 10 15 <210> 494 <211> 14 <212> PRT <213> Carnobacterium gallinarum <400> 494 Ile Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu 1 5 10 <210> 495 <211> 16 <212> PRT <213> Carnobacterium gallinarum <400> 495 Thr Leu Gln Glu Ile Gly Met Tyr Glu Gly Thr Gln Thr Lys Phe Met 1 5 10 15 <210> 496 <211> 15 <212> PRT <213> Carnobacterium gallinarum <400> 496 Ile Arg Gly Ala Val Gln Arg Val Arg Asn Gln Ile Phe His Gln 1 5 10 15 <210> 497 <211> 16 <212> PRT <213> Carnobacterium gallinarum <400> 497 Met Val Gly Phe Ser Val Leu Phe Glu Arg Asp Phe Val Tyr Met Gly 1 5 10 15 <210> 498 <211> 14 <212> PRT <213> Carnobacterium gallinarum <400> 498 Ile Arg Asn Asn Ile Ala His Leu His Val Leu Arg Asn Asp 1 5 10 <210> 499 <211> 16 <212> PRT <213> Paludibacter propionicigenes <400> 499 Asp Leu Ile Arg Ile Lys Thr Asn Glu Ala Phe Val Leu Asn Leu Thr 1 5 10 15 <210> 500 <211> 15 <212> PRT <213> Paludibacter propionicigenes <400> 500 Ile Arg Gly Ala Val Gln Gln Ile Arg Asn Asn Val Asn His Tyr 1 5 10 15 <210> 501 <211> 16 <212> PRT <213> Paludibacter propionicigenes <400> 501 Met Ala Gly Phe Val Ala Leu Phe Asp Arg Asp Phe Gln Phe Phe Asp 1 5 10 15 <210> 502 <211> 14 <212> PRT <213> Paludibacter propionicigenes <400> 502 Ile Arg Asn His Ile Ala His Phe Asn Tyr Leu Thr Lys Asp 1 5 10 <210> 503 <211> 16 <212> PRT <213> Listeria seeligeri <400> 503 Ser Leu Gln Lys Ile Lys Ile Glu Glu Ala Phe Ala Leu Lys Phe Ile 1 5 10 15 <210> 504 <211> 15 <212> PRT <213> Listeria seeligeri <400> 504 Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile Ile His Leu 1 5 10 15 <210> 505 <211> 16 <212> PRT <213> Listeria seeligeri <400> 505 Leu Ala Gly Tyr Met Ser Ile Ala Asp Arg Asp Phe Gln Phe Ser Ser 1 5 10 15 <210> 506 <211> 14 <212> PRT <213> Listeria seeligeri <400> 506 Lys Arg Asn Asn Ile Ser His Phe Asn Tyr Leu Asn Gly Gln 1 5 10 <210> 507 <211> 16 <212> PRT <213> Listeria weihenstephanensis <400> 507 Asp Leu Gln Asp Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile 1 5 10 15 <210> 508 <211> 15 <212> PRT <213> Listeria weihenstephanensis <400> 508 Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys 1 5 10 15 <210> 509 <211> 16 <212> PRT <213> Listeria weihenstephanensis <400> 509 Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe Gln Cys Met Ala 1 5 10 15 <210> 510 <211> 14 <212> PRT <213> Listeria weihenstephanensis <400> 510 Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys 1 5 10 <210> 511 <211> 16 <212> PRT <213> Listeria newyorkensis <400> 511 Asp Leu Gln Asp Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile 1 5 10 15 <210> 512 <211> 15 <212> PRT <213> Listeria newyorkensis <400> 512 Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys 1 5 10 15 <210> 513 <211> 16 <212> PRT <213> Listeria newyorkensis <400> 513 Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe Gln Cys Met Ala 1 5 10 15 <210> 514 <211> 14 <212> PRT <213> Listeria newyorkensis <400> 514 Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys 1 5 10 <210> 515 <211> 16 <212> PRT <213> Leptotrichia wadei <400> 515 Asp Leu Glu Tyr Ile Lys Thr Lys Glu Thr Leu Ile Arg Lys Met Ala 1 5 10 15 <210> 516 <211> 15 <212> PRT <213> Leptotrichia wadei <400> 516 Ile Ser Tyr Ser Ile Tyr Asn Val Arg Asn Gly Val Gly His Phe 1 5 10 15 <210> 517 <211> 16 <212> PRT <213> Leptotrichia wadei <400> 517 Asn Val Ala Phe Phe Asn Lys Trp Glu Arg Asp Phe Lys Phe Ile Val 1 5 10 15 <210> 518 <211> 14 <212> PRT <213> Leptotrichia wadei <400> 518 Phe Arg Asn Tyr Ile Ala His Phe Leu His Leu His Thr Lys 1 5 10 <210> 519 <211> 16 <212> PRT <213> Leptotrichia wadei <400> 519 Ile Asn Met Arg Asn Arg Gln Thr Glu Ala Phe Leu Arg Ser Ile Ile 1 5 10 15 <210> 520 <211> 15 <212> PRT <213> Leptotrichia wadei <400> 520 Met Leu Asn Ala Ile Thr Ser Ile Arg His Arg Val Val His Tyr 1 5 10 15 <210> 521 <211> 16 <212> PRT <213> Leptotrichia wadei <400> 521 Leu Ala Gly Tyr Thr Ser Leu Trp Glu Arg Asp Leu Gln Phe Lys Leu 1 5 10 15 <210> 522 <211> 14 <212> PRT <213> Leptotrichia wadei <400> 522 Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro Asp Ala 1 5 10 <210> 523 <211> 16 <212> PRT <213> Leptotrichia wadei <400> 523 Phe Ile Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile 1 5 10 15 <210> 524 <211> 15 <212> PRT <213> Leptotrichia wadei <400> 524 Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 1 5 10 15 <210> 525 <211> 16 <212> PRT <213> Leptotrichia wadei <400> 525 Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg Leu 1 5 10 15 <210> 526 <211> 14 <212> PRT <213> Leptotrichia wadei <400> 526 Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala 1 5 10 <210> 527 <211> 16 <212> PRT <213> Rhodobacter capsulatus <400> 527 Gly Gln Thr Glu Ile Lys Glu Ser Glu Ile Phe Val Arg Leu Trp Val 1 5 10 15 <210> 528 <211> 15 <212> PRT <213> Rhodobacter capsulatus <400> 528 Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe His Leu 1 5 10 15 <210> 529 <211> 16 <212> PRT <213> Rhodobacter capsulatus <400> 529 Leu Ile Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu 1 5 10 15 <210> 530 <211> 14 <212> PRT <213> Rhodobacter capsulatus <400> 530 Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala 1 5 10 <210> 531 <211> 16 <212> PRT <213> Leptotrichia buccalis <400> 531 Phe Ile Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile 1 5 10 15 <210> 532 <211> 15 <212> PRT <213> Leptotrichia buccalis <400> 532 Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 1 5 10 15 <210> 533 <211> 16 <212> PRT <213> Leptotrichia buccalis <400> 533 Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg Leu 1 5 10 15 <210> 534 <211> 14 <212> PRT <213> Leptotrichia buccalis <400> 534 Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala 1 5 10 <210> 535 <211> 16 <212> PRT <213> Leptotrichia sp. <400> 535 Phe Ile Val Gly Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile 1 5 10 15 <210> 536 <211> 15 <212> PRT <213> Leptotrichia sp. <400> 536 Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe 1 5 10 15 <210> 537 <211> 16 <212> PRT <213> Leptotrichia sp. <400> 537 Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg Leu 1 5 10 15 <210> 538 <211> 14 <212> PRT <213> Leptotrichia sp. <400> 538 Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro Asn Ala 1 5 10 <210> 539 <211> 16 <212> PRT <213> Leptotrichia sp. <400> 539 Asp Phe Ser Arg Leu His Ala Lys Glu Glu Leu Asp Leu Glu Leu Ile 1 5 10 15 <210> 540 <211> 15 <212> PRT <213> Leptotrichia sp. <400> 540 Phe Gln Lys Glu Gly Tyr Leu Leu Arg Asn Lys Ile Leu His Asn 1 5 10 15 <210> 541 <211> 16 <212> PRT <213> Leptotrichia sp. <400> 541 Leu Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val 1 5 10 15 <210> 542 <211> 14 <212> PRT <213> Leptotrichia sp. <400> 542 Ile Arg Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro 1 5 10 <210> 543 <211> 16 <212> PRT <213> Leptotrichia shahii <400> 543 Asp Phe Ser Arg Leu His Ala Lys Glu Glu Leu Asp Leu Glu Leu Ile 1 5 10 15 <210> 544 <211> 15 <212> PRT <213> Leptotrichia shahii <400> 544 Phe Thr Lys Ile Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala 1 5 10 15 <210> 545 <211> 16 <212> PRT <213> Leptotrichia shahii <400> 545 Leu Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val 1 5 10 15 <210> 546 <211> 14 <212> PRT <213> Leptotrichia shahii <400> 546 Ile Arg Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro 1 5 10 <210> 547 <211> 18 <212> PRT <213> Leptotrichia shahii <400> 547 Ile Arg Lys Phe Thr Lys Ile Gly Thr Asn Glu Arg Asn Arg Ile Leu 1 5 10 15 His Ala <210> 548 <211> 15 <212> PRT <213> Leptotrichia shahii <400> 548 Ser Ile Arg Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro 1 5 10 15 <210> 549 <211> 18 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium" <400> 549 Leu Tyr Ser Leu Lys Ser Met Leu Tyr Ser Met Arg Asn Ser Ser Phe 1 5 10 15 His Phe <210> 550 <211> 15 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium" <400> 550 Ile Phe Arg Asn Glu Ile Asp His Phe His Tyr Phe Tyr Asp Arg 1 5 10 15 <210> 551 <211> 18 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium" <400> 551 Leu Thr Asp Leu Lys Asp Val Ile Tyr Ser Met Arg Asn Asp Ser Phe 1 5 10 15 His Tyr <210> 552 <211> 15 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium" <400> 552 Glu Leu Arg Asn Tyr Ile Glu His Phe Arg Tyr Tyr Ser Ser Phe 1 5 10 15 <210> 553 <211> 18 <212> PRT <213> Clostridium aminophilum <400> 553 Ala Asp Asp Leu Arg Lys Ala Ile Tyr Ser Leu Arg Asn Glu Thr Phe 1 5 10 15 His Phe <210> 554 <211> 15 <212> PRT <213> Clostridium aminophilum <400> 554 Asp Val Arg Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Thr Ser 1 5 10 15 <210> 555 <211> 18 <212> PRT <213> Camobacterium gallinarum <400> 555 Ile Trp Ala Leu Arg Gly Ser Val Gln Gln Ile Arg Asn Glu Ile Phe 1 5 10 15 His Ser <210> 556 <211> 15 <212> PRT <213> Camobacterium gallinarum <400> 556 Lys Ile Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu 1 5 10 15 <210> 557 <211> 18 <212> PRT <213> Camobacterium gallinarum <400> 557 Leu Trp Ala Ile Arg Gly Ala Val Gln Arg Val Arg Asn Gln Ile Phe 1 5 10 15 His Gln <210> 558 <211> 15 <212> PRT <213> Camobacterium gallinarum <400> 558 Glu Ile Arg Asn Asn Ile Ala His Leu His Val Leu Arg Asn Asp 1 5 10 15 <210> 559 <211> 18 <212> PRT <213> Paludibacter propionicigenes <400> 559 Leu Trp Gly Ile Arg Gly Ala Val Gln Gln Ile Arg Asn Asn Val Asn 1 5 10 15 His Tyr <210> 560 <211> 15 <212> PRT <213> Paludibacter propionicigenes <400> 560 Asp Ile Arg Asn His Ile Ala His Phe Asn Tyr Leu Thr Lys Asp 1 5 10 15 <210> 561 <211> 18 <212> PRT <213> Listeria weihenstephanensis <400> 561 Ile Trp Ala Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr 1 5 10 15 His Cys <210> 562 <211> 15 <212> PRT <213> Listeria weihenstephanensis <400> 562 Asn Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys 1 5 10 15 <210> 563 <211> 18 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium" <400> 563 Ile Trp Ala Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr 1 5 10 15 His Cys <210> 564 <211> 15 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Lachnospiraceae bacterium" <400> 564 Asn Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys 1 5 10 15 <210> 565 <211> 18 <212> PRT <213> Leptotrichia wadei <400> 565 Phe Ala Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val 1 5 10 15 His Phe <210> 566 <211> 15 <212> PRT <213> Leptotrichia wadei <400> 566 Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala 1 5 10 15 <210> 567 <211> 18 <212> PRT <213> Rhodobacter capsulatus <400> 567 Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe 1 5 10 15 His Leu <210> 568 <211> 15 <212> PRT <213> Rhodobacter capsulatus <400> 568 Gln Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala 1 5 10 15 <210> 569 <211> 18 <212> PRT <213> Rhodobacter capsulatus <400> 569 Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe 1 5 10 15 His Leu <210> 570 <211> 15 <212> PRT <213> Rhodobacter capsulatus <400> 570 Gln Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala 1 5 10 15 <210> 571 <211> 18 <212> PRT <213> Rhodobacter capsulatus <400> 571 Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe 1 5 10 15 His Leu <210> 572 <211> 15 <212> PRT <213> Rhodobacter capsulatus <400> 572 Gln Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala 1 5 10 15 <210> 573 <211> 18 <212> PRT <213> Leptotrichia wadei <400> 573 Phe Ala Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val 1 5 10 15 His Phe <210> 574 <211> 15 <212> PRT <213> Leptotrichia wadei <400> 574 Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala 1 5 10 15 <210> 575 <211> 18 <212> PRT <213> Listeria seeligeri <400> 575 Ser Trp Gly Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile Ile 1 5 10 15 His Leu <210> 576 <211> 15 <212> PRT <213> Listeria seeligeri <400> 576 Glu Lys Arg Asn Asn Ile Ser His Phe Asn Tyr Leu Asn Gly Gln 1 5 10 15 <210> 577 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 6xHis tag" <400> 577 His His His His His His 1 5

Claims (1)

  1. 본원 발명의 설명에 기재된 모든 발명.
KR1020237037115A 2016-06-17 2017-06-19 제vi형 crispr 오솔로그 및 시스템 KR20230156150A (ko)

Applications Claiming Priority (16)

Application Number Priority Date Filing Date Title
US201662351662P 2016-06-17 2016-06-17
US201662351803P 2016-06-17 2016-06-17
US62/351,662 2016-06-17
US62/351,803 2016-06-17
US201662376377P 2016-08-17 2016-08-17
US62/376,377 2016-08-17
US201662410366P 2016-10-19 2016-10-19
US62/410,366 2016-10-19
US201662432240P 2016-12-09 2016-12-09
US62/432,240 2016-12-09
US201762471792P 2017-03-15 2017-03-15
US62/471,792 2017-03-15
US201762484786P 2017-04-12 2017-04-12
US62/484,786 2017-04-12
KR1020197001527A KR20190019168A (ko) 2016-06-17 2017-06-19 제vi형 crispr 오솔로그 및 시스템
PCT/US2017/038154 WO2017219027A1 (en) 2016-06-17 2017-06-19 Type vi crispr orthologs and systems

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020197001527A Division KR20190019168A (ko) 2016-06-17 2017-06-19 제vi형 crispr 오솔로그 및 시스템

Publications (1)

Publication Number Publication Date
KR20230156150A true KR20230156150A (ko) 2023-11-13

Family

ID=59295312

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020237037115A KR20230156150A (ko) 2016-06-17 2017-06-19 제vi형 crispr 오솔로그 및 시스템
KR1020197001527A KR20190019168A (ko) 2016-06-17 2017-06-19 제vi형 crispr 오솔로그 및 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020197001527A KR20190019168A (ko) 2016-06-17 2017-06-19 제vi형 crispr 오솔로그 및 시스템

Country Status (9)

Country Link
US (3) US11788083B2 (ko)
EP (1) EP3455357A1 (ko)
JP (3) JP7267013B2 (ko)
KR (2) KR20230156150A (ko)
CN (1) CN109642231A (ko)
AU (4) AU2017283713B2 (ko)
BR (1) BR112018076190A2 (ko)
CA (1) CA3028158A1 (ko)
WO (1) WO2017219027A1 (ko)

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2510488B (en) 2011-06-23 2020-04-08 Univ Texas Identifying peptides at the single molecule level
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EP3543703A1 (en) 2014-09-15 2019-09-25 Board of Regents, The University of Texas System Improved single molecule peptide sequencing
AU2015342749B2 (en) 2014-11-07 2022-01-27 Editas Medicine, Inc. Methods for improving CRISPR/Cas-mediated genome-editing
US11390884B2 (en) 2015-05-11 2022-07-19 Editas Medicine, Inc. Optimized CRISPR/cas9 systems and methods for gene editing in stem cells
KR20180031671A (ko) 2015-06-09 2018-03-28 에디타스 메디신, 인코포레이티드 이식의 개선을 위한 crispr/cas-관련 방법 및 조성물
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
JP2019500899A (ja) 2015-11-23 2019-01-17 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア CRISPR/Cas9の核送達を通じた細胞RNAの追跡と操作
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US10337051B2 (en) * 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018064352A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
GB2569733B (en) 2016-09-30 2022-09-14 Univ California RNA-guided nucleic acid modifying enzymes and methods of use thereof
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
CA3049961A1 (en) * 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr effector system based diagnostics
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP4095263A1 (en) 2017-01-06 2022-11-30 Editas Medicine, Inc. Methods of assessing nuclease cleavage
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
US11174515B2 (en) * 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11021740B2 (en) 2017-03-15 2021-06-01 The Broad Institute, Inc. Devices for CRISPR effector system based diagnostics
EP4361261A3 (en) 2017-03-15 2024-07-10 The Broad Institute Inc. Novel cas13b orthologues crispr enzymes and systems
US11104937B2 (en) 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
US11963966B2 (en) 2017-03-31 2024-04-23 Dana-Farber Cancer Institute, Inc. Compositions and methods for treating ovarian tumors
US11618928B2 (en) 2017-04-12 2023-04-04 The Broad Institute, Inc. CRISPR effector system based diagnostics for malaria detection
KR20200006054A (ko) 2017-04-12 2020-01-17 더 브로드 인스티튜트, 인코퍼레이티드 신규 타입 vi crispr 오르소로그 및 시스템
BR112019021719A2 (pt) 2017-04-21 2020-06-16 The General Hospital Corporation Variantes de cpf1 (cas12a) com especificidade para pam alterada
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
EP3622062A4 (en) 2017-05-10 2020-10-14 The Regents of the University of California DIRECTED EDITING OF CELLULAR RNA BY NUCLEAR ADMINISTRATION OF CRISPR / CAS9
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN110997908A (zh) 2017-06-09 2020-04-10 爱迪塔斯医药公司 工程化的cas9核酸酶
WO2018232195A1 (en) 2017-06-14 2018-12-20 The Broad Institute, Inc. Compositions and methods targeting complement component 3 for inhibiting tumor growth
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
US11168322B2 (en) 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US12049643B2 (en) 2017-07-14 2024-07-30 The Broad Institute, Inc. Methods and compositions for modulating cytotoxic lymphocyte activity
EP3654993A4 (en) 2017-07-17 2021-08-25 The Broad Institute, Inc. HUMAN COLON CELL ATLAS IN GOOD HEALTH WITH HEMORRHAGIC RECTO-COLITIS
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
KR20200074104A (ko) * 2017-10-04 2020-06-24 더 브로드 인스티튜트, 인코퍼레이티드 표적화된 핵산 편집을 위한 시스템, 방법, 및 조성물
WO2019071051A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. DIAGNOSTICS BASED ON A CRISPR EFFECTOR SYSTEM
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
EP3701042A4 (en) * 2017-10-23 2021-08-11 The Broad Institute, Inc. SYSTEMS, PROCEDURES AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITING
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
SG11202003863VA (en) 2017-11-01 2020-05-28 Univ California Casz compositions and methods of use
WO2019113506A1 (en) 2017-12-07 2019-06-13 The Broad Institute, Inc. Methods and compositions for multiplexing single cell and single nuclei sequencing
WO2019126716A1 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted rna base editing
RU2020124203A (ru) * 2017-12-22 2022-01-24 Зе Броад Институт, Инк. Мультиплексная диагностика на основе эффекторной системы crispr
BR112020015093A2 (pt) * 2018-01-29 2020-12-08 The Broad Institute, Inc. Diagnóstico baseado no sistema de efetor crispr
CN108559738A (zh) * 2018-02-12 2018-09-21 南昌大学 一种植物rna修饰和编辑的系统及方法
WO2019178427A1 (en) 2018-03-14 2019-09-19 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
DK3765616T3 (da) 2018-03-14 2023-08-21 Arbor Biotechnologies Inc Nye enzymer og systemer målrettet crispr dna og rna
WO2019189827A1 (ja) * 2018-03-30 2019-10-03 国立大学法人 岡山大学 核酸構築物、医薬組成物、抗がん剤、抗ウイルス剤及び抗菌剤
CN108796036B (zh) * 2018-04-03 2021-11-19 交弘生物科技(上海)有限公司 基于原核Argonaute蛋白的核酸检测方法及其应用
US11795456B2 (en) 2018-04-16 2023-10-24 Georgia Tech Research Corporation MRNA driven expression of RNA editors for treatment of pathologies
WO2019204828A1 (en) * 2018-04-20 2019-10-24 The Regents Of The University Of California Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna
US11957695B2 (en) 2018-04-26 2024-04-16 The Broad Institute, Inc. Methods and compositions targeting glucocorticoid signaling for modulating immune responses
CN108546718B (zh) * 2018-05-16 2021-07-09 康春生 crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用
WO2019222555A1 (en) 2018-05-16 2019-11-21 Arbor Biotechnologies, Inc. Novel crispr-associated systems and components
CN110527697B (zh) * 2018-05-23 2023-07-07 中国科学院分子植物科学卓越创新中心 基于CRISPR-Cas13a的RNA定点编辑技术
US12036240B2 (en) 2018-06-14 2024-07-16 The Broad Institute, Inc. Compositions and methods targeting complement component 3 for inhibiting tumor growth
US20190390193A1 (en) * 2018-06-23 2019-12-26 John Lawrence Mee Reversible method for sustainable human cognitive enhancement
JP2021528091A (ja) 2018-06-26 2021-10-21 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprダブルニッカーゼに基づく増幅の組成物、システム、及び方法
JP2021528090A (ja) 2018-06-26 2021-10-21 マサチューセッツ インスティテュート オブ テクノロジー Crisprエフェクター系に基づく増幅法、システム、及び診断法
WO2020000454A1 (zh) * 2018-06-29 2020-01-02 深圳市博奥康生物科技有限公司 一种表达LwCas13a基因的质粒、构建方法及其应用
EP3827093A4 (en) * 2018-07-23 2022-10-05 Board of Regents, The University of Texas System IDENTIFICATION BY SINGLE MOLECULE SEQUENCING OF POST-TRANSLATIONAL MODIFICATIONS ON PROTEINS
JP6915820B2 (ja) * 2018-07-25 2021-08-04 国立研究開発法人産業技術総合研究所 植物における標的dnaのメチル化を抑制する方法
EP3830256A2 (en) * 2018-07-31 2021-06-09 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
CA3110998A1 (en) * 2018-09-06 2020-03-12 The Regents Of The University Of California Rna and dna base editing via engneered adar recruitment
EP3650553B1 (en) * 2018-11-07 2023-07-12 Siemens Healthcare GmbH Method for detection of specific nucleic acids
BR112021009425A2 (pt) 2018-11-14 2021-11-23 Massachusetts Inst Technology Sistemas e métodos de diagnóstico por gotículas com base no sistema crispr
WO2020102608A2 (en) 2018-11-14 2020-05-22 President And Fellows Of Harvard College Multiplexing highly evolving viral variants with sherlock
AU2019381258B2 (en) * 2018-11-15 2024-02-01 China Agricultural University CRISPR-Cas12j enzyme and system
US20220282275A1 (en) * 2018-11-15 2022-09-08 The Broad Institute, Inc. G-to-t base editors and uses thereof
WO2020124050A1 (en) 2018-12-13 2020-06-18 The Broad Institute, Inc. Tiled assays using crispr-cas based detection
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US11739156B2 (en) 2019-01-06 2023-08-29 The Broad Institute, Inc. Massachusetts Institute of Technology Methods and compositions for overcoming immunosuppression
EP3911741A1 (en) * 2019-01-14 2021-11-24 University of Rochester Targeted nuclear rna cleavage and polyadenylation with crispr-cas
WO2020186231A2 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
WO2020191102A1 (en) 2019-03-18 2020-09-24 The Broad Institute, Inc. Type vii crispr proteins and systems
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
WO2020192712A1 (en) * 2019-03-26 2020-10-01 Peking University Method for identifying functional elements
CN109913502A (zh) * 2019-04-16 2019-06-21 和元生物技术(上海)股份有限公司 一种Cas9-gRNA表达系统及其应用
US20220251152A1 (en) 2019-04-24 2022-08-11 Novartis Ag Compositions and methods for selective protein degradation
EP3997222A4 (en) * 2019-07-12 2023-08-09 Duke University 3' UTR CRISPR DCAS 13 ENGINEERING SYSTEM AND METHODS OF USE
CN110819652A (zh) * 2019-08-21 2020-02-21 山东金城生物药业有限公司 一种谷氨酸棒杆菌同时基因敲除及基因表达抑制的双功能系统及应用
WO2021046257A1 (en) 2019-09-03 2021-03-11 The Broad Institute, Inc. Crispr effector system based multiplex cancer diagnostics
JP2022546592A (ja) 2019-09-03 2022-11-04 マイエロイド・セラピューティクス,インコーポレーテッド ゲノム組込みのための方法および組成物
US20230025039A1 (en) 2019-09-20 2023-01-26 The Broad Institute, Inc. Novel type vi crispr enzymes and systems
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
EP4069842A1 (en) 2019-12-02 2022-10-12 Shape Therapeutics Inc. Therapeutic editing
EP4100424A2 (en) * 2020-02-07 2022-12-14 University of Rochester Targeted translation of rna with crispr-cas13 to enhance protein synthesis
CN111337666B (zh) * 2020-02-12 2021-04-02 山东大学 I-motif重组介导的FRET探针及其原位成像癌细胞表面蛋白质同源二聚化的应用
AU2020431316A1 (en) * 2020-02-28 2022-10-20 Huigene Therapeutics Co., Ltd. Type VI-E and type VI-F CRISPR-Cas system and uses thereof
US11639523B2 (en) 2020-03-23 2023-05-02 The Broad Institute, Inc. Type V CRISPR-Cas systems and use thereof
DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
JP7419168B2 (ja) * 2020-06-10 2024-01-22 株式会社東芝 改変型piggyBacトランスポゼースのポリペプチド、それをコードするポリヌクレオチド、導入キャリア、キット、細胞のゲノムに目的配列を組込む方法及び細胞製造方法
WO2022068912A1 (en) 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
WO2022188039A1 (en) 2021-03-09 2022-09-15 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
EP4222253A1 (en) * 2020-09-30 2023-08-09 HuidaGene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
CN112430586B (zh) * 2020-11-16 2021-09-07 珠海舒桐医疗科技有限公司 一种VI-B型CRISPR/Cas13基因编辑系统及其应用
CN116917478A (zh) * 2020-12-22 2023-10-20 亥姆霍兹慕尼黑中心-德国健康与环境研究中心(有限公司) Crispr/cas13在rna病毒和/或细菌诱导的疾病的治疗中的应用
EP4276182A1 (en) * 2021-01-05 2023-11-15 Kawasaki Gakuen Educational Foundation Transcriptional product in cells of organism including human, transfected rna, and tool for purifying complex thereof
EP4347818A2 (en) 2021-06-01 2024-04-10 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
US20240309343A1 (en) * 2021-07-08 2024-09-19 Korea Advanced Institute Of Science And Technology RNA expression modulating or editing method via regulation of Cas13 protein
US11814689B2 (en) 2021-07-21 2023-11-14 Montana State University Nucleic acid detection using type III CRISPR complex
EP4215612A1 (en) * 2022-01-20 2023-07-26 Sartorius Stedim Cellca GmbH Genome editing with crispr/cas nucleases comprising collateral activity
US20240301447A1 (en) 2023-02-15 2024-09-12 Arbor Biotechnologies, Inc. Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript

Family Cites Families (133)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
ATE141646T1 (de) 1986-04-09 1996-09-15 Genzyme Corp Genetisch transformierte tiere, die ein gewünschtes protein in milch absondern
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
CA2004574A1 (en) * 1988-12-05 1990-06-05 Barbara C. Chu Target nucleic acid amplification/detection systems
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
WO1994002620A2 (en) 1992-07-27 1994-02-03 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
CA2163129A1 (en) 1993-05-17 1994-11-24 Flossie Wong-Staal Ribozyme gene therapy for hiv infection and aids
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
EP0831854A4 (en) 1995-06-06 2001-01-24 Isis Pharmaceuticals Inc OLIGONUCLEOTIDS WITH PHOSPHOROTHIOATE BINDINGS OF HIGH CHIRAL PURITY
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5985309A (en) 1996-05-24 1999-11-16 Massachusetts Institute Of Technology Preparation of particles for inhalation
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
GB9907461D0 (en) 1999-03-31 1999-05-26 King S College London Neurite regeneration
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
CN100342008C (zh) 1997-10-24 2007-10-10 茵维特罗根公司 利用具重组位点的核酸进行重组克隆
US6750059B1 (en) 1998-07-16 2004-06-15 Whatman, Inc. Archiving of vectors
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7868149B2 (en) 1999-07-20 2011-01-11 Monsanto Technology Llc Plant genome sequence and uses thereof
US6603061B1 (en) 1999-07-29 2003-08-05 Monsanto Company Agrobacterium-mediated plant transformation method
GB0024550D0 (ko) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
AU2002336760A1 (en) 2001-09-26 2003-06-10 Mayo Foundation For Medical Education And Research Mutable vaccines
GB0125216D0 (en) 2001-10-19 2001-12-12 Univ Strathclyde Dendrimers for use in targeted delivery
US20090100536A1 (en) 2001-12-04 2009-04-16 Monsanto Company Transgenic plants with enhanced agronomic traits
AU2002353231B2 (en) 2001-12-21 2008-10-16 Oxford Biomedica (Uk) Limited Method for producing a transgenic organism using a lentiviral expression vector such as EIAV
DK1519714T3 (da) 2002-06-28 2011-01-31 Protiva Biotherapeutics Inc Fremgangsmåde og apparat til fremstilling af liposomer
GB0220467D0 (en) 2002-09-03 2002-10-09 Oxford Biomedica Ltd Composition
US20040142476A1 (en) 2002-11-01 2004-07-22 New England Biolabs, Inc. Organellar targeting of RNA and its use in the interruption of environmental gene flow
EP2567693B1 (en) 2003-07-16 2015-10-21 Protiva Biotherapeutics Inc. Lipid encapsulated interfering RNA
US7803397B2 (en) 2003-09-15 2010-09-28 Protiva Biotherapeutics, Inc. Polyethyleneglycol-modified lipid compounds and uses thereof
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
AU2005252273B2 (en) 2004-06-07 2011-04-28 Arbutus Biopharma Corporation Lipid encapsulated interfering RNA
ATE537263T1 (de) 2004-06-07 2011-12-15 Protiva Biotherapeutics Inc Kationische lipide und verwendungsverfahren
AU2005274948B2 (en) 2004-07-16 2011-09-22 Genvec, Inc. Vaccines against aids comprising CMV/R-nucleic acid constructs
GB0422877D0 (en) 2004-10-14 2004-11-17 Univ Glasgow Bioactive polymers
WO2007048046A2 (en) 2005-10-20 2007-04-26 Protiva Biotherapeutics, Inc. Sirna silencing of filovirus gene expression
ES2377660T3 (es) 2005-10-28 2012-03-29 Mitsubishi Tanabe Pharma Corporation Nuevo péptido que penetra en las células
US8101741B2 (en) 2005-11-02 2012-01-24 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
GB0526211D0 (en) 2005-12-22 2006-02-01 Oxford Biomedica Ltd Viral vectors
US7915399B2 (en) 2006-06-09 2011-03-29 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
WO2008042156A1 (en) 2006-09-28 2008-04-10 Northwestern University Maximizing oligonucleotide loading on gold nanoparticle
CA2670096A1 (en) 2006-11-21 2008-05-29 The Samuel Roberts Noble Foundation, Inc. Biofuel production methods and compositions
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
AU2008346801A1 (en) 2007-12-31 2009-07-16 Nanocor Therapeutics, Inc. RNA interference for the treatment of heart failure
HUE034483T2 (en) 2008-04-15 2018-02-28 Protiva Biotherapeutics Inc New lipid preparations for introducing a nucleic acid
US8575305B2 (en) 2008-06-04 2013-11-05 Medical Research Council Cell penetrating peptides
JP2011526619A (ja) 2008-06-30 2011-10-13 サイレンシード リミテッド 局所ドラッグデリバリーシステム、その方法、および、その組成物
EP2309980A1 (en) 2008-07-08 2011-04-20 S.I.F.I. Societa' Industria Farmaceutica Italiana Ophthalmic compositions for treating pathologies of the posterior segment of the eye
CA2742954C (en) 2008-11-07 2018-07-10 Massachusetts Institute Of Technology Aminoalcohol lipidoids and uses thereof
GB2465749B (en) 2008-11-25 2013-05-08 Algentech Sas Plant cell transformation method
US20120047601A1 (en) 2009-02-17 2012-02-23 The Regents Of The University Of California Method of Reducing Acetylation in Plants to Improve Biofuel Production
US8236943B2 (en) 2009-07-01 2012-08-07 Protiva Biotherapeutics, Inc. Compositions and methods for silencing apolipoprotein B
WO2011000107A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Novel lipid formulations for delivery of therapeutic agents to solid tumors
US20110027239A1 (en) 2009-07-29 2011-02-03 Tissue Genesis, Inc. Adipose-derived stromal cells (asc) as delivery tool for treatment of cancer
WO2011028929A2 (en) 2009-09-03 2011-03-10 The Regents Of The University Of California Nitrate-responsive promoter
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US20120003201A1 (en) 2010-04-21 2012-01-05 Nicholas Susanne B Vault agents for chronic kidney disease
US8771985B2 (en) 2010-04-26 2014-07-08 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using zinc-finger nucleases
US8372951B2 (en) 2010-05-14 2013-02-12 National Tsing Hua University Cell penetrating peptides for intracellular delivery
CN102946907A (zh) 2010-05-28 2013-02-27 牛津生物医学(英国)有限公司 慢病毒载体向脑的递送
US9193827B2 (en) 2010-08-26 2015-11-24 Massachusetts Institute Of Technology Poly(beta-amino alcohols), their preparation, and uses thereof
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
PL2691443T3 (pl) 2011-03-28 2021-08-30 Massachusetts Institute Of Technology Sprzężone lipomery i ich zastosowania
DE12722942T1 (de) 2011-03-31 2021-09-30 Modernatx, Inc. Freisetzung und formulierung von manipulierten nukleinsäuren
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
EP2751567B1 (en) 2011-09-01 2019-05-08 University of Iowa Research Foundation Oligonucleotide-based probes for detection of bacterial nucleases
JP2015501844A (ja) 2011-12-16 2015-01-19 モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. 修飾ヌクレオシド、ヌクレオチドおよび核酸組成物
US20130185823A1 (en) 2012-01-16 2013-07-18 Academia Sinica Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root
DE202013012241U1 (de) * 2012-05-25 2016-01-18 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
US8614194B1 (en) 2012-07-25 2013-12-24 Kaohsiung Medical University Anionic cell penetrating peptide and its use for intracellular delivery
ES2757623T3 (es) 2012-07-25 2020-04-29 Broad Inst Inc Proteínas de unión a ADN inducibles y herramientas de perturbación genómica y aplicaciones de las mismas
ES2926021T3 (es) 2012-10-23 2022-10-21 Toolgen Inc Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma
EP2825654B1 (en) 2012-12-12 2017-04-26 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
MX2015007549A (es) 2012-12-12 2017-01-20 Broad Inst Inc Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias.
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
EP2931892B1 (en) 2012-12-12 2018-09-12 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
BR112015013784A2 (pt) 2012-12-12 2017-07-11 Massachusetts Inst Technology aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas
PL2896697T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją
PL2898075T3 (pl) 2012-12-12 2016-09-30 PROJEKTOWANIE i OPTYMALIZACJA ULEPSZONYCH SYSTEMÓW, SPOSOBY I KOMPOZYCJE ENZYMÓW DO MANIPULACJI SEKWENCJĄ
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
CN105793425B (zh) 2013-06-17 2021-10-26 布罗德研究所有限公司 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
CN107995927B (zh) 2013-06-17 2021-07-30 布罗德研究所有限公司 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途
EP3011029B1 (en) 2013-06-17 2019-12-11 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
KR20160034901A (ko) 2013-06-17 2016-03-30 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
ES2767318T3 (es) 2013-06-17 2020-06-17 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para generar modelos y actuar sobre enfermedades y trastornos de células posmitóticas
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
EP3835419A1 (en) * 2013-12-12 2021-06-16 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
US9068179B1 (en) * 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
JP2017501149A (ja) 2013-12-12 2017-01-12 ザ・ブロード・インスティテュート・インコーポレイテッド 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用
CA3012631A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US20170211142A1 (en) * 2015-10-22 2017-07-27 The Broad Institute, Inc. Novel crispr enzymes and systems
US11118194B2 (en) * 2015-12-18 2021-09-14 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
SG11201804038VA (en) * 2016-01-08 2018-06-28 Univ California Conditionally active heterodimeric polypeptides and methods of use thereof
US11427837B2 (en) * 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
WO2017136335A1 (en) * 2016-02-01 2017-08-10 The Regents Of The University Of California Self-inactivating endonuclease-encoding nucleic acids and methods of using the same
US11666666B2 (en) * 2016-02-11 2023-06-06 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
WO2017160752A1 (en) * 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
KR102617874B1 (ko) * 2016-03-30 2023-12-22 인텔리아 테라퓨틱스, 인크. Crispr/cas 성분을 위한 지질 나노입자 제제
WO2017173092A1 (en) * 2016-03-31 2017-10-05 The Regents Of The University Of California Methods for genome editing in zygotes
WO2017189336A1 (en) * 2016-04-25 2017-11-02 The Regents Of The University Of California Methods and compositions for genomic editing
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
CA3049961A1 (en) * 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr effector system based diagnostics
US11174515B2 (en) * 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11021740B2 (en) * 2017-03-15 2021-06-01 The Broad Institute, Inc. Devices for CRISPR effector system based diagnostics

Also Published As

Publication number Publication date
AU2017283713A1 (en) 2018-12-20
JP2023134453A (ja) 2023-09-27
CA3028158A1 (en) 2017-12-21
WO2017219027A1 (en) 2017-12-21
US20230383282A1 (en) 2023-11-30
JP2023052051A (ja) 2023-04-11
JP2019524072A (ja) 2019-09-05
EP3455357A1 (en) 2019-03-20
BR112018076190A2 (pt) 2019-06-18
AU2021203747A1 (en) 2021-07-01
JP7267013B2 (ja) 2023-05-01
KR20190019168A (ko) 2019-02-26
US20240191223A1 (en) 2024-06-13
AU2023204078A1 (en) 2023-07-13
AU2018271372A1 (en) 2019-01-17
AU2021203747B2 (en) 2023-11-09
US11788083B2 (en) 2023-10-17
US20190359971A1 (en) 2019-11-28
AU2017283713B2 (en) 2021-04-08
CN109642231A (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
AU2021203747B2 (en) Novel Type VI CRISPR orthologs and systems
US11773412B2 (en) Crispr enzymes and systems
US20200231975A1 (en) Novel type vi crispr orthologs and systems
AU2016342038B2 (en) Type VI-B CRISPR enzymes and systems
JP2023052236A (ja) 新規vi型crisprオルソログ及び系
EP3645728A1 (en) Novel type vi crispr orthologs and systems
US20200308560A1 (en) Novel type vi crispr orthologs and systems
KR20240155360A (ko) 신규 타입 vi crispr 오르소로그 및 시스템

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal