KR20210149686A - 유전자 편집에 유용한 폴리펩티드 및 사용 방법 - Google Patents

유전자 편집에 유용한 폴리펩티드 및 사용 방법 Download PDF

Info

Publication number
KR20210149686A
KR20210149686A KR1020217023648A KR20217023648A KR20210149686A KR 20210149686 A KR20210149686 A KR 20210149686A KR 1020217023648 A KR1020217023648 A KR 1020217023648A KR 20217023648 A KR20217023648 A KR 20217023648A KR 20210149686 A KR20210149686 A KR 20210149686A
Authority
KR
South Korea
Prior art keywords
seq
sequence
position corresponding
polypeptide
amino acid
Prior art date
Application number
KR1020217023648A
Other languages
English (en)
Inventor
타이슨 디. 보웬
알렉산드라 브리너 크롤리
테드 디. 일리치
마크 무어
로돌페 바랭구
마이클 라스너
Original Assignee
라이프에디트 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 라이프에디트 테라퓨틱스, 인크. filed Critical 라이프에디트 테라퓨틱스, 인크.
Publication of KR20210149686A publication Critical patent/KR20210149686A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

관심 표적 서열에 결합하기 위한 조성물 및 방법이 제공된다. 조성물은 DNA 결합 단백질 또는 단백질 도메인과 핵산 변형 단백질 또는 단백질 도메인 사이의 융합 단백질을 포함한다. 조성물은 관심 표적 서열의 절단 또는 변형, 관심 표적 서열의 가시화, 및 관심 서열의 발현의 변형에 사용된다. 조성물은 RNA-가이드된 뉴클레아제 폴리펩티드, CRISPR RNA, 트랜스-활성화 CRISPR RNA, 가이드 RNA, 데아미나제, 및 이를 코딩하는 핵산 분자를 포함한다. 핵산 분자를 포함하는 벡터 및 숙주 세포 또한 제공된다. 관심 표적 서열에 결합시키기 위한 CRISPR 시스템이 추가로 제공되며, CRISPR 시스템은 RNA-가이드된 뉴클레아제 폴리펩티드 및 하나 이상의 가이드 RNA를 포함한다. DNA-결합 폴리펩티드에 융합될 수 있고 유전자 편집에 유용할 수 있는 데아미나제 또한 제공된다.

Description

유전자 편집에 유용한 폴리펩티드 및 사용 방법
본 발명은 분자 생물학 및 유전자 편집 분야에 관한 것이다.
표적화된 게놈 편집 또는 변형은 기본 및 응용 연구를 위한 중요한 도구가 되고 있다. 초기 방법은 뉴클레아제, 예컨대 메가뉴클레아제, 아연 핑거 융합 단백질 또는 TALEN의 조작을 수반하였고, 각각의 특정한 표적 서열에 대해 특이적인 조작된, 프로그래밍가능한, 서열-특이적인 DNA-결합 도메인을 갖는 키메라 뉴클레아제의 생성을 필요로 한다. RNA-가이드된 뉴클레아제 (RGN), 예컨대 CRISPR-cas 박테리아 시스템의 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR)-연관된 (cas) 단백질은 특정한 표적 서열과 특이적으로 혼성화하는 가이드 RNA와 뉴클레아제를 복합체화시킴으로써 특이적인 서열의 표적화를 가능하게 한다. 표적-특이적인 가이드 RNA의 생성은 각각의 표적 서열에 대한 키메라 뉴클레아제를 생성하는 것에 비해 비용이 적게 들고 더 효율적이다. 이러한 RNA-가이드된 뉴클레아제를 사용하여, 오류가 발생하기 쉬운 비상동성 말단-연결 (NHEJ)을 통해 복구되는 서열-특이적인 이중 가닥 파손에 의해 게놈을 편집하여, 특이적인 게놈 위치에 돌연변이를 도입시킬 수 있다. 대안적으로, 이종성 DNA는 상동성-지정된 복구를 통해 게놈 부위에 도입될 수 있다.
추가로, RGN은 DNA 편집 접근법에서 유용하다. 핵산 서열의 표적화된 편집, 예를 들어 게놈 DNA로 특이적인 변형의 도입을 가능하게 하는 표적화된 절단은 유전자 기능 및 유전자 발현을 연구하기 위한 고도로 미묘한 접근을 가능하게 한다. 이러한 표적화된 편집은 또한 인간에서 유전 질환을 표적화하기 위해 또는 농작물의 게놈에서 농경학적으로 유익한 돌연변이를 도입시키기 위해 배치될 수 있다. 게놈 편집 도구의 발달은 유전자 편집-기반 포유동물 치료제 및 농업 생명공학에 대한 새로운 접근법을 제공한다.
관심 표적 핵산 서열에 결합시키기 위한 조성물 및 방법이 제공된다. 조성물은 관심 표적 서열의 절단 또는 변형, 관심 표적 서열의 검출, 및 관심 서열의 발현의 변형에 사용될 수 있다. 조성물은 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드 및 그의 변이체, CRISPR RNA (crRNA), 트랜스-활성화 CRISPR RNA (tracrRNA), 가이드 RNA (gRNA), 데아미나제 폴리펩티드, 이를 코딩하는 핵산 분자, 및 핵산 분자를 포함하는 벡터 및 숙주 세포를 포함한다. 관심 표적 서열과 결합하기 위한 CRISPR 시스템 또한 제공되며, CRISPR 시스템은 RNA-가이드된 뉴클레아제 폴리펩티드 및 하나 이상의 가이드 RNA를 포함한다. RNA-가이드된 DNA 결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 폴리펩티드 또한 제공된다. 본원에 개시된 방법은 관심 표적 핵산 서열의 결합, 일부 실시양태에서, 관심 표적 핵산 서열의 절단 또는 변형을 위해 도출된다. 관심 표적 서열은 예를 들어 도입된 공여자 서열에 의한 비상동성 말단 결합 또는 상동성-지정된 복구의 결과로서, 또는 염기 편집의 결과로서 변형될 수 있다.
본 발명의 여러 변형 및 다른 실시양태는 관련 기술분야의 기술자에 의해 이들 발명이 상기 설명 및 관련된 도면에 제시된 교시내용의 이익을 갖는 것으로 고려될 것이다. 따라서, 본 발명이 개시된 구체적인 실시양태로 제한되지 않고, 변형 및 다른 실시양태가 첨부된 실시양태의 범위 내에 포함되는 것으로 의도됨을 이해해야 한다. 특정한 용어들이 본원에서 사용되지만, 이들은 단지 일반적이고 설명적인 의미로만 사용되고, 제한하려는 목적이 아니다.
I. 개요
RNA-가이드된 뉴클레아제 (RGN)는 게놈 내의 단일 부위의 표적화된 조작을 가능하게 하고, 치료 및 연구 적용을 위해 유전자 표적화의 맥락에서 유용하다. 포유동물을 비롯한 다양한 유기체에서, RNA-가이드된 뉴클레아제는 예를 들어 비상동성 말단 결합 및 상동성 재조합을 자극함으로써 게놈 조작에 사용되었다. 본원에 기재된 조성물 및 방법은 폴리뉴클레오티드에서 단일 또는 이중 가닥 파손을 생성하거나, 폴리뉴클레오티드를 변형시키거나, 폴리뉴클레오티드 내의 특정한 부위를 검출하거나, 또는 특정한 유전자의 발현을 변형시키는데 유용하다.
본원에 개시된 RNA-가이드된 뉴클레아제는 표적 서열을 변형시킴으로써 유전자 발현을 변경시킬 수 있다. 구체적인 실시양태에서, RNA-가이드된 뉴클레아제는 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) RNA-가이드된 뉴클레아제 시스템의 일부로서 가이드 RNA (gRNA 또는 sgRNA로도 지칭됨)에 의해 표적 서열로 지시된다. 가이드 RNA는 RNA-가이드된 뉴클레아제와 복합체를 형성하여 RNA-가이드된 뉴클레아제가 표적 서열과 결합하도록, 일부 실시양태에서, 표적 서열에서 단일 가닥 또는 이중 가닥 파손을 도입하도록 지시한다. 표적 서열이 절단된 후에, 파손은 표적 서열의 DNA 서열이 복구 과정 동안에 변형되도록 복구될 수 있다. 따라서, 숙주 세포의 DNA에서 표적 서열을 변형시키기 위해 RNA-가이드된 뉴클레아제를 사용하는 방법이 본원에 제공된다. 예를 들어, RNA-가이드된 뉴클레아제를 사용하여 진핵생물 세포 또는 원핵생물 세포의 게놈 유전자좌에서 표적 서열을 변형시킬 수 있다.
본 개시내용은 데아미나제 폴리펩티드, 및 이를 코딩하는 핵산 분자, 뿐만 아니라 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 단백질을 추가로 제공한다. 일부 실시양태에서, DNA-결합 폴리펩티드는 메가뉴클레아제, 아연 핑거 융합 단백질 또는 TALEN이거나 또는 그로부터 유래된다. 일부 실시양태에서, 융합 단백질은 RNA-가이드된 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함한다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 RGN이다. 일부 실시양태에서, RGN은 유형 II CRISPR-Cas 폴리펩티드이다. 다른 실시양태에서, RGN은 유형 V CRISPR-Cas 폴리펩티드이다. 추가의 실시양태에서, RGN은 gRNA에 결합하는 Cas9 폴리펩티드 도메인이며, 이는 가닥 혼성화를 통해 표적 핵산 서열에 결합한다.
데아미나제 폴리펩티드는 예를 들어 시티딘과 같은 핵염기를 탈아미노화시킬 수 있는 데아미나제 도메인을 포함한다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 유도할 수 있으며, 이는 본원에서 "핵산 편집" 또는 "염기 편집"으로 지칭된다. 따라서, RGN 폴리펩티드 변이체 또는 도메인 및 데아미나제 도메인을 포함하는 융합 단백질은 핵산 서열의 표적화된 편집을 위해 사용될 수 있다.
이러한 융합 단백질은 예를 들어 돌연변이성 세포의 생성을 위해 시험관내에서 DNA의 표적화된 편집에 유용하다. 이들 돌연변이성 세포는 식물 또는 동물에 있을 수 있다. 이러한 융합 단백질은 또한 예를 들어 생체외에서 포유동물 세포에서, 예를 들어 동일한 또는 또 다른 대상체에게 후속적으로 재도입되는 대상체로부터 수득된 세포에서 유전적 결함의 수정을 위해 표적화된 돌연변이를 도입하는데; 및 예를 들어 포유동물 대상체에서 질환-연관된 유전자에서 유전적 결함의 수정 또는 불활성화 돌연변이의 도입을 위해 표적화된 돌연변이를 도입하는데 유용할 수 있다. 이러한 융합 단백질은 또한 식물 세포에서 표적화된 돌연변이를 도입하는데, 예를 들어 유익한 또는 농경학적으로 가치있는 형질 또는 대립유전자를 도입하는데 유용할 수 있다.
용어 "단백질", "펩티드" 및 "폴리펩티드"는 본원에서 상호교환적으로 사용되고, 펩티드 (아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 상기 용어는 임의의 크기, 구조 또는 기능을 갖는 단백질, 펩티드 또는 폴리펩티드를 지칭한다. 전형적으로, 단백질, 펩티드 또는 폴리펩티드는 적어도 3개의 아미노산 길이일 것이다. 단백질, 펩티드 또는 폴리펩티드는 개별 단백질 또는 단백질 집합체를 지칭할 수 있다. 단백질, 펩티드 또는 폴리펩티드에서 하나 이상의 아미노산이 예를 들어 화학적 개체, 예컨대 탄수화물 기, 히드록실 기, 포스페이트 기, 파메실 기, 이소파메실 기, 지방산 기, 접합, 관능화 또는 다른 변형을 위한 링커 등의 부가에 의해 변형될 수 있다. 단백질, 펩티드 또는 폴리펩티드는 단일 분자일 수 있거나, 또는 다분자 복합체일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 단지 천연 발생 단백질 또는 펩티드의 단편일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 천연 발생, 재조합, 또는 합성, 또는 이들의 임의의 조합일 수 있다.
본원에서 사용된 바와 같이 용어 "융합 단백질"은 적어도 2가지 상이한 단백질로부터의 단백질 도메인을 포함하는 혼성체 폴리펩티드를 지칭한다. 한 단백질은 융합 단백질의 아미노-말단 (N-말단) 부분에 또는 카르복시-말단 (C-말단) 단백질에 위치하여, 각각 "아미노-말단 융합 단백질" 또는 "카르복시-말단 융합 단백질"을 형성할 수 있다. 단백질은 상이한 도메인, 예를 들어 핵산 결합 도메인 (예를 들어, 표적 부위로 단백질의 결합을 지시하는 Cas9의 gRNA 결합 도메인) 및 핵산 절단 도메인 또는 재조합효소의 촉매적 도메인을 포함할 수 있다. 일부 실시양태에서, 단백질은 단백질성 부분, 예를 들어 핵산 결합 도메인을 구성하는 아미노산 서열, 및 유기 화합물, 예를 들어 핵산 절단제로서 작용할 수 있는 화합물을 포함한다. 일부 실시양태에서, 단백질은 핵산, 예를 들어 RNA와 복합체로 있거나 또는 그와 회합되어 있다. 본원에 제공된 임의의 단백질은 관련 기술분야에 공지된 임의의 방법에 의해 생성될 수 있다. 예를 들어, 본원에 제공된 단백질은 펩티드 링커를 포함하는 융합 단백질에 특히 적합한 재조합 단백질 발현 및 정제를 통해 생성될 수 있다. 재조합 단백질 발현 및 정제 방법은 널리 공지되어 있고, [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))] (그의 전체 내용은 본원에 참고로 포함됨)에 의해 기재된 것들이 포함된다.
II. RNA-가이드된 뉴클레아제
RNA-가이드된 뉴클레아제가 본원에 제공된다. 용어 RNA-가이드된 뉴클레아제 (RGN)는 서열-특이적인 방식으로 특정한 표적 뉴클레오티드 서열에 결합하며, 폴리펩티드와 복합체화하고 표적 서열과 혼성화하는 가이드 RNA 분자에 의해 표적 뉴클레오티드 서열로 가이드되는 폴리펩티드를 지칭한다. RNA-가이드된 뉴클레아제가 결합시 표적 서열을 절단시킬 수 있지만, 용어 RNA-가이드된 뉴클레아제는 또한 표적 서열을 절단하지 않고 그에 결합할 수 있는 뉴클레아제-데드(nuclease-dead) RNA-가이드된 뉴클레아제를 포함한다. RNA-가이드된 뉴클레아제에 의한 표적 서열의 절단은 단일 또는 이중 가닥 파손을 일으킬 수 있다. 이중 가닥 핵산 분자의 단일 가닥만을 절단할 수 있는 RNA-가이드된 뉴클레아제는 본원에서 닉카제로 지칭된다.
본원에 개시된 RNA-가이드된 뉴클레아제에는 APG00969, APG03128, APG09748, APG00771 및 APG02789 RNA-가이드된 뉴클레아제 (이들의 아미노산 서열은 각각 서열식별번호((SEQ ID NO)): 1, 16, 24, 35, 43 또는 50으로 제시됨), 및 RNA-가이드된 서열-특이적인 방식으로 표적 뉴클레오티드 서열에 결합하는 능력을 보유하는 그의 활성 단편 또는 변이체가 포함된다. 이들 실시양태의 일부에서, APG00969, APG03128, APG09748, APG00771 및 APG02789 RGN의 활성 단편 또는 변이체는 단일- 또는 이중-가닥 표적 서열을 절단할 수 있다. 일부 실시양태에서, APG00969, APG03128, APG09748, APG00771 또는 APG02789 RGN의 활성 변이체는 서열식별번호: 1, 16, 24, 35, 43 또는 50에 제시된 아미노산 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, APG00969, APG03128, APG09748, APG00771 또는 APG02789 RGN의 활성 단편은 서열식별번호: 1, 16, 24, 35, 43 또는 50에 제시된 아미노산 서열의 적어도 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 또는 그 초과의 연속 아미노산 잔기를 포함한다. 본원에 제공된 RNA-가이드된 뉴클레아제는 적어도 하나의 뉴클레아제 도메인 (예를 들어, DNase, RNase 도메인), 및 가이드 RNA와 상호작용하기 위한 적어도 하나의 RNA 인식 및/또는 RNA 결합 도메인을 포함할 수 있다. 추가로, 본원에 제공된 RNA-가이드된 뉴클레아제에서 확인될 수 있는 도메인에는 다음이 포함되나 이로 제한되지 않는다: DNA 결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 및 이합체화 도메인. 구체적인 실시양태에서, 본원에 제공된 RNA-가이드된 뉴클레아제는 DNA 결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 및 이합체화 도메인 중 하나 이상과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%를 포함할 수 있다.
표적 뉴클레오티드 서열은 본원에 제공된 RNA-가이드된 뉴클레아제에 의해 결합되고, RNA-가이드된 뉴클레아제와 회합된 가이드 RNA와 혼성화한다. 이어서, 폴리펩티드가 뉴클레아제 활성을 갖는 경우에, 표적 서열은 후속적으로 RNA-가이드된 뉴클레아제에 의해 절단될 수 있다. 용어 "절단하다" 또는 "절단"은 표적 서열 내에 단일 가닥 또는 이중 가닥 파손을 생성할 수 있는, 표적 뉴클레오티드 서열의 백본 내에서 적어도 하나의 포스포디에스테르 결합의 가수분해를 지칭한다. 본원에 개시된 RGN은 엔도뉴클레아제로서 기능하여 폴리뉴클레오티드 내의 뉴클레오티드를 절단할 수 있거나, 또는 폴리뉴클레오티드의 말단 (5' 및/또는 3' 말단)으로부터 연속적인 뉴클레오티드를 제거하는 엑소뉴클레아제일 수 있다. 다른 실시양태에서, 개시된 RGN은 폴리뉴클레오티드의 임의의 위치 내에서 표적 서열의 뉴클레오티드를 절단할 수 있고, 따라서 엔도뉴클레아제 및 엑소뉴클레아제 둘 다로 기능할 수 있다. 본원에 개시된 RGN의 표적 폴리뉴클레오티드의 절단은 엇갈린 파손 또는 평활 말단을 생성할 수 있다.
본원에 개시된 RNA-가이드된 뉴클레아제는 박테리아 또는 고세균 종으로부터 유래된 야생형 서열일 수 있다. 대안적으로, RNA-가이드된 뉴클레아제는 야생형 폴리펩티드의 변이체 또는 단편일 수 있다. 야생형 RGN은 예를 들어 뉴클레아제 활성을 변경시키도록 또는 PAM 특이성을 변경시키도록 변형될 수 있다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 천연 발생이 아니다.
특정한 실시양태에서, RNA-가이드된 뉴클레아제는 닉카제로서 기능하여, 표적 뉴클레오티드 서열의 단일 가닥만을 절단한다. 이러한 RNA-가이드된 뉴클레아제는 단일 기능 뉴클레아제 도메인을 갖는다. 이들 일부 실시양태에서, 추가의 뉴클레아제 도메인은 뉴클레아제 활성이 감소되거나 또는 제거되도록 돌연변이되었다. 뉴클레아제 불활성 RGN 또는 닉카제 RGN은 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드, 또는 RNA-가이드된 DNA-결합 단백질, 또는 RNA-가이드된 DNA-결합 도메인으로 지칭될 수 있다.
다른 실시양태에서, RNA-가이드된 뉴클레아제는 뉴클레아제 활성이 완전히 결여되거나 또는 감소된 뉴클레아제 활성을 나타내고, 본원에서 뉴클레아제-데드로 지칭된다. 돌연변이를 아미노산 서열에 도입시키기 위한 관련 기술분야에 공지된 임의의 방법, 예컨대 PCR-매개된 돌연변이 유발 및 부위-지정된 돌연변이 유발은 닉카제 또는 뉴클레아제-데드 RGN을 생성하기 위해 이용될 수 있다. 예를 들어, 미국 공개 번호 2014/0068797 및 미국 특허 번호 9,790,490을 참고하며; 이들 각각은 그의 전문이 참고로 포함된다.
뉴클레아제 활성이 결여된 RNA-가이드된 뉴클레아제는 융합된 폴리펩티드, 폴리뉴클레오티드, 또는 소분자 페이로드를 특정한 게놈 위치로 전달하기 위해 사용될 수 있다. 이들 일부 실시양태에서, RGN 폴리펩티드 또는 가이드 RNA는 특정한 서열의 검출이 가능하도록 검출가능한 표지에 융합될 수 있다. 비제한적인 예로서, 뉴클레아제-데드 RGN은 검출가능한 표지 (예를 들어, 형광 단백질)에 융합될 수 있고, 질환-연관된 서열의 검출이 가능하도록 질환과 연관된 특정한 서열에 대해 표적화될 수 있다.
대안적으로, 뉴클레아제-데드 RGN은 원하는 서열의 발현을 변경시키도록 특정한 게놈 위치에 대해 표적화될 수 있다. 일부 실시양태에서, 뉴클레아제-데드 RNA-가이드된 뉴클레아제와 표적 서열의 결합은 표적화된 게놈 영역 내에서 RNA 폴리머라제 또는 전사 인자의 결합을 방해함으로써 표적 서열, 또는 표적 서열에 의한 전사 조절하에 있는 유전자의 발현을 억제한다. 다른 실시양태에서, RGN (예를 들어, 뉴클레아제-데드 RGN) 또는 그의 복합체화된 가이드 RNA는 표적 서열과 결합시 표적 서열, 또는 표적 서열에 의한 전사 조절하에 있는 유전자의 발현을 억제하거나 또는 활성화시키는 작용을 하는 발현 조절인자를 추가로 포함한다. 이들 일부 실시양태에서, 발현 조절인자는 후성적인 메카니즘을 통해 표적 서열 또는 조절된 유전자의 발현을 조절한다.
다른 실시양태에서, 뉴클레아제-데드 RGN 또는 닉카제 활성만을 갖는 RGN은, 염기-편집 폴리펩티드, 예를 들어 뉴클레오티드 염기를 탈아미노화시키는 데아미나제 폴리펩티드 또는 그의 활성 변이체 또는 단편과의 융합을 통해 표적 폴리뉴클레오티드의 서열을 변형시켜, 하나의 뉴클레오티드 염기를 또 다른 염기로 전환시키도록, 특정한 게놈 위치에 대해 표적화될 수 있다. 염기-편집 폴리펩티드는 그의 N-말단 또는 C-말단에서 RGN에 융합될 수 있다. 추가로, 염기-편집 폴리펩티드는 펩티드 링커를 통해 RGN에 융합될 수 있다. 이러한 조성물 및 방법에 유용한 데아미나제 폴리펩티드의 비제한적인 예에는 [Gaudelli et al. (2017) Nature 551:464-471], 미국 공개 번호 2017/0121693 및 2018/0073012, 및 국제 공개 번호 WO/2018/027078에 기재된 시티딘 데아미나제 또는 아데노신 데아미나제 염기 편집기가 포함되고, 이들 각각은 그의 전문이 본원에 참고로 포함된다.
폴리펩티드 또는 도메인에 융합된 RNA-가이드된 뉴클레아제는 링커에 의해 분리되거나 또는 결합될 수 있다. 본원에서 사용된 바와 같이, 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어 뉴클레아제의 결합 도메인 및 절단 도메인을 연결하는 화학적 기 또는 분자를 지칭한다. 일부 실시양태에서, 링커는 RNA 가이드된 뉴클레아제의 gRNA 결합 도메인 및 염기-편집 폴리펩티드, 예컨대 데아미나제를 결합시킨다. 일부 실시양태에서, 링커는 뉴클레아제-데드 RGN 및 데아미나제를 결합시킨다. 전형적으로, 링커는 2개의 기, 분자 또는 다른 모이어티 사이에 위치하거나 또는 그에 의해 플랭킹되고, 공유 결합을 통해 서로 연결되어 이들 둘을 연결시킨다. 일부 실시양태에서, 링커는 아미노산 또는 여러개의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 또는 150-200개 아미노산 길이이다. 더 길거나 또는 더 짧은 링커 또한 고려된다.
본원에 개시된 RNA-가이드된 뉴클레아제는 세포의 핵으로 RGN의 수송을 증강시키기 위해 적어도 하나의 핵 국재화 신호 (NLS)를 포함할 수 있다. 핵 국재화 신호는 관련 기술분야에 공지되어 있고, 일반적으로 염기성 아미노산의 스트레치를 포함한다 (예를 들어, [Lange et al., J. Biol. Chem. (2007) 282:5101-5105] 참고). 특정한 실시양태에서, RGN은 2, 3, 4, 5, 6개 또는 그 초과의 핵 국재화 신호를 포함한다. 핵 국재화 신호(들)은 이종성 NLS일 수 있다. 본원에 개시된 RGN에 대해 유용한 핵 국재화 신호의 비제한적인 예는 SV40 거대 T-항원, 뉴클레오파스민, 및 c-Myc의 핵 국재화 신호이다 (예를 들어, [Ray et al. (2015) Bioconjug Chem 26(6):1004-7] 참고). 특정한 실시양태에서, RGN은 서열식별번호: 10에 제시된 NLS 서열을 포함한다. RGN은 그의 N-말단, C-말단, 또는 N-말단 및 C-말단 둘 다에 하나 이상의 NLS 서열을 포함할 수 있다. 예를 들어, RGN은 N-말단 영역에 2개의 NLS 서열 및 C-말단 영역에서 4개의 NLS 서열을 포함할 수 있다.
폴리펩티드를 특정한 세포하 위치(들)에 국재화시키는 관련 기술분야에 공지된 다른 국재화 신호 서열, 예컨대 비제한적으로 색소체 국재화 서열, 미토콘드리아 국재화 서열, 및 색소체 및 미토콘드리아 둘 다를 표적화하는 이중-표적화 신호 서열을 또한 사용하여, RGN을 표적화할 수 있다 (예를 들어, [Nassoury and Morse (2005) Biochim Biophys Acta 1743:5-19; Kunze and Berger (2015) Front Physiol dx.doi.org/10.3389/fphys.2015.00259; Herrmann and Neupert (2003) IUBMB Life 55:219-225; Soll (2002) Curr Opin Plant Biol 5:529-535; Carrie and Small (2013) Biochim Biophys Acta 1833:253-259; Carrie et al. (2009) FEBS J 276:1187-1195; Silva-Filho (2003) Curr Opin Plant Biol 6:589-595; Peeters and Small (2001) Biochim Biophys Acta 1541:54-63; Murcha et al. (2014) J Exp Bot 65:6301-6335; Mackenzie (2005) Trends Cell Biol 15:548-554; Glaser et al. (1998) Plant Mol Biol 38:311-338] 참고).
특정한 실시양태에서, 본원에 개시된 RNA-가이드된 뉴클레아제는 RGN의 세포 흡수를 용이하게 하는 적어도 하나의 세포-투과 도메인을 포함한다. 세포-투과 도메인은 관련 기술분야에 공지되어 있고, 일반적으로 양으로 하전된 아미노산 잔기 (즉, 다중양이온성 세포-투과 도메인), 교대하는 극성 아미노산 잔기 및 비-극성 아미노산 잔기 (즉, 양친매성 세포-투과 도메인), 또는 소수성 아미노산 잔기 (즉, 소수성 세포-투과 도메인)의 스트레치를 포함한다 (예를 들어, [Milletti F. (2012) Drug Discov Today 17:850-860] 참고). 세포-투과 도메인의 비제한적인 예는 인간 면역결핍 바이러스 1로부터의 트랜스-활성화 전사 활성화제 (TAT)이다.
핵 국재화 신호, 색소체 국재화 신호, 미토콘드리아 국재화 신호, 이중-표적화 국재화 신호, 및/또는 세포-투과 도메인은 RNA-가이드된 뉴클레아제의 아미노-말단 (N-말단), 카르복실-말단 (C-말단), 또는 내부 위치에 위치할 수 있다.
본원에 개시된 RGN은 이펙터 도메인, 예컨대 절단 도메인, 데아미나제 도메인, 또는 발현 조절인자 도메인에 직접적으로 또는 링커 펩티드를 통해 간접적으로 융합될 수 있다. 이러한 도메인은 RNA-가이드된 뉴클레아제의 N-말단, C-말단, 또는 내부 위치에 위치할 수 있다. 이들 일부 실시양태에서, 융합 단백질의 RGN 성분은 뉴클레아제-데드 RGN이다.
일부 실시양태에서, RGN 융합 단백질은 절단 도메인을 포함하며, 이는 폴리뉴클레오티드 (즉, RNA, DNA, 또는 RNA/DNA 혼성체)를 절단할 수 있는 임의의 도메인이고, 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제, 예컨대 유형 IIS 엔도뉴클레아제 (예를 들어, FokI)가 포함되나 이로 제한되지 않는다 (예를 들어, [Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993] 참고).
다른 실시양태에서, RGN 융합 단백질은 뉴클레오티드 염기를 탈아미노화시켜 하나의 뉴클레오티드 염기를 또 다른 염기로 전환시키는 데아미나제 도메인을 포함하며, 시티딘 데아미나제 또는 아데노신 데아미나제 염기 편집기가 포함되나 이로 제한되지 않는다 (예를 들어, [Gaudelli et al. (2017) Nature 551:464-471], 미국 공개 번호 2017/0121693 및 2018/0073012, 미국 특허 번호 9,840,699, 및 국제 공개 번호 WO/2018/027078 참고). 추가의 실시양태에서, RGN 융합 단백질은 서열식별번호: 374-545 또는 572-584 중 어느 하나의 아미노산 서열, 또는 그의 활성 변이체를 포함하는 본 발명의 데아미나제를 포함할 수 있다.
다른 실시양태에서, 서열식별번호: 374-545 또는 572-584 중 어느 하나의 아미노산 서열, 또는 그의 활성 변이체를 포함하는 본 발명의 데아미나제는 임의의 DNA-결합 단백질에 융합될 수 있다. 일부 실시양태에서, 데아미나제는 본 발명의 RGN에 융합된다. 다른 실시양태에서, 데아미나제는 관련 기술분야에 공지된 RGN에 융합된다. 다른 실시양태에서, 데아미나제는 RGN이 아닌 DNA-결합 단백질, 예를 들어 메가뉴클레아제, TALEN, 또는 아연 핑거 뉴클레아제에 융합된다. 일부 실시양태에서, 데아미나제는 임의의 서열식별번호: 374-545 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 특정 실시양태에서, 데아미나제는 임의의 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 변이체 데아미나제 폴리펩티드는 서열식별번호: 572-584 중 어느 하나와 특정한 수준의 서열 동일성을 가지며, 특이적인 아미노산 잔기는 모 서열로부터 변하지 않는다. 예를 들어, 일부 실시양태에서, 변이체 서열식별번호: 572는 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 위치 104에 상응하는 위치에서 티로신, 및 위치 106에 상응하는 위치에서 트레오닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 574는 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 위치 103에 상응하는 위치에서 세린, 및 위치 105에 상응하는 위치에서 리신을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 575는 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 위치 103에 상응하는 위치에서 류신, 및 위치 105에 상응하는 위치에서 글루탐산을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 576은 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 위치 107에 상응하는 위치에서 아르기닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 577은 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 위치 104에 상응하는 위치에서 세린, 및 위치 106에 상응하는 위치에서 아르기닌을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 578은 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 위치 107에 상응하는 위치에서 트레오닌을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 579는 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 위치 104에 상응하는 위치에서 글루타민, 및 위치 106에 상응하는 위치에서 글리신을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 580은 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 581은 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 위치 106에 상응하는 위치에서 글리신, 및 위치 108에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 582는 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 위치 104에 상응하는 위치에서 트립토판, 및 위치 106에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 583은 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 위치 106에 상응하는 위치에서 세린을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 584는 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 위치 112에 상응하는 위치에서 세린, 및 위치 114에 상응하는 위치에서 트레오닌을 포함한다.
용어 "데아미나제"는 탈아미노화 반응 (즉, 아미노산 또는 다른 화합물로부터 아미노 기의 제거)을 촉매하는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 각각 시티딘 또는 데옥시시티딘에서 우라실 또는 데옥시우라실로의 가수분해성 탈아미노화를 촉매하는 시티딘 데아미나제이다. 다른 실시양태에서, 데아미나제는 아데닌 데아미나제이다. 아데닌의 탈아미노화는 이노신을 생성하며, 이는 폴리머라제에 의해 구아닌으로 처리된다. 시티딘 데아미나제 및 아데닌 데아미나제는 DNA 또는 RNA에 대해 작용할 수 있지만, 지금까지 DNA에서 아데닌을 탈아미노화하는 천연 발생 아데닌 데아미나제는 공지되어 있지 않다. 그러나, DNA에 대해 유의한 아데노신 데아미나제 활성을 갖는 천연 발생 단백질인 APG07458 (서열식별번호: 514)이 본원에 개시된다. 본 발명의 데아미나제는 DNA 또는 RNA 분자의 편집을 위해 사용될 수 있다. 본 발명의 데아미나제는 그룹으로서 DNA 분자에서 4가지 모든 전이 (C에서 T로, A에서 G로, T에서 C로, 및 G에서 A로) 및 RNA 분자에서 C에서 U로, A에서 G로, 및 G에서 A로의 전이의 프로그래밍가능한 설치를 가능하게 한다.
본 발명의 데아미나제는 단일-가닥 핵산 분자에 대해 작동한다. 표적 가닥에 대해 닉카제 활성을 갖는 RGN은 표적 가닥을 닉킹시키는 반면에, 상보적인 비-표적 가닥은 데아미나제에 의해 변형된다. 세포성 DNA-복구 기구는 주형으로서 변형된 비-표적 가닥을 사용하여 닉킹된 표적 가닥을 복구시켜, DNA에서 돌연변이를 도입시킬 수 있다.
일부 실시양태에서, 데아미나제에 융합된 뉴클레아제 불활성 RGN 또는 닉카제 RGN은 원하는 서열의 발현을 변경시키기 위해 특정한 게놈 위치에 대해 표적화될 수 있다. 일부 실시양태에서, 뉴클레아제 불활성 RGN 또는 닉카제 RGN은 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드 또는 단백질 또는 단백질 도메인으로 지칭될 수 있다. 일부 실시양태에서, 이러한 융합 단백질과 표적 서열의 결합은 뉴클레오티드 염기를 탈아미노화시켜, 한 뉴클레오티드 염기에서 또 다른 것으로 전환시킨다. 일부 실시양태에서, RGN 융합 단백질의 이펙터 도메인은 발현 조절인자 도메인일 수 있고, 이는 전사를 상향조절하거나 또는 하향조절하는 도메인이다. 발현 조절인자 도메인은 후성적 변형 도메인, 전사 리프레서 도메인 또는 전사 활성화 도메인일 수 있다.
이들 일부 실시양태에서, RGN 융합 단백질의 발현 조절인자는 DNA 서열을 변경시키지 않고 히스톤 구조 및/또는 염색체 구조를 변경시키도록 DNA 또는 히스톤 단백질을 공유적으로 변형시켜, 유전자 발현에서의 변화 (즉, 상향조절 또는 하향조절)를 유도하는 후성적 변형 도메인을 포함한다. 후성적 변형의 비제한적인 예에는 DNA에서 리신 잔기의 아세틸화 또는 메틸화, 아르기닌 메틸화, 세린 및 트레오닌 인산화, 및 히스톤 단백질의 리신 유비퀴틴화 및 SUMO화, 및 시토신 잔기의 메틸화 및 히드록시메틸화가 포함된다. 후성적 변형 도메인의 비제한적인 예에는 히스톤 아세틸트랜스퍼라제 도메인, 히스톤 데아세틸라제 도메인, 히스톤 메틸트랜스퍼라제 도메인, 히스톤 데메틸라제 도메인, DNA 메틸트랜스퍼라제 도메인, 및 DNA 데메틸라제 도메인이 포함된다.
다른 실시양태에서, 융합 단백질의 발현 조절인자는 적어도 하나의 유전자의 전사를 감소시키거나 또는 종료시키기 위해, 전사 조절 요소 및/또는 전사 조절 단백질, 예컨대 RNA 폴리머라제 및 전사 인자와 상호작용하는 전사 리프레서 도메인을 포함한다. 전사 리프레서 도메인은 관련 기술분야에 공지되어 있고, Sp1-유사 리프레서, IκB, 및 크루펠(Kruppel) 연관된 박스 (KRAB) 도메인이 포함되나 이로 제한되지 않는다.
여전히 다른 실시양태에서, 융합 단백질의 발현 조절인자는, 적어도 하나의 유전자의 전사를 증가시키거나 또는 활성화시키기 위해, 전사 조절 요소 및/또는 전사 조절 단백질, 예컨대 RNA 폴리머라제 및 전사 인자와 상호작용하는 전사 활성화 도메인을 포함한다. 전사 활성화 도메인은 관련 기술분야에 공지되어 있고, 단순 포진 바이러스 VP16 활성화 도메인 및 NFAT 활성화 도메인이 포함되나 이로 제한되지 않는다.
본원에 개시된 RGN 및 데아미나제 폴리펩티드, 또는 이들의 융합 폴리펩티드는 검출가능한 표지 또는 정제 태그를 포함할 수 있다. 검출가능한 표지 또는 정제 태그는 RNA-가이드된 뉴클레아제의 N-말단, C-말단 또는 내부 위치에 직접적으로 또는 링커 펩티드를 통해 간접적으로 위치할 수 있다. 이들 일부 실시양태에서, 융합 단백질의 RGN 성분은 뉴클레아제-데드 RGN이다. 다른 실시양태에서, 융합 단백질의 RGN 성분은 닉카제 활성을 갖는 RGN이다.
검출가능한 표지는 가시화될 수 있거나 또는 달리 관찰될 수 있는 분자이다. 검출가능한 표지는 융합 단백질 (예를 들어, 형광 단백질)로서 RGN에 융합될 수 있거나, 또는 시각적으로 또는 다른 수단에 의해 검출될 수 있는 RGN 폴리펩티드에 접합된 소분자일 수 있다. 본원에 개시된 RGN 또는 데아미나제에 융합 단백질로서 융합될 수 있는 검출가능한 표지에는 임의의 검출가능한 단백질 도메인, 예컨대 비제한적으로 특이적인 항체에 의해 검출될 수 있는 형광 단백질 또는 단백질 도메인이 포함된다. 형광 단백질의 비제한적인 예에는 녹색 형광 단백질 (예를 들어, GFP, EGFP, ZsGreen1) 및 황색 형광 단백질 (예를 들어, YFP, EYFP, ZsYellow1)이 포함된다. 소분자 검출가능한 표지의 비제한적인 예에는 방사선 활성 표지, 예컨대 3H 및 35S가 포함된다.
본 발명의 RGN 및 데아미나제 폴리펩티드, 또는 이들의 융합 폴리펩티드는 또한 정제 태그를 포함할 수 있고, 이는 혼합물 (예를 들어, 생물학적 샘플, 배양 배지)로부터 단백질 또는 융합된 단백질을 단리하기 위해 사용될 수 있는 임의의 분자이다. 정제 태그의 비제한적인 예에는 비오틴, myc, 말토스 결합 단백질 (MBP), 및 글루타티온-S-트랜스퍼라제 (GST)가 포함된다.
II. 가이드 RNA
본 개시내용은 가이드 RNA, 및 이를 코딩하는 폴리뉴클레오티드를 제공한다. 용어 "가이드 RNA"는, 표적 서열과 혼성화하도록 표적 뉴클레오티드 서열과 충분한 상보성을 가지며, 연관된 RNA-가이드된 뉴클레아제와 표적 뉴클레오티드 서열의 서열-특이적인 결합을 지시하는 뉴클레오티드 서열을 지칭한다. 따라서, RGN의 각각의 가이드 RNA는 RGN에 결합하여 RGN이 특정한 표적 뉴클레오티드 서열과 결합하도록 가이드하는 하나 이상의 RNA 분자 (일반적으로, 1개 또는 2개)이며, 이들 예에서 RGN은 닉카제 또는 뉴클레아제 활성을 갖고, 또한 표적 뉴클레오티드 서열을 절단한다. 일반적으로, 가이드 RNA는 CRISPR RNA (crRNA) 및 트랜스-활성화 CRISPR RNA (tracrRNA)를 포함한다. crRNA 및 tracrRNA 둘 다를 포함하는 본래의 가이드 RNA는 일반적으로 crRNA의 반복 서열 및 tracrRNA의 안티-반복 서열을 통해 서로 혼성화하는 2가지 별도의 RNA 분자를 포함한다.
CRISPR 어레이 내의 본래의 직접적인 반복 서열은 일반적으로 28 내지 37개 염기쌍의 길이 범위를 갖지만, 상기 길이는 약 23 bp 내지 약 55 bp로 달라질 수 있다. CRISPR 어레이 내의 스페이서 서열은 일반적으로 약 32 내지 약 38 bp의 길이 범위를 갖지만, 상기 길이는 약 21 bp 내지 약 72 bp일 수 있다. 각각의 CRISPR 어레이는 일반적으로 CRISPR 반복-스페이서 서열의 50개 미만의 단위를 포함한다. CRISPR은 일차 CRISPR 전사체로 명명되는 긴 전사체의 일부로서 전사되며, 이는 CRISPR 어레이의 대부분을 포함한다. 일차 CRISPR 전사체는 Cas 단백질에 의해 절단되어, crRNA를 생성하거나 또는 일부 경우에는 추가의 Cas 단백질에 의해 성숙 crRNA로 추가로 가공되는 프리-crRNA를 생성한다. 성숙 crRNA는 스페이서 서열 및 CRISPR 반복 서열을 포함한다. 프리-crRNA가 성숙 (또는 가공된) crRNA로 가공되는 일부 실시양태에서, 성숙은 약 1 내지 약 6개 또는 그 초과의 5', 3', 또는 5' 및 3' 뉴클레오티드의 제거를 수반한다. 특정한 관심 표적 뉴클레오티드 서열의 게놈 편집 또는 표적화의 목적을 위해, 프리-crRNA 분자의 성숙 동안에 제거된 이들 뉴클레오티드가 반드시 가이드 RNA를 생성하거나 또는 설계할 필요는 없다.
CRISPR RNA (crRNA)는 스페이서 서열 및 CRISPR 반복 서열을 포함한다. "스페이서 서열"은 관심 표적 뉴클레오티드 서열과 직접적으로 혼성화하는 뉴클레오티드 서열이다. 스페이서 서열은 관심 표적 서열에 의해 완전히 또는 부분적으로 상보성이도록 조작된다. 다양한 실시양태에서, 스페이서 서열은 약 8개 뉴클레오티드 내지 약 30개 뉴클레오티드, 또는 그 초과를 포함할 수 있다. 예를 들어, 스페이서 서열은 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30개, 또는 그 초과의 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 스페이서 서열은 약 10 내지 약 26개 뉴클레오티드 길이, 또는 약 12 내지 약 30개 뉴클레오티드 길이이다. 특정한 실시양태에서, 스페이서 서열은 약 30개 뉴클레오티드 길이이다. 일부 실시양태에서, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬하였을 때 스페이서 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 약 60%, 약 70%, 약 75%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 그 초과이거나, 또는 대략 상기 값 초과이다. 특정한 실시양태에서, 스페이서 서열은 이차 구조를 함유하지 않으며, 이는 관련 기술분야에 공지된 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘, 예컨대 비제한적으로 mFold (예를 들어, [Zuker and Stiegler (1981) Nucleic Acids Res. 9:133-148] 참고) 및 RNAfold (예를 들어, [Gruber et al. (2008) Cell 106(1):23-24] 참고)를 사용하여 예측될 수 있다.
RGN 단백질은 절단 효율에 영향을 미치는 gRNA에서의 스페이서 서열과 그의 표적 서열 사이의 미스매치에 대해 다양한 민감성을 가질 수 있다.
CRISPR RNA 반복 서열은 tracrRNA와 혼성화하도록 충분한 상보성을 갖는 영역을 포함하는 뉴클레오티드 서열을 포함한다. 다양한 실시양태에서, CRISPR RNA 반복 서열은 약 8개 뉴클레오티드 내지 약 30개 뉴클레오티드, 또는 그 초과를 포함할 수 있다. 예를 들어, CRISPR 반복 서열은 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30개, 또는 그 초과의 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, CRISPR 반복 서열은 약 21개 뉴클레오티드 길이이다. 일부 실시양태에서, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬될 때 CRISPR 반복 서열과 그의 상응하는 tracrRNA 서열 사이의 상보성 정도는 약 50%, 약 60%, 약 70%, 약 75%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 그 초과, 또는 대략 상기 값 초과이다. 특정한 실시양태에서, CRISPR 반복 서열은, 가이드 RNA 내에 포함될 때 본원에 제공된 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 CRISPR 반복 서열 변이체는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 CRISPR 반복 서열 단편은 서열식별번호: 2, 17, 25, 36, 44, 또는 51에 제시된 뉴클레오티드 서열의 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속 뉴클레오티드를 포함한다.
특정한 실시양태에서, crRNA는 천연 발생이 아니다. 이들 일부 실시양태에서, 특이적인 CRISPR 반복 서열은 본래 조작된 스페이서 서열에 연결되지 않고, CRISPR 반복 서열은 스페이서 서열에 대해 이종성인 것으로 고려된다. 특정한 실시양태에서, 스페이서 서열은 천연 발생이 아닌 조작된 서열이다.
트랜스-활성화 CRISPR RNA 또는 tracrRNA 분자는 crRNA의 CRISPR 반복 서열과 혼성화하도록 충분한 상보성을 갖는 영역을 포함하는 뉴클레오티드 서열을 포함하며, 이는 본원에서 안티-반복 영역으로 지칭된다. 일부 실시양태에서, tracrRNA 분자는 이차 구조 (예를 들어, 스템-루프)를 갖는 영역을 추가로 포함하거나, 또는 그의 상응하는 crRNA와 혼성화시 이차 구조를 형성한다. 특정한 실시양태에서, CRISPR 반복 서열과 완전히 또는 부분적으로 상보성인 tracrRNA의 영역은 분자의 5' 말단에 있고, tracrRNA의 3' 말단은 이차 구조를 포함한다. 유형 II RGN의 경우, 이러한 이차 구조 영역은 일반적으로 안티-반복 서열과 인접하여 발견되는 몇몇 헤어핀 구조, 예컨대 넥서스 헤어핀을 포함한다. 넥서스 헤어핀은 종종 tracrRNA의 넥서스 헤어핀에서 발견되는 모티프 UNANNC (서열식별번호: 13; APG00969의 경우), ANGNNU (서열식별번호: 23; APG03128의 경우), 또는 UNANNA (서열식별번호: 42; APG00771의 경우)와 함께 헤어핀 스템의 염기에서 보존된 뉴클레오티드 서열을 갖는다. 종종 tracrRNA의 3' 말단에 구조 및 개수가 다양할 수 있지만 종종 GC-풍부 Rho-비의존성 전사 종결인자 헤어핀에 이어서 3' 말단에 U의 문자열을 포함하는 말단 헤어핀이 있다. 예를 들어, [Briner et al. (2014) Molecular Cell 56:333-339, Briner and Barrangou (2016) Cold Spring Harb Protoc; doi: 10.1101/pdb.top090902], 및 미국 공개 번호 2017/0275648을 참고하며, 이들 각각은 그의 전문이 본원에 참고로 포함된다.
다양한 실시양태에서, CRISPR 반복 서열에 대해 완전히 또는 부분적으로 상보성인 tracrRNA의 안티-반복 영역은 약 8개 뉴클레오티드 내지 약 30개 뉴클레오티드, 또는 그 초과를 포함한다. 예를 들어, tracrRNA 안티-반복 서열과 CRISPR 반복 서열 사이의 염기쌍 영역은 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30개, 또는 그 초과의 뉴클레오티드 길이일 수 있다. 특정한 실시양태에서, CRISPR 반복 서열에 대해 완전히 또는 부분적으로 상보성인 tracrRNA의 안티-반복 영역은 약 20개 뉴클레오티드 길이이다. 일부 실시양태에서, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬될 때 CRISPR 반복 서열과 그의 상응하는 tracrRNA 안티-반복 서열 사이의 상보성 정도는 약 50%, 약 60%, 약 70%, 약 75%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 그 초과, 또는 대략 상기 값 초과이다.
다양한 실시양태에서, 전체 tracrRNA는 약 60개 뉴클레오티드 내지 약 140개 초과의 뉴클레오티드를 포함할 수 있다. 예를 들어, tracrRNA는 약 60, 약 65, 약 70, 약 75, 약 80, 약 85, 약 90, 약 95, 약 100, 약 105, 약 110, 약 115, 약 120, 약 125, 약 130, 약 135, 약 140개 또는 그 초과의 뉴클레오티드 길이일 수 있다. 특정한 실시양태에서, tracrRNA는 약 80 내지 약 90개 뉴클레오티드 길이, 예컨대 약 80, 약 81, 약 82, 약 83, 약 84, 약 85, 약 86, 약 87, 약 88, 약 89, 및 약 90개 뉴클레오티드 길이이다. 특정한 실시양태에서, tracrRNA는 약 85개 뉴클레오티드 길이이다.
특정한 실시양태에서, tracrRNA는, 가이드 RNA 내에 포함될 때 본원에 제공된 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 tracrRNA 서열 변이체는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 tracrRNA 서열 단편은 서열식별번호: 3, 18, 26, 37, 45 또는 52에 제시된 뉴클레오티드 서열의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80개 또는 그 초과의 연속 뉴클레오티드를 포함한다.
2개의 폴리뉴클레오티드 서열은 2개의 서열이 엄격도 조건하에 서로 혼성화할 때 실질적으로 상보성인 것으로 고려된다. 마찬가지로, RGN은 RGN에 결합된 가이드 RNA가 엄격도 조건하에 표적 서열에 결합하는 경우 서열-특이적인 방식 내에서 특정한 표적 서열에 결합하는 것으로 고려된다. "엄격도 조건" 또는 "엄격도 혼성화 조건"은 2개의 폴리뉴클레오티드 서열이 다른 서열에 비해 검출가능하게 더 큰 정도로 (예를 들어, 백그라운드에 비해 적어도 2배) 서로 혼성화하도록 하는 의도된 조건이다. 엄격도 조건은 서열-의존성이고, 상이한 환경에서 상이할 것이다. 전형적으로, 엄격도 조건은 염 농도가 pH 7.0 내지 8.3에서 약 1.5 M 미만의 Na 이온, 전형적으로 약 0.01 내지 1.0 M Na 이온 농도 (또는 다른 염)이고 온도가 짧은 서열 (예를 들어, 10 내지 50개 뉴클레오티드)의 경우 적어도 약 30℃ 및 긴 서열 (예를 들어, 50개 초과의 뉴클레오티드)의 경우 적어도 약 60℃인 조건일 것이다. 엄격도 조건은 또한 탈안정화제, 예컨대 포름아미드의 첨가에 의해 달성될 수 있다. 예시적인 저엄격도 조건에는 37℃에서 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS (나트륨 도데실 술페이트)의 완충제 용액에 의한 혼성화, 및 50 내지 55℃에서 1X 내지 2X SSC (20X SSC = 3.0 M NaCl/0.3 M 시트르산삼나트륨) 중에서 세척이 포함된다. 예시적인 중간 엄격도 조건에는 37℃에서 40 내지 45% 포름아미드, 1.0 M NaCl, 1% SDS 중에서 혼성화, 및 55 내지 60℃에서 0.5X 내지 1X SSC 중에서 세척이 포함된다. 예시적인 고엄격도 조건에는 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS 중에서 혼성화, 및 60 내지 65℃에서 0.1X SSC 중에서 세척이 포함된다. 임의적으로, 세척 완충제는 약 0.1% 내지 약 1% SDS를 포함할 수 있다. 혼성화 지속시간은 일반적으로 약 24 시간 미만, 보통 약 4 내지 약 12 시간이다. 세척 지속시간은 적어도 평형에 도달하기에 충분한 시간일 것이다.
Tm은 (정의된 이온 강도 및 pH하에) 상보성 표적 서열의 50%가 매칭된 서열과 완벽하게 혼성화하는 온도이다. DNA-DNA 혼성체의 경우, Tm은 [Meinkoth and Wahl (1984) Anal. Biochem. 138:267-284]의 방정식으로부터 계산될 수 있으며: Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L; 여기서 M은 일가 양이온의 몰 농도이고, %GC는 DNA에서 구아노신 및 시토신 뉴클레오티드의 백분율이고, % form은 혼성화 용액 중에서 포름아미드의 백분율이고, L은 염기쌍에서 혼성체의 길이이다. 일반적으로, 엄격도 조건은 정의된 이온 강도 및 pH에서 특이적인 서열 및 그의 상보체에 대한 열 융점 (Tm)보다 약 5℃ 낮도록 선택된다. 그러나, 매우 엄격도 조건은 열 융점 (Tm)보다 1, 2, 3 또는 4℃ 낮은 온도에서 혼성화 및/또는 세척을 이용할 수 있고; 중간 엄격도 조건은 열 융점 (Tm)보다 6, 7, 8, 9 또는 10℃ 낮은 온도에서 혼성화 및/또는 세척을 이용할 수 있고; 저엄격도 조건은 열 융점 (Tm)보다 11, 12, 13, 14, 15 또는 20℃ 낮은 온도에서 혼성화 및/또는 세척을 이용할 수 있다. 상기 방정식, 혼성화 및 세척 조성물, 및 원하는 Tm을 이용하여, 통상의 기술자는 혼성화 및/또는 세척 용액의 엄격도에서의 변동이 본질적으로 기재되어 있음을 이해할 것이다. 핵산의 혼성화에 대한 광범위한 안내는 [Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier, New York); 및 Ausubel et al., eds. (1995) Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, New York)]에서 확인한다. [Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)]을 참고한다.
가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA 시스템일 수 있다. 단일 가이드 RNA는 RNA의 단일 분자 상에 crRNA 및 tracrRNA를 포함하는 반면에, 이중-가이드 RNA 시스템은 2가지 별개의 RNA 분자 상에 존재하는 crRNA 및 tracrRNA를 포함하며, 이들은 crRNA의 CRISPR 반복 서열의 적어도 일부분, 및 crRNA의 CRISPR 반복 서열에 대해 완전히 또는 부분적으로 상보성일 수 있는 tracrRNA의 적어도 일부분을 통해 서로 혼성화된다. 가이드 RNA가 단일 가이드 RNA인 이들 일부 실시양태에서, crRNA 및 tracrRNA는 링커 뉴클레오티드 서열에 의해 분리된다. 일반적으로, 링커 뉴클레오티드 서열은 링커 뉴클레오티드 서열의 뉴클레오티드 내에서 또는 이를 포함하는 이차 구조의 형성을 피하기 위해 상보성 염기를 포함하지 않는 것이다. 일부 실시양태에서, crRNA와 tracrRNA 사이의 링커 뉴클레오티드 서열은 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12개 또는 그 초과의 뉴클레오티드 길이이다. 특정한 실시양태에서, 단일 가이드 RNA의 링커 뉴클레오티드 서열은 적어도 4개 뉴클레오티드 길이이다. 특정한 실시양태에서, 링커 뉴클레오티드 서열은 서열식별번호: 8 또는 31에 제시된 뉴클레오티드 서열이다. 다른 실시양태에서, 링커 뉴클레오티드 서열은 적어도 6개 뉴클레오티드 길이이다.
단일 가이드 RNA 또는 이중-가이드 RNA는 화학적으로 또는 시험관내 전사를 통해 합성될 수 있다. RGN과 가이드 RNA 사이의 서열-특이적인 결합을 결정하기 위한 검정은 관련 기술분야에 공지되어 있고, 발현된 RGN과 가이드 RNA 사이의 시험관내 결합 검정이 포함되나 이로 제한되지 않으며, 이는 검출가능한 표지 (예를 들어, 비오틴)에 의해 태그 부착될 수 있고, 검출가능한 표지를 통해 (예를 들어, 스트렙타비딘 비드에 의해) 가이드 RNA:RGN 복합체를 포획하는 풀다운(pull-down) 검출 검정에서 이용될 수 있다. 가이드 RNA에 대해 관련이 없는 서열 또는 구조를 갖는 대조군 가이드 RNA는 RGN과 RNA의 비-특이적인 결합에 대한 음성 대조군으로서 사용될 수 있다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 4, 19, 27, 38, 46, 53, 64, 65 또는 66이고, 스페이서 서열은 임의의 서열일 수 있고 폴리-N 서열로 표시된다.
특정한 실시양태에서, 가이드 RNA는 RNA 분자로서 표적 세포, 소기관 또는 배아에 도입될 수 있다. 가이드 RNA는 시험관내에서 전사될 수 있거나 또는 화학적으로 합성될 수 있다. 다른 실시양태에서, 가이드 RNA를 코딩하는 뉴클레오티드 서열은 세포, 소기관 또는 배아에 도입된다. 이들 일부 실시양태에서, 가이드 RNA를 코딩하는 뉴클레오티드 서열은 프로모터 (예를 들어, RNA 폴리머라제 III 프로모터)에 작동가능하게 연결된다. 프로모터는 본래의 프로모터일 수 있거나 또는 가이드 RNA-코딩 뉴클레오티드 서열에 대해 이종성일 수 있다.
다양한 실시양태에서, 가이드 RNA는 본원에 기재된 바와 같이 리보핵단백질 복합체로서 표적 세포, 소기관 또는 배아에 도입될 수 있으며, 가이드 RNA는 RNA-가이드된 뉴클레아제 폴리펩티드에 결합된다.
가이드 RNA는 가이드 RNA와 표적 뉴클레오티드 서열의 혼성화를 통해 연관된 RNA-가이드된 뉴클레아제를 특정한 관심 표적 뉴클레오티드 서열로 지시한다. 표적 뉴클레오티드 서열은 DNA, RNA, 또는 이들 둘의 조합물을 포함할 수 있고, 단일 가닥 또는 이중 가닥일 수 있다. 표적 뉴클레오티드 서열은 게놈 DNA (즉, 염색체 DNA), 플라스미드 DNA, 또는 RNA 분자 (예를 들어, 메신저 RNA, 리보솜 RNA, 전달 RNA, 마이크로 RNA, 소형 간섭 RNA)일 수 있다. 표적 뉴클레오티드 서열은 시험관내에서 또는 세포에서 RNA-가이드된 뉴클레아제에 의해 결합될 수 있다 (그리고 일부 실시양태에서 절단될 수 있다). RGN에 의해 표적화된 염색체 서열은 핵, 색소체 또는 미토콘드리아 염색체 서열일 수 있다. 일부 실시양태에서, 표적 뉴클레오티드 서열은 표적 게놈에서 고유하다.
표적 뉴클레오티드 서열은 프로토스페이서 인접한 모티프 (PAM)에 인접해 있다. 프로토스페이서 인접한 모티프는 일반적으로 표적 뉴클레오티드 서열로부터 약 1 내지 약 10개 뉴클레오티드 이내에, 예컨대 표적 뉴클레오티드 서열로부터 약 1, 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9 또는 약 10개 뉴클레오티드 이내에 있다. PAM은 표적 서열의 5' 또는 3'일 수 있다. 일부 실시양태에서, PAM은 본원에 개시된 RGN에 대한 표적 서열의 3'이다. 일반적으로, PAM은 약 3-4개 뉴클레오티드의 컨센서스 서열이지만, 특정한 실시양태에서 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 초과의 뉴클레오티드 길이일 수 있다. 다양한 실시양태에서, 본원에 개시된 RGN에 의해 인식되는 PAM 서열은 서열식별번호: 7, 22, 30, 41 또는 49에 제시된 컨센서스 서열을 포함한다.
특정한 실시양태에서, 서열식별번호: 1, 16, 24, 35, 43 또는 50을 갖는 RNA-가이드된 뉴클레아제, 또는 그의 활성 변이체 또는 단편은 각각 서열식별번호: 7, 22, 30, 41 또는 49에 제시된 PAM 서열에 인접한 표적 뉴클레오티드 서열에 결합한다. 이들 일부 실시양태에서, RGN은 각각 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 CRISPR 반복 서열을 포함하는 가이드 서열, 또는 그의 활성 변이체 또는 단편, 및 각각 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 tracrRNA 서열, 또는 그의 활성 변이체 또는 단편에 결합한다. RGN 시스템은 본 명세서의 실시예 1 및 표 1에서 추가로 기재된다.
주어진 뉴클레아제 효소에 대한 PAM 서열 특이성이 효소 농도에 의해 영향을 받는다는 것은 관련 기술분야에 널리 공지되어 있고 (예를 들어, [Karvelis et al. (2015) Genome Biol 16:253] 참고), 이는 RGN을 발현하기 위해 사용된 프로모터, 또는 세포, 소기관 또는 배아에 전달된 리보핵단백질 복합체의 양을 변경시킴으로써 변형될 수 있다.
그의 상응하는 PAM 서열을 인식할 때, RGN은 특이적인 절단 부위에서 표적 뉴클레오티드 서열을 절단할 수 있다. 본원에서 사용된 바와 같이, 절단 부위는 표적 뉴클레오티드 서열 내의 2개의 특정한 뉴클레오티드로 구성되며, 이들 사이에서 뉴클레오티드 서열이 RGN에 의해 절단된다. 절단 부위는 5' 또는 3' 방향으로 PAM으로부터 1번째 및 2번째, 2번째 및 3번째, 3번째 및 4번째, 4번째 및 5번째, 5번째 및 6번째, 7번째 및 8번째, 또는 8번째 및 9번째 뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, 절단 부위는 5' 또는 3' 방향으로 PAM으로부터 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드에 걸쳐 있을 수 있다. 일부 실시양태에서, 절단 부위는 PAM으로부터 4개 뉴클레오티드 떨어져 있다. 다른 실시양태에서, 절단 부위는 PAM으로부터 적어도 15개 뉴클레오티드 떨어져 있다. RGN이 표적 뉴클레오티드 서열을 절단하여 엇갈린 말단을 생성할 수 있기 때문에, 일부 실시양태에서, 절단 부위는 폴리뉴클레오티드의 양성 (+) 가닥 상의 PAM으로부터 2개 뉴클레오티드의 거리 및 폴리뉴클레오티드의 음성 (-) 가닥 상의 PAM으로부터 2개 뉴클레오티드의 거리를 기반으로 하여 정의된다.
III. 융합 단백질
본원에서 사용된 바와 같이, 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어 뉴클레아제의 결합 도메인 및 절단 도메인을 연결하는 화학적 기 또는 분자를 지칭한다. 일부 실시양태에서, 링커는 RNA 가이드된 뉴클레아제 및 데아미나제를 결합시킨다. 일부 실시양태에서, 링커는 dCas9 및 데아미나제를 결합시킨다. 전형적으로, 링커는 2개의 기, 분자 또는 다른 모이어티 사이에 위치하거나 또는 그에 의해 플랭킹되고, 공유 결합을 통해 서로 연결되어 이들 둘을 연결시킨다. 일부 실시양태에서, 링커는 아미노산 또는 여러 개의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 또는 150-200개 아미노산 길이이다. 더 길거나 또는 더 짧은 링커 또한 고려된다.
본 개시내용의 일부 측면은 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 단백질을 제공한다. DNA-결합 폴리펩티드는 DNA에 결합하는 임의의 단백질 또는 단백질 도메인일 수 있다. 일부 실시양태에서, 융합 단백질의 DNA-결합 폴리펩티드는 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN이다. 본 개시내용의 일부 측면은 RNA-가이드된 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 RNA-가이드된 뉴클레아제이다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 본 발명의 RGN이다. 일부 실시양태에서, RGN은 본 발명의 RGN이 아니다. 추가의 실시양태에서, RNA-가이드된 뉴클레아제는 CRISPR-Cas 단백질이다. 여전히 추가의 실시양태에서, CRISPR-Cas 단백질은 유형 II CRISPR-Cas 단백질이다. 다른 실시양태에서, CRISPR-Cas 단백질은 유형 V CRISPR-Cas 단백질이다. 다른 실시양태에서, CRISPR-Cas 단백질은 유형 VI CRISPR-Cas 단백질이다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 가이드 RNA에 결합하는 Cas9 도메인이며, 이는 가닥 혼성화를 통해 표적 핵산 서열과 결합한다. 일부 실시양태에서, 데아미나제 폴리펩티드는 예를 들어 시티딘 또는 아데닌과 같은 핵염기를 탈아미노화시킬 수 있는 데아미나제 도메인일 수 있다. 일부 실시양태에서, 데아미나제 폴리펩티드는 임의의 서열식별번호: 374-545 또는 572-584로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함한다. 이들 실시양태의 일부에서, 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함한다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 초래하여, DNA 분자를 변형시킨다. 이러한 변형 작용은 본원에서 핵산 편집, 또는 염기 편집으로도 지칭된다. 따라서, Cas9 변이체 또는 도메인 및 데아미나제 도메인을 포함하는 융합 단백질은 핵산 서열의 표적화된 편집을 위해 사용될 수 있다.
이러한 융합 단백질은 예를 들어 돌연변이성 세포의 생성을 위해 시험관내에서 DNA의 표적화된 편집에 유용하다. 이들 돌연변이성 세포는 식물 또는 동물에 있을 수 있다. 이러한 융합 단백질은 또한 예를 들어 생체 외에서 포유동물 세포에서, 예를 들어 동일한 또는 또 다른 대상체에게 후속적으로 재도입되는 대상체로부터 수득된 세포에서 유전적 결함의 수정을 위해 표적화된 돌연변이를 도입하는데; 및 예를 들어 포유동물 대상체에서 질환-연관된 유전자에서 유전적 결함의 수정 또는 불활성화 돌연변이의 도입을 위해 표적화된 돌연변이를 도입하는데 유용할 수 있다. 이러한 융합 단백질은 또한 식물 세포에서 표적화된 돌연변이를 도입하는데, 예를 들어 유익한 또는 농경학적으로 가치있는 형질 또는 대립유전자를 도입하는데 유용할 수 있다.
본원에서 사용된 바와 같이, 용어 "우라실 글리코실라제 억제제" 또는 "UGI"는 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 수 있는 단백질을 지칭한다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합된 뉴클레아제-불활성 RGN, 예컨대 Cas9 (dCas9)를 포함한다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합된 닉카제 RGN, 예컨대 Cas9 (nCas9)를 포함한다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합되고 추가로 UGI 도메인에 융합된 뉴클레아제 불활성 RGN 또는 닉카제 RGN을 포함한다.
일부 실시양태에서, 융합 단백질의 닉카제 RGN은 RGN이 핵산 듀플렉스의 표적 가닥 (PAM을 포함하는 가닥)만을 절단할 수 있게 하는 D10A 돌연변이 또는 상동적으로 등가의 돌연변이 (서열식별번호: 569; 또는 유사하게 서열식별번호: 553)를 포함한다. 일부 실시양태에서, 융합 단백질의 뉴클레아제-불활성 ("데드") RGN은 RGN이 DNA 표적을 절단할 수 없게 만드는 D10A 돌연변이 및 H840A 돌연변이 또는 상동적으로 등가의 돌연변이 (서열식별번호: 568; 또는 유사하게 서열식별번호: 547)를 포함한다. 일부 실시양태에서, 융합 단백질의 닉카제 RGN은 RGN이 핵산 듀플렉스의 비-표적 가닥 (PAM을 포함하지 않는 가닥)만을 절단할 수 있게 하는 H840A 돌연변이를 포함한다. H840A 돌연변이 또는 등가의 돌연변이를 포함하는 닉카제 RGN은 불활성화된 HNH 도메인을 갖는다. D10A 돌연변이 또는 등가의 돌연변이를 포함하는 닉카제 RGN은 불활성화된 RuvC 도메인을 갖는다. 데아미나제는 비-표적 가닥에 대해 작용한다. D10A 돌연변이 또는 등가의 돌연변이를 포함하는 닉카제는 불활성 RuvC 뉴클레아제 도메인을 갖고, DNA의 비-표적화된 가닥, 즉, 염기 편집을 원하는 가닥을 절단할 수 없다.
일부 실시양태에서, 본원에 기재된 융합 단백질의 RGN은 닉카제 활성을 가지며, 닉카제는 RGN의 단편 또는 RGN의 닉카제 변이체일 수 있다. 일부 실시양태에서, 본원에 기재된 융합 단백질의 RGN 도메인은 적어도 부분적으로 불활성화된 뉴클레아제 활성을 가지며, RNA-가이드된 DNA-결합 폴리펩티드로 지칭될 수 있다. 본원에 기재된 상기 융합 단백질의 사용 방법 또한 제공된다. 일부 실시양태에서, RGN은 Cas9 단백질이다. 비제한적인 예시적인 뉴클레아제-불활성 및 닉카제 Cas9 도메인이 본원에서 제공된다. 한 예시적인 적합한 뉴클레아제-불활성 RGN 도메인은 D10A/H840A Cas9 도메인 돌연변이체이다 (예를 들어, [Qi et al., Cell. 2013; 152(5): 1173-83]을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨). 추가의 적합한 뉴클레아제-불활성 Cas9 도메인은 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다. 이러한 추가의 예시적인 적합한 뉴클레아제 불활성 Cas9 도메인에는 D10A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이성 도메인이 포함되나 이로 제한되지 않는다 (예를 들어, [Mali et al., Nature Biotechnology. 2013; 31(9): 833-838]을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨). 추가로, 다른 공지된 RGN의 적합한 뉴클레아제-불활성 RGN 도메인이 결정될 수 있다 (예를 들어, 서열식별번호: 547, RGN APG08290.1의 뉴클레아제-불활성 변이체; 미국 특허 출원 번호 16/432,321을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨).
본 개시내용의 일부 측면은 (i) 뉴클레아제-불활성 또는 닉카제 RGN 또는 도메인; 및 (ii) 데아미나제 효소 또는 도메인을 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 DNA-편집 효소 또는 도메인이다. 일부 실시양태에서, 데아미나제 효소는 데아미나제 활성을 갖는다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 데아미나제 도메인이거나 또는 그를 포함한다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 패밀리 데아미나제이다. 다른 실시양태에서, 데아미나제는 APOBEC3 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 시티딘 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 ACF1/ASE 데아미나제이다. 일부 실시양태에서, 데아미나제는 아데노신 데아미나제이다. 일부 실시양태에서, 데아미나제는 ADAT 패밀리 데아미나제이다. 일부 핵산 데아미나제 효소 및 도메인은 본원에서 상세하게 기재된다 (표 17 참고). 추가의 적합한 데아미나제 효소 또는 도메인은 본 개시내용을 기반으로 하여 기술자에게 자명할 것이다. 이들 실시양태의 일부에서, 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함한다.
본 개시내용은 다양한 구성의 융합 단백질을 제공한다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 RGN 도메인의 N-말단에 융합된다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 RGN 도메인의 C-말단에 융합된다. 일부 실시양태에서, 링커는 (GGGGS)n (서열식별번호: 585), (G)n (서열식별번호: 586), (EAAAK)n (서열식별번호: 587), 또는 (XP)n (서열식별번호: 588) 모티프, 또는 이들의 임의의 조합물을 포함하고, 여기서 n은 독립적으로 1 내지 30의 정수이다. 일부 실시양태에서, n은 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30이거나, 또는 1개 초과의 링커 또는 1개 초과의 링커 모티프가 존재하는 경우, 이들의 임의의 조합이다. 추가의 적합한 링커 모티프 및 링커 구성은 관련 기술분야의 기술자에게 자명할 것이다. 일부 실시양태에서, 적합한 링커 모티프 및 구성에는 [Chen et al., Fusion protein linkers: property, design and functionality (Adv Drug Deliv Rev. 2013; 65(10):1357-69]에 기재된 것들이 포함되며, 그의 전체 내용은 본원에 참고로 포함된다. 추가의 적합한 링커 서열은 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다.
일부 실시양태에서, 본원에 기재된 예시적인 융합 단백질의 일반적인 아키텍쳐는 하기 구조를 포함하며: [NH2]-[데아미나제 효소 또는 도메인]-[RGN 단백질 또는 도메인][COOH] 또는 [NH2]-[RGN 단백질 또는 도메인]-[데아미나제 효소 또는 도메인][COOH], 여기서 NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 추가의 특징, 예를 들어 NLS와 융합 단백질의 나머지 사이에 및/또는 데아미나제 효소 또는 도메인과 RGN 단백질 또는 도메인 사이에 하나 이상의 링커 서열이 존재할 수 있다. 존재할 수 있는 다른 예시적인 특징은 국재화 서열, 예컨대 핵 국재화 서열, 세포질 국재화 서열, 수출 서열, 예컨대 핵 수출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제 또는 검출에 유용한 서열 태그이다. 본원에 제공된 적합한 국재화 신호 서열 및 단백질 태그 서열에는 비오틴 카르복실라제 운반 단백질 (BCCP) 태그, myc-태그, 칼모듈린-태그, FLAG-태그, 헤마글루티닌 (HA)-태그, 폴리히스티딘 태그 (히스티딘 태그 또는 His-태그로도 지칭됨), 말토스 결합 단백질 (MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제 (GST)-태그, 녹색 형광 단백질 (GFP)-태그, 티오레독신-태그, S-태그, 소프태그 (예를 들어, 소프태그 1, 소프태그 3), 스트렙태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그가 포함되나 이로 제한되지 않는다. 추가의 적합한 서열은 관련 기술분야의 기술자에게 자명할 것이다.
일부 실시양태에서, 데아미나제 효소, 또는 데아미나제 효소 또는 도메인을 갖는 예시적인 융합 단백질의 일반적인 아키텍쳐는 하기 구조를 포함하며: [NH2]-[NLS]-[RGN 단백질 또는 도메인]-[데아미나제]-[COOH], [NH2]-[NLS]-[데아미나제]-[RGN 단백질 또는 도메인]-[COOH], [NH2]-[RGN 단백질 또는 도메인]-[데아미나제]-[COOH], 또는 [NH2]-[데아미나제]-[RGN 단백질 또는 도메인]-[COOH], 여기서 NLS는 핵 국재화 신호이고, NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 일부 실시양태에서, 링커는 RGN 단백질 또는 도메인과 데아미나제 사이에 삽입된다. 일부 실시양태에서, NLS는 데아미나제 및/또는 RGN 단백질 또는 도메인의 C-말단에 위치한다. 일부 실시양태에서, NLS는 데아미나제와 RGN 단백질 또는 도메인 사이에 위치한다. 추가의 특징, 예컨대 서열 태그 또한 존재할 수 있다. 본원에서 "RGN 단백질 또는 도메인"은 임의의 RNA-가이드된 뉴클레아제, 예컨대 CRISPR-Cas 단백질 및 그의 변이체 및 돌연변이체를 나타내며, 이는 본 발명의 융합 단백질을 생성하기 위해 사용될 수 있다. RGN 단백질은 뉴클레아제-불활성 RGN 또는 CRISPR-Cas, 예컨대 예를 들어 dCas9 (서열식별번호: 568) 또는 대안적으로 서열식별번호: 547, 또는 RGN 또는 Cas9 닉카제, 예를 들어 서열식별번호: 569 (또는 서열식별번호: 553)일 수 있다. 일부 실시양태에서, 본 발명의 융합 단백질은 RNA-가이드된 DNA-결합 폴리펩티드 및 데아미나제를 포함하고, 데아미나제는 임의의 서열식별번호: 374-545 또는 572-584, 또는 그의 활성 변이체와 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 융합 단백질은 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함하는 데아미나제 폴리펩티드를 포함한다. 이러한 융합 단백질의 예는 본원에서 실시예 부분에 기재된다.
데아미나제 효소 및 도메인의 한 예시적인 적합한 유형은 예를 들어 APOBEC 패밀리의 시토신 데아미나제이다. 시토신 데아미나제 효소의 아포지단백질 B mRNA 편집 복합체 (APOBEC) 패밀리는 제어되고 유익한 방식으로 돌연변이 유발을 개시하기 위해 작용하는 11개의 단백질을 포함한다 (Conticello et al., 2008. Genome Biology, 9(6): 229). 한 패밀리 구성원인 활성화-유도된 시티딘 데아미나제 (AID)는 전사 의존적인 가닥-편향된 방식으로 ssDNA에서 시토신을 우라실로 전환시킴으로써 항체의 성숙을 담당한다 (Reynaud et al., 2003. Nature Immunology, 4(7): 631-638). 아포지단백질 B 편집 복합체 3 (APOBEC3) 효소는 역전사된 바이러스 ssDNA에서 시토신의 탈아미노화를 통해 특정한 HIV-1 균주에 대한 인간 세포의 보호를 제공한다 (Bhagwat et al., 2004, 3(1): 85-9). 이들 단백질은 모두 촉매적 활성을 위해 Zn2+-배위 모티프 (HisX- Glu-X23-26-Pro-Cys-X2-4-Cys; 서열식별번호: 589) 및 결합된 물 분자를 필요로 한다. Glu 잔기는 탈아미노화 반응에서 친핵성 공격을 위해 물 분자를 수산화아연으로 활성화시키는 역할을 한다. 각각의 패밀리 구성원은 hAID의 경우 WRC (W는 A 또는 T이고, R은 A 또는 G임)에서부터 hAPOBEC3F의 경우 TTC에 이르는 그 자신의 특정한 "핫스팟"에서 우세하게 탈아미노화한다 (Navaratnam et al., 2006. Intl J Hematol 83(3): 195-200). APOBEC3G의 촉매적 도메인의 최근의 결정 구조는 6개의 α-나선에 의해 플랭킹된 5-가닥 β-시트 코어로 구성된 이차 구조를 밝혀 내었으며, 이는 전체 패밀리에 걸쳐 보존되는 것으로 믿어진다 (Holden et al., 2008. Nature 456(7218): 121-124). 활성 중심 루프는 ssDNA 결합 및 "핫스팟" 동일성 결정 둘 다를 담당하는 것으로 확인되었다 (Chelico et al., 2009. J Biol Chem 284(41): 27761-27765). 이들 효소의 과발현은 게놈 불안정성 및 암과 관련이 있으며, 그에 따라 서열-특이적인 표적화의 중요성을 강조한다 (Pham et al., 2005. Biochem 44(8): 2703-2715).
데아미나제 효소 및 도메인의 또 다른 예시적인 적합한 유형은 아데노신 데아미나제이다. ADAT 패밀리 아데노신 데아미나제는 RGN 또는 RGN의 단편 또는 도메인 또는 그의 변이체, 예를 들어 뉴클레아제-불활성 Cas9 도메인에 융합될 수 있으며, 그에 따라 Cas9-ADAT 융합 단백질을 생성한다. 본 개시내용은 RGN 또는 RGN의 단편 또는 도메인 또는 그의 변이체와 데아미나제 효소, 예를 들어 시토신 데아미나제, 예컨대 APOBEC 효소, 또는 아데노신 데아미나제 효소, 예컨대 ADAT 효소 사이의 체계적인 일련의 융합을 포함하며, 이로써 RGN-데아미나제 융합체는 게놈 DNA에서 특이적인 부위에 대한 데아미나제의 효소 활성을 지시한다. 인식 작용제로서 RGN 사용의 이점은 두 가지이다: (1) 융합 단백질의 서열 특이성은 sgRNA 서열을 간단히 변화시킴으로써 용이하게 변경될 수 있고, (2) RGN, 예컨대 Cas9는 dsDNA를 변성시킴으로써 그의 표적 서열에 결합하여, 단일-가닥인 DNA의 스트레치, 따라서 데아미나제의 생존가능한 기질을 생성한다. 성공적인 융합 단백질은 인간 및 마우스 데아미나제 도메인, 예를 들어 AID 도메인에 의해 생성되었다 (WO 2010132092, 본원에 참고로 포함됨). 본원에 인용된 데아미나제와 RGN 사이의 다양한 다른 융합 단백질 또한 고려된다.
RGN-DNA 복합체 (RGN-DNA 버블의 크기)에서 단일 가닥인 DNA의 부분은 설명되지 않았다. 그러나, sgRNA가 비-주형 가닥에 결합할 때에만 전사 간섭이 발생한다는 것이 전사를 간섭하도록 복합체에 대해 특이적으로 설계된 sgRNA를 갖는 dCas9 시스템에서 확인되었다. 이 결과는 DNA-Cas9 복합체에서 DNA의 특정한 부분이 Cas9에 의해 보호되지 않고, 융합 단백질에서 데아미나제에 의해 잠재적으로 표적화될 수 있음을 시사한다 (Qi et al., 2013. Cell 152(15): 1173-83). 따라서, 데아미나제 도메인을 갖는 Cas9의 N-말단 및 C-말단 융합 둘 다 또는 일반적으로 RGN은 본 개시내용의 측면에 따라 유용하다.
일부 실시양태에서, RGN의 데아미나제 도메인 및 RNA-가이드된 DNA-결합 도메인은 링커를 통해 서로 융합된다. 데아미나제 도메인 (예를 들어, AID)과 RGN 도메인 사이에 다양한 링커 길이 및 가요성이 이용될 수 있다 (예를 들어, 특정한 적용을 위해 데아미나제 활성에 대한 최적의 길이를 달성하기 위해 (GGGGS)n (서열식별번호 590) 및 (G)n 형태의 매우 가요성인 링커에서부터 (EAAAK)n (서열식별번호: 591) 및 (XP)n 형태의 더욱 강직한 링커에 이르는 범위).
본 개시내용의 측면에 따라 RNA-가이드된 DNA-결합 도메인에 융합될 수 있는 일부 예시적인 적합한 핵산 편집 효소 및 도메인, 예를 들어 데아미나제 및 데아미나제 도메인이 제공된다 (서열식별번호: 374-545 및 572-584). 일부 실시양태에서, 각각의 서열의 활성 도메인, 예를 들어 국재화 신호 (핵 국재화 신호, 핵 수출 신호없이, 세포질 국재화 신호)가 없는 도메인이 사용될 수 있는 것으로 이해될 것이다.
일부 실시양태에서, 본원에 제공된 융합 단백질은 데아미나제 효소의 전장 아미노산, 예를 들어 서열식별번호: 374-545 또는 572-584 중 어느 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에 제공된 융합 단백질은 핵산 편집 효소의 전장 서열을 포함하지 않고, 그의 단편만을 포함한다. 예를 들어, 일부 실시양태에서, 본원에 제공된 융합 단백질은 예를 들어 RNA-가이드된 DNA-결합 도메인 및 데아미나제 효소의 단편을 포함하고, 상기 단편은 데아미나제 도메인을 포함한다. 데아미나제 도메인의 예시적인 아미노산 서열은 표 17에 기재되고, 이러한 도메인의 추가의 적합한 서열은 관련 기술분야의 기술자에게 자명할 것이다.
본 발명의 측면에 따라 사용될 수 있는, 예를 들어 뉴클레아제-불활성 또는 닉카제 RGN 도메인에 융합될 수 있는 추가의 적합한 핵산 편집 효소 서열, 예를 들어 데아미나제 효소 및 도메인 서열은 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다. 일부 실시양태에서, 이러한 추가의 효소 서열에는 본원에 제공된 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 유사한 데아미나제 효소 또는 데아미나제 도메인 서열이 포함된다. 추가의 적합한 RGN 도메인, 변이체 및 서열 또한 관련 기술분야의 기술자에게 자명할 것이다. 이러한 추가의 적합한 RGN 도메인의 예에는 Dl0A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이성 도메인이 포함되나 이로 제한되지 않는다 (예를 들어, [Mali et al., Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838]을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨).
RNA-가이드된 DNA-결합 도메인 및 데아미나제 도메인을 포함하는 융합 단백질을 생성하기 위한 추가의 적합한 전략은 관련 기술분야의 일반적인 지식과 함께 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다. 링커를 사용하거나 또는 링커를 사용하지 않고 본 개시내용의 측면에 따른 융합 단백질을 생성하기 위한 적합한 전략은 또한 본 개시내용 및 관련 기술분야의 지식에 비추어 관련 기술분야의 기술자에게 자명할 것이다.
일부 실시양태에서, RNA-가이드된 DNA-결합 도메인은 닉카제 활성을 갖는 RGN 단백질 변이체이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 도메인은 RGN 닉카제이다. 일부 실시양태에서, RGN은 본 발명의 RGN이다. 다른 실시양태에서, RGN은 본 발명의 RGN이 아니다. RGN 닉카제는 듀플렉스 핵산 분자 (예를 들어, 듀플렉스 DNA 분자, 이중-가닥 DNA 분자로도 지칭됨)의 한 가닥만을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 실시양태에서, RGN 닉카제는 듀플렉스 핵산 분자의 표적 가닥을 절단하며, 이는 RGN 닉카제가 RGN에 결합된 gRNA와 염기쌍을 형성한 (그에 대해 상보성인) 가닥을 절단함을 의미한다. 일부 실시양태에서, RGN 닉카제는 Dl0A 돌연변이 또는 등가의 돌연변이를 포함한다. 다른 실시양태에서, RGN 닉카제는 H840A 돌연변이 또는 등가의 돌연변이를 포함한다. 예를 들어, RGN 닉카제는 서열식별번호: 569에 제시된 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, RGN 닉카제는 D10A Cas9 닉카제이며, 이는 Cas9의 RuvC 도메인을 불활성화시키고, 듀플렉스 핵산 분자의 표적 비-염기 편집된 가닥을 절단시키며, 이는 D10A Cas9 닉카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)와 염기쌍을 형성한 염기인 가닥을 절단한다. 일부 실시양태에서, Cas9 닉카제는 H840A 돌연변이를 포함하고, 이는 Cas9 폴리펩티드의 HNH 도메인을 불활성화시킨다. H840A Cas9 닉카제는 비-표적 염기-편집된 가닥을 절단할 것이다. 일부 실시양태에서, RGN 닉카제는 서열식별번호: 568, 569, 547 또는 553과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 닉카제로 돌연변이된 추가의 적합한 RGN 단백질은 본 개시내용 및 관련 기술분야의 지식 (예를 들어 미국 특허 출원 번호 16/432,321에 개시된 RGN)을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이고, 본 개시내용의 범위 내에 있다.
본 개시내용의 일부 측면은 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하는 융합 단백질에 관한 것이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 도메인 (예를 들어, 뉴클레아제 활성 RGN 도메인, 또는 뉴클레아제 불활성이거나 또는 닉카제로서 기능하는 RGN 변이체)을 포함하는 본원에 제공된 임의의 융합 단백질은 적어도 하나의 UGI 도메인에 직접적으로 또는 링커를 통해 추가로 융합될 수 있다. 일부 실시양태에서, 융합 단백질은 적어도 2개의 UGI 도메인에 직접적으로 또는 링커를 통해 추가로 융합된다. 본 개시내용의 일부 측면은 적어도 1개의 UGI 도메인에 추가로 융합되고, UGI 도메인을 포함하지 않는 유사한 융합 단백질과 비교하여 증가된 C→T 핵염기 편집 효율을 갖는, 데아미나제-RGN 융합 단백질, 데아미나제-뉴클레아제 불활성 RGN 융합 단백질 및 데아미나제-닉카제 RGN 융합 단백질을 제공한다. 임의의 특정한 이론에 구애되기를 바라진 않지만, U:G 헤테로듀플렉스 DNA의 존재에 대한 세포성 DNA-복구 반응은 세포에서 핵염기 편집 효율의 감소에 대한 원인일 수 있다. 예를 들어, 우라실 DNA 글리코실라제 (UDG)는 세포에서 DNA로부터 U의 제거를 촉매하며, 이는 염기 절제 복구를 개시할 수 있으며, 가장 일반적인 결과로서 U:G 쌍에서 C:G 쌍으로 역전시킨다.
본 개시내용은 UGI 도메인에 추가로 융합된, 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 단백질을 고려한다. 본 개시내용은 또한 UGI 도메인에 추가로 융합된, 데아미나제, RGN 닉카제 또는 뉴클레아제 불활성 RGN 폴리펩티드를 포함하는 융합 단백질을 고려한다. UGI 도메인의 사용이 C에서 U로의 변화를 촉매할 수 있는 핵산 편집 도메인의 편집 효율을 증가시킬 수 있음을 이해해야 한다. 예를 들어, UGI 도메인을 포함하는 융합 단백질은 C 잔기를 탈아미노화시키는데 더욱 효율적일 수 있다. 일부 실시양태에서, 융합 단백질은 하기 구조를 포함한다: [데아미나제]-[임의적인 링커 서열]- [뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[UGI]; [데아미나제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[뉴클레아제-불활성 RGN]; [UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[뉴클레아제-불활성 RGN]; [UGI]-[임의적인 링커 서열]-[뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[데아미나제]; [뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[UGI]; 또는 [뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[데아미나제]. "뉴클레아제-불활성 RGN"이 뉴클레아제-불활성으로 돌연변이된 임의의 RGN, 예컨대 임의의 CRISPR-Cas 단백질을 나타냄을 이해해야 한다. 또한, "UGI"가 1개 이상의 UGI 도메인을 나타냄을 이해해야 한다.
다른 실시양태에서, 융합 단백질은 하기 구조를 포함한다: [데아미나제]-[임의적인 링커 서열]-[RGN 닉카제]-[임의적인 링커 서열]-[UGI]; [데아미나제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[RGN 닉카제]; [UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[RGN 닉카제]; [UGI]-[임의적인 링커 서열]-[RGN 닉카제]-[임의적인 링커 서열]-[데아미나제]; [RGN 닉카제]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[UGI]; 또는 [RGN 닉카제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[데아미나제]. "RGN 닉카제"가 닉카제로서 활성인 것으로 돌연변이된 임의의 RGN, 예컨대 임의의 CRISPR-Cas 단백질을 나타냄을 이해해야 한다. 또한, "UGI"가 1개 이상의 UGI 도메인을 나타냄을 이해해야 한다.
일부 실시양태에서, 본원에 제공된 융합 단백질은 링커 서열을 포함하지 않는다. 일부 실시양태에서, 임의적인 링커 서열 중 하나 또는 둘 다가 존재한다.
일부 실시양태에서, 상기 일반적인 아키텍쳐에서 사용된 "-"는 임의적인 링커 서열의 존재를 나타낸다. 일부 실시양태에서, UGI를 포함하는 융합 단백질은 핵 표적화 서열, 예를 들어 핵 국재화 서열을 추가로 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질은 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 융합 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 융합 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 RGN 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 RGN 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 데아미나제의 N-말단에 융합된다. 일부 실시양태에서, NLS는 데아미나제의 C-말단에 융합된다. 일부 실시양태에서, NLS는 제2 RGN의 N-말단에 융합된다. 일부 실시양태에서, NLS는 제2 RGN의 C-말단에 융합된다. 일부 실시양태에서, NLS는 하나 이상의 링커를 통해 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 링커없이 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 본원에 제공되거나 또는 참고된 NLS 서열 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, NLS는 서열식별번호: 10에 제시된 아미노산 서열을 포함한다.
일부 실시양태에서, UGI 도메인은 야생형 UGI 또는 서열식별번호: 570에 제시된 UGI를 포함한다. 일부 실시양태에서, 본원에 제공된 UGI 단백질에는 UGI의 단편, 및 UGI 또는 UGI 단편에 대해 상동성인 단백질이 포함된다. 예를 들어, 일부 실시양태에서, UGI 도메인은 서열식별번호: 570에 제공된 아미노산 서열의 단편을 포함한다. 일부 실시양태에서, UGI 단편은 서열식별번호: 570에 제시된 아미노산 서열의 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5%를 포함하는 아미노산 서열을 포함한다. 일부 실시양태에서, UGI는 서열식별번호: 570에 제시된 아미노산 서열에 대해 상동성인 아미노산 서열 또는 서열식별번호: 570에 제시된 아미노산 서열의 단편에 대해 상동성인 아미노산 서열을 포함한다. 일부 실시양태에서, UGI 또는 UGI 단편, 또는 UGI 또는 UGI 단편의 상동체를 포함하는 단백질은 "UGI 변이체"로 지칭된다. UGI 변이체는 UGI 또는 그의 단편과 상동성을 공유한다. 예를 들어, UGI 변이체는 야생형 UGI 또는 서열식별번호: 570에 제시된 UGI와 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 적어도 99.9% 동일한 것이다. 일부 실시양태에서, UGI 변이체는 UGI의 단편을 포함하며, 상기 단편은 야생형 UGI 또는 서열식별번호: 570에 제시된 UGI의 상응하는 단편과 적어도 70% 동일한, 적어도 80% 동일한, 적어도 90% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 적어도 99.9%이다.
적합한 UGI 단백질 및 뉴클레오티드 서열은 본원에 제공되고, 추가의 적합한 UGI 서열은 관련 기술분야의 기술자에게 공지되어 있으며, 예를 들어 [Wang et al., 1989. J. Biol. Chem. 264: 1163-1171; Lundquist et al., 1997. J. Biol. Chem. 272:21408-21419; Ravishankar et al., 1998. Nucleic Acids Res. 26:4880-4887; 및 Putnam et al., 1999. J. Mol. Biol. 287:331-346(1999)]에 공개된 것들이 포함되고, 이들 각각의 전체 내용은 본원에 참고로 포함된다.
추가의 단백질이 우라실 글리코실라제 억제제일 수 있음을 이해해야 한다. 예를 들어, 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 수 있는 (예를 들어, 입체적으로 차단할 수 있는) 다른 단백질은 본 개시내용의 범위 내에 있다. 추가로, 염기-절제 복구를 차단하거나 또는 억제하는 임의의 단백질 또한 본 개시내용의 범위 내에 있다. 일부 실시양태에서, DNA와 결합하는 단백질이 사용된다. 또 다른 실시양태에서, UGI에 대한 대용물이 사용된다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 단일-가닥 DNA와 결합하는 단백질이다. 예를 들어, 우라실 글리코실라제 억제제는 에르위니아 타스마니엔시스(Erwinia tasmaniensis) 단일-가닥 결합 단백질일 수 있다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 우라실과 결합하는 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 DNA에서 우라실과 결합하는 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 촉매적으로 불활성인 우라실 DNA-글리코실라제 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 DNA로부터 우라실을 절제하지 않는 촉매적으로 불활성인 우라실 DNA-글리코실라제 단백질이다. 다른 우라실 글리코실라제 억제제는 관련 기술분야의 기술자에게 자명하며 본 개시내용의 범위 내에 있는 것으로 이해해야 한다. 적합한 UGI 단백질 서열 (서열식별번호: 570)이 본원에서 제공되고, 추가의 적합한 UGI 서열은 관련 기술분야에 공지되어 있으며, 예를 들어 [Wang et al., 1989. J. Biol. Chem. 264: 1163-1171; Lundquist et al., 1997. J. Biol. Chem. 272:21408-21419; Ravishankar et al. 1998. Nucleic Acids Res. 26:4880-4887; 및 Putnam et al., 1999. J. Mol. Biol. 287:331-346]에 공개된 것들이 포함되고, 그의 전체 내용은 본원에 참고로 포함된다. 일부 실시양태에서, 임의적인 링커는 (SGGS)n (서열식별번호: 592) 모티프를 포함하고, 여기서 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 19, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20이다. 일부 실시양태에서, 임의적인 링커는 서열식별번호: 546에 제시된 아미노산 서열을 포함한다.
특정 실시양태에서, 본원에 개시된 융합 단백질은 RGN의 세포 흡수를 용이하게 하는 적어도 하나의 세포-투과 도메인을 포함한다. 세포-투과 도메인은 관련 기술분야에 공지되어 있으며, 일반적으로 양으로 하전된 아미노산 잔기 (즉, 다중양이온성 세포-투과 도메인), 교대하는 극성 아미노산 잔기 및 비극성 아미노산 잔기 (즉, 양친매성 세포-투과 도메인), 또는 소수성 아미노산 잔기 (즉, 소수성 세포-투과 도메인)의 스트레치를 포함한다 (예를 들어, [Milletti F. (2012) Drug Discov Today 17:850-860] 참고). 세포-투과 도메인의 비제한적인 예는 인간 면역결핍 바이러스 1로부터의 트랜스-활성화 전사 활성화제 (TAT)이다.
핵 국재화 신호, 색소체 국재화 신호, 미토콘드리아 국재화 신호, 이중-표적화 국재화 신호, 및/또는 세포-투과 도메인은 융합 단백질의 아미노-말단 (N-말단), 카르복실-말단 (C-말단) 또는 내부 위치에 위치할 수 있다.
본 발명의 또 다른 실시양태는 융합 단백질, 및 단일 가이드 또는 이중 가이드 RNA로서 가이드 RNA (집합적으로 gRNA로 지칭됨)를 포함하는 리보핵단백질 복합체이다.
IV. RNA-가이드된 뉴클레아제, RNA-가이드된 DNA 결합 폴리펩티드, 데아미나제, CRISPR RNA, tracrRNA, 및 gRNA를 코딩하는 뉴클레오티드
본 개시내용은 본원에 개시된 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, CRISPR RNA, tracrRNA 및/또는 sgRNA를 포함하는 폴리뉴클레오티드를 제공한다. 본원에 개시된 폴리뉴클레오티드에는, 가이드 RNA 내에 포함될 때 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하거나 또는 코딩하는 폴리뉴클레오티드, 또는 그의 활성 변이체 또는 단편이 포함된다. 가이드 RNA 내에 포함될 때 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하거나 또는 코딩하는 폴리뉴클레오티드, 또는 그의 활성 변이체 또는 단편 또한 개시된다. RNA-가이드된 서열-특이적인 방식으로 표적 뉴클레오티드 서열에 결합하는 능력을 보유하는 서열식별번호: 1, 16, 24, 35, 43 또는 50에 제시된 아미노산 서열을 포함하는 RGN을 코딩하는 폴리뉴클레오티드, 및 그의 활성 단편 또는 변이체 또한 제공된다.
본 개시내용은 본원에 인용된 데아미나제 (서열식별번호: 374-545 및 572-584, 또는 그의 활성 변이체) 및 DNA 결합 폴리펩티드, 예를 들어 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN를 포함하는 융합 단백질을 코딩하는 폴리뉴클레오티드를 추가로 제공한다. 본 개시내용은 본원에 인용된 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 단백질을 코딩하는 폴리뉴클레오티드를 추가로 제공한다. 이러한 RNA-가이드된 DNA-결합 폴리펩티드는 본 발명의 RGN, 관련 기술분야에 공지된 RGN, CRISPR-Cas 단백질, 또는 이들의 임의의 단백질 변이체일 수 있다. 단백질 변이체는 뉴클레아제-불활성이거나 또는 닉카제일 수 있다. 이러한 RGN 변이체의 예에는 뉴클레아제-불활성 RGN (서열식별번호: 568 또는 서열식별번호: 547) 또는 RGN 닉카제 돌연변이체 (서열식별번호: 569 또는 서열식별번호: 553)가 포함된다. RGN 뉴클레아제의 다른 예는 관련 기술분야에 널리 공지되어 있으며, 유사한 상응하는 돌연변이는 뉴클레아제 불활성이거나 또는 닉카제인 돌연변이성 변이체를 생성할 수 있다.
용어 "폴리뉴클레오티드"의 사용은 본 개시내용을 DNA를 포함하는 폴리뉴클레오티드로 제한하는 것으로 의도되지 않는다. 관련 기술분야의 통상의 기술자는 폴리뉴클레오티드가 리보뉴클레오티드 (RNA), 및 리보뉴클레오티드 및 데옥시리보뉴클레오티드의 조합물을 포함할 수 있음을 인지할 것이다. 이러한 데옥시리보뉴클레오티드 및 리보뉴클레오티드에는 천연 발생 분자 및 합성 유사체 둘 다가 포함된다. 이들에는 펩티드 핵산 (PNA), PNA-DNA 키메라, 록킹된 핵산 (LNA), 및 포스포티오레이트 연결된 서열이 포함된다. 본원에 개시된 폴리뉴클레오티드는 또한 모든 형태의 서열, 예컨대 비제한적으로 단일 가닥 형태, 이중 가닥 형태, DNA-RNA 혼성체, 삼중 구조, 스템-루프 구조 등을 포괄한다.
RGN, 데아미나제 또는 융합 단백질을 코딩하는 핵산 분자는 관심 유기체에서의 발현을 위해 코돈 최적화될 수 있다. "코돈-최적화된" 코딩 서열은 특정한 숙주 세포의 선호된 코돈 사용 빈도 또는 전사 조건을 모방하도록 설계된 그의 코돈 사용 빈도를 갖는 폴리뉴클레오티드 코딩 서열이다. 특정한 숙주 세포 또는 유기체에서의 발현은 번역된 아미노산 서열이 변하지 않도록 핵산 수준에서 하나 이상의 코돈 변경의 결과로서 증강된다. 핵산 분자는 전체적으로 또는 부분적으로 코돈 최적화될 수 있다. 광범위한 유기체에 대한 선호도 정보를 제공하는 코돈 표 및 다른 참고자료가 관련 기술분야에서 이용가능하다 (예를 들어, 식물-선호 코돈 용법의 논의에 대해서는 [Campbell and Gowri (1990) Plant Physiol. 92:1-11] 참고). 식물-선호 유전자를 합성하는 방법은 관련 기술분야에서 이용가능하다. 예를 들어, 미국 특허 번호 5,380,831, 및 5,436,391, 및 [Murray et al. (1989) Nucleic Acids Res. 17:477-498]을 참고하며, 이들은 본원에 참고로 포함된다.
본원에 제공된 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드는 시험관내 발현 또는 관심 세포, 소기관, 배아 또는 유기체에서의 발현을 위해 발현 카세트에 제공될 수 있다. 카세트는 폴리뉴클레오티드의 발현을 가능하게 하는 본원에 제공된 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 5' 및 3' 조절 서열을 포함할 것이다. 카세트는 유기체에 동시 형질전환되는 적어도 하나의 추가의 유전자 또는 유전자 요소를 추가로 함유할 수 있다. 추가의 유전자 또는 요소가 포함되는 경우, 성분들은 작동가능하게 연결된다. 용어 "작동가능하게 연결된"은 2가지 이상의 요소들 사이의 기능적 연결을 의미하는 것으로 의도된다. 예를 들어, 프로모터와 관심 코딩 영역 (예를 들어, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 영역) 사이의 연결은 관심 코딩 영역의 발현을 가능하게 하는 기능적 연결이다. 작동가능하게 연결된 요소는 연속적 또는 비-연속적일 수 있다. 2가지 단백질 코딩 영역의 결합을 지칭하기 위해 사용되는 경우, 작동가능하게 연결된이란 코딩 영역이 동일한 리딩 프레임 내에 있는 것으로 의도된다. 대안적으로, 추가의 유전자(들) 또는 요소(들)가 다중 발현 카세트 상에 제공될 수 있다. 예를 들어, 본원에 개시된 RGN을 코딩하는 뉴클레오티드 서열은 하나의 발현 카세트 상에 존재할 수 있는 반면에, crRNA, tracrRNA 또는 완전 가이드 RNA를 코딩하는 뉴클레오티드 서열은 별도의 발현 카세트 상에 존재할 수 있다. 이러한 발현 카세트에는 조절 영역의 전사 조절하에 있는 폴리뉴클레오티드의 삽입을 위한 다수개의 제한 부위 및/또는 재조합 부위가 제공된다. 발현 카세트는 선택가능한 마커 유전자를 추가로 함유할 수 있다.
발현 카세트는 5'-3' 전사 방향으로 관심 유기체에서 기능적인 전사 (일부 실시양태에서는 번역) 개시 영역 (즉, 프로모터), 본 발명의 RGN-, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체-, 데아미나제-, crRNA-, tracrRNA- 및/또는 sgRNA-코딩 폴리뉴클레오티드, 및 전사 (일부 실시양태에서는 번역) 종결 영역 (즉, 종결 영역)을 포함할 것이다. 본 발명의 프로모터는 숙주 세포에서 코딩 서열의 발현을 지시하거나 또는 유도할 수 있다. 조절 영역 (예를 들어, 프로모터, 전사 조절 영역, 및 번역 종결 영역)은 숙주 세포에 대해 또는 서로에 대해 내인성 또는 이종성일 수 있다. 본원에서 사용된 바와 같이, 서열과 관련하여 "이종성"은 외래 종으로부터 기원하는 서열이거나, 또는 동일한 종으로부터 기원하는 경우에는 의도적인 인간 개입에 의해 조성 및/또는 게놈 유전자좌에서 그의 본래의 형태로부터 실질적으로 변형된 서열이다. 본원에서 사용된 바와 같이, 키메라 유전자는 코딩 서열에 대해 이종성인 전사 개시 영역에 작동가능하게 연결된 코딩 서열을 포함한다.
편리한 종결 영역은 에이. 투메파시엔스(A. tumefaciens)의 Ti-플라스미드, 예컨대 옥토핀 신타제 및 노팔린 신타제 종결 영역으로부터 입수가능하다. [Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al. (1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell 2:1261-1272; Munroe et al. (1990) Gene 91:151-158; Ballas et al. (1989) Nucleic Acids Res. 17:7891-7903; 및 Joshi et al. (1987) Nucleic Acids Res. 15:9627-9639] 또한 참고한다.
추가의 조절 신호에는 전사 개시 시작 부위, 오퍼레이터, 활성화제, 인핸서, 다른 조절 요소, 리보솜 결합 부위, 개시 코돈, 종결 신호 등이 포함되나 이로 제한되지 않는다. 예를 들어, 미국 특허 번호 5,039,523 및 4,853,331; EPO 0480762A2; [Sambrook et al. (1992) Molecular Cloning: A Laboratory Manual, ed. Maniatis et al. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.), 이후 "Sambrook 11"; Davis et al., eds. (1980) Advanced Bacterial Genetics (Cold Spring Harbor Laboratory Press), Cold Spring Harbor, N.Y.], 및 여기에 인용된 참고문헌을 참고한다.
발현 카세트를 제조하기 위해, 적절한 배향으로, 적절한 경우 적절한 리딩 프레임으로 DNA 서열을 제공하도록 다양한 DNA 단편을 조작할 수 있다. 이를 위해, 어댑터 또는 링커를 사용하여 DNA 단편을 결합시킬 수 있거나, 또는 편리한 제한 부위, 불필요한 DNA의 제거, 제한 부위의 제거 등을 제공하기 위해 다른 조작이 수반될 수 있다. 이를 위해, 시험관내 돌연변이 유발, 프라이머 복구, 제한, 어닐링, 재치환, 예를 들어 전이 및 전환이 수반될 수 있다.
수많은 프로모터가 본 발명의 실시에 사용될 수 있다. 프로모터는 원하는 결과를 기준으로 선택될 수 있다. 핵산은 구성적, 유도성, 성장 단계-특이적, 세포 유형-특이적, 조직-선호, 조직-특이적, 또는 관심 유기체에서의 발현을 위한 다른 프로모터와 조합될 수 있다. 예를 들어, WO 99/43838, 및 미국 특허 번호 8,575,425; 7,790,846; 8,147,856; 8,586832; 7,772,369; 7,534,939; 6,072,050; 5,659,026; 5,608,149; 5,608,144; 5,604,121; 5,569,597; 5,466,785; 5,399,680; 5,268,463; 5,608,142; 및 6,177,611에 제시된 프로모터를 참고하며; 이들은 본원에 참고로 포함된다.
식물에서의 발현을 위해, 구성적 프로모터에는 CaMV 35S 프로모터 (Odell et al. (1985) Nature 313:810-812); 쌀 액틴 (McElroy et al. (1990) Plant Cell 2:163-171); 유비퀴틴 (Christensen et al. (1989) Plant Mol. Biol. 12:619-632 및 Christensen et al. (1992) Plant Mol. Biol. 18:675-689); pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581-588); 및 MAS (Velten et al. (1984) EMBO J. 3:2723-2730) 또한 포함된다.
유도성 프로모터의 예는 저산소 또는 저온 스트레스에 의해 유도성인 Adh1 프로모터, 열 스트레스에 의해 유도성인 Hsp70 프로모터, 둘 모두 빛에 의해 유도성인 PPDK 프로모터 및 펩카르복실라제 프로모터이다. 화학적으로 유도성인 프로모터, 예컨대 완화제 유도된 In2-2 프로모터 (미국 특허 번호 5,364,780), 옥신 유도되고 융단층 특이적이지만 캘러스에서도 활성인 Axig1 프로모터 (PCT US01/22169), 스테로이드-반응성 프로모터 (예를 들어, 에스트로겐 유도된 ERE 프로모터, 및 [Schena et al. (1991) Proc. Natl. Acad. Sci. USA 88:10421-10425 및 McNellis et al. (1998) Plant J. 14(2):247-257]에서의 글루코코르티코이드-유도성 프로모터 참고) 및 테트라시클린-유도성 및 테트라시클린-억제성 프로모터 (예를 들어, [Gatz et al. (1991) Mol. Gen. Genet. 227:229-237], 및 미국 특허 번호 5,814,618 및 5,789,156 참고) 또한 유용하며, 이들은 본원에 참고로 포함된다.
조직-특이적 또는 조직-선호 프로모터는 특정한 조직 내에서 발현 구축물의 표적 발현을 위해 사용될 수 있다. 특정한 실시양태에서, 조직-특이적 또는 조직-선호 프로모터는 식물 조직에서 활성이다. 식물에서 발달 조절하에 있는 프로모터의 예에는 특정 조직, 예컨대 잎, 뿌리, 과실, 종자 또는 꽃에서 전사를 우선적으로 개시하는 프로모터가 포함된다. "조직 특이적" 프로모터는 특정 조직에서만 전사를 개시하는 프로모터이다. 유전자의 구성적 발현과는 달리, 조직-특이적인 발현은 유전자 조절의 여러 상호작용 수준의 결과이다. 따라서, 상동성인 또는 밀접하게 관련된 식물 종으로부터의 프로모터가 특정한 조직에서 트랜스진의 효율적이고 신뢰할 수 있는 발현을 달성하기 위해 바람직하게 사용될 수 있다. 일부 실시양태에서, 발현은 조직-선호 프로모터를 포함한다. "조직 선호" 프로모터는 특정 조직에서 전사를 우선적으로 개시하지만 반드시 전체적으로 또는 단독으로 개시하는 것은 아닌 프로모터이다.
일부 실시양태에서, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 핵산 분자는 세포 유형-특이적인 프로모터를 포함한다. "세포 유형 특이적인" 프로모터는 하나 이상의 장기의 특정 세포 유형에서 주로 발현을 유도하는 프로모터이다. 식물에서 기능성인 세포 유형 특이적인 프로모터가 주로 활성일 수 있는 식물 세포의 일부 예에는 예를 들어 BETL 세포, 뿌리, 잎에서의 맥관 세포, 자루 세포, 및 줄기 세포가 포함된다. 핵산 분자는 또한 세포 유형 선호 프로모터를 포함할 수 있다. "세포 유형 선호" 프로모터는 하나 이상의 장기의 특정 세포 유형에서 주로 대부분의 발현을 유도하지만 반드시 전체적으로 또는 단독으로 유도하는 것은 아닌 프로모터이다. 식물에서 기능성인 세포 유형 선호 프로모터가 우선적으로 활성일 수 있는 식물 세포의 일부 예에는 예를 들어 BETL 세포, 뿌리, 잎에서의 맥관 세포, 자루 세포, 및 줄기 세포가 포함된다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 핵산 서열은 예를 들어 시험관내 mRNA 합성을 위해 파지 RNA 폴리머라제에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 이러한 실시양태에서, 시험관내-전사된 RNA는 본원에 기재된 방법에서 사용하기 위해 정제될 수 있다. 예를 들어, 프로모터 서열은 T7, T3 또는 SP6 프로모터 서열, 또는 T7, T3 또는 SP6 프로모터 서열의 변형일 수 있다. 이러한 실시양태에서, 발현된 단백질 및/또는 RNA는 본원에 기재된 게놈 변형 방법에서 사용하기 위해 정제될 수 있다.
특정한 실시양태에서, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드는 또한 폴리아데닐화 신호 (예를 들어, SV40 폴리A 신호 및 식물에서 기능성인 다른 신호) 및/또는 적어도 하나의 전사 종결 서열에 연결될 수 있다. 추가로, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체 또는 데아미나제를 코딩하는 서열은 또한 본원에 기재된 바와 같이 적어도 하나의 핵 국재화 신호, 적어도 하나의 세포-투과 도메인, 및/또는 단백질을 특정한 세포하 위치로 수송할 수 있는 적어도 하나의 신호 펩티드를 코딩하는 서열(들)에 연결될 수 있다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드는 벡터 또는 다중 벡터에 존재할 수 있다. "벡터"는 핵산을 숙주 세포로 수송, 전달 또는 도입하기 위한 폴리뉴클레오티드 조성물을 지칭한다. 적합한 벡터에는 플라스미드 벡터, 파지미드, 코스미드, 인공/미니-염색체, 트랜스포손, 및 바이러스 벡터 (예를 들어, 렌티바이러스 벡터, 아데노-연관된 바이러스 벡터, 바쿨로바이러스 벡터)가 포함된다. 벡터는 추가의 발현 조절 서열 (예를 들어, 인핸서 서열, 코작 서열, 폴리아데닐화 서열, 전사 종결 서열), 선택가능한 마커 서열 (예를 들어, 항생제 내성 유전자), 복제 기점 등을 포함할 수 있다. 추가의 정보는 ["Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 또는 "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, N.Y., 3rd edition, 2001]에서 확인할 수 있다.
벡터는 또한 형질전환된 세포의 선택을 위해 선택가능한 마커 유전자를 포함할 수 있다. 선택가능한 마커 유전자는 형질전환된 세포 또는 조직의 선택을 위해 사용된다. 마커 유전자에는 항생제 내성을 코딩하는 유전자, 예컨대 네오마이신 포스포트랜스퍼라제 II (NEO) 및 히그로마이신 포스포트랜스퍼라제 (HPT)를 코딩하는 유전자, 뿐만 아니라 제초성 화합물, 예컨대 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논, 및 2,4-디클로로페녹시아세테이트 (2,4-D)에 대한 내성을 부여하는 유전자가 포함된다.
일부 실시양태에서, RGN 폴리펩티드, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체 또는 데아미나제를 코딩하는 서열을 포함하는 발현 카세트 또는 벡터는 crRNA 및/또는 tracrRNA를 코딩하는 서열, 또는 가이드 RNA를 생성하기 위해 조합된 crRNA 및 tracrRNA를 추가로 포함할 수 있다. crRNA 및/또는 tracrRNA를 코딩하는 서열(들)은 관심 유기체 또는 숙주 세포에서 crRNA 및/또는 tracrRNA의 발현을 위해 적어도 하나의 전사 조절 서열에 작동가능하게 연결될 수 있다. 예를 들어, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드는 RNA 폴리머라제 III (Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 적합한 Pol III 프로모터의 예에는 포유동물 U6, U3, H1, 및 7SL RNA 프로모터 및 쌀 U6 및 U3 프로모터가 포함되나 이로 제한되지 않는다.
나타낸 바와 같이, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물을 이용하여 관심 유기체를 형질전환시킬 수 있다. 형질전환 방법은 뉴클레오티드 구축물을 관심 유기체에 도입시키는 것을 수반한다. "도입시키는"은 구축물이 숙주 세포의 내부로 접근하게 하는 방식으로 뉴클레오티드 구축물을 숙주 세포에 도입시키는 것으로 의도된다. 본 발명의 방법은 뉴클레오티드 구축물을 숙주 유기체에 도입시키기 위해 특정한 방법을 필요로 하지 않으며, 단지 뉴클레오티드 구축물이 숙주 유기체의 적어도 하나의 세포의 내부로 접근하기만 하면 된다. 숙주 세포는 진핵생물 또는 원핵생물 세포일 수 있다. 특정한 실시양태에서, 진핵생물 숙주 세포는 식물 세포, 포유동물 세포, 또는 곤충 세포이다. 안정한 형질전환 방법, 일시적인 형질전환 방법, 및 바이러스-매개된 방법을 비롯하여 이로 제한되지 않는, 뉴클레오티드 구축물을 식물 및 다른 숙주 세포에 도입시키는 방법은 관련 기술분야에 공지되어 있다.
상기 방법은 형질전환된 유기체, 예컨대 식물, 예컨대 전체 식물, 뿐만 아니라 식물 기관 (예를 들어, 잎, 줄기, 뿌리 등), 종자, 식물 세포, 주아, 배아 및 그의 자손을 생성한다. 식물 세포는 분화될 수 있거나 또는 분화되지 않을 수 있다 (예를 들어 캘러스, 현탁액 배양 세포, 원형질체, 잎 세포, 뿌리 세포, 체관부 세포, 화분).
"트랜스제닉 유기체" 또는 "형질전환된 유기체" 또는 "안정하게 형질전환된" 유기체 또는 세포 또는 조직은 본 발명의 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드에 도입되거나 또는 통합된 유기체를 지칭한다. 다른 외인성 또는 내인성 핵산 서열 또는 DNA 단편 또한 숙주 세포에 혼입될 수 있는 것으로 인지된다. 아그로박테리움(Agrobacterium)- 및 유전자총-매개된 형질전환은 식물 세포의 형질전환을 위해 주로 이용되는 2가지 접근법이다. 그러나, 숙주 세포의 형질전환은 감염, 형질감염, 미량주사, 전기천공, 미량투영, 유전자총 또는 입자 충격, 전기천공, 실리카/탄소 섬유, 초음파 매개, PEG 매개, 인산칼슘 공동 침전, 다가양이온 DMSO 기술, DEAE 덱스트란 절차, 및 바이러스 매개, 리포솜 매개 등에 의해 수행될 수 있다. RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드의 바이러스-매개된 도입에는 레트로바이러스, 렌티바이러스, 아데노바이러스, 및 아데노-연관된 바이러스 매개된 도입 및 발현, 뿐만 아니라 카울리모바이러스, 제미니바이러스, 및 RNA 식물 바이러스가 포함된다.
형질전환 프로토콜 뿐만 아니라, 폴리펩티드 또는 폴리뉴클레오티드 서열을 식물에 도입시키기 위한 프로토콜은 형질전환을 위해 표적화된 숙주 세포의 유형 (예를 들어, 외떡잎 또는 쌍떡잎 식물 세포)에 따라 달라질 수 있다. 형질전환 방법은 관련 기술분야에 공지되어 있고, 미국 특허 번호: 8,575,425; 7,692,068; 8,802,934; 7,541,517에 제시된 것들이 포함되며, 이들 각각은 본원에 참고로 포함된다. 또한, [Rakoczy-Trojanowska, M. (2002) Cell Mol Biol Lett. 7:849-858; Jones et al. (2005) Plant Methods 1:5; Rivera et al. (2012) Physics of Life Reviews 9:308-345; Bartlett et al. (2008) Plant Methods 4:1-12; Bates, G.W. (1999) Methods in Molecular Biology 111:359-366; Binns and Thomashow (1988) Annual Reviews in Microbiology 42:575-606; Christou, P. (1992) The Plant Journal 2:275-281; Christou, P. (1995) Euphytica 85:13-27; Tzfira et al. (2004) TRENDS in Genetics 20:375-383; Yao et al. (2006) Journal of Experimental Botany 57:3737-3746; Zupan and Zambryski (1995) Plant Physiology 107:1041-1047; Jones et al. (2005) Plant Methods 1:5]을 참고한다
형질전환은 세포로 핵산의 안정한 또는 일시적인 포함을 일으킬 수 있다. "안정한 형질전환"은, 숙주 세포에 도입된 뉴클레오티드 구축물이 숙주 세포의 게놈과 통합하고, 그의 자손에 의해 유전될 수 있는 것을 의미하는 것으로 의도된다. "일시적인 형질전환"은, 폴리뉴클레오티드가 숙주 세포에 도입되고, 숙주 세포의 게놈에 통합되지 않는 것을 의미하는 것으로 의도된다.
엽록체의 형질전환 방법은 관련 기술분야에 공지되어 있다. 예를 들어, [Svab et al. (1990) Proc. Nail. Acad. Sci. USA 87:8526-8530; Svab and Maliga (1993) Proc. Natl. Acad. Sci. USA 90:913-917; Svab and Maliga (1993) EMBO J. 12:601-606]을 참고한다. 상기 방법은 선택가능한 마커를 함유하는 DNA의 입자 총 전달, 및 상동성 재조합을 통해 색소체 게놈으로 DNA의 표적화에 의존한다. 추가로, 색소체 형질전환은 핵-코딩된 및 색소체-지정된 RNA 폴리머라제의 조직-선호 발현에 의한 침묵 색소체-매개 트랜스진의 전사촉진에 의해 달성될 수 있다. 이러한 시스템은 [McBride et al. (1994) Proc. Natl. Acad. Sci. USA 91:7301-7305]에서 보고되었다.
형질전환된 세포는 통상적인 방식에 따라 트랜스제닉 유기체, 예컨대 식물로 성장할 수 있다. 예를 들어, [McCormick et al. (1986) Plant Cell Reports 5:81-84]를 참고한다. 이어서, 이들 식물을 성장시킨 다음, 동일한 형질전환된 균주 또는 상이한 균주와 수분시킬 수 있고, 생성된 혼성체는 확인된 원하는 표현형 특징의 구성적 발현을 가질 수 있다. 원하는 표현형 특징의 발현이 안정하게 유지되고 유전된 다음, 종자가 수확되는 것을 보장하도록 2 세대 이상 성장시켜, 원하는 표현형 특징의 발현이 달성될 수 있도록 보장할 수 있다. 이러한 방식으로, 본 발명은 게놈에 안정하게 도입된 본 발명의 뉴클레오티드 구축물, 예를 들어 본 발명의 발현 카세트를 갖는 형질전환된 종자 ("트랜스제닉 종자"로도 지칭됨)를 제공한다.
대안적으로, 형질전환된 세포는 유기체에 도입될 수 있다. 이들 세포는 유기체로부터 기원할 수 있고, 세포는 생체외 접근법으로 형질전환된다.
본원에 제공된 서열은 임의의 식물 종, 예컨대 비제한적으로, 외떡잎 식물 및 쌍떡잎 식물의 형질전환을 위해 사용될 수 있다. 관심 식물의 예에는 옥수수 (메이즈), 수수, 밀, 해바라기, 토마토, 크루시퍼, 후추, 감자, 목화, 쌀, 대두, 사탕무, 사탕수수, 담배, 보리, 및 유채, 브라시카(Brassica) 종, 알팔파, 호밀, 조, 홍화, 땅콩, 고구마, 카사야, 커피, 코코넛, 파인애플, 감귤 나무, 코코아, 차, 바나나, 아보카도, 무화과, 구아바, 망고, 올리브, 파파야, 캐슈, 마카다미아, 아몬드, 귀리, 채소, 관상용 식물, 및 구과 식물이 포함되나 이로 제한되지 않는다.
채소에는 토마토, 상추, 그린 빈, 리마 빈, 완두콩, 및 쿠르쿠미스(Curcumis) 속의 구성원, 예컨대 오이, 칸탈루프, 및 머스크 멜론이 포함되나 이로 제한되지 않는다. 관상용 식물에는 진달래, 수국, 히비스커스, 장미, 튤립, 수선화, 페튜니아, 카네이션, 포인세티아, 및 국화가 포함되나 이로 제한되지 않는다. 바람직하게는, 본 발명의 식물은 농작물 (예를 들어, 옥수수, 수수, 밀, 해바라기, 토마토, 크루시퍼, 후추, 감자, 목화, 쌀, 대두, 사탕무, 사탕수수, 담배, 보리, 유채 등)이다.
본원에서 사용된 바와 같이, 용어 식물에는 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘리(calli), 식물 덩어리, 및 식물 또는 식물의 일부분, 예컨대 배아, 화분, 배주, 종자, 잎, 꽃, 가지, 과실, 커넬, 이삭, 콥, 겉껍질, 자루, 뿌리, 근단, 꽃밥 등에서 온전한 식물 세포가 포함된다. 곡물은 종의 재배 또는 번식 이외의 목적으로 상업적인 재배자에 의해 생산된 성숙한 종자를 의미하는 것으로 의도된다. 재생된 식물의 자손, 변이체 및 돌연변이체 또한 본 발명의 범위 내에 포함되나, 단, 이들 부분은 도입된 폴리뉴클레오티드를 포함한다. 본원에 개시된 서열을 보유하는 가공된 식물 생성물 또는 부산물, 예를 들어 대두박이 추가로 제공된다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드는 또한 임의의 원핵생물 종, 예컨대 비제한적으로, 고세균류 및 박테리아 (예를 들어, 바실러스(Bacillus) 종, 클레브시엘라(Klebsiella) 종, 스트렙토마이세스(Streptomyces) 종, 리조비움(Rhizobium) 종, 에스케리키아(Escherichia) 종, 슈도모나스(Pseudomonas) 종, 살모넬라(Salmonella) 종, 시겔라(Shigella) 종, 비브리오(Vibrio) 종, 예르시니아(Yersinia) 종, 마이코플라즈마(Mycoplasma) 종, 아그로박테리움, 락토바실러스(Lactobacillus) 종)을 형질전환시키기 위해 사용될 수 있다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드는 임의의 진핵생물 종, 예컨대 비제한적으로 동물 (예를 들어, 포유동물, 곤충, 어류, 새, 및 파충류), 진균, 아메바, 조류 및 효모를 형질전환시키기 위해 사용될 수 있다.
통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법을 이용하여 포유동물 세포 또는 표적 조직에서 핵산을 도입시킬 수 있다. 이러한 방법을 이용하여 CRISPR 시스템의 성분을 코딩하는 핵산을 배양물 중의 또는 숙주 유기체 중의 세포에 투여할 수 있다. 비-바이러스 벡터 전달 시스템에는 DNA 플라스미드, RNA (예를 들어, 본원에 기재된 벡터의 전사체), 네이키드 핵산, 및 리포솜과 같은 전달 비히클과 복합체화된 핵산이 포함된다. 바이러스 벡터 전달 시스템에는 세포로 전달 후에 에피솜 또는 통합 게놈을 갖는 DNA 및 RNA 바이러스가 포함된다. 유전자 요법 절차의 검토를 위해, [Anderson, Science 256: 808- 813 (1992); Nabel & Feigner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Bohm (eds) (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)]를 참고한다.
핵산의 비-바이러스 전달 방법에는 리포펙션, 뉴클레오펙션, 미량주사, 유전자총, 비로솜, 리포솜, 이뮤노리포솜, 다가양이온 또는 지질: 핵산 접합체, 네이키드 DNA, 인공 비리온, 및 DNA의 작용제-증강된 흡수가 포함된다. 리포펙션은 예를 들어 미국 특허 번호 5,049,386, 4,946,787; 및 4,897,355)에 기재되어 있고, 리포펙션 시약은 상업적으로 판매된다 (예를 들어, 트랜스펙탐(Transfectam)™ 및 리포펙틴(Lipofectin)™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질에는 프라이그너(Feigner), WO 91/17424; WO 91/16024의 것들이 포함된다. 전달은 세포로 (예를 들어 시험관내 또는 생체외 투여) 또는 표적 조직으로 (예를 들어 생체내 투여)일 수 있다. 지질:핵산 복합체, 예컨대 표적화된 리포솜, 예컨대 면역지질 복합체의 제조는 관련 기술분야의 기술자에게 널리 공지되어 있다 (예를 들어, [Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291- 297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992)]; 미국 특허 번호 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787 참고).
핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 신체의 특이적인 세포로 표적화하고 바이러스 페이로드를 핵으로 수송하는 고도로 진화된 과정을 활용한다. 바이러스 벡터는 환자에게 직접적으로 투여될 수 있거나 (생체내) 또는 이들을 이용하여 시험관내에서 세포를 치료할 수 있고, 임의적으로 변형된 세포가 환자에게 투여될 수 있다 (생체외). 통상적인 바이러스 기반 시스템에는 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관된 및 단순 포진 바이러스 벡터가 포함될 수 있다. 숙주 게놈에서 통합은 레트로바이러스, 렌티바이러스, 및 아데노-연관된 바이러스 유전자 전달 방법에 의해 가능하며, 이는 종종 삽입된 트랜스진의 장기간 발현을 일으킨다. 추가로, 높은 형질도입 효율이 여러 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 향성은 외래 외피 단백질을 도입하고, 표적 세포의 잠재적인 표적 집단을 확장시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 또는 감염시킬 수 있고, 전형적으로 높은 바이러스 역가를 생성할 수 있는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 좌우될 것이다. 레트로바이러스 벡터는 6-10 kb 이하의 외래 서열에 대해 팩키징 능력을 갖는 시스-작용 긴 말단 반복부로 구성된다. 최소의 시스-작용 LTR은 벡터의 복제 및 팩키징에 충분하며, 이를 사용하여 치료 유전자를 표적 세포에 통합시켜 영구적인 트랜스진 발현을 제공한다. 광범위하게 사용되는 레트로바이러스 벡터에는 뮤린 백혈병 바이러스 (MuLV), 긴팔 원숭이 백혈병 바이러스 (GaLV), 유인원 면역결핍 바이러스 (SIV), 인간 면역결핍 바이러스 (HIV), 및 이들의 조합물을 기반으로 하는 것들이 포함된다 (예를 들어, [Buchscher et al., J. Viral. 66:2731-2739 (1992); Johann et al., J. Viral. 66:1635-1640 (1992); Sommnerfelt et al., Viral. 176:58-59 (1990); Wilson et al., J. Viral. 63:2374-2378 (1989); Miller et al., 1. Viral. 65:2220-2224 (1991)]; PCT/US94/05700 참고).
일시적인 발현이 바람직한 경우에, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 여러 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있고, 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 수준의 발현이 수득되었다. 이 벡터는 비교적 간단한 시스템으로 다량 생산될 수 있다. 또한, 아데노-연관된 바이러스 ("AAV") 벡터를 사용하여, 예를 들어 핵산 및 펩티드의 시험관내 생성에서 및 생체내 및 생체외 유전자 요법 절차를 위해 세포를 표적 핵산으로 형질도입시킬 수 있다 (예를 들어, [West et al., Virology 160:38-47 (1987)]; 미국 특허 번호 4,797,368; WO 93/24641; [Katin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참고). 재조합 AAV 벡터의 구축은 수많은 공보, 예컨대 미국 특허 번호 5,173,414; [Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); 및 Samulski et al., J. Viral. 63:03822-3828 (1989)]에 기재되어 있다. 전형적으로 팩키징 세포를 사용하여 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성한다. 이러한 세포에는 아데노바이러스를 팩키징하는 293 세포, 및 레트로바이러스를 팩키징하는 ψJ2 세포 또는 PA317 세포가 포함된다.
유전자 요법에서 사용되는 바이러스 벡터는 일반적으로 핵산 벡터를 바이러스 입자로 팩키징하는 세포주를 생성함으로써 생성된다. 벡터는 전형적으로 팩키징 및 숙주로의 후속적인 통합을 위해 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트에 의해 대체된다. 잃어버린 바이러스 기능은 전형적으로 팩키징 세포주에 의해 트랜스로 제공된다. 예를 들어, 유전자 요법에서 사용되는 AAV 벡터는 전형적으로 팩키징 및 숙주 게놈으로의 통합을 위해 필요한 AAV 게놈으로부터의 ITR 서열만을 갖는다. 바이러스 DNA는 다른 AAV 유전자, 즉, rep 및 cap을 코딩하는 헬퍼 플라스미드를 함유하지만 ITR 서열은 결여된 세포주에서 팩키징된다.
세포주는 또한 헬퍼로서 아데노바이러스에 의해 감염될 수 있다. 헬퍼 바이러스는 헬퍼 플라스미드로부터 AAV 벡터의 복제 및 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 유의한 양으로 팩키징되지 않는다. 아데노바이러스에 의한 오염은 예를 들어 AAV에 비해 아데노바이러스가 덜 민감한 열 처리에 의해 감소될 수 있다. 세포로 핵산의 추가의 전달 방법은 관련 기술분야의 기술자에게 공지되어 있다. 예를 들어, 본원에 참고로 포함된 US20030087817을 참고한다.
일부 실시양태에서, 숙주 세포는 본원에 기재된 하나 이상의 벡터에 의해 일시적으로 또는 비-일시적으로 형질감염된다. 일부 실시양태에서, 세포는 대상체에서 자연적으로 발생하는 것처럼 형질감염된다. 일부 실시양태에서, 형질감염된 세포를 대상체로부터 취한다. 일부 실시양태에서, 세포는 대상체로부터 취한 세포, 예컨대 세포주로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 관련 기술분야에 공지되어 있다. 세포주의 예에는 C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLaS3, Huhl, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panel, PC-3, TFl, CTLL-2, CIR, Rat6, CVI, RPTE, AlO, T24, 182, A375, ARH-77, Calul, SW480, SW620, SKOV3, SK-UT, CaCo2, P388Dl, SEM-K2, WEHI- 231, HB56, TIB55, lurkat, 145.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4. COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피, BALB/3T3 마우스 배아 섬유모세포, 3T3 Swiss, 3T3-Ll, 132-d5 인간 태아 섬유모세포; 10.1 마우스 섬유모세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-I 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10Tl/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-Kl, CHO-K2, CHO-T, CHO Dhfr-/-, COR-L23, COR-L23/CPR, COR-L235010, CORL23/ R23, COS-7, COV-434, CML Tl, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepalclc7, HL-60, HMEC, HT-29, lurkat, lY 세포, K562 세포, Ku812, KCL22, KGl, KYOl, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-l0A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCKII, MDCKII, MOR/ 0.2R, MONO-MAC 6, MTD-lA, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT 세포주, Peer, PNT-lA/ PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THPl 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR, 및 그의 트랜스제닉 변이체가 포함되나 이로 제한되지 않는다. 세포주는 관련 기술분야의 기술자에게 공지된 다양한 공급처로부터 입수가능하다 (예를 들어, 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection, ATCC) (버지니아주 마나사스) 참고).
일부 실시양태에서, 본원에 기재된 하나 이상의 벡터로 형질감염된 세포를 사용하여, 하나 이상의 벡터-유래된 서열을 포함하는 새로운 세포주를 확립한다. 일부 실시양태에서, 본원에 기재된 CRISPR 시스템 또는 데아미나제 또는 그의 융합체의 성분으로 일시적으로 형질감염되고 (예컨대 하나 이상의 벡터의 일시적인 형질감염, 또는 RNA로의 형질감염에 의해), CRISPR 복합체 또는 데아미나제의 활성을 통해 변형된 세포를 사용하여, 변형을 함유하지만 임의의 다른 외인성 서열이 결여된 세포를 포함하는 새로운 세포주를 확립한다. 일부 실시양태에서, 본원에 기재된 하나 이상의 벡터에 의해 일시적으로 또는 비-일시적으로 형질감염된 세포, 또는 이러한 세포로부터 유래된 세포주는 하나 이상의 시험 화합물을 평가하는데 사용된다.
일부 실시양태에서, 본원에 기재된 하나 이상의 벡터를 사용하여, 비-인간 트랜스제닉 동물 또는 트랜스제닉 식물을 생성한다. 일부 실시양태에서, 트랜스제닉 동물은 포유동물, 예컨대 마우스, 래트 또는 토끼이다. 일부 실시양태에서, 트랜스제닉 인간 세포를 생성한다.
V. 폴리펩티드 및 폴리뉴클레오티드의 변이체 및 단편
본 개시내용은 그의 아미노산 서열이 서열식별번호: 1, 16, 24, 35, 43, 50, 374-545, 572-590 및 그의 활성 변이체에 제시된 천연 발생 (즉, 야생형) RNA-가이드된 뉴클레아제 및 데아미나제의 활성 변이체 및 단편, 뿐만 아니라 천연 발생 CRISPR 반복부, 예컨대 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 서열의 활성 변이체 및 단편, 및 천연 발생 tracrRNA, 예컨대 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 서열의 활성 변이체 및 단편, 및 이를 코딩하는 폴리뉴클레오티드를 제공한다. 또한, 데아미나제, 예컨대 서열식별번호: 374-545 및 572-584에 제시된 서열의 활성 변이체 및 단편이 제공된다.
변이체 또는 단편의 활성이 관심 폴리뉴클레오티드 또는 폴리펩티드에 비해 변경될 수 있지만, 변이체 및 단편은 관심 폴리뉴클레오티드 또는 폴리펩티드의 기능을 보유해야 한다. 예를 들어, 변이체 또는 단편은 관심 폴리뉴클레오티드 또는 폴리펩티드와 비교하여 증가된 활성, 감소된 활성, 상이한 스펙트럼의 활성 또는 활성에서의 임의의 다른 변경을 가질 수 있다.
본원에 개시된 것과 같은 천연 발생 RGN 폴리펩티드의 단편 및 변이체는 서열-특이적인, RNA-가이드된 DNA-결합 활성을 보유할 것이다. 특정한 실시양태에서, 본원에 개시된 것과 같은 천연 발생 RGN 폴리펩티드의 단편 및 변이체는 뉴클레아제 활성 (단일 가닥 또는 이중 가닥)을 보유할 것이다. 다른 실시양태에서, 천연 발생 데아미나제, 예컨대 본원에 개시된 것들의 단편 및 변이체는 데아미나제 활성을 보유할 것이다. 일부 실시양태에서, 데아미나제 변이체는 변경된 활성, 예를 들어 DNA 주형에 대한 활성, 또는 본래의 데아미나제와는 상이한 뉴클레오티드에 대한 활성, 예를 들어 아데노신에 대한 활성을 갖는다.
본원에 개시된 것과 같은 천연 발생 CRISPR 반복부의 단편 및 변이체는 (tracrRNA를 포함하는) 가이드 RNA의 일부일 때 (가이드 RNA와 복합체화된) RNA-가이드된 뉴클레아제에 결합하여 이를 서열-특이적인 방식으로 표적 뉴클레오티드 서열로 가이드하는 능력을 보유할 것이다.
본원에 개시된 것과 같은 천연 발생 tracrRNA의 단편 및 변이체는 (CRISPR RNA를 포함하는) 가이드 RNA의 일부일 때 (가이드 RNA와 복합체화된) RNA-가이드된 뉴클레아제를 서열-특이적인 방식으로 표적 뉴클레오티드 서열로 가이드하는 능력을 보유할 것이다.
용어 "단편"은 본 발명의 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부분을 지칭한다. "단편" 또는 "생물학적으로 활성인 부분"에는 생물학적 활성을 보유하도록 (즉, 가이드RNA 내에 포함될 때 서열-특이적인 방식으로 RGN과 결합하여 이를 표적 뉴클레오티드 서열로 지시하도록) 충분한 개수의 연속 뉴클레오티드를 포함하는 폴리뉴클레오티드가 포함된다. "단편" 또는 "생물학적으로 활성인 부분"에는 생물학적 활성을 보유하도록 (즉, 가이드 RNA와 복합체화될 때 서열-특이적인 방식으로 표적 뉴클레오티드 서열에 결합하도록) 충분한 개수의 연속 아미노산 잔기를 포함하는 폴리펩티드가 포함된다. RGN 단백질의 단편에는 대안적인 하류 시작 부위의 사용으로 인해 전장 서열보다 더 짧은 것들이 포함된다. RGN 단백질의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 1, 16, 24, 35, 43 또는 50의 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 또는 그 초과의 연속 아미노산 잔기를 포함하는 폴리펩티드일 수 있다. 이러한 생물학적으로 활성인 부분은 재조합 기술에 의해 제조되고 서열-특이적인 RNA-가이드된 DNA-결합 활성에 대해 평가될 수 있다. CRISPR 반복 서열의 생물학적으로 활성인 단편은 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 적어도 8개 연속 핵산을 포함할 수 있다. CRISPR 반복 서열의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속 뉴클레오티드를 포함하는 폴리뉴클레오티드일 수 있다. tracrRNA의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80개 또는 그 초과의 연속 뉴클레오티드를 포함하는 폴리뉴클레오티드일 수 있다. 데아미나제의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 374-545 및 572-584 중 어느 하나의 10, 25, 50, 100, 150, 200 또는 그 초과의 연속 아미노산 잔기를 포함하는 폴리펩티드일 수 있다.
일반적으로, "변이체"는 실질적으로 유사한 서열을 의미하는 것으로 의도된다. 폴리뉴클레오티드의 경우, 변이체는 본래의 폴리뉴클레오티드 내의 하나 이상의 내부 부위에서 하나 이상의 뉴클레오티드의 결실 및/또는 부가, 및/또는 본래의 폴리뉴클레오티드에서 하나 이상 부위에서 하나 이상의 뉴클레오티드의 치환을 포함한다. 본원에서 사용된 바와 같이, "본래의" 또는 "야생형" 폴리뉴클레오티드 또는 폴리펩티드는 각각 천연 발생 뉴클레오티드 서열 또는 아미노산 서열을 포함한다. 폴리뉴클레오티드의 경우, 보존적 변이체에는 유전자 코드의 축퇴성 때문에 관심 유전자의 본래의 아미노산 서열을 코딩하는 이들 서열이 포함된다. 이들과 같은 천연 발생 대립유전자 변이체는 널리 공지된 분자 생물학 기술, 예를 들어 하기에서 설명되는 폴리머라제 연쇄 반응 (PCR) 및 혼성화 기술을 사용하여 확인될 수 있다. 변이체 폴리뉴클레오티드에는 또한 합성에 의해 유래된 폴리뉴클레오티드, 예를 들어 부위-지정된 돌연변이 유발을 이용하여 생성되었지만 관심 폴리펩티드 또는 폴리뉴클레오티드를 여전히 코딩하는 것들이 포함된다. 일반적으로, 본원에 개시된 특정한 폴리뉴클레오티드의 변이체는 본원에 기재된 서열 정렬 프로그램 및 파라미터에 의해 결정시 특정한 해당 폴리뉴클레오티드와 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 가질 것이다.
본원에 개시된 특정한 폴리뉴클레오티드 (즉, 기준 폴리뉴클레오티드)의 변이체는 또한 변이체 폴리뉴클레오티드에 의해 코딩된 폴리펩티드 및 기준 폴리뉴클레오티드에 의해 코딩된 폴리펩티드 사이의 퍼센트 서열 동일성을 비교함으로써 평가될 수 있다. 임의의 두 폴리펩티드 사이의 퍼센트 서열 동일성은 본원에 기재된 서열 정렬 프로그램 및 파라미터를 사용하여 계산될 수 있다. 본원에 개시된 폴리뉴클레오티드의 임의의 주어진 쌍을 그들이 코딩하는 두 폴리펩티드에 의해 공유된 퍼센트 서열 동일성을 비교함으로써 평가하는 경우, 코딩된 두 폴리펩티드 사이의 퍼센트 서열 동일성은 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성이다.
특정한 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 임의의 서열식별번호: 374-545 또는 572-584의 아미노산 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하는 데아미나제 폴리펩티드를 코딩한다. 특정 실시양태에서, 데아미나제는 임의의 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 변이체 데아미나제 폴리펩티드는 서열식별번호: 572-584 중 어느 하나와 특정한 수준의 서열 동일성을 가지며, 특이적인 아미노산 잔기는 모 서열로부터 변하지 않는다. 예를 들어, 일부 실시양태에서, 변이체 서열식별번호: 572는 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 위치 104에 상응하는 위치에서 티로신, 및 위치 106에 상응하는 위치에서 트레오닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 574는 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 위치 103에 상응하는 위치에서 세린, 및 위치 105에 상응하는 위치에서 리신을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 575는 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 위치 103에 상응하는 위치에서 류신, 및 위치 105에 상응하는 위치에서 글루탐산을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 576은 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 위치 107에 상응하는 위치에서 아르기닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 577은 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 위치 104에 상응하는 위치에서 세린, 및 위치 106에 상응하는 위치에서 아르기닌을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 578은 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 위치 107에 상응하는 위치에서 트레오닌을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 579는 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 위치 104에 상응하는 위치에서 글루타민, 및 위치 106에 상응하는 위치에서 글리신을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 580은 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 581은 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 위치 106에 상응하는 위치에서 글리신, 및 위치 108에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 582는 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 위치 104에 상응하는 위치에서 트립토판, 및 위치 106에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 583은 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 위치 106에 상응하는 위치에서 세린을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 584는 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 위치 112에 상응하는 위치에서 세린, 및 위치 114에 상응하는 위치에서 트레오닌을 포함한다.
본 발명의 데아미나제 폴리펩티드의 생물학적으로 활성인 변이체는 적게는 약 1-15개 아미노산 잔기, 적게는 약 1-10개, 예컨대 약 6-10개, 적게는 5개, 적게는 4개, 적게는 3개, 적게는 2개 또는 적게는 1개 아미노산 잔기만큼 상이할 수 있다. 구체적인 실시양태에서, 폴리펩티드는 N-말단 또는 C-말단 절단을 포함할 수 있으며, 이는 폴리펩티드의 N 또는 C 말단으로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 아미노산 또는 그 초과의 결실을 포함할 수 있다.
다른 특정한 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50의 아미노산 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 폴리펩티드를 코딩한다.
본 발명의 RGN 또는 데아미나제 폴리펩티드의 생물학적으로 활성인 변이체는 적게는 약 1-15개 아미노산 잔기, 적게는 약 1-10개, 예컨대 약 6-10개, 적게는 5개, 적게는 4개, 적게는 3개, 적게는 2개 또는 적게는 1개 아미노산 잔기만큼 상이할 수 있다. 구체적인 실시양태에서, 폴리펩티드는 N-말단 또는 C-말단 절단을 포함할 수 있으며, 이는 폴리펩티드의 N 또는 C 말단으로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 아미노산 또는 그 초과의 결실을 포함할 수 있다.
특정한 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복부를 포함하거나 또는 코딩한다.
본원에 개시된 폴리뉴클레오티드는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하거나 또는 코딩할 수 있다.
본 발명의 CRISPR 반복부 또는 tracrRNA의 생물학적으로 활성인 변이체는 적게는 약 1-25개 뉴클레오티드, 적게는 약 1-20개, 적게는 약 1-10개, 적게는 약 6-10개, 적게는 5개, 적게는 4개, 적게는 3개, 적게는 2개 또는 적게는 1개 뉴클레오티드만큼 상이할 수 있다. 일부 실시양태에서, 폴리뉴클레오티드는 5' 또는 3' 말단 절단을 포함할 수 있고, 이는 폴리뉴클레오티드의 5' 또는 3' 말단으로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80개 뉴클레오티드 또는 그 초과의 결실을 포함할 수 있다. 일부 실시양태에서, CRISPR 반복부 또는 tracrRNA는 뉴클레오티드의 결실 및/또는 삽입 둘 다에 의해 및 또한 돌연변이 또는 치환에 의해 변경될 수 있다.
변이체 단백질 및 폴리뉴클레오티드를 생성하는 본원에 제공된 RGN 폴리펩티드, DNA-결합 폴리펩티드-데아미나제 융합 폴리펩티드, 데아미나제 폴리펩티드, CRISPR 반복부 및 tracrRNA에 대해 변형이 이루어질 수 있음을 인지한다. 인위적으로 설계된 변화는 부위-지정된 돌연변이 유발 기술의 적용을 통해 도입될 수 있다. 대안적으로, 본원에 개시된 서열과 구조적으로 및/또는 기능적으로 관련이 있는 아직 공지되지 않거나 또는 아직 확인되지 않은 본래의 폴리뉴클레오티드 및/또는 폴리펩티드 또한 본 발명의 범위 내에 속하는 것으로 확인될 수 있다. 보존적 아미노산 치환이 RGN 또는 데아미나제 단백질의 기능을 변경시키지 않는 비보존된 영역에서 이루어질 수 있다. 대안적으로, RGN 또는 데아미나제의 활성을 개선시키거나 또는 변경시키는 변형이 이루어질 수 있다.
변이체 폴리뉴클레오티드 및 단백질은 또한 돌연변이 유발 및 재조합 유발 절차, 예컨대 DNA 셔플링으로부터 유래된 서열 및 단백질을 포함한다. 이러한 절차에 의해, 본원에 개시된 하나 이상의 상이한 RGN 또는 데아미나제 단백질 (예를 들어, 서열식별번호: 1, 16, 24, 35, 43, 50, 374-545 및 572-584)은 원하는 성질을 갖는 새로운 RGN 또는 데아미나제 단백질을 생성하도록 조작된다. 이러한 방식으로, 실질적인 서열 동일성을 갖는 서열 영역을 포함하는 관련된 서열 폴리뉴클레오티드의 집단으로부터 재조합 폴리뉴클레오티드의 라이브러리가 생성되고, 시험관내 또는 생체내에서 상동성 재조합될 수 있다. 예를 들어, 이 접근법을 이용하여, 관심 도메인을 코딩하는 서열 모티프가 본원에 제공된 RGN 서열 및 다른 공지된 RGN 유전자 사이에서 셔플링되어, 개선된 관심 성질, 예컨대 효소의 경우 증가된 Km을 갖는 단백질을 코딩하는 새로운 유전자를 수득할 수 있다. 본원에 제공된 데아미나제는 또한 유사한 전략에서 셔플링될 수 있다. 이러한 DNA 셔플링을 위한 전략은 관련 기술분야에 공지되어 있다. 예를 들어, [Stemmer (1994) Proc. Natl. Acad. Sci. USA 91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameri et al. (1997) Nature Biotech. 15:436-438; Moore et al. (1997) J. Mol. Biol. 272:336-347; Zhang et al. (1997) Proc. Natl. Acad. Sci. USA 94:4504-4509; Crameri et al. (1998) Nature 391:288-291]; 및 미국 특허 번호 5,605,793 및 5,837,458을 참고한다. "셔플링된" 핵산은 셔플링 절차, 예컨대 본원에 제시된 임의의 셔플링 절차에 의해 생성되는 핵산이다. 셔플링된 핵산은 예를 들어 인공적인, 임의적으로 재귀적인 방식으로 2가지 이상의 핵산 (또는 문자열)을 (물리적으로 또는 가상으로) 재조합함으로써 생성된다. 일반적으로, 하나 이상의 스크리닝 단계를 셔플링 과정에서 이용하여 관심 핵산을 확인하고; 이 스크리닝 단계는 임의의 재조합 단계 이전에 또는 이후에 수행될 수 있다. 일부 (그러나 전부는 아님) 셔플링 실시양태에서, 스크리닝될 풀의 다양성을 증가시키기 위해 선택 이전에 다중 라운드의 재조합을 수행하는 것이 바람직하다. 재조합 및 선택의 전체 과정을 임의적으로 재귀적으로 반복한다. 문맥에 따라, 셔플링은 재조합 및 선택의 전체 과정을 지칭할 수 있거나, 또는 대안적으로 전체 과정 중 재조합 부분을 간단히 지칭할 수 있다.
본원에서 사용된 바와 같이, 두 폴리뉴클레오티드 또는 폴리펩티드 서열과 관련하여 "서열 동일성" 또는 "동일성"은 명시된 비교 범위에 걸쳐 최대 대응을 위해 정렬될 때 동일한 두 서열의 잔기를 지칭한다. 서열 동일성의 백분율이 단백질과 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환에 의해 상이한 것으로 인지되며, 여기서 아미노산 잔기는 유사한 화학적 성질 (예를 들어, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되고, 따라서 분자의 기능적 성질이 변하지 않는다. 서열이 보존적 치환에서 상이할 때, 퍼센트 서열 동일성은 치환의 보존적 성질을 보정하기 위해 상향 조정될 수 있다. 이러한 보존적 치환에 의해 상이한 서열은 "서열 유사성" 또는 "유사성"을 갖는다고 한다. 이러한 조정을 위한 수단은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 전형적으로 이는 전체가 아니라 부분 미스매치로서 보존적 치환을 평점하여, 서열 동일성 백분율을 증가시킨다. 따라서, 예를 들어, 동일한 아미노산에 1의 점수가 주어지고, 비-보존적 치환에 0의 점수가 주어지는 경우, 보존적 치환에는 0 내지 1의 점수가 주어진다. 보존적 치환의 평점은 예를 들어 프로그램 PC/GENE (인텔리제네틱스(Intelligenetics), 캘리포니아주 마운틴뷰)에서 구현되는 바와 같이 계산된다.
본원에서 사용된 바와 같이, "서열 동일성 백분율"은 비교 범위에 걸쳐 최적으로 정렬된 두 서열을 비교함으로써 결정된 값을 의미하며, 비교 범위에서 폴리뉴클레오티드 서열의 일부분은 두 서열의 최적의 정렬을 위해 기준 서열 (부가 또는 결실을 포함하지 않음)과 비교하여 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 백분율은 매칭된 위치의 개수를 수득하기 위해 두 서열에서 발생하는 동일한 핵산 염기 또는 아미노산 잔기의 위치의 개수를 결정하고, 매칭된 위치의 개수를 비교 범위의 총 위치의 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성 백분율을 수득함으로써 계산된다.
달리 명시되지 않는다면, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하여 GAP 버전 10을 사용하여 수득한 값을 지칭한다: 50의 GAP 가중치 및 3의 길이 가중치, 및 nwsgapdna.cmp 평점 행렬을 사용하는 뉴클레오티드 서열에 대한 % 동일성 및 % 유사성; 8의 GAP 가중치 및 2의 길이 가중치, 및 BLOSUM62 평점 행렬을 사용하는 아미노산 서열에 대한 % 동일성 및 % 유사성; 또는 그의 임의의 등가의 프로그램. "등가의 프로그램"은, GAP 버전 10에 의해 생성된 상응하는 정렬과 비교할 때, 해당하는 임의의 두 서열에 대해, 동일한 뉴클레오티드 또는 아미노산 잔기 매치 및 동일한 퍼센트 서열 동일성을 갖는 정렬을 생성하는 임의의 서열 비교 프로그램을 의미한다.
해당 서열 쌍에 대해 가능한 가장 높은 점수에 도달하도록 정의된 아미노산 치환 행렬 (예를 들어, BLOSUM62), 갭 존재 패널티 및 갭 확장 패널티를 이용하는 유사성 평점을 위해 두 서열이 정렬될 때, 이들은 "최적으로 정렬된" 것이다. 아미노산 치환 행렬, 및 두 서열 사이의 유사성을 정량화하는데 있어서 그들의 사용은 관련 기술분야에 널리 공지되어 있고, 예를 들어 [Dayhoff et al. (1978) "A model of evolutionary change in proteins." In "Atlas of Protein Sequence and Structure," Vol. 5, Suppl. 3 (ed. M. O. Dayhoff), pp. 345-352. Natl. Biomed. Res. Found., Washington, D.C. and Henikoff et al. (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919]에 기재되어 있다. BLOSUM62 행렬은 종종 서열 정렬 프로토콜에서 디폴트 평점 치환 행렬로서 사용된다. 갭 존재 패널티는 정렬된 서열 중 하나에서 단일 아미노산 갭의 도입에 대해 부과되고, 갭 확장 패널티는 이미 개방된 갭에 삽입된 각각의 추가의 빈 아미노산 위치에 대해 부과된다. 정렬은 정렬이 시작되고 끝나는 각각의 서열의 아미노산 위치에 의해, 임의적으로 가능한 가장 높은 점수에 도달하도록 하나의 서열 또는 두 서열 모두에서 하나의 갭 또는 다중 갭의 삽입에 의해 정의된다. 최적의 정렬 및 평점은 수동으로 달성될 수 있지만, 상기 과정은 컴퓨터-실행된 정렬 알고리즘, 예를 들어 [Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402]에 기재되고 생명공학 정보 웹사이트 국제 센터(National Center for Biotechnology Information Website (www.ncbi.nlm.nih.gov))에서 공개적으로 입수가능한 갭이 있는 BLAST 2.0의 사용에 의해 용이해진다. 다중 정렬을 비롯하여 최적의 정렬은 예를 들어 www.ncbi.nlm.nih.gov로부터 입수가능하고 [Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402]에 기재된 PSI-BLAST를 이용하여 제조될 수 있다.
기준 서열에 대해 최적으로 정렬된 아미노산 서열과 관련하여, 아미노산 잔기는 정렬에서 잔기가 쌍을 형성한 기준 서열의 위치에 "상응한다". "위치"는 N-말단에 대한 그의 위치를 기반으로 하여 기준 서열에서 각각의 아미노산을 순차적으로 식별하는 번호로 표시된다. 최적의 정렬을 결정할 때 고려되어야 하는 결실, 삽입, 말단 절단, 융합 등으로 인해, 일반적으로 N-말단으로부터 간단히 카운팅함으로써 결정되는 시험 서열에서의 아미노산 잔기 개수는 기준 서열에서 그의 상응하는 위치의 번호와 반드시 동일하지는 않을 것이다. 예를 들어, 정렬된 시험 서열에서 결실이 있는 경우, 결실 부위에서는 기준 서열에서의 위치에 상응하는 아미노산이 없을 것이다. 정렬된 기준 서열에서 삽입이 있는 경우, 해당 삽입은 기준 서열에서 임의의 아미노산 위치에 상응하지 않을 것이다. 말단 절단 또는 융합의 경우, 상응하는 서열에서 임의의 아미노산에 상응하지 않는 기준 또는 정렬된 서열에서의 아미노산 스트레치가 있을 수 있다.
VI. 항체
서열식별번호: 1, 16, 24, 35, 43, 50, 374-545 및 572-584에 제시된 아미노산 서열을 포함하는 것들 또는 그의 활성 변이체 또는 단편을 비롯하여 RGN 폴리펩티드, 본 발명의 RGN 폴리펩티드를 포함하는 리보핵단백질, 데아미나제, 또는 DNA-결합 데아미나제 융합 단백질에 대한 항체 또한 포함된다. 항체의 생성 방법 또한 관련 기술분야에 널리 공지되어 있다 (예를 들어, [Harlow and Lane (1988) Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.]; 및 미국 특허 번호 4,196,265 참고). 이들 항체는 RGN 폴리펩티드 또는 리보핵단백질의 검출 및 단리를 위한 키트에서 사용될 수 있다. 따라서, 본 개시내용은 본원에 기재된 폴리펩티드 또는 리보핵단백질, 예를 들어 서열식별번호: 1, 16, 24, 35, 43, 50, 374-545 및 572-584 중 어느 하나의 서열을 갖는 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 키트를 제공한다.
VII. 관심 표적 서열의 결합을 위한 시스템 및 리보핵단백질 복합체, 및 이를 제조하는 방법
본 개시내용은 관심 표적 서열의 결합을 위한 시스템을 제공하고, 상기 시스템은 적어도 하나의 가이드 RNA 또는 이를 코딩하는 뉴클레오티드 서열, 및 적어도 하나의 RNA-가이드된 뉴클레아제 또는 이를 코딩하는 뉴클레오티드 서열을 포함한다. 가이드 RNA는 관심 표적 서열과 혼성화하고, 또한 RGN 폴리펩티드와 복합체를 형성하여, RGN 폴리펩티드가 표적 서열과 결합하도록 지시한다. 이들 일부 실시양태에서, RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 다양한 실시양태에서, 가이드 RNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA, 또는 그의 활성 변이체 또는 단편을 포함한다. 상기 시스템의 가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA일 수 있다. 특정한 실시양태에서, 상기 시스템은 가이드RNA에 대해 이종성인 RNA-가이드된 뉴클레아제를 포함하고, RGN 및 가이드RNA는 원래 자연적으로 복합체화되지 않는다.
본 개시내용은 또한 핵산 서열에 대해 표적화하고 표적 핵산 서열을 변형시키는 시스템을 제공한다. RNA-가이드된 DNA-결합 폴리펩티드, 예컨대 RGN, 및 gRNA는 리보핵폴리펩티드 복합체를 관심 핵산 서열로 표적화시키는 것을 담당하고; 데아미나제 폴리펩티드는 표적화된 핵산 서열을 변형시키는 것을 담당한다. 가이드 RNA는 관심 표적 서열과 혼성화하고, 또한 RNA-가이드된 DNA-결합 폴리펩티드와 복합체를 형성하여, RNA-가이드된 DNA-결합 폴리펩티드가 표적 서열에 결합하도록 지시한다. RNA-가이드된 DNA-결합 폴리펩티드는 융합 단백질의 한 도메인이고; 다른 도메인은 본원에 기재된 데아미나제이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 RGN, 예컨대 Cas9이다. 추가의 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 서열식별번호: 568, 569, 547, 553의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. RNA-가이드된 DNA-결합 폴리펩티드의 다른 예에는 RGN, 예컨대 미국 특허 출원 번호 16/432,321 (그의 전문이 본원에 참고로 포함됨)에 기재된 것들이 포함된다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 유형 II CRISPR-Cas 폴리펩티드, 또는 그의 활성 변이체 또는 단편이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 유형 V CRISPR-Cas 폴리펩티드, 또는 그의 활성 변이체 또는 단편이다. 다른 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 유형 VI CRISPR-Cas 폴리펩티드이다. 다른 실시양태에서, 융합 단백질의 DNA-결합 도메인은 RNA 가이드, 예컨대 Zn 아연 뉴클레아제, TALEN, 또는 메가뉴클레아제 폴리펩티드를 필요로 하지 않으며, 각각의 뉴클레아제 활성은 불활성화되었다.
본원에 제공된 관심 표적 서열의 결합을 위한 시스템은 적어도 하나의 단백질에 결합된 RNA의 적어도 하나의 분자인 리보핵단백질 복합체일 수 있다. 일부 실시양태에서, 본원에 제공된 리보핵단백질 복합체는 RNA 성분으로서 적어도 하나의 가이드 RNA 및 단백질 성분으로서 RNA-가이드된 뉴클레아제를 포함한다. 이러한 리보핵단백질 복합체는 RGN 폴리펩티드를 천연적으로 발현하고 관심 표적 서열에 대해 특이적인 특정한 가이드 RNA를 발현하도록 조작된 세포 또는 유기체로부터 정제될 수 있다. 다른 실시양태에서, 본원에 제공된 리보핵단백질 복합체는 RNA 성분으로서 적어도 하나의 가이드 RNA, 및 단백질 성분으로서 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 단백질을 포함한다. 융합 단백질의 경우 또는 본 발명의 RGN의 경우, 리보핵단백질 복합체는 융합 단백질 (또는 본 발명의 RGN 단독) 및 가이드 RNA를 코딩하는 폴리뉴클레오티드에 의해 형질전환되고 융합 단백질 (또는 본 발명의 RGN 단독) 및 가이드 RNA의 발현을 가능하게 하는 조건하에서 배양된 세포 또는 유기체로부터 정제될 수 있다. 따라서, 본 발명의 RGN, 본 발명의 데아미나제, 본 발명의 RGN을 포함하는 리보핵단백질 복합체, 본 발명의 융합 단백질, 또는 융합 단백질 리보핵단백질 복합체를 제조하는 방법이 제공된다. 이러한 방법은 폴리펩티드 (일부 실시양태에서, 가이드 RNA)가 발현되는 조건하에서 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열, 및 일부 실시양태에서 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 세포를 배양하는 것을 포함한다. 이어서, 본 발명의 RGN, 본 발명의 RGN을 포함하는 리보핵단백질 복합체, 본 발명의 융합 단백질, 또는 융합 단백질 리보핵단백질 복합체를 배양된 세포의 용해물로부터 정제할 수 있다.
생물학적 샘플의 용해물로부터 본 발명의 RGN, 본 발명의 데아미나제, 본 발명의 RGN을 포함하는 리보핵단백질 복합체, 본 발명의 융합 단백질, 또는 융합 단백질 리보핵단백질 복합체를 정제하는 방법은 관련 기술분야에 공지되어 있다 (예를 들어, 크기 배제 및/또는 친화도 크로마토그래피, 2D-PAGE, HPLC, 역상 크로마토그래피, 면역침전). 특정한 방법에서, 본 발명의 폴리펩티드는 재조합적으로 생성되고, 그의 정제에 도움이 되도록 정제 태그, 예컨대 비제한적으로 글루타티온-S-트랜스퍼라제 (GST), 키틴 결합 단백질 (CBP), 말토스 결합 단백질, 티오레독신 (TRX), 폴리(NANP), 직렬식 친화도 정제 (TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis (서열식별번호: 593), 10xHis (서열식별번호: 594), 비오틴 카르복실 담체 단백질 (BCCP), 및 칼모둘린을 포함한다. 일반적으로, 본 발명의 태그 부착된 폴리펩티드 또는 리보핵단백질 복합체는 고정된 금속 친화도 크로마토그래피를 이용하여 정제된다. 관련 기술분야에 공지된 다른 유사한 방법, 예컨대 다른 형태의 크로마토그래피 또는 예를 들어 면역침전을 단독으로 또는 조합하여 이용할 있음을 이해할 것이다.
"단리된" 또는 "정제된" 폴리펩티드, 또는 그의 생물학적으로 활성인 부분은 그의 천연 발생 환경에서 발견되는 폴리펩티드에 일반적으로 동반되거나 또는 그와 상호작용하는 성분을 실질적으로 또는 본질적으로 함유하지 않는다. 따라서, 단리된 또는 정제된 폴리펩티드는 다른 세포 물질, 또는 재조합 기술에 의해 생성되는 경우 배양 배지를 실질적으로 함유하지 않거나, 또는 화학적으로 합성되는 경우 화학적 전구체 또는 다른 화학물질을 실질적으로 함유하지 않는다. 세포 물질을 실질적으로 함유하지 않는 단백질에는 약 30%, 20%, 10%, 5% 또는 1% (건조 중량 기준) 미만의 오염 단백질을 갖는 단백질 제제가 포함된다. 본 발명의 단백질 또는 그의 생물학적으로 활성인 부분이 재조합적으로 생성될 때, 최적으로 배양 배지는 약 30%, 20%, 10%, 5% 또는 1% (건조 중량 기준) 미만의 화학적 전구체 또는 관심 단백질이 아닌 화학물질을 나타낸다.
관심 표적 서열의 결합 및/또는 절단을 위해 본원에 제공된 특정한 방법은 시험관내 조립된 RGN 리보핵단백질 복합체의 사용을 수반한다. RGN 리보핵단백질 복합체의 시험관내 조립체는, RGN 폴리펩티드와 가이드 RNA의 결합을 가능하게 하는 조건하에서 RGN 폴리펩티드를 가이드 RNA와 접촉시키는 관련 기술분야에 공지된 임의의 방법을 이용하여 수행될 수 있다. 본원에서 사용된 바와 같이, "접촉하다", "접촉하는", "접촉된"은 원하는 반응을 수행하는데 적합한 조건하에서 원하는 반응의 성분들을 함께 배치시키는 것을 지칭한다. RGN 폴리펩티드는 시험관내 번역을 통해 생성되거나 또는 화학적으로 합성된 생물학적 샘플, 세포 용해물 또는 배양 배지로부터 정제될 수 있다. 가이드 RNA는 시험관내에서 전사되거나 또는 화학적으로 합성된 생물학적 샘플, 세포 용해물 또는 배양 배지로부터 정제될 수 있다. RGN 폴리펩티드 및 가이드 RNA는 RGN 리보핵단백질 복합체의 시험관내 조립을 가능하게 하도록 용액 (예를 들어, 완충된 식염수 용액)과 접촉할 수 있다.
VIII. 표적 서열의 결합, 절단 또는 변형 방법
본 개시내용은 관심 표적 뉴클레오티드 서열을 결합, 절단 및/또는 변형시키는 방법을 제공한다. 일부 실시양태에서, 상기 방법은 적어도 하나의 가이드 RNA 또는 그를 코딩하는 폴리뉴클레오티드, 및 적어도 하나의 RGN 폴리펩티드 또는 그를 코딩하는 폴리뉴클레오티드를 포함하는 시스템을 표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하는 것을 포함한다. 이들 일부 실시양태에서, RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 다양한 실시양태에서, 가이드 RNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA, 또는 그의 활성 변이체 또는 단편을 포함한다. 시스템의 가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA일 수 있다. 시스템의 RGN은 뉴클레아제 데드 RGN일 수 있거나, 닉카제 활성을 가질 수 있거나, 또는 융합 폴리펩티드일 수 있다. 일부 실시양태에서, 융합 폴리펩티드는 염기-편집 폴리펩티드, 예를 들어 시티딘 데아미나제 또는 아데노신 데아미나제를 포함한다. 특정한 실시양태에서, RGN 및/또는 가이드 RNA는, RGN 및/또는 가이드 RNA (또는 RGN 및 가이드 RNA 중 적어도 하나를 코딩하는 폴리뉴클레오티드(들))가 도입되는 세포, 소기관 또는 배아에 대해 이종성이다.
다른 실시양태에서, 상기 방법은 적어도 하나의 가이드 RNA 또는 그를 코딩하는 폴리뉴클레오티드, 및 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드 또는 그를 코딩하는 폴리뉴클레오티드를 포함하는 적어도 하나의 융합 단백질을 포함하는 시스템을 표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하는 것을 포함한다. 이들 실시양태의 일부에서, 융합 단백질은 서열식별번호: 374-545 또는 572-584의 아미노산 서열 중 어느 하나, 또는 그의 활성 변이체 또는 단편을 포함한다.
일부 실시양태에서, 상기 방법은 표적 폴리뉴클레오티드를 본원에 개시된 데아미나제와 접촉시키는 것을 포함한다. 일부 실시양태에서, 상기 방법은 표적 폴리뉴클레오티드를 데아미나제 도메인 및 DNA-결합 도메인을 포함하는 융합 단백질과 접촉시키는 것을 포함한다. 이들 실시양태의 일부에서, 상기 방법은 DNA 분자를 (a) 데아미나제 도메인 및 RNA-가이드된 DNA-결합 폴리펩티드, 예를 들어 뉴클레아제-불활성 RGN 도메인을 포함하는 융합 단백질; 및 (b) (a)의 융합 단백질을 DNA 가닥의 표적 뉴클레오티드 서열에 대해 표적화하는 gRNA와 접촉시키는 것을 포함하고; 뉴클레오티드 염기의 탈아미노화에 효과적인 양으로 및 그에 적합한 조건하에 DNA 분자를 융합 단백질 및 gRNA와 접촉시킨다. 데아미나제가 방법에서 사용되는 이들 실시양태의 일부에서, 데아미나제는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나의 아미노산 서열 또는 그의 변이체를 포함하며, 변이체는 임의의 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 변이체 데아미나제 폴리펩티드는 서열식별번호: 572-584 중 어느 하나와 특정 수준의 서열 동일성을 가지며, 구체적인 아미노산 잔기는 모 서열로부터 변하지 않는다. 예를 들어, 일부 실시양태에서, 변이체 서열식별번호: 572는 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 위치 104에 상응하는 위치에서 티로신, 및 위치 106에 상응하는 위치에서 트레오닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 574는 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 위치 103에 상응하는 위치에서 세린, 및 위치 105에 상응하는 위치에서 리신을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 575는 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 위치 103에 상응하는 위치에서 류신, 및 위치 105에 상응하는 위치에서 글루탐산을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 576은 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 위치 107에 상응하는 위치에서 아르기닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 577은 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 위치 104에 상응하는 위치에서 세린, 및 위치 106에 상응하는 위치에서 아르기닌을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 578은 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 위치 107에 상응하는 위치에서 트레오닌을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 579는 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 위치 104에 상응하는 위치에서 글루타민, 및 위치 106에 상응하는 위치에서 글리신을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 580은 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 581은 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 위치 106에 상응하는 위치에서 글리신, 및 위치 108에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 582는 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 위치 104에 상응하는 위치에서 트립토판, 및 위치 106에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 583은 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 위치 106에 상응하는 위치에서 세린을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 584는 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 위치 112에 상응하는 위치에서 세린, 및 위치 114에 상응하는 위치에서 트레오닌을 포함한다.
일부 실시양태에서, 상기 방법은 DNA 분자를 (a) 데아미나제 도메인 및 RNA-가이드된 DNA-결합 폴리펩티드, 예를 들어 뉴클레아제-불활성 RGN 도메인을 포함하는 융합 단백질; 및 (b) (a)의 융합 단백질을 DNA 가닥의 표적 뉴클레오티드 서열에 대해 표적화하는 gRNA와 접촉시키는 것을 포함하며; 뉴클레오티드 염기의 탈아미노화에 효과적인 양으로 및 그에 적합한 조건하에 DNA 분자를 융합 단백질 및 gRNA와 접촉시킨다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함하고, 뉴클레오티드 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 표적 DNA 서열은 농작물의 대립유전자에 존재하고, 관심 형질을 갖는 특정한 대립유전자는 더 낮은 농경학적 가치를 갖는 식물을 생성한다. 뉴클레오티드 염기의 탈아미노화는 식물의 형질을 개선하고 농경학적 가치를 증가시키는 대립유전자를 생성한다.
일부 실시양태에서, DNA 서열은 질환 또는 장애와 연관된 T→C 또는 A→G 점 돌연변이를 포함하고, 돌연변이성 C 또는 G 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 탈아미노화는 질환 또는 장애와 연관된 서열에서 점 돌연변이를 수정한다.
일부 실시양태에서, 질환 또는 장애와 연관된 서열은 단백질을 코딩하고, 탈아미노화는 질환 또는 장애와 연관된 서열에 정지 코돈을 도입시켜, 코딩된 단백질을 말단 절단시킨다. 일부 실시양태에서, 접촉은 질환 또는 장애를 가진 것으로 의심되거나, 그를 갖거나 또는 그로 진단된 대상체에서 생체내에서 수행된다. 일부 실시양태에서, 질환 또는 장애는 게놈에서 점 돌연변이 또는 단일-염기 돌연변이와 연관된 질환이다. 일부 실시양태에서, 질환은 유전 질환, 암, 대사 질환, 또는 리소좀 저장 질환이다.
상기 방법이 가이드 RNA 및/또는 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드, 또는 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드를 전달하는 것을 포함하는 것인 이들 실시양태에서, 세포 또는 배아는 가이드 RNA 및/또는 RGN 폴리펩티드가 발현되는 조건하에 배양될 수 있다. 다양한 실시양태에서, 상기 방법은 표적 서열을 RGN 리보핵단백질 복합체와 접촉시키는 것을 포함한다. RGN 리보핵단백질 복합체는 뉴클레아제 데드이거나 또는 닉카제 활성을 갖는 RGN을 포함할 수 있다. 일부 실시양태에서, 리보핵단백질 복합체의 RGN은 염기-편집 폴리펩티드, 예를 들어 본원에 개시된 데아미나제를 포함하는 융합 폴리펩티드이다. 다른 실시양태에서, 리보핵단백질 복합체는 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드를 포함한다. 특정한 실시양태에서, 상기 방법은 표적 서열을 포함하는 세포, 소기관 또는 배아에 RGN 리보핵단백질 복합체를 전달하는 것을 포함한다. RGN 리보핵단백질 복합체는 본원에 기재된 바와 같이 생물학적 샘플로부터 정제되고, 재조합적으로 생성되고, 후속적으로 정제되거나, 또는 시험관내에서 조립된 것일 수 있다. 표적 서열 또는 세포 소기관 또는 배아와 접촉하는 RGN 리보핵단백질 복합체가 시험관내에서 조립된 것인 이들 실시양태에서, 상기 방법은 표적 서열, 세포, 소기관 또는 배아와 접촉하기 전에 복합체의 시험관내 조립체를 추가로 포함할 수 있다.
정제된 또는 시험관내 조립된 RGN 리보핵단백질 복합체를 관련 기술분야에 공지된 임의의 방법, 예컨대 비제한적으로 전기천공을 이용하여 세포, 소기관 또는 배아에 도입시킬 수 있다. 대안적으로, RGN 폴리펩티드, 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드, 및/또는 가이드 RNA를 코딩하거나 또는 포함하는 폴리뉴클레오티드를 관련 기술분야에 공지된 임의의 방법 (예를 들어, 전기천공)을 이용하여 세포, 소기관 또는 배아에 도입시킬 수 있다.
표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하거나 또는 그와 접촉시, 가이드 RNA는 RGN 폴리펩티드 또는 융합 폴리펩티드가 서열-특이적인 방식으로 표적 서열과 결합하도록 지시한다. RGN이 뉴클레아제 활성을 갖는 것인 이들 실시양태에서, RGN 폴리펩티드는 결합시 관심 표적 서열을 절단한다. 표적 서열은 제공된 공여자 폴리뉴클레오티드에 의해 내인성 복구 메카니즘, 예컨대 비상동성 말단 결합, 또는 상동성-지정된 복구를 통해 후속적으로 변형될 수 있다.
RNA-가이드된 DNA-결합 폴리펩티드와 표적 서열의 결합을 측정하는 방법은 관련 기술분야에 공지되어 있고, 염색질 면역침전 검정, 겔 이동성 변화 검정, DNA 풀다운 검정, 리포터 검정, 마이크로플레이트 포획 및 검출 검정이 포함된다. 마찬가지로, 표적 서열의 절단 또는 변형을 측정하는 방법은 관련 기술분야에 공지되어 있고, 시험관내 또는 생체내 절단 검정이 포함되며, 절단은 분해 생성물의 검출을 용이하게 하기 위해 표적 서열에 적절한 표지 (예를 들어, 방사성 동위원소, 형광 기질)를 부착시키거나 또는 부착시키지 않고 PCR, 시퀀싱, 또는 겔 전기영동에 의해 확인된다. 대안적으로, 닉킹 촉발된 지수적 증폭 반응 (NTEXPAR) 검정을 이용할 수 있다 (예를 들어, [Zhang et al. (2016) Chem. Sci. 7:4951-4957] 참고). 생체내 절단은 서베이어(Surveyor) 검정을 이용하여 평가될 수 있다 (Guschin et al. (2010) Methods Mol Biol 649:247-256).
일부 실시양태에서, 상기 방법은 1개 초과의 가이드 RNA와 복합체화된 단일 유형의 RGN의 사용을 수반한다. 1개 초과의 가이드 RNA는 단일 유전자의 상이한 영역을 표적화할 수 있거나 또는 다중 유전자를 표적화할 수 있다. 다른 실시양태에서, 상기 방법은 융합 단백질의 일부로서 1개 초과의 가이드 RNA와 복합체화된 단일 유형의 RNA-결합 DNA-가이드된 도메인의 사용을 수반한다. 이러한 다중 표적화는 융합 단백질의 데아미나제 도메인이 핵산을 변형시킬 수 있게 하여, 관심 게놈에서 다중 돌연변이를 도입시킨다.
공여자 폴리뉴클레오티드가 제공되지 않는 것인 이들 실시양태에서, RGN 폴리펩티드에 의해 도입된 이중 가닥 파손은 비상동성 말단-연결 (NHEJ) 복구 과정에 의해 복구될 수 있다. NHEJ의 오류가 발생하기 쉬운 성질 때문에, 이중 가닥 파손의 복구는 표적 서열에 대해 변형을 일으킬 수 있다. 본원에서 사용된 바와 같이, 핵산 분자와 관련하여 "변형"은 핵산 분자의 뉴클레오티드 서열에서의 변화를 지칭하고, 이는 하나 이상의 뉴클레오티드의 결실, 삽입 또는 치환, 또는 이들의 조합일 수 있다. 표적 서열의 변형은 변경된 단백질 생성물의 발현 또는 코딩 서열의 불활성화를 일으킬 수 있다.
공여자 폴리뉴클레오티드가 존재하는 이들 실시양태에서, 공여자 폴리뉴클레오티드의 공여자 서열은 도입된 이중 가닥 파손의 복구 과정 동안에 표적 뉴클레오티드 서열에 통합되거나 또는 그와 교환되어, 외인성 공여자 서열의 도입을 일으킬 수 있다. 따라서, 공여자 폴리뉴클레오티드는 관심 표적 서열에 도입되는 것을 원하는 공여자 서열을 포함한다. 일부 실시양태에서, 공여자 서열은 새로 통합된 공여자 서열이 RGN에 의해 인식 및 절단되지 않도록 원래의 표적 뉴클레오티드 서열을 변경시킨다. 공여자 서열의 통합은 표적 뉴클레오티드 서열을 플랭킹하는 서열과 실질적인 서열 동일성을 갖는 플랭킹 서열을 갖는 공여자 폴리뉴클레오티드 내에 포함시킴으로써 증강될 수 있으며, 이는 상동성-지정된 복구 과정을 가능하게 한다. RGN 폴리펩티드가 이중 가닥 엇갈린 파손을 도입하는 것인 이들 실시양태에서, 공여자 폴리뉴클레오티드는 상용성 오버행에 의해 플랭킹된 공여자 서열을 포함할 수 있으며, 이는 이중 가닥 파손의 복구 동안에 비상동성 복구 과정에 의해 오버행을 포함하는 절단된 표적 뉴클레오티드 서열로의 공여자 서열의 직접적인 라이게이션을 가능하게 한다.
상기 방법이 닉카제인 (즉, 이중 가닥 폴리뉴클레오티드의 단일 가닥만을 절단하는) 본 발명의 RGN의 사용을 수반하는 것인 이들 실시양태에서, 상기 방법은 동일한 또는 중복되는 표적 서열을 표적화하고 폴리뉴클레오티드의 상이한 가닥을 절단하는 2개의 RGN 닉카제를 도입하는 것을 포함할 수 있다. 예를 들어, 이중 가닥 폴리뉴클레오티드의 양성 (+) 가닥만을 절단하는 RGN 닉카제는 이중 가닥 폴리뉴클레오티드의 음성 (-) 가닥만을 절단하는 제2 RGN 닉카제와 함께 도입될 수 있다. 유사하게, 일부 실시양태에서, 상기 방법은 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드, 예를 들어 및 RGN을 포함하는 융합 폴리펩티드의 사용을 수반하며, RGN은 닉카제 (예를 들어 서열식별번호: 569)이다.
다양한 실시양태에서, 표적 뉴클레오티드 서열과 결합시키고, 표적 서열을 검출하는 방법이 제공되며, 상기 방법은 세포, 소기관 또는 배아에 적어도 하나의 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드, 및 적어도 하나의 RGN 폴리펩티드 또는 이를 코딩하는 폴리뉴클레오티드를 도입시키고, 가이드 RNA 및/또는 RGN 폴리펩티드 (코딩 서열이 도입된 경우)를 발현시키는 것을 포함하고, RGN 폴리펩티드는 뉴클레아제-데드 RGN이고 검출가능한 표지를 추가로 포함하며, 상기 방법은 검출가능한 표지를 검출하는 것을 추가로 포함한다. 검출가능한 표지는 융합 단백질 (예를 들어, 형광 단백질)로서 RGN에 융합될 수 있거나, 또는 시각적으로 또는 다른 수단에 의해 검출될 수 있는 RGN 폴리펩티드에 접합되거나 또는 그 안에 혼입된 소분자일 수 있다.
표적 서열의 조절하에 표적 서열 또는 관심 유전자의 발현을 조절하는 방법 또한 본원에 제공된다. 상기 방법은 세포, 소기관 또는 배아에 적어도 하나의 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드, 및 적어도 하나의 RGN 폴리펩티드 또는 이를 코딩하는 폴리뉴클레오티드를 도입시키고, 가이드 RNA 및/또는 RGN 폴리펩티드 (코딩 서열이 도입된 경우)를 발현시키는 것을 포함하고, RGN 폴리펩티드는 뉴클레아제-데드 RGN이다. 이들 일부 실시양태에서, 뉴클레아제-데드 RGN은 본원에 기재된 발현 조절인자 도메인 (즉, 후성적 변형 도메인, 전사 활성화 도메인 또는 전사 리프레서 도메인)을 포함하는 융합 단백질이다. 일부 실시양태에서, 뉴클레아제-데드 RGN은 본원에 기재된 데아미나제를 포함하는 융합 단백질이다.
본 개시내용은 또한 관심 표적 뉴클레오티드 서열의 결합 및/또는 변형을 위한 방법을 제공한다. 상기 방법은 적어도 하나의 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드, 및 본 발명의 RGN 및 염기-편집 폴리펩티드, 예를 들어 본원에 기재된 데아미나제를 포함하는 적어도 하나의 융합 폴리펩티드, 또는 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 시스템을 표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하는 것을 포함한다.
관련 기술분야의 통상의 기술자는 본원에 개시된 임의의 방법을 이용하여 단일 표적 서열 또는 다중 표적 서열을 표적화할 수 있음을 이해할 것이다. 따라서, 상기 방법은 단일 유전자 내의 다중의 별개의 서열 및/또는 다중 유전자를 표적화할 수 있는 다중의 별개의 가이드 RNA와 조합하여 단일 RGN 폴리펩티드를 사용하는 것을 포함한다. 다중의 별개의 가이드 RNA를 다중의 별개의 RGN 폴리펩티드와 조합하여 도입하는 방법 또한 본원에 포함된다. 이들 가이드 RNA 및 가이드 RNA/RGN 폴리펩티드 시스템은 단일 유전자 내의 다중의 별개의 서열 및/또는 다중 유전자를 표적화할 수 있다.
한 측면에서, 본 발명은 상기 방법 및 조성물에 개시된 임의의 하나 이상의 요소를 함유하는 키트를 제공한다. 일부 실시양태에서, 키트는 벡터 시스템, 및 키트의 사용에 대한 지침서를 포함한다. 일부 실시양태에서, 벡터 시스템은 (a) tracr 메이트 서열, 및 tracr 메이트 서열의 상류에 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소, 여기서 가이드 서열은 발현될 때 CRISPR 복합체와 진핵생물 세포의 표적 서열의 서열-특이적인 결합을 지시하고, 여기서 CRISPR 복합체는 (1) 표적 서열과 혼성화된 가이드 서열, 및 (2) tracr 서열과 혼성화된 트레이스 메이트 서열과 복합체화된 CRISPR 효소를 포함함; 및/또는 (b) 핵 국재화 서열을 포함하는 상기 CRISPR 효소를 코딩하는 효소 코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함한다.
일부 실시양태에서, 키트는 RNA-가이드된 DNA-결합 폴리펩티드, 예컨대 RGN 폴리펩티드, 예를 들어 뉴클레아제-불활성 Cas9 도메인, 및 본 발명의 데아미나제, 및 임의적으로 Cas9 도메인과 데아미나제 사이에 위치하는 링커를 포함하는 융합 단백질을 포함한다. 또한, 일부 실시양태에서, 키트는 적합한 시약, 완충제 및/또는 예를 들어 시험관내 또는 생체내 DNA 또는 RNA 편집을 위해 융합 단백질의 사용에 대한 지침서를 포함한다. 요소들은 개별적으로 또는 조합으로 제공될 수 있고, 임의의 적합한 용기, 예컨대 바이알, 보틀 또는 튜브에 제공될 수 있다. 일부 실시양태에서, 키트는 핵산 서열의 표적화된 편집에 적합한 gRNA의 설계 및 사용에 관한 지침서를 포함한다.
일부 실시양태에서, 키트는 1가지 이상의 언어로 된 지침서를 포함한다. 일부 실시양태에서, 키트는 본원에 기재된 요소 중 하나 이상을 이용하는 과정에서 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적합한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 보관 완충제를 제공할 수 있다. 시약은 특정한 검정에서 이용가능한 형태로, 또는 사용하기 전에 하나 이상의 다른 성분의 첨가를 필요로 하는 형태로 (예를 들어 농축물 또는 동결건조된 형태로) 제공될 수 있다. 완충제는 임의의 완충제, 예컨대 비제한적으로 탄산나트륨 완충제, 중탄산나트륨 완충제, 붕산염 완충제, Tris 완충제, MOPS 완충제, HEPES 완충제, 및 이들의 조합물일 수 있다. 일부 실시양태에서, 완충제는 알칼리성이다. 일부 실시양태에서, 완충제는 약 7 내지 약 10의 pH를 갖는다.
일부 실시양태에서, 키트는 가이드 서열 및 조절 요소와 작동가능하게 연결하기 위해 벡터에 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오티드를 포함한다. 일부 실시양태에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다. 한 측면에서, 본 발명은 CRISPR 시스템의 하나 이상의 요소를 사용하는 방법을 제공한다. 본 발명의 CRISPR 복합체는 표적 폴리뉴클레오티드를 변형시키는데 효과적인 수단을 제공한다. 본 발명의 CRISPR 복합체는 다양한 세포 유형에서 표적 폴리뉴클레오티드를 변형시키는 (예를 들어, 결실, 삽입, 전좌, 불활성화, 활성화) 것을 비롯하여 다양한 유용성을 갖는다. 따라서, 본 발명의 CRISPR 복합체는 예를 들어 유전자 요법, 약물 스크리닝, 질환 진단, 및 예후에서 광범위한 적용을 갖는다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내의 표적 서열과 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함한다.
VIII. 표적 폴리뉴클레오티드
한 측면에서, 본 발명은 진핵생물 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법을 제공하며, 이는 생체내, 생체외 또는 시험관내일 수 있다. 일부 실시양태에서, 상기 방법은 인간 또는 비-인간 동물 또는 식물 (예컨대 미세조류)로부터 세포 또는 세포 집단을 샘플링하고, 세포 또는 세포들을 변형시키는 것을 포함한다. 배양은 임의의 생체외 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비-인간 동물 또는 식물 (예컨대 미세조류)에 재도입될 수 있다.
자연적인 가변성을 이용하여, 식물 재배자는 바람직한 특성, 예컨대 수율, 품질, 균일성, 강도 및 해충에 대한 내성에 대해 가장 유용한 유전자들을 조합한다. 이들 바람직한 특성에는 성장, 광주기 선호도, 온도 요건, 꽃 또는 번식 발달의 개시일, 지방산 함량, 곤충 내성, 질환 내성, 선충 내성, 진균 내성, 제초제 내성, 다양한 환경 인자, 예컨대 가뭄, 열, 습기, 추위, 바람, 및 고염도를 비롯한 불리한 토양 조건에 대한 내성이 포함된다. 이들 유용한 유전자의 공급원에는 본래 또는 외래 품종, 가보(heirloom) 품종, 야생 식물 동족, 및 유도된 돌연변이, 예를 들어 돌연변이 유발제로 처리된 식물 물질이 포함된다. 본 발명을 이용하여, 식물 재배자는 돌연변이를 유도하는 새로운 도구를 제공한다. 따라서, 관련 기술분야의 기술자는 유용한 유전자의 공급원에 대한 게놈을 분석할 수 있고, 원하는 특징 또는 특성을 갖는 품종에서 본 발명을 이용하여 이전의 돌연변이 유발제에 비해 더욱 정밀하게 유용한 유전자의 증가를 유도할 수 있고, 따라서 식물 재배 프로그램을 가속화 및 개선시킬 수 있다.
RGN 시스템의 표적 폴리뉴클레오티드는 진핵생물 세포에 대해 내인성 또는 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵생물 세포의 핵에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물 (예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열 (예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다. 이론에 구애되기를 바라지 않지만, 표적 서열이 PAM (프로토스페이서 인접한 모티프); 즉, CRISPR 복합체에 의해 인식되는 짧은 서열과 회합되어야 하는 것으로 믿어진다. PAM에 대한 정확한 서열 및 길이 요건은 사용된 CRISPR 효소에 따라 다르지만, PAM은 전형적으로 프로토스페이서 (즉, 표적 서열)에 인접한 2-5개 염기쌍 서열이다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 수많은 질환-연관된 유전자 및 폴리뉴클레오티드, 뿐만 아니라 신호전달 생화학적 경로-연관된 유전자 및 폴리뉴클레오티드를 포함할 수 있다. 표적 폴리뉴클레오티드의 예에는 신호전달 생화학적 경로와 연관된 서열, 예를 들어 신호전달 생화학적 경로-연관된 유전자 또는 폴리뉴클레오티드가 포함된다. 표적 폴리뉴클레오티드의 예에는 질환 연관된 유전자 또는 폴리뉴클레오티드가 포함된다. "질환-연관된" 유전자 또는 폴리뉴클레오티드는, 비-질환 대조군의 조직 또는 세포와 비교하여 질환-발병 조직으로부터 유래된 세포에서 전사 또는 번역 생성물을 비정상적인 수준으로 또는 비정상적인 형태로 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현되는 유전자일 수 있고; 이는 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있고, 변경된 발현은 질환의 발병 및/또는 진행과 상관관계가 있다. 질환-연관된 유전자는 또한 질환의 병인 (예를 들어, 원인 돌연변이)의 원인이 되는 유전자(들)에 직접적인 책임이 있거나 또는 그들과 연결 불균형 상태에 있는 돌연변이(들)를 보유하는 유전자 또는 유전자 변이를 지칭한다. 전사된 또는 번역된 생성물은 공지되어 있거나 또는 공지되어 있지 않을 수 있고, 추가로 정상 또는 비정상 수준일 수 있다. 질환-연관된 유전자 및 폴리뉴클레오티드의 예는 월드 와이드 웹(World Wide Web)으로 이용가능한 맥쿠식-나탄 인스티튜트 오브 제네틱 메디신, 존스 홉킨스 유니버시티(McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University, 메릴랜드주 볼티모어) 및 내셔널 센터 포 바이오테크놀로지 인포메이션, 내셔널 라이브러리 오브 메디신(National Center for Biotechnology Information, National Library of Medicine, 메릴랜드주 베데스다)으로부터 입수할 수 있다.
CRISPR 시스템이 관심 게놈 서열로의 표적화에서 비교적 용이하다는 점에서 특히 유용하지만, RGN이 원인 돌연변이를 해결할 수 있는 것에 대한 문제가 여전히 남아 있다. 한 접근법은 RGN (바람직하게는 RGN의 불활성 또는 닉카제 변이체)과 염기-편집 효소 또는 염기 편집 효소의 활성 도메인, 예컨대 시티딘 데아미나제 또는 아데노신 데아미나제 염기 편집기 사이의 융합 단백질을 생성하는 것이다 (미국 특허 번호 9,840, 699, 본원에 참고로 포함됨). 일부 실시양태에서, 상기 방법은 DNA 분자를 (a) 본 발명의 RGN 및 염기-편집 폴리펩티드, 예컨대 데아미나제를 포함하는 융합 단백질; 및 (b) (a)의 융합 단백질을 DNA 가닥의 표적 뉴클레오티드 서열로 표적화하는 gRNA와 접촉시키는 것을 포함하며; 뉴클레오티드 염기를 탈아미노화시키는데 효과적인 양으로 및 그에 적합한 조건하에 DNA 분자를 융합 단백질 및 gRNA와 접촉시킨다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함하고, 뉴클레오티드 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 표적 DNA 서열은 농작물의 대립유전자에 존재하고, 관심 특성을 갖는 특정한 대립유전자는 더 적은 농경학적 가치를 갖는 식물을 생성한다. 뉴클레오티드 염기의 탈아미노화는 식물의 특성을 개선시키고 농경학적 가치를 증가시키는 대립유전자를 생성한다.
일부 실시양태에서, DNA 서열은 질환 또는 장애와 연관된 T→C 또는 A→G 점 돌연변이를 포함하며, 돌연변이성 C 또는 G 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 탈아미노화는 질환 또는 장애와 연관된 서열에서 점 돌연변이를 수정한다.
일부 실시양태에서, 질환 또는 장애와 연관된 서열은 단백질을 코딩하고, 탈아미노화는 질환 또는 장애와 연관된 서열에 정지 코돈을 도입시켜, 코딩된 단백질의 말단 절단을 일으킨다. 일부 실시양태에서, 접촉은 질환 또는 장애를 갖기 쉬운, 갖고 있는 또는 가진 것으로 진단된 대상체의 생체 내에서 수행된다. 일부 실시양태에서, 질환 또는 장애는 게놈에서 점 돌연변이 또는 단일-염기 돌연변이와 연관된 질환이다. 일부 실시양태에서, 질환은 유전 질환, 암, 대사 질환, 또는 리소좀 저장 질환이다.
유전 질환의 원인이 되는 유전자좌, 특히 본 발명의 RGN 또는 RGN-염기 편집기 융합 단백질에 의해 용이하게 표적화될 수 있는 유전자좌의 추가의 예는 실시예 7 및 상응하는 표 8에서 확인할 수 있다.
헐러(Hurler) 증후군
본 발명의 RGN-염기 편집기 융합 단백질에 의존하는 접근법을 이용하여 수정될 수 있는 유전적으로 유전된 질환의 예는 헐러 증후군이다. MPS-1로도 공지된 헐러 증후군은 α-L-이두로니다제 (IDUA)의 결핍으로 인한 것이며, 리소좀에서 데르마탄 술페이트 및 헤파란 술페이트가 분자 수준으로 축적되는 것을 특징으로 하는 리소좀 저장 질환을 일으킨다. 이 질환은 일반적으로 α-L-이두로니다제를 코딩하는 IDUA 유전자에서 돌연변이에 의해 유발된 유전적으로 유전된 장애이다. 일반적인 IDUA 돌연변이는 W402X 및 Q70X이며, 이들 둘 다 번역의 조기 종결을 일으키는 넌센스 돌연변이이다. 예를 들어 염기-편집 접근법에 의한 단일 뉴클레오티드의 복귀가 야생형 코딩 서열을 복구하고, 유전자좌의 내인성 조절 메카니즘에 의해 조절되는 단백질 발현을 일으키기 때문에, 이러한 돌연변이는 정밀한 게놈 편집 (PGE) 접근법에 의해 잘 해결된다. 추가로, 이형접합체가 무증상인 것으로 공지되어 있기 때문에, 돌연변이된 대립유전자 중 하나만을 수정하면 되므로, 이들 돌연변이 중 하나를 표적화하는 PGE 요법은 이 질환을 가진 많은 환자에게 유용할 것이다 ([Bunge et al. (1994) Hum. Mol. Genet. 3(6): 861-866], 본원에 참고로 포함됨).
헐러 증후군에 대한 현재의 치료에는 효소 대체 요법 및 골수 이식이 포함된다 ([Vellodi et al. (1997) Arch. Dis. Child. 76(2): 92-99; Peters et al. (1998) Blood 91(7): 2601-2608] 본원에 참고로 포함됨). 효소 대체 요법이 헐러 증후군 환자의 생존 및 삶의 질에 극적인 영향을 미쳤지만, 이 접근법은 고가이며 시간 소모적인 매주 주입을 필요로 한다. 추가의 접근법에는 발현 벡터 상의 IDUA 유전자의 전달 또는 혈청 알부민과 같이 고도로 발현된 유전자좌로의 유전자의 삽입이 포함된다 (미국 특허 번호 9,956,247, 본원에 참고로 포함됨). 그러나, 이들 접근법은 원래의 IDUA 유전자좌를 수정된 코딩 서열로 복구하지 않는다. 게놈-편집 전략은 수많은 이점을 가지며, 가장 주목할만하게는, 유전자 발현의 조절이 건강한 개체에서 존재하는 자연적인 메카니즘에 의해 조절된다는 것이다. 추가로, 염기 편집의 이용은 종양 억제 메카니즘의 방해에 의해 큰 염색체 재배열, 세포 사멸, 또는 종양 발생을 초래할 수 있는 이중 가닥 DNA 파손을 일으킬 필요가 없다. 이 질환의 원인 돌연변이를 수정하는 방법에 대한 가능한 설명은 실시예 8에 제공된다. 기재된 방법은 인간 게놈에서 특정 질환-유발 돌연변이를 표적화하고 수정하기 위해 본 발명의 RGN-염기 편집기 융합 단백질을 사용하는 것에 대한 일반적인 전략의 예이다. 표 8에 기재된 것과 같은 표적 질환에 대한 유사한 접근법 또한 추구될 수 있음을 이해할 것이다. 추가로, 다른 종, 특히 일반적인 가정 애완 동물 또는 가축에서 질환-유발 돌연변이를 표적화하는 유사한 접근법 또한 본 발명의 RGN을 사용하여 이용될 수 있음을 이해할 것이다. 일반적인 가정 애완 동물 및 가축에는 개, 고양이, 말, 돼지, 소, 양, 닭, 당나귀, 뱀, 페럿, 어류, 예컨대 연어 및 새우가 포함된다.
프리드라이히(Friedreich) 운동실조
본 발명의 RGN은 또한 원인 돌연변이가 더욱 복잡한 인간 치료 접근법에서 유용할 수 있다. 예를 들어, 프리드라이히 운동실조 및 헌팅턴(Huntington) 질환과 같은 일부 질환은 유전자의 특정한 영역에서 3개 뉴클레오티드 모티프의 반복부에서의 유의한 증가의 결과이며, 이는 발현된 단백질이 기능하고 발현되는 능력에 영향을 미친다. 프리드라이히 운동실조 (FRDA)는 척수에서 신경 조직의 진행성 퇴행을 일으키는 상염색체성 열성 질환이다. 미토콘드리아에서 프라탁신 (FXN) 단백질의 감소된 수준은 세포 수준에서 산화성 손상 및 철 결핍을 초래한다. 감소된 FXN 발현은 체세포 및 생식선 FXN 유전자에서 인트론 1 내의 GAA 삼중항 확장과 관련이 있었다. FRDA 환자에서, GAA 반복부는 종종 70개 초과, 때때로 심지어 1000개 초과 (가장 흔하게는 600-900개)의 삼중항으로 구성되는 반면에, 발병하지 않은 개체는 약 40개 이하의 반복부를 갖는다 ([Pandolfo et al. (2012) Handbook of Clinical Neurology 103: 275-294; Campuzano et al. (1996) Science 271: 1423-1427; Pandolfo (2002) Adv. Exp. Med. Biol. 516: 99-118]; 모두 본원에 참고로 포함됨).
프리드라이히 운동실조 (FRDA)를 초래하는 트리뉴클레오티드 반복 서열의 확장은 FRDA 불안정 영역으로 지칭되는 FXN 유전자 내의 정의된 유전자좌에서 발생한다. RNA 가이드된 뉴클레아제 (RGN)는 FRDA 환자 세포에서 불안정 영역을 절제하기 위해 사용될 수 있다. 이 접근법은 하기를 필요로 한다: 1) 인간 게놈에서 대립유전자를 표적화하도록 프로그래밍될 수 있는 RGN 및 가이드 RNA 서열; 및 2) RGN 및 가이드 서열에 대한 전달 접근법. 게놈 편집을 위해 사용되는 여러 뉴클레아제, 예컨대 흔히 사용되는 에스. 피로게네스(S. pyogenes)로부터의 Cas9 뉴클레아제 (SpCas9)는 본질적으로 기능적 발현 카세트를 위해 필요한 다른 유전자 요소 외에도 SpCas9 유전자 및 가이드 RNA의 길이를 고려할 때 너무 커서 아데노-연관된 바이러스 (AAV) 벡터에 팩키징되지 않는다. 이는 SpCas9를 사용하는 접근법을 더 어렵게 만든다.
본 발명의 조밀한 RNA 가이드된 뉴클레아제는 FRDA 불안정 영역의 절제에 매우 적합하다. 각각의 RGN은 FRDA 불안정 영역 근처에 있는 PAM 요건을 갖는다. 추가로, 이들 RGN 각각은 가이드 RNA와 함께 AAV 벡터에 팩키징될 수 있다. 2개의 가이드 RNA의 팩킹은 제2 벡터를 필요로 할 수 있지만, 이 접근법은 두 벡터 사이의 단백질 서열을 분할할 수 있는 더 큰 뉴클레아제, 예컨대 SpCas9에서 필요로 되는 것보다 여전히 유리하게 비교된다. 이 질환의 원인 돌연변이를 수정하는 방법에 대한 가능한 설명은 실시예 9에 제공된다. 기재된 방법은 게놈 불안정 영역을 제거하는 본 발명의 RGN을 이용하는 전략을 포함한다. 이러한 전략은 유사한 유전적 근거를 갖는 다른 질환 및 장애, 예컨대 헌팅턴 질환에 적용가능하다. 본 발명의 RGN을 이용하는 유사한 전략은 농경학적으로 또는 경제적으로 중요한 비-인간 동물, 예컨대 개, 고양이, 말, 돼지, 소, 양, 닭, 당나귀, 뱀, 페럿, 어류, 예컨대 연어 및 새우에서 유사한 질환 및 장애에 또한 적용가능하다.
혈색소병증
본 발명의 RGN은 또한 유익한 효과를 일으킬 수 있는 파괴적 돌연변이를 도입하기 위해 사용될 수 있다. 헤모글로빈을 코딩하는 유전자, 특히 베타 글로빈 쇄 (HBB 유전자)에서의 유전적 결함은 겸상 적혈구 빈혈 및 지중해 빈혈을 비롯하여 혈색소병증으로 공지된 수많은 질환의 원인이 될 수 있다.
성인 인간에서, 헤모글로빈은 2개의 알파 (α)-유사 글로빈 쇄 및 2개의 베타 (β)-유사 글로빈 쇄 및 4개의 헴 기를 포함하는 이종사합체이다. 성인에서, α2β2 사합체는 헤모글로빈 A (HbA) 또는 성인 헤모글로빈으로 지칭된다. 전형적으로, 알파 및 베타 글로빈 쇄는 대략 1:1 비로 합성되고, 이 비는 헤모글로빈 및 적혈구 (RBC) 안정화의 측면에서 중요한 것으로 보인다. 발달 중인 태아에서는, 산소가 모체의 혈류를 통해 아기의 시스템으로 전달될 수 있도록 헤모글로빈 A에 비해 산소에 대해 더 높은 결합 친화도를 갖는 상이한 형태의 헤모글로빈인 태아 헤모글로빈 (HbF)이 생성된다. 태아 헤모글로빈 또한 2개의 α 글로빈 쇄를 함유하지만, 성인 β-글로빈 쇄 대신에 이는 2개의 태아 감마 (γ)-글로빈 쇄를 갖는다 (즉, 태아 헤모글로빈은 α2γ2임). 감마-글로빈에서 베타-글로빈 생성으로의 전환의 조절은 매우 복잡하며, 베타 글로빈 전사의 상향조절과 동시에 감마 글로빈 전사의 하향조절을 주로 수반한다. 대략 임신 30 주에, 태아에서 베타 글로빈의 생성이 증가하면서 감마 글로빈의 합성이 감소하기 시작한다. 일부 HbF는 성인기까지 지속되지만 (총 헤모글로빈의 대략 1-3%), 대략 10 개월째에 신생아의 헤모글로빈은 거의 모두 α2β2이다. 혈색소병증을 가진 대부분의 환자에서는, 감마 글로빈을 코딩하는 유전자가 여전히 존재하지만, 상기 기재된 바와 같이 분만시 발생하는 정상 유전자 억제로 인해 발현은 비교적 낮다.
겸상 적혈구 질환은 β 글로빈 유전자 (HBB)에서 V6E 돌연변이 (DNA 수준에서 GAG에서 GTG로)에 의해 유발되며, 생성된 헤모글로빈은 "헤모글로빈S" 또는 "HbS"로 지칭된다. 보다 낮은 산소 조건하에서는, HbS 분자가 응집하고 섬유성 침전물을 형성한다. 이들 응집물은 RBC의 이상 또는 '겸상화'를 유발하여, 세포의 유연성을 상실한다. 겸상 RBC는 더이상 모세혈관계로 넣어질 수 없으며, 겸상 적혈구 환자에서 혈관 폐색 위기를 일으킬 수 있다. 또한, 겸상 RBC는 정상 RBC에 비해 더 약하고, 용혈의 경향을 가지며, 결국 환자에서 빈혈을 초래한다.
겸상 적혈구 환자의 치료 및 관리는 항생체 치료, 통증 관리, 및 급성 에피소드 동안 수혈을 수반하는 평생의 일이다. 한 접근법은 히드록시우레아의 사용이며, 이는 감마 글로빈의 생성을 증가시킴으로써 부분적으로 그의 효과를 발휘한다. 만성 히드록시우레아 요법의 장기간 부작용은 아직 알려져 있지 않지만, 상기 치료는 원치않는 부작용을 일으키고, 환자마다 다양한 효능을 가질 수 있다. 겸상 적혈구 치료의 효능에서의 증가에도 불구하고, 환자의 기대 수명은 여전히 50대 중후반에 불과하며, 상기 질환과 연관된 이환율은 환자의 삶의 질에 큰 영향을 미친다.
지중해 빈혈 (알파 지중해 빈혈 및 베타 지중해 빈혈) 또한 헤모글로빈과 관련된 질환이며, 전형적으로 감소된 글로빈 쇄 발현을 수반한다. 이는 유전자의 조절 영역의 돌연변이를 통해, 또는 감소된 발현 또는 감소된 수준 또는 기능적 글로빈 단백질을 유발하는 글로빈 코딩 서열에서의 돌연변이로부터 발생할 수 있다. 지중해 빈혈의 치료에는 일반적으로 수혈 및 철 킬레이트 요법이 수반된다. 적절한 공여자가 확인될 수 있는 경우에는 골수 이식 또한 중증 지중해 빈혈을 가진 사람의 치료를 위해 이용되고 있지만, 이 절차는 상당한 위험을 가질 수 있다.
SCD 및 베타 지중해 빈혈 둘 다의 치료에 대해 제안된 한 접근법은, HbF가 비정상적인 성인 헤모글로빈을 기능적으로 대체하도록 감마 글로빈의 발현을 증가시키는 것이다. 상기 언급된 바와 같이, 히드록시우레아에 의한 SCD 환자의 치료는 감마 글로빈 발현을 증가시키는 그의 효과로 인해 부분적으로 성공적인 것으로 여겨진다 ([DeSimone (1982) Proc Nat'l Acad Sci USA 79(14):4428-31; Ley, et al., (1982) N. Engl. J. Medicine, 307: 1469-1475; Ley, et al., (1983) Blood 62: 370-380; Constantoulakis et al., (1988) Blood 72(6):1961-1967], 모두 본원에 참고로 포함됨). HbF의 발현 증가는 그의 생성물이 감마 글로빈 발현을 조절하는 역할을 하는 유전자의 확인을 수반한다. 이러한 한 유전자는 BCL11A이다. BCL11A는 성인 적혈구 전구체 세포에서 발현되는 아연 핑거 단백질을 코딩하고, 그의 발현의 하향조절은 감마 글로빈 발현을 증가시킨다 ([Sankaran et al. (2008) Science 322: 1839], 본원에 참고로 포함됨). BCL11A 유전자에 대해 표적화된 억제성 RNA의 사용이 제안되었지만 (예를 들어, 미국 특허 공보 2011/0182867, 본원에 참고로 포함됨), 이 기술은 몇가지 잠재적인 단점을 가지며, 예를 들어 완전한 녹다운이 달성되지 않을 수 있고, 이러한 RNA의 전달이 문제가 될 수 있으며, RNA가 지속적으로 존재해야 하므로, 평생 여러 치료를 필요로 한다.
본 발명의 RGN을 이용하여 BCL11A 인핸서 영역을 표적화하여, BCL11A의 발현을 방해할 수 있고, 이로써 감마 글로빈 발현이 증가된다. 이러한 표적화된 방해는 비상동성 말단 결합 (NHEJ)에 의해 달성될 수 있으며, 이에 의해 본 발명의 RGN이 BCL11A 인핸서 영역 내의 특정한 서열에 대해 표적화되고, 이중 가닥 파손이 형성되고, 전형적으로 유해한 돌연변이를 동시에 도입시키면서 세포 기구가 파손을 복구한다. 다른 질환 표적에 대해 기재된 것과 유사하게, 본 발명의 RGN은 생체내 전달을 위해 RGN 및 그의 가이드 RNA에 대한 발현 카세트를 단일 AAV 벡터에 팩키징할 수 있게 하는 그의 비교적 작은 크기 때문에 다른 공지된 RGN에 비해 이점을 갖는다. 이 방법에 대해 가능한 설명은 실시예 10에 제공된다. 본 발명의 RGN을 이용하는 유사한 전략은 또한 인간 및 농경학적으로 또는 경제적으로 중요한 비-인간 동물 모두에서 유사한 질환 및 장애에 적용될 수 있다.
IX. 폴리뉴클레오티드 유전자 변형을 포함하는 세포
본원에 기재된 RGN, crRNA, tracrRNA 및/또는 데아미나제에 의해 매개되는 과정을 이용하여 변형된 관심 표적 서열을 포함하는 세포 및 유기체가 본원에 제공된다. 이들 일부 실시양태에서, RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50,의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 다양한 실시양태에서, 가이드 RNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA, 또는 그의 활성 변이체 또는 단편을 포함한다. 상기 시스템의 가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA일 수 있다. 일부 실시양태에서, 데아미나제는 서열식별번호: 374-545 및 572-584 중 어느 하나의 아미노산 서열 또는 그의 활성 변이체 또는 단편을 포함한다.
변형된 세포는 진핵생물 (예를 들어, 포유동물, 식물, 곤충 세포) 또는 원핵생물일 수 있다. 본원에 기재된 RGN, crRNA 및/또는 tracrRNA를 이용하는 과정에 의해 변형된 적어도 하나의 뉴클레오티드 서열을 포함하는 소기관 및 배아 또한 제공된다. 유전자 변형된 세포, 유기체, 소기관 및 배아는 변형된 뉴클레오티드 서열에 대해 이형접합성 또는 동형접합성일 수 있다.
세포, 유기체, 소기관 또는 배아의 염색체 변형은 변경된 발현 (상향조절 또는 하향조절), 불활성화, 또는 변경된 단백질 생성물 또는 통합된 서열의 발현을 일으킬 수 있다. 염색체 변형이 유전자의 불활성화 또는 비기능성 단백질 생성물의 발현을 일으키는 것인 이들 예에서, 유전자 변형된 세포, 유기체, 소기관 또는 배아는 "녹아웃"으로 지칭된다. 녹아웃된 표현형은 결실 돌연변이 (즉, 적어도 하나의 뉴클레오티드의 결실), 삽입 돌연변이 (즉, 적어도 하나의 뉴클레오티드의 삽입), 또는 넌센스 돌연변이 (즉, 정지 코돈이 도입되도록 하는 적어도 하나의 뉴클레오티드의 치환)의 결과일 수 있다.
대안적으로, 세포, 유기체, 소기관 또는 배아의 염색체 변형은 "녹인"을 생성할 수 있으며, 이는 단백질을 코딩하는 뉴클레오티드 서열의 염색체 통합으로부터 발생한다. 이들 일부 실시양태에서, 코딩 서열은 야생형 단백질을 코딩하는 염색체 서열이 불활성화되지만 외인성으로 도입된 단백질이 발현되도록 염색체에 통합된다.
다른 실시양태에서, 염색체 변형은 변이체 단백질 생성물을 생성한다. 발현된 변이체 단백질 생성물은 적어도 하나의 아미노산 치환 및/또는 적어도 하나의 아미노산의 부가 또는 결실을 가질 수 있다. 변경된 염색체 서열에 의해 코딩되는 변이체 단백질 생성물은 야생형 단백질, 예컨대 비제한적으로 변경된 효소 활성 또는 기질 특이성과 비교하여 변형된 특징 또는 활성을 나타낼 수 있다.
여전히 다른 실시양태에서, 염색체 변형은 단백질의 변경된 발현 패턴을 일으킬 수 있다. 비제한적인 예로서, 단백질 생성물의 발현을 조절하는 조절 영역에서의 염색체 변경은 단백질 생성물의 과발현 또는 하향조절, 또는 변경된 조직 또는 일시적인 발현 패턴을 일으킬 수 있다.
단수 형태는 1개 또는 1개 초과의 (즉, 적어도 하나의) 문법적 대상을 지칭하기 위해 본원에서 사용된다. 예를 들어, "폴리펩티드"는 하나 이상의 폴리펩티드들을 의미한다.
본 명세서에 언급된 모든 공보 및 특허 출원은 이 개시내용이 속하는 기술분야의 기술자의 수준을 나타낸다. 모든 공보 및 특허 출원은 각각의 개별 공보 또는 특허 출원이 구체적이고 개별적으로 참고로 포함되는 것으로 나타낸 것과 동일한 정도로 본원에 참고로 포함된다.
상기 발명이 이해의 명료함의 목적으로 설명 및 예시를 위해 일부 상세하게 기재되었지만, 특정 변화 및 변형이 첨부된 실시양태의 범위 내에서 실시될 수 있음이 명백할 것이다.
비제한적인 실시양태에는 하기가 포함된다:
1. RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
상기 RGN 폴리펩티드는 표적 DNA 서열과 혼성화할 수 있는 가이드 RNA (gRNA)에 결합할 때 RNA-가이드된 서열 특이적인 방식으로 상기 표적 DNA 서열과 결합하고,
RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
2. 실시양태 1에 있어서, 상기 RGN 폴리펩티드가 결합시 상기 표적 DNA 서열을 절단할 수 있는 것인 핵산 분자.
3. 실시양태 2에 있어서, 상기 RGN 폴리펩티드에 의한 절단이 이중 가닥 파손을 생성하는 것인 핵산 분자.
4. 실시양태 2에 있어서, 상기 RGN 폴리펩티드에 의한 절단이 단일 가닥 파손을 생성하는 것인 핵산 분자.
5. 실시양태 1에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 핵산 분자.
6. 실시양태 5에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
7. 실시양태 6에 있어서, 상기 염기-편집 폴리펩티드가 데아미나제인 핵산 분자.
8. 실시양태 7에 있어서, 상기 데아미나제가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 90% 서열 동일성을 갖는 것인 핵산 분자.
9. 실시양태 1-8 중 어느 하나에 있어서, RGN 폴리펩티드가 하나 이상의 핵 국재화 신호를 포함하는 것인 핵산 분자.
10. 실시양태 1-9 중 어느 하나에 있어서, RGN 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화된 것인 핵산 분자.
11. 실시양태 1-10 중 어느 하나에 있어서, 상기 표적 DNA 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하게 위치하는 것인 핵산 분자.
12. 실시양태 1-11 중 어느 하나의 핵산 분자를 포함하는 벡터.
13. 실시양태 12에 있어서, 상기 표적 DNA 서열과 혼성화할 수 있는 상기 gRNA를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하는 벡터.
14. 실시양태 13에 있어서, 상기 gRNA가 단일 가이드 RNA인 벡터.
15. 실시양태 13에 있어서, 상기 gRNA가 이중-가이드 RNA인 벡터.
16. 실시양태 13-15 중 어느 하나에 있어서, 가이드 RNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 CRISPR 반복 서열을 포함하는 CRISPR RNA를 포함하는 것인 벡터.
17. 실시양태 13-16 중 어느 하나에 있어서, 가이드 RNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 tracrRNA을 포함하는 것인 벡터.
18. 실시양태 1-11 중 어느 하나의 핵산 분자 또는 실시양태 12-17 중 어느 하나의 벡터를 포함하는 세포.
19. RGN 폴리펩티드가 발현되는 조건하에 실시양태 18의 세포를 배양하는 것을 포함하는, RGN 폴리펩티드를 제조하는 방법.
20. 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 이종성 핵산 분자를 세포에 도입시키고;
상기 RGN 폴리펩티드는 표적 DNA 서열과 혼성화할 수 있는 가이드 RNA (gRNA)에 결합할 때 RNA-가이드된 서열 특이적인 방식으로 상기 표적 DNA 서열과 결합하며;
RGN 폴리펩티드가 발현되는 조건하에 상기 세포를 배양하는 것을 포함하는, RGN 폴리펩티드를 제조하는 방법.
21. 실시양태 19 또는 20에 있어서, 상기 RGN 폴리펩티드를 정제하는 것을 추가로 포함하는 방법.
22. 실시양태 19 또는 20에 있어서, 상기 세포가 상기 RGN 폴리펩티드에 결합하여 RGN 리보핵단백질 복합체를 형성하는 하나 이상의 가이드 RNA를 추가로 발현하는 것인 방법.
23. 실시양태 22에 있어서, 상기 RGN 리보핵단백질 복합체를 정제하는 것을 추가로 포함하는 방법.
24. CRISPR RNA (crRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 crRNA는 스페이서 서열 및 CRISPR 반복 서열을 포함하고, 상기 CRISPR 반복 서열은 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고;
a) 상기 crRNA; 및
b) 상기 crRNA의 상기 CRISPR 반복 서열에 혼성화된 트랜스-활성화 CRISPR RNA (tracrRNA)
를 포함하는 가이드 RNA는
상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드와 결합할 때 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열과 혼성화할 수 있고,
crRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
25. 실시양태 24의 핵산 분자를 포함하는 벡터.
26. 실시양태 25에 있어서, 상기 벡터가 상기 tracrRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
27. 실시양태 26에 있어서, 상기 tracrRNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인 벡터.
28. 실시양태 26 또는 27에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 동일한 프로모터에 작동가능하게 연결되고, 단일 가이드 RNA로서 코딩되는 것인 벡터.
29. 실시양태 26 또는 27에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 별도의 프로모터에 작동가능하게 연결된 것인 벡터.
30. 실시양태 25-29 중 어느 하나에 있어서, 상기 벡터가 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드를 추가로 포함하고, 상기 RGN 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 벡터.
31. 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 트랜스-활성화 CRISPR RNA (tracrRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며;
a) 상기 tracrRNA; 및
b) 스페이서 서열 및 CRISPR 반복 서열을 포함하는 crRNA
- 상기 tracrRNA는 상기 crRNA의 상기 CRISPR 반복 서열과 혼성화함
를 포함하는 가이드 RNA는
상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드에 결합할 때 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열과 혼성화할 수 있고,
tracrRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
32. 실시양태 31의 핵산 분자를 포함하는 벡터.
33. 실시양태 32에 있어서, 상기 벡터가 상기 crRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
34. 실시양태 33에 있어서, 상기 crRNA의 CRISPR 반복 서열이 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인 벡터.
35. 실시양태 33 또는 34에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 동일한 프로모터에 작동가능하게 연결되고, 단일 가이드 RNA로서 코딩되는 것인 벡터.
36. 실시양태 33 또는 34에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 별도의 프로모터에 작동가능하게 연결된 것인 벡터.
37. 실시양태 32-36 중 어느 하나에 있어서, 상기 벡터가 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드를 추가로 포함하고, 상기 RGN 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 벡터.
38. 표적 DNA 서열에 결합하기 위한 시스템이며, 상기 시스템은 하기를 포함하고:
a) 상기 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열;
하나 이상의 가이드 RNA를 코딩하고 RGN 폴리펩티드를 코딩하는 상기 뉴클레오티드 서열 각각이 상기 뉴클레오티드 서열에 대해 이종성인 프로모터에 작동가능하게 연결되고;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하고,
하나 이상의 가이드 RNA는 RGN 폴리펩티드와 복합체를 형성하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 시스템.
39. 실시양태 38에 있어서, 상기 gRNA가 단일 가이드 RNA (sgRNA)인 시스템.
40. 실시양태 38에 있어서, 상기 gRNA가 이중-가이드 RNA인 시스템.
41. 실시양태 38-40 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하는 것인 시스템.
42. 실시양태 38-41 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하는 것인 시스템.
43. 실시양태 38-42 중 어느 하나에 있어서, 상기 표적 DNA 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하게 위치하는 시스템.
44. 실시양태 38-43 중 어느 하나에 있어서, 표적 DNA 서열이 세포 내에 있는 것인 시스템.
45. 실시양태 44에 있어서, 세포가 진핵생물 세포인 시스템.
46. 실시양태 45에 있어서, 진핵생물 세포가 식물 세포인 시스템.
47. 실시양태 45에 있어서, 진핵생물 세포가 포유동물 세포인 시스템.
48. 실시양태 45에 있어서, 진핵생물 세포가 곤충 세포인 시스템.
49. 실시양태 44에 있어서, 세포가 원핵생물 세포인 시스템.
50. 실시양태 38-49 중 어느 하나에 있어서, 전사될 때 하나 이상의 가이드 RNA가 표적 DNA 서열과 혼성화하고, 가이드 RNA가 표적 DNA 서열의 절단을 초래하는 RGN 폴리펩티드와 복합체를 형성하는 것인 시스템.
51. 실시양태 50에 있어서, 절단이 이중 가닥 파손을 생성하는 것인 시스템.
52. 실시양태 50에 있어서, 상기 RGN 폴리펩티드에 의한 절단이 단일 가닥 파손을 생성하는 것인 시스템.
53. 실시양태 38-49 중 어느 하나에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 시스템.
54. 실시양태 53에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 시스템.
55. 실시양태 54에 있어서, 상기 염기-편집 폴리펩티드가 데아미나제인 시스템.
56. 실시양태 55에 있어서, 상기 데아미나제가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 90% 서열 동일성을 갖는 것인 시스템.
57. 실시양태 38-56 중 어느 하나에 있어서, RGN 폴리펩티드가 하나 이상 핵 국재화 신호를 포함하는 것인 시스템.
58. 실시양태 38-57 중 어느 하나에 있어서, RGN 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화된 것인 시스템.
59. 실시양태 38-58 중 어느 하나에 있어서, 하나 이상의 가이드 RNA를 코딩하는 뉴클레오티드 서열 및 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열이 하나의 벡터 상에 위치하는 것인 시스템.
60. 실시양태 38-59 중 어느 하나에 있어서, 상기 시스템이 하나 이상의 공여자 폴리뉴클레오티드, 또는 하나 이상의 공여자 폴리뉴클레오티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 추가로 포함하는 것인 시스템.
61. 실시양태 38-60 중 어느 하나에 따른 시스템을 표적 DNA 서열, 또는 표적 DNA 서열을 포함하는 세포에 전달하는 것을 포함하는, 표적 DNA 서열에 결합시키는 방법.
62. 실시양태 61에 있어서, 상기 RGN 폴리펩티드 또는 상기 가이드 RNA가 검출가능한 표지를 추가로 포함하여, 상기 표적 DNA 서열의 검출을 가능하게 하는 것인 방법.
63. 실시양태 61에 있어서, 상기 가이드 RNA 또는 상기 RGN 폴리펩티드가 발현 조절인자를 추가로 포함하여, 상기 표적 DNA 서열, 또는 상기 표적 DNA 서열에 의한 전사 조절하에 있는 유전자의 발현을 조절하는 것인 방법.
64. 실시양태 38-60 중 어느 하나에 따른 시스템을 표적 DNA 서열, 또는 표적 DNA 서열을 포함하는 세포에 전달하는 것을 포함하는, 표적 DNA 서열을 절단하거나 또는 변형시키는 방법.
65. 실시양태 64에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로의 이종성 DNA의 삽입을 포함하는 것인 방법.
66. 실시양태 64에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로부터 적어도 하나의 뉴클레오티드의 결실을 포함하는 것인 방법.
67. 실시양태 64에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열에서 적어도 하나의 뉴클레오티드의 돌연변이를 포함하는 것인 방법.
68. a) RGN 리보뉴클레오티드 복합체의 형성에 적합한 조건하에
i) 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA; 및
ii) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RGN 폴리펩티드
를 조합함으로써 시험관내에서 RNA-가이드된 뉴클레아제 (RGN) 리보뉴클레오티드 복합체를 조립하고;
b) 상기 표적 DNA 서열, 또는 상기 표적 DNA 서열을 포함하는 세포를 시험관내-조립된 RGN 리보뉴클레오티드 복합체와 접촉시키는 것을 포함하는, 표적 DNA 서열에 결합시키는 방법이며;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 방법.
69. 실시양태 68에 있어서, 상기 RGN 폴리펩티드 또는 상기 가이드 RNA가 검출가능한 표지를 추가로 포함하여, 상기 표적 DNA 서열의 검출을 가능하게 하는 것인 방법.
70. 실시양태 68에 있어서, 상기 가이드 RNA 또는 상기 RGN 폴리펩티드가 발현 조절인자를 추가로 포함하여, 상기 표적 DNA 서열의 발현의 조절을 가능하게 하는 것인 방법.
71. DNA 분자를 하기와 접촉시키는 것을 포함하는, 표적 DNA 서열을 절단하고/거나 변형시키는 방법이며:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 여기서 상기 RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함함; 및
b) (a)의 RGN을 표적 DNA 서열에 대해 표적화할 수 있는 하나 이상의 가이드 RNA;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열과 결합하도록 지시하고, 상기 표적 DNA 서열의 절단 및/또는 변형이 발생하는 것인 방법.
72. 실시양태 71에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로의 이종성 DNA의 삽입을 포함하는 것인 방법.
73. 실시양태 71에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로부터 적어도 하나의 뉴클레오티드의 결실을 포함하는 것인 방법.
74. 실시양태 71에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열에서 적어도 하나의 뉴클레오티드의 돌연변이를 포함하는 것인 방법.
75. 실시양태 71-74 중 어느 하나에 있어서, 상기 RGN 폴리펩티드가 닉카제인 방법.
76. 실시양태 73 또는 74에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이고, 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 방법.
77. 실시양태 68-76 중 어느 하나에 있어서, 상기 gRNA가 단일 가이드 RNA (sgRNA)인 방법.
78. 실시양태 68-76 중 어느 하나에 있어서, 상기 gRNA가 이중-가이드 RNA인 방법.
79. 실시양태 68-78 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하는 것인 방법.
80. 실시양태 68-79 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하는 것인 방법.
81. 실시양태 68-80 중 어느 하나에 있어서, 상기 표적 DNA 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하게 위치하는 것인 방법.
82. 실시양태 61-81 중 어느 하나에 있어서, 표적 DNA 서열이 세포 내에 위치하는 것인 방법.
83. 실시양태 82에 있어서, 세포가 진핵생물 세포인 방법.
84. 실시양태 83에 있어서, 진핵생물 세포가 식물 세포인 방법.
85. 실시양태 83에 있어서, 진핵생물 세포가 포유동물 세포인 방법.
86. 실시양태 83에 있어서, 진핵생물 세포가 곤충 세포인 방법.
87. 실시양태 82에 있어서, 세포가 원핵생물 세포인 방법.
88. 실시양태 82-87 중 어느 하나에 있어서, RGN 폴리펩티드가 발현되는 조건하에 세포를 배양하여, 표적 DNA 서열을 절단하여 변형된 DNA 서열을 생성하고; 상기 변형된 DNA 서열을 포함하는 세포를 선택하는 것을 추가로 포함하는 방법.
89. 실시양태 88의 방법에 따른 변형된 표적 DNA 서열을 포함하는 세포.
90. 실시양태 89에 있어서, 세포가 진핵생물 세포인 세포.
91. 실시양태 90에 있어서, 진핵생물 세포가 식물 세포인 세포.
92. 실시양태 91의 세포를 포함하는 식물.
93. 실시양태 91의 세포를 포함하는 종자.
94. 실시양태 90에 있어서, 진핵생물 세포가 포유동물 세포인 세포.
95. 실시양태 90에 있어서, 진핵생물 세포가 곤충 세포인 세포.
96. 실시양태 89에 있어서, 세포가 원핵생물 세포인 세포.
97. 세포에 하기를 도입시키는 것을 포함하고:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드 - 여기서 RGN 폴리펩티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하고, RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 세포에서 RGN 폴리펩티드의 발현이 가능하도록 프로모터에 작동가능하게 연결됨; 및
b) 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결됨;
이로써 RGN 및 gRNA은 원인 돌연변이의 게놈 위치에 대해 표적화되고, 원인 돌연변이를 제거하도록 게놈 서열을 변형시키는 것인, 유전적으로 유전된 질환에 대한 원인 돌연변이에서의 수정에 의해 유전자 변형된 세포를 생성하는 방법.
98. 실시양태 97에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 방법.
99. 실시양태 98에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 방법.
100. 실시양태 99에 있어서, 상기 염기-편집 폴리펩티드가 데아미나제인 방법.
101. 실시양태 100에 있어서, 데아미나제가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 방법.
102. 실시양태 97-101 중 어느 하나에 있어서, 세포가 동물 세포인 방법.
103. 실시양태 102에 있어서, 동물 세포가 포유동물 세포인 방법.
104. 실시양태 103에 있어서, 세포가 개, 고양이, 마우스, 래트, 토끼, 말, 소, 돼지, 또는 인간으로부터 유래되는 것인 방법.
105. 실시양태 102에 있어서, 유전적으로 유전된 질환이 표 8에 나열된 질환인 방법.
106. 실시양태 102에 있어서, 유전적으로 유전된 질환이 헐러 증후군인 방법.
107. 실시양태 106에 있어서, gRNA가 서열식별번호: 337을 표적화하는 스페이서 서열을 포함하는 것인 방법.
108. 세포에 하기를 도입하는 것을 포함하며:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드 - 여기서 RGN 폴리펩티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하고, RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 세포에서 RGN 폴리펩티드의 발현이 가능하도록 프로모터에 작동가능하게 연결됨; 및
b) 제1 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결되고, 추가로 gRNA는 불안정 게놈 영역의 5' 플랭크를 표적화하는 스페이서 서열을 포함함; 및
c) 제2 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결되고, 추가로 상기 제2 gRNA는 불안정 게놈 영역의 3' 플랭크를 표적화하는 스페이서 서열을 포함함;
이로써 RGN 및 2개의 gRNA는 불안정 게놈 영역을 표적화하고, 불안정 게놈 영역의 적어도 일부분이 제거되는 것인, 질환을 유발하는 불안정 게놈 영역에서 결실을 갖는 유전자 변형된 세포를 생성하는 방법.
109. 실시양태 108에 있어서, 세포가 동물 세포인 방법.
110. 실시양태 108에 있어서, 세포가 포유동물 세포인 방법.
111. 실시양태 110에 있어서, 세포가 개, 고양이, 마우스, 래트, 토끼, 말, 소, 돼지, 또는 인간으로부터 유래되는 것인 방법.
112. 실시양태 109에 있어서, 유전적으로 유전된 질환이 프리드리히(Friedrich) 운동실조 또는 헌팅턴 질환인 방법.
113. 실시양태 112에 있어서, 제1 gRNA가 서열식별번호: 340, 341, 342 또는 343을 표적화하는 스페이서 서열을 포함하는 것인 방법.
114. 실시양태 113에 있어서, 제2 gRNA가 서열식별번호: 340, 341, 342 또는 343을 표적화하는 스페이서 서열을 포함하는 것인 방법.
115. 단리된 인간 조혈 전구 세포에 하기를 도입하는 것을 포함하며:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드 - 여기서 RGN 폴리펩티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하고, RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 세포에서 RGN 폴리펩티드의 발현이 가능하도록 프로모터에 작동가능하게 연결됨; 및
b) 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결됨,
이로써 RGN 및 gRNA는 세포에서 발현되고, BCL11A 인핸서 영역에서 절단하여, 인간 조혈 전구 세포의 유전자 변형을 일으키고, BCL11A의 mRNA 및/또는 단백질 발현을 감소시키는 것인, 감소된 BCL11A mRNA 및 단백질 발현을 갖는 유전자 변형된 포유동물의 조혈 전구 세포를 생성하는 방법.
116. 실시양태 115에 있어서, gRNA가 서열식별번호: 350, 351 또는 352를 표적화하는 스페이서 서열을 추가로 포함하는 것인 방법.
117. 표적 DNA 서열과 결합하기 위한 시스템이며, 상기 시스템은 하기를 포함하고:
a) 상기 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하고,
하나 이상의 가이드 RNA는 RGN 폴리펩티드와 복합체를 형성하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 시스템.
118. 실시양태 117에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 시스템.
119. 실시양태 117 또는 118에 있어서, 상기 RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 융합된 것인 시스템.
120. 실시양태 119에 있어서, 염기-편집 폴리펩티드가 데아미나제인 시스템.
121. 실시양태 120에 있어서, 데아미나제 폴리펩티드가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.
122. 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
상기 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키고;
상기 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
123. 실시양태 122에 있어서, 데아미나제 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화되는 것인 핵산 분자.
124. 실시양태 122 또는 123에 있어서, 데아미나제 폴리펩티드가 상기 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 DNA-결합 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
125. 실시양태 124에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 핵산 분자.
126. 실시양태 124에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드되는 것인 핵산 분자.
127. 실시양태 126에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 핵산 분자.
128. 실시양태 127에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 핵산 분자.
129. 실시양태 127에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 핵산 분자.
130. 실시양태 126-129 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 핵산 분자.
131. 실시양태 127에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 핵산 분자.
132. 실시양태 124-131 중 어느 하나에 있어서, 데아미나제 폴리펩티드가 우라실 글리코실라제 억제제 (UGI) 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
133. 실시양태 132에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 핵산 분자.
134. 실시양태 122-133 중 어느 하나에 있어서, 데아미나제 폴리펩티드가 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 핵산 분자.
135. 실시양태 122-134 중 어느 하나의 핵산 분자를 포함하는 벡터.
136. 실시양태 126-134 중 어느 하나의 핵산 분자를 포함하는 벡터이며, 상기 벡터는 상기 표적 폴리뉴클레오티드와 혼성화할 수 있고 상기 RNA-가이드된 DNA-결합 폴리펩티드와 복합체로 작용할 수 있는 가이드 RNA (gRNA)를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하는 것인 벡터.
137. 실시양태 136에 있어서, 상기 gRNA가 단일 가이드 RNA인 벡터.
138. 실시양태 136에 있어서, 상기 gRNA가 이중-가이드 RNA인 벡터.
139. 실시양태 122-134 중 어느 하나의 핵산 분자 또는 실시양태 135-138 중 어느 하나의 벡터를 포함하는 세포.
140. 실시양태 139의 세포를 데아미나제 폴리펩티드가 발현되는 조건하에 배양하는 것을 포함하는, 데아미나제 폴리펩티드의 제조 방법.
141. 아데노신 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고:
a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키고;
아데노신 데아미나제 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
142. 실시양태 141에 있어서, 상기 아데노신 데아미나제 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화되는 것인 핵산 분자.
143. 실시양태 141 또는 142에 있어서, 아데노신 데아미나제 폴리펩티드가 상기 아데노신 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 DNA-결합 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
144. 실시양태 143에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 핵산 분자.
145. 실시양태 143에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드된 것인 핵산 분자.
146. 실시양태 145에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 핵산 분자.
147. 실시양태 146에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 핵산 분자.
148. 실시양태 146에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 핵산 분자.
149. 실시양태 145-148 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 핵산 분자.
150. 실시양태 146에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 핵산 분자.
151. 실시양태 141-150 중 어느 하나에 있어서, 아데노신 데아미나제 폴리펩티드가 우라실 글리코실라제 억제제 (UGI) 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
152. 실시양태 151에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 핵산 분자.
153. 실시양태 141-152 중 어느 하나에 있어서, 아데노신 데아미나제 폴리펩티드가 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 핵산 분자.
154. 실시양태 141-153 중 어느 하나의 핵산 분자를 포함하는 벡터.
155. 실시양태 145-153 중 어느 하나의 핵산 분자를 포함하는 벡터이며, 상기 벡터는 상기 표적 폴리뉴클레오티드와 혼성화할 수 있고 상기 RNA-가이드된 DNA-결합 폴리펩티드와 복합체로 작용할 수 있는 가이드 RNA (gRNA)를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하는 것인 벡터.
156. 실시양태 155에 있어서, 상기 gRNA가 단일 가이드 RNA인 벡터.
157. 실시양태 155에 있어서, 상기 gRNA가 이중-가이드 RNA인 벡터.
158. 실시양태 141-153 중 어느 하나의 핵산 분자 또는 실시양태 154-157 중 어느 하나의 벡터를 포함하는 세포.
159. 실시양태 158의 세포를 아데노신 데아미나제 폴리펩티드가 발현되는 조건하에 배양하는 것을 포함하는, 아데노신 데아미나제 폴리펩티드의 제조 방법.
160. 하기를 포함하는 융합 단백질이며:
a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
b) 데아미나제 폴리펩티드,
상기 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 융합 단백질.
161. 실시양태 160에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 융합 단백질.
162. 실시양태 160에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드된 것인 융합 단백질.
163. 실시양태 162에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 융합 단백질.
164. 실시양태 163에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 융합 단백질.
165. 실시양태 163에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 융합 단백질.
166. 실시양태 162-165 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 융합 단백질.
167. 실시양태 163에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 융합 단백질.
168. 실시양태 160-167 중 어느 하나에 있어서, 융합 단백질이 우라실 글리코실라제 억제제 (UGI) 폴리펩티드를 추가로 포함하는 것인 융합 단백질.
169. 실시양태 168에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 융합 단백질.
170. 실시양태 160-169 중 어느 하나에 있어서, 융합 단백질이 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 융합 단백질.
171. 하기를 포함하는 융합 단백질이며:
a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
b) 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드:
i) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
ii) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
iii) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
iv) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
v) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
vi) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
vii) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
viii) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
ix) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
x) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
xi) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
xii) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
xiii) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
xiv) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 융합 단백질.
172. 실시양태 171에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 융합 단백질.
173. 실시양태 171에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드된 것인 융합 단백질.
174. 실시양태 173에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 융합 단백질.
175. 실시양태 174에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 융합 단백질.
176. 실시양태 174에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 융합 단백질.
177. 실시양태 173-176 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 융합 단백질.
178. 실시양태 174에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 융합 단백질.
179. 실시양태 171-178 중 어느 하나에 있어서, 융합 단백질이 우라실 글리코실라제 억제제 (UGI) 폴리펩티드를 추가로 포함하는 것인 융합 단백질.
180. 실시양태 179에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 융합 단백질.
181. 실시양태 171-180 중 어느 하나에 있어서, 융합 단백질이 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 융합 단백질.
182. 표적 폴리뉴클레오티드 서열을 변형시키기 위한 시스템이며, 상기 시스템은 하기를 포함하고:
a) 상기 표적 폴리뉴클레오티드 서열에 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 실시양태 162-170 및 173-181 중 어느 하나의 융합 단백질 또는 상기 융합 단백질을 코딩하는 뉴클레오티드 서열;
하나 이상의 가이드 RNA를 코딩하고 융합 단백질을 코딩하는 상기 뉴클레오티드 서열 각각은 상기 뉴클레오티드 서열에 대해 이종성인 프로모터에 대해 작동가능하게 연결되고;
하나 이상의 가이드 RNA는 표적 폴리뉴클레오티드 서열에 혼성화하고,
하나 이상의 가이드 RNA는 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열과 결합하여 그를 변형시키도록 지시하는 것인 시스템.
183. 실시양태 182에 있어서, 상기 gRNA가 단일 가이드 RNA (sgRNA)인 시스템.
184. 실시양태 182에 있어서, 상기 gRNA가 이중-가이드 RNA인 시스템.
185. 실시양태 182-184 중 어느 하나에 있어서, 상기 표적 폴리뉴클레오티드 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하여 위치하는 것인 시스템.
186. 실시양태 182-185 중 어느 하나에 있어서, 표적 폴리뉴클레오티드 서열이 세포 내에 있는 것인 시스템.
187. 실시양태 186에 있어서, 세포가 진핵생물 세포인 시스템.
188. 실시양태 187에 있어서, 진핵생물 세포가 식물 세포인 시스템.
189. 실시양태 187에 있어서, 진핵생물 세포가 포유동물 세포인 시스템.
190. 실시양태 187에 있어서, 진핵생물 세포가 곤충 세포인 시스템.
191. 실시양태 186에 있어서, 세포가 원핵생물 세포인 시스템.
192. 표적 폴리뉴클레오티드를 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 탈아미노화시키는 방법이며, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
193. 표적 폴리뉴클레오티드를 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 방법이며:
a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 방법.
194. 표적 폴리뉴클레오티드를 실시양태 160, 161, 171 및 172 중 어느 하나의 융합 단백질과 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며, 상기 DNA-결합 폴리펩티드는 상기 표적 폴리뉴클레오티드에 결합하고, 상기 데아미나제는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
195. 표적 폴리뉴클레오티드를 실시양태 162-170 및 173-181 중 어느 하나의 융합 단백질과 접촉시키고, 하나 이상의 가이드 RNA (gRNA), 또는 하나 이상의 gRNA를 코딩하는 하나 이상의 뉴클레오티드 서열을 도입시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며;
하나 이상의 gRNA는 상기 표적 폴리뉴클레오티드에 혼성화하고, 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열에 결합하도록 지시하고, 융합 단백질의 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시켜, 상기 표적 폴리뉴클레오티드를 변형시키는 것인 방법.
196. 실시양태 195에 있어서, 표적 폴리뉴클레오티드가 세포 내에 있는 것인 방법.
197. 실시양태 196에 있어서, 세포가 진핵생물 세포인 방법.
198. 실시양태 197에 있어서, 진핵생물 세포가 포유동물 세포인 방법.
199. 실시양태 197에 있어서, 진핵생물 세포가 식물 세포인 방법.
200. 실시양태 195 내지 199 중 어느 하나에 있어서, 표적 폴리뉴클레오티드의 변형이 C에서 T로의 점 돌연변이를 포함하는 것인 방법.
201. 실시양태 200에 있어서, C 염기의 탈아미노화가 질환 또는 장애와 연관된 서열을 수정하는 것인 방법.
202. 실시양태 200에 있어서, 표적 폴리뉴클레오티드의 변형이 농작물의 게놈에서 C에서 T로의 변화를 포함하고, C 염기의 탈아미노화가 농작물의 농경학적 품질을 개선시키는 서열을 생성하는 것인 방법.
203. 실시양태 195 내지 199 중 어느 하나에 있어서, 표적 폴리뉴클레오티드의 변형이 A에서 G로의 점 돌연변이를 포함하는 것인 방법.
204. 실시양태 203에 있어서, A 염기의 탈아미노화가 질환 또는 장애와 연관된 서열을 수정하는 것인 방법.
205. 실시양태 203에 있어서, 표적 폴리뉴클레오티드의 변형이 농작물의 게놈에서 A에서 G로의 변화를 포함하고, A 염기의 탈아미노화가 농작물의 농격학적 품질을 개선시키는 서열을 생성하는 것인 방법.
하기 실시예는 설명을 위해 제공되며, 제한하는 것이 아니다.
실험
실시예 1. RNA-가이드된 뉴클레아제의 확인
6개의 별개의 CRISPR-연관된 RNA-가이드된 뉴클레아제 (RGN)를 확인하였고, 하기 표 1에 기재하였다. APG00969, APG03128 및 APG00771은 유형 II-C RGN이다. APG09748, APG02789 및 APG09106은 유형 V-B RGN이다. 표 1은 각각의 RGN의 명칭, 그의 아미노산 서열, 그가 유래된 공급원, 및 가공된 crRNA 반복 서열 및 tracrRNA 서열을 제공한다. 표 1은 sgRNA의 핵산 표적 서열을 결정하는 포괄적인 단일 가이드 RNA (sgRNA) 서열을 추가로 제공한다. 스페이서 서열의 위치는 폴리-N 서열에 의해 표시된다. 이 폴리-N 서열은 sgRNA에서 스페이서 서열의 위치를 나타내고, 기능적인 스페이서 서열에 필요한 길이를 나타내지는 않는다. 유형 II-C RGN 시스템 각각은 tracrRNA의 헤어핀 스템의 염기에서 보존된 서열을 갖고: APG00969는 UNANNC (서열식별번호: 13)를 갖고; APG03128은 ANGNNU (서열식별번호: 23)를 갖고; APG00771은 UNANNA (서열식별번호: 42)를 갖는다.
표 1: 서열식별번호 및 CRISPR 연관된 시스템의 개요
Figure pct00001
실시예 2: 가이드 RNA 확인 및 sgRNA 구축
연구 중인 RNA-가이드된 뉴클레아제 시스템을 본래 발현하는 박테리아의 배양물을 중간-로그 단계 (~0.600의 OD600)로 성장시키고, 펠렛화하고, 급속 냉동하였다. mirVANA miRNA 단리 키트 (라이프 테크놀로지즈(Life Technologies), 캘리포니아주 칼스바드)를 사용하여 RNA를 펠렛으로부터 단리하고, 단리된 RNA로부터 NEBNext 소형 RNA 라이브러리 제조 키트 (NEB, 메사추세츠주 베벌리)를 사용하여 시퀀싱 라이브러리를 제조하였다. 라이브러리 제조물을 6% 폴리아크릴아미드 겔 상에서 crRNA 및 tracrRNA를 검출하기 위해 각각 18-65nt 및 90-200nt RNA 종에 상응하는 2가지 크기 분획으로 분획화하였다. 딥 시퀀싱 (더 작은 분획의 경우 40 bp 쌍-말단 및 더 큰 분획의 경우 80bp 쌍-말단)은 Next Seq 500 (하이 아웃풋 키트(High Output kit)) 상에서 서비스 제공자 (모진(MoGene), 미주리주 세인트 루이스)에 의해 수행되었다. 판독을 컷어댑트(Cutadapt)를 사용하여 품질을 다듬고, 보우타이(Bowtie)2를 이용하여 기준 게놈에 맵핑하였다. 커스텀 RNAseq 파이프라인을 파이썬에 기록하여 crRNA 및 tracrRNA 전사체를 검출하였다. 가공된 crRNA 경계를 본래의 반복 스페이서 어레이의 서열 커버리지에 의해 결정하였다. tracrRNA의 안티-반복 부분은 허용적 BLASTn 파라미터를 사용하여 확인하였다. RNA 시퀀싱 깊이는 안티-반복부를 함유하는 전사체를 확인함으로써 가공된 tracrRNA의 경계를 확인시켰다. RNA의 수동 큐레이션을 RNA 폴딩 소프트웨어인 NUPACK에 의해 이차 구조 예측을 이용하여 수행하였다. 대안적으로, APG02789를 위한 tracrRNA는 소형 RNA 시퀀싱을 통해서가 아니라 안티-반복 서열에 의해 생물정보학적으로 결정되었다. 일반적으로, sgRNA 카세트를 DNA 합성에 의해 제조하였고, 일반적으로 APG00771, APG03128 및 APG00969를 위해 다음과 같이 설계되었다 (5'→3') 20-30 bp 스페이서 서열 -- crRNA의 가공된 반복 부분 -- 4 bp 비상보성 링커 (AAAG; 서열식별번호: 8) -- 가공된 tracrRNA. APG09748, APG09106 및 APG02789의 경우, sgRNA 카세트는 다음과 같이 설계되었다 (5'→3'): 가공된 tracrRNA -- 4 bp 비상보성 링커 (AAAG; 서열식별번호: 8) -- crRNA의 가공된 반복 부분) -- 20-30 bp 표적 스페이서 서열. 관련 기술분야에 공지된 다른 4 bp 또는 6 bp 비상보성 링커 또한 sgRNA 설계를 위해 사용될 수 있다. 시험관내 검정의 경우, 진아트(GeneArt)™ 정밀 gRNA 합성 키트 (써모피셔(ThermoFisher))를 사용하여 sgRNA 카세트의 시험관내 전사에 의해 sgRNA를 합성하였다. 각각의 RGN 폴리펩티드에 대한 가공된 crRNA 및 tracrRNA 서열을 확인하였고, 표 1에 제시되어 있다. PAM 라이브러리 1 및 2에 대해 구축된 sgRNA에 대해서는 하기를 참고한다.
실시예 3: 각각의 RGN에 대한 PAM 요건의 결정
각각의 RGN에 대한 PAM 요건을 [Kleinstiver et al. (2015) Nature 523:481-485 및 Zetsche et al. (2015) Cell 163:759-771]로부터 본질적으로 채택된 PAM 고갈 검정을 사용하여 결정하였다. 간략히, 2개의 플라스미드 라이브러리 (L1 및 L2)를 pUC18 백본 (ampR)에서 생성하였고, 이들 각각은 8개의 무작위 뉴클레오티드 (즉, PAM 영역)에 의해 플랭킹된 별개의 30bp 프로토스페이서 (표적) 서열을 함유하였다. RGN APG00969, APG03128 및 APG00771에 대한 라이브러리 1 및 라이브러리 2의 표적 서열 및 플랭킹 PAM 영역은 각각 서열식별번호: 14 및 15이다. RGN AP09748, APG02789 및 APG09106에 대한 라이브러리 1 및 라이브러리 2의 표적 서열 및 플랭킹 PAM 영역은 각각 서열식별번호: 32 및 33이다.
L1 또는 L2에서 프로토스페이서에 상응하는 스페이서 서열을 함유하는 동족 sgRNA와 함께, 본 발명의 RGN을 함유하는 pRSF-1b 발현 벡터 (이. 콜라이에 대해 코돈 최적화됨)를 보유하는 이. 콜라이(E. coli) BL21(DE3) 세포에 라이브러리를 별도로 전기천공하였다. 충분한 라이브러리 플라스미드를 형질전환 반응에서 사용하여, >10^6 CFU를 수득하였다. pRSF-1b 백본에서 RGN 및 sgRNA 둘 다 T7 프로모터의 조절하에 있었다. 형질전환 반응을 1 시간 동안 회복시킨 후, 이를 카르베니실린 및 카나마이신을 함유하는 LB 배지로 희석하고, 밤새 성장시켰다. 다음 날, 혼합물을 자체-유도 오버나이트 익스프레스(Overnight Express)™ 즉석 TB 배지 (밀리포어 시그마(Millipore Sigma))로 희석하여 RGN 및 sgRNA를 발현시키고, 추가 4 시간 또는 20 시간 동안 성장시켰고, 그 후에 세포를 스핀 다운하고, 플라스미드 DNA를 미니-프렙 키트(Mini-prep kit) (퀴아젠(Qiagen), 메릴랜드주 저먼타운)에 의해 단리하였다. 적절한 sgRNA의 존재하에, RGN에 의해 인식가능한 PAM을 함유하는 플라스미드가 절단되어, 집단으로부터 제거될 것이다. RGN에 의해 인식되지 않거나 또는 적절한 sgRNA를 함유하지 않는 박테리아로 형질전환된 PAM을 함유하는 플라스미드는 생존하고 복제할 것이다. 절단되지 않은 플라스미드의 PAM 및 프로토스페이서 영역을 PCR-증폭시키고, 공개된 프로토콜 (16s-메가게놈 라이브러리 제조 가이드 15044223B, 일루미나(Illumina), 캘리포니아주 샌디에고)에 따라 시퀀싱을 위해 준비하였다. 딥 시퀀싱 (80bp 단일 말단 판독)은 서비스 제공자 (모진, 미주리주 세인트 루이스)에 의해 MiSeq (일루미나) 상에서 수행되었다. 전형적으로, 앰플리콘당 1-4M 판독이 수득되었다. PAM 영역을 추출하고, 카운팅하고, 각각의 샘플의 총 판독에 대해 정규화하였다. 플라스미드 절단을 유도하는 PAM은 대조군과 비교할 때 (즉, 라이브러리가 RGN을 함유하지만 적절한 sgRNA가 결여된 이. 콜라이로 형질전환되었을 때) 적게 표시되는 것으로 확인되었다. 신규한 RGN에 대한 PAM 요건을 표시하기 위해, 해당 영역의 모든 서열에 대한 고갈률 (샘플에서 빈도/대조군에서 빈도)을 -log 염기 2 형질전환에 의해 농축 값으로 전환시켰다. 충분한 PAM은 농축 값 >2.3 (고갈률 < ~0.2에 상응함)을 가진 것들로 정의되었다. 두 라이브러리 모두에서 이 역치보다 높은 PAM을 수집하였고, 웹 로고를 생성하기 위해 사용하였으며, 이는 예를 들어 "웹로고(weblogo)"로 공지된 인터넷 상의 웹-기반 서비스를 이용하여 생성될 수 있다. 상위 농축 PAM에서 일정한 패턴이 있을 때 PAM 서열을 확인하고 보고하였다. 각각의 RGN에 대한 PAM (농축 지수 (EF) >2.3을 가짐)이 표 2에 제공된다. 일부 RGN의 경우, 비제한적인 예시적인 PAM (EF>3.3을 가짐) 또한 확인되었다. PAM 배향은 APG00969, APG03128, APG00771의 경우 5'-표적-PAM-3'이고, APG09748, APG09106 및 APG02789의 경우 5'-PAM-표적-3'이다.
표 2: PAM 결정
Figure pct00002
실시예 4: 뉴클레아제 활성을 증가시키기 위한 가이드 RNA의 조작
매우 높은 서열 동일성을 갖고 동일한 PAM을 갖는 RGN APG09748 및 APG09106의 경우, RNA 폴딩 예측을 이용하여, 뉴클레아제 활성을 최적화시키도록 변형될 수 있는 가이드 RNA의 영역을 결정하였다. 반복:안티-반복 영역에서 crRNA:tracrRNA 염기쌍 형성의 안정성은 반복:안티-반복 영역을 단축시키고, G-C 염기쌍을 부가하고, G-U 동요(wobble) 쌍을 제거함으로써 증가되었다. "최적화된" 가이드 변이체를 시험관내 절단 검정에서 RGN APG09748을 이용하여 시험하고 야생형 gRNA와 비교하였다.
RNP 형성을 위한 RGN을 생성하기 위해, C-말단 His6 (서열식별번호: 593) 또는 His10 (서열식별번호: 594) 태그에 융합된 RGN을 함유하는 발현 플라스미드를 구축하고, 이. 콜라이의 BL21 (DE3) 균주로 형질전환시켰다. 발현은 50 μg/mL 카나마이신으로 보충된 매직 미디어(Magic Media) (써모 피셔)를 사용하여 수행하였다. 용해 및 정화 이후, 단백질을 고정된 금속 친화도 크로마토그래피에 의해 정제하고, 큐빗(Qubit) 단백질 정량화 키트 (써모 피셔)를 사용하여 또는 계산된 소광 계수를 이용하는 UV-vis에 의해 정량화하였다.
리보핵단백질 (RNP)은 정제된 RGN을 sgRNA와 함께 ~2:1 비로 실온에서 20 분 동안 인큐베이션함으로써 제조하였다. 시험관내 절단 반응을 위해, RNP를 바람직한 PAM 서열에 의해 플랭킹된 표적화된 프로토스페이서를 함유하는 플라스미드 또는 선형 dsDNA와 함께 실온에서 >30 분 동안 인큐베이션하였다. TRAC 유전자좌 내의 2가지 표적 핵산 서열, TRAC11 (서열식별번호: 60) 및 TRAC14 (서열식별번호: 61)를 시험하였다. gRNA를 정확한 표적 핵산 서열을 갖는 (예를 들어, gRNA는 TRAC11 스페이서 서열을 갖고, 검정된 표적은 TRAC11임) 및 정확한 표적 핵산 서열을 갖지 않는 (예를 들어, gRNA는 TRAC11 스페이서 서열을 갖고, 검정된 표적이 TRAC14임) 표적화된 활성 둘 다에 대해 검정하였다. 플라스미드 절단에 의해 결정된 활성을 아가로스 겔 전기영동에 의해 평가하였다. 결과는 표 3에 나타내었다. 가이드 변이체는 서열식별번호: 56-59로서 나열되고, 스페이서 서열과 함께 제공된다. 이들 가이드 서열은 AAAA의 비상보성 뉴클레오티드 링커 (서열식별번호: 31)를 사용한다. 반복:안티-반복 결합이 증가된 최적화된 gRNA (서열식별번호: 64; 폴리-N은 스페이서 서열의 위치를 나타냄)는 최적화된 tracrRNA (서열식별번호: 62) 및 최적화된 crRNA (서열식별번호: 63) 성분을 갖는다. 최적화된 가이드 변이체는 이전에 야생형 가이드 RNA를 사용하여 절단이 검출되지 않은 2가지 유전자좌를 절단할 수 있다. 반복:안티-반복 영역에서 혼성화의 최적화를 통해, TRAC 유전자좌에서 다중 표적에 대해 APG09748의 시험관내 절단이 0% 절단에서 100% 절단으로 증가하였다.
표 3: 조작된 가이드 변이체에 의한 APG09748의 편집 효율
Figure pct00003
추가의 최적화된 gRNA 변이체를 설계하고 검정하였다. 추가로, 스페이서 길이가 절단 효율에 어떻게 영향을 미치는지 결정하기 위해 상이한 길이의 스페이서 서열 또한 시험하였다. 스페이서 서열 외부의 sgRNA는 이 검정에서 "백본"으로 지칭된다. 표 4에서, 이들은 "WT" (서열식별번호: 53, 야생형 서열), 및 3가지 최적화된 sgRNA: V1 (서열식별번호: 65), V2 (서열식별번호: 66) 및 V3 (서열식별번호: 64)으로 표시된다. 이들 서열 모두 스페이서 서열의 위치를 나타내기 위해 폴리-N을 갖는다. 가이드는 시험관내 전사 (IVT)에 의해 sgRNA로 발현되었다. 야생형 sgRNA 백본과 비교하여, V1은 87.8% 동일하고, V2는 92.4% 동일하고, V3은 85.5% 동일하다. 이중-가이드 RNA를 나타내지만 그 외에는 상기 인용된 야생형 및 최적화된 sgRNA와 유사한 합성 tracrRNA:crRNA 듀플렉스 ("합성") 또한 생성하여 시험하였다.
이 검정 세트의 경우, RGN APG09106이 사용되었고; 그 외에는 시험관내 절단 반응을 위한 방법이 상기 기재된 것과 유사하였다. 표적화된 핵산 서열은 표적 1 (서열식별번호: 67) 및 표적 2 (서열식별번호: 68)이었다. 결과는 표 4에 나타내었다.
표 4: 조작된 가이드 변이체에 의한 APG09106의 편집 효율
Figure pct00004
실시예 5: 포유동물 세포에서 유전자 편집 활성의 입증
실시예 5.1: 포유동물 세포에서 APG02789의 활성
인간 발현을 위해 코돈 최적화된 RGN 뉴클레오티드 서열을 N-말단 핵 국재화 태그를 사용하여 합성하고, pcDNA3.1 CMV 발현 플라스미드에 클로닝하였다. RGN 폴리펩티드의 최종 구축물은 다음과 같다: N-말단 -SV40 NLS (서열식별번호: 10)- 3X FLAG 태그 (서열식별번호: 11)- RGN 서열 (서열식별번호: 1, 16, 24, 35, 43 또는 50)- 뉴클레오플라스민 NLS (서열식별번호: 12)- C-말단. sgRNA 서열의 발현을 유도하는 U6 프로모터를 포함하는 PCR 앰플리콘은 허큘라제(Herculase) II (애질런트 테크놀로지즈(Agilent Technologies))를 사용하여 생성하였다. 400 ng의 RGN 발현 플라스미드 및 100 ng의 sgRNA PCR 생성물을 리포펙타민 2000 시약 (라이프 테크놀로지즈)을 사용하여 75-90% 전면생장에서 HEK293FT 세포의 24-웰 플레이트로 형질감염시켰다. 세포를 형질감염 후에 게놈 DNA 추출 전에 37℃에서 72 시간 동안 인큐베이션하였다. 게놈 DNA를 제조자의 프로토콜에 따라 퀵익스트랙트(QuickExtract) DNA 추출 용액 (에피센터(Epicentre))을 사용하여 추출하였다. RGN 표적 부위를 플랭킹하는 게놈 영역을 PCR 증폭시키고, 생성물을 제조자의 프로토콜에 따라 퀴아퀵 스핀 컬럼(QiaQuick Spin Column) (퀴아젠)을 사용하여 정제하였다. 200-500 ng의 총 정제된 PCR 생성물을 10 μl의 최종 부피로 1 μl의 10x Taq DNA 폴리머라제 PCR 완충제 (엔자이마틱스(Enzymatics)) 및 초순수와 혼합하고, 재어닐링 과정에 적용하여 헤테로듀플렉스를 형성하였다: 10 분 동안 95℃, -2℃/s 속도로 95℃에서 85℃로, -0.25℃/s 속도로 85℃에서 25℃로, 및 1 분 동안 25℃ 유지. 재어닐링 이후, 생성물을 제조자의 권고된 프로토콜에 따라 서베이어 뉴클레아제 및 서베이어 인핸서 S (인테그레이티드 디엔에이 테크놀로지즈(Integrated DNA Technologies))로 처리하고, 4-20% 노벡스(Novex) TBE 폴리아크릴아미드 겔 (라이프 테크놀로지즈) 상에서 분석하였다. 겔을 SYBR 골드 DNA 염색 (라이프 테크놀로지즈)으로 10 분 동안 염색하고, 겔 독(Gel Doc) 겔 영상화 시스템 (바이오-라드(Bio-rad))으로 영상화하였다. 정량화는 상대적인 밴드 강도를 기반으로 하였다. Indel 백분율은 하기 식에 의해 결정하고: 100x(1-(1-(b+c)/(a+b+c))½), 여기서 a는 소화되지 않은 PCR 생성물의 통합 강도이고, b 및 c는 각각의 절단 생성물의 통합 강도이다.
RGN APG02789의 경우, 상기 기재된 바와 같이 방법을 수행하였다. 인간 게놈에서 수많은 상이한 유전자가 RNA-가이드된 절단을 위해 표적화되었다. 이들 유전자좌는 sgRNA의 서열식별번호에 대한 참고와 함께 하기 표 5에 포함된다. RGN 활성의 지표인 indel 백분율 또한 나타낸다.
표 5: 포유동물 세포에서 APG02789의 활성
Figure pct00005
실시예 5.2: 포유동물 세포에서 APG09106의 활성
RGN 발현 카세트를 생성하여, 포유동물 발현을 위해 벡터에 도입하였다. RGN APG00969, APG03128, APG09748, APG09106 및 APG02789 각각을 인간 발현을 위해 코돈-최적화시켰고 (각각 서열식별번호: 357-361), 발현된 단백질을 N-말단에서 SV40 핵 국재화 서열 (NLS; 서열식별번호: 10)에 및 3xFLAG 태그 (서열식별번호: 11)에 작동가능하게 융합시켰고, C-말단에서 뉴클레오플라스민 NLS 서열 (서열식별번호: 12)에 작동가능하게 융합시켰다. 직렬식으로 작동가능하게 융합된 NLS 서열의 2개의 카피를 사용하였다. 각각의 발현 카세트는 시토메갈로바이러스 (CMV) 프로모터 (서열식별번호: 334)의 조절하에 있었다. CMV 전사 인핸서 (서열식별번호: 335) 또한 CMV 프로모터를 포함하는 구축물에 포함될 수 있음이 관련 기술분야에 공지되어 있다. 인간 RNA 폴리머라제 III U6 프로모터 (서열식별번호: 336)의 조절하에 단일 gRNA 각각을 코딩하는 가이드 RNA 발현 구축물을 생성하여, 발현 벡터에 도입하였다. 가이드는 AurkB 유전자의 영역을 표적화하였다. 한 RNA-가이드된 뉴클레아제의 경우, 단백질의 뉴클레아제 활성을 증가시키기 위해 특정 잔기를 돌연변이시켰고, 구체적으로 APG09106의 T849 잔기를 아르기닌 (서열식별번호: 362)으로 돌연변이시켰다. 이 점 돌연변이는 포유동물 세포에서 편집률을 증가시켰다.
상기 기재된 구축물을 포유동물 세포에 도입하였다. 형질감염 하루 전날에, 1x105 HEK293T 세포 (시그마)을 둘베코 변형된 이글 배지 (DMEM) 플러스 10% (vol/vol) 태아 소 혈청 (깁코(Gibco)) 및 1% 페니실린-스트렙토마이신 (깁코) 중에서 24-웰 디쉬에 플레이팅하였다. 세포가 50-60% 전면생장한 다음 날, 500 ng의 RGN 발현 플라스미드 플러스 500 ng의 단일 gRNA 발현 플라스미드를 제조자의 지침에 따라 웰당 1.5 μL의 리포펙타민 3000 (써모 사이언티픽)을 사용하여 공동 형질감염시켰다. 48 시간 성장시킨 후, 총 게놈 DNA를 제조자의 지침에 따라 게놈 DNA 단리 키트 (마쉐리-나겔(Machery-Nagel))를 사용하여 수확하였다.
이어서, 총 게놈 DNA를 분석하여, AurkB 표적에서 편집률을 결정하였다. 올리고뉴클레오티드를 생성하여, PCR 증폭, 및 증폭된 게놈 표적 부위 (서열식별번호: 363 및 364)의 후속적인 분석을 위해 사용하였다. 모든 PCR 반응은 0.5 μM의 각각의 프라이머를 포함하는 20 μL 반응 중에서 10 μL의 2X 마스터 믹스 퓨전 하이-피델리티(Master Mix Phusion High-Fidelity) DNA 폴리머라제 (써모 사이언티픽)를 사용하여 수행하였다. 먼저, 각각의 표적 유전자를 포함하는 큰 게놈 영역을 PCR#1 프라이머 (서열식별번호: 363 및 364)를 사용하고 하기 프로그램을 이용하여 증폭시켰다: 98℃, 1 분; [98℃, 10 초; 62℃, 15 초; 72℃, 5 분]의 30 주기; 72℃, 5 분; 12℃, 계속.
이어서, 1 마이크로리터의 이 PCR 반응을 각각의 가이드에 대해 특이적인 프라이머 (PCR#2 프라이머; 서열식별번호: 365-370)를 사용하고 하기 프로그램을 이용하여 추가로 증폭시켰다: 98℃, 1 분; [98℃, 10 초; 67℃, 15 초; 72℃, 30 초]의 35 주기; 72℃, 5 분; 12℃, 계속. PCR#2에 대한 프라이머에는 일루미나 시퀀싱을 위한 넥스테라(Nextera) 판독 1 및 판독 2 트랜스포사제 어댑터 오버행 서열이 포함된다.
제2 PCR 증폭 이후, DNA를 제조자의 지침에 따라 PCR 클린업 키트 (자이모(Zymo))를 사용하여 세척하고, 물에 용리시켰다. 200-500ng의 정제된 PCR#2 생성물을 20 μL 반응 중에서 2 μL의 10X NEB 완충제 2 및 물과 합하고, 하기 프로그램을 이용하여 어닐링하여 헤테로듀플렉스 DNA를 생성하였다: 95℃, 5 분; 95-85℃, 2℃/초의 속도로 냉각; 85-25℃, 0.1℃/초의 속도로 냉각; 12℃, 계속. 어닐링 후에, 5 μL의 DNA를 비 효소 대조군으로서 제거하였고, 1 μL의 T7 엔도뉴클레아제 I (NEB)을 첨가하고, 반응을 37℃에서 1 시간 동안 인큐베이션하였다. 인큐베이션 이후, 5x 플래쉬겔(FlashGel) 로딩 염료 (론자(Lonza))를 첨가하고, 겔 전기영동을 이용하여 2.2% 아가로스 플래쉬겔 (론자)에 의해 5 μL의 각각의 반응 및 대조군을 분석하였다. 겔의 가시화 이후에, 비상동성 말단 결합 (NHEJ)의 백분율은 하기 방정식을 이용하여 결정하였고: %NHEJ 사건 = 100 x [1-(1-절단된 분획)(½)], 여기서 (절단된 분획)은 다음과 같이 정의된다: (소화된 생성물의 밀도)/(소화된 생성물의 밀도 + 소화되지 않은 모 밴드).
일부 샘플의 경우, 서베이어®를 이용하여 포유동물 세포에서의 발현 이후의 결과를 분석하였다. 형질감염 이후 세포를 37℃에서 72 시간 동안 인큐베이션한 다음, 게놈 DNA를 추출하였다. 게놈 DNA는 제조자의 프로토콜에 따라 퀵익스트랙트 DNA 추출 용액 (에피센터)을 사용하여 추출하였다. RGN 표적 부위를 플랭킹하는 게놈 영역을 PCR 증폭시키고, 생성물을 제조자의 프로토콜에 따라 퀴아퀵 스핀 컬럼 (퀴아젠)을 사용하여 정제하였다. 200-500 ng의 총 정제된 PCR 생성물을 10 μl의 최종 부피로 1 μl의 10x Taq DNA 폴리머라제 PCR 완충제 (엔자이마틱스) 및 초순수와 혼합하고, 재어닐링 과정에 적용하여 헤테로듀플렉스를 형성하였다: 10 분 동안 95℃, -2℃/s 속도로 95℃에서 85℃로, -0.25℃/s 속도로 85℃에서 25℃로, 및 1 분 동안 25℃ 유지.
재어닐링 이후, 생성물을 제조자의 권고된 프로토콜에 따라 서베이어® 뉴클레아제 및 서베이어® 인핸서 S (인테그레이티드 디엔에이 테크놀로지즈)로 처리하고, 4-20% 노벡스(Novex) TBE 폴리아크릴아미드 겔 (라이프 테크놀로지즈) 상에서 분석하였다. 겔을 SYBR 골드 DNA 염색 (라이프 테크놀로지즈)으로 10 분 동안 염색하고, 겔 독(Gel Doc) 겔 영상화 시스템 (바이오-라드)으로 영상화하였다. 정량화는 상대적인 밴드 강도를 기반으로 하였다. Indel 백분율은 하기 식에 의해 결정하고: 100x(1-(1-(b+c)/(a+b+c))½), 여기서 a는 소화되지 않은 PCR 생성물의 통합 강도이고, b 및 c는 각각의 절단 생성물의 통합 강도이다.
추가로, 일루미나 오버행 서열을 함유하는 PCR#2로부터의 생성물은 일루미나 16S 메가게놈 시퀀싱 라이브러리 프로토콜에 따라 라이브러리 제조를 거쳤다. 딥 시퀀싱은 서비스 제공자 (모진)에 의해 일루미나 Mi-Seq 플랫폼 상에서 수행되었다. 전형적으로 앰플리콘당 200,000개의 250 bp 쌍-말단 판독 (2 x 100,000 판독)이 생성된다. 판독을 CRISPResso (Pinello, et al. 2016 Nature Biotech, 34:695-697)를 이용하여 분석하여, 편집률을 계산하였다. 출력 정렬을 수동-큐레이션하여, 삽입 및 결실 부위를 확인할 뿐만 아니라, 재조합 부위에서 미세상동성 부위를 확인하였다. 편집률은 표 6에 나타내었다. 모든 실험은 인간 세포에서 수행하였다. "표적 서열"은 유전자 표적 내의 표적화된 서열이다. 각각의 표적 서열의 경우, 가이드 RNA는 사용된 RGN에 따라 상보성 RNA 스페이서 서열 및 적절한 sgRNA를 포함하였다. 가이드 RNA에 의한 선택된 실험 분석은 표 7.1 및 7.2에 나타내었다.
표 6: AurkB 유전자 표적에 대한 전체 편집률
Figure pct00006
각각의 가이드에 대한 특이적인 삽입 및 결실을 표 7.1 및 7.2에 나타내었다. 이들 표에서, 표적 서열은 굵은 대문자로 표시되었다. 8합체 PAM 영역은 이중 밑줄로 표시되었고, 인식된 주요 뉴클레오티드는 굵게 표시되었다. 삽입은 소문자로 표시되었다. 결실은 점선 (---)으로 나타내었다. INDEL 위치는 표적 서열의 PAM 근위 엣지로부터 계산되고, 엣지는 위치 0이다. 위치가 엣지의 표적 쪽에 있는 경우, 위치는 양수 (+)이고; 위치가 엣지의 PAM 쪽에 있는 경우, 위치는 음수 (-)이다.
표 7.1: RGN APG09106을 사용한 가이드 831에 대한 특이적인 삽입 및 결실
Figure pct00007
표 7.2: APG09106 T849R을 사용한 가이드 831에 대한 특이적인 삽입 및 결실
Figure pct00008
실시예 6: 식물 세포에서 유전자 편집 활성의 입증
본 발명의 RGN의 RNA-가이드된 뉴클레아제 활성을 [Li, et al., 2013 (Nat. Biotech. 31:688-691)]로부터 채택된 프로토콜을 이용하여 식물 세포에서 입증하였다. 간략히, N-말단 SV40 핵 국재화 신호를 코딩하는 핵산 서열에 작동가능하게 연결된 본 발명의 RGN (서열식별번호: 1, 16, 24, 35, 43 또는 50)의 식물 코돈 최적화된 버전을 일시적인 형질전환 벡터에서 강한 구성적 35S 프로모터 뒤에 클로닝한다. 적절한 PAM 서열을 플랭킹하는 식물 PDS 유전자에서 하나 이상의 부위를 표적화하는 sgRNA는 제2 일시적인 발현 벡터에서 식물 U6 프로모터 뒤에 클로닝한다. PEG-매개된 형질전환을 이용하여 발현 벡터를 니코티아나 벤타미아나(Nicotiana benthamiana) 엽육 원형질체에 도입시킨다. 형질전환된 원형질체를 어두운 곳에서 최대 36 시간 동안 인큐베이션한다. DNeasy 식물 미니 키트 (퀴아젠)를 사용하여 게놈 DNA를 원형질체로부터 단리한다. RGN 표적 부위를 플랭킹하는 게놈 영역을 PCR 증폭시키고, 생성물을 제조자의 프로토콜에 따라 퀴아퀵 스핀 컬럼 (퀴아젠)을 사용하여 정제한다. 200-500 ng의 총 정제된 PCR 생성물을 10 μl의 최종 부피로 1 μl 10x Taq DNA 폴리머라제 PCR 완충제 (엔자이마틱스) 및 초순수와 혼합하고, 재어닐링 과정에 적용하여 헤테로듀플렉스를 형성한다: 10 분 동안 95℃, -2℃/s 속도로 95℃에서 85℃로, -0.25℃/s 속도로 85℃에서 25℃로, 및 1 분 동안 25℃ 유지.
재어닐링 이후, 생성물을 제조자의 권고된 프로토콜에 따라 서베이어 뉴클레아제 및 서베이어 인핸서 S (인테그레이티드 디엔에이 테크놀로지즈)로 처리하고, 4-20% 노벡스 TBE 폴리아크릴아미드 겔 (라이프 테크놀로지즈) 상에서 분석한다. 겔을 SYBR 골드 DNA 염색 (라이프 테크놀로지즈)에 의해 10 분 동안 염색하고, 겔 독 겔 영상화 시스템 (바이오-라드)에 의해 영상화한다. 정량화는 상대적인 밴드 강도를 기반으로 한다. Indel 백분율은 하기 식에 의해 결정하고: 100x(1-(1-(b+c)/(a+b+c))½), 여기서 a는 소화되지 않은 PCR 생성물의 통합 강도이고, b 및 c는 각각의 절단 생성물의 통합 강도이다.
실시예 7: 질환 표적의 확인
임상 변이체의 데이터베이스를 NCBI ClinVar 웹사이트에서 월드 와이드 웹을 통해 입수가능한 NCBI ClinVar 데이터베이스로부터 수득하였다. 병원성 단일 뉴클레오티드 다형성 (SNP)을 이 목록으로부터 확인하였다. 게놈 유전자좌 정보를 이용하여, 각각의 SNP와 중복되고 그를 둘러싸는 영역에서 CRISPR 표적을 확인하였다. 본 발명의 RGN의 조합물에서 염기 편집을 이용하여 원인 돌연변이 ("Casl Mut.")를 표적화하도록 수정될 수 있는 SNP의 선택은 표 8에 나열되어 있다. 표 8에서, 각각의 질환의 하나의 가명만이 나열된다. "RS#"는 NCBI 웹사이트에서 SNP 데이터베이스를 통해 확인된 RS 수탁 번호에 상응한다. 대립유전자ID는 원인 대립유전자 수탁 번호에 상응하고, 염색체 수탁 번호는 또한 NCBI 웹사이트를 통해 확인된 수탁 참고 번호를 제공한다. 표 8은 또한 각각의 질환에 대해 나열된 RGN에 적합한 게놈 표적 서열 정보를 제공한다. 표적 서열 정보는 또한 본 발명의 상응하는 RGN에 대해 필요한 sgRNA의 생성을 위해 프로토스페이서 서열을 제공한다.
표 8: 본 발명의 RGN에 대한 질환 표적
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
실시예 8: 헐러 증후군의 원인이 되는 표적화 돌연변이
다음은 헐러 증후군을 가진 대부분의 환자에서 상기 질환의 원인이 되는 돌연변이를 수정하는 RNA 지정된 염기 편집 시스템을 이용하여 MPS-1로도 지칭되는 헐러 증후군에 대한 잠재적인 치료법을 기재한다. 이 접근법은 RNA 유도되고 광범위한 조직 유형으로 전달을 위해 단일 AAV 벡터에 팩키징될 수 있는 염기 편집 융합 단백질을 이용한다. 사용된 정확한 조절 요소 및 염기 편집기 도메인에 따라, 질환 유전자좌를 표적화하기 위해 염기 편집 융합 단백질 및 단일 가이드 RNA 둘 다를 코딩하는 단일 벡터를 조작하는 것 또한 가능할 수 있다.
실시예 8.1: 이상적인 PAM에 의한 RGN의 확인
유전 질환 MPS-1은 리소좀에서 데르마탄 술페이트 및 헤파란 술페이트가 분자 수준으로 축적되는 것을 특징으로 하는 리소좀 저장 질환이다. 이 질환은 일반적으로 α-L-이두로니다제를 코딩하는 IDUA 유전자 (NCBI 기준 서열 NG_008103.1)에서의 돌연변이에 의해 유발된 선천성 유전 장애이다. 상기 질환은 α-L-이두로니다제 결핍의 결과이다. 북유럽 배경을 갖는 개인의 연구에서 확인된 가장 흔한 IDUA 돌연변이는 W402X 및 Q70X이고, 두 넌센스 돌연변이 모두 조기 번역 종결을 일으킨다 (Bunge et al. (1994), Hum. Mol. Genet, 3(6): 861-866, 본원에 참고로 포함됨). 단일 뉴클레오티드의 복귀가 야생형 코딩 서열을 복구하고, 유전자좌의 내인성 조절 메카니즘에 의해 조절되는 단백질 발현을 일으킨다.
인간 Idua 유전자의 W402X 돌연변이는 MPS-1H 사례의 높은 비율을 차지한다. 염기 편집기는 가이드 RNA의 프로토스페이서 성분의 결합 부위에 비해 좁은 서열 범위를 표적화할 수 있고, 따라서 표적 유전자좌로부터 특정한 거리에서 PAM 서열의 존재가 전략의 성공에 필수적이다. 염기 편집 단백질의 상호작용 동안에 표적 돌연변이가 노출된 비-표적 가닥 (NTS) 상에 있어야 하고, RGN 도메인의 풋프린트가 PAM 근처의 영역으로의 접근을 차단할 것이라는 제약을 고려할 때, 접근가능한 유전자좌는 PAM으로부터 10-30 bp인 것으로 생각된다. 이 범위에서 근처의 다른 아데노신 염기의 편집 및 돌연변이 유발을 피하기 위해, 상이한 링커가 스크리닝된다. 이상적인 범위는 PAM으로부터 12-16 bp이다.
RGN APG00969는 상용성인 PAM 서열을 갖는다. APG00969는 5'- nnARV-3'의 PAM 서열 (서열식별번호: 7)을 갖고, 소형의 크기를 가지며, 이는 잠재적으로 단일 AAV 벡터를 통한 전달을 가능하게 한다. 이 전달 접근법은 다른 것들에 비해 광범위한 조직 (간, 근육, CNS)으로의 접근, 및 잘 확립된 안전성 프로파일 및 제작 기술과 같은 다양한 이점을 제공한다.
에스. 피로게네스로부터의 Cas9 (SpyCas9)는 W402X 유전자좌 근처에 존재하는 NGG의 PAM 서열 (서열식별번호: 323)을 필요로 하지만, SpyCas9의 크기는 단일 AAV 벡터로 팩키징되는 것을 방지하며, 따라서 상기 언급된 이 접근법의 이점을 포기한다. 이중 전달 전략이 이용될 수 있지만 (예를 들어, Ryu et al., (2018), Nat. Biotechnol., 36(6): 536-539, 본원에 참고로 포함됨), 이는 상당한 제작 복잡성 및 비용을 부가할 것이다. 추가로, 주어진 세포에서 성공적으로 편집되려면 세포에서 융합 단백질의 벡터 및 조립체 둘 다로의 감염을 필요로 하기 때문에, 이중 바이러스 벡터 전달은 유전자 수정의 효율을 상당히 감소시킨다.
흔히 사용되는 에스. 아우레우스로부터의 Cas9 병렬상동체 (SauCas9)는 SpyCas9에 비해 상당히 작은 크기를 갖지만, 더 복잡한 PAM 요건 - NGRRT (서열식별번호: 324)을 갖는다. 그러나, 이 서열은 원인 유전자좌의 염기 편집에 유용할 것으로 예상되는 범위 내에 있지 않다.
실시예 8.2: RGN 융합 구축물 및 sgRNA 서열
하기 도메인을 갖는 융합 단백질을 코딩하는 DNA 서열은 표준 분자 생물학 기술을 이용하여 생성된다: 1) DNA 절단 활성 ("데드" 또는 "닉카제")을 불활성화시키는 돌연변이를 갖는 RGN 도메인; 2) 염기 편집에 유용한 아데노신 데아미나제. 하기 표 (표 9)에 기재된 구축물은 염기 편집 활성 도메인을 갖는 융합 단백질, 이 실시예에서는 데드 RGN APG00969 (서열식별번호: 327)의 N-말단에 작동가능하게 융합된 APG02312 (서열식별번호: 325)의 돌연변이된 변이체를 포함한다. 염기 편집 활성 도메인은 본 발명의 임의의 아데노신 데아미나제, 예를 들어 서열식별번호: 514 또는 572-584일 수 있다. 융합 단백질 또한 RGN의 C-말단에서 염기-편집 효소로 제조될 수 있음이 관련 기술분야에 공지되어 있다. 추가로, 융합 단백질의 RGN 및 염기 편집기는 전형적으로 링커 아미노 서열에 의해 분리된다. 표준 링커의 길이가 15-30개 아미노산 범위임이 관련 기술분야에 공지되어 있다. 추가로, RGN과 염기-편집 효소 사이의 특정한 융합 단백질 또한 염기 편집 효율을 증가시킬 수 있는 적어도 하나의 우라실 글리코실라제 억제제 (UGI) 도메인 (서열식별번호: 570)을 포함할 수 있음이 관련 기술분야에 공지되어 있다 (미국 특허 번호 10,167, 457, 본원에 참고로 포함됨). 따라서, 융합 단백질은 RGN APG00969 또는 그의 변이체, 아데노신 데아미나제, 및 임의적으로 적어도 하나의 UGI를 포함할 수 있다.
표 9: RNA-표적화된 염기 편집을 위한 구축물
Figure pct00025
RGN의 접근가능한 편집 부위는 PAM 서열에 의해 결정된다. RGN을 염기 편집 도메인과 조합할 때, NTS가 단일 가닥이지만 RGN이 유전자좌와 연관되기 때문에, 편집을 위한 표적 잔기는 비-표적 가닥 (NTS) 상에 있어야 한다. 수많은 뉴클레아제 및 상응하는 가이드 RNA의 평가는 이 특정한 유전자좌에 대해 가장 적절한 유전자 편집 도구의 선택을 가능하게 한다. 인간 Idua 유전자에서 상기 기재된 구축물에 의해 표적화될 수 있는 몇몇 잠재적인 PAM 서열은 W402X 돌연변이의 원인이 되는 돌연변이성 뉴클레오티드의 근처에 있다. 1) 질환 유전자좌에서 비-코딩 DNA 가닥에 대해 상보성인 "스페이서"; 및 2) 가이드 RNA와 RGN의 회합을 위해 필요한 RNA 서열을 함유하는 가이드 RNA 전사체를 코딩하는 서열 또한 생성된다. 이러한 sgRNA는 예를 들어 서열식별번호: 356에 의해 코딩될 수 있다. 관련 기술분야의 기술자에 의해 고안될 수 있는 이러한 sgRNA 또는 유사한 sgRNA는 상기 염기 편집기 또는 상이한 RGN-데아미나제 융합체를 갖는 염기 편집기를 관심 유전자좌로 지시하는데 있어서 그들의 효율에 대해 평가될 수 있다.
실시예 8.3: 헐러 질환 환자로부터의 세포에서 활성에 대한 검정
유전자형 전략을 검증하고 상기 기재된 구축물을 평가하기 위해, 헐러 질환 환자로부터의 섬유모세포를 사용한다. 인간 세포에서 이들의 발현을 위해 융합 단백질 코딩 서열 및 sgRNA 코딩 서열의 상류에 적절한 프로모터를 함유하는 벡터가 설계되며, 이는 실시예 5에 기재된 이들 벡터와 유사하다. 인간 세포에서 높은 발현 수준을 갖는 것으로 공지되어 있거나 또는 섬유모세포 세포에서 특이적으로 잘 발현될 수 있는 프로모터 및 다른 DNA 요소 (예를 들어 인핸서, 또는 종결인자) 또한 사용될 수 있는 것으로 인지된다. 벡터를 표준 기술, 예를 들어 실시예 5에 기재된 것과 유사한 형질감염을 이용하여 섬유모세포에 형질감염시킨다. 대안적으로, 전기천공을 이용할 수 있다. 세포를 1 - 3 일 동안 배양한다. 게놈 DNA (gDNA)를 표준 기술을 이용하여 단리한다. 편집 효율은 하기에 추가로 기재된 바와 같이 정제된 gDNA에 대해 qPCR 유전자형 분석 검정 및/또는 차세대 시퀀싱을 수행함으로써 결정된다.
탁맨(Taqman)™ qPCR 분석은 야생형 및 돌연변이성 대립유전자에 대해 특이적인 프로브를 사용한다. 이들 프로브는 qPCR 장비를 사용하여 그들의 스펙트럼 여기 및/또는 방출 성질에 의해 분석되는 형광단을 보유한다. PCR 프라이머 및 프로브를 함유하는 유전자형 분석 키트는 상업적으로 입수될 수 있거나 (즉, SNP ID rs121965019의 경우 써모 피셔 탁맨™ SNP 유전자형 분석 검정ID C__27862753_10) 또는 설계될 수 있다. 설계된 프라이머 및 프로브 세트의 예는 표 10에 제시된다.
표 10: RT-PCR 프라이머 및 프로브
Figure pct00026
편집 실험 이후에, gDNA는 표준 방법 및 상기 기재된 프라이머 및 프로브를 사용하여 qPCR 분석에 적용된다. 예상된 결과가 표 11에 제시된다. 이 시험관내 시스템을 이용하여 구축물을 편리하게 평가할 수 있고, 추가의 연구를 위해 높은 편집 효율을 갖는 것을 선택할 수 있다. 상기 시스템은 W402X 돌연변이가 있는 및 없는 세포와, 바람직하게는 이 돌연변이에 대해 이형접합성인 일부 세포와 비교하여 평가될 것이다. Ct 값은 Sybr 그린과 같은 염료를 사용하여 기준 유전자 또는 유전자좌의 총 증폭과 비교될 것이다.
표 11: 예상된 qPCR 결과
Figure pct00027
조직은 또한 차세대 시퀀싱에 의해 분석될 수 있다. 하기 (표 12) 제시된 것들과 같은 프라이머 결합 부위, 또는 관련 기술분야의 기술자에 의해 확인될 수 있는 다른 적합한 프라이머 결합 부위를 사용할 수 있다. PCR 증폭 이후에, 일루미나 넥스테라 XT 오버행 서열을 함유하는 생성물은 일루미나 16S 메타게놈 시퀀싱 라이브러리 프로토콜에 따라 라이브러리 제조를 거쳤다. 딥 시퀀싱은 일루미나 Mi-Seq 플랫폼 상에서 수행한다. 전형적으로, 앰플리콘당 200,000개의 250 bp 쌍-말단 판독 (2 x 100,000 판독)이 생성된다. 판독을 CRISPResso (Pinello et al., 2016)를 이용하여 분석하여 편집률을 계산한다. 출력 정렬을 수동-큐레이션하여, 삽입 및 결실 부위를 확인할 뿐만 아니라, 재조합 부위에서 미세상동성 부위를 확인한다.
표 12: NGS 프라이머 결합 부위
Figure pct00028
항-IDUA 항체를 사용하는 형질감염된 세포 및 대조군 세포의 세포 용해물의 웨스턴 블롯팅을 수행하여 전장 단백질의 발현을 검증하고, 기질 4-메틸움벨리페릴 a-L-이두로니드를 사용하는 세포 용해물에 대한 효소 활성 검정은 효소가 촉매 활성임을 검증한다 ([Hopwood et al., Clin.Chim. Acta (1979), 92(2): 257-265], 본원에 참고로 포함됨). 이들 실험은 원래의 IduaW402X/W402X 세포주 (형질감염 없음), 염기 편집 구축물 및 무작위 가이드 서열에 의해 형질감염된 IduaW402X/W402X 세포주, 및 야생형 IDUA를 발현하는 세포주와 비교하여 수행된다.
실시예 8.4: 뮤린 모델에서 질환 치료 검증
이 치료 접근법의 효능을 검증하기 위해, 유사한 아미노산에서 넌센스 돌연변이를 갖는 마우스 모델을 이용한다. 마우스 균주는 헐러 증후군 환자에서의 상동성 돌연변이에 상응하는 그의 Idua 유전자 (Gene ID: 15932)에 W392X 돌연변이를 보유한다 ([Bunge et al., (1994), Hum. Mol. Genet. 3(6): 861-866], 본원에 참고로 포함됨). 이 유전자좌는 이전 실시예에 기재된 염기 편집기에 의한 수정을 위해 필요한 PAM 서열이 결여된 인간 서열과 비교하여 별개의 뉴클레오티드 서열을 포함하며, 따라서 뉴클레오티드 수정을 수행하기 위해 별개의 융합 단백질의 설계를 필요로 한다. 이 동물에서 상기 질환의 개선은 유전자 전달 벡터에 의해 접근가능한 조직에서 돌연변이를 수정하는 치료 접근법을 검증할 수 있다.
이 돌연변이에 대해 동형접합성인 마우스는 헐러 증후군 환자와 유사한 수많은 표현형 특징을 나타낸다. RNA 가이드 서열과 함께 상기 (표 9) 기재된 염기 편집-RGN 융합 단백질을 마우스에서 단백질 발현 및 RNA 전사를 가능하게 하는 발현 벡터에 혼입시킨다. 연구 설계는 하기 표 13에 제시된다. 연구에는 염기-편집 융합 단백질 및 RNA 가이드 서열을 포함하는 고용량의 발현 벡터, 저용량의 동일한 발현 벡터로 처리된 그룹, 염기 편집 융합 단백질 또는 가이드 RNA를 포함하지 않는 발현 벡터로 처리된 모델 마우스인 대조군, 및 동일한 빈 벡터로 처리된 야생형 마우스인 제2 대조군이 포함된다.
표 13: 뮤린 모델에서 게놈 편집 실험
Figure pct00029
평가를 위한 종점에는 체중, 소변 GAG 배설, 혈청 IDUA 효소 활성, 관심 조직에서 IDUA 활성, 조직 병리학, SNP의 수정을 검증하기 위한 관심 조직의 유전자형 분석, 및 거동적 및 신경학적 평가가 포함된다. 일부 종점은 종료되기 때문에, 예를 들어 연구 종료 이전에 조직 병리학 및 조직 IDUA 활성을 평가하기 위해 추가의 그룹을 추가할 수 있다. 추가의 종점의 예는 헐러 증후군 동물 모델을 확립하는 공개된 논문에서 확인할 수 있다 ([Shull et al. (1994), Proc. Natl. Acad. Sci. U.S.A., 91(26): 12937-12941; Wang et al. (2010), Mol. Genet. Metab., 99(1): 62-71; Hartung et al. (2004), Mol. Ther., 9(6): 866-875; Liu et al. (2005), Mol. Ther., 11(1): 35-47; Clarke et al. (1997), Hum. Mol. Genet. 6(4): 503-511]; 모두 본원에 참고로 포함됨).
한 가지 가능한 전달 벡터는 아데노 연관된 바이러스 (AAV)를 이용한다. 벡터는 CMV 인핸서 (서열식별번호: 335) 및 프로모터 (서열식별번호: 334) 또는 다른 적합한 인핸서 및 프로모터 조합물, 임의적으로 코작 서열 뒤에 있으며, 3' 말단에서 종결인자 서열 및 폴리아데닐화 서열, 예컨대 [Levitt, N.; Briggs, D.; Gil, A.; Proudfoot, N. J. Definition of an Efficient Synthetic Poly(A) Site. Genes Dev. 1989, 3 (7), 1019-1025]에 기재된 최소 서열에 작동가능하게 융합된 염기 편집기-dRGN 융합 단백질 코딩 서열 (예를 들어, 상기 기재된 Nuc-ADAT-링커-dAPG19748-링커-SV40)을 포함하도록 생성된다. 벡터는 그의 5' 말단에서 인간 U6 프로모터 (서열식별번호: 336), 또는 소형 비-코딩 RNA의 생성에 적합한 또 다른 프로모터에 작동가능하게 연결된 단일 가이드 RNA를 코딩하는 발현 카세트를 추가로 포함할 수 있고, AAV 캡시드로의 팩키징에 필요하며 관련 기술분야에 널리 공지된 역전된 말단 반복 (ITR) 서열을 추가로 포함할 수 있다. 생성 및 바이러스 팩키징은 표준 방법, 예컨대 미국 특허 번호 9,587,250 (본원에 참고로 포함됨)에 기재된 방법에 의해 수행된다.
다른 가능한 바이러스 벡터에는 아데노바이러스 및 렌티바이러스 벡터가 포함되며, 이들은 흔히 사용되고, 상이한 팩키징 능력 및 요건과 함께 유사한 요소를 함유한다. 비-바이러스 전달 방법, 예컨대 지질 나노입자에 의해 캡슐화된 mRNA 및 sgRNA ([Cullis, P. R. and Allen, T. M. (2013), Adv. Drug Deliv. Rev. 65(1): 36-48; Finn et al. (2018), Cell Rep. 22(9): 2227-2235], 둘 다 참고로 포함됨), 플라스미드 DNA의 유체역학적 주사 ([Suda T and Liu D, 2007, Mol. Ther. 15(12): 2063-2069], 본원에 참고로 포함됨), 또는 금 나노입자와 회합된 sgRNA의 리보핵단백질 복합체 (Lee, K.; Conboy, M.; Park, H. M.; Jiang, F.; Kim, H. J.; Dewitt, M. A.; Mackley, V. A.; Chang, K.; Rao, A.; Skinner, C.; et al., Nat. Biomed. Eng. 2017, 1 (11), 889-90) 또한 이용될 수 있다.
실시예 8.5: 인간화 유전자좌를 갖는 뮤린 모델에서 질환 수정
인간 요법에서 사용되는 것과 동일한 염기 편집기 구축물의 효능을 평가하기 위해, W392 근처의 뉴클레오티드가 W402 주위에서 인간 서열과 매칭되도록 변경된 마우스 모델이 필요하다. 이는 다양한 기술, 예컨대 마우스 배아의 유전자좌를 절단하고 대체하도록 RGN 및 HDR 주형의 사용에 의해 달성될 수 있다.
높은 아미노산 보존 정도로 인해, 마우스 유전자좌에서 대부분의 뉴클레오티드는 표 14에 제시된 바와 같이 침묵 돌연변이를 가진 인간 서열의 것들로 변경될 수 있다. 생성된 조작된 마우스 게놈에서 변경된 코딩 서열을 생성하는 염기 변화만이 도입된 정지 코돈 이후에 발생한다.
표 14: 인간화 마우스 유전자좌를 생성하는 뉴클레오티드 돌연변이
Figure pct00030
이 마우스 균주의 조작시, 실시예 8.4에 기재된 바와 같이 유사한 실험이 수행될 것이다.
실시예 9: 프리드라이히 운동실조의 원인이 되는 표적화 돌연변이
프리드라이히 운동실조 (FRDA)를 초래하는 트리뉴클레오티드 반복 서열의 확장은 FRDA 불안정 영역으로 지칭되는 FXN 유전자 내의 정의된 유전자좌에서 발생한다. RNA 가이드된 뉴클레아제 (RGN)는 FRDA 환자 세포에서 불안정 영역을 절제하기 위해 사용될 수 있다. 이 접근법은 다음을 필요로 한다: 1) 인간 게놈에서 대립유전자를 표적화도록 프로그래밍될 수 있는 RGN 및 가이드 RNA 서열; 및 2) RGN 및 가이드 서열에 대한 전달 접근법. 게놈 편집을 위해 사용되는 여러 뉴클레아제, 예컨대 흔히 사용되는 에스. 피로게네스로부터의 Cas9 뉴클레아제 (SpCas9)는 본질적으로 기능적 발현 카세트를 위해 필요한 다른 유전자 요소 외에도 SpCas9 유전자 및 가이드 RNA의 길이를 고려할 때 너무 커서 아데노-연관된 바이러스 (AAV) 벡터에 팩키징되지 않는다. 이는 SpCas9를 사용하는 실행가능한 접근법을 가능하지 않게 만든다.
본 발명의 조밀한 RNA 가이드된 뉴클레아제, 특히 APG09748 및 APG09106은 FRDA 불안정 영역의 절제에 매우 적합하다. 각각의 RGN은 FRDA 불안정 영역 근처에 있는 PAM 요건을 갖는다. 추가로, 이들 RGN 각각은 가이드 RNA와 함께 AAV 벡터에 팩키징될 수 있다. 2개의 가이드 RNA의 팩킹은 제2 벡터를 필요로 할 수도 있지만, 이 접근법은 두 벡터 사이의 단백질 서열을 분할할 수 있는 더 큰 뉴클레아제, 예컨대 SpCas9에서 필요로 되는 것보다 여전히 유리하게 비교된다.
표 15는 FRDA 불안정 영역의 5' 및 3' 플랭킹으로 APG09748 또는 APG09106을 표적화하는데 적합한 게놈 표적 서열의 위치, 뿐만 아니라 게놈 표적에 대한 sgRNA의 서열을 나타낸다. 유전자좌에서, RGN은 FA 불안정 영역을 절제할 것이다. 상기 영역의 절제는 유전자좌의 일루미나 시퀀싱에 의해 검증될 수 있다.
표 15: RGN 시스템에 대한 게놈 표적 서열
Figure pct00031
실시예 10: 겸상 적혈구 질환의 원인이 되는 표적화 돌연변이
BCL11A 인핸서 영역 (서열식별번호: 348) 내의 표적화 서열은 겸상 적혈구 질환의 증상을 치유하거나 또는 완화시키기 위해 태아 헤모글로불린 (HbF)을 증가시키는 메카니즘을 제공할 수 있다. 예를 들어, 게놈 차원의 연관성 연구에 의해 증가된 HbF 수준과 연관된 BCL11A에서의 유전자 변이의 집합을 확인하였다. 이들 변이는 단계-특이적인 계통-제한된 인핸서 영역으로서 기능하는 BCL11A의 비-코딩 영역에서 발견되는 SNP의 집합이다. 추가의 연구를 통해, 이 BCL11A 인핸서가 BCL11A 발현을 위해 적혈구 세포에서 필요하다는 것이 밝혀졌다 ([Bauer et al., (2013) Science 343:253-257], 본원에 참고로 포함됨). 인핸서 영역은 BCL11A 유전자의 인트론 2 내에서 발견되었고, 인트론 2에서 DNaseI 과민성 (종종 조절 능력과 연관된 염색질 상태를 나타냄)인 3개의 영역이 확인되었다. 이들 3개의 영역은 BCL11A의 전사 시작 부위로부터의 거리 (킬로염기)에 따라 "+62", "+58" 및 "+55"로 확인되었다. 이들 인핸서 영역은 대략 350 (+55); 550 (+58); 및 350 (+62) 뉴클레오티드 길이이다 (Bauer et al., 2013).
실시예 10.1: 바람직한 RGN 시스템의 확인
여기서 BCL11A가 성인 헤모글로빈에서 베타-글로빈을 제조하는 것을 담당하는 유전자인 HBB 유전자좌 내의 그의 결합 부위로 결합하는 것을 방해하는 RGN 시스템을 사용하는 베타-혈색소병증의 잠재적인 치료가 기재된다. 이 접근법은 포유동물 세포에서 더욱 효율적인 NHEJ를 사용한다. 또한, 이 접근법은 생체내 전달을 위해 단일 AAV 벡터로 팩키징될 수 있는 충분히 작은 크기를 갖는 뉴클레아제를 사용한다.
인간 BCL11A 인핸서 영역 (서열식별번호: 348)에서 GATA1 인핸서 모티프는 성인 인간 적혈구에서 HbF의 동시 재발현과 함께 BCL11A 발현을 감소시키기 위해 RNA 가이드된 뉴클레아제 (RGN)를 사용하여 방해하기 위한 이상적인 표적이다 (Wu et al. (2019) Nat Med 387:2554). APG09748 또는 APG09106과 상용성인 몇몇 PAM 서열은 이 GATA1 부위를 둘러싸는 유전자좌에서 용이하게 명백하다. 이들 뉴클레아제는 5'-DTTN-3'의 PAM 서열 (서열식별번호: 30)을 갖고, 소형의 크기를 가지며, 이는 잠재적으로 단일 AAV 또는 아데노바이러스 벡터에서 적절한 가이드 RNA와 함께 그들의 전달을 가능하게 한다. 이 전달 접근법은 다른 것들에 비해 조혈 줄기 세포로의 접근, 및 잘 확립된 안전성 프로파일 및 제작 기술과 같은 다양한 이점을 제공한다.
흔히 사용되는 에스. 피로게네스로부터의 Cas9 뉴클레아제 (SpyCas9)는 5'-NGG-3'의 PAM 서열 (서열식별번호: 323)을 필요로 하며, 이 중에서 몇몇은 GATA1 모티프 근처에 존재한다. 그러나, SpyCas9의 크기는 단일 AAV 또는 아데노바이러스 벡터로 팩키징되는 것을 방지하며, 따라서 상기 언급된 이 접근법의 이점을 포기한다. 이중 전달 전략을 이용할 수 있지만, 이는 상당한 제작 복잡성 및 비용을 부가할 것이다. 추가로, 주어진 세포에서 성공적으로 편집되려면 두 벡터 모두로의 감염을 필요로 하기 때문에, 이중 바이러스 벡터 전달은 유전자 수정의 효율을 상당히 감소시킨다.
인간 코돈 최적화된 APG09748 (서열식별번호: 349) 또는 APG09106 (서열식별번호: 360)을 코딩하는 발현 카세트는 실시예 5에 기재된 것과 유사하게 생성된다. RGN APG09748 또는 APG09106에 대한 가이드 RNA를 발현하는 발현 카세트 또한 생성된다. 이들 가이드 RNA는 다음을 포함한다: 1) BCL11A 인핸서 유전자좌 (표적 서열) 내의 비-코딩 또는 코딩 DNA 가닥에 대해 상보성인 프로토스페이서 서열 및 2) 가이드 RNA와 RGN의 회합을 위해 필요한 RNA 서열. APG09748 또는 APG09106에 의해 표적화하기 위한 몇몇 잠재적인 PAM 서열은 BCL11A GATA1 인핸서 모티프를 둘러싸고 있기 때문에, BCL11A GATA1 인핸서 서열의 강건한 절단 및 NHEJ 매개된 방해를 제공하는 최상의 프로토스페이서 서열을 결정하기 위해 몇몇 잠재적인 가이드 RNA 구축물이 생성된다. 표 16에서 표적 게놈 서열은 표 16에 제공된 sgRNA를 이용하여 RGN을 이 유전자좌로 지시하기 위해 평가된다.
표 16: APG09748을 사용하여 BCL11A GATA1 인핸서 유전자좌에 대한 표적 서열
Figure pct00032
APG09748 또는 APG09106이 BCL11A 인핸서 영역을 방해하는 삽입 또는 결실을 생성하는 효율을 평가하기 위해, 인간 세포주, 예컨대 인간 배아 신장 세포 (HEK 세포)를 사용한다. RGN 발현 카세트를 포함하는 DNA 벡터 (예를 들어, 실시예 5에 기재됨)를 생성한다. 표 16의 가이드 RNA 서열에 대한 코딩 서열을 포함하는 발현 카세트를 포함하는 별도의 벡터를 또한 생성한다. 이러한 발현 카세트는 실시예 5에 기재된 바와 같이 인간 RNA 폴리머라제 III U6 프로모터 (서열식별번호: 336)를 추가로 포함할 수 있다. 대안적으로, RGN 및 가이드 RNA 둘 다의 발현 카세트를 포함하는 단일 벡터가 사용될 수 있다. 벡터를 실시예 5에 기재된 것과 같은 표준 기술을 이용하여 HEK 세포에 도입시키고, 세포를 1-3 일 동안 배양한다. 이 배양 기간 이후에, 게놈 DNA를 단리하고, 삽입 또는 결실의 빈도를 실시예 5에 기재된 바와 같이 T7 엔도뉴클레아제 I 소화 및/또는 직접적인 DNA 시퀀싱을 이용하여 결정한다.
표적 BCL11A 영역을 포함하는 DNA 영역을 일루미나 넥스테라 XT 오버행 서열을 함유하는 프라이머를 사용하여 PCR에 의해 증폭시킨다. 이들 PCR 앰플리콘은 T7 엔도뉴클레아제 I 소화를 이용하여 NHEJ 형성에 대해 시험하거나, 또는 일루미나 16S 메타게놈 시퀀싱 라이브러리 프로토콜 또는 유사한 차세대 시퀀싱 (NGS) 라이브러리 제조에 따라 라이브러리 제조를 거친다. 딥 시퀀싱 이후에, 생성된 판독을 CRISPResso에 의해 분석하여, 편집률을 계산한다. 출력 정렬을 수동-큐레이션하여, 삽입 및 결실 부위를 확인한다. 이 분석을 통해 바람직한 RGN 및 상응하는 바람직한 가이드 RNA (sgRNA)가 확인된다. 상기 분석은 APG09748 또는 APG09106 둘 다 동등하게 바람직하게 할 수 있다. 추가로, 상기 분석은 1개 초과의 바람직한 가이드 RNA가 있거나, 또는 표 16의 모든 표적 게놈 서열이 동등하게 바람직함을 결정할 수 있다.
실시예 10.2: 태아 헤모글로빈의 발현에 대한 검정
이 실시예에서, BCL11A 인핸서 영역을 방해하는 APG09748 또는 APG09106 생성된 삽입 또는 결실을 태아 헤모글로빈의 발현에 대해 검정한다. 건강한 인간 공여자 CD34+ 조혈 줄기 세포 (HSC)를 사용한다. 이들 HSC를 배양하고, 바람직한 RGN 및 바람직한 sgRNA의 코딩 영역을 포함하는 발현 카세트를 포함하는 벡터(들)을 실시예 8.3에 기재된 것과 유사한 방법을 이용하여 도입시킨다. 전기천공 이후에, 확립된 프로토콜을 이용하여 시험관내에서 이들 세포를 적혈구로 분화시킨다 (예를 들어, [Giarratana et al. (2004) Nat Biotechnology 23:69-74], 본원에 참고로 포함됨). 이어서, HbF의 발현을 항-인간 HbF 항체에 의해 웨스턴 블롯팅을 이용하여 측정하거나, 또는 고성능 액체 크로마토그래피 (HPLC)를 이용하여 정량화한다. BCL11A 인핸서 유전자좌의 성공적인 방해가 가이드 없이 RGN에 의해서만 전기천공된 HSC와 비교할 때 HbF 생성의 증가를 유도할 것으로 예상된다.
실시예 10.3: 감소된 겸상 적혈구 형성에 대한 검정
이 실시예에서, BCL11A 인핸서 영역을 방해하는 APG09748 또는 APG09106 생성된 삽입 또는 결실을 감소된 겸상 적혈구 형성에 대해 검정한다. 겸상 적혈구 질환에 걸린 환자로부터의 공여자 CD34+ 조혈 줄기 세포 (HSC)를 사용한다. 이들 HSC를 배양하고, 바람직한 RGN 및 바람직한 sgRNA의 코딩 영역을 포함하는 발현 카세트를 포함하는 벡터(들)를 실시예 8.3에 기재된 것과 유사한 방법을 이용하여 도입시킨다. 전기천공 이후에, 확립된 프로토콜을 이용하여 시험관내에서 이들 세포를 적혈구로 분화시킨다 (예를 들어, [Giarratana et al. (2004) Nat Biotechnology 23:69-74], 본원에 참고로 포함됨). 이어서, HbF의 발현을 항-인간 HbF 항체에 의해 웨스턴 블롯팅을 이용하여 측정하거나, 또는 고성능 액체 크로마토그래피 (HPLC)를 이용하여 정량화한다. BCL11A 인핸서 유전자좌의 성공적인 방해가 가이드 없이 RGN에 의해서만 전기천공된 HSC와 비교할 때 HbF 생성의 증가를 유도할 것으로 예상된다.
겸상 적혈구 형성을 메타비술파이트의 첨가에 의해 이들 분화된 적혈구에서 유도한다. 현미경을 이용하여 겸상 대 정상 적혈구의 개수를 카운팅한다. 처리되지 않거나 또는 RGN 단독으로 처리된 세포에 비해 APG09748 또는 APG09106 플러스 sgRNA로 처리된 세포에서 겸상 적혈구의 개수가 더 적을 것으로 예상된다.
실시예 10.4: 뮤린 모델에서 질환 치료 검증
BCL11A 유전자좌의 APG09748 또는 APG09106 방해를 이용하는 효능을 평가하기 위해, 겸상 적혈구 빈혈의 적합한 인간화 마우스 모델을 이용한다. 바람직한 RGN 및 바람직한 sgRNA를 코딩하는 발현 카세트를 AAV 벡터 또는 아데노바이러스 벡터에 팩키징한다. 특히, 아데노바이러스 유형 Ad5/35가 HSC를 표적화하는데 효과적이다. 겸상 적혈구 대립유전자를 갖는 인간화 HBB 유전자좌를 함유하는 적합한 마우스 모델, 예컨대 B6;FVB-Tg(LCR-HBA2,LCR-HBB*E26K)53Hhb/J 또는 B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ를 선택한다. 이들 마우스를 과립구 콜로니-자극 인자 단독으로 또는 플레릭사포어와 조합하여 처리하여, HSC를 순환으로 동원시킨다. 이어서, RGN 및 가이드 플라스미드를 갖는 AAV 또는 아데노바이러스를 정맥내로 주사하고, 마우스를 1 주일 동안 회복시킨다. 이들 마우스로부터 수득한 혈액을 메타비술파이트를 사용하여 시험관내 겸상화 검정에서 시험하고, 마우스를 사망률 및 조혈 기능을 모니터링하기 위해 종적으로 추적한다. 두 발현 카세트 모두 결여된 바이러스 또는 RGN 발현 카세트만을 갖는 바이러스로 처리된 마우스와 비교할 때 RGN 및 가이드 RNA를 갖는 AAV 또는 아데노바이러스로의 처리가 겸상화, 사망률을 감소시키고, 조혈 기능을 개선시킬 것으로 예상된다.
실시예 11: 데아미나제의 확인
미생물 배양물을 표준 실험실 배지에서 액체 배양물에서 성장시켰다. 배양물을 DNA 제조 전에 포화까지 (16 내지 24 시간) 성장시켰다. DNA를 세제 용해에 의해 박테리아 세포로부터 추출한 후, 실리카 매트릭스에 결합시키고, 에탄올 완충제로 세척하였다. 정제된 DNA를 약알칼리성 수성 완충제에 의해 실리카 매트릭스로부터 용리시켰다.
시퀀싱을 위한 DNA를 분광광도법에 의해 순도 및 농도에 대해 시험하였다. 시퀀싱 라이브러리를 넥스테라 XT 라이브러리 제조 키트를 제조자의 프로토콜에 따라 사용하여 제조하였다. 서열 데이터는 일루미나 HiSeq 2000 시스템 사용자 가이드 프로토콜에 따라 HiSeq 2000 상에서 생성하였다.
시퀀싱 판독은 씨엘씨 바이오 어셈블리 셀(CLC Bio Assembly Cell) 소프트웨어 패키지를 사용하여 드래프트 게놈으로 조립하였다. 조립 후에, 몇몇 방법에 의해 유전자 호출이 이루어졌고, 생성된 유전자 서열을 조사하여 데아미나제 유전자의 신규한 상동성을 확인하였다. 신규한 유전자는 BLAST 및 도메인 조성에 의해 확인하였다. 촉매적 도메인 D/H/C-[X]-E-[X15-45]-P-C-[X2]-C (서열식별번호: 613)는 모든 효소에서 예측되었다. 추가로, 시퀀싱된 진핵생물 유기체의 게놈으로부터의 가상의 데아미나제인 NCBI 데이터베이스에서 확인된 서열 또한 실험하였다. 확인된 268개의 APOBEC 도메인 단백질은 65% 상동성으로 클러스터화되었고, 47개의 후보가 데아미나제 활성 검정을 위해 선택되었다. 확인된 392개의 ADAT 도메인 단백질은 65% 상동성으로 클러스터화되었고, 추가로 서열 길이를 기반으로 하여 선택되었다. 모두 220개 미만의 아미노산 길이인 125개의 ADAT 도메인 단백질이 데아미나제 활성 검정을 위해 선택되었다.
표 17은 47개의 선택된 APOBEC 도메인 단백질 및 125개의 ADAT 도메인 단백질을 나타낸다. 각각의 폴리펩티드에 대한 독특한 식별 코드를 제공하는 서열식별번호 및 APG ID가 표시된다. 입수가능한 경우, NCBI 및 유니프롯(Uniprot) 수탁 번호가 제공된다. "도메인 설명"은 데아미나제가 ADAT 또는 APOBEC 도메인을 갖는지 여부를 나타낸다. 확인된 폴리펩티드 서열 내에서 ADAT 또는 APOBEC 도메인의 시작 및 끝 또한 나타낸다.
표 17: 확인된 데아미나제
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
실시예 12: 데아미나제 활성에 대한 검정
실시예 12.1: 추정 데아미나제의 선택
표 17에 나타낸 선택된 단백질의 코딩 서열은 박테리아에서의 발현을 위해 코돈-최적화되고, 합성되고, 5' 말단에서 T7 프로모터에 작동가능하게 연결된 관련 기술분야에 널리 공지된 표준 박테리아 발현 벡터에 도입된다.
실시예 12.2: 데아미나제 활성 검정
데아미나제 활성 검정은 [Garibyan et al. (DNA Repair 2: 593-608, 2003)]을 기반으로 한다. 에스케리키아 콜라이의 rpoB 유전자에서의 돌연변이는 RNA 폴리머라제의 β 서브유닛을 변경시킴으로써 항생제 리팜피신 (Rifr)에 대한 내성을 일으킨다.
실시예 12.1에 기재된 바와 같이, 추정 데아미나제를 코딩하는 박테리아 발현 벡터를 T7 발현 이. 콜라이 세포 (NEBioLabs)에 도입시켰다. 세포는 우라실 DNA 글리코실라제 억제제 (UGI; 서열식별번호: 570) 및 카르베니실린 선택가능한 마커를 코딩하는 별도의 발현 플라스미드 또한 함유할 수 있다. 세포를 포화까지 성장시킨 다음, 자가-유도 배지 (매직미디어™, 써모 피셔 사이언티픽)의 접종물을 위한 공급원으로서 사용한 다음, 추가 5 시간 동안 성장시켰다. 세포를 UGI 발현 플라스미드를 또한 함유하는지 여부에 따라 카나마이신을 갖는 LB 또는 카나마이신 및 카르베니실린을 갖는 LB 상에 희석-플레이팅시킨다. 이들 희석-플레이트를 사용하여 총 세포 카운트를 구하였다. rpoB 유전자로의 돌연변이를 성공적으로 도입시킬 수 있는 추정 데아미나제 발현 벡터를 확인하기 위해 동일한 세포를 리팜피신을 갖는 LB 또는 리팜피신 및 카르베니실린을 갖는 LB 상에 또한 플레이팅하였다.
리팜피신을 함유하는 LB 플레이트 상에서 성장시킨 박테리아 콜로니로부터 데아미나제 발현 벡터를 단리하고, 검정을 적어도 2회 반복하였다. 확인한 후에, 박테리아 세포를 시퀀싱하였다. 예상치 못하게도, 평가를 위해 선택된 단백질을 함유하는 47개의 APOBEC 도메인 중에서, 단지 9개만이 데아미나제 활성을 나타내었다. 평가를 위해 선택된 단백질을 함유하는 125개의 ADAT 도메인 중에서, 어느 것도 데아미나제 활성을 나타내지 않았다. 이는 데아미나제 활성이 폴리펩티드의 아미노산 서열을 기반으로 하여 예측될 수 없지만, 대신에 실험적으로 결정되어야 함을 시사한다. 이 검정에서 확인된 9개의 활성 데아미나제에 대한 결과는 표 18에 나타내었다. 리팜피신-내성 콜로니로부터의 rpoB 유전자를 시퀀싱하여 유도된 돌연변이를 확인하였다. 돌연변이율은 각각의 활성 데아미나제를 포함하는 내성 콜로니의 개수를 콜로니의 총 개수와 비교함으로써 계산되었다.
표 18: 활성 데아미나제의 돌연변이율의 NGS 분석
Figure pct00041
실시예 13: 박테리아 세포에서 염기 편집 활성
APG00868 (서열식별번호: 374) 또한 후속적인 활성 스크린에서 활성 데아미나제로 확인되었다. 10개의 확인된 활성 데아미나제의 코딩 서열을 그의 N-말단에서 NLS (서열식별번호: 10)를 포함하고, 그의 C-말단에서 표 18의 활성 데아미나제에 작동가능하게 연결되고, 그의 C-말단에서 링커 서열 (서열식별번호: 546)에 작동가능하게 연결되고, 그의 C-말단에서 RNA-가이드된 DNA 결합 단백질, 즉, 뉴클레아제-불활성 RNA-가이드된 뉴클레아제 (RGN) dAPG08290.1 변이체 (서열식별번호: 547)에 작동가능하게 연결되고, 그의 C-말단에서 제2 NLS에 작동가능하게 연결되고, 그의 C-말단에서 TEV 부위 (서열식별번호: 548)에 작동가능하게 연결되고, 그의 C-말단에서 10x His (서열식별번호 594) 태그에 작동가능하게 연결된 융합 단백질을 생성하는 발현 카세트에 도입시켰다. 실시예 12에서 확인된 선택된 데아미나제 및 APG00868을 박테리아 세포에서 표적화된 염기 편집 활성을 위해 검정하였다.
이 활성 검정은 실시예 12와 매우 유사하였다. 그러나, 이들 실험의 경우에는 데아미나제를 불활성 RGN에 연결시켜서, rpoB 유전자의 특정한 영역을 표적화하여 표적화된 C에서 T로의 돌연변이를 도입시킬 수 있었다. 추가로, RGN-데아미나제 융합체의 표적화를 위한 가이드 RNA를 발현할 수 있는 발현 카세트를 포함하는 벡터를 생성하였다. 이들 실험에서 4가지 상이한 가이드 RNA를 사용하였다. 표 19에서 "비표적화된" (서열식별번호: 549)으로 지칭되는 제1 가이드는 RGN-데아미나제 융합체를 rpoB 유전자가 아닌 게놈 박테리아 DNA의 영역으로 가이드하였다. 표적 1 (서열식별번호: 550)은 rpoB 단백질에서 R529C 돌연변이를 도입시키는 rpoB 유전자의 영역이었다. 표적 2 (서열식별번호: 551)는 rpoB 단백질에서 A532V 돌연변이를 도입시키는 rpoB 유전자의 영역이었고, 표적 3 (서열식별번호: 552)은 rpoB 단백질에서 Q513R 돌연변이를 도입시키는 rpoB 유전자의 영역이었다. 표적 1 및 2의 원하는 돌연변이는 GC 쌍에서 AT 쌍으로의 염기 편집의 결과이다. 표적 3의 원하는 돌연변이는 AT 쌍에서 GC 쌍으로의 염기 편집의 결과이다. 다른 가능한 돌연변이 또한 이들 표적에서 확인될 수 있다.
rpoB 유전자 상의 관심 위치로 표적화시키는 가이드 RNA를 발현할 수 있는 발현 카세트를 포함하는 벡터와 함께 융합 단백질 발현 벡터를 T7 발현 이. 콜라이 세포 (NEBioLabs)에 도입시켰다. 세포를 포화까지 성장시킨 다음, 자가-유도 배지 (매직미디어™, 써모 피셔 사이언티픽)의 접종물을 위한 공급원으로서 사용한 다음, 추가 5 시간 동안 성장시켰다. 세포를 카나마이신을 갖는 LB 상에 희석-플레이팅시키고, 이들 희석-플레이트를 사용하여 총 세포 카운트를 구하였다. rpoB 유전자에서 돌연변이를 보유하는 콜로니를 확인하기 위해 동일한 세포를 리팜피신을 갖는 LB 상에 또한 플레이팅하였다. "비표적화된" 및 표적화된 데아미나제-RGN 융합 단백질 ("표적화된")에 대한 돌연변이율을 계산하였고, 표 19에 나타내었다. rpoB 유전자에 대해 표적화되지 않은 데아미나제-RGN 융합체와 비교하여 표적화된 데아미나제-RGN 융합체의 돌연변이율에서 퍼센트 증가 ("% 증가") 또한 표 19에 나타내었다. 데아미나제로서 기능하는 것으로 공지된 양성 대조군 포유동물 APOBEC 또한 포함되었다.
표 19: 표적화된 및 비표적화된 데아미나제의 돌연변이율
Figure pct00042
실시예 14: 포유동물 세포에서 염기 편집 활성
확인된 활성 데아미나제의 코딩 서열을 포유동물 세포에서의 발현을 위해 코돈-최적화시키고, 그의 N-말단에서 NLS (서열식별번호: 10)를 포함하고, 그의 C-말단에서 3xFLAG 태그 (서열식별번호: 11)에 작동가능하게 연결되고, 그의 C-말단에서 본 발명의 데아미나제에 작동가능하게 연결되고, 그의 C-말단에서 아미노산 링커 (서열식별번호: 546)에 작동가능하게 연결되고, 그의 C-말단에서 RNA-가이드된 DNA-결합 폴리펩티드, 즉, 닉카제로서 기능하도록 돌연변이된 RGN (nAPG07433.1; 서열식별번호: 553)에 작동가능하게 연결되고, 그의 C-말단에서 제2 NLS에 작동가능하게 연결된 융합 단백질을 생성하는 발현 카세트에 도입시켰다. 추가로, APG07386의 N-말단 및 C-말단 단편 (각각 서열식별번호: 554로서 APG07386-NTD 및 서열식별번호: 555로서 APG07386-CTD)을 발현 카세트에 개별적으로 도입시켜 각각의 단편의 데아미나제-RGN 융합체를 생성하였다. 이들 발현 카세트 각각을 포유동물 세포에서 융합 단백질의 발현을 유도할 수 있는 벡터에 도입시켰다. 데아미나제-RGN 융합 단백질을 결정된 게놈 위치로 표적화하기 위해 가이드 RNA를 발현할 수 있는 벡터 또한 생성하였다. 이들 가이드 RNA는 데아미나제-RGN 융합 단백질을 염기 편집을 위한 표적화된 게놈 서열로 가이드할 수 있다. 서열식별번호: 556-561은 시험한 가이드 RNA를 코딩한다.
실시예 14.1: 데아미나제 중에서 효율성 및 서열 특이성
상기 기재된 데아미나제-RGN 융합 단백질 및 가이드 RNA를 발현할 수 있는 벡터를 리포펙션 또는 전기천공을 이용하여 HEK293T 세포에 형질감염시켰다. 리포펙션의 경우, 성장 배지 (DMEM + 10% 태아 소 혈청 + 1% 페니실린/스트렙토마이신)에서 형질감염 전날에 세포를 24-웰 플레이트에서 1x105 세포/웰로 시딩하였다. 제조자의 지침에 따라 500ng의 데아미나제-RGN 융합 발현 벡터 및 1 μg의 가이드 RNA 발현 벡터를 리포펙타민® 3000 시약 (써모 피셔 사이언티픽)을 이용하여 형질감염시켰다. 전기천공의 경우, 제조자의 지침에 따라 세포를 네온(Neon)® 형질감염 시스템 (써모 피셔 사이언티픽)을 이용하여 전기천공시켰다.
리포펙션 또는 전기천공 24-48 시간 후에, 게놈 DNA를 형질감염된 또는 전기천공된 세포로부터 수확하고, DNA를 시퀀싱하고, 표적화된 염기-편집 돌연변이의 존재에 대해 분석하였다.
하기 표 20은 APG07386의 C-말단 및 N-말단 단편을 비롯하여 각각의 데아미나제에 대한 시티딘 염기의 편집률을 나타낸다. 숫자 라인은 RGN의 PAM과 관련하여 표적화된 게놈 서열에서 시티딘 염기의 위치를 나타낸다. 각각의 위치에서 C 뉴클레오티드의 편집률은 다중 표적의 평균으로서 나타내었다. 표적의 개수 (n)는 각각의 위치에 대해 컬럼 아래에 나열된다. 표준 편차는 괄호 안에 나타내었다. 이 검정에서, APG09980, APG07386-CTD, APG05840, APG05241, APG07280, APG09688 및 APG00868은 적어도 하나의 시티딘의 적어도 일부 수준의 시티딘 염기 편집 활성을 나타낸다.
표 20: 포유동물 세포에서 C 뉴클레오티드의 편집률
Figure pct00043
Figure pct00044
실시예 14.2: 표적화된 염기 편집에 대한 형광 검정
첫번째 위치 C를 T로 변경시키기 위해 H66 코돈이 시토신 데아미나제를 사용하여 히스티딘 (CAT)으로부터 야생형 티로신 (TAT) 잔기로 되돌릴 수 있도록, 청색 형광 단백질 (BFP, 서열식별번호: 562)로의 형광 이동을 유발하는 Y66H 돌연변이를 함유하는 증강된 녹색 형광 단백질 (EGFP)을 보유하는 벡터를 구축하였다. 성공적인 C에서 T로의 전환은 정량화될 수 있는 EGFP의 발현을 생성한다. 데아미나제-RGN 융합 단백질을 Y66H 돌연변이 (서열식별번호: 563) 주변 영역으로 표적화하는 가이드 RNA를 발현할 수 있는 제2 벡터 또한 생성하였다.
데아미나제-RGN 융합 단백질 및 가이드 RNA를 발현할 수 있는 벡터와 함께 이러한 BFP에서 EGFP로의 리포터 벡터를 리포펙션 또는 전기천공을 이용하여 HEK293T 세포에 형질감염시켰다. 리포펙션의 경우, 성장 배지 (DMEM + 10% 태아 소 혈청 + 1% 페니실린/스트렙토마이신)에서 형질감염 전날에 세포를 24-웰 플레이트에서 1x105 세포/웰로 시딩하였다. 제조자의 지침에 따라 500 ng의 각각의 BFP 리포터 벡터, 데아미나제-RGN 발현 벡터, 및 가이드 RNA 발현 벡터를 리포펙타민® 3000 시약 (써모 피셔 사이언티픽)을 이용하여 형질감염시켰다. 전기천공의 경우, 제조자의 지침에 따라 세포를 네온® 형질감염 시스템 (써모 피셔 사이언티픽)을 이용하여 전기천공시켰다.
리포펙션 또는 전기천공 24-48 시간 후에, GFP+ 세포의 존재에 대해 세포를 현미경으로 조사함으로써 GFP의 발현을 결정하였다. 육안 검사 후에, GFP+ 세포 대 GFP- 세포의 비율을 결정할 수 있다. 표 21에 보고된 데아미나제-RGN 융합 단백질을 발현하는 포유동물 세포에 대해 형광을 관찰하였다. 관련 기술분야의 기술자는 RIPA 완충제를 사용하여 세포를 또한 용해시킬 수 있고, 생성된 용해물을 형광 플레이트 판독기 상에서 분석하여, BFP 및 GFP에 대한 형광 강도를 결정할 수 있음을 이해할 것이다. 추가로, 세포 분류에 의해 세포를 분석하여 BFP+, GFP+ 및 GFP- 세포의 정확한 비율을 결정할 수 있다.
표 21: 포유동물 시토신 데아미나제 형광 리포터 결과
Figure pct00045
N.D = 검출되지 않음; + = 약간의 GFP+ 세포가 검출됨, ++ = 많은 GFP+ 세포가 검출됨
실시예 15: 아데노신 및 시토신 염기 편집기의 생성을 위한 데아미나제의 다양화
DNA 서열에서 A 또는 T 잔기를 G 또는 C로 변화시킬 수 있는 아데노신 염기 편집기 (ABE)가 천연 발생하는 것으로 공지되어 있지 않다. 하기 다양화 전략을 이용하여, DNA 주형에 대해 작용하는 ABE를 확인하기 위한 목적으로 데아미나제 변이체를 생성하였다.
첫번째 전략은 [Gaudelli et al (Nature, 2017, doi:10.1038/nature24644] (본원에 참고로 포함됨)과 유사한 오류가 발생하기 쉬운 PCR 효소에 의한 무작위 돌연변이 유발이었다. 프라이머를 설계하고, 표 17의 125개의 ADAT 효소에 대한 뉴클레오티드 서열을 생성하였다. 오류가 발생하기 쉬운 PCR을 제조자의 지침에 따라 젠모르프(GenMorph) II 무작위 돌연변이 유발 키트 (애질런트 테크놀로지즈)를 사용하여 수행하였다. 돌연변이된 ADAT PCR 생성물을 제조자의 지침에 따라 ZR-96 DNA 클린-업 키트(Clean-up Kit)™ (자이모 리써치(Zymo Research))를 사용하여 정제하였다. 이 접근법으로부터, 약 1천만 개의 ADAT 변이체를 생성하였다.
추구된 두번째 전략은 [Stemmer, W. P. C. (Proc. Natl. Acad. Sci. USA, 1994)]과 유사한 유전자 셔플링이었다. 표 17의 125개의 ADAT 효소에 대한 코딩 서열을 본질적으로 제조자의 지침에 따라 퓨전® 하이-피델리티 DNA 폴리머라제 (NEBiolabs)를 사용하여 PCR 증폭시키고, 제조자의 지침에 따라 디엔에이 클린 앤 컨선트레이터(DNA Clean & Concentrator)™-5 (자이모 리써치)를 사용하여 정제하였다. 상이한 ADAT 코딩 서열을 갖는 정제된 DNA를 풀링하고, 컷스마트(Cutsmart)® 완충제 중에서 37℃에서 60 분 동안 효소 RsaI, AfeI, BsaAI 및 BsaHI에 의한 제한 소화에 적용하였다. 소화 후에, 반응을 겔 전기영동에 의해 분리하고, 소화된 단편을 자이모클린(Zymoclean)™ 겔 DNA 복구 키트를 사용하여 정제하였다. 이어서, 정제된 단편을 PCR 증폭을 이용하여 조립하고, 조립되고 증폭된 생성물을 정제하였다. 이 접근법으로부터, 약 2백만 개의 ADAT 변이체를 생성하였다.
마지막 전략은 핵산과 잠재적으로 상호작용하는 구조적 잔기와 상동성인 잔기를 표적화하는 것이었다. ADAT-유사 효소의 경우, RNA (RCSB 프로테인 데이터 뱅크(Protein Data Bank) 식별번호: 2B3J; [Losey et al., 2006, Nat. Struct. Mol. Biol. 13: 153-159])와 복합체화된 스타필로코커스 아우레우스(Staphylococcus aureus) tRNA 아데노신 데아미나제, TadA의 결정 구조의 주의깊은 검사를 통해, 이. 콜라이 TadA (유니프롯 P68398 및 진뱅크 수탁번호 NP_417054) P48, L84, A106, D108 및 K110과 상동성인 잔기에서 잠재적인 상호작용이 나타났다. 이어서, 이들 상동성 잔기의 포화 돌연변이 유발을 표 17로부터의 125개의 ADAT-도메인 데아미나제에 대해 수행하였다. 이 접근법으로부터, 약 1백만 개의 ADAT 변이체를 생성하였다.
관련 기술분야의 기술자는 이들 접근법이 배타적이지 않고, 조합될 수 있으며, 각각의 연속 라운드의 개선의 결과에 적용될 수 있음을 이해할 것이다. 포화 돌연변이 유발 또는 반복적인 포화 돌연변이 유발 (Reetz and Carballeira, 2007, Nature Protocols, 2 (4): 891-903)은 반복적인 것으로 공지되어 있으며, 이는 최적의 후보가 확인될 때가지 한 라운드로부터 최상의 성능 후보가 추가 라운드의 돌연변이 및 스크리닝을 위해 선택된다는 것을 의미한다.
실시예 16: 아데노신 염기 편집기 및 시토신 염기 편집기의 생성을 위한 활성의 다양화된 데아미나제의 결정
실시예 16.1: 다양화된 데아미나제에 대한 박테리아 활성 검정
실시예 15의 다양화된 라운드로부터의 ADAT 돌연변이성 변이체 생성물을 그의 N-말단에서 NLS (서열식별번호: 10)를 포함하고, 그의 C-말단에서 돌연변이된 데아미나제에 작동가능하게 연결되고, 그의 C-말단에서 링커 서열 (서열식별번호: 546)에 작동가능하게 연결되고, 그의 C-말단에서 RNA-가이드된 DNA 결합 단백질, 즉, 뉴클레아제-불활성 RNA-가이드된 뉴클레아제 (RGN) dAPG08290.1 변이체 (서열식별번호: 547)에 작동가능하게 연결되고, 그의 C-말단에서 제2 NLS에 작동가능하게 연결되고, 그의 C-말단에서 TEV 부위 (서열식별번호: 548)에 작동가능하게 연결되고, 그의 C-말단에서 10x His 태그 (서열식별번호: 594)에 작동가능하게 연결된 융합 단백질을 생성하는 발현 카세트에 도입시켰다.
이 활성 검정은 실시예 13과 매우 유사하였다. 그러나, 이들 실험의 경우에는, 시토신 염기 편집 선택의 경우 H193R (서열식별번호: 566) 또는 아데노신 염기 편집 선택의 경우 H193Y (서열식별번호: 567)로 돌연변이된 H193을 갖는 불활성화된 클로람페니콜 유전자를 갖는 구축물을 제조하였다. 각각의 플라스미드는 RGN-데아미나제 융합체를 플라스미드의 적절한 영역으로 표적화하기 위해 가이드 RNA를 또한 함유하였다. 성공적인 CG에서 TA로의 전환시 (서열식별번호: 566의 경우) 또는 AT에서 GC로의 전환시 (서열식별번호: 567의 경우), 박테리아 세포는 클로람페니콜을 함유하는 배지에서 생존할 수 있을 것이다.
불활성화된 클로람페니콜 유전자를 포함하고 sgRNA를 표적화하는 벡터와 함께 융합 단백질 발현 벡터를 T7 발현 이. 콜라이 세포 (NEBioLabs)에 도입시켰다. 세포를 포화까지 성장시킨 다음, 자가-유도 배지 (매직미디어™, 써모 피셔 사이언티픽)의 접종물을 위한 공급원으로서 사용한 다음, 추가 5 시간 동안 성장시켰다. 세포를 카나마이신 및 카르베니실린을 갖는 LB 상에 희석-플레이팅시키고, 이들 희석-플레이트를 사용하여 총 세포 카운트를 구하였다. 활성인 돌연변이된 데아미나제를 보유하는 콜로니를 확인하기 위해 동일한 세포를 카나마이신, 카르베니실린 및 클로람페니콜을 갖는 LB 상에 또한 플레이팅하였다. 대표적인 클론을 선택하고 시퀀싱한 다음, 개별적으로 시험하였다. 추가로, "비표적화된" 돌연변이율을 측정하기 위해 동일한 세포를 카나마이신 및 리팜피신을 갖는 LB 상에 또한 플레이팅하였다. H193R 플라스미드 ("CBE")로 표적화된 데아미나제-RGN 융합 단백질에 대한 돌연변이율 ("Mutn Rate")을 계산하고, H193Y 플라스미드 ("ABE")로 표적화된 데아미나제-RGN 융합 단백질에 대한 돌연변이율을 표 22에 나타내었다. 데드 RGN (dAPG08290.1; 서열식별번호: 547)만을 함유하는 세포에서 관찰된 백그라운드와 비교하여 상대적인 아데닌 염기 편집률 ("ABE Rel Rate"), 시토신 염기 편집률 ("CBE Rel Rate"), 및 오프 타겟률 ("Off-T Rel Rate) 또한 나타내었다. 시토신 데아미나제로서 기능하는 것으로 공지된 양성 대조군 포유동물 데아미나제 또한 포함되었다.
표 22: 선택된 돌연변이된 데아미나제의 돌연변이율
Figure pct00046
실시예 16.2: 표적화된 염기 편집에 대한 형광 검정
세번째 위치 A를 G로 변경시키기 위해 아데노신 데아미나제를 사용하여 W58 코돈을 정지 (TGA)에서 야생형 트립토판 (TGG) 잔기로 되돌릴 수 있도록, 조기 정지 코돈 (서열식별번호: 564)을 생성하는 W58* 돌연변이를 함유하는 증강된 녹색 형광 단백질 (EGFP)을 보유하는 벡터를 구축하였다. 성공적인 A에서 G로의 전환은 정량화될 수 있는 EGFP의 발현을 생성한다. 데아미나제-RGN 융합 단백질을 W58* 돌연변이 (서열식별번호: 565) 주위 영역으로 표적화하는 가이드 RNA를 발현할 수 있는 두번째 벡터 또한 생성하였다.
데아미나제-RGN 융합 단백질 및 가이드 RNA를 발현할 수 있는 벡터와 함께 이러한 EGFP에서 EGFP로의 리포터 벡터를 리포펙션 또는 전기천공을 이용하여 HEK293T 세포에 형질감염시켰다. 리포펙션의 경우, 성장 배지 (DMEM + 10% 태아 소 혈청 + 1% 페니실린/스트렙토마이신)에서 형질감염 전날에 세포를 24-웰 플레이트에서 1x105 세포/웰로 시딩하였다. 제조자의 지침에 따라 500 ng의 각각의 데드 EGFP 리포터 벡터, 데아미나제-RGN 발현 벡터, 및 가이드 RNA 발현 벡터를 리포펙타민® 3000 시약 (써모 피셔 사이언티픽)을 이용하여 형질감염시켰다. 전기천공의 경우, 제조자의 지침에 따라 세포를 네온® 형질감염 시스템 (써모 피셔 사이언티픽)을 이용하여 전기천공시켰다.
리포펙션 또는 전기천공 24-48 시간 후에, GFP+ 세포의 존재에 대해 세포를 현미경으로 조사함으로써 GFP의 발현을 결정하였다. 육안 검사 후에, GFP+ 세포 대 GFP- 세포의 비율을 결정할 수 있다. 표 23에 보고된 데아미나제-RGN 융합 단백질을 발현하는 포유동물 세포에 대해 형광을 관찰하였다. 관련 기술분야의 기술자는 RIPA 완충제를 사용하여 세포를 또한 용해시킬 수 있고, 생성된 용해물을 형광 플레이트 판독기 상에서 분석하여, GFP에 대한 형광 강도를 결정할 수 있음을 이해할 것이다. 추가로, 세포 분류에 의해 세포를 분석하여 GFP+ 및 GFP- 세포의 정확한 비율을 결정할 수 있다.
표 23: 포유동물 아데노신 데아미나제 형광 리포터 결과
Figure pct00047
+ = 약간의 GFP+ 세포가 검출됨, ++ = 많은 GFP+ 세포가 검출됨, +++ = 가장 많은 수의 GFP+ 세포가 관찰됨
SEQUENCE LISTING <110> LIFEEDIT, INC. <120> POLYPEPTIDES USEFUL FOR GENE EDITING AND METHODS OF USE <130> L103438 1150WO (0038.7) <140> <141> <150> 62/932,169 <151> 2019-11-07 <150> 62/790,261 <151> 2019-01-09 <150> 62/790,266 <151> 2019-01-09 <150> 62/790,262 <151> 2019-01-09 <150> 62/790,256 <151> 2019-01-09 <150> 61/790,258 <151> 2019-01-09 <150> 62/785,391 <151> 2018-12-27 <160> 617 <170> PatentIn version 3.5 <210> 1 <211> 1060 <212> PRT <213> Bacillus sp. <220> <221> source <223> /note="APG00969" <400> 1 Met Lys Gln Thr Ser Tyr Ser Leu Gly Leu Asp Ile Gly Ile Ala Ser 1 5 10 15 Val Gly Tyr Gly Leu Ile Asp Asn Asp Glu Asn Ile Val Asp Ala Gly 20 25 30 Val Arg Leu Phe Pro Glu Ala Asn Ser Lys Asn Asn Asp Gly Arg Arg 35 40 45 Lys Ser Arg Gly Ser Lys Arg Leu Ile Arg Arg Lys Arg His Arg Ile 50 55 60 Ala Arg Val Lys His Leu Leu Lys Glu Ser Gly Ile Asp Val Ser Tyr 65 70 75 80 Glu Asn Thr Val Leu Thr Asn Pro Tyr Glu Ile Arg Cys Lys Gly Leu 85 90 95 Thr Leu Pro Leu Thr Asn His Glu Leu Ser Ile Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Lys Ser Met Asp Gln Glu Lys 115 120 125 Val Lys Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Thr Ile Asn Asp 130 135 140 Asn Leu Leu Glu Glu Lys Phe Ile Cys Glu Leu Gln Leu Glu Arg Leu 145 150 155 160 Asn Lys Glu Gly Ile Val Arg Ser His Ser Asn Arg Phe Lys Thr Ala 165 170 175 Asp Tyr Ile Lys Glu Ile Lys Asn Leu Leu Glu Thr Gln Ala Lys Gln 180 185 190 Asn Thr Leu Val Thr Glu Glu Phe Ile Glu Lys Tyr Ile Glu Ile Phe 195 200 205 Ser Gly Arg Arg Lys Tyr Tyr Glu Gly Pro Gly Gly Glu Ser Lys Tyr 210 215 220 Gly Trp Lys Gly Asp Ile Glu Lys Trp Tyr Glu Gly Leu Met Gly Lys 225 230 235 240 Cys Thr Tyr Phe Pro Lys Glu Leu Arg Cys Val Lys His Ala Tyr Ser 245 250 255 Ala Ala Leu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Ser Ile Asn 260 265 270 Arg Glu Glu Asp Thr Lys Leu Ser Gln Tyr Glu Lys Glu Gln Ile Ile 275 280 285 Glu Lys Ile Phe Lys Val Arg Lys Thr Pro Thr Leu Thr Gln Ile Ala 290 295 300 Lys Leu Leu Lys Val Asp Pro Thr Asn Ile Lys Gly Phe Arg Thr Lys 305 310 315 320 Ala Asn Gly Thr Pro Asp Phe Leu Ser Ile Lys Ile Tyr His Asp Leu 325 330 335 Lys Gly Ile Ile Asp Asp Lys Gln Leu Leu Asp Asp Ile Ala Phe Leu 340 345 350 Asp Asn Val Ala Gln Ile Leu Thr Val Trp Gln Asp Ser Gln Ser Ile 355 360 365 Gln Glu Lys Leu Lys Thr Leu Asn Lys Asn Leu Asp Asp Lys Thr Ile 370 375 380 Lys Glu Ile Ser Glu Leu Lys Lys Tyr Thr Gln Thr His Ser Leu Ser 385 390 395 400 Leu Lys Leu Ile Asn Val Leu Leu Pro Glu Leu Trp Glu Thr Thr Lys 405 410 415 Asn Gln Met Thr Ile Leu Ser Glu Leu Lys Leu Lys Pro Arg Lys Ile 420 425 430 Asp Leu His Asn Cys Asn Glu Ile Pro Val Asn Met Ile Asn Asp Leu 435 440 445 Ile Val Ser Pro Val Val Arg Arg Ser Leu Thr Gln Ser Ile Glu Met 450 455 460 Ile Asn Gln Ile Ile Lys Asp Tyr Gly His Pro Arg Glu Ile Val Ile 465 470 475 480 Glu Leu Ala Arg Glu Lys Asn Ser Glu Glu Lys Lys Asn Phe Ile Lys 485 490 495 Ser Leu Asn Glu Lys Asn Lys Gln Ile Asn Asp Glu Val Ile Glu Lys 500 505 510 Leu Asn Ala Ser Asn His Arg Asp Asn Lys Gly Met Phe Asn Lys Val 515 520 525 Lys Leu Trp Ile Leu Gln Asp Gly His Cys Leu Tyr Ser Leu Lys Pro 530 535 540 Ile Arg Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Ile Asp 545 550 555 560 His Ile Ile Pro Lys Ser Val Ser Phe Asp Asp Ser Met Ser Asn Lys 565 570 575 Val Leu Val Tyr Gln Ile Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro 580 585 590 Tyr Gln Tyr Leu Thr Ser Ala Asp Lys Thr Ile Thr Tyr Glu Lys Phe 595 600 605 Lys Ala Asn Ile Thr Gln Leu Ala Lys Ser Asn His Lys Ile Ser Lys 610 615 620 Lys Lys Leu Asp Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe His 625 630 635 640 Ile Lys Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala 645 650 655 Thr Arg Ser Leu Ile Asn Leu Leu Lys Tyr Tyr Phe Ser Glu Lys Asp 660 665 670 Ile Asn Val Lys Val Lys Ser Ile Asn Gly Ser Phe Thr Asp Tyr Leu 675 680 685 Arg Lys Leu Trp Asn Phe Pro Lys Asp Arg Glu Phe Tyr His Lys His 690 695 700 His Ala Glu Asp Ala Leu Ile Ile Ala Met Ala Asn Lys Ile Phe Thr 705 710 715 720 Thr Arg Lys Ile Phe Lys Glu Gln Asn Ser Val Phe Ser Asp Glu Gln 725 730 735 Ile Leu Asp Gly Glu Val Thr Asn Ile Leu Ser Asp Asp Gln Phe Gln 740 745 750 Ala Glu Phe Thr Glu Lys Phe Tyr Lys Val Gln Ala Ile Lys Lys Tyr 755 760 765 Asp Lys Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln 770 775 780 Leu Phe Asp Asp Thr Leu Tyr Ser Thr Arg Glu Phe Glu Gly Glu Glu 785 790 795 800 Tyr Tyr Ile Gly Lys Ile Lys Asp Ile Tyr Asn Leu Lys Asp Lys Arg 805 810 815 Leu Lys Lys Ile Phe Thr Lys Ser Pro Glu Lys Ile Leu Met Tyr Gln 820 825 830 His Asp Ser Gln Thr Phe Lys Lys Leu Lys Gln Ile Met Arg Ser Tyr 835 840 845 Glu Asp Glu Val Asn Pro Leu Ala Lys Tyr His Lys Glu Thr Gly Glu 850 855 860 Tyr Leu Arg Lys Glu Cys Lys Lys Gly Asn Gly Pro Ile Val Lys Ser 865 870 875 880 Leu Lys Tyr Arg Val Thr Lys Leu Gly Val His Lys Asp Ile Thr His 885 890 895 Lys Tyr Glu Asn Ser Lys Asn Lys Val Val Ile Leu Ser Leu Lys Pro 900 905 910 Phe Arg Met Asp Val Phe Lys Glu Asn Gly Val Tyr Lys Phe Ile Thr 915 920 925 Ile Arg Tyr Cys Asp Leu Lys Glu Thr Val Asn Ser Tyr Thr Ile Ser 930 935 940 Glu His Leu Tyr Lys Ala Lys Leu Lys Ala Lys Asp Ile Lys Ser Met 945 950 955 960 Asp Ser Phe Lys Trp Ser Phe Tyr Lys Asn Asp Leu Leu Glu Tyr Asn 965 970 975 Gly Glu Leu Cys Thr Phe Lys Gly Val Asn Asp Asp Lys Lys Asn Lys 980 985 990 Ile Glu Val Asn Trp Val Glu Lys Asn Phe Ala Ile Tyr Ala Glu Lys 995 1000 1005 Lys Asn Leu Lys Ser Lys Gln Leu Val Lys Ser Ile Thr Lys Ser 1010 1015 1020 Thr Val Lys Ser Leu Leu Lys Tyr Thr Thr Asp Ile Leu Gly Asn 1025 1030 1035 Arg Tyr Pro Val Arg Asn Glu Lys Leu Lys Leu Met Ile Arg Lys 1040 1045 1050 Gln Thr Phe Arg Gly Asp Leu 1055 1060 <210> 2 <211> 16 <212> RNA <213> Bacillus sp. <220> <221> source <223> /note="crRNA" <400> 2 guuuuaguac ucugug 16 <210> 3 <211> 73 <212> RNA <213> Bacillus sp. <220> <221> source <223> /note="tracrRNA" <400> 3 cacagaaucu acuaaaauaa ggcauaaugc cguauuuaau cccaucauaa uucugauggg 60 auuuuuuaua uuu 73 <210> 4 <211> 118 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(25) <223> a, c, u, g, unknown or other <400> 4 nnnnnnnnnn nnnnnnnnnn nnnnnguuuu aguacucugu gaaagcacag aaucuacuaa 60 aauaaggcau aaugccguau uuaaucccau cauaauucug augggauuuu uuauauuu 118 <210> 5 <211> 123 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 5 gagcggacag cagcuuccua uaucucguac guuuuaguac ucugugaaag cacagaaucu 60 acuaaaauaa ggcauaaugc cguauuuaau cccaucauaa uucugauggg auuuuuuaua 120 uuu 123 <210> 6 <211> 123 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 6 ccaugauaua gacguugugg cuguuguagu guuuuaguac ucugugaaag cacagaaucu 60 acuaaaauaa ggcauaaugc cguauuuaau cccaucauaa uucugauggg auuuuuuaua 120 uuu 123 <210> 7 <211> 5 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <400> 7 nnarv 5 <210> 8 <211> 4 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 8 aaag 4 <210> 9 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 9 gccgccrcca tgg 13 <210> 10 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 10 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 11 <211> 22 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 11 Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr 1 5 10 15 Lys Asp Asp Asp Asp Lys 20 <210> 12 <211> 16 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 12 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 13 <211> 6 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (2)..(2) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (4)..(5) <223> a, c, u, g, unknown or other <400> 13 unannc 6 <210> 14 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (31)..(38) <223> a, c, t, g, unknown or other <400> 14 gagcggacag cagcttccta tatctcgtac nnnnnnnn 38 <210> 15 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (31)..(38) <223> a, c, t, g, unknown or other <400> 15 ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38 <210> 16 <211> 1090 <212> PRT <213> Rhizobium sp. <220> <221> source <223> /note="APG03128" <400> 16 Met Asn Asn Leu Leu Tyr Ser Phe Asp Ile Gly Thr Asn Ser Ile Gly 1 5 10 15 Trp Cys Val Phe Ala Leu Asp Glu Val Gly Asp Pro Cys Arg Ile Val 20 25 30 Asp Leu Gly Ala Arg Ile Tyr Ala Asp Gly Arg Asp Pro Gln Thr Lys 35 40 45 Thr Ser Leu Ala Val Ala Arg Arg Glu Ala Arg Ala Met Ser Arg Arg 50 55 60 Arg Asp Arg Ser Leu Arg Arg Arg Lys Ala Thr Leu Arg Thr Met Ile 65 70 75 80 Glu Tyr Gly Leu Met Pro Ala His Lys Val Glu Gln Glu Thr Leu Leu 85 90 95 Arg Lys Thr Gly Asp Arg Glu Gly Gly Asp Glu Gly Phe Asn Pro Tyr 100 105 110 Ala Leu Arg Ala Arg Ala Leu Gly Glu Lys Leu Pro Pro Phe Tyr Ile 115 120 125 Gly Arg Ala Leu Phe His Leu Gly Gln Arg Arg Gly Phe Lys Ser Asn 130 135 140 Arg Lys Thr Asp Arg Lys Asp Asn Asp Lys Gly Lys Ile Ala Leu Gly 145 150 155 160 Ile Asp Glu Leu Arg Ala Ala Met His Arg Ser Gly Ser Pro Thr Leu 165 170 175 Gly Ala Trp Leu Ala Met Arg Arg Ala Asp Gly His Pro Val Arg Leu 180 185 190 Arg Ala Gly Ser Glu Val Phe Asp Ala Glu Gly Tyr Ala Phe Tyr Pro 195 200 205 Glu Arg Ser Leu Leu Glu Asp Glu Phe Arg Gln Ile Trp Thr Ala Gln 210 215 220 Ala Val His His Pro Gln Leu Leu Thr Ser Glu Arg Arg Ala His Leu 225 230 235 240 Phe Arg Val Met Phe Tyr Gln Arg Pro Leu Lys Lys Pro Leu Val Gly 245 250 255 Arg Cys Ser Phe Asn Pro Ala Glu Ala Arg Leu Ser Arg Ala His Pro 260 265 270 Leu Phe Gln Glu Phe Arg Leu Tyr Lys Glu Val Asn Asp Leu Glu Val 275 280 285 Val Leu Pro Asp Gln Ser His Arg Lys Leu Thr Leu Asp Glu Arg Asn 290 295 300 Ala Leu Val Ala Lys Leu Lys Ser Ser Arg Lys Ala Ser Phe Ser Val 305 310 315 320 Leu Arg Arg Thr Leu Lys Leu Thr Pro Asp Leu Ala Phe Asn Lys Glu 325 330 335 Ser Glu Ala Arg Lys Asp Leu Leu Gly Asp Glu Ile Asn Ser Ala Leu 340 345 350 Ala Asp Ala Lys Met Phe Gly Val Arg Trp Gly Gly Phe Pro Arg Ala 355 360 365 Arg Gln Trp Glu Ile Ile Thr His Leu Lys Glu Glu Glu Asn Pro Ala 370 375 380 Arg Leu Ser Asp Trp Leu Lys Ser Glu Phe Gly Leu Asp Asp Glu Arg 385 390 395 400 Val Val Ala Ile Ala Asn Ile Ala Leu Pro Glu Gly Tyr Gly Arg Leu 405 410 415 Gly Glu Thr Ala Leu Ala Ser Met Leu Glu Glu Met Lys Thr Ala Val 420 425 430 Ile Pro Glu Ser Glu Ala Ala Lys Arg Cys Gly Tyr Asp His Ser Asn 435 440 445 Leu Ala Lys Glu Gln Asp Glu Gly Leu Asp Ile Leu Pro Glu Tyr Gln 450 455 460 Glu Ile Leu Glu Arg His Ile Pro Pro Gly Thr Gly Asp Pro Asp Asp 465 470 475 480 Ile Tyr Asp Ile Arg Lys Gly Arg Ile Thr Asn Pro Thr Val His Ile 485 490 495 Gly Leu Asn Gln Leu Arg Arg Val Val Asn Ala Leu Ile Lys Arg His 500 505 510 Gly Lys Pro Arg His Ile Val Val Glu Leu Ala Arg Asp Leu Gln Leu 515 520 525 Ser Glu Lys Gln Lys Ala Asp Val Asn Arg Arg Ile Ala Lys Asn Thr 530 535 540 Arg Glu Ala Glu Gly Arg Ser Gln Lys Leu Ile Glu Met Gly Gln Leu 545 550 555 560 Asp Thr Gly Tyr Asn Arg Leu Leu Leu Lys Leu Trp Glu Glu Leu Asn 565 570 575 Gln Asp Lys Pro Glu Asp Arg Val Cys Ile Tyr Ser Gly Lys Pro Ile 580 585 590 Gly Ile Ala Met Leu Phe Ser Gly Glu Val Asp Ile Asp His Ile Leu 595 600 605 Pro Trp Ser Lys Thr Leu Asp Asp Ser Gln Ala Asn Lys Leu Leu Cys 610 615 620 Leu Lys Ser Ala Asn Arg Gln Lys Arg Asn Arg Thr Pro Ser Asp Val 625 630 635 640 Pro Glu Trp Arg Asp Cys Tyr Glu Glu Val Leu Ala Arg Ala Ala Arg 645 650 655 Leu Pro Lys Asn Lys Arg Trp Arg Phe Ala Ala Asp Ala Met Gln Gln 660 665 670 Phe Glu Ala Glu Gly Gly Phe Leu Ala Arg Gln Leu Thr Asp Thr Gln 675 680 685 Tyr Leu Ser Arg Met Ala Phe Glu Tyr Leu Ser Ala Leu Phe Pro Ser 690 695 700 Glu Glu Ala Asp Lys Trp Gly Glu Leu Arg Gln Arg Lys Arg Val His 705 710 715 720 Val Val Pro Gly Arg Leu Thr Glu Leu Leu Arg Arg Asn Trp Gly Leu 725 730 735 Asn Thr Leu Leu Pro Asp His Asn Leu Gly Glu Met Ala Gln Glu Lys 740 745 750 Asn Arg Lys Asp His Arg His His Ala Ile Asp Ala Ala Val Ile Gly 755 760 765 Val Thr Ser Arg Ser Leu Leu Gln Arg Met Ser Gly Ala Ala Ala Arg 770 775 780 Leu Asp Asp Val Ala Phe Asp Asp Leu Val Arg Thr Val Val Lys Asp 785 790 795 800 Asn Pro Pro Trp Pro Gly Phe Arg Glu Glu Leu Leu Gly Cys Ile Asn 805 810 815 Arg Val Thr Val Ser His Lys Pro Asp His Gly Thr Val Ser Arg Ala 820 825 830 Ala Tyr Ala Gln Gly Lys Gly Gln Thr Ala Gly Lys Leu His Asn Asp 835 840 845 Thr Ala Tyr Gly Ile Thr Gly Leu Gln Asp Met Lys Gly Ser Pro Leu 850 855 860 Val Val Arg Arg Lys Pro Phe Met Ala Leu Glu Val Lys Asp Ile Ala 865 870 875 880 Ser Ile Arg Asp Thr Glu Leu Gln Ser Ala Leu Tyr Asp Ala Ile Gly 885 890 895 Ser Leu Thr Glu Lys Lys Ala Leu Gln Glu Ala Leu Val Arg Phe Arg 900 905 910 Asp Arg His Pro Gln Phe Lys Gly Ile Arg Arg Val Arg Val Leu Glu 915 920 925 Ala Leu Ser Val Ile Pro Ile Val Asp Asn Asn Gly Lys Ala Tyr Lys 930 935 940 Gly Tyr Lys Gly Asp Ala Asn Tyr Arg Tyr Glu Val Trp Glu Thr Leu 945 950 955 960 Asp Gly Arg Trp His Thr Glu Val Val Ser Met Phe Asp Ala His Gln 965 970 975 Pro Gly Trp Gln Ser Pro Phe His Arg Gln His Pro Ala Ala Arg Arg 980 985 990 Val Leu Lys Leu Gln Gln Asn Asp Met Val Ala Tyr Glu His Pro Ala 995 1000 1005 Asp Gly Tyr Thr Ile Ala Arg Val Val Lys Phe Ser Asn Asp Lys 1010 1015 1020 Arg Ile Tyr Phe Ala Ser His Arg Glu Ser Gly Ser Leu Lys Ala 1025 1030 1035 Arg Asp Ala Asp Lys Gly Asp Pro Phe Thr Tyr Phe Ala Lys Ala 1040 1045 1050 Asn Asn Gly Leu Arg Asp Ile Lys Cys Arg Gln Val Arg Ile Asp 1055 1060 1065 Ala Ala Gly Arg Val Phe Asp Pro Gly Pro Gln Asp Arg Glu Ala 1070 1075 1080 Arg Gln Ser Lys Gly Arg Ala 1085 1090 <210> 17 <211> 31 <212> RNA <213> Rhizobium sp. <220> <221> source <223> /note="crRNA" <400> 17 gguugcggcu ggaccgcguu uucugaucug c 31 <210> 18 <211> 79 <212> RNA <213> Rhizobium sp. <220> <221> source <223> /note="tracrRNA" <400> 18 gcaaaucaga aaacgcgguc uggccguuaa caagccucga ccagcaccag auaaggcggu 60 cccuccgggg gccguuuuu 79 <210> 19 <211> 139 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(25) <223> a, c, u, g, unknown or other <400> 19 nnnnnnnnnn nnnnnnnnnn nnnnngguug cggcuggacc gcguuuucug aucugcaaag 60 gcaaaucaga aaacgcgguc uggccguuaa caagccucga ccagcaccag auaaggcggu 120 cccuccgggg gccguuuuu 139 <210> 20 <211> 144 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 20 gagcggacag cagcuuccua uaucucguac gguugcggcu ggaccgcguu uucugaucug 60 caaaggcaaa ucagaaaacg cggucuggcc guuaacaagc cucgaccagc accagauaag 120 gcggucccuc cgggggccgu uuuu 144 <210> 21 <211> 144 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 21 ccaugauaua gacguugugg cuguuguagu gguugcggcu ggaccgcguu uucugaucug 60 caaaggcaaa ucagaaaacg cggucuggcc guuaacaagc cucgaccagc accagauaag 120 gcggucccuc cgggggccgu uuuu 144 <210> 22 <211> 7 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (5)..(6) <223> a, c, t, g, unknown or other <400> 22 nnggnnc 7 <210> 23 <211> 6 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (2)..(2) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (4)..(5) <223> a, c, u, g, unknown or other <400> 23 angnnu 6 <210> 24 <211> 1108 <212> PRT <213> Brevibacillus sp. <220> <221> source <223> /note="APG09748" <400> 24 Met Ala Ile Arg Ser Ile Lys Leu Lys Leu Lys Thr Arg Thr Gly Pro 1 5 10 15 Glu Ala Gln Asn Leu Arg Lys Gly Ile Trp Arg Thr His Arg Leu Leu 20 25 30 Asn Glu Gly Val Ala Tyr Tyr Met Lys Met Leu Leu Leu Phe Arg Gln 35 40 45 Glu Ser Thr Gly Gly Gln Thr Lys Lys Glu Leu Gln Glu Glu Leu Val 50 55 60 Arg His Ile Arg Glu Gln Gln Gln Lys Asn Arg Ala Asp Lys Asn Thr 65 70 75 80 Gln Ala Leu Pro Leu Asp Lys Ala Phe Ala Ala Leu Arg Gln Leu Tyr 85 90 95 Glu Leu Leu Val Pro Ser Ser Ile Gly Gln Ser Gly Asp Ala Gln Ile 100 105 110 Ile Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly 115 120 125 Gly Lys Gly Thr Ser Lys Ala Gly Ala Lys Pro Thr Trp Gln Lys Lys 130 135 140 Lys Glu Ala Asn Asp Pro Thr Trp Glu Gln Asp Tyr Glu Lys Trp Lys 145 150 155 160 Lys Arg Arg Glu Glu Asp Pro Thr Ala Ser Val Ile Thr Thr Leu Glu 165 170 175 Glu Tyr Gly Ile Arg Pro Ile Phe Pro Leu Tyr Thr Asn Thr Val Ala 180 185 190 Asp Ile Ala Trp Leu Pro Leu Gln Ser Asn Gln Phe Val Arg Thr Trp 195 200 205 Asp Arg Asp Met Leu Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu 210 215 220 Ser Trp Asn Lys Arg Val Gln Glu Glu Tyr Ser Lys Leu Gln Glu Lys 225 230 235 240 Met Thr Gln Leu Asn Glu Gln Leu Glu Gly Gly Gln Glu Trp Ile Ser 245 250 255 Leu Leu Glu Gln Tyr Glu Glu Gln Arg Glu Gln Glu Leu Ile Glu Asn 260 265 270 Met Thr Ala Ala Asn Asp Lys Tyr Arg Ile Thr Lys Arg Gln Met Lys 275 280 285 Gly Trp Asn Glu Leu Tyr Glu Gln Trp Ser Thr Val Leu Pro Asn Ala 290 295 300 Ser His Glu Gln Tyr Arg Glu Ala Leu Lys Arg Val Gln Gln Arg Leu 305 310 315 320 Arg Gly Arg Phe Gly Asp Ala His Phe Phe Gln Tyr Leu Met Lys Glu 325 330 335 Glu His His Leu Ile Trp Lys Gly Asn Pro Gln Arg Ile His Tyr Phe 340 345 350 Val Ala Arg Asn Glu Leu Lys Lys Arg Leu Glu Glu Ala Lys Gln Asn 355 360 365 Ala Thr Met Thr Leu Pro Asp Ala Arg Lys His Pro Leu Trp Val Arg 370 375 380 Phe Asp Ala Arg Gly Gly Asn Leu Gln Asp Tyr Tyr Leu Thr Ala Glu 385 390 395 400 Ala Asp Asn Pro Arg Ser Arg Arg Phe Val Thr Phe Ser Gln Leu Ile 405 410 415 Trp Pro Asn Glu Ser Gly Trp Met Glu Lys Gln Asp Val Glu Val Glu 420 425 430 Leu Ala Leu Ser Lys Gln Phe Tyr Gln Gln Val Thr Leu Gln Lys Asn 435 440 445 Asp Lys Gly Lys Gln Glu Ile Glu Phe Lys Asp Lys Gly Ser Gly Ser 450 455 460 Thr Phe Ser Gly His Leu Gly Gly Ala Lys Leu Gln Leu Glu Arg Gly 465 470 475 480 Asp Leu Glu Lys Glu Glu Lys Asp Phe Glu Gly Gly Glu Ile Gly Ser 485 490 495 Val Tyr Leu Asn Ile Val Ile Asp Phe Glu Pro Leu Gln Glu Val Lys 500 505 510 Asn Gly Arg Leu Gln Ser Pro Tyr Gly Gln Val Leu Gln Leu Val Arg 515 520 525 Arg Pro Asn Glu Phe Pro Lys Val Thr Thr Tyr Lys Ser Glu Glu Leu 530 535 540 Val Glu Trp Ile Lys Ser Ser Thr Lys Asp Ser Ala Gly Val Glu Ser 545 550 555 560 Leu Glu Ser Gly Phe Arg Val Met Ser Ile Asp Leu Gly Leu Arg Thr 565 570 575 Ala Ala Ala Thr Ser Ile Phe Ser Val Glu Glu Ser Asn Asp Ala Asn 580 585 590 Ala Ala Gly Phe Ser Tyr Trp Ile Glu Gly Thr Pro Leu Val Ala Val 595 600 605 His Lys Arg Ser Tyr Met Leu Lys Leu Pro Gly Glu Gln Val Glu Lys 610 615 620 Gln Val Arg Glu Lys Arg Asp Glu Arg Gln Asp Gln Gln Arg Arg Val 625 630 635 640 Arg Phe Gln Ile Arg Ile Leu Ser Gln Val Ile Arg Met Ala Lys Lys 645 650 655 Gln Asn Arg Glu Arg Ala Asp Glu Leu Asp His Leu Ser Gln Ala Leu 660 665 670 Glu Lys Gln Lys Ser Leu Leu Asp Gln Thr Asp Arg Thr Phe Trp Asn 675 680 685 Gly Ile Val Cys Asp Leu Thr Asp Ala Leu Arg Glu Lys Glu Gly Gly 690 695 700 Trp Glu Gln Ala Val Val Gln Ile His Arg Lys Ala Glu Glu His Val 705 710 715 720 Gly Lys Val Val Gln Ala Trp Arg Lys Arg Phe Asp Ala Asp Glu Arg 725 730 735 Lys Gly Ile Ala Gly Leu Ser Met Trp Ser Ile Glu Glu Leu Asp Ser 740 745 750 Leu Arg Lys Leu Leu Ile Ser Trp Ser Arg Arg Thr Arg Asn Pro Arg 755 760 765 Glu Ile Asn Cys Phe Glu Gln Gly His Thr Ser His Gln Arg Leu Leu 770 775 780 Thr His Ile Gln Asn Val Lys Glu Asp Arg Leu Lys Gln Leu Ser His 785 790 795 800 Ala Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Glu Lys Lys Leu 805 810 815 Glu Trp Phe Ala Lys Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asn 820 825 830 Leu Ser Gln Tyr Arg Ser Asn Met Asp Arg Ser Thr Lys Glu Asn Ser 835 840 845 Thr Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val His Met 850 855 860 Gln Ala Glu Pro Tyr Gly Ile Gln Ile Gly Asp Val Arg Ala Glu Tyr 865 870 875 880 Ser Ser Arg Phe His Ala Lys Thr Gly Thr Pro Gly Ile Arg Cys Lys 885 890 895 Met Val Ser Gly His Asp Leu Gln Gly Arg Arg Phe Glu Asn Leu Gln 900 905 910 Lys Arg Leu Ile Ser Glu Gln Phe Leu Thr Glu Glu Gln Val Lys Gln 915 920 925 Leu Arg Pro Gly Asp Ile Val Pro Asp Asp Ser Gly Glu Trp Phe Met 930 935 940 Thr Leu Ser Asp Gly Ser Glu Gly Lys Glu Val Val Phe Leu Gln Ala 945 950 955 960 Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln Arg Tyr 965 970 975 Asn Glu Leu Phe Lys Val Ser Cys Arg Val Leu Ile Arg Gly Glu Glu 980 985 990 Glu Tyr Leu Ile Pro Lys Thr Lys Ser Val Gln Ala Lys Leu Gly Lys 995 1000 1005 Gly Leu Phe Val Lys Lys Thr Asp Thr Val Met Lys Asp Val Tyr 1010 1015 1020 Val Trp Asp Ser Gln Ala Lys Leu Lys Gly Lys Thr Thr Phe Thr 1025 1030 1035 Glu Glu Ser Glu Ser Pro Glu Gln Leu Glu Asp Phe Gln Glu Ile 1040 1045 1050 Ile Glu Glu Ala Glu Glu Ala Lys Gly Thr Tyr Arg Thr Leu Phe 1055 1060 1065 Arg Asp Pro Ser Gly Val Phe Phe Pro Glu Phe Val Trp Ser Thr 1070 1075 1080 Gln Lys Asp Phe Trp Ser Glu Val Lys Arg Arg Leu Tyr Gly Lys 1085 1090 1095 Leu Arg Glu Arg Phe Leu Met Lys Thr Arg 1100 1105 <210> 25 <211> 22 <212> RNA <213> Brevibacillus sp. <220> <221> source <223> /note="crRNA" <400> 25 uggaaagcuu cgagguuagc ac 22 <210> 26 <211> 95 <212> RNA <213> Brevibacillus sp. <220> <221> source <223> /note="tracrRNA" <400> 26 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaagu 95 <210> 27 <211> 151 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (132)..(151) <223> a, c, u, g, unknown or other <400> 27 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cnnnnnnnnn nnnnnnnnnn n 151 <210> 28 <211> 145 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 28 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacguacg 120 agauauagga agcugcuguc cgcuc 145 <210> 29 <211> 145 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 29 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacacuac 120 aacagccaca acgucuauau caugg 145 <210> 30 <211> 4 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (4)..(4) <223> a, c, t, g, unknown or other <400> 30 dttn 4 <210> 31 <211> 4 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 31 aaaa 4 <210> 32 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(8) <223> a, c, t, g, unknown or other <400> 32 nnnnnnnngt acgagatata ggaagctgct gtccgctc 38 <210> 33 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(8) <223> a, c, t, g, unknown or other <400> 33 nnnnnnnnac tacaacagcc acaacgtcta tatcatg 37 <210> 34 <211> 4 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (4)..(4) <223> a, c, t, g, unknown or other <400> 34 dttn 4 <210> 35 <211> 1429 <212> PRT <213> Chryseobacterium sp. <220> <221> source <223> /note="APG00771" <400> 35 Met Thr Lys Asn Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly 1 5 10 15 Trp Ala Leu Ile Lys Gln Asp Phe Glu Asn Lys Gln Gly Glu Ile Leu 20 25 30 Gly Met Gly Ser Arg Ile Ile Pro Met Asp Ala Gly Asp Met Gly Lys 35 40 45 Phe Ala Glu Gly Ala Thr Val Ser Lys Thr Ala Asp Arg Thr Lys Tyr 50 55 60 Arg Ser Val Arg Arg Leu Arg Glu Arg Phe Leu Leu Arg Arg Glu Arg 65 70 75 80 Leu His Arg Val Leu His Leu Leu Asn Phe Leu Pro Gln His Tyr Ala 85 90 95 Ser Gln Ile Asp Phe Glu Lys Arg Phe Gly Lys Phe Lys Val Glu Thr 100 105 110 Glu Pro Lys Leu Ala Trp Lys Asn Ile Glu Gly Lys Phe Ser Phe Leu 115 120 125 Phe Gln Asn Ser Phe Asn Glu Met Leu Glu Asp Phe Lys Ala Asn Glu 130 135 140 Gln Asp Leu Lys Ile Pro Tyr Asp Trp Thr Ile Tyr Phe Leu Arg Lys 145 150 155 160 Lys Ala Leu Ser Gln Lys Ile Glu Lys Glu Glu Leu Ala Trp Ile Leu 165 170 175 Leu Asn Phe Asn Gln Lys Arg Gly Tyr Tyr Gln Leu Arg Gly Glu Glu 180 185 190 Glu Glu Glu Asn Pro Asn Lys Leu Val Glu Phe Tyr Ser Leu Lys Val 195 200 205 Val Asp Val Leu Ala Asp Glu Pro Gln Lys Gly Lys Ser Glu Ile Trp 210 215 220 Tyr Ser Leu Val Leu Lys Asn Gly Trp Ile Tyr Arg Arg Ala Ser Lys 225 230 235 240 Ile Pro Leu Phe Glu Trp Lys Asp Lys Thr Arg Asp Phe Ile Val Thr 245 250 255 Thr Asp Leu Asn Asp Asp Gly Ser Ile Lys Lys Asp Lys Asp Gly Asn 260 265 270 Glu Lys Arg Ser Phe Arg Ala Pro Gly Glu Asn Asp Trp Thr Leu Val 275 280 285 Lys Lys Lys Thr Glu Gln Glu Ile Glu Gln Ser His Lys Thr Val Gly 290 295 300 Thr Tyr Ile Tyr Glu Thr Leu Leu Leu Asn Pro Lys Gln Lys Ile Lys 305 310 315 320 Gly Lys Leu Val Arg Thr Ile Glu Arg Lys Phe Tyr Lys Asp Glu Leu 325 330 335 Lys Gln Ile Leu Glu Lys Gln Lys Glu Phe His Gln Glu Leu Gln Asn 340 345 350 Asp Asp Leu Tyr Asn Asp Cys Ile Arg Glu Leu Tyr Arg Asn Asn Glu 355 360 365 Ala His Gln Leu Thr Leu Ser Lys Lys Asp Phe Val His Leu Leu Met 370 375 380 Asp Asp Leu Ile Phe Tyr Gln Arg Pro Leu Arg Ser Gln Lys Ser Ser 385 390 395 400 Ile Ser Asn Cys Thr Leu Glu Phe Arg Lys Tyr Lys Asp Glu Asn Gly 405 410 415 Ile Glu His Thr Gln Tyr Leu Lys Ala Ile Pro Lys Ser Asn Pro Tyr 420 425 430 Tyr Gln Glu Phe Arg Leu Trp Gln Trp Ile Tyr Asn Leu Asn Ile Tyr 435 440 445 Arg Lys Asp Asp Glu Val Asn Val Thr Lys Asp Phe Leu Asn Thr Thr 450 455 460 Lys Glu Phe Glu Asn Leu Phe Glu Phe Leu Asn Ser Arg Lys Glu Val 465 470 475 480 Asp Gln Lys Ala Leu Leu Lys Tyr Phe Lys Leu Asn Glu Lys Thr His 485 490 495 Arg Trp Asn Phe Val Glu Asp Lys Lys Tyr Pro Cys Asn Glu Thr Lys 500 505 510 Thr Met Ile Ser Ser Arg Leu Asp Lys Val Glu Asn Ile Ser Asp Asp 515 520 525 Phe Leu Thr Arg Asn Ile Glu Gln Lys Ile Trp His Ile Ile Tyr Ser 530 535 540 Val Asn Asp Lys Ile Glu Tyr Glu Lys Ala Leu Lys Ser Phe Ala Arg 545 550 555 560 Lys His His Leu Asp Glu Thr Ser Phe Phe Glu Ala Phe Arg Lys Phe 565 570 575 Pro Pro Phe Lys Ser Glu Tyr Gly Ser Phe Ser Glu Lys Ala Ile Lys 580 585 590 Lys Leu Leu Pro Leu Met Arg Leu Gly Lys Tyr Trp Asn Tyr Ala Asp 595 600 605 Ile Asp Lys Tyr Ser Arg Glu Arg Ile Gln Lys Ile Ile Thr Gly Glu 610 615 620 Tyr Asp Glu Asn Ile Lys Asp Lys Ile Arg Glu Lys Ala Ile His Leu 625 630 635 640 Thr Lys Glu Asn Asp Phe Gln Gly Leu Gln Leu Trp Leu Ala Gln Tyr 645 650 655 Leu Val Tyr Gly Arg His Ser Glu Ala Ser Met Ile Gly Lys Trp Asn 660 665 670 Ser Ala Asp Asp Leu Glu Val Phe Leu Lys Asp Phe Lys Gln His Ser 675 680 685 Leu Arg Asn Pro Ile Val Glu Gln Val Ile Thr Glu Thr Leu Arg Val 690 695 700 Val Lys Asp Ile Trp Leu Lys Tyr Gly Asn Gly Thr Lys Asp Phe Phe 705 710 715 720 Asn Glu Ile His Ile Glu Leu Gly Arg Glu Met Lys Leu Pro Ala Asp 725 730 735 Asp Arg Lys Lys Leu Thr Ser Gln Ile Ser Glu Asn Glu Asn Thr Asn 740 745 750 Leu Arg Ile Lys Ala Leu Leu Ala Glu Met Ile Asn Asp His Ser Val 755 760 765 Glu Asn Val Arg Pro Phe Ser Pro Met Gln Gln Glu Ile Leu Lys Ile 770 775 780 Tyr Glu Asp Gly Val Leu Asn Ser Asp Ile Glu Ile Glu Asp Asp Ile 785 790 795 800 Leu Lys Ile Ser Lys Thr Ala Gln Pro Ser Pro Ser Asp Leu Lys Arg 805 810 815 Tyr Lys Leu Trp Leu Glu Gln Lys Tyr Lys Ser Pro Tyr Thr Gly Gln 820 825 830 Ile Ile Pro Leu Asn Lys Leu Phe Thr Pro Glu Tyr Glu Ile Glu His 835 840 845 Ile Ile Pro Gln Ser Arg Tyr Phe Asp Asp Ser Phe Ser Asn Lys Val 850 855 860 Ile Cys Glu Ser Ala Val Asn Lys Leu Lys Asp Asn Tyr Ile Gly Leu 865 870 875 880 Glu Phe Ile Lys Lys Leu Gly Gly Thr Val Val Glu Cys Gly Asn Gly 885 890 895 Lys Ser Val Thr Val Leu Lys Glu Asp Gln Tyr Glu Asp Phe Val Lys 900 905 910 Lys His Tyr Ala Asn Asn Arg Gly Lys Arg Asn Lys Leu Leu Met Glu 915 920 925 Asp Ile Pro Glu Lys Met Ile Glu Arg Gln Leu Asn Asp Thr Arg Tyr 930 935 940 Ile Ser Lys Tyr Ile Ser Gly Val Leu Ser Asn Ile Val Arg Val Glu 945 950 955 960 Asp Gly Ser Asp Glu Gly Ile Asn Ser Lys Asn Ile Val Pro Gly Asn 965 970 975 Gly Lys Ile Thr Ser Gln Leu Lys Gln Asp Trp Gly Leu Asn Asp Val 980 985 990 Trp Asn Asp Leu Ile Leu Pro Arg Phe Glu Arg Met Asn Gln Leu Thr 995 1000 1005 Asn Ser Thr Asp Phe Thr Ala Trp Asn Glu Asn Tyr Gln Lys Phe 1010 1015 1020 Leu Pro Thr Val Pro Ile Glu Tyr Ser Lys Gly Phe Ser Lys Lys 1025 1030 1035 Arg Ile Asp His Arg His His Ala Leu Asp Ala Leu Val Ile Ala 1040 1045 1050 Cys Ala Thr Lys Asp His Val Asn Leu Leu Asn Asn Gln Ser Ala 1055 1060 1065 Lys Ser Asp Thr Lys Arg Tyr Asp Leu Lys Lys Lys Leu Met Lys 1070 1075 1080 Phe Glu Lys Val Val Tyr His His Thr Gln Thr Gly Glu Lys Ile 1085 1090 1095 Glu Arg Glu Ile Pro Arg Gln Phe Leu Lys Pro Trp Glu Asn Phe 1100 1105 1110 Thr Val Asp Ala Lys His Asn Leu Glu Ser Ile Ile Val Ser Phe 1115 1120 1125 Lys Gln Asn Leu Arg Val Ile Asn Lys Ala Thr Asn Tyr Tyr Glu 1130 1135 1140 Lys Tyr Val Glu Lys Asp Gly Thr Lys Asn Lys Glu Arg Val Glu 1145 1150 1155 Gln Thr Gly Thr Asn Trp Ala Ile Arg Lys Pro Met His Lys Asp 1160 1165 1170 Thr Val Ser Gly Lys Val Asp Leu Pro Trp Val Lys Val Pro Lys 1175 1180 1185 Gly Lys Ile Leu Thr Ala Thr Arg Lys Ser Leu Asp Thr Ser Phe 1190 1195 1200 Asp Leu Lys Ser Ile Gly Ser Ile Thr Asp Thr Gly Ile Gln Lys 1205 1210 1215 Ile Leu Lys Asn Tyr Leu Ala Phe Lys Asp Gly Asn Pro Glu Met 1220 1225 1230 Ala Phe Ser Pro Glu Gly Ile Asp Asp Leu Asn Lys Asn Ile Glu 1235 1240 1245 Lys Tyr Asn Asp Gly Lys Pro His Gln Pro Ile Asn Lys Val Arg 1250 1255 1260 Val Phe Glu Leu Gly Ser Lys Phe Gln Val Gly Gln Thr Gly Asn 1265 1270 1275 Lys Lys Asp Lys Tyr Val Glu Ala Ala Lys Gly Thr Asn Leu Phe 1280 1285 1290 Phe Ala Val Tyr Glu Asp Glu Lys Gly Lys Arg Ser Tyr Glu Thr 1295 1300 1305 Ile Pro Leu Asn Glu Val Ile Glu Arg Gln Lys Gln Gly Leu Ser 1310 1315 1320 Val Val Asp Leu Lys Asp Thr Asn Asp Phe Tyr Leu Cys Pro Asn 1325 1330 1335 Asp Leu Val Tyr Ile Pro Ser Gly Asp Glu Leu Glu Asn Val Asn 1340 1345 1350 Asn Val Asp Phe Lys Asp Ile Lys Lys Asp Lys Asn Glu Arg Ile 1355 1360 1365 Tyr Lys Val Val Ser Phe Ser Gly Ser Gln Ile Phe Phe Val Arg 1370 1375 1380 Gln Asp Ile Ala Thr Phe Ile Val Asn Lys Ala Glu Leu Ser Thr 1385 1390 1395 Leu Asn Lys Met Glu Arg Ala Ile Asp Gly Ser Met Ile Lys Glu 1400 1405 1410 Asn Cys Ile Lys Leu Asn Ile Asp Arg Leu Gly Asn Ile Ser Lys 1415 1420 1425 Ala <210> 36 <211> 20 <212> RNA <213> Chryseobacterium sp. <220> <221> source <223> /note="crRNA" <400> 36 guugugaauu gcuuucaaaa 20 <210> 37 <211> 76 <212> RNA <213> Chryseobacterium sp. <220> <221> source <223> /note="tracrRNA" <400> 37 uuuugaaagc aauucacaau aaggauuauu ccguugugaa aacauucaag gcggggcaac 60 ucgccuuuuu ucguuu 76 <210> 38 <211> 125 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(25) <223> a, c, u, g, unknown or other <400> 38 nnnnnnnnnn nnnnnnnnnn nnnnnguugu gaauugcuuu caaaaaaagu uuugaaagca 60 auucacaaua aggauuauuc cguugugaaa acauucaagg cggggcaacu cgccuuuuuu 120 cguuu 125 <210> 39 <211> 130 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 39 gagcggacag cagcuuccua uaucucguac guugugaauu gcuuucaaaa aaaguuuuga 60 aagcaauuca caauaaggau uauuccguug ugaaaacauu caaggcgggg caacucgccu 120 uuuuucguuu 130 <210> 40 <211> 130 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 40 ccaugauaua gacguugugg cuguuguagu guugugaauu gcuuucaaaa aaaguuuuga 60 aagcaauuca caauaaggau uauuccguug ugaaaacauu caaggcgggg caacucgccu 120 uuuuucguuu 130 <210> 41 <211> 6 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <400> 41 nnraat 6 <210> 42 <211> 6 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (2)..(2) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (4)..(5) <223> a, c, u, g, unknown or other <400> 42 unanna 6 <210> 43 <211> 1112 <212> PRT <213> Bacillus sp. <220> <221> source <223> /note="APG02789" <400> 43 Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr 1 5 10 15 Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile 20 25 30 Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln 35 40 45 Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile 50 55 60 Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His 65 70 75 80 Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu 85 90 95 Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly 100 105 110 Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys 115 120 125 Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu 130 135 140 Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg 145 150 155 160 Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr 165 170 175 Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile 180 185 190 Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys 195 200 205 Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp 210 215 220 Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu 225 230 235 240 Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys 245 250 255 Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala 260 265 270 Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly 275 280 285 Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser 290 295 300 Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser 305 310 315 320 Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu 325 330 335 Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala 340 345 350 Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala 355 360 365 Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr 370 375 380 Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys 385 390 395 400 Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser 405 410 415 Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro 420 425 430 Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly 435 440 445 Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp 450 455 460 Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys 465 470 475 480 Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe 485 490 495 Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg 500 505 510 Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe 515 520 525 Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn 530 535 540 Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly 545 550 555 560 Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val 565 570 575 Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys 580 585 590 Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg 595 600 605 Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys 610 615 620 Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln 625 630 635 640 Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro 645 650 655 Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser 660 665 670 Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu 675 680 685 Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu 690 695 700 Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile 705 710 715 720 Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala 725 730 735 Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu 740 745 750 Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg 755 760 765 Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln 770 775 780 Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met 785 790 795 800 Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys 805 810 815 Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn 820 825 830 Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser 835 840 845 Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met 850 855 860 Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr 865 870 875 880 Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His 885 890 895 Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg 900 905 910 Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys 915 920 925 Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu 930 935 940 Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile 945 950 955 960 His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln 965 970 975 Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly 980 985 990 Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys 995 1000 1005 Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu 1010 1015 1020 Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp 1025 1030 1035 Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser 1040 1045 1050 Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr 1055 1060 1065 Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp 1070 1075 1080 Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys 1085 1090 1095 Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu 1100 1105 1110 <210> 44 <211> 36 <212> RNA <213> Bacillus sp. <220> <221> source <223> /note="crRNA" <400> 44 gccugaauac uuagcagaaa uaaugaugau uggcac 36 <210> 45 <211> 100 <212> RNA <213> Bacillus sp. <220> <221> source <223> /note="tracrRNA" <400> 45 auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60 uacccaccac aggauuaucu uauuucugcu aaguguuuag 100 <210> 46 <211> 160 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (141)..(160) <223> a, c, u, g, unknown or other <400> 46 auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60 uacccaccac aggauuaucu uauuucugcu aaguguuuag aaaggccuga auacuuagca 120 gaaauaauga ugauuggcac nnnnnnnnnn nnnnnnnnnn 160 <210> 47 <211> 170 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 47 auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60 uacccaccac aggauuaucu uauuucugcu aaguguuuag aaaggccuga auacuuagca 120 gaaauaauga ugauuggcac guacgagaua uaggaagcug cuguccgcuc 170 <210> 48 <211> 170 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 48 auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60 uacccaccac aggauuaucu uauuucugcu aaguguuuag aaaggccuga auacuuagca 120 gaaauaauga ugauuggcac acuacaacag ccacaacguc uauaucaugg 170 <210> 49 <211> 4 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (4)..(4) <223> a, c, t, g, unknown or other <400> 49 attn 4 <210> 50 <211> 1108 <212> PRT <213> Brevibacillus sp. <220> <221> source <223> /note="APG09106" <400> 50 Met Ala Ile Arg Ser Ile Lys Leu Lys Leu Lys Thr Arg Thr Gly Pro 1 5 10 15 Glu Ala Gln Asn Leu Arg Lys Gly Ile Trp Arg Thr His Arg Leu Leu 20 25 30 Asn Glu Gly Val Ala Tyr Tyr Met Lys Met Leu Leu Leu Phe Arg Gln 35 40 45 Glu Ser Thr Gly Gly Gln Thr Lys Lys Glu Leu Gln Glu Glu Leu Val 50 55 60 Arg His Ile Arg Glu Gln Gln Gln Lys Asn Arg Ala Asp Lys Asn Thr 65 70 75 80 Gln Ala Leu Pro Leu Asp Lys Ala Phe Ala Ala Leu Arg Gln Leu Tyr 85 90 95 Glu Leu Leu Val Pro Ser Ser Ile Gly Gln Ser Gly Asp Ala Gln Ile 100 105 110 Ile Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly 115 120 125 Gly Lys Gly Thr Ser Lys Ala Gly Ala Lys Pro Thr Trp Gln Lys Lys 130 135 140 Lys Glu Ala Asn Asp Pro Thr Trp Glu Gln Asp Tyr Glu Lys Trp Lys 145 150 155 160 Lys Arg Arg Glu Glu Asp Pro Thr Ala Ser Val Ile Thr Thr Leu Glu 165 170 175 Glu Tyr Gly Ile Arg Pro Ile Phe Pro Leu Tyr Thr Asn Thr Val Ala 180 185 190 Asp Ile Ala Trp Leu Pro Leu Gln Ser Asn Gln Phe Val Arg Thr Trp 195 200 205 Asp Arg Asp Met Leu Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu 210 215 220 Ser Trp Asn Lys Arg Val Gln Glu Glu Tyr Ser Lys Leu Gln Glu Lys 225 230 235 240 Met Thr Gln Leu Asn Glu Gln Leu Glu Gly Gly Gln Glu Trp Ile Ser 245 250 255 Leu Leu Glu Gln Tyr Glu Glu Gln Arg Glu Gln Glu Leu Ile Glu Asn 260 265 270 Met Thr Ala Ala Asn Asp Lys Tyr Arg Ile Thr Lys Arg Gln Met Lys 275 280 285 Gly Trp Asn Glu Leu Tyr Glu Gln Trp Ser Thr Val Leu Pro Asn Ala 290 295 300 Ser His Glu Gln Tyr Arg Glu Ala Leu Lys Arg Val Gln Gln Arg Leu 305 310 315 320 Arg Gly Arg Phe Gly Asp Ala His Phe Phe Gln Tyr Leu Met Lys Glu 325 330 335 Glu His His Leu Ile Trp Lys Gly Asn Pro Gln Arg Ile His Tyr Phe 340 345 350 Val Ala Arg Asn Glu Leu Lys Lys Arg Leu Glu Glu Ala Lys Gln Asn 355 360 365 Ala Thr Met Thr Leu Pro Asp Ala Arg Lys His Pro Leu Trp Val Arg 370 375 380 Phe Asp Ala Arg Gly Gly Asn Leu Gln Asp Tyr Tyr Leu Thr Ala Glu 385 390 395 400 Ala Asp Asn Pro Arg Ser Arg Arg Phe Val Thr Phe Ser Gln Leu Ile 405 410 415 Trp Pro Asn Glu Ser Gly Trp Met Glu Lys Gln Asp Val Glu Val Glu 420 425 430 Leu Ala Leu Ser Lys Gln Phe Tyr Gln Gln Val Thr Leu Gln Lys Asn 435 440 445 Asp Lys Gly Lys Gln Glu Ile Glu Phe Lys Asp Lys Gly Ser Gly Ser 450 455 460 Thr Phe Ser Gly His Leu Gly Gly Ala Lys Leu Gln Leu Glu Arg Gly 465 470 475 480 Asp Leu Glu Lys Glu Glu Lys Asp Phe Glu Gly Gly Glu Ile Gly Ser 485 490 495 Val Tyr Leu Asn Ile Val Ile Asp Phe Glu Pro Leu Gln Glu Val Lys 500 505 510 Asn Gly Arg Leu Gln Ser Pro Tyr Gly Gln Val Leu Gln Leu Val Arg 515 520 525 Arg Pro Asn Glu Phe Pro Lys Val Thr Thr Tyr Lys Ser Glu Glu Leu 530 535 540 Val Glu Trp Met Lys Ala Ser Gln Asn His Ser Ser Gly Val Glu Ser 545 550 555 560 Leu Glu Ser Gly Phe Arg Val Met Ser Ile Asp Leu Gly Leu Arg Thr 565 570 575 Ala Ala Ala Thr Ser Ile Phe Ser Val Glu Glu Ser Asn Asp Ala Asn 580 585 590 Ala Ala Gly Phe Ser Tyr Trp Ile Glu Gly Thr Pro Leu Val Ala Val 595 600 605 His Lys Arg Ser Tyr Met Leu Lys Leu Pro Gly Glu Gln Val Glu Lys 610 615 620 Gln Val Arg Glu Lys Arg Asp Glu Arg Gln Asp Gln Gln Arg Arg Val 625 630 635 640 Arg Phe Gln Ile Arg Ile Leu Ser Gln Val Ile Arg Met Ala Lys Lys 645 650 655 Gln Asn Arg Glu Arg Ala Asp Glu Leu Asp His Leu Ser Gln Ala Leu 660 665 670 Glu Lys Gln Lys Ser Leu Leu Asp Gln Thr Asp Arg Thr Phe Trp Asn 675 680 685 Gly Ile Val Cys Asp Leu Thr Asp Ala Leu Arg Glu Lys Glu Gly Gly 690 695 700 Trp Glu Gln Ala Val Val Gln Ile His Arg Lys Ala Glu Glu His Val 705 710 715 720 Gly Lys Val Val Gln Ala Trp Arg Lys Arg Phe Asp Ala Asp Glu Arg 725 730 735 Lys Gly Ile Ala Gly Leu Ser Met Trp Ser Ile Glu Glu Leu Asp Ser 740 745 750 Leu Arg Lys Leu Leu Ile Ser Trp Ser Arg Arg Thr Arg Asn Pro Gln 755 760 765 Glu Ile Asn Arg Phe Glu Gln Gly His Thr Ser His Gln Arg Leu Leu 770 775 780 Thr His Ile Gln Asn Val Lys Glu Asp Arg Leu Lys Gln Leu Ser His 785 790 795 800 Ala Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Glu Lys Lys Leu 805 810 815 Glu Trp Phe Ala Lys Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asn 820 825 830 Leu Ser Gln Tyr Arg Ser His Met Asp Arg Ser Thr Lys Glu Asn Ser 835 840 845 Thr Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val His Met 850 855 860 Gln Ala Glu Pro Tyr Gly Ile Gln Ile Gly Asp Val Arg Ala Glu Tyr 865 870 875 880 Ser Ser Arg Phe His Ala Lys Thr Gly Thr Pro Gly Ile Arg Cys Lys 885 890 895 Met Val Lys Gly Gln Glu Leu Gln Gly Lys Arg Phe Glu Asn Leu Gln 900 905 910 Lys Arg Leu Val Ser Glu Gln Phe Leu Thr Glu Glu Gln Val Lys Gln 915 920 925 Leu Arg Pro Gly Asp Ile Val Pro Asp Asp Ser Gly Glu Trp Phe Met 930 935 940 Thr Leu Ser Asp Gly Ser Glu Gly Lys Glu Val Val Phe Leu Gln Ala 945 950 955 960 Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln Arg Tyr 965 970 975 Asn Glu Leu Phe Lys Val Ser Cys Arg Val Leu Ile Arg Gly Glu Glu 980 985 990 Glu Tyr Leu Ile Pro Lys Ala Lys Ser Val Gln Ala Lys Leu Gly Lys 995 1000 1005 Gly Leu Phe Val Lys Lys Thr Asp Thr Val Met Lys Asp Val Tyr 1010 1015 1020 Val Trp Asp Ser Gln Ala Lys Leu Lys Gly Lys Thr Thr Phe Thr 1025 1030 1035 Glu Glu Ser Glu Ser Pro Glu Gln Leu Glu Asp Phe Gln Glu Ile 1040 1045 1050 Ile Glu Glu Ala Glu Glu Ala Lys Gly Thr Tyr Arg Thr Leu Phe 1055 1060 1065 Arg Asp Pro Ser Gly Val Phe Phe Pro Glu Phe Val Trp Asn Thr 1070 1075 1080 Gln Lys Asp Phe Trp Ser Glu Val Lys Arg Arg Leu Tyr Gly Lys 1085 1090 1095 Leu Arg Glu Arg Phe Leu Met Lys Thr Arg 1100 1105 <210> 51 <211> 22 <212> RNA <213> Brevibacillus sp. <220> <221> source <223> /note="crRNA" <400> 51 uggaaagcuu cgagguuagc ac 22 <210> 52 <211> 105 <212> RNA <213> Brevibacillus sp. <220> <221> source <223> /note="tracrRNA" <400> 52 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugagu 105 <210> 53 <211> 151 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (132)..(151) <223> a, c, u, g, unknown or other <400> 53 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cnnnnnnnnn nnnnnnnnnn n 151 <210> 54 <211> 161 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 54 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cguacgagau auaggaagcu gcuguccgcu c 161 <210> 55 <211> 161 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 55 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cacuacaaca gccacaacgu cuauaucaug g 161 <210> 56 <211> 135 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 56 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcaccccgu 120 auaaagcaug agacc 135 <210> 57 <211> 135 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 57 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcaccucag 120 acuguuugcc ccuua 135 <210> 58 <211> 156 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 58 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca ccccguauaa agcaugagac cgugac 156 <210> 59 <211> 156 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 59 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca ccucagacug uuugccccuu acugcu 156 <210> 60 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 60 cccgtataaa gcatgagacc gtgac 25 <210> 61 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 61 ctcagactgt ttgcccctta ctgct 25 <210> 62 <211> 95 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 62 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaagu 95 <210> 63 <211> 16 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 63 gcuucguggc uagcac 16 <210> 64 <211> 135 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (116)..(135) <223> a, c, u, g, unknown or other <400> 64 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacnnnnn 120 nnnnnnnnnn nnnnn 135 <210> 65 <211> 135 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (116)..(135) <223> a, c, u, g, unknown or other <400> 65 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguaaaag cuucgagguu agcacnnnnn 120 nnnnnnnnnn nnnnn 135 <210> 66 <211> 144 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (125)..(144) <223> a, c, u, g, unknown or other <400> 66 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguuccaa aauggaaagc uucguggcua 120 gcacnnnnnn nnnnnnnnnn nnnn 144 <210> 67 <211> 30 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 67 gtacgagata taggaagctg ctgtccgctc 30 <210> 68 <211> 29 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 68 actacaacag ccacaacgtc tatatcatg 29 <210> 69 <211> 149 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 69 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cacuacaaca gccacaacg 149 <210> 70 <211> 151 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 70 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cguacgagau auaggaagcu g 151 <210> 71 <211> 151 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 71 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cacuacaaca gccacaacgu c 151 <210> 72 <211> 156 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 72 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cguacgagau auaggaagcu gcuguc 156 <210> 73 <211> 156 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 73 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120 gagguuagca cacuacaaca gccacaacgu cuauau 156 <210> 74 <211> 140 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 74 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagucac gaaguaaaag cuucgagguu agcacacuac 120 aacagccaca acgucuauau 140 <210> 75 <211> 149 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 75 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguuccaa aauggaaagc uucguggcua 120 gcacacuaca acagccacaa cgucuauau 149 <210> 76 <211> 140 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 76 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacacuac 120 aacagccaca acgucuauau 140 <210> 77 <211> 135 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 77 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacacuac 120 aacagccaca acguc 135 <210> 78 <211> 140 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 78 cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60 cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacguacg 120 agauauagga agcugcuguc 140 <210> 79 <211> 111 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 79 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacgg cucagcaggc accugccuca g 111 <210> 80 <211> 111 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 80 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacuu cuccccuggg aagcaucccu g 111 <210> 81 <211> 111 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 81 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacuu cauggagaaa auauucagaa u 111 <210> 82 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 82 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacug uuuggaguua cuuagggcca ugc 113 <210> 83 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 83 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacga gaugucccca gugaacucca aau 113 <210> 84 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 84 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcaccc ugucguugcc ccucccagau cau 113 <210> 85 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 85 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacgg aggcugagac aggagaguug cuu 113 <210> 86 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 86 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacau agccccccuu gagcacacag agg 113 <210> 87 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 87 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacgu ucacacgugu aaucccagca cuu 113 <210> 88 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 88 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacuu guuggucugg augcgcugac uga 113 <210> 89 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 89 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacga ugucugggcc ucuguacuuu gga 113 <210> 90 <211> 113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 90 gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60 ggagcaccug aaaacaggug cuuggcacgg ugugugcuga cccugaucuc ccu 113 <210> 91 <211> 25 <212> DNA <213> Homo sapiens <400> 91 acctctccag ggcgaactct gacac 25 <210> 92 <211> 25 <212> DNA <213> Homo sapiens <400> 92 tgtgtcagag ttcgccctgg agagg 25 <210> 93 <211> 25 <212> DNA <213> Homo sapiens <400> 93 gggaagtagg actgttggaa acggg 25 <210> 94 <211> 25 <212> DNA <213> Homo sapiens <400> 94 ccaacagtcc tacttccctg tttca 25 <210> 95 <211> 25 <212> DNA <213> Homo sapiens <400> 95 tctttggaca gtgtccatac tggtg 25 <210> 96 <211> 25 <212> DNA <213> Homo sapiens <400> 96 cgaggtgtgc tcaccagaat ggagt 25 <210> 97 <211> 25 <212> DNA <213> Homo sapiens <400> 97 tggtgagcac acctcgggac tgggc 25 <210> 98 <211> 25 <212> DNA <213> Homo sapiens <400> 98 tgaaagagtg atgcctccag gttgt 25 <210> 99 <211> 25 <212> DNA <213> Homo sapiens <400> 99 acccccgaat cgtgagtact gtcct 25 <210> 100 <211> 25 <212> DNA <213> Homo sapiens <400> 100 tgagaagggc caaggtattg tggca 25 <210> 101 <211> 25 <212> DNA <213> Homo sapiens <400> 101 ctgccacaat accttggccc ttctc 25 <210> 102 <211> 25 <212> DNA <213> Homo sapiens <400> 102 tctcagttcg ctgcgaccca tacac 25 <210> 103 <211> 25 <212> DNA <213> Homo sapiens <400> 103 ggtgtatggg tcgcagcgaa ctgag 25 <210> 104 <211> 25 <212> DNA <213> Homo sapiens <400> 104 gctgcgaccc atacacccaa aggat 25 <210> 105 <211> 25 <212> DNA <213> Homo sapiens <400> 105 ctctgcagat cactggggtg gatcc 25 <210> 106 <211> 25 <212> DNA <213> Homo sapiens <400> 106 gccgcgccct ctgcagatca ctggg 25 <210> 107 <211> 25 <212> DNA <213> Homo sapiens <400> 107 gctcctcacg cacctgctct ggttt 25 <210> 108 <211> 25 <212> DNA <213> Homo sapiens <400> 108 ataaggctgt gctgaccatc gacaa 25 <210> 109 <211> 25 <212> DNA <213> Homo sapiens <400> 109 aaggctgtgc tgaccatcga caaga 25 <210> 110 <211> 25 <212> DNA <213> Homo sapiens <400> 110 ttgtcgatgg tcagcacagc cttat 25 <210> 111 <211> 25 <212> DNA <213> Homo sapiens <400> 111 acctgccccg gtggctctgc tacac 25 <210> 112 <211> 25 <212> DNA <213> Homo sapiens <400> 112 ggctgcgctg ggtgtagcag agcca 25 <210> 113 <211> 25 <212> DNA <213> Homo sapiens <400> 113 tgccaatcgc gagcagcatc cagct 25 <210> 114 <211> 25 <212> DNA <213> Homo sapiens <400> 114 atgccggggg caccgatgct ggttt 25 <210> 115 <211> 25 <212> DNA <213> Homo sapiens <400> 115 ggtggctgag tggatggaga tgccg 25 <210> 116 <211> 25 <212> DNA <213> Homo sapiens <400> 116 ctccctctcc cagttaccat gaagt 25 <210> 117 <211> 25 <212> DNA <213> Homo sapiens <400> 117 tgacttcatg gtaactggga gaggg 25 <210> 118 <211> 25 <212> DNA <213> Homo sapiens <400> 118 aagaagtgca agacccggga gacgg 25 <210> 119 <211> 25 <212> DNA <213> Homo sapiens <400> 119 ctcccgggtc ttgcacttct tgatg 25 <210> 120 <211> 25 <212> DNA <213> Homo sapiens <400> 120 tgctgccagc acggttctgg actac 25 <210> 121 <211> 25 <212> DNA <213> Homo sapiens <400> 121 gcacggttct ggactacaca acacg 25 <210> 122 <211> 25 <212> DNA <213> Homo sapiens <400> 122 tgtagtccag aaccgtgctg gcagc 25 <210> 123 <211> 25 <212> DNA <213> Homo sapiens <400> 123 acggttctgg actacacaac acgca 25 <210> 124 <211> 25 <212> DNA <213> Homo sapiens <400> 124 cagtcacgga gcggttggcc ttcac 25 <210> 125 <211> 25 <212> DNA <213> Homo sapiens <400> 125 gggcatcttc gtggactaca gagct 25 <210> 126 <211> 25 <212> DNA <213> Homo sapiens <400> 126 gatccaccat gatggccctt ggctt 25 <210> 127 <211> 25 <212> DNA <213> Homo sapiens <400> 127 aggatccacc atgatggccc ttggc 25 <210> 128 <211> 25 <212> DNA <213> Homo sapiens <400> 128 ccggccacga gaatagcagc ccagg 25 <210> 129 <211> 25 <212> DNA <213> Homo sapiens <400> 129 cctgccagca gatctgagag ggagg 25 <210> 130 <211> 25 <212> DNA <213> Homo sapiens <400> 130 gatctgagag ggagggcagc caggc 25 <210> 131 <211> 25 <212> DNA <213> Homo sapiens <400> 131 gaggctcgcc acaaggagct ggagg 25 <210> 132 <211> 25 <212> DNA <213> Homo sapiens <400> 132 gctagagaag tccgaggctc gccac 25 <210> 133 <211> 25 <212> DNA <213> Homo sapiens <400> 133 actgctccta gtgtctgtca ggacc 25 <210> 134 <211> 25 <212> DNA <213> Homo sapiens <400> 134 ctcctagtgt ctgtcaggac ctgaa 25 <210> 135 <211> 25 <212> DNA <213> Homo sapiens <400> 135 cacttcaggt cctgacagac actag 25 <210> 136 <211> 25 <212> DNA <213> Homo sapiens <400> 136 cccttgagga cctgtgaaat ccaga 25 <210> 137 <211> 25 <212> DNA <213> Homo sapiens <400> 137 cacaggtcct caagggcaga agagt 25 <210> 138 <211> 25 <212> DNA <213> Homo sapiens <400> 138 gacctgagag tgggtgttgg acagt 25 <210> 139 <211> 25 <212> DNA <213> Homo sapiens <400> 139 tccaacaccc actctcaggt cacca 25 <210> 140 <211> 25 <212> DNA <213> Homo sapiens <400> 140 cagccatggg agccccttca cttca 25 <210> 141 <211> 25 <212> DNA <213> Homo sapiens <400> 141 gctgagtttg tgtgtgaatg gacac 25 <210> 142 <211> 25 <212> DNA <213> Homo sapiens <400> 142 tgatcaaacg ccccggcagg aagtg 25 <210> 143 <211> 25 <212> DNA <213> Homo sapiens <400> 143 gtcggcctca gcttttcact tcctg 25 <210> 144 <211> 25 <212> DNA <213> Homo sapiens <400> 144 aggccattcc caagaaacgg ggctg 25 <210> 145 <211> 25 <212> DNA <213> Homo sapiens <400> 145 cagccccgtt tcttgggaat ggcct 25 <210> 146 <211> 25 <212> DNA <213> Homo sapiens <400> 146 ccaagaaacg gggctgaaag ccggg 25 <210> 147 <211> 25 <212> DNA <213> Homo sapiens <400> 147 cccaggagga ggtccagctg gagat 25 <210> 148 <211> 25 <212> DNA <213> Homo sapiens <400> 148 cttccatctc cagctggacc tcctc 25 <210> 149 <211> 25 <212> DNA <213> Homo sapiens <400> 149 gctactgggt ggtgataatg gtgaa 25 <210> 150 <211> 25 <212> DNA <213> Homo sapiens <400> 150 tccttcacca ttatcaccac ccagt 25 <210> 151 <211> 25 <212> DNA <213> Homo sapiens <400> 151 ggctactggg tggtgataat ggtga 25 <210> 152 <211> 25 <212> DNA <213> Homo sapiens <400> 152 tcacggtttg ggggtataca tgggc 25 <210> 153 <211> 25 <212> DNA <213> Homo sapiens <400> 153 gcttagggtt accgaagagg ggcca 25 <210> 154 <211> 25 <212> DNA <213> Homo sapiens <400> 154 cacatttggc ttagggttac cgaag 25 <210> 155 <211> 25 <212> DNA <213> Homo sapiens <400> 155 ggcttagggt taccgaagag gggcc 25 <210> 156 <211> 25 <212> DNA <213> Homo sapiens <400> 156 gctcagggtt actgaagagg ggcca 25 <210> 157 <211> 25 <212> DNA <213> Homo sapiens <400> 157 cacatttggc tcagggttac tgaag 25 <210> 158 <211> 25 <212> DNA <213> Homo sapiens <400> 158 ggctcagggt tactgaagag gggcc 25 <210> 159 <211> 20 <212> DNA <213> Homo sapiens <400> 159 cctaaaggaa atgactgcag 20 <210> 160 <211> 25 <212> DNA <213> Homo sapiens <400> 160 aggaccatca ccccctagac tatag 25 <210> 161 <211> 25 <212> DNA <213> Homo sapiens <400> 161 catcaccccc tagactatag ttagc 25 <210> 162 <211> 20 <212> DNA <213> Homo sapiens <400> 162 acttcgtcta ttcccagatc 20 <210> 163 <211> 25 <212> DNA <213> Homo sapiens <400> 163 ctagtagggg ctggtgacag tcaat 25 <210> 164 <211> 25 <212> DNA <213> Homo sapiens <400> 164 attgtggact gcatcttagc cctag 25 <210> 165 <211> 20 <212> DNA <213> Homo sapiens <400> 165 tggactgcat cttagcccta 20 <210> 166 <211> 25 <212> DNA <213> Homo sapiens <400> 166 acagcccagc ctacctaccc aaaat 25 <210> 167 <211> 25 <212> DNA <213> Homo sapiens <400> 167 tgggtaggta ggctgggctg tgggt 25 <210> 168 <211> 25 <212> DNA <213> Homo sapiens <400> 168 attttgggta ggtaggctgg gctgt 25 <210> 169 <211> 25 <212> DNA <213> Homo sapiens <400> 169 ttgctcattg acctccactc agtgt 25 <210> 170 <211> 25 <212> DNA <213> Homo sapiens <400> 170 ccgtccattt aactggaatc cgacc 25 <210> 171 <211> 25 <212> DNA <213> Homo sapiens <400> 171 ttctaacccc cacccccact gccgg 25 <210> 172 <211> 25 <212> DNA <213> Homo sapiens <400> 172 cccccactgc cgggtaaggg tgtca 25 <210> 173 <211> 25 <212> DNA <213> Homo sapiens <400> 173 taacccccac ccccactgcc gggta 25 <210> 174 <211> 25 <212> DNA <213> Homo sapiens <400> 174 ttgctcgttg atctccactc agtgt 25 <210> 175 <211> 25 <212> DNA <213> Homo sapiens <400> 175 gcagcatctt cttccgggtc atctt 25 <210> 176 <211> 25 <212> DNA <213> Homo sapiens <400> 176 ggacctacac aagcagcatc ttctt 25 <210> 177 <211> 25 <212> DNA <213> Homo sapiens <400> 177 tccaccacgg ctgtcgacac caatc 25 <210> 178 <211> 25 <212> DNA <213> Homo sapiens <400> 178 gctgtcgaca ccaatcccaa ggaat 25 <210> 179 <211> 20 <212> DNA <213> Homo sapiens <400> 179 caccacggct gtcgacacca 20 <210> 180 <211> 25 <212> DNA <213> Homo sapiens <400> 180 accacggctg tcgacaccaa tccca 25 <210> 181 <211> 25 <212> DNA <213> Homo sapiens <400> 181 actccaaagg ctttcctcca ctgtt 25 <210> 182 <211> 20 <212> DNA <213> Homo sapiens <400> 182 caacagtgga ggaaagcctt 20 <210> 183 <211> 25 <212> DNA <213> Homo sapiens <400> 183 catcccgtac tcccacgacc agata 25 <210> 184 <211> 25 <212> DNA <213> Homo sapiens <400> 184 ctatctggtc gtgggagtac gggat 25 <210> 185 <211> 25 <212> DNA <213> Homo sapiens <400> 185 aagcagcagg aagcagaccc aggag 25 <210> 186 <211> 25 <212> DNA <213> Homo sapiens <400> 186 tcaaataagc agcaggaagc agacc 25 <210> 187 <211> 20 <212> DNA <213> Homo sapiens <400> 187 aaataagcag caggaagcag 20 <210> 188 <211> 25 <212> DNA <213> Homo sapiens <400> 188 cctgggtctg cttcctgctg cttat 25 <210> 189 <211> 25 <212> DNA <213> Homo sapiens <400> 189 tgggccaaga ctccacctat atcga 25 <210> 190 <211> 25 <212> DNA <213> Homo sapiens <400> 190 ggctttcctc gatataggtg gagtc 25 <210> 191 <211> 20 <212> DNA <213> Homo sapiens <400> 191 ctcgatatag gtggagtctt 20 <210> 192 <211> 25 <212> DNA <213> Homo sapiens <400> 192 tattcaccgg cccgctgatg gtccc 25 <210> 193 <211> 25 <212> DNA <213> Homo sapiens <400> 193 agccctcagt gcagccagat attca 25 <210> 194 <211> 25 <212> DNA <213> Homo sapiens <400> 194 gatattcacc ggcccgctga tggtc 25 <210> 195 <211> 25 <212> DNA <213> Homo sapiens <400> 195 cttcctcccg acgcagatga gcccg 25 <210> 196 <211> 25 <212> DNA <213> Homo sapiens <400> 196 gccactggga gcgctggcgt ggaca 25 <210> 197 <211> 25 <212> DNA <213> Homo sapiens <400> 197 tagacagagg acaatggctt ccatg 25 <210> 198 <211> 25 <212> DNA <213> Homo sapiens <400> 198 gacagaggac aatggcttcc atggt 25 <210> 199 <211> 25 <212> DNA <213> Homo sapiens <400> 199 tggttgtgca gccagatgcc tagac 25 <210> 200 <211> 25 <212> DNA <213> Homo sapiens <400> 200 atagctgtgt ggtgcttctg tggtg 25 <210> 201 <211> 25 <212> DNA <213> Homo sapiens <400> 201 tcttgctcac tttggacctt ggtgg 25 <210> 202 <211> 25 <212> DNA <213> Homo sapiens <400> 202 cccgacttac agccagtaat gtcac 25 <210> 203 <211> 25 <212> DNA <213> Homo sapiens <400> 203 ctggctgtaa gtcgggcttt cttca 25 <210> 204 <211> 25 <212> DNA <213> Homo sapiens <400> 204 agcaacctcc agtggtgacc agaat 25 <210> 205 <211> 25 <212> DNA <213> Homo sapiens <400> 205 ctgcaagcaa cctccagtgg tgacc 25 <210> 206 <211> 25 <212> DNA <213> Homo sapiens <400> 206 tcagaaaaac tggctcgaga gctcc 25 <210> 207 <211> 20 <212> DNA <213> Homo sapiens <400> 207 aggagctctc gagccagttt 20 <210> 208 <211> 25 <212> DNA <213> Homo sapiens <400> 208 attagtcaga ggaaggttga gccca 25 <210> 209 <211> 25 <212> DNA <213> Homo sapiens <400> 209 ctcaaccttc ctctgactaa tggtg 25 <210> 210 <211> 20 <212> DNA <213> Homo sapiens <400> 210 gtcagaggaa ggttgagccc 20 <210> 211 <211> 25 <212> DNA <213> Homo sapiens <400> 211 agtggctccg aaggcaccgt cttct 25 <210> 212 <211> 25 <212> DNA <213> Homo sapiens <400> 212 gggtctgttt gaacatggag aacac 25 <210> 213 <211> 25 <212> DNA <213> Homo sapiens <400> 213 gaaagatcta gctcaccgtc ctctt 25 <210> 214 <211> 25 <212> DNA <213> Homo sapiens <400> 214 agtacaccac cgtcggccac atgga 25 <210> 215 <211> 25 <212> DNA <213> Homo sapiens <400> 215 cgctcagtac accaccgtcg gccac 25 <210> 216 <211> 25 <212> DNA <213> Homo sapiens <400> 216 tgcaagccca ccttggtcca tgtgg 25 <210> 217 <211> 25 <212> DNA <213> Homo sapiens <400> 217 ttcagccctg ggacacatga tggag 25 <210> 218 <211> 25 <212> DNA <213> Homo sapiens <400> 218 ttccctccat catgtgtccc agggc 25 <210> 219 <211> 25 <212> DNA <213> Homo sapiens <400> 219 ttcagccctg ggacacatga tggag 25 <210> 220 <211> 25 <212> DNA <213> Homo sapiens <400> 220 ggaagtggtt ggacaagtaa gcgcc 25 <210> 221 <211> 25 <212> DNA <213> Homo sapiens <400> 221 ggcgcttact tgtccaacca cttcc 25 <210> 222 <211> 25 <212> DNA <213> Homo sapiens <400> 222 caaactgaaa tctgtaagca ggcgg 25 <210> 223 <211> 25 <212> DNA <213> Homo sapiens <400> 223 cccgcctgct tacagatttc agttt 25 <210> 224 <211> 25 <212> DNA <213> Homo sapiens <400> 224 tggcaggcat cattggtcag atcca 25 <210> 225 <211> 25 <212> DNA <213> Homo sapiens <400> 225 ccagcaccat cactcgccgg gctgt 25 <210> 226 <211> 25 <212> DNA <213> Homo sapiens <400> 226 tgccagcacc atcactcgcc gggct 25 <210> 227 <211> 25 <212> DNA <213> Homo sapiens <400> 227 atgcccccga agcccctctc caccg 25 <210> 228 <211> 25 <212> DNA <213> Homo sapiens <400> 228 cgcaaaagct gtgatcttct ccttc 25 <210> 229 <211> 25 <212> DNA <213> Homo sapiens <400> 229 aagcccctct ccaccgcaaa agctg 25 <210> 230 <211> 25 <212> DNA <213> Homo sapiens <400> 230 aaaggaccgc aatgtggcca cccca 25 <210> 231 <211> 25 <212> DNA <213> Homo sapiens <400> 231 caccccaaga gactactact ttgct 25 <210> 232 <211> 25 <212> DNA <213> Homo sapiens <400> 232 tggggtggcc acattgcggt ccttt 25 <210> 233 <211> 25 <212> DNA <213> Homo sapiens <400> 233 gtaatggtgt ggctgtactc tccaa 25 <210> 234 <211> 20 <212> DNA <213> Homo sapiens <400> 234 gagagtacag ccacaccatt 20 <210> 235 <211> 25 <212> DNA <213> Homo sapiens <400> 235 tatcacttac ggatcacaga ggggg 25 <210> 236 <211> 25 <212> DNA <213> Homo sapiens <400> 236 gtgacagagc tggtttcaaa gttgc 25 <210> 237 <211> 25 <212> DNA <213> Homo sapiens <400> 237 gcgaagatgg cttggatgag tggcc 25 <210> 238 <211> 25 <212> DNA <213> Homo sapiens <400> 238 cttggatgag tggccgcagc gctgt 25 <210> 239 <211> 25 <212> DNA <213> Homo sapiens <400> 239 cctgtggcag agttccctga agcca 25 <210> 240 <211> 25 <212> DNA <213> Homo sapiens <400> 240 tcagggaact ctgccacagg tgagc 25 <210> 241 <211> 25 <212> DNA <213> Homo sapiens <400> 241 cctgaagcca tcaaggggct gcagc 25 <210> 242 <211> 25 <212> DNA <213> Homo sapiens <400> 242 tcgccatcgc tgtagaacgc accac 25 <210> 243 <211> 25 <212> DNA <213> Homo sapiens <400> 243 gtccaagcag cgccactgtg ggaga 25 <210> 244 <211> 25 <212> DNA <213> Homo sapiens <400> 244 tttactctcc cacagtggcg ctgct 25 <210> 245 <211> 25 <212> DNA <213> Homo sapiens <400> 245 cctccaattc aggacccaca tgacg 25 <210> 246 <211> 25 <212> DNA <213> Homo sapiens <400> 246 ctccaattca ggacccacat gacgg 25 <210> 247 <211> 25 <212> DNA <213> Homo sapiens <400> 247 agtgctcccc gcaccggccc atcct 25 <210> 248 <211> 25 <212> DNA <213> Homo sapiens <400> 248 ctgcccccac agagtgctcc ccgca 25 <210> 249 <211> 25 <212> DNA <213> Homo sapiens <400> 249 gaccaagcag ccatgccagt acttc 25 <210> 250 <211> 25 <212> DNA <213> Homo sapiens <400> 250 atctcctcct catcctccag cctct 25 <210> 251 <211> 25 <212> DNA <213> Homo sapiens <400> 251 gacaacaaga tgccccctga ggcct 25 <210> 252 <211> 25 <212> DNA <213> Homo sapiens <400> 252 ctggggctgc ttactactac caatg 25 <210> 253 <211> 25 <212> DNA <213> Homo sapiens <400> 253 gacaagatgt ggaggctgac ccatg 25 <210> 254 <211> 25 <212> DNA <213> Homo sapiens <400> 254 ctggggctgc ttactactac caatg 25 <210> 255 <211> 25 <212> DNA <213> Homo sapiens <400> 255 gggggctggt ttgccatcca agggg 25 <210> 256 <211> 25 <212> DNA <213> Homo sapiens <400> 256 aatgaacatc cctgtccggc caatt 25 <210> 257 <211> 25 <212> DNA <213> Homo sapiens <400> 257 gccggacagg gatgttcatt gtgat 25 <210> 258 <211> 25 <212> DNA <213> Homo sapiens <400> 258 aatcacaatg aacatccctg tccgg 25 <210> 259 <211> 25 <212> DNA <213> Homo sapiens <400> 259 gattactgtg acctgtatgg agggg 25 <210> 260 <211> 25 <212> DNA <213> Homo sapiens <400> 260 gccattttgg ctgagttggt ccagt 25 <210> 261 <211> 25 <212> DNA <213> Homo sapiens <400> 261 tttggctgag ttggtccggt attac 25 <210> 262 <211> 25 <212> DNA <213> Homo sapiens <400> 262 gccactttgg ctgagttggt ccggt 25 <210> 263 <211> 25 <212> DNA <213> Homo sapiens <400> 263 ttggctgagt tggtccggta ttaca 25 <210> 264 <211> 25 <212> DNA <213> Homo sapiens <400> 264 ccgcagatga ggagcagctc taggc 25 <210> 265 <211> 25 <212> DNA <213> Homo sapiens <400> 265 agctctaggc cgaagtgtcg caggc 25 <210> 266 <211> 25 <212> DNA <213> Homo sapiens <400> 266 tacgtcctca gctgggacta gcagc 25 <210> 267 <211> 25 <212> DNA <213> Homo sapiens <400> 267 gactagcagc tcaacctcgc ctatg 25 <210> 268 <211> 25 <212> DNA <213> Homo sapiens <400> 268 agctgctagt cccagctgag gacgt 25 <210> 269 <211> 25 <212> DNA <213> Homo sapiens <400> 269 tctctcctgg gcatcaaggg agtcc 25 <210> 270 <211> 25 <212> DNA <213> Homo sapiens <400> 270 ttggactccc ttgatgccca ggaga 25 <210> 271 <211> 25 <212> DNA <213> Homo sapiens <400> 271 aatgactgtg atccacattc cccct 25 <210> 272 <211> 20 <212> DNA <213> Homo sapiens <400> 272 cctaccctga aaatccgaaa 20 <210> 273 <211> 25 <212> DNA <213> Homo sapiens <400> 273 cacacactct gcaccttgaa ggctg 25 <210> 274 <211> 25 <212> DNA <213> Homo sapiens <400> 274 gcaccttgaa ggctgacaag tcatc 25 <210> 275 <211> 25 <212> DNA <213> Homo sapiens <400> 275 tagtagcaca cactctgcac cttga 25 <210> 276 <211> 25 <212> DNA <213> Homo sapiens <400> 276 ttggtgctct cctccgtggc cacgc 25 <210> 277 <211> 25 <212> DNA <213> Homo sapiens <400> 277 agcatcgatg tcaacgaggg caacc 25 <210> 278 <211> 25 <212> DNA <213> Homo sapiens <400> 278 ccctcgttga catcgatgct tgaga 25 <210> 279 <211> 25 <212> DNA <213> Homo sapiens <400> 279 gggggctgag cagcagtgcg ccctt 25 <210> 280 <211> 25 <212> DNA <213> Homo sapiens <400> 280 agctgctttt ccggggtttc cgctg 25 <210> 281 <211> 25 <212> DNA <213> Homo sapiens <400> 281 gacagcggaa accccggaaa agcag 25 <210> 282 <211> 25 <212> DNA <213> Homo sapiens <400> 282 gtggaacttc tgtactacaa cgctg 25 <210> 283 <211> 25 <212> DNA <213> Homo sapiens <400> 283 gtctcagcag gatctctcac cgtag 25 <210> 284 <211> 25 <212> DNA <213> Homo sapiens <400> 284 acctgagtgt tttagctacg gtgag 25 <210> 285 <211> 25 <212> DNA <213> Homo sapiens <400> 285 gtggagctga ccagggagga gacct 25 <210> 286 <211> 25 <212> DNA <213> Homo sapiens <400> 286 tgaccaggga ggagaccttc aaata 25 <210> 287 <211> 20 <212> DNA <213> Homo sapiens <400> 287 gaaggtctcc tccctggtca 20 <210> 288 <211> 25 <212> DNA <213> Homo sapiens <400> 288 gtggagctga ccagggagga gacct 25 <210> 289 <211> 25 <212> DNA <213> Homo sapiens <400> 289 cgctggttct gccggctgat tcagc 25 <210> 290 <211> 25 <212> DNA <213> Homo sapiens <400> 290 ctgctgaatc agccggcaga accag 25 <210> 291 <211> 25 <212> DNA <213> Homo sapiens <400> 291 ggatgggtgg agagcaagtt ggtca 25 <210> 292 <211> 25 <212> DNA <213> Homo sapiens <400> 292 tgcaggagct tcgaggcact gtggc 25 <210> 293 <211> 25 <212> DNA <213> Homo sapiens <400> 293 atgctggatg tgctgcagga gcttc 25 <210> 294 <211> 25 <212> DNA <213> Homo sapiens <400> 294 ctgccatatt gtgtgcccgc actcg 25 <210> 295 <211> 25 <212> DNA <213> Homo sapiens <400> 295 gggggcccgg ctgctttttc gagtg 25 <210> 296 <211> 20 <212> DNA <213> Homo sapiens <400> 296 tgtgcccgca ctcgaaaaag 20 <210> 297 <211> 25 <212> DNA <213> Homo sapiens <400> 297 ctcagaggtc agggagggtc cagac 25 <210> 298 <211> 20 <212> DNA <213> Homo sapiens <400> 298 cttgggactg taaaagctgt 20 <210> 299 <211> 25 <212> DNA <213> Homo sapiens <400> 299 gtaagtgatc catcctaggt tggca 25 <210> 300 <211> 20 <212> DNA <213> Homo sapiens <400> 300 gtaagtgatc catcctaggt 20 <210> 301 <211> 25 <212> DNA <213> Homo sapiens <400> 301 gccccctcac cttggacagt gagat 25 <210> 302 <211> 25 <212> DNA <213> Homo sapiens <400> 302 cttcaatctc actgtccaag gtgag 25 <210> 303 <211> 25 <212> DNA <213> Homo sapiens <400> 303 tttaacgaag ccctccgtga gagct 25 <210> 304 <211> 20 <212> DNA <213> Homo sapiens <400> 304 aacgaagccc tccgtgagag 20 <210> 305 <211> 20 <212> DNA <213> Homo sapiens <400> 305 caagaatctg accatcttgg 20 <210> 306 <211> 25 <212> DNA <213> Homo sapiens <400> 306 actgtgggag ttctcgtccg tgacc 25 <210> 307 <211> 20 <212> DNA <213> Homo sapiens <400> 307 tcgtccgtga cctgggagcc 20 <210> 308 <211> 25 <212> DNA <213> Homo sapiens <400> 308 cagatgaaca ctggtcagcg taggg 25 <210> 309 <211> 20 <212> DNA <213> Homo sapiens <400> 309 acagatgaac actggtcagc 20 <210> 310 <211> 25 <212> DNA <213> Homo sapiens <400> 310 cagaacatcc ttgggggcta caggt 25 <210> 311 <211> 25 <212> DNA <213> Homo sapiens <400> 311 gccagcatgg ctgccagaac atcct 25 <210> 312 <211> 25 <212> DNA <213> Homo sapiens <400> 312 cggaacctgt gaggaggttg gcact 25 <210> 313 <211> 25 <212> DNA <213> Homo sapiens <400> 313 gttgacatcg gaacctgtga ggagg 25 <210> 314 <211> 20 <212> DNA <213> Homo sapiens <400> 314 tcagtgccaa cctcctcaca 20 <210> 315 <211> 25 <212> DNA <213> Homo sapiens <400> 315 cggaacctgt gaggaggttg gcact 25 <210> 316 <211> 25 <212> DNA <213> Homo sapiens <400> 316 taggcgatgg agcctggggg ttcgg 25 <210> 317 <211> 25 <212> DNA <213> Homo sapiens <400> 317 ggtaggcgat ggagcctggg ggttc 25 <210> 318 <211> 25 <212> DNA <213> Homo sapiens <400> 318 gactggggaa ctcccgacaa gatca 25 <210> 319 <211> 25 <212> DNA <213> Homo sapiens <400> 319 gggaactccc gacaagatca agaaa 25 <210> 320 <211> 20 <212> DNA <213> Homo sapiens <400> 320 ttgatcttgt cgggagttcc 20 <210> 321 <211> 25 <212> DNA <213> Homo sapiens <400> 321 tcccgacaag atcaagaaag ggggc 25 <210> 322 <211> 25 <212> DNA <213> Homo sapiens <400> 322 ctgagcaccc tgtacagctt cttcc 25 <210> 323 <211> 3 <212> DNA <213> Streptococcus pyogenes <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <400> 323 ngg 3 <210> 324 <211> 5 <212> DNA <213> Staphylococcus aureus <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <400> 324 ngrrt 5 <210> 325 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 325 Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg 1 5 10 15 Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg 20 25 30 Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys 35 40 45 Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys 50 55 60 Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys 85 90 95 Thr Val Tyr Tyr Gly Ala Pro Arg Leu Ser Ala Gly Ser Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val 115 120 125 Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe 130 135 140 Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln 145 150 155 160 Ala Gln Met Asn Asp Leu Asn Glu Ile 165 <210> 326 <211> 1254 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 326 Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg 1 5 10 15 Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg 20 25 30 Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys 35 40 45 Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys 50 55 60 Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys 85 90 95 Thr Val Tyr Tyr Gly Ala Pro Arg Leu Ser Ala Gly Ser Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val 115 120 125 Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe 130 135 140 Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln 145 150 155 160 Ala Gln Met Asn Asp Leu Asn Glu Ile Ser Gly Ser Glu Thr Pro Gly 165 170 175 Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly 180 185 190 Ser Ser Met Lys Gln Thr Ser Tyr Ser Leu Gly Leu Ala Ile Gly Ile 195 200 205 Ala Ser Val Gly Tyr Gly Leu Ile Asp Asn Asp Glu Asn Ile Val Asp 210 215 220 Ala Gly Val Arg Leu Phe Pro Glu Ala Asn Ser Lys Asn Asn Asp Gly 225 230 235 240 Arg Arg Lys Ser Arg Gly Ser Lys Arg Leu Ile Arg Arg Lys Arg His 245 250 255 Arg Ile Ala Arg Val Lys His Leu Leu Lys Glu Ser Gly Ile Asp Val 260 265 270 Ser Tyr Glu Asn Thr Val Leu Thr Asn Pro Tyr Glu Ile Arg Cys Lys 275 280 285 Gly Leu Thr Leu Pro Leu Thr Asn His Glu Leu Ser Ile Ala Leu Leu 290 295 300 His Leu Ala Lys Arg Arg Gly Val His Asn Val Lys Ser Met Asp Gln 305 310 315 320 Glu Lys Val Lys Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Thr Ile 325 330 335 Asn Asp Asn Leu Leu Glu Glu Lys Phe Ile Cys Glu Leu Gln Leu Glu 340 345 350 Arg Leu Asn Lys Glu Gly Ile Val Arg Ser His Ser Asn Arg Phe Lys 355 360 365 Thr Ala Asp Tyr Ile Lys Glu Ile Lys Asn Leu Leu Glu Thr Gln Ala 370 375 380 Lys Gln Asn Thr Leu Val Thr Glu Glu Phe Ile Glu Lys Tyr Ile Glu 385 390 395 400 Ile Phe Ser Gly Arg Arg Lys Tyr Tyr Glu Gly Pro Gly Gly Glu Ser 405 410 415 Lys Tyr Gly Trp Lys Gly Asp Ile Glu Lys Trp Tyr Glu Gly Leu Met 420 425 430 Gly Lys Cys Thr Tyr Phe Pro Lys Glu Leu Arg Cys Val Lys His Ala 435 440 445 Tyr Ser Ala Ala Leu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Ser 450 455 460 Ile Asn Arg Glu Glu Asp Thr Lys Leu Ser Gln Tyr Glu Lys Glu Gln 465 470 475 480 Ile Ile Glu Lys Ile Phe Lys Val Arg Lys Thr Pro Thr Leu Thr Gln 485 490 495 Ile Ala Lys Leu Leu Lys Val Asp Pro Thr Asn Ile Lys Gly Phe Arg 500 505 510 Thr Lys Ala Asn Gly Thr Pro Asp Phe Leu Ser Ile Lys Ile Tyr His 515 520 525 Asp Leu Lys Gly Ile Ile Asp Asp Lys Gln Leu Leu Asp Asp Ile Ala 530 535 540 Phe Leu Asp Asn Val Ala Gln Ile Leu Thr Val Trp Gln Asp Ser Gln 545 550 555 560 Ser Ile Gln Glu Lys Leu Lys Thr Leu Asn Lys Asn Leu Asp Asp Lys 565 570 575 Thr Ile Lys Glu Ile Ser Glu Leu Lys Lys Tyr Thr Gln Thr His Ser 580 585 590 Leu Ser Leu Lys Leu Ile Asn Val Leu Leu Pro Glu Leu Trp Glu Thr 595 600 605 Thr Lys Asn Gln Met Thr Ile Leu Ser Glu Leu Lys Leu Lys Pro Arg 610 615 620 Lys Ile Asp Leu His Asn Cys Asn Glu Ile Pro Val Asn Met Ile Asn 625 630 635 640 Asp Leu Ile Val Ser Pro Val Val Arg Arg Ser Leu Thr Gln Ser Ile 645 650 655 Glu Met Ile Asn Gln Ile Ile Lys Asp Tyr Gly His Pro Arg Glu Ile 660 665 670 Val Ile Glu Leu Ala Arg Glu Lys Asn Ser Glu Glu Lys Lys Asn Phe 675 680 685 Ile Lys Ser Leu Asn Glu Lys Asn Lys Gln Ile Asn Asp Glu Val Ile 690 695 700 Glu Lys Leu Asn Ala Ser Asn His Arg Asp Asn Lys Gly Met Phe Asn 705 710 715 720 Lys Val Lys Leu Trp Ile Leu Gln Asp Gly His Cys Leu Tyr Ser Leu 725 730 735 Lys Pro Ile Arg Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu 740 745 750 Ile Asp Ala Ile Ile Pro Lys Ser Val Ser Phe Asp Asp Ser Met Ser 755 760 765 Asn Lys Val Leu Val Tyr Gln Ile Glu Asn Ser Lys Lys Gly Asn Arg 770 775 780 Thr Pro Tyr Gln Tyr Leu Thr Ser Ala Asp Lys Thr Ile Thr Tyr Glu 785 790 795 800 Lys Phe Lys Ala Asn Ile Thr Gln Leu Ala Lys Ser Asn His Lys Ile 805 810 815 Ser Lys Lys Lys Leu Asp Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg 820 825 830 Phe His Ile Lys Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg 835 840 845 Tyr Ala Thr Arg Ser Leu Ile Asn Leu Leu Lys Tyr Tyr Phe Ser Glu 850 855 860 Lys Asp Ile Asn Val Lys Val Lys Ser Ile Asn Gly Ser Phe Thr Asp 865 870 875 880 Tyr Leu Arg Lys Leu Trp Asn Phe Pro Lys Asp Arg Glu Phe Tyr His 885 890 895 Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Met Ala Asn Lys Ile 900 905 910 Phe Thr Thr Arg Lys Ile Phe Lys Glu Gln Asn Ser Val Phe Ser Asp 915 920 925 Glu Gln Ile Leu Asp Gly Glu Val Thr Asn Ile Leu Ser Asp Asp Gln 930 935 940 Phe Gln Ala Glu Phe Thr Glu Lys Phe Tyr Lys Val Gln Ala Ile Lys 945 950 955 960 Lys Tyr Asp Lys Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn 965 970 975 Arg Gln Leu Phe Asp Asp Thr Leu Tyr Ser Thr Arg Glu Phe Glu Gly 980 985 990 Glu Glu Tyr Tyr Ile Gly Lys Ile Lys Asp Ile Tyr Asn Leu Lys Asp 995 1000 1005 Lys Arg Leu Lys Lys Ile Phe Thr Lys Ser Pro Glu Lys Ile Leu 1010 1015 1020 Met Tyr Gln His Asp Ser Gln Thr Phe Lys Lys Leu Lys Gln Ile 1025 1030 1035 Met Arg Ser Tyr Glu Asp Glu Val Asn Pro Leu Ala Lys Tyr His 1040 1045 1050 Lys Glu Thr Gly Glu Tyr Leu Arg Lys Glu Cys Lys Lys Gly Asn 1055 1060 1065 Gly Pro Ile Val Lys Ser Leu Lys Tyr Arg Val Thr Lys Leu Gly 1070 1075 1080 Val His Lys Asp Ile Thr His Lys Tyr Glu Asn Ser Lys Asn Lys 1085 1090 1095 Val Val Ile Leu Ser Leu Lys Pro Phe Arg Met Asp Val Phe Lys 1100 1105 1110 Glu Asn Gly Val Tyr Lys Phe Ile Thr Ile Arg Tyr Cys Asp Leu 1115 1120 1125 Lys Glu Thr Val Asn Ser Tyr Thr Ile Ser Glu His Leu Tyr Lys 1130 1135 1140 Ala Lys Leu Lys Ala Lys Asp Ile Lys Ser Met Asp Ser Phe Lys 1145 1150 1155 Trp Ser Phe Tyr Lys Asn Asp Leu Leu Glu Tyr Asn Gly Glu Leu 1160 1165 1170 Cys Thr Phe Lys Gly Val Asn Asp Asp Lys Lys Asn Lys Ile Glu 1175 1180 1185 Val Asn Trp Val Glu Lys Asn Phe Ala Ile Tyr Ala Glu Lys Lys 1190 1195 1200 Asn Leu Lys Ser Lys Gln Leu Val Lys Ser Ile Thr Lys Ser Thr 1205 1210 1215 Val Lys Ser Leu Leu Lys Tyr Thr Thr Asp Ile Leu Gly Asn Arg 1220 1225 1230 Tyr Pro Val Arg Asn Glu Lys Leu Lys Leu Met Ile Arg Lys Gln 1235 1240 1245 Thr Phe Arg Gly Asp Leu 1250 <210> 327 <211> 1060 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 327 Met Lys Gln Thr Ser Tyr Ser Leu Gly Leu Ala Ile Gly Ile Ala Ser 1 5 10 15 Val Gly Tyr Gly Leu Ile Asp Asn Asp Glu Asn Ile Val Asp Ala Gly 20 25 30 Val Arg Leu Phe Pro Glu Ala Asn Ser Lys Asn Asn Asp Gly Arg Arg 35 40 45 Lys Ser Arg Gly Ser Lys Arg Leu Ile Arg Arg Lys Arg His Arg Ile 50 55 60 Ala Arg Val Lys His Leu Leu Lys Glu Ser Gly Ile Asp Val Ser Tyr 65 70 75 80 Glu Asn Thr Val Leu Thr Asn Pro Tyr Glu Ile Arg Cys Lys Gly Leu 85 90 95 Thr Leu Pro Leu Thr Asn His Glu Leu Ser Ile Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Lys Ser Met Asp Gln Glu Lys 115 120 125 Val Lys Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Thr Ile Asn Asp 130 135 140 Asn Leu Leu Glu Glu Lys Phe Ile Cys Glu Leu Gln Leu Glu Arg Leu 145 150 155 160 Asn Lys Glu Gly Ile Val Arg Ser His Ser Asn Arg Phe Lys Thr Ala 165 170 175 Asp Tyr Ile Lys Glu Ile Lys Asn Leu Leu Glu Thr Gln Ala Lys Gln 180 185 190 Asn Thr Leu Val Thr Glu Glu Phe Ile Glu Lys Tyr Ile Glu Ile Phe 195 200 205 Ser Gly Arg Arg Lys Tyr Tyr Glu Gly Pro Gly Gly Glu Ser Lys Tyr 210 215 220 Gly Trp Lys Gly Asp Ile Glu Lys Trp Tyr Glu Gly Leu Met Gly Lys 225 230 235 240 Cys Thr Tyr Phe Pro Lys Glu Leu Arg Cys Val Lys His Ala Tyr Ser 245 250 255 Ala Ala Leu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Ser Ile Asn 260 265 270 Arg Glu Glu Asp Thr Lys Leu Ser Gln Tyr Glu Lys Glu Gln Ile Ile 275 280 285 Glu Lys Ile Phe Lys Val Arg Lys Thr Pro Thr Leu Thr Gln Ile Ala 290 295 300 Lys Leu Leu Lys Val Asp Pro Thr Asn Ile Lys Gly Phe Arg Thr Lys 305 310 315 320 Ala Asn Gly Thr Pro Asp Phe Leu Ser Ile Lys Ile Tyr His Asp Leu 325 330 335 Lys Gly Ile Ile Asp Asp Lys Gln Leu Leu Asp Asp Ile Ala Phe Leu 340 345 350 Asp Asn Val Ala Gln Ile Leu Thr Val Trp Gln Asp Ser Gln Ser Ile 355 360 365 Gln Glu Lys Leu Lys Thr Leu Asn Lys Asn Leu Asp Asp Lys Thr Ile 370 375 380 Lys Glu Ile Ser Glu Leu Lys Lys Tyr Thr Gln Thr His Ser Leu Ser 385 390 395 400 Leu Lys Leu Ile Asn Val Leu Leu Pro Glu Leu Trp Glu Thr Thr Lys 405 410 415 Asn Gln Met Thr Ile Leu Ser Glu Leu Lys Leu Lys Pro Arg Lys Ile 420 425 430 Asp Leu His Asn Cys Asn Glu Ile Pro Val Asn Met Ile Asn Asp Leu 435 440 445 Ile Val Ser Pro Val Val Arg Arg Ser Leu Thr Gln Ser Ile Glu Met 450 455 460 Ile Asn Gln Ile Ile Lys Asp Tyr Gly His Pro Arg Glu Ile Val Ile 465 470 475 480 Glu Leu Ala Arg Glu Lys Asn Ser Glu Glu Lys Lys Asn Phe Ile Lys 485 490 495 Ser Leu Asn Glu Lys Asn Lys Gln Ile Asn Asp Glu Val Ile Glu Lys 500 505 510 Leu Asn Ala Ser Asn His Arg Asp Asn Lys Gly Met Phe Asn Lys Val 515 520 525 Lys Leu Trp Ile Leu Gln Asp Gly His Cys Leu Tyr Ser Leu Lys Pro 530 535 540 Ile Arg Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Ile Asp 545 550 555 560 Ala Ile Ile Pro Lys Ser Val Ser Phe Asp Asp Ser Met Ser Asn Lys 565 570 575 Val Leu Val Tyr Gln Ile Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro 580 585 590 Tyr Gln Tyr Leu Thr Ser Ala Asp Lys Thr Ile Thr Tyr Glu Lys Phe 595 600 605 Lys Ala Asn Ile Thr Gln Leu Ala Lys Ser Asn His Lys Ile Ser Lys 610 615 620 Lys Lys Leu Asp Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe His 625 630 635 640 Ile Lys Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala 645 650 655 Thr Arg Ser Leu Ile Asn Leu Leu Lys Tyr Tyr Phe Ser Glu Lys Asp 660 665 670 Ile Asn Val Lys Val Lys Ser Ile Asn Gly Ser Phe Thr Asp Tyr Leu 675 680 685 Arg Lys Leu Trp Asn Phe Pro Lys Asp Arg Glu Phe Tyr His Lys His 690 695 700 His Ala Glu Asp Ala Leu Ile Ile Ala Met Ala Asn Lys Ile Phe Thr 705 710 715 720 Thr Arg Lys Ile Phe Lys Glu Gln Asn Ser Val Phe Ser Asp Glu Gln 725 730 735 Ile Leu Asp Gly Glu Val Thr Asn Ile Leu Ser Asp Asp Gln Phe Gln 740 745 750 Ala Glu Phe Thr Glu Lys Phe Tyr Lys Val Gln Ala Ile Lys Lys Tyr 755 760 765 Asp Lys Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln 770 775 780 Leu Phe Asp Asp Thr Leu Tyr Ser Thr Arg Glu Phe Glu Gly Glu Glu 785 790 795 800 Tyr Tyr Ile Gly Lys Ile Lys Asp Ile Tyr Asn Leu Lys Asp Lys Arg 805 810 815 Leu Lys Lys Ile Phe Thr Lys Ser Pro Glu Lys Ile Leu Met Tyr Gln 820 825 830 His Asp Ser Gln Thr Phe Lys Lys Leu Lys Gln Ile Met Arg Ser Tyr 835 840 845 Glu Asp Glu Val Asn Pro Leu Ala Lys Tyr His Lys Glu Thr Gly Glu 850 855 860 Tyr Leu Arg Lys Glu Cys Lys Lys Gly Asn Gly Pro Ile Val Lys Ser 865 870 875 880 Leu Lys Tyr Arg Val Thr Lys Leu Gly Val His Lys Asp Ile Thr His 885 890 895 Lys Tyr Glu Asn Ser Lys Asn Lys Val Val Ile Leu Ser Leu Lys Pro 900 905 910 Phe Arg Met Asp Val Phe Lys Glu Asn Gly Val Tyr Lys Phe Ile Thr 915 920 925 Ile Arg Tyr Cys Asp Leu Lys Glu Thr Val Asn Ser Tyr Thr Ile Ser 930 935 940 Glu His Leu Tyr Lys Ala Lys Leu Lys Ala Lys Asp Ile Lys Ser Met 945 950 955 960 Asp Ser Phe Lys Trp Ser Phe Tyr Lys Asn Asp Leu Leu Glu Tyr Asn 965 970 975 Gly Glu Leu Cys Thr Phe Lys Gly Val Asn Asp Asp Lys Lys Asn Lys 980 985 990 Ile Glu Val Asn Trp Val Glu Lys Asn Phe Ala Ile Tyr Ala Glu Lys 995 1000 1005 Lys Asn Leu Lys Ser Lys Gln Leu Val Lys Ser Ile Thr Lys Ser 1010 1015 1020 Thr Val Lys Ser Leu Leu Lys Tyr Thr Thr Asp Ile Leu Gly Asn 1025 1030 1035 Arg Tyr Pro Val Arg Asn Glu Lys Leu Lys Leu Met Ile Arg Lys 1040 1045 1050 Gln Thr Phe Arg Gly Asp Leu 1055 1060 <210> 328 <211> 15 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 328 gactccttca ccaag 15 <210> 329 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 329 gtagatcagc accg 14 <210> 330 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 330 ctctgggccg aagt 14 <210> 331 <211> 14 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 331 ctctaggccg aagt 14 <210> 332 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 332 acttcctcca gcc 13 <210> 333 <211> 13 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 333 gaaccccggc tta 13 <210> 334 <211> 203 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 334 tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 60 caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 120 ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 180 gggaggtcta tataagcaga gct 203 <210> 335 <211> 304 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 335 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300 catg 304 <210> 336 <211> 318 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 336 tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60 gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120 gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180 tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240 gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300 tggaaaggac gaaacacc 318 <210> 337 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 337 ggagcagctc taggccgaag tgtcgcaggc c 31 <210> 338 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 338 agaacaactc taggcagagg tctcaaaggc t 31 <210> 339 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 339 ggagcagctc taggccgaag tgtcgcaggc c 31 <210> 340 <211> 20 <212> DNA <213> Homo sapiens <400> 340 aagactaacc tggccaacat 20 <210> 341 <211> 20 <212> DNA <213> Homo sapiens <400> 341 gtcttgaact ccggacctca 20 <210> 342 <211> 20 <212> DNA <213> Homo sapiens <400> 342 gccgggcgtg gtgtcgcgcg 20 <210> 343 <211> 20 <212> DNA <213> Homo sapiens <400> 343 tcctgccgca gcctctggag 20 <210> 344 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 344 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacaagac 120 taacctggcc aacat 135 <210> 345 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 345 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacgtctt 120 gaactccgga cctca 135 <210> 346 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 346 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacgccgg 120 gcgtggtgtc gcgcg 135 <210> 347 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 347 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcactcctg 120 ccgcagcctc tggag 135 <210> 348 <211> 500 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 348 aaaaatggac aattatgagg aggggagagt gcagacaggg gaagcttcac ctcctttaca 60 attttgggag tccacacggc atggcataca aattatttca ttcccattga gaaataaaat 120 ccaattctcc atcaccaaga gagccttccg aaagaggccc ccctgggcaa acggccaccg 180 atggagaggt ctgccagtcc tcttctaccc cacccacgcc cccaccctaa tcagaggcca 240 aacccttcct ggagcctgtg ataaaagcaa ctgttagctt gcactagact agcttcaaag 300 ttgtattgac cctggtgtgt tatgtctaag agtagatgcc atatctcttt tctggcctat 360 gttattacct gtatggactt tgcactggaa tcagctatct gctcttactt atgcacacct 420 ggggcataga gccagccctg tatcgctttt cagccatctc actacagata actcccaagt 480 cctgtctagc tgccttcctt 500 <210> 349 <211> 3324 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 349 atggccattc ggagcatcaa gctcaagctg aagaccagaa ccggtcctga ggctcagaac 60 ctgcggaagg gcatctggag aacccaccgg ctgctgaacg agggcgtggc ctactacatg 120 aagatgctgc tgctcttccg gcaggaatcc actggcggcc agacaaagaa ggaactgcag 180 gaggaactgg tgcggcacat ccgggagcag cagcagaaaa acagagccga caagaatacc 240 caggccctgc ctctggataa ggccttcgcc gctctgagac aactgtacga gctgctcgtg 300 ccatctagca tcggccagag cggcgatgcc cagatcatct ctagaaaatt cctgtctcct 360 ttggtggacc ctaacagcga gggcggcaag ggcactagca aggccggagc caagcccaca 420 tggcagaaaa agaaggaggc caatgaccct acatgggagc aagattacga gaagtggaaa 480 aagcgtagag aggaagatcc taccgccagt gtgataacaa ccctggaaga atatggaatt 540 agacctatct ttccactgta caccaacacc gtggccgata tcgcctggct gcctctgcag 600 tctaaccagt ttgtccggac atgggatcgg gacatgctgc agcaggccat cgagaggcta 660 ctctcttggg agtcttggaa caagcgggtg caagaggaat acagcaagct gcaggagaag 720 atgacgcaac tgaacgagca actggagggc ggacaggagt ggatcagcct gctggaacaa 780 tacgaggaac agagagagca ggagctgatc gaaaacatga ccgccgcaaa cgataaatac 840 cgcatcacca agcggcagat gaagggctgg aatgagctgt atgagcagtg gtctaccgtg 900 ctgcccaatg ccagccacga gcagtacaga gaggcactga aaagagtgca acagcggctg 960 aggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaagaaga acaccacctg 1020 atctggaagg ggaaccctca gagaatccac tacttcgtgg ccagaaacga gctgaagaaa 1080 agactggaag aagccaagca gaacgccacc atgaccctgc ctgatgccag aaagcaccct 1140 ctgtgggtca gatttgacgc cagaggcggc aacctgcaag actactacct gacggccgaa 1200 gccgacaacc ccagaagcag aaggttcgtg accttcagcc aactgatctg gcctaacgag 1260 agcggctgga tggaaaaaca ggacgtggaa gttgaactgg ccctgagcaa gcagttctac 1320 cagcaagtga cactgcagaa aaacgacaag gggaagcagg aaatcgagtt caaagacaag 1380 ggcagtggca gcaccttcag cggccacctg ggcggggcca agctgcaact ggagagagga 1440 gatctggaga aggaagaaaa agactttgaa ggcggcgaaa tcggcagcgt gtacctgaac 1500 atcgtgatcg acttcgagcc actgcaggag gtgaagaacg gccgactgca atctccttac 1560 ggccaggtgc tgcaactggt cagaaggcct aatgagttcc ccaaggtgac cacctacaag 1620 tctgaggaac tggtcgagtg gatcaagagc agcaccaagg acagcgccgg cgtggagtcc 1680 ttagagagcg gttttagagt gatgagcatc gacctgggac tgcggaccgc cgccgcaaca 1740 agcatcttct ctgtagagga atccaacgac gccaacgccg cgggtttcag ctactggatc 1800 gagggaactc ctctggttgc cgttcataag cggtcatata tgctgaaact gcccggagag 1860 caagtcgaaa agcaggtgcg agagaagcgg gacgagcggc aggatcagca gagaagagtg 1920 aggttccaaa tcagaatcct gagccaggtg atccggatgg ccaagaagca gaaccgggag 1980 cgggctgatg agctggacca cctgtcccag gccctggaga agcaaaaatc tctgctggac 2040 cagaccgatc ggaccttttg gaacggcatc gtgtgcgacc tgacagacgc tctgagagag 2100 aaagagggcg gatgggaaca ggccgtggtc cagatccaca ggaaggccga ggagcacgtg 2160 ggcaaggtgg tgcaagcctg gcggaaacgg ttcgacgccg atgaacgcaa gggcatcgcc 2220 ggcctgtcta tgtggtctat cgaggagctg gacagcctgc ggaagctgct gatctcttgg 2280 agcagaagaa caagaaaccc cagagaaatc aactgcttcg agcagggcca caccagccac 2340 cagcggctgc tgacacacat ccagaacgtg aaggaggacc ggctgaagca actgagccac 2400 gccattgtga tgacagcctt gggctacgtg tacgacgaga agaaattgga atggtttgcc 2460 aagtaccctg cttgtcaggt gatcctgttc gagaacctgt cccagtaccg gtccaacatg 2520 gacagaagca ccaaagagaa tagcaccctg atgaaatggg cccacaggag catccctaag 2580 tacgtgcaca tgcaggccga gccttacggc atccagatcg gcgatgtgcg ggccgagtac 2640 tccagcagat tccacgccaa gacaggcaca cctggcatcc ggtgcaagat ggtgtccgga 2700 cacgacctgc aaggcaggcg cttcgagaac ctgcagaagc ggttaatctc tgaacagttc 2760 ctgacagagg agcaagtgaa gcagctcaga cccggcgaca tcgtgcccga cgactccggc 2820 gagtggttca tgaccctgag cgacggcagc gaaggcaaag aggttgtgtt cctccaagcc 2880 gacatcaacg ccgcccaaaa tctgcaaaag agattctggc agcggtacaa cgagctgttt 2940 aaggtctcct gcagagtgct gatccgagga gaagaggaat acctgatccc caagacaaag 3000 tccgtgcaag ccaagctggg caaaggcctg ttcgtgaaaa aaaccgacac cgtgatgaag 3060 gacgtgtacg tgtgggacag ccaggctaag ctgaagggca aaaccacatt caccgaggag 3120 tccgaaagcc ctgagcaact ggaggatttt caggagatca tcgaagaagc cgaagaagct 3180 aagggcacat acagaacact gtttagagac cccagcggag tgttcttccc tgagttcgtg 3240 tggtccaccc agaaagattt ctggtccgag gtgaagagac ggctgtacgg caagctgaga 3300 gagcggttcc tgatgaagac cagg 3324 <210> 350 <211> 20 <212> DNA <213> Homo sapiens <400> 350 tattgaccct ggtgtgttat 20 <210> 351 <211> 20 <212> DNA <213> Homo sapiens <400> 351 gcttgcacta gactagcttc 20 <210> 352 <211> 20 <212> DNA <213> Homo sapiens <400> 352 cttttatcac aggctccagg 20 <210> 353 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 353 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcactattg 120 accctggtgt gttat 135 <210> 354 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 354 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacgcttg 120 cactagacta gcttc 135 <210> 355 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 355 cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60 cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacctttt 120 atcacaggct ccagg 135 <210> 356 <211> 118 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 356 aggagcagcu cuaggccgaa gugucguuuu aguacucugu gaaagcacag aaucuacuaa 60 aauaaggcau aaugccguau uuaaucccau cauaauucug augggauuuu uuauauuu 118 <210> 357 <211> 3180 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 357 atgaagcaga catcttattc tctgggcctg gatatcggca tcgcctctgt gggctacggc 60 ctgattgata acgacgaaaa catcgtggac gccggcgtca gactgtttcc tgaggccaat 120 agcaagaaca acgacggaag acggaagagc agaggctcca agcggctgat ccggcggaag 180 cgccacagaa tcgccagagt gaagcacctg ctgaaggaaa gcggcatcga cgtgtcctac 240 gaaaataccg tgctgaccaa cccttacgag atccggtgca agggcctgac cttaccactg 300 acgaaccacg agctttccat cgccctgctt catctggcta agagacgagg cgtgcacaac 360 gtgaagagca tggaccagga gaaagtcaag ggcaacgagc tgtctacaaa agagcaactg 420 accatcaatg ataatctgct ggaagaaaag ttcatctgcg agctgcaact ggagagactg 480 aacaaggaag gcatcgtgcg gagccactcc aacagattca agaccgccga ctacatcaaa 540 gagatcaaga acctgctgga aacacaggcc aagcagaaca cacttgttac cgaggagttc 600 atcgaaaagt acatcgagat tttcagcggc agaagaaagt actatgaagg ccccggcgga 660 gagagcaagt acggatggaa gggagatatt gaaaagtggt acgaaggcct gatgggcaag 720 tgcacctact tccccaagga actgagatgt gtgaaacatg cctactctgc cgccctgttc 780 aacctgctga atgatctgaa caacctgagc atcaacagag aggaagatac caagctctcc 840 caatacgaaa aagagcagat aattgagaag atctttaagg tgcggaagac ccctaccctg 900 acacagatcg ccaagctgct gaaggtggac cctacaaaca tcaagggctt ccggacaaag 960 gccaacggta cacctgactt cctgagcatc aagatctacc acgacctgaa aggaatcatc 1020 gacgacaagc aacttctcga cgacatcgca ttcctggaca acgtggccca gattctgaca 1080 gtgtggcagg acagccagag catccaggag aagctgaaga ctctgaacaa gaacctggac 1140 gataagacca tcaaggagat cagcgaactg aagaagtaca cccagaccca cagcctgagc 1200 ctgaagctga tcaacgtgct gctgcctgag ctgtgggaga ccacaaaaaa ccagatgacc 1260 atcctgagcg agctgaagct gaagcccaga aaaatcgacc tgcacaattg caacgagatc 1320 cccgtgaaca tgataaacga cctgatcgtg tcccctgtgg tgcggagatc cttgacccaa 1380 agcatcgaga tgatcaacca gattatcaag gactacggcc atcctagaga gatcgttatc 1440 gagctggcca gagaaaaaaa cagcgaggag aagaaaaatt tcatcaagag cctgaacgag 1500 aagaacaaac agatcaatga cgaggtgatc gagaaactga atgccagcaa ccacagggac 1560 aacaagggca tgttcaacaa ggtgaagctg tggattctgc aagacggcca ctgcctgtac 1620 agtctgaagc ctatcaggct ggaagacctg cttaacaacc ccaatcacta cgagatcgac 1680 cacatcatcc ctaagagcgt ttctttcgac gatagcatga gcaacaaggt gctggtgtac 1740 cagatcgaga actctaagaa aggcaataga acaccttacc agtacctgac cagcgctgat 1800 aagacaatca catacgagaa gttcaaggct aacatcaccc aactggccaa gtccaaccac 1860 aagattagca agaagaagtt ggattacctg ttagaggaaa gagatatcaa ccggtttcac 1920 atcaagaagg aatttatcaa tcgcaacctg gtggacaccc ggtacgccac cagaagcctg 1980 atcaacctgc tgaaatacta cttcagcgag aaagatatta atgtgaaggt caaatccatc 2040 aatggcagct tcacagatta cctgcgtaaa ttgtggaact tcccaaagga tagagaattc 2100 taccacaaac accacgccga ggacgccctc atcatcgcta tggccaacaa gatcttcaca 2160 accaggaaaa tcttcaagga acaaaactcc gtgttctcag atgaacagat tctggatggc 2220 gaggtgacaa atatcctctc tgatgatcag ttccaggctg aattcaccga gaagttttac 2280 aaagtgcaag ccatcaagaa atacgacaaa tataaatact cccaccgggt ggacaagaaa 2340 cctaaccggc agctttttga cgacaccctg tacagcacgc gggaattcga gggagaagag 2400 tactacatcg gcaaaattaa ggacatctat aacctgaagg acaaaagact gaaaaagatc 2460 ttcaccaaga gccccgagaa gatcctgatg taccaacacg acagccagac cttcaagaag 2520 ctgaagcaga tcatgagaag ctacgaggac gaggtgaacc ccctggccaa gtaccacaag 2580 gagacaggcg aatacctgag aaaggagtgc aagaaaggca acggccctat agtgaaatcc 2640 ctgaaatata gagtgactaa gctgggcgtg cacaaggaca tcacccacaa gtacgagaac 2700 agcaagaaca aggtcgtgat ccttagcctg aagcccttca gaatggacgt gttcaaggag 2760 aatggagtct acaagtttat caccatcaga tactgtgacc tgaaggaaac cgtgaactct 2820 tacaccatca gcgagcacct gtacaaggcc aagctaaagg ccaaggacat caagagcatg 2880 gacagcttca agtggtcctt ttacaagaac gacctgttgg aatacaacgg cgagctgtgt 2940 accttcaaag gcgttaacga tgacaagaag aacaagattg aagtgaactg ggtggaaaag 3000 aacttcgcca tatacgccga gaagaaaaat ctgaagtcta aacaactggt gaagtctatc 3060 accaagagca ccgtgaagtc cctgttaaag tacaccaccg acatcctggg aaacagatac 3120 cccgtgcgga acgagaagct gaagctgatg atccggaagc agacctttag aggcgacctg 3180 <210> 358 <211> 3270 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 358 atgaacaatc tgctctacag cttcgacatc ggcactaaca gcatcggctg gtgcgtgttc 60 gccctggatg aggttggcga cccttgtaga atcgttgacc tgggcgcccg gatctacgcc 120 gatggcagag atcctcaaac caagacaagc ctggccgtgg ccagaagaga agcacgggcg 180 atgagccggc gacgggaccg aagcctgcgg aggcgcaagg ccacactgcg gaccatgatc 240 gagtacggcc tgatgcctgc ccacaaggtg gaacaggaga cactgctgcg caaaaccggg 300 gacagagaag gaggagacga agggttcaac ccctacgccc tgagagctag agccctgggc 360 gagaagctgc ctccttttta catcggcaga gccctcttcc acctgggcca gcggagaggc 420 ttcaagagca accggaaaac cgacagaaaa gacaacgaca aaggaaaaat cgcacttgga 480 atcgacgagc tgagagccgc tatgcacaga tctggctccc ctaccctggg cgcctggctg 540 gccatgagaa gagcagacgg ccaccctgtg agactgagag ccggcagcga ggtgttcgat 600 gcagagggat acgcttttta ccccgagaga agcctgctgg aggacgaatt cagacaaatc 660 tggaccgccc aggccgtgca tcacccacaa ctgctgacca gcgagcggcg ggcccatctg 720 ttcagagtga tgttctacca gagacctctg aagaagcccc tggtgggcag atgtagcttc 780 aaccccgccg aggctagact gtctagagcc cacccgctgt ttcaggagtt cagactctac 840 aaagaagtga atgacctgga ggtggtgctg cccgaccaga gccacagaaa gctcaccctc 900 gatgaaagaa acgccctggt agcaaagctg aagagttcta gaaaggcctc tttcagcgtg 960 ctgagacgaa ccctcaagct gacccctgac ctggccttca acaaggaaag cgaggcccgg 1020 aaggacctgc tgggcgacga gattaacagc gccctggctg atgccaagat gtttggcgtg 1080 cggtggggcg gctttcctag agcccggcag tgggaaatca tcacacacct gaaggaagaa 1140 gaaaaccccg cccggttgag cgactggctg aaaagcgagt tcggcctgga cgacgagcgg 1200 gtggtggcta tcgccaatat cgccctccca gagggatacg gccgtctcgg cgaaacagcc 1260 ctggcatcta tgctggaaga aatgaagacc gccgtcatcc ccgagagcga agctgctaag 1320 cggtgcggct atgatcattc taatctggcc aaggagcagg acgaggggct cgacatcctg 1380 cctgaatatc aggagatcct ggaacggcat attcctcctg gcaccggcga tcccgatgac 1440 atctacgaca tccggaaggg cagaattaca aaccctacag tccacatcgg actgaaccaa 1500 ctgagaagag tggtcaacgc cctgatcaag agacacggca agcccaggca tatcgtggtg 1560 gaactggcca gagatctgca actgagcgag aaacagaagg ccgacgtgaa cagacgcatc 1620 gccaaaaaca caagagaggc cgagggcaga tcccagaaac tgatcgagat gggccaactg 1680 gacaccggct acaaccggct gctgctgaag ctgtgggagg aactgaatca ggacaagcct 1740 gaggacagag tgtgcatcta ttctgggaag cccatcggaa tcgccatgct gttcagcgga 1800 gaggtggata ttgatcacat cctgccttgg tccaagaccc tggacgatag ccaggccaac 1860 aagctgctgt gcctgaagtc tgctaaccgg caaaagcgga acagaacccc tagcgacgtg 1920 cctgagtgga gagattgcta cgaggaggtc ctggctagag ccgctaggct gcccaagaac 1980 aagcggtggc ggttcgccgc cgacgccatg cagcagttcg aggcagaagg cggcttcctg 2040 gccagacaac tgaccgacac ccagtacctg tcaagaatgg ccttcgagta cctgagcgct 2100 ctgttcccat ctgaagaggc cgataaatgg ggggagctaa gacagcggaa gagagtccac 2160 gtggtgcccg gcagactgac cgagctgctg agaagaaact ggggactgaa caccctgctg 2220 cctgaccaca acctgggcga gatggcccag gagaagaacc ggaaagatca cagacaccac 2280 gccatcgacg ccgccgtgat cggagtgacc tccagatcgc tgctgcagcg gatgtctgga 2340 gccgccgcaa gacttgacga cgtggccttc gacgacctgg tgcggaccgt ggtgaaggac 2400 aatcctcctt ggcctggctt ccgggaagaa ctgcttggtt gtatcaacag agtcaccgtc 2460 agccacaagc cagaccacgg caccgtgagc agagccgcct acgcacaggg caagggccaa 2520 acagccggca aactgcacaa cgacacagct tatggaatca ccggactgca ggacatgaag 2580 ggcagcccac tggtggtgcg gagaaagcct ttcatggccc tggaagtgaa ggacatcgct 2640 tctatcagag atactgagct gcaatctgcc ctgtacgacg ccatcggatc tctgacagag 2700 aagaaggccc tgcaagaagc cctggtgaga ttcagggaca gacacccgca gtttaagggc 2760 atcagaagag tgcgggtgct ggaagctcta agcgtgatcc ctatcgtgga caacaacggc 2820 aaggcctaca agggctacaa gggcgatgct aattacagat acgaggtttg ggagacactg 2880 gatggcagat ggcacaccga agtggtgtcc atgttcgacg cccaccagcc tggctggcag 2940 agccccttcc accggcaaca ccctgccgcc agaagagtgc tgaaactgca gcagaacgac 3000 atggtggcct acgaacaccc ggccgatggc tacaccatcg ctcgggtggt taagttctcc 3060 aacgacaaga gaatctactt cgcctcccac agagagagcg gaagcctgaa ggccagagac 3120 gccgacaagg gggacccctt cacctacttt gccaaggcca acaacggcct gagagacatc 3180 aagtgccggc aagtgaggat cgacgccgcc ggacgggtgt tcgaccctgg acctcaggat 3240 cgagaggcca gacagtctaa gggaagagcc 3270 <210> 359 <211> 3324 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 359 atggccattc ggagcatcaa gctcaagctg aagaccagaa ccggtcctga ggctcagaac 60 ctgcggaagg gcatctggag aacccaccgg ctgctgaacg agggcgtggc ctactacatg 120 aagatgctgc tgctcttccg gcaggaatcc actggcggcc agacaaagaa ggaactgcag 180 gaggaactgg tgcggcacat ccgggagcag cagcagaaaa acagagccga caagaatacc 240 caggccctgc ctctggataa ggccttcgcc gctctgagac aactgtacga gctgctcgtg 300 ccatctagca tcggccagag cggcgatgcc cagatcatct ctagaaaatt cctgtctcct 360 ttggtggacc ctaacagcga gggcggcaag ggcactagca aggccggagc caagcccaca 420 tggcagaaaa agaaggaggc caatgaccct acatgggagc aagattacga gaagtggaaa 480 aagcgtagag aggaagatcc taccgccagt gtgataacaa ccctggaaga atatggaatt 540 agacctatct ttccactgta caccaacacc gtggccgata tcgcctggct gcctctgcag 600 tctaaccagt ttgtccggac atgggatcgg gacatgctgc agcaggccat cgagaggcta 660 ctctcttggg agtcttggaa caagcgggtg caagaggaat acagcaagct gcaggagaag 720 atgacgcaac tgaacgagca actggagggc ggacaggagt ggatcagcct gctggaacaa 780 tacgaggaac agagagagca ggagctgatc gaaaacatga ccgccgcaaa cgataaatac 840 cgcatcacca agcggcagat gaagggctgg aatgagctgt atgagcagtg gtctaccgtg 900 ctgcccaatg ccagccacga gcagtacaga gaggcactga aaagagtgca acagcggctg 960 aggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaagaaga acaccacctg 1020 atctggaagg ggaaccctca gagaatccac tacttcgtgg ccagaaacga gctgaagaaa 1080 agactggaag aagccaagca gaacgccacc atgaccctgc ctgatgccag aaagcaccct 1140 ctgtgggtca gatttgacgc cagaggcggc aacctgcaag actactacct gacggccgaa 1200 gccgacaacc ccagaagcag aaggttcgtg accttcagcc aactgatctg gcctaacgag 1260 agcggctgga tggaaaaaca ggacgtggaa gttgaactgg ccctgagcaa gcagttctac 1320 cagcaagtga cactgcagaa aaacgacaag gggaagcagg aaatcgagtt caaagacaag 1380 ggcagtggca gcaccttcag cggccacctg ggcggggcca agctgcaact ggagagagga 1440 gatctggaga aggaagaaaa agactttgaa ggcggcgaaa tcggcagcgt gtacctgaac 1500 atcgtgatcg acttcgagcc actgcaggag gtgaagaacg gccgactgca atctccttac 1560 ggccaggtgc tgcaactggt cagaaggcct aatgagttcc ccaaggtgac cacctacaag 1620 tctgaggaac tggtcgagtg gatcaagagc agcaccaagg acagcgccgg cgtggagtcc 1680 ttagagagcg gttttagagt gatgagcatc gacctgggac tgcggaccgc cgccgcaaca 1740 agcatcttct ctgtagagga atccaacgac gccaacgccg cgggtttcag ctactggatc 1800 gagggaactc ctctggttgc cgttcataag cggtcatata tgctgaaact gcccggagag 1860 caagtcgaaa agcaggtgcg agagaagcgg gacgagcggc aggatcagca gagaagagtg 1920 aggttccaaa tcagaatcct gagccaggtg atccggatgg ccaagaagca gaaccgggag 1980 cgggctgatg agctggacca cctgtcccag gccctggaga agcaaaaatc tctgctggac 2040 cagaccgatc ggaccttttg gaacggcatc gtgtgcgacc tgacagacgc tctgagagag 2100 aaagagggcg gatgggaaca ggccgtggtc cagatccaca ggaaggccga ggagcacgtg 2160 ggcaaggtgg tgcaagcctg gcggaaacgg ttcgacgccg atgaacgcaa gggcatcgcc 2220 ggcctgtcta tgtggtctat cgaggagctg gacagcctgc ggaagctgct gatctcttgg 2280 agcagaagaa caagaaaccc cagagaaatc aactgcttcg agcagggcca caccagccac 2340 cagcggctgc tgacacacat ccagaacgtg aaggaggacc ggctgaagca actgagccac 2400 gccattgtga tgacagcctt gggctacgtg tacgacgaga agaaattgga atggtttgcc 2460 aagtaccctg cttgtcaggt gatcctgttc gagaacctgt cccagtaccg gtccaacatg 2520 gacagaagca ccaaagagaa tagcaccctg atgaaatggg cccacaggag catccctaag 2580 tacgtgcaca tgcaggccga gccttacggc atccagatcg gcgatgtgcg ggccgagtac 2640 tccagcagat tccacgccaa gacaggcaca cctggcatcc ggtgcaagat ggtgtccgga 2700 cacgacctgc aaggcaggcg cttcgagaac ctgcagaagc ggttaatctc tgaacagttc 2760 ctgacagagg agcaagtgaa gcagctcaga cccggcgaca tcgtgcccga cgactccggc 2820 gagtggttca tgaccctgag cgacggcagc gaaggcaaag aggttgtgtt cctccaagcc 2880 gacatcaacg ccgcccaaaa tctgcaaaag agattctggc agcggtacaa cgagctgttt 2940 aaggtctcct gcagagtgct gatccgagga gaagaggaat acctgatccc caagacaaag 3000 tccgtgcaag ccaagctggg caaaggcctg ttcgtgaaaa aaaccgacac cgtgatgaag 3060 gacgtgtacg tgtgggacag ccaggctaag ctgaagggca aaaccacatt caccgaggag 3120 tccgaaagcc ctgagcaact ggaggatttt caggagatca tcgaagaagc cgaagaagct 3180 aagggcacat acagaacact gtttagagac cccagcggag tgttcttccc tgagttcgtg 3240 tggtccaccc agaaagattt ctggtccgag gtgaagagac ggctgtacgg caagctgaga 3300 gagcggttcc tgatgaagac cagg 3324 <210> 360 <211> 3324 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 360 atggccatca gatctatcaa gctgaagctc aagaccagaa caggtcctga ggcccagaac 60 ctgcggaagg gcatttggcg gacacaccgc ctcctcaacg agggcgtcgc ctattatatg 120 aaaatgctgc tgctgttcag acaggagagc acaggcggcc agaccaagaa agagctgcag 180 gaagaactgg tccggcacat cagagagcag cagcagaaga atcgggccga caagaacacc 240 caggccctgc ctctggacaa ggcttttgcc gctctgcggc agctctacga gctgctggtg 300 ccttcttcta tcggccagag cggagacgcg cagatcatca gcagaaagtt cctgtcccct 360 ctcgtggacc ccaacagcga gggcggcaag ggcacatcta aagctggcgc caagcctaca 420 tggcagaaaa agaaggaggc caacgacccc acctgggaac aggattacga gaaatggaag 480 aagcggagag aggaggaccc taccgccagc gtgattacca ccctggaaga atacggcatc 540 agaccaatct tcccactgta caccaacacc gtggccgaca tcgcctggct gcctctgcag 600 tccaaccagt tcgtgcggac atgggacaga gacatgctgc agcaggctat cgagagactg 660 ctgagctggg aaagctggaa caagagagtg caagaggaat acagcaagct gcaagagaag 720 atgacacagc tcaacgagca actggagggc ggccaggagt ggatcagcct gctggaacag 780 tacgaggagc aacgggagca ggagctgatc gagaacatga ccgccgctaa cgacaaatat 840 agaataacaa agcggcagat gaagggctgg aacgagctgt acgagcagtg gagcaccgtg 900 ctgcccaatg cctctcacga gcagtaccgg gaagccctta agcgggtcca gcaaagactg 960 cggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaggaaga gcaccacctg 1020 atttggaagg gcaaccccca gagaatccac tactttgtgg ccagaaacga gctgaagaaa 1080 agactggaag aggccaagca gaacgccact atgaccctgc cagacgccag aaagcacccc 1140 ctgtgggtgc ggttcgacgc cagaggcgga aatctgcagg actactacct gaccgccgag 1200 gccgataacc ccagatctag aagattcgtt acctttagcc agttgatctg gcctaacgag 1260 tccggctgga tggaaaagca ggacgtggaa gtggaactcg ccctgagcaa gcagttctac 1320 cagcaagtga ccctgcagaa gaacgataag gggaaacagg agatcgagtt taaggacaag 1380 ggctccggat ctacgttcag tggccatctg ggcggggcta agctgcaact ggagcgaggc 1440 gacctggaga aagaagagaa ggactttgag ggcggagaaa tcggaagcgt gtacctgaac 1500 atcgtgatcg acttcgagcc cttgcaggag gtgaaaaacg gcagactgca gagcccatac 1560 ggccaggtgc tgcagctcgt tcggagacct aatgagttcc ctaaggtgac cacatacaag 1620 tctgaagaac ttgttgagtg gatgaaggcc agccagaatc acagcagcgg cgtggagtct 1680 ctggagtcgg gcttcagagt gatgagcatc gatctgggac tgaggacagc cgctgccacc 1740 agcattttct ctgtggaaga aagcaacgat gccaacgccg ctggcttcag ctactggatc 1800 gagggcaccc ctctggtcgc cgtgcacaag agaagctaca tgctgaagct gccaggcgaa 1860 caagtggaaa aacaggtgcg ggaaaagaga gatgagagac aagaccagca gaggcgcgtc 1920 agatttcaga tcagaatcct gagccaggtg atcaggatgg ccaagaaaca aaacagagaa 1980 agagctgacg aactggacca cctgagccag gcactggaga agcagaagtc cctgctcgat 2040 cagaccgata gaaccttctg gaacggcatc gtttgtgacc tgaccgatgc gctgcgcgaa 2100 aaggagggag gctgggagca agccgtggtc caaatccaca gaaaggccga ggaacacgtg 2160 ggcaaggtgg tgcaagcctg gcggaaaaga tttgacgccg atgagcggaa gggcatcgcc 2220 ggcctgagca tgtggtccat agaagagctg gacagcctcc ggaagctgct cattagctgg 2280 agcagaagga caagaaaccc tcaggagatc aacagattcg agcagggcca cacctctcac 2340 cagcggctgc tgacacatat ccagaacgtg aaggaagata gactgaagca actgagccac 2400 gccatcgtga tgaccgccct gggctacgtg tacgacgaga agaagctgga gtggttcgcc 2460 aaataccccg cctgccaggt gatcctgttc gagaatctgt ctcagtacag aagccacatg 2520 gacagatcca cgaaggaaaa tagcaccctg atgaaatggg cccacagaag catccctaag 2580 tacgtccaca tgcaggccga gccttacgga atccagatcg gagatgtgag agccgaatat 2640 agcagcaggt tccacgccaa gacagggaca cctggcatcc gttgcaagat ggtgaaggga 2700 caagaactgc aaggcaagcg attcgagaac ctgcaaaaga gactggtgtc cgaacagttt 2760 ctgaccgagg aacaggtgaa gcagcttcgg cctggagata tcgtgccaga tgacagcgga 2820 gagtggttca tgaccctgag tgatggcagc gaaggcaagg aagtggtgtt cctgcaagcc 2880 gacatcaacg ccgcccagaa ccttcagaaa cgattctggc agagatacaa cgaactgttc 2940 aaggtgtcat gcagagtgct gatcagaggc gaggaagagt acctgatccc caaggccaag 3000 agcgtgcaag ccaaactcgg caagggactg ttcgtgaaga aaaccgacac cgtgatgaag 3060 gacgtgtacg tgtgggatag ccaggccaaa ctgaagggca aaacaacctt caccgaggaa 3120 agcgagagcc ctgagcaact ggaggacttc caggagatca tcgaagaagc cgaggaagcc 3180 aagggcacct acagaacact gtttagagat cctagcggcg ttttcttccc cgagttcgtg 3240 tggaataccc agaaagactt ctggtccgag gtgaagagaa ggctgtacgg caagctgcgc 3300 gagagattcc tgatgaagac ccgg 3324 <210> 361 <211> 3336 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 361 atggccatta gatccatcaa gctgaaaatg aagaccaact ccggcaccga cagcatctac 60 ctgcggaagg ccctgtggag aacacaccaa ctgatcaacg agggcatcgc ctactacatg 120 aacctgctga cactgtacag acaggaggct attggcgata agaccaagga ggcctaccag 180 gctgaactga tcaacattat cagaaaccaa cagagaaaca acggcagctc tgaagagcac 240 ggctctgacc aggagatcct ggccctgctc agacaactct acgagctgat cattcccagc 300 agcatcggcg agagcggcga tgccaaccaa ctgggcaaca aattcctgta tcctttagtt 360 gaccccaaca gccagagcgg caagggcaca agcaacgccg gcagaaaacc tagatggaag 420 cggctgaagg aggaaggcaa ccctgactgg gagctggaga agaaaaagga cgaggaacgg 480 aaggctaaag acccaaccgt gaagatcttc gacaacctga acaagtacgg cctgctgcct 540 ctgttccccc tgtttaccaa catccagaag gacatcgagt ggctgcctct gggcaaacgc 600 cagagcgtga ggaagtggga caaggatatg ttcatccagg ccatcgagcg gctgctgagc 660 tgggaatctt ggaatcggcg ggtggccgat gagtacaagc aactgaagga aaagaccgag 720 agctactaca aggaacacct gaccggcgga gaggagtgga tcgaaaaaat ccggaagttc 780 gagaaggaga gaaacatgga attagaaaag aacgccttcg cccctaacga cggatacttc 840 atcaccagca gacagatcag gggctgggat agagtttacg agaagtggtc caagctgccc 900 gagagcgcca gcccagaaga actgtggaag gtagtggccg agcagcaaaa caagatgagc 960 gagggattcg gcgaccctaa ggtgttcagc ttcctggcaa accgagaaaa cagagatatc 1020 tggagaggcc actctgaacg gatctaccac atcgccgcct acaacggcct gcagaagaaa 1080 ctgtccagaa caaaggaaca agccacattc accctgcccg acgccataga acatcctctg 1140 tggatcagat atgagtctcc aggaggcacc aatctcaact tgttcaagct ggaggaaaag 1200 cagaaaaaga actactacgt gaccctgagc aagatcatct ggcctagcga ggagaaatgg 1260 atcgaaaagg aaaatatcga gatccccctg gcccctagca tccagtttaa tagacagatc 1320 aagctgaaac agcacgtgaa aggtaagcaa gagatctcat ttagcgacta cagcagccgg 1380 atcagcctgg atggagtgct gggaggctct agaatccagt tcaaccggaa atacatcaag 1440 aaccacaagg aactgttagg agaaggcgat attggtcctg tgttcttcaa cctggtggtg 1500 gacgtggctc ctctgcagga aaccagaaat ggcagactgc agtctcctat cggcaaggcc 1560 ctgaaggtga tctccagcga cttcagcaag gtgatcgact acaagcctaa ggaactgatg 1620 gactggatga ataccggcag cgcctctaat agtttcggcg tggccagcct gctggaaggc 1680 atgcgggtga tgtctatcga catgggacag agaacctcag ctagcgtgtc tattttcgag 1740 gtcgtcaagg agctgcccaa ggaccaggag cagaaactct tctacagcat caacgacacc 1800 gaactgtttg ccatccacaa aagatccttt ctgctgaacc tgcccgggga ggtggtgaca 1860 aagaacaaca agcagcagcg gcaagaaaga agaaagaaga gacagttcgt gcggagccag 1920 atccggatgc tggccaatgt gctgagactg gaaacaaaga agacacctga cgagagaaag 1980 aaagccatcc acaagctgat ggaaatcgtg caaagctacg atagctggac agccagccag 2040 aaagaggtgt gggaaaagga gctgaacctg ctgaccaaca tggctgcctt caatgacgag 2100 atctggaagg aaagtctggt cgaactgcac cacagaatcg agccttacgt gggccagatc 2160 gtcagcaagt ggcggaaggg cctgagcgag ggcagaaaga acctggctgg catcagcatg 2220 tggaacattg atgaacttga agatacaaga agactgctta tctcttggag caagagatct 2280 cggacacctg gcgaggccaa tagaatcgag acagatgaac ccttcggcag cagcctgctc 2340 caacacatcc agaacgtgaa ggacgataga ctgaagcaaa tggccaacct gatcatcatg 2400 accgccctgg gctttaagta cgataaggaa gaaaaggacc ggtacaagcg gtggaaagag 2460 acataccccg cctgtcagat catcctgttc gagaacctga acagatacct gtttaacctg 2520 gacagaagca gacgggagaa cagccggctg atgaaatggg cccaccggtc cattccaaga 2580 accgtgtcca tgcagggcga gatgttcgga ctgcaagtgg gcgatgtgcg gagcgagtat 2640 agctccagat tccacgccaa gaccggagcc ccaggcatca gatgccacgc tctgacagag 2700 gaagatctga aggccggcag caacaccctg aagcggttga tcgaggatgg cttcatcaac 2760 gaaagcgaat tggcctatct gaagaagggc gacattatcc cttctcaagg cggagaactg 2820 ttcgtgaccc tgtctaagag atacaagaaa gacagcgaca acaacgagct gactgtgatt 2880 cacgccgaca tcaacgccgc ccagaacctg cagaagcggt tctggcagca gaacagcgag 2940 gtgtatagag tgccttgcca actggccaga atgggcgaag ataagctcta catccctaag 3000 tctcagaccg agacgatcaa gaagtacttt ggcaaaggca gcttcgtgaa gaacaatacc 3060 gagcaggaag tgtacaagtg ggagaagagc gaaaagatga agattaagac agacaccacc 3120 tttgacctgc aagatctgga cggcttcgag gacattagca agaccatcga gctagctcag 3180 gagcaacaga agaagtacct gactatgttc agagaccctt ctggctactt cttcaacaac 3240 gagacatggc gcccccagaa ggagtactgg tccatcgtga acaacatcat caagtcctgc 3300 ctgaagaaga agattctgag caacaaggtg gaactc 3336 <210> 362 <211> 3324 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 362 atggccatca gatctatcaa gctgaagctc aagaccagaa caggtcctga ggcccagaac 60 ctgcggaagg gcatttggcg gacacaccgc ctcctcaacg agggcgtcgc ctattatatg 120 aaaatgctgc tgctgttcag acaggagagc acaggcggcc agaccaagaa agagctgcag 180 gaagaactgg tccggcacat cagagagcag cagcagaaga atcgggccga caagaacacc 240 caggccctgc ctctggacaa ggcttttgcc gctctgcggc agctctacga gctgctggtg 300 ccttcttcta tcggccagag cggagacgcg cagatcatca gcagaaagtt cctgtcccct 360 ctcgtggacc ccaacagcga gggcggcaag ggcacatcta aagctggcgc caagcctaca 420 tggcagaaaa agaaggaggc caacgacccc acctgggaac aggattacga gaaatggaag 480 aagcggagag aggaggaccc taccgccagc gtgattacca ccctggaaga atacggcatc 540 agaccaatct tcccactgta caccaacacc gtggccgaca tcgcctggct gcctctgcag 600 tccaaccagt tcgtgcggac atgggacaga gacatgctgc agcaggctat cgagagactg 660 ctgagctggg aaagctggaa caagagagtg caagaggaat acagcaagct gcaagagaag 720 atgacacagc tcaacgagca actggagggc ggccaggagt ggatcagcct gctggaacag 780 tacgaggagc aacgggagca ggagctgatc gagaacatga ccgccgctaa cgacaaatat 840 agaataacaa agcggcagat gaagggctgg aacgagctgt acgagcagtg gagcaccgtg 900 ctgcccaatg cctctcacga gcagtaccgg gaagccctta agcgggtcca gcaaagactg 960 cggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaggaaga gcaccacctg 1020 atttggaagg gcaaccccca gagaatccac tactttgtgg ccagaaacga gctgaagaaa 1080 agactggaag aggccaagca gaacgccact atgaccctgc cagacgccag aaagcacccc 1140 ctgtgggtgc ggttcgacgc cagaggcgga aatctgcagg actactacct gaccgccgag 1200 gccgataacc ccagatctag aagattcgtt acctttagcc agttgatctg gcctaacgag 1260 tccggctgga tggaaaagca ggacgtggaa gtggaactcg ccctgagcaa gcagttctac 1320 cagcaagtga ccctgcagaa gaacgataag gggaaacagg agatcgagtt taaggacaag 1380 ggctccggat ctacgttcag tggccatctg ggcggggcta agctgcaact ggagcgaggc 1440 gacctggaga aagaagagaa ggactttgag ggcggagaaa tcggaagcgt gtacctgaac 1500 atcgtgatcg acttcgagcc cttgcaggag gtgaaaaacg gcagactgca gagcccatac 1560 ggccaggtgc tgcagctcgt tcggagacct aatgagttcc ctaaggtgac cacatacaag 1620 tctgaagaac ttgttgagtg gatgaaggcc agccagaatc acagcagcgg cgtggagtct 1680 ctggagtcgg gcttcagagt gatgagcatc gatctgggac tgaggacagc cgctgccacc 1740 agcattttct ctgtggaaga aagcaacgat gccaacgccg ctggcttcag ctactggatc 1800 gagggcaccc ctctggtcgc cgtgcacaag agaagctaca tgctgaagct gccaggcgaa 1860 caagtggaaa aacaggtgcg ggaaaagaga gatgagagac aagaccagca gaggcgcgtc 1920 agatttcaga tcagaatcct gagccaggtg atcaggatgg ccaagaaaca aaacagagaa 1980 agagctgacg aactggacca cctgagccag gcactggaga agcagaagtc cctgctcgat 2040 cagaccgata gaaccttctg gaacggcatc gtttgtgacc tgaccgatgc gctgcgcgaa 2100 aaggagggag gctgggagca agccgtggtc caaatccaca gaaaggccga ggaacacgtg 2160 ggcaaggtgg tgcaagcctg gcggaaaaga tttgacgccg atgagcggaa gggcatcgcc 2220 ggcctgagca tgtggtccat agaagagctg gacagcctcc ggaagctgct cattagctgg 2280 agcagaagga caagaaaccc tcaggagatc aacagattcg agcagggcca cacctctcac 2340 cagcggctgc tgacacatat ccagaacgtg aaggaagata gactgaagca actgagccac 2400 gccatcgtga tgaccgccct gggctacgtg tacgacgaga agaagctgga gtggttcgcc 2460 aaataccccg cctgccaggt gatcctgttc gagaatctgt ctcagtacag aagccacatg 2520 gacagatcca cgaaggaaaa tagccgcctg atgaaatggg cccacagaag catccctaag 2580 tacgtccaca tgcaggccga gccttacgga atccagatcg gagatgtgag agccgaatat 2640 agcagcaggt tccacgccaa gacagggaca cctggcatcc gttgcaagat ggtgaaggga 2700 caagaactgc aaggcaagcg attcgagaac ctgcaaaaga gactggtgtc cgaacagttt 2760 ctgaccgagg aacaggtgaa gcagcttcgg cctggagata tcgtgccaga tgacagcgga 2820 gagtggttca tgaccctgag tgatggcagc gaaggcaagg aagtggtgtt cctgcaagcc 2880 gacatcaacg ccgcccagaa ccttcagaaa cgattctggc agagatacaa cgaactgttc 2940 aaggtgtcat gcagagtgct gatcagaggc gaggaagagt acctgatccc caaggccaag 3000 agcgtgcaag ccaaactcgg caagggactg ttcgtgaaga aaaccgacac cgtgatgaag 3060 gacgtgtacg tgtgggatag ccaggccaaa ctgaagggca aaacaacctt caccgaggaa 3120 agcgagagcc ctgagcaact ggaggacttc caggagatca tcgaagaagc cgaggaagcc 3180 aagggcacct acagaacact gtttagagat cctagcggcg ttttcttccc cgagttcgtg 3240 tggaataccc agaaagactt ctggtccgag gtgaagagaa ggctgtacgg caagctgcgc 3300 gagagattcc tgatgaagac ccgg 3324 <210> 363 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 363 cccagcccta ggttgtttat t 21 <210> 364 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 364 ctggctacat cttccttgac tac 23 <210> 365 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 365 gagctgcaca tttgacgagc 20 <210> 366 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 366 attacaggtg tgagccacgg 20 <210> 367 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 367 accagaacat gcctgatggg 20 <210> 368 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 368 gcccctcaat catctctggg 20 <210> 369 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 369 cccacccttt gagagtgcat 20 <210> 370 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 370 gattgaaggg cagagggagg 20 <210> 371 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 371 gagatgtccc cagtgaactc caaat 25 <210> 372 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 372 cctgtcgttg cccctcccag atcat 25 <210> 373 <211> 49 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 373 gtctgattgc ctgtcgttgc ccctcccaga tcatggagga gttggcaga 49 <210> 374 <211> 192 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 374 Met Glu Pro Trp Arg Pro Ser Pro Arg Asn Pro Met Asp Arg Ile Asp 1 5 10 15 Pro Asn Thr Phe Arg Phe His Phe Pro Asn Leu Leu Tyr Ala Ser Gly 20 25 30 Arg Lys Leu Cys Tyr Leu Cys Phe Gln Val Glu Thr Gly Asp Tyr Phe 35 40 45 Ser Cys Asp Asp Ser Asp Arg Gly Val Phe Arg Asn Lys Val His Pro 50 55 60 Trp Ala Arg Cys His Ala Glu Gln Cys Phe Leu Ser Trp Phe Arg Asp 65 70 75 80 Gln Tyr Pro Cys Arg Asp Glu Tyr Tyr Asn Val Thr Trp Phe Leu Ser 85 90 95 Trp Ser Pro Cys Pro Thr Cys Ala Glu Glu Val Val Glu Phe Leu Glu 100 105 110 Glu Tyr Arg Asn Leu Thr Leu Ser Ile Phe Thr Ser Arg Leu Tyr Tyr 115 120 125 Phe Tyr His Pro Asn Tyr Gln Gln Gly Leu Arg Lys Leu Trp Asp Ala 130 135 140 Gly Val Gln Leu Asp Ile Met Ser Cys Asp Asp Phe Glu His Cys Trp 145 150 155 160 Asp Asn Phe Val Asp His Lys Gly Met Arg Phe Gln Arg Arg Asn Leu 165 170 175 Leu Lys Asp Tyr Asp Phe Leu Ala Ala Glu Leu Gln Glu Ile Leu Arg 180 185 190 <210> 375 <211> 398 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 375 Met Gln Glu Lys Glu Val Leu Asn Ser Leu Arg Cys Asn Thr Gln Ser 1 5 10 15 Ile Glu Glu Glu Ile Gln Ile Asn Thr Leu Leu Asn Lys Thr Lys Arg 20 25 30 Asn Arg Ile Lys Ile Asn Asn Leu Asp Glu Phe Lys Asp Val Leu Lys 35 40 45 Lys Glu Gly Tyr Glu Ile Asn Glu Phe Asp Glu Glu Lys Phe Lys Glu 50 55 60 Asp Leu Val Lys Ile Phe Gln Val Asp Asn Gly Val Ile Glu Asn Leu 65 70 75 80 His Thr Tyr Ile Asn Asn Pro Glu Ile Ser Tyr Lys Val Tyr Asp Thr 85 90 95 Ser Asp Leu Ile Asp Tyr Ile Lys Lys Met Ile Leu Phe Glu Asn Glu 100 105 110 Tyr Asn Arg Leu Cys Lys Lys Ile Ser Ser Val Lys Lys Leu Asp Ile 115 120 125 Asp Arg Val Glu Tyr Glu Arg Glu Phe Ser Leu Gln Asp Asn Val Glu 130 135 140 Asp Ile Ile Lys Ala Ile Glu Glu Ile Lys Asp Asp Ile Ser Gly Ile 145 150 155 160 Ile Ser Lys Glu Gly Lys Thr Arg Leu Glu Asn Leu Glu Arg Glu Ile 165 170 175 Asn Lys Glu Tyr Leu Tyr Ala Lys Asp Ile Glu Leu Leu Lys Lys Met 180 185 190 Val Ile Ile Glu Asn Glu Asn Val Lys Glu Lys Tyr Asn Ile Glu Ser 195 200 205 Lys Ile Lys Thr Ile Ser Ile Lys Ile Pro Lys Lys Ile Asn Tyr Glu 210 215 220 His Ile Val Ala Lys Lys Gly Ser Val Glu Tyr His Asp Tyr Leu Ser 225 230 235 240 Ser Asn Ile Pro Arg Met Gln Arg Leu Ile Lys Asn Ile His Lys Tyr 245 250 255 Met Lys Val Asp Glu Lys Glu Lys Ser Thr Phe Lys Ile Asn Gln Ser 260 265 270 Lys Ala Leu Gln Asp Ser Ile Asn Ile Ala Val Ala Thr Tyr Asp Asn 275 280 285 Lys Glu Phe Lys Ala Ile Ser Gly Ser Asn Asp Ile Lys Asn Tyr Cys 290 295 300 Arg Arg Thr Pro Leu Glu Asn Ala Thr Phe Lys Ser Ser Lys Val Asn 305 310 315 320 Lys Leu Gly Asn Leu Gly Ile Gly Tyr Asn Arg Val Asn Asp Ser Glu 325 330 335 Lys Lys Ile Phe Glu Glu Ile His Arg Gln Ile Glu Lys Asn Thr Leu 340 345 350 Lys Asp Glu Gly Asn Leu Ile Leu Tyr Thr Lys Leu Glu Pro Cys Pro 355 360 365 Ser Cys Tyr Tyr Val Ile Ser Gln Phe Cys Lys Lys His Pro Asn Ile 370 375 380 Lys Val Gln Ile Lys Tyr Ser Glu Lys Tyr Gly Glu Trp Arg 385 390 395 <210> 376 <211> 201 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 376 Met Glu Glu Lys Lys Leu Ala Leu Val Ser Lys Ile His Tyr Glu Leu 1 5 10 15 Glu Asp Lys Gly Ile Glu Leu Arg Asn Leu Ala Leu Ile His Lys Asp 20 25 30 Arg Thr Glu Leu Leu Ala Arg Ile Lys Ala Lys Ser Arg Lys Arg Pro 35 40 45 Ile Tyr Phe Tyr Arg Tyr Leu Glu Asp Leu Pro Glu Phe Leu Gly Gly 50 55 60 Asn Asp Ala Val Leu Glu Tyr Ile Pro Asn Gly Asp Asn Thr Asn Lys 65 70 75 80 Lys Ile Tyr Phe Ala Asn Ser Phe Val Asn Tyr Thr Asp Ser Pro Phe 85 90 95 Ser Asp Ile Tyr Ile Glu Phe Thr Asp Ser Val Tyr Val Leu Ile Pro 100 105 110 Glu Asp Lys Lys Phe Asp Ala Ile Ile Thr Asn Arg Asp Arg Glu Ile 115 120 125 Gly Asn Gly His Leu Arg Glu Asn Asp Thr Glu Tyr Lys Leu Met Val 130 135 140 Glu Ile Ser Asp Lys Ile Asp Thr Thr Val Pro Gly His Ile Asn Ile 145 150 155 160 Tyr Thr Tyr Tyr Glu Pro Cys Leu Ser Cys Asp Asn Val Phe Ile Gln 165 170 175 Phe Ser Lys Lys Phe Pro Asn Val Ser Val Asn Val Tyr Phe Ser Asp 180 185 190 Glu Tyr Lys Ser Lys Lys Trp Val Val 195 200 <210> 377 <211> 237 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 377 Met Ser Leu Leu Thr Ala Glu Thr Phe Ser Leu Gln Phe Asn Asn Arg 1 5 10 15 Arg Gln Arg Arg Lys Lys Gly Thr Tyr Tyr Pro Lys Arg Thr Tyr Leu 20 25 30 Cys Tyr Gln Leu Thr Pro Arg Asn Gly Ser Thr Pro Thr Arg Gly Tyr 35 40 45 Phe Lys Asn Lys Lys Asn Cys His Val Glu Ile Cys Phe Ile Asp Lys 50 55 60 Ile Ala Ser Met Glu Leu Asp Lys Thr Gln Cys Tyr Asp Val Thr Cys 65 70 75 80 Tyr Leu Thr Trp Ser Pro Cys Pro Ser Cys Ala Gln Lys Leu Ala Ala 85 90 95 Phe Ala Lys Ala Gln Asp His Leu Asn Leu Arg Ile Phe Ala Ser Arg 100 105 110 Leu Tyr Tyr His Trp Arg Arg Ser Tyr Gln Lys Gly Leu Gln Leu Leu 115 120 125 Trp Glu Ser Gln Ile Pro Val Glu Val Met Gly Leu Pro Glu Phe Thr 130 135 140 Asp Cys Trp Glu Asn Phe Val Asp His Gly Lys Pro Pro Pro Phe Asn 145 150 155 160 Pro Ser Glu Lys Leu Gln Lys Leu Gly Glu Ala Ser Gln Ser Ile Lys 165 170 175 Arg Arg Leu Glu Arg Ile Lys Val Arg Arg Cys Pro Ala Ala Ala His 180 185 190 Cys Leu Leu Thr Ala Arg Leu Gly Pro Thr Pro Asp His Ala Ser Ala 195 200 205 His Cys Ser Ser Pro Tyr Phe Phe Phe Leu Leu Tyr Leu Phe Tyr Ser 210 215 220 Ile His Pro Ile Ile Lys Tyr His Arg Leu Gly Asp Ser 225 230 235 <210> 378 <211> 197 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 378 Met Ala Ala Val Thr Asn Arg Asp Ser Ala Cys Arg Glu Asn Asn Gln 1 5 10 15 Arg Trp Lys Ile Gln Pro Asn Asp Phe Arg Arg Asn Tyr Leu Pro Asp 20 25 30 Lys Gln Pro Arg Val Val Tyr Leu Leu Tyr Glu Ile Arg Trp Arg Arg 35 40 45 Gly Thr Ile Trp Arg Asn Trp Cys Ser Asn Asn Pro Asn Gln His Ala 50 55 60 Glu Val Asn Phe Leu Lys Asn Tyr Phe Asn Ala Met Pro Ser Val Ser 65 70 75 80 Cys Ser Ile Thr Trp Val Leu Ser Thr Thr Pro Cys Gly Lys Cys Ser 85 90 95 Ile Lys Ile Met Glu Phe Leu Lys Leu His Pro Asn Val Thr Leu Glu 100 105 110 Ile Tyr Ala Ala Lys Leu Phe Lys His Leu Asp Ile Arg Asn Arg Glu 115 120 125 Gly Leu Arg Asn Leu Ala Lys Asn Gly Val Ile Ile His Ile Met Asn 130 135 140 Leu Ala Asp Tyr Ser Tyr Trp Trp Lys Ile Phe Val Thr Arg Gln His 145 150 155 160 Gly Glu Glu Asp Tyr Leu Pro Trp Ser Phe Ala Leu His Ile Phe Leu 165 170 175 Asn Cys Ile Glu Phe Gln Gln Ile Leu Leu Gly Leu Pro Pro Leu Leu 180 185 190 Pro Asn Phe Lys Tyr 195 <210> 379 <211> 333 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 379 Met Pro Cys Val Leu Gly Leu Cys Lys His Leu Ser Glu Thr Ser Ala 1 5 10 15 Val His Cys Pro Ala Leu Leu Ile Ala Leu Arg Gln Ala Val Glu Arg 20 25 30 Leu Leu Ala Pro Leu Leu Gln Asp Pro Leu Tyr Ile Thr Ala Thr Thr 35 40 45 Leu Asp Pro Gln Phe Lys Leu Ser Trp Ser Asn Asn Thr Asp Cys Leu 50 55 60 Gln Thr Val Met Ala Asp Arg Ser Arg Ile Gly Ala Lys Lys Lys Glu 65 70 75 80 Lys Ser Asp Glu Lys Ala Leu Asp Lys Asp Lys Thr Lys Glu Lys Asn 85 90 95 Ala Lys Lys Pro Asp Lys Val Val Lys Lys Ser Glu Lys Leu Pro Glu 100 105 110 Lys Thr Leu Glu Lys Thr Ser Glu Gln Ser Lys Ala Asp Glu Glu Ser 115 120 125 Arg Thr Thr Glu Ala Glu Gly Ala Thr Gly Ser Thr Asn Glu Glu Asn 130 135 140 Gly Glu Phe Gln Pro Ile Glu Leu Pro Pro Phe Glu Ile Val Lys Gly 145 150 155 160 Glu Gln Met Ser Pro Phe Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu 165 170 175 Tyr Ser Ser Gly Arg Asn Lys Thr Leu Leu Cys Tyr Arg Val Asp Thr 180 185 190 Ala Gly Gly Ser Thr Glu Pro Leu Lys Gly Tyr Met Glu Asp Glu His 195 200 205 Thr Thr Ala His Ala Glu Glu Ala Phe Phe Gln Gln Val Leu Pro Asp 210 215 220 Ser Ser Gln His His Asp Val Thr Trp Tyr Val Ser Ser Ser Pro Cys 225 230 235 240 Ala Asp Cys Ala Ala Lys Leu Ala Ser Ile Leu Cys Gln Arg Lys Asn 245 250 255 Leu Lys Leu Cys Val Phe Cys Ser Arg Leu Phe Glu Trp Glu Glu Pro 260 265 270 Glu Ile Val Glu Gly Leu Arg Ala Leu Val Thr Ala Gly Cys Lys Leu 275 280 285 Arg Met Met Lys Pro Ser Asp Phe Met His Val Trp Glu Thr Tyr Val 290 295 300 Asp Lys Glu Glu Gln Asn Phe Ser Pro Trp Glu Asp Cys Gln Asp Asn 305 310 315 320 Tyr Asn Tyr Tyr Val Glu Lys Leu Ala Glu Ile Leu Lys 325 330 <210> 380 <211> 207 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 380 Met Ala Phe Gly Asn Phe Ser Asn Trp Ile Asn Glu Gly Val Asp Glu 1 5 10 15 Ile Gln Phe Thr Lys Glu Leu Tyr Glu Lys Leu Leu Lys His Ser Glu 20 25 30 Gln Glu Ala Ile Ser Tyr Leu Phe Lys Leu Ser Ser Leu Glu His Phe 35 40 45 Asn Gln Trp Lys Phe Tyr Leu Ile Leu Leu Gln Thr Leu Thr Ser Lys 50 55 60 Cys Ser Asp Glu Asn Gly Ala Phe Ile Arg Lys Tyr Leu Lys Thr Arg 65 70 75 80 Leu Thr Gln Ile Ala Ala Leu Pro Lys Arg Glu Tyr Met Leu His Leu 85 90 95 Leu Leu Ser Val Arg Ala Ala Thr Ala Thr Thr Met Asp Ile Asp Lys 100 105 110 Asn Ile Thr Ala Tyr Ala Asp Trp Tyr Lys Arg Asn Val Ala Asp Met 115 120 125 Lys Phe Val Leu Lys Val Glu Glu Phe Lys Ala Ile Ile Asp Leu Leu 130 135 140 Glu Gln Cys Ile Pro Tyr Glu Ser Leu Glu Asp Tyr Leu Glu Ile His 145 150 155 160 Ala Thr Phe Ser Ile Ser Pro Pro Ile His Cys Gly Lys Leu Val Gln 165 170 175 Ser Tyr Lys Ser Lys Cys Lys Met Gln Leu Ala Lys Ile Lys Ser Lys 180 185 190 Val Lys Gln Gly Asn Glu His Glu Glu Ser Ile Val Ile Asp Asp 195 200 205 <210> 381 <211> 383 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 381 Met Thr Gln Thr Glu Ile Lys Ile Gly Arg Lys Lys Leu Arg Ile Asn 1 5 10 15 Ile Lys Thr Ile Asp Glu Leu Glu Lys Ala Met Lys Asn Glu Gly Tyr 20 25 30 Asn Val Ala Ser Phe Glu Asn Leu Asn Val Glu Glu Phe Lys Ser Glu 35 40 45 Ile Cys Asn Leu Val Asn Ile Lys Pro Asn Val Ala Glu His Ile Tyr 50 55 60 Phe Asn Met Ser Gln Cys Glu Arg Glu Ile Ser Tyr Arg Ser Asn Asn 65 70 75 80 Val Gln Asp Phe Leu Asp Tyr Met Glu Lys Ile Thr Glu Ile Lys Glu 85 90 95 Tyr Glu Lys Ile Leu Trp Lys Lys Ile Arg Lys Val Asp Lys Ile His 100 105 110 Ile Asp Arg Ile Glu Tyr Asp Arg Lys Pro Ser Ile Gln Glu Asp Val 115 120 125 Glu His Met Ile Asn Ala Ile Lys Asn Val Lys Asn Thr Met Cys Gly 130 135 140 Lys Ile Asp Glu Tyr Glu Lys Leu Arg Leu Tyr Glu Leu Glu Thr Gly 145 150 155 160 Ile Asp Glu Asn Tyr Ile Tyr Ala Lys Asp Ile Glu Leu Leu Lys Lys 165 170 175 Met Ile Ile Lys Asp Lys Gly Lys Val Lys Asn Thr Tyr Asp Glu Phe 180 185 190 Thr Cys Asn Lys Arg Ile Tyr Ile Asp Ile Pro Glu Asn Met Asn Ser 195 200 205 Ser Tyr Ile Lys Pro Leu Glu Gly Ser Ile Glu Tyr His Glu His Ile 210 215 220 Ser Arg Asn Ile Pro Arg Ile Lys Arg Leu Ile Lys Asn Leu Asp Lys 225 230 235 240 Tyr Met Lys Ile Thr Ser Asp Glu Glu Gly Asn Lys Val Cys Glu Ile 245 250 255 Asn Gln Ser Lys Ala Leu Gln Asp Ser Ile Asn Ile Ala Val Ala Val 260 265 270 Tyr Asn Gln Lys Glu Phe Lys Ala Val Ser Gly Ser Asp Glu Val Asp 275 280 285 Asp Tyr Cys Met Ala Met Glu Lys Glu Glu Thr Val Phe Glu Ser Cys 290 295 300 Arg Val Asn Arg Leu Gly Lys Ile Gly Ile Gly Tyr Asn Arg Phe Tyr 305 310 315 320 Asp Ser Glu Lys Lys Ile Leu Glu Glu Ile His Lys Gln Ile Glu Glu 325 330 335 Lys Lys Leu Asp Asp Arg Gly Asn Leu Val Met Tyr Ser Arg Trp Glu 340 345 350 Pro Cys Pro Ser Cys Tyr Tyr Val Ile Ser Gln Phe Cys Ser Ala His 355 360 365 Pro Gln Ile Glu Val Ser Val Lys Phe Asp Lys Ser Tyr Gly Glu 370 375 380 <210> 382 <211> 197 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 382 Met Val Thr Arg Val Arg Lys Phe His Tyr Ser Glu Asp Thr Asn Gly 1 5 10 15 Gln Val Leu Arg Arg Ile Ser Lys Gln Tyr Lys Lys Arg Ile Asn Leu 20 25 30 Thr Ala Arg Arg Lys Glu Lys Asn Asp Gln Asp Tyr Ser Phe Glu Tyr 35 40 45 Arg Met Ser Tyr Pro Arg Phe Glu Gly Gly Asn Asp Ala Val Leu Glu 50 55 60 Tyr Val Arg Pro Gly Arg Thr Thr Lys Val Glu Arg Phe Leu Tyr Tyr 65 70 75 80 Ala Asn Ser Ala Val Asn Asp Arg Tyr Ser Pro Phe Ala Met Leu Gly 85 90 95 Gly Arg Arg Gly Gln Tyr Thr Leu Ile Pro Ala Glu Pro Lys Phe Ser 100 105 110 His Phe Arg Thr Thr Arg Lys Arg Glu Val Asn Met Gly Thr Leu Arg 115 120 125 Glu Asn Asp Thr Glu Tyr Lys Leu Leu Glu Arg Val Thr Gln Asp Ile 130 135 140 Leu Ser Gln Asp Glu Arg Gly Leu Ile Arg Met Tyr Thr Tyr Tyr Glu 145 150 155 160 Pro Cys Leu Ser Cys Asp Tyr Val Met Ile Gln Phe Ile Asn Met Tyr 165 170 175 Pro Asn Ile Lys Ile Asp Val Tyr Tyr Glu Glu Asp Tyr Lys Pro Glu 180 185 190 Glu Lys Gly Leu Ile 195 <210> 383 <211> 373 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 383 Met Ile Glu Asn Pro Ala Leu Lys Ile Ser Lys Arg Asp Arg Ile Lys 1 5 10 15 Ile Ser Asn Leu Lys Asp Leu Lys Asn Ala Leu Lys Asn Glu Asn Tyr 20 25 30 Asn Ile Lys Ala Asn Asp Lys Glu Lys Phe Lys Asp Glu Val Lys Lys 35 40 45 Val Phe Asn Ile Asn Asp Asp Ile Phe Glu Arg Leu Asp Lys Cys Leu 50 55 60 Asn Arg Asp Ile Thr Tyr Lys Val Asp Asn Val Glu Asp Phe Ile Asp 65 70 75 80 Tyr Ile Lys Lys Ile Met Ile Phe Glu Asp Lys His Glu Ile Ile Cys 85 90 95 Glu Lys Leu Lys Arg Ile Lys Lys Leu Tyr Ile Asn Arg Glu Glu Tyr 100 105 110 Glu Arg Glu Lys Ser Thr Arg Asp Asn Val Glu His Ile Ile Glu Val 115 120 125 Ile Glu Lys Thr Lys Glu Asn Val Ser Arg Lys Ile Ser Leu Glu Glu 130 135 140 Leu Glu Arg Leu Glu Ile Leu Glu Glu Glu Leu Glu Asp Lys Tyr Leu 145 150 155 160 Phe Ala Lys Asp Ile Glu Phe Leu Lys Lys Met Ile Leu Gly Asn Cys 165 170 175 Lys Asn Val Ile Glu Ser Tyr Asn Glu Lys Thr Lys Ile Lys Thr Leu 180 185 190 Lys Met Lys Ile Pro Lys Glu Ile Asn Tyr Ser Tyr Ile Lys Ala Lys 195 200 205 Glu Gly Ser Val Glu Tyr His Gln Tyr Leu Asn Asn Asn Ile Asn Arg 210 215 220 Met Asn Arg Leu Ile Lys Ser Ile Asp Lys Tyr Ile Glu His Tyr Lys 225 230 235 240 Asp Asp Ile Phe Asn Ile Asn Gln Ser Leu Ala Leu Gln Asp Ser Ile 245 250 255 Asn Ile Ala Leu Ala Thr Phe Asp Asn Lys Glu Phe Lys Ala Ile Ser 260 265 270 Gly Lys Asn Asp Ile Glu Asp Tyr Cys Lys Val Ile Pro Ile Glu Lys 275 280 285 Ser Arg Phe Lys Ser Arg Lys Val Asn Lys Leu Gly Glu Leu Gly Ile 290 295 300 Gly Tyr Asn Arg Ile Asn Asp Ser Glu Lys Lys Ile Leu Glu Glu Ile 305 310 315 320 His Glu Lys Ile Lys Gln Lys Ile Leu Lys Asp Arg Gly Asn Leu Thr 325 330 335 Leu Tyr Thr Lys Trp Glu Pro Cys Pro Ser Cys Tyr Phe Val Ile Ser 340 345 350 Gln Phe Cys Glu Lys Tyr Pro Asn Ile Lys Val Glu Val Lys Tyr Asn 355 360 365 Lys Lys Tyr Gly Glu 370 <210> 384 <211> 330 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 384 Met Arg Arg Lys Lys Pro Ser Gly Met Tyr Ile Ser Lys Arg Ala Leu 1 5 10 15 Lys Asp Asn Phe Asp Pro His Lys Phe Pro His Asp Thr Tyr Leu Leu 20 25 30 Cys Lys Leu Gln Trp Gly Asp Thr Gly Arg Ser Trp Ile His Trp Ile 35 40 45 Arg Lys Asp Arg Tyr His Ala Glu Val Tyr Phe Leu Glu Lys Ile Phe 50 55 60 Lys Met Arg Arg Ser Lys Asn Tyr Val Asn Cys Ser Ile Thr Trp Tyr 65 70 75 80 Leu Ser Trp Ser Pro Cys Val Arg Cys Cys Cys Glu Ile Leu Asn Phe 85 90 95 Leu Glu Lys His Ser Tyr Val Asn Ile Asp Ile Tyr Val Ala Arg Leu 100 105 110 Tyr Lys Ile Gln Asn Ser Glu Val Arg Glu Gly Leu Lys Lys Leu Val 115 120 125 Ser Ser Lys Lys Val Thr Ile Ala Val Met Glu Ile Lys Asp Tyr Thr 130 135 140 Tyr Cys Trp Lys Asn Phe Ile Gln Gly Asp Ala Asp Asp Asp Ser Trp 145 150 155 160 Thr Val Asp Phe Gln Ser Ala Ile Thr Lys Asn Arg Leu Lys Leu Lys 165 170 175 Asp Val Phe Glu Phe Leu Lys Ser His Pro Asn Val Thr Leu Glu Ile 180 185 190 Tyr Ala Ala Lys Leu Phe Lys His Leu Asp Ile Arg Asn Arg Glu Gly 195 200 205 Leu Arg Asn Leu Ala Lys Asn Gly Val Ile Ile His Ile Met Asn Leu 210 215 220 Ala Asp Tyr Ser Tyr Trp Trp Lys Ile Phe Val Thr Arg Gln His Gly 225 230 235 240 Glu Asp Asp Tyr Leu Pro Trp Ser Phe Ala Leu His Ile Phe Leu Asn 245 250 255 Cys Ile Glu Phe Gln Gln Ile Leu Leu Val Ser Arg His Leu Lys Glu 260 265 270 Ser Leu Arg Val Lys Ser Asn Glu Lys Ala Gln Glu Lys Glu Val Trp 275 280 285 Arg Ile Pro Ala Met Val Leu Ala Glu Met Ile Val Gly Lys Met Asn 290 295 300 Arg Asp Leu Met Leu His Glu Gln Arg Ala Asn Arg Ala Arg Asn Cys 305 310 315 320 Lys Gly Leu Trp Cys Tyr Ile Val Pro Leu 325 330 <210> 385 <211> 195 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 385 Met Ser Asn Val Arg Lys Tyr His Tyr Ser Val Asn Ser Val Gly Glu 1 5 10 15 Glu Leu Lys Lys Leu Val Glu Tyr His Lys Arg Arg Thr Glu Met Tyr 20 25 30 Ala Arg Ile Lys Ala Lys Asn Asn Pro Ser Ala Tyr Arg Asn Tyr Leu 35 40 45 Asn Glu Leu Pro Gly Phe Glu Gly Gly Asn Asp Ala Ile Leu Ile Phe 50 55 60 Gln Val Asn Gly Asn His Lys Ser Arg Ile Arg Arg Cys Ala Asn Ser 65 70 75 80 Phe Val Asn Asp Ser Thr Ser Ser Phe Ala Asn Ile Pro Val Asn Phe 85 90 95 Thr Gly Lys Tyr Val Leu Ile Pro His Pro Pro Ala Gln Lys Phe Ser 100 105 110 Tyr Ile Cys Thr Asn Lys His Arg Glu Ile Gly Val Gly His Tyr Arg 115 120 125 Asn Asn Asp Thr Glu Tyr Lys Leu Leu Glu Asp Ile Ser Arg Arg Ile 130 135 140 Thr Pro Thr Leu Val Gly His Ile Asn Leu Phe Thr Phe Tyr Glu Pro 145 150 155 160 Cys Leu Ser Cys Asp Tyr Val Ile Ile Gln Phe Ala Asn Lys Tyr Pro 165 170 175 Leu Ile Thr Ile Asp Val Tyr Phe Glu Glu Glu Tyr Arg Pro Glu Asn 180 185 190 Gly Val Ile 195 <210> 386 <211> 202 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 386 Met Val Ala Ile Val Arg Lys Met His Tyr Glu Asp Asn Lys Glu Gly 1 5 10 15 Ile Arg Leu Gln Arg Arg Ser Arg Gln Tyr Lys His Ala Met Leu Gln 20 25 30 Met Ala Asp Arg Lys Ala Thr Met Asp Ser Val Tyr Gln Lys Val Met 35 40 45 Asn Leu Ser Val Leu Arg Phe Thr Gly Gly Asn Asp Ala Val Leu Glu 50 55 60 Tyr Ser Ile Cys Ile Asp Pro Asp Arg Asn Lys Lys Leu Lys Lys Pro 65 70 75 80 Val Ser Arg Tyr His Ala Asn Ser Ala Val Asn Asp Met Asn Ser Pro 85 90 95 Phe Ala Lys Ile Met Gly Asn Arg Ile Arg Tyr Thr Leu Ile Pro Gln 100 105 110 Lys Ser Thr Phe Ile His Phe His Thr Asn Arg Asn Arg Glu Ile Asn 115 120 125 Asn Gly Thr Pro Arg Glu Asn Asp Thr Glu Tyr Lys Leu Leu Glu Lys 130 135 140 Val Lys Glu Asp Ile His Asp Arg Tyr Gln Glu Gly Leu Ile Arg Met 145 150 155 160 Tyr Thr Tyr Tyr Glu Pro Cys Leu Ser Cys Asp Tyr Val Ile Ile Gln 165 170 175 Phe Thr Glu Arg Tyr Pro Asn Ile Asp Ile Glu Ile Tyr Tyr Glu Glu 180 185 190 Glu Tyr Lys Pro Gln Glu Lys Gly Leu Ile 195 200 <210> 387 <211> 365 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 387 Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Arg Thr 1 5 10 15 Phe Tyr Tyr Asn Phe Glu Asn Lys Pro Ile Leu Cys Gly Arg Ser Tyr 20 25 30 Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu 35 40 45 Pro Trp Asp Lys Gly Val Phe Arg Gly Gln Val Leu Pro Lys Phe Gln 50 55 60 Ser Asn His Arg Gln Glu Val Tyr Phe Gln Leu Glu Asn His Ala Glu 65 70 75 80 Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro Ala Asn Arg 85 90 95 Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro Cys Leu Pro Cys 100 105 110 Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Pro Asn Val Thr Leu 115 120 125 Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Gly Arg Asp Trp Arg 130 135 140 Arg Ala Leu Arg Arg Leu His Lys Ala Gly Ala Arg Val Lys Ile Met 145 150 155 160 Asp Tyr Glu Asp Phe Ala Tyr Cys Trp Glu Asn Phe Val Cys Asn Glu 165 170 175 Gly Gln Pro Phe Lys Pro Trp Tyr Lys Phe Asn Asp Asn Tyr Ala Phe 180 185 190 Leu His His Arg Leu Asn Glu Ile Leu Arg Asn Pro Met Glu Val Thr 195 200 205 Tyr Pro His Ile Phe Tyr Phe His Phe Glu Asn Leu Arg Lys Ala Tyr 210 215 220 Gly Arg Asn Glu Thr Trp Leu Cys Phe Thr Met Lys Val Ile Lys Trp 225 230 235 240 Pro Ser Arg Val Ser Trp Lys Ser Gly Val Phe Arg Asn Gln Val Ala 245 250 255 Pro Lys Pro His Cys His Ala Glu Met Cys Phe Leu Ser Cys Pro Cys 260 265 270 Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn 275 280 285 Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Trp Asn Thr 290 295 300 Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Glu Glu Gly Ala Ser Val 305 310 315 320 Glu Ile Met Glu Tyr Lys His Phe Lys Tyr Cys Trp Glu Asn Phe Val 325 330 335 Tyr Asn Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr Asn 340 345 350 Phe Arg Phe Leu Glu Arg Lys Leu Trp Glu Ile Ile Lys 355 360 365 <210> 388 <211> 204 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 388 Met Val Ala Lys Lys Thr Lys Val Thr Lys Phe His Tyr Lys Ser Asn 1 5 10 15 Glu His Gly Ile Glu Leu His Lys Met Cys Lys Ala Gln Asn Glu Trp 20 25 30 Val Leu Lys Met Ala Lys Gly Arg Ser Glu Arg Asn Leu Met Tyr Asn 35 40 45 Val Lys Tyr His Leu Ala Phe Pro Arg Phe Lys Gly Gly Asn Asn Ala 50 55 60 Val Leu Val His Leu Glu Tyr Val Gly Lys Asp Lys Asn Lys Thr Arg 65 70 75 80 Pro Arg Ala Val Phe His Ala Ser Ser Ala Val Asp Asp Ser Asp Ser 85 90 95 Pro Phe Ala Arg Val Gly Gly Gly Ser Arg Arg Lys Tyr Ala Leu Ile 100 105 110 Pro Ser Lys Pro Met Phe Lys Pro Ile Arg Thr Asn Arg Asn Arg Asp 115 120 125 Ile Asn His Gly His Phe Arg Glu Asn Asp Thr Glu Tyr Lys Leu Leu 130 135 140 Glu Lys Val Ser Gln Tyr Ile Asp Asp Lys Asp Glu His Ser Leu Ile 145 150 155 160 Arg Met Tyr Thr Asp Leu Glu Pro Cys Leu Ser Cys Asp Tyr Val Ile 165 170 175 Ile Gln Phe Thr Lys Arg Tyr Pro Asn Ile Asn Ile Glu Val Tyr Tyr 180 185 190 Lys Asp Glu Tyr Lys Pro Lys Gly Glu Gly Leu Ile 195 200 <210> 389 <211> 242 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 389 Met Asn Pro Leu Gln Glu Val Ile Phe Cys Arg Gln Phe Gly Asn Gln 1 5 10 15 His Arg Val Pro Lys Pro Tyr Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr 20 25 30 Gln Leu Lys Leu Pro Glu Gly Thr Leu Ile His Lys Asp Cys Leu Arg 35 40 45 Asn Lys Lys Lys Arg His Ala Glu Met Cys Phe Ile Asp Lys Ile Lys 50 55 60 Ala Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile Ile Cys Tyr Ile 65 70 75 80 Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu Val Ala Phe Val 85 90 95 Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala Ser Arg Leu Tyr 100 105 110 Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu Arg His Leu His Ala 115 120 125 Ser Gly Ile Pro Val Ala Val Met Ser Leu Pro Glu Phe Glu Asp Cys 130 135 140 Trp Arg Asn Phe Val Asp His Gln Asp Arg Ser Phe Gln Pro Trp Pro 145 150 155 160 Asn Leu Asp Gln Tyr Ser Lys Ser Ile Lys Arg Arg Leu Gly Lys Ile 165 170 175 Leu Thr Val Arg Ser Cys Pro Cys Cys Arg His Leu Ala Ser Leu Pro 180 185 190 Leu Gly Leu Pro Phe Pro Ala His Arg Pro Leu Leu Ser Val Leu Ala 195 200 205 Leu Cys Pro Gln Cys Pro Ser Thr Pro Phe Ser Phe Leu Glu Thr Pro 210 215 220 Val Pro Pro Val Gly Ala Pro Arg Leu Pro Leu Pro Ser Leu Ala Pro 225 230 235 240 Phe Ser <210> 390 <211> 486 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 390 Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Pro Thr 1 5 10 15 Phe Tyr Tyr Asn Phe Glu Asn Glu Pro Ile Leu Cys Arg Arg Ser Tyr 20 25 30 Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu 35 40 45 Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Phe Gln Pro Glu 50 55 60 Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 65 70 75 80 Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro 85 90 95 Cys Pro Asp Cys Val Ala Lys Val Ala Val Phe Leu Ala Glu His Pro 100 105 110 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu 115 120 125 Lys Asp Trp Gln Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg 130 135 140 Val Lys Ile Met Asp Tyr Glu Glu Phe Glu Tyr Cys Trp Glu Asn Phe 145 150 155 160 Val Tyr Asn Glu Gly Glu Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp 165 170 175 Asn Tyr Ala Phe Pro His Arg Phe Asp Ala Asn Tyr Ala Phe Leu His 180 185 190 His Thr Leu Lys Glu Ile Leu Arg His Leu Met Asp Pro Asp Thr Phe 195 200 205 Thr Phe Asn Phe Asn Asn Asp Pro Leu Val Phe Gly Arg His Gln Thr 210 215 220 Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Trp Val Lys 225 230 235 240 Met Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asp Pro Leu 245 250 255 Tyr Gly Phe Asp Gly Arg His Thr Glu Leu Cys Phe Leu Gly Leu Ile 260 265 270 Pro Tyr Trp Gln Leu Asp Leu Ala Gln Thr Tyr Arg Val Thr Trp Phe 275 280 285 Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Glu Gln Val Arg 290 295 300 Ala Phe Leu Gln Glu Asn Thr His Met Arg Leu Arg Ile Phe Ala Ala 305 310 315 320 Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu 325 330 335 Arg Gly Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Glu 340 345 350 His Cys Trp Asp Thr Phe Val Asp His Gln Gly Arg Pro Phe Gln Pro 355 360 365 Trp Asp Gly Leu Glu Glu His Ser Gln Ala Leu Ser Gly Arg Leu Gln 370 375 380 Ala Ile Leu Leu Val Arg Ala Ser Ser Leu Cys Pro Val Pro His Arg 385 390 395 400 Pro Pro Pro Pro Pro Leu Ser Pro Gly Pro Cys Leu Pro Leu Cys Ser 405 410 415 Glu Pro Pro Leu Gly Ser Leu Leu Pro Thr Gly Cys Pro Ala Pro Ser 420 425 430 Leu Pro Phe Leu Leu Thr Ala Ser Leu Ser Pro Ala Ser Arg Leu Leu 435 440 445 Pro Val Pro Ser Phe His Ser Leu Thr Ser Cys Ser Ile Gln Pro Ser 450 455 460 Cys Ser Ser Ile Ile Arg Glu Thr Glu Gly Trp Ala Ser Val Ser Lys 465 470 475 480 Glu Gly Arg Asp Leu Val 485 <210> 391 <211> 174 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 391 Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His 1 5 10 15 Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr 20 25 30 Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met 35 40 45 Asp Gln His Arg Gly Phe Leu His Asn Gln Leu Asp Pro Ala Gln Ile 50 55 60 Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly 65 70 75 80 Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg 85 90 95 Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys 100 105 110 Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met 115 120 125 Thr Tyr Asp Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln 130 135 140 Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala 145 150 155 160 Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn 165 170 <210> 392 <211> 189 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 392 Met Ala Glu Lys Gln Glu Glu Pro Ser Asn Ala Gln Asn Gly Glu Pro 1 5 10 15 Asp Asn Ala Glu Glu Gly Glu Gly Lys Lys Lys Lys Val Lys Arg Glu 20 25 30 Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro Ala Ile 35 40 45 Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly Arg Asn 50 55 60 Lys Thr Phe Leu Cys Tyr Val Val Glu Thr Gln Gly Lys Glu Ala Ala 65 70 75 80 Thr Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala Ala His Ala Glu 85 90 95 Met Ala Phe Phe Asn Ser Ile Leu Pro Lys Cys Gln Ala Gly Ala Arg 100 105 110 His Asp Val Thr Trp Leu Phe Met Trp Glu Glu Pro Glu Met Gln Ala 115 120 125 Ala Leu Arg Gly Met Lys Glu Ala Gly Cys Lys Leu Arg Ile Met Lys 130 135 140 Pro Gln Asp Phe Glu Tyr Val Trp Lys Asn Phe Val Glu Pro Glu Glu 145 150 155 160 Gly Glu Glu Ala Lys Ser Phe Val Pro Trp Glu Asp Ile Gln Glu Asn 165 170 175 Phe Gln Tyr Tyr Glu Glu Lys Leu Ala Glu Ile Leu His 180 185 <210> 393 <211> 420 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 393 Met Glu Pro Gln His Pro Arg Gln Arg Ala Gly Met Gly Leu Ala Ser 1 5 10 15 Lys Gly Gly Cys Ser Gln Arg Pro Arg Ile Arg Asn Pro Val Glu Trp 20 25 30 Leu Asp His Gln Thr Phe Ser Phe His Phe Arg Asn Leu Arg Phe Ala 35 40 45 Ser Gly Arg Asn Cys Thr Tyr Leu Cys Tyr Gln Val Glu Arg Leu Lys 50 55 60 His Phe Ser Pro Asp Ser Ser Asp Trp Gly Val Phe Gln Asn Arg Val 65 70 75 80 Tyr Pro Glu Thr Pro Cys His Ala Glu Leu Cys Phe Leu Ser Trp Phe 85 90 95 Arg Thr Lys Lys Leu Ser Pro Tyr Glu Gln Tyr Arg Ile Thr Trp Phe 100 105 110 Leu Ser Trp Ser Pro Cys Leu Pro Cys Ala Glu Gln Val Ala Ala Phe 115 120 125 Leu Lys Glu Asn Arg Asn Val Arg Leu Ser Ile Phe Ala Ala Arg Leu 130 135 140 Tyr Tyr Phe Trp Lys Pro Asp Cys Gln Gln Gly Leu Arg Ala Leu His 145 150 155 160 Gln Gln Arg Ala Trp Val Arg Ile Met Ser Phe Arg Asp Phe Lys Tyr 165 170 175 Cys Trp Lys Asn Phe Val Tyr Asn Gln Gly Met Pro Phe Lys Pro Trp 180 185 190 Lys Lys Leu Arg Lys Asn Tyr Gln Phe Leu Val Ala Lys Leu His Glu 195 200 205 Ile Leu Gly Asn Thr Met Asn Leu Leu Lys Lys His Ile Phe Arg Gln 210 215 220 Gln Phe Gly Asn Gln His Arg Val Pro Gln Pro Tyr Tyr Arg Arg Lys 225 230 235 240 Thr Tyr Leu Cys Tyr Gln Leu Lys Gln Leu Asp Gly Phe Thr Leu Asp 245 250 255 Lys Gly Cys Phe Gln Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe 260 265 270 Ile Asp Lys Ile Thr Ser Leu Asn Leu Asp Pro Asn Gln Ser Tyr Lys 275 280 285 Ile Ile Cys Tyr Val Thr Trp Ser Pro Cys Pro Thr Cys Ala Lys Glu 290 295 300 Leu Val Asp Phe Ile Asn Gly Gln Asp His Leu Ser Leu Gln Ile Phe 305 310 315 320 Ala Ser Arg Leu Tyr Phe His Trp Val Lys Val Phe Gln Arg Gly Leu 325 330 335 Gln Gln Leu Gln Ala Ala Gln Val Ser Val Ala Val Met Thr Arg Ser 340 345 350 Glu Phe Glu Asp Cys Trp Glu Glu Phe Val Asp Asn Gln Gly Met Pro 355 360 365 Phe Glu Ser Trp Asp Lys Leu Glu Gln Tyr Ser Glu Ser Ile Ser Arg 370 375 380 Arg Leu Gln Lys Ile Leu Ser Pro Ser Asn Trp Asn Asn Leu Glu Asp 385 390 395 400 Ser Phe Arg Asp Leu Arg Leu Gly Ser Pro Ser Pro Ser Ser Leu Arg 405 410 415 Ser Asp Ser Arg 420 <210> 394 <211> 252 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 394 Met Glu Asp Asn Ala Ala Pro Glu Pro Arg Pro Leu Leu Asp Gln Gly 1 5 10 15 Thr Phe Met Asp His Phe Ala Asn Glu Asp Gly Gly Arg Gly Leu Asn 20 25 30 Glu Thr Tyr Leu Cys Tyr Glu Val Gln Leu Leu Asp Gly Ser Ser Gln 35 40 45 His Gln Gly Phe Leu Arg Asn Lys Asn Phe Cys Ile Asp Phe Asp Pro 50 55 60 Ser Leu Arg Arg His Ala Glu Leu Cys Phe Leu Asp Leu Val Pro Ala 65 70 75 80 Trp Arg Leu Asp Pro Ala Gln His Tyr Arg Val Thr Trp Phe Ile Ser 85 90 95 Trp Ser Pro Cys Phe Leu Cys Ala Gln Ala Val Ala Glu Phe Leu Arg 100 105 110 Arg Asn Ala His Val Ser Leu Arg Ile Phe Ala Ala Arg Ile Tyr Thr 115 120 125 Trp Arg Thr Asp Tyr Lys Ala Gly Leu Gln Asp Leu Gln Arg Ala Gly 130 135 140 Ala Gln Ile Ala Ile Met Thr Pro Ala Glu Ile Gln Phe Cys Trp Asn 145 150 155 160 Thr Phe Val Asp Asn Gln Ser Asn Pro Phe His Ser His Leu Gly Leu 165 170 175 Gly His Ala Lys Pro Ala Pro Ala Glu Gly Ala Ala Glu His Pro Pro 180 185 190 Gly Ser Leu Asn Arg Ala Gly Ala Leu Pro Gly Ala Ser Arg Lys Lys 195 200 205 Phe Cys Ile Arg Glu Arg Arg Pro Arg Thr Pro Arg Thr Pro Arg Thr 210 215 220 Pro Arg Arg Gln Pro Ser Pro Ala Val Arg Arg Arg Pro Arg Arg Asp 225 230 235 240 Trp Ser Asp Ala Leu Arg Val Gly Met Arg Arg Phe 245 250 <210> 395 <211> 413 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 395 Met Ala Gly Leu Gly Gln Ala Cys Glu Gly Cys Cys Gly Gln Met Pro 1 5 10 15 Glu Ile Ser Tyr Pro Met Gly Arg Leu Asp Pro Lys Thr Phe Ser Phe 20 25 30 Glu Phe Lys Asn Leu Leu Tyr Ala Tyr Arg Arg Lys Ser Ser Tyr Leu 35 40 45 Cys Phe Gln Val Glu Arg Glu Gln His Ser Ser Pro Val Pro Ser Asp 50 55 60 Trp Gly Val Phe Glu Asn Gln Phe Tyr His Ala Glu Leu Arg Phe Leu 65 70 75 80 Asn Trp Phe Arg Ala Glu Lys Leu Ser Pro Tyr Glu His Tyr Asp Val 85 90 95 Thr Trp Phe Leu Ser Trp Ser Pro Cys Ser Thr Cys Ala Lys Lys Ile 100 105 110 Ala Ile Phe Leu Ser Asn His Lys Asn Val Arg Leu Ser Ile Phe Val 115 120 125 Ser Arg Ile Tyr Tyr Phe Trp Lys Pro Ala Phe Arg Gln Gly Leu Gln 130 135 140 Glu Leu Asp His Leu Gly Val Gln Leu Asp Ala Met Ser Phe His Asp 145 150 155 160 Phe Lys Tyr Cys Trp Glu Asn Phe Val Asp Asn Gln Gly Met Pro Phe 165 170 175 Arg Cys Trp Lys Lys Val His Arg Asn Tyr Lys Phe Val Leu Arg Lys 180 185 190 Leu Asn Glu Ile Leu Arg Asn Met Asn Leu Leu Ser Glu Lys Thr Phe 195 200 205 Asn Tyr His Phe Gly Asn Gln Leu Arg Val Lys Lys Pro Gln Gly Arg 210 215 220 Arg Arg Thr Tyr Leu Cys Tyr Lys Leu Lys Leu Pro Asn Glu Thr Phe 225 230 235 240 Asp Lys Gly Tyr Phe Ile Asn Lys Lys Lys Asn His Ala Glu Ile Arg 245 250 255 Phe Ile Asn Lys Ile Arg Ser Leu Asn Leu Asp Gln Thr Gln Ser Tyr 260 265 270 Lys Ile Thr Cys Tyr Ile Thr Trp Ser Pro Cys Ser Tyr Cys Ala Gly 275 280 285 Lys Leu Val Ala Leu Val Lys Ser Cys Pro His Leu Ser Leu Gln Ile 290 295 300 Phe Thr Ser Arg Leu Tyr Tyr His Trp Leu Trp Lys Asn Gln Ala Gly 305 310 315 320 Leu Arg Tyr Leu Trp Lys Ile Asn Ile Pro Val Leu Val Met Lys Glu 325 330 335 Pro Asp Phe Ala Asp Cys Trp Asp Asn Phe Val Asn His Gln Ser Arg 340 345 350 Arg Phe Lys Pro Trp Glu Lys Leu Thr Gln Tyr Ser Asn Ser Thr Glu 355 360 365 Arg Arg Leu Leu Arg Ile Leu Arg Ile Asn Arg Thr Asp Leu Phe Leu 370 375 380 Ala Gln Ser Ser Glu Gln Asp Pro Gly Leu Asn Asp Leu Val Asp Ala 385 390 395 400 Ile Lys Arg Leu Phe Leu Asp Ala His Arg Pro Arg Asp 405 410 <210> 396 <211> 120 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 396 Met Ala Gly Leu Gly His Ala Cys Glu Gly Cys Cys Gly Gln Met Pro 1 5 10 15 Glu Ile Ser Tyr Pro Met Glu Gly Leu Asp Pro Glu Thr Phe Phe Phe 20 25 30 Glu Phe Gln Asn Leu Leu Tyr Ala Tyr Gly Arg Lys Ser Ser Tyr Leu 35 40 45 Cys Phe Gln Val Glu Arg Glu Gln His Ser Ser Pro Val Pro Ser Asp 50 55 60 Cys Gly Val Phe Lys Asn Gln Val Trp Ala Pro Leu Leu Ser Lys Ala 65 70 75 80 Gly Ala Lys Pro Val Glu Asp Ala Glu Lys Asn Ile Thr Cys Lys Met 85 90 95 Pro Ser Ala Ser Ser His Asn Asn Val Gln Cys Pro Gly Pro Leu Met 100 105 110 Ser Leu Pro Asp Pro Pro Ala Ser 115 120 <210> 397 <211> 235 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 397 Met Asn Ser Lys Thr Gly Pro Ser Val Gly Asp Ala Thr Leu Arg Arg 1 5 10 15 Arg Ile Lys Pro Trp Glu Phe Val Ala Phe Phe Asn Pro Gln Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Asn Gln Asn 35 40 45 Ile Trp Arg His Ser Asn Gln Asn Thr Ser Gln His Ala Glu Ile Asn 50 55 60 Phe Met Glu Lys Phe Thr Ala Glu Arg His Phe Asn Ser Ser Val Arg 65 70 75 80 Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser 85 90 95 Lys Ala Ile Arg Lys Phe Leu Asp His Tyr Pro Asn Val Thr Leu Ala 100 105 110 Ile Phe Ile Ser Arg Leu Tyr Trp His Met Asp Gln Gln His Arg Gln 115 120 125 Gly Leu Lys Glu Leu Val His Ser Gly Val Thr Ile Gln Ile Met Ser 130 135 140 Tyr Ser Glu Tyr His Tyr Cys Trp Arg Asn Phe Val Asp Tyr Pro Gln 145 150 155 160 Gly Glu Glu Asp Tyr Trp Pro Lys Tyr Pro Tyr Leu Trp Ile Met Leu 165 170 175 Tyr Val Leu Glu Leu His Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu 180 185 190 Lys Ile Ser Gly Ser His Ser Asn Gln Leu Ala Leu Phe Ser Leu Asp 195 200 205 Leu Gln Asp Cys His Tyr Gln Lys Ile Pro Tyr Asn Val Leu Val Ala 210 215 220 Thr Gly Leu Val Gln Pro Phe Val Thr Trp Arg 225 230 235 <210> 398 <211> 378 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 398 Met Thr Gln Glu Asn Thr Gln Leu Lys Lys Lys Ile Lys Lys Glu Arg 1 5 10 15 Ile Arg Ile Asn Asn Leu Ser Asp Phe Arg Ala Ala Leu Lys Lys Glu 20 25 30 Gly Tyr Asn Ile Asn Gly Leu Glu Glu Glu Lys Phe Ile Asp Lys Ile 35 40 45 Ile Asp Ile Leu Lys Leu Asp Arg Ser Val Ala Lys Lys Ile Phe Ala 50 55 60 Ser Phe Lys Asp Thr Ala Val Thr Tyr Arg Ala Asn Asp Ile Met Asp 65 70 75 80 Phe Ile Asp Tyr Met Lys Lys Ile Ser Leu Phe Glu Asn Glu His Asn 85 90 95 Lys Leu Cys Glu Lys Ile Arg Lys Ile Glu Lys Leu Ser Ile Ala Arg 100 105 110 Val Glu Tyr Glu Arg Glu Leu Lys Val Lys Asp Asp Val Glu His Ile 115 120 125 Ile Thr Arg Ile Glu Glu Ile Lys Ser Asp Ile Ser Glu Ile Ala Asn 130 135 140 His Glu Glu Lys Glu Lys Leu Tyr Ser Leu Glu Lys Glu Ile Glu Lys 145 150 155 160 Glu Tyr Leu Tyr Ala Lys Asp Ile Glu Leu Leu Lys Lys Met Leu Ile 165 170 175 Thr Arg Lys Glu Cys Ser Arg Glu Lys Tyr Asn Glu Glu Thr Lys Ile 180 185 190 Lys Val Val Ser Ile Glu Ile Pro Lys Asp Ile Asp Tyr Arg Tyr Ile 195 200 205 Pro Ala Gln Ile Gly Thr Ile Glu Tyr His Gln His Leu Ser Asn Asn 210 215 220 Ile Pro Arg Met Gln Arg Leu Thr Lys Asn Ile Asn Lys Tyr Met Arg 225 230 235 240 Val His Glu Asn Glu Lys Thr Thr Phe Lys Ile Asn Gln Ser Lys Ala 245 250 255 Leu Gln Asp Ser Ile Asn Ile Ala Leu Ala Thr Tyr Asp Asn Lys Glu 260 265 270 Phe Lys Ala Ile Ser Gly Ser Asn Asn Ile Val Asp Tyr Cys Val Ala 275 280 285 Pro Lys Glu Glu Glu Ala Val Phe Lys Ser Asn Lys Val Asn Lys Leu 290 295 300 Gly Glu Leu Gly Ile Gly Tyr Asn Arg Val Asn Asp Ser Glu Lys Lys 305 310 315 320 Ile Leu Glu Glu Ile His Lys Gln Ile Glu Glu Lys Thr Leu Lys Asp 325 330 335 Glu Gly Asp Leu Ile Leu Leu Ser Lys Trp Glu Pro Cys Pro Ser Cys 340 345 350 Tyr Phe Val Ile Ser Gln Phe Cys Lys Met His Pro Gln Ile Lys Val 355 360 365 Gln Val Lys Tyr Ser Lys Lys Tyr Gly Glu 370 375 <210> 399 <211> 201 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 399 Met Glu Ala Ser Pro Ala Ser Arg Pro Arg Pro Leu Met Asp Pro His 1 5 10 15 Met Phe Thr Gly Asn Phe Thr Asn Asn Pro Arg Val Phe Gly Leu His 20 25 30 Gln Thr Tyr Leu Cys Tyr Glu Val Lys Arg Gln Gly Pro Asp Gly Thr 35 40 45 Arg Asp Leu Met Asn Glu Gln Arg Asp Phe Leu Cys Asn Gln Ala Lys 50 55 60 Asn His Phe Ser Gly Ser Glu Asp His His Ala Glu Arg Cys Phe Leu 65 70 75 80 Asp Arg Ile Pro Ser Trp Gln Leu Asp Pro Ala Gln Thr Tyr Arg Val 85 90 95 Thr Cys Phe Ile Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Val 100 105 110 Ala Glu Phe Leu His Glu Asn Pro His Val Asn Leu Arg Ile Phe Ala 115 120 125 Ala Arg Ile Tyr Asp Tyr Leu Pro Arg Tyr Glu Glu Gly Leu Gln Met 130 135 140 Leu Gln Asn Ala Gly Ala Gln Val Ser Ile Met Thr Ser Glu Glu Phe 145 150 155 160 Gly His Cys Trp Asp Thr Phe Val Asp Arg Gln Gly His Pro Phe Gln 165 170 175 Pro Trp Glu Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu 180 185 190 Gln Ala Ile Leu Gln Asn Gln Gly Asn 195 200 <210> 400 <211> 137 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 400 Met His Leu Gln Val Trp Arg Lys Val Thr Glu Ala Trp Arg Glu Gly 1 5 10 15 Tyr Thr Leu Lys Pro Trp Ser Arg Asn Pro Met Glu Arg Leu Tyr His 20 25 30 Asp Tyr Phe Tyr Phe His Phe Tyr Asn Leu Pro Thr Pro Lys His Arg 35 40 45 Asn Gly Cys Tyr Ile Cys Tyr Gln Val Glu Gly Thr Lys Asn His Ser 50 55 60 Arg Met Pro Leu Leu Arg Gly Val Phe Glu Asn Gln Gly Leu Arg Lys 65 70 75 80 Leu His Asp Ala Gly Val His Val Ala Ile Met Ser Tyr Tyr Glu Phe 85 90 95 Lys His Cys Leu Asn Asp Phe Val Phe His Gln Gly Arg Ser Phe Cys 100 105 110 Pro Trp Asn Asp Leu Asn Lys Asn Ser Lys Asn Leu Ser Asn Thr Leu 115 120 125 Glu Asp Ile Leu Gln Asp Gln Glu Asp 130 135 <210> 401 <211> 381 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 401 Met Lys Pro Gln Thr Arg Asn Thr Val Val Arg Met Asp Pro Asp Thr 1 5 10 15 Phe Phe Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser His Arg Asn Thr 20 25 30 Val Trp Leu Cys Tyr Glu Val Lys Met Lys Thr Asn Asp Pro Ser Arg 35 40 45 Pro Pro Leu Val Ala Asn Ile Phe Gln Gly Gln Val Ser Phe Asn Pro 50 55 60 Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Arg Gly Asn Leu 65 70 75 80 Leu Pro Ala Cys Lys Arg Ser Gln Ile Thr Trp Phe Val Ser Trp Asn 85 90 95 Pro Cys Leu Tyr Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu His 100 105 110 Pro Lys Val Thr Leu Thr Val Ser Thr Ala Arg Leu Tyr Cys Tyr Arg 115 120 125 Lys Lys Asp Trp Arg Arg Ala Leu Arg Lys Leu Ser Gln Thr Gly Ala 130 135 140 Arg Val Lys Ile Met Asp Tyr Glu Glu Phe Gln His Cys Trp Asp Asn 145 150 155 160 Phe Val Asp Asn Gln Arg Glu Pro Phe Glu Pro Trp Asn Ala Leu Pro 165 170 175 Lys His Tyr Thr Leu Leu Arg Ile Thr Leu Gly Glu Val Leu Arg His 180 185 190 Arg Met Asp Pro Val Thr Phe Thr Tyr Asn Phe Thr Asn Asp Pro Ser 195 200 205 Val Leu Gly Gln His Gln Ser Tyr Leu Cys Tyr Lys Val Glu His Leu 210 215 220 Arg Asn Gly Thr Trp Val Pro Leu His Gln His Arg Gly Phe Ile Leu 225 230 235 240 Asn Glu Ala Ser Asn Ser Val Ser Phe Pro Glu Gly Arg His Ala Glu 245 250 255 Leu Cys Leu Leu Asp Leu Ile Ser Phe Trp Lys Leu Lys Gln Ala Gln 260 265 270 Arg Tyr Arg Val Thr Cys Phe Ile Ser Trp Ser Pro Cys Phe Ser Cys 275 280 285 Ala Glu Lys Val Ala Glu Phe Leu Gln Glu Asn Pro His Val Asn Leu 290 295 300 His Ile Ser Ala Ala Arg Ile Tyr Asp Tyr Gln Arg Gly Tyr Lys Lys 305 310 315 320 Gly Leu Arg Arg Leu Asp Arg Ala Gly Thr Pro Ile Ser Met Met Lys 325 330 335 Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly 340 345 350 His Pro Phe Gln Pro Trp Glu Glu Leu Asn Glu His Ser Gln Ala Leu 355 360 365 Ser Gly Arg Leu Gln Ala Ile Leu Gln Asn Gln Gly Asn 370 375 380 <210> 402 <211> 184 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 402 Met Tyr Arg Arg Lys Met Arg Gly Met Tyr Ile Ser Lys Arg Ala Leu 1 5 10 15 Arg Lys His Phe Asp Pro Arg Asn Tyr Pro Arg Glu Thr Tyr Leu Leu 20 25 30 Cys Glu Leu Gln Trp Arg Gly Ser His Lys Ser Trp Gln His Trp Leu 35 40 45 Arg Asn Asp Asp Ser Lys Asp Cys His Ala Glu Lys Tyr Phe Leu Glu 50 55 60 Glu Ile Phe Glu Pro Arg Ser Tyr Asn Ile Cys Asp Met Thr Trp Tyr 65 70 75 80 Leu Ser Trp Ser Pro Cys Gly Glu Cys Cys Asp Ile Ile Gln Asp Phe 85 90 95 Leu Glu Glu Gln Pro Asn Val Asn Ile Asn Ile Arg Ile Ala Arg Leu 100 105 110 Tyr Tyr Ala Asp Arg Ala Ser Asn Arg Arg Gly Leu Met Glu Leu Ala 115 120 125 Asn Ser Pro Gly Val Ser Ile Glu Ile Met Asp Ala Asp Asp Tyr Asn 130 135 140 Asp Cys Trp Glu Thr Phe Ile Gln Pro Gly Val Tyr Tyr Arg Phe Ser 145 150 155 160 Pro Glu Asn Phe Glu Ser Ala Ile Arg Arg Asn Cys Ser Gln Leu Glu 165 170 175 Asp Ile Leu Gln Gly Leu His Leu 180 <210> 403 <211> 218 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 403 Met His Leu Gln Val Trp Arg Lys Val Thr Glu Ala Trp Arg Glu Gly 1 5 10 15 Tyr Thr Leu Lys Pro Trp Ser Arg Asn Pro Met Glu Arg Leu Tyr His 20 25 30 Asp Tyr Phe Tyr Phe His Phe Tyr Asn Leu Pro Thr Pro Lys His Arg 35 40 45 Asn Gly Cys Tyr Ile Cys Tyr Gln Val Glu Gly Thr Lys Asn His Ser 50 55 60 Arg Met Pro Leu Leu Arg Gly Val Phe Glu Asn Gln Phe Phe Ser Lys 65 70 75 80 Lys Arg Arg His Thr Glu Leu Cys Phe Leu Ser Trp Phe Arg Thr Glu 85 90 95 Lys Ala Ser Leu Asp Met Leu Leu Ser Ser Gly Glu Lys Tyr Arg Val 100 105 110 Thr Trp Tyr Ile Ser Trp Ser Pro Cys Phe Ala Cys Val Asp Glu Val 115 120 125 Val Lys Phe Leu Arg Glu His Lys Asn Val Glu Leu Ile Ile Phe Ala 130 135 140 Ala Arg Leu Tyr His Ser Asp Ile Leu Gln Tyr Arg Gln Gly Leu Arg 145 150 155 160 Lys Leu His Asp Ala Gly Val His Val Ala Ile Met Ser Tyr Tyr Glu 165 170 175 Phe Lys His Cys Leu Asn Asp Phe Val Phe His Gln Gly Arg Ser Phe 180 185 190 Cys Pro Trp Asn Asp Leu Asn Lys Asn Ser Lys Asn Leu Ser Asn Thr 195 200 205 Leu Glu Asp Ile Leu Gln Asp Gln Glu Asp 210 215 <210> 404 <211> 338 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 404 Met Ala Ser Asp Lys Gly Pro Ser Ala Gly Asp Ala Thr Leu Arg Arg 1 5 10 15 Arg Ile Lys Pro Trp Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu 20 25 30 Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Gln Trp Gly Thr Ser His 35 40 45 Lys Ile Trp Arg Asn Ser Gly Lys Asn Thr Ala Asn His Val Glu Ile 50 55 60 Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg Gln Tyr Cys Pro Ser Ile 65 70 75 80 Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys 85 90 95 Ser Lys Ala Ile Arg Gly Phe Leu Ser Gln His Pro Ser Val Thr Leu 100 105 110 Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Pro Gln Asn Arg 115 120 125 Gln Gly Leu Arg Asp Leu Ile Asn Ser Gly Val Thr Ile Gln Ile Met 130 135 140 Arg Val Pro Glu Tyr Asp His Cys Trp Arg Asn Phe Val Asn Tyr Leu 145 150 155 160 Pro Gly Lys Glu Asp His Trp Pro Arg Tyr Pro Val Leu Trp Met Lys 165 170 175 Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Pro Ile Glu Met Pro 180 185 190 Gly Lys Ile Arg Asp Ala Pro Asn Asn Met Glu Ile Phe Ser Leu Phe 195 200 205 Val Gly Arg Tyr Ile Pro Lys Thr Lys Phe His Val Thr Cys Leu Leu 210 215 220 Ser Asp Val Arg Asn Asp Asp Ser His Leu Asp Lys Thr Ala Pro Lys 225 230 235 240 Trp Ile Arg Phe Asp Ser Leu Gln Pro Val Ala Ser Asp Pro Ser Ala 245 250 255 Glu His Trp Lys Met Lys Leu Pro Gly Arg Asp Asp Lys Thr Ala Val 260 265 270 Val Val Gly Thr Val Thr Glu Asp Val Ala Cys Ala Gln Gly Ala Lys 275 280 285 Leu Tyr Leu Cys Ala Leu Arg Val His Gly His Ala Gln Arg His Phe 290 295 300 Leu Lys Gly Arg Asp Glu Ile Leu Ala Leu Asp Gln Leu Ala Leu Asp 305 310 315 320 Ser Pro Gln Gly Leu Trp Arg Gln Pro Asp Leu Arg Ser His Pro Leu 325 330 335 Lys Gly <210> 405 <211> 207 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 405 Met Gln Lys Phe Thr Asp Phe Leu Gly Gly Ile Gln Leu Gly Leu Val 1 5 10 15 Arg Lys Tyr His Tyr Ser Val Asp Gly Val Gly Val Ala Leu Arg Asp 20 25 30 Leu Ile Tyr Ile His Lys Glu Arg Leu Glu Lys Lys Ala Arg Arg Arg 35 40 45 Ala Lys Ser Ser Asn Lys Met Phe Phe Glu Tyr Ile Thr Asp Phe Leu 50 55 60 Glu Phe Glu Gly Gly Asn Asp Ala Ile Leu Glu Tyr Ile Pro Asn Gly 65 70 75 80 Asn Asn Lys Ala Lys Arg Ile Phe Cys Ala Asn Ser Phe Val Asn Asp 85 90 95 Lys Thr Ser Pro Phe Ala Asn Ile Arg Met Pro Tyr Thr Gly Gln Tyr 100 105 110 Ala Leu Ile Pro Pro Lys His Ala Gln Lys Phe Asn Tyr Ile Ile Thr 115 120 125 Asn Arg Glu Arg Glu Leu Gly Lys Gly His Arg Arg Ala Asn Asp Thr 130 135 140 Glu Tyr Lys Leu Leu Glu Leu Ile Ala Ser Arg Ile Ser Pro Val Asp 145 150 155 160 Val Gly His Ile Asn Leu Tyr Thr Tyr Tyr Glu Pro Cys Leu Ser Cys 165 170 175 Asp Tyr Val Ile Val Gln Phe Val Lys Lys Tyr Pro Asn Ile Ser Ile 180 185 190 Asn Val Tyr Phe Glu Glu Glu Tyr Arg Pro Glu Lys Gly Val Ile 195 200 205 <210> 406 <211> 194 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 406 Met Lys Lys Val Lys Gly Val Ser Lys Met His Tyr Glu Gln Ser Ile 1 5 10 15 Asp Gly Ile Asn Leu Arg Val Lys Ser Asp Lys Met Lys Glu Arg Val 20 25 30 Arg Lys Asn Thr Trp Ile Arg Val Lys Lys Gly Ile Ile Ser Lys Arg 35 40 45 Glu Phe Gln Glu Ala Leu Pro Phe Phe Asn Ser Gly Asn Asp Ala Val 50 55 60 Leu Gln Tyr Thr Pro Leu Gly Glu Lys Ile Glu Lys Lys Lys Leu Phe 65 70 75 80 Tyr Ala Asn Ser Ser Val Ser Asp Phe Lys Asn Pro Phe Ala Tyr Leu 85 90 95 Arg Lys Tyr Ala Leu Met Pro Leu Glu Lys Asp Gln Asn Phe Asn Trp 100 105 110 Ile His Thr Asn Arg Lys Arg Glu Ile His Thr Gly Thr Pro Arg Asn 115 120 125 Val Asp Thr Glu Phe Lys Leu Leu Glu Lys Leu Ala Lys Tyr Ile Asp 130 135 140 Ser Gly Asp Val Gly Thr Ile Asp Leu Tyr Thr Tyr Tyr Glu Pro Cys 145 150 155 160 Leu Ser Cys Asp Tyr Val Ile Ile Gln Phe Thr Lys Lys Tyr Pro Asn 165 170 175 Ile Lys Val Asn Val Tyr Phe Ser Glu Glu Tyr Lys Pro Lys Lys Gly 180 185 190 Met Ile <210> 407 <211> 262 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 407 Met His His Ser Ala Arg Leu Pro Pro Asn Cys Ile Val Ser Arg Tyr 1 5 10 15 Ala Asn Ala Pro Trp Thr Val Leu Pro Leu Pro Leu Pro Pro Thr Glu 20 25 30 Ala Pro Ala Thr Gly Asp Asp Thr Leu Arg Arg Arg Ile Glu Pro Trp 35 40 45 Glu Phe Glu Ala Phe Phe Asn Pro Gln Glu Leu Arg Arg Glu Ala Cys 50 55 60 Leu Leu Tyr Gln Ile Thr Trp Ser Ser His Lys Val Trp Arg Glu Thr 65 70 75 80 Ala Lys Asn Thr Val Asp Ser His Val Glu Val Asn Phe Ile Gln Asn 85 90 95 Leu Thr Ala Gly Arg Tyr Cys Arg Pro Ser Thr Arg Cys Ser Ile Leu 100 105 110 Trp Phe Leu Ser Trp Ser Pro Cys Ser Ser Cys Ser Lys Ala Ile Arg 115 120 125 Leu Phe Leu Ser Gln His Pro Gly Val Ser Leu Val Ile Tyr Val Ala 130 135 140 Arg Leu Phe Gln His Met Asp Pro Gln Asn Arg Gln Gly Leu Arg Glu 145 150 155 160 Leu Ile His Ser Gly Val Thr Ile Gln Val Met Arg Pro Gln Glu Tyr 165 170 175 Asp Tyr Cys Trp Lys Asn Phe Val Asn Tyr Pro Pro Gly Gln Glu Glu 180 185 190 His Trp Pro Arg Tyr Pro Val Gln Cys Met Thr Leu Tyr Asn Leu Glu 195 200 205 Leu Tyr Cys Ile Ile His Asn Leu Pro Pro Cys Val Arg Ile Ser Lys 210 215 220 Gln Arg Gln Ser Gln Leu Ala Phe Phe Ser Leu Gly Leu Glu Asn Val 225 230 235 240 His Tyr Gln Arg Ile Pro Pro Pro Leu Leu Leu Leu Thr Gly Leu Val 245 250 255 Phe Val Phe Pro Trp Lys 260 <210> 408 <211> 395 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 408 Met Asn Pro Gln Ile Arg Asn Pro Met Glu Gly Met Asp Arg His Ala 1 5 10 15 Phe Asn Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr 20 25 30 Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu 35 40 45 Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Arg Pro Lys Leu Gln 50 55 60 Ser Asn Arg Arg Tyr Glu Leu Ser Asn Trp Glu Cys Arg Lys His Val 65 70 75 80 Tyr Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe 85 90 95 Cys Gly Asn Gln Leu Pro Ala His Lys Arg Phe Gln Ile Thr Trp Phe 100 105 110 Val Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe 115 120 125 Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu 130 135 140 Tyr Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu His 145 150 155 160 Gln Ala Gly Ala Arg Val Lys Ile Met Asp Tyr Glu Glu Phe Ala Tyr 165 170 175 Cys Trp Glu Asn Phe Val Tyr Asn Glu Gly Gln Ser Phe Met Pro Trp 180 185 190 Asp Lys Phe Asp Asp Asn Tyr Ala Phe Leu His His Lys Leu Lys Glu 195 200 205 Ile Leu Arg Asn Pro Met Glu Ala Thr Tyr Pro His Ile Phe Tyr Phe 210 215 220 His Phe Lys Asn Leu Arg Lys Ala Tyr Gly Arg Asn Glu Thr Trp Leu 225 230 235 240 Cys Phe Thr Met Glu Ile Ile Lys Gln His Ser Thr Val Phe Trp Glu 245 250 255 Thr Gly Val Phe Arg Asn Gln Val Tyr Pro Glu Ser Leu Cys His Ala 260 265 270 Glu Arg Cys Phe Leu Ser Trp Phe Cys Glu Asp Ile Leu Ser Pro Asn 275 280 285 Thr Asp Tyr Arg Val Thr Trp Tyr Thr Ser Trp Ser Pro Cys Leu Asp 290 295 300 Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn Val Lys 305 310 315 320 Leu Ala Ile Phe Ala Ala Arg Leu Tyr Tyr Phe Trp Asp Pro His Tyr 325 330 335 Gln Gln Gly Leu Arg Ser Leu Ser Glu Lys Gly Ala Ser Val Glu Ile 340 345 350 Met Gly Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn 355 360 365 Gly Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu 370 375 380 Phe Leu Asp Ser Lys Leu Gln Glu Ile Leu Gln 385 390 395 <210> 409 <211> 191 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 409 Met Asn Pro Leu Gln Glu Glu Thr Phe Tyr Gln Gln Phe Ser Asn Gln 1 5 10 15 Arg Val Pro Lys Pro Thr Tyr Gln Arg Arg Thr Tyr Leu Cys Tyr Gln 20 25 30 Leu Lys Pro His Glu Gly Ser Val Ile Ala Lys Val Cys Leu Gln Asn 35 40 45 Gln Glu Lys Arg His Ala Glu Ile Cys Phe Ile Asp Asp Ile Lys Ser 50 55 60 Arg Gln Leu Asp Pro Ser Gln Lys Phe Glu Ile Thr Cys Tyr Val Thr 65 70 75 80 Trp Ser Pro Cys Pro Thr Cys Ala Lys Lys Leu Ile Ala Phe Val Asn 85 90 95 Asp His Pro His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe 100 105 110 His Trp Arg Gln Lys Tyr Lys Arg Glu Leu Arg His Leu Gln Lys Ser 115 120 125 Gly Ile Pro Leu Ala Val Met Ser Tyr Leu Glu Phe Lys Asp Cys Trp 130 135 140 Glu Lys Phe Val Asp His Lys Gly Arg Pro Phe Gln Pro Trp Asn Lys 145 150 155 160 Leu Lys Gln Tyr Ser Glu Ser Ile Gly Arg Arg Leu Gln Arg Ile Leu 165 170 175 Gln Pro Leu Asn Asn Leu Glu Asn Asp Phe Arg Asn Leu Arg Leu 180 185 190 <210> 410 <211> 198 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 410 Met Ala Val Glu Glu Glu Lys Gly Leu Leu Gly Thr Ser Gln Gly Trp 1 5 10 15 Lys Ile Glu Leu Lys Asp Phe Gln Glu Asn Tyr Met Pro Ser Thr Trp 20 25 30 Pro Lys Val Thr His Leu Leu Tyr Glu Ile Arg Trp Gly Lys Gly Ser 35 40 45 Lys Val Trp Arg Asn Trp Cys Ser Asn Thr Leu Thr Gln His Ala Glu 50 55 60 Val Asn Cys Leu Glu Asn Ala Phe Gly Lys Leu Gln Phe Asn Pro Pro 65 70 75 80 Val Pro Cys His Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Cys Gln 85 90 95 Cys Cys Arg Arg Ile Leu Gln Phe Leu Arg Ala His Ser His Ile Thr 100 105 110 Leu Val Ile Lys Ala Ala Gln Leu Phe Lys His Met Asp Glu Arg Asn 115 120 125 Arg Gln Gly Leu Arg Asp Leu Val Gln Ser Gly Val His Val Gln Val 130 135 140 Met Asp Leu Pro Asp Tyr Arg Tyr Cys Trp Arg Thr Phe Val Ser His 145 150 155 160 Pro His Glu Gly Glu Gly Asp Phe Trp Pro Trp Phe Phe Pro Leu Trp 165 170 175 Ile Thr Phe Tyr Thr Leu Glu Leu Gln His Ile Leu Leu Gln Gln His 180 185 190 Ala Leu Ser Tyr Asn Leu 195 <210> 411 <211> 234 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 411 Met Asp Pro Gln Arg Leu Arg Gln Trp Pro Gly Pro Gly Pro Ala Ser 1 5 10 15 Arg Gly Gly Tyr Gly Gln Arg Pro Arg Ile Arg Asn Pro Glu Glu Trp 20 25 30 Phe His Glu Leu Ser Pro Arg Thr Phe Ser Phe His Phe Arg Asn Leu 35 40 45 Arg Phe Ala Ser Gly Arg Asn Arg Ser Tyr Ile Cys Cys Gln Val Glu 50 55 60 Gly Lys Asn Cys Phe Phe Gln Gly Ile Phe Gln Asn Gln Lys Lys Arg 65 70 75 80 His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn Ser Leu Asn Leu Asp 85 90 95 Gln Asn Gln Cys Tyr Arg Ile Ile Cys Tyr Val Thr Trp Ser Pro Cys 100 105 110 His Asn Cys Ala Lys Glu Leu Val Asp Phe Ile Ser Asn Arg His His 115 120 125 Leu Ser Leu Gln Leu Phe Ala Ser Arg Leu Tyr Phe His Trp Val Arg 130 135 140 Cys Tyr Gln Arg Gly Leu Gln Arg Leu Gln Ala Asn Arg Val Ser Val 145 150 155 160 Ala Val Met Lys Gly Pro Glu Phe Lys Asp Cys Trp Glu Lys Phe Val 165 170 175 Asp His Gln Gly Glu Ser Phe Pro Ser Trp Glu Lys Leu Glu Gln Tyr 180 185 190 Ser Glu Ser Ile Ser Arg Arg Leu Ser Arg Ile Leu Arg Phe Ala Asn 195 200 205 Gln Asn Asn Leu Glu Asp Ser Phe Arg Asp Leu Arg Leu Gly Ser Pro 210 215 220 Ser Pro Ser Ser Ser Arg Ser Asp Ser Arg 225 230 <210> 412 <211> 377 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 412 Met Thr Lys Ile Asn Ile Ile Ser Asn Lys Arg Lys Lys Glu Arg Ile 1 5 10 15 Lys Ile Asn Asn Leu Asn Asp Phe Lys Asp Ala Leu Lys Lys Glu Gly 20 25 30 Tyr Lys Ile Asn Tyr Phe Asp Glu Glu Lys Phe Lys Ile Glu Val Ala 35 40 45 Lys Ala Phe Lys Val Glu Asn Ser Leu Ile Glu Glu Leu Tyr Lys Cys 50 55 60 Ile Gly Glu Glu Gln Ala Thr Tyr Arg Ala Asp Asp Val Ser Asp Leu 65 70 75 80 Ile Asn Tyr Met Lys Lys Ile Ile Leu Phe Glu Tyr Glu His Asp Arg 85 90 95 Leu Trp Lys Lys Ile Asn Ser Ile Lys Ile Leu Asn Ile Asn Arg Ile 100 105 110 Glu Tyr Glu Arg Asp Thr Val Ser Arg Asp Asp Val Lys Asp Met Leu 115 120 125 Ile Asp Ile Lys Glu Val Lys Lys Arg Val Ser Arg Ile Val Ser Glu 130 135 140 Lys Glu Lys Glu Lys Leu Glu Ile Leu Glu Lys Glu Leu Asp Asn Asp 145 150 155 160 Tyr Leu Tyr Ser Lys Asp Ile Glu Leu Leu Lys Lys Met Leu Leu Ile 165 170 175 Lys Lys Glu Arg Val Lys Glu Ser Tyr Asn Ile Asn Thr Lys Val Lys 180 185 190 Thr Ile Ser Ile Glu Ile Pro Lys Gln Ile Asp Tyr His Tyr Ile Thr 195 200 205 Pro Gln Lys Gly Thr Val Glu Tyr His Gln His Leu Ser Asn Asn Ile 210 215 220 Pro Arg Met Gln Arg Leu Ile Lys Asn Ile Asn Lys Tyr Met Lys Ala 225 230 235 240 Asp Glu Glu Glu Arg Ser Ile Phe Lys Ile Asn Gln Ser Lys Thr Leu 245 250 255 Gln Asp Ser Ile Asn Ile Ala Val Ala Ile Tyr Asp Asn Lys Glu Phe 260 265 270 Lys Ala Ile Ser Gly Ser Asn Asn Ile Lys Asp Tyr Cys His Ala Pro 275 280 285 Thr Lys Asp Glu Ser Phe Phe Lys Ser Asn Lys Val Asn Lys Leu Gly 290 295 300 Glu Phe Gly Ile Gly Tyr Asp Arg Ile Asn Asp Ser Glu Lys Lys Ile 305 310 315 320 Ile Glu Glu Ile His Lys Gln Ile Glu Ala Lys Val Leu Lys Asp Glu 325 330 335 Gly Asn Leu Thr Leu Tyr Ser Lys Trp Glu Pro Cys Pro Ser Cys Cys 340 345 350 Phe Val Ile Ser Gln Phe Cys Lys Lys His Pro Asn Ile Glu Val Gln 355 360 365 Val Lys Tyr His Lys Lys Tyr Gly Glu 370 375 <210> 413 <211> 356 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 413 Met Gly Pro Val Arg Val Cys Glu Ser Ala Val Ile Trp Ala Ala Gly 1 5 10 15 Thr Ser Lys Ala Gly Glu Pro Leu Ser Trp Pro Ser Thr Pro Pro Gly 20 25 30 Gly Ala Gly Tyr Gln Arg Pro Ser Leu Ala Ala Cys Thr Gly Thr Arg 35 40 45 Leu Leu Thr Tyr Ile Leu Arg Glu Glu Thr Gln His Gly Val Pro Ser 50 55 60 Phe Ser Ala Arg Arg Ala Pro Gly Ser Leu Arg Gln Ala Thr Ala Val 65 70 75 80 Leu Ala Ala Ala Gly Asp Ser Ala Met Gly Arg His Gly Ala Cys Pro 85 90 95 Pro Gly Cys Leu Leu Asp Glu Asn Thr Phe Ala Glu Asn Tyr Met Asn 100 105 110 Gln Ile Ser Thr Arg Lys Thr Tyr Leu Cys Tyr Lys Val Glu Ile Leu 115 120 125 Gly Gly Asp Ala Arg Val Pro Pro Asp Glu Ser Lys Gly Phe Val Gln 130 135 140 Asn Lys Gly Ala Asn Glu Pro Gly Trp Pro Arg His Ala Glu Leu Tyr 145 150 155 160 Phe Leu Asp Arg Ile Arg Ser Trp Asn Leu Asp Pro Gly Leu Arg Tyr 165 170 175 Arg Leu Thr Cys Phe Ile Ser Trp Thr Pro Cys His Thr Cys Ala Gln 180 185 190 Glu Leu Ala Thr Phe Leu Gly Glu Asn Ser His Leu Ser Leu His Ile 195 200 205 Phe Ala Ser Arg Ile Tyr Ser Leu Pro Gly Tyr Glu Ala Gly Leu Arg 210 215 220 Thr Leu Gln Ala Ala Gly Ala Gln Ile Ala Ile Met Thr Ser Gln Glu 225 230 235 240 Phe Glu His Cys Trp Lys Asn Phe Val Asp His Gln Gly Arg Thr Phe 245 250 255 Glu Pro Trp Asp Glu Leu Glu Val Val Ser Gln His Leu Cys Lys Lys 260 265 270 Leu Gln Glu Ile Leu Gln Ala Leu Cys Val Leu Gln Glu Gly Ala His 275 280 285 Gly Arg Leu Ala Asp Asn Glu Ala Ala Phe Ser Gly Ala Ala Lys Leu 290 295 300 Arg Leu Ser Arg Gly Gly Leu Glu Pro Gly Ala Trp Gln Gly Ala Asn 305 310 315 320 Trp Arg Gly Ser Pro Arg Leu Trp Tyr Leu Ser Leu Ala Gly Pro Ala 325 330 335 Gly Pro Gly Thr Ala Ala Ser Ala Leu Pro Val Ala Pro Gly Ala Ala 340 345 350 Ser His Tyr Arg 355 <210> 414 <211> 211 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 414 Met Glu Asp Phe His Cys Val Cys Val Tyr Cys Pro Leu Gln Val Ser 1 5 10 15 Val Met Ser Asp Tyr Gln Ala Ala Ser Ser Ser Pro Asp Cys Pro Gln 20 25 30 Cys Pro Gln His Ile Leu Thr Gly Ala Glu Ala Ala Val Ser Tyr Ser 35 40 45 Gln Phe Cys Glu Thr Phe Gly Phe His Met Gly Pro Ser Gly Ala Arg 50 55 60 Ala Leu Leu Leu Phe Tyr Glu Leu Trp Gly Pro Ser Gly Thr Leu Val 65 70 75 80 Gln Arg Gly Gln Ala Ser Asn Leu Leu Glu Val Cys Glu Glu Val Leu 85 90 95 Tyr Ser Asn Tyr Met Pro Cys Gln Glu Cys Ser Gln Thr Leu Ile Ser 100 105 110 Phe Leu Leu Arg Tyr Pro Trp Val Arg Leu Asp Leu Leu Phe Ser Gln 115 120 125 Leu Tyr His Thr Ala Pro Ser Gln Thr His Ser Leu Asp Asn Gln Thr 130 135 140 Gly Leu Arg Ser Leu Ala Val Leu Thr Leu Ser Pro Asn Ser Gly Ala 145 150 155 160 Ala Trp Gly His Leu Leu Arg Cys Phe Val Arg Asp Val Pro Pro Ser 165 170 175 Ala Leu Gln Leu Pro Leu Leu Pro Glu Arg Val Glu Ala Asp Arg Val 180 185 190 Asn Ala Ile His Ile Ser Ala Thr Thr Gly Ile Gly Pro Ala Phe Trp 195 200 205 Thr Ser His 210 <210> 415 <211> 230 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 415 Met Thr Gly Ala Ile Trp Asn Phe Val His Ser Ala Leu Met Asn Phe 1 5 10 15 Leu Asn Ala Met Ala Leu Leu Thr Ala Glu Thr Phe Ser Leu Gln Phe 20 25 30 Asn Asn Lys Arg Cys Val Ser Lys Pro Tyr Tyr Pro Arg Lys Ala Leu 35 40 45 Leu Cys Tyr Gln Leu Thr Arg Gln Asn Gly Ser Thr Pro Thr Arg Gly 50 55 60 Tyr Leu Lys Asn Lys Lys Lys His His Ala Glu Ile Arg Phe Ile Lys 65 70 75 80 Lys Ile Glu Ser Met Gly Leu Asp Lys Thr Gln Cys Tyr Gln Val Thr 85 90 95 Cys Tyr Leu Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val 100 105 110 Asp Phe Ile Gln Ala His His His Leu Thr Leu Arg Ile Phe Ala Ser 115 120 125 Arg Leu Tyr Tyr His Trp Leu Gly His Tyr Gln Glu Gly Leu Leu Leu 130 135 140 Leu Cys Gly Ser Gln Val Pro Val Glu Val Met Gly Leu Arg Glu Phe 145 150 155 160 Thr Asp Cys Trp Glu Asn Phe Val Asp His Glu Glu Pro Pro Ser Phe 165 170 175 Asn Pro Ser Glu Lys Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile 180 185 190 Lys Arg Arg Leu Glu Arg Ile Lys Gln Ser Arg Ser Val Asp Val Leu 195 200 205 Glu Asn Gly Leu Arg Ser Leu Gln Leu Gly Pro Val Thr Pro Ser Ser 210 215 220 Ser Arg Cys Asn Ser Arg 225 230 <210> 416 <211> 267 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 416 Met Gly Thr Pro Lys Asp Thr Lys Ser Arg His Leu Ala Gly Arg Cys 1 5 10 15 His Glu Leu His Asn Ser Arg Gly Arg Ser Pro Glu Ser Asp Thr Met 20 25 30 Ala Ser Glu Lys Gly Pro Ser Asn Lys Asp Tyr Thr Leu Arg Arg Arg 35 40 45 Ile Glu Pro Trp Glu Phe Glu Val Phe Phe Asp Pro Gln Glu Leu Arg 50 55 60 Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Ala Ser Ser Lys 65 70 75 80 Thr Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val Asn 85 90 95 Phe Leu Glu Lys Leu Thr Ser Glu Gly Arg Leu Gly Pro Ser Thr Cys 100 105 110 Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser 115 120 125 Thr Ala Ile Arg Glu Phe Leu Ser Gln His Pro Gly Val Thr Leu Val 130 135 140 Ile Phe Val Ala Arg Leu Phe Gln His Met Asp Arg Arg Asn Arg Gln 145 150 155 160 Gly Leu Lys Asp Leu Val Thr Ser Gly Val Thr Val Gln Val Met Ser 165 170 175 Val Ser Glu Tyr Cys Tyr Cys Trp Glu Asn Phe Val Asn Tyr Pro Pro 180 185 190 Gly Lys Ala Ala Gln Trp Pro Arg Tyr Pro Pro Arg Trp Met Leu Met 195 200 205 Tyr Ala Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu 210 215 220 Lys Ile Ser Arg Arg His Gln Lys Gln Leu Thr Phe Phe Ser Leu Thr 225 230 235 240 Pro Gln Tyr Cys His Tyr Lys Met Ile Pro Pro Tyr Ile Leu Leu Ala 245 250 255 Thr Gly Leu Leu Gln Pro Ser Val Pro Trp Arg 260 265 <210> 417 <211> 399 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 417 Met Thr Asn Pro Gln Ile Arg Asn Met Val Lys Arg Met Lys Pro Gly 1 5 10 15 Ile Phe Val Ser Asn Phe Asn Asn Lys Pro Ile Leu Ser Gly Arg Asn 20 25 30 Thr Val Trp Leu Cys Cys Glu Val Lys Thr Lys Asp Pro Ser Gly Pro 35 40 45 Pro Leu Asp Ala Lys Ile Phe Arg Asp Lys Val Tyr Ser Lys Ala Lys 50 55 60 Tyr His Pro Glu Met Arg Phe Leu Arg Trp Phe Arg Lys Trp Arg Gln 65 70 75 80 Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Val Ser Trp Ser 85 90 95 Pro Cys Thr Gly Cys Ala Asn Ser Val Ala Thr Phe Leu Ala Glu Asp 100 105 110 Pro Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp 115 120 125 Lys Pro Asp Tyr Gln Glu Ala Leu Arg Val Leu Cys Gln Lys Arg Gly 130 135 140 Ser Pro His Ala Thr Met Lys Ile Met Asn Tyr Asn Glu Phe Gln His 145 150 155 160 Cys Trp Asn Lys Phe Val Arg Gly Arg Arg Glu Pro Phe Glu Pro Trp 165 170 175 Glu Asn Leu Pro Lys His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu 180 185 190 Leu Leu Arg His Leu Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn 195 200 205 Asn Lys Leu Trp Val Ser Gly Gln His Glu Thr Tyr Leu Cys Tyr Lys 210 215 220 Val Glu Arg Pro His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg 225 230 235 240 Gly Phe Leu Gln Asn Gln Ala Pro Asp Ile His Gly Phe Pro Lys Gly 245 250 255 Arg His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys Leu 260 265 270 Asp Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys 275 280 285 Phe Asn Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Asp Asn Lys His 290 295 300 Val Ser Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg 305 310 315 320 Cys Gln Glu Gly Leu Arg Thr Leu His Arg Asp Gly Ala Lys Ile Ala 325 330 335 Met Met Asn Tyr Ser Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Asp 340 345 350 Arg Gln Gly Arg Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser 355 360 365 Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Val Thr Ala Ser 370 375 380 Ser Leu Phe Gln Gly Asn Lys Ile Met Ile Pro Val Ser Ser Trp 385 390 395 <210> 418 <211> 396 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 418 Met Gln Pro Gln Gly Leu Gly Pro Asn Ala Gly Met Gly Pro Val Cys 1 5 10 15 Leu Gly Cys Ser His Arg Arg Pro Tyr Ser Pro Ile Arg Asn Pro Leu 20 25 30 Lys Lys Leu Tyr Gln Gln Thr Phe Tyr Phe His Phe Lys Asn Val Arg 35 40 45 Tyr Ala Trp Gly Arg Lys Asn Asn Phe Leu Cys Tyr Glu Val Asn Gly 50 55 60 Met Asp Cys Ala Leu Pro Val Pro Leu Arg Gln Gly Val Phe Arg Lys 65 70 75 80 Gln Gly His Ile His Ala Glu Leu Cys Phe Ile Tyr Trp Phe His Asp 85 90 95 Lys Val Leu Arg Val Leu Ser Pro Met Glu Glu Phe Lys Val Thr Trp 100 105 110 Tyr Met Ser Trp Ser Pro Cys Ser Lys Cys Ala Glu Gln Val Ala Arg 115 120 125 Phe Leu Ala Ala His Arg Asn Leu Ser Leu Ala Ile Phe Ser Ser Arg 130 135 140 Leu Tyr Tyr Tyr Leu Arg Asn Pro Asn Tyr Gln Gln Lys Leu Cys Arg 145 150 155 160 Leu Ile Gln Glu Gly Val His Val Ala Ala Met Asp Leu Pro Glu Phe 165 170 175 Lys Lys Cys Trp Asn Lys Phe Val Asp Asn Asp Gly Gln Pro Phe Arg 180 185 190 Pro Trp Met Arg Leu Arg Ile Asn Phe Ser Phe Tyr Asp Cys Lys Leu 195 200 205 Gln Glu Ile Phe Ser Arg Met Asn Leu Leu Arg Glu Asp Val Phe Tyr 210 215 220 Leu Gln Phe Asn Asn Ser His Arg Val Lys Pro Val Gln Asn Arg Tyr 225 230 235 240 Tyr Arg Arg Lys Ser Tyr Leu Cys Tyr Gln Leu Glu Arg Ala Asn Gly 245 250 255 Gln Glu Pro Leu Lys Gly Tyr Leu Leu Tyr Lys Lys Gly Glu Gln His 260 265 270 Val Glu Ile Leu Phe Leu Glu Lys Met Arg Ser Met Glu Leu Ser Gln 275 280 285 Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala 290 295 300 Arg Gln Leu Ala Ala Phe Lys Lys Asp His Pro Asp Leu Ile Leu Arg 305 310 315 320 Ile Tyr Thr Ser Arg Leu Tyr Phe Tyr Trp Arg Lys Lys Phe Gln Lys 325 330 335 Gly Leu Cys Thr Leu Trp Arg Ser Gly Ile His Val Asp Val Met Asp 340 345 350 Leu Pro Gln Phe Ala Asp Cys Trp Thr Asn Phe Val Asn Pro Gln Arg 355 360 365 Pro Phe Arg Pro Trp Asn Glu Leu Glu Lys Asn Ser Trp Arg Ile Gln 370 375 380 Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu 385 390 395 <210> 419 <211> 367 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 419 Met Cys Pro Arg Cys Pro Arg His Val Arg Val Gly Ser Asp Ser Arg 1 5 10 15 Val Pro Tyr Arg Glu Phe Cys Arg Ser Phe Gly Tyr Pro Val Ala Leu 20 25 30 Ala Arg Ser Ala Pro Trp Pro Gly Asp Asp Gly Ala Leu Leu Gly Phe 35 40 45 Tyr Glu Leu Arg Gly Thr Gly Gly Pro Leu Val Gln Arg Gly His Ala 50 55 60 Thr Gly Cys Ala Ala Arg Gly His His Pro Glu Thr Leu Leu Phe Asp 65 70 75 80 Ala Glu Gly His Leu Asp Ser Val Leu Leu Thr Leu Gly Leu Gly His 85 90 95 Gly Ala Ala Thr Arg Val Ala Leu Phe Ser Ser His Ala Pro Cys Gly 100 105 110 His Glu Ala Leu Gly Cys Val Ser Arg Ile Leu Gly Phe Leu Glu Ala 115 120 125 His Pro Gly Val Arg Leu Glu Met Tyr Phe Ala Gln Phe Glu Ser Gly 130 135 140 Phe Ala Glu Ala Gly Arg Gly Tyr His Arg Pro Pro Tyr Gly His Arg 145 150 155 160 Asp Gly Thr Asp Glu Gly Gly Ser Leu Arg Asp Leu Val Ser Leu Arg 165 170 175 Pro Arg Val Thr Val Ala Pro Ile Ser Gly Gly Met Trp Gly Lys Ile 180 185 190 Leu Arg Asp Phe Val Ser Asn Val Pro Pro Leu Ala Leu Met Asn Pro 195 200 205 Val Asn His Leu Arg Ala Arg Glu Asp Ser Glu Asn Ala Ala Arg Leu 210 215 220 Ala Gly Ile Thr Gly Val Trp Pro Pro Tyr Val Asp Leu Ala Pro Val 225 230 235 240 Pro Ser Lys Lys Ser Phe Ser Ser Ser Ser Pro Ser Ser Ser Ser Phe 245 250 255 Pro Ser Ser Ser Ser Phe Pro Ser Ser Ser Ser Ser Thr Thr Ser Pro 260 265 270 Leu Leu Gly Leu Phe Pro Thr Leu Asp Thr Phe Val Val Thr Val Leu 275 280 285 Thr Pro Ala Gln Thr Tyr Ala Trp Pro Gln Ala Trp Thr Pro Asn Trp 290 295 300 Arg Gln Pro Gln Pro Gln Val Val Arg His Met Thr Leu Pro Asp Leu 305 310 315 320 Pro Pro Pro Pro Lys Gln Lys Glu Lys Thr Ile Gln Glu Met Leu Pro 325 330 335 Pro Asn Gly Ile Ile Lys Asp Phe Thr Ile Thr Gln Glu Lys Pro Val 340 345 350 Lys Gln Ser Ala Asp Thr Thr Gly Lys Ser Asp Arg Gly Lys Lys 355 360 365 <210> 420 <211> 230 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 420 Met Ala Ala Gly Pro Ala Pro Glu Ala Arg Ser Leu Met Asp Glu Gln 1 5 10 15 Thr Phe Leu Asp Asn Phe Asn Asn Leu Lys Tyr Pro Arg Lys Thr Tyr 20 25 30 Leu Cys Tyr Glu Val Glu Leu Leu Val Gly Glu Asn His Ile Pro Leu 35 40 45 Asp Asp Tyr Lys Gly Phe Val His Asn Glu Gly Phe Asp Met Gly Leu 50 55 60 Glu Arg Cys His Ala Glu Leu Ile Phe Leu Glu Arg Met Ala Ser Trp 65 70 75 80 Asn Leu Asp Thr Glu Leu Arg Tyr Arg Ile Thr Val Phe Ile Ser Trp 85 90 95 Ser Pro Cys Pro Glu Cys Ala Asp Glu Leu Val Lys Phe Leu Arg Glu 100 105 110 Asn Arg His Val Asn Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Trp 115 120 125 Tyr Gln Gly Tyr Glu Ala Gly Leu Arg Ala Leu Lys Ala Ala Gly Ala 130 135 140 Glu Val Ala Met Met Thr Leu His Glu Phe Glu Tyr Cys Trp Asn Asn 145 150 155 160 Phe Val Asp His Gln Gln Asp Glu Asp Thr Pro Phe Pro Pro Trp Asp 165 170 175 Asn Leu Val Ala Arg Ser Glu Glu Leu Ser Gln Arg Leu Glu Gly Ile 180 185 190 Leu Gln Pro Ser Val Leu Val Phe Cys Trp Pro Ser Gln Val Ser Val 195 200 205 Thr Ala Ala His Ser Asp Ile Met Ser Gln Ala Ser Arg Ala Trp Glu 210 215 220 Lys Arg Arg Asp Pro Pro 225 230 <210> 421 <211> 175 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 421 Met Ile His Val Asp Gln Leu Leu Glu Ala Asp Arg Ile His His Glu 1 5 10 15 Thr Trp Met Gln Glu Ala Leu Lys Glu Ala Asp Lys Ala Leu Val Leu 20 25 30 Asp Glu Val Pro Ile Gly Ala Val Leu Val Tyr Gln Gly Gln Ile Val 35 40 45 Gly Arg Gly His Asn Val Arg Glu Ser Gln Glu Arg Ala Leu Gly His 50 55 60 Ala Glu Leu Met Ala Ile Glu Thr Ala Asn Gln Gln Leu Gly His Trp 65 70 75 80 Arg Leu Glu Glu Ala Ser Leu Tyr Val Thr Leu Glu Pro Cys Pro Met 85 90 95 Cys Ala Gly Ala Leu Met Asn Cys Arg Ile Lys Glu Val Ile Tyr Gly 100 105 110 Ala Ser Asp Leu Lys Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu 115 120 125 Glu Glu Asp Arg Phe Asn His Arg Ala Gln Val Ile Gln Gly Val Leu 130 135 140 Glu Gln Glu Cys Ser His Lys Leu Ser Gln Phe Phe Lys Asp Leu Arg 145 150 155 160 Gln Arg Lys Lys Met Ser Lys Ala Arg Gln Thr Glu His Lys Glu 165 170 175 <210> 422 <211> 156 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 422 Met Lys Leu Asn Gln Glu Glu Met Asp Arg Tyr Trp Met Arg Glu Ala 1 5 10 15 Leu Leu Leu Ala Glu Glu Ala Gly Lys Leu Gly Glu Val Pro Ile Gly 20 25 30 Ala Val Ile Val Arg Asn Gly Glu Lys Ile Gly Gln Gly Tyr Asn Arg 35 40 45 Arg Glu Val Asp Lys Asn Pro Leu Ala His Ala Glu Ile Leu Ala Ile 50 55 60 Gln Glu Ala Ser Arg Thr Leu Lys Gly Trp Arg Leu Asn Gly Thr Thr 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Gly Gly Ala Ile Leu 85 90 95 Gln Ser Arg Ile Pro Arg Leu Val Phe Gly Ala Arg Asp Pro Lys Ala 100 105 110 Gly Ala Ala Gly Ser Ile Leu Asp Leu Met His Glu Pro Arg Phe Asn 115 120 125 His Gln Val Glu Val Val Glu Gly Val Leu Ala Glu Glu Ala Gly Ala 130 135 140 Leu Leu Thr Gln Phe Phe Arg Arg Leu Arg Gln Arg 145 150 155 <210> 423 <211> 161 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 423 Met Ser Leu Lys Gln Ser Lys Glu Asp Ile Phe Phe Met Glu Gln Ala 1 5 10 15 Leu Val Glu Ala Glu Lys Ala Met Glu Ile Gly Glu Val Pro Ile Gly 20 25 30 Ala Ile Ile Val Arg Asp Asn Val Ile Ile Ala Arg Gly His Asn Leu 35 40 45 Arg Glu Gln Gln Gln Met Val Thr Asn His Ala Glu Leu Ile Ala Ile 50 55 60 Gln Lys Ala Cys Glu Glu Val Gly Ser Trp Arg Leu Glu Asp Cys Thr 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val 85 90 95 Gln Ser Arg Met Lys Arg Val Val Tyr Gly Ala Ala Asp Pro Lys Ala 100 105 110 Gly Cys Cys Gly Ser Leu Met Asn Leu Leu Asp Glu Pro Arg Leu Asn 115 120 125 His Gln Val Tyr Val Thr Ser Gly Leu Tyr Glu Glu Glu Ser Ser Arg 130 135 140 Leu Leu Lys Asp Phe Phe Lys Lys Leu Arg Gln Lys Lys Lys Gly Thr 145 150 155 160 Asp <210> 424 <211> 181 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 424 Met Gln Gln Gln Lys Gly Lys Glu Lys Leu Thr Asp Gln Glu Arg Phe 1 5 10 15 Met Lys Glu Ala Ile Arg Gln Ala Lys Lys Ala Glu Ala Leu Glu Glu 20 25 30 Val Pro Ile Gly Cys Val Ile Val His Glu Gly Lys Ile Ile Ala Arg 35 40 45 Gly Tyr Asn Arg Arg Asn Thr Asp Lys Asn Thr Leu Ser His Ala Glu 50 55 60 Leu Asn Ala Ile Arg Lys Ala Ser Lys Lys Leu Gly Asp Trp Arg Leu 65 70 75 80 Glu Gly Cys Thr Met Tyr Val Thr Leu Glu Pro Cys Gln Met Cys Ser 85 90 95 Gly Ala Leu Val Gln Ser Arg Ile Asp Glu Val Val Ile Gly Cys Met 100 105 110 Asn Ala Lys Ala Gly Cys Ala Gly Ser Val Met Asn Leu Leu Gln Val 115 120 125 Asp Gly Phe Asn His Gln Val Lys Ile Ile Gln Gly Val Leu Glu Glu 130 135 140 Glu Cys Ser Ser Met Leu Ser Glu Phe Phe Arg Lys Leu Arg Glu Lys 145 150 155 160 Lys Lys Gln Glu Lys Ala Ala Leu Lys Ala Ala Gln Glu Asn Pro Glu 165 170 175 Gly Glu Pro Glu Gln 180 <210> 425 <211> 189 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 425 Met Asn Lys Ile Thr Leu Asn Arg Gly Ser Met Glu Glu Asn Ile Asn 1 5 10 15 Phe Thr Asp Ala Glu Arg Thr Ala Met Asn Leu Ala Leu Glu Leu Ala 20 25 30 Gly Lys Ala Arg Glu Arg Gly Asp Val Pro Ile Gly Ala Val Ile Leu 35 40 45 Tyr Asp Gly Leu Lys Pro Asp Ser Pro Met Gly Arg Leu Cys Arg Glu 50 55 60 Lys Gly Ile Phe Pro Gly Glu Ile Leu Gly Thr Gly Phe Asn Gln Arg 65 70 75 80 Asn Phe His Gly Asn Ala Leu Cys His Ala Glu Ile Leu Ala Ile Glu 85 90 95 Glu Ala Cys Lys Lys Ile Gly Asp Trp Arg Leu Glu Asp Cys Thr Leu 100 105 110 Tyr Val Asn Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln 115 120 125 Ala Arg Ile Pro Arg Leu Gln Met Ser Val Arg Asn Pro Lys Ala Gly 130 135 140 Phe Cys Gly Ser Val Met Asn Ile Leu Gln Met Lys Glu Leu Asn His 145 150 155 160 Arg Val Glu Ile Thr Glu Gly Leu Gln Ala Glu Glu Ala Arg Lys Leu 165 170 175 Leu Gln Asp Phe Phe Ala Lys Leu Arg Leu Lys Glu Glu 180 185 <210> 426 <211> 164 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 426 Met Glu Thr Ala Phe Asp Leu Ala Lys Glu Ala Leu Ala Ala Asn Glu 1 5 10 15 Val Pro Ile Gly Cys Ser Phe Val Tyr Asn Gly Lys Val Val Ala Ser 20 25 30 Gly Arg Asn His Val Asn Glu Tyr Arg Asn Ala Ser Leu His Ala Glu 35 40 45 Ile Leu Ala Ile Met Glu Leu Glu Gln Trp Cys Ala Ile Gln Asn Leu 50 55 60 Asp Phe Ala Glu Val Leu Ser Gln Ser Ile Leu Tyr Val Thr Ala Glu 65 70 75 80 Pro Cys Ile Met Cys Ala Ala Ala Leu Arg Phe Ser Leu Pro Gly Gln 85 90 95 Pro Leu Lys Ile Val Tyr Ser Ala Lys Asn Glu Arg Phe Gly Gly Cys 100 105 110 Gly Ser Val Leu Ser Ile His Ser Asp Pro Ser Pro Tyr Pro Ile Leu 115 120 125 Val Cys Glu Val Asp Asn Arg Ser Asp Glu Ser Ile Asp Leu Leu Lys 130 135 140 Gln Phe Tyr Lys Leu Glu Asn Ala Asn Ala Pro Glu Ser Lys Arg Ile 145 150 155 160 Lys Lys Arg Gln <210> 427 <211> 184 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 427 Met Arg Glu Gly Asn Asp Glu Arg Glu Val Thr Glu Arg His Glu Trp 1 5 10 15 Phe Met Arg Ile Ala Leu Asp Gln Ala Glu Lys Ala Leu Arg Asp Lys 20 25 30 Glu Val Pro Val Gly Cys Val Phe Val His Ala Asp Ser Gly Thr Val 35 40 45 Leu Ala Thr Gly Ala Asn Glu Thr Asn Ile Ser Leu Asn Gly Thr Arg 50 55 60 His Ala Glu Phe Val Gly Val Asp Ala Ile Leu Lys Gln His Pro Ala 65 70 75 80 Ser Ile Leu Gln Glu Thr Val Leu Tyr Val Thr Val Glu Pro Cys Val 85 90 95 Met Cys Ala Ala Ala Leu Arg Gln Leu Gln Ile Lys His Val Tyr Phe 100 105 110 Gly Cys Gly Asn Asp Arg Phe Gly Gly Cys Gly Ser Val Phe Ser Val 115 120 125 His Ser Asp Pro Val Gly Arg Ser Val Glu Thr Pro Gly Tyr Pro Val 130 135 140 Thr Ser Gly Ile Phe Ser Lys Glu Ala Ile Met Leu Leu Arg Arg Phe 145 150 155 160 Tyr Leu Leu Gln Asn Asp Thr Ala Pro Asn Pro Ala Leu Lys Ala Met 165 170 175 Arg Val Leu Lys Glu Val Glu Asp 180 <210> 428 <211> 180 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 428 Met Glu Gln Leu Lys Asn Glu Ser Glu Thr Glu Leu Gln Asn Gln Ser 1 5 10 15 Glu Ala Glu Met Arg Asp Glu Lys Tyr Met Lys Glu Ala Leu Lys Gln 20 25 30 Ala Lys Lys Ala Tyr Ala Leu Glu Glu Thr Pro Ile Gly Cys Val Ile 35 40 45 Val His Glu Gly Lys Ile Ile Ala Arg Gly Tyr Asn Arg Arg Asn Thr 50 55 60 Asp Lys Ser Pro Leu Ala His Ala Glu Ile Ser Ala Ile Lys Lys Ala 65 70 75 80 Ser Lys Lys Leu Gly Asp Trp Arg Leu Glu Glu Cys Thr Leu Tyr Val 85 90 95 Thr Leu Glu Pro Cys Gln Met Cys Ala Gly Ala Ile Ile Gln Ser Arg 100 105 110 Ile Pro Arg Val Val Val Gly Cys Met Asn Pro Lys Ala Gly Cys Ala 115 120 125 Gly Ser Val Leu Asn Leu Leu Asp Val Gln Ala Phe Asn His Gln Ala 130 135 140 Glu Val Lys Thr Lys Val Leu Glu Glu Glu Cys Ser Leu Met Met Lys 145 150 155 160 Gln Phe Phe Arg Glu Leu Arg Ala Lys Gln Lys Met Lys Lys Lys Ser 165 170 175 Leu Leu Ser Glu 180 <210> 429 <211> 176 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 429 Met Val Gly Gly Arg Ser Ser Arg Gly Arg Arg Ser Pro Cys Arg Leu 1 5 10 15 Cys Val Cys Gln Arg Trp Pro Ser Asp Arg Ser Ser Lys Glu Ser Asp 20 25 30 Gln Arg Met Ala Gln Cys Lys Gly Ser Ser His Pro Leu Asp Ile Met 35 40 45 Arg Gly Arg Pro Val Asn Glu Gln Ala Thr Leu His Ala Glu Leu Glu 50 55 60 Ala Ile Asp His Leu Leu Pro Thr Asn Pro Ala Pro Leu Ser Ser Ile 65 70 75 80 Thr Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu 85 90 95 Arg Gln Ile Gly Ile Gly Arg Val Ile Tyr Gly Cys Gly Asn Asp Arg 100 105 110 Phe Gly Gly Cys Gly Ser Val Ile Asn Val Asn Ser Ser Cys Val Ser 115 120 125 Pro Leu Asp Val Leu Leu Cys Pro Asn Pro Pro Arg Glu Met Leu Asp 130 135 140 Thr His Pro Pro Phe Val Ala Glu Gly Gly Phe Tyr Arg Glu Glu Ala 145 150 155 160 Ile Met Leu Leu Arg Arg Phe Tyr Met Ser Glu Asn Gln Asn Gly Gln 165 170 175 <210> 430 <211> 209 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 430 Met Glu Gly Thr Ala Ala Ala Ser Ala Ala Gly Asp Gly Ser His Ala 1 5 10 15 Val Ser Ala Glu Glu Thr Ala Lys Trp Met Glu Glu Ala Met Arg Met 20 25 30 Ala Lys Glu Ala Leu Lys Asn Thr Glu Val Pro Val Gly Cys Leu Met 35 40 45 Val Tyr Asn Asn Glu Val Val Gly Lys Gly Arg Asn Glu Val Asn Gln 50 55 60 Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp Gln Val 65 70 75 80 Leu Asp Trp Cys Arg Glu Asn Asp Leu Arg Pro Ser Ala Val Phe Glu 85 90 95 His Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala 100 105 110 Ala Leu Arg Leu Met Ser Ile Leu Trp Pro Cys Lys Phe Lys Pro Cys 115 120 125 Ser Phe Pro Asn Glu Arg Phe Gly Gly Cys Asp Ile Ala Ser Ala Asp 130 135 140 Leu Pro Asn Thr Gly Asp Asn Phe Arg Val Leu His Thr Phe Ser Trp 145 150 155 160 Ala Trp Phe Ile Leu Leu Phe Ser Phe His Gln Cys Ile Pro Gly Tyr 165 170 175 Arg Ala Glu Glu Ala Val Glu Leu Leu Lys Thr Phe Tyr Lys Gln Glu 180 185 190 Asn Pro Asn Ala Pro Lys Ser Lys Val Arg Lys Lys Glu Cys Gln Lys 195 200 205 Pro <210> 431 <211> 181 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 431 Met Pro Val Met Ile Val Glu Lys Lys Ser Ile Ala Arg Ser His Glu 1 5 10 15 Tyr Trp Met Gln Arg Ala Ile Ala Glu Ala Gly Lys Ala Arg Ser Arg 20 25 30 Asp Glu Val Pro Ile Gly Cys Val Ile Val Arg Asp Asn Arg Ile Ile 35 40 45 Ala Arg Gly His Asn Leu Arg Glu Ser Ser Gln Asp Pro Ser Ala His 50 55 60 Ala Glu Met Ile Ala Ile Arg Lys Ala Ala Arg Lys Leu Ser Ser Trp 65 70 75 80 Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met 85 90 95 Cys Met Gly Ala Ile Ile Leu Ser Arg Ile Pro Arg Val Val Phe Gly 100 105 110 Cys Leu Asp Pro Lys Gly Gly Ala Ala Gly Ser Leu Tyr Asp Leu Ser 115 120 125 Asn Asp Pro Arg Leu Asn His Arg Val Glu Leu Leu Pro Gly Val Leu 130 135 140 Glu Arg Asp Cys Ser Ser Leu Leu Ser Gly Phe Phe Ala Glu Leu Arg 145 150 155 160 Arg Arg Arg Arg Glu Ala Arg Leu Ser Ser Ala Gly Glu Leu Pro Gly 165 170 175 Thr Pro Gln Gly Cys 180 <210> 432 <211> 160 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 432 Met Leu Ser Ser Glu Asp Asn Lys Trp Met Lys Leu Ala Leu Asp Glu 1 5 10 15 Ala Asp Lys Ala Glu Lys Ile Gly Glu Val Pro Ile Gly Ala Val Ile 20 25 30 Val Lys Gly Glu Glu Ile Ile Ala Thr Ala Tyr Asn Arg Arg Glu Val 35 40 45 Asp Ala Gln Ala Thr Ala His Ala Glu Leu Ile Ala Ile Gln Lys Ala 50 55 60 Cys Gln His Leu Asp Ala Trp Arg Leu Ser Gly Cys Thr Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Gln Ser Arg 85 90 95 Ile Asp Arg Val Val Phe Gly Ala Tyr Asp Pro Lys Ala Gly Cys Ala 100 105 110 Gly Ser Leu Met Asn Leu Leu Gln Asp Glu Arg Phe Asn His Gln Thr 115 120 125 Glu Val Asp Cys Gly Cys Leu Ala Asp Glu Cys Gly Gly Lys Leu Ser 130 135 140 Thr Phe Phe Arg Ala Leu Arg Gln Lys Lys Lys Gly Leu Lys Gln Lys 145 150 155 160 <210> 433 <211> 153 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 433 Met Val Gly Cys Val Phe Ala Ile Glu Ser Asp Ile Ile Ala Glu Ser 1 5 10 15 Arg Asn Ser Val Asn Ala Thr His Asn Pro Thr Arg His Ala Glu Ile 20 25 30 Asn Cys Ile Asp Tyr Val Ile Glu Tyr Cys Lys Ala Asn Asn Ile Asp 35 40 45 Tyr Arg Leu Tyr Phe Lys Asn Val Thr Val Tyr Val Thr Val Glu Pro 50 55 60 Cys Ile Met Cys Ala Ala Ala Leu Ser Asn Leu Gly Val Lys Glu Val 65 70 75 80 Val Tyr Gly Cys Ala Asn Asp Arg Phe Gly Gly Lys Thr Val Leu Asp 85 90 95 Ile Ser Asn Phe Tyr Glu His Asn Tyr Asn Leu Ile Gly Asn Leu Met 100 105 110 Ala Asn Glu Ala Met Ala Leu Leu Lys Gln Phe Tyr Lys Gly Ala Asn 115 120 125 Pro Asn Ala Pro Glu Ser Lys Val Lys Lys Lys Gln Lys Lys Arg Gln 130 135 140 Lys Ala Ala Ser Ala Thr Leu Arg Ser 145 150 <210> 434 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 434 Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg 1 5 10 15 Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg 20 25 30 Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys 35 40 45 Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys 50 55 60 Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys 85 90 95 Thr Val Tyr Tyr Gly Ala Pro Asp Leu Lys Ala Gly Ser Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val 115 120 125 Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe 130 135 140 Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln 145 150 155 160 Ala Gln Met Asn Asp Leu Asn Glu Ile 165 <210> 435 <211> 165 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 435 Met Asp Gln Gly Thr His Glu Lys Trp Met Asn Val Ala Leu Glu Glu 1 5 10 15 Ala Ala Lys Ala Glu Glu Ile Gly Glu Val Pro Ile Gly Ala Val Ile 20 25 30 Ile Lys Glu Gly Lys Leu Ile Ala Ser Ala Tyr Asn Leu Arg Glu Ala 35 40 45 Asn His Ser Ala Leu Ala His Ala Glu Leu Leu Ala Ile Glu Gln Ala 50 55 60 Asn Lys Lys Leu Gly Ala Trp Arg Leu Glu Gly Cys Thr Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg 85 90 95 Ile Pro Thr Val Val Tyr Gly Ala Gln Asp Gln Lys Ala Gly Cys Ala 100 105 110 Gly Thr Leu Met Asn Leu Leu Gln Glu Gln Arg Phe Asn His Arg Cys 115 120 125 Glu Val Ile Ser Gly Val Leu Glu Glu Gly Cys Gly Glu Lys Leu Ser 130 135 140 Ala Phe Phe Arg Lys Leu Arg Ala Asp Gln Lys Arg Lys Lys Gln Asp 145 150 155 160 Leu Gln Glu Gly Arg 165 <210> 436 <211> 149 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 436 Met Asp Glu Met Tyr Met Ser Leu Ala Leu Glu Glu Ala Tyr Lys Ala 1 5 10 15 Phe Ser Thr Tyr Glu Val Pro Val Gly Ala Val Ile Val His Asp Ser 20 25 30 Lys Val Ile Ser Arg Gly Tyr Asn Lys Arg Glu Thr Leu Lys Asp Pro 35 40 45 Thr Ala His Ala Glu Ile Ile Ala Ile Lys Glu Ala Ser Lys Tyr Leu 50 55 60 Gly Gly Trp Arg Leu Ile Gly Cys Thr Met Tyr Val Thr Leu Glu Pro 65 70 75 80 Cys Ser Met Cys Ala Gly Ala Ile Ile Asn Ser Arg Ile Glu Arg Leu 85 90 95 Val Ile Gly Ala Lys Asp Pro Lys Arg Gly Cys Cys Gly Ser Val Ile 100 105 110 Asn Leu Leu Asp Asn Pro Asn Phe Asn His Lys Val Glu Val Glu Phe 115 120 125 Gly Ile Leu Lys Asp Lys Cys Ser Asn Ile Leu Thr Glu Phe Phe Lys 130 135 140 Gln Ile Arg Cys Lys 145 <210> 437 <211> 179 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 437 Met Arg Glu Leu Pro Tyr Ser Pro Glu Glu Leu Met Arg Leu Ala Ile 1 5 10 15 Arg Glu Ala Lys Lys Ala Glu Arg Asn Gly Asp Val Pro Ile Gly Cys 20 25 30 Leu Ile Val Tyr Asp Gly Arg Leu Pro Gly Ser Arg Ala Asp Gln Arg 35 40 45 Ala Glu Glu Gln Ser Ile Arg Pro Gly Glu Ile Ile Gly Arg Gly Tyr 50 55 60 Asn Arg Arg Asn Arg Asp Lys Ser Ala Leu Lys His Ala Glu Ile Ser 65 70 75 80 Ala Ile Ser Lys Ala Cys Arg Arg Leu Gly Asp Trp Arg Leu Glu Asp 85 90 95 Cys Thr Met Ile Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala 100 105 110 Ile Leu Gln Ala Arg Ile Pro Arg Leu Leu Phe Gly Ala Glu Asn Pro 115 120 125 Lys Ala Gly Phe Cys Gly Ser Val Leu Asp Ile Leu Gln Leu Ser Ala 130 135 140 Leu Asn His Arg Val Glu Leu Leu Pro Pro Val Leu Arg Glu Asp Cys 145 150 155 160 Lys Arg Leu Met Thr Asp Phe Phe Gly Arg Leu Arg Ala His Ser Asp 165 170 175 Ser Glu Glu <210> 438 <211> 194 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 438 Met Val Ser His Leu Ser Tyr Lys Ala Glu Glu Ala Leu Ile Ala Arg 1 5 10 15 Glu Ile Pro Val Gly Cys Val Phe Val Arg Asn Asn Glu Ile Ile Ala 20 25 30 Arg Gly Arg Asn Arg Thr Asn Glu Thr Arg Asn Val Arg Pro Ser Ser 35 40 45 Leu Ser Phe Leu Ser Leu Ser Asn Thr His Glu Ser Gln Ala Ser Ile 50 55 60 His Ala Glu Leu Ala Ala Leu Ser His Ile Leu Pro Asn Gly Ser Ser 65 70 75 80 Arg Arg Gln Phe Glu Pro Leu Thr Asp Val Thr Leu Tyr Val Thr Val 85 90 95 Glu Pro Cys Leu Met Cys Ala Ser Ala Leu Arg Gln Val Gly Ile Arg 100 105 110 Lys Val Ile Tyr Gly Cys Ala Asn Asp Arg Phe Gly Gly Cys Gly Gly 115 120 125 Val Leu Glu Ile His Asn Lys Tyr Ala Leu Phe Thr Ser Phe His Arg 130 135 140 Ala Ile Ser Met Thr Arg Val Pro Ala Pro Ser Cys Tyr Ile Arg Asn 145 150 155 160 His Trp Lys Leu Leu Glu Val Thr Ser Ala Lys Arg Arg Ser Cys Phe 165 170 175 Ser Gly Gly Ser Thr Ser Leu Arg Thr Arg Arg Val Ser Met Thr Trp 180 185 190 His Leu <210> 439 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 439 Met Glu Arg Leu Gln Ile Lys Asn Asp Ile Glu Gly Met Lys Glu Ala 1 5 10 15 Leu Ile Glu Ala Lys Lys Ala Phe Ala Ile Gly Glu Ile Pro Ile Gly 20 25 30 Ala Ile Ile Cys Asp Asp Lys Gly Asn Ile Ile Ser Arg Gly His Asn 35 40 45 Leu Arg Glu Lys Thr Phe Asp Ala Thr Ala His Ala Glu Ile Val Ala 50 55 60 Ile Arg Lys Ala Cys Thr Lys Leu Gln Asn Trp Arg Leu Ser Asp Leu 65 70 75 80 Thr Leu Tyr Val Thr Val Glu Pro Cys Pro Met Cys Ala Gly Ala Ile 85 90 95 Phe Ser Ser Arg Leu Lys Arg Leu Val Tyr Gly Ala Thr Asp Trp Arg 100 105 110 Ala Gly Gly Cys Glu Ser Val Phe Asn Ile Val Asn Asn His Trp Leu 115 120 125 Asn His Gln Thr Gln Ile Arg Ala Gly Val Leu Glu Asp Glu Cys Ser 130 135 140 Leu Leu Val Lys Lys Phe Phe Gln Thr Arg Arg Gln Asn His Asn 145 150 155 <210> 440 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 440 Met Val Asn Ser Ser Trp Glu Arg Thr Ala Asp Lys Met His Glu Glu 1 5 10 15 Phe Met Arg Ala Ala Ile Glu Glu Ala Lys Lys Ala Glu Ala Ile Gly 20 25 30 Glu Val Pro Ile Gly Ala Val Ile Val His Asp Gly Gly Ile Ile Ala 35 40 45 Arg Ala His Asn Arg Arg Glu Thr Ser Gln Asn Pro Leu Thr His Ala 50 55 60 Glu Ile Ile Ala Ile Asp Ala Ala Ser Glu Lys Ile Gly Ser Trp Arg 65 70 75 80 Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys 85 90 95 Ser Gly Ala Ile Val Met Ser Arg Ile Pro His Val Val Tyr Gly Ala 100 105 110 Lys Asp Pro Lys Gly Gly Thr Val Glu Ser Leu Met His Leu Leu Asp 115 120 125 Glu Pro Arg Phe Asn His Arg Ala Tyr Ile Thr Ala Gly Val Leu Gly 130 135 140 Glu Glu Cys Ser Ser Met Leu Thr Leu Phe Phe Arg Lys Leu Arg Gly 145 150 155 160 Arg Arg Lys Arg Arg Ala Glu Asp 165 <210> 441 <211> 182 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 441 Met Asp Ser Trp Met Glu Glu Ala Phe Val Gln Ala Asn Glu Ala Leu 1 5 10 15 Gln Val Gly Glu Val Pro Val Gly Cys Val Phe Val Phe Asn Asp Gln 20 25 30 Val Ile Ala Arg Ser Arg Asn Thr Val Asn Glu Thr His Asn Ala Thr 35 40 45 Arg His Ala Glu Met Asn Cys Val Asp Gln Thr Val Thr Trp Cys Lys 50 55 60 Glu Thr Ser His Asp Phe Asp Glu Val Met Ser Ala Val Lys Val Trp 65 70 75 80 Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala Ala Leu His Ser Leu 85 90 95 Arg Val Ala Glu Val Val Tyr Gly Cys Asn Asn Asp Arg Phe Gly Gly 100 105 110 Cys Thr Ser Val Phe Asp Thr Ser Leu Leu Tyr Ser Pro Ala Thr Pro 115 120 125 Met Lys Gly Gly Met Gln Ser Asp Arg Ala Met Gln Leu Leu Lys Asp 130 135 140 Phe Tyr Lys Gly Thr Asn Pro Asn Ala Pro Gln Pro Lys Val Lys Lys 145 150 155 160 Asp Lys Lys Val Ala Ser Ile Ser Asp Val Ser Glu Ile Gln His Asn 165 170 175 Lys Glu Ala Ser Asp Ser 180 <210> 442 <211> 178 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 442 Met Ser Gly Lys Val Asn Asp Leu Asn Lys Asp Ile Ser Asn Asn Val 1 5 10 15 Asp Leu Glu Glu Ser Tyr Asp Ser Lys Lys Ala Asn Lys Tyr Met Lys 20 25 30 Glu Ala Ile Lys Gln Ala Lys Lys Ala Ala Ser Ile Gly Glu Val Pro 35 40 45 Ile Gly Cys Val Ile Val Tyr Gln Asp Lys Ile Ile Gly Arg Gly Tyr 50 55 60 Asn Arg Arg Met Val Asp Lys Asn Thr Leu Ser His Ala Glu Leu Asn 65 70 75 80 Ala Ile Lys Lys Ala Ser Lys Lys Leu Asp Asp Trp Arg Leu Asp Asp 85 90 95 Cys Glu Leu Tyr Val Thr Thr Glu Pro Cys Gln Met Cys Ala Gly Ala 100 105 110 Ile Val Gln Ala Arg Ile Lys Lys Val Tyr Ile Gly Cys Met Asn Pro 115 120 125 Lys Ala Gly Cys Ala Gly Ser Ile Met Asn Leu Leu Gln Val Asp Lys 130 135 140 Phe Asn His Gln Val Glu Met Glu Lys Gly Ile Leu Glu Glu Glu Cys 145 150 155 160 Ser Asn Leu Leu Lys Asp Phe Phe Arg Asn Leu Arg Lys Lys Gln Lys 165 170 175 Asp Glu <210> 443 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 443 Met Asp Tyr Thr Ile Glu Glu Lys Ala Met Phe Met Arg Glu Ala Leu 1 5 10 15 Lys Glu Ala Glu Ile Ala Leu Ala Asn Asp Glu Ile Pro Ile Gly Cys 20 25 30 Val Leu Val Lys Asp Gly Gln Ile Ile Gly Arg Gly His Asn Ala Arg 35 40 45 Glu Glu Leu Gln Arg Ala Val Met His Ala Glu Ile Met Ala Ile Glu 50 55 60 Glu Ala Asn Gln Arg Glu Asn Ser Trp Arg Leu Leu Asp Thr Thr Leu 65 70 75 80 Phe Val Thr Ile Glu Pro Cys Val Met Cys Ser Gly Ala Ile Gly Leu 85 90 95 Ala Arg Ile Pro Gln Val Ile Tyr Gly Ala Thr Asn Gln Lys Phe Gly 100 105 110 Gly Ala Gly Ser Leu Tyr Asp Ile Leu Ala Asp Glu Arg Leu Asn His 115 120 125 Arg Val Glu Val Glu Thr Gly Ile Leu Glu Ala Glu Cys Ala Ala Ile 130 135 140 Met Gln Thr Phe Phe Arg Gln Gly Arg Glu Arg Lys Lys Gln Ala Lys 145 150 155 160 Leu Ala Ala Lys Ala Glu Thr Gln Glu 165 <210> 444 <211> 165 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 444 Met Asn Gln Ser Gln Asp Glu His Tyr Met Arg Arg Ala Leu Asp Leu 1 5 10 15 Ala Arg Gln Ala Glu Gln Leu Gly Glu Val Pro Val Gly Ala Val Val 20 25 30 Val Leu Asn Gly Lys Val Ile Ala Ala Ala Gly Asn Arg Arg Glu Thr 35 40 45 Trp Gln Asp Pro Thr Ala His Ala Glu Leu Ile Ala Leu Arg Glu Ala 50 55 60 Ala Lys Arg Ile Asp Ser Trp Arg Leu Glu Glu Ala Thr Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Ile Met Cys Met Gly Gly Ile Ile Leu Ser Arg 85 90 95 Ile Pro Arg Leu Val Phe Gly Ala Arg Asp Pro Arg Val Gly Ala Val 100 105 110 Gly Ser Val Phe Asp Leu Ala Asp Asp Glu Arg Phe Asn His Arg Val 115 120 125 Glu Val Ser Glu Gly Val Leu Ala Glu Glu Cys Ser Glu Ile Leu Ser 130 135 140 Asn Phe Phe Arg Gln Leu Arg Gln Lys Lys Lys Ala Ala Arg Met Arg 145 150 155 160 Ser Ala Lys Asp Glu 165 <210> 445 <211> 190 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 445 Met Asn Leu Asn Met Gln Met Lys Pro Lys Ala Leu Gly Arg Ile Ser 1 5 10 15 Thr Lys Gly Leu Thr Gln Glu Glu Ile Gln Asp Ile Lys Phe Met Lys 20 25 30 Ala Ala Ile Thr Gln Ala Arg Lys Ala Tyr Val Leu Gly Glu Val Pro 35 40 45 Ile Gly Cys Val Ile Val Tyr Glu Gly Lys Ile Ile Gly Arg Gly Tyr 50 55 60 Asn Arg Arg Asn Thr Asp Lys Thr Thr Leu Ala His Ala Glu Ile Thr 65 70 75 80 Ala Ile Lys Arg Ala Gly Lys Val Ile Gly Asp Trp Arg Leu Glu Gly 85 90 95 Cys Lys Leu Tyr Val Thr Leu Glu Pro Cys Gln Met Cys Ala Gly Ala 100 105 110 Ile Val Gln Ala Arg Ile Pro Glu Val Ile Met Ala Ala Glu Asn Pro 115 120 125 Lys Ala Gly Cys Ala Gly Ser Val Leu Asp Ile Leu Asn Asn Pro Gly 130 135 140 Phe Asn His Gln Val Gln Val Lys Arg Gly Val Leu Lys Asp Glu Cys 145 150 155 160 Ala Lys Met Leu Lys Glu Phe Phe Val Glu Leu Arg Ala Arg Asn Lys 165 170 175 Ala Glu Lys Glu Leu Lys Ser Ser Gln Gly Leu Asp Glu Asn 180 185 190 <210> 446 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 446 Met Ser Ser His Pro Lys Asp Glu Tyr Tyr Met Ser Leu Ala Ile Ala 1 5 10 15 Glu Ala Arg Lys Ala Glu Ala Ile Gly Glu Val Pro Ile Gly Ala Val 20 25 30 Leu Val Ile Asp Asp Glu Val Val Ala Ala Ala Tyr Asn Leu Arg Glu 35 40 45 Ser Glu His Arg Ala Ile Ala His Ala Glu Leu Leu Ala Ile Asp Gln 50 55 60 Ala Cys Lys Lys Thr Gly Ala Trp Arg Leu Ser Gly Ser Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Val Leu Ser 85 90 95 Arg Val Asp Arg Val Val Phe Gly Ala His Asp Pro Lys Ala Gly Cys 100 105 110 Ala Gly Ser Leu Met Asn Leu Leu Glu Glu Glu Arg Phe Asn His Val 115 120 125 Cys Asp Val Thr Thr Gly Val Arg Lys Glu Glu Cys Ser Ala Met Leu 130 135 140 Ser Thr Phe Phe Arg Thr Leu Arg Gln Arg Asn Lys Glu Lys Arg Lys 145 150 155 160 Gln Arg Leu Gly Asp Lys Gln Pro 165 <210> 447 <211> 127 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 447 Met Ser Tyr Asp Leu Ser Arg His Phe Lys Tyr Met Ala Ile Ser Leu 1 5 10 15 Phe Val Gly Tyr Lys Ala Leu Leu Asn Asn Glu Thr Pro Val Ser Cys 20 25 30 Ile Val Val Asn Ser Lys Thr Asp Glu Ile Ile Ser Ile Gly Tyr Asn 35 40 45 Tyr Thr Asn His Ser Leu Asn Gly Thr Gln His Ala Glu Phe Ile Ala 50 55 60 Leu Gln Arg Phe Glu Ser Asp Glu Ser Ile Asn Tyr Ser Asp Leu Ile 65 70 75 80 Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Tyr Leu Arg 85 90 95 Gln Leu Gly Ile Gly Lys Val Ile Phe Gly Cys Gly Asn Asp Arg Phe 100 105 110 Gly Gly Asn Gly Ser Ile Ala Ser Thr Gln Arg Ser Lys Phe Thr 115 120 125 <210> 448 <211> 164 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 448 Met Thr Ile Asp Glu Lys Tyr Met Arg Ala Ala Ile Arg Gln Ala Glu 1 5 10 15 Lys Ala Gly Ala Met Gly Glu Val Pro Ile Gly Cys Val Ile Val Tyr 20 25 30 Glu Asp Lys Ile Ile Ala Arg Gly Tyr Asn Arg Arg Thr Ile Asp Lys 35 40 45 Asn Val Leu Ser His Ala Glu Ile Asn Ala Ile Arg Lys Ala Cys Arg 50 55 60 Lys Val Gly Asp Trp Arg Leu Glu Gly Cys Thr Met Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ala Arg Ile Pro 85 90 95 Lys Val Ile Met Gly Cys Met Asn Ala Lys Ala Gly Cys Ala Gly Ser 100 105 110 Val Leu Asp Leu Phe His Gln Asp Gly Leu Asn His Gln Val Glu Thr 115 120 125 Glu Ser Gly Val Leu Gly Asp Glu Cys Ser Arg Leu Met Lys Asp Phe 130 135 140 Phe Lys Ala Leu Arg Glu Lys Ser Lys Lys Lys Pro Glu Gly Ile Ser 145 150 155 160 Phe Ile Thr Pro <210> 449 <211> 177 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 449 Met Glu Thr Val Gln Phe Asp His Asp Ser His Asn Pro Ile Gln Ala 1 5 10 15 Glu His Glu Lys Trp Met Arg Glu Ala Met Leu Glu Ala Asp Lys Ala 20 25 30 Lys Ala Leu Met Glu Val Pro Ile Gly Ala Val Ile Val Arg Gly Gly 35 40 45 Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Thr Ser Leu Asp Pro 50 55 60 Thr Ala His Ala Glu Ile Ile Ala Ile Arg Glu Ala Ser Glu Lys Leu 65 70 75 80 Gly Ala Trp Arg Leu Leu Asp Cys Arg Leu Tyr Val Thr Leu Glu Pro 85 90 95 Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg Val Pro Gln Val 100 105 110 Ile Tyr Gly Thr Pro Asp Pro Lys Ala Gly Cys Ala Gly Thr Leu Met 115 120 125 Asn Leu Leu Gln Glu Glu Arg Phe Asn His Cys Val Asp Val Ile Ser 130 135 140 Gly Val Leu Gln Pro Glu Cys Ala Ser Gln Leu Thr Asp Phe Phe Arg 145 150 155 160 Glu Leu Arg Arg Arg Ala Lys Glu Ala Lys Lys Ala Leu Pro Ala Glu 165 170 175 Glu <210> 450 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 450 Met Lys Thr Asp Glu Asp Phe Met Glu Leu Ala Leu Glu Glu Ala Arg 1 5 10 15 Lys Ala Leu Ala Leu Glu Glu Val Pro Ile Gly Ala Val Val Val Cys 20 25 30 Asn Gly Glu Ile Val Gly Ser Gly His Asn Leu Lys Glu Thr Glu Asn 35 40 45 Asp Pro Thr Ala His Ala Glu Ile Val Ala Ile Arg Asp Ala Ala Arg 50 55 60 Lys Leu Ser Ser Trp Arg Leu Asn Glu Cys Gln Leu Tyr Val Thr Ile 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Met Gln Ala Arg Leu Gln 85 90 95 Arg Val Val Tyr Gly Ala Val Asp Pro Lys Ala Gly Val Ala Gly Ser 100 105 110 Leu Tyr Asn Leu Leu Gln Asp Asn Arg Phe Asn His Thr Val Glu Leu 115 120 125 Lys Ser Gly Val Leu Ala Ala Glu Cys Arg Gln Ile Ile Lys Asp Phe 130 135 140 Phe Ser Glu Leu Arg Gln Thr Arg Gly Arg Val Gly Glu Ser Gly 145 150 155 <210> 451 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 451 Met Glu Lys Glu Glu Ala Ser Leu Gln Gly Ile His Glu Arg Trp Met 1 5 10 15 Arg Gln Ala Leu Glu Glu Ala Asp Lys Ala Glu Gln Leu Asn Glu Val 20 25 30 Pro Ile Gly Ala Ile Ile Val Lys Asp Gln Gln Ile Ile Gly Arg Gly 35 40 45 Tyr Asn Val Arg Glu Thr Gln His Gln Ala Thr Gly His Ala Glu Ile 50 55 60 Gln Ala Ile Glu Asp Ala Asn Arg His Gln Gln Ala Trp Arg Leu Glu 65 70 75 80 Gly Ala Thr Met Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly 85 90 95 Ala Leu Ile Asn Ser Arg Ile Gln Thr Val Val Tyr Gly Ala Ser Asp 100 105 110 Leu Lys Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu Gln Asp Asp 115 120 125 Arg Phe Asn His Gln Val Glu Val Ile Ser Gly Val Leu Ala Glu Glu 130 135 140 Cys Gly Asp Lys Leu Ser Tyr Phe Phe Arg Lys Leu Arg Gln Arg Lys 145 150 155 160 Gly Lys Asn Ile Asp Arg Ala Glu 165 <210> 452 <211> 150 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 452 Met Thr Ala Asp Glu Glu Tyr Met Thr Leu Cys Ile Glu Leu Ala Lys 1 5 10 15 Lys Ala Ala Glu Lys Gly Glu Cys Pro Val Gly Ala Ile Val Val Asp 20 25 30 Lys Asp Gly Arg Ile Ile Gly Glu Gly Tyr Asn Met Arg Glu Ala Glu 35 40 45 Gln Met Pro Thr Ala His Ala Glu Ile Ile Ala Ile Glu Gln Ala Ala 50 55 60 Lys Ala Met Asn Ser Trp Arg Leu Thr Glu Cys Thr Leu Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Asn Ser Arg Ile 85 90 95 Lys Arg Leu Val Tyr Gly Ala Phe Asp Glu Lys Gly Gly Ala Cys Ala 100 105 110 Ser Leu Met Glu Ile Phe Asp Tyr Pro Phe Asn His Arg Pro Met Val 115 120 125 Arg Ser Arg Val Leu Gln Asp Glu Cys Ala Lys Leu Leu Thr Glu Phe 130 135 140 Phe Lys Asp Leu Arg Thr 145 150 <210> 453 <211> 182 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 453 Met Thr Asp Thr Phe Thr Ala Thr Pro Ala His Met Gln Leu Ala Leu 1 5 10 15 Val Gln Ala Gln His Ala Trp Asp Leu Gly Glu Val Pro Val Gly Ala 20 25 30 Val Val Val Lys Asp Gly Glu Val Ile Ala Thr Gly Tyr Asn Gln Pro 35 40 45 Ile Gly Lys His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Ala Ala Ala Glu Ile Leu Gly Asn Tyr Arg Leu Pro Gly Cys Glu Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Met His 85 90 95 Ala Arg Leu Ala Arg Val Val Tyr Gly Ala Ala Asp Pro Lys Thr Gly 100 105 110 Ala Cys Gly Ser Val Val Asn Leu Phe Ala Gln Glu Glu Leu Asn His 115 120 125 His Thr Glu Leu Val Gly Gly Val Met Ala Glu Ala Cys Gly Gln Met 130 135 140 Leu Lys Ser Phe Phe Ser Glu Arg Arg Glu Gln Leu Lys Gln Glu Arg 145 150 155 160 Leu Gln Arg Gln Ala Ile Ala His Ala His Ala Asn Ala His Ser Ile 165 170 175 Asp Asp Glu Ala Asn Asp 180 <210> 454 <211> 154 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 454 Met His Lys Ile Phe Leu Glu Glu Ala Tyr Lys Glu Ala Ile Lys Ala 1 5 10 15 Leu Gln Glu Gln Glu Val Pro Val Gly Cys Val Ile Val Gln Asn Lys 20 25 30 Gln Ile Leu Ser Arg Ser His Asn Leu Thr Asn Lys Leu His Asp Pro 35 40 45 Leu Ala His Ala Glu Ile Asn Gly Leu Arg Glu Leu Leu Gln Gln Ser 50 55 60 Gln Ile Thr Asp Asp Leu Thr Phe Tyr Ile Thr Cys Glu Pro Cys Ile 65 70 75 80 Met Cys Leu Gly Ile Leu Asn Arg Ile Lys Ala Arg Ile Tyr Tyr Gly 85 90 95 Cys Lys Asn Ile Ile Phe Gly Gly Ile Thr Ile Leu Glu Thr Pro Ser 100 105 110 Asp Ser His Phe Ile Glu Asp Lys Arg Cys Tyr Glu Ile Leu Gln Lys 115 120 125 Phe Tyr Ser Asn Glu Asn Glu Phe Ala Pro Glu Glu Lys Arg Lys Lys 130 135 140 Lys Asn Asn Arg Asn Asn Gly Val Pro Leu 145 150 <210> 455 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 455 Met Leu Thr Ser Leu Lys Ala Thr Arg His Ala Glu Phe Leu Gly Ile 1 5 10 15 Asp Glu Ile Leu Ser Lys Tyr Asp Lys Asp Val Phe Lys Glu Thr Asp 20 25 30 Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu Arg 35 40 45 Gln Leu Glu Ile Arg Lys Val Tyr Phe Gly Ala Ala Asn Asp Arg Phe 50 55 60 Gly Gly Cys Gly Ser Val Leu Ser Leu His Asn His Ala Lys Leu Pro 65 70 75 80 Glu Pro Ala Tyr Asn Val Tyr Pro Gly Phe Tyr Arg Asp Glu Ala Ile 85 90 95 Val Met Leu Arg Lys Phe Tyr Val Gln Glu Asn Thr Lys Ala Pro Val 100 105 110 Pro Arg Gly Lys Lys Thr Arg Glu Leu Lys Leu Glu Val Glu Asp Asn 115 120 125 Phe Asp Tyr Ser Lys Phe Val Gly Ser Glu Glu Glu Phe Ile Asn Val 130 135 140 Tyr Gly Lys Glu Arg Leu Ser Glu Tyr Arg Lys Leu Ser Ser Lys 145 150 155 <210> 456 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 456 Met Lys Ser Asp Glu Phe Tyr Met Lys Leu Ala Ile Glu Glu Ala Lys 1 5 10 15 Arg Ala Ala Glu Ile Asn Glu Val Pro Ile Gly Ala Val Leu Val Ser 20 25 30 Asn Asp Glu Val Ile Ala Thr Ala His Asn Leu Arg Glu Thr Glu Gln 35 40 45 Arg Ser Ile Ala His Ala Glu Leu Leu Val Ile Asp Glu Ala Cys Arg 50 55 60 Arg Thr Gly Ser Trp Arg Leu Glu Asn Ala Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Ser Gly Ala Ile Val Leu Ser Arg Val Asn 85 90 95 Arg Val Val Tyr Gly Ala Ser Asp Pro Lys Gly Gly Cys Ala Gly Thr 100 105 110 Leu Met Asn Leu Leu Gln Glu Lys Arg Phe Asn His Gln Ala Glu Val 115 120 125 Leu Ser Gly Val Cys Glu Glu Glu Cys Gly Gln Leu Leu Ser Ser Phe 130 135 140 Phe Arg Gly Ile Arg Glu Arg Lys Lys Lys Glu Lys Val Asn Tyr Ile 145 150 155 160 Gln Gln Lys Ser Ala Thr Ser Asn Glu 165 <210> 457 <211> 171 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 457 Met Arg Asp Asn Asn Leu Tyr Met Arg Glu Ala Leu Lys Glu Ala Tyr 1 5 10 15 Ile Ala Ala Glu Leu Gly Glu Val Pro Val Gly Ala Val Ile Val Lys 20 25 30 Ala Gly Glu Ile Ile Ala Lys Ala His Asn Met Val Glu Ala Tyr Ala 35 40 45 Ser Ser Ser Ala His Ala Glu Met Leu Ala Met Asp Ala Ala Glu Ala 50 55 60 Arg Leu Gly Ser Lys Trp Leu Ser Gly Cys Glu Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Ser Met Cys Ala Gly Ala Met Val Leu Ala Arg Leu Glu 85 90 95 Lys Leu Cys Ile Gly Thr Met Asp Pro Lys Asn Gly Ala Ser Gly Ser 100 105 110 Ile Phe Asp Ile Thr Gly Ser Asp Ser Leu Asn His Arg Ile Asp Val 115 120 125 Glu Arg Gly Ile Leu Ala Asp Glu Cys Ala Glu Ala Leu Thr Ser Phe 130 135 140 Phe Arg Glu Leu Arg Ile Thr Lys Ala Gln Leu Arg Lys Ser Asn Ile 145 150 155 160 Val Lys Asp Lys Val Asp Ile Pro Glu Glu Lys 165 170 <210> 458 <211> 151 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 458 Met Leu Glu Asp Phe Met Arg Val Ala Leu Glu Glu Ala Lys Lys Ala 1 5 10 15 Tyr Lys Gln Gly Glu Val Pro Val Gly Ala Val Ile Val Lys Asn Gly 20 25 30 Lys Val Ile Ser Lys Ala His Asn Glu Thr Arg Gln Lys Lys Asn Ala 35 40 45 Val Ala His Ala Glu Ile Leu Ala Ile Asp Lys Ala Cys Lys Lys Leu 50 55 60 Glu Asn Glu Arg Leu Val Asp Thr Glu Met Tyr Val Thr Leu Glu Pro 65 70 75 80 Cys Ala Met Cys Ala Gly Ala Ile Val Gln Ala Arg Ile Pro Glu Val 85 90 95 Met Ile Gly Thr Arg Asp Leu Lys Ser Gly Ala Ala Asn Thr Ile Leu 100 105 110 Asn Val Leu Glu Asn Glu Lys Leu Asn His Arg Ala Glu Leu Arg Phe 115 120 125 Gly Ile Phe Glu Glu Glu Cys Ser Glu Ile Leu Lys Thr Phe Phe Lys 130 135 140 Glu Leu Arg Asp Glu Arg Lys 145 150 <210> 459 <211> 158 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 459 Met Thr Arg Asp Glu Met Tyr Met Arg Lys Ala Leu Glu Leu Ala Ala 1 5 10 15 Leu Ala Ala Asp Glu Asp Glu Val Pro Val Gly Ala Val Val Val Lys 20 25 30 Lys Ser Thr Gly Glu Ile Val Gly Arg Gly Phe Asn Arg Arg Glu Tyr 35 40 45 Gly Arg Ser Pro Leu Thr His Ala Glu Ile Val Ala Ile Asp Glu Ala 50 55 60 Ser Arg Lys Leu Gly Gly Trp Arg Leu Ile Asp Cys Glu Leu Phe Val 65 70 75 80 Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val Ile Asn Ser Arg 85 90 95 Val Glu Arg Val Val Phe Gly Ala Tyr Asp Lys Lys Ala Gly Ser Cys 100 105 110 Gly Ser Val Val Asp Leu Phe Gly Leu Pro Tyr Asn His Lys Pro Glu 115 120 125 Cys Ile Gly Gly Val Leu Glu Glu Glu Cys Ala Ala Val Leu Thr Glu 130 135 140 Phe Phe Lys Gly Leu Arg Lys Arg Lys Val Lys Val Asn Glu 145 150 155 <210> 460 <211> 191 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 460 Met Val Thr Val Thr Arg Glu Phe Ser Pro Ser Asp Leu Ala Phe Met 1 5 10 15 Glu Leu Ala Leu Lys Gln Ala Lys Phe Ala Met Ser Asn Leu Glu Val 20 25 30 Pro Val Gly Cys Val Val Val Val Asp Gly Lys Ile Val Ala Ser Gly 35 40 45 Cys Asn Arg Thr Asn Glu Thr Arg Asn Ala Thr Arg His Ala Glu Met 50 55 60 Glu Ala Ile Asp Leu Leu Leu Glu Gln Trp Gln Lys Ala Gly Leu Ser 65 70 75 80 Gln Val Glu Val Ala Glu Lys Phe Ser Arg Cys Val Leu Tyr Val Thr 85 90 95 Cys Glu Pro Cys Ile Met Cys Ala Thr Ala Leu Ser Ile Leu Gly Ile 100 105 110 Arg Asp Val Tyr Tyr Gly Cys Ala Asn Asp Lys Phe Gly Gly Cys Gly 115 120 125 Ser Ile Leu Ser Leu His Glu Ser Gly Cys Glu Gln Leu Phe Arg Ser 130 135 140 Ser His Glu Asn Gly Phe Arg Cys Ser Gly Gly Leu Met Ala Ser Glu 145 150 155 160 Ala Ile Ala Leu Leu Arg Ser Phe Tyr Glu Gln Gly Asn Pro Asn Ala 165 170 175 Pro Lys Pro His Arg Pro Val Arg Met Thr Gln Glu Asp Ser Thr 180 185 190 <210> 461 <211> 158 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 461 Met Pro Ser His Asn Asn Thr Asp Lys Tyr Trp Met Gln Gln Ala Ile 1 5 10 15 Asp Gln Ala Lys Leu Ala Tyr Asn Lys Gly Glu Val Pro Ile Gly Ala 20 25 30 Val Ile Val Lys Asp Glu Gln Leu Ile Ala Thr Gly Phe Asn Lys Arg 35 40 45 Glu Thr Ser Gln Asp Ala Thr Ser His Ala Glu Ile Ile Ala Ile Gln 50 55 60 Ser Ala Cys Asn Tyr Leu Gly Gly Trp Arg Leu Leu Asp Cys Thr Leu 65 70 75 80 Tyr Val Thr Ile Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln 85 90 95 Ser Arg Ile Thr Lys Leu Val Phe Gly Thr Glu Asp Pro Lys Ala Trp 100 105 110 Gly Glu Leu Ser Ile Ser Gln Leu Leu Gln Asn Pro Gln Leu Asn His 115 120 125 Gln Val Asp Ile Val Glu Gly Ile Cys Lys Glu Glu Ser Lys Asp Ile 130 135 140 Ile Lys Gln Phe Phe His Glu Leu Arg Lys Arg Lys Lys Asn 145 150 155 <210> 462 <211> 152 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 462 Met Asp Arg Tyr Met Thr Arg Ala Leu Glu Leu Ala Arg Leu Ala Phe 1 5 10 15 Asp Glu Gly Glu Val Pro Val Gly Ala Val Val Val Lys Lys Thr Thr 20 25 30 Gly Glu Ile Ile Gly Glu Gly Arg Asn Met Arg Glu Gly Ala Lys Asn 35 40 45 Ala Leu Ala His Ala Glu Ile Ile Ala Ile Asp Gln Ala Cys Arg Thr 50 55 60 Leu Gly Gly Trp Arg Leu Pro Glu Cys Ala Ile Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Cys Gly Ala Ile Ile Asn Ala Arg Ile Asp Asn 85 90 95 Val Ile Phe Gly Ala Tyr Asp Leu Lys Ser Gly Ser Ala Ala Ser Val 100 105 110 Gln Lys Met Phe Glu Leu Pro Tyr Asn Tyr Arg Pro Glu Val Thr Gly 115 120 125 Gly Ile Met Glu Gln Glu Cys Ala Asp Ile Leu Ser Glu Phe Phe Arg 130 135 140 Gln Leu Arg Ile Arg Lys Lys Thr 145 150 <210> 463 <211> 197 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 463 Met Glu Gln Asn Ser Pro Gly Ile Arg Phe Ala Asn Asp Ala Gln Lys 1 5 10 15 His Ala Phe Phe Met Lys Lys Ala Leu Asp Met Gly Glu Glu Ala Leu 20 25 30 Ala Ser Gly Glu Thr Pro Val Gly Cys Val Leu Val His Asn Asp Glu 35 40 45 Val Ile Gly Ser Gly Met Asn Asp Thr Asn Lys Ser Met Asn Gly Thr 50 55 60 Arg His Ala Glu Phe Leu Ala Ile Glu Glu Val Leu Arg Ser His Pro 65 70 75 80 Arg Ser Ile Phe Arg Glu Thr Asp Leu Tyr Val Thr Val Glu Pro Cys 85 90 95 Ile Met Cys Ala Ser Ala Leu Arg Gln Tyr Gln Ile Arg His Val Tyr 100 105 110 Phe Gly Cys Ala Asn Glu Arg Phe Gly Gly Thr Gly Gly Val Leu Lys 115 120 125 Leu His Ser Asp Pro Gly Ile Asp Pro Pro Tyr Gly Leu Thr Gly Gly 130 135 140 Leu Phe Arg Lys Glu Ala Ile Met Leu Leu Arg Arg Phe Tyr Ile Gln 145 150 155 160 Glu Asn Glu Arg Ala Pro Asn Pro Lys Pro Lys Lys Asp Arg Glu Leu 165 170 175 Lys Asp Asp Asp Phe Gly Asp Val Gly Ala Gly Met Glu Phe Ala Gly 180 185 190 Met Leu Pro Arg Pro 195 <210> 464 <211> 166 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 464 Met Thr Asp Phe Glu Leu Met Gly Leu Ala Leu Glu Glu Ala Ala Lys 1 5 10 15 Ala Ala Ala Leu Gly Glu Val Pro Val Gly Ala Val Val Ala Arg His 20 25 30 Gly Glu Val Ile Ala Thr Ala His Asn Thr Arg Glu Thr Glu Lys Asn 35 40 45 Ala Leu His His Ala Glu Leu Leu Ala Ile Asp Ala Ala Cys Lys Ala 50 55 60 Leu Gly Gly Trp Arg Leu Trp Glu Cys Glu Leu Phe Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Gly Ile Ile Asn Ser Arg Leu Arg Arg 85 90 95 Val Val Tyr Gly Ala Ala Asp Thr Lys Ala Gly Cys Cys Gly Ser Val 100 105 110 Thr Asp Leu Phe Ala Leu Pro Phe Asn His His Pro Val Val Glu Lys 115 120 125 Gly Leu Arg Glu Ala Glu Ala Gln Gln Leu Leu Gln Ala Phe Phe Val 130 135 140 Ser Leu Arg Glu Lys Arg Ala Gly Arg Pro Arg Trp Lys Pro Pro Val 145 150 155 160 Pro Glu Asn Arg Gly Lys 165 <210> 465 <211> 152 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 465 Met Asp His Lys Asp Tyr Met Ala Arg Ala Leu Glu Leu Ala Ala Gln 1 5 10 15 Ala Ala Glu His Gly Asp Val Pro Val Gly Cys Val Ile Val Lys Asp 20 25 30 Gly Lys Ile Val Gly Glu Gly Arg Asn Arg Arg Glu Glu His Gly Asp 35 40 45 Ala Thr Ala His Ala Glu Leu Glu Ala Ile Arg Asp Ala Cys Ala Arg 50 55 60 Leu Gly Ser Trp Arg Leu His Gly Cys Thr Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Gly Ile Ile Asn Ser Arg Ile Glu Thr 85 90 95 Val Arg Tyr Gly Ala Arg Asp Glu Lys Ala Gly Cys Cys Ser Ser Val 100 105 110 Leu Asn Leu Phe Glu Glu Arg Phe Asn His His Pro Arg Ile Tyr Arg 115 120 125 Gly Pro Leu Glu Pro Gln Cys Gln Lys Ile Leu Gln Asp Phe Phe Leu 130 135 140 Asp Leu Arg Glu Asp Gly Glu Asn 145 150 <210> 466 <211> 188 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 466 Met Glu Glu Lys Val Glu Ser Thr Thr Val Pro Asp Gly Ser Cys Val 1 5 10 15 Val Ser Val Gln Glu Thr Glu Lys Trp Met Glu Glu Ala Met Arg Met 20 25 30 Ala Lys Glu Ala Leu Glu Asn Ile Glu Val Pro Val Gly Cys Leu Met 35 40 45 Val Tyr Asn Asn Glu Val Val Gly Lys Gly Arg Asn Glu Val Asn Gln 50 55 60 Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Pro Phe Asp Gln Val 65 70 75 80 Asp Trp Cys His His Thr Gly Gln Pro Ser Ala Val Phe Glu His Thr 85 90 95 Val Leu Tyr Val Thr Val Pro Cys Ile Met Cys Ala Ala Val Leu Ala 100 105 110 Leu Met Ser Ile Pro Leu Ala Ala Ser Gly Gln Arg Thr Asp Arg Arg 115 120 125 Thr Thr Arg Arg Ser Ala Leu Asn Ile Gly Phe Cys Phe Leu Phe Asn 130 135 140 Ala Gly Arg Pro Phe Gln Cys Ile Pro Gly Tyr Arg Ala Glu Glu Ala 145 150 155 160 Val Glu Leu Leu Lys Thr Phe Tyr Lys Gln Glu Asn Pro Asn Ala Pro 165 170 175 Lys Ser Lys Val Arg Lys Lys Asp Cys Gln Lys Ser 180 185 <210> 467 <211> 151 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 467 Met Lys Glu Ala Leu Lys Glu Ala Arg Lys Ala Ala Glu Met Gly Glu 1 5 10 15 Ile Pro Val Gly Ala Val Ile Val Lys Asp Gly Glu Ile Ile Ser Arg 20 25 30 Gly His Asn Leu Thr Glu Thr Thr Lys Asp Pro Thr Ala His Ala Glu 35 40 45 Met Ile Ala Ile Arg Glu Ala Ala Lys Leu Leu Arg Gly Trp Arg Leu 50 55 60 Thr Gly Cys Asp Met Tyr Val Thr Met Glu Pro Cys Ser Met Cys Ala 65 70 75 80 Gly Ala Leu Val Trp Ser Arg Ile Glu His Leu Tyr Ile Gly Ala Asp 85 90 95 Asp Pro Lys Thr Gly Ala Cys Gly Ser Val Phe Asn Ile Val Gln Asp 100 105 110 Asp Arg Leu Asn His Gln Ile Ala Val Asp Arg Gly Ile Met Ala Glu 115 120 125 Glu Ser Ser Gln Leu Val Arg Glu Phe Phe Arg Asn Leu Arg Asn Lys 130 135 140 Thr Lys Lys Pro Glu Glu Glu 145 150 <210> 468 <211> 163 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 468 Met Ser Ala Gln Ser Glu His Glu Lys Trp Met Ala Arg Ala Ile Gln 1 5 10 15 Leu Ala Lys Gln Ala Glu Thr Leu Gly Glu Val Pro Ile Gly Ala Val 20 25 30 Ile Val Lys Glu Gly Glu Val Leu Gly Glu Gly Tyr Asn Arg Arg Glu 35 40 45 Ile Asp Arg Asn Pro Leu Ala His Ala Glu Leu Met Ala Ile Gln Gln 50 55 60 Ala Cys Glu Arg Leu Gly Gly Trp Arg Leu Ala Gly Cys Asp Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ala 85 90 95 Arg Leu Arg Arg Val Ile Tyr Gly Thr Glu Asp Pro Lys Ala Gly Tyr 100 105 110 Ala Gly Ser Leu His Asn Thr Leu Gln Asp Glu Arg Leu Asn His Gln 115 120 125 Thr Asp Val Ile Ala Gly Ile Arg Arg Glu Glu Cys Gln His Leu Leu 130 135 140 Lys Asp Phe Phe Arg Arg Leu Arg Glu Gln Lys Lys Ala Ala Lys Gly 145 150 155 160 Met Ser Thr <210> 469 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 469 Met Asp Arg Asp Asn Tyr Phe Leu Lys Glu Ala Val Lys Gln Ala Lys 1 5 10 15 Lys Ala Gly Glu Ile Gly Asp Val Pro Ile Gly Cys Val Ile Val Phe 20 25 30 Glu Asp Lys Ile Ile Ala Arg Gly Tyr Asn Arg Arg Asn Lys Asp Lys 35 40 45 Ser Thr Leu Ser His Ala Glu Ile Ile Ala Ile Lys Lys Ala Cys Lys 50 55 60 Lys Ile Gly Asp Trp Arg Leu Glu Asp Cys Thr Met Tyr Ile Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Gln Ser Arg Ile Lys 85 90 95 Arg Val Val Leu Gly Ala Met Asn Pro Lys Ala Gly Cys Ala Gly Ser 100 105 110 Ile Ile Asn Ile Leu Gln Thr Glu Gly Phe Asn His Lys Thr Glu Ile 115 120 125 Ser Leu Ile Asp Glu Pro Leu His Ser Glu Cys Val Ser Leu Leu Thr 130 135 140 Ser Phe Phe Lys Ala Leu Arg Glu Asn Lys Lys 145 150 155 <210> 470 <211> 181 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 470 Met Pro Glu Leu Ile His Val Met Asn Leu Ser Asn Glu Glu Arg Glu 1 5 10 15 Asp His Glu Tyr Trp Met Lys Glu Ala Met Lys Glu Ala Leu Lys Ala 20 25 30 Gln Glu Lys Asp Glu Val Pro Ile Gly Ala Val Ile Val Tyr Gln Gly 35 40 45 Arg Ile Ile Gly Arg Gly His Asn Ile Arg Glu Thr Gln Asn Leu Ala 50 55 60 Thr Gly His Ala Glu Ile Gln Ala Ile Glu Ala Ala Asn His Tyr Leu 65 70 75 80 Gly Ala Trp Arg Leu Glu Gly Ala Arg Leu Tyr Val Thr Leu Glu Pro 85 90 95 Cys Pro Met Cys Ala Gly Ala Ala Val Leu Ala Arg Ile Glu Thr Ile 100 105 110 Ile Tyr Ala Cys Arg Asp Pro Lys Gly Gly Cys Thr Gly Ser Leu Met 115 120 125 Asn Leu Ala Gln Glu Asp Arg Phe Asn His Gln Thr Gln Val Ile Glu 130 135 140 Gly Val Leu Asp Ala Ala Cys Ser Gln Met Met Lys Asp Phe Phe Lys 145 150 155 160 Lys Leu Arg Lys Arg Lys Lys Leu Glu Lys Leu Ser Thr Lys Thr Val 165 170 175 Asp Asn Ala Asp Leu 180 <210> 471 <211> 99 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 471 Met Asp Leu Thr Gln His Phe Gln Arg Met Gly Leu Ser Leu Phe Val 1 5 10 15 Ala Phe Lys Ala Leu Ser Ile Asn Glu Thr Pro Val Ala Cys Ile Leu 20 25 30 Val Ser Lys Lys Ser Ser Gln Val Ile Ser Ile Gly Tyr Asn Asp Thr 35 40 45 Asn Arg Ser Leu Asn Gly Thr Arg His Ala Glu Phe Ile Ala Ile Asp 50 55 60 Tyr Val Leu Asp Asn Val Val Asp Thr Leu Pro Val Asp Asp Leu Ile 65 70 75 80 Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Lys 85 90 95 Gln Val Gly <210> 472 <211> 162 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 472 Met Glu Gly Ile Gln His Glu Leu Phe Met Arg Glu Ala Leu Lys Glu 1 5 10 15 Ala Glu Lys Ala Arg Glu Leu Asp Glu Val Pro Ile Gly Ala Val Val 20 25 30 Val Arg Asp Gly Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Ser 35 40 45 Thr Arg Asn Ala Thr Met His Ala Glu Met Val Ala Ile Gln Glu Ala 50 55 60 Asn Glu Gln Leu Ala Asn Trp Arg Leu Glu Glu Cys Asp Leu Tyr Val 65 70 75 80 Thr Val Glu Pro Cys Val Met Cys Gly Gly Ala Ile Ile Trp Ser Arg 85 90 95 Met Arg Thr Val Tyr Phe Gly Ala His Asp Pro Lys Gly Gly Ala Ala 100 105 110 Gly Ser Leu Leu Asn Val Leu Glu Asp Asp Arg Phe Asn His Thr Ala 115 120 125 Thr Val Tyr Ser Gly Leu Leu Ala Glu Glu Ser Gln Arg Leu Leu Lys 130 135 140 Asp Phe Phe Arg Glu Leu Arg Lys Arg Lys Lys Gln Lys Asn Gly Glu 145 150 155 160 His Ala <210> 473 <211> 98 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 473 Met Val Glu Leu Glu Lys His Tyr Glu Phe Met Arg Tyr Ala Leu Arg 1 5 10 15 Leu Ala Asn Asn Ala Leu His Thr Asn Glu Val Pro Val Ala Cys Val 20 25 30 Phe Val Tyr Asp Gly Gln Ile Ile Ser Tyr Gly Ser Asn Asn Thr Asn 35 40 45 Asp Ser Leu Ser Gly Ile Thr His Ala Glu Phe Arg Gly Ile Asn Ile 50 55 60 Ile Leu Asp Lys Val Lys Ser Ser Pro Asp Phe Gln Gln Val Tyr Gln 65 70 75 80 Asn Pro Gln Asp Ile Phe Lys Asp Ile Asp Leu Tyr Val Thr Val Glu 85 90 95 Pro Cys <210> 474 <211> 202 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 474 Met Asn Asp Ser Thr Glu Gln Thr Asp Ser Asp Leu Gln Leu Glu Gln 1 5 10 15 Glu His Ile Gln Trp Met Arg Val Ala Met Glu Met Ala Glu Glu Ala 20 25 30 Leu Val Ala Lys Glu Val Pro Val Gly Cys Ile Phe Val Arg Asp Gly 35 40 45 Arg Ile Ile Ala Arg Ala Arg Asn Arg Thr Asn Glu Leu Arg Asn Ala 50 55 60 Thr Arg His Ala Glu Leu Glu Ala Ile Asp Gly Ile Leu Ser Asp Lys 65 70 75 80 Asp Leu Thr Pro Val Leu Thr Asp Tyr Pro Leu Ser Glu Thr Thr Leu 85 90 95 Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Arg Gln 100 105 110 Met Gly Ile Lys Lys Val Phe Tyr Gly Cys Ala Asn Asp Arg Phe Gly 115 120 125 Gly Cys Gly Ser Val Leu Gly Val Asn Arg Ser Leu Thr His Pro Arg 130 135 140 His Pro Ala Tyr Gln Ala Val Gly Gly Tyr Leu Arg Glu Asp Ala Ile 145 150 155 160 Met Ile Leu Arg Arg Phe Tyr Val Thr Glu Asn Thr Asn Ala Pro Ala 165 170 175 Pro Lys Ser Lys Ala Asn Arg Val Thr Thr Lys Cys Ile Thr Ser Ala 180 185 190 Ile Tyr Val Tyr Tyr Arg Ser Ser Arg Ile 195 200 <210> 475 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 475 Met Thr Ser His Gln Tyr Tyr Met Ser Leu Ala Leu Glu Glu Ala Arg 1 5 10 15 Glu Ala Ala Lys Lys Gly Glu Val Pro Ile Gly Ala Ile Ile Val Lys 20 25 30 Asn Glu Lys Val Ile Ala Arg Ala His Asn Leu Arg Glu Thr Asn Gln 35 40 45 Asn Pro Thr Ala His Ala Glu His Leu Ala Ile Glu Gln Ala Ala Glu 50 55 60 Thr Leu Gly Thr Trp Arg Leu Glu Gly Cys Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Val Met Cys Ala Gly Thr Ile Val Met Ser Arg Val Asp 85 90 95 Thr Val Val Phe Gly Ala Tyr Asp Pro Lys Gly Gly Cys Thr Gly Ser 100 105 110 Leu Met Asn Leu Val Gln Asp Gln Arg Met Asn His Arg Ala Lys Val 115 120 125 Ile Glu Gly Val Leu Ala Tyr Ser Cys Gly Glu Ile Leu Arg Gln Phe 130 135 140 Phe Arg Thr Leu Arg Gln Arg Lys Ala Ala Lys Ala Met Ser Asn 145 150 155 <210> 476 <211> 120 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 476 Met Val Ser Ser Ser Lys Thr Val Lys Leu Ser Leu Glu Pro Glu Ile 1 5 10 15 Gly Pro Thr Ser Gly Glu Met Cys Val Ile Leu Ser Leu Pro Tyr Arg 20 25 30 Ser Ser Ser Asp Leu Pro Gln Ala Thr Leu His Ala Glu Leu Glu Ala 35 40 45 Ile Asp His Leu Leu Pro Asn Asn Pro Ala Pro Leu Ser Ser Ile Thr 50 55 60 Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu Arg 65 70 75 80 Gln Ile Gly Ile Gly Lys Val Ile Tyr Gly Cys Gly Asn Asp Arg Phe 85 90 95 Gly Gly Cys Gly Ser Val Ile Asn Val Asn Ser Ser Phe Val Leu Leu 100 105 110 Gly Arg Val Gly Glu Ala Gly Cys 115 120 <210> 477 <211> 165 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 477 Met Ser Pro Gly Tyr Arg Gly Tyr Ala Asp Leu Val Ser Leu Pro Val 1 5 10 15 Pro Ala Ala Asp Asp Ala Ala Met Thr Arg Ala Leu Glu Leu Ala Ala 20 25 30 Asp Ala Pro Ala His Asp Asp Val Pro Val Gly Ala Val Val Thr Arg 35 40 45 Gly Gly Gln Val Val Gly Glu Gly Arg Asn Leu Arg Glu Arg Asp Gly 50 55 60 Asp Pro Leu Ala His Ala Glu Ile Val Ala Leu Arg Ala Ala Ala Ser 65 70 75 80 Ala Leu Gly Ser Trp Asn Leu Glu Asp Cys Thr Leu Val Val Thr Leu 85 90 95 Glu Pro Cys Val Met Cys Ala Gly Ala Ile Leu Gln Thr Arg Val Gly 100 105 110 Arg Val Val Phe Gly Ala Trp Asp Glu Lys Ala Gly Ala Ala Gly Ser 115 120 125 Val His Asp Leu Leu Arg Asp Arg Arg Met Pro His Arg Ala Glu Val 130 135 140 Leu Gly Gly Val Arg Ala Ala Glu Ser Ala Ala Leu Leu Arg Asp Phe 145 150 155 160 Phe Gly Gln Lys Arg 165 <210> 478 <211> 154 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 478 Met Val Leu Glu Glu Asn Phe Met Leu Glu Ala Ile Glu Glu Ala Lys 1 5 10 15 Lys Ala Phe Asn Lys Lys Glu Val Pro Ile Gly Ala Val Val Val Lys 20 25 30 Asp Asn Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Thr Thr Lys 35 40 45 Asn Ser Ile Ser His Ala Glu Ile Met Ala Ile Gln Glu Ala Cys Lys 50 55 60 Phe Leu Gly Gly Trp Arg Leu Thr Asp Cys Thr Leu Tyr Val Thr Ile 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Gln 85 90 95 Lys Val Val Ile Gly Ala Met Asp Pro Lys Ala Gly Ala Cys Gly Ser 100 105 110 Leu Val Asn Leu Leu Asn Asp Ser Arg Phe Asn His Gln Thr Glu Ile 115 120 125 Glu Gln Gly Val Leu Glu Glu Glu Cys Ser Leu Leu Met Lys Glu Phe 130 135 140 Phe Lys Ala Leu Arg Glu Lys Arg Phe Gly 145 150 <210> 479 <211> 162 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 479 Met Lys His Ile Thr Tyr Met Gln Ala Ala Ile Glu Glu Ala Lys Lys 1 5 10 15 Ala Gln Asn Leu Gly Glu Val Pro Ile Gly Ala Val Ile Val Lys Asp 20 25 30 Gly Glu Ile Ile Ala Arg Gly Tyr Asn Leu Arg Glu Thr Ser Gln Leu 35 40 45 Ser Asn Ala His Ala Glu Met Ile Ala Ile Ala Lys Ala Asn Glu Met 50 55 60 Val Gly Ser Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg Ile Pro Thr 85 90 95 Val Val Phe Gly Ala His Asp Pro Lys Gly Gly Cys Cys Gly Thr Ile 100 105 110 Tyr Asn Leu Leu Asp Glu Ser Lys Phe Asn His Arg Cys Glu Leu Val 115 120 125 Ser Gly Val Leu Glu Glu Glu Cys Gly Gln Leu Leu Ser Asp Phe Phe 130 135 140 Arg Asn Leu Arg Gln Lys Lys Lys Gln Gln Arg Val Asp Asn Glu Thr 145 150 155 160 Ser Asn <210> 480 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 480 Met Arg Thr Asp Asn Asp Tyr Met Arg Leu Ala Ile Lys Glu Ala Arg 1 5 10 15 Lys Ala Gln Glu Leu Gly Glu Val Pro Ile Gly Ala Val Ile Val Lys 20 25 30 Asp Asn His Val Ile Ala Arg Ala His Asn Leu Arg Glu Thr Leu Gln 35 40 45 Gln Pro Thr Ala His Ala Glu His Ile Ala Ile Glu Arg Ala Ser Glu 50 55 60 Val Ile Gly Ser Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Val Met Cys Ala Gly Ala Ile Val Met Ser Arg Ile Pro 85 90 95 Arg Val Val Tyr Gly Ala Ile Asp Pro Lys Gly Gly Cys Thr Gly Ser 100 105 110 Leu Met Asn Leu Leu Ala Gln Pro Gln Phe Asn His Arg Ala Ile Val 115 120 125 Glu Ser Gly Ile Leu Glu Asn Glu Cys Ser Thr Leu Leu Arg Glu Phe 130 135 140 Phe Lys Asn Ile Arg Gln Gln Lys Arg Ser Leu Lys Gln Ala Lys Ile 145 150 155 160 Gln Asn Asp Thr Asn Leu Leu Glu 165 <210> 481 <211> 181 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 481 Met Asp Thr Asn Glu Pro Leu Thr Asn Gly Ala Gly Ala Ser Glu Gln 1 5 10 15 Asp Leu Gln Phe Met Gly Gln Ala Ile Leu Glu Ala Lys Lys Ala Glu 20 25 30 Ala Ile Gly Glu Val Pro Ile Gly Ala Val Ile Val Arg Asp Gly Lys 35 40 45 Val Ile Ala Ala Ser His Asn Leu Arg Glu Arg Asp Gln Glu Ala Thr 50 55 60 Ala His Ala Glu Leu Ala Ala Ile Thr Glu Ala Cys Arg Lys Thr Gly 65 70 75 80 Ser Trp Arg Leu Glu Asp Thr Val Leu Tyr Val Thr Leu Glu Pro Cys 85 90 95 Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Pro Arg Val Val 100 105 110 Tyr Gly Ala Arg Asp Pro Lys Ala Gly Cys Val Asp Ser Leu Tyr Arg 115 120 125 Leu Leu Asp Asp Pro Arg Phe Asn His Arg Cys Asp Val Thr Glu Gly 130 135 140 Val Leu Ala Asp Glu Cys Gly Ala Leu Leu Thr Asn Phe Phe Arg Gly 145 150 155 160 Ile Arg Lys Arg Arg Lys Ala Glu Lys Gln Ala Arg Arg Ala Leu Glu 165 170 175 Ser Glu Gln Gly Glu 180 <210> 482 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 482 Met Ser Arg Asp Glu Tyr Phe Met Asp Ile Ala Leu Lys Glu Ala Lys 1 5 10 15 Lys Ala Tyr Asn Lys Gly Glu Val Pro Ile Gly Cys Val Ile Val Lys 20 25 30 Asp Asp Lys Ile Val Ser Arg Gly His Asn Gln Val Leu Ser Lys Lys 35 40 45 Ser Gly Val Asn His Ala Glu Ile Ile Ala Ile Asn Lys Ala Gly Gln 50 55 60 Lys Leu Gly Asp Phe Arg Leu Glu Asp Thr Glu Leu Phe Val Thr Leu 65 70 75 80 Glu Pro Cys Cys Met Cys Ala Gly Ala Ile Val Asn Ser Arg Ile Lys 85 90 95 Arg Val Ile Ile Gly Ala Met Asp Val Lys Arg Gly Phe Cys Gly Ser 100 105 110 Ile Glu Asn Val Leu Asp Arg Gln Glu Leu Asn His Arg Ser Ile Ile 115 120 125 Lys Thr Gly Val Leu Glu Gln Lys Cys Leu Asp Ile Leu Gln Asp Phe 130 135 140 Phe Lys Asn Leu Arg Ser Glu Lys Lys Asn Lys 145 150 155 <210> 483 <211> 174 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 483 Met Lys Thr Ser Gln Gln Leu Lys Asp Glu Ala Tyr Met Lys Glu Ala 1 5 10 15 Leu Thr Glu Ala Asp Lys Ala Glu Ala Ile Gly Glu Val Pro Ile Gly 20 25 30 Ala Val Ile Val Lys Asp Asp Ile Ile Ile Ala Arg Gly Tyr Asn Glu 35 40 45 Arg Glu Thr Lys Gln Arg Ala Thr Gly His Ala Glu Leu Val Ala Ile 50 55 60 Glu Glu Ala Cys Arg Ile Leu Lys Thr Trp Arg Leu Glu Gly Cys Thr 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val 85 90 95 Gln Ser Arg Ile Asp Arg Val Val Tyr Gly Ala Asp Asp Pro Lys Gly 100 105 110 Gly Ser Cys Gly Thr Val Val Asn Leu Leu Asp Glu Pro Lys Phe Asn 115 120 125 His Ala Pro Leu Val Thr Ser Gly Thr Leu Lys Glu Glu Ala Ala Asp 130 135 140 Arg Leu Ser Ser Phe Phe Arg Ala Leu Arg Glu Ala Arg Lys Gln Lys 145 150 155 160 Lys Lys Glu Gly Ile Pro His Glu Thr Glu Ser Asp Phe Thr 165 170 <210> 484 <211> 151 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 484 Met Asn His Glu Tyr Phe Met Lys Ile Ala Ile Glu Glu Ala Lys Lys 1 5 10 15 Cys Leu Phe Leu Asp Glu Val Pro Val Gly Ala Ile Ile Val Lys Asp 20 25 30 Gly Lys Ile Ile Ala Arg Ala His Asn Leu Arg Glu Thr Leu Arg Asp 35 40 45 Ala Thr Ala His Ala Glu Ile Leu Ala Ile Asn Glu Ala Cys Met Ala 50 55 60 Leu Gly Gly Trp Arg Leu Leu Asp Cys Thr Met Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Leu Val Asn Ser Arg Ile Lys Thr 85 90 95 Leu Ile Phe Gly Thr Arg Asp Pro Lys Gly Gly Ala Cys Gly Ser Leu 100 105 110 Tyr Asn Ile Val Ala Asp Glu Arg Leu Asn His Arg Ile Glu Ile Ile 115 120 125 Glu Gly Val Leu Gln Asp Glu Cys Ser Lys Leu Leu Lys Glu Phe Phe 130 135 140 Lys Ser Lys Arg Lys Lys Asp 145 150 <210> 485 <211> 197 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 485 Met Ile Val Leu Glu Arg Arg Pro Val Tyr Ala Ser Asn Ser Ser Gln 1 5 10 15 Ala Glu Arg Leu Leu Arg Cys Asp Cys Val Leu Asn Ser Gly Tyr Gly 20 25 30 Thr Leu Met Val Arg Ile Val His Phe Ser Met Ser Gly Ala Glu Gln 35 40 45 Met Glu His Glu Lys Phe Met Arg Glu Ala Leu Gln Glu Ala Glu Lys 50 55 60 Ala Ile Lys Trp Gly Glu Val Pro Ile Gly Ala Val Val Val Arg Glu 65 70 75 80 Gly Gln Val Ile Ala Arg Gly His Asn Met Arg Glu Thr Trp Lys Asp 85 90 95 Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg Glu Ala Ser Arg Val 100 105 110 Leu Gly Gly Trp Arg Leu Thr Gly Cys Lys Leu Tyr Val Thr Leu Glu 115 120 125 Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Leu Ala Arg Ile Asp Glu 130 135 140 Val Ile Phe Gly Ala Arg Glu Pro Lys Phe Gly Ala Ala Gly Ser Ile 145 150 155 160 Val Asn Leu Ile Glu Thr Asp Arg Phe Asn His Gln Pro Gln Leu Thr 165 170 175 Ser Gly Val Leu Ala Glu Glu Cys Gly Met Ile Leu Lys Glu Phe Phe 180 185 190 Arg Gln Arg Arg Lys 195 <210> 486 <211> 171 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 486 Met Thr Asn Leu Glu Arg Asp Glu Lys Met Met Arg Arg Ala Leu Glu 1 5 10 15 Leu Ala Arg Gln Ala Ala Leu Glu Gly Glu Val Pro Val Gly Ala Val 20 25 30 Val Ala Arg Gly Asp Glu Ile Ile Ala Glu Gly Arg Asn Arg Arg Glu 35 40 45 Ala Cys Lys Asn Ala Leu Cys His Ala Glu Ile Glu Ala Ile Asp Ala 50 55 60 Ala Cys Arg Ala Leu His Gly Trp Arg Leu Trp Glu Cys Asp Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Leu Asn Ala 85 90 95 Arg Ile Ala Arg Val Ile Phe Gly Ala Ser Asp Pro Lys Ala Gly Ser 100 105 110 Cys Gly Ser Ile Val Asn Leu Phe Asp Leu Pro Tyr Asn His His Pro 115 120 125 Gln Leu Val Ser Gly Val Leu Arg Glu Glu Cys Gly Glu Val Leu Thr 130 135 140 Glu Phe Phe Gln Arg Leu Arg Asp Gln Arg Ala Val Lys Lys Pro Ser 145 150 155 160 Glu Pro Lys Ser Pro Ala Lys Asp Gly Thr Glu 165 170 <210> 487 <211> 157 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 487 Met Asn Arg Glu His Glu Ala Trp Met Asp Leu Ala Leu Asp Glu Ala 1 5 10 15 Arg Ala Ala Leu Ala Thr Asp Asp Val Pro Ile Gly Ala Val Val Ile 20 25 30 Ser Pro Asp Gly Lys Leu Leu Ser Thr Gly Arg Asn Glu Arg Glu Ala 35 40 45 Leu Lys Asp Pro Thr Ala His Ala Glu Val Val Ala Ile Arg Asn Ala 50 55 60 Val Ser Ala Leu Ala Ala Arg Gly Ala Asp Asp Gly Trp Arg Leu Glu 65 70 75 80 Asp Cys Thr Leu Val Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly 85 90 95 Ala Ile Val Leu Ala Arg Ile Pro Arg Val Val Phe Gly Ala Trp Asp 100 105 110 Glu Lys Ala Gly Ala Cys Gly Ser Val Phe Asp Ile Val Arg Glu Pro 115 120 125 Arg Leu Asn His Trp Val Glu Val Tyr Pro Arg Val Arg Glu Gln Glu 130 135 140 Cys Ala Asp Leu Leu Arg Asp Phe Phe Arg Ser Lys Arg 145 150 155 <210> 488 <211> 182 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 488 Met Glu Ala Lys Val Gly Ser Thr Gln Ile Thr Gly Gly Ala Cys Ser 1 5 10 15 Val Leu Ala Glu Glu Thr Glu Lys Trp Met Glu Gln Ala Met Gln Met 20 25 30 Ala Lys Glu Ala Leu Glu Asn Ile Glu Val Pro Val Gly Cys Leu Leu 35 40 45 Val Tyr Asn Asn Glu Val Val Gly Lys Gly Arg Asn Glu Val Asn Gln 50 55 60 Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp Gln Ala 65 70 75 80 Leu Asp Trp Cys Arg Arg His Gly Lys Ser Pro Ser Glu Val Phe Glu 85 90 95 His Met Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala 100 105 110 Ala Leu Arg Leu Met Lys Ile Pro Leu Val Val Tyr Gly Cys Gln Asn 115 120 125 Glu Arg Phe Gly Gly Cys Gly Ser Val Leu Asp Ile Ala Ser Ala Asp 130 135 140 Leu Pro Asn Thr Gly Arg Pro Phe Gln Cys Phe Glu Ile Leu Lys Lys 145 150 155 160 Leu Pro Ile Pro Gln Ala Ser Gly Cys Cys Val Phe Tyr Phe Tyr Leu 165 170 175 Val Gly Leu Gly Cys Gly 180 <210> 489 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 489 Met Glu Ser Asp Arg Tyr Tyr Met Lys Lys Ala Ile Glu Glu Ala Glu 1 5 10 15 Lys Ala Glu Ala Leu Gly Glu Val Pro Ile Gly Ala Val Leu Val His 20 25 30 Glu Gly Glu Val Ile Ala Arg Gly His Asn Leu Arg Glu Thr Thr Gln 35 40 45 Lys Thr Ser Ser His Ala Glu Cys Ile Thr Ile Asp Arg Ala Asn Asp 50 55 60 Val Ile Gly Ser Trp Arg Leu Glu Glu Cys Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Pro 85 90 95 Val Leu Val Tyr Gly Ala Tyr Asp Arg Lys Ala Gly Cys Ala Gly Thr 100 105 110 Leu Met Asn Leu Leu Asp Asp Asp Arg Phe Asn His Arg Thr Ala Ile 115 120 125 Arg Ala Gly Val Met Glu Glu Glu Cys Gly Glu Met Leu Ser Ser Phe 130 135 140 Phe Arg Arg Ile Arg Lys Lys Arg Lys Asp Lys 145 150 155 <210> 490 <211> 149 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 490 Met His Ile Gln Ala Glu Glu Ala Leu His Ser Asp Glu Val Pro Val 1 5 10 15 Gly Cys Val Phe Val Lys Gly Asp Thr Ala Ile Ala Arg Ala Arg Asn 20 25 30 Arg Thr Asn Glu Trp Arg Asn Ala Thr Leu His Ala Glu Leu Glu Ala 35 40 45 Ile Asp His Leu Leu Pro Asp His Pro Ala Pro Leu Ser Glu Ile Thr 50 55 60 Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu Arg 65 70 75 80 Gln Ile Gly Ile Gly Arg Val Val Tyr Gly Cys Gly Asn Glu Arg Phe 85 90 95 Gly Gly Cys Gly Ser Val Ile Asp Ile His Ala Ser Tyr Val Leu Val 100 105 110 Leu Thr Ser Ser Gly Ala Lys Ala Gly Ala Gly Arg Arg Val Gly Ser 115 120 125 His Ser Glu Ser Arg Pro Ser Arg Arg Glu Ser Arg Arg Asn Ala Arg 130 135 140 Thr Glu Ala Arg Leu 145 <210> 491 <211> 167 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 491 Met Glu Glu Glu Glu Ala Ala Thr Leu Asp Trp Met Asp Gln Ala Phe 1 5 10 15 Asp Met Ala Lys Glu Ala Leu Glu Cys Gly Glu Val Pro Val Gly Cys 20 25 30 Leu Leu Val His Asn Gly Gln Ala Ile Gly Arg Gly Arg Asn Glu Val 35 40 45 Asn Glu Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp 50 55 60 Arg Val Leu Asp Trp Cys Lys Gln His Asn Arg Asp Tyr Thr Glu Val 65 70 75 80 Phe Pro Gln Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys 85 90 95 Ala Ala Ala Val Arg Leu Met Ser Ile Leu Ser Cys Leu Phe Met Leu 100 105 110 Gly Asn Gln Met Leu Lys Cys Tyr Ser Phe Gly Asn Thr Gly Glu Pro 115 120 125 Phe Glu Cys Val Ser Gly Tyr Arg Ala Lys Glu Ala Val Glu Met Leu 130 135 140 Lys Ala Phe Tyr Arg Gln Glu Asn Pro Asn Ala Pro Lys Ser Lys Val 145 150 155 160 Arg Lys Lys Asp His Arg Asn 165 <210> 492 <211> 162 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 492 Met Leu Pro Leu Asp Asp Pro Asp Thr Arg Phe Met Gln Gln Ala Leu 1 5 10 15 Thr Leu Ala Arg Ser Ala Pro Leu Ile Gly Glu Val Pro Ile Ala Ala 20 25 30 Leu Leu Val His Glu Gly Ile Val Ile Ala Gln Ala His Asn Leu Arg 35 40 45 Glu Thr Arg Gln Asp Pro Thr Ala His Ala Glu Val Ile Val Ile Gln 50 55 60 Asp Ala Ala Arg His Met Gly Ser Trp Arg Leu Ile Asn Thr Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ile Gly Ala Ile Val Leu 85 90 95 Ala Arg Ile Pro Arg Leu Val Phe Ala Ala Thr Asp Pro Lys Ala Gly 100 105 110 Ala Cys Gly Ser Ile Met Asn Ile Pro Pro Glu Pro Arg Leu Asn His 115 120 125 Arg Val Glu Val Val Gly Gly Val Cys Ala Glu Glu Ser Gln Ala Leu 130 135 140 Leu Gln Asp Phe Phe Gln Gln Leu Arg Lys Asp Ala Ala Arg Arg Glu 145 150 155 160 Thr Thr <210> 493 <211> 182 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 493 Met Val Arg Pro Gln Ala Glu Glu Ala Phe Thr Ala Ser Glu Ile Pro 1 5 10 15 Val Gly Cys Val Leu Val His Gln Gly Arg Ile Ile Ala Lys Gly Arg 20 25 30 Asn Arg Thr Asn Glu Gly Arg Asn Ala Thr Leu His Ala Glu Phe Asp 35 40 45 Ala Leu Arg His Leu Leu Pro Asp Arg Ser His Thr Val Thr Pro Gln 50 55 60 Leu Thr Arg Pro Phe Thr Pro Gln Glu Gly Glu Arg Lys Ile Trp Glu 65 70 75 80 Thr Pro Leu Glu Gly Val Val Leu Tyr Val Thr Val Glu Pro Cys Ile 85 90 95 Met Cys Ala Ala Ala Met Arg Gln Val Gly Ile Glu Lys Val Ile Tyr 100 105 110 Gly Cys Gly Asn Asp Arg Phe Gly Gly Thr Gly Gly Val Gln Ser Ile 115 120 125 His Ser Glu Ser Val Arg Phe Pro Phe Asp Leu Leu Asp Arg Val Ala 130 135 140 Asn Ser Cys Leu Val Arg Ser Phe Val Ala Leu Asp Cys Cys Thr Leu 145 150 155 160 Arg Arg Ile Gln Leu Thr Ala Ile Thr Glu Glu Lys Arg Arg Leu Cys 165 170 175 Cys Tyr Gly Asp Ser Ile 180 <210> 494 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 494 Met Gln Glu Asp Ala Tyr Tyr Met Arg Leu Ala Leu Glu Glu Ala Gln 1 5 10 15 Lys Ala Tyr Asp Leu Glu Glu Val Pro Ile Gly Ala Val Leu Val Asp 20 25 30 Arg Glu Gly Glu Val Val Ala Arg Gly His Asn Met Arg Glu Val Trp 35 40 45 His Asp Ala Thr Ala His Ala Glu Met Ile Ala Ile Arg Glu Ala Cys 50 55 60 Ala Lys Glu Gly Arg Trp Arg Leu Ser Gly Leu Thr Leu Tyr Val Thr 65 70 75 80 Ile Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Met Ser Arg Val 85 90 95 Asp Arg Val Val Tyr Gly Ser Thr Asp Ala Arg Ala Gly Ala Cys Glu 100 105 110 Ser Val Phe Asn Ile Pro Gly Cys Pro Ala Leu Asn His Arg Pro Glu 115 120 125 Met Thr Ala Gly Val Leu Gln Glu Glu Cys Ala Gly Ile Met Lys Arg 130 135 140 Phe Phe Lys Glu Arg Arg Ala Lys Arg Lys Ala Leu Arg Gln Gln Ala 145 150 155 160 Ala Gly Ser Pro Glu Thr Ala Glu Arg 165 <210> 495 <211> 146 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 495 Met Ala Thr Arg His Ala Glu Leu Glu Ala Ile Asp Phe Ile Leu Ser 1 5 10 15 Gln His Pro Pro Lys Glu Gln Asp Phe Pro Ile Ser Pro His Ser Gly 20 25 30 Pro Ser Gly Asp Asn Pro Phe Ala Glu Thr Thr Leu Tyr Val Thr Ile 35 40 45 Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Arg Gln Val Gly Ile Lys 50 55 60 Arg Val Val Phe Gly Ala Gly Asn Glu Arg Phe Gly Gly Asn Gly Ser 65 70 75 80 Val Leu Pro Val His Thr Asp Ala Gln Leu Lys Asn Ala Pro Ala Tyr 85 90 95 Glu Ala Val Gly Gly Tyr Tyr Arg Glu Asp Ala Ile Met Leu Leu Arg 100 105 110 Arg Phe Tyr Leu Thr Glu Asn Val Phe Ala Pro Asn Pro Arg Ser Lys 115 120 125 Ala Lys Arg Val Leu Lys Thr Tyr Phe Gln Arg Glu Ser Arg Pro Phe 130 135 140 Cys Phe 145 <210> 496 <211> 150 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 496 Met Gly Val Ala Arg Thr Leu Ala Glu Gln Ala Ser Ala Glu Gly Glu 1 5 10 15 Val Pro Val Gly Ala Leu Val Val Lys Asp Gly Glu Ile Ile Gly Arg 20 25 30 Gly Tyr Asn Gln Pro Ile Gly Arg His Asp Pro Ser Ala His Ala Glu 35 40 45 Met Gln Ala Leu Arg Asp Ala Ala Ala Arg Leu Gly Asn Tyr Arg Leu 50 55 60 Asp Gly Cys Asp Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ser 65 70 75 80 Gly Ala Ile Leu His Ala Arg Ile Ala Arg Val Ile Tyr Gly Ala Ala 85 90 95 Asp Ala Lys Thr Gly Ala Ala Gly Ser Thr Val Asp Leu Phe Ala Asp 100 105 110 Ala Arg Leu Asn His His Ala Ala Val Phe Gly Gly Val Glu Ala Glu 115 120 125 Thr Cys Ala Glu Gln Leu Ser Ala Phe Phe Arg Gln Arg Arg Arg Ser 130 135 140 Ala Gly Asp Gly Glu Glu 145 150 <210> 497 <211> 160 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 497 Met Glu Gln Glu Asn Tyr Met Arg Arg Ala Leu Thr Leu Ala Arg Glu 1 5 10 15 Ala Gly Asp Ala Gly Glu Val Pro Val Gly Cys Val Ile Val Arg Asp 20 25 30 Gly Lys Val Val Gly Glu Gly Arg Asn Arg Arg Glu Glu Leu Thr Ser 35 40 45 Ala Ala Ser His Ala Glu Met Glu Ala Ile Ala Ala Ala Asn Glu Arg 50 55 60 Leu Gly Ser Trp Arg Leu Glu Gly Cys Ala Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Asn Ala Arg Val Ser Lys 85 90 95 Val Phe Tyr Gly Ala Arg Asp Pro Ala Phe Gly Ala Cys Gly Gly Val 100 105 110 Thr Asn Leu Phe Met Glu Asp Phe Pro Asn Arg Pro Ala Leu Val Gly 115 120 125 Gly Val Leu Ala Glu Glu Cys Arg Glu Val Leu Arg Ala Phe Phe Gln 130 135 140 Lys Leu Arg Asn Asp Gly Gly Thr Gly Glu Ser Pro Glu Pro Lys Ile 145 150 155 160 <210> 498 <211> 154 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 498 Met Glu Asp Asp Ile Lys Tyr Met Lys Met Ala Leu Ala Glu Ala Arg 1 5 10 15 Lys Ala Tyr Gln Arg Ala Glu Val Pro Ile Gly Ala Val Val Ile Cys 20 25 30 Asp Asp Lys Val Val Gly Arg Gly Phe Asn Leu Arg Glu Gln Thr Gln 35 40 45 Asp Pro Thr Ser His Ala Glu Met Ile Ala Leu Arg Glu Ala Ala Lys 50 55 60 Asn Glu Ala Ser Trp Arg Leu Glu Asn Cys Gln Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Lys 85 90 95 Arg Leu Val Tyr Gly Ala Ser Asp Pro Lys Ala Gly Ala Val Asn Ser 100 105 110 Leu Tyr Gln Leu Leu Asn Asp Glu Arg Phe Asn His Gln Val Glu Val 115 120 125 Glu Ala Gly Val Met Lys Lys Glu Ala Ala Gln Leu Leu Lys Asp Phe 130 135 140 Phe Arg Asp Leu Arg Glu Arg Lys Asp Gly 145 150 <210> 499 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 499 Met Gln Glu Ala Leu Val Glu Ala Ser Ala Ala Ala Arg Leu Gly Glu 1 5 10 15 Val Pro Val Gly Ala Val Val Val Lys Asp Gly Met Ile Ile Gly Arg 20 25 30 Gly His Asn Leu Arg Glu Thr Ser Asn Asp Pro Thr Thr His Ala Glu 35 40 45 Met Ile Ala Ile Arg Gln Ala Ala Ala Ala Ile Asp Ser Trp Arg Leu 50 55 60 Ile Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Met 65 70 75 80 Gly Ala Ile Ile Leu Ala Arg Ile Pro Arg Leu Val Phe Gly Ser Arg 85 90 95 Asp Pro Arg Val Gly Ala Val Gly Ser Ile Phe Asp Leu Ser Arg Asp 100 105 110 Glu Arg Phe Asn His Gln Val Ala Val Thr Glu Gly Val Leu Ala Leu 115 120 125 Glu Ser Ser Asp Met Leu Ser Gly Phe Phe Arg Gln Leu Arg Ala Glu 130 135 140 Lys Lys Ser Arg Lys Arg Lys Ala Ala Asp Ser Glu Asp Gln Thr 145 150 155 <210> 500 <211> 151 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 500 Met Asn Asp Asn Asp Phe Met Gly Glu Ala Leu Arg Leu Ala Gly Cys 1 5 10 15 Ala Ala Glu Arg Gly Glu Val Pro Val Gly Ala Val Val Val Cys Asp 20 25 30 Gly Gln Ile Val Gly Thr Gly Phe Asn Arg Arg Glu Thr Gly Lys Asn 35 40 45 Ala Leu Ala His Ala Glu Leu Glu Ala Ile Asp Ala Ala Cys Arg Arg 50 55 60 Leu Gly Gly Trp Arg Leu His Arg Cys Glu Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Asn Ala Arg Ile Arg Arg 85 90 95 Leu Val Phe Gly Ala Arg Asp Pro Lys Ser Gly Cys Phe Gly Ser Val 100 105 110 Ser Asp Phe Asn Ala Leu Ala Phe Asn His Lys Pro Gln Val Val Cys 115 120 125 Gly Val Arg Gly Glu Glu Cys Ala Gln Ile Leu Ser Ala Phe Phe Gln 130 135 140 Lys Leu Arg Arg Gly Arg Gln 145 150 <210> 501 <211> 175 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 501 Met Glu Lys Asp Ile Glu Phe Met Lys Gln Ala Leu Ile Glu Ala Glu 1 5 10 15 Lys Ala Phe Thr Leu Asp Glu Ala Pro Ile Gly Ala Val Ile Val Tyr 20 25 30 Lys Glu Gln Val Ile Gly Arg Gly His Asn Arg Arg Asn Thr Asp Lys 35 40 45 Asn Ala Leu Ala His Ala Glu Val Met Ala Ile Asn Glu Ala Cys Lys 50 55 60 His Ile Lys Asp Trp Arg Leu Glu Glu Cys Thr Ile Tyr Ile Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ser Gly Ala Ile Val Gln Ala Arg Leu Pro 85 90 95 Arg Val Val Phe Gly Ala Arg Ser Pro Lys Ala Gly Phe Gly Gly Ser 100 105 110 Val Leu Asn Ile Leu Gln Met Asp Glu Leu Asn His Arg Cys Glu Val 115 120 125 Val Glu Gly Val Cys Glu Glu Glu Ala Ser Gln Leu Leu Lys Ser Tyr 130 135 140 Phe Lys Gln Met Arg Gln Lys Asn Lys Ile Ile Gly Gly Glu Leu Trp 145 150 155 160 Gln Gln Ile Gln Asp Ile Arg Lys Gln Glu Cys Leu Glu Ile Leu 165 170 175 <210> 502 <211> 112 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 502 Met Val Tyr Asn Asn Glu Ile Val Gly Lys Gly Arg Asn Glu Val Asn 1 5 10 15 Glu Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp Gln 20 25 30 Val Leu Asp Trp Cys Gln Gln His Lys Lys Gln Pro Glu Asp Val Phe 35 40 45 Thr His Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala 50 55 60 Ala Ala Leu Arg Met Met Asn Ile Gly Glu Pro Phe Gln Cys Ile Ala 65 70 75 80 Gly Tyr Arg Ser Glu Glu Ala Val Glu Met Leu Lys Thr Phe Tyr Arg 85 90 95 Gln Glu Asn Pro Asn Ala Pro Lys Ser Lys Val Arg Lys Lys Glu Phe 100 105 110 <210> 503 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 503 Met Lys Asp His Ser Tyr Tyr Met Glu Met Ala Leu Glu Glu Ala Arg 1 5 10 15 Arg Ala Tyr Ala Lys Gly Glu Val Pro Ile Gly Ala Val Leu Val Val 20 25 30 Asp Gly Glu Val Ile Ala Lys Ala His Asn Thr Arg Glu Glu His Gln 35 40 45 Gln Ala Leu Asn His Ala Glu Met Leu Ala Ile Lys Glu Ala Cys Glu 50 55 60 Lys Gln Gly Phe Trp Arg Leu Asp Asn Ser Tyr Leu Tyr Thr Thr Val 65 70 75 80 Glu Pro Cys Val Met Cys Ser Gly Ala Ile Val Gln Ala Arg Val Glu 85 90 95 Asn Val Ile Tyr Gly Ala Ser Asp Pro Lys Tyr Gly Cys Cys Gly Ser 100 105 110 Cys Ile Asp Leu Val Gly Glu Asn Lys Phe Asn His Gln Ala Glu Val 115 120 125 Ile Ser Gly Val Leu Glu Glu Glu Cys Ser Met Leu Met Lys Asn Phe 130 135 140 Phe Lys Glu Leu Arg Glu Lys Lys Lys Lys Gln 145 150 155 <210> 504 <211> 158 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 504 Met Lys Phe Ser Glu Glu Lys Asn Leu Ser Phe Met Gln Met Ala Leu 1 5 10 15 Asp Gln Ala Gln Leu Ala Gln Ala Asp Gly Glu Val Pro Ile Gly Cys 20 25 30 Leu Ile Val Asp Asn Gln Thr Ser Glu Ile Ile Ala Thr Gly Phe Asn 35 40 45 Glu Arg Glu Gln Thr Gln Asp Ala Ile Lys His Ala Glu Ile Ile Ala 50 55 60 Ile Glu Lys Ala Cys Gln Lys Val Gly Ser Trp Arg Leu Glu His Thr 65 70 75 80 Ser Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile 85 90 95 Ile Asn Ser Arg Ile Glu Glu Val Ile Phe Gly Ala Tyr Asp Pro Lys 100 105 110 Ala Gly Ser Val Gly Ser Ile Asn Asn Leu Phe Glu Glu Lys Arg Tyr 115 120 125 Asn His His Pro Asp Phe Leu Gly Gly Met Leu Ala Asp Asp Ser Ala 130 135 140 Ser Leu Leu Gln Asn Phe Phe Arg Glu Ile Arg Arg Lys Lys 145 150 155 <210> 505 <211> 161 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 505 Met Met Glu Gln Ala Ala Asp Glu Arg Phe Met Arg Arg Ala Leu Glu 1 5 10 15 Leu Ala Glu Glu Ala Ala Arg Trp Gly Glu Val Pro Val Gly Ala Val 20 25 30 Val Val Glu Asn Gly Arg Ile Val Gly Glu Gly Phe Asn Arg Arg Glu 35 40 45 Thr Trp Arg Asp Gly Thr Ala His Ala Glu Met Leu Ala Ile Glu Glu 50 55 60 Ala Ser Arg Arg Leu Gly Gly Trp Arg Leu Thr Asn Cys Val Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Leu Ser 85 90 95 Arg Val Gln Arg Val Val Tyr Gly Ala Thr Asp Ala Lys Gly Gly Ala 100 105 110 Val Ala Ser Lys Val Arg Leu Leu Glu Pro Gly Leu Trp Asn His Ala 115 120 125 Pro Gln Ile Thr Ser Gly Ile Leu Ala Asp Asp Cys Ala Lys Leu Leu 130 135 140 Thr Asp Phe Phe Arg Lys Arg Arg Leu Lys Arg Arg Asp Gly Glu Val 145 150 155 160 Ser <210> 506 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 506 Met Glu Glu Phe Asn Glu Lys Trp Met Lys Val Ala Ile Glu Leu Ala 1 5 10 15 Glu Lys Ala Leu Ala Gln Gly Glu Val Pro Val Gly Cys Ile Phe Val 20 25 30 Arg Gly Glu Glu Ile Ile Ala Lys Gly Arg Asn Asp Val Asn Arg Thr 35 40 45 Arg Asn Ala Thr Arg His Ala Glu Met Ile Cys Ile Asp Glu Val Phe 50 55 60 Glu Arg Phe Lys Thr Thr Asp Val Phe Lys Glu Val Thr Val Val Val 65 70 75 80 Thr Val Glu Pro Cys Ile Met Cys Ala Gly Ala Leu His Asp Leu Gly 85 90 95 Val Arg Gly Val Val Phe Gly Cys Ala Asn Asp Arg Phe Gly Gly Cys 100 105 110 Gly Ser Val Phe Asp Val Ala Ala Val His His Thr Pro Val Pro Val 115 120 125 His Gly Gly Val Phe Ala Ser Lys Ala Met Glu Leu Leu Lys Thr Phe 130 135 140 Tyr Met Gly Val Asn Pro Asn Ala Pro Pro Ser Lys Val Lys Thr Arg 145 150 155 160 Lys Lys Thr Glu Leu Ser Met Asn 165 <210> 507 <211> 195 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 507 Met Arg Gln Arg Ser Lys Ile Phe Met His Leu Arg Gln Val Leu Phe 1 5 10 15 Tyr Ser Glu Glu Leu Gln Lys Cys Thr Asp Gln Lys Gly Gly Asp Arg 20 25 30 Met His Gly Glu Asp Glu Arg Tyr Met Ala Leu Ala Ile Asp Glu Ala 35 40 45 Ala Lys Ala Arg Ala Ile Gly Glu Val Pro Ile Gly Ala Val Ile Val 50 55 60 Arg Glu Gly Ala Val Ile Ala Gln Ala Tyr Asn Gln Arg Glu Thr Leu 65 70 75 80 Gln Glu Pro Thr Ala His Ala Glu Leu Ser Ala Leu Arg Glu Ala Gly 85 90 95 Arg Lys Leu Gly Thr Trp Arg Leu Thr Gly Cys Thr Leu Tyr Val Thr 100 105 110 Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val Val Leu Ser Arg Ile 115 120 125 Asp Arg Leu Val Phe Gly Ala Pro Asp Pro Lys Ala Gly Cys Ala Gly 130 135 140 Thr Leu Met Asn Leu Val Gln Asp Ser Arg Phe Asn His Gln Ala Glu 145 150 155 160 Val Ala Gly Asn Val Leu Gly Glu Gln Cys Gly Ala Leu Leu Thr Asp 165 170 175 Phe Phe Ser Asn Leu Arg Arg Glu Lys Arg Gly Arg Ala Asn Asp Arg 180 185 190 Pro Glu Ile 195 <210> 508 <211> 177 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 508 Met Pro Leu Leu Ser Leu Glu Cys Tyr Pro Leu Ser Asp Ala Glu Leu 1 5 10 15 Thr His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Gln Arg Ala 20 25 30 Trp Asp Glu Gly Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn 35 40 45 Gln Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro 50 55 60 Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Gln 65 70 75 80 Gln Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro 85 90 95 Cys Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Gly Arg Leu 100 105 110 Ile Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Ile 115 120 125 Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Val Val Glu 130 135 140 Gly Ile Leu Arg Asp Glu Cys Ala Gly Met Leu Ser Ala Phe Phe Arg 145 150 155 160 Gln Arg Arg Ala Glu Lys Lys Ala Leu Lys Lys Gly Ala Thr Asp Val 165 170 175 Leu <210> 509 <211> 178 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 509 Met Gly Glu Tyr Phe Met Arg Lys Tyr Thr Glu Asp Glu Lys Phe Met 1 5 10 15 Lys Glu Ala Ile Lys Gln Ala Lys Lys Ala Glu Ala Ile Gly Asp Val 20 25 30 Pro Ile Gly Cys Val Ile Val His Asp Gly Lys Ile Ile Ala Arg Gly 35 40 45 Tyr Asn Lys Arg Asn Lys Asp Lys Thr Val Leu Ala His Ala Glu Leu 50 55 60 Leu Ala Met Lys Lys Ala Cys Lys Lys Leu Gly Asp Trp Arg Leu Glu 65 70 75 80 Asp Cys Thr Met Tyr Ile Thr Leu Glu Pro Cys Gln Met Cys Ala Gly 85 90 95 Ala Ile Val Gln Ala Arg Val Thr Arg Val Val Ile Gly Ser Met Asn 100 105 110 Ala Lys Ala Gly Cys Gly Gly Ser Ile Leu Asn Leu Leu Glu Met Gln 115 120 125 Glu Phe Asn His Gln Ala Glu Val Glu Arg Gly Val Leu Gln Glu Glu 130 135 140 Cys Ser Glu Met Leu Ser Ala Phe Phe Arg Lys Leu Arg Glu Ile Gln 145 150 155 160 Lys Glu Lys Lys Lys Lys Arg Lys Leu Ile Gln Glu Glu Asn Gln Thr 165 170 175 Asp Asn <210> 510 <211> 164 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 510 Met Lys Thr His Glu Glu Tyr Met Glu Leu Ala Leu Glu Glu Ala Arg 1 5 10 15 Lys Ala Glu Glu Ile Asp Glu Val Pro Val Gly Cys Val Ile Val Cys 20 25 30 Asp Gly Glu Val Ile Ser Arg Gly His Asn Leu Lys Glu Gln Leu Asn 35 40 45 Gln Ala Tyr Ala His Ala Glu Met Met Ala Ile Gln Lys Ala Ala Glu 50 55 60 Val Lys Gly Asn Trp Cys Leu Asn Asp Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Met Met Cys Thr Gly Ile Ile Asn Leu Ser Arg Ile Arg 85 90 95 Thr Val Tyr Tyr Gly Thr Gln Asp Pro Lys Gly Gly Cys Leu Glu Thr 100 105 110 Val Ile Asp Leu Lys Lys Ile Asn Arg Leu Asn His Tyr Pro Asn Ile 115 120 125 Val Gly Asn Ile Leu Gln Lys Glu Cys Ser Glu Ile Leu Thr Asn Tyr 130 135 140 Phe Arg Lys Lys Arg Glu Ile Ile Lys Glu Lys Lys Gln Lys Asn Lys 145 150 155 160 Ala Asn Ile Gln <210> 511 <211> 152 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 511 Met Gln Glu Lys Asp His Glu Phe Phe Met Arg Glu Ala Leu Lys Glu 1 5 10 15 Ala Arg Lys Ala Phe Glu Gln Asp Glu Val Pro Val Gly Ala Val Ile 20 25 30 Ala Tyr Glu Gly Ser Ile Ile Ala Arg Ala His Asn Leu Arg Glu Arg 35 40 45 Ser Gln Asp Ala Thr Ala His Ala Glu Val Leu Ala Ile Lys Ala Ala 50 55 60 Cys Glu Ala Met Gly Thr Trp Arg Leu Thr Gly Cys Ser Leu Tyr Val 65 70 75 80 Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Leu Ala Arg 85 90 95 Leu Asp Arg Val Val Phe Gly Ala Pro Asp Pro Lys Ala Gly Ala Ala 100 105 110 Gly Ser Val Val Asp Leu Phe Lys Val Glu Arg Phe Asn His His Pro 115 120 125 Glu Val Val Ser Gly Val Leu Ala Glu Glu Cys Gly Ile Leu Leu Lys 130 135 140 Asp Phe Phe Arg Gln Lys Arg Leu 145 150 <210> 512 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 512 Met Val Gln Asn Ala Gly Asn Ser Leu Ala Gly Gln Arg Asp Val His 1 5 10 15 Phe Met Glu Met Ala Leu Glu Glu Ala Arg Gln Ala Ala Arg Glu Gly 20 25 30 Glu Ile Pro Val Gly Ala Val Leu Val Arg Asp Gly Gln Val Leu Ala 35 40 45 Arg Asp His Asn Arg Arg Glu Gln Asp Arg Asp Ala Thr Ala His Ala 50 55 60 Glu Phe Leu Val Ile Arg Gln Ala Cys Arg Leu Leu Arg Arg Trp Arg 65 70 75 80 Leu Ser Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys 85 90 95 Ala Gly Ala Ile Trp Asn Ala Arg Val Gly Arg Leu Val Tyr Gly Ala 100 105 110 Trp Asp Ser Ala Ala Gly Ser Cys Gly Ser Gln Phe Asn Leu Pro Ala 115 120 125 His Pro Ser Leu Asn Phe Arg Thr Glu Val Thr Ala Gly Val Leu Glu 130 135 140 Glu Glu Cys Arg Lys Ile Leu Gln Asp Phe Leu Lys Ala Arg Arg 145 150 155 <210> 513 <211> 214 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 513 Met Gln Glu Val Gly Val Asp Pro Glu Lys Asn Asp Phe Leu Gln Pro 1 5 10 15 Ser Asp Ser Glu Val Gln Thr Trp Met Ala Lys Ala Phe Asp Met Ala 20 25 30 Val Glu Ala Leu Glu Asn Gly Glu Val Pro Val Gly Cys Leu Met Val 35 40 45 Tyr Asn Asn Glu Ile Ile Gly Lys Gly Arg Asn Glu Val Asn Glu Thr 50 55 60 Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Leu Asp Gln Val Leu 65 70 75 80 Asp Trp Cys Arg Leu Arg Glu Lys Asp Cys Lys Glu Val Cys Glu Gln 85 90 95 Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala Ala 100 105 110 Leu Arg Leu Leu Arg Ile Pro Phe Val Val Tyr Gly Cys Lys Asn Glu 115 120 125 Arg Phe Gly Gly Cys Gly Ser Val Leu Asp Val Ser Ser Asp His Leu 130 135 140 Pro His Thr Gly Thr Ser Phe Lys Cys Ile Ala Gly Tyr Arg Ala Glu 145 150 155 160 Glu Ala Val Glu Met Leu Lys Thr Phe Tyr Lys Gln Glu Asn Pro Asn 165 170 175 Ala Pro Lys Pro Lys Val Arg Lys Asp Ser Ile Asn Pro Gln Asp Gly 180 185 190 Ala Ala Val Ile Gln Val Met Arg Gly Pro Pro Asp Glu Glu Thr Glu 195 200 205 Thr Ile Ala His Leu Ser 210 <210> 514 <211> 154 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 514 Met Thr Glu Gln Gln Tyr Tyr Met Thr Glu Ala Leu Ile Glu Ala Lys 1 5 10 15 Lys Ala Phe Ala Leu Lys Glu Val Pro Ile Gly Ala Val Met Val Arg 20 25 30 Lys Gly Glu Ile Ile Ala Arg Gly Tyr Asn Leu Arg Asn Ser Ala Lys 35 40 45 Asn Pro Leu Cys His Ala Glu Ile Asp Val Ile Asp Lys Ser Ala Lys 50 55 60 Ile Val Gly Asp Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Val 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg Ile Pro 85 90 95 Lys Ile Val Phe Gly Thr Arg Asn Asn Lys Ala Gly Cys Ala Gly Ser 100 105 110 Ile Leu Asn Ile Leu Gln Glu Pro Arg Phe Asn His Gln Val Glu Ile 115 120 125 Glu Glu Asn Val Leu Gln Gln Glu Cys Ala Glu Leu Met Arg Ala Phe 130 135 140 Phe Lys Asn Phe Arg Lys Lys Ser Asn Met 145 150 <210> 515 <211> 153 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 515 Met Glu Leu Ala Thr Asp Glu Glu Lys Met Tyr Met Glu Glu Ala Leu 1 5 10 15 Lys Glu Ala Ala Leu Ala Ala Leu Glu Gly Glu Ile Pro Val Gly Ala 20 25 30 Ile Leu Val Gln Asp Gly Arg Val Ile Ala Arg Asn His Asn Arg Arg 35 40 45 Glu Arg Ala His Asp Ala Thr Ala His Ala Glu Ile Leu Val Ile Arg 50 55 60 Glu Ala Cys Glu Lys Leu Arg Arg Trp Arg Leu Ala Asp Ser Thr Leu 65 70 75 80 Tyr Val Thr Met Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Tyr Asn 85 90 95 Ala Arg Ile Gly Arg Val Val Phe Gly Ala Ser Asp Ser Val Ala Gly 100 105 110 Ala Cys Gly Ser Leu Phe Gln Ile Pro Leu His Pro Ser Leu His Ala 115 120 125 Asn Thr Ile Ile Lys Ala Gly Ile Glu Ala Glu Arg Cys Lys Lys Ile 130 135 140 Leu Gln Glu Phe Phe Thr Arg Arg Arg 145 150 <210> 516 <211> 161 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 516 Met Ala Lys Val Pro Thr Phe Ser Glu Gln Gln Ile Asp Tyr Phe Met 1 5 10 15 Gln Glu Ala Leu Asn Glu Ala Lys Leu Ala Gly Ser Glu Gly Glu Val 20 25 30 Pro Ile Gly Ala Val Ile Val Phe Glu Asn Gln Ile Ile Ala Arg Ala 35 40 45 His Asn His Arg Glu Arg Asp Gln Leu Ala Thr Ala His Ala Glu Leu 50 55 60 Ile Ala Ile Glu Arg Ala Asn Gln Ala Leu Lys Ser Trp Arg Leu Glu 65 70 75 80 Asp Thr Ala Leu Phe Val Thr Leu Glu Pro Cys Ile Met Cys Ala Gly 85 90 95 Ala Ile Ile Asn Ala Arg Val Pro Ala Val Tyr Tyr Gly Ala Gln Asp 100 105 110 Ala Lys Gly Gly Gly Thr Gln Ser Leu Tyr Gln Leu Leu Glu Asp Glu 115 120 125 Arg Leu Asn His Arg Val Ala Val Gln Ala Gly Val Arg Ala Glu Glu 130 135 140 Ser Thr Lys Ile Leu Gln Gln Phe Phe Ala Asp Ile Arg Ala Lys Arg 145 150 155 160 Lys <210> 517 <211> 171 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 517 Met Cys Val Cys Val Cys Leu Gln Pro Asn Met Asp His Phe Met Glu 1 5 10 15 Gln Ala Leu Glu Gln Ala Arg Lys Ala Glu Gln Leu Lys Glu Val Pro 20 25 30 Val Gly Cys Val Phe Val Tyr Arg Gly Glu Ile Ile Ala Asn Gly Cys 35 40 45 Asn Leu Val Asn Glu Thr Lys Asn Ala Thr Arg His Val Glu Phe Ile 50 55 60 Cys Ile Asp Gln Val Leu Glu Tyr Cys Lys Asn Arg Ser Leu Lys His 65 70 75 80 Glu Asp Val Phe Arg Glu Val Thr Val Val Val Thr Val Glu Pro Cys 85 90 95 Ile Met Cys Ala Ala Ala Leu Ile Glu Leu Asn Val Arg Glu Val Ile 100 105 110 Tyr Gly Cys Lys Asn Asp Arg Phe Gly Gly Cys Thr Val Leu Asp Val 115 120 125 Pro Gly Leu Leu Lys Thr Ser Ile Pro Ile Arg Gly Gly Val Arg Ala 130 135 140 Asp Glu Ala Met Glu Leu Leu Lys Glu Phe Tyr Lys Gly Glu Asn Pro 145 150 155 160 Ser Ala Pro Val Pro Lys Val Lys Ser Gln Lys 165 170 <210> 518 <211> 153 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 518 Met Asp His Glu Lys Phe Met Ala Glu Ala Leu Lys Glu Ala Glu Lys 1 5 10 15 Ala Ala Leu Gln Gly Glu Val Pro Val Gly Ala Val Val Val Tyr Asn 20 25 30 Gly Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Thr Phe Ser Asp 35 40 45 Pro Thr Ala His Ala Glu Ile Val Ala Leu Lys Glu Ala Ala Ser Lys 50 55 60 Leu Lys Asn Trp Gln Leu Lys Asp Cys Thr Leu Tyr Val Thr Val Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Ile Tyr Gln Ala Arg Ile Lys Thr 85 90 95 Leu Val Tyr Gly Ala Pro Asp Leu Lys Ala Gly Ala Val Asp Thr Leu 100 105 110 Phe Asp Leu Val Arg Asn Pro Arg Leu Asn His Arg Val Glu Val Ile 115 120 125 Ser Gly Val Leu Ala Ala Glu Ala Ser Lys Ile Ile Thr Asp Phe Phe 130 135 140 Arg Glu Lys Arg Asn Arg Gly Lys Phe 145 150 <210> 519 <211> 150 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 519 Met Arg Asn Asn Tyr Ile Asn Leu Val Ile Glu Thr Ala Leu Asn Glu 1 5 10 15 Ala Glu Ile Ala Leu Leu Glu Gly Glu Val Pro Val Ser Cys Val Met 20 25 30 Lys Phe Gly Asn Ile Ile Ile Lys Thr His Asn Thr Thr Asn Lys Ser 35 40 45 Cys Asp Pro Leu Lys His Cys Glu Leu Asp Ala Ile Arg Glu Tyr Gln 50 55 60 Arg Phe His Met Ser Asn Thr Asn Asp Ile Ile Met Phe Ile Thr Leu 65 70 75 80 Glu Pro Cys Thr Met Cys Cys Arg Ile Ile Thr Asp Phe Lys Glu Arg 85 90 95 Phe Ile Lys Cys Asn Leu Lys Leu Phe Phe Gly Val Tyr Asn Asp Ile 100 105 110 Phe Gly Asn Leu Lys Ile Thr Gly Asn Thr Phe Gly Glu Cys Ile Tyr 115 120 125 Asp Glu Arg Cys Ile Glu Ile Ile Lys Arg Phe Tyr Glu Gln Gln Asn 130 135 140 Pro Asn Thr Val Asn Ile 145 150 <210> 520 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 520 Met Tyr Thr Asp Gln Phe Tyr Met Lys Ile Ala Leu Glu Glu Ala Arg 1 5 10 15 Lys Ala Ser Ala Ile Gly Glu Val Pro Ile Gly Ala Ile Val Val Lys 20 25 30 Asp Asn Glu Val Ile Ser Arg Ala His Asn Leu Arg Glu Ser Thr Gln 35 40 45 Asp Pro Thr Ala His Ala Glu His Ile Ala Ile Gln Lys Ala Ala Lys 50 55 60 Gln Leu Asn Ser Trp Arg Leu Ala Ser Cys Lys Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Val Met Cys Ser Gly Ala Ile Val Met Ser Arg Ile Pro 85 90 95 Glu Val Ile Tyr Gly Ala Gln Asp Leu Lys Gly Gly Cys Ala Gly Ser 100 105 110 Leu Met Asn Leu Leu Gln Glu Ser Arg Phe Asn His Arg Ala Lys Ile 115 120 125 Thr Thr Gly Val Leu Ala Glu Glu Cys Ser His Leu Leu Lys Thr Phe 130 135 140 Phe Lys Asp Ile Arg Gln Lys Lys Lys Ile Ile Arg Thr Glu Asp Asn 145 150 155 160 Thr Asn Ser Glu Thr Phe Gly Lys Ile 165 <210> 521 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 521 Met Thr Asp Glu Asp Tyr Met Glu Leu Ala Leu Ala Glu Ala Ile Lys 1 5 10 15 Ala Ala Gln Leu Gly Glu Val Pro Ile Gly Ala Leu Leu Val Tyr Gln 20 25 30 Asp Glu Val Val Ala Lys Ala Phe Asn Leu Arg Glu Ala Leu Gln Thr 35 40 45 Thr Ala Ser His Ala Glu Met Leu Val Ile Asp Lys Gly Asn Glu Val 50 55 60 Ile Asn Ser Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ala Arg Ile Pro Arg 85 90 95 Val Val Phe Gly Ala Tyr Asp Pro Lys Ala Gly Cys Ala Gly Ser Ile 100 105 110 Leu Asn Leu Leu Asp Asp Lys Arg Phe Asn His Gln Val Glu Val Thr 115 120 125 Arg Gly Val Leu Ala Glu Ala Cys Gly His Leu Leu Lys Asp Phe Phe 130 135 140 Lys Gln Leu Arg Ser Arg Lys Gln Glu Ala Glu Val Val Ser Leu Ala 145 150 155 160 Asp Tyr Lys Glu Glu Asn Asn Asn Gly 165 <210> 522 <211> 127 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 522 Met Ala Pro Asp Leu Ser Gln His Phe Lys Phe Met Ala Val Ala Leu 1 5 10 15 Phe Val Gly Tyr Lys Ala Leu Leu Lys Asn Glu Thr Pro Val Ala Cys 20 25 30 Val Val Thr Arg Gly Cys Gln Ile Ile Ser Ile Gly Tyr Asn His Thr 35 40 45 Asn Ile Thr Leu Asn Gly Thr Lys His Ala Glu Phe Ile Ala Leu Gly 50 55 60 Arg Leu Lys Glu Pro Val Asp Tyr Lys Asn Leu Thr Leu Tyr Val Thr 65 70 75 80 Val Glu Pro Cys Ile Met Cys Ala Ser Tyr Leu Arg Gln Leu Gly Leu 85 90 95 Lys Asn Val Ile Tyr Gly Cys Gly Asn Asp Arg Phe Gly Gly Ala Gly 100 105 110 Thr Ile Leu Pro Leu His Asn Asp Pro Lys Leu Pro His Lys Pro 115 120 125 <210> 523 <211> 170 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 523 Met Val Ser Leu Ser Val Pro Leu Ser Ser His Ser Phe Pro Pro Thr 1 5 10 15 Leu Ala Pro Ser Arg Ala Lys Leu Asn Asp Leu Tyr Ala Gly Ala Gln 20 25 30 Gly Glu Glu Ala Leu Asp Val Arg Glu Ile Pro Val Gly Cys Val Leu 35 40 45 Val His Glu Gly Lys Ile Ile Ala Arg Gly Arg Asn Arg Thr Asn Glu 50 55 60 Gly Arg Asn Ala Thr Leu His Ala Glu Phe Asp Ala Leu Arg His Leu 65 70 75 80 Leu Pro Asp Arg Ser Pro Ser Gln Thr Pro Gly Leu Val Arg Pro Tyr 85 90 95 Thr Pro Gln Thr Asp Asp Val Leu Ala Ala Ala Gly Tyr Asp Ser Ala 100 105 110 Ala Gly Arg Lys Val Trp Gln Thr Pro Leu Lys Gly Val Val Leu Tyr 115 120 125 Val Thr Val Glu Pro Cys Leu Met Cys Ala Ser Ala Met Arg Gln Val 130 135 140 Gly Ile Glu Lys Val Val Tyr Gly Cys Ala Asn Asp Arg Phe Gly Gly 145 150 155 160 Asn Gly Gly Val Gln Ser Ile His Ala Glu 165 170 <210> 524 <211> 182 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 524 Met Thr Lys Asp Leu Met Asp Ser Thr Glu Leu Asn Thr Met Asp Glu 1 5 10 15 Arg Ser Arg Asp Glu Tyr Phe Met Ser Leu Ala Ile Glu Glu Gly Lys 20 25 30 Lys Ala Tyr Ala Leu Gly Glu Ile Pro Ile Gly Ala Ile Leu Val His 35 40 45 Asn Asn Gln Val Ile Ser Arg His His Asn Arg Arg Glu Leu Asp His 50 55 60 Asp Ala Thr Ala His Ala Glu Val Leu Val Ile Arg Glu Ala Cys Asn 65 70 75 80 Ser Leu Lys Arg Trp Arg Leu Thr Gly Cys Thr Leu Tyr Val Thr Ile 85 90 95 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Asn Ser Arg Ile Asp 100 105 110 Arg Val Val Tyr Gly Ala Ser Asp Tyr Lys Gly Gly Ala Val Glu Ser 115 120 125 Leu Phe Asn Val Leu Ser His Pro Gly Leu Asn His Glu Pro Gln Leu 130 135 140 Gln Ala Gly Ile Leu Ala Asp Glu Cys Ser Gln Leu Met Lys Asp Phe 145 150 155 160 Phe Lys Glu Arg Arg Lys Ala Arg Arg Ser Thr Gln Glu Ala Glu Gly 165 170 175 Ser Ala Leu Glu Met Arg 180 <210> 525 <211> 147 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 525 Met Phe Asn Lys Phe Met Ala Glu Ala Ile Glu Glu Ala Lys Lys Ala 1 5 10 15 Leu Ala Glu Asp Glu Val Pro Val Gly Ala Val Ile Thr His Arg Gly 20 25 30 Lys Ile Ile Ala Ala Ala His Asn Leu Arg Glu Thr Leu Asn Arg Ala 35 40 45 Thr Ala His Ala Glu Ile Leu Ala Ile Glu Lys Ala Cys Ser Ile Leu 50 55 60 Asn Ser Trp Tyr Leu Thr Asp Cys Asp Leu Tyr Val Thr Leu Glu Pro 65 70 75 80 Cys Ile Met Cys Ala Gly Ala Ile Val Asn Ala Arg Ile Arg Ser Leu 85 90 95 Tyr Phe Gly Ala Phe Asp Pro Lys Ala Gly Ala Cys Gly Ser Val Ile 100 105 110 Asp Val Phe Arg Leu Lys Glu Leu Asn His Arg Val Thr Val Tyr Ala 115 120 125 Gly Ile Met Glu Asp Glu Cys Ala Ser Leu Leu Thr Lys Phe Phe Arg 130 135 140 Ser Lys Arg 145 <210> 526 <211> 160 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 526 Met Thr Val Asn Thr Gly Ser Met His Glu Thr Trp Met Arg Leu Ala 1 5 10 15 Leu Glu Gln Ala Glu Arg Ala Gly Arg Glu Gly Glu Val Pro Ile Gly 20 25 30 Ala Val Ile Val Lys Asp Gly Ala Ala Leu Ala Val Gly Arg Asn Arg 35 40 45 Arg Glu Thr Asp His Asn Ala Leu Ala His Ala Glu Ala Glu Ala Ile 50 55 60 Arg Ala Ala Cys Ala Ala Leu Gly Ser Trp Arg Leu Ser Gly Cys Thr 65 70 75 80 Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile 85 90 95 Asn Ala Arg Val Asp Thr Val Val Phe Gly Ala Tyr Asp Pro Lys Ala 100 105 110 Gly Ala Ser Gly Ser Val Ile Asp Leu Phe Ser Cys Pro Phe Asn His 115 120 125 His Pro Ala Val Met Gly Gly Val Leu Glu Glu Asp Cys Arg Arg Leu 130 135 140 Leu Gln Asp Phe Phe Ala Gly Leu Arg Arg Pro Lys Asn Asp Gly Cys 145 150 155 160 <210> 527 <211> 161 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 527 Met Asn His Glu Ile Phe Met Gln Met Ala Ile Asp Glu Ala Lys Lys 1 5 10 15 Ala Tyr Lys Ile Asn Glu Val Pro Ile Gly Ala Val Val Ile Lys His 20 25 30 Gly Glu Val Ile Gly Arg Gly His Asn Leu Arg Glu Ser Ser Gln Asn 35 40 45 Pro Leu Met His Ala Glu Val Val Ala Ile Asn Glu Ala Ser Lys Asn 50 55 60 Ile Gly Ser Trp Arg Leu Glu Glu Cys Val Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Val Met Cys Ser Gly Ala Ile Val Met Ser Arg Ile Pro Thr 85 90 95 Val Val Tyr Gly Ala His Asp Ala Lys Gly Gly Cys Ser Gly Ser Leu 100 105 110 Met Asn Leu Leu His Glu Ser Arg Phe Asn His Gln Ala Thr Val Ile 115 120 125 Ala Gly Ile Lys His Glu Glu Cys Ser Met Leu Leu Lys Asp Phe Phe 130 135 140 Lys Ser Leu Arg Asn Asn Lys Leu Leu Glu Lys Asn Lys Lys Leu Glu 145 150 155 160 Glu <210> 528 <211> 160 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 528 Met Pro Thr Leu Glu Tyr Gln Lys Asp Asp Phe Phe Phe Met Arg Gln 1 5 10 15 Ala Ile Gln Glu Ala Lys Arg Ala Met Glu Ile Asp Glu Val Pro Ile 20 25 30 Gly Ala Val Ile Val Lys Ala Asp Glu Val Ile Ala Arg Ala His Asn 35 40 45 Leu Arg Glu Thr Leu Gln Asp Ala Thr Ala His Ala Glu Leu Leu Ala 50 55 60 Ile Arg Lys Ala Cys Glu Val Leu Gly Thr Trp Arg Leu Glu Gly Cys 65 70 75 80 Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val 85 90 95 Ile Leu Ser Arg Val Asp Arg Leu Val Phe Gly Ala Lys Asp Pro Lys 100 105 110 Gly Gly Ala Cys Gly Ser Leu Met Asn Leu Pro Ala Asp Glu Arg Phe 115 120 125 Asn His Arg Pro Lys Ile Ala Ala Gly Ile Met Ala Asp Glu Cys Gly 130 135 140 Asn Ile Leu Lys Lys Phe Phe Gln Asp Lys Arg Met Asn Lys Lys Ala 145 150 155 160 <210> 529 <211> 201 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 529 Met Asp Glu Pro Ile Thr Glu His Glu Ile Thr Pro Ala Val Ser Glu 1 5 10 15 Asn Ser Lys His Ala Ser Trp Met Lys Gln Ala Leu Met Met Gly Glu 20 25 30 Gln Ala Leu Glu His Gly Glu Thr Pro Val Gly Cys Val Leu Val Tyr 35 40 45 Asp Asn Lys Ile Val Gly Arg Gly Met Asn Asp Thr Asn Arg Ser Met 50 55 60 Asn Gly Thr Arg His Ala Glu Phe Leu Ala Ile Ala Glu Met Leu Gln 65 70 75 80 Ser Tyr Pro Lys Ser Ala Leu Gln Ser Thr Asp Leu Tyr Val Thr Val 85 90 95 Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Arg Gln Tyr Gly Ile Arg 100 105 110 Ser Val Tyr Phe Gly Cys Ala Asn Asp Arg Phe Gly Gly Thr Gly Gly 115 120 125 Val Leu Asn Ile His Ser Asp Arg Ser Ile Asp Pro Pro Tyr Pro Val 130 135 140 Tyr Gly Gly Leu Phe Gln Lys Glu Ala Ile Met Leu Leu Arg Arg Phe 145 150 155 160 Tyr Ile Gln Glu Asn Asp Lys Ala Pro Lys Pro Arg Pro Lys Arg Asn 165 170 175 Arg Glu Leu Asn Thr Ala Phe Asp Arg Val Pro Glu Ile Gly Gly Ala 180 185 190 Asn Gly Gly Asn Ile Glu Gln Ser Ser 195 200 <210> 530 <211> 184 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 530 Met Trp Arg Gly Thr Cys Gly Arg Asp Lys Lys Leu Thr Val Asn Lys 1 5 10 15 Lys Phe Met Glu Gln Phe Met Ser Glu Ala Phe Ile Glu Ala Lys Ser 20 25 30 Val Leu Glu Ala Gly Glu Val Pro Val Gly Cys Ile Phe Leu Tyr His 35 40 45 Gly Asp Gly Lys Asn Glu Val Ile Ala Arg Ala Gly Asn Asn Val Asn 50 55 60 Ala Thr Lys Asn Ala Thr Arg His Ala Glu Phe Leu Cys Ile Asp Gln 65 70 75 80 Thr Leu Glu Phe Cys Thr Arg Asn Ser Leu Ser Ile Lys Asp Val Phe 85 90 95 Ser Lys Ile Ser Val Val Val Thr Val Glu Pro Cys Ile Met Cys Ser 100 105 110 Ala Ala Leu His Asp Leu Gly Val Lys Glu Ile Leu Tyr Gly Cys Ala 115 120 125 Asn Asp Arg Phe Gly Gly Lys Thr Leu Val Asp Val Pro Phe Val Thr 130 135 140 Asn Arg Arg Asp Gly Gln Thr Gln Val Asn Gly Gly Val Cys Ala Asp 145 150 155 160 Glu Ala Met Ala Leu Leu Lys Asp Phe Tyr Lys Gly Asp Asn Pro Ser 165 170 175 Ala Pro Ile Thr Lys Thr Lys Arg 180 <210> 531 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 531 Met Glu Asn Asn Asp Glu Lys Phe Met Met Lys Ala Ile Glu Gln Ala 1 5 10 15 Lys Ile Ala Tyr Asp Met Asp Glu Val Pro Val Gly Cys Val Ile Val 20 25 30 Lys Asp Gly Glu Ile Ile Ala Gln Ala Tyr Asn Ser Val Glu Lys Asp 35 40 45 Lys Asn Ala Thr Met His Ala Glu Leu Lys Ala Ile Asn Gln Ala Thr 50 55 60 Glu Phe Ile Gly Asn Phe Arg Leu Asp Asp Cys Ile Met Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Val Met Cys Thr Gly Ala Leu Val Tyr Ser Arg Ile 85 90 95 Pro Lys Val Val Phe Gly Ala Phe Asp Lys Lys Arg Gly Ala Cys Gly 100 105 110 Ser Leu Ile Ser Leu Asn Asp Tyr Glu Gly Leu Asn His Lys Ile Glu 115 120 125 Val Lys Ser Ile Met Glu Lys Glu Cys Val Glu Leu Met Gln Ser Phe 130 135 140 Phe Arg Arg Ile Arg Glu Lys Asn Arg Asn Lys 145 150 155 <210> 532 <211> 97 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 532 Met Met Asp Leu Thr Asn Glu Phe Gly Phe Met Ala Ile Ala Thr Phe 1 5 10 15 Val Ala Phe Arg Ala Leu Lys Asn Gly Glu Thr Pro Val Ala Cys Ile 20 25 30 Phe Val His Glu Pro Thr His Thr Ile Leu Ser Phe Gly Cys Asn Asp 35 40 45 Thr Asn Gly Ser Leu Asn Gly Thr Met His Ala Glu Phe Val Ala Ile 50 55 60 Glu Lys Ile Leu Gln Gly Phe Asn Leu Tyr Lys Lys Gly Arg Glu Glu 65 70 75 80 Ile Ile Glu Phe Phe Met Asp Val Thr Leu Tyr Val Thr Val Glu Pro 85 90 95 Cys <210> 533 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 533 Met Ser Asp Asp Ile Ala Phe Met Gln Gln Ala Leu Glu Leu Ala Arg 1 5 10 15 Glu Ala Ala Ser Leu Gly Glu Val Pro Val Gly Ala Val Ala Val Leu 20 25 30 Asp Gly Asn Val Val Gly Thr Gly Tyr Asn Arg Arg Glu Cys Asp Arg 35 40 45 Asn Pro Phe Ala His Ala Glu Met Leu Ala Leu Ala Ala Ala Ala Lys 50 55 60 Ala Arg Asp Ala Trp Arg Leu Ser Gly Val Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val Gln Ser Arg Val Thr 85 90 95 Arg Leu Val Phe Gly Thr Met Asp Pro Lys Ala Gly Ala Val Gly Ser 100 105 110 Leu Tyr Asn Leu Val Glu Glu Pro Arg His Asn His Arg Leu Gln Val 115 120 125 Thr Ser Gly Ile Leu Ala Glu Asp Ser Arg Gln Leu Leu Lys Thr Phe 130 135 140 Phe Glu Arg Leu Arg Ala Lys Arg Arg Glu Asn 145 150 155 <210> 534 <211> 161 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 534 Met Val Asp Gln Met Thr Asp Glu Tyr Tyr Met Gly Leu Ala Leu Ala 1 5 10 15 Glu Ala Gln Ala Ala Phe Gln Ile Gly Glu Val Pro Ile Gly Ala Val 20 25 30 Ile Val Met Asp Gly Gln Val Val Ala Ala Gly His Asn Leu Arg Glu 35 40 45 Thr Trp His Asp Ala Thr Ala His Ala Glu Ile Ile Ala Ile Arg Gln 50 55 60 Ala Cys Glu Arg Leu Ser Arg Trp Arg Leu Thr Gly Ala Thr Leu Tyr 65 70 75 80 Val Thr Ile Glu Pro Cys Pro Met Cys Ala Gly Ala Leu Ile Met Ser 85 90 95 Arg Ile Asp Arg Leu Val Tyr Gly Ser Ser Asp Tyr Lys Ala Gly Ala 100 105 110 Val Glu Ser Ile Phe Asn Ile Val Gln Asn Glu Ala Leu Asn His Gln 115 120 125 Leu Ala Val Thr Ala Gly Val Arg Ala Glu Glu Cys Ala Arg Ile Met 130 135 140 Arg Asp Phe Phe Arg Met Arg Arg Ser Gly Glu Met Arg Ser Ile Ser 145 150 155 160 Glu <210> 535 <211> 159 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 535 Met Thr Lys Asp Glu Phe Tyr Met Gly Lys Ala Leu Glu Glu Ala Lys 1 5 10 15 Lys Ala Ala Ala Val Gly Glu Ile Pro Ile Gly Ala Val Ile Val His 20 25 30 Lys Lys Lys Ala Val Ala Arg Ala His Asn Leu Arg Glu Thr Leu Pro 35 40 45 Cys Ala Thr Ala His Ala Glu Leu Leu Ala Ile Ala Glu Ala Cys Arg 50 55 60 Val Leu Gly Arg Trp Arg Leu Thr Gly Cys Thr Leu Tyr Val Thr Val 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Asn Ser Arg Leu Asp 85 90 95 Arg Val Val Tyr Gly Cys Ala Asp Thr Lys Gly Gly Gly Thr Arg Ser 100 105 110 Leu Tyr Lys Ile Val Asp Asp Glu Arg Leu Asn His Arg Ala Ile Val 115 120 125 Thr Ala Gly Ile Arg Glu Thr Glu Cys Ala Ala Leu Leu Lys Asp Phe 130 135 140 Phe Arg Lys Arg Arg Ala Glu Glu Lys Arg Lys Thr Val Ser Asp 145 150 155 <210> 536 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 536 Met Glu Arg His Glu His Tyr Met Arg Leu Ala Met Gln Glu Ala Lys 1 5 10 15 Lys Ala Glu Ala Ile Gly Glu Val Pro Ile Gly Cys Val Ile Val Lys 20 25 30 Gly Asp Glu Val Ile Ala Ser Gly Tyr Asn His Arg Glu Thr Asn Arg 35 40 45 Gln Ala Thr Ala His Ala Glu Leu Leu Ala Ile Glu Ala Ala Cys Glu 50 55 60 Lys Leu Ala Asn Trp Arg Leu Glu Gly Cys Glu Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Met Leu Ser Arg Ile Glu 85 90 95 His Val Ile Phe Gly Ala Val Asp Pro Lys Gly Gly Cys Cys Gly Thr 100 105 110 Leu Met Asn Leu Val Gln Asp Asp Arg Phe Asn His Val Ser Gln Leu 115 120 125 Thr Gly Gly Ile Leu Glu Gln Glu Cys Gly Glu Met Leu Thr Ser Phe 130 135 140 Phe Arg Glu Leu Arg Ala Lys Lys Lys Gln Gln Lys Arg Ala Met Gly 145 150 155 160 Cys Asn Ala Thr Asn Glu Thr Val 165 <210> 537 <211> 176 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 537 Met His Thr Cys Ile Ile Leu Pro Asn Lys Pro Thr Ile Ile Lys Ser 1 5 10 15 Ala Val Glu Lys Asp Asp Val Trp Trp Met Gly Ser Ala Ile Arg Glu 20 25 30 Ala Glu Lys Ala Ala Glu Arg Gly Glu Val Pro Ile Gly Ala Val Ile 35 40 45 Val Arg Asp Gly Lys Ile Ile Ser Arg Gly Tyr Asn Leu Arg Glu Gly 50 55 60 Lys Gln Asp Pro Ala Ala His Ala Glu Leu Ile Ala Ile Arg Lys Ala 65 70 75 80 Ala Lys Lys Leu Gly Asn Trp Arg Leu Ala Gly Thr Thr Leu Tyr Val 85 90 95 Thr Leu Glu Pro Cys Ile Met Cys Met Gly Ala Ile Leu Leu Ala Arg 100 105 110 Val Glu Lys Val Val Phe Gly Cys Tyr Asp Pro Lys Gly Gly Ala Ala 115 120 125 Gly Ser Leu Tyr Asp Leu Ser Asp Asp Lys Arg Leu Asn His Arg Val 130 135 140 Thr Leu Val Ala Gly Ile Arg Gln Ala Glu Cys Ala Ala Leu Leu Ser 145 150 155 160 Gly Phe Phe Ala Ala Leu Arg Ala Glu Lys Lys Arg Ala Lys Leu Gln 165 170 175 <210> 538 <211> 156 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 538 Met Glu Asp Ser Thr Gly Lys His Glu Tyr Phe Met Arg Gln Ala Leu 1 5 10 15 Ala Glu Ala Arg Lys Ala Ala Glu Lys Asp Glu Val Pro Ile Gly Ala 20 25 30 Val Ile Val Tyr Glu Asn His Ile Ile Ala Arg Ala His Asn Gln Arg 35 40 45 Glu Met Leu Asn Asp Pro Thr Ala His Ala Glu Met Ile Ala Ile Thr 50 55 60 Gln Ala Ala Ala His Leu Gln Asn Trp Arg Leu Thr Gly Thr Thr Ile 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val Gln 85 90 95 Ser Arg Ile Asp Thr Leu Val Tyr Gly Thr Pro Asp Lys Lys Ala Gly 100 105 110 Ala Cys Ala Ser Val Ile Asn Leu Val Gln Glu Pro Arg Phe Asn His 115 120 125 Arg Leu Asn Val Leu Ser Asn Val Leu Ala Asp Glu Cys Lys His Ile 130 135 140 Leu Gln Lys Phe Phe Leu Glu Asn Cys Arg Thr Lys 145 150 155 <210> 539 <211> 176 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 539 Met Phe Ser Ser Glu Glu Lys Lys His Tyr Met Glu Leu Ala Phe Ala 1 5 10 15 Glu Ala Glu Lys Ala Glu Ala Gln Asp Glu Val Pro Ile Gly Ala Ile 20 25 30 Val Val Ala Pro Asp Gly Gln Val Ile Gly Arg Gly Tyr Asn Arg Arg 35 40 45 Glu Leu Asp Asn Ile Ala Thr His His Ala Glu Ile Leu Ala Ile Asn 50 55 60 Glu Ala Cys Lys Asn Leu Asn Ser Trp Arg Leu Ile Asp Cys Ser Leu 65 70 75 80 Phe Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Ile Asn 85 90 95 Ala Arg Leu Lys Glu Val Phe Tyr Gly Ala Pro Asp His Lys Ala Gly 100 105 110 Ala Ser Gly Ser Val Val Asp Leu Phe Ala Val Glu Lys Phe Asn His 115 120 125 His Pro Gln Val Ile Arg Gly Leu Tyr Ser Glu Lys Ala Ser Asn Met 130 135 140 Leu Thr Asn Phe Phe Arg Ala Ile Arg Ala Lys Gln Lys Glu Lys Lys 145 150 155 160 Leu Lys Ala Lys Thr Lys Glu Asn Asp Ala Ser Pro Ser Gln Ile Asp 165 170 175 <210> 540 <211> 172 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 540 Met Ser Lys Gly Asp Ser Asp Gln Lys Tyr Met Gln Gln Ala Ile Gln 1 5 10 15 Leu Ala Leu Gln Ala Gln Ala Gln Gly Glu Val Pro Ile Gly Ala Leu 20 25 30 Leu Val Lys Asp Asp Lys Ile Val Ala Gln Ala Tyr Asn Leu Arg Glu 35 40 45 Asn Asn Gln Asp Ala Thr Ala His Ala Glu Leu Met Val Ile Gln Ala 50 55 60 Ala Cys Lys Gln Leu Asn Ser Trp Arg Leu Thr Gly Cys Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Leu Val Leu Ser 85 90 95 Arg Val Glu Arg Val Val Tyr Gly Ala Leu Asp Pro Lys Ala Gly Ala 100 105 110 Val His Ser Leu Phe Asn Ile Leu Thr His Pro Leu Leu Asn His Gln 115 120 125 Ile Glu Val Gln Gly Gly Val Cys Glu Ala Glu Cys Arg Gln Leu Leu 130 135 140 Lys Asn Phe Phe Gln Gln Arg Arg Gln Glu Asn Lys Leu Lys Lys Gln 145 150 155 160 Met Arg Gln Asn Val Ser Leu Glu Arg Glu Val Glu 165 170 <210> 541 <211> 151 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 541 Met Asp Asp Phe Ala Tyr Met Arg Gln Ala Met Glu Leu Ala Glu Gln 1 5 10 15 Ala Ala Ala Leu Gly Glu Ile Pro Val Gly Ala Leu Val Val Gln Asp 20 25 30 Ala Thr Gly Glu Val Leu Gly Arg Gly Tyr Asn Arg Arg Glu Val Asp 35 40 45 His Asp Pro Thr Ala His Ala Glu Val Leu Ala Ile Arg Gln Ala Ala 50 55 60 Leu Ala Ile Gly Ser Trp Arg Leu Ser Gly Cys Thr Leu Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Pro Met Cys Cys Gly Thr Ile Ile Asn Ala Arg Val 85 90 95 Arg Arg Val Val Phe Gly Ala Tyr Asp Ser Lys Ala Gly Ser Ala Asp 100 105 110 Ser Val Ile Asn Leu Phe Ala Leu Pro Tyr Asn His Lys Pro Ala Val 115 120 125 Thr Gly Gly Leu Leu Glu Asp Ala Cys Lys Glu Gln Leu Gln Arg Phe 130 135 140 Phe Ser Gly Leu Arg Glu Lys 145 150 <210> 542 <211> 160 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 542 Met Glu Asp Gln Asp His Tyr Phe Met Glu Gln Ala Leu Ala Glu Ala 1 5 10 15 Lys Lys Ala Glu Glu Ile Gly Glu Val Pro Ile Gly Ala Val Val Val 20 25 30 Lys Asp Gly Arg Val Ile Ala Thr Ala His Asn Leu Arg Glu Ser Lys 35 40 45 Gln Gln Ala Thr Ala His Ala Glu Val Leu Ala Ile Glu Gln Ala Ser 50 55 60 Leu Glu Thr Gly Phe Trp Arg Leu Asp Asp Cys Ala Leu Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile 85 90 95 Ser Lys Leu Val Tyr Gly Ala Lys Asp Pro Lys Ala Gly Cys Val His 100 105 110 Ser Leu Tyr Ser Leu Leu Glu Asp Pro Arg Phe Asn His Gln Val Glu 115 120 125 Val Ile Ala Gly Val Asn Glu Glu Glu Cys Gly Glu Arg Leu Thr Gln 130 135 140 Phe Phe Arg Gln Leu Arg Ala Asn Lys Arg Glu Lys Lys Ser Glu Ser 145 150 155 160 <210> 543 <211> 180 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 543 Met Val Gly Lys Lys Met Asn Ile Thr Tyr Asn Asp Asp Asp Tyr Met 1 5 10 15 Lys Glu Ala Ile Glu Glu Ala Lys Lys Ala Gly Glu Leu Gly Glu Val 20 25 30 Pro Ile Gly Ala Val Val Val Leu Asp Gly Lys Ile Ile Ser Arg Ala 35 40 45 His Asn Leu Arg Glu Ser Asn Gln Asn Ala Val Ala His Ala Glu Leu 50 55 60 Leu Ala Ile Glu Glu Ala Cys Gly Met Leu Gly Thr Trp Arg Leu Glu 65 70 75 80 Asp Ala Ala Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ser Gly 85 90 95 Ala Ile Ile Leu Ser Arg Ile Lys Arg Val Val Tyr Gly Ala Ala Asp 100 105 110 Pro Lys Gly Gly Cys Ala Gly Thr Phe Met Asn Leu Leu Gln Asp Glu 115 120 125 Arg Phe Asn His Gln Ser Glu Val Ser Ala Gly Val Leu Glu Glu Glu 130 135 140 Cys Gly Ser Leu Leu Thr Asp Phe Phe Arg Ala Leu Arg Glu Arg Lys 145 150 155 160 Lys Glu Glu Lys Arg Arg Arg Lys Gln Leu Leu Asp Leu Gln Glu Gly 165 170 175 Ile Asp Arg Pro 180 <210> 544 <211> 108 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 544 Met Val Gly Cys Val Phe Val Tyr Gln Gly Lys Ile Ile Gly Arg Gly 1 5 10 15 Met Asn Ala Thr Asn Arg Thr Leu Asn Gly Thr Arg His Ala Glu Phe 20 25 30 Met Ala Ile Ser His Ile Leu Ser Pro Pro Ala Tyr Ser Glu Asp Lys 35 40 45 Ala Tyr Pro Pro Thr Val Phe His Asp Thr Asp Leu Tyr Val Thr Val 50 55 60 Glu Pro Cys Ile Met Cys Ala Ser Leu Leu Arg Gln Phe Gly Ile Arg 65 70 75 80 Lys Val Tyr Phe Gly Ala Ser Asn Asp Lys Phe Gly Gly Thr Gly Gly 85 90 95 Val Leu Asn Ile His Ala Asp Glu Asp Ile Gly Asn 100 105 <210> 545 <211> 185 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 545 Met Val Glu Ala Gly Val Thr Ala Ala Ser Ala Ala Thr Ala Ala Thr 1 5 10 15 Ala Ala Ser Ala Thr Ser Ala Ala Ala Phe Leu Pro Trp Thr Glu Glu 20 25 30 Asp Ala Arg Tyr Ile Arg Leu Ala Leu Glu Glu Ala Gln Ala Ala Tyr 35 40 45 Asp Ile Gly Glu Val Pro Val Gly Ala Leu Val Val Ser Ala Lys Gly 50 55 60 Glu Ile Leu Gly Arg Gly Tyr Asn Arg Thr Ile Ile Asp His Asp Pro 65 70 75 80 Thr Ala His Ala Glu Ile Val Ala Leu Arg Asn Ala Ala Arg Gln Leu 85 90 95 Glu Asn Tyr Arg Leu Pro Gly Ile Thr Val Tyr Val Thr Leu Glu Pro 100 105 110 Cys Val Met Cys Ile Gly Ala Met Leu His Ala Arg Leu Ala Arg Val 115 120 125 Val Phe Gly Ala Tyr Asp Pro Lys Thr Gly Ala Cys Gly Ser Val Leu 130 135 140 Asp Val Gly Ala Val Pro Lys Leu Asn His His Thr Ser Val Thr Gly 145 150 155 160 Gly Val Leu Ala Glu Pro Cys Gly Asp Leu Leu Arg Arg Phe Phe Arg 165 170 175 Glu Arg Arg Ala Lys Glu Ser Ile Ala 180 185 <210> 546 <211> 16 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 546 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 547 <211> 1072 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 547 Met Ser Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser 1 5 10 15 Ile Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg 20 25 30 Tyr Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys 35 40 45 Ala Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile 50 55 60 Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys 65 70 75 80 Glu Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu 85 90 95 Leu Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp 100 105 110 Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala 115 120 125 Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg 130 135 140 Lys Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile 145 150 155 160 Gln Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met 165 170 175 Trp Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser 180 185 190 Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu 195 200 205 Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala 210 215 220 Ser Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu 225 230 235 240 Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser 245 250 255 Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe 260 265 270 Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro 275 280 285 Asp Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys 290 295 300 Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val 305 310 315 320 Ser Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln 325 330 335 Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu 340 345 350 Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val 355 360 365 Val Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp 370 375 380 Tyr Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp 385 390 395 400 Ile Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr 405 410 415 Asp Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe 420 425 430 Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln 435 440 445 Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr 450 455 460 Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro 465 470 475 480 Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg 485 490 495 Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val 500 505 510 His Ile Ala Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys 515 520 525 Lys Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala 530 535 540 Ile Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp 545 550 555 560 Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr 565 570 575 Ser Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys 580 585 590 Glu Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr 595 600 605 Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser 610 615 620 Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu 625 630 635 640 Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn 645 650 655 Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Lys Thr Tyr 660 665 670 Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr 675 680 685 Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln 690 695 700 Phe Lys Glu Val Glu Val Asn Leu Arg Lys Lys Arg Val Gln Thr Val 705 710 715 720 Asn Gly Val Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys 725 730 735 Asn Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val 740 745 750 Ala Cys Thr Asp His His Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln 755 760 765 Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro 770 775 780 Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro 785 790 795 800 Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser 805 810 815 Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala 820 825 830 Ala His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly 835 840 845 Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe Asp 850 855 860 Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr 865 870 875 880 Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys Asn Ser Lys 885 890 895 Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly 900 905 910 Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln Thr Lys Ala Phe Val 915 920 925 Arg Glu Val Asn Gly Gly Val Ala Gln Asn Ser Asp Leu Val Arg Val 930 935 940 Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val 945 950 955 960 Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Lys Ser Gly 965 970 975 Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys 980 985 990 Ser Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asn Glu 995 1000 1005 Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg 1010 1015 1020 Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr 1025 1030 1035 Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val 1040 1045 1050 Gly Val Leu Gly Asp Leu Arg Leu Val Lys Gln Glu Thr Arg Arg 1055 1060 1065 Ile Phe Asn Arg 1070 <210> 548 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 548 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 549 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 549 aggagcgaag gcatgaaacc atatcgtcat agttccatga aagccaaaag tggctttgat 60 gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120 ttctccccat ttatt 135 <210> 550 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 550 acgcacaaac gtcgtatctc cgcacgtcat agttccatga aagccaaaag tggctttgat 60 gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120 ttctccccat ttatt 135 <210> 551 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 551 tatctccgca ctcggcccag gcggtgtcat agttccatga aagccaaaag tggctttgat 60 gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120 ttctccccat ttatt 135 <210> 552 <211> 135 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 552 cagctgtctc agtttatgga ccagagtcat agttccatga aagccaaaag tggctttgat 60 gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120 ttctccccat ttatt 135 <210> 553 <211> 1071 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 553 Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser 1 5 10 15 Ile Gly Trp Gly Val Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Arg 20 25 30 Tyr Glu Lys Val Arg Ile Val Asp Gln Gly Val Arg Met Phe Asp Arg 35 40 45 Ala Glu Met Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile 50 55 60 Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys 65 70 75 80 Asn Ile Arg Asn Leu Leu Val Gln His Gly Val Ile Thr Gln Glu Glu 85 90 95 Leu Asp Ser Leu Tyr Pro Leu Ser Lys Lys Ser Met Asp Ile Trp Gly 100 105 110 Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Phe Glu Trp Ala 115 120 125 Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg 130 135 140 Lys Ser Glu Leu Lys Asp Thr Glu Thr Gly Lys Val Leu Ser Ser Ile 145 150 155 160 Gln Leu Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met 165 170 175 Trp Met Lys Asp Pro Asp Phe Ser Lys Tyr Asp Arg Lys Arg Asn Ser 180 185 190 Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Glu Leu Glu Lys Glu 195 200 205 Ile Val Thr Leu Phe Ala Ala Gln Arg Arg Phe Gln Ser Pro Tyr Ala 210 215 220 Ser Lys Asp Leu Gln Glu Thr Tyr Leu Gln Ile Trp Thr His Gln Leu 225 230 235 240 Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser 245 250 255 Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe 260 265 270 Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro 275 280 285 Asp Phe Gln Pro Phe Thr Lys Glu Gln Arg Glu Ile Ile Leu Asn Asn 290 295 300 Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val 305 310 315 320 Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln 325 330 335 Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu 340 345 350 Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Asn Lys Val 355 360 365 Val Ala Asn Tyr Ser Glu Arg Thr Asn Glu Thr Phe Ser Thr Leu Asp 370 375 380 Tyr Asp Gly Ile Gly Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp 385 390 395 400 Ile Arg Ser Tyr Leu Lys Ser Ser His Asn Leu Pro Lys Arg Cys Tyr 405 410 415 Asp Asp Gln Leu Ile Glu Glu Leu Leu Ser Leu Ser Tyr Thr Lys Phe 420 425 430 Gly His Leu Ser Leu Lys Ala Ile Asn His Val Leu Ser Ile Met Gln 435 440 445 Lys Gly Asn Thr Tyr Lys Glu Ala Val Asp Gln Leu Gly Tyr Asp Thr 450 455 460 Ser Gly Leu Lys Lys Glu Lys Arg Ser Lys Phe Leu Pro Pro Ile Ser 465 470 475 480 Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg 485 490 495 Lys Val Val Asn Ala Ile Ile Arg Arg His Gly Ser Pro His Ser Val 500 505 510 His Ile Glu Leu Ala Arg Glu Leu Ser Lys Asn His Asp Glu Arg Thr 515 520 525 Lys Ile Val Ser Ala Gln Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala 530 535 540 Ile Ser Ile Leu Ser Glu His Gly Ile Leu Asn Pro Thr Gly Tyr Asp 545 550 555 560 Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr 565 570 575 Ser Leu Lys Glu Ile Pro Ala Asp Thr Phe Phe Asn Glu Leu Lys Lys 580 585 590 Glu Arg Asn Gly Ala Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr 595 600 605 Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser 610 615 620 Asp Glu Asn Arg Lys Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu 625 630 635 640 Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn 645 650 655 Lys Phe Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Arg Ala Tyr 660 665 670 Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr 675 680 685 Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln 690 695 700 Phe Lys Glu Ala Glu Asp Asn Pro Arg Lys Arg Arg Val Gln Thr Val 705 710 715 720 Asn Gly Val Ile Thr Ala His Phe Arg Lys Arg Trp Gly Leu Glu Lys 725 730 735 Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val 740 745 750 Ala Cys Thr Asp His His Met Val Thr Arg Val Thr Glu Tyr Tyr Gln 755 760 765 Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro 770 775 780 Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro 785 790 795 800 Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Leu 805 810 815 Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Ile Thr Gly Ala 820 825 830 Ala His Lys Gln Thr Ile Met Arg Lys Gly Gly Ile Asp Lys Lys Gly 835 840 845 Lys Thr Ile Ile Ile Glu Arg Leu His Leu Lys Asp Ile Lys Phe Asp 850 855 860 Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Met Ala Thr 865 870 875 880 Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Gly Lys Asn Ser Lys 885 890 895 Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly 900 905 910 Asn Leu Ile Lys Arg Val Lys Val Glu Gly Gln Ala Lys Ser Phe Val 915 920 925 Arg Glu Val Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val 930 935 940 Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val 945 950 955 960 Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Ala Ser Ser 965 970 975 Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys 980 985 990 Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asp Glu 995 1000 1005 Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg 1010 1015 1020 Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Lys Asn Glu Tyr 1025 1030 1035 Arg Tyr Ser Leu Lys Thr Ile Glu Asp Leu Glu Lys Tyr Glu Val 1040 1045 1050 Gly Val Leu Gly Asp Leu Arg Leu Val Arg Lys Glu Thr Arg Arg 1055 1060 1065 Asn Phe His 1070 <210> 554 <211> 213 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 554 Met Asn Pro Gln Ile Arg Asn Pro Met Glu Gly Met Asp Arg His Ala 1 5 10 15 Phe Asn Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr 20 25 30 Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu 35 40 45 Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Arg Pro Lys Leu Gln 50 55 60 Ser Asn Arg Arg Tyr Glu Leu Ser Asn Trp Glu Cys Arg Lys His Val 65 70 75 80 Tyr Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe 85 90 95 Cys Gly Asn Gln Leu Pro Ala His Lys Arg Phe Gln Ile Thr Trp Phe 100 105 110 Val Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe 115 120 125 Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu 130 135 140 Tyr Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu His 145 150 155 160 Gln Ala Gly Ala Arg Val Lys Ile Met Asp Tyr Glu Glu Phe Ala Tyr 165 170 175 Cys Trp Glu Asn Phe Val Tyr Asn Glu Gly Gln Ser Phe Met Pro Trp 180 185 190 Asp Lys Phe Asp Asp Asn Tyr Ala Phe Leu His His Lys Leu Lys Glu 195 200 205 Ile Leu Arg Asn Pro 210 <210> 555 <211> 182 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 555 Met Glu Ala Thr Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu 1 5 10 15 Arg Lys Ala Tyr Gly Arg Asn Glu Thr Trp Leu Cys Phe Thr Met Glu 20 25 30 Ile Ile Lys Gln His Ser Thr Val Phe Trp Glu Thr Gly Val Phe Arg 35 40 45 Asn Gln Val Tyr Pro Glu Ser Leu Cys His Ala Glu Arg Cys Phe Leu 50 55 60 Ser Trp Phe Cys Glu Asp Ile Leu Ser Pro Asn Thr Asp Tyr Arg Val 65 70 75 80 Thr Trp Tyr Thr Ser Trp Ser Pro Cys Leu Asp Cys Ala Gly Glu Val 85 90 95 Ala Glu Phe Leu Ala Arg His Ser Asn Val Lys Leu Ala Ile Phe Ala 100 105 110 Ala Arg Leu Tyr Tyr Phe Trp Asp Pro His Tyr Gln Gln Gly Leu Arg 115 120 125 Ser Leu Ser Glu Lys Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp 130 135 140 Phe Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Gly Asp Glu Pro Phe 145 150 155 160 Lys Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys 165 170 175 Leu Gln Glu Ile Leu Gln 180 <210> 556 <211> 130 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 556 aggttttaat ggcccagcct gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60 tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120 cccatttatt 130 <210> 557 <211> 130 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 557 catggcagta cattagagca gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60 tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120 cccatttatt 130 <210> 558 <211> 130 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 558 cacatctcga gcaagacgtt gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60 tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120 cccatttatt 130 <210> 559 <211> 130 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 559 cttctatagc ctccttcccc gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60 tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120 cccatttatt 130 <210> 560 <211> 130 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 560 cctgaatgct gtgcggctct gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60 tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120 cccatttatt 130 <210> 561 <211> 130 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 561 gccgcacagc attcaggtcg gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60 tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120 cccatttatt 130 <210> 562 <211> 4923 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 562 gccaccatgg tgtctaaggg cgaggaactg ttcaccggcg tggtgcccat cctggtggaa 60 ctggacgggg atgtgaacgg ccacaagttc agcgtgtccg gcgagggaga gggcgacgcc 120 acatacggca agctgaccct gaaattcatc tgcaccacag gaaagctccc cgtgccttgg 180 cctaccctgg tcaccaccct gacgcatggc gtgcaatgtt tcagccgcta ccccgaccac 240 atgaaacagc acgacttttt caaaagcgcc atgcctgagg gctacgtgca agagcggacc 300 atcttcttca aggacgacgg aaattacaag accagagccg aggtgaagtt cgagggcgac 360 accctggtga atagaatcga gctgaagggc atcgacttca aggaagatgg caacatcctg 420 ggccacaagc tggaatacaa ctacaacagc cacaacgtgt acatcatggc cgacaagcag 480 aagaacggca tcaaggtgaa cttcaagatc agacacaaca tcgaggacgg cagcgtgcaa 540 ctggccgatc attaccagca gaacacccct atcggcgatg gtcctgtgct gctgcctgac 600 aaccactacc tgagcaccca gagcgccctg tctaaagatc ctaacgagaa gcgggaccac 660 atggtcctgc tggaattcgt gaccgccgct ggcataacac tcggcatgga cgagctgtac 720 aagtaaggat ccgcaggcct ctgctagctt gactgactga gatacagcgt accttcagct 780 cacagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa 840 aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg 900 caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt 960 gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt ggtattggcc catctctatc 1020 ggtatcgtag cataacccct tggggcctct aaacgggtct tgaggggttt tttgtgcccc 1080 tcgggccgga ttgctatcta ccggcattgg cgcagaaaaa aatgcctgat gcgacgctgc 1140 gcgtcttata ctcccacata tgccagattc agcaacggat acggcttccc caacttgccc 1200 acttccatac gtgtcctcct taccagaaat ttatccttaa ggtcgtcagc tatcctgcag 1260 gcgatctctc gatttcgatc aagacattcc tttaatggtc ttttctggac accactaggg 1320 gtcagaagta gttcatcaaa ctttcttccc tccctaatct cattggttac cttgggctat 1380 cgaaacttaa ttaaccagtc aagtcagcta cttggcgaga tcgacttgtc tgggtttcga 1440 ctacgctcag aattgcgtca gtcaagttcg atctggtcct tgctattgca cccgttctcc 1500 gattacgagt ttcatttaaa tcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 1560 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1620 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1680 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1740 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1800 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1860 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1920 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1980 agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 2040 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 2100 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 2160 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2220 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2280 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2340 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2400 agttgcattt aaatttccga actctccaag gccctcgtcg gaaaatcttc aaacctttcg 2460 tccgatccat cttgcaggct acctctcgaa cgaactatcg caagtctctt ggccggcctt 2520 gcgccttggc tattgcttgg cagcgcctat cgccaggtat tactccaatc ccgaatatcc 2580 gagatcggga tcacccgaga gaagttcaac ctacatcctc aatcccgatc tatccgagat 2640 ccgaggaata tcgaaatcgg ggcgcgcctg gtgtaccgag aacgatcctc tcagtgcgag 2700 tctcgacgat ccatatcgtt gcttggcagt cagccagtcg gaatccagct tgggacccag 2760 gaagtccaat cgtcagatat tgtactcaag cctggtcacg gcagcgtacc gatctgttta 2820 aacctagata ttgatagtct gatcggtcaa cgtataatcg agtcctagct tttgcaaaca 2880 tctatcaaga gacaggatca gcaggaggct ttcgcatgag tattcaacat ttccgtgtcg 2940 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 3000 tgaaagtaaa agatgctgaa gatcagttgg gtgcgcgagt gggttacatc gaactggatc 3060 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgctttcca atgatgagca 3120 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 3180 tcggtcgccg catacactat tctcagaatg acttggttga gtattcacca gtcacagaaa 3240 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 3300 ataacactgc ggccaactta cttctgacaa cgattggagg accgaaggag ctaaccgctt 3360 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 3420 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaaccttgc 3480 gtaaactatt aactggcgaa ctacttactc tagcttcccg gcaacagttg atagactgga 3540 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 3600 ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 3660 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 3720 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaaccga 3780 ttctaggtgc attggcgcag aaaaaaatgc ctgatgcgac gctgcgcgtc ttatactccc 3840 acatatgcca gattcagcaa cggatacggc ttccccaact tgcccacttc catacgtgtc 3900 ctccttacca gaaatttatc cttaagatcc cgaatcgttt aaactcgact ctggctctat 3960 cgaatctccg tcgtttcgag cttacgcgaa cagccgtggc gctcatttgc tcgtcgggca 4020 tcgaatctcg tcagctatcg tcagcttacc tttttggcag cgatcgcggc tcccgacatc 4080 ttggaccatt agctccacag gtatcttctt ccctctagtg gtcataacag cagcttcagc 4140 tacctctcaa ttcaaaaaac ccctcaagac ccgtttagag gccccaaggg gttatgctat 4200 caatcgttgc gttacacaca caaaaaacca acacacatcc atcttcgatg gatagcgatt 4260 ttattatcta actgctgatc gagtgtagcc agatctagta atcaattacg gggtcattag 4320 ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 4380 gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 4440 caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 4500 cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 4560 ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 4620 tctacgtatt agtcatcgct attaccatgc tgatgcggtt ttggcagtac atcaatgggc 4680 gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 4740 gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 4800 tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 4860 tgaaccgtca gatcagatct ttgtcgatcc taccatccac tcgacacacc cgccagcggc 4920 cgc 4923 <210> 563 <211> 140 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 563 accctgacgc atggcgtgca atgttgtcat agttccatga aagccaaaag tggctttgat 60 gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120 ttctccccat ttattttttt 140 <210> 564 <211> 4923 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 564 cgctcatttg ctcgtcgggc atcgaatctc gtcagctatc gtcagcttac ctttttggca 60 gcgatcgcgg ctcccgacat cttggaccat tagctccaca ggtatcttct tccctctagt 120 ggtcataaca gcagcttcag ctacctctca attcaaaaaa cccctcaaga cccgtttaga 180 ggccccaagg ggttatgcta tcaatcgttg cgttacacac acaaaaaacc aacacacatc 240 catcttcgat ggatagcgat tttattatct aactgctgat cgagtgtagc cagatctagt 300 aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 360 cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 420 cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 480 tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta 540 ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg 600 actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg ctgatgcggt 660 tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 720 accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 780 gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 840 atataagcag agctggttta gtgaaccgtc agatcagatc tttgtcgatc ctaccatcca 900 ctcgacacac ccgccagcgg ccgcgccacc atggtgtcta agggcgagga actgttcacc 960 ggcgtggtgc ccatcctggt ggaactggac ggggatgtga acggccacaa gttcagcgtg 1020 tccggcgagg gagagggcga cgccacatac ggcaagctga ccctgaaatt catctgcacc 1080 acaggaaagc tccccgtgcc ttgacctacc ctggtcacca ccctgacgta cggcgtgcaa 1140 tgtttcagcc gctaccccga ccacatgaaa cagcacgact ttttcaaaag cgccatgcct 1200 gagggctacg tgcaagagcg gaccatcttc ttcaaggacg acggaaatta caagaccaga 1260 gccgaggtga agttcgaggg cgacaccctg gtgaatagaa tcgagctgaa gggcatcgac 1320 ttcaaggaag atggcaacat cctgggccac aagctggaat acaactacaa cagccacaac 1380 gtgtacatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatcagacac 1440 aacatcgagg acggcagcgt gcaactggcc gatcattacc agcagaacac ccctatcggc 1500 gatggtcctg tgctgctgcc tgacaaccac tacctgagca cccagagcgc cctgtctaaa 1560 gatcctaacg agaagcggga ccacatggtc ctgctggaat tcgtgaccgc cgctggcata 1620 acactcggca tggacgagct gtacaagtaa ggatccgcag gcctctgcta gcttgactga 1680 ctgagataca gcgtaccttc agctcacaga catgataaga tacattgatg agtttggaca 1740 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1800 tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1860 tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa 1920 atgtggtatt ggcccatctc tatcggtatc gtagcataac cccttggggc ctctaaacgg 1980 gtcttgaggg gttttttgtg cccctcgggc cggattgcta tctaccggca ttggcgcaga 2040 aaaaaatgcc tgatgcgacg ctgcgcgtct tatactccca catatgccag attcagcaac 2100 ggatacggct tccccaactt gcccacttcc atacgtgtcc tccttaccag aaatttatcc 2160 ttaaggtcgt cagctatcct gcaggcgatc tctcgatttc gatcaagaca ttcctttaat 2220 ggtcttttct ggacaccact aggggtcaga agtagttcat caaactttct tccctcccta 2280 atctcattgg ttaccttggg ctatcgaaac ttaattaacc agtcaagtca gctacttggc 2340 gagatcgact tgtctgggtt tcgactacgc tcagaattgc gtcagtcaag ttcgatctgg 2400 tccttgctat tgcacccgtt ctccgattac gagtttcatt taaatcatgt gagcaaaagg 2460 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 2520 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 2580 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 2640 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 2700 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 2760 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 2820 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 2880 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 2940 tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 3000 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 3060 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 3120 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 3180 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 3240 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 3300 gatctgtcta tttcgttcat ccatagttgc atttaaattt ccgaactctc caaggccctc 3360 gtcggaaaat cttcaaacct ttcgtccgat ccatcttgca ggctacctct cgaacgaact 3420 atcgcaagtc tcttggccgg ccttgcgcct tggctattgc ttggcagcgc ctatcgccag 3480 gtattactcc aatcccgaat atccgagatc gggatcaccc gagagaagtt caacctacat 3540 cctcaatccc gatctatccg agatccgagg aatatcgaaa tcggggcgcg cctggtgtac 3600 cgagaacgat cctctcagtg cgagtctcga cgatccatat cgttgcttgg cagtcagcca 3660 gtcggaatcc agcttgggac ccaggaagtc caatcgtcag atattgtact caagcctggt 3720 cacggcagcg taccgatctg tttaaaccta gatattgata gtctgatcgg tcaacgtata 3780 atcgagtcct agcttttgca aacatctatc aagagacagg atcagcagga ggctttcgca 3840 tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 3900 tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcgc 3960 gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 4020 aagaacgctt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 4080 gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 4140 ttgagtattc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 4200 gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgattg 4260 gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 4320 atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 4380 ctgtagcaat ggcaacaacc ttgcgtaaac tattaactgg cgaactactt actctagctt 4440 cccggcaaca gttgatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 4500 cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 4560 gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 4620 cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 4680 cactgattaa gcattggtaa ccgattctag gtgcattggc gcagaaaaaa atgcctgatg 4740 cgacgctgcg cgtcttatac tcccacatat gccagattca gcaacggata cggcttcccc 4800 aacttgccca cttccatacg tgtcctcctt accagaaatt tatccttaag atcccgaatc 4860 gtttaaactc gactctggct ctatcgaatc tccgtcgttt cgagcttacg cgaacagccg 4920 tgg 4923 <210> 565 <211> 2714 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 565 ctccaataac tgtgatccac cacaagcgcc agggttttcc cagtcacgac gttgtaaaac 60 gacggccagt catgcataat ccgcacgcat ctggaataag gaagtgccat tccgcctgac 120 cttgtacaaa aaagcaggct ttaaaggaac caattcagtc gactggatcc ggtaccaagg 180 tcgggcagga agagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 240 ctgttagaga gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata 300 cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 360 tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 420 tgtggaaagg acgaaacacc gcccgtgcct tgacctaccc tggtcagtca tagttccatg 480 aaagccaaaa gtggctttga tgtttctatg ataagggttt cggcccgtgg cgtcggggat 540 cgcctgccca ttccgatggg cttctcccca tttatttttt tctagaccca gctttcttgt 600 acaaagttgg cattaaggct aggtggaggc tcagtgatga taagtctgcg atggtggatg 660 catgtgtcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcag agggcacaat 720 cctattccgc gctatccgac aatctccaag acattaggtg gagttcagtt cggcgtatgg 780 catatgtcgc tggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 840 aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 900 gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 960 ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 1020 cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 1080 cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 1140 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 1200 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 1260 agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 1320 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 1380 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 1440 gatctcaaga agatcctttg atcttttcta cggggtctga cgctctattc aacaaagccg 1500 ccgtcccgtc aagtcagcgt aaatgggtag ggggcttcaa atcgtcctcg tgataccaat 1560 tcggagcctg cttttttgta caaacttgtt gataatggca attcaaggat cttcacctag 1620 atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1680 tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 1740 tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 1800 tctggcccca gtgctgcaat gataccgcga gagccacgct caccggctcc agatttatca 1860 gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 1920 tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 1980 ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 2040 gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 2100 aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 2160 ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 2220 tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 2280 ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 2340 aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 2400 ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 2460 ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 2520 agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 2580 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 2640 ataggggttc cgcgcacatt tccccgaaaa gtgccagata cctgaaacaa aacccatcgt 2700 acggccaagg aagt 2714 <210> 566 <211> 663 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 566 atgggtgaga aaaaaatcac cggatatacc accgttgata tatcccaatg gcatcgtaaa 60 gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg 120 gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt 180 attcacattc ttgcccgcct gatgaatgct catccggaat ttcgtatggc aatgaaagac 240 ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact 300 gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata 360 tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt 420 gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac 480 gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa 540 ggcgacaagg tgctgatgcc gctggcgatt caggttcatc gcgccgtttg tgatggcttc 600 catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg 660 taa 663 <210> 567 <211> 663 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 567 atgggtgaga aaaaaatcac cggatatacc accgttgata tatcccaatg gcatcgtaaa 60 gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg 120 gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt 180 attcacattc ttgcccgcct gatgaatgct catccggaat ttcgtatggc aatgaaagac 240 ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact 300 gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata 360 tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt 420 gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac 480 gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa 540 ggcgacaagg tgctgatgcc gctggcgatt caggttcact acgccgtttg tgatggcttc 600 catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg 660 taa 663 <210> 568 <211> 1368 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 568 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 569 <211> 1368 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 569 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 570 <211> 82 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 570 Thr Asn Leu Ser Asp His Glu Lys Glu Thr Gly Lys Gln Leu Val Ile 1 5 10 15 Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly 20 25 30 Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser 35 40 45 Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys 50 55 60 Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys 65 70 75 80 Met Leu <210> 571 <211> 199 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 571 Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His 1 5 10 15 Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr 20 25 30 Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met 35 40 45 Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys 50 55 60 Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro 65 70 75 80 Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile 85 90 95 Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala 100 105 110 Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg 115 120 125 Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg 130 135 140 Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His 145 150 155 160 Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp 165 170 175 Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala 180 185 190 Ile Leu Gln Asn Gln Gly Asn 195 <210> 572 <211> 164 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 572 Met Lys Thr His Glu Glu Tyr Met Glu Leu Ala Leu Glu Glu Ala Arg 1 5 10 15 Lys Ala Glu Glu Ile Asp Glu Val Pro Val Gly Cys Val Ile Val Cys 20 25 30 Asp Gly Glu Val Ile Ser Arg Gly His Asn Leu Lys Glu Gln Leu Asn 35 40 45 Gln Ala Tyr Ala His Ala Glu Met Met Ala Ile Gln Lys Ala Ala Glu 50 55 60 Val Lys Gly Asn Trp Cys Leu Asn Asp Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Met Met Cys Thr Gly Ile Ile Asn Leu Ser Arg Ile Arg 85 90 95 Thr Val Tyr Tyr Gly Lys Gln Tyr Pro Thr Gly Gly Cys Leu Glu Thr 100 105 110 Val Ile Asp Leu Lys Lys Ile Asn Arg Leu Asn His Tyr Pro Asn Ile 115 120 125 Val Gly Asn Ile Leu Gln Lys Glu Cys Ser Glu Ile Leu Thr Asn Tyr 130 135 140 Phe Arg Lys Lys Arg Glu Ile Ile Lys Glu Lys Lys Gln Lys Asn Lys 145 150 155 160 Ala Asn Ile Gln <210> 573 <211> 154 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 573 Met Leu Glu Asp Phe Met Arg Val Ala Leu Glu Glu Ala Lys Lys Ala 1 5 10 15 Tyr Lys Gln Gly Glu Val Pro Val Gly Ala Val Ile Val Lys Asn Gly 20 25 30 Lys Val Ile Ser Lys Ala His Asn Glu Thr Arg Gln Lys Lys Asn Ala 35 40 45 Val Ala His Ala Glu Ile Leu Ala Ile Asp Lys Ala Cys Lys Lys Leu 50 55 60 Glu Asn Glu Arg Leu Val Asp Thr Glu Met Tyr Val Thr Leu Glu Pro 65 70 75 80 Cys Ala Met Cys Ala Gly Ala Ile Leu Gln Ala Arg Ile Pro Arg Leu 85 90 95 Leu Phe Gly Ala Glu Asn Pro Lys Ala Gly Phe Cys Gly Ser Val Leu 100 105 110 Asp Ile Leu Gln Leu Ser Ala Leu Asn His Arg Val Glu Leu Leu Pro 115 120 125 Pro Val Leu Arg Glu Asp Cys Lys Arg Leu Met Thr Asp Phe Phe Gly 130 135 140 Arg Leu Arg Ala His Ser Asp Ser Glu Glu 145 150 <210> 574 <211> 160 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 574 Met Glu Gln Glu Asn Tyr Met Arg Arg Ala Leu Thr Leu Ala Arg Glu 1 5 10 15 Ala Gly Asp Ala Gly Glu Val Pro Val Gly Cys Val Ile Val Arg Asp 20 25 30 Gly Lys Val Val Gly Glu Gly Arg Asn Arg Arg Glu Glu Leu Thr Ser 35 40 45 Ala Ala Ser His Ala Glu Met Glu Ala Ile Ala Ala Ala Asn Glu Arg 50 55 60 Leu Gly Ser Trp Arg Leu Glu Gly Cys Ala Leu Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Asn Ala Arg Val Ser Lys 85 90 95 Val Phe Tyr Gly Glu Arg Ser Pro Lys Phe Gly Ala Cys Gly Gly Val 100 105 110 Thr Asn Leu Phe Met Glu Asp Phe Pro Asn Arg Pro Ala Leu Val Gly 115 120 125 Gly Val Leu Ala Glu Glu Cys Arg Glu Val Leu Arg Ala Phe Phe Gln 130 135 140 Lys Leu Arg Asn Asp Gly Gly Thr Gly Glu Ser Pro Glu Pro Lys Ile 145 150 155 160 <210> 575 <211> 152 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 575 Met Asp Arg Tyr Met Thr Arg Ala Leu Glu Leu Ala Arg Leu Ala Phe 1 5 10 15 Asp Glu Gly Glu Val Pro Val Gly Ala Val Val Val Lys Lys Thr Thr 20 25 30 Gly Glu Ile Ile Gly Glu Gly Arg Asn Met Arg Glu Gly Ala Lys Asn 35 40 45 Ala Leu Ala His Ala Glu Ile Ile Ala Ile Asp Gln Ala Cys Arg Thr 50 55 60 Leu Gly Gly Trp Arg Leu Pro Glu Cys Ala Ile Tyr Val Thr Leu Glu 65 70 75 80 Pro Cys Pro Met Cys Cys Gly Ala Ile Ile Asn Ala Arg Ile Asp Asn 85 90 95 Val Ile Phe Gly Lys Tyr Leu Leu Glu Ser Gly Ser Ala Ala Ser Val 100 105 110 Gln Lys Met Phe Glu Leu Pro Tyr Asn Tyr Arg Pro Glu Val Thr Gly 115 120 125 Gly Ile Met Glu Gln Glu Cys Ala Asp Ile Leu Ser Glu Phe Phe Arg 130 135 140 Gln Leu Arg Ile Arg Lys Lys Thr 145 150 <210> 576 <211> 155 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 576 Met Glu Asn Asn Asp Glu Lys Phe Met Met Lys Ala Ile Glu Gln Ala 1 5 10 15 Lys Ile Ala Tyr Asp Met Asp Glu Val Pro Val Gly Cys Val Ile Val 20 25 30 Lys Asp Gly Glu Ile Ile Ala Gln Ala Tyr Asn Ser Val Glu Lys Asp 35 40 45 Lys Asn Ala Thr Met His Ala Glu Leu Lys Ala Ile Asn Gln Ala Thr 50 55 60 Glu Phe Ile Gly Asn Phe Arg Leu Asp Asp Cys Ile Met Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Val Met Cys Thr Gly Ala Leu Val Tyr Ser Arg Ile 85 90 95 Pro Lys Val Val Phe Gly Ala Phe Ala Lys Arg Arg Gly Ala Cys Gly 100 105 110 Ser Leu Ile Ser Leu Asn Asp Tyr Glu Gly Leu Asn His Lys Ile Glu 115 120 125 Val Lys Ser Ile Met Glu Lys Glu Cys Val Glu Leu Met Gln Ser Phe 130 135 140 Phe Arg Arg Ile Arg Glu Lys Asn Arg Asn Lys 145 150 155 <210> 577 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 577 Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg 1 5 10 15 Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg 20 25 30 Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys 35 40 45 Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys 50 55 60 Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys 85 90 95 Thr Val Tyr Tyr Gly Gly Pro Ser Leu Arg Ala Gly Ser Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val 115 120 125 Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe 130 135 140 Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln 145 150 155 160 Ala Gln Met Asn Asp Leu Asn Glu Ile 165 <210> 578 <211> 151 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 578 Met Asp Asp Phe Ala Tyr Met Arg Gln Ala Met Glu Leu Ala Glu Gln 1 5 10 15 Ala Ala Ala Leu Gly Glu Ile Pro Val Gly Ala Leu Val Val Gln Asp 20 25 30 Ala Thr Gly Glu Val Leu Gly Arg Gly Tyr Asn Arg Arg Glu Val Asp 35 40 45 His Asp Pro Thr Ala His Ala Glu Val Leu Ala Ile Arg Gln Ala Ala 50 55 60 Leu Ala Ile Gly Ser Trp Arg Leu Ser Gly Cys Thr Leu Tyr Val Thr 65 70 75 80 Leu Glu Pro Cys Pro Met Cys Cys Gly Thr Ile Ile Asn Ala Arg Val 85 90 95 Arg Arg Val Val Phe Gly Ala Tyr Ser Ser Thr Ala Gly Ser Ala Asp 100 105 110 Ser Val Ile Asn Leu Phe Ala Leu Pro Tyr Asn His Lys Pro Ala Val 115 120 125 Thr Gly Gly Leu Leu Glu Asp Ala Cys Lys Glu Gln Leu Gln Arg Phe 130 135 140 Phe Ser Gly Leu Arg Glu Lys 145 150 <210> 579 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 579 Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg 1 5 10 15 Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg 20 25 30 Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys 35 40 45 Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys 50 55 60 Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys 85 90 95 Thr Val Tyr Tyr Gly Ser Pro Gln Leu Gly Ala Gly Ser Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val 115 120 125 Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe 130 135 140 Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln 145 150 155 160 Ala Gln Met Asn Asp Leu Asn Glu Ile 165 <210> 580 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 580 Met Glu Lys Glu Glu Ala Ser Leu Gln Gly Ile His Glu Arg Trp Met 1 5 10 15 Arg Gln Ala Leu Glu Glu Ala Asp Lys Ala Glu Gln Leu Asn Glu Val 20 25 30 Pro Ile Gly Ala Ile Ile Val Lys Asp Gln Gln Ile Ile Gly Arg Gly 35 40 45 Tyr Asn Val Arg Glu Thr Gln His Gln Ala Thr Gly His Ala Glu Ile 50 55 60 Gln Ala Ile Glu Asp Ala Asn Arg His Gln Gln Ala Trp Arg Leu Glu 65 70 75 80 Gly Ala Thr Met Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly 85 90 95 Ala Leu Ile Asn Ser Arg Ile Gln Thr Val Val Tyr Gly Ala Ser Gly 100 105 110 Leu Lys Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu Gln Asp Asp 115 120 125 Arg Phe Asn His Gln Val Glu Val Ile Ser Gly Val Leu Ala Glu Glu 130 135 140 Cys Gly Asp Lys Leu Ser Tyr Phe Phe Arg Lys Leu Arg Gln Arg Lys 145 150 155 160 Gly Lys Asn Ile Asp Arg Ala Glu 165 <210> 581 <211> 158 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 581 Met Thr Arg Asp Glu Met Tyr Met Arg Lys Ala Leu Glu Leu Ala Ala 1 5 10 15 Leu Ala Ala Asp Glu Asp Glu Val Pro Val Gly Ala Val Val Val Lys 20 25 30 Lys Ser Thr Gly Glu Ile Val Gly Arg Gly Phe Asn Arg Arg Glu Tyr 35 40 45 Gly Arg Ser Pro Leu Thr His Ala Glu Ile Val Ala Ile Asp Glu Ala 50 55 60 Ser Arg Lys Leu Gly Gly Trp Arg Leu Ile Asp Cys Glu Leu Phe Val 65 70 75 80 Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val Ile Asn Ser Arg 85 90 95 Val Glu Arg Val Val Phe Gly Gln Tyr Gly Lys Arg Ala Gly Ser Cys 100 105 110 Gly Ser Val Val Asp Leu Phe Gly Leu Pro Tyr Asn His Lys Pro Glu 115 120 125 Cys Ile Gly Gly Val Leu Glu Glu Glu Cys Ala Ala Val Leu Thr Glu 130 135 140 Phe Phe Lys Gly Leu Arg Lys Arg Lys Val Lys Val Asn Glu 145 150 155 <210> 582 <211> 164 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 582 Met Lys Thr His Glu Glu Tyr Met Glu Leu Ala Leu Glu Glu Ala Arg 1 5 10 15 Lys Ala Glu Glu Ile Asp Glu Val Pro Val Gly Cys Val Ile Val Cys 20 25 30 Asp Gly Glu Val Ile Ser Arg Gly His Asn Leu Lys Glu Gln Leu Asn 35 40 45 Gln Ala Tyr Ala His Ala Glu Met Met Ala Ile Gln Lys Ala Ala Glu 50 55 60 Val Lys Gly Asn Trp Cys Leu Asn Asp Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Met Met Cys Thr Gly Ile Ile Asn Leu Ser Arg Ile Arg 85 90 95 Thr Val Tyr Tyr Gly Arg Gln Trp Pro Glu Gly Gly Cys Leu Glu Thr 100 105 110 Val Ile Asp Leu Lys Lys Ile Asn Arg Leu Asn His Tyr Pro Asn Ile 115 120 125 Val Gly Asn Ile Leu Gln Lys Glu Cys Ser Glu Ile Leu Thr Asn Tyr 130 135 140 Phe Arg Lys Lys Arg Glu Ile Ile Lys Glu Lys Lys Gln Lys Asn Lys 145 150 155 160 Ala Asn Ile Gln <210> 583 <211> 169 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 583 Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg 1 5 10 15 Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg 20 25 30 Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys 35 40 45 Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys 50 55 60 Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys 85 90 95 Thr Val Tyr Tyr Gly Ala Pro Arg Leu Ser Ala Gly Ser Cys Gly Ser 100 105 110 Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val 115 120 125 Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe 130 135 140 Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln 145 150 155 160 Ala Gln Met Asn Asp Leu Asn Glu Ile 165 <210> 584 <211> 168 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 584 Met Glu Lys Glu Glu Ala Ser Leu Gln Gly Ile His Glu Arg Trp Met 1 5 10 15 Arg Gln Ala Leu Glu Glu Ala Asp Lys Ala Glu Gln Leu Asn Glu Val 20 25 30 Pro Ile Gly Ala Ile Ile Val Lys Asp Gln Gln Ile Ile Gly Arg Gly 35 40 45 Tyr Asn Val Arg Glu Thr Gln His Gln Ala Thr Gly His Ala Glu Ile 50 55 60 Gln Ala Ile Glu Asp Ala Asn Arg His Gln Gln Ala Trp Arg Leu Glu 65 70 75 80 Gly Ala Thr Met Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly 85 90 95 Ala Leu Ile Asn Ser Arg Ile Gln Thr Val Val Tyr Gly Phe Ser Ser 100 105 110 Leu Thr Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu Gln Asp Asp 115 120 125 Arg Phe Asn His Gln Val Glu Val Ile Ser Gly Val Leu Ala Glu Glu 130 135 140 Cys Gly Asp Lys Leu Ser Tyr Phe Phe Arg Lys Leu Arg Gln Arg Lys 145 150 155 160 Gly Lys Asn Ile Asp Arg Ala Glu 165 <210> 585 <211> 150 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> SITE <222> (1)..(150) <223> /note="This sequence may encompass 1-30 'Gly Gly Gly Gly Ser' repeating units" <400> 585 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 50 55 60 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 85 90 95 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 100 105 110 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser 145 150 <210> 586 <211> 30 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> SITE <222> (1)..(30) <223> /note="This sequence may encompass 1-30 residues" <400> 586 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 1 5 10 15 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 20 25 30 <210> 587 <211> 150 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> SITE <222> (1)..(150) <223> /note="This sequence may encompass 1-30 'Glu Ala Ala Ala Lys' repeating units" <400> 587 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 1 5 10 15 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 20 25 30 Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala 35 40 45 Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 50 55 60 Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys 65 70 75 80 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 85 90 95 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 100 105 110 Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala 115 120 125 Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 130 135 140 Lys Glu Ala Ala Ala Lys 145 150 <210> 588 <211> 60 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> SITE <222> (1)..(60) <223> /note="This sequence may encompass 1-30 'Xaa Pro' repeating units" <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (13)..(13) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(17) <223> Any amino acid <220> <221> MOD_RES <222> (19)..(19) <223> Any amino acid <220> <221> MOD_RES <222> (21)..(21) <223> Any amino acid <220> <221> MOD_RES <222> (23)..(23) <223> Any amino acid <220> <221> MOD_RES <222> (25)..(25) <223> Any amino acid <220> <221> MOD_RES <222> (27)..(27) <223> Any amino acid <220> <221> MOD_RES <222> (29)..(29) <223> Any amino acid <220> <221> MOD_RES <222> (31)..(31) <223> Any amino acid <220> <221> MOD_RES <222> (33)..(33) <223> Any amino acid <220> <221> MOD_RES <222> (35)..(35) <223> Any amino acid <220> <221> MOD_RES <222> (37)..(37) <223> Any amino acid <220> <221> MOD_RES <222> (39)..(39) <223> Any amino acid <220> <221> MOD_RES <222> (41)..(41) <223> Any amino acid <220> <221> MOD_RES <222> (43)..(43) <223> Any amino acid <220> <221> MOD_RES <222> (45)..(45) <223> Any amino acid <220> <221> MOD_RES <222> (47)..(47) <223> Any amino acid <220> <221> MOD_RES <222> (49)..(49) <223> Any amino acid <220> <221> MOD_RES <222> (51)..(51) <223> Any amino acid <220> <221> MOD_RES <222> (53)..(53) <223> Any amino acid <220> <221> MOD_RES <222> (55)..(55) <223> Any amino acid <220> <221> MOD_RES <222> (57)..(57) <223> Any amino acid <220> <221> MOD_RES <222> (59)..(59) <223> Any amino acid <400> 588 Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro 1 5 10 15 Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro 20 25 30 Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro 35 40 45 Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro 50 55 60 <210> 589 <211> 36 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (4)..(29) <223> Any amino acid <220> <221> SITE <222> (4)..(29) <223> /note="This region may encompass 23-26 residues" <220> <221> MOD_RES <222> (32)..(35) <223> Any amino acid <220> <221> SITE <222> (32)..(35) <223> /note="This region may encompass 2-4 residues" <400> 589 His Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Cys Xaa 20 25 30 Xaa Xaa Xaa Cys 35 <210> 590 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 590 Gly Gly Gly Gly Ser 1 5 <210> 591 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 591 Glu Ala Ala Ala Lys 1 5 <210> 592 <211> 80 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> SITE <222> (1)..(80) <223> /note="This sequence may encompass 1-20 'Ser Gly Gly Ser' repeating units" <400> 592 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 1 5 10 15 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 35 40 45 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 65 70 75 80 <210> 593 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 6xHis tag" <400> 593 His His His His His His 1 5 <210> 594 <211> 10 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 10xHis tag" <400> 594 His His His His His His His His His His 1 5 10 <210> 595 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 595 gtctgattgc ctgtcgttgc ccctcccaag gagttggcag a 41 <210> 596 <211> 69 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 596 gtctgattgc ctgtcgttgc ccctaagtgt attaagcatt gtctcagaga ttttggagga 60 gttggcaga 69 <210> 597 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 597 gtctgattgc ctgtcgttgc ccctggagga gttggcaga 39 <210> 598 <211> 47 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 598 gtctgattgc ctgtcgttgc ccctcccaga tcggaggagt tggcaga 47 <210> 599 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 599 gtctgattgc ctgtcgttgc ccctcccaga taggagttgg caga 44 <210> 600 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 600 gtctgattgc ctgtcgttgc ccatctggga gttggcaga 39 <210> 601 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 601 gtctgattgc ctgtcgttgc ccctctggag gagttggcag a 41 <210> 602 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 602 gtctgattgg aggagttggc aga 23 <210> 603 <211> 40 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 603 gtctgattgc ctgtcgttgc ccctcggagg agttggcaga 40 <210> 604 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 604 gtctgattgc ctgtcgttgc ccctccagga ggagttggca ga 42 <210> 605 <211> 34 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 605 gtctgattgc ctgtcgttgc ccggagttgg caga 34 <210> 606 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 606 gtctgattgc ctgtcgttgc ccatcatgga ggagttggca ga 42 <210> 607 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 607 gtctgattgc ctgtcgttgc ccctccatgg aggagttggc aga 43 <210> 608 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 608 gtctgattgc ctgtcgttgc ccctcccagt act 33 <210> 609 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 609 gtctgattgc ctgtcgttgc cccaatcttg gaggagttgg caga 44 <210> 610 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 610 gtctgattgc ctgtcgttgc cctgggatgg aggagttggc aga 43 <210> 611 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 611 gtctgattgc ctgtcgttgc ccctcagttg gcaga 35 <210> 612 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 612 gtctgattgc ctgtcgttgc ccctcatgga ggagttggca ga 42 <210> 613 <211> 53 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> VARIANT <222> (1)..(1) <223> /replace="His" or "Cys" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (4)..(48) <223> Any amino acid <220> <221> SITE <222> (4)..(48) <223> /note="This region may encompass 15-45 residues" <220> <221> MOD_RES <222> (51)..(52) <223> Any amino acid <220> <221> SITE <222> (1)..(53) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 613 Asp Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 20 25 30 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 35 40 45 Pro Cys Xaa Xaa Cys 50 <210> 614 <211> 4 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 614 Glu Glu Gln Leu 1 <210> 615 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 615 Ala Glu Val Ser Gln Ala 1 5 <210> 616 <211> 4 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 616 Gly Glu Gln Leu 1 <210> 617 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 617 Ala Glu Val Ser Lys Ala 1 5

Claims (45)

  1. RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
    상기 RGN 폴리펩티드는 표적 DNA 서열과 혼성화할 수 있는 가이드 RNA (gRNA)에 결합할 때 RNA-가이드된 서열 특이적인 방식으로 상기 표적 DNA 서열에 결합하고,
    RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
  2. 제1항에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 핵산 분자.
  3. 제2항에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
  4. 제1항 내지 제3항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
  5. 제4항에 있어서, 상기 벡터가 상기 가이드 RNA를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하고, 가이드 RNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 CRISPR 반복 서열을 포함하는 CRISPR RNA를 포함하는 것인 벡터.
  6. 제4항 또는 제5항에 있어서, 가이드 RNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 tracrRNA를 포함하는 것인 벡터.
  7. 제1항 내지 제3항 중 어느 한 항의 핵산 분자 또는 제4항 내지 제6항 중 어느 한 항의 벡터를 포함하는 세포.
  8. CRISPR RNA (crRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 crRNA는 스페이서 서열 및 CRISPR 반복 서열을 포함하고, 상기 CRISPR 반복 서열은 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고;
    a) 상기 crRNA; 및
    b) 상기 crRNA의 상기 CRISPR 반복 서열에 혼성화된 트랜스-활성화 CRISPR RNA (tracrRNA)
    를 포함하는 가이드 RNA는
    상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드에 결합할 때, 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열에 혼성화할 수 있고,
    crRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
  9. 제8항의 핵산 분자를 포함하는 벡터.
  10. 제9항에 있어서, 상기 벡터가 상기 tracrRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
  11. 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 트랜스-활성화 CRISPR RNA (tracrRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며;
    a) 상기 tracrRNA; 및
    b) 스페이서 서열 및 CRISPR 반복 서열을 포함하는 crRNA
    - 상기 tracrRNA는 상기 crRNA의 상기 CRISPR 반복 서열과 혼성화함
    를 포함하는 가이드 RNA는
    상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드에 결합할 때, 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열에 혼성화할 수 있고,
    tracrRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
  12. 제11항의 핵산 분자를 포함하는 벡터.
  13. 제12항에 있어서, 상기 벡터가 상기 crRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
  14. 표적 DNA 서열에 결합하기 위한 시스템이며, 상기 시스템은
    a) 상기 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
    b) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열
    을 포함하고;
    하나 이상의 가이드 RNA를 코딩하고 RGN 폴리펩티드를 코딩하는 상기 뉴클레오티드 서열 각각은 상기 각각의 뉴클레오티드 서열에 대해 이종성인 프로모터에 작동가능하게 연결되고;
    하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하고,
    하나 이상의 가이드 RNA는 RGN 폴리펩티드와 복합체를 형성하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 시스템.
  15. 제14항에 있어서, 표적 DNA 서열이 진핵생물 세포 내에 있는 것인 시스템.
  16. 제14항 또는 제15항에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하고, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 시스템.
  17. 제14항 또는 제15항에 있어서, 상기 시스템이 하나 이상의 공여자 폴리뉴클레오티드, 또는 하나 이상의 공여자 폴리뉴클레오티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 추가로 포함하고, 하나 이상의 공여자 폴리뉴클레오티드를 코딩하는 상기 뉴클레오티드 서열 각각이 상기 각각의 뉴클레오티드 서열에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 시스템.
  18. 제14항 내지 제17항 중 어느 한 항에 따른 시스템을 표적 DNA 서열 또는 표적 DNA 서열을 포함하는 세포에 전달하는 것을 포함하는, 표적 DNA 서열에 결합시키는 방법.
  19. 표적 DNA 서열을
    a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드 - 여기서 상기 RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함함;
    b) (a)의 RGN을 표적 DNA 서열에 표적화시킬 수 있는 하나 이상의 가이드 RNA
    와 접촉시키는 것을 포함하며;
    하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하고, 상기 표적 DNA 서열의 절단 및/또는 변형이 일어나는 것인, 표적 DNA 서열을 절단하고/거나 변형시키는 방법.
  20. 제19항에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로부터 적어도 하나의 뉴클레오티드의 결실 또는 돌연변이를 포함하는 것인 방법.
  21. 제19항 또는 제20항에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하고, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 방법.
  22. 제19항에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로의 이종성 DNA의 삽입을 포함하는 것인 방법.
  23. 제19항 내지 제22항 중 어느 한 항에 있어서, 표적 DNA 서열이 세포 내에 있는 것인 방법.
  24. 제23항에 있어서, 세포가 진핵생물 세포인 방법.
  25. 제23항 또는 제24항에 있어서, RGN 폴리펩티드가 발현되고 표적 DNA 서열을 절단하여 변형된 DNA 서열을 생성하는 조건하에 세포를 배양하고; 상기 변형된 DNA 서열을 포함하는 세포를 선택하는 것을 추가로 포함하는 방법.
  26. 제25항의 방법에 따른 변형된 표적 DNA 서열을 포함하는 세포.
  27. 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
    상기 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키고;
    데아미나제 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
  28. 제27항에 있어서, 상기 데아미나제 폴리펩티드가 상기 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 RNA-가이드된 뉴클레아제 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
  29. 제28항에 있어서, 상기 RNA-가이드된 뉴클레아제 폴리펩티드가 닉카제인 핵산 분자.
  30. 제27항 내지 제29항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
  31. 제27항 내지 제29항 중 어느 한 항의 핵산 분자 또는 제30항의 벡터를 포함하는 세포.
  32. 아데노신 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고:
    a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
    b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
    d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
    e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
    g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
    h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
    j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
    k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
    n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키고;
    아데노신 데아미나제 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
  33. 제32항에 있어서, 상기 아데노신 데아미나제 폴리펩티드가 상기 아데노신 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 RNA-가이드된 뉴클레아제 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
  34. 제33항에 있어서, 상기 RNA-가이드된 뉴클레아제 폴리펩티드가 닉카제인 핵산 분자.
  35. 제32항 내지 제34항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
  36. 제31항 내지 제33항 중 어느 한 항의 핵산 분자 또는 제35항의 벡터를 포함하는 세포.
  37. 하기를 포함하는 융합 단백질이며:
    a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
    b) 데아미나제 폴리펩티드,
    상기 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 융합 단백질.
  38. 제37항에 있어서, DNA-결합 폴리펩티드가 닉카제 활성을 갖는 RNA-가이드된 뉴클레아제인 융합 단백질.
  39. 하기를 포함하는 융합 단백질이며:
    a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
    b) 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드:
    i) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
    ii) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    iii) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
    iv) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
    v) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    vi) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
    vii) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
    viii) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    ix) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
    x) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
    xi) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    xii) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    xiii) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
    xiv) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 융합 단백질.
  40. 제39항에 있어서, DNA-결합 폴리펩티드가 닉카제 활성을 갖는 RNA-가이드된 뉴클레아제인 융합 단백질.
  41. 하기를 포함하는, 표적 폴리뉴클레오티드 서열을 변형시키기 위한 시스템이며:
    a) 상기 표적 폴리뉴클레오티드 서열에 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
    b) 제37항 내지 제40항 중 어느 한 항의 융합 단백질, 또는 상기 융합 단백질을 코딩하는 뉴클레오티드 서열;
    하나 이상의 가이드 RNA를 코딩하고 융합 단백질을 코딩하는 상기 뉴클레오티드 서열 각각은 상기 뉴클레오티드 서열에 대해 이종성인 프로모터에 대해 작동가능하게 연결되고;
    하나 이상의 가이드 RNA는 표적 폴리뉴클레오티드 서열에 혼성화하고,
    하나 이상의 가이드 RNA는 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열에 결합하여 그를 변형시키도록 지시하는 것인 시스템.
  42. 표적 폴리뉴클레오티드를 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 탈아미노화시키는 방법이며, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
  43. 표적 폴리뉴클레오티드를 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 방법이며:
    a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
    b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
    d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
    e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
    g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
    h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
    j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
    k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
    m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
    n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
    상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 방법.
  44. 표적 폴리뉴클레오티드를 제37항 또는 제39항의 융합 단백질과 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며, 상기 DNA-결합 폴리펩티드는 상기 표적 폴리뉴클레오티드에 결합하고, 상기 데아미나제는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
  45. 표적 폴리뉴클레오티드를 제38항 또는 제40항의 융합 단백질과 접촉시키고, 하나 이상의 가이드 RNA (gRNA), 또는 하나 이상의 gRNA를 코딩하는 하나 이상의 뉴클레오티드 서열을 도입시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며;
    하나 이상의 gRNA는 상기 표적 폴리뉴클레오티드에 혼성화하고, 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열에 결합하도록 지시하고, 융합 단백질의 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시켜, 상기 표적 폴리뉴클레오티드를 변형시키는 것인 방법.
KR1020217023648A 2018-12-27 2019-12-20 유전자 편집에 유용한 폴리펩티드 및 사용 방법 KR20210149686A (ko)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US201862785391P 2018-12-27 2018-12-27
US62/785,391 2018-12-27
US201962790261P 2019-01-09 2019-01-09
US201962790258P 2019-01-09 2019-01-09
US201962790256P 2019-01-09 2019-01-09
US201962790262P 2019-01-09 2019-01-09
US201962790266P 2019-01-09 2019-01-09
US62/790,256 2019-01-09
US62/790,262 2019-01-09
US62/790,266 2019-01-09
US62/790,258 2019-01-09
US62/790,261 2019-01-09
US201962932169P 2019-11-07 2019-11-07
US62/932,169 2019-11-07
PCT/US2019/068079 WO2020139783A2 (en) 2018-12-27 2019-12-20 Polypeptides useful for gene editing and methods of use

Publications (1)

Publication Number Publication Date
KR20210149686A true KR20210149686A (ko) 2021-12-09

Family

ID=69182752

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217023648A KR20210149686A (ko) 2018-12-27 2019-12-20 유전자 편집에 유용한 폴리펩티드 및 사용 방법

Country Status (13)

Country Link
US (2) US20220145296A1 (ko)
EP (2) EP4339286A2 (ko)
JP (2) JP2022516130A (ko)
KR (1) KR20210149686A (ko)
CN (1) CN113631704A (ko)
AU (1) AU2019416108A1 (ko)
BR (1) BR112021012665A2 (ko)
ES (1) ES2970169T3 (ko)
IL (1) IL284400A (ko)
MX (1) MX2021007835A (ko)
SG (1) SG11202106977PA (ko)
TW (1) TW202039847A (ko)
WO (1) WO2020139783A2 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202208626A (zh) 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法
CA3174356A1 (en) 2020-07-01 2022-01-06 Santosh NARAYAN Compositions and methods for cellular reprogramming using circular rna
JP2023534693A (ja) 2020-07-15 2023-08-10 ライフエディット セラピューティクス,インコーポレイティド ウラシル安定化タンパク質並びにその活性断片及びバリアント並びに使用方法
TW202227624A (zh) 2020-09-11 2022-07-16 美商生命編輯治療學公司 Dna修飾酶及活性片段,及其變異體與使用方法
CN117295817A (zh) 2021-03-22 2023-12-26 生命编辑制药股份有限公司 Dna修饰酶及其活性片段和变体以及使用方法
EP4101928A1 (en) * 2021-06-11 2022-12-14 Bayer AG Type v rna programmable endonuclease systems
AU2022290382A1 (en) * 2021-06-11 2023-11-23 Bayer Aktiengesellschaft Type v rna programmable endonuclease systems
WO2022261394A1 (en) 2021-06-11 2022-12-15 LifeEDIT Therapeutics, Inc. Rna polymerase iii promoters and methods of use
AU2022336615A1 (en) 2021-09-02 2024-04-11 Sanofi Compositions and methods for rna affinity purification
CA3234107A1 (en) 2021-10-05 2023-04-13 Florent PERAL Methods for freezing and freeze-drying lipid nanoparticles (lnps) and lnps obtained with the same
WO2023118068A1 (en) * 2021-12-23 2023-06-29 Bayer Aktiengesellschaft Novel small type v rna programmable endonuclease systems
WO2023135305A1 (en) 2022-01-17 2023-07-20 Sanofi Lipidic compounds, and uses thereof
WO2023141602A2 (en) 2022-01-21 2023-07-27 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2023242425A1 (en) 2022-06-17 2023-12-21 Sanofi Compositions and methods for circular rna affinity purification
WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024033901A1 (en) 2022-08-12 2024-02-15 LifeEDIT Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024044723A1 (en) 2022-08-25 2024-02-29 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4196265A (en) 1977-06-15 1980-04-01 The Wistar Institute Method of producing antibodies
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4853331A (en) 1985-08-16 1989-08-01 Mycogen Corporation Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US5039523A (en) 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
KR920701453A (ko) 1989-03-17 1992-08-11 미리엄 디. 멕코나헤이 유전자발현의 외부조절
ATE225853T1 (de) 1990-04-12 2002-10-15 Syngenta Participations Ag Gewebe-spezifische promotoren
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
CA2051562C (en) 1990-10-12 2003-12-02 Jewel M. Payne Bacillus thuringiensis isolates active against dipteran pests
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
DE69230290T2 (de) 1991-08-27 2000-07-20 Novartis Ag Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz
TW261517B (ko) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
CA2315546C (en) 1998-02-26 2008-04-29 Pioneer Hi-Bred International, Inc. Constitutive maize promoters
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
CA2371442A1 (en) 1999-05-04 2000-11-09 Monsanto Technology Llc Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants
US6593293B1 (en) 1999-09-15 2003-07-15 Monsanto Technology, Llc Lepidopteran-active Bacillus thuringiensis δ-endotoxin compositions and methods of use
AU2002360291A1 (en) 2001-12-17 2003-06-30 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use
WO2005066202A2 (en) 2003-12-22 2005-07-21 E.I. Du Pont De Nemours And Company Bacillus cry9 family members
BRPI0713646B1 (pt) 2006-06-14 2017-11-21 Athenix Corporation Nucleic acid molecule; vector; hospedeira cell; polipeptídeo with pesticide activity and method for their production; composition; method for obtaining a plant, as well as methods for control of pest populations; to exterminate a plague of lepidópteros or coleópteros; to protect a plant of a nematode prague
DK2334794T3 (en) 2008-09-15 2017-02-20 Children's Medical Center Corp MODULATION OF BCL11A FOR TREATMENT OF HEMOGLOBINOPATHIES
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
RS55550B1 (sr) 2009-07-02 2017-05-31 Athenix Corp Axmi-205 pesticidni gen i postupci za njegovu upotrebu
WO2011084324A2 (en) 2009-12-21 2011-07-14 Pioneer Hi-Bred International, Inc. Novel bacillus thuringiensis gene with lepidopteran activity
CN103154247A (zh) 2010-08-19 2013-06-12 先锋国际良种公司 对鳞翅目昆虫具有活性的新苏云金杆菌基因
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
MA37663B1 (fr) 2012-05-25 2019-12-31 Univ California Procédés et compositions permettant la modification de l'adn cible dirigée par l'arn et la modulation de la transcription dirigée par l'arn
ES2813080T3 (es) 2012-07-11 2021-03-22 Sangamo Therapeutics Inc Métodos y composiciones para el tratamiento de enfermedades por almacenamiento lisosomal
KR20150105634A (ko) * 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
US10450584B2 (en) 2014-08-28 2019-10-22 North Carolina State University Cas9 proteins and guiding features for DNA targeting and genome editing
AU2015101792A4 (en) * 2014-12-24 2016-01-28 Massachusetts Institute Of Technology Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CA3000917A1 (en) * 2015-10-09 2017-04-13 Monsanto Technology Llc Rna-guided nucleases and uses thereof
JP7067793B2 (ja) 2015-10-23 2022-05-16 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸塩基編集因子およびその使用
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
CN109957569B (zh) * 2017-12-22 2022-10-25 苏州齐禾生科生物科技有限公司 基于cpf1蛋白的碱基编辑系统和方法

Also Published As

Publication number Publication date
US20230272398A1 (en) 2023-08-31
AU2019416108A1 (en) 2021-08-12
CN113631704A (zh) 2021-11-09
ES2970169T3 (es) 2024-05-27
US20220145296A1 (en) 2022-05-12
BR112021012665A2 (pt) 2021-11-03
WO2020139783A3 (en) 2020-07-23
SG11202106977PA (en) 2021-07-29
JP2022516130A (ja) 2022-02-24
TW202039847A (zh) 2020-11-01
MX2021007835A (es) 2021-08-11
EP3902911A2 (en) 2021-11-03
EP3902911C0 (en) 2023-12-13
EP3902911B1 (en) 2023-12-13
JP2024050676A (ja) 2024-04-10
WO2020139783A2 (en) 2020-07-02
EP4339286A2 (en) 2024-03-20
IL284400A (en) 2021-08-31

Similar Documents

Publication Publication Date Title
KR20210149686A (ko) 유전자 편집에 유용한 폴리펩티드 및 사용 방법
US11162114B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
JP2021166513A (ja) 配列操作のためのCRISPR−Cas成分系、方法および組成物
KR20150107739A (ko) 유전자 산물의 발현의 변경을 위한 crispr―cas 시스템 및 방법
KR20160034901A (ko) 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물
KR20220062289A (ko) Rna-가이드된 뉴클레아제 및 그의 활성 단편 및 변이체 및 사용 방법
US11859181B2 (en) RNA-guided nucleases and active fragments and variants thereof and methods of use
CA3125175A1 (en) Polypeptides useful for gene editing and methods of use
TW202346583A (zh) Rna引導核酸酶、其活性片段與變體,及使用方法
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
AU2021254373A1 (en) Genome engineering method and genome engineering kit

Legal Events

Date Code Title Description
A201 Request for examination