KR20210149686A - 유전자 편집에 유용한 폴리펩티드 및 사용 방법 - Google Patents
유전자 편집에 유용한 폴리펩티드 및 사용 방법 Download PDFInfo
- Publication number
- KR20210149686A KR20210149686A KR1020217023648A KR20217023648A KR20210149686A KR 20210149686 A KR20210149686 A KR 20210149686A KR 1020217023648 A KR1020217023648 A KR 1020217023648A KR 20217023648 A KR20217023648 A KR 20217023648A KR 20210149686 A KR20210149686 A KR 20210149686A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- sequence
- position corresponding
- polypeptide
- amino acid
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
관심 표적 서열에 결합하기 위한 조성물 및 방법이 제공된다. 조성물은 DNA 결합 단백질 또는 단백질 도메인과 핵산 변형 단백질 또는 단백질 도메인 사이의 융합 단백질을 포함한다. 조성물은 관심 표적 서열의 절단 또는 변형, 관심 표적 서열의 가시화, 및 관심 서열의 발현의 변형에 사용된다. 조성물은 RNA-가이드된 뉴클레아제 폴리펩티드, CRISPR RNA, 트랜스-활성화 CRISPR RNA, 가이드 RNA, 데아미나제, 및 이를 코딩하는 핵산 분자를 포함한다. 핵산 분자를 포함하는 벡터 및 숙주 세포 또한 제공된다. 관심 표적 서열에 결합시키기 위한 CRISPR 시스템이 추가로 제공되며, CRISPR 시스템은 RNA-가이드된 뉴클레아제 폴리펩티드 및 하나 이상의 가이드 RNA를 포함한다. DNA-결합 폴리펩티드에 융합될 수 있고 유전자 편집에 유용할 수 있는 데아미나제 또한 제공된다.
Description
본 발명은 분자 생물학 및 유전자 편집 분야에 관한 것이다.
표적화된 게놈 편집 또는 변형은 기본 및 응용 연구를 위한 중요한 도구가 되고 있다. 초기 방법은 뉴클레아제, 예컨대 메가뉴클레아제, 아연 핑거 융합 단백질 또는 TALEN의 조작을 수반하였고, 각각의 특정한 표적 서열에 대해 특이적인 조작된, 프로그래밍가능한, 서열-특이적인 DNA-결합 도메인을 갖는 키메라 뉴클레아제의 생성을 필요로 한다. RNA-가이드된 뉴클레아제 (RGN), 예컨대 CRISPR-cas 박테리아 시스템의 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR)-연관된 (cas) 단백질은 특정한 표적 서열과 특이적으로 혼성화하는 가이드 RNA와 뉴클레아제를 복합체화시킴으로써 특이적인 서열의 표적화를 가능하게 한다. 표적-특이적인 가이드 RNA의 생성은 각각의 표적 서열에 대한 키메라 뉴클레아제를 생성하는 것에 비해 비용이 적게 들고 더 효율적이다. 이러한 RNA-가이드된 뉴클레아제를 사용하여, 오류가 발생하기 쉬운 비상동성 말단-연결 (NHEJ)을 통해 복구되는 서열-특이적인 이중 가닥 파손에 의해 게놈을 편집하여, 특이적인 게놈 위치에 돌연변이를 도입시킬 수 있다. 대안적으로, 이종성 DNA는 상동성-지정된 복구를 통해 게놈 부위에 도입될 수 있다.
추가로, RGN은 DNA 편집 접근법에서 유용하다. 핵산 서열의 표적화된 편집, 예를 들어 게놈 DNA로 특이적인 변형의 도입을 가능하게 하는 표적화된 절단은 유전자 기능 및 유전자 발현을 연구하기 위한 고도로 미묘한 접근을 가능하게 한다. 이러한 표적화된 편집은 또한 인간에서 유전 질환을 표적화하기 위해 또는 농작물의 게놈에서 농경학적으로 유익한 돌연변이를 도입시키기 위해 배치될 수 있다. 게놈 편집 도구의 발달은 유전자 편집-기반 포유동물 치료제 및 농업 생명공학에 대한 새로운 접근법을 제공한다.
관심 표적 핵산 서열에 결합시키기 위한 조성물 및 방법이 제공된다. 조성물은 관심 표적 서열의 절단 또는 변형, 관심 표적 서열의 검출, 및 관심 서열의 발현의 변형에 사용될 수 있다. 조성물은 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드 및 그의 변이체, CRISPR RNA (crRNA), 트랜스-활성화 CRISPR RNA (tracrRNA), 가이드 RNA (gRNA), 데아미나제 폴리펩티드, 이를 코딩하는 핵산 분자, 및 핵산 분자를 포함하는 벡터 및 숙주 세포를 포함한다. 관심 표적 서열과 결합하기 위한 CRISPR 시스템 또한 제공되며, CRISPR 시스템은 RNA-가이드된 뉴클레아제 폴리펩티드 및 하나 이상의 가이드 RNA를 포함한다. RNA-가이드된 DNA 결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 폴리펩티드 또한 제공된다. 본원에 개시된 방법은 관심 표적 핵산 서열의 결합, 일부 실시양태에서, 관심 표적 핵산 서열의 절단 또는 변형을 위해 도출된다. 관심 표적 서열은 예를 들어 도입된 공여자 서열에 의한 비상동성 말단 결합 또는 상동성-지정된 복구의 결과로서, 또는 염기 편집의 결과로서 변형될 수 있다.
본 발명의 여러 변형 및 다른 실시양태는 관련 기술분야의 기술자에 의해 이들 발명이 상기 설명 및 관련된 도면에 제시된 교시내용의 이익을 갖는 것으로 고려될 것이다. 따라서, 본 발명이 개시된 구체적인 실시양태로 제한되지 않고, 변형 및 다른 실시양태가 첨부된 실시양태의 범위 내에 포함되는 것으로 의도됨을 이해해야 한다. 특정한 용어들이 본원에서 사용되지만, 이들은 단지 일반적이고 설명적인 의미로만 사용되고, 제한하려는 목적이 아니다.
I. 개요
RNA-가이드된 뉴클레아제 (RGN)는 게놈 내의 단일 부위의 표적화된 조작을 가능하게 하고, 치료 및 연구 적용을 위해 유전자 표적화의 맥락에서 유용하다. 포유동물을 비롯한 다양한 유기체에서, RNA-가이드된 뉴클레아제는 예를 들어 비상동성 말단 결합 및 상동성 재조합을 자극함으로써 게놈 조작에 사용되었다. 본원에 기재된 조성물 및 방법은 폴리뉴클레오티드에서 단일 또는 이중 가닥 파손을 생성하거나, 폴리뉴클레오티드를 변형시키거나, 폴리뉴클레오티드 내의 특정한 부위를 검출하거나, 또는 특정한 유전자의 발현을 변형시키는데 유용하다.
본원에 개시된 RNA-가이드된 뉴클레아제는 표적 서열을 변형시킴으로써 유전자 발현을 변경시킬 수 있다. 구체적인 실시양태에서, RNA-가이드된 뉴클레아제는 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) RNA-가이드된 뉴클레아제 시스템의 일부로서 가이드 RNA (gRNA 또는 sgRNA로도 지칭됨)에 의해 표적 서열로 지시된다. 가이드 RNA는 RNA-가이드된 뉴클레아제와 복합체를 형성하여 RNA-가이드된 뉴클레아제가 표적 서열과 결합하도록, 일부 실시양태에서, 표적 서열에서 단일 가닥 또는 이중 가닥 파손을 도입하도록 지시한다. 표적 서열이 절단된 후에, 파손은 표적 서열의 DNA 서열이 복구 과정 동안에 변형되도록 복구될 수 있다. 따라서, 숙주 세포의 DNA에서 표적 서열을 변형시키기 위해 RNA-가이드된 뉴클레아제를 사용하는 방법이 본원에 제공된다. 예를 들어, RNA-가이드된 뉴클레아제를 사용하여 진핵생물 세포 또는 원핵생물 세포의 게놈 유전자좌에서 표적 서열을 변형시킬 수 있다.
본 개시내용은 데아미나제 폴리펩티드, 및 이를 코딩하는 핵산 분자, 뿐만 아니라 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 단백질을 추가로 제공한다. 일부 실시양태에서, DNA-결합 폴리펩티드는 메가뉴클레아제, 아연 핑거 융합 단백질 또는 TALEN이거나 또는 그로부터 유래된다. 일부 실시양태에서, 융합 단백질은 RNA-가이드된 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함한다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 RGN이다. 일부 실시양태에서, RGN은 유형 II CRISPR-Cas 폴리펩티드이다. 다른 실시양태에서, RGN은 유형 V CRISPR-Cas 폴리펩티드이다. 추가의 실시양태에서, RGN은 gRNA에 결합하는 Cas9 폴리펩티드 도메인이며, 이는 가닥 혼성화를 통해 표적 핵산 서열에 결합한다.
데아미나제 폴리펩티드는 예를 들어 시티딘과 같은 핵염기를 탈아미노화시킬 수 있는 데아미나제 도메인을 포함한다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 유도할 수 있으며, 이는 본원에서 "핵산 편집" 또는 "염기 편집"으로 지칭된다. 따라서, RGN 폴리펩티드 변이체 또는 도메인 및 데아미나제 도메인을 포함하는 융합 단백질은 핵산 서열의 표적화된 편집을 위해 사용될 수 있다.
이러한 융합 단백질은 예를 들어 돌연변이성 세포의 생성을 위해 시험관내에서 DNA의 표적화된 편집에 유용하다. 이들 돌연변이성 세포는 식물 또는 동물에 있을 수 있다. 이러한 융합 단백질은 또한 예를 들어 생체외에서 포유동물 세포에서, 예를 들어 동일한 또는 또 다른 대상체에게 후속적으로 재도입되는 대상체로부터 수득된 세포에서 유전적 결함의 수정을 위해 표적화된 돌연변이를 도입하는데; 및 예를 들어 포유동물 대상체에서 질환-연관된 유전자에서 유전적 결함의 수정 또는 불활성화 돌연변이의 도입을 위해 표적화된 돌연변이를 도입하는데 유용할 수 있다. 이러한 융합 단백질은 또한 식물 세포에서 표적화된 돌연변이를 도입하는데, 예를 들어 유익한 또는 농경학적으로 가치있는 형질 또는 대립유전자를 도입하는데 유용할 수 있다.
용어 "단백질", "펩티드" 및 "폴리펩티드"는 본원에서 상호교환적으로 사용되고, 펩티드 (아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 상기 용어는 임의의 크기, 구조 또는 기능을 갖는 단백질, 펩티드 또는 폴리펩티드를 지칭한다. 전형적으로, 단백질, 펩티드 또는 폴리펩티드는 적어도 3개의 아미노산 길이일 것이다. 단백질, 펩티드 또는 폴리펩티드는 개별 단백질 또는 단백질 집합체를 지칭할 수 있다. 단백질, 펩티드 또는 폴리펩티드에서 하나 이상의 아미노산이 예를 들어 화학적 개체, 예컨대 탄수화물 기, 히드록실 기, 포스페이트 기, 파메실 기, 이소파메실 기, 지방산 기, 접합, 관능화 또는 다른 변형을 위한 링커 등의 부가에 의해 변형될 수 있다. 단백질, 펩티드 또는 폴리펩티드는 단일 분자일 수 있거나, 또는 다분자 복합체일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 단지 천연 발생 단백질 또는 펩티드의 단편일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 천연 발생, 재조합, 또는 합성, 또는 이들의 임의의 조합일 수 있다.
본원에서 사용된 바와 같이 용어 "융합 단백질"은 적어도 2가지 상이한 단백질로부터의 단백질 도메인을 포함하는 혼성체 폴리펩티드를 지칭한다. 한 단백질은 융합 단백질의 아미노-말단 (N-말단) 부분에 또는 카르복시-말단 (C-말단) 단백질에 위치하여, 각각 "아미노-말단 융합 단백질" 또는 "카르복시-말단 융합 단백질"을 형성할 수 있다. 단백질은 상이한 도메인, 예를 들어 핵산 결합 도메인 (예를 들어, 표적 부위로 단백질의 결합을 지시하는 Cas9의 gRNA 결합 도메인) 및 핵산 절단 도메인 또는 재조합효소의 촉매적 도메인을 포함할 수 있다. 일부 실시양태에서, 단백질은 단백질성 부분, 예를 들어 핵산 결합 도메인을 구성하는 아미노산 서열, 및 유기 화합물, 예를 들어 핵산 절단제로서 작용할 수 있는 화합물을 포함한다. 일부 실시양태에서, 단백질은 핵산, 예를 들어 RNA와 복합체로 있거나 또는 그와 회합되어 있다. 본원에 제공된 임의의 단백질은 관련 기술분야에 공지된 임의의 방법에 의해 생성될 수 있다. 예를 들어, 본원에 제공된 단백질은 펩티드 링커를 포함하는 융합 단백질에 특히 적합한 재조합 단백질 발현 및 정제를 통해 생성될 수 있다. 재조합 단백질 발현 및 정제 방법은 널리 공지되어 있고, [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))] (그의 전체 내용은 본원에 참고로 포함됨)에 의해 기재된 것들이 포함된다.
II. RNA-가이드된 뉴클레아제
RNA-가이드된 뉴클레아제가 본원에 제공된다. 용어 RNA-가이드된 뉴클레아제 (RGN)는 서열-특이적인 방식으로 특정한 표적 뉴클레오티드 서열에 결합하며, 폴리펩티드와 복합체화하고 표적 서열과 혼성화하는 가이드 RNA 분자에 의해 표적 뉴클레오티드 서열로 가이드되는 폴리펩티드를 지칭한다. RNA-가이드된 뉴클레아제가 결합시 표적 서열을 절단시킬 수 있지만, 용어 RNA-가이드된 뉴클레아제는 또한 표적 서열을 절단하지 않고 그에 결합할 수 있는 뉴클레아제-데드(nuclease-dead) RNA-가이드된 뉴클레아제를 포함한다. RNA-가이드된 뉴클레아제에 의한 표적 서열의 절단은 단일 또는 이중 가닥 파손을 일으킬 수 있다. 이중 가닥 핵산 분자의 단일 가닥만을 절단할 수 있는 RNA-가이드된 뉴클레아제는 본원에서 닉카제로 지칭된다.
본원에 개시된 RNA-가이드된 뉴클레아제에는 APG00969, APG03128, APG09748, APG00771 및 APG02789 RNA-가이드된 뉴클레아제 (이들의 아미노산 서열은 각각 서열식별번호((SEQ ID NO)): 1, 16, 24, 35, 43 또는 50으로 제시됨), 및 RNA-가이드된 서열-특이적인 방식으로 표적 뉴클레오티드 서열에 결합하는 능력을 보유하는 그의 활성 단편 또는 변이체가 포함된다. 이들 실시양태의 일부에서, APG00969, APG03128, APG09748, APG00771 및 APG02789 RGN의 활성 단편 또는 변이체는 단일- 또는 이중-가닥 표적 서열을 절단할 수 있다. 일부 실시양태에서, APG00969, APG03128, APG09748, APG00771 또는 APG02789 RGN의 활성 변이체는 서열식별번호: 1, 16, 24, 35, 43 또는 50에 제시된 아미노산 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 실시양태에서, APG00969, APG03128, APG09748, APG00771 또는 APG02789 RGN의 활성 단편은 서열식별번호: 1, 16, 24, 35, 43 또는 50에 제시된 아미노산 서열의 적어도 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 또는 그 초과의 연속 아미노산 잔기를 포함한다. 본원에 제공된 RNA-가이드된 뉴클레아제는 적어도 하나의 뉴클레아제 도메인 (예를 들어, DNase, RNase 도메인), 및 가이드 RNA와 상호작용하기 위한 적어도 하나의 RNA 인식 및/또는 RNA 결합 도메인을 포함할 수 있다. 추가로, 본원에 제공된 RNA-가이드된 뉴클레아제에서 확인될 수 있는 도메인에는 다음이 포함되나 이로 제한되지 않는다: DNA 결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 및 이합체화 도메인. 구체적인 실시양태에서, 본원에 제공된 RNA-가이드된 뉴클레아제는 DNA 결합 도메인, 헬리카제 도메인, 단백질-단백질 상호작용 도메인, 및 이합체화 도메인 중 하나 이상과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%를 포함할 수 있다.
표적 뉴클레오티드 서열은 본원에 제공된 RNA-가이드된 뉴클레아제에 의해 결합되고, RNA-가이드된 뉴클레아제와 회합된 가이드 RNA와 혼성화한다. 이어서, 폴리펩티드가 뉴클레아제 활성을 갖는 경우에, 표적 서열은 후속적으로 RNA-가이드된 뉴클레아제에 의해 절단될 수 있다. 용어 "절단하다" 또는 "절단"은 표적 서열 내에 단일 가닥 또는 이중 가닥 파손을 생성할 수 있는, 표적 뉴클레오티드 서열의 백본 내에서 적어도 하나의 포스포디에스테르 결합의 가수분해를 지칭한다. 본원에 개시된 RGN은 엔도뉴클레아제로서 기능하여 폴리뉴클레오티드 내의 뉴클레오티드를 절단할 수 있거나, 또는 폴리뉴클레오티드의 말단 (5' 및/또는 3' 말단)으로부터 연속적인 뉴클레오티드를 제거하는 엑소뉴클레아제일 수 있다. 다른 실시양태에서, 개시된 RGN은 폴리뉴클레오티드의 임의의 위치 내에서 표적 서열의 뉴클레오티드를 절단할 수 있고, 따라서 엔도뉴클레아제 및 엑소뉴클레아제 둘 다로 기능할 수 있다. 본원에 개시된 RGN의 표적 폴리뉴클레오티드의 절단은 엇갈린 파손 또는 평활 말단을 생성할 수 있다.
본원에 개시된 RNA-가이드된 뉴클레아제는 박테리아 또는 고세균 종으로부터 유래된 야생형 서열일 수 있다. 대안적으로, RNA-가이드된 뉴클레아제는 야생형 폴리펩티드의 변이체 또는 단편일 수 있다. 야생형 RGN은 예를 들어 뉴클레아제 활성을 변경시키도록 또는 PAM 특이성을 변경시키도록 변형될 수 있다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 천연 발생이 아니다.
특정한 실시양태에서, RNA-가이드된 뉴클레아제는 닉카제로서 기능하여, 표적 뉴클레오티드 서열의 단일 가닥만을 절단한다. 이러한 RNA-가이드된 뉴클레아제는 단일 기능 뉴클레아제 도메인을 갖는다. 이들 일부 실시양태에서, 추가의 뉴클레아제 도메인은 뉴클레아제 활성이 감소되거나 또는 제거되도록 돌연변이되었다. 뉴클레아제 불활성 RGN 또는 닉카제 RGN은 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드, 또는 RNA-가이드된 DNA-결합 단백질, 또는 RNA-가이드된 DNA-결합 도메인으로 지칭될 수 있다.
다른 실시양태에서, RNA-가이드된 뉴클레아제는 뉴클레아제 활성이 완전히 결여되거나 또는 감소된 뉴클레아제 활성을 나타내고, 본원에서 뉴클레아제-데드로 지칭된다. 돌연변이를 아미노산 서열에 도입시키기 위한 관련 기술분야에 공지된 임의의 방법, 예컨대 PCR-매개된 돌연변이 유발 및 부위-지정된 돌연변이 유발은 닉카제 또는 뉴클레아제-데드 RGN을 생성하기 위해 이용될 수 있다. 예를 들어, 미국 공개 번호 2014/0068797 및 미국 특허 번호 9,790,490을 참고하며; 이들 각각은 그의 전문이 참고로 포함된다.
뉴클레아제 활성이 결여된 RNA-가이드된 뉴클레아제는 융합된 폴리펩티드, 폴리뉴클레오티드, 또는 소분자 페이로드를 특정한 게놈 위치로 전달하기 위해 사용될 수 있다. 이들 일부 실시양태에서, RGN 폴리펩티드 또는 가이드 RNA는 특정한 서열의 검출이 가능하도록 검출가능한 표지에 융합될 수 있다. 비제한적인 예로서, 뉴클레아제-데드 RGN은 검출가능한 표지 (예를 들어, 형광 단백질)에 융합될 수 있고, 질환-연관된 서열의 검출이 가능하도록 질환과 연관된 특정한 서열에 대해 표적화될 수 있다.
대안적으로, 뉴클레아제-데드 RGN은 원하는 서열의 발현을 변경시키도록 특정한 게놈 위치에 대해 표적화될 수 있다. 일부 실시양태에서, 뉴클레아제-데드 RNA-가이드된 뉴클레아제와 표적 서열의 결합은 표적화된 게놈 영역 내에서 RNA 폴리머라제 또는 전사 인자의 결합을 방해함으로써 표적 서열, 또는 표적 서열에 의한 전사 조절하에 있는 유전자의 발현을 억제한다. 다른 실시양태에서, RGN (예를 들어, 뉴클레아제-데드 RGN) 또는 그의 복합체화된 가이드 RNA는 표적 서열과 결합시 표적 서열, 또는 표적 서열에 의한 전사 조절하에 있는 유전자의 발현을 억제하거나 또는 활성화시키는 작용을 하는 발현 조절인자를 추가로 포함한다. 이들 일부 실시양태에서, 발현 조절인자는 후성적인 메카니즘을 통해 표적 서열 또는 조절된 유전자의 발현을 조절한다.
다른 실시양태에서, 뉴클레아제-데드 RGN 또는 닉카제 활성만을 갖는 RGN은, 염기-편집 폴리펩티드, 예를 들어 뉴클레오티드 염기를 탈아미노화시키는 데아미나제 폴리펩티드 또는 그의 활성 변이체 또는 단편과의 융합을 통해 표적 폴리뉴클레오티드의 서열을 변형시켜, 하나의 뉴클레오티드 염기를 또 다른 염기로 전환시키도록, 특정한 게놈 위치에 대해 표적화될 수 있다. 염기-편집 폴리펩티드는 그의 N-말단 또는 C-말단에서 RGN에 융합될 수 있다. 추가로, 염기-편집 폴리펩티드는 펩티드 링커를 통해 RGN에 융합될 수 있다. 이러한 조성물 및 방법에 유용한 데아미나제 폴리펩티드의 비제한적인 예에는 [Gaudelli et al. (2017) Nature 551:464-471], 미국 공개 번호 2017/0121693 및 2018/0073012, 및 국제 공개 번호 WO/2018/027078에 기재된 시티딘 데아미나제 또는 아데노신 데아미나제 염기 편집기가 포함되고, 이들 각각은 그의 전문이 본원에 참고로 포함된다.
폴리펩티드 또는 도메인에 융합된 RNA-가이드된 뉴클레아제는 링커에 의해 분리되거나 또는 결합될 수 있다. 본원에서 사용된 바와 같이, 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어 뉴클레아제의 결합 도메인 및 절단 도메인을 연결하는 화학적 기 또는 분자를 지칭한다. 일부 실시양태에서, 링커는 RNA 가이드된 뉴클레아제의 gRNA 결합 도메인 및 염기-편집 폴리펩티드, 예컨대 데아미나제를 결합시킨다. 일부 실시양태에서, 링커는 뉴클레아제-데드 RGN 및 데아미나제를 결합시킨다. 전형적으로, 링커는 2개의 기, 분자 또는 다른 모이어티 사이에 위치하거나 또는 그에 의해 플랭킹되고, 공유 결합을 통해 서로 연결되어 이들 둘을 연결시킨다. 일부 실시양태에서, 링커는 아미노산 또는 여러개의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 또는 150-200개 아미노산 길이이다. 더 길거나 또는 더 짧은 링커 또한 고려된다.
본원에 개시된 RNA-가이드된 뉴클레아제는 세포의 핵으로 RGN의 수송을 증강시키기 위해 적어도 하나의 핵 국재화 신호 (NLS)를 포함할 수 있다. 핵 국재화 신호는 관련 기술분야에 공지되어 있고, 일반적으로 염기성 아미노산의 스트레치를 포함한다 (예를 들어, [Lange et al., J. Biol. Chem. (2007) 282:5101-5105] 참고). 특정한 실시양태에서, RGN은 2, 3, 4, 5, 6개 또는 그 초과의 핵 국재화 신호를 포함한다. 핵 국재화 신호(들)은 이종성 NLS일 수 있다. 본원에 개시된 RGN에 대해 유용한 핵 국재화 신호의 비제한적인 예는 SV40 거대 T-항원, 뉴클레오파스민, 및 c-Myc의 핵 국재화 신호이다 (예를 들어, [Ray et al. (2015) Bioconjug Chem 26(6):1004-7] 참고). 특정한 실시양태에서, RGN은 서열식별번호: 10에 제시된 NLS 서열을 포함한다. RGN은 그의 N-말단, C-말단, 또는 N-말단 및 C-말단 둘 다에 하나 이상의 NLS 서열을 포함할 수 있다. 예를 들어, RGN은 N-말단 영역에 2개의 NLS 서열 및 C-말단 영역에서 4개의 NLS 서열을 포함할 수 있다.
폴리펩티드를 특정한 세포하 위치(들)에 국재화시키는 관련 기술분야에 공지된 다른 국재화 신호 서열, 예컨대 비제한적으로 색소체 국재화 서열, 미토콘드리아 국재화 서열, 및 색소체 및 미토콘드리아 둘 다를 표적화하는 이중-표적화 신호 서열을 또한 사용하여, RGN을 표적화할 수 있다 (예를 들어, [Nassoury and Morse (2005) Biochim Biophys Acta 1743:5-19; Kunze and Berger (2015) Front Physiol dx.doi.org/10.3389/fphys.2015.00259; Herrmann and Neupert (2003) IUBMB Life 55:219-225; Soll (2002) Curr Opin Plant Biol 5:529-535; Carrie and Small (2013) Biochim Biophys Acta 1833:253-259; Carrie et al. (2009) FEBS J 276:1187-1195; Silva-Filho (2003) Curr Opin Plant Biol 6:589-595; Peeters and Small (2001) Biochim Biophys Acta 1541:54-63; Murcha et al. (2014) J Exp Bot 65:6301-6335; Mackenzie (2005) Trends Cell Biol 15:548-554; Glaser et al. (1998) Plant Mol Biol 38:311-338] 참고).
특정한 실시양태에서, 본원에 개시된 RNA-가이드된 뉴클레아제는 RGN의 세포 흡수를 용이하게 하는 적어도 하나의 세포-투과 도메인을 포함한다. 세포-투과 도메인은 관련 기술분야에 공지되어 있고, 일반적으로 양으로 하전된 아미노산 잔기 (즉, 다중양이온성 세포-투과 도메인), 교대하는 극성 아미노산 잔기 및 비-극성 아미노산 잔기 (즉, 양친매성 세포-투과 도메인), 또는 소수성 아미노산 잔기 (즉, 소수성 세포-투과 도메인)의 스트레치를 포함한다 (예를 들어, [Milletti F. (2012) Drug Discov Today 17:850-860] 참고). 세포-투과 도메인의 비제한적인 예는 인간 면역결핍 바이러스 1로부터의 트랜스-활성화 전사 활성화제 (TAT)이다.
핵 국재화 신호, 색소체 국재화 신호, 미토콘드리아 국재화 신호, 이중-표적화 국재화 신호, 및/또는 세포-투과 도메인은 RNA-가이드된 뉴클레아제의 아미노-말단 (N-말단), 카르복실-말단 (C-말단), 또는 내부 위치에 위치할 수 있다.
본원에 개시된 RGN은 이펙터 도메인, 예컨대 절단 도메인, 데아미나제 도메인, 또는 발현 조절인자 도메인에 직접적으로 또는 링커 펩티드를 통해 간접적으로 융합될 수 있다. 이러한 도메인은 RNA-가이드된 뉴클레아제의 N-말단, C-말단, 또는 내부 위치에 위치할 수 있다. 이들 일부 실시양태에서, 융합 단백질의 RGN 성분은 뉴클레아제-데드 RGN이다.
일부 실시양태에서, RGN 융합 단백질은 절단 도메인을 포함하며, 이는 폴리뉴클레오티드 (즉, RNA, DNA, 또는 RNA/DNA 혼성체)를 절단할 수 있는 임의의 도메인이고, 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제, 예컨대 유형 IIS 엔도뉴클레아제 (예를 들어, FokI)가 포함되나 이로 제한되지 않는다 (예를 들어, [Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993] 참고).
다른 실시양태에서, RGN 융합 단백질은 뉴클레오티드 염기를 탈아미노화시켜 하나의 뉴클레오티드 염기를 또 다른 염기로 전환시키는 데아미나제 도메인을 포함하며, 시티딘 데아미나제 또는 아데노신 데아미나제 염기 편집기가 포함되나 이로 제한되지 않는다 (예를 들어, [Gaudelli et al. (2017) Nature 551:464-471], 미국 공개 번호 2017/0121693 및 2018/0073012, 미국 특허 번호 9,840,699, 및 국제 공개 번호 WO/2018/027078 참고). 추가의 실시양태에서, RGN 융합 단백질은 서열식별번호: 374-545 또는 572-584 중 어느 하나의 아미노산 서열, 또는 그의 활성 변이체를 포함하는 본 발명의 데아미나제를 포함할 수 있다.
다른 실시양태에서, 서열식별번호: 374-545 또는 572-584 중 어느 하나의 아미노산 서열, 또는 그의 활성 변이체를 포함하는 본 발명의 데아미나제는 임의의 DNA-결합 단백질에 융합될 수 있다. 일부 실시양태에서, 데아미나제는 본 발명의 RGN에 융합된다. 다른 실시양태에서, 데아미나제는 관련 기술분야에 공지된 RGN에 융합된다. 다른 실시양태에서, 데아미나제는 RGN이 아닌 DNA-결합 단백질, 예를 들어 메가뉴클레아제, TALEN, 또는 아연 핑거 뉴클레아제에 융합된다. 일부 실시양태에서, 데아미나제는 임의의 서열식별번호: 374-545 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 특정 실시양태에서, 데아미나제는 임의의 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 변이체 데아미나제 폴리펩티드는 서열식별번호: 572-584 중 어느 하나와 특정한 수준의 서열 동일성을 가지며, 특이적인 아미노산 잔기는 모 서열로부터 변하지 않는다. 예를 들어, 일부 실시양태에서, 변이체 서열식별번호: 572는 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 위치 104에 상응하는 위치에서 티로신, 및 위치 106에 상응하는 위치에서 트레오닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 574는 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 위치 103에 상응하는 위치에서 세린, 및 위치 105에 상응하는 위치에서 리신을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 575는 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 위치 103에 상응하는 위치에서 류신, 및 위치 105에 상응하는 위치에서 글루탐산을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 576은 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 위치 107에 상응하는 위치에서 아르기닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 577은 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 위치 104에 상응하는 위치에서 세린, 및 위치 106에 상응하는 위치에서 아르기닌을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 578은 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 위치 107에 상응하는 위치에서 트레오닌을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 579는 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 위치 104에 상응하는 위치에서 글루타민, 및 위치 106에 상응하는 위치에서 글리신을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 580은 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 581은 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 위치 106에 상응하는 위치에서 글리신, 및 위치 108에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 582는 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 위치 104에 상응하는 위치에서 트립토판, 및 위치 106에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 583은 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 위치 106에 상응하는 위치에서 세린을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 584는 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 위치 112에 상응하는 위치에서 세린, 및 위치 114에 상응하는 위치에서 트레오닌을 포함한다.
용어 "데아미나제"는 탈아미노화 반응 (즉, 아미노산 또는 다른 화합물로부터 아미노 기의 제거)을 촉매하는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 각각 시티딘 또는 데옥시시티딘에서 우라실 또는 데옥시우라실로의 가수분해성 탈아미노화를 촉매하는 시티딘 데아미나제이다. 다른 실시양태에서, 데아미나제는 아데닌 데아미나제이다. 아데닌의 탈아미노화는 이노신을 생성하며, 이는 폴리머라제에 의해 구아닌으로 처리된다. 시티딘 데아미나제 및 아데닌 데아미나제는 DNA 또는 RNA에 대해 작용할 수 있지만, 지금까지 DNA에서 아데닌을 탈아미노화하는 천연 발생 아데닌 데아미나제는 공지되어 있지 않다. 그러나, DNA에 대해 유의한 아데노신 데아미나제 활성을 갖는 천연 발생 단백질인 APG07458 (서열식별번호: 514)이 본원에 개시된다. 본 발명의 데아미나제는 DNA 또는 RNA 분자의 편집을 위해 사용될 수 있다. 본 발명의 데아미나제는 그룹으로서 DNA 분자에서 4가지 모든 전이 (C에서 T로, A에서 G로, T에서 C로, 및 G에서 A로) 및 RNA 분자에서 C에서 U로, A에서 G로, 및 G에서 A로의 전이의 프로그래밍가능한 설치를 가능하게 한다.
본 발명의 데아미나제는 단일-가닥 핵산 분자에 대해 작동한다. 표적 가닥에 대해 닉카제 활성을 갖는 RGN은 표적 가닥을 닉킹시키는 반면에, 상보적인 비-표적 가닥은 데아미나제에 의해 변형된다. 세포성 DNA-복구 기구는 주형으로서 변형된 비-표적 가닥을 사용하여 닉킹된 표적 가닥을 복구시켜, DNA에서 돌연변이를 도입시킬 수 있다.
일부 실시양태에서, 데아미나제에 융합된 뉴클레아제 불활성 RGN 또는 닉카제 RGN은 원하는 서열의 발현을 변경시키기 위해 특정한 게놈 위치에 대해 표적화될 수 있다. 일부 실시양태에서, 뉴클레아제 불활성 RGN 또는 닉카제 RGN은 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드 또는 단백질 또는 단백질 도메인으로 지칭될 수 있다. 일부 실시양태에서, 이러한 융합 단백질과 표적 서열의 결합은 뉴클레오티드 염기를 탈아미노화시켜, 한 뉴클레오티드 염기에서 또 다른 것으로 전환시킨다. 일부 실시양태에서, RGN 융합 단백질의 이펙터 도메인은 발현 조절인자 도메인일 수 있고, 이는 전사를 상향조절하거나 또는 하향조절하는 도메인이다. 발현 조절인자 도메인은 후성적 변형 도메인, 전사 리프레서 도메인 또는 전사 활성화 도메인일 수 있다.
이들 일부 실시양태에서, RGN 융합 단백질의 발현 조절인자는 DNA 서열을 변경시키지 않고 히스톤 구조 및/또는 염색체 구조를 변경시키도록 DNA 또는 히스톤 단백질을 공유적으로 변형시켜, 유전자 발현에서의 변화 (즉, 상향조절 또는 하향조절)를 유도하는 후성적 변형 도메인을 포함한다. 후성적 변형의 비제한적인 예에는 DNA에서 리신 잔기의 아세틸화 또는 메틸화, 아르기닌 메틸화, 세린 및 트레오닌 인산화, 및 히스톤 단백질의 리신 유비퀴틴화 및 SUMO화, 및 시토신 잔기의 메틸화 및 히드록시메틸화가 포함된다. 후성적 변형 도메인의 비제한적인 예에는 히스톤 아세틸트랜스퍼라제 도메인, 히스톤 데아세틸라제 도메인, 히스톤 메틸트랜스퍼라제 도메인, 히스톤 데메틸라제 도메인, DNA 메틸트랜스퍼라제 도메인, 및 DNA 데메틸라제 도메인이 포함된다.
다른 실시양태에서, 융합 단백질의 발현 조절인자는 적어도 하나의 유전자의 전사를 감소시키거나 또는 종료시키기 위해, 전사 조절 요소 및/또는 전사 조절 단백질, 예컨대 RNA 폴리머라제 및 전사 인자와 상호작용하는 전사 리프레서 도메인을 포함한다. 전사 리프레서 도메인은 관련 기술분야에 공지되어 있고, Sp1-유사 리프레서, IκB, 및 크루펠(Kruppel) 연관된 박스 (KRAB) 도메인이 포함되나 이로 제한되지 않는다.
여전히 다른 실시양태에서, 융합 단백질의 발현 조절인자는, 적어도 하나의 유전자의 전사를 증가시키거나 또는 활성화시키기 위해, 전사 조절 요소 및/또는 전사 조절 단백질, 예컨대 RNA 폴리머라제 및 전사 인자와 상호작용하는 전사 활성화 도메인을 포함한다. 전사 활성화 도메인은 관련 기술분야에 공지되어 있고, 단순 포진 바이러스 VP16 활성화 도메인 및 NFAT 활성화 도메인이 포함되나 이로 제한되지 않는다.
본원에 개시된 RGN 및 데아미나제 폴리펩티드, 또는 이들의 융합 폴리펩티드는 검출가능한 표지 또는 정제 태그를 포함할 수 있다. 검출가능한 표지 또는 정제 태그는 RNA-가이드된 뉴클레아제의 N-말단, C-말단 또는 내부 위치에 직접적으로 또는 링커 펩티드를 통해 간접적으로 위치할 수 있다. 이들 일부 실시양태에서, 융합 단백질의 RGN 성분은 뉴클레아제-데드 RGN이다. 다른 실시양태에서, 융합 단백질의 RGN 성분은 닉카제 활성을 갖는 RGN이다.
검출가능한 표지는 가시화될 수 있거나 또는 달리 관찰될 수 있는 분자이다. 검출가능한 표지는 융합 단백질 (예를 들어, 형광 단백질)로서 RGN에 융합될 수 있거나, 또는 시각적으로 또는 다른 수단에 의해 검출될 수 있는 RGN 폴리펩티드에 접합된 소분자일 수 있다. 본원에 개시된 RGN 또는 데아미나제에 융합 단백질로서 융합될 수 있는 검출가능한 표지에는 임의의 검출가능한 단백질 도메인, 예컨대 비제한적으로 특이적인 항체에 의해 검출될 수 있는 형광 단백질 또는 단백질 도메인이 포함된다. 형광 단백질의 비제한적인 예에는 녹색 형광 단백질 (예를 들어, GFP, EGFP, ZsGreen1) 및 황색 형광 단백질 (예를 들어, YFP, EYFP, ZsYellow1)이 포함된다. 소분자 검출가능한 표지의 비제한적인 예에는 방사선 활성 표지, 예컨대 3H 및 35S가 포함된다.
본 발명의 RGN 및 데아미나제 폴리펩티드, 또는 이들의 융합 폴리펩티드는 또한 정제 태그를 포함할 수 있고, 이는 혼합물 (예를 들어, 생물학적 샘플, 배양 배지)로부터 단백질 또는 융합된 단백질을 단리하기 위해 사용될 수 있는 임의의 분자이다. 정제 태그의 비제한적인 예에는 비오틴, myc, 말토스 결합 단백질 (MBP), 및 글루타티온-S-트랜스퍼라제 (GST)가 포함된다.
II. 가이드 RNA
본 개시내용은 가이드 RNA, 및 이를 코딩하는 폴리뉴클레오티드를 제공한다. 용어 "가이드 RNA"는, 표적 서열과 혼성화하도록 표적 뉴클레오티드 서열과 충분한 상보성을 가지며, 연관된 RNA-가이드된 뉴클레아제와 표적 뉴클레오티드 서열의 서열-특이적인 결합을 지시하는 뉴클레오티드 서열을 지칭한다. 따라서, RGN의 각각의 가이드 RNA는 RGN에 결합하여 RGN이 특정한 표적 뉴클레오티드 서열과 결합하도록 가이드하는 하나 이상의 RNA 분자 (일반적으로, 1개 또는 2개)이며, 이들 예에서 RGN은 닉카제 또는 뉴클레아제 활성을 갖고, 또한 표적 뉴클레오티드 서열을 절단한다. 일반적으로, 가이드 RNA는 CRISPR RNA (crRNA) 및 트랜스-활성화 CRISPR RNA (tracrRNA)를 포함한다. crRNA 및 tracrRNA 둘 다를 포함하는 본래의 가이드 RNA는 일반적으로 crRNA의 반복 서열 및 tracrRNA의 안티-반복 서열을 통해 서로 혼성화하는 2가지 별도의 RNA 분자를 포함한다.
CRISPR 어레이 내의 본래의 직접적인 반복 서열은 일반적으로 28 내지 37개 염기쌍의 길이 범위를 갖지만, 상기 길이는 약 23 bp 내지 약 55 bp로 달라질 수 있다. CRISPR 어레이 내의 스페이서 서열은 일반적으로 약 32 내지 약 38 bp의 길이 범위를 갖지만, 상기 길이는 약 21 bp 내지 약 72 bp일 수 있다. 각각의 CRISPR 어레이는 일반적으로 CRISPR 반복-스페이서 서열의 50개 미만의 단위를 포함한다. CRISPR은 일차 CRISPR 전사체로 명명되는 긴 전사체의 일부로서 전사되며, 이는 CRISPR 어레이의 대부분을 포함한다. 일차 CRISPR 전사체는 Cas 단백질에 의해 절단되어, crRNA를 생성하거나 또는 일부 경우에는 추가의 Cas 단백질에 의해 성숙 crRNA로 추가로 가공되는 프리-crRNA를 생성한다. 성숙 crRNA는 스페이서 서열 및 CRISPR 반복 서열을 포함한다. 프리-crRNA가 성숙 (또는 가공된) crRNA로 가공되는 일부 실시양태에서, 성숙은 약 1 내지 약 6개 또는 그 초과의 5', 3', 또는 5' 및 3' 뉴클레오티드의 제거를 수반한다. 특정한 관심 표적 뉴클레오티드 서열의 게놈 편집 또는 표적화의 목적을 위해, 프리-crRNA 분자의 성숙 동안에 제거된 이들 뉴클레오티드가 반드시 가이드 RNA를 생성하거나 또는 설계할 필요는 없다.
CRISPR RNA (crRNA)는 스페이서 서열 및 CRISPR 반복 서열을 포함한다. "스페이서 서열"은 관심 표적 뉴클레오티드 서열과 직접적으로 혼성화하는 뉴클레오티드 서열이다. 스페이서 서열은 관심 표적 서열에 의해 완전히 또는 부분적으로 상보성이도록 조작된다. 다양한 실시양태에서, 스페이서 서열은 약 8개 뉴클레오티드 내지 약 30개 뉴클레오티드, 또는 그 초과를 포함할 수 있다. 예를 들어, 스페이서 서열은 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30개, 또는 그 초과의 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 스페이서 서열은 약 10 내지 약 26개 뉴클레오티드 길이, 또는 약 12 내지 약 30개 뉴클레오티드 길이이다. 특정한 실시양태에서, 스페이서 서열은 약 30개 뉴클레오티드 길이이다. 일부 실시양태에서, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬하였을 때 스페이서 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 약 60%, 약 70%, 약 75%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 그 초과이거나, 또는 대략 상기 값 초과이다. 특정한 실시양태에서, 스페이서 서열은 이차 구조를 함유하지 않으며, 이는 관련 기술분야에 공지된 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘, 예컨대 비제한적으로 mFold (예를 들어, [Zuker and Stiegler (1981) Nucleic Acids Res. 9:133-148] 참고) 및 RNAfold (예를 들어, [Gruber et al. (2008) Cell 106(1):23-24] 참고)를 사용하여 예측될 수 있다.
RGN 단백질은 절단 효율에 영향을 미치는 gRNA에서의 스페이서 서열과 그의 표적 서열 사이의 미스매치에 대해 다양한 민감성을 가질 수 있다.
CRISPR RNA 반복 서열은 tracrRNA와 혼성화하도록 충분한 상보성을 갖는 영역을 포함하는 뉴클레오티드 서열을 포함한다. 다양한 실시양태에서, CRISPR RNA 반복 서열은 약 8개 뉴클레오티드 내지 약 30개 뉴클레오티드, 또는 그 초과를 포함할 수 있다. 예를 들어, CRISPR 반복 서열은 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30개, 또는 그 초과의 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, CRISPR 반복 서열은 약 21개 뉴클레오티드 길이이다. 일부 실시양태에서, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬될 때 CRISPR 반복 서열과 그의 상응하는 tracrRNA 서열 사이의 상보성 정도는 약 50%, 약 60%, 약 70%, 약 75%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 그 초과, 또는 대략 상기 값 초과이다. 특정한 실시양태에서, CRISPR 반복 서열은, 가이드 RNA 내에 포함될 때 본원에 제공된 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 CRISPR 반복 서열 변이체는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 CRISPR 반복 서열 단편은 서열식별번호: 2, 17, 25, 36, 44, 또는 51에 제시된 뉴클레오티드 서열의 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속 뉴클레오티드를 포함한다.
특정한 실시양태에서, crRNA는 천연 발생이 아니다. 이들 일부 실시양태에서, 특이적인 CRISPR 반복 서열은 본래 조작된 스페이서 서열에 연결되지 않고, CRISPR 반복 서열은 스페이서 서열에 대해 이종성인 것으로 고려된다. 특정한 실시양태에서, 스페이서 서열은 천연 발생이 아닌 조작된 서열이다.
트랜스-활성화 CRISPR RNA 또는 tracrRNA 분자는 crRNA의 CRISPR 반복 서열과 혼성화하도록 충분한 상보성을 갖는 영역을 포함하는 뉴클레오티드 서열을 포함하며, 이는 본원에서 안티-반복 영역으로 지칭된다. 일부 실시양태에서, tracrRNA 분자는 이차 구조 (예를 들어, 스템-루프)를 갖는 영역을 추가로 포함하거나, 또는 그의 상응하는 crRNA와 혼성화시 이차 구조를 형성한다. 특정한 실시양태에서, CRISPR 반복 서열과 완전히 또는 부분적으로 상보성인 tracrRNA의 영역은 분자의 5' 말단에 있고, tracrRNA의 3' 말단은 이차 구조를 포함한다. 유형 II RGN의 경우, 이러한 이차 구조 영역은 일반적으로 안티-반복 서열과 인접하여 발견되는 몇몇 헤어핀 구조, 예컨대 넥서스 헤어핀을 포함한다. 넥서스 헤어핀은 종종 tracrRNA의 넥서스 헤어핀에서 발견되는 모티프 UNANNC (서열식별번호: 13; APG00969의 경우), ANGNNU (서열식별번호: 23; APG03128의 경우), 또는 UNANNA (서열식별번호: 42; APG00771의 경우)와 함께 헤어핀 스템의 염기에서 보존된 뉴클레오티드 서열을 갖는다. 종종 tracrRNA의 3' 말단에 구조 및 개수가 다양할 수 있지만 종종 GC-풍부 Rho-비의존성 전사 종결인자 헤어핀에 이어서 3' 말단에 U의 문자열을 포함하는 말단 헤어핀이 있다. 예를 들어, [Briner et al. (2014) Molecular Cell 56:333-339, Briner and Barrangou (2016) Cold Spring Harb Protoc; doi: 10.1101/pdb.top090902], 및 미국 공개 번호 2017/0275648을 참고하며, 이들 각각은 그의 전문이 본원에 참고로 포함된다.
다양한 실시양태에서, CRISPR 반복 서열에 대해 완전히 또는 부분적으로 상보성인 tracrRNA의 안티-반복 영역은 약 8개 뉴클레오티드 내지 약 30개 뉴클레오티드, 또는 그 초과를 포함한다. 예를 들어, tracrRNA 안티-반복 서열과 CRISPR 반복 서열 사이의 염기쌍 영역은 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30개, 또는 그 초과의 뉴클레오티드 길이일 수 있다. 특정한 실시양태에서, CRISPR 반복 서열에 대해 완전히 또는 부분적으로 상보성인 tracrRNA의 안티-반복 영역은 약 20개 뉴클레오티드 길이이다. 일부 실시양태에서, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬될 때 CRISPR 반복 서열과 그의 상응하는 tracrRNA 안티-반복 서열 사이의 상보성 정도는 약 50%, 약 60%, 약 70%, 약 75%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 그 초과, 또는 대략 상기 값 초과이다.
다양한 실시양태에서, 전체 tracrRNA는 약 60개 뉴클레오티드 내지 약 140개 초과의 뉴클레오티드를 포함할 수 있다. 예를 들어, tracrRNA는 약 60, 약 65, 약 70, 약 75, 약 80, 약 85, 약 90, 약 95, 약 100, 약 105, 약 110, 약 115, 약 120, 약 125, 약 130, 약 135, 약 140개 또는 그 초과의 뉴클레오티드 길이일 수 있다. 특정한 실시양태에서, tracrRNA는 약 80 내지 약 90개 뉴클레오티드 길이, 예컨대 약 80, 약 81, 약 82, 약 83, 약 84, 약 85, 약 86, 약 87, 약 88, 약 89, 및 약 90개 뉴클레오티드 길이이다. 특정한 실시양태에서, tracrRNA는 약 85개 뉴클레오티드 길이이다.
특정한 실시양태에서, tracrRNA는, 가이드 RNA 내에 포함될 때 본원에 제공된 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 tracrRNA 서열 변이체는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다. 특정한 실시양태에서, 야생형 서열의 활성 tracrRNA 서열 단편은 서열식별번호: 3, 18, 26, 37, 45 또는 52에 제시된 뉴클레오티드 서열의 적어도 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80개 또는 그 초과의 연속 뉴클레오티드를 포함한다.
2개의 폴리뉴클레오티드 서열은 2개의 서열이 엄격도 조건하에 서로 혼성화할 때 실질적으로 상보성인 것으로 고려된다. 마찬가지로, RGN은 RGN에 결합된 가이드 RNA가 엄격도 조건하에 표적 서열에 결합하는 경우 서열-특이적인 방식 내에서 특정한 표적 서열에 결합하는 것으로 고려된다. "엄격도 조건" 또는 "엄격도 혼성화 조건"은 2개의 폴리뉴클레오티드 서열이 다른 서열에 비해 검출가능하게 더 큰 정도로 (예를 들어, 백그라운드에 비해 적어도 2배) 서로 혼성화하도록 하는 의도된 조건이다. 엄격도 조건은 서열-의존성이고, 상이한 환경에서 상이할 것이다. 전형적으로, 엄격도 조건은 염 농도가 pH 7.0 내지 8.3에서 약 1.5 M 미만의 Na 이온, 전형적으로 약 0.01 내지 1.0 M Na 이온 농도 (또는 다른 염)이고 온도가 짧은 서열 (예를 들어, 10 내지 50개 뉴클레오티드)의 경우 적어도 약 30℃ 및 긴 서열 (예를 들어, 50개 초과의 뉴클레오티드)의 경우 적어도 약 60℃인 조건일 것이다. 엄격도 조건은 또한 탈안정화제, 예컨대 포름아미드의 첨가에 의해 달성될 수 있다. 예시적인 저엄격도 조건에는 37℃에서 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS (나트륨 도데실 술페이트)의 완충제 용액에 의한 혼성화, 및 50 내지 55℃에서 1X 내지 2X SSC (20X SSC = 3.0 M NaCl/0.3 M 시트르산삼나트륨) 중에서 세척이 포함된다. 예시적인 중간 엄격도 조건에는 37℃에서 40 내지 45% 포름아미드, 1.0 M NaCl, 1% SDS 중에서 혼성화, 및 55 내지 60℃에서 0.5X 내지 1X SSC 중에서 세척이 포함된다. 예시적인 고엄격도 조건에는 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS 중에서 혼성화, 및 60 내지 65℃에서 0.1X SSC 중에서 세척이 포함된다. 임의적으로, 세척 완충제는 약 0.1% 내지 약 1% SDS를 포함할 수 있다. 혼성화 지속시간은 일반적으로 약 24 시간 미만, 보통 약 4 내지 약 12 시간이다. 세척 지속시간은 적어도 평형에 도달하기에 충분한 시간일 것이다.
Tm은 (정의된 이온 강도 및 pH하에) 상보성 표적 서열의 50%가 매칭된 서열과 완벽하게 혼성화하는 온도이다. DNA-DNA 혼성체의 경우, Tm은 [Meinkoth and Wahl (1984) Anal. Biochem. 138:267-284]의 방정식으로부터 계산될 수 있으며: Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L; 여기서 M은 일가 양이온의 몰 농도이고, %GC는 DNA에서 구아노신 및 시토신 뉴클레오티드의 백분율이고, % form은 혼성화 용액 중에서 포름아미드의 백분율이고, L은 염기쌍에서 혼성체의 길이이다. 일반적으로, 엄격도 조건은 정의된 이온 강도 및 pH에서 특이적인 서열 및 그의 상보체에 대한 열 융점 (Tm)보다 약 5℃ 낮도록 선택된다. 그러나, 매우 엄격도 조건은 열 융점 (Tm)보다 1, 2, 3 또는 4℃ 낮은 온도에서 혼성화 및/또는 세척을 이용할 수 있고; 중간 엄격도 조건은 열 융점 (Tm)보다 6, 7, 8, 9 또는 10℃ 낮은 온도에서 혼성화 및/또는 세척을 이용할 수 있고; 저엄격도 조건은 열 융점 (Tm)보다 11, 12, 13, 14, 15 또는 20℃ 낮은 온도에서 혼성화 및/또는 세척을 이용할 수 있다. 상기 방정식, 혼성화 및 세척 조성물, 및 원하는 Tm을 이용하여, 통상의 기술자는 혼성화 및/또는 세척 용액의 엄격도에서의 변동이 본질적으로 기재되어 있음을 이해할 것이다. 핵산의 혼성화에 대한 광범위한 안내는 [Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier, New York); 및 Ausubel et al., eds. (1995) Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, New York)]에서 확인한다. [Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)]을 참고한다.
가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA 시스템일 수 있다. 단일 가이드 RNA는 RNA의 단일 분자 상에 crRNA 및 tracrRNA를 포함하는 반면에, 이중-가이드 RNA 시스템은 2가지 별개의 RNA 분자 상에 존재하는 crRNA 및 tracrRNA를 포함하며, 이들은 crRNA의 CRISPR 반복 서열의 적어도 일부분, 및 crRNA의 CRISPR 반복 서열에 대해 완전히 또는 부분적으로 상보성일 수 있는 tracrRNA의 적어도 일부분을 통해 서로 혼성화된다. 가이드 RNA가 단일 가이드 RNA인 이들 일부 실시양태에서, crRNA 및 tracrRNA는 링커 뉴클레오티드 서열에 의해 분리된다. 일반적으로, 링커 뉴클레오티드 서열은 링커 뉴클레오티드 서열의 뉴클레오티드 내에서 또는 이를 포함하는 이차 구조의 형성을 피하기 위해 상보성 염기를 포함하지 않는 것이다. 일부 실시양태에서, crRNA와 tracrRNA 사이의 링커 뉴클레오티드 서열은 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12개 또는 그 초과의 뉴클레오티드 길이이다. 특정한 실시양태에서, 단일 가이드 RNA의 링커 뉴클레오티드 서열은 적어도 4개 뉴클레오티드 길이이다. 특정한 실시양태에서, 링커 뉴클레오티드 서열은 서열식별번호: 8 또는 31에 제시된 뉴클레오티드 서열이다. 다른 실시양태에서, 링커 뉴클레오티드 서열은 적어도 6개 뉴클레오티드 길이이다.
단일 가이드 RNA 또는 이중-가이드 RNA는 화학적으로 또는 시험관내 전사를 통해 합성될 수 있다. RGN과 가이드 RNA 사이의 서열-특이적인 결합을 결정하기 위한 검정은 관련 기술분야에 공지되어 있고, 발현된 RGN과 가이드 RNA 사이의 시험관내 결합 검정이 포함되나 이로 제한되지 않으며, 이는 검출가능한 표지 (예를 들어, 비오틴)에 의해 태그 부착될 수 있고, 검출가능한 표지를 통해 (예를 들어, 스트렙타비딘 비드에 의해) 가이드 RNA:RGN 복합체를 포획하는 풀다운(pull-down) 검출 검정에서 이용될 수 있다. 가이드 RNA에 대해 관련이 없는 서열 또는 구조를 갖는 대조군 가이드 RNA는 RGN과 RNA의 비-특이적인 결합에 대한 음성 대조군으로서 사용될 수 있다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 4, 19, 27, 38, 46, 53, 64, 65 또는 66이고, 스페이서 서열은 임의의 서열일 수 있고 폴리-N 서열로 표시된다.
특정한 실시양태에서, 가이드 RNA는 RNA 분자로서 표적 세포, 소기관 또는 배아에 도입될 수 있다. 가이드 RNA는 시험관내에서 전사될 수 있거나 또는 화학적으로 합성될 수 있다. 다른 실시양태에서, 가이드 RNA를 코딩하는 뉴클레오티드 서열은 세포, 소기관 또는 배아에 도입된다. 이들 일부 실시양태에서, 가이드 RNA를 코딩하는 뉴클레오티드 서열은 프로모터 (예를 들어, RNA 폴리머라제 III 프로모터)에 작동가능하게 연결된다. 프로모터는 본래의 프로모터일 수 있거나 또는 가이드 RNA-코딩 뉴클레오티드 서열에 대해 이종성일 수 있다.
다양한 실시양태에서, 가이드 RNA는 본원에 기재된 바와 같이 리보핵단백질 복합체로서 표적 세포, 소기관 또는 배아에 도입될 수 있으며, 가이드 RNA는 RNA-가이드된 뉴클레아제 폴리펩티드에 결합된다.
가이드 RNA는 가이드 RNA와 표적 뉴클레오티드 서열의 혼성화를 통해 연관된 RNA-가이드된 뉴클레아제를 특정한 관심 표적 뉴클레오티드 서열로 지시한다. 표적 뉴클레오티드 서열은 DNA, RNA, 또는 이들 둘의 조합물을 포함할 수 있고, 단일 가닥 또는 이중 가닥일 수 있다. 표적 뉴클레오티드 서열은 게놈 DNA (즉, 염색체 DNA), 플라스미드 DNA, 또는 RNA 분자 (예를 들어, 메신저 RNA, 리보솜 RNA, 전달 RNA, 마이크로 RNA, 소형 간섭 RNA)일 수 있다. 표적 뉴클레오티드 서열은 시험관내에서 또는 세포에서 RNA-가이드된 뉴클레아제에 의해 결합될 수 있다 (그리고 일부 실시양태에서 절단될 수 있다). RGN에 의해 표적화된 염색체 서열은 핵, 색소체 또는 미토콘드리아 염색체 서열일 수 있다. 일부 실시양태에서, 표적 뉴클레오티드 서열은 표적 게놈에서 고유하다.
표적 뉴클레오티드 서열은 프로토스페이서 인접한 모티프 (PAM)에 인접해 있다. 프로토스페이서 인접한 모티프는 일반적으로 표적 뉴클레오티드 서열로부터 약 1 내지 약 10개 뉴클레오티드 이내에, 예컨대 표적 뉴클레오티드 서열로부터 약 1, 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9 또는 약 10개 뉴클레오티드 이내에 있다. PAM은 표적 서열의 5' 또는 3'일 수 있다. 일부 실시양태에서, PAM은 본원에 개시된 RGN에 대한 표적 서열의 3'이다. 일반적으로, PAM은 약 3-4개 뉴클레오티드의 컨센서스 서열이지만, 특정한 실시양태에서 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 초과의 뉴클레오티드 길이일 수 있다. 다양한 실시양태에서, 본원에 개시된 RGN에 의해 인식되는 PAM 서열은 서열식별번호: 7, 22, 30, 41 또는 49에 제시된 컨센서스 서열을 포함한다.
특정한 실시양태에서, 서열식별번호: 1, 16, 24, 35, 43 또는 50을 갖는 RNA-가이드된 뉴클레아제, 또는 그의 활성 변이체 또는 단편은 각각 서열식별번호: 7, 22, 30, 41 또는 49에 제시된 PAM 서열에 인접한 표적 뉴클레오티드 서열에 결합한다. 이들 일부 실시양태에서, RGN은 각각 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 CRISPR 반복 서열을 포함하는 가이드 서열, 또는 그의 활성 변이체 또는 단편, 및 각각 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 tracrRNA 서열, 또는 그의 활성 변이체 또는 단편에 결합한다. RGN 시스템은 본 명세서의 실시예 1 및 표 1에서 추가로 기재된다.
주어진 뉴클레아제 효소에 대한 PAM 서열 특이성이 효소 농도에 의해 영향을 받는다는 것은 관련 기술분야에 널리 공지되어 있고 (예를 들어, [Karvelis et al. (2015) Genome Biol 16:253] 참고), 이는 RGN을 발현하기 위해 사용된 프로모터, 또는 세포, 소기관 또는 배아에 전달된 리보핵단백질 복합체의 양을 변경시킴으로써 변형될 수 있다.
그의 상응하는 PAM 서열을 인식할 때, RGN은 특이적인 절단 부위에서 표적 뉴클레오티드 서열을 절단할 수 있다. 본원에서 사용된 바와 같이, 절단 부위는 표적 뉴클레오티드 서열 내의 2개의 특정한 뉴클레오티드로 구성되며, 이들 사이에서 뉴클레오티드 서열이 RGN에 의해 절단된다. 절단 부위는 5' 또는 3' 방향으로 PAM으로부터 1번째 및 2번째, 2번째 및 3번째, 3번째 및 4번째, 4번째 및 5번째, 5번째 및 6번째, 7번째 및 8번째, 또는 8번째 및 9번째 뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, 절단 부위는 5' 또는 3' 방향으로 PAM으로부터 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드에 걸쳐 있을 수 있다. 일부 실시양태에서, 절단 부위는 PAM으로부터 4개 뉴클레오티드 떨어져 있다. 다른 실시양태에서, 절단 부위는 PAM으로부터 적어도 15개 뉴클레오티드 떨어져 있다. RGN이 표적 뉴클레오티드 서열을 절단하여 엇갈린 말단을 생성할 수 있기 때문에, 일부 실시양태에서, 절단 부위는 폴리뉴클레오티드의 양성 (+) 가닥 상의 PAM으로부터 2개 뉴클레오티드의 거리 및 폴리뉴클레오티드의 음성 (-) 가닥 상의 PAM으로부터 2개 뉴클레오티드의 거리를 기반으로 하여 정의된다.
III. 융합 단백질
본원에서 사용된 바와 같이, 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어 뉴클레아제의 결합 도메인 및 절단 도메인을 연결하는 화학적 기 또는 분자를 지칭한다. 일부 실시양태에서, 링커는 RNA 가이드된 뉴클레아제 및 데아미나제를 결합시킨다. 일부 실시양태에서, 링커는 dCas9 및 데아미나제를 결합시킨다. 전형적으로, 링커는 2개의 기, 분자 또는 다른 모이어티 사이에 위치하거나 또는 그에 의해 플랭킹되고, 공유 결합을 통해 서로 연결되어 이들 둘을 연결시킨다. 일부 실시양태에서, 링커는 아미노산 또는 여러 개의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 또는 150-200개 아미노산 길이이다. 더 길거나 또는 더 짧은 링커 또한 고려된다.
본 개시내용의 일부 측면은 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 단백질을 제공한다. DNA-결합 폴리펩티드는 DNA에 결합하는 임의의 단백질 또는 단백질 도메인일 수 있다. 일부 실시양태에서, 융합 단백질의 DNA-결합 폴리펩티드는 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN이다. 본 개시내용의 일부 측면은 RNA-가이드된 DNA-결합 폴리펩티드 및 데아미나제 폴리펩티드를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 RNA-가이드된 뉴클레아제이다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 본 발명의 RGN이다. 일부 실시양태에서, RGN은 본 발명의 RGN이 아니다. 추가의 실시양태에서, RNA-가이드된 뉴클레아제는 CRISPR-Cas 단백질이다. 여전히 추가의 실시양태에서, CRISPR-Cas 단백질은 유형 II CRISPR-Cas 단백질이다. 다른 실시양태에서, CRISPR-Cas 단백질은 유형 V CRISPR-Cas 단백질이다. 다른 실시양태에서, CRISPR-Cas 단백질은 유형 VI CRISPR-Cas 단백질이다. 일부 실시양태에서, RNA-가이드된 뉴클레아제는 가이드 RNA에 결합하는 Cas9 도메인이며, 이는 가닥 혼성화를 통해 표적 핵산 서열과 결합한다. 일부 실시양태에서, 데아미나제 폴리펩티드는 예를 들어 시티딘 또는 아데닌과 같은 핵염기를 탈아미노화시킬 수 있는 데아미나제 도메인일 수 있다. 일부 실시양태에서, 데아미나제 폴리펩티드는 임의의 서열식별번호: 374-545 또는 572-584로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함한다. 이들 실시양태의 일부에서, 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함한다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 초래하여, DNA 분자를 변형시킨다. 이러한 변형 작용은 본원에서 핵산 편집, 또는 염기 편집으로도 지칭된다. 따라서, Cas9 변이체 또는 도메인 및 데아미나제 도메인을 포함하는 융합 단백질은 핵산 서열의 표적화된 편집을 위해 사용될 수 있다.
이러한 융합 단백질은 예를 들어 돌연변이성 세포의 생성을 위해 시험관내에서 DNA의 표적화된 편집에 유용하다. 이들 돌연변이성 세포는 식물 또는 동물에 있을 수 있다. 이러한 융합 단백질은 또한 예를 들어 생체 외에서 포유동물 세포에서, 예를 들어 동일한 또는 또 다른 대상체에게 후속적으로 재도입되는 대상체로부터 수득된 세포에서 유전적 결함의 수정을 위해 표적화된 돌연변이를 도입하는데; 및 예를 들어 포유동물 대상체에서 질환-연관된 유전자에서 유전적 결함의 수정 또는 불활성화 돌연변이의 도입을 위해 표적화된 돌연변이를 도입하는데 유용할 수 있다. 이러한 융합 단백질은 또한 식물 세포에서 표적화된 돌연변이를 도입하는데, 예를 들어 유익한 또는 농경학적으로 가치있는 형질 또는 대립유전자를 도입하는데 유용할 수 있다.
본원에서 사용된 바와 같이, 용어 "우라실 글리코실라제 억제제" 또는 "UGI"는 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 수 있는 단백질을 지칭한다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합된 뉴클레아제-불활성 RGN, 예컨대 Cas9 (dCas9)를 포함한다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합된 닉카제 RGN, 예컨대 Cas9 (nCas9)를 포함한다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합되고 추가로 UGI 도메인에 융합된 뉴클레아제 불활성 RGN 또는 닉카제 RGN을 포함한다.
일부 실시양태에서, 융합 단백질의 닉카제 RGN은 RGN이 핵산 듀플렉스의 표적 가닥 (PAM을 포함하는 가닥)만을 절단할 수 있게 하는 D10A 돌연변이 또는 상동적으로 등가의 돌연변이 (서열식별번호: 569; 또는 유사하게 서열식별번호: 553)를 포함한다. 일부 실시양태에서, 융합 단백질의 뉴클레아제-불활성 ("데드") RGN은 RGN이 DNA 표적을 절단할 수 없게 만드는 D10A 돌연변이 및 H840A 돌연변이 또는 상동적으로 등가의 돌연변이 (서열식별번호: 568; 또는 유사하게 서열식별번호: 547)를 포함한다. 일부 실시양태에서, 융합 단백질의 닉카제 RGN은 RGN이 핵산 듀플렉스의 비-표적 가닥 (PAM을 포함하지 않는 가닥)만을 절단할 수 있게 하는 H840A 돌연변이를 포함한다. H840A 돌연변이 또는 등가의 돌연변이를 포함하는 닉카제 RGN은 불활성화된 HNH 도메인을 갖는다. D10A 돌연변이 또는 등가의 돌연변이를 포함하는 닉카제 RGN은 불활성화된 RuvC 도메인을 갖는다. 데아미나제는 비-표적 가닥에 대해 작용한다. D10A 돌연변이 또는 등가의 돌연변이를 포함하는 닉카제는 불활성 RuvC 뉴클레아제 도메인을 갖고, DNA의 비-표적화된 가닥, 즉, 염기 편집을 원하는 가닥을 절단할 수 없다.
일부 실시양태에서, 본원에 기재된 융합 단백질의 RGN은 닉카제 활성을 가지며, 닉카제는 RGN의 단편 또는 RGN의 닉카제 변이체일 수 있다. 일부 실시양태에서, 본원에 기재된 융합 단백질의 RGN 도메인은 적어도 부분적으로 불활성화된 뉴클레아제 활성을 가지며, RNA-가이드된 DNA-결합 폴리펩티드로 지칭될 수 있다. 본원에 기재된 상기 융합 단백질의 사용 방법 또한 제공된다. 일부 실시양태에서, RGN은 Cas9 단백질이다. 비제한적인 예시적인 뉴클레아제-불활성 및 닉카제 Cas9 도메인이 본원에서 제공된다. 한 예시적인 적합한 뉴클레아제-불활성 RGN 도메인은 D10A/H840A Cas9 도메인 돌연변이체이다 (예를 들어, [Qi et al., Cell. 2013; 152(5): 1173-83]을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨). 추가의 적합한 뉴클레아제-불활성 Cas9 도메인은 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다. 이러한 추가의 예시적인 적합한 뉴클레아제 불활성 Cas9 도메인에는 D10A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이성 도메인이 포함되나 이로 제한되지 않는다 (예를 들어, [Mali et al., Nature Biotechnology. 2013; 31(9): 833-838]을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨). 추가로, 다른 공지된 RGN의 적합한 뉴클레아제-불활성 RGN 도메인이 결정될 수 있다 (예를 들어, 서열식별번호: 547, RGN APG08290.1의 뉴클레아제-불활성 변이체; 미국 특허 출원 번호 16/432,321을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨).
본 개시내용의 일부 측면은 (i) 뉴클레아제-불활성 또는 닉카제 RGN 또는 도메인; 및 (ii) 데아미나제 효소 또는 도메인을 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 DNA-편집 효소 또는 도메인이다. 일부 실시양태에서, 데아미나제 효소는 데아미나제 활성을 갖는다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 데아미나제 도메인이거나 또는 그를 포함한다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 패밀리 데아미나제이다. 다른 실시양태에서, 데아미나제는 APOBEC3 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 시티딘 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 ACF1/ASE 데아미나제이다. 일부 실시양태에서, 데아미나제는 아데노신 데아미나제이다. 일부 실시양태에서, 데아미나제는 ADAT 패밀리 데아미나제이다. 일부 핵산 데아미나제 효소 및 도메인은 본원에서 상세하게 기재된다 (표 17 참고). 추가의 적합한 데아미나제 효소 또는 도메인은 본 개시내용을 기반으로 하여 기술자에게 자명할 것이다. 이들 실시양태의 일부에서, 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함한다.
본 개시내용은 다양한 구성의 융합 단백질을 제공한다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 RGN 도메인의 N-말단에 융합된다. 일부 실시양태에서, 데아미나제 효소 또는 도메인은 RGN 도메인의 C-말단에 융합된다. 일부 실시양태에서, 링커는 (GGGGS)n (서열식별번호: 585), (G)n (서열식별번호: 586), (EAAAK)n (서열식별번호: 587), 또는 (XP)n (서열식별번호: 588) 모티프, 또는 이들의 임의의 조합물을 포함하고, 여기서 n은 독립적으로 1 내지 30의 정수이다. 일부 실시양태에서, n은 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30이거나, 또는 1개 초과의 링커 또는 1개 초과의 링커 모티프가 존재하는 경우, 이들의 임의의 조합이다. 추가의 적합한 링커 모티프 및 링커 구성은 관련 기술분야의 기술자에게 자명할 것이다. 일부 실시양태에서, 적합한 링커 모티프 및 구성에는 [Chen et al., Fusion protein linkers: property, design and functionality (Adv Drug Deliv Rev. 2013; 65(10):1357-69]에 기재된 것들이 포함되며, 그의 전체 내용은 본원에 참고로 포함된다. 추가의 적합한 링커 서열은 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다.
일부 실시양태에서, 본원에 기재된 예시적인 융합 단백질의 일반적인 아키텍쳐는 하기 구조를 포함하며: [NH2]-[데아미나제 효소 또는 도메인]-[RGN 단백질 또는 도메인][COOH] 또는 [NH2]-[RGN 단백질 또는 도메인]-[데아미나제 효소 또는 도메인][COOH], 여기서 NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 추가의 특징, 예를 들어 NLS와 융합 단백질의 나머지 사이에 및/또는 데아미나제 효소 또는 도메인과 RGN 단백질 또는 도메인 사이에 하나 이상의 링커 서열이 존재할 수 있다. 존재할 수 있는 다른 예시적인 특징은 국재화 서열, 예컨대 핵 국재화 서열, 세포질 국재화 서열, 수출 서열, 예컨대 핵 수출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제 또는 검출에 유용한 서열 태그이다. 본원에 제공된 적합한 국재화 신호 서열 및 단백질 태그 서열에는 비오틴 카르복실라제 운반 단백질 (BCCP) 태그, myc-태그, 칼모듈린-태그, FLAG-태그, 헤마글루티닌 (HA)-태그, 폴리히스티딘 태그 (히스티딘 태그 또는 His-태그로도 지칭됨), 말토스 결합 단백질 (MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제 (GST)-태그, 녹색 형광 단백질 (GFP)-태그, 티오레독신-태그, S-태그, 소프태그 (예를 들어, 소프태그 1, 소프태그 3), 스트렙태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그가 포함되나 이로 제한되지 않는다. 추가의 적합한 서열은 관련 기술분야의 기술자에게 자명할 것이다.
일부 실시양태에서, 데아미나제 효소, 또는 데아미나제 효소 또는 도메인을 갖는 예시적인 융합 단백질의 일반적인 아키텍쳐는 하기 구조를 포함하며: [NH2]-[NLS]-[RGN 단백질 또는 도메인]-[데아미나제]-[COOH], [NH2]-[NLS]-[데아미나제]-[RGN 단백질 또는 도메인]-[COOH], [NH2]-[RGN 단백질 또는 도메인]-[데아미나제]-[COOH], 또는 [NH2]-[데아미나제]-[RGN 단백질 또는 도메인]-[COOH], 여기서 NLS는 핵 국재화 신호이고, NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 일부 실시양태에서, 링커는 RGN 단백질 또는 도메인과 데아미나제 사이에 삽입된다. 일부 실시양태에서, NLS는 데아미나제 및/또는 RGN 단백질 또는 도메인의 C-말단에 위치한다. 일부 실시양태에서, NLS는 데아미나제와 RGN 단백질 또는 도메인 사이에 위치한다. 추가의 특징, 예컨대 서열 태그 또한 존재할 수 있다. 본원에서 "RGN 단백질 또는 도메인"은 임의의 RNA-가이드된 뉴클레아제, 예컨대 CRISPR-Cas 단백질 및 그의 변이체 및 돌연변이체를 나타내며, 이는 본 발명의 융합 단백질을 생성하기 위해 사용될 수 있다. RGN 단백질은 뉴클레아제-불활성 RGN 또는 CRISPR-Cas, 예컨대 예를 들어 dCas9 (서열식별번호: 568) 또는 대안적으로 서열식별번호: 547, 또는 RGN 또는 Cas9 닉카제, 예를 들어 서열식별번호: 569 (또는 서열식별번호: 553)일 수 있다. 일부 실시양태에서, 본 발명의 융합 단백질은 RNA-가이드된 DNA-결합 폴리펩티드 및 데아미나제를 포함하고, 데아미나제는 임의의 서열식별번호: 374-545 또는 572-584, 또는 그의 활성 변이체와 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일한 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 융합 단백질은 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나로부터 선택된 아미노산 서열, 또는 그의 변이체를 포함하는 데아미나제 폴리펩티드를 포함한다. 이러한 융합 단백질의 예는 본원에서 실시예 부분에 기재된다.
데아미나제 효소 및 도메인의 한 예시적인 적합한 유형은 예를 들어 APOBEC 패밀리의 시토신 데아미나제이다. 시토신 데아미나제 효소의 아포지단백질 B mRNA 편집 복합체 (APOBEC) 패밀리는 제어되고 유익한 방식으로 돌연변이 유발을 개시하기 위해 작용하는 11개의 단백질을 포함한다 (Conticello et al., 2008. Genome Biology, 9(6): 229). 한 패밀리 구성원인 활성화-유도된 시티딘 데아미나제 (AID)는 전사 의존적인 가닥-편향된 방식으로 ssDNA에서 시토신을 우라실로 전환시킴으로써 항체의 성숙을 담당한다 (Reynaud et al., 2003. Nature Immunology, 4(7): 631-638). 아포지단백질 B 편집 복합체 3 (APOBEC3) 효소는 역전사된 바이러스 ssDNA에서 시토신의 탈아미노화를 통해 특정한 HIV-1 균주에 대한 인간 세포의 보호를 제공한다 (Bhagwat et al., 2004, 3(1): 85-9). 이들 단백질은 모두 촉매적 활성을 위해 Zn2+-배위 모티프 (HisX- Glu-X23-26-Pro-Cys-X2-4-Cys; 서열식별번호: 589) 및 결합된 물 분자를 필요로 한다. Glu 잔기는 탈아미노화 반응에서 친핵성 공격을 위해 물 분자를 수산화아연으로 활성화시키는 역할을 한다. 각각의 패밀리 구성원은 hAID의 경우 WRC (W는 A 또는 T이고, R은 A 또는 G임)에서부터 hAPOBEC3F의 경우 TTC에 이르는 그 자신의 특정한 "핫스팟"에서 우세하게 탈아미노화한다 (Navaratnam et al., 2006. Intl J Hematol 83(3): 195-200). APOBEC3G의 촉매적 도메인의 최근의 결정 구조는 6개의 α-나선에 의해 플랭킹된 5-가닥 β-시트 코어로 구성된 이차 구조를 밝혀 내었으며, 이는 전체 패밀리에 걸쳐 보존되는 것으로 믿어진다 (Holden et al., 2008. Nature 456(7218): 121-124). 활성 중심 루프는 ssDNA 결합 및 "핫스팟" 동일성 결정 둘 다를 담당하는 것으로 확인되었다 (Chelico et al., 2009. J Biol Chem 284(41): 27761-27765). 이들 효소의 과발현은 게놈 불안정성 및 암과 관련이 있으며, 그에 따라 서열-특이적인 표적화의 중요성을 강조한다 (Pham et al., 2005. Biochem 44(8): 2703-2715).
데아미나제 효소 및 도메인의 또 다른 예시적인 적합한 유형은 아데노신 데아미나제이다. ADAT 패밀리 아데노신 데아미나제는 RGN 또는 RGN의 단편 또는 도메인 또는 그의 변이체, 예를 들어 뉴클레아제-불활성 Cas9 도메인에 융합될 수 있으며, 그에 따라 Cas9-ADAT 융합 단백질을 생성한다. 본 개시내용은 RGN 또는 RGN의 단편 또는 도메인 또는 그의 변이체와 데아미나제 효소, 예를 들어 시토신 데아미나제, 예컨대 APOBEC 효소, 또는 아데노신 데아미나제 효소, 예컨대 ADAT 효소 사이의 체계적인 일련의 융합을 포함하며, 이로써 RGN-데아미나제 융합체는 게놈 DNA에서 특이적인 부위에 대한 데아미나제의 효소 활성을 지시한다. 인식 작용제로서 RGN 사용의 이점은 두 가지이다: (1) 융합 단백질의 서열 특이성은 sgRNA 서열을 간단히 변화시킴으로써 용이하게 변경될 수 있고, (2) RGN, 예컨대 Cas9는 dsDNA를 변성시킴으로써 그의 표적 서열에 결합하여, 단일-가닥인 DNA의 스트레치, 따라서 데아미나제의 생존가능한 기질을 생성한다. 성공적인 융합 단백질은 인간 및 마우스 데아미나제 도메인, 예를 들어 AID 도메인에 의해 생성되었다 (WO 2010132092, 본원에 참고로 포함됨). 본원에 인용된 데아미나제와 RGN 사이의 다양한 다른 융합 단백질 또한 고려된다.
RGN-DNA 복합체 (RGN-DNA 버블의 크기)에서 단일 가닥인 DNA의 부분은 설명되지 않았다. 그러나, sgRNA가 비-주형 가닥에 결합할 때에만 전사 간섭이 발생한다는 것이 전사를 간섭하도록 복합체에 대해 특이적으로 설계된 sgRNA를 갖는 dCas9 시스템에서 확인되었다. 이 결과는 DNA-Cas9 복합체에서 DNA의 특정한 부분이 Cas9에 의해 보호되지 않고, 융합 단백질에서 데아미나제에 의해 잠재적으로 표적화될 수 있음을 시사한다 (Qi et al., 2013. Cell 152(15): 1173-83). 따라서, 데아미나제 도메인을 갖는 Cas9의 N-말단 및 C-말단 융합 둘 다 또는 일반적으로 RGN은 본 개시내용의 측면에 따라 유용하다.
일부 실시양태에서, RGN의 데아미나제 도메인 및 RNA-가이드된 DNA-결합 도메인은 링커를 통해 서로 융합된다. 데아미나제 도메인 (예를 들어, AID)과 RGN 도메인 사이에 다양한 링커 길이 및 가요성이 이용될 수 있다 (예를 들어, 특정한 적용을 위해 데아미나제 활성에 대한 최적의 길이를 달성하기 위해 (GGGGS)n (서열식별번호 590) 및 (G)n 형태의 매우 가요성인 링커에서부터 (EAAAK)n (서열식별번호: 591) 및 (XP)n 형태의 더욱 강직한 링커에 이르는 범위).
본 개시내용의 측면에 따라 RNA-가이드된 DNA-결합 도메인에 융합될 수 있는 일부 예시적인 적합한 핵산 편집 효소 및 도메인, 예를 들어 데아미나제 및 데아미나제 도메인이 제공된다 (서열식별번호: 374-545 및 572-584). 일부 실시양태에서, 각각의 서열의 활성 도메인, 예를 들어 국재화 신호 (핵 국재화 신호, 핵 수출 신호없이, 세포질 국재화 신호)가 없는 도메인이 사용될 수 있는 것으로 이해될 것이다.
일부 실시양태에서, 본원에 제공된 융합 단백질은 데아미나제 효소의 전장 아미노산, 예를 들어 서열식별번호: 374-545 또는 572-584 중 어느 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에 제공된 융합 단백질은 핵산 편집 효소의 전장 서열을 포함하지 않고, 그의 단편만을 포함한다. 예를 들어, 일부 실시양태에서, 본원에 제공된 융합 단백질은 예를 들어 RNA-가이드된 DNA-결합 도메인 및 데아미나제 효소의 단편을 포함하고, 상기 단편은 데아미나제 도메인을 포함한다. 데아미나제 도메인의 예시적인 아미노산 서열은 표 17에 기재되고, 이러한 도메인의 추가의 적합한 서열은 관련 기술분야의 기술자에게 자명할 것이다.
본 발명의 측면에 따라 사용될 수 있는, 예를 들어 뉴클레아제-불활성 또는 닉카제 RGN 도메인에 융합될 수 있는 추가의 적합한 핵산 편집 효소 서열, 예를 들어 데아미나제 효소 및 도메인 서열은 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다. 일부 실시양태에서, 이러한 추가의 효소 서열에는 본원에 제공된 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 유사한 데아미나제 효소 또는 데아미나제 도메인 서열이 포함된다. 추가의 적합한 RGN 도메인, 변이체 및 서열 또한 관련 기술분야의 기술자에게 자명할 것이다. 이러한 추가의 적합한 RGN 도메인의 예에는 Dl0A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이성 도메인이 포함되나 이로 제한되지 않는다 (예를 들어, [Mali et al., Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838]을 참고하며, 그의 전체 내용은 본원에 참고로 포함됨).
RNA-가이드된 DNA-결합 도메인 및 데아미나제 도메인을 포함하는 융합 단백질을 생성하기 위한 추가의 적합한 전략은 관련 기술분야의 일반적인 지식과 함께 본 개시내용을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이다. 링커를 사용하거나 또는 링커를 사용하지 않고 본 개시내용의 측면에 따른 융합 단백질을 생성하기 위한 적합한 전략은 또한 본 개시내용 및 관련 기술분야의 지식에 비추어 관련 기술분야의 기술자에게 자명할 것이다.
일부 실시양태에서, RNA-가이드된 DNA-결합 도메인은 닉카제 활성을 갖는 RGN 단백질 변이체이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 도메인은 RGN 닉카제이다. 일부 실시양태에서, RGN은 본 발명의 RGN이다. 다른 실시양태에서, RGN은 본 발명의 RGN이 아니다. RGN 닉카제는 듀플렉스 핵산 분자 (예를 들어, 듀플렉스 DNA 분자, 이중-가닥 DNA 분자로도 지칭됨)의 한 가닥만을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 실시양태에서, RGN 닉카제는 듀플렉스 핵산 분자의 표적 가닥을 절단하며, 이는 RGN 닉카제가 RGN에 결합된 gRNA와 염기쌍을 형성한 (그에 대해 상보성인) 가닥을 절단함을 의미한다. 일부 실시양태에서, RGN 닉카제는 Dl0A 돌연변이 또는 등가의 돌연변이를 포함한다. 다른 실시양태에서, RGN 닉카제는 H840A 돌연변이 또는 등가의 돌연변이를 포함한다. 예를 들어, RGN 닉카제는 서열식별번호: 569에 제시된 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, RGN 닉카제는 D10A Cas9 닉카제이며, 이는 Cas9의 RuvC 도메인을 불활성화시키고, 듀플렉스 핵산 분자의 표적 비-염기 편집된 가닥을 절단시키며, 이는 D10A Cas9 닉카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)와 염기쌍을 형성한 염기인 가닥을 절단한다. 일부 실시양태에서, Cas9 닉카제는 H840A 돌연변이를 포함하고, 이는 Cas9 폴리펩티드의 HNH 도메인을 불활성화시킨다. H840A Cas9 닉카제는 비-표적 염기-편집된 가닥을 절단할 것이다. 일부 실시양태에서, RGN 닉카제는 서열식별번호: 568, 569, 547 또는 553과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 닉카제로 돌연변이된 추가의 적합한 RGN 단백질은 본 개시내용 및 관련 기술분야의 지식 (예를 들어 미국 특허 출원 번호 16/432,321에 개시된 RGN)을 기반으로 하여 관련 기술분야의 기술자에게 자명할 것이고, 본 개시내용의 범위 내에 있다.
본 개시내용의 일부 측면은 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하는 융합 단백질에 관한 것이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 도메인 (예를 들어, 뉴클레아제 활성 RGN 도메인, 또는 뉴클레아제 불활성이거나 또는 닉카제로서 기능하는 RGN 변이체)을 포함하는 본원에 제공된 임의의 융합 단백질은 적어도 하나의 UGI 도메인에 직접적으로 또는 링커를 통해 추가로 융합될 수 있다. 일부 실시양태에서, 융합 단백질은 적어도 2개의 UGI 도메인에 직접적으로 또는 링커를 통해 추가로 융합된다. 본 개시내용의 일부 측면은 적어도 1개의 UGI 도메인에 추가로 융합되고, UGI 도메인을 포함하지 않는 유사한 융합 단백질과 비교하여 증가된 C→T 핵염기 편집 효율을 갖는, 데아미나제-RGN 융합 단백질, 데아미나제-뉴클레아제 불활성 RGN 융합 단백질 및 데아미나제-닉카제 RGN 융합 단백질을 제공한다. 임의의 특정한 이론에 구애되기를 바라진 않지만, U:G 헤테로듀플렉스 DNA의 존재에 대한 세포성 DNA-복구 반응은 세포에서 핵염기 편집 효율의 감소에 대한 원인일 수 있다. 예를 들어, 우라실 DNA 글리코실라제 (UDG)는 세포에서 DNA로부터 U의 제거를 촉매하며, 이는 염기 절제 복구를 개시할 수 있으며, 가장 일반적인 결과로서 U:G 쌍에서 C:G 쌍으로 역전시킨다.
본 개시내용은 UGI 도메인에 추가로 융합된, 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 단백질을 고려한다. 본 개시내용은 또한 UGI 도메인에 추가로 융합된, 데아미나제, RGN 닉카제 또는 뉴클레아제 불활성 RGN 폴리펩티드를 포함하는 융합 단백질을 고려한다. UGI 도메인의 사용이 C에서 U로의 변화를 촉매할 수 있는 핵산 편집 도메인의 편집 효율을 증가시킬 수 있음을 이해해야 한다. 예를 들어, UGI 도메인을 포함하는 융합 단백질은 C 잔기를 탈아미노화시키는데 더욱 효율적일 수 있다. 일부 실시양태에서, 융합 단백질은 하기 구조를 포함한다: [데아미나제]-[임의적인 링커 서열]- [뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[UGI]; [데아미나제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[뉴클레아제-불활성 RGN]; [UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[뉴클레아제-불활성 RGN]; [UGI]-[임의적인 링커 서열]-[뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[데아미나제]; [뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[UGI]; 또는 [뉴클레아제-불활성 RGN]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[데아미나제]. "뉴클레아제-불활성 RGN"이 뉴클레아제-불활성으로 돌연변이된 임의의 RGN, 예컨대 임의의 CRISPR-Cas 단백질을 나타냄을 이해해야 한다. 또한, "UGI"가 1개 이상의 UGI 도메인을 나타냄을 이해해야 한다.
다른 실시양태에서, 융합 단백질은 하기 구조를 포함한다: [데아미나제]-[임의적인 링커 서열]-[RGN 닉카제]-[임의적인 링커 서열]-[UGI]; [데아미나제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[RGN 닉카제]; [UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[RGN 닉카제]; [UGI]-[임의적인 링커 서열]-[RGN 닉카제]-[임의적인 링커 서열]-[데아미나제]; [RGN 닉카제]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[UGI]; 또는 [RGN 닉카제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[데아미나제]. "RGN 닉카제"가 닉카제로서 활성인 것으로 돌연변이된 임의의 RGN, 예컨대 임의의 CRISPR-Cas 단백질을 나타냄을 이해해야 한다. 또한, "UGI"가 1개 이상의 UGI 도메인을 나타냄을 이해해야 한다.
일부 실시양태에서, 본원에 제공된 융합 단백질은 링커 서열을 포함하지 않는다. 일부 실시양태에서, 임의적인 링커 서열 중 하나 또는 둘 다가 존재한다.
일부 실시양태에서, 상기 일반적인 아키텍쳐에서 사용된 "-"는 임의적인 링커 서열의 존재를 나타낸다. 일부 실시양태에서, UGI를 포함하는 융합 단백질은 핵 표적화 서열, 예를 들어 핵 국재화 서열을 추가로 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질은 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 융합 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 융합 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 RGN 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 RGN 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 데아미나제의 N-말단에 융합된다. 일부 실시양태에서, NLS는 데아미나제의 C-말단에 융합된다. 일부 실시양태에서, NLS는 제2 RGN의 N-말단에 융합된다. 일부 실시양태에서, NLS는 제2 RGN의 C-말단에 융합된다. 일부 실시양태에서, NLS는 하나 이상의 링커를 통해 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 링커없이 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 본원에 제공되거나 또는 참고된 NLS 서열 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, NLS는 서열식별번호: 10에 제시된 아미노산 서열을 포함한다.
일부 실시양태에서, UGI 도메인은 야생형 UGI 또는 서열식별번호: 570에 제시된 UGI를 포함한다. 일부 실시양태에서, 본원에 제공된 UGI 단백질에는 UGI의 단편, 및 UGI 또는 UGI 단편에 대해 상동성인 단백질이 포함된다. 예를 들어, 일부 실시양태에서, UGI 도메인은 서열식별번호: 570에 제공된 아미노산 서열의 단편을 포함한다. 일부 실시양태에서, UGI 단편은 서열식별번호: 570에 제시된 아미노산 서열의 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5%를 포함하는 아미노산 서열을 포함한다. 일부 실시양태에서, UGI는 서열식별번호: 570에 제시된 아미노산 서열에 대해 상동성인 아미노산 서열 또는 서열식별번호: 570에 제시된 아미노산 서열의 단편에 대해 상동성인 아미노산 서열을 포함한다. 일부 실시양태에서, UGI 또는 UGI 단편, 또는 UGI 또는 UGI 단편의 상동체를 포함하는 단백질은 "UGI 변이체"로 지칭된다. UGI 변이체는 UGI 또는 그의 단편과 상동성을 공유한다. 예를 들어, UGI 변이체는 야생형 UGI 또는 서열식별번호: 570에 제시된 UGI와 적어도 70% 동일한, 적어도 75% 동일한, 적어도 80% 동일한, 적어도 85% 동일한, 적어도 90% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 적어도 99.9% 동일한 것이다. 일부 실시양태에서, UGI 변이체는 UGI의 단편을 포함하며, 상기 단편은 야생형 UGI 또는 서열식별번호: 570에 제시된 UGI의 상응하는 단편과 적어도 70% 동일한, 적어도 80% 동일한, 적어도 90% 동일한, 적어도 95% 동일한, 적어도 96% 동일한, 적어도 97% 동일한, 적어도 98% 동일한, 적어도 99% 동일한, 적어도 99.5% 동일한 또는 적어도 99.9%이다.
적합한 UGI 단백질 및 뉴클레오티드 서열은 본원에 제공되고, 추가의 적합한 UGI 서열은 관련 기술분야의 기술자에게 공지되어 있으며, 예를 들어 [Wang et al., 1989. J. Biol. Chem. 264: 1163-1171; Lundquist et al., 1997. J. Biol. Chem. 272:21408-21419; Ravishankar et al., 1998. Nucleic Acids Res. 26:4880-4887; 및 Putnam et al., 1999. J. Mol. Biol. 287:331-346(1999)]에 공개된 것들이 포함되고, 이들 각각의 전체 내용은 본원에 참고로 포함된다.
추가의 단백질이 우라실 글리코실라제 억제제일 수 있음을 이해해야 한다. 예를 들어, 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 수 있는 (예를 들어, 입체적으로 차단할 수 있는) 다른 단백질은 본 개시내용의 범위 내에 있다. 추가로, 염기-절제 복구를 차단하거나 또는 억제하는 임의의 단백질 또한 본 개시내용의 범위 내에 있다. 일부 실시양태에서, DNA와 결합하는 단백질이 사용된다. 또 다른 실시양태에서, UGI에 대한 대용물이 사용된다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 단일-가닥 DNA와 결합하는 단백질이다. 예를 들어, 우라실 글리코실라제 억제제는 에르위니아 타스마니엔시스(Erwinia tasmaniensis) 단일-가닥 결합 단백질일 수 있다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 우라실과 결합하는 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 DNA에서 우라실과 결합하는 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 촉매적으로 불활성인 우라실 DNA-글리코실라제 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 DNA로부터 우라실을 절제하지 않는 촉매적으로 불활성인 우라실 DNA-글리코실라제 단백질이다. 다른 우라실 글리코실라제 억제제는 관련 기술분야의 기술자에게 자명하며 본 개시내용의 범위 내에 있는 것으로 이해해야 한다. 적합한 UGI 단백질 서열 (서열식별번호: 570)이 본원에서 제공되고, 추가의 적합한 UGI 서열은 관련 기술분야에 공지되어 있으며, 예를 들어 [Wang et al., 1989. J. Biol. Chem. 264: 1163-1171; Lundquist et al., 1997. J. Biol. Chem. 272:21408-21419; Ravishankar et al. 1998. Nucleic Acids Res. 26:4880-4887; 및 Putnam et al., 1999. J. Mol. Biol. 287:331-346]에 공개된 것들이 포함되고, 그의 전체 내용은 본원에 참고로 포함된다. 일부 실시양태에서, 임의적인 링커는 (SGGS)n (서열식별번호: 592) 모티프를 포함하고, 여기서 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 19, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20이다. 일부 실시양태에서, 임의적인 링커는 서열식별번호: 546에 제시된 아미노산 서열을 포함한다.
특정 실시양태에서, 본원에 개시된 융합 단백질은 RGN의 세포 흡수를 용이하게 하는 적어도 하나의 세포-투과 도메인을 포함한다. 세포-투과 도메인은 관련 기술분야에 공지되어 있으며, 일반적으로 양으로 하전된 아미노산 잔기 (즉, 다중양이온성 세포-투과 도메인), 교대하는 극성 아미노산 잔기 및 비극성 아미노산 잔기 (즉, 양친매성 세포-투과 도메인), 또는 소수성 아미노산 잔기 (즉, 소수성 세포-투과 도메인)의 스트레치를 포함한다 (예를 들어, [Milletti F. (2012) Drug Discov Today 17:850-860] 참고). 세포-투과 도메인의 비제한적인 예는 인간 면역결핍 바이러스 1로부터의 트랜스-활성화 전사 활성화제 (TAT)이다.
핵 국재화 신호, 색소체 국재화 신호, 미토콘드리아 국재화 신호, 이중-표적화 국재화 신호, 및/또는 세포-투과 도메인은 융합 단백질의 아미노-말단 (N-말단), 카르복실-말단 (C-말단) 또는 내부 위치에 위치할 수 있다.
본 발명의 또 다른 실시양태는 융합 단백질, 및 단일 가이드 또는 이중 가이드 RNA로서 가이드 RNA (집합적으로 gRNA로 지칭됨)를 포함하는 리보핵단백질 복합체이다.
IV. RNA-가이드된 뉴클레아제, RNA-가이드된 DNA 결합 폴리펩티드, 데아미나제, CRISPR RNA, tracrRNA, 및 gRNA를 코딩하는 뉴클레오티드
본 개시내용은 본원에 개시된 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, CRISPR RNA, tracrRNA 및/또는 sgRNA를 포함하는 폴리뉴클레오티드를 제공한다. 본원에 개시된 폴리뉴클레오티드에는, 가이드 RNA 내에 포함될 때 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하거나 또는 코딩하는 폴리뉴클레오티드, 또는 그의 활성 변이체 또는 단편이 포함된다. 가이드 RNA 내에 포함될 때 연관된 RNA-가이드된 뉴클레아제와 관심 표적 서열의 서열-특이적인 결합을 지시할 수 있는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하거나 또는 코딩하는 폴리뉴클레오티드, 또는 그의 활성 변이체 또는 단편 또한 개시된다. RNA-가이드된 서열-특이적인 방식으로 표적 뉴클레오티드 서열에 결합하는 능력을 보유하는 서열식별번호: 1, 16, 24, 35, 43 또는 50에 제시된 아미노산 서열을 포함하는 RGN을 코딩하는 폴리뉴클레오티드, 및 그의 활성 단편 또는 변이체 또한 제공된다.
본 개시내용은 본원에 인용된 데아미나제 (서열식별번호: 374-545 및 572-584, 또는 그의 활성 변이체) 및 DNA 결합 폴리펩티드, 예를 들어 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN를 포함하는 융합 단백질을 코딩하는 폴리뉴클레오티드를 추가로 제공한다. 본 개시내용은 본원에 인용된 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 단백질을 코딩하는 폴리뉴클레오티드를 추가로 제공한다. 이러한 RNA-가이드된 DNA-결합 폴리펩티드는 본 발명의 RGN, 관련 기술분야에 공지된 RGN, CRISPR-Cas 단백질, 또는 이들의 임의의 단백질 변이체일 수 있다. 단백질 변이체는 뉴클레아제-불활성이거나 또는 닉카제일 수 있다. 이러한 RGN 변이체의 예에는 뉴클레아제-불활성 RGN (서열식별번호: 568 또는 서열식별번호: 547) 또는 RGN 닉카제 돌연변이체 (서열식별번호: 569 또는 서열식별번호: 553)가 포함된다. RGN 뉴클레아제의 다른 예는 관련 기술분야에 널리 공지되어 있으며, 유사한 상응하는 돌연변이는 뉴클레아제 불활성이거나 또는 닉카제인 돌연변이성 변이체를 생성할 수 있다.
용어 "폴리뉴클레오티드"의 사용은 본 개시내용을 DNA를 포함하는 폴리뉴클레오티드로 제한하는 것으로 의도되지 않는다. 관련 기술분야의 통상의 기술자는 폴리뉴클레오티드가 리보뉴클레오티드 (RNA), 및 리보뉴클레오티드 및 데옥시리보뉴클레오티드의 조합물을 포함할 수 있음을 인지할 것이다. 이러한 데옥시리보뉴클레오티드 및 리보뉴클레오티드에는 천연 발생 분자 및 합성 유사체 둘 다가 포함된다. 이들에는 펩티드 핵산 (PNA), PNA-DNA 키메라, 록킹된 핵산 (LNA), 및 포스포티오레이트 연결된 서열이 포함된다. 본원에 개시된 폴리뉴클레오티드는 또한 모든 형태의 서열, 예컨대 비제한적으로 단일 가닥 형태, 이중 가닥 형태, DNA-RNA 혼성체, 삼중 구조, 스템-루프 구조 등을 포괄한다.
RGN, 데아미나제 또는 융합 단백질을 코딩하는 핵산 분자는 관심 유기체에서의 발현을 위해 코돈 최적화될 수 있다. "코돈-최적화된" 코딩 서열은 특정한 숙주 세포의 선호된 코돈 사용 빈도 또는 전사 조건을 모방하도록 설계된 그의 코돈 사용 빈도를 갖는 폴리뉴클레오티드 코딩 서열이다. 특정한 숙주 세포 또는 유기체에서의 발현은 번역된 아미노산 서열이 변하지 않도록 핵산 수준에서 하나 이상의 코돈 변경의 결과로서 증강된다. 핵산 분자는 전체적으로 또는 부분적으로 코돈 최적화될 수 있다. 광범위한 유기체에 대한 선호도 정보를 제공하는 코돈 표 및 다른 참고자료가 관련 기술분야에서 이용가능하다 (예를 들어, 식물-선호 코돈 용법의 논의에 대해서는 [Campbell and Gowri (1990) Plant Physiol. 92:1-11] 참고). 식물-선호 유전자를 합성하는 방법은 관련 기술분야에서 이용가능하다. 예를 들어, 미국 특허 번호 5,380,831, 및 5,436,391, 및 [Murray et al. (1989) Nucleic Acids Res. 17:477-498]을 참고하며, 이들은 본원에 참고로 포함된다.
본원에 제공된 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드는 시험관내 발현 또는 관심 세포, 소기관, 배아 또는 유기체에서의 발현을 위해 발현 카세트에 제공될 수 있다. 카세트는 폴리뉴클레오티드의 발현을 가능하게 하는 본원에 제공된 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 5' 및 3' 조절 서열을 포함할 것이다. 카세트는 유기체에 동시 형질전환되는 적어도 하나의 추가의 유전자 또는 유전자 요소를 추가로 함유할 수 있다. 추가의 유전자 또는 요소가 포함되는 경우, 성분들은 작동가능하게 연결된다. 용어 "작동가능하게 연결된"은 2가지 이상의 요소들 사이의 기능적 연결을 의미하는 것으로 의도된다. 예를 들어, 프로모터와 관심 코딩 영역 (예를 들어, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 영역) 사이의 연결은 관심 코딩 영역의 발현을 가능하게 하는 기능적 연결이다. 작동가능하게 연결된 요소는 연속적 또는 비-연속적일 수 있다. 2가지 단백질 코딩 영역의 결합을 지칭하기 위해 사용되는 경우, 작동가능하게 연결된이란 코딩 영역이 동일한 리딩 프레임 내에 있는 것으로 의도된다. 대안적으로, 추가의 유전자(들) 또는 요소(들)가 다중 발현 카세트 상에 제공될 수 있다. 예를 들어, 본원에 개시된 RGN을 코딩하는 뉴클레오티드 서열은 하나의 발현 카세트 상에 존재할 수 있는 반면에, crRNA, tracrRNA 또는 완전 가이드 RNA를 코딩하는 뉴클레오티드 서열은 별도의 발현 카세트 상에 존재할 수 있다. 이러한 발현 카세트에는 조절 영역의 전사 조절하에 있는 폴리뉴클레오티드의 삽입을 위한 다수개의 제한 부위 및/또는 재조합 부위가 제공된다. 발현 카세트는 선택가능한 마커 유전자를 추가로 함유할 수 있다.
발현 카세트는 5'-3' 전사 방향으로 관심 유기체에서 기능적인 전사 (일부 실시양태에서는 번역) 개시 영역 (즉, 프로모터), 본 발명의 RGN-, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체-, 데아미나제-, crRNA-, tracrRNA- 및/또는 sgRNA-코딩 폴리뉴클레오티드, 및 전사 (일부 실시양태에서는 번역) 종결 영역 (즉, 종결 영역)을 포함할 것이다. 본 발명의 프로모터는 숙주 세포에서 코딩 서열의 발현을 지시하거나 또는 유도할 수 있다. 조절 영역 (예를 들어, 프로모터, 전사 조절 영역, 및 번역 종결 영역)은 숙주 세포에 대해 또는 서로에 대해 내인성 또는 이종성일 수 있다. 본원에서 사용된 바와 같이, 서열과 관련하여 "이종성"은 외래 종으로부터 기원하는 서열이거나, 또는 동일한 종으로부터 기원하는 경우에는 의도적인 인간 개입에 의해 조성 및/또는 게놈 유전자좌에서 그의 본래의 형태로부터 실질적으로 변형된 서열이다. 본원에서 사용된 바와 같이, 키메라 유전자는 코딩 서열에 대해 이종성인 전사 개시 영역에 작동가능하게 연결된 코딩 서열을 포함한다.
편리한 종결 영역은 에이. 투메파시엔스(A. tumefaciens)의 Ti-플라스미드, 예컨대 옥토핀 신타제 및 노팔린 신타제 종결 영역으로부터 입수가능하다. [Guerineau et al. (1991) Mol. Gen. Genet. 262:141-144; Proudfoot (1991) Cell 64:671-674; Sanfacon et al. (1991) Genes Dev. 5:141-149; Mogen et al. (1990) Plant Cell 2:1261-1272; Munroe et al. (1990) Gene 91:151-158; Ballas et al. (1989) Nucleic Acids Res. 17:7891-7903; 및 Joshi et al. (1987) Nucleic Acids Res. 15:9627-9639] 또한 참고한다.
추가의 조절 신호에는 전사 개시 시작 부위, 오퍼레이터, 활성화제, 인핸서, 다른 조절 요소, 리보솜 결합 부위, 개시 코돈, 종결 신호 등이 포함되나 이로 제한되지 않는다. 예를 들어, 미국 특허 번호 5,039,523 및 4,853,331; EPO 0480762A2; [Sambrook et al. (1992) Molecular Cloning: A Laboratory Manual, ed. Maniatis et al. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.), 이후 "Sambrook 11"; Davis et al., eds. (1980) Advanced Bacterial Genetics (Cold Spring Harbor Laboratory Press), Cold Spring Harbor, N.Y.], 및 여기에 인용된 참고문헌을 참고한다.
발현 카세트를 제조하기 위해, 적절한 배향으로, 적절한 경우 적절한 리딩 프레임으로 DNA 서열을 제공하도록 다양한 DNA 단편을 조작할 수 있다. 이를 위해, 어댑터 또는 링커를 사용하여 DNA 단편을 결합시킬 수 있거나, 또는 편리한 제한 부위, 불필요한 DNA의 제거, 제한 부위의 제거 등을 제공하기 위해 다른 조작이 수반될 수 있다. 이를 위해, 시험관내 돌연변이 유발, 프라이머 복구, 제한, 어닐링, 재치환, 예를 들어 전이 및 전환이 수반될 수 있다.
수많은 프로모터가 본 발명의 실시에 사용될 수 있다. 프로모터는 원하는 결과를 기준으로 선택될 수 있다. 핵산은 구성적, 유도성, 성장 단계-특이적, 세포 유형-특이적, 조직-선호, 조직-특이적, 또는 관심 유기체에서의 발현을 위한 다른 프로모터와 조합될 수 있다. 예를 들어, WO 99/43838, 및 미국 특허 번호 8,575,425; 7,790,846; 8,147,856; 8,586832; 7,772,369; 7,534,939; 6,072,050; 5,659,026; 5,608,149; 5,608,144; 5,604,121; 5,569,597; 5,466,785; 5,399,680; 5,268,463; 5,608,142; 및 6,177,611에 제시된 프로모터를 참고하며; 이들은 본원에 참고로 포함된다.
식물에서의 발현을 위해, 구성적 프로모터에는 CaMV 35S 프로모터 (Odell et al. (1985) Nature 313:810-812); 쌀 액틴 (McElroy et al. (1990) Plant Cell 2:163-171); 유비퀴틴 (Christensen et al. (1989) Plant Mol. Biol. 12:619-632 및 Christensen et al. (1992) Plant Mol. Biol. 18:675-689); pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581-588); 및 MAS (Velten et al. (1984) EMBO J. 3:2723-2730) 또한 포함된다.
유도성 프로모터의 예는 저산소 또는 저온 스트레스에 의해 유도성인 Adh1 프로모터, 열 스트레스에 의해 유도성인 Hsp70 프로모터, 둘 모두 빛에 의해 유도성인 PPDK 프로모터 및 펩카르복실라제 프로모터이다. 화학적으로 유도성인 프로모터, 예컨대 완화제 유도된 In2-2 프로모터 (미국 특허 번호 5,364,780), 옥신 유도되고 융단층 특이적이지만 캘러스에서도 활성인 Axig1 프로모터 (PCT US01/22169), 스테로이드-반응성 프로모터 (예를 들어, 에스트로겐 유도된 ERE 프로모터, 및 [Schena et al. (1991) Proc. Natl. Acad. Sci. USA 88:10421-10425 및 McNellis et al. (1998) Plant J. 14(2):247-257]에서의 글루코코르티코이드-유도성 프로모터 참고) 및 테트라시클린-유도성 및 테트라시클린-억제성 프로모터 (예를 들어, [Gatz et al. (1991) Mol. Gen. Genet. 227:229-237], 및 미국 특허 번호 5,814,618 및 5,789,156 참고) 또한 유용하며, 이들은 본원에 참고로 포함된다.
조직-특이적 또는 조직-선호 프로모터는 특정한 조직 내에서 발현 구축물의 표적 발현을 위해 사용될 수 있다. 특정한 실시양태에서, 조직-특이적 또는 조직-선호 프로모터는 식물 조직에서 활성이다. 식물에서 발달 조절하에 있는 프로모터의 예에는 특정 조직, 예컨대 잎, 뿌리, 과실, 종자 또는 꽃에서 전사를 우선적으로 개시하는 프로모터가 포함된다. "조직 특이적" 프로모터는 특정 조직에서만 전사를 개시하는 프로모터이다. 유전자의 구성적 발현과는 달리, 조직-특이적인 발현은 유전자 조절의 여러 상호작용 수준의 결과이다. 따라서, 상동성인 또는 밀접하게 관련된 식물 종으로부터의 프로모터가 특정한 조직에서 트랜스진의 효율적이고 신뢰할 수 있는 발현을 달성하기 위해 바람직하게 사용될 수 있다. 일부 실시양태에서, 발현은 조직-선호 프로모터를 포함한다. "조직 선호" 프로모터는 특정 조직에서 전사를 우선적으로 개시하지만 반드시 전체적으로 또는 단독으로 개시하는 것은 아닌 프로모터이다.
일부 실시양태에서, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 핵산 분자는 세포 유형-특이적인 프로모터를 포함한다. "세포 유형 특이적인" 프로모터는 하나 이상의 장기의 특정 세포 유형에서 주로 발현을 유도하는 프로모터이다. 식물에서 기능성인 세포 유형 특이적인 프로모터가 주로 활성일 수 있는 식물 세포의 일부 예에는 예를 들어 BETL 세포, 뿌리, 잎에서의 맥관 세포, 자루 세포, 및 줄기 세포가 포함된다. 핵산 분자는 또한 세포 유형 선호 프로모터를 포함할 수 있다. "세포 유형 선호" 프로모터는 하나 이상의 장기의 특정 세포 유형에서 주로 대부분의 발현을 유도하지만 반드시 전체적으로 또는 단독으로 유도하는 것은 아닌 프로모터이다. 식물에서 기능성인 세포 유형 선호 프로모터가 우선적으로 활성일 수 있는 식물 세포의 일부 예에는 예를 들어 BETL 세포, 뿌리, 잎에서의 맥관 세포, 자루 세포, 및 줄기 세포가 포함된다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 핵산 서열은 예를 들어 시험관내 mRNA 합성을 위해 파지 RNA 폴리머라제에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 이러한 실시양태에서, 시험관내-전사된 RNA는 본원에 기재된 방법에서 사용하기 위해 정제될 수 있다. 예를 들어, 프로모터 서열은 T7, T3 또는 SP6 프로모터 서열, 또는 T7, T3 또는 SP6 프로모터 서열의 변형일 수 있다. 이러한 실시양태에서, 발현된 단백질 및/또는 RNA는 본원에 기재된 게놈 변형 방법에서 사용하기 위해 정제될 수 있다.
특정한 실시양태에서, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드는 또한 폴리아데닐화 신호 (예를 들어, SV40 폴리A 신호 및 식물에서 기능성인 다른 신호) 및/또는 적어도 하나의 전사 종결 서열에 연결될 수 있다. 추가로, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체 또는 데아미나제를 코딩하는 서열은 또한 본원에 기재된 바와 같이 적어도 하나의 핵 국재화 신호, 적어도 하나의 세포-투과 도메인, 및/또는 단백질을 특정한 세포하 위치로 수송할 수 있는 적어도 하나의 신호 펩티드를 코딩하는 서열(들)에 연결될 수 있다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 폴리뉴클레오티드는 벡터 또는 다중 벡터에 존재할 수 있다. "벡터"는 핵산을 숙주 세포로 수송, 전달 또는 도입하기 위한 폴리뉴클레오티드 조성물을 지칭한다. 적합한 벡터에는 플라스미드 벡터, 파지미드, 코스미드, 인공/미니-염색체, 트랜스포손, 및 바이러스 벡터 (예를 들어, 렌티바이러스 벡터, 아데노-연관된 바이러스 벡터, 바쿨로바이러스 벡터)가 포함된다. 벡터는 추가의 발현 조절 서열 (예를 들어, 인핸서 서열, 코작 서열, 폴리아데닐화 서열, 전사 종결 서열), 선택가능한 마커 서열 (예를 들어, 항생제 내성 유전자), 복제 기점 등을 포함할 수 있다. 추가의 정보는 ["Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 또는 "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, N.Y., 3rd edition, 2001]에서 확인할 수 있다.
벡터는 또한 형질전환된 세포의 선택을 위해 선택가능한 마커 유전자를 포함할 수 있다. 선택가능한 마커 유전자는 형질전환된 세포 또는 조직의 선택을 위해 사용된다. 마커 유전자에는 항생제 내성을 코딩하는 유전자, 예컨대 네오마이신 포스포트랜스퍼라제 II (NEO) 및 히그로마이신 포스포트랜스퍼라제 (HPT)를 코딩하는 유전자, 뿐만 아니라 제초성 화합물, 예컨대 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논, 및 2,4-디클로로페녹시아세테이트 (2,4-D)에 대한 내성을 부여하는 유전자가 포함된다.
일부 실시양태에서, RGN 폴리펩티드, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체 또는 데아미나제를 코딩하는 서열을 포함하는 발현 카세트 또는 벡터는 crRNA 및/또는 tracrRNA를 코딩하는 서열, 또는 가이드 RNA를 생성하기 위해 조합된 crRNA 및 tracrRNA를 추가로 포함할 수 있다. crRNA 및/또는 tracrRNA를 코딩하는 서열(들)은 관심 유기체 또는 숙주 세포에서 crRNA 및/또는 tracrRNA의 발현을 위해 적어도 하나의 전사 조절 서열에 작동가능하게 연결될 수 있다. 예를 들어, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드는 RNA 폴리머라제 III (Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 적합한 Pol III 프로모터의 예에는 포유동물 U6, U3, H1, 및 7SL RNA 프로모터 및 쌀 U6 및 U3 프로모터가 포함되나 이로 제한되지 않는다.
나타낸 바와 같이, RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA, tracrRNA 및/또는 sgRNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구축물을 이용하여 관심 유기체를 형질전환시킬 수 있다. 형질전환 방법은 뉴클레오티드 구축물을 관심 유기체에 도입시키는 것을 수반한다. "도입시키는"은 구축물이 숙주 세포의 내부로 접근하게 하는 방식으로 뉴클레오티드 구축물을 숙주 세포에 도입시키는 것으로 의도된다. 본 발명의 방법은 뉴클레오티드 구축물을 숙주 유기체에 도입시키기 위해 특정한 방법을 필요로 하지 않으며, 단지 뉴클레오티드 구축물이 숙주 유기체의 적어도 하나의 세포의 내부로 접근하기만 하면 된다. 숙주 세포는 진핵생물 또는 원핵생물 세포일 수 있다. 특정한 실시양태에서, 진핵생물 숙주 세포는 식물 세포, 포유동물 세포, 또는 곤충 세포이다. 안정한 형질전환 방법, 일시적인 형질전환 방법, 및 바이러스-매개된 방법을 비롯하여 이로 제한되지 않는, 뉴클레오티드 구축물을 식물 및 다른 숙주 세포에 도입시키는 방법은 관련 기술분야에 공지되어 있다.
상기 방법은 형질전환된 유기체, 예컨대 식물, 예컨대 전체 식물, 뿐만 아니라 식물 기관 (예를 들어, 잎, 줄기, 뿌리 등), 종자, 식물 세포, 주아, 배아 및 그의 자손을 생성한다. 식물 세포는 분화될 수 있거나 또는 분화되지 않을 수 있다 (예를 들어 캘러스, 현탁액 배양 세포, 원형질체, 잎 세포, 뿌리 세포, 체관부 세포, 화분).
"트랜스제닉 유기체" 또는 "형질전환된 유기체" 또는 "안정하게 형질전환된" 유기체 또는 세포 또는 조직은 본 발명의 RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드에 도입되거나 또는 통합된 유기체를 지칭한다. 다른 외인성 또는 내인성 핵산 서열 또는 DNA 단편 또한 숙주 세포에 혼입될 수 있는 것으로 인지된다. 아그로박테리움(Agrobacterium)- 및 유전자총-매개된 형질전환은 식물 세포의 형질전환을 위해 주로 이용되는 2가지 접근법이다. 그러나, 숙주 세포의 형질전환은 감염, 형질감염, 미량주사, 전기천공, 미량투영, 유전자총 또는 입자 충격, 전기천공, 실리카/탄소 섬유, 초음파 매개, PEG 매개, 인산칼슘 공동 침전, 다가양이온 DMSO 기술, DEAE 덱스트란 절차, 및 바이러스 매개, 리포솜 매개 등에 의해 수행될 수 있다. RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드의 바이러스-매개된 도입에는 레트로바이러스, 렌티바이러스, 아데노바이러스, 및 아데노-연관된 바이러스 매개된 도입 및 발현, 뿐만 아니라 카울리모바이러스, 제미니바이러스, 및 RNA 식물 바이러스가 포함된다.
형질전환 프로토콜 뿐만 아니라, 폴리펩티드 또는 폴리뉴클레오티드 서열을 식물에 도입시키기 위한 프로토콜은 형질전환을 위해 표적화된 숙주 세포의 유형 (예를 들어, 외떡잎 또는 쌍떡잎 식물 세포)에 따라 달라질 수 있다. 형질전환 방법은 관련 기술분야에 공지되어 있고, 미국 특허 번호: 8,575,425; 7,692,068; 8,802,934; 7,541,517에 제시된 것들이 포함되며, 이들 각각은 본원에 참고로 포함된다. 또한, [Rakoczy-Trojanowska, M. (2002) Cell Mol Biol Lett. 7:849-858; Jones et al. (2005) Plant Methods 1:5; Rivera et al. (2012) Physics of Life Reviews 9:308-345; Bartlett et al. (2008) Plant Methods 4:1-12; Bates, G.W. (1999) Methods in Molecular Biology 111:359-366; Binns and Thomashow (1988) Annual Reviews in Microbiology 42:575-606; Christou, P. (1992) The Plant Journal 2:275-281; Christou, P. (1995) Euphytica 85:13-27; Tzfira et al. (2004) TRENDS in Genetics 20:375-383; Yao et al. (2006) Journal of Experimental Botany 57:3737-3746; Zupan and Zambryski (1995) Plant Physiology 107:1041-1047; Jones et al. (2005) Plant Methods 1:5]을 참고한다
형질전환은 세포로 핵산의 안정한 또는 일시적인 포함을 일으킬 수 있다. "안정한 형질전환"은, 숙주 세포에 도입된 뉴클레오티드 구축물이 숙주 세포의 게놈과 통합하고, 그의 자손에 의해 유전될 수 있는 것을 의미하는 것으로 의도된다. "일시적인 형질전환"은, 폴리뉴클레오티드가 숙주 세포에 도입되고, 숙주 세포의 게놈에 통합되지 않는 것을 의미하는 것으로 의도된다.
엽록체의 형질전환 방법은 관련 기술분야에 공지되어 있다. 예를 들어, [Svab et al. (1990) Proc. Nail. Acad. Sci. USA 87:8526-8530; Svab and Maliga (1993) Proc. Natl. Acad. Sci. USA 90:913-917; Svab and Maliga (1993) EMBO J. 12:601-606]을 참고한다. 상기 방법은 선택가능한 마커를 함유하는 DNA의 입자 총 전달, 및 상동성 재조합을 통해 색소체 게놈으로 DNA의 표적화에 의존한다. 추가로, 색소체 형질전환은 핵-코딩된 및 색소체-지정된 RNA 폴리머라제의 조직-선호 발현에 의한 침묵 색소체-매개 트랜스진의 전사촉진에 의해 달성될 수 있다. 이러한 시스템은 [McBride et al. (1994) Proc. Natl. Acad. Sci. USA 91:7301-7305]에서 보고되었다.
형질전환된 세포는 통상적인 방식에 따라 트랜스제닉 유기체, 예컨대 식물로 성장할 수 있다. 예를 들어, [McCormick et al. (1986) Plant Cell Reports 5:81-84]를 참고한다. 이어서, 이들 식물을 성장시킨 다음, 동일한 형질전환된 균주 또는 상이한 균주와 수분시킬 수 있고, 생성된 혼성체는 확인된 원하는 표현형 특징의 구성적 발현을 가질 수 있다. 원하는 표현형 특징의 발현이 안정하게 유지되고 유전된 다음, 종자가 수확되는 것을 보장하도록 2 세대 이상 성장시켜, 원하는 표현형 특징의 발현이 달성될 수 있도록 보장할 수 있다. 이러한 방식으로, 본 발명은 게놈에 안정하게 도입된 본 발명의 뉴클레오티드 구축물, 예를 들어 본 발명의 발현 카세트를 갖는 형질전환된 종자 ("트랜스제닉 종자"로도 지칭됨)를 제공한다.
대안적으로, 형질전환된 세포는 유기체에 도입될 수 있다. 이들 세포는 유기체로부터 기원할 수 있고, 세포는 생체외 접근법으로 형질전환된다.
본원에 제공된 서열은 임의의 식물 종, 예컨대 비제한적으로, 외떡잎 식물 및 쌍떡잎 식물의 형질전환을 위해 사용될 수 있다. 관심 식물의 예에는 옥수수 (메이즈), 수수, 밀, 해바라기, 토마토, 크루시퍼, 후추, 감자, 목화, 쌀, 대두, 사탕무, 사탕수수, 담배, 보리, 및 유채, 브라시카(Brassica) 종, 알팔파, 호밀, 조, 홍화, 땅콩, 고구마, 카사야, 커피, 코코넛, 파인애플, 감귤 나무, 코코아, 차, 바나나, 아보카도, 무화과, 구아바, 망고, 올리브, 파파야, 캐슈, 마카다미아, 아몬드, 귀리, 채소, 관상용 식물, 및 구과 식물이 포함되나 이로 제한되지 않는다.
채소에는 토마토, 상추, 그린 빈, 리마 빈, 완두콩, 및 쿠르쿠미스(Curcumis) 속의 구성원, 예컨대 오이, 칸탈루프, 및 머스크 멜론이 포함되나 이로 제한되지 않는다. 관상용 식물에는 진달래, 수국, 히비스커스, 장미, 튤립, 수선화, 페튜니아, 카네이션, 포인세티아, 및 국화가 포함되나 이로 제한되지 않는다. 바람직하게는, 본 발명의 식물은 농작물 (예를 들어, 옥수수, 수수, 밀, 해바라기, 토마토, 크루시퍼, 후추, 감자, 목화, 쌀, 대두, 사탕무, 사탕수수, 담배, 보리, 유채 등)이다.
본원에서 사용된 바와 같이, 용어 식물에는 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘리(calli), 식물 덩어리, 및 식물 또는 식물의 일부분, 예컨대 배아, 화분, 배주, 종자, 잎, 꽃, 가지, 과실, 커넬, 이삭, 콥, 겉껍질, 자루, 뿌리, 근단, 꽃밥 등에서 온전한 식물 세포가 포함된다. 곡물은 종의 재배 또는 번식 이외의 목적으로 상업적인 재배자에 의해 생산된 성숙한 종자를 의미하는 것으로 의도된다. 재생된 식물의 자손, 변이체 및 돌연변이체 또한 본 발명의 범위 내에 포함되나, 단, 이들 부분은 도입된 폴리뉴클레오티드를 포함한다. 본원에 개시된 서열을 보유하는 가공된 식물 생성물 또는 부산물, 예를 들어 대두박이 추가로 제공된다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드는 또한 임의의 원핵생물 종, 예컨대 비제한적으로, 고세균류 및 박테리아 (예를 들어, 바실러스(Bacillus) 종, 클레브시엘라(Klebsiella) 종, 스트렙토마이세스(Streptomyces) 종, 리조비움(Rhizobium) 종, 에스케리키아(Escherichia) 종, 슈도모나스(Pseudomonas) 종, 살모넬라(Salmonella) 종, 시겔라(Shigella) 종, 비브리오(Vibrio) 종, 예르시니아(Yersinia) 종, 마이코플라즈마(Mycoplasma) 종, 아그로박테리움, 락토바실러스(Lactobacillus) 종)을 형질전환시키기 위해 사용될 수 있다.
RGN, RNA-가이드된 DNA-결합 폴리펩티드-데아미나제 융합체, 데아미나제, crRNA 및/또는 tracrRNA를 코딩하는 폴리뉴클레오티드는 임의의 진핵생물 종, 예컨대 비제한적으로 동물 (예를 들어, 포유동물, 곤충, 어류, 새, 및 파충류), 진균, 아메바, 조류 및 효모를 형질전환시키기 위해 사용될 수 있다.
통상적인 바이러스 및 비-바이러스 기반 유전자 전달 방법을 이용하여 포유동물 세포 또는 표적 조직에서 핵산을 도입시킬 수 있다. 이러한 방법을 이용하여 CRISPR 시스템의 성분을 코딩하는 핵산을 배양물 중의 또는 숙주 유기체 중의 세포에 투여할 수 있다. 비-바이러스 벡터 전달 시스템에는 DNA 플라스미드, RNA (예를 들어, 본원에 기재된 벡터의 전사체), 네이키드 핵산, 및 리포솜과 같은 전달 비히클과 복합체화된 핵산이 포함된다. 바이러스 벡터 전달 시스템에는 세포로 전달 후에 에피솜 또는 통합 게놈을 갖는 DNA 및 RNA 바이러스가 포함된다. 유전자 요법 절차의 검토를 위해, [Anderson, Science 256: 808- 813 (1992); Nabel & Feigner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Bohm (eds) (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)]를 참고한다.
핵산의 비-바이러스 전달 방법에는 리포펙션, 뉴클레오펙션, 미량주사, 유전자총, 비로솜, 리포솜, 이뮤노리포솜, 다가양이온 또는 지질: 핵산 접합체, 네이키드 DNA, 인공 비리온, 및 DNA의 작용제-증강된 흡수가 포함된다. 리포펙션은 예를 들어 미국 특허 번호 5,049,386, 4,946,787; 및 4,897,355)에 기재되어 있고, 리포펙션 시약은 상업적으로 판매된다 (예를 들어, 트랜스펙탐(Transfectam)™ 및 리포펙틴(Lipofectin)™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질에는 프라이그너(Feigner), WO 91/17424; WO 91/16024의 것들이 포함된다. 전달은 세포로 (예를 들어 시험관내 또는 생체외 투여) 또는 표적 조직으로 (예를 들어 생체내 투여)일 수 있다. 지질:핵산 복합체, 예컨대 표적화된 리포솜, 예컨대 면역지질 복합체의 제조는 관련 기술분야의 기술자에게 널리 공지되어 있다 (예를 들어, [Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291- 297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992)]; 미국 특허 번호 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787 참고).
핵산의 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 신체의 특이적인 세포로 표적화하고 바이러스 페이로드를 핵으로 수송하는 고도로 진화된 과정을 활용한다. 바이러스 벡터는 환자에게 직접적으로 투여될 수 있거나 (생체내) 또는 이들을 이용하여 시험관내에서 세포를 치료할 수 있고, 임의적으로 변형된 세포가 환자에게 투여될 수 있다 (생체외). 통상적인 바이러스 기반 시스템에는 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관된 및 단순 포진 바이러스 벡터가 포함될 수 있다. 숙주 게놈에서 통합은 레트로바이러스, 렌티바이러스, 및 아데노-연관된 바이러스 유전자 전달 방법에 의해 가능하며, 이는 종종 삽입된 트랜스진의 장기간 발현을 일으킨다. 추가로, 높은 형질도입 효율이 여러 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 향성은 외래 외피 단백질을 도입하고, 표적 세포의 잠재적인 표적 집단을 확장시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 또는 감염시킬 수 있고, 전형적으로 높은 바이러스 역가를 생성할 수 있는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 따라 좌우될 것이다. 레트로바이러스 벡터는 6-10 kb 이하의 외래 서열에 대해 팩키징 능력을 갖는 시스-작용 긴 말단 반복부로 구성된다. 최소의 시스-작용 LTR은 벡터의 복제 및 팩키징에 충분하며, 이를 사용하여 치료 유전자를 표적 세포에 통합시켜 영구적인 트랜스진 발현을 제공한다. 광범위하게 사용되는 레트로바이러스 벡터에는 뮤린 백혈병 바이러스 (MuLV), 긴팔 원숭이 백혈병 바이러스 (GaLV), 유인원 면역결핍 바이러스 (SIV), 인간 면역결핍 바이러스 (HIV), 및 이들의 조합물을 기반으로 하는 것들이 포함된다 (예를 들어, [Buchscher et al., J. Viral. 66:2731-2739 (1992); Johann et al., J. Viral. 66:1635-1640 (1992); Sommnerfelt et al., Viral. 176:58-59 (1990); Wilson et al., J. Viral. 63:2374-2378 (1989); Miller et al., 1. Viral. 65:2220-2224 (1991)]; PCT/US94/05700 참고).
일시적인 발현이 바람직한 경우에, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 여러 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있고, 세포 분열을 필요로 하지 않는다. 이러한 벡터를 사용하여, 높은 역가 및 수준의 발현이 수득되었다. 이 벡터는 비교적 간단한 시스템으로 다량 생산될 수 있다. 또한, 아데노-연관된 바이러스 ("AAV") 벡터를 사용하여, 예를 들어 핵산 및 펩티드의 시험관내 생성에서 및 생체내 및 생체외 유전자 요법 절차를 위해 세포를 표적 핵산으로 형질도입시킬 수 있다 (예를 들어, [West et al., Virology 160:38-47 (1987)]; 미국 특허 번호 4,797,368; WO 93/24641; [Katin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)] 참고). 재조합 AAV 벡터의 구축은 수많은 공보, 예컨대 미국 특허 번호 5,173,414; [Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); 및 Samulski et al., J. Viral. 63:03822-3828 (1989)]에 기재되어 있다. 전형적으로 팩키징 세포를 사용하여 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성한다. 이러한 세포에는 아데노바이러스를 팩키징하는 293 세포, 및 레트로바이러스를 팩키징하는 ψJ2 세포 또는 PA317 세포가 포함된다.
유전자 요법에서 사용되는 바이러스 벡터는 일반적으로 핵산 벡터를 바이러스 입자로 팩키징하는 세포주를 생성함으로써 생성된다. 벡터는 전형적으로 팩키징 및 숙주로의 후속적인 통합을 위해 필요한 최소 바이러스 서열을 함유하며, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 대한 발현 카세트에 의해 대체된다. 잃어버린 바이러스 기능은 전형적으로 팩키징 세포주에 의해 트랜스로 제공된다. 예를 들어, 유전자 요법에서 사용되는 AAV 벡터는 전형적으로 팩키징 및 숙주 게놈으로의 통합을 위해 필요한 AAV 게놈으로부터의 ITR 서열만을 갖는다. 바이러스 DNA는 다른 AAV 유전자, 즉, rep 및 cap을 코딩하는 헬퍼 플라스미드를 함유하지만 ITR 서열은 결여된 세포주에서 팩키징된다.
세포주는 또한 헬퍼로서 아데노바이러스에 의해 감염될 수 있다. 헬퍼 바이러스는 헬퍼 플라스미드로부터 AAV 벡터의 복제 및 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인해 유의한 양으로 팩키징되지 않는다. 아데노바이러스에 의한 오염은 예를 들어 AAV에 비해 아데노바이러스가 덜 민감한 열 처리에 의해 감소될 수 있다. 세포로 핵산의 추가의 전달 방법은 관련 기술분야의 기술자에게 공지되어 있다. 예를 들어, 본원에 참고로 포함된 US20030087817을 참고한다.
일부 실시양태에서, 숙주 세포는 본원에 기재된 하나 이상의 벡터에 의해 일시적으로 또는 비-일시적으로 형질감염된다. 일부 실시양태에서, 세포는 대상체에서 자연적으로 발생하는 것처럼 형질감염된다. 일부 실시양태에서, 형질감염된 세포를 대상체로부터 취한다. 일부 실시양태에서, 세포는 대상체로부터 취한 세포, 예컨대 세포주로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 관련 기술분야에 공지되어 있다. 세포주의 예에는 C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLaS3, Huhl, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panel, PC-3, TFl, CTLL-2, CIR, Rat6, CVI, RPTE, AlO, T24, 182, A375, ARH-77, Calul, SW480, SW620, SKOV3, SK-UT, CaCo2, P388Dl, SEM-K2, WEHI- 231, HB56, TIB55, lurkat, 145.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4. COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피, BALB/3T3 마우스 배아 섬유모세포, 3T3 Swiss, 3T3-Ll, 132-d5 인간 태아 섬유모세포; 10.1 마우스 섬유모세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-I 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10Tl/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-Kl, CHO-K2, CHO-T, CHO Dhfr-/-, COR-L23, COR-L23/CPR, COR-L235010, CORL23/ R23, COS-7, COV-434, CML Tl, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepalclc7, HL-60, HMEC, HT-29, lurkat, lY 세포, K562 세포, Ku812, KCL22, KGl, KYOl, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-l0A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCKII, MDCKII, MOR/ 0.2R, MONO-MAC 6, MTD-lA, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT 세포주, Peer, PNT-lA/ PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THPl 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR, 및 그의 트랜스제닉 변이체가 포함되나 이로 제한되지 않는다. 세포주는 관련 기술분야의 기술자에게 공지된 다양한 공급처로부터 입수가능하다 (예를 들어, 아메리칸 타입 컬쳐 콜렉션 (American Type Culture Collection, ATCC) (버지니아주 마나사스) 참고).
일부 실시양태에서, 본원에 기재된 하나 이상의 벡터로 형질감염된 세포를 사용하여, 하나 이상의 벡터-유래된 서열을 포함하는 새로운 세포주를 확립한다. 일부 실시양태에서, 본원에 기재된 CRISPR 시스템 또는 데아미나제 또는 그의 융합체의 성분으로 일시적으로 형질감염되고 (예컨대 하나 이상의 벡터의 일시적인 형질감염, 또는 RNA로의 형질감염에 의해), CRISPR 복합체 또는 데아미나제의 활성을 통해 변형된 세포를 사용하여, 변형을 함유하지만 임의의 다른 외인성 서열이 결여된 세포를 포함하는 새로운 세포주를 확립한다. 일부 실시양태에서, 본원에 기재된 하나 이상의 벡터에 의해 일시적으로 또는 비-일시적으로 형질감염된 세포, 또는 이러한 세포로부터 유래된 세포주는 하나 이상의 시험 화합물을 평가하는데 사용된다.
일부 실시양태에서, 본원에 기재된 하나 이상의 벡터를 사용하여, 비-인간 트랜스제닉 동물 또는 트랜스제닉 식물을 생성한다. 일부 실시양태에서, 트랜스제닉 동물은 포유동물, 예컨대 마우스, 래트 또는 토끼이다. 일부 실시양태에서, 트랜스제닉 인간 세포를 생성한다.
V. 폴리펩티드 및 폴리뉴클레오티드의 변이체 및 단편
본 개시내용은 그의 아미노산 서열이 서열식별번호: 1, 16, 24, 35, 43, 50, 374-545, 572-590 및 그의 활성 변이체에 제시된 천연 발생 (즉, 야생형) RNA-가이드된 뉴클레아제 및 데아미나제의 활성 변이체 및 단편, 뿐만 아니라 천연 발생 CRISPR 반복부, 예컨대 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 서열의 활성 변이체 및 단편, 및 천연 발생 tracrRNA, 예컨대 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 서열의 활성 변이체 및 단편, 및 이를 코딩하는 폴리뉴클레오티드를 제공한다. 또한, 데아미나제, 예컨대 서열식별번호: 374-545 및 572-584에 제시된 서열의 활성 변이체 및 단편이 제공된다.
변이체 또는 단편의 활성이 관심 폴리뉴클레오티드 또는 폴리펩티드에 비해 변경될 수 있지만, 변이체 및 단편은 관심 폴리뉴클레오티드 또는 폴리펩티드의 기능을 보유해야 한다. 예를 들어, 변이체 또는 단편은 관심 폴리뉴클레오티드 또는 폴리펩티드와 비교하여 증가된 활성, 감소된 활성, 상이한 스펙트럼의 활성 또는 활성에서의 임의의 다른 변경을 가질 수 있다.
본원에 개시된 것과 같은 천연 발생 RGN 폴리펩티드의 단편 및 변이체는 서열-특이적인, RNA-가이드된 DNA-결합 활성을 보유할 것이다. 특정한 실시양태에서, 본원에 개시된 것과 같은 천연 발생 RGN 폴리펩티드의 단편 및 변이체는 뉴클레아제 활성 (단일 가닥 또는 이중 가닥)을 보유할 것이다. 다른 실시양태에서, 천연 발생 데아미나제, 예컨대 본원에 개시된 것들의 단편 및 변이체는 데아미나제 활성을 보유할 것이다. 일부 실시양태에서, 데아미나제 변이체는 변경된 활성, 예를 들어 DNA 주형에 대한 활성, 또는 본래의 데아미나제와는 상이한 뉴클레오티드에 대한 활성, 예를 들어 아데노신에 대한 활성을 갖는다.
본원에 개시된 것과 같은 천연 발생 CRISPR 반복부의 단편 및 변이체는 (tracrRNA를 포함하는) 가이드 RNA의 일부일 때 (가이드 RNA와 복합체화된) RNA-가이드된 뉴클레아제에 결합하여 이를 서열-특이적인 방식으로 표적 뉴클레오티드 서열로 가이드하는 능력을 보유할 것이다.
본원에 개시된 것과 같은 천연 발생 tracrRNA의 단편 및 변이체는 (CRISPR RNA를 포함하는) 가이드 RNA의 일부일 때 (가이드 RNA와 복합체화된) RNA-가이드된 뉴클레아제를 서열-특이적인 방식으로 표적 뉴클레오티드 서열로 가이드하는 능력을 보유할 것이다.
용어 "단편"은 본 발명의 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부분을 지칭한다. "단편" 또는 "생물학적으로 활성인 부분"에는 생물학적 활성을 보유하도록 (즉, 가이드RNA 내에 포함될 때 서열-특이적인 방식으로 RGN과 결합하여 이를 표적 뉴클레오티드 서열로 지시하도록) 충분한 개수의 연속 뉴클레오티드를 포함하는 폴리뉴클레오티드가 포함된다. "단편" 또는 "생물학적으로 활성인 부분"에는 생물학적 활성을 보유하도록 (즉, 가이드 RNA와 복합체화될 때 서열-특이적인 방식으로 표적 뉴클레오티드 서열에 결합하도록) 충분한 개수의 연속 아미노산 잔기를 포함하는 폴리펩티드가 포함된다. RGN 단백질의 단편에는 대안적인 하류 시작 부위의 사용으로 인해 전장 서열보다 더 짧은 것들이 포함된다. RGN 단백질의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 1, 16, 24, 35, 43 또는 50의 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 또는 그 초과의 연속 아미노산 잔기를 포함하는 폴리펩티드일 수 있다. 이러한 생물학적으로 활성인 부분은 재조합 기술에 의해 제조되고 서열-특이적인 RNA-가이드된 DNA-결합 활성에 대해 평가될 수 있다. CRISPR 반복 서열의 생물학적으로 활성인 단편은 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 적어도 8개 연속 핵산을 포함할 수 있다. CRISPR 반복 서열의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속 뉴클레오티드를 포함하는 폴리뉴클레오티드일 수 있다. tracrRNA의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80개 또는 그 초과의 연속 뉴클레오티드를 포함하는 폴리뉴클레오티드일 수 있다. 데아미나제의 생물학적으로 활성인 부분은 예를 들어 서열식별번호: 374-545 및 572-584 중 어느 하나의 10, 25, 50, 100, 150, 200 또는 그 초과의 연속 아미노산 잔기를 포함하는 폴리펩티드일 수 있다.
일반적으로, "변이체"는 실질적으로 유사한 서열을 의미하는 것으로 의도된다. 폴리뉴클레오티드의 경우, 변이체는 본래의 폴리뉴클레오티드 내의 하나 이상의 내부 부위에서 하나 이상의 뉴클레오티드의 결실 및/또는 부가, 및/또는 본래의 폴리뉴클레오티드에서 하나 이상 부위에서 하나 이상의 뉴클레오티드의 치환을 포함한다. 본원에서 사용된 바와 같이, "본래의" 또는 "야생형" 폴리뉴클레오티드 또는 폴리펩티드는 각각 천연 발생 뉴클레오티드 서열 또는 아미노산 서열을 포함한다. 폴리뉴클레오티드의 경우, 보존적 변이체에는 유전자 코드의 축퇴성 때문에 관심 유전자의 본래의 아미노산 서열을 코딩하는 이들 서열이 포함된다. 이들과 같은 천연 발생 대립유전자 변이체는 널리 공지된 분자 생물학 기술, 예를 들어 하기에서 설명되는 폴리머라제 연쇄 반응 (PCR) 및 혼성화 기술을 사용하여 확인될 수 있다. 변이체 폴리뉴클레오티드에는 또한 합성에 의해 유래된 폴리뉴클레오티드, 예를 들어 부위-지정된 돌연변이 유발을 이용하여 생성되었지만 관심 폴리펩티드 또는 폴리뉴클레오티드를 여전히 코딩하는 것들이 포함된다. 일반적으로, 본원에 개시된 특정한 폴리뉴클레오티드의 변이체는 본원에 기재된 서열 정렬 프로그램 및 파라미터에 의해 결정시 특정한 해당 폴리뉴클레오티드와 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 가질 것이다.
본원에 개시된 특정한 폴리뉴클레오티드 (즉, 기준 폴리뉴클레오티드)의 변이체는 또한 변이체 폴리뉴클레오티드에 의해 코딩된 폴리펩티드 및 기준 폴리뉴클레오티드에 의해 코딩된 폴리펩티드 사이의 퍼센트 서열 동일성을 비교함으로써 평가될 수 있다. 임의의 두 폴리펩티드 사이의 퍼센트 서열 동일성은 본원에 기재된 서열 정렬 프로그램 및 파라미터를 사용하여 계산될 수 있다. 본원에 개시된 폴리뉴클레오티드의 임의의 주어진 쌍을 그들이 코딩하는 두 폴리펩티드에 의해 공유된 퍼센트 서열 동일성을 비교함으로써 평가하는 경우, 코딩된 두 폴리펩티드 사이의 퍼센트 서열 동일성은 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성이다.
특정한 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 임의의 서열식별번호: 374-545 또는 572-584의 아미노산 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하는 데아미나제 폴리펩티드를 코딩한다. 특정 실시양태에서, 데아미나제는 임의의 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 변이체 데아미나제 폴리펩티드는 서열식별번호: 572-584 중 어느 하나와 특정한 수준의 서열 동일성을 가지며, 특이적인 아미노산 잔기는 모 서열로부터 변하지 않는다. 예를 들어, 일부 실시양태에서, 변이체 서열식별번호: 572는 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 위치 104에 상응하는 위치에서 티로신, 및 위치 106에 상응하는 위치에서 트레오닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 574는 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 위치 103에 상응하는 위치에서 세린, 및 위치 105에 상응하는 위치에서 리신을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 575는 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 위치 103에 상응하는 위치에서 류신, 및 위치 105에 상응하는 위치에서 글루탐산을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 576은 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 위치 107에 상응하는 위치에서 아르기닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 577은 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 위치 104에 상응하는 위치에서 세린, 및 위치 106에 상응하는 위치에서 아르기닌을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 578은 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 위치 107에 상응하는 위치에서 트레오닌을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 579는 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 위치 104에 상응하는 위치에서 글루타민, 및 위치 106에 상응하는 위치에서 글리신을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 580은 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 581은 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 위치 106에 상응하는 위치에서 글리신, 및 위치 108에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 582는 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 위치 104에 상응하는 위치에서 트립토판, 및 위치 106에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 583은 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 위치 106에 상응하는 위치에서 세린을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 584는 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 위치 112에 상응하는 위치에서 세린, 및 위치 114에 상응하는 위치에서 트레오닌을 포함한다.
본 발명의 데아미나제 폴리펩티드의 생물학적으로 활성인 변이체는 적게는 약 1-15개 아미노산 잔기, 적게는 약 1-10개, 예컨대 약 6-10개, 적게는 5개, 적게는 4개, 적게는 3개, 적게는 2개 또는 적게는 1개 아미노산 잔기만큼 상이할 수 있다. 구체적인 실시양태에서, 폴리펩티드는 N-말단 또는 C-말단 절단을 포함할 수 있으며, 이는 폴리펩티드의 N 또는 C 말단으로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 아미노산 또는 그 초과의 결실을 포함할 수 있다.
다른 특정한 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50의 아미노산 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 폴리펩티드를 코딩한다.
본 발명의 RGN 또는 데아미나제 폴리펩티드의 생물학적으로 활성인 변이체는 적게는 약 1-15개 아미노산 잔기, 적게는 약 1-10개, 예컨대 약 6-10개, 적게는 5개, 적게는 4개, 적게는 3개, 적게는 2개 또는 적게는 1개 아미노산 잔기만큼 상이할 수 있다. 구체적인 실시양태에서, 폴리펩티드는 N-말단 또는 C-말단 절단을 포함할 수 있으며, 이는 폴리펩티드의 N 또는 C 말단으로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050개 아미노산 또는 그 초과의 결실을 포함할 수 있다.
특정한 실시양태에서, 본원에 개시된 폴리뉴클레오티드는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복부를 포함하거나 또는 코딩한다.
본원에 개시된 폴리뉴클레오티드는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62에 제시된 뉴클레오티드 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하거나 또는 코딩할 수 있다.
본 발명의 CRISPR 반복부 또는 tracrRNA의 생물학적으로 활성인 변이체는 적게는 약 1-25개 뉴클레오티드, 적게는 약 1-20개, 적게는 약 1-10개, 적게는 약 6-10개, 적게는 5개, 적게는 4개, 적게는 3개, 적게는 2개 또는 적게는 1개 뉴클레오티드만큼 상이할 수 있다. 일부 실시양태에서, 폴리뉴클레오티드는 5' 또는 3' 말단 절단을 포함할 수 있고, 이는 폴리뉴클레오티드의 5' 또는 3' 말단으로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80개 뉴클레오티드 또는 그 초과의 결실을 포함할 수 있다. 일부 실시양태에서, CRISPR 반복부 또는 tracrRNA는 뉴클레오티드의 결실 및/또는 삽입 둘 다에 의해 및 또한 돌연변이 또는 치환에 의해 변경될 수 있다.
변이체 단백질 및 폴리뉴클레오티드를 생성하는 본원에 제공된 RGN 폴리펩티드, DNA-결합 폴리펩티드-데아미나제 융합 폴리펩티드, 데아미나제 폴리펩티드, CRISPR 반복부 및 tracrRNA에 대해 변형이 이루어질 수 있음을 인지한다. 인위적으로 설계된 변화는 부위-지정된 돌연변이 유발 기술의 적용을 통해 도입될 수 있다. 대안적으로, 본원에 개시된 서열과 구조적으로 및/또는 기능적으로 관련이 있는 아직 공지되지 않거나 또는 아직 확인되지 않은 본래의 폴리뉴클레오티드 및/또는 폴리펩티드 또한 본 발명의 범위 내에 속하는 것으로 확인될 수 있다. 보존적 아미노산 치환이 RGN 또는 데아미나제 단백질의 기능을 변경시키지 않는 비보존된 영역에서 이루어질 수 있다. 대안적으로, RGN 또는 데아미나제의 활성을 개선시키거나 또는 변경시키는 변형이 이루어질 수 있다.
변이체 폴리뉴클레오티드 및 단백질은 또한 돌연변이 유발 및 재조합 유발 절차, 예컨대 DNA 셔플링으로부터 유래된 서열 및 단백질을 포함한다. 이러한 절차에 의해, 본원에 개시된 하나 이상의 상이한 RGN 또는 데아미나제 단백질 (예를 들어, 서열식별번호: 1, 16, 24, 35, 43, 50, 374-545 및 572-584)은 원하는 성질을 갖는 새로운 RGN 또는 데아미나제 단백질을 생성하도록 조작된다. 이러한 방식으로, 실질적인 서열 동일성을 갖는 서열 영역을 포함하는 관련된 서열 폴리뉴클레오티드의 집단으로부터 재조합 폴리뉴클레오티드의 라이브러리가 생성되고, 시험관내 또는 생체내에서 상동성 재조합될 수 있다. 예를 들어, 이 접근법을 이용하여, 관심 도메인을 코딩하는 서열 모티프가 본원에 제공된 RGN 서열 및 다른 공지된 RGN 유전자 사이에서 셔플링되어, 개선된 관심 성질, 예컨대 효소의 경우 증가된 Km을 갖는 단백질을 코딩하는 새로운 유전자를 수득할 수 있다. 본원에 제공된 데아미나제는 또한 유사한 전략에서 셔플링될 수 있다. 이러한 DNA 셔플링을 위한 전략은 관련 기술분야에 공지되어 있다. 예를 들어, [Stemmer (1994) Proc. Natl. Acad. Sci. USA 91:10747-10751; Stemmer (1994) Nature 370:389-391; Crameri et al. (1997) Nature Biotech. 15:436-438; Moore et al. (1997) J. Mol. Biol. 272:336-347; Zhang et al. (1997) Proc. Natl. Acad. Sci. USA 94:4504-4509; Crameri et al. (1998) Nature 391:288-291]; 및 미국 특허 번호 5,605,793 및 5,837,458을 참고한다. "셔플링된" 핵산은 셔플링 절차, 예컨대 본원에 제시된 임의의 셔플링 절차에 의해 생성되는 핵산이다. 셔플링된 핵산은 예를 들어 인공적인, 임의적으로 재귀적인 방식으로 2가지 이상의 핵산 (또는 문자열)을 (물리적으로 또는 가상으로) 재조합함으로써 생성된다. 일반적으로, 하나 이상의 스크리닝 단계를 셔플링 과정에서 이용하여 관심 핵산을 확인하고; 이 스크리닝 단계는 임의의 재조합 단계 이전에 또는 이후에 수행될 수 있다. 일부 (그러나 전부는 아님) 셔플링 실시양태에서, 스크리닝될 풀의 다양성을 증가시키기 위해 선택 이전에 다중 라운드의 재조합을 수행하는 것이 바람직하다. 재조합 및 선택의 전체 과정을 임의적으로 재귀적으로 반복한다. 문맥에 따라, 셔플링은 재조합 및 선택의 전체 과정을 지칭할 수 있거나, 또는 대안적으로 전체 과정 중 재조합 부분을 간단히 지칭할 수 있다.
본원에서 사용된 바와 같이, 두 폴리뉴클레오티드 또는 폴리펩티드 서열과 관련하여 "서열 동일성" 또는 "동일성"은 명시된 비교 범위에 걸쳐 최대 대응을 위해 정렬될 때 동일한 두 서열의 잔기를 지칭한다. 서열 동일성의 백분율이 단백질과 관련하여 사용될 때, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환에 의해 상이한 것으로 인지되며, 여기서 아미노산 잔기는 유사한 화학적 성질 (예를 들어, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되고, 따라서 분자의 기능적 성질이 변하지 않는다. 서열이 보존적 치환에서 상이할 때, 퍼센트 서열 동일성은 치환의 보존적 성질을 보정하기 위해 상향 조정될 수 있다. 이러한 보존적 치환에 의해 상이한 서열은 "서열 유사성" 또는 "유사성"을 갖는다고 한다. 이러한 조정을 위한 수단은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 전형적으로 이는 전체가 아니라 부분 미스매치로서 보존적 치환을 평점하여, 서열 동일성 백분율을 증가시킨다. 따라서, 예를 들어, 동일한 아미노산에 1의 점수가 주어지고, 비-보존적 치환에 0의 점수가 주어지는 경우, 보존적 치환에는 0 내지 1의 점수가 주어진다. 보존적 치환의 평점은 예를 들어 프로그램 PC/GENE (인텔리제네틱스(Intelligenetics), 캘리포니아주 마운틴뷰)에서 구현되는 바와 같이 계산된다.
본원에서 사용된 바와 같이, "서열 동일성 백분율"은 비교 범위에 걸쳐 최적으로 정렬된 두 서열을 비교함으로써 결정된 값을 의미하며, 비교 범위에서 폴리뉴클레오티드 서열의 일부분은 두 서열의 최적의 정렬을 위해 기준 서열 (부가 또는 결실을 포함하지 않음)과 비교하여 부가 또는 결실 (즉, 갭)을 포함할 수 있다. 백분율은 매칭된 위치의 개수를 수득하기 위해 두 서열에서 발생하는 동일한 핵산 염기 또는 아미노산 잔기의 위치의 개수를 결정하고, 매칭된 위치의 개수를 비교 범위의 총 위치의 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성 백분율을 수득함으로써 계산된다.
달리 명시되지 않는다면, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하여 GAP 버전 10을 사용하여 수득한 값을 지칭한다: 50의 GAP 가중치 및 3의 길이 가중치, 및 nwsgapdna.cmp 평점 행렬을 사용하는 뉴클레오티드 서열에 대한 % 동일성 및 % 유사성; 8의 GAP 가중치 및 2의 길이 가중치, 및 BLOSUM62 평점 행렬을 사용하는 아미노산 서열에 대한 % 동일성 및 % 유사성; 또는 그의 임의의 등가의 프로그램. "등가의 프로그램"은, GAP 버전 10에 의해 생성된 상응하는 정렬과 비교할 때, 해당하는 임의의 두 서열에 대해, 동일한 뉴클레오티드 또는 아미노산 잔기 매치 및 동일한 퍼센트 서열 동일성을 갖는 정렬을 생성하는 임의의 서열 비교 프로그램을 의미한다.
해당 서열 쌍에 대해 가능한 가장 높은 점수에 도달하도록 정의된 아미노산 치환 행렬 (예를 들어, BLOSUM62), 갭 존재 패널티 및 갭 확장 패널티를 이용하는 유사성 평점을 위해 두 서열이 정렬될 때, 이들은 "최적으로 정렬된" 것이다. 아미노산 치환 행렬, 및 두 서열 사이의 유사성을 정량화하는데 있어서 그들의 사용은 관련 기술분야에 널리 공지되어 있고, 예를 들어 [Dayhoff et al. (1978) "A model of evolutionary change in proteins." In "Atlas of Protein Sequence and Structure," Vol. 5, Suppl. 3 (ed. M. O. Dayhoff), pp. 345-352. Natl. Biomed. Res. Found., Washington, D.C. and Henikoff et al. (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919]에 기재되어 있다. BLOSUM62 행렬은 종종 서열 정렬 프로토콜에서 디폴트 평점 치환 행렬로서 사용된다. 갭 존재 패널티는 정렬된 서열 중 하나에서 단일 아미노산 갭의 도입에 대해 부과되고, 갭 확장 패널티는 이미 개방된 갭에 삽입된 각각의 추가의 빈 아미노산 위치에 대해 부과된다. 정렬은 정렬이 시작되고 끝나는 각각의 서열의 아미노산 위치에 의해, 임의적으로 가능한 가장 높은 점수에 도달하도록 하나의 서열 또는 두 서열 모두에서 하나의 갭 또는 다중 갭의 삽입에 의해 정의된다. 최적의 정렬 및 평점은 수동으로 달성될 수 있지만, 상기 과정은 컴퓨터-실행된 정렬 알고리즘, 예를 들어 [Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402]에 기재되고 생명공학 정보 웹사이트 국제 센터(National Center for Biotechnology Information Website (www.ncbi.nlm.nih.gov))에서 공개적으로 입수가능한 갭이 있는 BLAST 2.0의 사용에 의해 용이해진다. 다중 정렬을 비롯하여 최적의 정렬은 예를 들어 www.ncbi.nlm.nih.gov로부터 입수가능하고 [Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402]에 기재된 PSI-BLAST를 이용하여 제조될 수 있다.
기준 서열에 대해 최적으로 정렬된 아미노산 서열과 관련하여, 아미노산 잔기는 정렬에서 잔기가 쌍을 형성한 기준 서열의 위치에 "상응한다". "위치"는 N-말단에 대한 그의 위치를 기반으로 하여 기준 서열에서 각각의 아미노산을 순차적으로 식별하는 번호로 표시된다. 최적의 정렬을 결정할 때 고려되어야 하는 결실, 삽입, 말단 절단, 융합 등으로 인해, 일반적으로 N-말단으로부터 간단히 카운팅함으로써 결정되는 시험 서열에서의 아미노산 잔기 개수는 기준 서열에서 그의 상응하는 위치의 번호와 반드시 동일하지는 않을 것이다. 예를 들어, 정렬된 시험 서열에서 결실이 있는 경우, 결실 부위에서는 기준 서열에서의 위치에 상응하는 아미노산이 없을 것이다. 정렬된 기준 서열에서 삽입이 있는 경우, 해당 삽입은 기준 서열에서 임의의 아미노산 위치에 상응하지 않을 것이다. 말단 절단 또는 융합의 경우, 상응하는 서열에서 임의의 아미노산에 상응하지 않는 기준 또는 정렬된 서열에서의 아미노산 스트레치가 있을 수 있다.
VI. 항체
서열식별번호: 1, 16, 24, 35, 43, 50, 374-545 및 572-584에 제시된 아미노산 서열을 포함하는 것들 또는 그의 활성 변이체 또는 단편을 비롯하여 RGN 폴리펩티드, 본 발명의 RGN 폴리펩티드를 포함하는 리보핵단백질, 데아미나제, 또는 DNA-결합 데아미나제 융합 단백질에 대한 항체 또한 포함된다. 항체의 생성 방법 또한 관련 기술분야에 널리 공지되어 있다 (예를 들어, [Harlow and Lane (1988) Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.]; 및 미국 특허 번호 4,196,265 참고). 이들 항체는 RGN 폴리펩티드 또는 리보핵단백질의 검출 및 단리를 위한 키트에서 사용될 수 있다. 따라서, 본 개시내용은 본원에 기재된 폴리펩티드 또는 리보핵단백질, 예를 들어 서열식별번호: 1, 16, 24, 35, 43, 50, 374-545 및 572-584 중 어느 하나의 서열을 갖는 폴리펩티드에 특이적으로 결합하는 항체를 포함하는 키트를 제공한다.
VII. 관심 표적 서열의 결합을 위한 시스템 및 리보핵단백질 복합체, 및 이를 제조하는 방법
본 개시내용은 관심 표적 서열의 결합을 위한 시스템을 제공하고, 상기 시스템은 적어도 하나의 가이드 RNA 또는 이를 코딩하는 뉴클레오티드 서열, 및 적어도 하나의 RNA-가이드된 뉴클레아제 또는 이를 코딩하는 뉴클레오티드 서열을 포함한다. 가이드 RNA는 관심 표적 서열과 혼성화하고, 또한 RGN 폴리펩티드와 복합체를 형성하여, RGN 폴리펩티드가 표적 서열과 결합하도록 지시한다. 이들 일부 실시양태에서, RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 다양한 실시양태에서, 가이드 RNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA, 또는 그의 활성 변이체 또는 단편을 포함한다. 상기 시스템의 가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA일 수 있다. 특정한 실시양태에서, 상기 시스템은 가이드RNA에 대해 이종성인 RNA-가이드된 뉴클레아제를 포함하고, RGN 및 가이드RNA는 원래 자연적으로 복합체화되지 않는다.
본 개시내용은 또한 핵산 서열에 대해 표적화하고 표적 핵산 서열을 변형시키는 시스템을 제공한다. RNA-가이드된 DNA-결합 폴리펩티드, 예컨대 RGN, 및 gRNA는 리보핵폴리펩티드 복합체를 관심 핵산 서열로 표적화시키는 것을 담당하고; 데아미나제 폴리펩티드는 표적화된 핵산 서열을 변형시키는 것을 담당한다. 가이드 RNA는 관심 표적 서열과 혼성화하고, 또한 RNA-가이드된 DNA-결합 폴리펩티드와 복합체를 형성하여, RNA-가이드된 DNA-결합 폴리펩티드가 표적 서열에 결합하도록 지시한다. RNA-가이드된 DNA-결합 폴리펩티드는 융합 단백질의 한 도메인이고; 다른 도메인은 본원에 기재된 데아미나제이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 RGN, 예컨대 Cas9이다. 추가의 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 서열식별번호: 568, 569, 547, 553의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. RNA-가이드된 DNA-결합 폴리펩티드의 다른 예에는 RGN, 예컨대 미국 특허 출원 번호 16/432,321 (그의 전문이 본원에 참고로 포함됨)에 기재된 것들이 포함된다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 유형 II CRISPR-Cas 폴리펩티드, 또는 그의 활성 변이체 또는 단편이다. 일부 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 유형 V CRISPR-Cas 폴리펩티드, 또는 그의 활성 변이체 또는 단편이다. 다른 실시양태에서, RNA-가이드된 DNA-결합 폴리펩티드는 유형 VI CRISPR-Cas 폴리펩티드이다. 다른 실시양태에서, 융합 단백질의 DNA-결합 도메인은 RNA 가이드, 예컨대 Zn 아연 뉴클레아제, TALEN, 또는 메가뉴클레아제 폴리펩티드를 필요로 하지 않으며, 각각의 뉴클레아제 활성은 불활성화되었다.
본원에 제공된 관심 표적 서열의 결합을 위한 시스템은 적어도 하나의 단백질에 결합된 RNA의 적어도 하나의 분자인 리보핵단백질 복합체일 수 있다. 일부 실시양태에서, 본원에 제공된 리보핵단백질 복합체는 RNA 성분으로서 적어도 하나의 가이드 RNA 및 단백질 성분으로서 RNA-가이드된 뉴클레아제를 포함한다. 이러한 리보핵단백질 복합체는 RGN 폴리펩티드를 천연적으로 발현하고 관심 표적 서열에 대해 특이적인 특정한 가이드 RNA를 발현하도록 조작된 세포 또는 유기체로부터 정제될 수 있다. 다른 실시양태에서, 본원에 제공된 리보핵단백질 복합체는 RNA 성분으로서 적어도 하나의 가이드 RNA, 및 단백질 성분으로서 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 단백질을 포함한다. 융합 단백질의 경우 또는 본 발명의 RGN의 경우, 리보핵단백질 복합체는 융합 단백질 (또는 본 발명의 RGN 단독) 및 가이드 RNA를 코딩하는 폴리뉴클레오티드에 의해 형질전환되고 융합 단백질 (또는 본 발명의 RGN 단독) 및 가이드 RNA의 발현을 가능하게 하는 조건하에서 배양된 세포 또는 유기체로부터 정제될 수 있다. 따라서, 본 발명의 RGN, 본 발명의 데아미나제, 본 발명의 RGN을 포함하는 리보핵단백질 복합체, 본 발명의 융합 단백질, 또는 융합 단백질 리보핵단백질 복합체를 제조하는 방법이 제공된다. 이러한 방법은 폴리펩티드 (일부 실시양태에서, 가이드 RNA)가 발현되는 조건하에서 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열, 및 일부 실시양태에서 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 세포를 배양하는 것을 포함한다. 이어서, 본 발명의 RGN, 본 발명의 RGN을 포함하는 리보핵단백질 복합체, 본 발명의 융합 단백질, 또는 융합 단백질 리보핵단백질 복합체를 배양된 세포의 용해물로부터 정제할 수 있다.
생물학적 샘플의 용해물로부터 본 발명의 RGN, 본 발명의 데아미나제, 본 발명의 RGN을 포함하는 리보핵단백질 복합체, 본 발명의 융합 단백질, 또는 융합 단백질 리보핵단백질 복합체를 정제하는 방법은 관련 기술분야에 공지되어 있다 (예를 들어, 크기 배제 및/또는 친화도 크로마토그래피, 2D-PAGE, HPLC, 역상 크로마토그래피, 면역침전). 특정한 방법에서, 본 발명의 폴리펩티드는 재조합적으로 생성되고, 그의 정제에 도움이 되도록 정제 태그, 예컨대 비제한적으로 글루타티온-S-트랜스퍼라제 (GST), 키틴 결합 단백질 (CBP), 말토스 결합 단백질, 티오레독신 (TRX), 폴리(NANP), 직렬식 친화도 정제 (TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis (서열식별번호: 593), 10xHis (서열식별번호: 594), 비오틴 카르복실 담체 단백질 (BCCP), 및 칼모둘린을 포함한다. 일반적으로, 본 발명의 태그 부착된 폴리펩티드 또는 리보핵단백질 복합체는 고정된 금속 친화도 크로마토그래피를 이용하여 정제된다. 관련 기술분야에 공지된 다른 유사한 방법, 예컨대 다른 형태의 크로마토그래피 또는 예를 들어 면역침전을 단독으로 또는 조합하여 이용할 있음을 이해할 것이다.
"단리된" 또는 "정제된" 폴리펩티드, 또는 그의 생물학적으로 활성인 부분은 그의 천연 발생 환경에서 발견되는 폴리펩티드에 일반적으로 동반되거나 또는 그와 상호작용하는 성분을 실질적으로 또는 본질적으로 함유하지 않는다. 따라서, 단리된 또는 정제된 폴리펩티드는 다른 세포 물질, 또는 재조합 기술에 의해 생성되는 경우 배양 배지를 실질적으로 함유하지 않거나, 또는 화학적으로 합성되는 경우 화학적 전구체 또는 다른 화학물질을 실질적으로 함유하지 않는다. 세포 물질을 실질적으로 함유하지 않는 단백질에는 약 30%, 20%, 10%, 5% 또는 1% (건조 중량 기준) 미만의 오염 단백질을 갖는 단백질 제제가 포함된다. 본 발명의 단백질 또는 그의 생물학적으로 활성인 부분이 재조합적으로 생성될 때, 최적으로 배양 배지는 약 30%, 20%, 10%, 5% 또는 1% (건조 중량 기준) 미만의 화학적 전구체 또는 관심 단백질이 아닌 화학물질을 나타낸다.
관심 표적 서열의 결합 및/또는 절단을 위해 본원에 제공된 특정한 방법은 시험관내 조립된 RGN 리보핵단백질 복합체의 사용을 수반한다. RGN 리보핵단백질 복합체의 시험관내 조립체는, RGN 폴리펩티드와 가이드 RNA의 결합을 가능하게 하는 조건하에서 RGN 폴리펩티드를 가이드 RNA와 접촉시키는 관련 기술분야에 공지된 임의의 방법을 이용하여 수행될 수 있다. 본원에서 사용된 바와 같이, "접촉하다", "접촉하는", "접촉된"은 원하는 반응을 수행하는데 적합한 조건하에서 원하는 반응의 성분들을 함께 배치시키는 것을 지칭한다. RGN 폴리펩티드는 시험관내 번역을 통해 생성되거나 또는 화학적으로 합성된 생물학적 샘플, 세포 용해물 또는 배양 배지로부터 정제될 수 있다. 가이드 RNA는 시험관내에서 전사되거나 또는 화학적으로 합성된 생물학적 샘플, 세포 용해물 또는 배양 배지로부터 정제될 수 있다. RGN 폴리펩티드 및 가이드 RNA는 RGN 리보핵단백질 복합체의 시험관내 조립을 가능하게 하도록 용액 (예를 들어, 완충된 식염수 용액)과 접촉할 수 있다.
VIII. 표적 서열의 결합, 절단 또는 변형 방법
본 개시내용은 관심 표적 뉴클레오티드 서열을 결합, 절단 및/또는 변형시키는 방법을 제공한다. 일부 실시양태에서, 상기 방법은 적어도 하나의 가이드 RNA 또는 그를 코딩하는 폴리뉴클레오티드, 및 적어도 하나의 RGN 폴리펩티드 또는 그를 코딩하는 폴리뉴클레오티드를 포함하는 시스템을 표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하는 것을 포함한다. 이들 일부 실시양태에서, RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 다양한 실시양태에서, 가이드 RNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA, 또는 그의 활성 변이체 또는 단편을 포함한다. 시스템의 가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA일 수 있다. 시스템의 RGN은 뉴클레아제 데드 RGN일 수 있거나, 닉카제 활성을 가질 수 있거나, 또는 융합 폴리펩티드일 수 있다. 일부 실시양태에서, 융합 폴리펩티드는 염기-편집 폴리펩티드, 예를 들어 시티딘 데아미나제 또는 아데노신 데아미나제를 포함한다. 특정한 실시양태에서, RGN 및/또는 가이드 RNA는, RGN 및/또는 가이드 RNA (또는 RGN 및 가이드 RNA 중 적어도 하나를 코딩하는 폴리뉴클레오티드(들))가 도입되는 세포, 소기관 또는 배아에 대해 이종성이다.
다른 실시양태에서, 상기 방법은 적어도 하나의 가이드 RNA 또는 그를 코딩하는 폴리뉴클레오티드, 및 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드 또는 그를 코딩하는 폴리뉴클레오티드를 포함하는 적어도 하나의 융합 단백질을 포함하는 시스템을 표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하는 것을 포함한다. 이들 실시양태의 일부에서, 융합 단백질은 서열식별번호: 374-545 또는 572-584의 아미노산 서열 중 어느 하나, 또는 그의 활성 변이체 또는 단편을 포함한다.
일부 실시양태에서, 상기 방법은 표적 폴리뉴클레오티드를 본원에 개시된 데아미나제와 접촉시키는 것을 포함한다. 일부 실시양태에서, 상기 방법은 표적 폴리뉴클레오티드를 데아미나제 도메인 및 DNA-결합 도메인을 포함하는 융합 단백질과 접촉시키는 것을 포함한다. 이들 실시양태의 일부에서, 상기 방법은 DNA 분자를 (a) 데아미나제 도메인 및 RNA-가이드된 DNA-결합 폴리펩티드, 예를 들어 뉴클레아제-불활성 RGN 도메인을 포함하는 융합 단백질; 및 (b) (a)의 융합 단백질을 DNA 가닥의 표적 뉴클레오티드 서열에 대해 표적화하는 gRNA와 접촉시키는 것을 포함하고; 뉴클레오티드 염기의 탈아미노화에 효과적인 양으로 및 그에 적합한 조건하에 DNA 분자를 융합 단백질 및 gRNA와 접촉시킨다. 데아미나제가 방법에서 사용되는 이들 실시양태의 일부에서, 데아미나제는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나의 아미노산 서열 또는 그의 변이체를 포함하며, 변이체는 임의의 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584의 아미노산 서열과 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성인 아미노산 서열을 갖는다. 이들 실시양태의 일부에서, 변이체 데아미나제 폴리펩티드는 서열식별번호: 572-584 중 어느 하나와 특정 수준의 서열 동일성을 가지며, 구체적인 아미노산 잔기는 모 서열로부터 변하지 않는다. 예를 들어, 일부 실시양태에서, 변이체 서열식별번호: 572는 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 위치 104에 상응하는 위치에서 티로신, 및 위치 106에 상응하는 위치에서 트레오닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 574는 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 위치 103에 상응하는 위치에서 세린, 및 위치 105에 상응하는 위치에서 리신을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 575는 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 위치 103에 상응하는 위치에서 류신, 및 위치 105에 상응하는 위치에서 글루탐산을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 576은 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 위치 107에 상응하는 위치에서 아르기닌을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 577은 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 위치 104에 상응하는 위치에서 세린, 및 위치 106에 상응하는 위치에서 아르기닌을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 578은 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 위치 107에 상응하는 위치에서 트레오닌을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 579는 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 위치 104에 상응하는 위치에서 글루타민, 및 위치 106에 상응하는 위치에서 글리신을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 580은 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함한다. 일부 실시양태에서, 변이체 서열식별번호: 581은 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 위치 106에 상응하는 위치에서 글리신, 및 위치 108에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 582는 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 위치 104에 상응하는 위치에서 트립토판, 및 위치 106에 상응하는 위치에서 글루탐산을 포함한다. 특정 실시양태에서, 변이체 서열식별번호: 583은 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 위치 106에 상응하는 위치에서 세린을 포함한다. 특정한 실시양태에서, 변이체 서열식별번호: 584는 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 위치 112에 상응하는 위치에서 세린, 및 위치 114에 상응하는 위치에서 트레오닌을 포함한다.
일부 실시양태에서, 상기 방법은 DNA 분자를 (a) 데아미나제 도메인 및 RNA-가이드된 DNA-결합 폴리펩티드, 예를 들어 뉴클레아제-불활성 RGN 도메인을 포함하는 융합 단백질; 및 (b) (a)의 융합 단백질을 DNA 가닥의 표적 뉴클레오티드 서열에 대해 표적화하는 gRNA와 접촉시키는 것을 포함하며; 뉴클레오티드 염기의 탈아미노화에 효과적인 양으로 및 그에 적합한 조건하에 DNA 분자를 융합 단백질 및 gRNA와 접촉시킨다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함하고, 뉴클레오티드 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 표적 DNA 서열은 농작물의 대립유전자에 존재하고, 관심 형질을 갖는 특정한 대립유전자는 더 낮은 농경학적 가치를 갖는 식물을 생성한다. 뉴클레오티드 염기의 탈아미노화는 식물의 형질을 개선하고 농경학적 가치를 증가시키는 대립유전자를 생성한다.
일부 실시양태에서, DNA 서열은 질환 또는 장애와 연관된 T→C 또는 A→G 점 돌연변이를 포함하고, 돌연변이성 C 또는 G 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 탈아미노화는 질환 또는 장애와 연관된 서열에서 점 돌연변이를 수정한다.
일부 실시양태에서, 질환 또는 장애와 연관된 서열은 단백질을 코딩하고, 탈아미노화는 질환 또는 장애와 연관된 서열에 정지 코돈을 도입시켜, 코딩된 단백질을 말단 절단시킨다. 일부 실시양태에서, 접촉은 질환 또는 장애를 가진 것으로 의심되거나, 그를 갖거나 또는 그로 진단된 대상체에서 생체내에서 수행된다. 일부 실시양태에서, 질환 또는 장애는 게놈에서 점 돌연변이 또는 단일-염기 돌연변이와 연관된 질환이다. 일부 실시양태에서, 질환은 유전 질환, 암, 대사 질환, 또는 리소좀 저장 질환이다.
상기 방법이 가이드 RNA 및/또는 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드, 또는 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드를 전달하는 것을 포함하는 것인 이들 실시양태에서, 세포 또는 배아는 가이드 RNA 및/또는 RGN 폴리펩티드가 발현되는 조건하에 배양될 수 있다. 다양한 실시양태에서, 상기 방법은 표적 서열을 RGN 리보핵단백질 복합체와 접촉시키는 것을 포함한다. RGN 리보핵단백질 복합체는 뉴클레아제 데드이거나 또는 닉카제 활성을 갖는 RGN을 포함할 수 있다. 일부 실시양태에서, 리보핵단백질 복합체의 RGN은 염기-편집 폴리펩티드, 예를 들어 본원에 개시된 데아미나제를 포함하는 융합 폴리펩티드이다. 다른 실시양태에서, 리보핵단백질 복합체는 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드를 포함한다. 특정한 실시양태에서, 상기 방법은 표적 서열을 포함하는 세포, 소기관 또는 배아에 RGN 리보핵단백질 복합체를 전달하는 것을 포함한다. RGN 리보핵단백질 복합체는 본원에 기재된 바와 같이 생물학적 샘플로부터 정제되고, 재조합적으로 생성되고, 후속적으로 정제되거나, 또는 시험관내에서 조립된 것일 수 있다. 표적 서열 또는 세포 소기관 또는 배아와 접촉하는 RGN 리보핵단백질 복합체가 시험관내에서 조립된 것인 이들 실시양태에서, 상기 방법은 표적 서열, 세포, 소기관 또는 배아와 접촉하기 전에 복합체의 시험관내 조립체를 추가로 포함할 수 있다.
정제된 또는 시험관내 조립된 RGN 리보핵단백질 복합체를 관련 기술분야에 공지된 임의의 방법, 예컨대 비제한적으로 전기천공을 이용하여 세포, 소기관 또는 배아에 도입시킬 수 있다. 대안적으로, RGN 폴리펩티드, 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드를 포함하는 융합 폴리펩티드, 및/또는 가이드 RNA를 코딩하거나 또는 포함하는 폴리뉴클레오티드를 관련 기술분야에 공지된 임의의 방법 (예를 들어, 전기천공)을 이용하여 세포, 소기관 또는 배아에 도입시킬 수 있다.
표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하거나 또는 그와 접촉시, 가이드 RNA는 RGN 폴리펩티드 또는 융합 폴리펩티드가 서열-특이적인 방식으로 표적 서열과 결합하도록 지시한다. RGN이 뉴클레아제 활성을 갖는 것인 이들 실시양태에서, RGN 폴리펩티드는 결합시 관심 표적 서열을 절단한다. 표적 서열은 제공된 공여자 폴리뉴클레오티드에 의해 내인성 복구 메카니즘, 예컨대 비상동성 말단 결합, 또는 상동성-지정된 복구를 통해 후속적으로 변형될 수 있다.
RNA-가이드된 DNA-결합 폴리펩티드와 표적 서열의 결합을 측정하는 방법은 관련 기술분야에 공지되어 있고, 염색질 면역침전 검정, 겔 이동성 변화 검정, DNA 풀다운 검정, 리포터 검정, 마이크로플레이트 포획 및 검출 검정이 포함된다. 마찬가지로, 표적 서열의 절단 또는 변형을 측정하는 방법은 관련 기술분야에 공지되어 있고, 시험관내 또는 생체내 절단 검정이 포함되며, 절단은 분해 생성물의 검출을 용이하게 하기 위해 표적 서열에 적절한 표지 (예를 들어, 방사성 동위원소, 형광 기질)를 부착시키거나 또는 부착시키지 않고 PCR, 시퀀싱, 또는 겔 전기영동에 의해 확인된다. 대안적으로, 닉킹 촉발된 지수적 증폭 반응 (NTEXPAR) 검정을 이용할 수 있다 (예를 들어, [Zhang et al. (2016) Chem. Sci. 7:4951-4957] 참고). 생체내 절단은 서베이어(Surveyor) 검정을 이용하여 평가될 수 있다 (Guschin et al. (2010) Methods Mol Biol 649:247-256).
일부 실시양태에서, 상기 방법은 1개 초과의 가이드 RNA와 복합체화된 단일 유형의 RGN의 사용을 수반한다. 1개 초과의 가이드 RNA는 단일 유전자의 상이한 영역을 표적화할 수 있거나 또는 다중 유전자를 표적화할 수 있다. 다른 실시양태에서, 상기 방법은 융합 단백질의 일부로서 1개 초과의 가이드 RNA와 복합체화된 단일 유형의 RNA-결합 DNA-가이드된 도메인의 사용을 수반한다. 이러한 다중 표적화는 융합 단백질의 데아미나제 도메인이 핵산을 변형시킬 수 있게 하여, 관심 게놈에서 다중 돌연변이를 도입시킨다.
공여자 폴리뉴클레오티드가 제공되지 않는 것인 이들 실시양태에서, RGN 폴리펩티드에 의해 도입된 이중 가닥 파손은 비상동성 말단-연결 (NHEJ) 복구 과정에 의해 복구될 수 있다. NHEJ의 오류가 발생하기 쉬운 성질 때문에, 이중 가닥 파손의 복구는 표적 서열에 대해 변형을 일으킬 수 있다. 본원에서 사용된 바와 같이, 핵산 분자와 관련하여 "변형"은 핵산 분자의 뉴클레오티드 서열에서의 변화를 지칭하고, 이는 하나 이상의 뉴클레오티드의 결실, 삽입 또는 치환, 또는 이들의 조합일 수 있다. 표적 서열의 변형은 변경된 단백질 생성물의 발현 또는 코딩 서열의 불활성화를 일으킬 수 있다.
공여자 폴리뉴클레오티드가 존재하는 이들 실시양태에서, 공여자 폴리뉴클레오티드의 공여자 서열은 도입된 이중 가닥 파손의 복구 과정 동안에 표적 뉴클레오티드 서열에 통합되거나 또는 그와 교환되어, 외인성 공여자 서열의 도입을 일으킬 수 있다. 따라서, 공여자 폴리뉴클레오티드는 관심 표적 서열에 도입되는 것을 원하는 공여자 서열을 포함한다. 일부 실시양태에서, 공여자 서열은 새로 통합된 공여자 서열이 RGN에 의해 인식 및 절단되지 않도록 원래의 표적 뉴클레오티드 서열을 변경시킨다. 공여자 서열의 통합은 표적 뉴클레오티드 서열을 플랭킹하는 서열과 실질적인 서열 동일성을 갖는 플랭킹 서열을 갖는 공여자 폴리뉴클레오티드 내에 포함시킴으로써 증강될 수 있으며, 이는 상동성-지정된 복구 과정을 가능하게 한다. RGN 폴리펩티드가 이중 가닥 엇갈린 파손을 도입하는 것인 이들 실시양태에서, 공여자 폴리뉴클레오티드는 상용성 오버행에 의해 플랭킹된 공여자 서열을 포함할 수 있으며, 이는 이중 가닥 파손의 복구 동안에 비상동성 복구 과정에 의해 오버행을 포함하는 절단된 표적 뉴클레오티드 서열로의 공여자 서열의 직접적인 라이게이션을 가능하게 한다.
상기 방법이 닉카제인 (즉, 이중 가닥 폴리뉴클레오티드의 단일 가닥만을 절단하는) 본 발명의 RGN의 사용을 수반하는 것인 이들 실시양태에서, 상기 방법은 동일한 또는 중복되는 표적 서열을 표적화하고 폴리뉴클레오티드의 상이한 가닥을 절단하는 2개의 RGN 닉카제를 도입하는 것을 포함할 수 있다. 예를 들어, 이중 가닥 폴리뉴클레오티드의 양성 (+) 가닥만을 절단하는 RGN 닉카제는 이중 가닥 폴리뉴클레오티드의 음성 (-) 가닥만을 절단하는 제2 RGN 닉카제와 함께 도입될 수 있다. 유사하게, 일부 실시양태에서, 상기 방법은 본 발명의 데아미나제 및 RNA-가이드된 DNA-결합 폴리펩티드, 예를 들어 및 RGN을 포함하는 융합 폴리펩티드의 사용을 수반하며, RGN은 닉카제 (예를 들어 서열식별번호: 569)이다.
다양한 실시양태에서, 표적 뉴클레오티드 서열과 결합시키고, 표적 서열을 검출하는 방법이 제공되며, 상기 방법은 세포, 소기관 또는 배아에 적어도 하나의 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드, 및 적어도 하나의 RGN 폴리펩티드 또는 이를 코딩하는 폴리뉴클레오티드를 도입시키고, 가이드 RNA 및/또는 RGN 폴리펩티드 (코딩 서열이 도입된 경우)를 발현시키는 것을 포함하고, RGN 폴리펩티드는 뉴클레아제-데드 RGN이고 검출가능한 표지를 추가로 포함하며, 상기 방법은 검출가능한 표지를 검출하는 것을 추가로 포함한다. 검출가능한 표지는 융합 단백질 (예를 들어, 형광 단백질)로서 RGN에 융합될 수 있거나, 또는 시각적으로 또는 다른 수단에 의해 검출될 수 있는 RGN 폴리펩티드에 접합되거나 또는 그 안에 혼입된 소분자일 수 있다.
표적 서열의 조절하에 표적 서열 또는 관심 유전자의 발현을 조절하는 방법 또한 본원에 제공된다. 상기 방법은 세포, 소기관 또는 배아에 적어도 하나의 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드, 및 적어도 하나의 RGN 폴리펩티드 또는 이를 코딩하는 폴리뉴클레오티드를 도입시키고, 가이드 RNA 및/또는 RGN 폴리펩티드 (코딩 서열이 도입된 경우)를 발현시키는 것을 포함하고, RGN 폴리펩티드는 뉴클레아제-데드 RGN이다. 이들 일부 실시양태에서, 뉴클레아제-데드 RGN은 본원에 기재된 발현 조절인자 도메인 (즉, 후성적 변형 도메인, 전사 활성화 도메인 또는 전사 리프레서 도메인)을 포함하는 융합 단백질이다. 일부 실시양태에서, 뉴클레아제-데드 RGN은 본원에 기재된 데아미나제를 포함하는 융합 단백질이다.
본 개시내용은 또한 관심 표적 뉴클레오티드 서열의 결합 및/또는 변형을 위한 방법을 제공한다. 상기 방법은 적어도 하나의 가이드 RNA 또는 이를 코딩하는 폴리뉴클레오티드, 및 본 발명의 RGN 및 염기-편집 폴리펩티드, 예를 들어 본원에 기재된 데아미나제를 포함하는 적어도 하나의 융합 폴리펩티드, 또는 융합 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 시스템을 표적 서열, 또는 표적 서열을 포함하는 세포, 소기관 또는 배아에 전달하는 것을 포함한다.
관련 기술분야의 통상의 기술자는 본원에 개시된 임의의 방법을 이용하여 단일 표적 서열 또는 다중 표적 서열을 표적화할 수 있음을 이해할 것이다. 따라서, 상기 방법은 단일 유전자 내의 다중의 별개의 서열 및/또는 다중 유전자를 표적화할 수 있는 다중의 별개의 가이드 RNA와 조합하여 단일 RGN 폴리펩티드를 사용하는 것을 포함한다. 다중의 별개의 가이드 RNA를 다중의 별개의 RGN 폴리펩티드와 조합하여 도입하는 방법 또한 본원에 포함된다. 이들 가이드 RNA 및 가이드 RNA/RGN 폴리펩티드 시스템은 단일 유전자 내의 다중의 별개의 서열 및/또는 다중 유전자를 표적화할 수 있다.
한 측면에서, 본 발명은 상기 방법 및 조성물에 개시된 임의의 하나 이상의 요소를 함유하는 키트를 제공한다. 일부 실시양태에서, 키트는 벡터 시스템, 및 키트의 사용에 대한 지침서를 포함한다. 일부 실시양태에서, 벡터 시스템은 (a) tracr 메이트 서열, 및 tracr 메이트 서열의 상류에 가이드 서열을 삽입하기 위한 하나 이상의 삽입 부위에 작동가능하게 연결된 제1 조절 요소, 여기서 가이드 서열은 발현될 때 CRISPR 복합체와 진핵생물 세포의 표적 서열의 서열-특이적인 결합을 지시하고, 여기서 CRISPR 복합체는 (1) 표적 서열과 혼성화된 가이드 서열, 및 (2) tracr 서열과 혼성화된 트레이스 메이트 서열과 복합체화된 CRISPR 효소를 포함함; 및/또는 (b) 핵 국재화 서열을 포함하는 상기 CRISPR 효소를 코딩하는 효소 코딩 서열에 작동가능하게 연결된 제2 조절 요소를 포함한다.
일부 실시양태에서, 키트는 RNA-가이드된 DNA-결합 폴리펩티드, 예컨대 RGN 폴리펩티드, 예를 들어 뉴클레아제-불활성 Cas9 도메인, 및 본 발명의 데아미나제, 및 임의적으로 Cas9 도메인과 데아미나제 사이에 위치하는 링커를 포함하는 융합 단백질을 포함한다. 또한, 일부 실시양태에서, 키트는 적합한 시약, 완충제 및/또는 예를 들어 시험관내 또는 생체내 DNA 또는 RNA 편집을 위해 융합 단백질의 사용에 대한 지침서를 포함한다. 요소들은 개별적으로 또는 조합으로 제공될 수 있고, 임의의 적합한 용기, 예컨대 바이알, 보틀 또는 튜브에 제공될 수 있다. 일부 실시양태에서, 키트는 핵산 서열의 표적화된 편집에 적합한 gRNA의 설계 및 사용에 관한 지침서를 포함한다.
일부 실시양태에서, 키트는 1가지 이상의 언어로 된 지침서를 포함한다. 일부 실시양태에서, 키트는 본원에 기재된 요소 중 하나 이상을 이용하는 과정에서 사용하기 위한 하나 이상의 시약을 포함한다. 시약은 임의의 적합한 용기에 제공될 수 있다. 예를 들어, 키트는 하나 이상의 반응 또는 보관 완충제를 제공할 수 있다. 시약은 특정한 검정에서 이용가능한 형태로, 또는 사용하기 전에 하나 이상의 다른 성분의 첨가를 필요로 하는 형태로 (예를 들어 농축물 또는 동결건조된 형태로) 제공될 수 있다. 완충제는 임의의 완충제, 예컨대 비제한적으로 탄산나트륨 완충제, 중탄산나트륨 완충제, 붕산염 완충제, Tris 완충제, MOPS 완충제, HEPES 완충제, 및 이들의 조합물일 수 있다. 일부 실시양태에서, 완충제는 알칼리성이다. 일부 실시양태에서, 완충제는 약 7 내지 약 10의 pH를 갖는다.
일부 실시양태에서, 키트는 가이드 서열 및 조절 요소와 작동가능하게 연결하기 위해 벡터에 삽입하기 위한 가이드 서열에 상응하는 하나 이상의 올리고뉴클레오티드를 포함한다. 일부 실시양태에서, 키트는 상동성 재조합 주형 폴리뉴클레오티드를 포함한다. 한 측면에서, 본 발명은 CRISPR 시스템의 하나 이상의 요소를 사용하는 방법을 제공한다. 본 발명의 CRISPR 복합체는 표적 폴리뉴클레오티드를 변형시키는데 효과적인 수단을 제공한다. 본 발명의 CRISPR 복합체는 다양한 세포 유형에서 표적 폴리뉴클레오티드를 변형시키는 (예를 들어, 결실, 삽입, 전좌, 불활성화, 활성화) 것을 비롯하여 다양한 유용성을 갖는다. 따라서, 본 발명의 CRISPR 복합체는 예를 들어 유전자 요법, 약물 스크리닝, 질환 진단, 및 예후에서 광범위한 적용을 갖는다. 예시적인 CRISPR 복합체는 표적 폴리뉴클레오티드 내의 표적 서열과 혼성화된 가이드 서열과 복합체화된 CRISPR 효소를 포함한다.
VIII. 표적 폴리뉴클레오티드
한 측면에서, 본 발명은 진핵생물 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법을 제공하며, 이는 생체내, 생체외 또는 시험관내일 수 있다. 일부 실시양태에서, 상기 방법은 인간 또는 비-인간 동물 또는 식물 (예컨대 미세조류)로부터 세포 또는 세포 집단을 샘플링하고, 세포 또는 세포들을 변형시키는 것을 포함한다. 배양은 임의의 생체외 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비-인간 동물 또는 식물 (예컨대 미세조류)에 재도입될 수 있다.
자연적인 가변성을 이용하여, 식물 재배자는 바람직한 특성, 예컨대 수율, 품질, 균일성, 강도 및 해충에 대한 내성에 대해 가장 유용한 유전자들을 조합한다. 이들 바람직한 특성에는 성장, 광주기 선호도, 온도 요건, 꽃 또는 번식 발달의 개시일, 지방산 함량, 곤충 내성, 질환 내성, 선충 내성, 진균 내성, 제초제 내성, 다양한 환경 인자, 예컨대 가뭄, 열, 습기, 추위, 바람, 및 고염도를 비롯한 불리한 토양 조건에 대한 내성이 포함된다. 이들 유용한 유전자의 공급원에는 본래 또는 외래 품종, 가보(heirloom) 품종, 야생 식물 동족, 및 유도된 돌연변이, 예를 들어 돌연변이 유발제로 처리된 식물 물질이 포함된다. 본 발명을 이용하여, 식물 재배자는 돌연변이를 유도하는 새로운 도구를 제공한다. 따라서, 관련 기술분야의 기술자는 유용한 유전자의 공급원에 대한 게놈을 분석할 수 있고, 원하는 특징 또는 특성을 갖는 품종에서 본 발명을 이용하여 이전의 돌연변이 유발제에 비해 더욱 정밀하게 유용한 유전자의 증가를 유도할 수 있고, 따라서 식물 재배 프로그램을 가속화 및 개선시킬 수 있다.
RGN 시스템의 표적 폴리뉴클레오티드는 진핵생물 세포에 대해 내인성 또는 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵생물 세포의 핵에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물 (예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열 (예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다. 이론에 구애되기를 바라지 않지만, 표적 서열이 PAM (프로토스페이서 인접한 모티프); 즉, CRISPR 복합체에 의해 인식되는 짧은 서열과 회합되어야 하는 것으로 믿어진다. PAM에 대한 정확한 서열 및 길이 요건은 사용된 CRISPR 효소에 따라 다르지만, PAM은 전형적으로 프로토스페이서 (즉, 표적 서열)에 인접한 2-5개 염기쌍 서열이다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 수많은 질환-연관된 유전자 및 폴리뉴클레오티드, 뿐만 아니라 신호전달 생화학적 경로-연관된 유전자 및 폴리뉴클레오티드를 포함할 수 있다. 표적 폴리뉴클레오티드의 예에는 신호전달 생화학적 경로와 연관된 서열, 예를 들어 신호전달 생화학적 경로-연관된 유전자 또는 폴리뉴클레오티드가 포함된다. 표적 폴리뉴클레오티드의 예에는 질환 연관된 유전자 또는 폴리뉴클레오티드가 포함된다. "질환-연관된" 유전자 또는 폴리뉴클레오티드는, 비-질환 대조군의 조직 또는 세포와 비교하여 질환-발병 조직으로부터 유래된 세포에서 전사 또는 번역 생성물을 비정상적인 수준으로 또는 비정상적인 형태로 생성하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현되는 유전자일 수 있고; 이는 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있고, 변경된 발현은 질환의 발병 및/또는 진행과 상관관계가 있다. 질환-연관된 유전자는 또한 질환의 병인 (예를 들어, 원인 돌연변이)의 원인이 되는 유전자(들)에 직접적인 책임이 있거나 또는 그들과 연결 불균형 상태에 있는 돌연변이(들)를 보유하는 유전자 또는 유전자 변이를 지칭한다. 전사된 또는 번역된 생성물은 공지되어 있거나 또는 공지되어 있지 않을 수 있고, 추가로 정상 또는 비정상 수준일 수 있다. 질환-연관된 유전자 및 폴리뉴클레오티드의 예는 월드 와이드 웹(World Wide Web)으로 이용가능한 맥쿠식-나탄 인스티튜트 오브 제네틱 메디신, 존스 홉킨스 유니버시티(McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University, 메릴랜드주 볼티모어) 및 내셔널 센터 포 바이오테크놀로지 인포메이션, 내셔널 라이브러리 오브 메디신(National Center for Biotechnology Information, National Library of Medicine, 메릴랜드주 베데스다)으로부터 입수할 수 있다.
CRISPR 시스템이 관심 게놈 서열로의 표적화에서 비교적 용이하다는 점에서 특히 유용하지만, RGN이 원인 돌연변이를 해결할 수 있는 것에 대한 문제가 여전히 남아 있다. 한 접근법은 RGN (바람직하게는 RGN의 불활성 또는 닉카제 변이체)과 염기-편집 효소 또는 염기 편집 효소의 활성 도메인, 예컨대 시티딘 데아미나제 또는 아데노신 데아미나제 염기 편집기 사이의 융합 단백질을 생성하는 것이다 (미국 특허 번호 9,840, 699, 본원에 참고로 포함됨). 일부 실시양태에서, 상기 방법은 DNA 분자를 (a) 본 발명의 RGN 및 염기-편집 폴리펩티드, 예컨대 데아미나제를 포함하는 융합 단백질; 및 (b) (a)의 융합 단백질을 DNA 가닥의 표적 뉴클레오티드 서열로 표적화하는 gRNA와 접촉시키는 것을 포함하며; 뉴클레오티드 염기를 탈아미노화시키는데 효과적인 양으로 및 그에 적합한 조건하에 DNA 분자를 융합 단백질 및 gRNA와 접촉시킨다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함하고, 뉴클레오티드 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 표적 DNA 서열은 농작물의 대립유전자에 존재하고, 관심 특성을 갖는 특정한 대립유전자는 더 적은 농경학적 가치를 갖는 식물을 생성한다. 뉴클레오티드 염기의 탈아미노화는 식물의 특성을 개선시키고 농경학적 가치를 증가시키는 대립유전자를 생성한다.
일부 실시양태에서, DNA 서열은 질환 또는 장애와 연관된 T→C 또는 A→G 점 돌연변이를 포함하며, 돌연변이성 C 또는 G 염기의 탈아미노화는 질환 또는 장애와 연관이 없는 서열을 생성한다. 일부 실시양태에서, 탈아미노화는 질환 또는 장애와 연관된 서열에서 점 돌연변이를 수정한다.
일부 실시양태에서, 질환 또는 장애와 연관된 서열은 단백질을 코딩하고, 탈아미노화는 질환 또는 장애와 연관된 서열에 정지 코돈을 도입시켜, 코딩된 단백질의 말단 절단을 일으킨다. 일부 실시양태에서, 접촉은 질환 또는 장애를 갖기 쉬운, 갖고 있는 또는 가진 것으로 진단된 대상체의 생체 내에서 수행된다. 일부 실시양태에서, 질환 또는 장애는 게놈에서 점 돌연변이 또는 단일-염기 돌연변이와 연관된 질환이다. 일부 실시양태에서, 질환은 유전 질환, 암, 대사 질환, 또는 리소좀 저장 질환이다.
유전 질환의 원인이 되는 유전자좌, 특히 본 발명의 RGN 또는 RGN-염기 편집기 융합 단백질에 의해 용이하게 표적화될 수 있는 유전자좌의 추가의 예는 실시예 7 및 상응하는 표 8에서 확인할 수 있다.
헐러(Hurler) 증후군
본 발명의 RGN-염기 편집기 융합 단백질에 의존하는 접근법을 이용하여 수정될 수 있는 유전적으로 유전된 질환의 예는 헐러 증후군이다. MPS-1로도 공지된 헐러 증후군은 α-L-이두로니다제 (IDUA)의 결핍으로 인한 것이며, 리소좀에서 데르마탄 술페이트 및 헤파란 술페이트가 분자 수준으로 축적되는 것을 특징으로 하는 리소좀 저장 질환을 일으킨다. 이 질환은 일반적으로 α-L-이두로니다제를 코딩하는 IDUA 유전자에서 돌연변이에 의해 유발된 유전적으로 유전된 장애이다. 일반적인 IDUA 돌연변이는 W402X 및 Q70X이며, 이들 둘 다 번역의 조기 종결을 일으키는 넌센스 돌연변이이다. 예를 들어 염기-편집 접근법에 의한 단일 뉴클레오티드의 복귀가 야생형 코딩 서열을 복구하고, 유전자좌의 내인성 조절 메카니즘에 의해 조절되는 단백질 발현을 일으키기 때문에, 이러한 돌연변이는 정밀한 게놈 편집 (PGE) 접근법에 의해 잘 해결된다. 추가로, 이형접합체가 무증상인 것으로 공지되어 있기 때문에, 돌연변이된 대립유전자 중 하나만을 수정하면 되므로, 이들 돌연변이 중 하나를 표적화하는 PGE 요법은 이 질환을 가진 많은 환자에게 유용할 것이다 ([Bunge et al. (1994) Hum. Mol. Genet. 3(6): 861-866], 본원에 참고로 포함됨).
헐러 증후군에 대한 현재의 치료에는 효소 대체 요법 및 골수 이식이 포함된다 ([Vellodi et al. (1997) Arch. Dis. Child. 76(2): 92-99; Peters et al. (1998) Blood 91(7): 2601-2608] 본원에 참고로 포함됨). 효소 대체 요법이 헐러 증후군 환자의 생존 및 삶의 질에 극적인 영향을 미쳤지만, 이 접근법은 고가이며 시간 소모적인 매주 주입을 필요로 한다. 추가의 접근법에는 발현 벡터 상의 IDUA 유전자의 전달 또는 혈청 알부민과 같이 고도로 발현된 유전자좌로의 유전자의 삽입이 포함된다 (미국 특허 번호 9,956,247, 본원에 참고로 포함됨). 그러나, 이들 접근법은 원래의 IDUA 유전자좌를 수정된 코딩 서열로 복구하지 않는다. 게놈-편집 전략은 수많은 이점을 가지며, 가장 주목할만하게는, 유전자 발현의 조절이 건강한 개체에서 존재하는 자연적인 메카니즘에 의해 조절된다는 것이다. 추가로, 염기 편집의 이용은 종양 억제 메카니즘의 방해에 의해 큰 염색체 재배열, 세포 사멸, 또는 종양 발생을 초래할 수 있는 이중 가닥 DNA 파손을 일으킬 필요가 없다. 이 질환의 원인 돌연변이를 수정하는 방법에 대한 가능한 설명은 실시예 8에 제공된다. 기재된 방법은 인간 게놈에서 특정 질환-유발 돌연변이를 표적화하고 수정하기 위해 본 발명의 RGN-염기 편집기 융합 단백질을 사용하는 것에 대한 일반적인 전략의 예이다. 표 8에 기재된 것과 같은 표적 질환에 대한 유사한 접근법 또한 추구될 수 있음을 이해할 것이다. 추가로, 다른 종, 특히 일반적인 가정 애완 동물 또는 가축에서 질환-유발 돌연변이를 표적화하는 유사한 접근법 또한 본 발명의 RGN을 사용하여 이용될 수 있음을 이해할 것이다. 일반적인 가정 애완 동물 및 가축에는 개, 고양이, 말, 돼지, 소, 양, 닭, 당나귀, 뱀, 페럿, 어류, 예컨대 연어 및 새우가 포함된다.
프리드라이히(Friedreich) 운동실조
본 발명의 RGN은 또한 원인 돌연변이가 더욱 복잡한 인간 치료 접근법에서 유용할 수 있다. 예를 들어, 프리드라이히 운동실조 및 헌팅턴(Huntington) 질환과 같은 일부 질환은 유전자의 특정한 영역에서 3개 뉴클레오티드 모티프의 반복부에서의 유의한 증가의 결과이며, 이는 발현된 단백질이 기능하고 발현되는 능력에 영향을 미친다. 프리드라이히 운동실조 (FRDA)는 척수에서 신경 조직의 진행성 퇴행을 일으키는 상염색체성 열성 질환이다. 미토콘드리아에서 프라탁신 (FXN) 단백질의 감소된 수준은 세포 수준에서 산화성 손상 및 철 결핍을 초래한다. 감소된 FXN 발현은 체세포 및 생식선 FXN 유전자에서 인트론 1 내의 GAA 삼중항 확장과 관련이 있었다. FRDA 환자에서, GAA 반복부는 종종 70개 초과, 때때로 심지어 1000개 초과 (가장 흔하게는 600-900개)의 삼중항으로 구성되는 반면에, 발병하지 않은 개체는 약 40개 이하의 반복부를 갖는다 ([Pandolfo et al. (2012) Handbook of Clinical Neurology 103: 275-294; Campuzano et al. (1996) Science 271: 1423-1427; Pandolfo (2002) Adv. Exp. Med. Biol. 516: 99-118]; 모두 본원에 참고로 포함됨).
프리드라이히 운동실조 (FRDA)를 초래하는 트리뉴클레오티드 반복 서열의 확장은 FRDA 불안정 영역으로 지칭되는 FXN 유전자 내의 정의된 유전자좌에서 발생한다. RNA 가이드된 뉴클레아제 (RGN)는 FRDA 환자 세포에서 불안정 영역을 절제하기 위해 사용될 수 있다. 이 접근법은 하기를 필요로 한다: 1) 인간 게놈에서 대립유전자를 표적화하도록 프로그래밍될 수 있는 RGN 및 가이드 RNA 서열; 및 2) RGN 및 가이드 서열에 대한 전달 접근법. 게놈 편집을 위해 사용되는 여러 뉴클레아제, 예컨대 흔히 사용되는 에스. 피로게네스(S. pyogenes)로부터의 Cas9 뉴클레아제 (SpCas9)는 본질적으로 기능적 발현 카세트를 위해 필요한 다른 유전자 요소 외에도 SpCas9 유전자 및 가이드 RNA의 길이를 고려할 때 너무 커서 아데노-연관된 바이러스 (AAV) 벡터에 팩키징되지 않는다. 이는 SpCas9를 사용하는 접근법을 더 어렵게 만든다.
본 발명의 조밀한 RNA 가이드된 뉴클레아제는 FRDA 불안정 영역의 절제에 매우 적합하다. 각각의 RGN은 FRDA 불안정 영역 근처에 있는 PAM 요건을 갖는다. 추가로, 이들 RGN 각각은 가이드 RNA와 함께 AAV 벡터에 팩키징될 수 있다. 2개의 가이드 RNA의 팩킹은 제2 벡터를 필요로 할 수 있지만, 이 접근법은 두 벡터 사이의 단백질 서열을 분할할 수 있는 더 큰 뉴클레아제, 예컨대 SpCas9에서 필요로 되는 것보다 여전히 유리하게 비교된다. 이 질환의 원인 돌연변이를 수정하는 방법에 대한 가능한 설명은 실시예 9에 제공된다. 기재된 방법은 게놈 불안정 영역을 제거하는 본 발명의 RGN을 이용하는 전략을 포함한다. 이러한 전략은 유사한 유전적 근거를 갖는 다른 질환 및 장애, 예컨대 헌팅턴 질환에 적용가능하다. 본 발명의 RGN을 이용하는 유사한 전략은 농경학적으로 또는 경제적으로 중요한 비-인간 동물, 예컨대 개, 고양이, 말, 돼지, 소, 양, 닭, 당나귀, 뱀, 페럿, 어류, 예컨대 연어 및 새우에서 유사한 질환 및 장애에 또한 적용가능하다.
혈색소병증
본 발명의 RGN은 또한 유익한 효과를 일으킬 수 있는 파괴적 돌연변이를 도입하기 위해 사용될 수 있다. 헤모글로빈을 코딩하는 유전자, 특히 베타 글로빈 쇄 (HBB 유전자)에서의 유전적 결함은 겸상 적혈구 빈혈 및 지중해 빈혈을 비롯하여 혈색소병증으로 공지된 수많은 질환의 원인이 될 수 있다.
성인 인간에서, 헤모글로빈은 2개의 알파 (α)-유사 글로빈 쇄 및 2개의 베타 (β)-유사 글로빈 쇄 및 4개의 헴 기를 포함하는 이종사합체이다. 성인에서, α2β2 사합체는 헤모글로빈 A (HbA) 또는 성인 헤모글로빈으로 지칭된다. 전형적으로, 알파 및 베타 글로빈 쇄는 대략 1:1 비로 합성되고, 이 비는 헤모글로빈 및 적혈구 (RBC) 안정화의 측면에서 중요한 것으로 보인다. 발달 중인 태아에서는, 산소가 모체의 혈류를 통해 아기의 시스템으로 전달될 수 있도록 헤모글로빈 A에 비해 산소에 대해 더 높은 결합 친화도를 갖는 상이한 형태의 헤모글로빈인 태아 헤모글로빈 (HbF)이 생성된다. 태아 헤모글로빈 또한 2개의 α 글로빈 쇄를 함유하지만, 성인 β-글로빈 쇄 대신에 이는 2개의 태아 감마 (γ)-글로빈 쇄를 갖는다 (즉, 태아 헤모글로빈은 α2γ2임). 감마-글로빈에서 베타-글로빈 생성으로의 전환의 조절은 매우 복잡하며, 베타 글로빈 전사의 상향조절과 동시에 감마 글로빈 전사의 하향조절을 주로 수반한다. 대략 임신 30 주에, 태아에서 베타 글로빈의 생성이 증가하면서 감마 글로빈의 합성이 감소하기 시작한다. 일부 HbF는 성인기까지 지속되지만 (총 헤모글로빈의 대략 1-3%), 대략 10 개월째에 신생아의 헤모글로빈은 거의 모두 α2β2이다. 혈색소병증을 가진 대부분의 환자에서는, 감마 글로빈을 코딩하는 유전자가 여전히 존재하지만, 상기 기재된 바와 같이 분만시 발생하는 정상 유전자 억제로 인해 발현은 비교적 낮다.
겸상 적혈구 질환은 β 글로빈 유전자 (HBB)에서 V6E 돌연변이 (DNA 수준에서 GAG에서 GTG로)에 의해 유발되며, 생성된 헤모글로빈은 "헤모글로빈S" 또는 "HbS"로 지칭된다. 보다 낮은 산소 조건하에서는, HbS 분자가 응집하고 섬유성 침전물을 형성한다. 이들 응집물은 RBC의 이상 또는 '겸상화'를 유발하여, 세포의 유연성을 상실한다. 겸상 RBC는 더이상 모세혈관계로 넣어질 수 없으며, 겸상 적혈구 환자에서 혈관 폐색 위기를 일으킬 수 있다. 또한, 겸상 RBC는 정상 RBC에 비해 더 약하고, 용혈의 경향을 가지며, 결국 환자에서 빈혈을 초래한다.
겸상 적혈구 환자의 치료 및 관리는 항생체 치료, 통증 관리, 및 급성 에피소드 동안 수혈을 수반하는 평생의 일이다. 한 접근법은 히드록시우레아의 사용이며, 이는 감마 글로빈의 생성을 증가시킴으로써 부분적으로 그의 효과를 발휘한다. 만성 히드록시우레아 요법의 장기간 부작용은 아직 알려져 있지 않지만, 상기 치료는 원치않는 부작용을 일으키고, 환자마다 다양한 효능을 가질 수 있다. 겸상 적혈구 치료의 효능에서의 증가에도 불구하고, 환자의 기대 수명은 여전히 50대 중후반에 불과하며, 상기 질환과 연관된 이환율은 환자의 삶의 질에 큰 영향을 미친다.
지중해 빈혈 (알파 지중해 빈혈 및 베타 지중해 빈혈) 또한 헤모글로빈과 관련된 질환이며, 전형적으로 감소된 글로빈 쇄 발현을 수반한다. 이는 유전자의 조절 영역의 돌연변이를 통해, 또는 감소된 발현 또는 감소된 수준 또는 기능적 글로빈 단백질을 유발하는 글로빈 코딩 서열에서의 돌연변이로부터 발생할 수 있다. 지중해 빈혈의 치료에는 일반적으로 수혈 및 철 킬레이트 요법이 수반된다. 적절한 공여자가 확인될 수 있는 경우에는 골수 이식 또한 중증 지중해 빈혈을 가진 사람의 치료를 위해 이용되고 있지만, 이 절차는 상당한 위험을 가질 수 있다.
SCD 및 베타 지중해 빈혈 둘 다의 치료에 대해 제안된 한 접근법은, HbF가 비정상적인 성인 헤모글로빈을 기능적으로 대체하도록 감마 글로빈의 발현을 증가시키는 것이다. 상기 언급된 바와 같이, 히드록시우레아에 의한 SCD 환자의 치료는 감마 글로빈 발현을 증가시키는 그의 효과로 인해 부분적으로 성공적인 것으로 여겨진다 ([DeSimone (1982) Proc Nat'l Acad Sci USA 79(14):4428-31; Ley, et al., (1982) N. Engl. J. Medicine, 307: 1469-1475; Ley, et al., (1983) Blood 62: 370-380; Constantoulakis et al., (1988) Blood 72(6):1961-1967], 모두 본원에 참고로 포함됨). HbF의 발현 증가는 그의 생성물이 감마 글로빈 발현을 조절하는 역할을 하는 유전자의 확인을 수반한다. 이러한 한 유전자는 BCL11A이다. BCL11A는 성인 적혈구 전구체 세포에서 발현되는 아연 핑거 단백질을 코딩하고, 그의 발현의 하향조절은 감마 글로빈 발현을 증가시킨다 ([Sankaran et al. (2008) Science 322: 1839], 본원에 참고로 포함됨). BCL11A 유전자에 대해 표적화된 억제성 RNA의 사용이 제안되었지만 (예를 들어, 미국 특허 공보 2011/0182867, 본원에 참고로 포함됨), 이 기술은 몇가지 잠재적인 단점을 가지며, 예를 들어 완전한 녹다운이 달성되지 않을 수 있고, 이러한 RNA의 전달이 문제가 될 수 있으며, RNA가 지속적으로 존재해야 하므로, 평생 여러 치료를 필요로 한다.
본 발명의 RGN을 이용하여 BCL11A 인핸서 영역을 표적화하여, BCL11A의 발현을 방해할 수 있고, 이로써 감마 글로빈 발현이 증가된다. 이러한 표적화된 방해는 비상동성 말단 결합 (NHEJ)에 의해 달성될 수 있으며, 이에 의해 본 발명의 RGN이 BCL11A 인핸서 영역 내의 특정한 서열에 대해 표적화되고, 이중 가닥 파손이 형성되고, 전형적으로 유해한 돌연변이를 동시에 도입시키면서 세포 기구가 파손을 복구한다. 다른 질환 표적에 대해 기재된 것과 유사하게, 본 발명의 RGN은 생체내 전달을 위해 RGN 및 그의 가이드 RNA에 대한 발현 카세트를 단일 AAV 벡터에 팩키징할 수 있게 하는 그의 비교적 작은 크기 때문에 다른 공지된 RGN에 비해 이점을 갖는다. 이 방법에 대해 가능한 설명은 실시예 10에 제공된다. 본 발명의 RGN을 이용하는 유사한 전략은 또한 인간 및 농경학적으로 또는 경제적으로 중요한 비-인간 동물 모두에서 유사한 질환 및 장애에 적용될 수 있다.
IX. 폴리뉴클레오티드 유전자 변형을 포함하는 세포
본원에 기재된 RGN, crRNA, tracrRNA 및/또는 데아미나제에 의해 매개되는 과정을 이용하여 변형된 관심 표적 서열을 포함하는 세포 및 유기체가 본원에 제공된다. 이들 일부 실시양태에서, RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50,의 아미노산 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 다양한 실시양태에서, 가이드 RNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63의 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열, 또는 그의 활성 변이체 또는 단편을 포함한다. 특정한 실시양태에서, 가이드 RNA는 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62의 뉴클레오티드 서열을 포함하는 tracrRNA, 또는 그의 활성 변이체 또는 단편을 포함한다. 상기 시스템의 가이드 RNA는 단일 가이드 RNA 또는 이중-가이드 RNA일 수 있다. 일부 실시양태에서, 데아미나제는 서열식별번호: 374-545 및 572-584 중 어느 하나의 아미노산 서열 또는 그의 활성 변이체 또는 단편을 포함한다.
변형된 세포는 진핵생물 (예를 들어, 포유동물, 식물, 곤충 세포) 또는 원핵생물일 수 있다. 본원에 기재된 RGN, crRNA 및/또는 tracrRNA를 이용하는 과정에 의해 변형된 적어도 하나의 뉴클레오티드 서열을 포함하는 소기관 및 배아 또한 제공된다. 유전자 변형된 세포, 유기체, 소기관 및 배아는 변형된 뉴클레오티드 서열에 대해 이형접합성 또는 동형접합성일 수 있다.
세포, 유기체, 소기관 또는 배아의 염색체 변형은 변경된 발현 (상향조절 또는 하향조절), 불활성화, 또는 변경된 단백질 생성물 또는 통합된 서열의 발현을 일으킬 수 있다. 염색체 변형이 유전자의 불활성화 또는 비기능성 단백질 생성물의 발현을 일으키는 것인 이들 예에서, 유전자 변형된 세포, 유기체, 소기관 또는 배아는 "녹아웃"으로 지칭된다. 녹아웃된 표현형은 결실 돌연변이 (즉, 적어도 하나의 뉴클레오티드의 결실), 삽입 돌연변이 (즉, 적어도 하나의 뉴클레오티드의 삽입), 또는 넌센스 돌연변이 (즉, 정지 코돈이 도입되도록 하는 적어도 하나의 뉴클레오티드의 치환)의 결과일 수 있다.
대안적으로, 세포, 유기체, 소기관 또는 배아의 염색체 변형은 "녹인"을 생성할 수 있으며, 이는 단백질을 코딩하는 뉴클레오티드 서열의 염색체 통합으로부터 발생한다. 이들 일부 실시양태에서, 코딩 서열은 야생형 단백질을 코딩하는 염색체 서열이 불활성화되지만 외인성으로 도입된 단백질이 발현되도록 염색체에 통합된다.
다른 실시양태에서, 염색체 변형은 변이체 단백질 생성물을 생성한다. 발현된 변이체 단백질 생성물은 적어도 하나의 아미노산 치환 및/또는 적어도 하나의 아미노산의 부가 또는 결실을 가질 수 있다. 변경된 염색체 서열에 의해 코딩되는 변이체 단백질 생성물은 야생형 단백질, 예컨대 비제한적으로 변경된 효소 활성 또는 기질 특이성과 비교하여 변형된 특징 또는 활성을 나타낼 수 있다.
여전히 다른 실시양태에서, 염색체 변형은 단백질의 변경된 발현 패턴을 일으킬 수 있다. 비제한적인 예로서, 단백질 생성물의 발현을 조절하는 조절 영역에서의 염색체 변경은 단백질 생성물의 과발현 또는 하향조절, 또는 변경된 조직 또는 일시적인 발현 패턴을 일으킬 수 있다.
단수 형태는 1개 또는 1개 초과의 (즉, 적어도 하나의) 문법적 대상을 지칭하기 위해 본원에서 사용된다. 예를 들어, "폴리펩티드"는 하나 이상의 폴리펩티드들을 의미한다.
본 명세서에 언급된 모든 공보 및 특허 출원은 이 개시내용이 속하는 기술분야의 기술자의 수준을 나타낸다. 모든 공보 및 특허 출원은 각각의 개별 공보 또는 특허 출원이 구체적이고 개별적으로 참고로 포함되는 것으로 나타낸 것과 동일한 정도로 본원에 참고로 포함된다.
상기 발명이 이해의 명료함의 목적으로 설명 및 예시를 위해 일부 상세하게 기재되었지만, 특정 변화 및 변형이 첨부된 실시양태의 범위 내에서 실시될 수 있음이 명백할 것이다.
비제한적인 실시양태에는 하기가 포함된다:
1. RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
상기 RGN 폴리펩티드는 표적 DNA 서열과 혼성화할 수 있는 가이드 RNA (gRNA)에 결합할 때 RNA-가이드된 서열 특이적인 방식으로 상기 표적 DNA 서열과 결합하고,
RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
2. 실시양태 1에 있어서, 상기 RGN 폴리펩티드가 결합시 상기 표적 DNA 서열을 절단할 수 있는 것인 핵산 분자.
3. 실시양태 2에 있어서, 상기 RGN 폴리펩티드에 의한 절단이 이중 가닥 파손을 생성하는 것인 핵산 분자.
4. 실시양태 2에 있어서, 상기 RGN 폴리펩티드에 의한 절단이 단일 가닥 파손을 생성하는 것인 핵산 분자.
5. 실시양태 1에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 핵산 분자.
6. 실시양태 5에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
7. 실시양태 6에 있어서, 상기 염기-편집 폴리펩티드가 데아미나제인 핵산 분자.
8. 실시양태 7에 있어서, 상기 데아미나제가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 90% 서열 동일성을 갖는 것인 핵산 분자.
9. 실시양태 1-8 중 어느 하나에 있어서, RGN 폴리펩티드가 하나 이상의 핵 국재화 신호를 포함하는 것인 핵산 분자.
10. 실시양태 1-9 중 어느 하나에 있어서, RGN 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화된 것인 핵산 분자.
11. 실시양태 1-10 중 어느 하나에 있어서, 상기 표적 DNA 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하게 위치하는 것인 핵산 분자.
12. 실시양태 1-11 중 어느 하나의 핵산 분자를 포함하는 벡터.
13. 실시양태 12에 있어서, 상기 표적 DNA 서열과 혼성화할 수 있는 상기 gRNA를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하는 벡터.
14. 실시양태 13에 있어서, 상기 gRNA가 단일 가이드 RNA인 벡터.
15. 실시양태 13에 있어서, 상기 gRNA가 이중-가이드 RNA인 벡터.
16. 실시양태 13-15 중 어느 하나에 있어서, 가이드 RNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 CRISPR 반복 서열을 포함하는 CRISPR RNA를 포함하는 것인 벡터.
17. 실시양태 13-16 중 어느 하나에 있어서, 가이드 RNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 tracrRNA을 포함하는 것인 벡터.
18. 실시양태 1-11 중 어느 하나의 핵산 분자 또는 실시양태 12-17 중 어느 하나의 벡터를 포함하는 세포.
19. RGN 폴리펩티드가 발현되는 조건하에 실시양태 18의 세포를 배양하는 것을 포함하는, RGN 폴리펩티드를 제조하는 방법.
20. 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 이종성 핵산 분자를 세포에 도입시키고;
상기 RGN 폴리펩티드는 표적 DNA 서열과 혼성화할 수 있는 가이드 RNA (gRNA)에 결합할 때 RNA-가이드된 서열 특이적인 방식으로 상기 표적 DNA 서열과 결합하며;
RGN 폴리펩티드가 발현되는 조건하에 상기 세포를 배양하는 것을 포함하는, RGN 폴리펩티드를 제조하는 방법.
21. 실시양태 19 또는 20에 있어서, 상기 RGN 폴리펩티드를 정제하는 것을 추가로 포함하는 방법.
22. 실시양태 19 또는 20에 있어서, 상기 세포가 상기 RGN 폴리펩티드에 결합하여 RGN 리보핵단백질 복합체를 형성하는 하나 이상의 가이드 RNA를 추가로 발현하는 것인 방법.
23. 실시양태 22에 있어서, 상기 RGN 리보핵단백질 복합체를 정제하는 것을 추가로 포함하는 방법.
24. CRISPR RNA (crRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 crRNA는 스페이서 서열 및 CRISPR 반복 서열을 포함하고, 상기 CRISPR 반복 서열은 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고;
a) 상기 crRNA; 및
b) 상기 crRNA의 상기 CRISPR 반복 서열에 혼성화된 트랜스-활성화 CRISPR RNA (tracrRNA)
를 포함하는 가이드 RNA는
상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드와 결합할 때 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열과 혼성화할 수 있고,
crRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
25. 실시양태 24의 핵산 분자를 포함하는 벡터.
26. 실시양태 25에 있어서, 상기 벡터가 상기 tracrRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
27. 실시양태 26에 있어서, 상기 tracrRNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인 벡터.
28. 실시양태 26 또는 27에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 동일한 프로모터에 작동가능하게 연결되고, 단일 가이드 RNA로서 코딩되는 것인 벡터.
29. 실시양태 26 또는 27에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 별도의 프로모터에 작동가능하게 연결된 것인 벡터.
30. 실시양태 25-29 중 어느 하나에 있어서, 상기 벡터가 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드를 추가로 포함하고, 상기 RGN 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 벡터.
31. 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 트랜스-활성화 CRISPR RNA (tracrRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며;
a) 상기 tracrRNA; 및
b) 스페이서 서열 및 CRISPR 반복 서열을 포함하는 crRNA
- 상기 tracrRNA는 상기 crRNA의 상기 CRISPR 반복 서열과 혼성화함
를 포함하는 가이드 RNA는
상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드에 결합할 때 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열과 혼성화할 수 있고,
tracrRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
32. 실시양태 31의 핵산 분자를 포함하는 벡터.
33. 실시양태 32에 있어서, 상기 벡터가 상기 crRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
34. 실시양태 33에 있어서, 상기 crRNA의 CRISPR 반복 서열이 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 것인 벡터.
35. 실시양태 33 또는 34에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 동일한 프로모터에 작동가능하게 연결되고, 단일 가이드 RNA로서 코딩되는 것인 벡터.
36. 실시양태 33 또는 34에 있어서, 상기 crRNA를 코딩하는 상기 폴리뉴클레오티드 및 상기 tracrRNA를 코딩하는 상기 폴리뉴클레오티드가 별도의 프로모터에 작동가능하게 연결된 것인 벡터.
37. 실시양태 32-36 중 어느 하나에 있어서, 상기 벡터가 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드를 추가로 포함하고, 상기 RGN 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 벡터.
38. 표적 DNA 서열에 결합하기 위한 시스템이며, 상기 시스템은 하기를 포함하고:
a) 상기 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열;
하나 이상의 가이드 RNA를 코딩하고 RGN 폴리펩티드를 코딩하는 상기 뉴클레오티드 서열 각각이 상기 뉴클레오티드 서열에 대해 이종성인 프로모터에 작동가능하게 연결되고;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하고,
하나 이상의 가이드 RNA는 RGN 폴리펩티드와 복합체를 형성하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 시스템.
39. 실시양태 38에 있어서, 상기 gRNA가 단일 가이드 RNA (sgRNA)인 시스템.
40. 실시양태 38에 있어서, 상기 gRNA가 이중-가이드 RNA인 시스템.
41. 실시양태 38-40 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하는 것인 시스템.
42. 실시양태 38-41 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하는 것인 시스템.
43. 실시양태 38-42 중 어느 하나에 있어서, 상기 표적 DNA 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하게 위치하는 시스템.
44. 실시양태 38-43 중 어느 하나에 있어서, 표적 DNA 서열이 세포 내에 있는 것인 시스템.
45. 실시양태 44에 있어서, 세포가 진핵생물 세포인 시스템.
46. 실시양태 45에 있어서, 진핵생물 세포가 식물 세포인 시스템.
47. 실시양태 45에 있어서, 진핵생물 세포가 포유동물 세포인 시스템.
48. 실시양태 45에 있어서, 진핵생물 세포가 곤충 세포인 시스템.
49. 실시양태 44에 있어서, 세포가 원핵생물 세포인 시스템.
50. 실시양태 38-49 중 어느 하나에 있어서, 전사될 때 하나 이상의 가이드 RNA가 표적 DNA 서열과 혼성화하고, 가이드 RNA가 표적 DNA 서열의 절단을 초래하는 RGN 폴리펩티드와 복합체를 형성하는 것인 시스템.
51. 실시양태 50에 있어서, 절단이 이중 가닥 파손을 생성하는 것인 시스템.
52. 실시양태 50에 있어서, 상기 RGN 폴리펩티드에 의한 절단이 단일 가닥 파손을 생성하는 것인 시스템.
53. 실시양태 38-49 중 어느 하나에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 시스템.
54. 실시양태 53에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 시스템.
55. 실시양태 54에 있어서, 상기 염기-편집 폴리펩티드가 데아미나제인 시스템.
56. 실시양태 55에 있어서, 상기 데아미나제가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 90% 서열 동일성을 갖는 것인 시스템.
57. 실시양태 38-56 중 어느 하나에 있어서, RGN 폴리펩티드가 하나 이상 핵 국재화 신호를 포함하는 것인 시스템.
58. 실시양태 38-57 중 어느 하나에 있어서, RGN 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화된 것인 시스템.
59. 실시양태 38-58 중 어느 하나에 있어서, 하나 이상의 가이드 RNA를 코딩하는 뉴클레오티드 서열 및 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열이 하나의 벡터 상에 위치하는 것인 시스템.
60. 실시양태 38-59 중 어느 하나에 있어서, 상기 시스템이 하나 이상의 공여자 폴리뉴클레오티드, 또는 하나 이상의 공여자 폴리뉴클레오티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 추가로 포함하는 것인 시스템.
61. 실시양태 38-60 중 어느 하나에 따른 시스템을 표적 DNA 서열, 또는 표적 DNA 서열을 포함하는 세포에 전달하는 것을 포함하는, 표적 DNA 서열에 결합시키는 방법.
62. 실시양태 61에 있어서, 상기 RGN 폴리펩티드 또는 상기 가이드 RNA가 검출가능한 표지를 추가로 포함하여, 상기 표적 DNA 서열의 검출을 가능하게 하는 것인 방법.
63. 실시양태 61에 있어서, 상기 가이드 RNA 또는 상기 RGN 폴리펩티드가 발현 조절인자를 추가로 포함하여, 상기 표적 DNA 서열, 또는 상기 표적 DNA 서열에 의한 전사 조절하에 있는 유전자의 발현을 조절하는 것인 방법.
64. 실시양태 38-60 중 어느 하나에 따른 시스템을 표적 DNA 서열, 또는 표적 DNA 서열을 포함하는 세포에 전달하는 것을 포함하는, 표적 DNA 서열을 절단하거나 또는 변형시키는 방법.
65. 실시양태 64에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로의 이종성 DNA의 삽입을 포함하는 것인 방법.
66. 실시양태 64에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로부터 적어도 하나의 뉴클레오티드의 결실을 포함하는 것인 방법.
67. 실시양태 64에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열에서 적어도 하나의 뉴클레오티드의 돌연변이를 포함하는 것인 방법.
68. a) RGN 리보뉴클레오티드 복합체의 형성에 적합한 조건하에
i) 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA; 및
ii) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RGN 폴리펩티드
를 조합함으로써 시험관내에서 RNA-가이드된 뉴클레아제 (RGN) 리보뉴클레오티드 복합체를 조립하고;
b) 상기 표적 DNA 서열, 또는 상기 표적 DNA 서열을 포함하는 세포를 시험관내-조립된 RGN 리보뉴클레오티드 복합체와 접촉시키는 것을 포함하는, 표적 DNA 서열에 결합시키는 방법이며;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 방법.
69. 실시양태 68에 있어서, 상기 RGN 폴리펩티드 또는 상기 가이드 RNA가 검출가능한 표지를 추가로 포함하여, 상기 표적 DNA 서열의 검출을 가능하게 하는 것인 방법.
70. 실시양태 68에 있어서, 상기 가이드 RNA 또는 상기 RGN 폴리펩티드가 발현 조절인자를 추가로 포함하여, 상기 표적 DNA 서열의 발현의 조절을 가능하게 하는 것인 방법.
71. DNA 분자를 하기와 접촉시키는 것을 포함하는, 표적 DNA 서열을 절단하고/거나 변형시키는 방법이며:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 여기서 상기 RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함함; 및
b) (a)의 RGN을 표적 DNA 서열에 대해 표적화할 수 있는 하나 이상의 가이드 RNA;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열과 결합하도록 지시하고, 상기 표적 DNA 서열의 절단 및/또는 변형이 발생하는 것인 방법.
72. 실시양태 71에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로의 이종성 DNA의 삽입을 포함하는 것인 방법.
73. 실시양태 71에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로부터 적어도 하나의 뉴클레오티드의 결실을 포함하는 것인 방법.
74. 실시양태 71에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열에서 적어도 하나의 뉴클레오티드의 돌연변이를 포함하는 것인 방법.
75. 실시양태 71-74 중 어느 하나에 있어서, 상기 RGN 폴리펩티드가 닉카제인 방법.
76. 실시양태 73 또는 74에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이고, 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 방법.
77. 실시양태 68-76 중 어느 하나에 있어서, 상기 gRNA가 단일 가이드 RNA (sgRNA)인 방법.
78. 실시양태 68-76 중 어느 하나에 있어서, 상기 gRNA가 이중-가이드 RNA인 방법.
79. 실시양태 68-78 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하는 것인 방법.
80. 실시양태 68-79 중 어느 하나에 있어서, 상기 gRNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 tracrRNA를 포함하는 것인 방법.
81. 실시양태 68-80 중 어느 하나에 있어서, 상기 표적 DNA 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하게 위치하는 것인 방법.
82. 실시양태 61-81 중 어느 하나에 있어서, 표적 DNA 서열이 세포 내에 위치하는 것인 방법.
83. 실시양태 82에 있어서, 세포가 진핵생물 세포인 방법.
84. 실시양태 83에 있어서, 진핵생물 세포가 식물 세포인 방법.
85. 실시양태 83에 있어서, 진핵생물 세포가 포유동물 세포인 방법.
86. 실시양태 83에 있어서, 진핵생물 세포가 곤충 세포인 방법.
87. 실시양태 82에 있어서, 세포가 원핵생물 세포인 방법.
88. 실시양태 82-87 중 어느 하나에 있어서, RGN 폴리펩티드가 발현되는 조건하에 세포를 배양하여, 표적 DNA 서열을 절단하여 변형된 DNA 서열을 생성하고; 상기 변형된 DNA 서열을 포함하는 세포를 선택하는 것을 추가로 포함하는 방법.
89. 실시양태 88의 방법에 따른 변형된 표적 DNA 서열을 포함하는 세포.
90. 실시양태 89에 있어서, 세포가 진핵생물 세포인 세포.
91. 실시양태 90에 있어서, 진핵생물 세포가 식물 세포인 세포.
92. 실시양태 91의 세포를 포함하는 식물.
93. 실시양태 91의 세포를 포함하는 종자.
94. 실시양태 90에 있어서, 진핵생물 세포가 포유동물 세포인 세포.
95. 실시양태 90에 있어서, 진핵생물 세포가 곤충 세포인 세포.
96. 실시양태 89에 있어서, 세포가 원핵생물 세포인 세포.
97. 세포에 하기를 도입시키는 것을 포함하고:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드 - 여기서 RGN 폴리펩티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하고, RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 세포에서 RGN 폴리펩티드의 발현이 가능하도록 프로모터에 작동가능하게 연결됨; 및
b) 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결됨;
이로써 RGN 및 gRNA은 원인 돌연변이의 게놈 위치에 대해 표적화되고, 원인 돌연변이를 제거하도록 게놈 서열을 변형시키는 것인, 유전적으로 유전된 질환에 대한 원인 돌연변이에서의 수정에 의해 유전자 변형된 세포를 생성하는 방법.
98. 실시양태 97에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 방법.
99. 실시양태 98에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 방법.
100. 실시양태 99에 있어서, 상기 염기-편집 폴리펩티드가 데아미나제인 방법.
101. 실시양태 100에 있어서, 데아미나제가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 방법.
102. 실시양태 97-101 중 어느 하나에 있어서, 세포가 동물 세포인 방법.
103. 실시양태 102에 있어서, 동물 세포가 포유동물 세포인 방법.
104. 실시양태 103에 있어서, 세포가 개, 고양이, 마우스, 래트, 토끼, 말, 소, 돼지, 또는 인간으로부터 유래되는 것인 방법.
105. 실시양태 102에 있어서, 유전적으로 유전된 질환이 표 8에 나열된 질환인 방법.
106. 실시양태 102에 있어서, 유전적으로 유전된 질환이 헐러 증후군인 방법.
107. 실시양태 106에 있어서, gRNA가 서열식별번호: 337을 표적화하는 스페이서 서열을 포함하는 것인 방법.
108. 세포에 하기를 도입하는 것을 포함하며:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드 - 여기서 RGN 폴리펩티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하고, RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 세포에서 RGN 폴리펩티드의 발현이 가능하도록 프로모터에 작동가능하게 연결됨; 및
b) 제1 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결되고, 추가로 gRNA는 불안정 게놈 영역의 5' 플랭크를 표적화하는 스페이서 서열을 포함함; 및
c) 제2 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결되고, 추가로 상기 제2 gRNA는 불안정 게놈 영역의 3' 플랭크를 표적화하는 스페이서 서열을 포함함;
이로써 RGN 및 2개의 gRNA는 불안정 게놈 영역을 표적화하고, 불안정 게놈 영역의 적어도 일부분이 제거되는 것인, 질환을 유발하는 불안정 게놈 영역에서 결실을 갖는 유전자 변형된 세포를 생성하는 방법.
109. 실시양태 108에 있어서, 세포가 동물 세포인 방법.
110. 실시양태 108에 있어서, 세포가 포유동물 세포인 방법.
111. 실시양태 110에 있어서, 세포가 개, 고양이, 마우스, 래트, 토끼, 말, 소, 돼지, 또는 인간으로부터 유래되는 것인 방법.
112. 실시양태 109에 있어서, 유전적으로 유전된 질환이 프리드리히(Friedrich) 운동실조 또는 헌팅턴 질환인 방법.
113. 실시양태 112에 있어서, 제1 gRNA가 서열식별번호: 340, 341, 342 또는 343을 표적화하는 스페이서 서열을 포함하는 것인 방법.
114. 실시양태 113에 있어서, 제2 gRNA가 서열식별번호: 340, 341, 342 또는 343을 표적화하는 스페이서 서열을 포함하는 것인 방법.
115. 단리된 인간 조혈 전구 세포에 하기를 도입하는 것을 포함하며:
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 상기 RGN 폴리펩티드를 코딩하는 폴리뉴클레오티드 - 여기서 RGN 폴리펩티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하고, RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 세포에서 RGN 폴리펩티드의 발현이 가능하도록 프로모터에 작동가능하게 연결됨; 및
b) 가이드 RNA (gRNA), 또는 상기 gRNA를 코딩하는 폴리뉴클레오티드 - 여기서 gRNA는 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 CRISPR 반복 서열을 포함하고, gRNA를 코딩하는 상기 폴리뉴클레오티드는 세포에서 gRNA의 발현이 가능하도록 프로모터에 작동가능하게 연결됨,
이로써 RGN 및 gRNA는 세포에서 발현되고, BCL11A 인핸서 영역에서 절단하여, 인간 조혈 전구 세포의 유전자 변형을 일으키고, BCL11A의 mRNA 및/또는 단백질 발현을 감소시키는 것인, 감소된 BCL11A mRNA 및 단백질 발현을 갖는 유전자 변형된 포유동물의 조혈 전구 세포를 생성하는 방법.
116. 실시양태 115에 있어서, gRNA가 서열식별번호: 350, 351 또는 352를 표적화하는 스페이서 서열을 추가로 포함하는 것인 방법.
117. 표적 DNA 서열과 결합하기 위한 시스템이며, 상기 시스템은 하기를 포함하고:
a) 상기 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하고,
하나 이상의 가이드 RNA는 RGN 폴리펩티드와 복합체를 형성하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 시스템.
118. 실시양태 117에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 시스템.
119. 실시양태 117 또는 118에 있어서, 상기 RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 융합된 것인 시스템.
120. 실시양태 119에 있어서, 염기-편집 폴리펩티드가 데아미나제인 시스템.
121. 실시양태 120에 있어서, 데아미나제 폴리펩티드가 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416, 420, 514 및 572-584 중 어느 하나와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 시스템.
122. 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
상기 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키고;
상기 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
123. 실시양태 122에 있어서, 데아미나제 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화되는 것인 핵산 분자.
124. 실시양태 122 또는 123에 있어서, 데아미나제 폴리펩티드가 상기 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 DNA-결합 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
125. 실시양태 124에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 핵산 분자.
126. 실시양태 124에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드되는 것인 핵산 분자.
127. 실시양태 126에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 핵산 분자.
128. 실시양태 127에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 핵산 분자.
129. 실시양태 127에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 핵산 분자.
130. 실시양태 126-129 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 핵산 분자.
131. 실시양태 127에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 핵산 분자.
132. 실시양태 124-131 중 어느 하나에 있어서, 데아미나제 폴리펩티드가 우라실 글리코실라제 억제제 (UGI) 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
133. 실시양태 132에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 핵산 분자.
134. 실시양태 122-133 중 어느 하나에 있어서, 데아미나제 폴리펩티드가 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 핵산 분자.
135. 실시양태 122-134 중 어느 하나의 핵산 분자를 포함하는 벡터.
136. 실시양태 126-134 중 어느 하나의 핵산 분자를 포함하는 벡터이며, 상기 벡터는 상기 표적 폴리뉴클레오티드와 혼성화할 수 있고 상기 RNA-가이드된 DNA-결합 폴리펩티드와 복합체로 작용할 수 있는 가이드 RNA (gRNA)를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하는 것인 벡터.
137. 실시양태 136에 있어서, 상기 gRNA가 단일 가이드 RNA인 벡터.
138. 실시양태 136에 있어서, 상기 gRNA가 이중-가이드 RNA인 벡터.
139. 실시양태 122-134 중 어느 하나의 핵산 분자 또는 실시양태 135-138 중 어느 하나의 벡터를 포함하는 세포.
140. 실시양태 139의 세포를 데아미나제 폴리펩티드가 발현되는 조건하에 배양하는 것을 포함하는, 데아미나제 폴리펩티드의 제조 방법.
141. 아데노신 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고:
a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키고;
아데노신 데아미나제 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자.
142. 실시양태 141에 있어서, 상기 아데노신 데아미나제 폴리펩티드가 진핵생물 세포에서의 발현을 위해 코돈 최적화되는 것인 핵산 분자.
143. 실시양태 141 또는 142에 있어서, 아데노신 데아미나제 폴리펩티드가 상기 아데노신 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 DNA-결합 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
144. 실시양태 143에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 핵산 분자.
145. 실시양태 143에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드된 것인 핵산 분자.
146. 실시양태 145에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 핵산 분자.
147. 실시양태 146에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 핵산 분자.
148. 실시양태 146에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 핵산 분자.
149. 실시양태 145-148 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 핵산 분자.
150. 실시양태 146에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 핵산 분자.
151. 실시양태 141-150 중 어느 하나에 있어서, 아데노신 데아미나제 폴리펩티드가 우라실 글리코실라제 억제제 (UGI) 폴리펩티드에 작동가능하게 연결된 것인 핵산 분자.
152. 실시양태 151에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 핵산 분자.
153. 실시양태 141-152 중 어느 하나에 있어서, 아데노신 데아미나제 폴리펩티드가 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 핵산 분자.
154. 실시양태 141-153 중 어느 하나의 핵산 분자를 포함하는 벡터.
155. 실시양태 145-153 중 어느 하나의 핵산 분자를 포함하는 벡터이며, 상기 벡터는 상기 표적 폴리뉴클레오티드와 혼성화할 수 있고 상기 RNA-가이드된 DNA-결합 폴리펩티드와 복합체로 작용할 수 있는 가이드 RNA (gRNA)를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하는 것인 벡터.
156. 실시양태 155에 있어서, 상기 gRNA가 단일 가이드 RNA인 벡터.
157. 실시양태 155에 있어서, 상기 gRNA가 이중-가이드 RNA인 벡터.
158. 실시양태 141-153 중 어느 하나의 핵산 분자 또는 실시양태 154-157 중 어느 하나의 벡터를 포함하는 세포.
159. 실시양태 158의 세포를 아데노신 데아미나제 폴리펩티드가 발현되는 조건하에 배양하는 것을 포함하는, 아데노신 데아미나제 폴리펩티드의 제조 방법.
160. 하기를 포함하는 융합 단백질이며:
a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
b) 데아미나제 폴리펩티드,
상기 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 융합 단백질.
161. 실시양태 160에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 융합 단백질.
162. 실시양태 160에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드된 것인 융합 단백질.
163. 실시양태 162에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 융합 단백질.
164. 실시양태 163에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 융합 단백질.
165. 실시양태 163에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 융합 단백질.
166. 실시양태 162-165 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 융합 단백질.
167. 실시양태 163에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 융합 단백질.
168. 실시양태 160-167 중 어느 하나에 있어서, 융합 단백질이 우라실 글리코실라제 억제제 (UGI) 폴리펩티드를 추가로 포함하는 것인 융합 단백질.
169. 실시양태 168에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 융합 단백질.
170. 실시양태 160-169 중 어느 하나에 있어서, 융합 단백질이 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 융합 단백질.
171. 하기를 포함하는 융합 단백질이며:
a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
b) 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드:
i) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
ii) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
iii) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
iv) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
v) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
vi) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
vii) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
viii) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
ix) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
x) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
xi) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
xii) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
xiii) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
xiv) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 융합 단백질.
172. 실시양태 171에 있어서, DNA-결합 폴리펩티드가 메가뉴클레아제, 아연 핑거 융합 단백질, 또는 TALEN인 융합 단백질.
173. 실시양태 171에 있어서, DNA-결합 폴리펩티드가 RNA 가이드와 복합체로 작용하고, 따라서 RNA-가이드된 것인 융합 단백질.
174. 실시양태 173에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 RNA-가이드된 뉴클레아제 폴리펩티드이거나 또는 그로부터 유래된 것인 융합 단백질.
175. 실시양태 174에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 II CRISPR-Cas 폴리펩티드인 융합 단백질.
176. 실시양태 174에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 유형 V CRISPR-Cas 폴리펩티드인 융합 단백질.
177. 실시양태 173-176 중 어느 하나에 있어서, RNA-가이드된 DNA-결합 폴리펩티드가 닉카제인 융합 단백질.
178. 실시양태 174에 있어서, RNA-가이드된 뉴클레아제 폴리펩티드가 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 것인 융합 단백질.
179. 실시양태 171-178 중 어느 하나에 있어서, 융합 단백질이 우라실 글리코실라제 억제제 (UGI) 폴리펩티드를 추가로 포함하는 것인 융합 단백질.
180. 실시양태 179에 있어서, UGI 폴리펩티드가 서열식별번호: 570의 아미노산 서열과 적어도 85% 동일한 것인 융합 단백질.
181. 실시양태 171-180 중 어느 하나에 있어서, 융합 단백질이 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 융합 단백질.
182. 표적 폴리뉴클레오티드 서열을 변형시키기 위한 시스템이며, 상기 시스템은 하기를 포함하고:
a) 상기 표적 폴리뉴클레오티드 서열에 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 실시양태 162-170 및 173-181 중 어느 하나의 융합 단백질 또는 상기 융합 단백질을 코딩하는 뉴클레오티드 서열;
하나 이상의 가이드 RNA를 코딩하고 융합 단백질을 코딩하는 상기 뉴클레오티드 서열 각각은 상기 뉴클레오티드 서열에 대해 이종성인 프로모터에 대해 작동가능하게 연결되고;
하나 이상의 가이드 RNA는 표적 폴리뉴클레오티드 서열에 혼성화하고,
하나 이상의 가이드 RNA는 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열과 결합하여 그를 변형시키도록 지시하는 것인 시스템.
183. 실시양태 182에 있어서, 상기 gRNA가 단일 가이드 RNA (sgRNA)인 시스템.
184. 실시양태 182에 있어서, 상기 gRNA가 이중-가이드 RNA인 시스템.
185. 실시양태 182-184 중 어느 하나에 있어서, 상기 표적 폴리뉴클레오티드 서열이 프로토스페이서 인접한 모티프 (PAM)에 인접하여 위치하는 것인 시스템.
186. 실시양태 182-185 중 어느 하나에 있어서, 표적 폴리뉴클레오티드 서열이 세포 내에 있는 것인 시스템.
187. 실시양태 186에 있어서, 세포가 진핵생물 세포인 시스템.
188. 실시양태 187에 있어서, 진핵생물 세포가 식물 세포인 시스템.
189. 실시양태 187에 있어서, 진핵생물 세포가 포유동물 세포인 시스템.
190. 실시양태 187에 있어서, 진핵생물 세포가 곤충 세포인 시스템.
191. 실시양태 186에 있어서, 세포가 원핵생물 세포인 시스템.
192. 표적 폴리뉴클레오티드를 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 탈아미노화시키는 방법이며, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
193. 표적 폴리뉴클레오티드를 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 방법이며:
a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 방법.
194. 표적 폴리뉴클레오티드를 실시양태 160, 161, 171 및 172 중 어느 하나의 융합 단백질과 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며, 상기 DNA-결합 폴리펩티드는 상기 표적 폴리뉴클레오티드에 결합하고, 상기 데아미나제는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
195. 표적 폴리뉴클레오티드를 실시양태 162-170 및 173-181 중 어느 하나의 융합 단백질과 접촉시키고, 하나 이상의 가이드 RNA (gRNA), 또는 하나 이상의 gRNA를 코딩하는 하나 이상의 뉴클레오티드 서열을 도입시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며;
하나 이상의 gRNA는 상기 표적 폴리뉴클레오티드에 혼성화하고, 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열에 결합하도록 지시하고, 융합 단백질의 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시켜, 상기 표적 폴리뉴클레오티드를 변형시키는 것인 방법.
196. 실시양태 195에 있어서, 표적 폴리뉴클레오티드가 세포 내에 있는 것인 방법.
197. 실시양태 196에 있어서, 세포가 진핵생물 세포인 방법.
198. 실시양태 197에 있어서, 진핵생물 세포가 포유동물 세포인 방법.
199. 실시양태 197에 있어서, 진핵생물 세포가 식물 세포인 방법.
200. 실시양태 195 내지 199 중 어느 하나에 있어서, 표적 폴리뉴클레오티드의 변형이 C에서 T로의 점 돌연변이를 포함하는 것인 방법.
201. 실시양태 200에 있어서, C 염기의 탈아미노화가 질환 또는 장애와 연관된 서열을 수정하는 것인 방법.
202. 실시양태 200에 있어서, 표적 폴리뉴클레오티드의 변형이 농작물의 게놈에서 C에서 T로의 변화를 포함하고, C 염기의 탈아미노화가 농작물의 농경학적 품질을 개선시키는 서열을 생성하는 것인 방법.
203. 실시양태 195 내지 199 중 어느 하나에 있어서, 표적 폴리뉴클레오티드의 변형이 A에서 G로의 점 돌연변이를 포함하는 것인 방법.
204. 실시양태 203에 있어서, A 염기의 탈아미노화가 질환 또는 장애와 연관된 서열을 수정하는 것인 방법.
205. 실시양태 203에 있어서, 표적 폴리뉴클레오티드의 변형이 농작물의 게놈에서 A에서 G로의 변화를 포함하고, A 염기의 탈아미노화가 농작물의 농격학적 품질을 개선시키는 서열을 생성하는 것인 방법.
하기 실시예는 설명을 위해 제공되며, 제한하는 것이 아니다.
실험
실시예 1. RNA-가이드된 뉴클레아제의 확인
6개의 별개의 CRISPR-연관된 RNA-가이드된 뉴클레아제 (RGN)를 확인하였고, 하기 표 1에 기재하였다. APG00969, APG03128 및 APG00771은 유형 II-C RGN이다. APG09748, APG02789 및 APG09106은 유형 V-B RGN이다. 표 1은 각각의 RGN의 명칭, 그의 아미노산 서열, 그가 유래된 공급원, 및 가공된 crRNA 반복 서열 및 tracrRNA 서열을 제공한다. 표 1은 sgRNA의 핵산 표적 서열을 결정하는 포괄적인 단일 가이드 RNA (sgRNA) 서열을 추가로 제공한다. 스페이서 서열의 위치는 폴리-N 서열에 의해 표시된다. 이 폴리-N 서열은 sgRNA에서 스페이서 서열의 위치를 나타내고, 기능적인 스페이서 서열에 필요한 길이를 나타내지는 않는다. 유형 II-C RGN 시스템 각각은 tracrRNA의 헤어핀 스템의 염기에서 보존된 서열을 갖고: APG00969는 UNANNC (서열식별번호: 13)를 갖고; APG03128은 ANGNNU (서열식별번호: 23)를 갖고; APG00771은 UNANNA (서열식별번호: 42)를 갖는다.
표 1: 서열식별번호 및 CRISPR 연관된 시스템의 개요
실시예 2: 가이드 RNA 확인 및 sgRNA 구축
연구 중인 RNA-가이드된 뉴클레아제 시스템을 본래 발현하는 박테리아의 배양물을 중간-로그 단계 (~0.600의 OD600)로 성장시키고, 펠렛화하고, 급속 냉동하였다. mirVANA miRNA 단리 키트 (라이프 테크놀로지즈(Life Technologies), 캘리포니아주 칼스바드)를 사용하여 RNA를 펠렛으로부터 단리하고, 단리된 RNA로부터 NEBNext 소형 RNA 라이브러리 제조 키트 (NEB, 메사추세츠주 베벌리)를 사용하여 시퀀싱 라이브러리를 제조하였다. 라이브러리 제조물을 6% 폴리아크릴아미드 겔 상에서 crRNA 및 tracrRNA를 검출하기 위해 각각 18-65nt 및 90-200nt RNA 종에 상응하는 2가지 크기 분획으로 분획화하였다. 딥 시퀀싱 (더 작은 분획의 경우 40 bp 쌍-말단 및 더 큰 분획의 경우 80bp 쌍-말단)은 Next Seq 500 (하이 아웃풋 키트(High Output kit)) 상에서 서비스 제공자 (모진(MoGene), 미주리주 세인트 루이스)에 의해 수행되었다. 판독을 컷어댑트(Cutadapt)를 사용하여 품질을 다듬고, 보우타이(Bowtie)2를 이용하여 기준 게놈에 맵핑하였다. 커스텀 RNAseq 파이프라인을 파이썬에 기록하여 crRNA 및 tracrRNA 전사체를 검출하였다. 가공된 crRNA 경계를 본래의 반복 스페이서 어레이의 서열 커버리지에 의해 결정하였다. tracrRNA의 안티-반복 부분은 허용적 BLASTn 파라미터를 사용하여 확인하였다. RNA 시퀀싱 깊이는 안티-반복부를 함유하는 전사체를 확인함으로써 가공된 tracrRNA의 경계를 확인시켰다. RNA의 수동 큐레이션을 RNA 폴딩 소프트웨어인 NUPACK에 의해 이차 구조 예측을 이용하여 수행하였다. 대안적으로, APG02789를 위한 tracrRNA는 소형 RNA 시퀀싱을 통해서가 아니라 안티-반복 서열에 의해 생물정보학적으로 결정되었다. 일반적으로, sgRNA 카세트를 DNA 합성에 의해 제조하였고, 일반적으로 APG00771, APG03128 및 APG00969를 위해 다음과 같이 설계되었다 (5'→3') 20-30 bp 스페이서 서열 -- crRNA의 가공된 반복 부분 -- 4 bp 비상보성 링커 (AAAG; 서열식별번호: 8) -- 가공된 tracrRNA. APG09748, APG09106 및 APG02789의 경우, sgRNA 카세트는 다음과 같이 설계되었다 (5'→3'): 가공된 tracrRNA -- 4 bp 비상보성 링커 (AAAG; 서열식별번호: 8) -- crRNA의 가공된 반복 부분) -- 20-30 bp 표적 스페이서 서열. 관련 기술분야에 공지된 다른 4 bp 또는 6 bp 비상보성 링커 또한 sgRNA 설계를 위해 사용될 수 있다. 시험관내 검정의 경우, 진아트(GeneArt)™ 정밀 gRNA 합성 키트 (써모피셔(ThermoFisher))를 사용하여 sgRNA 카세트의 시험관내 전사에 의해 sgRNA를 합성하였다. 각각의 RGN 폴리펩티드에 대한 가공된 crRNA 및 tracrRNA 서열을 확인하였고, 표 1에 제시되어 있다. PAM 라이브러리 1 및 2에 대해 구축된 sgRNA에 대해서는 하기를 참고한다.
실시예 3: 각각의 RGN에 대한 PAM 요건의 결정
각각의 RGN에 대한 PAM 요건을 [Kleinstiver et al. (2015) Nature 523:481-485 및 Zetsche et al. (2015) Cell 163:759-771]로부터 본질적으로 채택된 PAM 고갈 검정을 사용하여 결정하였다. 간략히, 2개의 플라스미드 라이브러리 (L1 및 L2)를 pUC18 백본 (ampR)에서 생성하였고, 이들 각각은 8개의 무작위 뉴클레오티드 (즉, PAM 영역)에 의해 플랭킹된 별개의 30bp 프로토스페이서 (표적) 서열을 함유하였다. RGN APG00969, APG03128 및 APG00771에 대한 라이브러리 1 및 라이브러리 2의 표적 서열 및 플랭킹 PAM 영역은 각각 서열식별번호: 14 및 15이다. RGN AP09748, APG02789 및 APG09106에 대한 라이브러리 1 및 라이브러리 2의 표적 서열 및 플랭킹 PAM 영역은 각각 서열식별번호: 32 및 33이다.
L1 또는 L2에서 프로토스페이서에 상응하는 스페이서 서열을 함유하는 동족 sgRNA와 함께, 본 발명의 RGN을 함유하는 pRSF-1b 발현 벡터 (이. 콜라이에 대해 코돈 최적화됨)를 보유하는 이. 콜라이(E. coli) BL21(DE3) 세포에 라이브러리를 별도로 전기천공하였다. 충분한 라이브러리 플라스미드를 형질전환 반응에서 사용하여, >10^6 CFU를 수득하였다. pRSF-1b 백본에서 RGN 및 sgRNA 둘 다 T7 프로모터의 조절하에 있었다. 형질전환 반응을 1 시간 동안 회복시킨 후, 이를 카르베니실린 및 카나마이신을 함유하는 LB 배지로 희석하고, 밤새 성장시켰다. 다음 날, 혼합물을 자체-유도 오버나이트 익스프레스(Overnight Express)™ 즉석 TB 배지 (밀리포어 시그마(Millipore Sigma))로 희석하여 RGN 및 sgRNA를 발현시키고, 추가 4 시간 또는 20 시간 동안 성장시켰고, 그 후에 세포를 스핀 다운하고, 플라스미드 DNA를 미니-프렙 키트(Mini-prep kit) (퀴아젠(Qiagen), 메릴랜드주 저먼타운)에 의해 단리하였다. 적절한 sgRNA의 존재하에, RGN에 의해 인식가능한 PAM을 함유하는 플라스미드가 절단되어, 집단으로부터 제거될 것이다. RGN에 의해 인식되지 않거나 또는 적절한 sgRNA를 함유하지 않는 박테리아로 형질전환된 PAM을 함유하는 플라스미드는 생존하고 복제할 것이다. 절단되지 않은 플라스미드의 PAM 및 프로토스페이서 영역을 PCR-증폭시키고, 공개된 프로토콜 (16s-메가게놈 라이브러리 제조 가이드 15044223B, 일루미나(Illumina), 캘리포니아주 샌디에고)에 따라 시퀀싱을 위해 준비하였다. 딥 시퀀싱 (80bp 단일 말단 판독)은 서비스 제공자 (모진, 미주리주 세인트 루이스)에 의해 MiSeq (일루미나) 상에서 수행되었다. 전형적으로, 앰플리콘당 1-4M 판독이 수득되었다. PAM 영역을 추출하고, 카운팅하고, 각각의 샘플의 총 판독에 대해 정규화하였다. 플라스미드 절단을 유도하는 PAM은 대조군과 비교할 때 (즉, 라이브러리가 RGN을 함유하지만 적절한 sgRNA가 결여된 이. 콜라이로 형질전환되었을 때) 적게 표시되는 것으로 확인되었다. 신규한 RGN에 대한 PAM 요건을 표시하기 위해, 해당 영역의 모든 서열에 대한 고갈률 (샘플에서 빈도/대조군에서 빈도)을 -log 염기 2 형질전환에 의해 농축 값으로 전환시켰다. 충분한 PAM은 농축 값 >2.3 (고갈률 < ~0.2에 상응함)을 가진 것들로 정의되었다. 두 라이브러리 모두에서 이 역치보다 높은 PAM을 수집하였고, 웹 로고를 생성하기 위해 사용하였으며, 이는 예를 들어 "웹로고(weblogo)"로 공지된 인터넷 상의 웹-기반 서비스를 이용하여 생성될 수 있다. 상위 농축 PAM에서 일정한 패턴이 있을 때 PAM 서열을 확인하고 보고하였다. 각각의 RGN에 대한 PAM (농축 지수 (EF) >2.3을 가짐)이 표 2에 제공된다. 일부 RGN의 경우, 비제한적인 예시적인 PAM (EF>3.3을 가짐) 또한 확인되었다. PAM 배향은 APG00969, APG03128, APG00771의 경우 5'-표적-PAM-3'이고, APG09748, APG09106 및 APG02789의 경우 5'-PAM-표적-3'이다.
표 2: PAM 결정
실시예 4: 뉴클레아제 활성을 증가시키기 위한 가이드 RNA의 조작
매우 높은 서열 동일성을 갖고 동일한 PAM을 갖는 RGN APG09748 및 APG09106의 경우, RNA 폴딩 예측을 이용하여, 뉴클레아제 활성을 최적화시키도록 변형될 수 있는 가이드 RNA의 영역을 결정하였다. 반복:안티-반복 영역에서 crRNA:tracrRNA 염기쌍 형성의 안정성은 반복:안티-반복 영역을 단축시키고, G-C 염기쌍을 부가하고, G-U 동요(wobble) 쌍을 제거함으로써 증가되었다. "최적화된" 가이드 변이체를 시험관내 절단 검정에서 RGN APG09748을 이용하여 시험하고 야생형 gRNA와 비교하였다.
RNP 형성을 위한 RGN을 생성하기 위해, C-말단 His6 (서열식별번호: 593) 또는 His10 (서열식별번호: 594) 태그에 융합된 RGN을 함유하는 발현 플라스미드를 구축하고, 이. 콜라이의 BL21 (DE3) 균주로 형질전환시켰다. 발현은 50 μg/mL 카나마이신으로 보충된 매직 미디어(Magic Media) (써모 피셔)를 사용하여 수행하였다. 용해 및 정화 이후, 단백질을 고정된 금속 친화도 크로마토그래피에 의해 정제하고, 큐빗(Qubit) 단백질 정량화 키트 (써모 피셔)를 사용하여 또는 계산된 소광 계수를 이용하는 UV-vis에 의해 정량화하였다.
리보핵단백질 (RNP)은 정제된 RGN을 sgRNA와 함께 ~2:1 비로 실온에서 20 분 동안 인큐베이션함으로써 제조하였다. 시험관내 절단 반응을 위해, RNP를 바람직한 PAM 서열에 의해 플랭킹된 표적화된 프로토스페이서를 함유하는 플라스미드 또는 선형 dsDNA와 함께 실온에서 >30 분 동안 인큐베이션하였다. TRAC 유전자좌 내의 2가지 표적 핵산 서열, TRAC11 (서열식별번호: 60) 및 TRAC14 (서열식별번호: 61)를 시험하였다. gRNA를 정확한 표적 핵산 서열을 갖는 (예를 들어, gRNA는 TRAC11 스페이서 서열을 갖고, 검정된 표적은 TRAC11임) 및 정확한 표적 핵산 서열을 갖지 않는 (예를 들어, gRNA는 TRAC11 스페이서 서열을 갖고, 검정된 표적이 TRAC14임) 표적화된 활성 둘 다에 대해 검정하였다. 플라스미드 절단에 의해 결정된 활성을 아가로스 겔 전기영동에 의해 평가하였다. 결과는 표 3에 나타내었다. 가이드 변이체는 서열식별번호: 56-59로서 나열되고, 스페이서 서열과 함께 제공된다. 이들 가이드 서열은 AAAA의 비상보성 뉴클레오티드 링커 (서열식별번호: 31)를 사용한다. 반복:안티-반복 결합이 증가된 최적화된 gRNA (서열식별번호: 64; 폴리-N은 스페이서 서열의 위치를 나타냄)는 최적화된 tracrRNA (서열식별번호: 62) 및 최적화된 crRNA (서열식별번호: 63) 성분을 갖는다. 최적화된 가이드 변이체는 이전에 야생형 가이드 RNA를 사용하여 절단이 검출되지 않은 2가지 유전자좌를 절단할 수 있다. 반복:안티-반복 영역에서 혼성화의 최적화를 통해, TRAC 유전자좌에서 다중 표적에 대해 APG09748의 시험관내 절단이 0% 절단에서 100% 절단으로 증가하였다.
표 3: 조작된 가이드 변이체에 의한 APG09748의 편집 효율
추가의 최적화된 gRNA 변이체를 설계하고 검정하였다. 추가로, 스페이서 길이가 절단 효율에 어떻게 영향을 미치는지 결정하기 위해 상이한 길이의 스페이서 서열 또한 시험하였다. 스페이서 서열 외부의 sgRNA는 이 검정에서 "백본"으로 지칭된다. 표 4에서, 이들은 "WT" (서열식별번호: 53, 야생형 서열), 및 3가지 최적화된 sgRNA: V1 (서열식별번호: 65), V2 (서열식별번호: 66) 및 V3 (서열식별번호: 64)으로 표시된다. 이들 서열 모두 스페이서 서열의 위치를 나타내기 위해 폴리-N을 갖는다. 가이드는 시험관내 전사 (IVT)에 의해 sgRNA로 발현되었다. 야생형 sgRNA 백본과 비교하여, V1은 87.8% 동일하고, V2는 92.4% 동일하고, V3은 85.5% 동일하다. 이중-가이드 RNA를 나타내지만 그 외에는 상기 인용된 야생형 및 최적화된 sgRNA와 유사한 합성 tracrRNA:crRNA 듀플렉스 ("합성") 또한 생성하여 시험하였다.
이 검정 세트의 경우, RGN APG09106이 사용되었고; 그 외에는 시험관내 절단 반응을 위한 방법이 상기 기재된 것과 유사하였다. 표적화된 핵산 서열은 표적 1 (서열식별번호: 67) 및 표적 2 (서열식별번호: 68)이었다. 결과는 표 4에 나타내었다.
표 4: 조작된 가이드 변이체에 의한 APG09106의 편집 효율
실시예 5: 포유동물 세포에서 유전자 편집 활성의 입증
실시예 5.1: 포유동물 세포에서 APG02789의 활성
인간 발현을 위해 코돈 최적화된 RGN 뉴클레오티드 서열을 N-말단 핵 국재화 태그를 사용하여 합성하고, pcDNA3.1 CMV 발현 플라스미드에 클로닝하였다. RGN 폴리펩티드의 최종 구축물은 다음과 같다: N-말단 -SV40 NLS (서열식별번호: 10)- 3X FLAG 태그 (서열식별번호: 11)- RGN 서열 (서열식별번호: 1, 16, 24, 35, 43 또는 50)- 뉴클레오플라스민 NLS (서열식별번호: 12)- C-말단. sgRNA 서열의 발현을 유도하는 U6 프로모터를 포함하는 PCR 앰플리콘은 허큘라제(Herculase) II (애질런트 테크놀로지즈(Agilent Technologies))를 사용하여 생성하였다. 400 ng의 RGN 발현 플라스미드 및 100 ng의 sgRNA PCR 생성물을 리포펙타민 2000 시약 (라이프 테크놀로지즈)을 사용하여 75-90% 전면생장에서 HEK293FT 세포의 24-웰 플레이트로 형질감염시켰다. 세포를 형질감염 후에 게놈 DNA 추출 전에 37℃에서 72 시간 동안 인큐베이션하였다. 게놈 DNA를 제조자의 프로토콜에 따라 퀵익스트랙트(QuickExtract) DNA 추출 용액 (에피센터(Epicentre))을 사용하여 추출하였다. RGN 표적 부위를 플랭킹하는 게놈 영역을 PCR 증폭시키고, 생성물을 제조자의 프로토콜에 따라 퀴아퀵 스핀 컬럼(QiaQuick Spin Column) (퀴아젠)을 사용하여 정제하였다. 200-500 ng의 총 정제된 PCR 생성물을 10 μl의 최종 부피로 1 μl의 10x Taq DNA 폴리머라제 PCR 완충제 (엔자이마틱스(Enzymatics)) 및 초순수와 혼합하고, 재어닐링 과정에 적용하여 헤테로듀플렉스를 형성하였다: 10 분 동안 95℃, -2℃/s 속도로 95℃에서 85℃로, -0.25℃/s 속도로 85℃에서 25℃로, 및 1 분 동안 25℃ 유지. 재어닐링 이후, 생성물을 제조자의 권고된 프로토콜에 따라 서베이어 뉴클레아제 및 서베이어 인핸서 S (인테그레이티드 디엔에이 테크놀로지즈(Integrated DNA Technologies))로 처리하고, 4-20% 노벡스(Novex) TBE 폴리아크릴아미드 겔 (라이프 테크놀로지즈) 상에서 분석하였다. 겔을 SYBR 골드 DNA 염색 (라이프 테크놀로지즈)으로 10 분 동안 염색하고, 겔 독(Gel Doc) 겔 영상화 시스템 (바이오-라드(Bio-rad))으로 영상화하였다. 정량화는 상대적인 밴드 강도를 기반으로 하였다. Indel 백분율은 하기 식에 의해 결정하고: 100x(1-(1-(b+c)/(a+b+c))½), 여기서 a는 소화되지 않은 PCR 생성물의 통합 강도이고, b 및 c는 각각의 절단 생성물의 통합 강도이다.
RGN APG02789의 경우, 상기 기재된 바와 같이 방법을 수행하였다. 인간 게놈에서 수많은 상이한 유전자가 RNA-가이드된 절단을 위해 표적화되었다. 이들 유전자좌는 sgRNA의 서열식별번호에 대한 참고와 함께 하기 표 5에 포함된다. RGN 활성의 지표인 indel 백분율 또한 나타낸다.
표 5: 포유동물 세포에서 APG02789의 활성
실시예 5.2: 포유동물 세포에서 APG09106의 활성
RGN 발현 카세트를 생성하여, 포유동물 발현을 위해 벡터에 도입하였다. RGN APG00969, APG03128, APG09748, APG09106 및 APG02789 각각을 인간 발현을 위해 코돈-최적화시켰고 (각각 서열식별번호: 357-361), 발현된 단백질을 N-말단에서 SV40 핵 국재화 서열 (NLS; 서열식별번호: 10)에 및 3xFLAG 태그 (서열식별번호: 11)에 작동가능하게 융합시켰고, C-말단에서 뉴클레오플라스민 NLS 서열 (서열식별번호: 12)에 작동가능하게 융합시켰다. 직렬식으로 작동가능하게 융합된 NLS 서열의 2개의 카피를 사용하였다. 각각의 발현 카세트는 시토메갈로바이러스 (CMV) 프로모터 (서열식별번호: 334)의 조절하에 있었다. CMV 전사 인핸서 (서열식별번호: 335) 또한 CMV 프로모터를 포함하는 구축물에 포함될 수 있음이 관련 기술분야에 공지되어 있다. 인간 RNA 폴리머라제 III U6 프로모터 (서열식별번호: 336)의 조절하에 단일 gRNA 각각을 코딩하는 가이드 RNA 발현 구축물을 생성하여, 발현 벡터에 도입하였다. 가이드는 AurkB 유전자의 영역을 표적화하였다. 한 RNA-가이드된 뉴클레아제의 경우, 단백질의 뉴클레아제 활성을 증가시키기 위해 특정 잔기를 돌연변이시켰고, 구체적으로 APG09106의 T849 잔기를 아르기닌 (서열식별번호: 362)으로 돌연변이시켰다. 이 점 돌연변이는 포유동물 세포에서 편집률을 증가시켰다.
상기 기재된 구축물을 포유동물 세포에 도입하였다. 형질감염 하루 전날에, 1x105 HEK293T 세포 (시그마)을 둘베코 변형된 이글 배지 (DMEM) 플러스 10% (vol/vol) 태아 소 혈청 (깁코(Gibco)) 및 1% 페니실린-스트렙토마이신 (깁코) 중에서 24-웰 디쉬에 플레이팅하였다. 세포가 50-60% 전면생장한 다음 날, 500 ng의 RGN 발현 플라스미드 플러스 500 ng의 단일 gRNA 발현 플라스미드를 제조자의 지침에 따라 웰당 1.5 μL의 리포펙타민 3000 (써모 사이언티픽)을 사용하여 공동 형질감염시켰다. 48 시간 성장시킨 후, 총 게놈 DNA를 제조자의 지침에 따라 게놈 DNA 단리 키트 (마쉐리-나겔(Machery-Nagel))를 사용하여 수확하였다.
이어서, 총 게놈 DNA를 분석하여, AurkB 표적에서 편집률을 결정하였다. 올리고뉴클레오티드를 생성하여, PCR 증폭, 및 증폭된 게놈 표적 부위 (서열식별번호: 363 및 364)의 후속적인 분석을 위해 사용하였다. 모든 PCR 반응은 0.5 μM의 각각의 프라이머를 포함하는 20 μL 반응 중에서 10 μL의 2X 마스터 믹스 퓨전 하이-피델리티(Master Mix Phusion High-Fidelity) DNA 폴리머라제 (써모 사이언티픽)를 사용하여 수행하였다. 먼저, 각각의 표적 유전자를 포함하는 큰 게놈 영역을 PCR#1 프라이머 (서열식별번호: 363 및 364)를 사용하고 하기 프로그램을 이용하여 증폭시켰다: 98℃, 1 분; [98℃, 10 초; 62℃, 15 초; 72℃, 5 분]의 30 주기; 72℃, 5 분; 12℃, 계속.
이어서, 1 마이크로리터의 이 PCR 반응을 각각의 가이드에 대해 특이적인 프라이머 (PCR#2 프라이머; 서열식별번호: 365-370)를 사용하고 하기 프로그램을 이용하여 추가로 증폭시켰다: 98℃, 1 분; [98℃, 10 초; 67℃, 15 초; 72℃, 30 초]의 35 주기; 72℃, 5 분; 12℃, 계속. PCR#2에 대한 프라이머에는 일루미나 시퀀싱을 위한 넥스테라(Nextera) 판독 1 및 판독 2 트랜스포사제 어댑터 오버행 서열이 포함된다.
제2 PCR 증폭 이후, DNA를 제조자의 지침에 따라 PCR 클린업 키트 (자이모(Zymo))를 사용하여 세척하고, 물에 용리시켰다. 200-500ng의 정제된 PCR#2 생성물을 20 μL 반응 중에서 2 μL의 10X NEB 완충제 2 및 물과 합하고, 하기 프로그램을 이용하여 어닐링하여 헤테로듀플렉스 DNA를 생성하였다: 95℃, 5 분; 95-85℃, 2℃/초의 속도로 냉각; 85-25℃, 0.1℃/초의 속도로 냉각; 12℃, 계속. 어닐링 후에, 5 μL의 DNA를 비 효소 대조군으로서 제거하였고, 1 μL의 T7 엔도뉴클레아제 I (NEB)을 첨가하고, 반응을 37℃에서 1 시간 동안 인큐베이션하였다. 인큐베이션 이후, 5x 플래쉬겔(FlashGel) 로딩 염료 (론자(Lonza))를 첨가하고, 겔 전기영동을 이용하여 2.2% 아가로스 플래쉬겔 (론자)에 의해 5 μL의 각각의 반응 및 대조군을 분석하였다. 겔의 가시화 이후에, 비상동성 말단 결합 (NHEJ)의 백분율은 하기 방정식을 이용하여 결정하였고: %NHEJ 사건 = 100 x [1-(1-절단된 분획)(½)], 여기서 (절단된 분획)은 다음과 같이 정의된다: (소화된 생성물의 밀도)/(소화된 생성물의 밀도 + 소화되지 않은 모 밴드).
일부 샘플의 경우, 서베이어®를 이용하여 포유동물 세포에서의 발현 이후의 결과를 분석하였다. 형질감염 이후 세포를 37℃에서 72 시간 동안 인큐베이션한 다음, 게놈 DNA를 추출하였다. 게놈 DNA는 제조자의 프로토콜에 따라 퀵익스트랙트 DNA 추출 용액 (에피센터)을 사용하여 추출하였다. RGN 표적 부위를 플랭킹하는 게놈 영역을 PCR 증폭시키고, 생성물을 제조자의 프로토콜에 따라 퀴아퀵 스핀 컬럼 (퀴아젠)을 사용하여 정제하였다. 200-500 ng의 총 정제된 PCR 생성물을 10 μl의 최종 부피로 1 μl의 10x Taq DNA 폴리머라제 PCR 완충제 (엔자이마틱스) 및 초순수와 혼합하고, 재어닐링 과정에 적용하여 헤테로듀플렉스를 형성하였다: 10 분 동안 95℃, -2℃/s 속도로 95℃에서 85℃로, -0.25℃/s 속도로 85℃에서 25℃로, 및 1 분 동안 25℃ 유지.
재어닐링 이후, 생성물을 제조자의 권고된 프로토콜에 따라 서베이어® 뉴클레아제 및 서베이어® 인핸서 S (인테그레이티드 디엔에이 테크놀로지즈)로 처리하고, 4-20% 노벡스(Novex) TBE 폴리아크릴아미드 겔 (라이프 테크놀로지즈) 상에서 분석하였다. 겔을 SYBR 골드 DNA 염색 (라이프 테크놀로지즈)으로 10 분 동안 염색하고, 겔 독(Gel Doc) 겔 영상화 시스템 (바이오-라드)으로 영상화하였다. 정량화는 상대적인 밴드 강도를 기반으로 하였다. Indel 백분율은 하기 식에 의해 결정하고: 100x(1-(1-(b+c)/(a+b+c))½), 여기서 a는 소화되지 않은 PCR 생성물의 통합 강도이고, b 및 c는 각각의 절단 생성물의 통합 강도이다.
추가로, 일루미나 오버행 서열을 함유하는 PCR#2로부터의 생성물은 일루미나 16S 메가게놈 시퀀싱 라이브러리 프로토콜에 따라 라이브러리 제조를 거쳤다. 딥 시퀀싱은 서비스 제공자 (모진)에 의해 일루미나 Mi-Seq 플랫폼 상에서 수행되었다. 전형적으로 앰플리콘당 200,000개의 250 bp 쌍-말단 판독 (2 x 100,000 판독)이 생성된다. 판독을 CRISPResso (Pinello, et al. 2016 Nature Biotech, 34:695-697)를 이용하여 분석하여, 편집률을 계산하였다. 출력 정렬을 수동-큐레이션하여, 삽입 및 결실 부위를 확인할 뿐만 아니라, 재조합 부위에서 미세상동성 부위를 확인하였다. 편집률은 표 6에 나타내었다. 모든 실험은 인간 세포에서 수행하였다. "표적 서열"은 유전자 표적 내의 표적화된 서열이다. 각각의 표적 서열의 경우, 가이드 RNA는 사용된 RGN에 따라 상보성 RNA 스페이서 서열 및 적절한 sgRNA를 포함하였다. 가이드 RNA에 의한 선택된 실험 분석은 표 7.1 및 7.2에 나타내었다.
표 6: AurkB 유전자 표적에 대한 전체 편집률
각각의 가이드에 대한 특이적인 삽입 및 결실을 표 7.1 및 7.2에 나타내었다. 이들 표에서, 표적 서열은 굵은 대문자로 표시되었다. 8합체 PAM 영역은 이중 밑줄로 표시되었고, 인식된 주요 뉴클레오티드는 굵게 표시되었다. 삽입은 소문자로 표시되었다. 결실은 점선 (---)으로 나타내었다. INDEL 위치는 표적 서열의 PAM 근위 엣지로부터 계산되고, 엣지는 위치 0이다. 위치가 엣지의 표적 쪽에 있는 경우, 위치는 양수 (+)이고; 위치가 엣지의 PAM 쪽에 있는 경우, 위치는 음수 (-)이다.
표 7.1: RGN APG09106을 사용한 가이드 831에 대한 특이적인 삽입 및 결실
표 7.2: APG09106 T849R을 사용한 가이드 831에 대한 특이적인 삽입 및 결실
실시예 6: 식물 세포에서 유전자 편집 활성의 입증
본 발명의 RGN의 RNA-가이드된 뉴클레아제 활성을 [Li, et al., 2013 (Nat. Biotech. 31:688-691)]로부터 채택된 프로토콜을 이용하여 식물 세포에서 입증하였다. 간략히, N-말단 SV40 핵 국재화 신호를 코딩하는 핵산 서열에 작동가능하게 연결된 본 발명의 RGN (서열식별번호: 1, 16, 24, 35, 43 또는 50)의 식물 코돈 최적화된 버전을 일시적인 형질전환 벡터에서 강한 구성적 35S 프로모터 뒤에 클로닝한다. 적절한 PAM 서열을 플랭킹하는 식물 PDS 유전자에서 하나 이상의 부위를 표적화하는 sgRNA는 제2 일시적인 발현 벡터에서 식물 U6 프로모터 뒤에 클로닝한다. PEG-매개된 형질전환을 이용하여 발현 벡터를 니코티아나 벤타미아나(Nicotiana benthamiana) 엽육 원형질체에 도입시킨다. 형질전환된 원형질체를 어두운 곳에서 최대 36 시간 동안 인큐베이션한다. DNeasy 식물 미니 키트 (퀴아젠)를 사용하여 게놈 DNA를 원형질체로부터 단리한다. RGN 표적 부위를 플랭킹하는 게놈 영역을 PCR 증폭시키고, 생성물을 제조자의 프로토콜에 따라 퀴아퀵 스핀 컬럼 (퀴아젠)을 사용하여 정제한다. 200-500 ng의 총 정제된 PCR 생성물을 10 μl의 최종 부피로 1 μl 10x Taq DNA 폴리머라제 PCR 완충제 (엔자이마틱스) 및 초순수와 혼합하고, 재어닐링 과정에 적용하여 헤테로듀플렉스를 형성한다: 10 분 동안 95℃, -2℃/s 속도로 95℃에서 85℃로, -0.25℃/s 속도로 85℃에서 25℃로, 및 1 분 동안 25℃ 유지.
재어닐링 이후, 생성물을 제조자의 권고된 프로토콜에 따라 서베이어 뉴클레아제 및 서베이어 인핸서 S (인테그레이티드 디엔에이 테크놀로지즈)로 처리하고, 4-20% 노벡스 TBE 폴리아크릴아미드 겔 (라이프 테크놀로지즈) 상에서 분석한다. 겔을 SYBR 골드 DNA 염색 (라이프 테크놀로지즈)에 의해 10 분 동안 염색하고, 겔 독 겔 영상화 시스템 (바이오-라드)에 의해 영상화한다. 정량화는 상대적인 밴드 강도를 기반으로 한다. Indel 백분율은 하기 식에 의해 결정하고: 100x(1-(1-(b+c)/(a+b+c))½), 여기서 a는 소화되지 않은 PCR 생성물의 통합 강도이고, b 및 c는 각각의 절단 생성물의 통합 강도이다.
실시예 7: 질환 표적의 확인
임상 변이체의 데이터베이스를 NCBI ClinVar 웹사이트에서 월드 와이드 웹을 통해 입수가능한 NCBI ClinVar 데이터베이스로부터 수득하였다. 병원성 단일 뉴클레오티드 다형성 (SNP)을 이 목록으로부터 확인하였다. 게놈 유전자좌 정보를 이용하여, 각각의 SNP와 중복되고 그를 둘러싸는 영역에서 CRISPR 표적을 확인하였다. 본 발명의 RGN의 조합물에서 염기 편집을 이용하여 원인 돌연변이 ("Casl Mut.")를 표적화하도록 수정될 수 있는 SNP의 선택은 표 8에 나열되어 있다. 표 8에서, 각각의 질환의 하나의 가명만이 나열된다. "RS#"는 NCBI 웹사이트에서 SNP 데이터베이스를 통해 확인된 RS 수탁 번호에 상응한다. 대립유전자ID는 원인 대립유전자 수탁 번호에 상응하고, 염색체 수탁 번호는 또한 NCBI 웹사이트를 통해 확인된 수탁 참고 번호를 제공한다. 표 8은 또한 각각의 질환에 대해 나열된 RGN에 적합한 게놈 표적 서열 정보를 제공한다. 표적 서열 정보는 또한 본 발명의 상응하는 RGN에 대해 필요한 sgRNA의 생성을 위해 프로토스페이서 서열을 제공한다.
표 8: 본 발명의 RGN에 대한 질환 표적
실시예 8: 헐러 증후군의 원인이 되는 표적화 돌연변이
다음은 헐러 증후군을 가진 대부분의 환자에서 상기 질환의 원인이 되는 돌연변이를 수정하는 RNA 지정된 염기 편집 시스템을 이용하여 MPS-1로도 지칭되는 헐러 증후군에 대한 잠재적인 치료법을 기재한다. 이 접근법은 RNA 유도되고 광범위한 조직 유형으로 전달을 위해 단일 AAV 벡터에 팩키징될 수 있는 염기 편집 융합 단백질을 이용한다. 사용된 정확한 조절 요소 및 염기 편집기 도메인에 따라, 질환 유전자좌를 표적화하기 위해 염기 편집 융합 단백질 및 단일 가이드 RNA 둘 다를 코딩하는 단일 벡터를 조작하는 것 또한 가능할 수 있다.
실시예 8.1: 이상적인 PAM에 의한 RGN의 확인
유전 질환 MPS-1은 리소좀에서 데르마탄 술페이트 및 헤파란 술페이트가 분자 수준으로 축적되는 것을 특징으로 하는 리소좀 저장 질환이다. 이 질환은 일반적으로 α-L-이두로니다제를 코딩하는 IDUA 유전자 (NCBI 기준 서열 NG_008103.1)에서의 돌연변이에 의해 유발된 선천성 유전 장애이다. 상기 질환은 α-L-이두로니다제 결핍의 결과이다. 북유럽 배경을 갖는 개인의 연구에서 확인된 가장 흔한 IDUA 돌연변이는 W402X 및 Q70X이고, 두 넌센스 돌연변이 모두 조기 번역 종결을 일으킨다 (Bunge et al. (1994), Hum. Mol. Genet, 3(6): 861-866, 본원에 참고로 포함됨). 단일 뉴클레오티드의 복귀가 야생형 코딩 서열을 복구하고, 유전자좌의 내인성 조절 메카니즘에 의해 조절되는 단백질 발현을 일으킨다.
인간 Idua 유전자의 W402X 돌연변이는 MPS-1H 사례의 높은 비율을 차지한다. 염기 편집기는 가이드 RNA의 프로토스페이서 성분의 결합 부위에 비해 좁은 서열 범위를 표적화할 수 있고, 따라서 표적 유전자좌로부터 특정한 거리에서 PAM 서열의 존재가 전략의 성공에 필수적이다. 염기 편집 단백질의 상호작용 동안에 표적 돌연변이가 노출된 비-표적 가닥 (NTS) 상에 있어야 하고, RGN 도메인의 풋프린트가 PAM 근처의 영역으로의 접근을 차단할 것이라는 제약을 고려할 때, 접근가능한 유전자좌는 PAM으로부터 10-30 bp인 것으로 생각된다. 이 범위에서 근처의 다른 아데노신 염기의 편집 및 돌연변이 유발을 피하기 위해, 상이한 링커가 스크리닝된다. 이상적인 범위는 PAM으로부터 12-16 bp이다.
RGN APG00969는 상용성인 PAM 서열을 갖는다. APG00969는 5'- nnARV-3'의 PAM 서열 (서열식별번호: 7)을 갖고, 소형의 크기를 가지며, 이는 잠재적으로 단일 AAV 벡터를 통한 전달을 가능하게 한다. 이 전달 접근법은 다른 것들에 비해 광범위한 조직 (간, 근육, CNS)으로의 접근, 및 잘 확립된 안전성 프로파일 및 제작 기술과 같은 다양한 이점을 제공한다.
에스. 피로게네스로부터의 Cas9 (SpyCas9)는 W402X 유전자좌 근처에 존재하는 NGG의 PAM 서열 (서열식별번호: 323)을 필요로 하지만, SpyCas9의 크기는 단일 AAV 벡터로 팩키징되는 것을 방지하며, 따라서 상기 언급된 이 접근법의 이점을 포기한다. 이중 전달 전략이 이용될 수 있지만 (예를 들어, Ryu et al., (2018), Nat. Biotechnol., 36(6): 536-539, 본원에 참고로 포함됨), 이는 상당한 제작 복잡성 및 비용을 부가할 것이다. 추가로, 주어진 세포에서 성공적으로 편집되려면 세포에서 융합 단백질의 벡터 및 조립체 둘 다로의 감염을 필요로 하기 때문에, 이중 바이러스 벡터 전달은 유전자 수정의 효율을 상당히 감소시킨다.
흔히 사용되는 에스. 아우레우스로부터의 Cas9 병렬상동체 (SauCas9)는 SpyCas9에 비해 상당히 작은 크기를 갖지만, 더 복잡한 PAM 요건 - NGRRT (서열식별번호: 324)을 갖는다. 그러나, 이 서열은 원인 유전자좌의 염기 편집에 유용할 것으로 예상되는 범위 내에 있지 않다.
실시예 8.2: RGN 융합 구축물 및 sgRNA 서열
하기 도메인을 갖는 융합 단백질을 코딩하는 DNA 서열은 표준 분자 생물학 기술을 이용하여 생성된다: 1) DNA 절단 활성 ("데드" 또는 "닉카제")을 불활성화시키는 돌연변이를 갖는 RGN 도메인; 2) 염기 편집에 유용한 아데노신 데아미나제. 하기 표 (표 9)에 기재된 구축물은 염기 편집 활성 도메인을 갖는 융합 단백질, 이 실시예에서는 데드 RGN APG00969 (서열식별번호: 327)의 N-말단에 작동가능하게 융합된 APG02312 (서열식별번호: 325)의 돌연변이된 변이체를 포함한다. 염기 편집 활성 도메인은 본 발명의 임의의 아데노신 데아미나제, 예를 들어 서열식별번호: 514 또는 572-584일 수 있다. 융합 단백질 또한 RGN의 C-말단에서 염기-편집 효소로 제조될 수 있음이 관련 기술분야에 공지되어 있다. 추가로, 융합 단백질의 RGN 및 염기 편집기는 전형적으로 링커 아미노 서열에 의해 분리된다. 표준 링커의 길이가 15-30개 아미노산 범위임이 관련 기술분야에 공지되어 있다. 추가로, RGN과 염기-편집 효소 사이의 특정한 융합 단백질 또한 염기 편집 효율을 증가시킬 수 있는 적어도 하나의 우라실 글리코실라제 억제제 (UGI) 도메인 (서열식별번호: 570)을 포함할 수 있음이 관련 기술분야에 공지되어 있다 (미국 특허 번호 10,167, 457, 본원에 참고로 포함됨). 따라서, 융합 단백질은 RGN APG00969 또는 그의 변이체, 아데노신 데아미나제, 및 임의적으로 적어도 하나의 UGI를 포함할 수 있다.
표 9: RNA-표적화된 염기 편집을 위한 구축물
RGN의 접근가능한 편집 부위는 PAM 서열에 의해 결정된다. RGN을 염기 편집 도메인과 조합할 때, NTS가 단일 가닥이지만 RGN이 유전자좌와 연관되기 때문에, 편집을 위한 표적 잔기는 비-표적 가닥 (NTS) 상에 있어야 한다. 수많은 뉴클레아제 및 상응하는 가이드 RNA의 평가는 이 특정한 유전자좌에 대해 가장 적절한 유전자 편집 도구의 선택을 가능하게 한다. 인간 Idua 유전자에서 상기 기재된 구축물에 의해 표적화될 수 있는 몇몇 잠재적인 PAM 서열은 W402X 돌연변이의 원인이 되는 돌연변이성 뉴클레오티드의 근처에 있다. 1) 질환 유전자좌에서 비-코딩 DNA 가닥에 대해 상보성인 "스페이서"; 및 2) 가이드 RNA와 RGN의 회합을 위해 필요한 RNA 서열을 함유하는 가이드 RNA 전사체를 코딩하는 서열 또한 생성된다. 이러한 sgRNA는 예를 들어 서열식별번호: 356에 의해 코딩될 수 있다. 관련 기술분야의 기술자에 의해 고안될 수 있는 이러한 sgRNA 또는 유사한 sgRNA는 상기 염기 편집기 또는 상이한 RGN-데아미나제 융합체를 갖는 염기 편집기를 관심 유전자좌로 지시하는데 있어서 그들의 효율에 대해 평가될 수 있다.
실시예 8.3: 헐러 질환 환자로부터의 세포에서 활성에 대한 검정
유전자형 전략을 검증하고 상기 기재된 구축물을 평가하기 위해, 헐러 질환 환자로부터의 섬유모세포를 사용한다. 인간 세포에서 이들의 발현을 위해 융합 단백질 코딩 서열 및 sgRNA 코딩 서열의 상류에 적절한 프로모터를 함유하는 벡터가 설계되며, 이는 실시예 5에 기재된 이들 벡터와 유사하다. 인간 세포에서 높은 발현 수준을 갖는 것으로 공지되어 있거나 또는 섬유모세포 세포에서 특이적으로 잘 발현될 수 있는 프로모터 및 다른 DNA 요소 (예를 들어 인핸서, 또는 종결인자) 또한 사용될 수 있는 것으로 인지된다. 벡터를 표준 기술, 예를 들어 실시예 5에 기재된 것과 유사한 형질감염을 이용하여 섬유모세포에 형질감염시킨다. 대안적으로, 전기천공을 이용할 수 있다. 세포를 1 - 3 일 동안 배양한다. 게놈 DNA (gDNA)를 표준 기술을 이용하여 단리한다. 편집 효율은 하기에 추가로 기재된 바와 같이 정제된 gDNA에 대해 qPCR 유전자형 분석 검정 및/또는 차세대 시퀀싱을 수행함으로써 결정된다.
탁맨(Taqman)™ qPCR 분석은 야생형 및 돌연변이성 대립유전자에 대해 특이적인 프로브를 사용한다. 이들 프로브는 qPCR 장비를 사용하여 그들의 스펙트럼 여기 및/또는 방출 성질에 의해 분석되는 형광단을 보유한다. PCR 프라이머 및 프로브를 함유하는 유전자형 분석 키트는 상업적으로 입수될 수 있거나 (즉, SNP ID rs121965019의 경우 써모 피셔 탁맨™ SNP 유전자형 분석 검정ID C__27862753_10) 또는 설계될 수 있다. 설계된 프라이머 및 프로브 세트의 예는 표 10에 제시된다.
표 10: RT-PCR 프라이머 및 프로브
편집 실험 이후에, gDNA는 표준 방법 및 상기 기재된 프라이머 및 프로브를 사용하여 qPCR 분석에 적용된다. 예상된 결과가 표 11에 제시된다. 이 시험관내 시스템을 이용하여 구축물을 편리하게 평가할 수 있고, 추가의 연구를 위해 높은 편집 효율을 갖는 것을 선택할 수 있다. 상기 시스템은 W402X 돌연변이가 있는 및 없는 세포와, 바람직하게는 이 돌연변이에 대해 이형접합성인 일부 세포와 비교하여 평가될 것이다. Ct 값은 Sybr 그린과 같은 염료를 사용하여 기준 유전자 또는 유전자좌의 총 증폭과 비교될 것이다.
표 11: 예상된 qPCR 결과
조직은 또한 차세대 시퀀싱에 의해 분석될 수 있다. 하기 (표 12) 제시된 것들과 같은 프라이머 결합 부위, 또는 관련 기술분야의 기술자에 의해 확인될 수 있는 다른 적합한 프라이머 결합 부위를 사용할 수 있다. PCR 증폭 이후에, 일루미나 넥스테라 XT 오버행 서열을 함유하는 생성물은 일루미나 16S 메타게놈 시퀀싱 라이브러리 프로토콜에 따라 라이브러리 제조를 거쳤다. 딥 시퀀싱은 일루미나 Mi-Seq 플랫폼 상에서 수행한다. 전형적으로, 앰플리콘당 200,000개의 250 bp 쌍-말단 판독 (2 x 100,000 판독)이 생성된다. 판독을 CRISPResso (Pinello et al., 2016)를 이용하여 분석하여 편집률을 계산한다. 출력 정렬을 수동-큐레이션하여, 삽입 및 결실 부위를 확인할 뿐만 아니라, 재조합 부위에서 미세상동성 부위를 확인한다.
표 12: NGS 프라이머 결합 부위
항-IDUA 항체를 사용하는 형질감염된 세포 및 대조군 세포의 세포 용해물의 웨스턴 블롯팅을 수행하여 전장 단백질의 발현을 검증하고, 기질 4-메틸움벨리페릴 a-L-이두로니드를 사용하는 세포 용해물에 대한 효소 활성 검정은 효소가 촉매 활성임을 검증한다 ([Hopwood et al., Clin.Chim. Acta (1979), 92(2): 257-265], 본원에 참고로 포함됨). 이들 실험은 원래의 IduaW402X/W402X 세포주 (형질감염 없음), 염기 편집 구축물 및 무작위 가이드 서열에 의해 형질감염된 IduaW402X/W402X 세포주, 및 야생형 IDUA를 발현하는 세포주와 비교하여 수행된다.
실시예 8.4: 뮤린 모델에서 질환 치료 검증
이 치료 접근법의 효능을 검증하기 위해, 유사한 아미노산에서 넌센스 돌연변이를 갖는 마우스 모델을 이용한다. 마우스 균주는 헐러 증후군 환자에서의 상동성 돌연변이에 상응하는 그의 Idua 유전자 (Gene ID: 15932)에 W392X 돌연변이를 보유한다 ([Bunge et al., (1994), Hum. Mol. Genet. 3(6): 861-866], 본원에 참고로 포함됨). 이 유전자좌는 이전 실시예에 기재된 염기 편집기에 의한 수정을 위해 필요한 PAM 서열이 결여된 인간 서열과 비교하여 별개의 뉴클레오티드 서열을 포함하며, 따라서 뉴클레오티드 수정을 수행하기 위해 별개의 융합 단백질의 설계를 필요로 한다. 이 동물에서 상기 질환의 개선은 유전자 전달 벡터에 의해 접근가능한 조직에서 돌연변이를 수정하는 치료 접근법을 검증할 수 있다.
이 돌연변이에 대해 동형접합성인 마우스는 헐러 증후군 환자와 유사한 수많은 표현형 특징을 나타낸다. RNA 가이드 서열과 함께 상기 (표 9) 기재된 염기 편집-RGN 융합 단백질을 마우스에서 단백질 발현 및 RNA 전사를 가능하게 하는 발현 벡터에 혼입시킨다. 연구 설계는 하기 표 13에 제시된다. 연구에는 염기-편집 융합 단백질 및 RNA 가이드 서열을 포함하는 고용량의 발현 벡터, 저용량의 동일한 발현 벡터로 처리된 그룹, 염기 편집 융합 단백질 또는 가이드 RNA를 포함하지 않는 발현 벡터로 처리된 모델 마우스인 대조군, 및 동일한 빈 벡터로 처리된 야생형 마우스인 제2 대조군이 포함된다.
표 13: 뮤린 모델에서 게놈 편집 실험
평가를 위한 종점에는 체중, 소변 GAG 배설, 혈청 IDUA 효소 활성, 관심 조직에서 IDUA 활성, 조직 병리학, SNP의 수정을 검증하기 위한 관심 조직의 유전자형 분석, 및 거동적 및 신경학적 평가가 포함된다. 일부 종점은 종료되기 때문에, 예를 들어 연구 종료 이전에 조직 병리학 및 조직 IDUA 활성을 평가하기 위해 추가의 그룹을 추가할 수 있다. 추가의 종점의 예는 헐러 증후군 동물 모델을 확립하는 공개된 논문에서 확인할 수 있다 ([Shull et al. (1994), Proc. Natl. Acad. Sci. U.S.A., 91(26): 12937-12941; Wang et al. (2010), Mol. Genet. Metab., 99(1): 62-71; Hartung et al. (2004), Mol. Ther., 9(6): 866-875; Liu et al. (2005), Mol. Ther., 11(1): 35-47; Clarke et al. (1997), Hum. Mol. Genet. 6(4): 503-511]; 모두 본원에 참고로 포함됨).
한 가지 가능한 전달 벡터는 아데노 연관된 바이러스 (AAV)를 이용한다. 벡터는 CMV 인핸서 (서열식별번호: 335) 및 프로모터 (서열식별번호: 334) 또는 다른 적합한 인핸서 및 프로모터 조합물, 임의적으로 코작 서열 뒤에 있으며, 3' 말단에서 종결인자 서열 및 폴리아데닐화 서열, 예컨대 [Levitt, N.; Briggs, D.; Gil, A.; Proudfoot, N. J. Definition of an Efficient Synthetic Poly(A) Site. Genes Dev. 1989, 3 (7), 1019-1025]에 기재된 최소 서열에 작동가능하게 융합된 염기 편집기-dRGN 융합 단백질 코딩 서열 (예를 들어, 상기 기재된 Nuc-ADAT-링커-dAPG19748-링커-SV40)을 포함하도록 생성된다. 벡터는 그의 5' 말단에서 인간 U6 프로모터 (서열식별번호: 336), 또는 소형 비-코딩 RNA의 생성에 적합한 또 다른 프로모터에 작동가능하게 연결된 단일 가이드 RNA를 코딩하는 발현 카세트를 추가로 포함할 수 있고, AAV 캡시드로의 팩키징에 필요하며 관련 기술분야에 널리 공지된 역전된 말단 반복 (ITR) 서열을 추가로 포함할 수 있다. 생성 및 바이러스 팩키징은 표준 방법, 예컨대 미국 특허 번호 9,587,250 (본원에 참고로 포함됨)에 기재된 방법에 의해 수행된다.
다른 가능한 바이러스 벡터에는 아데노바이러스 및 렌티바이러스 벡터가 포함되며, 이들은 흔히 사용되고, 상이한 팩키징 능력 및 요건과 함께 유사한 요소를 함유한다. 비-바이러스 전달 방법, 예컨대 지질 나노입자에 의해 캡슐화된 mRNA 및 sgRNA ([Cullis, P. R. and Allen, T. M. (2013), Adv. Drug Deliv. Rev. 65(1): 36-48; Finn et al. (2018), Cell Rep. 22(9): 2227-2235], 둘 다 참고로 포함됨), 플라스미드 DNA의 유체역학적 주사 ([Suda T and Liu D, 2007, Mol. Ther. 15(12): 2063-2069], 본원에 참고로 포함됨), 또는 금 나노입자와 회합된 sgRNA의 리보핵단백질 복합체 (Lee, K.; Conboy, M.; Park, H. M.; Jiang, F.; Kim, H. J.; Dewitt, M. A.; Mackley, V. A.; Chang, K.; Rao, A.; Skinner, C.; et al., Nat. Biomed. Eng. 2017, 1 (11), 889-90) 또한 이용될 수 있다.
실시예 8.5: 인간화 유전자좌를 갖는 뮤린 모델에서 질환 수정
인간 요법에서 사용되는 것과 동일한 염기 편집기 구축물의 효능을 평가하기 위해, W392 근처의 뉴클레오티드가 W402 주위에서 인간 서열과 매칭되도록 변경된 마우스 모델이 필요하다. 이는 다양한 기술, 예컨대 마우스 배아의 유전자좌를 절단하고 대체하도록 RGN 및 HDR 주형의 사용에 의해 달성될 수 있다.
높은 아미노산 보존 정도로 인해, 마우스 유전자좌에서 대부분의 뉴클레오티드는 표 14에 제시된 바와 같이 침묵 돌연변이를 가진 인간 서열의 것들로 변경될 수 있다. 생성된 조작된 마우스 게놈에서 변경된 코딩 서열을 생성하는 염기 변화만이 도입된 정지 코돈 이후에 발생한다.
표 14: 인간화 마우스 유전자좌를 생성하는 뉴클레오티드 돌연변이
이 마우스 균주의 조작시, 실시예 8.4에 기재된 바와 같이 유사한 실험이 수행될 것이다.
실시예 9: 프리드라이히 운동실조의 원인이 되는 표적화 돌연변이
프리드라이히 운동실조 (FRDA)를 초래하는 트리뉴클레오티드 반복 서열의 확장은 FRDA 불안정 영역으로 지칭되는 FXN 유전자 내의 정의된 유전자좌에서 발생한다. RNA 가이드된 뉴클레아제 (RGN)는 FRDA 환자 세포에서 불안정 영역을 절제하기 위해 사용될 수 있다. 이 접근법은 다음을 필요로 한다: 1) 인간 게놈에서 대립유전자를 표적화도록 프로그래밍될 수 있는 RGN 및 가이드 RNA 서열; 및 2) RGN 및 가이드 서열에 대한 전달 접근법. 게놈 편집을 위해 사용되는 여러 뉴클레아제, 예컨대 흔히 사용되는 에스. 피로게네스로부터의 Cas9 뉴클레아제 (SpCas9)는 본질적으로 기능적 발현 카세트를 위해 필요한 다른 유전자 요소 외에도 SpCas9 유전자 및 가이드 RNA의 길이를 고려할 때 너무 커서 아데노-연관된 바이러스 (AAV) 벡터에 팩키징되지 않는다. 이는 SpCas9를 사용하는 실행가능한 접근법을 가능하지 않게 만든다.
본 발명의 조밀한 RNA 가이드된 뉴클레아제, 특히 APG09748 및 APG09106은 FRDA 불안정 영역의 절제에 매우 적합하다. 각각의 RGN은 FRDA 불안정 영역 근처에 있는 PAM 요건을 갖는다. 추가로, 이들 RGN 각각은 가이드 RNA와 함께 AAV 벡터에 팩키징될 수 있다. 2개의 가이드 RNA의 팩킹은 제2 벡터를 필요로 할 수도 있지만, 이 접근법은 두 벡터 사이의 단백질 서열을 분할할 수 있는 더 큰 뉴클레아제, 예컨대 SpCas9에서 필요로 되는 것보다 여전히 유리하게 비교된다.
표 15는 FRDA 불안정 영역의 5' 및 3' 플랭킹으로 APG09748 또는 APG09106을 표적화하는데 적합한 게놈 표적 서열의 위치, 뿐만 아니라 게놈 표적에 대한 sgRNA의 서열을 나타낸다. 유전자좌에서, RGN은 FA 불안정 영역을 절제할 것이다. 상기 영역의 절제는 유전자좌의 일루미나 시퀀싱에 의해 검증될 수 있다.
표 15: RGN 시스템에 대한 게놈 표적 서열
실시예 10: 겸상 적혈구 질환의 원인이 되는 표적화 돌연변이
BCL11A 인핸서 영역 (서열식별번호: 348) 내의 표적화 서열은 겸상 적혈구 질환의 증상을 치유하거나 또는 완화시키기 위해 태아 헤모글로불린 (HbF)을 증가시키는 메카니즘을 제공할 수 있다. 예를 들어, 게놈 차원의 연관성 연구에 의해 증가된 HbF 수준과 연관된 BCL11A에서의 유전자 변이의 집합을 확인하였다. 이들 변이는 단계-특이적인 계통-제한된 인핸서 영역으로서 기능하는 BCL11A의 비-코딩 영역에서 발견되는 SNP의 집합이다. 추가의 연구를 통해, 이 BCL11A 인핸서가 BCL11A 발현을 위해 적혈구 세포에서 필요하다는 것이 밝혀졌다 ([Bauer et al., (2013) Science 343:253-257], 본원에 참고로 포함됨). 인핸서 영역은 BCL11A 유전자의 인트론 2 내에서 발견되었고, 인트론 2에서 DNaseI 과민성 (종종 조절 능력과 연관된 염색질 상태를 나타냄)인 3개의 영역이 확인되었다. 이들 3개의 영역은 BCL11A의 전사 시작 부위로부터의 거리 (킬로염기)에 따라 "+62", "+58" 및 "+55"로 확인되었다. 이들 인핸서 영역은 대략 350 (+55); 550 (+58); 및 350 (+62) 뉴클레오티드 길이이다 (Bauer et al., 2013).
실시예 10.1: 바람직한 RGN 시스템의 확인
여기서 BCL11A가 성인 헤모글로빈에서 베타-글로빈을 제조하는 것을 담당하는 유전자인 HBB 유전자좌 내의 그의 결합 부위로 결합하는 것을 방해하는 RGN 시스템을 사용하는 베타-혈색소병증의 잠재적인 치료가 기재된다. 이 접근법은 포유동물 세포에서 더욱 효율적인 NHEJ를 사용한다. 또한, 이 접근법은 생체내 전달을 위해 단일 AAV 벡터로 팩키징될 수 있는 충분히 작은 크기를 갖는 뉴클레아제를 사용한다.
인간 BCL11A 인핸서 영역 (서열식별번호: 348)에서 GATA1 인핸서 모티프는 성인 인간 적혈구에서 HbF의 동시 재발현과 함께 BCL11A 발현을 감소시키기 위해 RNA 가이드된 뉴클레아제 (RGN)를 사용하여 방해하기 위한 이상적인 표적이다 (Wu et al. (2019) Nat Med 387:2554). APG09748 또는 APG09106과 상용성인 몇몇 PAM 서열은 이 GATA1 부위를 둘러싸는 유전자좌에서 용이하게 명백하다. 이들 뉴클레아제는 5'-DTTN-3'의 PAM 서열 (서열식별번호: 30)을 갖고, 소형의 크기를 가지며, 이는 잠재적으로 단일 AAV 또는 아데노바이러스 벡터에서 적절한 가이드 RNA와 함께 그들의 전달을 가능하게 한다. 이 전달 접근법은 다른 것들에 비해 조혈 줄기 세포로의 접근, 및 잘 확립된 안전성 프로파일 및 제작 기술과 같은 다양한 이점을 제공한다.
흔히 사용되는 에스. 피로게네스로부터의 Cas9 뉴클레아제 (SpyCas9)는 5'-NGG-3'의 PAM 서열 (서열식별번호: 323)을 필요로 하며, 이 중에서 몇몇은 GATA1 모티프 근처에 존재한다. 그러나, SpyCas9의 크기는 단일 AAV 또는 아데노바이러스 벡터로 팩키징되는 것을 방지하며, 따라서 상기 언급된 이 접근법의 이점을 포기한다. 이중 전달 전략을 이용할 수 있지만, 이는 상당한 제작 복잡성 및 비용을 부가할 것이다. 추가로, 주어진 세포에서 성공적으로 편집되려면 두 벡터 모두로의 감염을 필요로 하기 때문에, 이중 바이러스 벡터 전달은 유전자 수정의 효율을 상당히 감소시킨다.
인간 코돈 최적화된 APG09748 (서열식별번호: 349) 또는 APG09106 (서열식별번호: 360)을 코딩하는 발현 카세트는 실시예 5에 기재된 것과 유사하게 생성된다. RGN APG09748 또는 APG09106에 대한 가이드 RNA를 발현하는 발현 카세트 또한 생성된다. 이들 가이드 RNA는 다음을 포함한다: 1) BCL11A 인핸서 유전자좌 (표적 서열) 내의 비-코딩 또는 코딩 DNA 가닥에 대해 상보성인 프로토스페이서 서열 및 2) 가이드 RNA와 RGN의 회합을 위해 필요한 RNA 서열. APG09748 또는 APG09106에 의해 표적화하기 위한 몇몇 잠재적인 PAM 서열은 BCL11A GATA1 인핸서 모티프를 둘러싸고 있기 때문에, BCL11A GATA1 인핸서 서열의 강건한 절단 및 NHEJ 매개된 방해를 제공하는 최상의 프로토스페이서 서열을 결정하기 위해 몇몇 잠재적인 가이드 RNA 구축물이 생성된다. 표 16에서 표적 게놈 서열은 표 16에 제공된 sgRNA를 이용하여 RGN을 이 유전자좌로 지시하기 위해 평가된다.
표 16: APG09748을 사용하여 BCL11A GATA1 인핸서 유전자좌에 대한 표적 서열
APG09748 또는 APG09106이 BCL11A 인핸서 영역을 방해하는 삽입 또는 결실을 생성하는 효율을 평가하기 위해, 인간 세포주, 예컨대 인간 배아 신장 세포 (HEK 세포)를 사용한다. RGN 발현 카세트를 포함하는 DNA 벡터 (예를 들어, 실시예 5에 기재됨)를 생성한다. 표 16의 가이드 RNA 서열에 대한 코딩 서열을 포함하는 발현 카세트를 포함하는 별도의 벡터를 또한 생성한다. 이러한 발현 카세트는 실시예 5에 기재된 바와 같이 인간 RNA 폴리머라제 III U6 프로모터 (서열식별번호: 336)를 추가로 포함할 수 있다. 대안적으로, RGN 및 가이드 RNA 둘 다의 발현 카세트를 포함하는 단일 벡터가 사용될 수 있다. 벡터를 실시예 5에 기재된 것과 같은 표준 기술을 이용하여 HEK 세포에 도입시키고, 세포를 1-3 일 동안 배양한다. 이 배양 기간 이후에, 게놈 DNA를 단리하고, 삽입 또는 결실의 빈도를 실시예 5에 기재된 바와 같이 T7 엔도뉴클레아제 I 소화 및/또는 직접적인 DNA 시퀀싱을 이용하여 결정한다.
표적 BCL11A 영역을 포함하는 DNA 영역을 일루미나 넥스테라 XT 오버행 서열을 함유하는 프라이머를 사용하여 PCR에 의해 증폭시킨다. 이들 PCR 앰플리콘은 T7 엔도뉴클레아제 I 소화를 이용하여 NHEJ 형성에 대해 시험하거나, 또는 일루미나 16S 메타게놈 시퀀싱 라이브러리 프로토콜 또는 유사한 차세대 시퀀싱 (NGS) 라이브러리 제조에 따라 라이브러리 제조를 거친다. 딥 시퀀싱 이후에, 생성된 판독을 CRISPResso에 의해 분석하여, 편집률을 계산한다. 출력 정렬을 수동-큐레이션하여, 삽입 및 결실 부위를 확인한다. 이 분석을 통해 바람직한 RGN 및 상응하는 바람직한 가이드 RNA (sgRNA)가 확인된다. 상기 분석은 APG09748 또는 APG09106 둘 다 동등하게 바람직하게 할 수 있다. 추가로, 상기 분석은 1개 초과의 바람직한 가이드 RNA가 있거나, 또는 표 16의 모든 표적 게놈 서열이 동등하게 바람직함을 결정할 수 있다.
실시예 10.2: 태아 헤모글로빈의 발현에 대한 검정
이 실시예에서, BCL11A 인핸서 영역을 방해하는 APG09748 또는 APG09106 생성된 삽입 또는 결실을 태아 헤모글로빈의 발현에 대해 검정한다. 건강한 인간 공여자 CD34+ 조혈 줄기 세포 (HSC)를 사용한다. 이들 HSC를 배양하고, 바람직한 RGN 및 바람직한 sgRNA의 코딩 영역을 포함하는 발현 카세트를 포함하는 벡터(들)을 실시예 8.3에 기재된 것과 유사한 방법을 이용하여 도입시킨다. 전기천공 이후에, 확립된 프로토콜을 이용하여 시험관내에서 이들 세포를 적혈구로 분화시킨다 (예를 들어, [Giarratana et al. (2004) Nat Biotechnology 23:69-74], 본원에 참고로 포함됨). 이어서, HbF의 발현을 항-인간 HbF 항체에 의해 웨스턴 블롯팅을 이용하여 측정하거나, 또는 고성능 액체 크로마토그래피 (HPLC)를 이용하여 정량화한다. BCL11A 인핸서 유전자좌의 성공적인 방해가 가이드 없이 RGN에 의해서만 전기천공된 HSC와 비교할 때 HbF 생성의 증가를 유도할 것으로 예상된다.
실시예 10.3: 감소된 겸상 적혈구 형성에 대한 검정
이 실시예에서, BCL11A 인핸서 영역을 방해하는 APG09748 또는 APG09106 생성된 삽입 또는 결실을 감소된 겸상 적혈구 형성에 대해 검정한다. 겸상 적혈구 질환에 걸린 환자로부터의 공여자 CD34+ 조혈 줄기 세포 (HSC)를 사용한다. 이들 HSC를 배양하고, 바람직한 RGN 및 바람직한 sgRNA의 코딩 영역을 포함하는 발현 카세트를 포함하는 벡터(들)를 실시예 8.3에 기재된 것과 유사한 방법을 이용하여 도입시킨다. 전기천공 이후에, 확립된 프로토콜을 이용하여 시험관내에서 이들 세포를 적혈구로 분화시킨다 (예를 들어, [Giarratana et al. (2004) Nat Biotechnology 23:69-74], 본원에 참고로 포함됨). 이어서, HbF의 발현을 항-인간 HbF 항체에 의해 웨스턴 블롯팅을 이용하여 측정하거나, 또는 고성능 액체 크로마토그래피 (HPLC)를 이용하여 정량화한다. BCL11A 인핸서 유전자좌의 성공적인 방해가 가이드 없이 RGN에 의해서만 전기천공된 HSC와 비교할 때 HbF 생성의 증가를 유도할 것으로 예상된다.
겸상 적혈구 형성을 메타비술파이트의 첨가에 의해 이들 분화된 적혈구에서 유도한다. 현미경을 이용하여 겸상 대 정상 적혈구의 개수를 카운팅한다. 처리되지 않거나 또는 RGN 단독으로 처리된 세포에 비해 APG09748 또는 APG09106 플러스 sgRNA로 처리된 세포에서 겸상 적혈구의 개수가 더 적을 것으로 예상된다.
실시예 10.4: 뮤린 모델에서 질환 치료 검증
BCL11A 유전자좌의 APG09748 또는 APG09106 방해를 이용하는 효능을 평가하기 위해, 겸상 적혈구 빈혈의 적합한 인간화 마우스 모델을 이용한다. 바람직한 RGN 및 바람직한 sgRNA를 코딩하는 발현 카세트를 AAV 벡터 또는 아데노바이러스 벡터에 팩키징한다. 특히, 아데노바이러스 유형 Ad5/35가 HSC를 표적화하는데 효과적이다. 겸상 적혈구 대립유전자를 갖는 인간화 HBB 유전자좌를 함유하는 적합한 마우스 모델, 예컨대 B6;FVB-Tg(LCR-HBA2,LCR-HBB*E26K)53Hhb/J 또는 B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ를 선택한다. 이들 마우스를 과립구 콜로니-자극 인자 단독으로 또는 플레릭사포어와 조합하여 처리하여, HSC를 순환으로 동원시킨다. 이어서, RGN 및 가이드 플라스미드를 갖는 AAV 또는 아데노바이러스를 정맥내로 주사하고, 마우스를 1 주일 동안 회복시킨다. 이들 마우스로부터 수득한 혈액을 메타비술파이트를 사용하여 시험관내 겸상화 검정에서 시험하고, 마우스를 사망률 및 조혈 기능을 모니터링하기 위해 종적으로 추적한다. 두 발현 카세트 모두 결여된 바이러스 또는 RGN 발현 카세트만을 갖는 바이러스로 처리된 마우스와 비교할 때 RGN 및 가이드 RNA를 갖는 AAV 또는 아데노바이러스로의 처리가 겸상화, 사망률을 감소시키고, 조혈 기능을 개선시킬 것으로 예상된다.
실시예 11: 데아미나제의 확인
미생물 배양물을 표준 실험실 배지에서 액체 배양물에서 성장시켰다. 배양물을 DNA 제조 전에 포화까지 (16 내지 24 시간) 성장시켰다. DNA를 세제 용해에 의해 박테리아 세포로부터 추출한 후, 실리카 매트릭스에 결합시키고, 에탄올 완충제로 세척하였다. 정제된 DNA를 약알칼리성 수성 완충제에 의해 실리카 매트릭스로부터 용리시켰다.
시퀀싱을 위한 DNA를 분광광도법에 의해 순도 및 농도에 대해 시험하였다. 시퀀싱 라이브러리를 넥스테라 XT 라이브러리 제조 키트를 제조자의 프로토콜에 따라 사용하여 제조하였다. 서열 데이터는 일루미나 HiSeq 2000 시스템 사용자 가이드 프로토콜에 따라 HiSeq 2000 상에서 생성하였다.
시퀀싱 판독은 씨엘씨 바이오 어셈블리 셀(CLC Bio Assembly Cell) 소프트웨어 패키지를 사용하여 드래프트 게놈으로 조립하였다. 조립 후에, 몇몇 방법에 의해 유전자 호출이 이루어졌고, 생성된 유전자 서열을 조사하여 데아미나제 유전자의 신규한 상동성을 확인하였다. 신규한 유전자는 BLAST 및 도메인 조성에 의해 확인하였다. 촉매적 도메인 D/H/C-[X]-E-[X15-45]-P-C-[X2]-C (서열식별번호: 613)는 모든 효소에서 예측되었다. 추가로, 시퀀싱된 진핵생물 유기체의 게놈으로부터의 가상의 데아미나제인 NCBI 데이터베이스에서 확인된 서열 또한 실험하였다. 확인된 268개의 APOBEC 도메인 단백질은 65% 상동성으로 클러스터화되었고, 47개의 후보가 데아미나제 활성 검정을 위해 선택되었다. 확인된 392개의 ADAT 도메인 단백질은 65% 상동성으로 클러스터화되었고, 추가로 서열 길이를 기반으로 하여 선택되었다. 모두 220개 미만의 아미노산 길이인 125개의 ADAT 도메인 단백질이 데아미나제 활성 검정을 위해 선택되었다.
표 17은 47개의 선택된 APOBEC 도메인 단백질 및 125개의 ADAT 도메인 단백질을 나타낸다. 각각의 폴리펩티드에 대한 독특한 식별 코드를 제공하는 서열식별번호 및 APG ID가 표시된다. 입수가능한 경우, NCBI 및 유니프롯(Uniprot) 수탁 번호가 제공된다. "도메인 설명"은 데아미나제가 ADAT 또는 APOBEC 도메인을 갖는지 여부를 나타낸다. 확인된 폴리펩티드 서열 내에서 ADAT 또는 APOBEC 도메인의 시작 및 끝 또한 나타낸다.
표 17: 확인된 데아미나제
실시예 12: 데아미나제 활성에 대한 검정
실시예 12.1: 추정 데아미나제의 선택
표 17에 나타낸 선택된 단백질의 코딩 서열은 박테리아에서의 발현을 위해 코돈-최적화되고, 합성되고, 5' 말단에서 T7 프로모터에 작동가능하게 연결된 관련 기술분야에 널리 공지된 표준 박테리아 발현 벡터에 도입된다.
실시예 12.2: 데아미나제 활성 검정
데아미나제 활성 검정은 [Garibyan et al. (DNA Repair 2: 593-608, 2003)]을 기반으로 한다. 에스케리키아 콜라이의 rpoB 유전자에서의 돌연변이는 RNA 폴리머라제의 β 서브유닛을 변경시킴으로써 항생제 리팜피신 (Rifr)에 대한 내성을 일으킨다.
실시예 12.1에 기재된 바와 같이, 추정 데아미나제를 코딩하는 박테리아 발현 벡터를 T7 발현 이. 콜라이 세포 (NEBioLabs)에 도입시켰다. 세포는 우라실 DNA 글리코실라제 억제제 (UGI; 서열식별번호: 570) 및 카르베니실린 선택가능한 마커를 코딩하는 별도의 발현 플라스미드 또한 함유할 수 있다. 세포를 포화까지 성장시킨 다음, 자가-유도 배지 (매직미디어™, 써모 피셔 사이언티픽)의 접종물을 위한 공급원으로서 사용한 다음, 추가 5 시간 동안 성장시켰다. 세포를 UGI 발현 플라스미드를 또한 함유하는지 여부에 따라 카나마이신을 갖는 LB 또는 카나마이신 및 카르베니실린을 갖는 LB 상에 희석-플레이팅시킨다. 이들 희석-플레이트를 사용하여 총 세포 카운트를 구하였다. rpoB 유전자로의 돌연변이를 성공적으로 도입시킬 수 있는 추정 데아미나제 발현 벡터를 확인하기 위해 동일한 세포를 리팜피신을 갖는 LB 또는 리팜피신 및 카르베니실린을 갖는 LB 상에 또한 플레이팅하였다.
리팜피신을 함유하는 LB 플레이트 상에서 성장시킨 박테리아 콜로니로부터 데아미나제 발현 벡터를 단리하고, 검정을 적어도 2회 반복하였다. 확인한 후에, 박테리아 세포를 시퀀싱하였다. 예상치 못하게도, 평가를 위해 선택된 단백질을 함유하는 47개의 APOBEC 도메인 중에서, 단지 9개만이 데아미나제 활성을 나타내었다. 평가를 위해 선택된 단백질을 함유하는 125개의 ADAT 도메인 중에서, 어느 것도 데아미나제 활성을 나타내지 않았다. 이는 데아미나제 활성이 폴리펩티드의 아미노산 서열을 기반으로 하여 예측될 수 없지만, 대신에 실험적으로 결정되어야 함을 시사한다. 이 검정에서 확인된 9개의 활성 데아미나제에 대한 결과는 표 18에 나타내었다. 리팜피신-내성 콜로니로부터의 rpoB 유전자를 시퀀싱하여 유도된 돌연변이를 확인하였다. 돌연변이율은 각각의 활성 데아미나제를 포함하는 내성 콜로니의 개수를 콜로니의 총 개수와 비교함으로써 계산되었다.
표 18: 활성 데아미나제의 돌연변이율의 NGS 분석
실시예 13: 박테리아 세포에서 염기 편집 활성
APG00868 (서열식별번호: 374) 또한 후속적인 활성 스크린에서 활성 데아미나제로 확인되었다. 10개의 확인된 활성 데아미나제의 코딩 서열을 그의 N-말단에서 NLS (서열식별번호: 10)를 포함하고, 그의 C-말단에서 표 18의 활성 데아미나제에 작동가능하게 연결되고, 그의 C-말단에서 링커 서열 (서열식별번호: 546)에 작동가능하게 연결되고, 그의 C-말단에서 RNA-가이드된 DNA 결합 단백질, 즉, 뉴클레아제-불활성 RNA-가이드된 뉴클레아제 (RGN) dAPG08290.1 변이체 (서열식별번호: 547)에 작동가능하게 연결되고, 그의 C-말단에서 제2 NLS에 작동가능하게 연결되고, 그의 C-말단에서 TEV 부위 (서열식별번호: 548)에 작동가능하게 연결되고, 그의 C-말단에서 10x His (서열식별번호 594) 태그에 작동가능하게 연결된 융합 단백질을 생성하는 발현 카세트에 도입시켰다. 실시예 12에서 확인된 선택된 데아미나제 및 APG00868을 박테리아 세포에서 표적화된 염기 편집 활성을 위해 검정하였다.
이 활성 검정은 실시예 12와 매우 유사하였다. 그러나, 이들 실험의 경우에는 데아미나제를 불활성 RGN에 연결시켜서, rpoB 유전자의 특정한 영역을 표적화하여 표적화된 C에서 T로의 돌연변이를 도입시킬 수 있었다. 추가로, RGN-데아미나제 융합체의 표적화를 위한 가이드 RNA를 발현할 수 있는 발현 카세트를 포함하는 벡터를 생성하였다. 이들 실험에서 4가지 상이한 가이드 RNA를 사용하였다. 표 19에서 "비표적화된" (서열식별번호: 549)으로 지칭되는 제1 가이드는 RGN-데아미나제 융합체를 rpoB 유전자가 아닌 게놈 박테리아 DNA의 영역으로 가이드하였다. 표적 1 (서열식별번호: 550)은 rpoB 단백질에서 R529C 돌연변이를 도입시키는 rpoB 유전자의 영역이었다. 표적 2 (서열식별번호: 551)는 rpoB 단백질에서 A532V 돌연변이를 도입시키는 rpoB 유전자의 영역이었고, 표적 3 (서열식별번호: 552)은 rpoB 단백질에서 Q513R 돌연변이를 도입시키는 rpoB 유전자의 영역이었다. 표적 1 및 2의 원하는 돌연변이는 GC 쌍에서 AT 쌍으로의 염기 편집의 결과이다. 표적 3의 원하는 돌연변이는 AT 쌍에서 GC 쌍으로의 염기 편집의 결과이다. 다른 가능한 돌연변이 또한 이들 표적에서 확인될 수 있다.
rpoB 유전자 상의 관심 위치로 표적화시키는 가이드 RNA를 발현할 수 있는 발현 카세트를 포함하는 벡터와 함께 융합 단백질 발현 벡터를 T7 발현 이. 콜라이 세포 (NEBioLabs)에 도입시켰다. 세포를 포화까지 성장시킨 다음, 자가-유도 배지 (매직미디어™, 써모 피셔 사이언티픽)의 접종물을 위한 공급원으로서 사용한 다음, 추가 5 시간 동안 성장시켰다. 세포를 카나마이신을 갖는 LB 상에 희석-플레이팅시키고, 이들 희석-플레이트를 사용하여 총 세포 카운트를 구하였다. rpoB 유전자에서 돌연변이를 보유하는 콜로니를 확인하기 위해 동일한 세포를 리팜피신을 갖는 LB 상에 또한 플레이팅하였다. "비표적화된" 및 표적화된 데아미나제-RGN 융합 단백질 ("표적화된")에 대한 돌연변이율을 계산하였고, 표 19에 나타내었다. rpoB 유전자에 대해 표적화되지 않은 데아미나제-RGN 융합체와 비교하여 표적화된 데아미나제-RGN 융합체의 돌연변이율에서 퍼센트 증가 ("% 증가") 또한 표 19에 나타내었다. 데아미나제로서 기능하는 것으로 공지된 양성 대조군 포유동물 APOBEC 또한 포함되었다.
표 19: 표적화된 및 비표적화된 데아미나제의 돌연변이율
실시예 14: 포유동물 세포에서 염기 편집 활성
확인된 활성 데아미나제의 코딩 서열을 포유동물 세포에서의 발현을 위해 코돈-최적화시키고, 그의 N-말단에서 NLS (서열식별번호: 10)를 포함하고, 그의 C-말단에서 3xFLAG 태그 (서열식별번호: 11)에 작동가능하게 연결되고, 그의 C-말단에서 본 발명의 데아미나제에 작동가능하게 연결되고, 그의 C-말단에서 아미노산 링커 (서열식별번호: 546)에 작동가능하게 연결되고, 그의 C-말단에서 RNA-가이드된 DNA-결합 폴리펩티드, 즉, 닉카제로서 기능하도록 돌연변이된 RGN (nAPG07433.1; 서열식별번호: 553)에 작동가능하게 연결되고, 그의 C-말단에서 제2 NLS에 작동가능하게 연결된 융합 단백질을 생성하는 발현 카세트에 도입시켰다. 추가로, APG07386의 N-말단 및 C-말단 단편 (각각 서열식별번호: 554로서 APG07386-NTD 및 서열식별번호: 555로서 APG07386-CTD)을 발현 카세트에 개별적으로 도입시켜 각각의 단편의 데아미나제-RGN 융합체를 생성하였다. 이들 발현 카세트 각각을 포유동물 세포에서 융합 단백질의 발현을 유도할 수 있는 벡터에 도입시켰다. 데아미나제-RGN 융합 단백질을 결정된 게놈 위치로 표적화하기 위해 가이드 RNA를 발현할 수 있는 벡터 또한 생성하였다. 이들 가이드 RNA는 데아미나제-RGN 융합 단백질을 염기 편집을 위한 표적화된 게놈 서열로 가이드할 수 있다. 서열식별번호: 556-561은 시험한 가이드 RNA를 코딩한다.
실시예 14.1: 데아미나제 중에서 효율성 및 서열 특이성
상기 기재된 데아미나제-RGN 융합 단백질 및 가이드 RNA를 발현할 수 있는 벡터를 리포펙션 또는 전기천공을 이용하여 HEK293T 세포에 형질감염시켰다. 리포펙션의 경우, 성장 배지 (DMEM + 10% 태아 소 혈청 + 1% 페니실린/스트렙토마이신)에서 형질감염 전날에 세포를 24-웰 플레이트에서 1x105 세포/웰로 시딩하였다. 제조자의 지침에 따라 500ng의 데아미나제-RGN 융합 발현 벡터 및 1 μg의 가이드 RNA 발현 벡터를 리포펙타민® 3000 시약 (써모 피셔 사이언티픽)을 이용하여 형질감염시켰다. 전기천공의 경우, 제조자의 지침에 따라 세포를 네온(Neon)® 형질감염 시스템 (써모 피셔 사이언티픽)을 이용하여 전기천공시켰다.
리포펙션 또는 전기천공 24-48 시간 후에, 게놈 DNA를 형질감염된 또는 전기천공된 세포로부터 수확하고, DNA를 시퀀싱하고, 표적화된 염기-편집 돌연변이의 존재에 대해 분석하였다.
하기 표 20은 APG07386의 C-말단 및 N-말단 단편을 비롯하여 각각의 데아미나제에 대한 시티딘 염기의 편집률을 나타낸다. 숫자 라인은 RGN의 PAM과 관련하여 표적화된 게놈 서열에서 시티딘 염기의 위치를 나타낸다. 각각의 위치에서 C 뉴클레오티드의 편집률은 다중 표적의 평균으로서 나타내었다. 표적의 개수 (n)는 각각의 위치에 대해 컬럼 아래에 나열된다. 표준 편차는 괄호 안에 나타내었다. 이 검정에서, APG09980, APG07386-CTD, APG05840, APG05241, APG07280, APG09688 및 APG00868은 적어도 하나의 시티딘의 적어도 일부 수준의 시티딘 염기 편집 활성을 나타낸다.
표 20: 포유동물 세포에서 C 뉴클레오티드의 편집률
실시예 14.2: 표적화된 염기 편집에 대한 형광 검정
첫번째 위치 C를 T로 변경시키기 위해 H66 코돈이 시토신 데아미나제를 사용하여 히스티딘 (CAT)으로부터 야생형 티로신 (TAT) 잔기로 되돌릴 수 있도록, 청색 형광 단백질 (BFP, 서열식별번호: 562)로의 형광 이동을 유발하는 Y66H 돌연변이를 함유하는 증강된 녹색 형광 단백질 (EGFP)을 보유하는 벡터를 구축하였다. 성공적인 C에서 T로의 전환은 정량화될 수 있는 EGFP의 발현을 생성한다. 데아미나제-RGN 융합 단백질을 Y66H 돌연변이 (서열식별번호: 563) 주변 영역으로 표적화하는 가이드 RNA를 발현할 수 있는 제2 벡터 또한 생성하였다.
데아미나제-RGN 융합 단백질 및 가이드 RNA를 발현할 수 있는 벡터와 함께 이러한 BFP에서 EGFP로의 리포터 벡터를 리포펙션 또는 전기천공을 이용하여 HEK293T 세포에 형질감염시켰다. 리포펙션의 경우, 성장 배지 (DMEM + 10% 태아 소 혈청 + 1% 페니실린/스트렙토마이신)에서 형질감염 전날에 세포를 24-웰 플레이트에서 1x105 세포/웰로 시딩하였다. 제조자의 지침에 따라 500 ng의 각각의 BFP 리포터 벡터, 데아미나제-RGN 발현 벡터, 및 가이드 RNA 발현 벡터를 리포펙타민® 3000 시약 (써모 피셔 사이언티픽)을 이용하여 형질감염시켰다. 전기천공의 경우, 제조자의 지침에 따라 세포를 네온® 형질감염 시스템 (써모 피셔 사이언티픽)을 이용하여 전기천공시켰다.
리포펙션 또는 전기천공 24-48 시간 후에, GFP+ 세포의 존재에 대해 세포를 현미경으로 조사함으로써 GFP의 발현을 결정하였다. 육안 검사 후에, GFP+ 세포 대 GFP- 세포의 비율을 결정할 수 있다. 표 21에 보고된 데아미나제-RGN 융합 단백질을 발현하는 포유동물 세포에 대해 형광을 관찰하였다. 관련 기술분야의 기술자는 RIPA 완충제를 사용하여 세포를 또한 용해시킬 수 있고, 생성된 용해물을 형광 플레이트 판독기 상에서 분석하여, BFP 및 GFP에 대한 형광 강도를 결정할 수 있음을 이해할 것이다. 추가로, 세포 분류에 의해 세포를 분석하여 BFP+, GFP+ 및 GFP- 세포의 정확한 비율을 결정할 수 있다.
표 21: 포유동물 시토신 데아미나제 형광 리포터 결과
N.D = 검출되지 않음; + = 약간의 GFP+ 세포가 검출됨, ++ = 많은 GFP+ 세포가 검출됨
실시예 15: 아데노신 및 시토신 염기 편집기의 생성을 위한 데아미나제의 다양화
DNA 서열에서 A 또는 T 잔기를 G 또는 C로 변화시킬 수 있는 아데노신 염기 편집기 (ABE)가 천연 발생하는 것으로 공지되어 있지 않다. 하기 다양화 전략을 이용하여, DNA 주형에 대해 작용하는 ABE를 확인하기 위한 목적으로 데아미나제 변이체를 생성하였다.
첫번째 전략은 [Gaudelli et al (Nature, 2017, doi:10.1038/nature24644] (본원에 참고로 포함됨)과 유사한 오류가 발생하기 쉬운 PCR 효소에 의한 무작위 돌연변이 유발이었다. 프라이머를 설계하고, 표 17의 125개의 ADAT 효소에 대한 뉴클레오티드 서열을 생성하였다. 오류가 발생하기 쉬운 PCR을 제조자의 지침에 따라 젠모르프(GenMorph) II 무작위 돌연변이 유발 키트 (애질런트 테크놀로지즈)를 사용하여 수행하였다. 돌연변이된 ADAT PCR 생성물을 제조자의 지침에 따라 ZR-96 DNA 클린-업 키트(Clean-up Kit)™ (자이모 리써치(Zymo Research))를 사용하여 정제하였다. 이 접근법으로부터, 약 1천만 개의 ADAT 변이체를 생성하였다.
추구된 두번째 전략은 [Stemmer, W. P. C. (Proc. Natl. Acad. Sci. USA, 1994)]과 유사한 유전자 셔플링이었다. 표 17의 125개의 ADAT 효소에 대한 코딩 서열을 본질적으로 제조자의 지침에 따라 퓨전® 하이-피델리티 DNA 폴리머라제 (NEBiolabs)를 사용하여 PCR 증폭시키고, 제조자의 지침에 따라 디엔에이 클린 앤 컨선트레이터(DNA Clean & Concentrator)™-5 (자이모 리써치)를 사용하여 정제하였다. 상이한 ADAT 코딩 서열을 갖는 정제된 DNA를 풀링하고, 컷스마트(Cutsmart)® 완충제 중에서 37℃에서 60 분 동안 효소 RsaI, AfeI, BsaAI 및 BsaHI에 의한 제한 소화에 적용하였다. 소화 후에, 반응을 겔 전기영동에 의해 분리하고, 소화된 단편을 자이모클린(Zymoclean)™ 겔 DNA 복구 키트를 사용하여 정제하였다. 이어서, 정제된 단편을 PCR 증폭을 이용하여 조립하고, 조립되고 증폭된 생성물을 정제하였다. 이 접근법으로부터, 약 2백만 개의 ADAT 변이체를 생성하였다.
마지막 전략은 핵산과 잠재적으로 상호작용하는 구조적 잔기와 상동성인 잔기를 표적화하는 것이었다. ADAT-유사 효소의 경우, RNA (RCSB 프로테인 데이터 뱅크(Protein Data Bank) 식별번호: 2B3J; [Losey et al., 2006, Nat. Struct. Mol. Biol. 13: 153-159])와 복합체화된 스타필로코커스 아우레우스(Staphylococcus aureus) tRNA 아데노신 데아미나제, TadA의 결정 구조의 주의깊은 검사를 통해, 이. 콜라이 TadA (유니프롯 P68398 및 진뱅크 수탁번호 NP_417054) P48, L84, A106, D108 및 K110과 상동성인 잔기에서 잠재적인 상호작용이 나타났다. 이어서, 이들 상동성 잔기의 포화 돌연변이 유발을 표 17로부터의 125개의 ADAT-도메인 데아미나제에 대해 수행하였다. 이 접근법으로부터, 약 1백만 개의 ADAT 변이체를 생성하였다.
관련 기술분야의 기술자는 이들 접근법이 배타적이지 않고, 조합될 수 있으며, 각각의 연속 라운드의 개선의 결과에 적용될 수 있음을 이해할 것이다. 포화 돌연변이 유발 또는 반복적인 포화 돌연변이 유발 (Reetz and Carballeira, 2007, Nature Protocols, 2 (4): 891-903)은 반복적인 것으로 공지되어 있으며, 이는 최적의 후보가 확인될 때가지 한 라운드로부터 최상의 성능 후보가 추가 라운드의 돌연변이 및 스크리닝을 위해 선택된다는 것을 의미한다.
실시예 16: 아데노신 염기 편집기 및 시토신 염기 편집기의 생성을 위한 활성의 다양화된 데아미나제의 결정
실시예 16.1: 다양화된 데아미나제에 대한 박테리아 활성 검정
실시예 15의 다양화된 라운드로부터의 ADAT 돌연변이성 변이체 생성물을 그의 N-말단에서 NLS (서열식별번호: 10)를 포함하고, 그의 C-말단에서 돌연변이된 데아미나제에 작동가능하게 연결되고, 그의 C-말단에서 링커 서열 (서열식별번호: 546)에 작동가능하게 연결되고, 그의 C-말단에서 RNA-가이드된 DNA 결합 단백질, 즉, 뉴클레아제-불활성 RNA-가이드된 뉴클레아제 (RGN) dAPG08290.1 변이체 (서열식별번호: 547)에 작동가능하게 연결되고, 그의 C-말단에서 제2 NLS에 작동가능하게 연결되고, 그의 C-말단에서 TEV 부위 (서열식별번호: 548)에 작동가능하게 연결되고, 그의 C-말단에서 10x His 태그 (서열식별번호: 594)에 작동가능하게 연결된 융합 단백질을 생성하는 발현 카세트에 도입시켰다.
이 활성 검정은 실시예 13과 매우 유사하였다. 그러나, 이들 실험의 경우에는, 시토신 염기 편집 선택의 경우 H193R (서열식별번호: 566) 또는 아데노신 염기 편집 선택의 경우 H193Y (서열식별번호: 567)로 돌연변이된 H193을 갖는 불활성화된 클로람페니콜 유전자를 갖는 구축물을 제조하였다. 각각의 플라스미드는 RGN-데아미나제 융합체를 플라스미드의 적절한 영역으로 표적화하기 위해 가이드 RNA를 또한 함유하였다. 성공적인 CG에서 TA로의 전환시 (서열식별번호: 566의 경우) 또는 AT에서 GC로의 전환시 (서열식별번호: 567의 경우), 박테리아 세포는 클로람페니콜을 함유하는 배지에서 생존할 수 있을 것이다.
불활성화된 클로람페니콜 유전자를 포함하고 sgRNA를 표적화하는 벡터와 함께 융합 단백질 발현 벡터를 T7 발현 이. 콜라이 세포 (NEBioLabs)에 도입시켰다. 세포를 포화까지 성장시킨 다음, 자가-유도 배지 (매직미디어™, 써모 피셔 사이언티픽)의 접종물을 위한 공급원으로서 사용한 다음, 추가 5 시간 동안 성장시켰다. 세포를 카나마이신 및 카르베니실린을 갖는 LB 상에 희석-플레이팅시키고, 이들 희석-플레이트를 사용하여 총 세포 카운트를 구하였다. 활성인 돌연변이된 데아미나제를 보유하는 콜로니를 확인하기 위해 동일한 세포를 카나마이신, 카르베니실린 및 클로람페니콜을 갖는 LB 상에 또한 플레이팅하였다. 대표적인 클론을 선택하고 시퀀싱한 다음, 개별적으로 시험하였다. 추가로, "비표적화된" 돌연변이율을 측정하기 위해 동일한 세포를 카나마이신 및 리팜피신을 갖는 LB 상에 또한 플레이팅하였다. H193R 플라스미드 ("CBE")로 표적화된 데아미나제-RGN 융합 단백질에 대한 돌연변이율 ("Mutn Rate")을 계산하고, H193Y 플라스미드 ("ABE")로 표적화된 데아미나제-RGN 융합 단백질에 대한 돌연변이율을 표 22에 나타내었다. 데드 RGN (dAPG08290.1; 서열식별번호: 547)만을 함유하는 세포에서 관찰된 백그라운드와 비교하여 상대적인 아데닌 염기 편집률 ("ABE Rel Rate"), 시토신 염기 편집률 ("CBE Rel Rate"), 및 오프 타겟률 ("Off-T Rel Rate) 또한 나타내었다. 시토신 데아미나제로서 기능하는 것으로 공지된 양성 대조군 포유동물 데아미나제 또한 포함되었다.
표 22: 선택된 돌연변이된 데아미나제의 돌연변이율
실시예 16.2: 표적화된 염기 편집에 대한 형광 검정
세번째 위치 A를 G로 변경시키기 위해 아데노신 데아미나제를 사용하여 W58 코돈을 정지 (TGA)에서 야생형 트립토판 (TGG) 잔기로 되돌릴 수 있도록, 조기 정지 코돈 (서열식별번호: 564)을 생성하는 W58* 돌연변이를 함유하는 증강된 녹색 형광 단백질 (EGFP)을 보유하는 벡터를 구축하였다. 성공적인 A에서 G로의 전환은 정량화될 수 있는 EGFP의 발현을 생성한다. 데아미나제-RGN 융합 단백질을 W58* 돌연변이 (서열식별번호: 565) 주위 영역으로 표적화하는 가이드 RNA를 발현할 수 있는 두번째 벡터 또한 생성하였다.
데아미나제-RGN 융합 단백질 및 가이드 RNA를 발현할 수 있는 벡터와 함께 이러한 EGFP에서 EGFP로의 리포터 벡터를 리포펙션 또는 전기천공을 이용하여 HEK293T 세포에 형질감염시켰다. 리포펙션의 경우, 성장 배지 (DMEM + 10% 태아 소 혈청 + 1% 페니실린/스트렙토마이신)에서 형질감염 전날에 세포를 24-웰 플레이트에서 1x105 세포/웰로 시딩하였다. 제조자의 지침에 따라 500 ng의 각각의 데드 EGFP 리포터 벡터, 데아미나제-RGN 발현 벡터, 및 가이드 RNA 발현 벡터를 리포펙타민® 3000 시약 (써모 피셔 사이언티픽)을 이용하여 형질감염시켰다. 전기천공의 경우, 제조자의 지침에 따라 세포를 네온® 형질감염 시스템 (써모 피셔 사이언티픽)을 이용하여 전기천공시켰다.
리포펙션 또는 전기천공 24-48 시간 후에, GFP+ 세포의 존재에 대해 세포를 현미경으로 조사함으로써 GFP의 발현을 결정하였다. 육안 검사 후에, GFP+ 세포 대 GFP- 세포의 비율을 결정할 수 있다. 표 23에 보고된 데아미나제-RGN 융합 단백질을 발현하는 포유동물 세포에 대해 형광을 관찰하였다. 관련 기술분야의 기술자는 RIPA 완충제를 사용하여 세포를 또한 용해시킬 수 있고, 생성된 용해물을 형광 플레이트 판독기 상에서 분석하여, GFP에 대한 형광 강도를 결정할 수 있음을 이해할 것이다. 추가로, 세포 분류에 의해 세포를 분석하여 GFP+ 및 GFP- 세포의 정확한 비율을 결정할 수 있다.
표 23: 포유동물 아데노신 데아미나제 형광 리포터 결과
+ = 약간의 GFP+ 세포가 검출됨, ++ = 많은 GFP+ 세포가 검출됨, +++ = 가장 많은 수의 GFP+ 세포가 관찰됨
SEQUENCE LISTING
<110> LIFEEDIT, INC.
<120> POLYPEPTIDES USEFUL FOR GENE EDITING AND METHODS OF USE
<130> L103438 1150WO (0038.7)
<140>
<141>
<150> 62/932,169
<151> 2019-11-07
<150> 62/790,261
<151> 2019-01-09
<150> 62/790,266
<151> 2019-01-09
<150> 62/790,262
<151> 2019-01-09
<150> 62/790,256
<151> 2019-01-09
<150> 61/790,258
<151> 2019-01-09
<150> 62/785,391
<151> 2018-12-27
<160> 617
<170> PatentIn version 3.5
<210> 1
<211> 1060
<212> PRT
<213> Bacillus sp.
<220>
<221> source
<223> /note="APG00969"
<400> 1
Met Lys Gln Thr Ser Tyr Ser Leu Gly Leu Asp Ile Gly Ile Ala Ser
1 5 10 15
Val Gly Tyr Gly Leu Ile Asp Asn Asp Glu Asn Ile Val Asp Ala Gly
20 25 30
Val Arg Leu Phe Pro Glu Ala Asn Ser Lys Asn Asn Asp Gly Arg Arg
35 40 45
Lys Ser Arg Gly Ser Lys Arg Leu Ile Arg Arg Lys Arg His Arg Ile
50 55 60
Ala Arg Val Lys His Leu Leu Lys Glu Ser Gly Ile Asp Val Ser Tyr
65 70 75 80
Glu Asn Thr Val Leu Thr Asn Pro Tyr Glu Ile Arg Cys Lys Gly Leu
85 90 95
Thr Leu Pro Leu Thr Asn His Glu Leu Ser Ile Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Lys Ser Met Asp Gln Glu Lys
115 120 125
Val Lys Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Thr Ile Asn Asp
130 135 140
Asn Leu Leu Glu Glu Lys Phe Ile Cys Glu Leu Gln Leu Glu Arg Leu
145 150 155 160
Asn Lys Glu Gly Ile Val Arg Ser His Ser Asn Arg Phe Lys Thr Ala
165 170 175
Asp Tyr Ile Lys Glu Ile Lys Asn Leu Leu Glu Thr Gln Ala Lys Gln
180 185 190
Asn Thr Leu Val Thr Glu Glu Phe Ile Glu Lys Tyr Ile Glu Ile Phe
195 200 205
Ser Gly Arg Arg Lys Tyr Tyr Glu Gly Pro Gly Gly Glu Ser Lys Tyr
210 215 220
Gly Trp Lys Gly Asp Ile Glu Lys Trp Tyr Glu Gly Leu Met Gly Lys
225 230 235 240
Cys Thr Tyr Phe Pro Lys Glu Leu Arg Cys Val Lys His Ala Tyr Ser
245 250 255
Ala Ala Leu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Ser Ile Asn
260 265 270
Arg Glu Glu Asp Thr Lys Leu Ser Gln Tyr Glu Lys Glu Gln Ile Ile
275 280 285
Glu Lys Ile Phe Lys Val Arg Lys Thr Pro Thr Leu Thr Gln Ile Ala
290 295 300
Lys Leu Leu Lys Val Asp Pro Thr Asn Ile Lys Gly Phe Arg Thr Lys
305 310 315 320
Ala Asn Gly Thr Pro Asp Phe Leu Ser Ile Lys Ile Tyr His Asp Leu
325 330 335
Lys Gly Ile Ile Asp Asp Lys Gln Leu Leu Asp Asp Ile Ala Phe Leu
340 345 350
Asp Asn Val Ala Gln Ile Leu Thr Val Trp Gln Asp Ser Gln Ser Ile
355 360 365
Gln Glu Lys Leu Lys Thr Leu Asn Lys Asn Leu Asp Asp Lys Thr Ile
370 375 380
Lys Glu Ile Ser Glu Leu Lys Lys Tyr Thr Gln Thr His Ser Leu Ser
385 390 395 400
Leu Lys Leu Ile Asn Val Leu Leu Pro Glu Leu Trp Glu Thr Thr Lys
405 410 415
Asn Gln Met Thr Ile Leu Ser Glu Leu Lys Leu Lys Pro Arg Lys Ile
420 425 430
Asp Leu His Asn Cys Asn Glu Ile Pro Val Asn Met Ile Asn Asp Leu
435 440 445
Ile Val Ser Pro Val Val Arg Arg Ser Leu Thr Gln Ser Ile Glu Met
450 455 460
Ile Asn Gln Ile Ile Lys Asp Tyr Gly His Pro Arg Glu Ile Val Ile
465 470 475 480
Glu Leu Ala Arg Glu Lys Asn Ser Glu Glu Lys Lys Asn Phe Ile Lys
485 490 495
Ser Leu Asn Glu Lys Asn Lys Gln Ile Asn Asp Glu Val Ile Glu Lys
500 505 510
Leu Asn Ala Ser Asn His Arg Asp Asn Lys Gly Met Phe Asn Lys Val
515 520 525
Lys Leu Trp Ile Leu Gln Asp Gly His Cys Leu Tyr Ser Leu Lys Pro
530 535 540
Ile Arg Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Ile Asp
545 550 555 560
His Ile Ile Pro Lys Ser Val Ser Phe Asp Asp Ser Met Ser Asn Lys
565 570 575
Val Leu Val Tyr Gln Ile Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro
580 585 590
Tyr Gln Tyr Leu Thr Ser Ala Asp Lys Thr Ile Thr Tyr Glu Lys Phe
595 600 605
Lys Ala Asn Ile Thr Gln Leu Ala Lys Ser Asn His Lys Ile Ser Lys
610 615 620
Lys Lys Leu Asp Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe His
625 630 635 640
Ile Lys Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala
645 650 655
Thr Arg Ser Leu Ile Asn Leu Leu Lys Tyr Tyr Phe Ser Glu Lys Asp
660 665 670
Ile Asn Val Lys Val Lys Ser Ile Asn Gly Ser Phe Thr Asp Tyr Leu
675 680 685
Arg Lys Leu Trp Asn Phe Pro Lys Asp Arg Glu Phe Tyr His Lys His
690 695 700
His Ala Glu Asp Ala Leu Ile Ile Ala Met Ala Asn Lys Ile Phe Thr
705 710 715 720
Thr Arg Lys Ile Phe Lys Glu Gln Asn Ser Val Phe Ser Asp Glu Gln
725 730 735
Ile Leu Asp Gly Glu Val Thr Asn Ile Leu Ser Asp Asp Gln Phe Gln
740 745 750
Ala Glu Phe Thr Glu Lys Phe Tyr Lys Val Gln Ala Ile Lys Lys Tyr
755 760 765
Asp Lys Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln
770 775 780
Leu Phe Asp Asp Thr Leu Tyr Ser Thr Arg Glu Phe Glu Gly Glu Glu
785 790 795 800
Tyr Tyr Ile Gly Lys Ile Lys Asp Ile Tyr Asn Leu Lys Asp Lys Arg
805 810 815
Leu Lys Lys Ile Phe Thr Lys Ser Pro Glu Lys Ile Leu Met Tyr Gln
820 825 830
His Asp Ser Gln Thr Phe Lys Lys Leu Lys Gln Ile Met Arg Ser Tyr
835 840 845
Glu Asp Glu Val Asn Pro Leu Ala Lys Tyr His Lys Glu Thr Gly Glu
850 855 860
Tyr Leu Arg Lys Glu Cys Lys Lys Gly Asn Gly Pro Ile Val Lys Ser
865 870 875 880
Leu Lys Tyr Arg Val Thr Lys Leu Gly Val His Lys Asp Ile Thr His
885 890 895
Lys Tyr Glu Asn Ser Lys Asn Lys Val Val Ile Leu Ser Leu Lys Pro
900 905 910
Phe Arg Met Asp Val Phe Lys Glu Asn Gly Val Tyr Lys Phe Ile Thr
915 920 925
Ile Arg Tyr Cys Asp Leu Lys Glu Thr Val Asn Ser Tyr Thr Ile Ser
930 935 940
Glu His Leu Tyr Lys Ala Lys Leu Lys Ala Lys Asp Ile Lys Ser Met
945 950 955 960
Asp Ser Phe Lys Trp Ser Phe Tyr Lys Asn Asp Leu Leu Glu Tyr Asn
965 970 975
Gly Glu Leu Cys Thr Phe Lys Gly Val Asn Asp Asp Lys Lys Asn Lys
980 985 990
Ile Glu Val Asn Trp Val Glu Lys Asn Phe Ala Ile Tyr Ala Glu Lys
995 1000 1005
Lys Asn Leu Lys Ser Lys Gln Leu Val Lys Ser Ile Thr Lys Ser
1010 1015 1020
Thr Val Lys Ser Leu Leu Lys Tyr Thr Thr Asp Ile Leu Gly Asn
1025 1030 1035
Arg Tyr Pro Val Arg Asn Glu Lys Leu Lys Leu Met Ile Arg Lys
1040 1045 1050
Gln Thr Phe Arg Gly Asp Leu
1055 1060
<210> 2
<211> 16
<212> RNA
<213> Bacillus sp.
<220>
<221> source
<223> /note="crRNA"
<400> 2
guuuuaguac ucugug 16
<210> 3
<211> 73
<212> RNA
<213> Bacillus sp.
<220>
<221> source
<223> /note="tracrRNA"
<400> 3
cacagaaucu acuaaaauaa ggcauaaugc cguauuuaau cccaucauaa uucugauggg 60
auuuuuuaua uuu 73
<210> 4
<211> 118
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(25)
<223> a, c, u, g, unknown or other
<400> 4
nnnnnnnnnn nnnnnnnnnn nnnnnguuuu aguacucugu gaaagcacag aaucuacuaa 60
aauaaggcau aaugccguau uuaaucccau cauaauucug augggauuuu uuauauuu 118
<210> 5
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 5
gagcggacag cagcuuccua uaucucguac guuuuaguac ucugugaaag cacagaaucu 60
acuaaaauaa ggcauaaugc cguauuuaau cccaucauaa uucugauggg auuuuuuaua 120
uuu 123
<210> 6
<211> 123
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 6
ccaugauaua gacguugugg cuguuguagu guuuuaguac ucugugaaag cacagaaucu 60
acuaaaauaa ggcauaaugc cguauuuaau cccaucauaa uucugauggg auuuuuuaua 120
uuu 123
<210> 7
<211> 5
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<400> 7
nnarv 5
<210> 8
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 8
aaag 4
<210> 9
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 9
gccgccrcca tgg 13
<210> 10
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 10
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 11
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 11
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys
20
<210> 12
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 12
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 13
<211> 6
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (2)..(2)
<223> a, c, u, g, unknown or other
<220>
<221> modified_base
<222> (4)..(5)
<223> a, c, u, g, unknown or other
<400> 13
unannc 6
<210> 14
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (31)..(38)
<223> a, c, t, g, unknown or other
<400> 14
gagcggacag cagcttccta tatctcgtac nnnnnnnn 38
<210> 15
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (31)..(38)
<223> a, c, t, g, unknown or other
<400> 15
ccatgatata gacgttgtgg ctgttgtagt nnnnnnnn 38
<210> 16
<211> 1090
<212> PRT
<213> Rhizobium sp.
<220>
<221> source
<223> /note="APG03128"
<400> 16
Met Asn Asn Leu Leu Tyr Ser Phe Asp Ile Gly Thr Asn Ser Ile Gly
1 5 10 15
Trp Cys Val Phe Ala Leu Asp Glu Val Gly Asp Pro Cys Arg Ile Val
20 25 30
Asp Leu Gly Ala Arg Ile Tyr Ala Asp Gly Arg Asp Pro Gln Thr Lys
35 40 45
Thr Ser Leu Ala Val Ala Arg Arg Glu Ala Arg Ala Met Ser Arg Arg
50 55 60
Arg Asp Arg Ser Leu Arg Arg Arg Lys Ala Thr Leu Arg Thr Met Ile
65 70 75 80
Glu Tyr Gly Leu Met Pro Ala His Lys Val Glu Gln Glu Thr Leu Leu
85 90 95
Arg Lys Thr Gly Asp Arg Glu Gly Gly Asp Glu Gly Phe Asn Pro Tyr
100 105 110
Ala Leu Arg Ala Arg Ala Leu Gly Glu Lys Leu Pro Pro Phe Tyr Ile
115 120 125
Gly Arg Ala Leu Phe His Leu Gly Gln Arg Arg Gly Phe Lys Ser Asn
130 135 140
Arg Lys Thr Asp Arg Lys Asp Asn Asp Lys Gly Lys Ile Ala Leu Gly
145 150 155 160
Ile Asp Glu Leu Arg Ala Ala Met His Arg Ser Gly Ser Pro Thr Leu
165 170 175
Gly Ala Trp Leu Ala Met Arg Arg Ala Asp Gly His Pro Val Arg Leu
180 185 190
Arg Ala Gly Ser Glu Val Phe Asp Ala Glu Gly Tyr Ala Phe Tyr Pro
195 200 205
Glu Arg Ser Leu Leu Glu Asp Glu Phe Arg Gln Ile Trp Thr Ala Gln
210 215 220
Ala Val His His Pro Gln Leu Leu Thr Ser Glu Arg Arg Ala His Leu
225 230 235 240
Phe Arg Val Met Phe Tyr Gln Arg Pro Leu Lys Lys Pro Leu Val Gly
245 250 255
Arg Cys Ser Phe Asn Pro Ala Glu Ala Arg Leu Ser Arg Ala His Pro
260 265 270
Leu Phe Gln Glu Phe Arg Leu Tyr Lys Glu Val Asn Asp Leu Glu Val
275 280 285
Val Leu Pro Asp Gln Ser His Arg Lys Leu Thr Leu Asp Glu Arg Asn
290 295 300
Ala Leu Val Ala Lys Leu Lys Ser Ser Arg Lys Ala Ser Phe Ser Val
305 310 315 320
Leu Arg Arg Thr Leu Lys Leu Thr Pro Asp Leu Ala Phe Asn Lys Glu
325 330 335
Ser Glu Ala Arg Lys Asp Leu Leu Gly Asp Glu Ile Asn Ser Ala Leu
340 345 350
Ala Asp Ala Lys Met Phe Gly Val Arg Trp Gly Gly Phe Pro Arg Ala
355 360 365
Arg Gln Trp Glu Ile Ile Thr His Leu Lys Glu Glu Glu Asn Pro Ala
370 375 380
Arg Leu Ser Asp Trp Leu Lys Ser Glu Phe Gly Leu Asp Asp Glu Arg
385 390 395 400
Val Val Ala Ile Ala Asn Ile Ala Leu Pro Glu Gly Tyr Gly Arg Leu
405 410 415
Gly Glu Thr Ala Leu Ala Ser Met Leu Glu Glu Met Lys Thr Ala Val
420 425 430
Ile Pro Glu Ser Glu Ala Ala Lys Arg Cys Gly Tyr Asp His Ser Asn
435 440 445
Leu Ala Lys Glu Gln Asp Glu Gly Leu Asp Ile Leu Pro Glu Tyr Gln
450 455 460
Glu Ile Leu Glu Arg His Ile Pro Pro Gly Thr Gly Asp Pro Asp Asp
465 470 475 480
Ile Tyr Asp Ile Arg Lys Gly Arg Ile Thr Asn Pro Thr Val His Ile
485 490 495
Gly Leu Asn Gln Leu Arg Arg Val Val Asn Ala Leu Ile Lys Arg His
500 505 510
Gly Lys Pro Arg His Ile Val Val Glu Leu Ala Arg Asp Leu Gln Leu
515 520 525
Ser Glu Lys Gln Lys Ala Asp Val Asn Arg Arg Ile Ala Lys Asn Thr
530 535 540
Arg Glu Ala Glu Gly Arg Ser Gln Lys Leu Ile Glu Met Gly Gln Leu
545 550 555 560
Asp Thr Gly Tyr Asn Arg Leu Leu Leu Lys Leu Trp Glu Glu Leu Asn
565 570 575
Gln Asp Lys Pro Glu Asp Arg Val Cys Ile Tyr Ser Gly Lys Pro Ile
580 585 590
Gly Ile Ala Met Leu Phe Ser Gly Glu Val Asp Ile Asp His Ile Leu
595 600 605
Pro Trp Ser Lys Thr Leu Asp Asp Ser Gln Ala Asn Lys Leu Leu Cys
610 615 620
Leu Lys Ser Ala Asn Arg Gln Lys Arg Asn Arg Thr Pro Ser Asp Val
625 630 635 640
Pro Glu Trp Arg Asp Cys Tyr Glu Glu Val Leu Ala Arg Ala Ala Arg
645 650 655
Leu Pro Lys Asn Lys Arg Trp Arg Phe Ala Ala Asp Ala Met Gln Gln
660 665 670
Phe Glu Ala Glu Gly Gly Phe Leu Ala Arg Gln Leu Thr Asp Thr Gln
675 680 685
Tyr Leu Ser Arg Met Ala Phe Glu Tyr Leu Ser Ala Leu Phe Pro Ser
690 695 700
Glu Glu Ala Asp Lys Trp Gly Glu Leu Arg Gln Arg Lys Arg Val His
705 710 715 720
Val Val Pro Gly Arg Leu Thr Glu Leu Leu Arg Arg Asn Trp Gly Leu
725 730 735
Asn Thr Leu Leu Pro Asp His Asn Leu Gly Glu Met Ala Gln Glu Lys
740 745 750
Asn Arg Lys Asp His Arg His His Ala Ile Asp Ala Ala Val Ile Gly
755 760 765
Val Thr Ser Arg Ser Leu Leu Gln Arg Met Ser Gly Ala Ala Ala Arg
770 775 780
Leu Asp Asp Val Ala Phe Asp Asp Leu Val Arg Thr Val Val Lys Asp
785 790 795 800
Asn Pro Pro Trp Pro Gly Phe Arg Glu Glu Leu Leu Gly Cys Ile Asn
805 810 815
Arg Val Thr Val Ser His Lys Pro Asp His Gly Thr Val Ser Arg Ala
820 825 830
Ala Tyr Ala Gln Gly Lys Gly Gln Thr Ala Gly Lys Leu His Asn Asp
835 840 845
Thr Ala Tyr Gly Ile Thr Gly Leu Gln Asp Met Lys Gly Ser Pro Leu
850 855 860
Val Val Arg Arg Lys Pro Phe Met Ala Leu Glu Val Lys Asp Ile Ala
865 870 875 880
Ser Ile Arg Asp Thr Glu Leu Gln Ser Ala Leu Tyr Asp Ala Ile Gly
885 890 895
Ser Leu Thr Glu Lys Lys Ala Leu Gln Glu Ala Leu Val Arg Phe Arg
900 905 910
Asp Arg His Pro Gln Phe Lys Gly Ile Arg Arg Val Arg Val Leu Glu
915 920 925
Ala Leu Ser Val Ile Pro Ile Val Asp Asn Asn Gly Lys Ala Tyr Lys
930 935 940
Gly Tyr Lys Gly Asp Ala Asn Tyr Arg Tyr Glu Val Trp Glu Thr Leu
945 950 955 960
Asp Gly Arg Trp His Thr Glu Val Val Ser Met Phe Asp Ala His Gln
965 970 975
Pro Gly Trp Gln Ser Pro Phe His Arg Gln His Pro Ala Ala Arg Arg
980 985 990
Val Leu Lys Leu Gln Gln Asn Asp Met Val Ala Tyr Glu His Pro Ala
995 1000 1005
Asp Gly Tyr Thr Ile Ala Arg Val Val Lys Phe Ser Asn Asp Lys
1010 1015 1020
Arg Ile Tyr Phe Ala Ser His Arg Glu Ser Gly Ser Leu Lys Ala
1025 1030 1035
Arg Asp Ala Asp Lys Gly Asp Pro Phe Thr Tyr Phe Ala Lys Ala
1040 1045 1050
Asn Asn Gly Leu Arg Asp Ile Lys Cys Arg Gln Val Arg Ile Asp
1055 1060 1065
Ala Ala Gly Arg Val Phe Asp Pro Gly Pro Gln Asp Arg Glu Ala
1070 1075 1080
Arg Gln Ser Lys Gly Arg Ala
1085 1090
<210> 17
<211> 31
<212> RNA
<213> Rhizobium sp.
<220>
<221> source
<223> /note="crRNA"
<400> 17
gguugcggcu ggaccgcguu uucugaucug c 31
<210> 18
<211> 79
<212> RNA
<213> Rhizobium sp.
<220>
<221> source
<223> /note="tracrRNA"
<400> 18
gcaaaucaga aaacgcgguc uggccguuaa caagccucga ccagcaccag auaaggcggu 60
cccuccgggg gccguuuuu 79
<210> 19
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(25)
<223> a, c, u, g, unknown or other
<400> 19
nnnnnnnnnn nnnnnnnnnn nnnnngguug cggcuggacc gcguuuucug aucugcaaag 60
gcaaaucaga aaacgcgguc uggccguuaa caagccucga ccagcaccag auaaggcggu 120
cccuccgggg gccguuuuu 139
<210> 20
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 20
gagcggacag cagcuuccua uaucucguac gguugcggcu ggaccgcguu uucugaucug 60
caaaggcaaa ucagaaaacg cggucuggcc guuaacaagc cucgaccagc accagauaag 120
gcggucccuc cgggggccgu uuuu 144
<210> 21
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 21
ccaugauaua gacguugugg cuguuguagu gguugcggcu ggaccgcguu uucugaucug 60
caaaggcaaa ucagaaaacg cggucuggcc guuaacaagc cucgaccagc accagauaag 120
gcggucccuc cgggggccgu uuuu 144
<210> 22
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (5)..(6)
<223> a, c, t, g, unknown or other
<400> 22
nnggnnc 7
<210> 23
<211> 6
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (2)..(2)
<223> a, c, u, g, unknown or other
<220>
<221> modified_base
<222> (4)..(5)
<223> a, c, u, g, unknown or other
<400> 23
angnnu 6
<210> 24
<211> 1108
<212> PRT
<213> Brevibacillus sp.
<220>
<221> source
<223> /note="APG09748"
<400> 24
Met Ala Ile Arg Ser Ile Lys Leu Lys Leu Lys Thr Arg Thr Gly Pro
1 5 10 15
Glu Ala Gln Asn Leu Arg Lys Gly Ile Trp Arg Thr His Arg Leu Leu
20 25 30
Asn Glu Gly Val Ala Tyr Tyr Met Lys Met Leu Leu Leu Phe Arg Gln
35 40 45
Glu Ser Thr Gly Gly Gln Thr Lys Lys Glu Leu Gln Glu Glu Leu Val
50 55 60
Arg His Ile Arg Glu Gln Gln Gln Lys Asn Arg Ala Asp Lys Asn Thr
65 70 75 80
Gln Ala Leu Pro Leu Asp Lys Ala Phe Ala Ala Leu Arg Gln Leu Tyr
85 90 95
Glu Leu Leu Val Pro Ser Ser Ile Gly Gln Ser Gly Asp Ala Gln Ile
100 105 110
Ile Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly
115 120 125
Gly Lys Gly Thr Ser Lys Ala Gly Ala Lys Pro Thr Trp Gln Lys Lys
130 135 140
Lys Glu Ala Asn Asp Pro Thr Trp Glu Gln Asp Tyr Glu Lys Trp Lys
145 150 155 160
Lys Arg Arg Glu Glu Asp Pro Thr Ala Ser Val Ile Thr Thr Leu Glu
165 170 175
Glu Tyr Gly Ile Arg Pro Ile Phe Pro Leu Tyr Thr Asn Thr Val Ala
180 185 190
Asp Ile Ala Trp Leu Pro Leu Gln Ser Asn Gln Phe Val Arg Thr Trp
195 200 205
Asp Arg Asp Met Leu Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220
Ser Trp Asn Lys Arg Val Gln Glu Glu Tyr Ser Lys Leu Gln Glu Lys
225 230 235 240
Met Thr Gln Leu Asn Glu Gln Leu Glu Gly Gly Gln Glu Trp Ile Ser
245 250 255
Leu Leu Glu Gln Tyr Glu Glu Gln Arg Glu Gln Glu Leu Ile Glu Asn
260 265 270
Met Thr Ala Ala Asn Asp Lys Tyr Arg Ile Thr Lys Arg Gln Met Lys
275 280 285
Gly Trp Asn Glu Leu Tyr Glu Gln Trp Ser Thr Val Leu Pro Asn Ala
290 295 300
Ser His Glu Gln Tyr Arg Glu Ala Leu Lys Arg Val Gln Gln Arg Leu
305 310 315 320
Arg Gly Arg Phe Gly Asp Ala His Phe Phe Gln Tyr Leu Met Lys Glu
325 330 335
Glu His His Leu Ile Trp Lys Gly Asn Pro Gln Arg Ile His Tyr Phe
340 345 350
Val Ala Arg Asn Glu Leu Lys Lys Arg Leu Glu Glu Ala Lys Gln Asn
355 360 365
Ala Thr Met Thr Leu Pro Asp Ala Arg Lys His Pro Leu Trp Val Arg
370 375 380
Phe Asp Ala Arg Gly Gly Asn Leu Gln Asp Tyr Tyr Leu Thr Ala Glu
385 390 395 400
Ala Asp Asn Pro Arg Ser Arg Arg Phe Val Thr Phe Ser Gln Leu Ile
405 410 415
Trp Pro Asn Glu Ser Gly Trp Met Glu Lys Gln Asp Val Glu Val Glu
420 425 430
Leu Ala Leu Ser Lys Gln Phe Tyr Gln Gln Val Thr Leu Gln Lys Asn
435 440 445
Asp Lys Gly Lys Gln Glu Ile Glu Phe Lys Asp Lys Gly Ser Gly Ser
450 455 460
Thr Phe Ser Gly His Leu Gly Gly Ala Lys Leu Gln Leu Glu Arg Gly
465 470 475 480
Asp Leu Glu Lys Glu Glu Lys Asp Phe Glu Gly Gly Glu Ile Gly Ser
485 490 495
Val Tyr Leu Asn Ile Val Ile Asp Phe Glu Pro Leu Gln Glu Val Lys
500 505 510
Asn Gly Arg Leu Gln Ser Pro Tyr Gly Gln Val Leu Gln Leu Val Arg
515 520 525
Arg Pro Asn Glu Phe Pro Lys Val Thr Thr Tyr Lys Ser Glu Glu Leu
530 535 540
Val Glu Trp Ile Lys Ser Ser Thr Lys Asp Ser Ala Gly Val Glu Ser
545 550 555 560
Leu Glu Ser Gly Phe Arg Val Met Ser Ile Asp Leu Gly Leu Arg Thr
565 570 575
Ala Ala Ala Thr Ser Ile Phe Ser Val Glu Glu Ser Asn Asp Ala Asn
580 585 590
Ala Ala Gly Phe Ser Tyr Trp Ile Glu Gly Thr Pro Leu Val Ala Val
595 600 605
His Lys Arg Ser Tyr Met Leu Lys Leu Pro Gly Glu Gln Val Glu Lys
610 615 620
Gln Val Arg Glu Lys Arg Asp Glu Arg Gln Asp Gln Gln Arg Arg Val
625 630 635 640
Arg Phe Gln Ile Arg Ile Leu Ser Gln Val Ile Arg Met Ala Lys Lys
645 650 655
Gln Asn Arg Glu Arg Ala Asp Glu Leu Asp His Leu Ser Gln Ala Leu
660 665 670
Glu Lys Gln Lys Ser Leu Leu Asp Gln Thr Asp Arg Thr Phe Trp Asn
675 680 685
Gly Ile Val Cys Asp Leu Thr Asp Ala Leu Arg Glu Lys Glu Gly Gly
690 695 700
Trp Glu Gln Ala Val Val Gln Ile His Arg Lys Ala Glu Glu His Val
705 710 715 720
Gly Lys Val Val Gln Ala Trp Arg Lys Arg Phe Asp Ala Asp Glu Arg
725 730 735
Lys Gly Ile Ala Gly Leu Ser Met Trp Ser Ile Glu Glu Leu Asp Ser
740 745 750
Leu Arg Lys Leu Leu Ile Ser Trp Ser Arg Arg Thr Arg Asn Pro Arg
755 760 765
Glu Ile Asn Cys Phe Glu Gln Gly His Thr Ser His Gln Arg Leu Leu
770 775 780
Thr His Ile Gln Asn Val Lys Glu Asp Arg Leu Lys Gln Leu Ser His
785 790 795 800
Ala Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Glu Lys Lys Leu
805 810 815
Glu Trp Phe Ala Lys Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asn
820 825 830
Leu Ser Gln Tyr Arg Ser Asn Met Asp Arg Ser Thr Lys Glu Asn Ser
835 840 845
Thr Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val His Met
850 855 860
Gln Ala Glu Pro Tyr Gly Ile Gln Ile Gly Asp Val Arg Ala Glu Tyr
865 870 875 880
Ser Ser Arg Phe His Ala Lys Thr Gly Thr Pro Gly Ile Arg Cys Lys
885 890 895
Met Val Ser Gly His Asp Leu Gln Gly Arg Arg Phe Glu Asn Leu Gln
900 905 910
Lys Arg Leu Ile Ser Glu Gln Phe Leu Thr Glu Glu Gln Val Lys Gln
915 920 925
Leu Arg Pro Gly Asp Ile Val Pro Asp Asp Ser Gly Glu Trp Phe Met
930 935 940
Thr Leu Ser Asp Gly Ser Glu Gly Lys Glu Val Val Phe Leu Gln Ala
945 950 955 960
Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln Arg Tyr
965 970 975
Asn Glu Leu Phe Lys Val Ser Cys Arg Val Leu Ile Arg Gly Glu Glu
980 985 990
Glu Tyr Leu Ile Pro Lys Thr Lys Ser Val Gln Ala Lys Leu Gly Lys
995 1000 1005
Gly Leu Phe Val Lys Lys Thr Asp Thr Val Met Lys Asp Val Tyr
1010 1015 1020
Val Trp Asp Ser Gln Ala Lys Leu Lys Gly Lys Thr Thr Phe Thr
1025 1030 1035
Glu Glu Ser Glu Ser Pro Glu Gln Leu Glu Asp Phe Gln Glu Ile
1040 1045 1050
Ile Glu Glu Ala Glu Glu Ala Lys Gly Thr Tyr Arg Thr Leu Phe
1055 1060 1065
Arg Asp Pro Ser Gly Val Phe Phe Pro Glu Phe Val Trp Ser Thr
1070 1075 1080
Gln Lys Asp Phe Trp Ser Glu Val Lys Arg Arg Leu Tyr Gly Lys
1085 1090 1095
Leu Arg Glu Arg Phe Leu Met Lys Thr Arg
1100 1105
<210> 25
<211> 22
<212> RNA
<213> Brevibacillus sp.
<220>
<221> source
<223> /note="crRNA"
<400> 25
uggaaagcuu cgagguuagc ac 22
<210> 26
<211> 95
<212> RNA
<213> Brevibacillus sp.
<220>
<221> source
<223> /note="tracrRNA"
<400> 26
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaagu 95
<210> 27
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (132)..(151)
<223> a, c, u, g, unknown or other
<400> 27
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cnnnnnnnnn nnnnnnnnnn n 151
<210> 28
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 28
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacguacg 120
agauauagga agcugcuguc cgcuc 145
<210> 29
<211> 145
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 29
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacacuac 120
aacagccaca acgucuauau caugg 145
<210> 30
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (4)..(4)
<223> a, c, t, g, unknown or other
<400> 30
dttn 4
<210> 31
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 31
aaaa 4
<210> 32
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(8)
<223> a, c, t, g, unknown or other
<400> 32
nnnnnnnngt acgagatata ggaagctgct gtccgctc 38
<210> 33
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(8)
<223> a, c, t, g, unknown or other
<400> 33
nnnnnnnnac tacaacagcc acaacgtcta tatcatg 37
<210> 34
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (4)..(4)
<223> a, c, t, g, unknown or other
<400> 34
dttn 4
<210> 35
<211> 1429
<212> PRT
<213> Chryseobacterium sp.
<220>
<221> source
<223> /note="APG00771"
<400> 35
Met Thr Lys Asn Ile Leu Gly Leu Asp Leu Gly Thr Asn Ser Ile Gly
1 5 10 15
Trp Ala Leu Ile Lys Gln Asp Phe Glu Asn Lys Gln Gly Glu Ile Leu
20 25 30
Gly Met Gly Ser Arg Ile Ile Pro Met Asp Ala Gly Asp Met Gly Lys
35 40 45
Phe Ala Glu Gly Ala Thr Val Ser Lys Thr Ala Asp Arg Thr Lys Tyr
50 55 60
Arg Ser Val Arg Arg Leu Arg Glu Arg Phe Leu Leu Arg Arg Glu Arg
65 70 75 80
Leu His Arg Val Leu His Leu Leu Asn Phe Leu Pro Gln His Tyr Ala
85 90 95
Ser Gln Ile Asp Phe Glu Lys Arg Phe Gly Lys Phe Lys Val Glu Thr
100 105 110
Glu Pro Lys Leu Ala Trp Lys Asn Ile Glu Gly Lys Phe Ser Phe Leu
115 120 125
Phe Gln Asn Ser Phe Asn Glu Met Leu Glu Asp Phe Lys Ala Asn Glu
130 135 140
Gln Asp Leu Lys Ile Pro Tyr Asp Trp Thr Ile Tyr Phe Leu Arg Lys
145 150 155 160
Lys Ala Leu Ser Gln Lys Ile Glu Lys Glu Glu Leu Ala Trp Ile Leu
165 170 175
Leu Asn Phe Asn Gln Lys Arg Gly Tyr Tyr Gln Leu Arg Gly Glu Glu
180 185 190
Glu Glu Glu Asn Pro Asn Lys Leu Val Glu Phe Tyr Ser Leu Lys Val
195 200 205
Val Asp Val Leu Ala Asp Glu Pro Gln Lys Gly Lys Ser Glu Ile Trp
210 215 220
Tyr Ser Leu Val Leu Lys Asn Gly Trp Ile Tyr Arg Arg Ala Ser Lys
225 230 235 240
Ile Pro Leu Phe Glu Trp Lys Asp Lys Thr Arg Asp Phe Ile Val Thr
245 250 255
Thr Asp Leu Asn Asp Asp Gly Ser Ile Lys Lys Asp Lys Asp Gly Asn
260 265 270
Glu Lys Arg Ser Phe Arg Ala Pro Gly Glu Asn Asp Trp Thr Leu Val
275 280 285
Lys Lys Lys Thr Glu Gln Glu Ile Glu Gln Ser His Lys Thr Val Gly
290 295 300
Thr Tyr Ile Tyr Glu Thr Leu Leu Leu Asn Pro Lys Gln Lys Ile Lys
305 310 315 320
Gly Lys Leu Val Arg Thr Ile Glu Arg Lys Phe Tyr Lys Asp Glu Leu
325 330 335
Lys Gln Ile Leu Glu Lys Gln Lys Glu Phe His Gln Glu Leu Gln Asn
340 345 350
Asp Asp Leu Tyr Asn Asp Cys Ile Arg Glu Leu Tyr Arg Asn Asn Glu
355 360 365
Ala His Gln Leu Thr Leu Ser Lys Lys Asp Phe Val His Leu Leu Met
370 375 380
Asp Asp Leu Ile Phe Tyr Gln Arg Pro Leu Arg Ser Gln Lys Ser Ser
385 390 395 400
Ile Ser Asn Cys Thr Leu Glu Phe Arg Lys Tyr Lys Asp Glu Asn Gly
405 410 415
Ile Glu His Thr Gln Tyr Leu Lys Ala Ile Pro Lys Ser Asn Pro Tyr
420 425 430
Tyr Gln Glu Phe Arg Leu Trp Gln Trp Ile Tyr Asn Leu Asn Ile Tyr
435 440 445
Arg Lys Asp Asp Glu Val Asn Val Thr Lys Asp Phe Leu Asn Thr Thr
450 455 460
Lys Glu Phe Glu Asn Leu Phe Glu Phe Leu Asn Ser Arg Lys Glu Val
465 470 475 480
Asp Gln Lys Ala Leu Leu Lys Tyr Phe Lys Leu Asn Glu Lys Thr His
485 490 495
Arg Trp Asn Phe Val Glu Asp Lys Lys Tyr Pro Cys Asn Glu Thr Lys
500 505 510
Thr Met Ile Ser Ser Arg Leu Asp Lys Val Glu Asn Ile Ser Asp Asp
515 520 525
Phe Leu Thr Arg Asn Ile Glu Gln Lys Ile Trp His Ile Ile Tyr Ser
530 535 540
Val Asn Asp Lys Ile Glu Tyr Glu Lys Ala Leu Lys Ser Phe Ala Arg
545 550 555 560
Lys His His Leu Asp Glu Thr Ser Phe Phe Glu Ala Phe Arg Lys Phe
565 570 575
Pro Pro Phe Lys Ser Glu Tyr Gly Ser Phe Ser Glu Lys Ala Ile Lys
580 585 590
Lys Leu Leu Pro Leu Met Arg Leu Gly Lys Tyr Trp Asn Tyr Ala Asp
595 600 605
Ile Asp Lys Tyr Ser Arg Glu Arg Ile Gln Lys Ile Ile Thr Gly Glu
610 615 620
Tyr Asp Glu Asn Ile Lys Asp Lys Ile Arg Glu Lys Ala Ile His Leu
625 630 635 640
Thr Lys Glu Asn Asp Phe Gln Gly Leu Gln Leu Trp Leu Ala Gln Tyr
645 650 655
Leu Val Tyr Gly Arg His Ser Glu Ala Ser Met Ile Gly Lys Trp Asn
660 665 670
Ser Ala Asp Asp Leu Glu Val Phe Leu Lys Asp Phe Lys Gln His Ser
675 680 685
Leu Arg Asn Pro Ile Val Glu Gln Val Ile Thr Glu Thr Leu Arg Val
690 695 700
Val Lys Asp Ile Trp Leu Lys Tyr Gly Asn Gly Thr Lys Asp Phe Phe
705 710 715 720
Asn Glu Ile His Ile Glu Leu Gly Arg Glu Met Lys Leu Pro Ala Asp
725 730 735
Asp Arg Lys Lys Leu Thr Ser Gln Ile Ser Glu Asn Glu Asn Thr Asn
740 745 750
Leu Arg Ile Lys Ala Leu Leu Ala Glu Met Ile Asn Asp His Ser Val
755 760 765
Glu Asn Val Arg Pro Phe Ser Pro Met Gln Gln Glu Ile Leu Lys Ile
770 775 780
Tyr Glu Asp Gly Val Leu Asn Ser Asp Ile Glu Ile Glu Asp Asp Ile
785 790 795 800
Leu Lys Ile Ser Lys Thr Ala Gln Pro Ser Pro Ser Asp Leu Lys Arg
805 810 815
Tyr Lys Leu Trp Leu Glu Gln Lys Tyr Lys Ser Pro Tyr Thr Gly Gln
820 825 830
Ile Ile Pro Leu Asn Lys Leu Phe Thr Pro Glu Tyr Glu Ile Glu His
835 840 845
Ile Ile Pro Gln Ser Arg Tyr Phe Asp Asp Ser Phe Ser Asn Lys Val
850 855 860
Ile Cys Glu Ser Ala Val Asn Lys Leu Lys Asp Asn Tyr Ile Gly Leu
865 870 875 880
Glu Phe Ile Lys Lys Leu Gly Gly Thr Val Val Glu Cys Gly Asn Gly
885 890 895
Lys Ser Val Thr Val Leu Lys Glu Asp Gln Tyr Glu Asp Phe Val Lys
900 905 910
Lys His Tyr Ala Asn Asn Arg Gly Lys Arg Asn Lys Leu Leu Met Glu
915 920 925
Asp Ile Pro Glu Lys Met Ile Glu Arg Gln Leu Asn Asp Thr Arg Tyr
930 935 940
Ile Ser Lys Tyr Ile Ser Gly Val Leu Ser Asn Ile Val Arg Val Glu
945 950 955 960
Asp Gly Ser Asp Glu Gly Ile Asn Ser Lys Asn Ile Val Pro Gly Asn
965 970 975
Gly Lys Ile Thr Ser Gln Leu Lys Gln Asp Trp Gly Leu Asn Asp Val
980 985 990
Trp Asn Asp Leu Ile Leu Pro Arg Phe Glu Arg Met Asn Gln Leu Thr
995 1000 1005
Asn Ser Thr Asp Phe Thr Ala Trp Asn Glu Asn Tyr Gln Lys Phe
1010 1015 1020
Leu Pro Thr Val Pro Ile Glu Tyr Ser Lys Gly Phe Ser Lys Lys
1025 1030 1035
Arg Ile Asp His Arg His His Ala Leu Asp Ala Leu Val Ile Ala
1040 1045 1050
Cys Ala Thr Lys Asp His Val Asn Leu Leu Asn Asn Gln Ser Ala
1055 1060 1065
Lys Ser Asp Thr Lys Arg Tyr Asp Leu Lys Lys Lys Leu Met Lys
1070 1075 1080
Phe Glu Lys Val Val Tyr His His Thr Gln Thr Gly Glu Lys Ile
1085 1090 1095
Glu Arg Glu Ile Pro Arg Gln Phe Leu Lys Pro Trp Glu Asn Phe
1100 1105 1110
Thr Val Asp Ala Lys His Asn Leu Glu Ser Ile Ile Val Ser Phe
1115 1120 1125
Lys Gln Asn Leu Arg Val Ile Asn Lys Ala Thr Asn Tyr Tyr Glu
1130 1135 1140
Lys Tyr Val Glu Lys Asp Gly Thr Lys Asn Lys Glu Arg Val Glu
1145 1150 1155
Gln Thr Gly Thr Asn Trp Ala Ile Arg Lys Pro Met His Lys Asp
1160 1165 1170
Thr Val Ser Gly Lys Val Asp Leu Pro Trp Val Lys Val Pro Lys
1175 1180 1185
Gly Lys Ile Leu Thr Ala Thr Arg Lys Ser Leu Asp Thr Ser Phe
1190 1195 1200
Asp Leu Lys Ser Ile Gly Ser Ile Thr Asp Thr Gly Ile Gln Lys
1205 1210 1215
Ile Leu Lys Asn Tyr Leu Ala Phe Lys Asp Gly Asn Pro Glu Met
1220 1225 1230
Ala Phe Ser Pro Glu Gly Ile Asp Asp Leu Asn Lys Asn Ile Glu
1235 1240 1245
Lys Tyr Asn Asp Gly Lys Pro His Gln Pro Ile Asn Lys Val Arg
1250 1255 1260
Val Phe Glu Leu Gly Ser Lys Phe Gln Val Gly Gln Thr Gly Asn
1265 1270 1275
Lys Lys Asp Lys Tyr Val Glu Ala Ala Lys Gly Thr Asn Leu Phe
1280 1285 1290
Phe Ala Val Tyr Glu Asp Glu Lys Gly Lys Arg Ser Tyr Glu Thr
1295 1300 1305
Ile Pro Leu Asn Glu Val Ile Glu Arg Gln Lys Gln Gly Leu Ser
1310 1315 1320
Val Val Asp Leu Lys Asp Thr Asn Asp Phe Tyr Leu Cys Pro Asn
1325 1330 1335
Asp Leu Val Tyr Ile Pro Ser Gly Asp Glu Leu Glu Asn Val Asn
1340 1345 1350
Asn Val Asp Phe Lys Asp Ile Lys Lys Asp Lys Asn Glu Arg Ile
1355 1360 1365
Tyr Lys Val Val Ser Phe Ser Gly Ser Gln Ile Phe Phe Val Arg
1370 1375 1380
Gln Asp Ile Ala Thr Phe Ile Val Asn Lys Ala Glu Leu Ser Thr
1385 1390 1395
Leu Asn Lys Met Glu Arg Ala Ile Asp Gly Ser Met Ile Lys Glu
1400 1405 1410
Asn Cys Ile Lys Leu Asn Ile Asp Arg Leu Gly Asn Ile Ser Lys
1415 1420 1425
Ala
<210> 36
<211> 20
<212> RNA
<213> Chryseobacterium sp.
<220>
<221> source
<223> /note="crRNA"
<400> 36
guugugaauu gcuuucaaaa 20
<210> 37
<211> 76
<212> RNA
<213> Chryseobacterium sp.
<220>
<221> source
<223> /note="tracrRNA"
<400> 37
uuuugaaagc aauucacaau aaggauuauu ccguugugaa aacauucaag gcggggcaac 60
ucgccuuuuu ucguuu 76
<210> 38
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (1)..(25)
<223> a, c, u, g, unknown or other
<400> 38
nnnnnnnnnn nnnnnnnnnn nnnnnguugu gaauugcuuu caaaaaaagu uuugaaagca 60
auucacaaua aggauuauuc cguugugaaa acauucaagg cggggcaacu cgccuuuuuu 120
cguuu 125
<210> 39
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 39
gagcggacag cagcuuccua uaucucguac guugugaauu gcuuucaaaa aaaguuuuga 60
aagcaauuca caauaaggau uauuccguug ugaaaacauu caaggcgggg caacucgccu 120
uuuuucguuu 130
<210> 40
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 40
ccaugauaua gacguugugg cuguuguagu guugugaauu gcuuucaaaa aaaguuuuga 60
aagcaauuca caauaaggau uauuccguug ugaaaacauu caaggcgggg caacucgccu 120
uuuuucguuu 130
<210> 41
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (1)..(2)
<223> a, c, t, g, unknown or other
<400> 41
nnraat 6
<210> 42
<211> 6
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (2)..(2)
<223> a, c, u, g, unknown or other
<220>
<221> modified_base
<222> (4)..(5)
<223> a, c, u, g, unknown or other
<400> 42
unanna 6
<210> 43
<211> 1112
<212> PRT
<213> Bacillus sp.
<220>
<221> source
<223> /note="APG02789"
<400> 43
Met Ala Ile Arg Ser Ile Lys Leu Lys Met Lys Thr Asn Ser Gly Thr
1 5 10 15
Asp Ser Ile Tyr Leu Arg Lys Ala Leu Trp Arg Thr His Gln Leu Ile
20 25 30
Asn Glu Gly Ile Ala Tyr Tyr Met Asn Leu Leu Thr Leu Tyr Arg Gln
35 40 45
Glu Ala Ile Gly Asp Lys Thr Lys Glu Ala Tyr Gln Ala Glu Leu Ile
50 55 60
Asn Ile Ile Arg Asn Gln Gln Arg Asn Asn Gly Ser Ser Glu Glu His
65 70 75 80
Gly Ser Asp Gln Glu Ile Leu Ala Leu Leu Arg Gln Leu Tyr Glu Leu
85 90 95
Ile Ile Pro Ser Ser Ile Gly Glu Ser Gly Asp Ala Asn Gln Leu Gly
100 105 110
Asn Lys Phe Leu Tyr Pro Leu Val Asp Pro Asn Ser Gln Ser Gly Lys
115 120 125
Gly Thr Ser Asn Ala Gly Arg Lys Pro Arg Trp Lys Arg Leu Lys Glu
130 135 140
Glu Gly Asn Pro Asp Trp Glu Leu Glu Lys Lys Lys Asp Glu Glu Arg
145 150 155 160
Lys Ala Lys Asp Pro Thr Val Lys Ile Phe Asp Asn Leu Asn Lys Tyr
165 170 175
Gly Leu Leu Pro Leu Phe Pro Leu Phe Thr Asn Ile Gln Lys Asp Ile
180 185 190
Glu Trp Leu Pro Leu Gly Lys Arg Gln Ser Val Arg Lys Trp Asp Lys
195 200 205
Asp Met Phe Ile Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu Ser Trp
210 215 220
Asn Arg Arg Val Ala Asp Glu Tyr Lys Gln Leu Lys Glu Lys Thr Glu
225 230 235 240
Ser Tyr Tyr Lys Glu His Leu Thr Gly Gly Glu Glu Trp Ile Glu Lys
245 250 255
Ile Arg Lys Phe Glu Lys Glu Arg Asn Met Glu Leu Glu Lys Asn Ala
260 265 270
Phe Ala Pro Asn Asp Gly Tyr Phe Ile Thr Ser Arg Gln Ile Arg Gly
275 280 285
Trp Asp Arg Val Tyr Glu Lys Trp Ser Lys Leu Pro Glu Ser Ala Ser
290 295 300
Pro Glu Glu Leu Trp Lys Val Val Ala Glu Gln Gln Asn Lys Met Ser
305 310 315 320
Glu Gly Phe Gly Asp Pro Lys Val Phe Ser Phe Leu Ala Asn Arg Glu
325 330 335
Asn Arg Asp Ile Trp Arg Gly His Ser Glu Arg Ile Tyr His Ile Ala
340 345 350
Ala Tyr Asn Gly Leu Gln Lys Lys Leu Ser Arg Thr Lys Glu Gln Ala
355 360 365
Thr Phe Thr Leu Pro Asp Ala Ile Glu His Pro Leu Trp Ile Arg Tyr
370 375 380
Glu Ser Pro Gly Gly Thr Asn Leu Asn Leu Phe Lys Leu Glu Glu Lys
385 390 395 400
Gln Lys Lys Asn Tyr Tyr Val Thr Leu Ser Lys Ile Ile Trp Pro Ser
405 410 415
Glu Glu Lys Trp Ile Glu Lys Glu Asn Ile Glu Ile Pro Leu Ala Pro
420 425 430
Ser Ile Gln Phe Asn Arg Gln Ile Lys Leu Lys Gln His Val Lys Gly
435 440 445
Lys Gln Glu Ile Ser Phe Ser Asp Tyr Ser Ser Arg Ile Ser Leu Asp
450 455 460
Gly Val Leu Gly Gly Ser Arg Ile Gln Phe Asn Arg Lys Tyr Ile Lys
465 470 475 480
Asn His Lys Glu Leu Leu Gly Glu Gly Asp Ile Gly Pro Val Phe Phe
485 490 495
Asn Leu Val Val Asp Val Ala Pro Leu Gln Glu Thr Arg Asn Gly Arg
500 505 510
Leu Gln Ser Pro Ile Gly Lys Ala Leu Lys Val Ile Ser Ser Asp Phe
515 520 525
Ser Lys Val Ile Asp Tyr Lys Pro Lys Glu Leu Met Asp Trp Met Asn
530 535 540
Thr Gly Ser Ala Ser Asn Ser Phe Gly Val Ala Ser Leu Leu Glu Gly
545 550 555 560
Met Arg Val Met Ser Ile Asp Met Gly Gln Arg Thr Ser Ala Ser Val
565 570 575
Ser Ile Phe Glu Val Val Lys Glu Leu Pro Lys Asp Gln Glu Gln Lys
580 585 590
Leu Phe Tyr Ser Ile Asn Asp Thr Glu Leu Phe Ala Ile His Lys Arg
595 600 605
Ser Phe Leu Leu Asn Leu Pro Gly Glu Val Val Thr Lys Asn Asn Lys
610 615 620
Gln Gln Arg Gln Glu Arg Arg Lys Lys Arg Gln Phe Val Arg Ser Gln
625 630 635 640
Ile Arg Met Leu Ala Asn Val Leu Arg Leu Glu Thr Lys Lys Thr Pro
645 650 655
Asp Glu Arg Lys Lys Ala Ile His Lys Leu Met Glu Ile Val Gln Ser
660 665 670
Tyr Asp Ser Trp Thr Ala Ser Gln Lys Glu Val Trp Glu Lys Glu Leu
675 680 685
Asn Leu Leu Thr Asn Met Ala Ala Phe Asn Asp Glu Ile Trp Lys Glu
690 695 700
Ser Leu Val Glu Leu His His Arg Ile Glu Pro Tyr Val Gly Gln Ile
705 710 715 720
Val Ser Lys Trp Arg Lys Gly Leu Ser Glu Gly Arg Lys Asn Leu Ala
725 730 735
Gly Ile Ser Met Trp Asn Ile Asp Glu Leu Glu Asp Thr Arg Arg Leu
740 745 750
Leu Ile Ser Trp Ser Lys Arg Ser Arg Thr Pro Gly Glu Ala Asn Arg
755 760 765
Ile Glu Thr Asp Glu Pro Phe Gly Ser Ser Leu Leu Gln His Ile Gln
770 775 780
Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Ile Ile Met
785 790 795 800
Thr Ala Leu Gly Phe Lys Tyr Asp Lys Glu Glu Lys Asp Arg Tyr Lys
805 810 815
Arg Trp Lys Glu Thr Tyr Pro Ala Cys Gln Ile Ile Leu Phe Glu Asn
820 825 830
Leu Asn Arg Tyr Leu Phe Asn Leu Asp Arg Ser Arg Arg Glu Asn Ser
835 840 845
Arg Leu Met Lys Trp Ala His Arg Ser Ile Pro Arg Thr Val Ser Met
850 855 860
Gln Gly Glu Met Phe Gly Leu Gln Val Gly Asp Val Arg Ser Glu Tyr
865 870 875 880
Ser Ser Arg Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His
885 890 895
Ala Leu Thr Glu Glu Asp Leu Lys Ala Gly Ser Asn Thr Leu Lys Arg
900 905 910
Leu Ile Glu Asp Gly Phe Ile Asn Glu Ser Glu Leu Ala Tyr Leu Lys
915 920 925
Lys Gly Asp Ile Ile Pro Ser Gln Gly Gly Glu Leu Phe Val Thr Leu
930 935 940
Ser Lys Arg Tyr Lys Lys Asp Ser Asp Asn Asn Glu Leu Thr Val Ile
945 950 955 960
His Ala Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln
965 970 975
Gln Asn Ser Glu Val Tyr Arg Val Pro Cys Gln Leu Ala Arg Met Gly
980 985 990
Glu Asp Lys Leu Tyr Ile Pro Lys Ser Gln Thr Glu Thr Ile Lys Lys
995 1000 1005
Tyr Phe Gly Lys Gly Ser Phe Val Lys Asn Asn Thr Glu Gln Glu
1010 1015 1020
Val Tyr Lys Trp Glu Lys Ser Glu Lys Met Lys Ile Lys Thr Asp
1025 1030 1035
Thr Thr Phe Asp Leu Gln Asp Leu Asp Gly Phe Glu Asp Ile Ser
1040 1045 1050
Lys Thr Ile Glu Leu Ala Gln Glu Gln Gln Lys Lys Tyr Leu Thr
1055 1060 1065
Met Phe Arg Asp Pro Ser Gly Tyr Phe Phe Asn Asn Glu Thr Trp
1070 1075 1080
Arg Pro Gln Lys Glu Tyr Trp Ser Ile Val Asn Asn Ile Ile Lys
1085 1090 1095
Ser Cys Leu Lys Lys Lys Ile Leu Ser Asn Lys Val Glu Leu
1100 1105 1110
<210> 44
<211> 36
<212> RNA
<213> Bacillus sp.
<220>
<221> source
<223> /note="crRNA"
<400> 44
gccugaauac uuagcagaaa uaaugaugau uggcac 36
<210> 45
<211> 100
<212> RNA
<213> Bacillus sp.
<220>
<221> source
<223> /note="tracrRNA"
<400> 45
auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60
uacccaccac aggauuaucu uauuucugcu aaguguuuag 100
<210> 46
<211> 160
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (141)..(160)
<223> a, c, u, g, unknown or other
<400> 46
auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60
uacccaccac aggauuaucu uauuucugcu aaguguuuag aaaggccuga auacuuagca 120
gaaauaauga ugauuggcac nnnnnnnnnn nnnnnnnnnn 160
<210> 47
<211> 170
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 47
auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60
uacccaccac aggauuaucu uauuucugcu aaguguuuag aaaggccuga auacuuagca 120
gaaauaauga ugauuggcac guacgagaua uaggaagcug cuguccgcuc 170
<210> 48
<211> 170
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 48
auaauaaagg ugaccuauag ggucaaugaa ucugugcgug ugccauaagu aauuaaaaau 60
uacccaccac aggauuaucu uauuucugcu aaguguuuag aaaggccuga auacuuagca 120
gaaauaauga ugauuggcac acuacaacag ccacaacguc uauaucaugg 170
<210> 49
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<220>
<221> modified_base
<222> (4)..(4)
<223> a, c, t, g, unknown or other
<400> 49
attn 4
<210> 50
<211> 1108
<212> PRT
<213> Brevibacillus sp.
<220>
<221> source
<223> /note="APG09106"
<400> 50
Met Ala Ile Arg Ser Ile Lys Leu Lys Leu Lys Thr Arg Thr Gly Pro
1 5 10 15
Glu Ala Gln Asn Leu Arg Lys Gly Ile Trp Arg Thr His Arg Leu Leu
20 25 30
Asn Glu Gly Val Ala Tyr Tyr Met Lys Met Leu Leu Leu Phe Arg Gln
35 40 45
Glu Ser Thr Gly Gly Gln Thr Lys Lys Glu Leu Gln Glu Glu Leu Val
50 55 60
Arg His Ile Arg Glu Gln Gln Gln Lys Asn Arg Ala Asp Lys Asn Thr
65 70 75 80
Gln Ala Leu Pro Leu Asp Lys Ala Phe Ala Ala Leu Arg Gln Leu Tyr
85 90 95
Glu Leu Leu Val Pro Ser Ser Ile Gly Gln Ser Gly Asp Ala Gln Ile
100 105 110
Ile Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly
115 120 125
Gly Lys Gly Thr Ser Lys Ala Gly Ala Lys Pro Thr Trp Gln Lys Lys
130 135 140
Lys Glu Ala Asn Asp Pro Thr Trp Glu Gln Asp Tyr Glu Lys Trp Lys
145 150 155 160
Lys Arg Arg Glu Glu Asp Pro Thr Ala Ser Val Ile Thr Thr Leu Glu
165 170 175
Glu Tyr Gly Ile Arg Pro Ile Phe Pro Leu Tyr Thr Asn Thr Val Ala
180 185 190
Asp Ile Ala Trp Leu Pro Leu Gln Ser Asn Gln Phe Val Arg Thr Trp
195 200 205
Asp Arg Asp Met Leu Gln Gln Ala Ile Glu Arg Leu Leu Ser Trp Glu
210 215 220
Ser Trp Asn Lys Arg Val Gln Glu Glu Tyr Ser Lys Leu Gln Glu Lys
225 230 235 240
Met Thr Gln Leu Asn Glu Gln Leu Glu Gly Gly Gln Glu Trp Ile Ser
245 250 255
Leu Leu Glu Gln Tyr Glu Glu Gln Arg Glu Gln Glu Leu Ile Glu Asn
260 265 270
Met Thr Ala Ala Asn Asp Lys Tyr Arg Ile Thr Lys Arg Gln Met Lys
275 280 285
Gly Trp Asn Glu Leu Tyr Glu Gln Trp Ser Thr Val Leu Pro Asn Ala
290 295 300
Ser His Glu Gln Tyr Arg Glu Ala Leu Lys Arg Val Gln Gln Arg Leu
305 310 315 320
Arg Gly Arg Phe Gly Asp Ala His Phe Phe Gln Tyr Leu Met Lys Glu
325 330 335
Glu His His Leu Ile Trp Lys Gly Asn Pro Gln Arg Ile His Tyr Phe
340 345 350
Val Ala Arg Asn Glu Leu Lys Lys Arg Leu Glu Glu Ala Lys Gln Asn
355 360 365
Ala Thr Met Thr Leu Pro Asp Ala Arg Lys His Pro Leu Trp Val Arg
370 375 380
Phe Asp Ala Arg Gly Gly Asn Leu Gln Asp Tyr Tyr Leu Thr Ala Glu
385 390 395 400
Ala Asp Asn Pro Arg Ser Arg Arg Phe Val Thr Phe Ser Gln Leu Ile
405 410 415
Trp Pro Asn Glu Ser Gly Trp Met Glu Lys Gln Asp Val Glu Val Glu
420 425 430
Leu Ala Leu Ser Lys Gln Phe Tyr Gln Gln Val Thr Leu Gln Lys Asn
435 440 445
Asp Lys Gly Lys Gln Glu Ile Glu Phe Lys Asp Lys Gly Ser Gly Ser
450 455 460
Thr Phe Ser Gly His Leu Gly Gly Ala Lys Leu Gln Leu Glu Arg Gly
465 470 475 480
Asp Leu Glu Lys Glu Glu Lys Asp Phe Glu Gly Gly Glu Ile Gly Ser
485 490 495
Val Tyr Leu Asn Ile Val Ile Asp Phe Glu Pro Leu Gln Glu Val Lys
500 505 510
Asn Gly Arg Leu Gln Ser Pro Tyr Gly Gln Val Leu Gln Leu Val Arg
515 520 525
Arg Pro Asn Glu Phe Pro Lys Val Thr Thr Tyr Lys Ser Glu Glu Leu
530 535 540
Val Glu Trp Met Lys Ala Ser Gln Asn His Ser Ser Gly Val Glu Ser
545 550 555 560
Leu Glu Ser Gly Phe Arg Val Met Ser Ile Asp Leu Gly Leu Arg Thr
565 570 575
Ala Ala Ala Thr Ser Ile Phe Ser Val Glu Glu Ser Asn Asp Ala Asn
580 585 590
Ala Ala Gly Phe Ser Tyr Trp Ile Glu Gly Thr Pro Leu Val Ala Val
595 600 605
His Lys Arg Ser Tyr Met Leu Lys Leu Pro Gly Glu Gln Val Glu Lys
610 615 620
Gln Val Arg Glu Lys Arg Asp Glu Arg Gln Asp Gln Gln Arg Arg Val
625 630 635 640
Arg Phe Gln Ile Arg Ile Leu Ser Gln Val Ile Arg Met Ala Lys Lys
645 650 655
Gln Asn Arg Glu Arg Ala Asp Glu Leu Asp His Leu Ser Gln Ala Leu
660 665 670
Glu Lys Gln Lys Ser Leu Leu Asp Gln Thr Asp Arg Thr Phe Trp Asn
675 680 685
Gly Ile Val Cys Asp Leu Thr Asp Ala Leu Arg Glu Lys Glu Gly Gly
690 695 700
Trp Glu Gln Ala Val Val Gln Ile His Arg Lys Ala Glu Glu His Val
705 710 715 720
Gly Lys Val Val Gln Ala Trp Arg Lys Arg Phe Asp Ala Asp Glu Arg
725 730 735
Lys Gly Ile Ala Gly Leu Ser Met Trp Ser Ile Glu Glu Leu Asp Ser
740 745 750
Leu Arg Lys Leu Leu Ile Ser Trp Ser Arg Arg Thr Arg Asn Pro Gln
755 760 765
Glu Ile Asn Arg Phe Glu Gln Gly His Thr Ser His Gln Arg Leu Leu
770 775 780
Thr His Ile Gln Asn Val Lys Glu Asp Arg Leu Lys Gln Leu Ser His
785 790 795 800
Ala Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Glu Lys Lys Leu
805 810 815
Glu Trp Phe Ala Lys Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asn
820 825 830
Leu Ser Gln Tyr Arg Ser His Met Asp Arg Ser Thr Lys Glu Asn Ser
835 840 845
Thr Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val His Met
850 855 860
Gln Ala Glu Pro Tyr Gly Ile Gln Ile Gly Asp Val Arg Ala Glu Tyr
865 870 875 880
Ser Ser Arg Phe His Ala Lys Thr Gly Thr Pro Gly Ile Arg Cys Lys
885 890 895
Met Val Lys Gly Gln Glu Leu Gln Gly Lys Arg Phe Glu Asn Leu Gln
900 905 910
Lys Arg Leu Val Ser Glu Gln Phe Leu Thr Glu Glu Gln Val Lys Gln
915 920 925
Leu Arg Pro Gly Asp Ile Val Pro Asp Asp Ser Gly Glu Trp Phe Met
930 935 940
Thr Leu Ser Asp Gly Ser Glu Gly Lys Glu Val Val Phe Leu Gln Ala
945 950 955 960
Asp Ile Asn Ala Ala Gln Asn Leu Gln Lys Arg Phe Trp Gln Arg Tyr
965 970 975
Asn Glu Leu Phe Lys Val Ser Cys Arg Val Leu Ile Arg Gly Glu Glu
980 985 990
Glu Tyr Leu Ile Pro Lys Ala Lys Ser Val Gln Ala Lys Leu Gly Lys
995 1000 1005
Gly Leu Phe Val Lys Lys Thr Asp Thr Val Met Lys Asp Val Tyr
1010 1015 1020
Val Trp Asp Ser Gln Ala Lys Leu Lys Gly Lys Thr Thr Phe Thr
1025 1030 1035
Glu Glu Ser Glu Ser Pro Glu Gln Leu Glu Asp Phe Gln Glu Ile
1040 1045 1050
Ile Glu Glu Ala Glu Glu Ala Lys Gly Thr Tyr Arg Thr Leu Phe
1055 1060 1065
Arg Asp Pro Ser Gly Val Phe Phe Pro Glu Phe Val Trp Asn Thr
1070 1075 1080
Gln Lys Asp Phe Trp Ser Glu Val Lys Arg Arg Leu Tyr Gly Lys
1085 1090 1095
Leu Arg Glu Arg Phe Leu Met Lys Thr Arg
1100 1105
<210> 51
<211> 22
<212> RNA
<213> Brevibacillus sp.
<220>
<221> source
<223> /note="crRNA"
<400> 51
uggaaagcuu cgagguuagc ac 22
<210> 52
<211> 105
<212> RNA
<213> Brevibacillus sp.
<220>
<221> source
<223> /note="tracrRNA"
<400> 52
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugagu 105
<210> 53
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (132)..(151)
<223> a, c, u, g, unknown or other
<400> 53
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cnnnnnnnnn nnnnnnnnnn n 151
<210> 54
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 54
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cguacgagau auaggaagcu gcuguccgcu c 161
<210> 55
<211> 161
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 55
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cacuacaaca gccacaacgu cuauaucaug g 161
<210> 56
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 56
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcaccccgu 120
auaaagcaug agacc 135
<210> 57
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 57
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcaccucag 120
acuguuugcc ccuua 135
<210> 58
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 58
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca ccccguauaa agcaugagac cgugac 156
<210> 59
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 59
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca ccucagacug uuugccccuu acugcu 156
<210> 60
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 60
cccgtataaa gcatgagacc gtgac 25
<210> 61
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 61
ctcagactgt ttgcccctta ctgct 25
<210> 62
<211> 95
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 62
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaagu 95
<210> 63
<211> 16
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 63
gcuucguggc uagcac 16
<210> 64
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (116)..(135)
<223> a, c, u, g, unknown or other
<400> 64
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacnnnnn 120
nnnnnnnnnn nnnnn 135
<210> 65
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (116)..(135)
<223> a, c, u, g, unknown or other
<400> 65
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguaaaag cuucgagguu agcacnnnnn 120
nnnnnnnnnn nnnnn 135
<210> 66
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (125)..(144)
<223> a, c, u, g, unknown or other
<400> 66
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguuccaa aauggaaagc uucguggcua 120
gcacnnnnnn nnnnnnnnnn nnnn 144
<210> 67
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 67
gtacgagata taggaagctg ctgtccgctc 30
<210> 68
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 68
actacaacag ccacaacgtc tatatcatg 29
<210> 69
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 69
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cacuacaaca gccacaacg 149
<210> 70
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 70
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cguacgagau auaggaagcu g 151
<210> 71
<211> 151
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 71
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cacuacaaca gccacaacgu c 151
<210> 72
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 72
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cguacgagau auaggaagcu gcuguc 156
<210> 73
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 73
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguuccac ugaguaaagu ggaaagcuuc 120
gagguuagca cacuacaaca gccacaacgu cuauau 156
<210> 74
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 74
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagucac gaaguaaaag cuucgagguu agcacacuac 120
aacagccaca acgucuauau 140
<210> 75
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 75
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguuccaa aauggaaagc uucguggcua 120
gcacacuaca acagccacaa cgucuauau 149
<210> 76
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 76
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacacuac 120
aacagccaca acgucuauau 140
<210> 77
<211> 135
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 77
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacacuac 120
aacagccaca acguc 135
<210> 78
<211> 140
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 78
cgacgguuag aggccguaug ucgauuugcu uuaauuucgu gcgugugcau ugucguccuc 60
cauuacaggg cggcuaccac gaauagccac gaaguaaaag cuucguggcu agcacguacg 120
agauauagga agcugcuguc 140
<210> 79
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 79
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacgg cucagcaggc accugccuca g 111
<210> 80
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 80
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacuu cuccccuggg aagcaucccu g 111
<210> 81
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 81
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacuu cauggagaaa auauucagaa u 111
<210> 82
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 82
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacug uuuggaguua cuuagggcca ugc 113
<210> 83
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 83
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacga gaugucccca gugaacucca aau 113
<210> 84
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 84
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcaccc ugucguugcc ccucccagau cau 113
<210> 85
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 85
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacgg aggcugagac aggagaguug cuu 113
<210> 86
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 86
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacau agccccccuu gagcacacag agg 113
<210> 87
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 87
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacgu ucacacgugu aaucccagca cuu 113
<210> 88
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 88
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacuu guuggucugg augcgcugac uga 113
<210> 89
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 89
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacga ugucugggcc ucuguacuuu gga 113
<210> 90
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 90
gaccuauagg gucaaugaau cugugcgugu gccauaagua auuaaaaauu acccaccaca 60
ggagcaccug aaaacaggug cuuggcacgg ugugugcuga cccugaucuc ccu 113
<210> 91
<211> 25
<212> DNA
<213> Homo sapiens
<400> 91
acctctccag ggcgaactct gacac 25
<210> 92
<211> 25
<212> DNA
<213> Homo sapiens
<400> 92
tgtgtcagag ttcgccctgg agagg 25
<210> 93
<211> 25
<212> DNA
<213> Homo sapiens
<400> 93
gggaagtagg actgttggaa acggg 25
<210> 94
<211> 25
<212> DNA
<213> Homo sapiens
<400> 94
ccaacagtcc tacttccctg tttca 25
<210> 95
<211> 25
<212> DNA
<213> Homo sapiens
<400> 95
tctttggaca gtgtccatac tggtg 25
<210> 96
<211> 25
<212> DNA
<213> Homo sapiens
<400> 96
cgaggtgtgc tcaccagaat ggagt 25
<210> 97
<211> 25
<212> DNA
<213> Homo sapiens
<400> 97
tggtgagcac acctcgggac tgggc 25
<210> 98
<211> 25
<212> DNA
<213> Homo sapiens
<400> 98
tgaaagagtg atgcctccag gttgt 25
<210> 99
<211> 25
<212> DNA
<213> Homo sapiens
<400> 99
acccccgaat cgtgagtact gtcct 25
<210> 100
<211> 25
<212> DNA
<213> Homo sapiens
<400> 100
tgagaagggc caaggtattg tggca 25
<210> 101
<211> 25
<212> DNA
<213> Homo sapiens
<400> 101
ctgccacaat accttggccc ttctc 25
<210> 102
<211> 25
<212> DNA
<213> Homo sapiens
<400> 102
tctcagttcg ctgcgaccca tacac 25
<210> 103
<211> 25
<212> DNA
<213> Homo sapiens
<400> 103
ggtgtatggg tcgcagcgaa ctgag 25
<210> 104
<211> 25
<212> DNA
<213> Homo sapiens
<400> 104
gctgcgaccc atacacccaa aggat 25
<210> 105
<211> 25
<212> DNA
<213> Homo sapiens
<400> 105
ctctgcagat cactggggtg gatcc 25
<210> 106
<211> 25
<212> DNA
<213> Homo sapiens
<400> 106
gccgcgccct ctgcagatca ctggg 25
<210> 107
<211> 25
<212> DNA
<213> Homo sapiens
<400> 107
gctcctcacg cacctgctct ggttt 25
<210> 108
<211> 25
<212> DNA
<213> Homo sapiens
<400> 108
ataaggctgt gctgaccatc gacaa 25
<210> 109
<211> 25
<212> DNA
<213> Homo sapiens
<400> 109
aaggctgtgc tgaccatcga caaga 25
<210> 110
<211> 25
<212> DNA
<213> Homo sapiens
<400> 110
ttgtcgatgg tcagcacagc cttat 25
<210> 111
<211> 25
<212> DNA
<213> Homo sapiens
<400> 111
acctgccccg gtggctctgc tacac 25
<210> 112
<211> 25
<212> DNA
<213> Homo sapiens
<400> 112
ggctgcgctg ggtgtagcag agcca 25
<210> 113
<211> 25
<212> DNA
<213> Homo sapiens
<400> 113
tgccaatcgc gagcagcatc cagct 25
<210> 114
<211> 25
<212> DNA
<213> Homo sapiens
<400> 114
atgccggggg caccgatgct ggttt 25
<210> 115
<211> 25
<212> DNA
<213> Homo sapiens
<400> 115
ggtggctgag tggatggaga tgccg 25
<210> 116
<211> 25
<212> DNA
<213> Homo sapiens
<400> 116
ctccctctcc cagttaccat gaagt 25
<210> 117
<211> 25
<212> DNA
<213> Homo sapiens
<400> 117
tgacttcatg gtaactggga gaggg 25
<210> 118
<211> 25
<212> DNA
<213> Homo sapiens
<400> 118
aagaagtgca agacccggga gacgg 25
<210> 119
<211> 25
<212> DNA
<213> Homo sapiens
<400> 119
ctcccgggtc ttgcacttct tgatg 25
<210> 120
<211> 25
<212> DNA
<213> Homo sapiens
<400> 120
tgctgccagc acggttctgg actac 25
<210> 121
<211> 25
<212> DNA
<213> Homo sapiens
<400> 121
gcacggttct ggactacaca acacg 25
<210> 122
<211> 25
<212> DNA
<213> Homo sapiens
<400> 122
tgtagtccag aaccgtgctg gcagc 25
<210> 123
<211> 25
<212> DNA
<213> Homo sapiens
<400> 123
acggttctgg actacacaac acgca 25
<210> 124
<211> 25
<212> DNA
<213> Homo sapiens
<400> 124
cagtcacgga gcggttggcc ttcac 25
<210> 125
<211> 25
<212> DNA
<213> Homo sapiens
<400> 125
gggcatcttc gtggactaca gagct 25
<210> 126
<211> 25
<212> DNA
<213> Homo sapiens
<400> 126
gatccaccat gatggccctt ggctt 25
<210> 127
<211> 25
<212> DNA
<213> Homo sapiens
<400> 127
aggatccacc atgatggccc ttggc 25
<210> 128
<211> 25
<212> DNA
<213> Homo sapiens
<400> 128
ccggccacga gaatagcagc ccagg 25
<210> 129
<211> 25
<212> DNA
<213> Homo sapiens
<400> 129
cctgccagca gatctgagag ggagg 25
<210> 130
<211> 25
<212> DNA
<213> Homo sapiens
<400> 130
gatctgagag ggagggcagc caggc 25
<210> 131
<211> 25
<212> DNA
<213> Homo sapiens
<400> 131
gaggctcgcc acaaggagct ggagg 25
<210> 132
<211> 25
<212> DNA
<213> Homo sapiens
<400> 132
gctagagaag tccgaggctc gccac 25
<210> 133
<211> 25
<212> DNA
<213> Homo sapiens
<400> 133
actgctccta gtgtctgtca ggacc 25
<210> 134
<211> 25
<212> DNA
<213> Homo sapiens
<400> 134
ctcctagtgt ctgtcaggac ctgaa 25
<210> 135
<211> 25
<212> DNA
<213> Homo sapiens
<400> 135
cacttcaggt cctgacagac actag 25
<210> 136
<211> 25
<212> DNA
<213> Homo sapiens
<400> 136
cccttgagga cctgtgaaat ccaga 25
<210> 137
<211> 25
<212> DNA
<213> Homo sapiens
<400> 137
cacaggtcct caagggcaga agagt 25
<210> 138
<211> 25
<212> DNA
<213> Homo sapiens
<400> 138
gacctgagag tgggtgttgg acagt 25
<210> 139
<211> 25
<212> DNA
<213> Homo sapiens
<400> 139
tccaacaccc actctcaggt cacca 25
<210> 140
<211> 25
<212> DNA
<213> Homo sapiens
<400> 140
cagccatggg agccccttca cttca 25
<210> 141
<211> 25
<212> DNA
<213> Homo sapiens
<400> 141
gctgagtttg tgtgtgaatg gacac 25
<210> 142
<211> 25
<212> DNA
<213> Homo sapiens
<400> 142
tgatcaaacg ccccggcagg aagtg 25
<210> 143
<211> 25
<212> DNA
<213> Homo sapiens
<400> 143
gtcggcctca gcttttcact tcctg 25
<210> 144
<211> 25
<212> DNA
<213> Homo sapiens
<400> 144
aggccattcc caagaaacgg ggctg 25
<210> 145
<211> 25
<212> DNA
<213> Homo sapiens
<400> 145
cagccccgtt tcttgggaat ggcct 25
<210> 146
<211> 25
<212> DNA
<213> Homo sapiens
<400> 146
ccaagaaacg gggctgaaag ccggg 25
<210> 147
<211> 25
<212> DNA
<213> Homo sapiens
<400> 147
cccaggagga ggtccagctg gagat 25
<210> 148
<211> 25
<212> DNA
<213> Homo sapiens
<400> 148
cttccatctc cagctggacc tcctc 25
<210> 149
<211> 25
<212> DNA
<213> Homo sapiens
<400> 149
gctactgggt ggtgataatg gtgaa 25
<210> 150
<211> 25
<212> DNA
<213> Homo sapiens
<400> 150
tccttcacca ttatcaccac ccagt 25
<210> 151
<211> 25
<212> DNA
<213> Homo sapiens
<400> 151
ggctactggg tggtgataat ggtga 25
<210> 152
<211> 25
<212> DNA
<213> Homo sapiens
<400> 152
tcacggtttg ggggtataca tgggc 25
<210> 153
<211> 25
<212> DNA
<213> Homo sapiens
<400> 153
gcttagggtt accgaagagg ggcca 25
<210> 154
<211> 25
<212> DNA
<213> Homo sapiens
<400> 154
cacatttggc ttagggttac cgaag 25
<210> 155
<211> 25
<212> DNA
<213> Homo sapiens
<400> 155
ggcttagggt taccgaagag gggcc 25
<210> 156
<211> 25
<212> DNA
<213> Homo sapiens
<400> 156
gctcagggtt actgaagagg ggcca 25
<210> 157
<211> 25
<212> DNA
<213> Homo sapiens
<400> 157
cacatttggc tcagggttac tgaag 25
<210> 158
<211> 25
<212> DNA
<213> Homo sapiens
<400> 158
ggctcagggt tactgaagag gggcc 25
<210> 159
<211> 20
<212> DNA
<213> Homo sapiens
<400> 159
cctaaaggaa atgactgcag 20
<210> 160
<211> 25
<212> DNA
<213> Homo sapiens
<400> 160
aggaccatca ccccctagac tatag 25
<210> 161
<211> 25
<212> DNA
<213> Homo sapiens
<400> 161
catcaccccc tagactatag ttagc 25
<210> 162
<211> 20
<212> DNA
<213> Homo sapiens
<400> 162
acttcgtcta ttcccagatc 20
<210> 163
<211> 25
<212> DNA
<213> Homo sapiens
<400> 163
ctagtagggg ctggtgacag tcaat 25
<210> 164
<211> 25
<212> DNA
<213> Homo sapiens
<400> 164
attgtggact gcatcttagc cctag 25
<210> 165
<211> 20
<212> DNA
<213> Homo sapiens
<400> 165
tggactgcat cttagcccta 20
<210> 166
<211> 25
<212> DNA
<213> Homo sapiens
<400> 166
acagcccagc ctacctaccc aaaat 25
<210> 167
<211> 25
<212> DNA
<213> Homo sapiens
<400> 167
tgggtaggta ggctgggctg tgggt 25
<210> 168
<211> 25
<212> DNA
<213> Homo sapiens
<400> 168
attttgggta ggtaggctgg gctgt 25
<210> 169
<211> 25
<212> DNA
<213> Homo sapiens
<400> 169
ttgctcattg acctccactc agtgt 25
<210> 170
<211> 25
<212> DNA
<213> Homo sapiens
<400> 170
ccgtccattt aactggaatc cgacc 25
<210> 171
<211> 25
<212> DNA
<213> Homo sapiens
<400> 171
ttctaacccc cacccccact gccgg 25
<210> 172
<211> 25
<212> DNA
<213> Homo sapiens
<400> 172
cccccactgc cgggtaaggg tgtca 25
<210> 173
<211> 25
<212> DNA
<213> Homo sapiens
<400> 173
taacccccac ccccactgcc gggta 25
<210> 174
<211> 25
<212> DNA
<213> Homo sapiens
<400> 174
ttgctcgttg atctccactc agtgt 25
<210> 175
<211> 25
<212> DNA
<213> Homo sapiens
<400> 175
gcagcatctt cttccgggtc atctt 25
<210> 176
<211> 25
<212> DNA
<213> Homo sapiens
<400> 176
ggacctacac aagcagcatc ttctt 25
<210> 177
<211> 25
<212> DNA
<213> Homo sapiens
<400> 177
tccaccacgg ctgtcgacac caatc 25
<210> 178
<211> 25
<212> DNA
<213> Homo sapiens
<400> 178
gctgtcgaca ccaatcccaa ggaat 25
<210> 179
<211> 20
<212> DNA
<213> Homo sapiens
<400> 179
caccacggct gtcgacacca 20
<210> 180
<211> 25
<212> DNA
<213> Homo sapiens
<400> 180
accacggctg tcgacaccaa tccca 25
<210> 181
<211> 25
<212> DNA
<213> Homo sapiens
<400> 181
actccaaagg ctttcctcca ctgtt 25
<210> 182
<211> 20
<212> DNA
<213> Homo sapiens
<400> 182
caacagtgga ggaaagcctt 20
<210> 183
<211> 25
<212> DNA
<213> Homo sapiens
<400> 183
catcccgtac tcccacgacc agata 25
<210> 184
<211> 25
<212> DNA
<213> Homo sapiens
<400> 184
ctatctggtc gtgggagtac gggat 25
<210> 185
<211> 25
<212> DNA
<213> Homo sapiens
<400> 185
aagcagcagg aagcagaccc aggag 25
<210> 186
<211> 25
<212> DNA
<213> Homo sapiens
<400> 186
tcaaataagc agcaggaagc agacc 25
<210> 187
<211> 20
<212> DNA
<213> Homo sapiens
<400> 187
aaataagcag caggaagcag 20
<210> 188
<211> 25
<212> DNA
<213> Homo sapiens
<400> 188
cctgggtctg cttcctgctg cttat 25
<210> 189
<211> 25
<212> DNA
<213> Homo sapiens
<400> 189
tgggccaaga ctccacctat atcga 25
<210> 190
<211> 25
<212> DNA
<213> Homo sapiens
<400> 190
ggctttcctc gatataggtg gagtc 25
<210> 191
<211> 20
<212> DNA
<213> Homo sapiens
<400> 191
ctcgatatag gtggagtctt 20
<210> 192
<211> 25
<212> DNA
<213> Homo sapiens
<400> 192
tattcaccgg cccgctgatg gtccc 25
<210> 193
<211> 25
<212> DNA
<213> Homo sapiens
<400> 193
agccctcagt gcagccagat attca 25
<210> 194
<211> 25
<212> DNA
<213> Homo sapiens
<400> 194
gatattcacc ggcccgctga tggtc 25
<210> 195
<211> 25
<212> DNA
<213> Homo sapiens
<400> 195
cttcctcccg acgcagatga gcccg 25
<210> 196
<211> 25
<212> DNA
<213> Homo sapiens
<400> 196
gccactggga gcgctggcgt ggaca 25
<210> 197
<211> 25
<212> DNA
<213> Homo sapiens
<400> 197
tagacagagg acaatggctt ccatg 25
<210> 198
<211> 25
<212> DNA
<213> Homo sapiens
<400> 198
gacagaggac aatggcttcc atggt 25
<210> 199
<211> 25
<212> DNA
<213> Homo sapiens
<400> 199
tggttgtgca gccagatgcc tagac 25
<210> 200
<211> 25
<212> DNA
<213> Homo sapiens
<400> 200
atagctgtgt ggtgcttctg tggtg 25
<210> 201
<211> 25
<212> DNA
<213> Homo sapiens
<400> 201
tcttgctcac tttggacctt ggtgg 25
<210> 202
<211> 25
<212> DNA
<213> Homo sapiens
<400> 202
cccgacttac agccagtaat gtcac 25
<210> 203
<211> 25
<212> DNA
<213> Homo sapiens
<400> 203
ctggctgtaa gtcgggcttt cttca 25
<210> 204
<211> 25
<212> DNA
<213> Homo sapiens
<400> 204
agcaacctcc agtggtgacc agaat 25
<210> 205
<211> 25
<212> DNA
<213> Homo sapiens
<400> 205
ctgcaagcaa cctccagtgg tgacc 25
<210> 206
<211> 25
<212> DNA
<213> Homo sapiens
<400> 206
tcagaaaaac tggctcgaga gctcc 25
<210> 207
<211> 20
<212> DNA
<213> Homo sapiens
<400> 207
aggagctctc gagccagttt 20
<210> 208
<211> 25
<212> DNA
<213> Homo sapiens
<400> 208
attagtcaga ggaaggttga gccca 25
<210> 209
<211> 25
<212> DNA
<213> Homo sapiens
<400> 209
ctcaaccttc ctctgactaa tggtg 25
<210> 210
<211> 20
<212> DNA
<213> Homo sapiens
<400> 210
gtcagaggaa ggttgagccc 20
<210> 211
<211> 25
<212> DNA
<213> Homo sapiens
<400> 211
agtggctccg aaggcaccgt cttct 25
<210> 212
<211> 25
<212> DNA
<213> Homo sapiens
<400> 212
gggtctgttt gaacatggag aacac 25
<210> 213
<211> 25
<212> DNA
<213> Homo sapiens
<400> 213
gaaagatcta gctcaccgtc ctctt 25
<210> 214
<211> 25
<212> DNA
<213> Homo sapiens
<400> 214
agtacaccac cgtcggccac atgga 25
<210> 215
<211> 25
<212> DNA
<213> Homo sapiens
<400> 215
cgctcagtac accaccgtcg gccac 25
<210> 216
<211> 25
<212> DNA
<213> Homo sapiens
<400> 216
tgcaagccca ccttggtcca tgtgg 25
<210> 217
<211> 25
<212> DNA
<213> Homo sapiens
<400> 217
ttcagccctg ggacacatga tggag 25
<210> 218
<211> 25
<212> DNA
<213> Homo sapiens
<400> 218
ttccctccat catgtgtccc agggc 25
<210> 219
<211> 25
<212> DNA
<213> Homo sapiens
<400> 219
ttcagccctg ggacacatga tggag 25
<210> 220
<211> 25
<212> DNA
<213> Homo sapiens
<400> 220
ggaagtggtt ggacaagtaa gcgcc 25
<210> 221
<211> 25
<212> DNA
<213> Homo sapiens
<400> 221
ggcgcttact tgtccaacca cttcc 25
<210> 222
<211> 25
<212> DNA
<213> Homo sapiens
<400> 222
caaactgaaa tctgtaagca ggcgg 25
<210> 223
<211> 25
<212> DNA
<213> Homo sapiens
<400> 223
cccgcctgct tacagatttc agttt 25
<210> 224
<211> 25
<212> DNA
<213> Homo sapiens
<400> 224
tggcaggcat cattggtcag atcca 25
<210> 225
<211> 25
<212> DNA
<213> Homo sapiens
<400> 225
ccagcaccat cactcgccgg gctgt 25
<210> 226
<211> 25
<212> DNA
<213> Homo sapiens
<400> 226
tgccagcacc atcactcgcc gggct 25
<210> 227
<211> 25
<212> DNA
<213> Homo sapiens
<400> 227
atgcccccga agcccctctc caccg 25
<210> 228
<211> 25
<212> DNA
<213> Homo sapiens
<400> 228
cgcaaaagct gtgatcttct ccttc 25
<210> 229
<211> 25
<212> DNA
<213> Homo sapiens
<400> 229
aagcccctct ccaccgcaaa agctg 25
<210> 230
<211> 25
<212> DNA
<213> Homo sapiens
<400> 230
aaaggaccgc aatgtggcca cccca 25
<210> 231
<211> 25
<212> DNA
<213> Homo sapiens
<400> 231
caccccaaga gactactact ttgct 25
<210> 232
<211> 25
<212> DNA
<213> Homo sapiens
<400> 232
tggggtggcc acattgcggt ccttt 25
<210> 233
<211> 25
<212> DNA
<213> Homo sapiens
<400> 233
gtaatggtgt ggctgtactc tccaa 25
<210> 234
<211> 20
<212> DNA
<213> Homo sapiens
<400> 234
gagagtacag ccacaccatt 20
<210> 235
<211> 25
<212> DNA
<213> Homo sapiens
<400> 235
tatcacttac ggatcacaga ggggg 25
<210> 236
<211> 25
<212> DNA
<213> Homo sapiens
<400> 236
gtgacagagc tggtttcaaa gttgc 25
<210> 237
<211> 25
<212> DNA
<213> Homo sapiens
<400> 237
gcgaagatgg cttggatgag tggcc 25
<210> 238
<211> 25
<212> DNA
<213> Homo sapiens
<400> 238
cttggatgag tggccgcagc gctgt 25
<210> 239
<211> 25
<212> DNA
<213> Homo sapiens
<400> 239
cctgtggcag agttccctga agcca 25
<210> 240
<211> 25
<212> DNA
<213> Homo sapiens
<400> 240
tcagggaact ctgccacagg tgagc 25
<210> 241
<211> 25
<212> DNA
<213> Homo sapiens
<400> 241
cctgaagcca tcaaggggct gcagc 25
<210> 242
<211> 25
<212> DNA
<213> Homo sapiens
<400> 242
tcgccatcgc tgtagaacgc accac 25
<210> 243
<211> 25
<212> DNA
<213> Homo sapiens
<400> 243
gtccaagcag cgccactgtg ggaga 25
<210> 244
<211> 25
<212> DNA
<213> Homo sapiens
<400> 244
tttactctcc cacagtggcg ctgct 25
<210> 245
<211> 25
<212> DNA
<213> Homo sapiens
<400> 245
cctccaattc aggacccaca tgacg 25
<210> 246
<211> 25
<212> DNA
<213> Homo sapiens
<400> 246
ctccaattca ggacccacat gacgg 25
<210> 247
<211> 25
<212> DNA
<213> Homo sapiens
<400> 247
agtgctcccc gcaccggccc atcct 25
<210> 248
<211> 25
<212> DNA
<213> Homo sapiens
<400> 248
ctgcccccac agagtgctcc ccgca 25
<210> 249
<211> 25
<212> DNA
<213> Homo sapiens
<400> 249
gaccaagcag ccatgccagt acttc 25
<210> 250
<211> 25
<212> DNA
<213> Homo sapiens
<400> 250
atctcctcct catcctccag cctct 25
<210> 251
<211> 25
<212> DNA
<213> Homo sapiens
<400> 251
gacaacaaga tgccccctga ggcct 25
<210> 252
<211> 25
<212> DNA
<213> Homo sapiens
<400> 252
ctggggctgc ttactactac caatg 25
<210> 253
<211> 25
<212> DNA
<213> Homo sapiens
<400> 253
gacaagatgt ggaggctgac ccatg 25
<210> 254
<211> 25
<212> DNA
<213> Homo sapiens
<400> 254
ctggggctgc ttactactac caatg 25
<210> 255
<211> 25
<212> DNA
<213> Homo sapiens
<400> 255
gggggctggt ttgccatcca agggg 25
<210> 256
<211> 25
<212> DNA
<213> Homo sapiens
<400> 256
aatgaacatc cctgtccggc caatt 25
<210> 257
<211> 25
<212> DNA
<213> Homo sapiens
<400> 257
gccggacagg gatgttcatt gtgat 25
<210> 258
<211> 25
<212> DNA
<213> Homo sapiens
<400> 258
aatcacaatg aacatccctg tccgg 25
<210> 259
<211> 25
<212> DNA
<213> Homo sapiens
<400> 259
gattactgtg acctgtatgg agggg 25
<210> 260
<211> 25
<212> DNA
<213> Homo sapiens
<400> 260
gccattttgg ctgagttggt ccagt 25
<210> 261
<211> 25
<212> DNA
<213> Homo sapiens
<400> 261
tttggctgag ttggtccggt attac 25
<210> 262
<211> 25
<212> DNA
<213> Homo sapiens
<400> 262
gccactttgg ctgagttggt ccggt 25
<210> 263
<211> 25
<212> DNA
<213> Homo sapiens
<400> 263
ttggctgagt tggtccggta ttaca 25
<210> 264
<211> 25
<212> DNA
<213> Homo sapiens
<400> 264
ccgcagatga ggagcagctc taggc 25
<210> 265
<211> 25
<212> DNA
<213> Homo sapiens
<400> 265
agctctaggc cgaagtgtcg caggc 25
<210> 266
<211> 25
<212> DNA
<213> Homo sapiens
<400> 266
tacgtcctca gctgggacta gcagc 25
<210> 267
<211> 25
<212> DNA
<213> Homo sapiens
<400> 267
gactagcagc tcaacctcgc ctatg 25
<210> 268
<211> 25
<212> DNA
<213> Homo sapiens
<400> 268
agctgctagt cccagctgag gacgt 25
<210> 269
<211> 25
<212> DNA
<213> Homo sapiens
<400> 269
tctctcctgg gcatcaaggg agtcc 25
<210> 270
<211> 25
<212> DNA
<213> Homo sapiens
<400> 270
ttggactccc ttgatgccca ggaga 25
<210> 271
<211> 25
<212> DNA
<213> Homo sapiens
<400> 271
aatgactgtg atccacattc cccct 25
<210> 272
<211> 20
<212> DNA
<213> Homo sapiens
<400> 272
cctaccctga aaatccgaaa 20
<210> 273
<211> 25
<212> DNA
<213> Homo sapiens
<400> 273
cacacactct gcaccttgaa ggctg 25
<210> 274
<211> 25
<212> DNA
<213> Homo sapiens
<400> 274
gcaccttgaa ggctgacaag tcatc 25
<210> 275
<211> 25
<212> DNA
<213> Homo sapiens
<400> 275
tagtagcaca cactctgcac cttga 25
<210> 276
<211> 25
<212> DNA
<213> Homo sapiens
<400> 276
ttggtgctct cctccgtggc cacgc 25
<210> 277
<211> 25
<212> DNA
<213> Homo sapiens
<400> 277
agcatcgatg tcaacgaggg caacc 25
<210> 278
<211> 25
<212> DNA
<213> Homo sapiens
<400> 278
ccctcgttga catcgatgct tgaga 25
<210> 279
<211> 25
<212> DNA
<213> Homo sapiens
<400> 279
gggggctgag cagcagtgcg ccctt 25
<210> 280
<211> 25
<212> DNA
<213> Homo sapiens
<400> 280
agctgctttt ccggggtttc cgctg 25
<210> 281
<211> 25
<212> DNA
<213> Homo sapiens
<400> 281
gacagcggaa accccggaaa agcag 25
<210> 282
<211> 25
<212> DNA
<213> Homo sapiens
<400> 282
gtggaacttc tgtactacaa cgctg 25
<210> 283
<211> 25
<212> DNA
<213> Homo sapiens
<400> 283
gtctcagcag gatctctcac cgtag 25
<210> 284
<211> 25
<212> DNA
<213> Homo sapiens
<400> 284
acctgagtgt tttagctacg gtgag 25
<210> 285
<211> 25
<212> DNA
<213> Homo sapiens
<400> 285
gtggagctga ccagggagga gacct 25
<210> 286
<211> 25
<212> DNA
<213> Homo sapiens
<400> 286
tgaccaggga ggagaccttc aaata 25
<210> 287
<211> 20
<212> DNA
<213> Homo sapiens
<400> 287
gaaggtctcc tccctggtca 20
<210> 288
<211> 25
<212> DNA
<213> Homo sapiens
<400> 288
gtggagctga ccagggagga gacct 25
<210> 289
<211> 25
<212> DNA
<213> Homo sapiens
<400> 289
cgctggttct gccggctgat tcagc 25
<210> 290
<211> 25
<212> DNA
<213> Homo sapiens
<400> 290
ctgctgaatc agccggcaga accag 25
<210> 291
<211> 25
<212> DNA
<213> Homo sapiens
<400> 291
ggatgggtgg agagcaagtt ggtca 25
<210> 292
<211> 25
<212> DNA
<213> Homo sapiens
<400> 292
tgcaggagct tcgaggcact gtggc 25
<210> 293
<211> 25
<212> DNA
<213> Homo sapiens
<400> 293
atgctggatg tgctgcagga gcttc 25
<210> 294
<211> 25
<212> DNA
<213> Homo sapiens
<400> 294
ctgccatatt gtgtgcccgc actcg 25
<210> 295
<211> 25
<212> DNA
<213> Homo sapiens
<400> 295
gggggcccgg ctgctttttc gagtg 25
<210> 296
<211> 20
<212> DNA
<213> Homo sapiens
<400> 296
tgtgcccgca ctcgaaaaag 20
<210> 297
<211> 25
<212> DNA
<213> Homo sapiens
<400> 297
ctcagaggtc agggagggtc cagac 25
<210> 298
<211> 20
<212> DNA
<213> Homo sapiens
<400> 298
cttgggactg taaaagctgt 20
<210> 299
<211> 25
<212> DNA
<213> Homo sapiens
<400> 299
gtaagtgatc catcctaggt tggca 25
<210> 300
<211> 20
<212> DNA
<213> Homo sapiens
<400> 300
gtaagtgatc catcctaggt 20
<210> 301
<211> 25
<212> DNA
<213> Homo sapiens
<400> 301
gccccctcac cttggacagt gagat 25
<210> 302
<211> 25
<212> DNA
<213> Homo sapiens
<400> 302
cttcaatctc actgtccaag gtgag 25
<210> 303
<211> 25
<212> DNA
<213> Homo sapiens
<400> 303
tttaacgaag ccctccgtga gagct 25
<210> 304
<211> 20
<212> DNA
<213> Homo sapiens
<400> 304
aacgaagccc tccgtgagag 20
<210> 305
<211> 20
<212> DNA
<213> Homo sapiens
<400> 305
caagaatctg accatcttgg 20
<210> 306
<211> 25
<212> DNA
<213> Homo sapiens
<400> 306
actgtgggag ttctcgtccg tgacc 25
<210> 307
<211> 20
<212> DNA
<213> Homo sapiens
<400> 307
tcgtccgtga cctgggagcc 20
<210> 308
<211> 25
<212> DNA
<213> Homo sapiens
<400> 308
cagatgaaca ctggtcagcg taggg 25
<210> 309
<211> 20
<212> DNA
<213> Homo sapiens
<400> 309
acagatgaac actggtcagc 20
<210> 310
<211> 25
<212> DNA
<213> Homo sapiens
<400> 310
cagaacatcc ttgggggcta caggt 25
<210> 311
<211> 25
<212> DNA
<213> Homo sapiens
<400> 311
gccagcatgg ctgccagaac atcct 25
<210> 312
<211> 25
<212> DNA
<213> Homo sapiens
<400> 312
cggaacctgt gaggaggttg gcact 25
<210> 313
<211> 25
<212> DNA
<213> Homo sapiens
<400> 313
gttgacatcg gaacctgtga ggagg 25
<210> 314
<211> 20
<212> DNA
<213> Homo sapiens
<400> 314
tcagtgccaa cctcctcaca 20
<210> 315
<211> 25
<212> DNA
<213> Homo sapiens
<400> 315
cggaacctgt gaggaggttg gcact 25
<210> 316
<211> 25
<212> DNA
<213> Homo sapiens
<400> 316
taggcgatgg agcctggggg ttcgg 25
<210> 317
<211> 25
<212> DNA
<213> Homo sapiens
<400> 317
ggtaggcgat ggagcctggg ggttc 25
<210> 318
<211> 25
<212> DNA
<213> Homo sapiens
<400> 318
gactggggaa ctcccgacaa gatca 25
<210> 319
<211> 25
<212> DNA
<213> Homo sapiens
<400> 319
gggaactccc gacaagatca agaaa 25
<210> 320
<211> 20
<212> DNA
<213> Homo sapiens
<400> 320
ttgatcttgt cgggagttcc 20
<210> 321
<211> 25
<212> DNA
<213> Homo sapiens
<400> 321
tcccgacaag atcaagaaag ggggc 25
<210> 322
<211> 25
<212> DNA
<213> Homo sapiens
<400> 322
ctgagcaccc tgtacagctt cttcc 25
<210> 323
<211> 3
<212> DNA
<213> Streptococcus pyogenes
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<400> 323
ngg 3
<210> 324
<211> 5
<212> DNA
<213> Staphylococcus aureus
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<400> 324
ngrrt 5
<210> 325
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 325
Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg
1 5 10 15
Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg
20 25 30
Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys
35 40 45
Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys
50 55 60
Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys
85 90 95
Thr Val Tyr Tyr Gly Ala Pro Arg Leu Ser Ala Gly Ser Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val
115 120 125
Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe
130 135 140
Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln
145 150 155 160
Ala Gln Met Asn Asp Leu Asn Glu Ile
165
<210> 326
<211> 1254
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 326
Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg
1 5 10 15
Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg
20 25 30
Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys
35 40 45
Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys
50 55 60
Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys
85 90 95
Thr Val Tyr Tyr Gly Ala Pro Arg Leu Ser Ala Gly Ser Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val
115 120 125
Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe
130 135 140
Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln
145 150 155 160
Ala Gln Met Asn Asp Leu Asn Glu Ile Ser Gly Ser Glu Thr Pro Gly
165 170 175
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
180 185 190
Ser Ser Met Lys Gln Thr Ser Tyr Ser Leu Gly Leu Ala Ile Gly Ile
195 200 205
Ala Ser Val Gly Tyr Gly Leu Ile Asp Asn Asp Glu Asn Ile Val Asp
210 215 220
Ala Gly Val Arg Leu Phe Pro Glu Ala Asn Ser Lys Asn Asn Asp Gly
225 230 235 240
Arg Arg Lys Ser Arg Gly Ser Lys Arg Leu Ile Arg Arg Lys Arg His
245 250 255
Arg Ile Ala Arg Val Lys His Leu Leu Lys Glu Ser Gly Ile Asp Val
260 265 270
Ser Tyr Glu Asn Thr Val Leu Thr Asn Pro Tyr Glu Ile Arg Cys Lys
275 280 285
Gly Leu Thr Leu Pro Leu Thr Asn His Glu Leu Ser Ile Ala Leu Leu
290 295 300
His Leu Ala Lys Arg Arg Gly Val His Asn Val Lys Ser Met Asp Gln
305 310 315 320
Glu Lys Val Lys Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Thr Ile
325 330 335
Asn Asp Asn Leu Leu Glu Glu Lys Phe Ile Cys Glu Leu Gln Leu Glu
340 345 350
Arg Leu Asn Lys Glu Gly Ile Val Arg Ser His Ser Asn Arg Phe Lys
355 360 365
Thr Ala Asp Tyr Ile Lys Glu Ile Lys Asn Leu Leu Glu Thr Gln Ala
370 375 380
Lys Gln Asn Thr Leu Val Thr Glu Glu Phe Ile Glu Lys Tyr Ile Glu
385 390 395 400
Ile Phe Ser Gly Arg Arg Lys Tyr Tyr Glu Gly Pro Gly Gly Glu Ser
405 410 415
Lys Tyr Gly Trp Lys Gly Asp Ile Glu Lys Trp Tyr Glu Gly Leu Met
420 425 430
Gly Lys Cys Thr Tyr Phe Pro Lys Glu Leu Arg Cys Val Lys His Ala
435 440 445
Tyr Ser Ala Ala Leu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Ser
450 455 460
Ile Asn Arg Glu Glu Asp Thr Lys Leu Ser Gln Tyr Glu Lys Glu Gln
465 470 475 480
Ile Ile Glu Lys Ile Phe Lys Val Arg Lys Thr Pro Thr Leu Thr Gln
485 490 495
Ile Ala Lys Leu Leu Lys Val Asp Pro Thr Asn Ile Lys Gly Phe Arg
500 505 510
Thr Lys Ala Asn Gly Thr Pro Asp Phe Leu Ser Ile Lys Ile Tyr His
515 520 525
Asp Leu Lys Gly Ile Ile Asp Asp Lys Gln Leu Leu Asp Asp Ile Ala
530 535 540
Phe Leu Asp Asn Val Ala Gln Ile Leu Thr Val Trp Gln Asp Ser Gln
545 550 555 560
Ser Ile Gln Glu Lys Leu Lys Thr Leu Asn Lys Asn Leu Asp Asp Lys
565 570 575
Thr Ile Lys Glu Ile Ser Glu Leu Lys Lys Tyr Thr Gln Thr His Ser
580 585 590
Leu Ser Leu Lys Leu Ile Asn Val Leu Leu Pro Glu Leu Trp Glu Thr
595 600 605
Thr Lys Asn Gln Met Thr Ile Leu Ser Glu Leu Lys Leu Lys Pro Arg
610 615 620
Lys Ile Asp Leu His Asn Cys Asn Glu Ile Pro Val Asn Met Ile Asn
625 630 635 640
Asp Leu Ile Val Ser Pro Val Val Arg Arg Ser Leu Thr Gln Ser Ile
645 650 655
Glu Met Ile Asn Gln Ile Ile Lys Asp Tyr Gly His Pro Arg Glu Ile
660 665 670
Val Ile Glu Leu Ala Arg Glu Lys Asn Ser Glu Glu Lys Lys Asn Phe
675 680 685
Ile Lys Ser Leu Asn Glu Lys Asn Lys Gln Ile Asn Asp Glu Val Ile
690 695 700
Glu Lys Leu Asn Ala Ser Asn His Arg Asp Asn Lys Gly Met Phe Asn
705 710 715 720
Lys Val Lys Leu Trp Ile Leu Gln Asp Gly His Cys Leu Tyr Ser Leu
725 730 735
Lys Pro Ile Arg Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu
740 745 750
Ile Asp Ala Ile Ile Pro Lys Ser Val Ser Phe Asp Asp Ser Met Ser
755 760 765
Asn Lys Val Leu Val Tyr Gln Ile Glu Asn Ser Lys Lys Gly Asn Arg
770 775 780
Thr Pro Tyr Gln Tyr Leu Thr Ser Ala Asp Lys Thr Ile Thr Tyr Glu
785 790 795 800
Lys Phe Lys Ala Asn Ile Thr Gln Leu Ala Lys Ser Asn His Lys Ile
805 810 815
Ser Lys Lys Lys Leu Asp Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg
820 825 830
Phe His Ile Lys Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg
835 840 845
Tyr Ala Thr Arg Ser Leu Ile Asn Leu Leu Lys Tyr Tyr Phe Ser Glu
850 855 860
Lys Asp Ile Asn Val Lys Val Lys Ser Ile Asn Gly Ser Phe Thr Asp
865 870 875 880
Tyr Leu Arg Lys Leu Trp Asn Phe Pro Lys Asp Arg Glu Phe Tyr His
885 890 895
Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Met Ala Asn Lys Ile
900 905 910
Phe Thr Thr Arg Lys Ile Phe Lys Glu Gln Asn Ser Val Phe Ser Asp
915 920 925
Glu Gln Ile Leu Asp Gly Glu Val Thr Asn Ile Leu Ser Asp Asp Gln
930 935 940
Phe Gln Ala Glu Phe Thr Glu Lys Phe Tyr Lys Val Gln Ala Ile Lys
945 950 955 960
Lys Tyr Asp Lys Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn
965 970 975
Arg Gln Leu Phe Asp Asp Thr Leu Tyr Ser Thr Arg Glu Phe Glu Gly
980 985 990
Glu Glu Tyr Tyr Ile Gly Lys Ile Lys Asp Ile Tyr Asn Leu Lys Asp
995 1000 1005
Lys Arg Leu Lys Lys Ile Phe Thr Lys Ser Pro Glu Lys Ile Leu
1010 1015 1020
Met Tyr Gln His Asp Ser Gln Thr Phe Lys Lys Leu Lys Gln Ile
1025 1030 1035
Met Arg Ser Tyr Glu Asp Glu Val Asn Pro Leu Ala Lys Tyr His
1040 1045 1050
Lys Glu Thr Gly Glu Tyr Leu Arg Lys Glu Cys Lys Lys Gly Asn
1055 1060 1065
Gly Pro Ile Val Lys Ser Leu Lys Tyr Arg Val Thr Lys Leu Gly
1070 1075 1080
Val His Lys Asp Ile Thr His Lys Tyr Glu Asn Ser Lys Asn Lys
1085 1090 1095
Val Val Ile Leu Ser Leu Lys Pro Phe Arg Met Asp Val Phe Lys
1100 1105 1110
Glu Asn Gly Val Tyr Lys Phe Ile Thr Ile Arg Tyr Cys Asp Leu
1115 1120 1125
Lys Glu Thr Val Asn Ser Tyr Thr Ile Ser Glu His Leu Tyr Lys
1130 1135 1140
Ala Lys Leu Lys Ala Lys Asp Ile Lys Ser Met Asp Ser Phe Lys
1145 1150 1155
Trp Ser Phe Tyr Lys Asn Asp Leu Leu Glu Tyr Asn Gly Glu Leu
1160 1165 1170
Cys Thr Phe Lys Gly Val Asn Asp Asp Lys Lys Asn Lys Ile Glu
1175 1180 1185
Val Asn Trp Val Glu Lys Asn Phe Ala Ile Tyr Ala Glu Lys Lys
1190 1195 1200
Asn Leu Lys Ser Lys Gln Leu Val Lys Ser Ile Thr Lys Ser Thr
1205 1210 1215
Val Lys Ser Leu Leu Lys Tyr Thr Thr Asp Ile Leu Gly Asn Arg
1220 1225 1230
Tyr Pro Val Arg Asn Glu Lys Leu Lys Leu Met Ile Arg Lys Gln
1235 1240 1245
Thr Phe Arg Gly Asp Leu
1250
<210> 327
<211> 1060
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 327
Met Lys Gln Thr Ser Tyr Ser Leu Gly Leu Ala Ile Gly Ile Ala Ser
1 5 10 15
Val Gly Tyr Gly Leu Ile Asp Asn Asp Glu Asn Ile Val Asp Ala Gly
20 25 30
Val Arg Leu Phe Pro Glu Ala Asn Ser Lys Asn Asn Asp Gly Arg Arg
35 40 45
Lys Ser Arg Gly Ser Lys Arg Leu Ile Arg Arg Lys Arg His Arg Ile
50 55 60
Ala Arg Val Lys His Leu Leu Lys Glu Ser Gly Ile Asp Val Ser Tyr
65 70 75 80
Glu Asn Thr Val Leu Thr Asn Pro Tyr Glu Ile Arg Cys Lys Gly Leu
85 90 95
Thr Leu Pro Leu Thr Asn His Glu Leu Ser Ile Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Lys Ser Met Asp Gln Glu Lys
115 120 125
Val Lys Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Thr Ile Asn Asp
130 135 140
Asn Leu Leu Glu Glu Lys Phe Ile Cys Glu Leu Gln Leu Glu Arg Leu
145 150 155 160
Asn Lys Glu Gly Ile Val Arg Ser His Ser Asn Arg Phe Lys Thr Ala
165 170 175
Asp Tyr Ile Lys Glu Ile Lys Asn Leu Leu Glu Thr Gln Ala Lys Gln
180 185 190
Asn Thr Leu Val Thr Glu Glu Phe Ile Glu Lys Tyr Ile Glu Ile Phe
195 200 205
Ser Gly Arg Arg Lys Tyr Tyr Glu Gly Pro Gly Gly Glu Ser Lys Tyr
210 215 220
Gly Trp Lys Gly Asp Ile Glu Lys Trp Tyr Glu Gly Leu Met Gly Lys
225 230 235 240
Cys Thr Tyr Phe Pro Lys Glu Leu Arg Cys Val Lys His Ala Tyr Ser
245 250 255
Ala Ala Leu Phe Asn Leu Leu Asn Asp Leu Asn Asn Leu Ser Ile Asn
260 265 270
Arg Glu Glu Asp Thr Lys Leu Ser Gln Tyr Glu Lys Glu Gln Ile Ile
275 280 285
Glu Lys Ile Phe Lys Val Arg Lys Thr Pro Thr Leu Thr Gln Ile Ala
290 295 300
Lys Leu Leu Lys Val Asp Pro Thr Asn Ile Lys Gly Phe Arg Thr Lys
305 310 315 320
Ala Asn Gly Thr Pro Asp Phe Leu Ser Ile Lys Ile Tyr His Asp Leu
325 330 335
Lys Gly Ile Ile Asp Asp Lys Gln Leu Leu Asp Asp Ile Ala Phe Leu
340 345 350
Asp Asn Val Ala Gln Ile Leu Thr Val Trp Gln Asp Ser Gln Ser Ile
355 360 365
Gln Glu Lys Leu Lys Thr Leu Asn Lys Asn Leu Asp Asp Lys Thr Ile
370 375 380
Lys Glu Ile Ser Glu Leu Lys Lys Tyr Thr Gln Thr His Ser Leu Ser
385 390 395 400
Leu Lys Leu Ile Asn Val Leu Leu Pro Glu Leu Trp Glu Thr Thr Lys
405 410 415
Asn Gln Met Thr Ile Leu Ser Glu Leu Lys Leu Lys Pro Arg Lys Ile
420 425 430
Asp Leu His Asn Cys Asn Glu Ile Pro Val Asn Met Ile Asn Asp Leu
435 440 445
Ile Val Ser Pro Val Val Arg Arg Ser Leu Thr Gln Ser Ile Glu Met
450 455 460
Ile Asn Gln Ile Ile Lys Asp Tyr Gly His Pro Arg Glu Ile Val Ile
465 470 475 480
Glu Leu Ala Arg Glu Lys Asn Ser Glu Glu Lys Lys Asn Phe Ile Lys
485 490 495
Ser Leu Asn Glu Lys Asn Lys Gln Ile Asn Asp Glu Val Ile Glu Lys
500 505 510
Leu Asn Ala Ser Asn His Arg Asp Asn Lys Gly Met Phe Asn Lys Val
515 520 525
Lys Leu Trp Ile Leu Gln Asp Gly His Cys Leu Tyr Ser Leu Lys Pro
530 535 540
Ile Arg Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Ile Asp
545 550 555 560
Ala Ile Ile Pro Lys Ser Val Ser Phe Asp Asp Ser Met Ser Asn Lys
565 570 575
Val Leu Val Tyr Gln Ile Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro
580 585 590
Tyr Gln Tyr Leu Thr Ser Ala Asp Lys Thr Ile Thr Tyr Glu Lys Phe
595 600 605
Lys Ala Asn Ile Thr Gln Leu Ala Lys Ser Asn His Lys Ile Ser Lys
610 615 620
Lys Lys Leu Asp Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe His
625 630 635 640
Ile Lys Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala
645 650 655
Thr Arg Ser Leu Ile Asn Leu Leu Lys Tyr Tyr Phe Ser Glu Lys Asp
660 665 670
Ile Asn Val Lys Val Lys Ser Ile Asn Gly Ser Phe Thr Asp Tyr Leu
675 680 685
Arg Lys Leu Trp Asn Phe Pro Lys Asp Arg Glu Phe Tyr His Lys His
690 695 700
His Ala Glu Asp Ala Leu Ile Ile Ala Met Ala Asn Lys Ile Phe Thr
705 710 715 720
Thr Arg Lys Ile Phe Lys Glu Gln Asn Ser Val Phe Ser Asp Glu Gln
725 730 735
Ile Leu Asp Gly Glu Val Thr Asn Ile Leu Ser Asp Asp Gln Phe Gln
740 745 750
Ala Glu Phe Thr Glu Lys Phe Tyr Lys Val Gln Ala Ile Lys Lys Tyr
755 760 765
Asp Lys Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln
770 775 780
Leu Phe Asp Asp Thr Leu Tyr Ser Thr Arg Glu Phe Glu Gly Glu Glu
785 790 795 800
Tyr Tyr Ile Gly Lys Ile Lys Asp Ile Tyr Asn Leu Lys Asp Lys Arg
805 810 815
Leu Lys Lys Ile Phe Thr Lys Ser Pro Glu Lys Ile Leu Met Tyr Gln
820 825 830
His Asp Ser Gln Thr Phe Lys Lys Leu Lys Gln Ile Met Arg Ser Tyr
835 840 845
Glu Asp Glu Val Asn Pro Leu Ala Lys Tyr His Lys Glu Thr Gly Glu
850 855 860
Tyr Leu Arg Lys Glu Cys Lys Lys Gly Asn Gly Pro Ile Val Lys Ser
865 870 875 880
Leu Lys Tyr Arg Val Thr Lys Leu Gly Val His Lys Asp Ile Thr His
885 890 895
Lys Tyr Glu Asn Ser Lys Asn Lys Val Val Ile Leu Ser Leu Lys Pro
900 905 910
Phe Arg Met Asp Val Phe Lys Glu Asn Gly Val Tyr Lys Phe Ile Thr
915 920 925
Ile Arg Tyr Cys Asp Leu Lys Glu Thr Val Asn Ser Tyr Thr Ile Ser
930 935 940
Glu His Leu Tyr Lys Ala Lys Leu Lys Ala Lys Asp Ile Lys Ser Met
945 950 955 960
Asp Ser Phe Lys Trp Ser Phe Tyr Lys Asn Asp Leu Leu Glu Tyr Asn
965 970 975
Gly Glu Leu Cys Thr Phe Lys Gly Val Asn Asp Asp Lys Lys Asn Lys
980 985 990
Ile Glu Val Asn Trp Val Glu Lys Asn Phe Ala Ile Tyr Ala Glu Lys
995 1000 1005
Lys Asn Leu Lys Ser Lys Gln Leu Val Lys Ser Ile Thr Lys Ser
1010 1015 1020
Thr Val Lys Ser Leu Leu Lys Tyr Thr Thr Asp Ile Leu Gly Asn
1025 1030 1035
Arg Tyr Pro Val Arg Asn Glu Lys Leu Lys Leu Met Ile Arg Lys
1040 1045 1050
Gln Thr Phe Arg Gly Asp Leu
1055 1060
<210> 328
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 328
gactccttca ccaag 15
<210> 329
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 329
gtagatcagc accg 14
<210> 330
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 330
ctctgggccg aagt 14
<210> 331
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 331
ctctaggccg aagt 14
<210> 332
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 332
acttcctcca gcc 13
<210> 333
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 333
gaaccccggc tta 13
<210> 334
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 334
tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 60
caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 120
ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 180
gggaggtcta tataagcaga gct 203
<210> 335
<211> 304
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 335
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catg 304
<210> 336
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 336
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacacc 318
<210> 337
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 337
ggagcagctc taggccgaag tgtcgcaggc c 31
<210> 338
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 338
agaacaactc taggcagagg tctcaaaggc t 31
<210> 339
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 339
ggagcagctc taggccgaag tgtcgcaggc c 31
<210> 340
<211> 20
<212> DNA
<213> Homo sapiens
<400> 340
aagactaacc tggccaacat 20
<210> 341
<211> 20
<212> DNA
<213> Homo sapiens
<400> 341
gtcttgaact ccggacctca 20
<210> 342
<211> 20
<212> DNA
<213> Homo sapiens
<400> 342
gccgggcgtg gtgtcgcgcg 20
<210> 343
<211> 20
<212> DNA
<213> Homo sapiens
<400> 343
tcctgccgca gcctctggag 20
<210> 344
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 344
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacaagac 120
taacctggcc aacat 135
<210> 345
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 345
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacgtctt 120
gaactccgga cctca 135
<210> 346
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 346
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacgccgg 120
gcgtggtgtc gcgcg 135
<210> 347
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 347
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcactcctg 120
ccgcagcctc tggag 135
<210> 348
<211> 500
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 348
aaaaatggac aattatgagg aggggagagt gcagacaggg gaagcttcac ctcctttaca 60
attttgggag tccacacggc atggcataca aattatttca ttcccattga gaaataaaat 120
ccaattctcc atcaccaaga gagccttccg aaagaggccc ccctgggcaa acggccaccg 180
atggagaggt ctgccagtcc tcttctaccc cacccacgcc cccaccctaa tcagaggcca 240
aacccttcct ggagcctgtg ataaaagcaa ctgttagctt gcactagact agcttcaaag 300
ttgtattgac cctggtgtgt tatgtctaag agtagatgcc atatctcttt tctggcctat 360
gttattacct gtatggactt tgcactggaa tcagctatct gctcttactt atgcacacct 420
ggggcataga gccagccctg tatcgctttt cagccatctc actacagata actcccaagt 480
cctgtctagc tgccttcctt 500
<210> 349
<211> 3324
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 349
atggccattc ggagcatcaa gctcaagctg aagaccagaa ccggtcctga ggctcagaac 60
ctgcggaagg gcatctggag aacccaccgg ctgctgaacg agggcgtggc ctactacatg 120
aagatgctgc tgctcttccg gcaggaatcc actggcggcc agacaaagaa ggaactgcag 180
gaggaactgg tgcggcacat ccgggagcag cagcagaaaa acagagccga caagaatacc 240
caggccctgc ctctggataa ggccttcgcc gctctgagac aactgtacga gctgctcgtg 300
ccatctagca tcggccagag cggcgatgcc cagatcatct ctagaaaatt cctgtctcct 360
ttggtggacc ctaacagcga gggcggcaag ggcactagca aggccggagc caagcccaca 420
tggcagaaaa agaaggaggc caatgaccct acatgggagc aagattacga gaagtggaaa 480
aagcgtagag aggaagatcc taccgccagt gtgataacaa ccctggaaga atatggaatt 540
agacctatct ttccactgta caccaacacc gtggccgata tcgcctggct gcctctgcag 600
tctaaccagt ttgtccggac atgggatcgg gacatgctgc agcaggccat cgagaggcta 660
ctctcttggg agtcttggaa caagcgggtg caagaggaat acagcaagct gcaggagaag 720
atgacgcaac tgaacgagca actggagggc ggacaggagt ggatcagcct gctggaacaa 780
tacgaggaac agagagagca ggagctgatc gaaaacatga ccgccgcaaa cgataaatac 840
cgcatcacca agcggcagat gaagggctgg aatgagctgt atgagcagtg gtctaccgtg 900
ctgcccaatg ccagccacga gcagtacaga gaggcactga aaagagtgca acagcggctg 960
aggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaagaaga acaccacctg 1020
atctggaagg ggaaccctca gagaatccac tacttcgtgg ccagaaacga gctgaagaaa 1080
agactggaag aagccaagca gaacgccacc atgaccctgc ctgatgccag aaagcaccct 1140
ctgtgggtca gatttgacgc cagaggcggc aacctgcaag actactacct gacggccgaa 1200
gccgacaacc ccagaagcag aaggttcgtg accttcagcc aactgatctg gcctaacgag 1260
agcggctgga tggaaaaaca ggacgtggaa gttgaactgg ccctgagcaa gcagttctac 1320
cagcaagtga cactgcagaa aaacgacaag gggaagcagg aaatcgagtt caaagacaag 1380
ggcagtggca gcaccttcag cggccacctg ggcggggcca agctgcaact ggagagagga 1440
gatctggaga aggaagaaaa agactttgaa ggcggcgaaa tcggcagcgt gtacctgaac 1500
atcgtgatcg acttcgagcc actgcaggag gtgaagaacg gccgactgca atctccttac 1560
ggccaggtgc tgcaactggt cagaaggcct aatgagttcc ccaaggtgac cacctacaag 1620
tctgaggaac tggtcgagtg gatcaagagc agcaccaagg acagcgccgg cgtggagtcc 1680
ttagagagcg gttttagagt gatgagcatc gacctgggac tgcggaccgc cgccgcaaca 1740
agcatcttct ctgtagagga atccaacgac gccaacgccg cgggtttcag ctactggatc 1800
gagggaactc ctctggttgc cgttcataag cggtcatata tgctgaaact gcccggagag 1860
caagtcgaaa agcaggtgcg agagaagcgg gacgagcggc aggatcagca gagaagagtg 1920
aggttccaaa tcagaatcct gagccaggtg atccggatgg ccaagaagca gaaccgggag 1980
cgggctgatg agctggacca cctgtcccag gccctggaga agcaaaaatc tctgctggac 2040
cagaccgatc ggaccttttg gaacggcatc gtgtgcgacc tgacagacgc tctgagagag 2100
aaagagggcg gatgggaaca ggccgtggtc cagatccaca ggaaggccga ggagcacgtg 2160
ggcaaggtgg tgcaagcctg gcggaaacgg ttcgacgccg atgaacgcaa gggcatcgcc 2220
ggcctgtcta tgtggtctat cgaggagctg gacagcctgc ggaagctgct gatctcttgg 2280
agcagaagaa caagaaaccc cagagaaatc aactgcttcg agcagggcca caccagccac 2340
cagcggctgc tgacacacat ccagaacgtg aaggaggacc ggctgaagca actgagccac 2400
gccattgtga tgacagcctt gggctacgtg tacgacgaga agaaattgga atggtttgcc 2460
aagtaccctg cttgtcaggt gatcctgttc gagaacctgt cccagtaccg gtccaacatg 2520
gacagaagca ccaaagagaa tagcaccctg atgaaatggg cccacaggag catccctaag 2580
tacgtgcaca tgcaggccga gccttacggc atccagatcg gcgatgtgcg ggccgagtac 2640
tccagcagat tccacgccaa gacaggcaca cctggcatcc ggtgcaagat ggtgtccgga 2700
cacgacctgc aaggcaggcg cttcgagaac ctgcagaagc ggttaatctc tgaacagttc 2760
ctgacagagg agcaagtgaa gcagctcaga cccggcgaca tcgtgcccga cgactccggc 2820
gagtggttca tgaccctgag cgacggcagc gaaggcaaag aggttgtgtt cctccaagcc 2880
gacatcaacg ccgcccaaaa tctgcaaaag agattctggc agcggtacaa cgagctgttt 2940
aaggtctcct gcagagtgct gatccgagga gaagaggaat acctgatccc caagacaaag 3000
tccgtgcaag ccaagctggg caaaggcctg ttcgtgaaaa aaaccgacac cgtgatgaag 3060
gacgtgtacg tgtgggacag ccaggctaag ctgaagggca aaaccacatt caccgaggag 3120
tccgaaagcc ctgagcaact ggaggatttt caggagatca tcgaagaagc cgaagaagct 3180
aagggcacat acagaacact gtttagagac cccagcggag tgttcttccc tgagttcgtg 3240
tggtccaccc agaaagattt ctggtccgag gtgaagagac ggctgtacgg caagctgaga 3300
gagcggttcc tgatgaagac cagg 3324
<210> 350
<211> 20
<212> DNA
<213> Homo sapiens
<400> 350
tattgaccct ggtgtgttat 20
<210> 351
<211> 20
<212> DNA
<213> Homo sapiens
<400> 351
gcttgcacta gactagcttc 20
<210> 352
<211> 20
<212> DNA
<213> Homo sapiens
<400> 352
cttttatcac aggctccagg 20
<210> 353
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 353
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcactattg 120
accctggtgt gttat 135
<210> 354
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 354
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacgcttg 120
cactagacta gcttc 135
<210> 355
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 355
cgacggttag aggccgtatg tcgatttgct ttaatttcgt gcgtgtgcat tgtcgtcctc 60
cattacaggg cggctaccac gaatagccac gaagtaaaag cttcgtggct agcacctttt 120
atcacaggct ccagg 135
<210> 356
<211> 118
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 356
aggagcagcu cuaggccgaa gugucguuuu aguacucugu gaaagcacag aaucuacuaa 60
aauaaggcau aaugccguau uuaaucccau cauaauucug augggauuuu uuauauuu 118
<210> 357
<211> 3180
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 357
atgaagcaga catcttattc tctgggcctg gatatcggca tcgcctctgt gggctacggc 60
ctgattgata acgacgaaaa catcgtggac gccggcgtca gactgtttcc tgaggccaat 120
agcaagaaca acgacggaag acggaagagc agaggctcca agcggctgat ccggcggaag 180
cgccacagaa tcgccagagt gaagcacctg ctgaaggaaa gcggcatcga cgtgtcctac 240
gaaaataccg tgctgaccaa cccttacgag atccggtgca agggcctgac cttaccactg 300
acgaaccacg agctttccat cgccctgctt catctggcta agagacgagg cgtgcacaac 360
gtgaagagca tggaccagga gaaagtcaag ggcaacgagc tgtctacaaa agagcaactg 420
accatcaatg ataatctgct ggaagaaaag ttcatctgcg agctgcaact ggagagactg 480
aacaaggaag gcatcgtgcg gagccactcc aacagattca agaccgccga ctacatcaaa 540
gagatcaaga acctgctgga aacacaggcc aagcagaaca cacttgttac cgaggagttc 600
atcgaaaagt acatcgagat tttcagcggc agaagaaagt actatgaagg ccccggcgga 660
gagagcaagt acggatggaa gggagatatt gaaaagtggt acgaaggcct gatgggcaag 720
tgcacctact tccccaagga actgagatgt gtgaaacatg cctactctgc cgccctgttc 780
aacctgctga atgatctgaa caacctgagc atcaacagag aggaagatac caagctctcc 840
caatacgaaa aagagcagat aattgagaag atctttaagg tgcggaagac ccctaccctg 900
acacagatcg ccaagctgct gaaggtggac cctacaaaca tcaagggctt ccggacaaag 960
gccaacggta cacctgactt cctgagcatc aagatctacc acgacctgaa aggaatcatc 1020
gacgacaagc aacttctcga cgacatcgca ttcctggaca acgtggccca gattctgaca 1080
gtgtggcagg acagccagag catccaggag aagctgaaga ctctgaacaa gaacctggac 1140
gataagacca tcaaggagat cagcgaactg aagaagtaca cccagaccca cagcctgagc 1200
ctgaagctga tcaacgtgct gctgcctgag ctgtgggaga ccacaaaaaa ccagatgacc 1260
atcctgagcg agctgaagct gaagcccaga aaaatcgacc tgcacaattg caacgagatc 1320
cccgtgaaca tgataaacga cctgatcgtg tcccctgtgg tgcggagatc cttgacccaa 1380
agcatcgaga tgatcaacca gattatcaag gactacggcc atcctagaga gatcgttatc 1440
gagctggcca gagaaaaaaa cagcgaggag aagaaaaatt tcatcaagag cctgaacgag 1500
aagaacaaac agatcaatga cgaggtgatc gagaaactga atgccagcaa ccacagggac 1560
aacaagggca tgttcaacaa ggtgaagctg tggattctgc aagacggcca ctgcctgtac 1620
agtctgaagc ctatcaggct ggaagacctg cttaacaacc ccaatcacta cgagatcgac 1680
cacatcatcc ctaagagcgt ttctttcgac gatagcatga gcaacaaggt gctggtgtac 1740
cagatcgaga actctaagaa aggcaataga acaccttacc agtacctgac cagcgctgat 1800
aagacaatca catacgagaa gttcaaggct aacatcaccc aactggccaa gtccaaccac 1860
aagattagca agaagaagtt ggattacctg ttagaggaaa gagatatcaa ccggtttcac 1920
atcaagaagg aatttatcaa tcgcaacctg gtggacaccc ggtacgccac cagaagcctg 1980
atcaacctgc tgaaatacta cttcagcgag aaagatatta atgtgaaggt caaatccatc 2040
aatggcagct tcacagatta cctgcgtaaa ttgtggaact tcccaaagga tagagaattc 2100
taccacaaac accacgccga ggacgccctc atcatcgcta tggccaacaa gatcttcaca 2160
accaggaaaa tcttcaagga acaaaactcc gtgttctcag atgaacagat tctggatggc 2220
gaggtgacaa atatcctctc tgatgatcag ttccaggctg aattcaccga gaagttttac 2280
aaagtgcaag ccatcaagaa atacgacaaa tataaatact cccaccgggt ggacaagaaa 2340
cctaaccggc agctttttga cgacaccctg tacagcacgc gggaattcga gggagaagag 2400
tactacatcg gcaaaattaa ggacatctat aacctgaagg acaaaagact gaaaaagatc 2460
ttcaccaaga gccccgagaa gatcctgatg taccaacacg acagccagac cttcaagaag 2520
ctgaagcaga tcatgagaag ctacgaggac gaggtgaacc ccctggccaa gtaccacaag 2580
gagacaggcg aatacctgag aaaggagtgc aagaaaggca acggccctat agtgaaatcc 2640
ctgaaatata gagtgactaa gctgggcgtg cacaaggaca tcacccacaa gtacgagaac 2700
agcaagaaca aggtcgtgat ccttagcctg aagcccttca gaatggacgt gttcaaggag 2760
aatggagtct acaagtttat caccatcaga tactgtgacc tgaaggaaac cgtgaactct 2820
tacaccatca gcgagcacct gtacaaggcc aagctaaagg ccaaggacat caagagcatg 2880
gacagcttca agtggtcctt ttacaagaac gacctgttgg aatacaacgg cgagctgtgt 2940
accttcaaag gcgttaacga tgacaagaag aacaagattg aagtgaactg ggtggaaaag 3000
aacttcgcca tatacgccga gaagaaaaat ctgaagtcta aacaactggt gaagtctatc 3060
accaagagca ccgtgaagtc cctgttaaag tacaccaccg acatcctggg aaacagatac 3120
cccgtgcgga acgagaagct gaagctgatg atccggaagc agacctttag aggcgacctg 3180
<210> 358
<211> 3270
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 358
atgaacaatc tgctctacag cttcgacatc ggcactaaca gcatcggctg gtgcgtgttc 60
gccctggatg aggttggcga cccttgtaga atcgttgacc tgggcgcccg gatctacgcc 120
gatggcagag atcctcaaac caagacaagc ctggccgtgg ccagaagaga agcacgggcg 180
atgagccggc gacgggaccg aagcctgcgg aggcgcaagg ccacactgcg gaccatgatc 240
gagtacggcc tgatgcctgc ccacaaggtg gaacaggaga cactgctgcg caaaaccggg 300
gacagagaag gaggagacga agggttcaac ccctacgccc tgagagctag agccctgggc 360
gagaagctgc ctccttttta catcggcaga gccctcttcc acctgggcca gcggagaggc 420
ttcaagagca accggaaaac cgacagaaaa gacaacgaca aaggaaaaat cgcacttgga 480
atcgacgagc tgagagccgc tatgcacaga tctggctccc ctaccctggg cgcctggctg 540
gccatgagaa gagcagacgg ccaccctgtg agactgagag ccggcagcga ggtgttcgat 600
gcagagggat acgcttttta ccccgagaga agcctgctgg aggacgaatt cagacaaatc 660
tggaccgccc aggccgtgca tcacccacaa ctgctgacca gcgagcggcg ggcccatctg 720
ttcagagtga tgttctacca gagacctctg aagaagcccc tggtgggcag atgtagcttc 780
aaccccgccg aggctagact gtctagagcc cacccgctgt ttcaggagtt cagactctac 840
aaagaagtga atgacctgga ggtggtgctg cccgaccaga gccacagaaa gctcaccctc 900
gatgaaagaa acgccctggt agcaaagctg aagagttcta gaaaggcctc tttcagcgtg 960
ctgagacgaa ccctcaagct gacccctgac ctggccttca acaaggaaag cgaggcccgg 1020
aaggacctgc tgggcgacga gattaacagc gccctggctg atgccaagat gtttggcgtg 1080
cggtggggcg gctttcctag agcccggcag tgggaaatca tcacacacct gaaggaagaa 1140
gaaaaccccg cccggttgag cgactggctg aaaagcgagt tcggcctgga cgacgagcgg 1200
gtggtggcta tcgccaatat cgccctccca gagggatacg gccgtctcgg cgaaacagcc 1260
ctggcatcta tgctggaaga aatgaagacc gccgtcatcc ccgagagcga agctgctaag 1320
cggtgcggct atgatcattc taatctggcc aaggagcagg acgaggggct cgacatcctg 1380
cctgaatatc aggagatcct ggaacggcat attcctcctg gcaccggcga tcccgatgac 1440
atctacgaca tccggaaggg cagaattaca aaccctacag tccacatcgg actgaaccaa 1500
ctgagaagag tggtcaacgc cctgatcaag agacacggca agcccaggca tatcgtggtg 1560
gaactggcca gagatctgca actgagcgag aaacagaagg ccgacgtgaa cagacgcatc 1620
gccaaaaaca caagagaggc cgagggcaga tcccagaaac tgatcgagat gggccaactg 1680
gacaccggct acaaccggct gctgctgaag ctgtgggagg aactgaatca ggacaagcct 1740
gaggacagag tgtgcatcta ttctgggaag cccatcggaa tcgccatgct gttcagcgga 1800
gaggtggata ttgatcacat cctgccttgg tccaagaccc tggacgatag ccaggccaac 1860
aagctgctgt gcctgaagtc tgctaaccgg caaaagcgga acagaacccc tagcgacgtg 1920
cctgagtgga gagattgcta cgaggaggtc ctggctagag ccgctaggct gcccaagaac 1980
aagcggtggc ggttcgccgc cgacgccatg cagcagttcg aggcagaagg cggcttcctg 2040
gccagacaac tgaccgacac ccagtacctg tcaagaatgg ccttcgagta cctgagcgct 2100
ctgttcccat ctgaagaggc cgataaatgg ggggagctaa gacagcggaa gagagtccac 2160
gtggtgcccg gcagactgac cgagctgctg agaagaaact ggggactgaa caccctgctg 2220
cctgaccaca acctgggcga gatggcccag gagaagaacc ggaaagatca cagacaccac 2280
gccatcgacg ccgccgtgat cggagtgacc tccagatcgc tgctgcagcg gatgtctgga 2340
gccgccgcaa gacttgacga cgtggccttc gacgacctgg tgcggaccgt ggtgaaggac 2400
aatcctcctt ggcctggctt ccgggaagaa ctgcttggtt gtatcaacag agtcaccgtc 2460
agccacaagc cagaccacgg caccgtgagc agagccgcct acgcacaggg caagggccaa 2520
acagccggca aactgcacaa cgacacagct tatggaatca ccggactgca ggacatgaag 2580
ggcagcccac tggtggtgcg gagaaagcct ttcatggccc tggaagtgaa ggacatcgct 2640
tctatcagag atactgagct gcaatctgcc ctgtacgacg ccatcggatc tctgacagag 2700
aagaaggccc tgcaagaagc cctggtgaga ttcagggaca gacacccgca gtttaagggc 2760
atcagaagag tgcgggtgct ggaagctcta agcgtgatcc ctatcgtgga caacaacggc 2820
aaggcctaca agggctacaa gggcgatgct aattacagat acgaggtttg ggagacactg 2880
gatggcagat ggcacaccga agtggtgtcc atgttcgacg cccaccagcc tggctggcag 2940
agccccttcc accggcaaca ccctgccgcc agaagagtgc tgaaactgca gcagaacgac 3000
atggtggcct acgaacaccc ggccgatggc tacaccatcg ctcgggtggt taagttctcc 3060
aacgacaaga gaatctactt cgcctcccac agagagagcg gaagcctgaa ggccagagac 3120
gccgacaagg gggacccctt cacctacttt gccaaggcca acaacggcct gagagacatc 3180
aagtgccggc aagtgaggat cgacgccgcc ggacgggtgt tcgaccctgg acctcaggat 3240
cgagaggcca gacagtctaa gggaagagcc 3270
<210> 359
<211> 3324
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 359
atggccattc ggagcatcaa gctcaagctg aagaccagaa ccggtcctga ggctcagaac 60
ctgcggaagg gcatctggag aacccaccgg ctgctgaacg agggcgtggc ctactacatg 120
aagatgctgc tgctcttccg gcaggaatcc actggcggcc agacaaagaa ggaactgcag 180
gaggaactgg tgcggcacat ccgggagcag cagcagaaaa acagagccga caagaatacc 240
caggccctgc ctctggataa ggccttcgcc gctctgagac aactgtacga gctgctcgtg 300
ccatctagca tcggccagag cggcgatgcc cagatcatct ctagaaaatt cctgtctcct 360
ttggtggacc ctaacagcga gggcggcaag ggcactagca aggccggagc caagcccaca 420
tggcagaaaa agaaggaggc caatgaccct acatgggagc aagattacga gaagtggaaa 480
aagcgtagag aggaagatcc taccgccagt gtgataacaa ccctggaaga atatggaatt 540
agacctatct ttccactgta caccaacacc gtggccgata tcgcctggct gcctctgcag 600
tctaaccagt ttgtccggac atgggatcgg gacatgctgc agcaggccat cgagaggcta 660
ctctcttggg agtcttggaa caagcgggtg caagaggaat acagcaagct gcaggagaag 720
atgacgcaac tgaacgagca actggagggc ggacaggagt ggatcagcct gctggaacaa 780
tacgaggaac agagagagca ggagctgatc gaaaacatga ccgccgcaaa cgataaatac 840
cgcatcacca agcggcagat gaagggctgg aatgagctgt atgagcagtg gtctaccgtg 900
ctgcccaatg ccagccacga gcagtacaga gaggcactga aaagagtgca acagcggctg 960
aggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaagaaga acaccacctg 1020
atctggaagg ggaaccctca gagaatccac tacttcgtgg ccagaaacga gctgaagaaa 1080
agactggaag aagccaagca gaacgccacc atgaccctgc ctgatgccag aaagcaccct 1140
ctgtgggtca gatttgacgc cagaggcggc aacctgcaag actactacct gacggccgaa 1200
gccgacaacc ccagaagcag aaggttcgtg accttcagcc aactgatctg gcctaacgag 1260
agcggctgga tggaaaaaca ggacgtggaa gttgaactgg ccctgagcaa gcagttctac 1320
cagcaagtga cactgcagaa aaacgacaag gggaagcagg aaatcgagtt caaagacaag 1380
ggcagtggca gcaccttcag cggccacctg ggcggggcca agctgcaact ggagagagga 1440
gatctggaga aggaagaaaa agactttgaa ggcggcgaaa tcggcagcgt gtacctgaac 1500
atcgtgatcg acttcgagcc actgcaggag gtgaagaacg gccgactgca atctccttac 1560
ggccaggtgc tgcaactggt cagaaggcct aatgagttcc ccaaggtgac cacctacaag 1620
tctgaggaac tggtcgagtg gatcaagagc agcaccaagg acagcgccgg cgtggagtcc 1680
ttagagagcg gttttagagt gatgagcatc gacctgggac tgcggaccgc cgccgcaaca 1740
agcatcttct ctgtagagga atccaacgac gccaacgccg cgggtttcag ctactggatc 1800
gagggaactc ctctggttgc cgttcataag cggtcatata tgctgaaact gcccggagag 1860
caagtcgaaa agcaggtgcg agagaagcgg gacgagcggc aggatcagca gagaagagtg 1920
aggttccaaa tcagaatcct gagccaggtg atccggatgg ccaagaagca gaaccgggag 1980
cgggctgatg agctggacca cctgtcccag gccctggaga agcaaaaatc tctgctggac 2040
cagaccgatc ggaccttttg gaacggcatc gtgtgcgacc tgacagacgc tctgagagag 2100
aaagagggcg gatgggaaca ggccgtggtc cagatccaca ggaaggccga ggagcacgtg 2160
ggcaaggtgg tgcaagcctg gcggaaacgg ttcgacgccg atgaacgcaa gggcatcgcc 2220
ggcctgtcta tgtggtctat cgaggagctg gacagcctgc ggaagctgct gatctcttgg 2280
agcagaagaa caagaaaccc cagagaaatc aactgcttcg agcagggcca caccagccac 2340
cagcggctgc tgacacacat ccagaacgtg aaggaggacc ggctgaagca actgagccac 2400
gccattgtga tgacagcctt gggctacgtg tacgacgaga agaaattgga atggtttgcc 2460
aagtaccctg cttgtcaggt gatcctgttc gagaacctgt cccagtaccg gtccaacatg 2520
gacagaagca ccaaagagaa tagcaccctg atgaaatggg cccacaggag catccctaag 2580
tacgtgcaca tgcaggccga gccttacggc atccagatcg gcgatgtgcg ggccgagtac 2640
tccagcagat tccacgccaa gacaggcaca cctggcatcc ggtgcaagat ggtgtccgga 2700
cacgacctgc aaggcaggcg cttcgagaac ctgcagaagc ggttaatctc tgaacagttc 2760
ctgacagagg agcaagtgaa gcagctcaga cccggcgaca tcgtgcccga cgactccggc 2820
gagtggttca tgaccctgag cgacggcagc gaaggcaaag aggttgtgtt cctccaagcc 2880
gacatcaacg ccgcccaaaa tctgcaaaag agattctggc agcggtacaa cgagctgttt 2940
aaggtctcct gcagagtgct gatccgagga gaagaggaat acctgatccc caagacaaag 3000
tccgtgcaag ccaagctggg caaaggcctg ttcgtgaaaa aaaccgacac cgtgatgaag 3060
gacgtgtacg tgtgggacag ccaggctaag ctgaagggca aaaccacatt caccgaggag 3120
tccgaaagcc ctgagcaact ggaggatttt caggagatca tcgaagaagc cgaagaagct 3180
aagggcacat acagaacact gtttagagac cccagcggag tgttcttccc tgagttcgtg 3240
tggtccaccc agaaagattt ctggtccgag gtgaagagac ggctgtacgg caagctgaga 3300
gagcggttcc tgatgaagac cagg 3324
<210> 360
<211> 3324
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 360
atggccatca gatctatcaa gctgaagctc aagaccagaa caggtcctga ggcccagaac 60
ctgcggaagg gcatttggcg gacacaccgc ctcctcaacg agggcgtcgc ctattatatg 120
aaaatgctgc tgctgttcag acaggagagc acaggcggcc agaccaagaa agagctgcag 180
gaagaactgg tccggcacat cagagagcag cagcagaaga atcgggccga caagaacacc 240
caggccctgc ctctggacaa ggcttttgcc gctctgcggc agctctacga gctgctggtg 300
ccttcttcta tcggccagag cggagacgcg cagatcatca gcagaaagtt cctgtcccct 360
ctcgtggacc ccaacagcga gggcggcaag ggcacatcta aagctggcgc caagcctaca 420
tggcagaaaa agaaggaggc caacgacccc acctgggaac aggattacga gaaatggaag 480
aagcggagag aggaggaccc taccgccagc gtgattacca ccctggaaga atacggcatc 540
agaccaatct tcccactgta caccaacacc gtggccgaca tcgcctggct gcctctgcag 600
tccaaccagt tcgtgcggac atgggacaga gacatgctgc agcaggctat cgagagactg 660
ctgagctggg aaagctggaa caagagagtg caagaggaat acagcaagct gcaagagaag 720
atgacacagc tcaacgagca actggagggc ggccaggagt ggatcagcct gctggaacag 780
tacgaggagc aacgggagca ggagctgatc gagaacatga ccgccgctaa cgacaaatat 840
agaataacaa agcggcagat gaagggctgg aacgagctgt acgagcagtg gagcaccgtg 900
ctgcccaatg cctctcacga gcagtaccgg gaagccctta agcgggtcca gcaaagactg 960
cggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaggaaga gcaccacctg 1020
atttggaagg gcaaccccca gagaatccac tactttgtgg ccagaaacga gctgaagaaa 1080
agactggaag aggccaagca gaacgccact atgaccctgc cagacgccag aaagcacccc 1140
ctgtgggtgc ggttcgacgc cagaggcgga aatctgcagg actactacct gaccgccgag 1200
gccgataacc ccagatctag aagattcgtt acctttagcc agttgatctg gcctaacgag 1260
tccggctgga tggaaaagca ggacgtggaa gtggaactcg ccctgagcaa gcagttctac 1320
cagcaagtga ccctgcagaa gaacgataag gggaaacagg agatcgagtt taaggacaag 1380
ggctccggat ctacgttcag tggccatctg ggcggggcta agctgcaact ggagcgaggc 1440
gacctggaga aagaagagaa ggactttgag ggcggagaaa tcggaagcgt gtacctgaac 1500
atcgtgatcg acttcgagcc cttgcaggag gtgaaaaacg gcagactgca gagcccatac 1560
ggccaggtgc tgcagctcgt tcggagacct aatgagttcc ctaaggtgac cacatacaag 1620
tctgaagaac ttgttgagtg gatgaaggcc agccagaatc acagcagcgg cgtggagtct 1680
ctggagtcgg gcttcagagt gatgagcatc gatctgggac tgaggacagc cgctgccacc 1740
agcattttct ctgtggaaga aagcaacgat gccaacgccg ctggcttcag ctactggatc 1800
gagggcaccc ctctggtcgc cgtgcacaag agaagctaca tgctgaagct gccaggcgaa 1860
caagtggaaa aacaggtgcg ggaaaagaga gatgagagac aagaccagca gaggcgcgtc 1920
agatttcaga tcagaatcct gagccaggtg atcaggatgg ccaagaaaca aaacagagaa 1980
agagctgacg aactggacca cctgagccag gcactggaga agcagaagtc cctgctcgat 2040
cagaccgata gaaccttctg gaacggcatc gtttgtgacc tgaccgatgc gctgcgcgaa 2100
aaggagggag gctgggagca agccgtggtc caaatccaca gaaaggccga ggaacacgtg 2160
ggcaaggtgg tgcaagcctg gcggaaaaga tttgacgccg atgagcggaa gggcatcgcc 2220
ggcctgagca tgtggtccat agaagagctg gacagcctcc ggaagctgct cattagctgg 2280
agcagaagga caagaaaccc tcaggagatc aacagattcg agcagggcca cacctctcac 2340
cagcggctgc tgacacatat ccagaacgtg aaggaagata gactgaagca actgagccac 2400
gccatcgtga tgaccgccct gggctacgtg tacgacgaga agaagctgga gtggttcgcc 2460
aaataccccg cctgccaggt gatcctgttc gagaatctgt ctcagtacag aagccacatg 2520
gacagatcca cgaaggaaaa tagcaccctg atgaaatggg cccacagaag catccctaag 2580
tacgtccaca tgcaggccga gccttacgga atccagatcg gagatgtgag agccgaatat 2640
agcagcaggt tccacgccaa gacagggaca cctggcatcc gttgcaagat ggtgaaggga 2700
caagaactgc aaggcaagcg attcgagaac ctgcaaaaga gactggtgtc cgaacagttt 2760
ctgaccgagg aacaggtgaa gcagcttcgg cctggagata tcgtgccaga tgacagcgga 2820
gagtggttca tgaccctgag tgatggcagc gaaggcaagg aagtggtgtt cctgcaagcc 2880
gacatcaacg ccgcccagaa ccttcagaaa cgattctggc agagatacaa cgaactgttc 2940
aaggtgtcat gcagagtgct gatcagaggc gaggaagagt acctgatccc caaggccaag 3000
agcgtgcaag ccaaactcgg caagggactg ttcgtgaaga aaaccgacac cgtgatgaag 3060
gacgtgtacg tgtgggatag ccaggccaaa ctgaagggca aaacaacctt caccgaggaa 3120
agcgagagcc ctgagcaact ggaggacttc caggagatca tcgaagaagc cgaggaagcc 3180
aagggcacct acagaacact gtttagagat cctagcggcg ttttcttccc cgagttcgtg 3240
tggaataccc agaaagactt ctggtccgag gtgaagagaa ggctgtacgg caagctgcgc 3300
gagagattcc tgatgaagac ccgg 3324
<210> 361
<211> 3336
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 361
atggccatta gatccatcaa gctgaaaatg aagaccaact ccggcaccga cagcatctac 60
ctgcggaagg ccctgtggag aacacaccaa ctgatcaacg agggcatcgc ctactacatg 120
aacctgctga cactgtacag acaggaggct attggcgata agaccaagga ggcctaccag 180
gctgaactga tcaacattat cagaaaccaa cagagaaaca acggcagctc tgaagagcac 240
ggctctgacc aggagatcct ggccctgctc agacaactct acgagctgat cattcccagc 300
agcatcggcg agagcggcga tgccaaccaa ctgggcaaca aattcctgta tcctttagtt 360
gaccccaaca gccagagcgg caagggcaca agcaacgccg gcagaaaacc tagatggaag 420
cggctgaagg aggaaggcaa ccctgactgg gagctggaga agaaaaagga cgaggaacgg 480
aaggctaaag acccaaccgt gaagatcttc gacaacctga acaagtacgg cctgctgcct 540
ctgttccccc tgtttaccaa catccagaag gacatcgagt ggctgcctct gggcaaacgc 600
cagagcgtga ggaagtggga caaggatatg ttcatccagg ccatcgagcg gctgctgagc 660
tgggaatctt ggaatcggcg ggtggccgat gagtacaagc aactgaagga aaagaccgag 720
agctactaca aggaacacct gaccggcgga gaggagtgga tcgaaaaaat ccggaagttc 780
gagaaggaga gaaacatgga attagaaaag aacgccttcg cccctaacga cggatacttc 840
atcaccagca gacagatcag gggctgggat agagtttacg agaagtggtc caagctgccc 900
gagagcgcca gcccagaaga actgtggaag gtagtggccg agcagcaaaa caagatgagc 960
gagggattcg gcgaccctaa ggtgttcagc ttcctggcaa accgagaaaa cagagatatc 1020
tggagaggcc actctgaacg gatctaccac atcgccgcct acaacggcct gcagaagaaa 1080
ctgtccagaa caaaggaaca agccacattc accctgcccg acgccataga acatcctctg 1140
tggatcagat atgagtctcc aggaggcacc aatctcaact tgttcaagct ggaggaaaag 1200
cagaaaaaga actactacgt gaccctgagc aagatcatct ggcctagcga ggagaaatgg 1260
atcgaaaagg aaaatatcga gatccccctg gcccctagca tccagtttaa tagacagatc 1320
aagctgaaac agcacgtgaa aggtaagcaa gagatctcat ttagcgacta cagcagccgg 1380
atcagcctgg atggagtgct gggaggctct agaatccagt tcaaccggaa atacatcaag 1440
aaccacaagg aactgttagg agaaggcgat attggtcctg tgttcttcaa cctggtggtg 1500
gacgtggctc ctctgcagga aaccagaaat ggcagactgc agtctcctat cggcaaggcc 1560
ctgaaggtga tctccagcga cttcagcaag gtgatcgact acaagcctaa ggaactgatg 1620
gactggatga ataccggcag cgcctctaat agtttcggcg tggccagcct gctggaaggc 1680
atgcgggtga tgtctatcga catgggacag agaacctcag ctagcgtgtc tattttcgag 1740
gtcgtcaagg agctgcccaa ggaccaggag cagaaactct tctacagcat caacgacacc 1800
gaactgtttg ccatccacaa aagatccttt ctgctgaacc tgcccgggga ggtggtgaca 1860
aagaacaaca agcagcagcg gcaagaaaga agaaagaaga gacagttcgt gcggagccag 1920
atccggatgc tggccaatgt gctgagactg gaaacaaaga agacacctga cgagagaaag 1980
aaagccatcc acaagctgat ggaaatcgtg caaagctacg atagctggac agccagccag 2040
aaagaggtgt gggaaaagga gctgaacctg ctgaccaaca tggctgcctt caatgacgag 2100
atctggaagg aaagtctggt cgaactgcac cacagaatcg agccttacgt gggccagatc 2160
gtcagcaagt ggcggaaggg cctgagcgag ggcagaaaga acctggctgg catcagcatg 2220
tggaacattg atgaacttga agatacaaga agactgctta tctcttggag caagagatct 2280
cggacacctg gcgaggccaa tagaatcgag acagatgaac ccttcggcag cagcctgctc 2340
caacacatcc agaacgtgaa ggacgataga ctgaagcaaa tggccaacct gatcatcatg 2400
accgccctgg gctttaagta cgataaggaa gaaaaggacc ggtacaagcg gtggaaagag 2460
acataccccg cctgtcagat catcctgttc gagaacctga acagatacct gtttaacctg 2520
gacagaagca gacgggagaa cagccggctg atgaaatggg cccaccggtc cattccaaga 2580
accgtgtcca tgcagggcga gatgttcgga ctgcaagtgg gcgatgtgcg gagcgagtat 2640
agctccagat tccacgccaa gaccggagcc ccaggcatca gatgccacgc tctgacagag 2700
gaagatctga aggccggcag caacaccctg aagcggttga tcgaggatgg cttcatcaac 2760
gaaagcgaat tggcctatct gaagaagggc gacattatcc cttctcaagg cggagaactg 2820
ttcgtgaccc tgtctaagag atacaagaaa gacagcgaca acaacgagct gactgtgatt 2880
cacgccgaca tcaacgccgc ccagaacctg cagaagcggt tctggcagca gaacagcgag 2940
gtgtatagag tgccttgcca actggccaga atgggcgaag ataagctcta catccctaag 3000
tctcagaccg agacgatcaa gaagtacttt ggcaaaggca gcttcgtgaa gaacaatacc 3060
gagcaggaag tgtacaagtg ggagaagagc gaaaagatga agattaagac agacaccacc 3120
tttgacctgc aagatctgga cggcttcgag gacattagca agaccatcga gctagctcag 3180
gagcaacaga agaagtacct gactatgttc agagaccctt ctggctactt cttcaacaac 3240
gagacatggc gcccccagaa ggagtactgg tccatcgtga acaacatcat caagtcctgc 3300
ctgaagaaga agattctgag caacaaggtg gaactc 3336
<210> 362
<211> 3324
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 362
atggccatca gatctatcaa gctgaagctc aagaccagaa caggtcctga ggcccagaac 60
ctgcggaagg gcatttggcg gacacaccgc ctcctcaacg agggcgtcgc ctattatatg 120
aaaatgctgc tgctgttcag acaggagagc acaggcggcc agaccaagaa agagctgcag 180
gaagaactgg tccggcacat cagagagcag cagcagaaga atcgggccga caagaacacc 240
caggccctgc ctctggacaa ggcttttgcc gctctgcggc agctctacga gctgctggtg 300
ccttcttcta tcggccagag cggagacgcg cagatcatca gcagaaagtt cctgtcccct 360
ctcgtggacc ccaacagcga gggcggcaag ggcacatcta aagctggcgc caagcctaca 420
tggcagaaaa agaaggaggc caacgacccc acctgggaac aggattacga gaaatggaag 480
aagcggagag aggaggaccc taccgccagc gtgattacca ccctggaaga atacggcatc 540
agaccaatct tcccactgta caccaacacc gtggccgaca tcgcctggct gcctctgcag 600
tccaaccagt tcgtgcggac atgggacaga gacatgctgc agcaggctat cgagagactg 660
ctgagctggg aaagctggaa caagagagtg caagaggaat acagcaagct gcaagagaag 720
atgacacagc tcaacgagca actggagggc ggccaggagt ggatcagcct gctggaacag 780
tacgaggagc aacgggagca ggagctgatc gagaacatga ccgccgctaa cgacaaatat 840
agaataacaa agcggcagat gaagggctgg aacgagctgt acgagcagtg gagcaccgtg 900
ctgcccaatg cctctcacga gcagtaccgg gaagccctta agcgggtcca gcaaagactg 960
cggggcagat tcggcgacgc tcatttcttc cagtatctga tgaaggaaga gcaccacctg 1020
atttggaagg gcaaccccca gagaatccac tactttgtgg ccagaaacga gctgaagaaa 1080
agactggaag aggccaagca gaacgccact atgaccctgc cagacgccag aaagcacccc 1140
ctgtgggtgc ggttcgacgc cagaggcgga aatctgcagg actactacct gaccgccgag 1200
gccgataacc ccagatctag aagattcgtt acctttagcc agttgatctg gcctaacgag 1260
tccggctgga tggaaaagca ggacgtggaa gtggaactcg ccctgagcaa gcagttctac 1320
cagcaagtga ccctgcagaa gaacgataag gggaaacagg agatcgagtt taaggacaag 1380
ggctccggat ctacgttcag tggccatctg ggcggggcta agctgcaact ggagcgaggc 1440
gacctggaga aagaagagaa ggactttgag ggcggagaaa tcggaagcgt gtacctgaac 1500
atcgtgatcg acttcgagcc cttgcaggag gtgaaaaacg gcagactgca gagcccatac 1560
ggccaggtgc tgcagctcgt tcggagacct aatgagttcc ctaaggtgac cacatacaag 1620
tctgaagaac ttgttgagtg gatgaaggcc agccagaatc acagcagcgg cgtggagtct 1680
ctggagtcgg gcttcagagt gatgagcatc gatctgggac tgaggacagc cgctgccacc 1740
agcattttct ctgtggaaga aagcaacgat gccaacgccg ctggcttcag ctactggatc 1800
gagggcaccc ctctggtcgc cgtgcacaag agaagctaca tgctgaagct gccaggcgaa 1860
caagtggaaa aacaggtgcg ggaaaagaga gatgagagac aagaccagca gaggcgcgtc 1920
agatttcaga tcagaatcct gagccaggtg atcaggatgg ccaagaaaca aaacagagaa 1980
agagctgacg aactggacca cctgagccag gcactggaga agcagaagtc cctgctcgat 2040
cagaccgata gaaccttctg gaacggcatc gtttgtgacc tgaccgatgc gctgcgcgaa 2100
aaggagggag gctgggagca agccgtggtc caaatccaca gaaaggccga ggaacacgtg 2160
ggcaaggtgg tgcaagcctg gcggaaaaga tttgacgccg atgagcggaa gggcatcgcc 2220
ggcctgagca tgtggtccat agaagagctg gacagcctcc ggaagctgct cattagctgg 2280
agcagaagga caagaaaccc tcaggagatc aacagattcg agcagggcca cacctctcac 2340
cagcggctgc tgacacatat ccagaacgtg aaggaagata gactgaagca actgagccac 2400
gccatcgtga tgaccgccct gggctacgtg tacgacgaga agaagctgga gtggttcgcc 2460
aaataccccg cctgccaggt gatcctgttc gagaatctgt ctcagtacag aagccacatg 2520
gacagatcca cgaaggaaaa tagccgcctg atgaaatggg cccacagaag catccctaag 2580
tacgtccaca tgcaggccga gccttacgga atccagatcg gagatgtgag agccgaatat 2640
agcagcaggt tccacgccaa gacagggaca cctggcatcc gttgcaagat ggtgaaggga 2700
caagaactgc aaggcaagcg attcgagaac ctgcaaaaga gactggtgtc cgaacagttt 2760
ctgaccgagg aacaggtgaa gcagcttcgg cctggagata tcgtgccaga tgacagcgga 2820
gagtggttca tgaccctgag tgatggcagc gaaggcaagg aagtggtgtt cctgcaagcc 2880
gacatcaacg ccgcccagaa ccttcagaaa cgattctggc agagatacaa cgaactgttc 2940
aaggtgtcat gcagagtgct gatcagaggc gaggaagagt acctgatccc caaggccaag 3000
agcgtgcaag ccaaactcgg caagggactg ttcgtgaaga aaaccgacac cgtgatgaag 3060
gacgtgtacg tgtgggatag ccaggccaaa ctgaagggca aaacaacctt caccgaggaa 3120
agcgagagcc ctgagcaact ggaggacttc caggagatca tcgaagaagc cgaggaagcc 3180
aagggcacct acagaacact gtttagagat cctagcggcg ttttcttccc cgagttcgtg 3240
tggaataccc agaaagactt ctggtccgag gtgaagagaa ggctgtacgg caagctgcgc 3300
gagagattcc tgatgaagac ccgg 3324
<210> 363
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 363
cccagcccta ggttgtttat t 21
<210> 364
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 364
ctggctacat cttccttgac tac 23
<210> 365
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 365
gagctgcaca tttgacgagc 20
<210> 366
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 366
attacaggtg tgagccacgg 20
<210> 367
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 367
accagaacat gcctgatggg 20
<210> 368
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 368
gcccctcaat catctctggg 20
<210> 369
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 369
cccacccttt gagagtgcat 20
<210> 370
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 370
gattgaaggg cagagggagg 20
<210> 371
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 371
gagatgtccc cagtgaactc caaat 25
<210> 372
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 372
cctgtcgttg cccctcccag atcat 25
<210> 373
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 373
gtctgattgc ctgtcgttgc ccctcccaga tcatggagga gttggcaga 49
<210> 374
<211> 192
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 374
Met Glu Pro Trp Arg Pro Ser Pro Arg Asn Pro Met Asp Arg Ile Asp
1 5 10 15
Pro Asn Thr Phe Arg Phe His Phe Pro Asn Leu Leu Tyr Ala Ser Gly
20 25 30
Arg Lys Leu Cys Tyr Leu Cys Phe Gln Val Glu Thr Gly Asp Tyr Phe
35 40 45
Ser Cys Asp Asp Ser Asp Arg Gly Val Phe Arg Asn Lys Val His Pro
50 55 60
Trp Ala Arg Cys His Ala Glu Gln Cys Phe Leu Ser Trp Phe Arg Asp
65 70 75 80
Gln Tyr Pro Cys Arg Asp Glu Tyr Tyr Asn Val Thr Trp Phe Leu Ser
85 90 95
Trp Ser Pro Cys Pro Thr Cys Ala Glu Glu Val Val Glu Phe Leu Glu
100 105 110
Glu Tyr Arg Asn Leu Thr Leu Ser Ile Phe Thr Ser Arg Leu Tyr Tyr
115 120 125
Phe Tyr His Pro Asn Tyr Gln Gln Gly Leu Arg Lys Leu Trp Asp Ala
130 135 140
Gly Val Gln Leu Asp Ile Met Ser Cys Asp Asp Phe Glu His Cys Trp
145 150 155 160
Asp Asn Phe Val Asp His Lys Gly Met Arg Phe Gln Arg Arg Asn Leu
165 170 175
Leu Lys Asp Tyr Asp Phe Leu Ala Ala Glu Leu Gln Glu Ile Leu Arg
180 185 190
<210> 375
<211> 398
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 375
Met Gln Glu Lys Glu Val Leu Asn Ser Leu Arg Cys Asn Thr Gln Ser
1 5 10 15
Ile Glu Glu Glu Ile Gln Ile Asn Thr Leu Leu Asn Lys Thr Lys Arg
20 25 30
Asn Arg Ile Lys Ile Asn Asn Leu Asp Glu Phe Lys Asp Val Leu Lys
35 40 45
Lys Glu Gly Tyr Glu Ile Asn Glu Phe Asp Glu Glu Lys Phe Lys Glu
50 55 60
Asp Leu Val Lys Ile Phe Gln Val Asp Asn Gly Val Ile Glu Asn Leu
65 70 75 80
His Thr Tyr Ile Asn Asn Pro Glu Ile Ser Tyr Lys Val Tyr Asp Thr
85 90 95
Ser Asp Leu Ile Asp Tyr Ile Lys Lys Met Ile Leu Phe Glu Asn Glu
100 105 110
Tyr Asn Arg Leu Cys Lys Lys Ile Ser Ser Val Lys Lys Leu Asp Ile
115 120 125
Asp Arg Val Glu Tyr Glu Arg Glu Phe Ser Leu Gln Asp Asn Val Glu
130 135 140
Asp Ile Ile Lys Ala Ile Glu Glu Ile Lys Asp Asp Ile Ser Gly Ile
145 150 155 160
Ile Ser Lys Glu Gly Lys Thr Arg Leu Glu Asn Leu Glu Arg Glu Ile
165 170 175
Asn Lys Glu Tyr Leu Tyr Ala Lys Asp Ile Glu Leu Leu Lys Lys Met
180 185 190
Val Ile Ile Glu Asn Glu Asn Val Lys Glu Lys Tyr Asn Ile Glu Ser
195 200 205
Lys Ile Lys Thr Ile Ser Ile Lys Ile Pro Lys Lys Ile Asn Tyr Glu
210 215 220
His Ile Val Ala Lys Lys Gly Ser Val Glu Tyr His Asp Tyr Leu Ser
225 230 235 240
Ser Asn Ile Pro Arg Met Gln Arg Leu Ile Lys Asn Ile His Lys Tyr
245 250 255
Met Lys Val Asp Glu Lys Glu Lys Ser Thr Phe Lys Ile Asn Gln Ser
260 265 270
Lys Ala Leu Gln Asp Ser Ile Asn Ile Ala Val Ala Thr Tyr Asp Asn
275 280 285
Lys Glu Phe Lys Ala Ile Ser Gly Ser Asn Asp Ile Lys Asn Tyr Cys
290 295 300
Arg Arg Thr Pro Leu Glu Asn Ala Thr Phe Lys Ser Ser Lys Val Asn
305 310 315 320
Lys Leu Gly Asn Leu Gly Ile Gly Tyr Asn Arg Val Asn Asp Ser Glu
325 330 335
Lys Lys Ile Phe Glu Glu Ile His Arg Gln Ile Glu Lys Asn Thr Leu
340 345 350
Lys Asp Glu Gly Asn Leu Ile Leu Tyr Thr Lys Leu Glu Pro Cys Pro
355 360 365
Ser Cys Tyr Tyr Val Ile Ser Gln Phe Cys Lys Lys His Pro Asn Ile
370 375 380
Lys Val Gln Ile Lys Tyr Ser Glu Lys Tyr Gly Glu Trp Arg
385 390 395
<210> 376
<211> 201
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 376
Met Glu Glu Lys Lys Leu Ala Leu Val Ser Lys Ile His Tyr Glu Leu
1 5 10 15
Glu Asp Lys Gly Ile Glu Leu Arg Asn Leu Ala Leu Ile His Lys Asp
20 25 30
Arg Thr Glu Leu Leu Ala Arg Ile Lys Ala Lys Ser Arg Lys Arg Pro
35 40 45
Ile Tyr Phe Tyr Arg Tyr Leu Glu Asp Leu Pro Glu Phe Leu Gly Gly
50 55 60
Asn Asp Ala Val Leu Glu Tyr Ile Pro Asn Gly Asp Asn Thr Asn Lys
65 70 75 80
Lys Ile Tyr Phe Ala Asn Ser Phe Val Asn Tyr Thr Asp Ser Pro Phe
85 90 95
Ser Asp Ile Tyr Ile Glu Phe Thr Asp Ser Val Tyr Val Leu Ile Pro
100 105 110
Glu Asp Lys Lys Phe Asp Ala Ile Ile Thr Asn Arg Asp Arg Glu Ile
115 120 125
Gly Asn Gly His Leu Arg Glu Asn Asp Thr Glu Tyr Lys Leu Met Val
130 135 140
Glu Ile Ser Asp Lys Ile Asp Thr Thr Val Pro Gly His Ile Asn Ile
145 150 155 160
Tyr Thr Tyr Tyr Glu Pro Cys Leu Ser Cys Asp Asn Val Phe Ile Gln
165 170 175
Phe Ser Lys Lys Phe Pro Asn Val Ser Val Asn Val Tyr Phe Ser Asp
180 185 190
Glu Tyr Lys Ser Lys Lys Trp Val Val
195 200
<210> 377
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 377
Met Ser Leu Leu Thr Ala Glu Thr Phe Ser Leu Gln Phe Asn Asn Arg
1 5 10 15
Arg Gln Arg Arg Lys Lys Gly Thr Tyr Tyr Pro Lys Arg Thr Tyr Leu
20 25 30
Cys Tyr Gln Leu Thr Pro Arg Asn Gly Ser Thr Pro Thr Arg Gly Tyr
35 40 45
Phe Lys Asn Lys Lys Asn Cys His Val Glu Ile Cys Phe Ile Asp Lys
50 55 60
Ile Ala Ser Met Glu Leu Asp Lys Thr Gln Cys Tyr Asp Val Thr Cys
65 70 75 80
Tyr Leu Thr Trp Ser Pro Cys Pro Ser Cys Ala Gln Lys Leu Ala Ala
85 90 95
Phe Ala Lys Ala Gln Asp His Leu Asn Leu Arg Ile Phe Ala Ser Arg
100 105 110
Leu Tyr Tyr His Trp Arg Arg Ser Tyr Gln Lys Gly Leu Gln Leu Leu
115 120 125
Trp Glu Ser Gln Ile Pro Val Glu Val Met Gly Leu Pro Glu Phe Thr
130 135 140
Asp Cys Trp Glu Asn Phe Val Asp His Gly Lys Pro Pro Pro Phe Asn
145 150 155 160
Pro Ser Glu Lys Leu Gln Lys Leu Gly Glu Ala Ser Gln Ser Ile Lys
165 170 175
Arg Arg Leu Glu Arg Ile Lys Val Arg Arg Cys Pro Ala Ala Ala His
180 185 190
Cys Leu Leu Thr Ala Arg Leu Gly Pro Thr Pro Asp His Ala Ser Ala
195 200 205
His Cys Ser Ser Pro Tyr Phe Phe Phe Leu Leu Tyr Leu Phe Tyr Ser
210 215 220
Ile His Pro Ile Ile Lys Tyr His Arg Leu Gly Asp Ser
225 230 235
<210> 378
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 378
Met Ala Ala Val Thr Asn Arg Asp Ser Ala Cys Arg Glu Asn Asn Gln
1 5 10 15
Arg Trp Lys Ile Gln Pro Asn Asp Phe Arg Arg Asn Tyr Leu Pro Asp
20 25 30
Lys Gln Pro Arg Val Val Tyr Leu Leu Tyr Glu Ile Arg Trp Arg Arg
35 40 45
Gly Thr Ile Trp Arg Asn Trp Cys Ser Asn Asn Pro Asn Gln His Ala
50 55 60
Glu Val Asn Phe Leu Lys Asn Tyr Phe Asn Ala Met Pro Ser Val Ser
65 70 75 80
Cys Ser Ile Thr Trp Val Leu Ser Thr Thr Pro Cys Gly Lys Cys Ser
85 90 95
Ile Lys Ile Met Glu Phe Leu Lys Leu His Pro Asn Val Thr Leu Glu
100 105 110
Ile Tyr Ala Ala Lys Leu Phe Lys His Leu Asp Ile Arg Asn Arg Glu
115 120 125
Gly Leu Arg Asn Leu Ala Lys Asn Gly Val Ile Ile His Ile Met Asn
130 135 140
Leu Ala Asp Tyr Ser Tyr Trp Trp Lys Ile Phe Val Thr Arg Gln His
145 150 155 160
Gly Glu Glu Asp Tyr Leu Pro Trp Ser Phe Ala Leu His Ile Phe Leu
165 170 175
Asn Cys Ile Glu Phe Gln Gln Ile Leu Leu Gly Leu Pro Pro Leu Leu
180 185 190
Pro Asn Phe Lys Tyr
195
<210> 379
<211> 333
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 379
Met Pro Cys Val Leu Gly Leu Cys Lys His Leu Ser Glu Thr Ser Ala
1 5 10 15
Val His Cys Pro Ala Leu Leu Ile Ala Leu Arg Gln Ala Val Glu Arg
20 25 30
Leu Leu Ala Pro Leu Leu Gln Asp Pro Leu Tyr Ile Thr Ala Thr Thr
35 40 45
Leu Asp Pro Gln Phe Lys Leu Ser Trp Ser Asn Asn Thr Asp Cys Leu
50 55 60
Gln Thr Val Met Ala Asp Arg Ser Arg Ile Gly Ala Lys Lys Lys Glu
65 70 75 80
Lys Ser Asp Glu Lys Ala Leu Asp Lys Asp Lys Thr Lys Glu Lys Asn
85 90 95
Ala Lys Lys Pro Asp Lys Val Val Lys Lys Ser Glu Lys Leu Pro Glu
100 105 110
Lys Thr Leu Glu Lys Thr Ser Glu Gln Ser Lys Ala Asp Glu Glu Ser
115 120 125
Arg Thr Thr Glu Ala Glu Gly Ala Thr Gly Ser Thr Asn Glu Glu Asn
130 135 140
Gly Glu Phe Gln Pro Ile Glu Leu Pro Pro Phe Glu Ile Val Lys Gly
145 150 155 160
Glu Gln Met Ser Pro Phe Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu
165 170 175
Tyr Ser Ser Gly Arg Asn Lys Thr Leu Leu Cys Tyr Arg Val Asp Thr
180 185 190
Ala Gly Gly Ser Thr Glu Pro Leu Lys Gly Tyr Met Glu Asp Glu His
195 200 205
Thr Thr Ala His Ala Glu Glu Ala Phe Phe Gln Gln Val Leu Pro Asp
210 215 220
Ser Ser Gln His His Asp Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
225 230 235 240
Ala Asp Cys Ala Ala Lys Leu Ala Ser Ile Leu Cys Gln Arg Lys Asn
245 250 255
Leu Lys Leu Cys Val Phe Cys Ser Arg Leu Phe Glu Trp Glu Glu Pro
260 265 270
Glu Ile Val Glu Gly Leu Arg Ala Leu Val Thr Ala Gly Cys Lys Leu
275 280 285
Arg Met Met Lys Pro Ser Asp Phe Met His Val Trp Glu Thr Tyr Val
290 295 300
Asp Lys Glu Glu Gln Asn Phe Ser Pro Trp Glu Asp Cys Gln Asp Asn
305 310 315 320
Tyr Asn Tyr Tyr Val Glu Lys Leu Ala Glu Ile Leu Lys
325 330
<210> 380
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 380
Met Ala Phe Gly Asn Phe Ser Asn Trp Ile Asn Glu Gly Val Asp Glu
1 5 10 15
Ile Gln Phe Thr Lys Glu Leu Tyr Glu Lys Leu Leu Lys His Ser Glu
20 25 30
Gln Glu Ala Ile Ser Tyr Leu Phe Lys Leu Ser Ser Leu Glu His Phe
35 40 45
Asn Gln Trp Lys Phe Tyr Leu Ile Leu Leu Gln Thr Leu Thr Ser Lys
50 55 60
Cys Ser Asp Glu Asn Gly Ala Phe Ile Arg Lys Tyr Leu Lys Thr Arg
65 70 75 80
Leu Thr Gln Ile Ala Ala Leu Pro Lys Arg Glu Tyr Met Leu His Leu
85 90 95
Leu Leu Ser Val Arg Ala Ala Thr Ala Thr Thr Met Asp Ile Asp Lys
100 105 110
Asn Ile Thr Ala Tyr Ala Asp Trp Tyr Lys Arg Asn Val Ala Asp Met
115 120 125
Lys Phe Val Leu Lys Val Glu Glu Phe Lys Ala Ile Ile Asp Leu Leu
130 135 140
Glu Gln Cys Ile Pro Tyr Glu Ser Leu Glu Asp Tyr Leu Glu Ile His
145 150 155 160
Ala Thr Phe Ser Ile Ser Pro Pro Ile His Cys Gly Lys Leu Val Gln
165 170 175
Ser Tyr Lys Ser Lys Cys Lys Met Gln Leu Ala Lys Ile Lys Ser Lys
180 185 190
Val Lys Gln Gly Asn Glu His Glu Glu Ser Ile Val Ile Asp Asp
195 200 205
<210> 381
<211> 383
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 381
Met Thr Gln Thr Glu Ile Lys Ile Gly Arg Lys Lys Leu Arg Ile Asn
1 5 10 15
Ile Lys Thr Ile Asp Glu Leu Glu Lys Ala Met Lys Asn Glu Gly Tyr
20 25 30
Asn Val Ala Ser Phe Glu Asn Leu Asn Val Glu Glu Phe Lys Ser Glu
35 40 45
Ile Cys Asn Leu Val Asn Ile Lys Pro Asn Val Ala Glu His Ile Tyr
50 55 60
Phe Asn Met Ser Gln Cys Glu Arg Glu Ile Ser Tyr Arg Ser Asn Asn
65 70 75 80
Val Gln Asp Phe Leu Asp Tyr Met Glu Lys Ile Thr Glu Ile Lys Glu
85 90 95
Tyr Glu Lys Ile Leu Trp Lys Lys Ile Arg Lys Val Asp Lys Ile His
100 105 110
Ile Asp Arg Ile Glu Tyr Asp Arg Lys Pro Ser Ile Gln Glu Asp Val
115 120 125
Glu His Met Ile Asn Ala Ile Lys Asn Val Lys Asn Thr Met Cys Gly
130 135 140
Lys Ile Asp Glu Tyr Glu Lys Leu Arg Leu Tyr Glu Leu Glu Thr Gly
145 150 155 160
Ile Asp Glu Asn Tyr Ile Tyr Ala Lys Asp Ile Glu Leu Leu Lys Lys
165 170 175
Met Ile Ile Lys Asp Lys Gly Lys Val Lys Asn Thr Tyr Asp Glu Phe
180 185 190
Thr Cys Asn Lys Arg Ile Tyr Ile Asp Ile Pro Glu Asn Met Asn Ser
195 200 205
Ser Tyr Ile Lys Pro Leu Glu Gly Ser Ile Glu Tyr His Glu His Ile
210 215 220
Ser Arg Asn Ile Pro Arg Ile Lys Arg Leu Ile Lys Asn Leu Asp Lys
225 230 235 240
Tyr Met Lys Ile Thr Ser Asp Glu Glu Gly Asn Lys Val Cys Glu Ile
245 250 255
Asn Gln Ser Lys Ala Leu Gln Asp Ser Ile Asn Ile Ala Val Ala Val
260 265 270
Tyr Asn Gln Lys Glu Phe Lys Ala Val Ser Gly Ser Asp Glu Val Asp
275 280 285
Asp Tyr Cys Met Ala Met Glu Lys Glu Glu Thr Val Phe Glu Ser Cys
290 295 300
Arg Val Asn Arg Leu Gly Lys Ile Gly Ile Gly Tyr Asn Arg Phe Tyr
305 310 315 320
Asp Ser Glu Lys Lys Ile Leu Glu Glu Ile His Lys Gln Ile Glu Glu
325 330 335
Lys Lys Leu Asp Asp Arg Gly Asn Leu Val Met Tyr Ser Arg Trp Glu
340 345 350
Pro Cys Pro Ser Cys Tyr Tyr Val Ile Ser Gln Phe Cys Ser Ala His
355 360 365
Pro Gln Ile Glu Val Ser Val Lys Phe Asp Lys Ser Tyr Gly Glu
370 375 380
<210> 382
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 382
Met Val Thr Arg Val Arg Lys Phe His Tyr Ser Glu Asp Thr Asn Gly
1 5 10 15
Gln Val Leu Arg Arg Ile Ser Lys Gln Tyr Lys Lys Arg Ile Asn Leu
20 25 30
Thr Ala Arg Arg Lys Glu Lys Asn Asp Gln Asp Tyr Ser Phe Glu Tyr
35 40 45
Arg Met Ser Tyr Pro Arg Phe Glu Gly Gly Asn Asp Ala Val Leu Glu
50 55 60
Tyr Val Arg Pro Gly Arg Thr Thr Lys Val Glu Arg Phe Leu Tyr Tyr
65 70 75 80
Ala Asn Ser Ala Val Asn Asp Arg Tyr Ser Pro Phe Ala Met Leu Gly
85 90 95
Gly Arg Arg Gly Gln Tyr Thr Leu Ile Pro Ala Glu Pro Lys Phe Ser
100 105 110
His Phe Arg Thr Thr Arg Lys Arg Glu Val Asn Met Gly Thr Leu Arg
115 120 125
Glu Asn Asp Thr Glu Tyr Lys Leu Leu Glu Arg Val Thr Gln Asp Ile
130 135 140
Leu Ser Gln Asp Glu Arg Gly Leu Ile Arg Met Tyr Thr Tyr Tyr Glu
145 150 155 160
Pro Cys Leu Ser Cys Asp Tyr Val Met Ile Gln Phe Ile Asn Met Tyr
165 170 175
Pro Asn Ile Lys Ile Asp Val Tyr Tyr Glu Glu Asp Tyr Lys Pro Glu
180 185 190
Glu Lys Gly Leu Ile
195
<210> 383
<211> 373
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 383
Met Ile Glu Asn Pro Ala Leu Lys Ile Ser Lys Arg Asp Arg Ile Lys
1 5 10 15
Ile Ser Asn Leu Lys Asp Leu Lys Asn Ala Leu Lys Asn Glu Asn Tyr
20 25 30
Asn Ile Lys Ala Asn Asp Lys Glu Lys Phe Lys Asp Glu Val Lys Lys
35 40 45
Val Phe Asn Ile Asn Asp Asp Ile Phe Glu Arg Leu Asp Lys Cys Leu
50 55 60
Asn Arg Asp Ile Thr Tyr Lys Val Asp Asn Val Glu Asp Phe Ile Asp
65 70 75 80
Tyr Ile Lys Lys Ile Met Ile Phe Glu Asp Lys His Glu Ile Ile Cys
85 90 95
Glu Lys Leu Lys Arg Ile Lys Lys Leu Tyr Ile Asn Arg Glu Glu Tyr
100 105 110
Glu Arg Glu Lys Ser Thr Arg Asp Asn Val Glu His Ile Ile Glu Val
115 120 125
Ile Glu Lys Thr Lys Glu Asn Val Ser Arg Lys Ile Ser Leu Glu Glu
130 135 140
Leu Glu Arg Leu Glu Ile Leu Glu Glu Glu Leu Glu Asp Lys Tyr Leu
145 150 155 160
Phe Ala Lys Asp Ile Glu Phe Leu Lys Lys Met Ile Leu Gly Asn Cys
165 170 175
Lys Asn Val Ile Glu Ser Tyr Asn Glu Lys Thr Lys Ile Lys Thr Leu
180 185 190
Lys Met Lys Ile Pro Lys Glu Ile Asn Tyr Ser Tyr Ile Lys Ala Lys
195 200 205
Glu Gly Ser Val Glu Tyr His Gln Tyr Leu Asn Asn Asn Ile Asn Arg
210 215 220
Met Asn Arg Leu Ile Lys Ser Ile Asp Lys Tyr Ile Glu His Tyr Lys
225 230 235 240
Asp Asp Ile Phe Asn Ile Asn Gln Ser Leu Ala Leu Gln Asp Ser Ile
245 250 255
Asn Ile Ala Leu Ala Thr Phe Asp Asn Lys Glu Phe Lys Ala Ile Ser
260 265 270
Gly Lys Asn Asp Ile Glu Asp Tyr Cys Lys Val Ile Pro Ile Glu Lys
275 280 285
Ser Arg Phe Lys Ser Arg Lys Val Asn Lys Leu Gly Glu Leu Gly Ile
290 295 300
Gly Tyr Asn Arg Ile Asn Asp Ser Glu Lys Lys Ile Leu Glu Glu Ile
305 310 315 320
His Glu Lys Ile Lys Gln Lys Ile Leu Lys Asp Arg Gly Asn Leu Thr
325 330 335
Leu Tyr Thr Lys Trp Glu Pro Cys Pro Ser Cys Tyr Phe Val Ile Ser
340 345 350
Gln Phe Cys Glu Lys Tyr Pro Asn Ile Lys Val Glu Val Lys Tyr Asn
355 360 365
Lys Lys Tyr Gly Glu
370
<210> 384
<211> 330
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 384
Met Arg Arg Lys Lys Pro Ser Gly Met Tyr Ile Ser Lys Arg Ala Leu
1 5 10 15
Lys Asp Asn Phe Asp Pro His Lys Phe Pro His Asp Thr Tyr Leu Leu
20 25 30
Cys Lys Leu Gln Trp Gly Asp Thr Gly Arg Ser Trp Ile His Trp Ile
35 40 45
Arg Lys Asp Arg Tyr His Ala Glu Val Tyr Phe Leu Glu Lys Ile Phe
50 55 60
Lys Met Arg Arg Ser Lys Asn Tyr Val Asn Cys Ser Ile Thr Trp Tyr
65 70 75 80
Leu Ser Trp Ser Pro Cys Val Arg Cys Cys Cys Glu Ile Leu Asn Phe
85 90 95
Leu Glu Lys His Ser Tyr Val Asn Ile Asp Ile Tyr Val Ala Arg Leu
100 105 110
Tyr Lys Ile Gln Asn Ser Glu Val Arg Glu Gly Leu Lys Lys Leu Val
115 120 125
Ser Ser Lys Lys Val Thr Ile Ala Val Met Glu Ile Lys Asp Tyr Thr
130 135 140
Tyr Cys Trp Lys Asn Phe Ile Gln Gly Asp Ala Asp Asp Asp Ser Trp
145 150 155 160
Thr Val Asp Phe Gln Ser Ala Ile Thr Lys Asn Arg Leu Lys Leu Lys
165 170 175
Asp Val Phe Glu Phe Leu Lys Ser His Pro Asn Val Thr Leu Glu Ile
180 185 190
Tyr Ala Ala Lys Leu Phe Lys His Leu Asp Ile Arg Asn Arg Glu Gly
195 200 205
Leu Arg Asn Leu Ala Lys Asn Gly Val Ile Ile His Ile Met Asn Leu
210 215 220
Ala Asp Tyr Ser Tyr Trp Trp Lys Ile Phe Val Thr Arg Gln His Gly
225 230 235 240
Glu Asp Asp Tyr Leu Pro Trp Ser Phe Ala Leu His Ile Phe Leu Asn
245 250 255
Cys Ile Glu Phe Gln Gln Ile Leu Leu Val Ser Arg His Leu Lys Glu
260 265 270
Ser Leu Arg Val Lys Ser Asn Glu Lys Ala Gln Glu Lys Glu Val Trp
275 280 285
Arg Ile Pro Ala Met Val Leu Ala Glu Met Ile Val Gly Lys Met Asn
290 295 300
Arg Asp Leu Met Leu His Glu Gln Arg Ala Asn Arg Ala Arg Asn Cys
305 310 315 320
Lys Gly Leu Trp Cys Tyr Ile Val Pro Leu
325 330
<210> 385
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 385
Met Ser Asn Val Arg Lys Tyr His Tyr Ser Val Asn Ser Val Gly Glu
1 5 10 15
Glu Leu Lys Lys Leu Val Glu Tyr His Lys Arg Arg Thr Glu Met Tyr
20 25 30
Ala Arg Ile Lys Ala Lys Asn Asn Pro Ser Ala Tyr Arg Asn Tyr Leu
35 40 45
Asn Glu Leu Pro Gly Phe Glu Gly Gly Asn Asp Ala Ile Leu Ile Phe
50 55 60
Gln Val Asn Gly Asn His Lys Ser Arg Ile Arg Arg Cys Ala Asn Ser
65 70 75 80
Phe Val Asn Asp Ser Thr Ser Ser Phe Ala Asn Ile Pro Val Asn Phe
85 90 95
Thr Gly Lys Tyr Val Leu Ile Pro His Pro Pro Ala Gln Lys Phe Ser
100 105 110
Tyr Ile Cys Thr Asn Lys His Arg Glu Ile Gly Val Gly His Tyr Arg
115 120 125
Asn Asn Asp Thr Glu Tyr Lys Leu Leu Glu Asp Ile Ser Arg Arg Ile
130 135 140
Thr Pro Thr Leu Val Gly His Ile Asn Leu Phe Thr Phe Tyr Glu Pro
145 150 155 160
Cys Leu Ser Cys Asp Tyr Val Ile Ile Gln Phe Ala Asn Lys Tyr Pro
165 170 175
Leu Ile Thr Ile Asp Val Tyr Phe Glu Glu Glu Tyr Arg Pro Glu Asn
180 185 190
Gly Val Ile
195
<210> 386
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 386
Met Val Ala Ile Val Arg Lys Met His Tyr Glu Asp Asn Lys Glu Gly
1 5 10 15
Ile Arg Leu Gln Arg Arg Ser Arg Gln Tyr Lys His Ala Met Leu Gln
20 25 30
Met Ala Asp Arg Lys Ala Thr Met Asp Ser Val Tyr Gln Lys Val Met
35 40 45
Asn Leu Ser Val Leu Arg Phe Thr Gly Gly Asn Asp Ala Val Leu Glu
50 55 60
Tyr Ser Ile Cys Ile Asp Pro Asp Arg Asn Lys Lys Leu Lys Lys Pro
65 70 75 80
Val Ser Arg Tyr His Ala Asn Ser Ala Val Asn Asp Met Asn Ser Pro
85 90 95
Phe Ala Lys Ile Met Gly Asn Arg Ile Arg Tyr Thr Leu Ile Pro Gln
100 105 110
Lys Ser Thr Phe Ile His Phe His Thr Asn Arg Asn Arg Glu Ile Asn
115 120 125
Asn Gly Thr Pro Arg Glu Asn Asp Thr Glu Tyr Lys Leu Leu Glu Lys
130 135 140
Val Lys Glu Asp Ile His Asp Arg Tyr Gln Glu Gly Leu Ile Arg Met
145 150 155 160
Tyr Thr Tyr Tyr Glu Pro Cys Leu Ser Cys Asp Tyr Val Ile Ile Gln
165 170 175
Phe Thr Glu Arg Tyr Pro Asn Ile Asp Ile Glu Ile Tyr Tyr Glu Glu
180 185 190
Glu Tyr Lys Pro Gln Glu Lys Gly Leu Ile
195 200
<210> 387
<211> 365
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 387
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Arg Thr
1 5 10 15
Phe Tyr Tyr Asn Phe Glu Asn Lys Pro Ile Leu Cys Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu
35 40 45
Pro Trp Asp Lys Gly Val Phe Arg Gly Gln Val Leu Pro Lys Phe Gln
50 55 60
Ser Asn His Arg Gln Glu Val Tyr Phe Gln Leu Glu Asn His Ala Glu
65 70 75 80
Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro Ala Asn Arg
85 90 95
Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro Cys Leu Pro Cys
100 105 110
Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Pro Asn Val Thr Leu
115 120 125
Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Gly Arg Asp Trp Arg
130 135 140
Arg Ala Leu Arg Arg Leu His Lys Ala Gly Ala Arg Val Lys Ile Met
145 150 155 160
Asp Tyr Glu Asp Phe Ala Tyr Cys Trp Glu Asn Phe Val Cys Asn Glu
165 170 175
Gly Gln Pro Phe Lys Pro Trp Tyr Lys Phe Asn Asp Asn Tyr Ala Phe
180 185 190
Leu His His Arg Leu Asn Glu Ile Leu Arg Asn Pro Met Glu Val Thr
195 200 205
Tyr Pro His Ile Phe Tyr Phe His Phe Glu Asn Leu Arg Lys Ala Tyr
210 215 220
Gly Arg Asn Glu Thr Trp Leu Cys Phe Thr Met Lys Val Ile Lys Trp
225 230 235 240
Pro Ser Arg Val Ser Trp Lys Ser Gly Val Phe Arg Asn Gln Val Ala
245 250 255
Pro Lys Pro His Cys His Ala Glu Met Cys Phe Leu Ser Cys Pro Cys
260 265 270
Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn
275 280 285
Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Trp Asn Thr
290 295 300
Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Glu Glu Gly Ala Ser Val
305 310 315 320
Glu Ile Met Glu Tyr Lys His Phe Lys Tyr Cys Trp Glu Asn Phe Val
325 330 335
Tyr Asn Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr Asn
340 345 350
Phe Arg Phe Leu Glu Arg Lys Leu Trp Glu Ile Ile Lys
355 360 365
<210> 388
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 388
Met Val Ala Lys Lys Thr Lys Val Thr Lys Phe His Tyr Lys Ser Asn
1 5 10 15
Glu His Gly Ile Glu Leu His Lys Met Cys Lys Ala Gln Asn Glu Trp
20 25 30
Val Leu Lys Met Ala Lys Gly Arg Ser Glu Arg Asn Leu Met Tyr Asn
35 40 45
Val Lys Tyr His Leu Ala Phe Pro Arg Phe Lys Gly Gly Asn Asn Ala
50 55 60
Val Leu Val His Leu Glu Tyr Val Gly Lys Asp Lys Asn Lys Thr Arg
65 70 75 80
Pro Arg Ala Val Phe His Ala Ser Ser Ala Val Asp Asp Ser Asp Ser
85 90 95
Pro Phe Ala Arg Val Gly Gly Gly Ser Arg Arg Lys Tyr Ala Leu Ile
100 105 110
Pro Ser Lys Pro Met Phe Lys Pro Ile Arg Thr Asn Arg Asn Arg Asp
115 120 125
Ile Asn His Gly His Phe Arg Glu Asn Asp Thr Glu Tyr Lys Leu Leu
130 135 140
Glu Lys Val Ser Gln Tyr Ile Asp Asp Lys Asp Glu His Ser Leu Ile
145 150 155 160
Arg Met Tyr Thr Asp Leu Glu Pro Cys Leu Ser Cys Asp Tyr Val Ile
165 170 175
Ile Gln Phe Thr Lys Arg Tyr Pro Asn Ile Asn Ile Glu Val Tyr Tyr
180 185 190
Lys Asp Glu Tyr Lys Pro Lys Gly Glu Gly Leu Ile
195 200
<210> 389
<211> 242
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 389
Met Asn Pro Leu Gln Glu Val Ile Phe Cys Arg Gln Phe Gly Asn Gln
1 5 10 15
His Arg Val Pro Lys Pro Tyr Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr
20 25 30
Gln Leu Lys Leu Pro Glu Gly Thr Leu Ile His Lys Asp Cys Leu Arg
35 40 45
Asn Lys Lys Lys Arg His Ala Glu Met Cys Phe Ile Asp Lys Ile Lys
50 55 60
Ala Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile Ile Cys Tyr Ile
65 70 75 80
Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu Val Ala Phe Val
85 90 95
Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu Arg His Leu His Ala
115 120 125
Ser Gly Ile Pro Val Ala Val Met Ser Leu Pro Glu Phe Glu Asp Cys
130 135 140
Trp Arg Asn Phe Val Asp His Gln Asp Arg Ser Phe Gln Pro Trp Pro
145 150 155 160
Asn Leu Asp Gln Tyr Ser Lys Ser Ile Lys Arg Arg Leu Gly Lys Ile
165 170 175
Leu Thr Val Arg Ser Cys Pro Cys Cys Arg His Leu Ala Ser Leu Pro
180 185 190
Leu Gly Leu Pro Phe Pro Ala His Arg Pro Leu Leu Ser Val Leu Ala
195 200 205
Leu Cys Pro Gln Cys Pro Ser Thr Pro Phe Ser Phe Leu Glu Thr Pro
210 215 220
Val Pro Pro Val Gly Ala Pro Arg Leu Pro Leu Pro Ser Leu Ala Pro
225 230 235 240
Phe Ser
<210> 390
<211> 486
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 390
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Pro Thr
1 5 10 15
Phe Tyr Tyr Asn Phe Glu Asn Glu Pro Ile Leu Cys Arg Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu
35 40 45
Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Phe Gln Pro Glu
50 55 60
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Val Ala Val Phe Leu Ala Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Lys Asp Trp Gln Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Lys Ile Met Asp Tyr Glu Glu Phe Glu Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Glu Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp
165 170 175
Asn Tyr Ala Phe Pro His Arg Phe Asp Ala Asn Tyr Ala Phe Leu His
180 185 190
His Thr Leu Lys Glu Ile Leu Arg His Leu Met Asp Pro Asp Thr Phe
195 200 205
Thr Phe Asn Phe Asn Asn Asp Pro Leu Val Phe Gly Arg His Gln Thr
210 215 220
Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Trp Val Lys
225 230 235 240
Met Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asp Pro Leu
245 250 255
Tyr Gly Phe Asp Gly Arg His Thr Glu Leu Cys Phe Leu Gly Leu Ile
260 265 270
Pro Tyr Trp Gln Leu Asp Leu Ala Gln Thr Tyr Arg Val Thr Trp Phe
275 280 285
Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Glu Gln Val Arg
290 295 300
Ala Phe Leu Gln Glu Asn Thr His Met Arg Leu Arg Ile Phe Ala Ala
305 310 315 320
Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu
325 330 335
Arg Gly Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Glu
340 345 350
His Cys Trp Asp Thr Phe Val Asp His Gln Gly Arg Pro Phe Gln Pro
355 360 365
Trp Asp Gly Leu Glu Glu His Ser Gln Ala Leu Ser Gly Arg Leu Gln
370 375 380
Ala Ile Leu Leu Val Arg Ala Ser Ser Leu Cys Pro Val Pro His Arg
385 390 395 400
Pro Pro Pro Pro Pro Leu Ser Pro Gly Pro Cys Leu Pro Leu Cys Ser
405 410 415
Glu Pro Pro Leu Gly Ser Leu Leu Pro Thr Gly Cys Pro Ala Pro Ser
420 425 430
Leu Pro Phe Leu Leu Thr Ala Ser Leu Ser Pro Ala Ser Arg Leu Leu
435 440 445
Pro Val Pro Ser Phe His Ser Leu Thr Ser Cys Ser Ile Gln Pro Ser
450 455 460
Cys Ser Ser Ile Ile Arg Glu Thr Glu Gly Trp Ala Ser Val Ser Lys
465 470 475 480
Glu Gly Arg Asp Leu Val
485
<210> 391
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 391
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Leu Asp Pro Ala Gln Ile
50 55 60
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
65 70 75 80
Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
85 90 95
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
100 105 110
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
115 120 125
Thr Tyr Asp Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln
130 135 140
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala
145 150 155 160
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
165 170
<210> 392
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 392
Met Ala Glu Lys Gln Glu Glu Pro Ser Asn Ala Gln Asn Gly Glu Pro
1 5 10 15
Asp Asn Ala Glu Glu Gly Glu Gly Lys Lys Lys Lys Val Lys Arg Glu
20 25 30
Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro Ala Ile
35 40 45
Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly Arg Asn
50 55 60
Lys Thr Phe Leu Cys Tyr Val Val Glu Thr Gln Gly Lys Glu Ala Ala
65 70 75 80
Thr Ser Arg Gly Tyr Leu Glu Asp Glu His Ala Ala Ala His Ala Glu
85 90 95
Met Ala Phe Phe Asn Ser Ile Leu Pro Lys Cys Gln Ala Gly Ala Arg
100 105 110
His Asp Val Thr Trp Leu Phe Met Trp Glu Glu Pro Glu Met Gln Ala
115 120 125
Ala Leu Arg Gly Met Lys Glu Ala Gly Cys Lys Leu Arg Ile Met Lys
130 135 140
Pro Gln Asp Phe Glu Tyr Val Trp Lys Asn Phe Val Glu Pro Glu Glu
145 150 155 160
Gly Glu Glu Ala Lys Ser Phe Val Pro Trp Glu Asp Ile Gln Glu Asn
165 170 175
Phe Gln Tyr Tyr Glu Glu Lys Leu Ala Glu Ile Leu His
180 185
<210> 393
<211> 420
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 393
Met Glu Pro Gln His Pro Arg Gln Arg Ala Gly Met Gly Leu Ala Ser
1 5 10 15
Lys Gly Gly Cys Ser Gln Arg Pro Arg Ile Arg Asn Pro Val Glu Trp
20 25 30
Leu Asp His Gln Thr Phe Ser Phe His Phe Arg Asn Leu Arg Phe Ala
35 40 45
Ser Gly Arg Asn Cys Thr Tyr Leu Cys Tyr Gln Val Glu Arg Leu Lys
50 55 60
His Phe Ser Pro Asp Ser Ser Asp Trp Gly Val Phe Gln Asn Arg Val
65 70 75 80
Tyr Pro Glu Thr Pro Cys His Ala Glu Leu Cys Phe Leu Ser Trp Phe
85 90 95
Arg Thr Lys Lys Leu Ser Pro Tyr Glu Gln Tyr Arg Ile Thr Trp Phe
100 105 110
Leu Ser Trp Ser Pro Cys Leu Pro Cys Ala Glu Gln Val Ala Ala Phe
115 120 125
Leu Lys Glu Asn Arg Asn Val Arg Leu Ser Ile Phe Ala Ala Arg Leu
130 135 140
Tyr Tyr Phe Trp Lys Pro Asp Cys Gln Gln Gly Leu Arg Ala Leu His
145 150 155 160
Gln Gln Arg Ala Trp Val Arg Ile Met Ser Phe Arg Asp Phe Lys Tyr
165 170 175
Cys Trp Lys Asn Phe Val Tyr Asn Gln Gly Met Pro Phe Lys Pro Trp
180 185 190
Lys Lys Leu Arg Lys Asn Tyr Gln Phe Leu Val Ala Lys Leu His Glu
195 200 205
Ile Leu Gly Asn Thr Met Asn Leu Leu Lys Lys His Ile Phe Arg Gln
210 215 220
Gln Phe Gly Asn Gln His Arg Val Pro Gln Pro Tyr Tyr Arg Arg Lys
225 230 235 240
Thr Tyr Leu Cys Tyr Gln Leu Lys Gln Leu Asp Gly Phe Thr Leu Asp
245 250 255
Lys Gly Cys Phe Gln Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe
260 265 270
Ile Asp Lys Ile Thr Ser Leu Asn Leu Asp Pro Asn Gln Ser Tyr Lys
275 280 285
Ile Ile Cys Tyr Val Thr Trp Ser Pro Cys Pro Thr Cys Ala Lys Glu
290 295 300
Leu Val Asp Phe Ile Asn Gly Gln Asp His Leu Ser Leu Gln Ile Phe
305 310 315 320
Ala Ser Arg Leu Tyr Phe His Trp Val Lys Val Phe Gln Arg Gly Leu
325 330 335
Gln Gln Leu Gln Ala Ala Gln Val Ser Val Ala Val Met Thr Arg Ser
340 345 350
Glu Phe Glu Asp Cys Trp Glu Glu Phe Val Asp Asn Gln Gly Met Pro
355 360 365
Phe Glu Ser Trp Asp Lys Leu Glu Gln Tyr Ser Glu Ser Ile Ser Arg
370 375 380
Arg Leu Gln Lys Ile Leu Ser Pro Ser Asn Trp Asn Asn Leu Glu Asp
385 390 395 400
Ser Phe Arg Asp Leu Arg Leu Gly Ser Pro Ser Pro Ser Ser Leu Arg
405 410 415
Ser Asp Ser Arg
420
<210> 394
<211> 252
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 394
Met Glu Asp Asn Ala Ala Pro Glu Pro Arg Pro Leu Leu Asp Gln Gly
1 5 10 15
Thr Phe Met Asp His Phe Ala Asn Glu Asp Gly Gly Arg Gly Leu Asn
20 25 30
Glu Thr Tyr Leu Cys Tyr Glu Val Gln Leu Leu Asp Gly Ser Ser Gln
35 40 45
His Gln Gly Phe Leu Arg Asn Lys Asn Phe Cys Ile Asp Phe Asp Pro
50 55 60
Ser Leu Arg Arg His Ala Glu Leu Cys Phe Leu Asp Leu Val Pro Ala
65 70 75 80
Trp Arg Leu Asp Pro Ala Gln His Tyr Arg Val Thr Trp Phe Ile Ser
85 90 95
Trp Ser Pro Cys Phe Leu Cys Ala Gln Ala Val Ala Glu Phe Leu Arg
100 105 110
Arg Asn Ala His Val Ser Leu Arg Ile Phe Ala Ala Arg Ile Tyr Thr
115 120 125
Trp Arg Thr Asp Tyr Lys Ala Gly Leu Gln Asp Leu Gln Arg Ala Gly
130 135 140
Ala Gln Ile Ala Ile Met Thr Pro Ala Glu Ile Gln Phe Cys Trp Asn
145 150 155 160
Thr Phe Val Asp Asn Gln Ser Asn Pro Phe His Ser His Leu Gly Leu
165 170 175
Gly His Ala Lys Pro Ala Pro Ala Glu Gly Ala Ala Glu His Pro Pro
180 185 190
Gly Ser Leu Asn Arg Ala Gly Ala Leu Pro Gly Ala Ser Arg Lys Lys
195 200 205
Phe Cys Ile Arg Glu Arg Arg Pro Arg Thr Pro Arg Thr Pro Arg Thr
210 215 220
Pro Arg Arg Gln Pro Ser Pro Ala Val Arg Arg Arg Pro Arg Arg Asp
225 230 235 240
Trp Ser Asp Ala Leu Arg Val Gly Met Arg Arg Phe
245 250
<210> 395
<211> 413
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 395
Met Ala Gly Leu Gly Gln Ala Cys Glu Gly Cys Cys Gly Gln Met Pro
1 5 10 15
Glu Ile Ser Tyr Pro Met Gly Arg Leu Asp Pro Lys Thr Phe Ser Phe
20 25 30
Glu Phe Lys Asn Leu Leu Tyr Ala Tyr Arg Arg Lys Ser Ser Tyr Leu
35 40 45
Cys Phe Gln Val Glu Arg Glu Gln His Ser Ser Pro Val Pro Ser Asp
50 55 60
Trp Gly Val Phe Glu Asn Gln Phe Tyr His Ala Glu Leu Arg Phe Leu
65 70 75 80
Asn Trp Phe Arg Ala Glu Lys Leu Ser Pro Tyr Glu His Tyr Asp Val
85 90 95
Thr Trp Phe Leu Ser Trp Ser Pro Cys Ser Thr Cys Ala Lys Lys Ile
100 105 110
Ala Ile Phe Leu Ser Asn His Lys Asn Val Arg Leu Ser Ile Phe Val
115 120 125
Ser Arg Ile Tyr Tyr Phe Trp Lys Pro Ala Phe Arg Gln Gly Leu Gln
130 135 140
Glu Leu Asp His Leu Gly Val Gln Leu Asp Ala Met Ser Phe His Asp
145 150 155 160
Phe Lys Tyr Cys Trp Glu Asn Phe Val Asp Asn Gln Gly Met Pro Phe
165 170 175
Arg Cys Trp Lys Lys Val His Arg Asn Tyr Lys Phe Val Leu Arg Lys
180 185 190
Leu Asn Glu Ile Leu Arg Asn Met Asn Leu Leu Ser Glu Lys Thr Phe
195 200 205
Asn Tyr His Phe Gly Asn Gln Leu Arg Val Lys Lys Pro Gln Gly Arg
210 215 220
Arg Arg Thr Tyr Leu Cys Tyr Lys Leu Lys Leu Pro Asn Glu Thr Phe
225 230 235 240
Asp Lys Gly Tyr Phe Ile Asn Lys Lys Lys Asn His Ala Glu Ile Arg
245 250 255
Phe Ile Asn Lys Ile Arg Ser Leu Asn Leu Asp Gln Thr Gln Ser Tyr
260 265 270
Lys Ile Thr Cys Tyr Ile Thr Trp Ser Pro Cys Ser Tyr Cys Ala Gly
275 280 285
Lys Leu Val Ala Leu Val Lys Ser Cys Pro His Leu Ser Leu Gln Ile
290 295 300
Phe Thr Ser Arg Leu Tyr Tyr His Trp Leu Trp Lys Asn Gln Ala Gly
305 310 315 320
Leu Arg Tyr Leu Trp Lys Ile Asn Ile Pro Val Leu Val Met Lys Glu
325 330 335
Pro Asp Phe Ala Asp Cys Trp Asp Asn Phe Val Asn His Gln Ser Arg
340 345 350
Arg Phe Lys Pro Trp Glu Lys Leu Thr Gln Tyr Ser Asn Ser Thr Glu
355 360 365
Arg Arg Leu Leu Arg Ile Leu Arg Ile Asn Arg Thr Asp Leu Phe Leu
370 375 380
Ala Gln Ser Ser Glu Gln Asp Pro Gly Leu Asn Asp Leu Val Asp Ala
385 390 395 400
Ile Lys Arg Leu Phe Leu Asp Ala His Arg Pro Arg Asp
405 410
<210> 396
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 396
Met Ala Gly Leu Gly His Ala Cys Glu Gly Cys Cys Gly Gln Met Pro
1 5 10 15
Glu Ile Ser Tyr Pro Met Glu Gly Leu Asp Pro Glu Thr Phe Phe Phe
20 25 30
Glu Phe Gln Asn Leu Leu Tyr Ala Tyr Gly Arg Lys Ser Ser Tyr Leu
35 40 45
Cys Phe Gln Val Glu Arg Glu Gln His Ser Ser Pro Val Pro Ser Asp
50 55 60
Cys Gly Val Phe Lys Asn Gln Val Trp Ala Pro Leu Leu Ser Lys Ala
65 70 75 80
Gly Ala Lys Pro Val Glu Asp Ala Glu Lys Asn Ile Thr Cys Lys Met
85 90 95
Pro Ser Ala Ser Ser His Asn Asn Val Gln Cys Pro Gly Pro Leu Met
100 105 110
Ser Leu Pro Asp Pro Pro Ala Ser
115 120
<210> 397
<211> 235
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 397
Met Asn Ser Lys Thr Gly Pro Ser Val Gly Asp Ala Thr Leu Arg Arg
1 5 10 15
Arg Ile Lys Pro Trp Glu Phe Val Ala Phe Phe Asn Pro Gln Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Asn Gln Asn
35 40 45
Ile Trp Arg His Ser Asn Gln Asn Thr Ser Gln His Ala Glu Ile Asn
50 55 60
Phe Met Glu Lys Phe Thr Ala Glu Arg His Phe Asn Ser Ser Val Arg
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser
85 90 95
Lys Ala Ile Arg Lys Phe Leu Asp His Tyr Pro Asn Val Thr Leu Ala
100 105 110
Ile Phe Ile Ser Arg Leu Tyr Trp His Met Asp Gln Gln His Arg Gln
115 120 125
Gly Leu Lys Glu Leu Val His Ser Gly Val Thr Ile Gln Ile Met Ser
130 135 140
Tyr Ser Glu Tyr His Tyr Cys Trp Arg Asn Phe Val Asp Tyr Pro Gln
145 150 155 160
Gly Glu Glu Asp Tyr Trp Pro Lys Tyr Pro Tyr Leu Trp Ile Met Leu
165 170 175
Tyr Val Leu Glu Leu His Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Lys Ile Ser Gly Ser His Ser Asn Gln Leu Ala Leu Phe Ser Leu Asp
195 200 205
Leu Gln Asp Cys His Tyr Gln Lys Ile Pro Tyr Asn Val Leu Val Ala
210 215 220
Thr Gly Leu Val Gln Pro Phe Val Thr Trp Arg
225 230 235
<210> 398
<211> 378
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 398
Met Thr Gln Glu Asn Thr Gln Leu Lys Lys Lys Ile Lys Lys Glu Arg
1 5 10 15
Ile Arg Ile Asn Asn Leu Ser Asp Phe Arg Ala Ala Leu Lys Lys Glu
20 25 30
Gly Tyr Asn Ile Asn Gly Leu Glu Glu Glu Lys Phe Ile Asp Lys Ile
35 40 45
Ile Asp Ile Leu Lys Leu Asp Arg Ser Val Ala Lys Lys Ile Phe Ala
50 55 60
Ser Phe Lys Asp Thr Ala Val Thr Tyr Arg Ala Asn Asp Ile Met Asp
65 70 75 80
Phe Ile Asp Tyr Met Lys Lys Ile Ser Leu Phe Glu Asn Glu His Asn
85 90 95
Lys Leu Cys Glu Lys Ile Arg Lys Ile Glu Lys Leu Ser Ile Ala Arg
100 105 110
Val Glu Tyr Glu Arg Glu Leu Lys Val Lys Asp Asp Val Glu His Ile
115 120 125
Ile Thr Arg Ile Glu Glu Ile Lys Ser Asp Ile Ser Glu Ile Ala Asn
130 135 140
His Glu Glu Lys Glu Lys Leu Tyr Ser Leu Glu Lys Glu Ile Glu Lys
145 150 155 160
Glu Tyr Leu Tyr Ala Lys Asp Ile Glu Leu Leu Lys Lys Met Leu Ile
165 170 175
Thr Arg Lys Glu Cys Ser Arg Glu Lys Tyr Asn Glu Glu Thr Lys Ile
180 185 190
Lys Val Val Ser Ile Glu Ile Pro Lys Asp Ile Asp Tyr Arg Tyr Ile
195 200 205
Pro Ala Gln Ile Gly Thr Ile Glu Tyr His Gln His Leu Ser Asn Asn
210 215 220
Ile Pro Arg Met Gln Arg Leu Thr Lys Asn Ile Asn Lys Tyr Met Arg
225 230 235 240
Val His Glu Asn Glu Lys Thr Thr Phe Lys Ile Asn Gln Ser Lys Ala
245 250 255
Leu Gln Asp Ser Ile Asn Ile Ala Leu Ala Thr Tyr Asp Asn Lys Glu
260 265 270
Phe Lys Ala Ile Ser Gly Ser Asn Asn Ile Val Asp Tyr Cys Val Ala
275 280 285
Pro Lys Glu Glu Glu Ala Val Phe Lys Ser Asn Lys Val Asn Lys Leu
290 295 300
Gly Glu Leu Gly Ile Gly Tyr Asn Arg Val Asn Asp Ser Glu Lys Lys
305 310 315 320
Ile Leu Glu Glu Ile His Lys Gln Ile Glu Glu Lys Thr Leu Lys Asp
325 330 335
Glu Gly Asp Leu Ile Leu Leu Ser Lys Trp Glu Pro Cys Pro Ser Cys
340 345 350
Tyr Phe Val Ile Ser Gln Phe Cys Lys Met His Pro Gln Ile Lys Val
355 360 365
Gln Val Lys Tyr Ser Lys Lys Tyr Gly Glu
370 375
<210> 399
<211> 201
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 399
Met Glu Ala Ser Pro Ala Ser Arg Pro Arg Pro Leu Met Asp Pro His
1 5 10 15
Met Phe Thr Gly Asn Phe Thr Asn Asn Pro Arg Val Phe Gly Leu His
20 25 30
Gln Thr Tyr Leu Cys Tyr Glu Val Lys Arg Gln Gly Pro Asp Gly Thr
35 40 45
Arg Asp Leu Met Asn Glu Gln Arg Asp Phe Leu Cys Asn Gln Ala Lys
50 55 60
Asn His Phe Ser Gly Ser Glu Asp His His Ala Glu Arg Cys Phe Leu
65 70 75 80
Asp Arg Ile Pro Ser Trp Gln Leu Asp Pro Ala Gln Thr Tyr Arg Val
85 90 95
Thr Cys Phe Ile Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Val
100 105 110
Ala Glu Phe Leu His Glu Asn Pro His Val Asn Leu Arg Ile Phe Ala
115 120 125
Ala Arg Ile Tyr Asp Tyr Leu Pro Arg Tyr Glu Glu Gly Leu Gln Met
130 135 140
Leu Gln Asn Ala Gly Ala Gln Val Ser Ile Met Thr Ser Glu Glu Phe
145 150 155 160
Gly His Cys Trp Asp Thr Phe Val Asp Arg Gln Gly His Pro Phe Gln
165 170 175
Pro Trp Glu Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu
180 185 190
Gln Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 400
<211> 137
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 400
Met His Leu Gln Val Trp Arg Lys Val Thr Glu Ala Trp Arg Glu Gly
1 5 10 15
Tyr Thr Leu Lys Pro Trp Ser Arg Asn Pro Met Glu Arg Leu Tyr His
20 25 30
Asp Tyr Phe Tyr Phe His Phe Tyr Asn Leu Pro Thr Pro Lys His Arg
35 40 45
Asn Gly Cys Tyr Ile Cys Tyr Gln Val Glu Gly Thr Lys Asn His Ser
50 55 60
Arg Met Pro Leu Leu Arg Gly Val Phe Glu Asn Gln Gly Leu Arg Lys
65 70 75 80
Leu His Asp Ala Gly Val His Val Ala Ile Met Ser Tyr Tyr Glu Phe
85 90 95
Lys His Cys Leu Asn Asp Phe Val Phe His Gln Gly Arg Ser Phe Cys
100 105 110
Pro Trp Asn Asp Leu Asn Lys Asn Ser Lys Asn Leu Ser Asn Thr Leu
115 120 125
Glu Asp Ile Leu Gln Asp Gln Glu Asp
130 135
<210> 401
<211> 381
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 401
Met Lys Pro Gln Thr Arg Asn Thr Val Val Arg Met Asp Pro Asp Thr
1 5 10 15
Phe Phe Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser His Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Met Lys Thr Asn Asp Pro Ser Arg
35 40 45
Pro Pro Leu Val Ala Asn Ile Phe Gln Gly Gln Val Ser Phe Asn Pro
50 55 60
Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Arg Gly Asn Leu
65 70 75 80
Leu Pro Ala Cys Lys Arg Ser Gln Ile Thr Trp Phe Val Ser Trp Asn
85 90 95
Pro Cys Leu Tyr Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu His
100 105 110
Pro Lys Val Thr Leu Thr Val Ser Thr Ala Arg Leu Tyr Cys Tyr Arg
115 120 125
Lys Lys Asp Trp Arg Arg Ala Leu Arg Lys Leu Ser Gln Thr Gly Ala
130 135 140
Arg Val Lys Ile Met Asp Tyr Glu Glu Phe Gln His Cys Trp Asp Asn
145 150 155 160
Phe Val Asp Asn Gln Arg Glu Pro Phe Glu Pro Trp Asn Ala Leu Pro
165 170 175
Lys His Tyr Thr Leu Leu Arg Ile Thr Leu Gly Glu Val Leu Arg His
180 185 190
Arg Met Asp Pro Val Thr Phe Thr Tyr Asn Phe Thr Asn Asp Pro Ser
195 200 205
Val Leu Gly Gln His Gln Ser Tyr Leu Cys Tyr Lys Val Glu His Leu
210 215 220
Arg Asn Gly Thr Trp Val Pro Leu His Gln His Arg Gly Phe Ile Leu
225 230 235 240
Asn Glu Ala Ser Asn Ser Val Ser Phe Pro Glu Gly Arg His Ala Glu
245 250 255
Leu Cys Leu Leu Asp Leu Ile Ser Phe Trp Lys Leu Lys Gln Ala Gln
260 265 270
Arg Tyr Arg Val Thr Cys Phe Ile Ser Trp Ser Pro Cys Phe Ser Cys
275 280 285
Ala Glu Lys Val Ala Glu Phe Leu Gln Glu Asn Pro His Val Asn Leu
290 295 300
His Ile Ser Ala Ala Arg Ile Tyr Asp Tyr Gln Arg Gly Tyr Lys Lys
305 310 315 320
Gly Leu Arg Arg Leu Asp Arg Ala Gly Thr Pro Ile Ser Met Met Lys
325 330 335
Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly
340 345 350
His Pro Phe Gln Pro Trp Glu Glu Leu Asn Glu His Ser Gln Ala Leu
355 360 365
Ser Gly Arg Leu Gln Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 402
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 402
Met Tyr Arg Arg Lys Met Arg Gly Met Tyr Ile Ser Lys Arg Ala Leu
1 5 10 15
Arg Lys His Phe Asp Pro Arg Asn Tyr Pro Arg Glu Thr Tyr Leu Leu
20 25 30
Cys Glu Leu Gln Trp Arg Gly Ser His Lys Ser Trp Gln His Trp Leu
35 40 45
Arg Asn Asp Asp Ser Lys Asp Cys His Ala Glu Lys Tyr Phe Leu Glu
50 55 60
Glu Ile Phe Glu Pro Arg Ser Tyr Asn Ile Cys Asp Met Thr Trp Tyr
65 70 75 80
Leu Ser Trp Ser Pro Cys Gly Glu Cys Cys Asp Ile Ile Gln Asp Phe
85 90 95
Leu Glu Glu Gln Pro Asn Val Asn Ile Asn Ile Arg Ile Ala Arg Leu
100 105 110
Tyr Tyr Ala Asp Arg Ala Ser Asn Arg Arg Gly Leu Met Glu Leu Ala
115 120 125
Asn Ser Pro Gly Val Ser Ile Glu Ile Met Asp Ala Asp Asp Tyr Asn
130 135 140
Asp Cys Trp Glu Thr Phe Ile Gln Pro Gly Val Tyr Tyr Arg Phe Ser
145 150 155 160
Pro Glu Asn Phe Glu Ser Ala Ile Arg Arg Asn Cys Ser Gln Leu Glu
165 170 175
Asp Ile Leu Gln Gly Leu His Leu
180
<210> 403
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 403
Met His Leu Gln Val Trp Arg Lys Val Thr Glu Ala Trp Arg Glu Gly
1 5 10 15
Tyr Thr Leu Lys Pro Trp Ser Arg Asn Pro Met Glu Arg Leu Tyr His
20 25 30
Asp Tyr Phe Tyr Phe His Phe Tyr Asn Leu Pro Thr Pro Lys His Arg
35 40 45
Asn Gly Cys Tyr Ile Cys Tyr Gln Val Glu Gly Thr Lys Asn His Ser
50 55 60
Arg Met Pro Leu Leu Arg Gly Val Phe Glu Asn Gln Phe Phe Ser Lys
65 70 75 80
Lys Arg Arg His Thr Glu Leu Cys Phe Leu Ser Trp Phe Arg Thr Glu
85 90 95
Lys Ala Ser Leu Asp Met Leu Leu Ser Ser Gly Glu Lys Tyr Arg Val
100 105 110
Thr Trp Tyr Ile Ser Trp Ser Pro Cys Phe Ala Cys Val Asp Glu Val
115 120 125
Val Lys Phe Leu Arg Glu His Lys Asn Val Glu Leu Ile Ile Phe Ala
130 135 140
Ala Arg Leu Tyr His Ser Asp Ile Leu Gln Tyr Arg Gln Gly Leu Arg
145 150 155 160
Lys Leu His Asp Ala Gly Val His Val Ala Ile Met Ser Tyr Tyr Glu
165 170 175
Phe Lys His Cys Leu Asn Asp Phe Val Phe His Gln Gly Arg Ser Phe
180 185 190
Cys Pro Trp Asn Asp Leu Asn Lys Asn Ser Lys Asn Leu Ser Asn Thr
195 200 205
Leu Glu Asp Ile Leu Gln Asp Gln Glu Asp
210 215
<210> 404
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 404
Met Ala Ser Asp Lys Gly Pro Ser Ala Gly Asp Ala Thr Leu Arg Arg
1 5 10 15
Arg Ile Lys Pro Trp Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Gln Trp Gly Thr Ser His
35 40 45
Lys Ile Trp Arg Asn Ser Gly Lys Asn Thr Ala Asn His Val Glu Ile
50 55 60
Asn Phe Ile Glu Lys Phe Thr Ser Glu Arg Gln Tyr Cys Pro Ser Ile
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Lys Ala Ile Arg Gly Phe Leu Ser Gln His Pro Ser Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Pro Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Val Pro Glu Tyr Asp His Cys Trp Arg Asn Phe Val Asn Tyr Leu
145 150 155 160
Pro Gly Lys Glu Asp His Trp Pro Arg Tyr Pro Val Leu Trp Met Lys
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Pro Ile Glu Met Pro
180 185 190
Gly Lys Ile Arg Asp Ala Pro Asn Asn Met Glu Ile Phe Ser Leu Phe
195 200 205
Val Gly Arg Tyr Ile Pro Lys Thr Lys Phe His Val Thr Cys Leu Leu
210 215 220
Ser Asp Val Arg Asn Asp Asp Ser His Leu Asp Lys Thr Ala Pro Lys
225 230 235 240
Trp Ile Arg Phe Asp Ser Leu Gln Pro Val Ala Ser Asp Pro Ser Ala
245 250 255
Glu His Trp Lys Met Lys Leu Pro Gly Arg Asp Asp Lys Thr Ala Val
260 265 270
Val Val Gly Thr Val Thr Glu Asp Val Ala Cys Ala Gln Gly Ala Lys
275 280 285
Leu Tyr Leu Cys Ala Leu Arg Val His Gly His Ala Gln Arg His Phe
290 295 300
Leu Lys Gly Arg Asp Glu Ile Leu Ala Leu Asp Gln Leu Ala Leu Asp
305 310 315 320
Ser Pro Gln Gly Leu Trp Arg Gln Pro Asp Leu Arg Ser His Pro Leu
325 330 335
Lys Gly
<210> 405
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 405
Met Gln Lys Phe Thr Asp Phe Leu Gly Gly Ile Gln Leu Gly Leu Val
1 5 10 15
Arg Lys Tyr His Tyr Ser Val Asp Gly Val Gly Val Ala Leu Arg Asp
20 25 30
Leu Ile Tyr Ile His Lys Glu Arg Leu Glu Lys Lys Ala Arg Arg Arg
35 40 45
Ala Lys Ser Ser Asn Lys Met Phe Phe Glu Tyr Ile Thr Asp Phe Leu
50 55 60
Glu Phe Glu Gly Gly Asn Asp Ala Ile Leu Glu Tyr Ile Pro Asn Gly
65 70 75 80
Asn Asn Lys Ala Lys Arg Ile Phe Cys Ala Asn Ser Phe Val Asn Asp
85 90 95
Lys Thr Ser Pro Phe Ala Asn Ile Arg Met Pro Tyr Thr Gly Gln Tyr
100 105 110
Ala Leu Ile Pro Pro Lys His Ala Gln Lys Phe Asn Tyr Ile Ile Thr
115 120 125
Asn Arg Glu Arg Glu Leu Gly Lys Gly His Arg Arg Ala Asn Asp Thr
130 135 140
Glu Tyr Lys Leu Leu Glu Leu Ile Ala Ser Arg Ile Ser Pro Val Asp
145 150 155 160
Val Gly His Ile Asn Leu Tyr Thr Tyr Tyr Glu Pro Cys Leu Ser Cys
165 170 175
Asp Tyr Val Ile Val Gln Phe Val Lys Lys Tyr Pro Asn Ile Ser Ile
180 185 190
Asn Val Tyr Phe Glu Glu Glu Tyr Arg Pro Glu Lys Gly Val Ile
195 200 205
<210> 406
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 406
Met Lys Lys Val Lys Gly Val Ser Lys Met His Tyr Glu Gln Ser Ile
1 5 10 15
Asp Gly Ile Asn Leu Arg Val Lys Ser Asp Lys Met Lys Glu Arg Val
20 25 30
Arg Lys Asn Thr Trp Ile Arg Val Lys Lys Gly Ile Ile Ser Lys Arg
35 40 45
Glu Phe Gln Glu Ala Leu Pro Phe Phe Asn Ser Gly Asn Asp Ala Val
50 55 60
Leu Gln Tyr Thr Pro Leu Gly Glu Lys Ile Glu Lys Lys Lys Leu Phe
65 70 75 80
Tyr Ala Asn Ser Ser Val Ser Asp Phe Lys Asn Pro Phe Ala Tyr Leu
85 90 95
Arg Lys Tyr Ala Leu Met Pro Leu Glu Lys Asp Gln Asn Phe Asn Trp
100 105 110
Ile His Thr Asn Arg Lys Arg Glu Ile His Thr Gly Thr Pro Arg Asn
115 120 125
Val Asp Thr Glu Phe Lys Leu Leu Glu Lys Leu Ala Lys Tyr Ile Asp
130 135 140
Ser Gly Asp Val Gly Thr Ile Asp Leu Tyr Thr Tyr Tyr Glu Pro Cys
145 150 155 160
Leu Ser Cys Asp Tyr Val Ile Ile Gln Phe Thr Lys Lys Tyr Pro Asn
165 170 175
Ile Lys Val Asn Val Tyr Phe Ser Glu Glu Tyr Lys Pro Lys Lys Gly
180 185 190
Met Ile
<210> 407
<211> 262
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 407
Met His His Ser Ala Arg Leu Pro Pro Asn Cys Ile Val Ser Arg Tyr
1 5 10 15
Ala Asn Ala Pro Trp Thr Val Leu Pro Leu Pro Leu Pro Pro Thr Glu
20 25 30
Ala Pro Ala Thr Gly Asp Asp Thr Leu Arg Arg Arg Ile Glu Pro Trp
35 40 45
Glu Phe Glu Ala Phe Phe Asn Pro Gln Glu Leu Arg Arg Glu Ala Cys
50 55 60
Leu Leu Tyr Gln Ile Thr Trp Ser Ser His Lys Val Trp Arg Glu Thr
65 70 75 80
Ala Lys Asn Thr Val Asp Ser His Val Glu Val Asn Phe Ile Gln Asn
85 90 95
Leu Thr Ala Gly Arg Tyr Cys Arg Pro Ser Thr Arg Cys Ser Ile Leu
100 105 110
Trp Phe Leu Ser Trp Ser Pro Cys Ser Ser Cys Ser Lys Ala Ile Arg
115 120 125
Leu Phe Leu Ser Gln His Pro Gly Val Ser Leu Val Ile Tyr Val Ala
130 135 140
Arg Leu Phe Gln His Met Asp Pro Gln Asn Arg Gln Gly Leu Arg Glu
145 150 155 160
Leu Ile His Ser Gly Val Thr Ile Gln Val Met Arg Pro Gln Glu Tyr
165 170 175
Asp Tyr Cys Trp Lys Asn Phe Val Asn Tyr Pro Pro Gly Gln Glu Glu
180 185 190
His Trp Pro Arg Tyr Pro Val Gln Cys Met Thr Leu Tyr Asn Leu Glu
195 200 205
Leu Tyr Cys Ile Ile His Asn Leu Pro Pro Cys Val Arg Ile Ser Lys
210 215 220
Gln Arg Gln Ser Gln Leu Ala Phe Phe Ser Leu Gly Leu Glu Asn Val
225 230 235 240
His Tyr Gln Arg Ile Pro Pro Pro Leu Leu Leu Leu Thr Gly Leu Val
245 250 255
Phe Val Phe Pro Trp Lys
260
<210> 408
<211> 395
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 408
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Gly Met Asp Arg His Ala
1 5 10 15
Phe Asn Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu
35 40 45
Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Arg Pro Lys Leu Gln
50 55 60
Ser Asn Arg Arg Tyr Glu Leu Ser Asn Trp Glu Cys Arg Lys His Val
65 70 75 80
Tyr Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe
85 90 95
Cys Gly Asn Gln Leu Pro Ala His Lys Arg Phe Gln Ile Thr Trp Phe
100 105 110
Val Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe
115 120 125
Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu
130 135 140
Tyr Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu His
145 150 155 160
Gln Ala Gly Ala Arg Val Lys Ile Met Asp Tyr Glu Glu Phe Ala Tyr
165 170 175
Cys Trp Glu Asn Phe Val Tyr Asn Glu Gly Gln Ser Phe Met Pro Trp
180 185 190
Asp Lys Phe Asp Asp Asn Tyr Ala Phe Leu His His Lys Leu Lys Glu
195 200 205
Ile Leu Arg Asn Pro Met Glu Ala Thr Tyr Pro His Ile Phe Tyr Phe
210 215 220
His Phe Lys Asn Leu Arg Lys Ala Tyr Gly Arg Asn Glu Thr Trp Leu
225 230 235 240
Cys Phe Thr Met Glu Ile Ile Lys Gln His Ser Thr Val Phe Trp Glu
245 250 255
Thr Gly Val Phe Arg Asn Gln Val Tyr Pro Glu Ser Leu Cys His Ala
260 265 270
Glu Arg Cys Phe Leu Ser Trp Phe Cys Glu Asp Ile Leu Ser Pro Asn
275 280 285
Thr Asp Tyr Arg Val Thr Trp Tyr Thr Ser Trp Ser Pro Cys Leu Asp
290 295 300
Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser Asn Val Lys
305 310 315 320
Leu Ala Ile Phe Ala Ala Arg Leu Tyr Tyr Phe Trp Asp Pro His Tyr
325 330 335
Gln Gln Gly Leu Arg Ser Leu Ser Glu Lys Gly Ala Ser Val Glu Ile
340 345 350
Met Gly Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn
355 360 365
Gly Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu
370 375 380
Phe Leu Asp Ser Lys Leu Gln Glu Ile Leu Gln
385 390 395
<210> 409
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 409
Met Asn Pro Leu Gln Glu Glu Thr Phe Tyr Gln Gln Phe Ser Asn Gln
1 5 10 15
Arg Val Pro Lys Pro Thr Tyr Gln Arg Arg Thr Tyr Leu Cys Tyr Gln
20 25 30
Leu Lys Pro His Glu Gly Ser Val Ile Ala Lys Val Cys Leu Gln Asn
35 40 45
Gln Glu Lys Arg His Ala Glu Ile Cys Phe Ile Asp Asp Ile Lys Ser
50 55 60
Arg Gln Leu Asp Pro Ser Gln Lys Phe Glu Ile Thr Cys Tyr Val Thr
65 70 75 80
Trp Ser Pro Cys Pro Thr Cys Ala Lys Lys Leu Ile Ala Phe Val Asn
85 90 95
Asp His Pro His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe
100 105 110
His Trp Arg Gln Lys Tyr Lys Arg Glu Leu Arg His Leu Gln Lys Ser
115 120 125
Gly Ile Pro Leu Ala Val Met Ser Tyr Leu Glu Phe Lys Asp Cys Trp
130 135 140
Glu Lys Phe Val Asp His Lys Gly Arg Pro Phe Gln Pro Trp Asn Lys
145 150 155 160
Leu Lys Gln Tyr Ser Glu Ser Ile Gly Arg Arg Leu Gln Arg Ile Leu
165 170 175
Gln Pro Leu Asn Asn Leu Glu Asn Asp Phe Arg Asn Leu Arg Leu
180 185 190
<210> 410
<211> 198
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 410
Met Ala Val Glu Glu Glu Lys Gly Leu Leu Gly Thr Ser Gln Gly Trp
1 5 10 15
Lys Ile Glu Leu Lys Asp Phe Gln Glu Asn Tyr Met Pro Ser Thr Trp
20 25 30
Pro Lys Val Thr His Leu Leu Tyr Glu Ile Arg Trp Gly Lys Gly Ser
35 40 45
Lys Val Trp Arg Asn Trp Cys Ser Asn Thr Leu Thr Gln His Ala Glu
50 55 60
Val Asn Cys Leu Glu Asn Ala Phe Gly Lys Leu Gln Phe Asn Pro Pro
65 70 75 80
Val Pro Cys His Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Cys Gln
85 90 95
Cys Cys Arg Arg Ile Leu Gln Phe Leu Arg Ala His Ser His Ile Thr
100 105 110
Leu Val Ile Lys Ala Ala Gln Leu Phe Lys His Met Asp Glu Arg Asn
115 120 125
Arg Gln Gly Leu Arg Asp Leu Val Gln Ser Gly Val His Val Gln Val
130 135 140
Met Asp Leu Pro Asp Tyr Arg Tyr Cys Trp Arg Thr Phe Val Ser His
145 150 155 160
Pro His Glu Gly Glu Gly Asp Phe Trp Pro Trp Phe Phe Pro Leu Trp
165 170 175
Ile Thr Phe Tyr Thr Leu Glu Leu Gln His Ile Leu Leu Gln Gln His
180 185 190
Ala Leu Ser Tyr Asn Leu
195
<210> 411
<211> 234
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 411
Met Asp Pro Gln Arg Leu Arg Gln Trp Pro Gly Pro Gly Pro Ala Ser
1 5 10 15
Arg Gly Gly Tyr Gly Gln Arg Pro Arg Ile Arg Asn Pro Glu Glu Trp
20 25 30
Phe His Glu Leu Ser Pro Arg Thr Phe Ser Phe His Phe Arg Asn Leu
35 40 45
Arg Phe Ala Ser Gly Arg Asn Arg Ser Tyr Ile Cys Cys Gln Val Glu
50 55 60
Gly Lys Asn Cys Phe Phe Gln Gly Ile Phe Gln Asn Gln Lys Lys Arg
65 70 75 80
His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn Ser Leu Asn Leu Asp
85 90 95
Gln Asn Gln Cys Tyr Arg Ile Ile Cys Tyr Val Thr Trp Ser Pro Cys
100 105 110
His Asn Cys Ala Lys Glu Leu Val Asp Phe Ile Ser Asn Arg His His
115 120 125
Leu Ser Leu Gln Leu Phe Ala Ser Arg Leu Tyr Phe His Trp Val Arg
130 135 140
Cys Tyr Gln Arg Gly Leu Gln Arg Leu Gln Ala Asn Arg Val Ser Val
145 150 155 160
Ala Val Met Lys Gly Pro Glu Phe Lys Asp Cys Trp Glu Lys Phe Val
165 170 175
Asp His Gln Gly Glu Ser Phe Pro Ser Trp Glu Lys Leu Glu Gln Tyr
180 185 190
Ser Glu Ser Ile Ser Arg Arg Leu Ser Arg Ile Leu Arg Phe Ala Asn
195 200 205
Gln Asn Asn Leu Glu Asp Ser Phe Arg Asp Leu Arg Leu Gly Ser Pro
210 215 220
Ser Pro Ser Ser Ser Arg Ser Asp Ser Arg
225 230
<210> 412
<211> 377
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 412
Met Thr Lys Ile Asn Ile Ile Ser Asn Lys Arg Lys Lys Glu Arg Ile
1 5 10 15
Lys Ile Asn Asn Leu Asn Asp Phe Lys Asp Ala Leu Lys Lys Glu Gly
20 25 30
Tyr Lys Ile Asn Tyr Phe Asp Glu Glu Lys Phe Lys Ile Glu Val Ala
35 40 45
Lys Ala Phe Lys Val Glu Asn Ser Leu Ile Glu Glu Leu Tyr Lys Cys
50 55 60
Ile Gly Glu Glu Gln Ala Thr Tyr Arg Ala Asp Asp Val Ser Asp Leu
65 70 75 80
Ile Asn Tyr Met Lys Lys Ile Ile Leu Phe Glu Tyr Glu His Asp Arg
85 90 95
Leu Trp Lys Lys Ile Asn Ser Ile Lys Ile Leu Asn Ile Asn Arg Ile
100 105 110
Glu Tyr Glu Arg Asp Thr Val Ser Arg Asp Asp Val Lys Asp Met Leu
115 120 125
Ile Asp Ile Lys Glu Val Lys Lys Arg Val Ser Arg Ile Val Ser Glu
130 135 140
Lys Glu Lys Glu Lys Leu Glu Ile Leu Glu Lys Glu Leu Asp Asn Asp
145 150 155 160
Tyr Leu Tyr Ser Lys Asp Ile Glu Leu Leu Lys Lys Met Leu Leu Ile
165 170 175
Lys Lys Glu Arg Val Lys Glu Ser Tyr Asn Ile Asn Thr Lys Val Lys
180 185 190
Thr Ile Ser Ile Glu Ile Pro Lys Gln Ile Asp Tyr His Tyr Ile Thr
195 200 205
Pro Gln Lys Gly Thr Val Glu Tyr His Gln His Leu Ser Asn Asn Ile
210 215 220
Pro Arg Met Gln Arg Leu Ile Lys Asn Ile Asn Lys Tyr Met Lys Ala
225 230 235 240
Asp Glu Glu Glu Arg Ser Ile Phe Lys Ile Asn Gln Ser Lys Thr Leu
245 250 255
Gln Asp Ser Ile Asn Ile Ala Val Ala Ile Tyr Asp Asn Lys Glu Phe
260 265 270
Lys Ala Ile Ser Gly Ser Asn Asn Ile Lys Asp Tyr Cys His Ala Pro
275 280 285
Thr Lys Asp Glu Ser Phe Phe Lys Ser Asn Lys Val Asn Lys Leu Gly
290 295 300
Glu Phe Gly Ile Gly Tyr Asp Arg Ile Asn Asp Ser Glu Lys Lys Ile
305 310 315 320
Ile Glu Glu Ile His Lys Gln Ile Glu Ala Lys Val Leu Lys Asp Glu
325 330 335
Gly Asn Leu Thr Leu Tyr Ser Lys Trp Glu Pro Cys Pro Ser Cys Cys
340 345 350
Phe Val Ile Ser Gln Phe Cys Lys Lys His Pro Asn Ile Glu Val Gln
355 360 365
Val Lys Tyr His Lys Lys Tyr Gly Glu
370 375
<210> 413
<211> 356
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 413
Met Gly Pro Val Arg Val Cys Glu Ser Ala Val Ile Trp Ala Ala Gly
1 5 10 15
Thr Ser Lys Ala Gly Glu Pro Leu Ser Trp Pro Ser Thr Pro Pro Gly
20 25 30
Gly Ala Gly Tyr Gln Arg Pro Ser Leu Ala Ala Cys Thr Gly Thr Arg
35 40 45
Leu Leu Thr Tyr Ile Leu Arg Glu Glu Thr Gln His Gly Val Pro Ser
50 55 60
Phe Ser Ala Arg Arg Ala Pro Gly Ser Leu Arg Gln Ala Thr Ala Val
65 70 75 80
Leu Ala Ala Ala Gly Asp Ser Ala Met Gly Arg His Gly Ala Cys Pro
85 90 95
Pro Gly Cys Leu Leu Asp Glu Asn Thr Phe Ala Glu Asn Tyr Met Asn
100 105 110
Gln Ile Ser Thr Arg Lys Thr Tyr Leu Cys Tyr Lys Val Glu Ile Leu
115 120 125
Gly Gly Asp Ala Arg Val Pro Pro Asp Glu Ser Lys Gly Phe Val Gln
130 135 140
Asn Lys Gly Ala Asn Glu Pro Gly Trp Pro Arg His Ala Glu Leu Tyr
145 150 155 160
Phe Leu Asp Arg Ile Arg Ser Trp Asn Leu Asp Pro Gly Leu Arg Tyr
165 170 175
Arg Leu Thr Cys Phe Ile Ser Trp Thr Pro Cys His Thr Cys Ala Gln
180 185 190
Glu Leu Ala Thr Phe Leu Gly Glu Asn Ser His Leu Ser Leu His Ile
195 200 205
Phe Ala Ser Arg Ile Tyr Ser Leu Pro Gly Tyr Glu Ala Gly Leu Arg
210 215 220
Thr Leu Gln Ala Ala Gly Ala Gln Ile Ala Ile Met Thr Ser Gln Glu
225 230 235 240
Phe Glu His Cys Trp Lys Asn Phe Val Asp His Gln Gly Arg Thr Phe
245 250 255
Glu Pro Trp Asp Glu Leu Glu Val Val Ser Gln His Leu Cys Lys Lys
260 265 270
Leu Gln Glu Ile Leu Gln Ala Leu Cys Val Leu Gln Glu Gly Ala His
275 280 285
Gly Arg Leu Ala Asp Asn Glu Ala Ala Phe Ser Gly Ala Ala Lys Leu
290 295 300
Arg Leu Ser Arg Gly Gly Leu Glu Pro Gly Ala Trp Gln Gly Ala Asn
305 310 315 320
Trp Arg Gly Ser Pro Arg Leu Trp Tyr Leu Ser Leu Ala Gly Pro Ala
325 330 335
Gly Pro Gly Thr Ala Ala Ser Ala Leu Pro Val Ala Pro Gly Ala Ala
340 345 350
Ser His Tyr Arg
355
<210> 414
<211> 211
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 414
Met Glu Asp Phe His Cys Val Cys Val Tyr Cys Pro Leu Gln Val Ser
1 5 10 15
Val Met Ser Asp Tyr Gln Ala Ala Ser Ser Ser Pro Asp Cys Pro Gln
20 25 30
Cys Pro Gln His Ile Leu Thr Gly Ala Glu Ala Ala Val Ser Tyr Ser
35 40 45
Gln Phe Cys Glu Thr Phe Gly Phe His Met Gly Pro Ser Gly Ala Arg
50 55 60
Ala Leu Leu Leu Phe Tyr Glu Leu Trp Gly Pro Ser Gly Thr Leu Val
65 70 75 80
Gln Arg Gly Gln Ala Ser Asn Leu Leu Glu Val Cys Glu Glu Val Leu
85 90 95
Tyr Ser Asn Tyr Met Pro Cys Gln Glu Cys Ser Gln Thr Leu Ile Ser
100 105 110
Phe Leu Leu Arg Tyr Pro Trp Val Arg Leu Asp Leu Leu Phe Ser Gln
115 120 125
Leu Tyr His Thr Ala Pro Ser Gln Thr His Ser Leu Asp Asn Gln Thr
130 135 140
Gly Leu Arg Ser Leu Ala Val Leu Thr Leu Ser Pro Asn Ser Gly Ala
145 150 155 160
Ala Trp Gly His Leu Leu Arg Cys Phe Val Arg Asp Val Pro Pro Ser
165 170 175
Ala Leu Gln Leu Pro Leu Leu Pro Glu Arg Val Glu Ala Asp Arg Val
180 185 190
Asn Ala Ile His Ile Ser Ala Thr Thr Gly Ile Gly Pro Ala Phe Trp
195 200 205
Thr Ser His
210
<210> 415
<211> 230
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 415
Met Thr Gly Ala Ile Trp Asn Phe Val His Ser Ala Leu Met Asn Phe
1 5 10 15
Leu Asn Ala Met Ala Leu Leu Thr Ala Glu Thr Phe Ser Leu Gln Phe
20 25 30
Asn Asn Lys Arg Cys Val Ser Lys Pro Tyr Tyr Pro Arg Lys Ala Leu
35 40 45
Leu Cys Tyr Gln Leu Thr Arg Gln Asn Gly Ser Thr Pro Thr Arg Gly
50 55 60
Tyr Leu Lys Asn Lys Lys Lys His His Ala Glu Ile Arg Phe Ile Lys
65 70 75 80
Lys Ile Glu Ser Met Gly Leu Asp Lys Thr Gln Cys Tyr Gln Val Thr
85 90 95
Cys Tyr Leu Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val
100 105 110
Asp Phe Ile Gln Ala His His His Leu Thr Leu Arg Ile Phe Ala Ser
115 120 125
Arg Leu Tyr Tyr His Trp Leu Gly His Tyr Gln Glu Gly Leu Leu Leu
130 135 140
Leu Cys Gly Ser Gln Val Pro Val Glu Val Met Gly Leu Arg Glu Phe
145 150 155 160
Thr Asp Cys Trp Glu Asn Phe Val Asp His Glu Glu Pro Pro Ser Phe
165 170 175
Asn Pro Ser Glu Lys Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile
180 185 190
Lys Arg Arg Leu Glu Arg Ile Lys Gln Ser Arg Ser Val Asp Val Leu
195 200 205
Glu Asn Gly Leu Arg Ser Leu Gln Leu Gly Pro Val Thr Pro Ser Ser
210 215 220
Ser Arg Cys Asn Ser Arg
225 230
<210> 416
<211> 267
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 416
Met Gly Thr Pro Lys Asp Thr Lys Ser Arg His Leu Ala Gly Arg Cys
1 5 10 15
His Glu Leu His Asn Ser Arg Gly Arg Ser Pro Glu Ser Asp Thr Met
20 25 30
Ala Ser Glu Lys Gly Pro Ser Asn Lys Asp Tyr Thr Leu Arg Arg Arg
35 40 45
Ile Glu Pro Trp Glu Phe Glu Val Phe Phe Asp Pro Gln Glu Leu Arg
50 55 60
Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Ala Ser Ser Lys
65 70 75 80
Thr Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val Asn
85 90 95
Phe Leu Glu Lys Leu Thr Ser Glu Gly Arg Leu Gly Pro Ser Thr Cys
100 105 110
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser
115 120 125
Thr Ala Ile Arg Glu Phe Leu Ser Gln His Pro Gly Val Thr Leu Val
130 135 140
Ile Phe Val Ala Arg Leu Phe Gln His Met Asp Arg Arg Asn Arg Gln
145 150 155 160
Gly Leu Lys Asp Leu Val Thr Ser Gly Val Thr Val Gln Val Met Ser
165 170 175
Val Ser Glu Tyr Cys Tyr Cys Trp Glu Asn Phe Val Asn Tyr Pro Pro
180 185 190
Gly Lys Ala Ala Gln Trp Pro Arg Tyr Pro Pro Arg Trp Met Leu Met
195 200 205
Tyr Ala Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
210 215 220
Lys Ile Ser Arg Arg His Gln Lys Gln Leu Thr Phe Phe Ser Leu Thr
225 230 235 240
Pro Gln Tyr Cys His Tyr Lys Met Ile Pro Pro Tyr Ile Leu Leu Ala
245 250 255
Thr Gly Leu Leu Gln Pro Ser Val Pro Trp Arg
260 265
<210> 417
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 417
Met Thr Asn Pro Gln Ile Arg Asn Met Val Lys Arg Met Lys Pro Gly
1 5 10 15
Ile Phe Val Ser Asn Phe Asn Asn Lys Pro Ile Leu Ser Gly Arg Asn
20 25 30
Thr Val Trp Leu Cys Cys Glu Val Lys Thr Lys Asp Pro Ser Gly Pro
35 40 45
Pro Leu Asp Ala Lys Ile Phe Arg Asp Lys Val Tyr Ser Lys Ala Lys
50 55 60
Tyr His Pro Glu Met Arg Phe Leu Arg Trp Phe Arg Lys Trp Arg Gln
65 70 75 80
Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Val Ser Trp Ser
85 90 95
Pro Cys Thr Gly Cys Ala Asn Ser Val Ala Thr Phe Leu Ala Glu Asp
100 105 110
Pro Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp
115 120 125
Lys Pro Asp Tyr Gln Glu Ala Leu Arg Val Leu Cys Gln Lys Arg Gly
130 135 140
Ser Pro His Ala Thr Met Lys Ile Met Asn Tyr Asn Glu Phe Gln His
145 150 155 160
Cys Trp Asn Lys Phe Val Arg Gly Arg Arg Glu Pro Phe Glu Pro Trp
165 170 175
Glu Asn Leu Pro Lys His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu
180 185 190
Leu Leu Arg His Leu Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn
195 200 205
Asn Lys Leu Trp Val Ser Gly Gln His Glu Thr Tyr Leu Cys Tyr Lys
210 215 220
Val Glu Arg Pro His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg
225 230 235 240
Gly Phe Leu Gln Asn Gln Ala Pro Asp Ile His Gly Phe Pro Lys Gly
245 250 255
Arg His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys Leu
260 265 270
Asp Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Asn Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Asp Asn Lys His
290 295 300
Val Ser Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu His Arg Asp Gly Ala Lys Ile Ala
325 330 335
Met Met Asn Tyr Ser Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Asp
340 345 350
Arg Gln Gly Arg Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Val Thr Ala Ser
370 375 380
Ser Leu Phe Gln Gly Asn Lys Ile Met Ile Pro Val Ser Ser Trp
385 390 395
<210> 418
<211> 396
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 418
Met Gln Pro Gln Gly Leu Gly Pro Asn Ala Gly Met Gly Pro Val Cys
1 5 10 15
Leu Gly Cys Ser His Arg Arg Pro Tyr Ser Pro Ile Arg Asn Pro Leu
20 25 30
Lys Lys Leu Tyr Gln Gln Thr Phe Tyr Phe His Phe Lys Asn Val Arg
35 40 45
Tyr Ala Trp Gly Arg Lys Asn Asn Phe Leu Cys Tyr Glu Val Asn Gly
50 55 60
Met Asp Cys Ala Leu Pro Val Pro Leu Arg Gln Gly Val Phe Arg Lys
65 70 75 80
Gln Gly His Ile His Ala Glu Leu Cys Phe Ile Tyr Trp Phe His Asp
85 90 95
Lys Val Leu Arg Val Leu Ser Pro Met Glu Glu Phe Lys Val Thr Trp
100 105 110
Tyr Met Ser Trp Ser Pro Cys Ser Lys Cys Ala Glu Gln Val Ala Arg
115 120 125
Phe Leu Ala Ala His Arg Asn Leu Ser Leu Ala Ile Phe Ser Ser Arg
130 135 140
Leu Tyr Tyr Tyr Leu Arg Asn Pro Asn Tyr Gln Gln Lys Leu Cys Arg
145 150 155 160
Leu Ile Gln Glu Gly Val His Val Ala Ala Met Asp Leu Pro Glu Phe
165 170 175
Lys Lys Cys Trp Asn Lys Phe Val Asp Asn Asp Gly Gln Pro Phe Arg
180 185 190
Pro Trp Met Arg Leu Arg Ile Asn Phe Ser Phe Tyr Asp Cys Lys Leu
195 200 205
Gln Glu Ile Phe Ser Arg Met Asn Leu Leu Arg Glu Asp Val Phe Tyr
210 215 220
Leu Gln Phe Asn Asn Ser His Arg Val Lys Pro Val Gln Asn Arg Tyr
225 230 235 240
Tyr Arg Arg Lys Ser Tyr Leu Cys Tyr Gln Leu Glu Arg Ala Asn Gly
245 250 255
Gln Glu Pro Leu Lys Gly Tyr Leu Leu Tyr Lys Lys Gly Glu Gln His
260 265 270
Val Glu Ile Leu Phe Leu Glu Lys Met Arg Ser Met Glu Leu Ser Gln
275 280 285
Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
290 295 300
Arg Gln Leu Ala Ala Phe Lys Lys Asp His Pro Asp Leu Ile Leu Arg
305 310 315 320
Ile Tyr Thr Ser Arg Leu Tyr Phe Tyr Trp Arg Lys Lys Phe Gln Lys
325 330 335
Gly Leu Cys Thr Leu Trp Arg Ser Gly Ile His Val Asp Val Met Asp
340 345 350
Leu Pro Gln Phe Ala Asp Cys Trp Thr Asn Phe Val Asn Pro Gln Arg
355 360 365
Pro Phe Arg Pro Trp Asn Glu Leu Glu Lys Asn Ser Trp Arg Ile Gln
370 375 380
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu
385 390 395
<210> 419
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 419
Met Cys Pro Arg Cys Pro Arg His Val Arg Val Gly Ser Asp Ser Arg
1 5 10 15
Val Pro Tyr Arg Glu Phe Cys Arg Ser Phe Gly Tyr Pro Val Ala Leu
20 25 30
Ala Arg Ser Ala Pro Trp Pro Gly Asp Asp Gly Ala Leu Leu Gly Phe
35 40 45
Tyr Glu Leu Arg Gly Thr Gly Gly Pro Leu Val Gln Arg Gly His Ala
50 55 60
Thr Gly Cys Ala Ala Arg Gly His His Pro Glu Thr Leu Leu Phe Asp
65 70 75 80
Ala Glu Gly His Leu Asp Ser Val Leu Leu Thr Leu Gly Leu Gly His
85 90 95
Gly Ala Ala Thr Arg Val Ala Leu Phe Ser Ser His Ala Pro Cys Gly
100 105 110
His Glu Ala Leu Gly Cys Val Ser Arg Ile Leu Gly Phe Leu Glu Ala
115 120 125
His Pro Gly Val Arg Leu Glu Met Tyr Phe Ala Gln Phe Glu Ser Gly
130 135 140
Phe Ala Glu Ala Gly Arg Gly Tyr His Arg Pro Pro Tyr Gly His Arg
145 150 155 160
Asp Gly Thr Asp Glu Gly Gly Ser Leu Arg Asp Leu Val Ser Leu Arg
165 170 175
Pro Arg Val Thr Val Ala Pro Ile Ser Gly Gly Met Trp Gly Lys Ile
180 185 190
Leu Arg Asp Phe Val Ser Asn Val Pro Pro Leu Ala Leu Met Asn Pro
195 200 205
Val Asn His Leu Arg Ala Arg Glu Asp Ser Glu Asn Ala Ala Arg Leu
210 215 220
Ala Gly Ile Thr Gly Val Trp Pro Pro Tyr Val Asp Leu Ala Pro Val
225 230 235 240
Pro Ser Lys Lys Ser Phe Ser Ser Ser Ser Pro Ser Ser Ser Ser Phe
245 250 255
Pro Ser Ser Ser Ser Phe Pro Ser Ser Ser Ser Ser Thr Thr Ser Pro
260 265 270
Leu Leu Gly Leu Phe Pro Thr Leu Asp Thr Phe Val Val Thr Val Leu
275 280 285
Thr Pro Ala Gln Thr Tyr Ala Trp Pro Gln Ala Trp Thr Pro Asn Trp
290 295 300
Arg Gln Pro Gln Pro Gln Val Val Arg His Met Thr Leu Pro Asp Leu
305 310 315 320
Pro Pro Pro Pro Lys Gln Lys Glu Lys Thr Ile Gln Glu Met Leu Pro
325 330 335
Pro Asn Gly Ile Ile Lys Asp Phe Thr Ile Thr Gln Glu Lys Pro Val
340 345 350
Lys Gln Ser Ala Asp Thr Thr Gly Lys Ser Asp Arg Gly Lys Lys
355 360 365
<210> 420
<211> 230
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 420
Met Ala Ala Gly Pro Ala Pro Glu Ala Arg Ser Leu Met Asp Glu Gln
1 5 10 15
Thr Phe Leu Asp Asn Phe Asn Asn Leu Lys Tyr Pro Arg Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Leu Leu Val Gly Glu Asn His Ile Pro Leu
35 40 45
Asp Asp Tyr Lys Gly Phe Val His Asn Glu Gly Phe Asp Met Gly Leu
50 55 60
Glu Arg Cys His Ala Glu Leu Ile Phe Leu Glu Arg Met Ala Ser Trp
65 70 75 80
Asn Leu Asp Thr Glu Leu Arg Tyr Arg Ile Thr Val Phe Ile Ser Trp
85 90 95
Ser Pro Cys Pro Glu Cys Ala Asp Glu Leu Val Lys Phe Leu Arg Glu
100 105 110
Asn Arg His Val Asn Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Trp
115 120 125
Tyr Gln Gly Tyr Glu Ala Gly Leu Arg Ala Leu Lys Ala Ala Gly Ala
130 135 140
Glu Val Ala Met Met Thr Leu His Glu Phe Glu Tyr Cys Trp Asn Asn
145 150 155 160
Phe Val Asp His Gln Gln Asp Glu Asp Thr Pro Phe Pro Pro Trp Asp
165 170 175
Asn Leu Val Ala Arg Ser Glu Glu Leu Ser Gln Arg Leu Glu Gly Ile
180 185 190
Leu Gln Pro Ser Val Leu Val Phe Cys Trp Pro Ser Gln Val Ser Val
195 200 205
Thr Ala Ala His Ser Asp Ile Met Ser Gln Ala Ser Arg Ala Trp Glu
210 215 220
Lys Arg Arg Asp Pro Pro
225 230
<210> 421
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 421
Met Ile His Val Asp Gln Leu Leu Glu Ala Asp Arg Ile His His Glu
1 5 10 15
Thr Trp Met Gln Glu Ala Leu Lys Glu Ala Asp Lys Ala Leu Val Leu
20 25 30
Asp Glu Val Pro Ile Gly Ala Val Leu Val Tyr Gln Gly Gln Ile Val
35 40 45
Gly Arg Gly His Asn Val Arg Glu Ser Gln Glu Arg Ala Leu Gly His
50 55 60
Ala Glu Leu Met Ala Ile Glu Thr Ala Asn Gln Gln Leu Gly His Trp
65 70 75 80
Arg Leu Glu Glu Ala Ser Leu Tyr Val Thr Leu Glu Pro Cys Pro Met
85 90 95
Cys Ala Gly Ala Leu Met Asn Cys Arg Ile Lys Glu Val Ile Tyr Gly
100 105 110
Ala Ser Asp Leu Lys Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu
115 120 125
Glu Glu Asp Arg Phe Asn His Arg Ala Gln Val Ile Gln Gly Val Leu
130 135 140
Glu Gln Glu Cys Ser His Lys Leu Ser Gln Phe Phe Lys Asp Leu Arg
145 150 155 160
Gln Arg Lys Lys Met Ser Lys Ala Arg Gln Thr Glu His Lys Glu
165 170 175
<210> 422
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 422
Met Lys Leu Asn Gln Glu Glu Met Asp Arg Tyr Trp Met Arg Glu Ala
1 5 10 15
Leu Leu Leu Ala Glu Glu Ala Gly Lys Leu Gly Glu Val Pro Ile Gly
20 25 30
Ala Val Ile Val Arg Asn Gly Glu Lys Ile Gly Gln Gly Tyr Asn Arg
35 40 45
Arg Glu Val Asp Lys Asn Pro Leu Ala His Ala Glu Ile Leu Ala Ile
50 55 60
Gln Glu Ala Ser Arg Thr Leu Lys Gly Trp Arg Leu Asn Gly Thr Thr
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Gly Gly Ala Ile Leu
85 90 95
Gln Ser Arg Ile Pro Arg Leu Val Phe Gly Ala Arg Asp Pro Lys Ala
100 105 110
Gly Ala Ala Gly Ser Ile Leu Asp Leu Met His Glu Pro Arg Phe Asn
115 120 125
His Gln Val Glu Val Val Glu Gly Val Leu Ala Glu Glu Ala Gly Ala
130 135 140
Leu Leu Thr Gln Phe Phe Arg Arg Leu Arg Gln Arg
145 150 155
<210> 423
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 423
Met Ser Leu Lys Gln Ser Lys Glu Asp Ile Phe Phe Met Glu Gln Ala
1 5 10 15
Leu Val Glu Ala Glu Lys Ala Met Glu Ile Gly Glu Val Pro Ile Gly
20 25 30
Ala Ile Ile Val Arg Asp Asn Val Ile Ile Ala Arg Gly His Asn Leu
35 40 45
Arg Glu Gln Gln Gln Met Val Thr Asn His Ala Glu Leu Ile Ala Ile
50 55 60
Gln Lys Ala Cys Glu Glu Val Gly Ser Trp Arg Leu Glu Asp Cys Thr
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val
85 90 95
Gln Ser Arg Met Lys Arg Val Val Tyr Gly Ala Ala Asp Pro Lys Ala
100 105 110
Gly Cys Cys Gly Ser Leu Met Asn Leu Leu Asp Glu Pro Arg Leu Asn
115 120 125
His Gln Val Tyr Val Thr Ser Gly Leu Tyr Glu Glu Glu Ser Ser Arg
130 135 140
Leu Leu Lys Asp Phe Phe Lys Lys Leu Arg Gln Lys Lys Lys Gly Thr
145 150 155 160
Asp
<210> 424
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 424
Met Gln Gln Gln Lys Gly Lys Glu Lys Leu Thr Asp Gln Glu Arg Phe
1 5 10 15
Met Lys Glu Ala Ile Arg Gln Ala Lys Lys Ala Glu Ala Leu Glu Glu
20 25 30
Val Pro Ile Gly Cys Val Ile Val His Glu Gly Lys Ile Ile Ala Arg
35 40 45
Gly Tyr Asn Arg Arg Asn Thr Asp Lys Asn Thr Leu Ser His Ala Glu
50 55 60
Leu Asn Ala Ile Arg Lys Ala Ser Lys Lys Leu Gly Asp Trp Arg Leu
65 70 75 80
Glu Gly Cys Thr Met Tyr Val Thr Leu Glu Pro Cys Gln Met Cys Ser
85 90 95
Gly Ala Leu Val Gln Ser Arg Ile Asp Glu Val Val Ile Gly Cys Met
100 105 110
Asn Ala Lys Ala Gly Cys Ala Gly Ser Val Met Asn Leu Leu Gln Val
115 120 125
Asp Gly Phe Asn His Gln Val Lys Ile Ile Gln Gly Val Leu Glu Glu
130 135 140
Glu Cys Ser Ser Met Leu Ser Glu Phe Phe Arg Lys Leu Arg Glu Lys
145 150 155 160
Lys Lys Gln Glu Lys Ala Ala Leu Lys Ala Ala Gln Glu Asn Pro Glu
165 170 175
Gly Glu Pro Glu Gln
180
<210> 425
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 425
Met Asn Lys Ile Thr Leu Asn Arg Gly Ser Met Glu Glu Asn Ile Asn
1 5 10 15
Phe Thr Asp Ala Glu Arg Thr Ala Met Asn Leu Ala Leu Glu Leu Ala
20 25 30
Gly Lys Ala Arg Glu Arg Gly Asp Val Pro Ile Gly Ala Val Ile Leu
35 40 45
Tyr Asp Gly Leu Lys Pro Asp Ser Pro Met Gly Arg Leu Cys Arg Glu
50 55 60
Lys Gly Ile Phe Pro Gly Glu Ile Leu Gly Thr Gly Phe Asn Gln Arg
65 70 75 80
Asn Phe His Gly Asn Ala Leu Cys His Ala Glu Ile Leu Ala Ile Glu
85 90 95
Glu Ala Cys Lys Lys Ile Gly Asp Trp Arg Leu Glu Asp Cys Thr Leu
100 105 110
Tyr Val Asn Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln
115 120 125
Ala Arg Ile Pro Arg Leu Gln Met Ser Val Arg Asn Pro Lys Ala Gly
130 135 140
Phe Cys Gly Ser Val Met Asn Ile Leu Gln Met Lys Glu Leu Asn His
145 150 155 160
Arg Val Glu Ile Thr Glu Gly Leu Gln Ala Glu Glu Ala Arg Lys Leu
165 170 175
Leu Gln Asp Phe Phe Ala Lys Leu Arg Leu Lys Glu Glu
180 185
<210> 426
<211> 164
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 426
Met Glu Thr Ala Phe Asp Leu Ala Lys Glu Ala Leu Ala Ala Asn Glu
1 5 10 15
Val Pro Ile Gly Cys Ser Phe Val Tyr Asn Gly Lys Val Val Ala Ser
20 25 30
Gly Arg Asn His Val Asn Glu Tyr Arg Asn Ala Ser Leu His Ala Glu
35 40 45
Ile Leu Ala Ile Met Glu Leu Glu Gln Trp Cys Ala Ile Gln Asn Leu
50 55 60
Asp Phe Ala Glu Val Leu Ser Gln Ser Ile Leu Tyr Val Thr Ala Glu
65 70 75 80
Pro Cys Ile Met Cys Ala Ala Ala Leu Arg Phe Ser Leu Pro Gly Gln
85 90 95
Pro Leu Lys Ile Val Tyr Ser Ala Lys Asn Glu Arg Phe Gly Gly Cys
100 105 110
Gly Ser Val Leu Ser Ile His Ser Asp Pro Ser Pro Tyr Pro Ile Leu
115 120 125
Val Cys Glu Val Asp Asn Arg Ser Asp Glu Ser Ile Asp Leu Leu Lys
130 135 140
Gln Phe Tyr Lys Leu Glu Asn Ala Asn Ala Pro Glu Ser Lys Arg Ile
145 150 155 160
Lys Lys Arg Gln
<210> 427
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 427
Met Arg Glu Gly Asn Asp Glu Arg Glu Val Thr Glu Arg His Glu Trp
1 5 10 15
Phe Met Arg Ile Ala Leu Asp Gln Ala Glu Lys Ala Leu Arg Asp Lys
20 25 30
Glu Val Pro Val Gly Cys Val Phe Val His Ala Asp Ser Gly Thr Val
35 40 45
Leu Ala Thr Gly Ala Asn Glu Thr Asn Ile Ser Leu Asn Gly Thr Arg
50 55 60
His Ala Glu Phe Val Gly Val Asp Ala Ile Leu Lys Gln His Pro Ala
65 70 75 80
Ser Ile Leu Gln Glu Thr Val Leu Tyr Val Thr Val Glu Pro Cys Val
85 90 95
Met Cys Ala Ala Ala Leu Arg Gln Leu Gln Ile Lys His Val Tyr Phe
100 105 110
Gly Cys Gly Asn Asp Arg Phe Gly Gly Cys Gly Ser Val Phe Ser Val
115 120 125
His Ser Asp Pro Val Gly Arg Ser Val Glu Thr Pro Gly Tyr Pro Val
130 135 140
Thr Ser Gly Ile Phe Ser Lys Glu Ala Ile Met Leu Leu Arg Arg Phe
145 150 155 160
Tyr Leu Leu Gln Asn Asp Thr Ala Pro Asn Pro Ala Leu Lys Ala Met
165 170 175
Arg Val Leu Lys Glu Val Glu Asp
180
<210> 428
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 428
Met Glu Gln Leu Lys Asn Glu Ser Glu Thr Glu Leu Gln Asn Gln Ser
1 5 10 15
Glu Ala Glu Met Arg Asp Glu Lys Tyr Met Lys Glu Ala Leu Lys Gln
20 25 30
Ala Lys Lys Ala Tyr Ala Leu Glu Glu Thr Pro Ile Gly Cys Val Ile
35 40 45
Val His Glu Gly Lys Ile Ile Ala Arg Gly Tyr Asn Arg Arg Asn Thr
50 55 60
Asp Lys Ser Pro Leu Ala His Ala Glu Ile Ser Ala Ile Lys Lys Ala
65 70 75 80
Ser Lys Lys Leu Gly Asp Trp Arg Leu Glu Glu Cys Thr Leu Tyr Val
85 90 95
Thr Leu Glu Pro Cys Gln Met Cys Ala Gly Ala Ile Ile Gln Ser Arg
100 105 110
Ile Pro Arg Val Val Val Gly Cys Met Asn Pro Lys Ala Gly Cys Ala
115 120 125
Gly Ser Val Leu Asn Leu Leu Asp Val Gln Ala Phe Asn His Gln Ala
130 135 140
Glu Val Lys Thr Lys Val Leu Glu Glu Glu Cys Ser Leu Met Met Lys
145 150 155 160
Gln Phe Phe Arg Glu Leu Arg Ala Lys Gln Lys Met Lys Lys Lys Ser
165 170 175
Leu Leu Ser Glu
180
<210> 429
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 429
Met Val Gly Gly Arg Ser Ser Arg Gly Arg Arg Ser Pro Cys Arg Leu
1 5 10 15
Cys Val Cys Gln Arg Trp Pro Ser Asp Arg Ser Ser Lys Glu Ser Asp
20 25 30
Gln Arg Met Ala Gln Cys Lys Gly Ser Ser His Pro Leu Asp Ile Met
35 40 45
Arg Gly Arg Pro Val Asn Glu Gln Ala Thr Leu His Ala Glu Leu Glu
50 55 60
Ala Ile Asp His Leu Leu Pro Thr Asn Pro Ala Pro Leu Ser Ser Ile
65 70 75 80
Thr Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu
85 90 95
Arg Gln Ile Gly Ile Gly Arg Val Ile Tyr Gly Cys Gly Asn Asp Arg
100 105 110
Phe Gly Gly Cys Gly Ser Val Ile Asn Val Asn Ser Ser Cys Val Ser
115 120 125
Pro Leu Asp Val Leu Leu Cys Pro Asn Pro Pro Arg Glu Met Leu Asp
130 135 140
Thr His Pro Pro Phe Val Ala Glu Gly Gly Phe Tyr Arg Glu Glu Ala
145 150 155 160
Ile Met Leu Leu Arg Arg Phe Tyr Met Ser Glu Asn Gln Asn Gly Gln
165 170 175
<210> 430
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 430
Met Glu Gly Thr Ala Ala Ala Ser Ala Ala Gly Asp Gly Ser His Ala
1 5 10 15
Val Ser Ala Glu Glu Thr Ala Lys Trp Met Glu Glu Ala Met Arg Met
20 25 30
Ala Lys Glu Ala Leu Lys Asn Thr Glu Val Pro Val Gly Cys Leu Met
35 40 45
Val Tyr Asn Asn Glu Val Val Gly Lys Gly Arg Asn Glu Val Asn Gln
50 55 60
Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp Gln Val
65 70 75 80
Leu Asp Trp Cys Arg Glu Asn Asp Leu Arg Pro Ser Ala Val Phe Glu
85 90 95
His Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala
100 105 110
Ala Leu Arg Leu Met Ser Ile Leu Trp Pro Cys Lys Phe Lys Pro Cys
115 120 125
Ser Phe Pro Asn Glu Arg Phe Gly Gly Cys Asp Ile Ala Ser Ala Asp
130 135 140
Leu Pro Asn Thr Gly Asp Asn Phe Arg Val Leu His Thr Phe Ser Trp
145 150 155 160
Ala Trp Phe Ile Leu Leu Phe Ser Phe His Gln Cys Ile Pro Gly Tyr
165 170 175
Arg Ala Glu Glu Ala Val Glu Leu Leu Lys Thr Phe Tyr Lys Gln Glu
180 185 190
Asn Pro Asn Ala Pro Lys Ser Lys Val Arg Lys Lys Glu Cys Gln Lys
195 200 205
Pro
<210> 431
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 431
Met Pro Val Met Ile Val Glu Lys Lys Ser Ile Ala Arg Ser His Glu
1 5 10 15
Tyr Trp Met Gln Arg Ala Ile Ala Glu Ala Gly Lys Ala Arg Ser Arg
20 25 30
Asp Glu Val Pro Ile Gly Cys Val Ile Val Arg Asp Asn Arg Ile Ile
35 40 45
Ala Arg Gly His Asn Leu Arg Glu Ser Ser Gln Asp Pro Ser Ala His
50 55 60
Ala Glu Met Ile Ala Ile Arg Lys Ala Ala Arg Lys Leu Ser Ser Trp
65 70 75 80
Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met
85 90 95
Cys Met Gly Ala Ile Ile Leu Ser Arg Ile Pro Arg Val Val Phe Gly
100 105 110
Cys Leu Asp Pro Lys Gly Gly Ala Ala Gly Ser Leu Tyr Asp Leu Ser
115 120 125
Asn Asp Pro Arg Leu Asn His Arg Val Glu Leu Leu Pro Gly Val Leu
130 135 140
Glu Arg Asp Cys Ser Ser Leu Leu Ser Gly Phe Phe Ala Glu Leu Arg
145 150 155 160
Arg Arg Arg Arg Glu Ala Arg Leu Ser Ser Ala Gly Glu Leu Pro Gly
165 170 175
Thr Pro Gln Gly Cys
180
<210> 432
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 432
Met Leu Ser Ser Glu Asp Asn Lys Trp Met Lys Leu Ala Leu Asp Glu
1 5 10 15
Ala Asp Lys Ala Glu Lys Ile Gly Glu Val Pro Ile Gly Ala Val Ile
20 25 30
Val Lys Gly Glu Glu Ile Ile Ala Thr Ala Tyr Asn Arg Arg Glu Val
35 40 45
Asp Ala Gln Ala Thr Ala His Ala Glu Leu Ile Ala Ile Gln Lys Ala
50 55 60
Cys Gln His Leu Asp Ala Trp Arg Leu Ser Gly Cys Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Gln Ser Arg
85 90 95
Ile Asp Arg Val Val Phe Gly Ala Tyr Asp Pro Lys Ala Gly Cys Ala
100 105 110
Gly Ser Leu Met Asn Leu Leu Gln Asp Glu Arg Phe Asn His Gln Thr
115 120 125
Glu Val Asp Cys Gly Cys Leu Ala Asp Glu Cys Gly Gly Lys Leu Ser
130 135 140
Thr Phe Phe Arg Ala Leu Arg Gln Lys Lys Lys Gly Leu Lys Gln Lys
145 150 155 160
<210> 433
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 433
Met Val Gly Cys Val Phe Ala Ile Glu Ser Asp Ile Ile Ala Glu Ser
1 5 10 15
Arg Asn Ser Val Asn Ala Thr His Asn Pro Thr Arg His Ala Glu Ile
20 25 30
Asn Cys Ile Asp Tyr Val Ile Glu Tyr Cys Lys Ala Asn Asn Ile Asp
35 40 45
Tyr Arg Leu Tyr Phe Lys Asn Val Thr Val Tyr Val Thr Val Glu Pro
50 55 60
Cys Ile Met Cys Ala Ala Ala Leu Ser Asn Leu Gly Val Lys Glu Val
65 70 75 80
Val Tyr Gly Cys Ala Asn Asp Arg Phe Gly Gly Lys Thr Val Leu Asp
85 90 95
Ile Ser Asn Phe Tyr Glu His Asn Tyr Asn Leu Ile Gly Asn Leu Met
100 105 110
Ala Asn Glu Ala Met Ala Leu Leu Lys Gln Phe Tyr Lys Gly Ala Asn
115 120 125
Pro Asn Ala Pro Glu Ser Lys Val Lys Lys Lys Gln Lys Lys Arg Gln
130 135 140
Lys Ala Ala Ser Ala Thr Leu Arg Ser
145 150
<210> 434
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 434
Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg
1 5 10 15
Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg
20 25 30
Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys
35 40 45
Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys
50 55 60
Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys
85 90 95
Thr Val Tyr Tyr Gly Ala Pro Asp Leu Lys Ala Gly Ser Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val
115 120 125
Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe
130 135 140
Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln
145 150 155 160
Ala Gln Met Asn Asp Leu Asn Glu Ile
165
<210> 435
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 435
Met Asp Gln Gly Thr His Glu Lys Trp Met Asn Val Ala Leu Glu Glu
1 5 10 15
Ala Ala Lys Ala Glu Glu Ile Gly Glu Val Pro Ile Gly Ala Val Ile
20 25 30
Ile Lys Glu Gly Lys Leu Ile Ala Ser Ala Tyr Asn Leu Arg Glu Ala
35 40 45
Asn His Ser Ala Leu Ala His Ala Glu Leu Leu Ala Ile Glu Gln Ala
50 55 60
Asn Lys Lys Leu Gly Ala Trp Arg Leu Glu Gly Cys Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg
85 90 95
Ile Pro Thr Val Val Tyr Gly Ala Gln Asp Gln Lys Ala Gly Cys Ala
100 105 110
Gly Thr Leu Met Asn Leu Leu Gln Glu Gln Arg Phe Asn His Arg Cys
115 120 125
Glu Val Ile Ser Gly Val Leu Glu Glu Gly Cys Gly Glu Lys Leu Ser
130 135 140
Ala Phe Phe Arg Lys Leu Arg Ala Asp Gln Lys Arg Lys Lys Gln Asp
145 150 155 160
Leu Gln Glu Gly Arg
165
<210> 436
<211> 149
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 436
Met Asp Glu Met Tyr Met Ser Leu Ala Leu Glu Glu Ala Tyr Lys Ala
1 5 10 15
Phe Ser Thr Tyr Glu Val Pro Val Gly Ala Val Ile Val His Asp Ser
20 25 30
Lys Val Ile Ser Arg Gly Tyr Asn Lys Arg Glu Thr Leu Lys Asp Pro
35 40 45
Thr Ala His Ala Glu Ile Ile Ala Ile Lys Glu Ala Ser Lys Tyr Leu
50 55 60
Gly Gly Trp Arg Leu Ile Gly Cys Thr Met Tyr Val Thr Leu Glu Pro
65 70 75 80
Cys Ser Met Cys Ala Gly Ala Ile Ile Asn Ser Arg Ile Glu Arg Leu
85 90 95
Val Ile Gly Ala Lys Asp Pro Lys Arg Gly Cys Cys Gly Ser Val Ile
100 105 110
Asn Leu Leu Asp Asn Pro Asn Phe Asn His Lys Val Glu Val Glu Phe
115 120 125
Gly Ile Leu Lys Asp Lys Cys Ser Asn Ile Leu Thr Glu Phe Phe Lys
130 135 140
Gln Ile Arg Cys Lys
145
<210> 437
<211> 179
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 437
Met Arg Glu Leu Pro Tyr Ser Pro Glu Glu Leu Met Arg Leu Ala Ile
1 5 10 15
Arg Glu Ala Lys Lys Ala Glu Arg Asn Gly Asp Val Pro Ile Gly Cys
20 25 30
Leu Ile Val Tyr Asp Gly Arg Leu Pro Gly Ser Arg Ala Asp Gln Arg
35 40 45
Ala Glu Glu Gln Ser Ile Arg Pro Gly Glu Ile Ile Gly Arg Gly Tyr
50 55 60
Asn Arg Arg Asn Arg Asp Lys Ser Ala Leu Lys His Ala Glu Ile Ser
65 70 75 80
Ala Ile Ser Lys Ala Cys Arg Arg Leu Gly Asp Trp Arg Leu Glu Asp
85 90 95
Cys Thr Met Ile Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala
100 105 110
Ile Leu Gln Ala Arg Ile Pro Arg Leu Leu Phe Gly Ala Glu Asn Pro
115 120 125
Lys Ala Gly Phe Cys Gly Ser Val Leu Asp Ile Leu Gln Leu Ser Ala
130 135 140
Leu Asn His Arg Val Glu Leu Leu Pro Pro Val Leu Arg Glu Asp Cys
145 150 155 160
Lys Arg Leu Met Thr Asp Phe Phe Gly Arg Leu Arg Ala His Ser Asp
165 170 175
Ser Glu Glu
<210> 438
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 438
Met Val Ser His Leu Ser Tyr Lys Ala Glu Glu Ala Leu Ile Ala Arg
1 5 10 15
Glu Ile Pro Val Gly Cys Val Phe Val Arg Asn Asn Glu Ile Ile Ala
20 25 30
Arg Gly Arg Asn Arg Thr Asn Glu Thr Arg Asn Val Arg Pro Ser Ser
35 40 45
Leu Ser Phe Leu Ser Leu Ser Asn Thr His Glu Ser Gln Ala Ser Ile
50 55 60
His Ala Glu Leu Ala Ala Leu Ser His Ile Leu Pro Asn Gly Ser Ser
65 70 75 80
Arg Arg Gln Phe Glu Pro Leu Thr Asp Val Thr Leu Tyr Val Thr Val
85 90 95
Glu Pro Cys Leu Met Cys Ala Ser Ala Leu Arg Gln Val Gly Ile Arg
100 105 110
Lys Val Ile Tyr Gly Cys Ala Asn Asp Arg Phe Gly Gly Cys Gly Gly
115 120 125
Val Leu Glu Ile His Asn Lys Tyr Ala Leu Phe Thr Ser Phe His Arg
130 135 140
Ala Ile Ser Met Thr Arg Val Pro Ala Pro Ser Cys Tyr Ile Arg Asn
145 150 155 160
His Trp Lys Leu Leu Glu Val Thr Ser Ala Lys Arg Arg Ser Cys Phe
165 170 175
Ser Gly Gly Ser Thr Ser Leu Arg Thr Arg Arg Val Ser Met Thr Trp
180 185 190
His Leu
<210> 439
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 439
Met Glu Arg Leu Gln Ile Lys Asn Asp Ile Glu Gly Met Lys Glu Ala
1 5 10 15
Leu Ile Glu Ala Lys Lys Ala Phe Ala Ile Gly Glu Ile Pro Ile Gly
20 25 30
Ala Ile Ile Cys Asp Asp Lys Gly Asn Ile Ile Ser Arg Gly His Asn
35 40 45
Leu Arg Glu Lys Thr Phe Asp Ala Thr Ala His Ala Glu Ile Val Ala
50 55 60
Ile Arg Lys Ala Cys Thr Lys Leu Gln Asn Trp Arg Leu Ser Asp Leu
65 70 75 80
Thr Leu Tyr Val Thr Val Glu Pro Cys Pro Met Cys Ala Gly Ala Ile
85 90 95
Phe Ser Ser Arg Leu Lys Arg Leu Val Tyr Gly Ala Thr Asp Trp Arg
100 105 110
Ala Gly Gly Cys Glu Ser Val Phe Asn Ile Val Asn Asn His Trp Leu
115 120 125
Asn His Gln Thr Gln Ile Arg Ala Gly Val Leu Glu Asp Glu Cys Ser
130 135 140
Leu Leu Val Lys Lys Phe Phe Gln Thr Arg Arg Gln Asn His Asn
145 150 155
<210> 440
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 440
Met Val Asn Ser Ser Trp Glu Arg Thr Ala Asp Lys Met His Glu Glu
1 5 10 15
Phe Met Arg Ala Ala Ile Glu Glu Ala Lys Lys Ala Glu Ala Ile Gly
20 25 30
Glu Val Pro Ile Gly Ala Val Ile Val His Asp Gly Gly Ile Ile Ala
35 40 45
Arg Ala His Asn Arg Arg Glu Thr Ser Gln Asn Pro Leu Thr His Ala
50 55 60
Glu Ile Ile Ala Ile Asp Ala Ala Ser Glu Lys Ile Gly Ser Trp Arg
65 70 75 80
Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys
85 90 95
Ser Gly Ala Ile Val Met Ser Arg Ile Pro His Val Val Tyr Gly Ala
100 105 110
Lys Asp Pro Lys Gly Gly Thr Val Glu Ser Leu Met His Leu Leu Asp
115 120 125
Glu Pro Arg Phe Asn His Arg Ala Tyr Ile Thr Ala Gly Val Leu Gly
130 135 140
Glu Glu Cys Ser Ser Met Leu Thr Leu Phe Phe Arg Lys Leu Arg Gly
145 150 155 160
Arg Arg Lys Arg Arg Ala Glu Asp
165
<210> 441
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 441
Met Asp Ser Trp Met Glu Glu Ala Phe Val Gln Ala Asn Glu Ala Leu
1 5 10 15
Gln Val Gly Glu Val Pro Val Gly Cys Val Phe Val Phe Asn Asp Gln
20 25 30
Val Ile Ala Arg Ser Arg Asn Thr Val Asn Glu Thr His Asn Ala Thr
35 40 45
Arg His Ala Glu Met Asn Cys Val Asp Gln Thr Val Thr Trp Cys Lys
50 55 60
Glu Thr Ser His Asp Phe Asp Glu Val Met Ser Ala Val Lys Val Trp
65 70 75 80
Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala Ala Leu His Ser Leu
85 90 95
Arg Val Ala Glu Val Val Tyr Gly Cys Asn Asn Asp Arg Phe Gly Gly
100 105 110
Cys Thr Ser Val Phe Asp Thr Ser Leu Leu Tyr Ser Pro Ala Thr Pro
115 120 125
Met Lys Gly Gly Met Gln Ser Asp Arg Ala Met Gln Leu Leu Lys Asp
130 135 140
Phe Tyr Lys Gly Thr Asn Pro Asn Ala Pro Gln Pro Lys Val Lys Lys
145 150 155 160
Asp Lys Lys Val Ala Ser Ile Ser Asp Val Ser Glu Ile Gln His Asn
165 170 175
Lys Glu Ala Ser Asp Ser
180
<210> 442
<211> 178
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 442
Met Ser Gly Lys Val Asn Asp Leu Asn Lys Asp Ile Ser Asn Asn Val
1 5 10 15
Asp Leu Glu Glu Ser Tyr Asp Ser Lys Lys Ala Asn Lys Tyr Met Lys
20 25 30
Glu Ala Ile Lys Gln Ala Lys Lys Ala Ala Ser Ile Gly Glu Val Pro
35 40 45
Ile Gly Cys Val Ile Val Tyr Gln Asp Lys Ile Ile Gly Arg Gly Tyr
50 55 60
Asn Arg Arg Met Val Asp Lys Asn Thr Leu Ser His Ala Glu Leu Asn
65 70 75 80
Ala Ile Lys Lys Ala Ser Lys Lys Leu Asp Asp Trp Arg Leu Asp Asp
85 90 95
Cys Glu Leu Tyr Val Thr Thr Glu Pro Cys Gln Met Cys Ala Gly Ala
100 105 110
Ile Val Gln Ala Arg Ile Lys Lys Val Tyr Ile Gly Cys Met Asn Pro
115 120 125
Lys Ala Gly Cys Ala Gly Ser Ile Met Asn Leu Leu Gln Val Asp Lys
130 135 140
Phe Asn His Gln Val Glu Met Glu Lys Gly Ile Leu Glu Glu Glu Cys
145 150 155 160
Ser Asn Leu Leu Lys Asp Phe Phe Arg Asn Leu Arg Lys Lys Gln Lys
165 170 175
Asp Glu
<210> 443
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 443
Met Asp Tyr Thr Ile Glu Glu Lys Ala Met Phe Met Arg Glu Ala Leu
1 5 10 15
Lys Glu Ala Glu Ile Ala Leu Ala Asn Asp Glu Ile Pro Ile Gly Cys
20 25 30
Val Leu Val Lys Asp Gly Gln Ile Ile Gly Arg Gly His Asn Ala Arg
35 40 45
Glu Glu Leu Gln Arg Ala Val Met His Ala Glu Ile Met Ala Ile Glu
50 55 60
Glu Ala Asn Gln Arg Glu Asn Ser Trp Arg Leu Leu Asp Thr Thr Leu
65 70 75 80
Phe Val Thr Ile Glu Pro Cys Val Met Cys Ser Gly Ala Ile Gly Leu
85 90 95
Ala Arg Ile Pro Gln Val Ile Tyr Gly Ala Thr Asn Gln Lys Phe Gly
100 105 110
Gly Ala Gly Ser Leu Tyr Asp Ile Leu Ala Asp Glu Arg Leu Asn His
115 120 125
Arg Val Glu Val Glu Thr Gly Ile Leu Glu Ala Glu Cys Ala Ala Ile
130 135 140
Met Gln Thr Phe Phe Arg Gln Gly Arg Glu Arg Lys Lys Gln Ala Lys
145 150 155 160
Leu Ala Ala Lys Ala Glu Thr Gln Glu
165
<210> 444
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 444
Met Asn Gln Ser Gln Asp Glu His Tyr Met Arg Arg Ala Leu Asp Leu
1 5 10 15
Ala Arg Gln Ala Glu Gln Leu Gly Glu Val Pro Val Gly Ala Val Val
20 25 30
Val Leu Asn Gly Lys Val Ile Ala Ala Ala Gly Asn Arg Arg Glu Thr
35 40 45
Trp Gln Asp Pro Thr Ala His Ala Glu Leu Ile Ala Leu Arg Glu Ala
50 55 60
Ala Lys Arg Ile Asp Ser Trp Arg Leu Glu Glu Ala Thr Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Ile Met Cys Met Gly Gly Ile Ile Leu Ser Arg
85 90 95
Ile Pro Arg Leu Val Phe Gly Ala Arg Asp Pro Arg Val Gly Ala Val
100 105 110
Gly Ser Val Phe Asp Leu Ala Asp Asp Glu Arg Phe Asn His Arg Val
115 120 125
Glu Val Ser Glu Gly Val Leu Ala Glu Glu Cys Ser Glu Ile Leu Ser
130 135 140
Asn Phe Phe Arg Gln Leu Arg Gln Lys Lys Lys Ala Ala Arg Met Arg
145 150 155 160
Ser Ala Lys Asp Glu
165
<210> 445
<211> 190
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 445
Met Asn Leu Asn Met Gln Met Lys Pro Lys Ala Leu Gly Arg Ile Ser
1 5 10 15
Thr Lys Gly Leu Thr Gln Glu Glu Ile Gln Asp Ile Lys Phe Met Lys
20 25 30
Ala Ala Ile Thr Gln Ala Arg Lys Ala Tyr Val Leu Gly Glu Val Pro
35 40 45
Ile Gly Cys Val Ile Val Tyr Glu Gly Lys Ile Ile Gly Arg Gly Tyr
50 55 60
Asn Arg Arg Asn Thr Asp Lys Thr Thr Leu Ala His Ala Glu Ile Thr
65 70 75 80
Ala Ile Lys Arg Ala Gly Lys Val Ile Gly Asp Trp Arg Leu Glu Gly
85 90 95
Cys Lys Leu Tyr Val Thr Leu Glu Pro Cys Gln Met Cys Ala Gly Ala
100 105 110
Ile Val Gln Ala Arg Ile Pro Glu Val Ile Met Ala Ala Glu Asn Pro
115 120 125
Lys Ala Gly Cys Ala Gly Ser Val Leu Asp Ile Leu Asn Asn Pro Gly
130 135 140
Phe Asn His Gln Val Gln Val Lys Arg Gly Val Leu Lys Asp Glu Cys
145 150 155 160
Ala Lys Met Leu Lys Glu Phe Phe Val Glu Leu Arg Ala Arg Asn Lys
165 170 175
Ala Glu Lys Glu Leu Lys Ser Ser Gln Gly Leu Asp Glu Asn
180 185 190
<210> 446
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 446
Met Ser Ser His Pro Lys Asp Glu Tyr Tyr Met Ser Leu Ala Ile Ala
1 5 10 15
Glu Ala Arg Lys Ala Glu Ala Ile Gly Glu Val Pro Ile Gly Ala Val
20 25 30
Leu Val Ile Asp Asp Glu Val Val Ala Ala Ala Tyr Asn Leu Arg Glu
35 40 45
Ser Glu His Arg Ala Ile Ala His Ala Glu Leu Leu Ala Ile Asp Gln
50 55 60
Ala Cys Lys Lys Thr Gly Ala Trp Arg Leu Ser Gly Ser Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Val Leu Ser
85 90 95
Arg Val Asp Arg Val Val Phe Gly Ala His Asp Pro Lys Ala Gly Cys
100 105 110
Ala Gly Ser Leu Met Asn Leu Leu Glu Glu Glu Arg Phe Asn His Val
115 120 125
Cys Asp Val Thr Thr Gly Val Arg Lys Glu Glu Cys Ser Ala Met Leu
130 135 140
Ser Thr Phe Phe Arg Thr Leu Arg Gln Arg Asn Lys Glu Lys Arg Lys
145 150 155 160
Gln Arg Leu Gly Asp Lys Gln Pro
165
<210> 447
<211> 127
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 447
Met Ser Tyr Asp Leu Ser Arg His Phe Lys Tyr Met Ala Ile Ser Leu
1 5 10 15
Phe Val Gly Tyr Lys Ala Leu Leu Asn Asn Glu Thr Pro Val Ser Cys
20 25 30
Ile Val Val Asn Ser Lys Thr Asp Glu Ile Ile Ser Ile Gly Tyr Asn
35 40 45
Tyr Thr Asn His Ser Leu Asn Gly Thr Gln His Ala Glu Phe Ile Ala
50 55 60
Leu Gln Arg Phe Glu Ser Asp Glu Ser Ile Asn Tyr Ser Asp Leu Ile
65 70 75 80
Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Tyr Leu Arg
85 90 95
Gln Leu Gly Ile Gly Lys Val Ile Phe Gly Cys Gly Asn Asp Arg Phe
100 105 110
Gly Gly Asn Gly Ser Ile Ala Ser Thr Gln Arg Ser Lys Phe Thr
115 120 125
<210> 448
<211> 164
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 448
Met Thr Ile Asp Glu Lys Tyr Met Arg Ala Ala Ile Arg Gln Ala Glu
1 5 10 15
Lys Ala Gly Ala Met Gly Glu Val Pro Ile Gly Cys Val Ile Val Tyr
20 25 30
Glu Asp Lys Ile Ile Ala Arg Gly Tyr Asn Arg Arg Thr Ile Asp Lys
35 40 45
Asn Val Leu Ser His Ala Glu Ile Asn Ala Ile Arg Lys Ala Cys Arg
50 55 60
Lys Val Gly Asp Trp Arg Leu Glu Gly Cys Thr Met Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ala Arg Ile Pro
85 90 95
Lys Val Ile Met Gly Cys Met Asn Ala Lys Ala Gly Cys Ala Gly Ser
100 105 110
Val Leu Asp Leu Phe His Gln Asp Gly Leu Asn His Gln Val Glu Thr
115 120 125
Glu Ser Gly Val Leu Gly Asp Glu Cys Ser Arg Leu Met Lys Asp Phe
130 135 140
Phe Lys Ala Leu Arg Glu Lys Ser Lys Lys Lys Pro Glu Gly Ile Ser
145 150 155 160
Phe Ile Thr Pro
<210> 449
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 449
Met Glu Thr Val Gln Phe Asp His Asp Ser His Asn Pro Ile Gln Ala
1 5 10 15
Glu His Glu Lys Trp Met Arg Glu Ala Met Leu Glu Ala Asp Lys Ala
20 25 30
Lys Ala Leu Met Glu Val Pro Ile Gly Ala Val Ile Val Arg Gly Gly
35 40 45
Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Thr Ser Leu Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Ile Ala Ile Arg Glu Ala Ser Glu Lys Leu
65 70 75 80
Gly Ala Trp Arg Leu Leu Asp Cys Arg Leu Tyr Val Thr Leu Glu Pro
85 90 95
Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg Val Pro Gln Val
100 105 110
Ile Tyr Gly Thr Pro Asp Pro Lys Ala Gly Cys Ala Gly Thr Leu Met
115 120 125
Asn Leu Leu Gln Glu Glu Arg Phe Asn His Cys Val Asp Val Ile Ser
130 135 140
Gly Val Leu Gln Pro Glu Cys Ala Ser Gln Leu Thr Asp Phe Phe Arg
145 150 155 160
Glu Leu Arg Arg Arg Ala Lys Glu Ala Lys Lys Ala Leu Pro Ala Glu
165 170 175
Glu
<210> 450
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 450
Met Lys Thr Asp Glu Asp Phe Met Glu Leu Ala Leu Glu Glu Ala Arg
1 5 10 15
Lys Ala Leu Ala Leu Glu Glu Val Pro Ile Gly Ala Val Val Val Cys
20 25 30
Asn Gly Glu Ile Val Gly Ser Gly His Asn Leu Lys Glu Thr Glu Asn
35 40 45
Asp Pro Thr Ala His Ala Glu Ile Val Ala Ile Arg Asp Ala Ala Arg
50 55 60
Lys Leu Ser Ser Trp Arg Leu Asn Glu Cys Gln Leu Tyr Val Thr Ile
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Met Gln Ala Arg Leu Gln
85 90 95
Arg Val Val Tyr Gly Ala Val Asp Pro Lys Ala Gly Val Ala Gly Ser
100 105 110
Leu Tyr Asn Leu Leu Gln Asp Asn Arg Phe Asn His Thr Val Glu Leu
115 120 125
Lys Ser Gly Val Leu Ala Ala Glu Cys Arg Gln Ile Ile Lys Asp Phe
130 135 140
Phe Ser Glu Leu Arg Gln Thr Arg Gly Arg Val Gly Glu Ser Gly
145 150 155
<210> 451
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 451
Met Glu Lys Glu Glu Ala Ser Leu Gln Gly Ile His Glu Arg Trp Met
1 5 10 15
Arg Gln Ala Leu Glu Glu Ala Asp Lys Ala Glu Gln Leu Asn Glu Val
20 25 30
Pro Ile Gly Ala Ile Ile Val Lys Asp Gln Gln Ile Ile Gly Arg Gly
35 40 45
Tyr Asn Val Arg Glu Thr Gln His Gln Ala Thr Gly His Ala Glu Ile
50 55 60
Gln Ala Ile Glu Asp Ala Asn Arg His Gln Gln Ala Trp Arg Leu Glu
65 70 75 80
Gly Ala Thr Met Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly
85 90 95
Ala Leu Ile Asn Ser Arg Ile Gln Thr Val Val Tyr Gly Ala Ser Asp
100 105 110
Leu Lys Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu Gln Asp Asp
115 120 125
Arg Phe Asn His Gln Val Glu Val Ile Ser Gly Val Leu Ala Glu Glu
130 135 140
Cys Gly Asp Lys Leu Ser Tyr Phe Phe Arg Lys Leu Arg Gln Arg Lys
145 150 155 160
Gly Lys Asn Ile Asp Arg Ala Glu
165
<210> 452
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 452
Met Thr Ala Asp Glu Glu Tyr Met Thr Leu Cys Ile Glu Leu Ala Lys
1 5 10 15
Lys Ala Ala Glu Lys Gly Glu Cys Pro Val Gly Ala Ile Val Val Asp
20 25 30
Lys Asp Gly Arg Ile Ile Gly Glu Gly Tyr Asn Met Arg Glu Ala Glu
35 40 45
Gln Met Pro Thr Ala His Ala Glu Ile Ile Ala Ile Glu Gln Ala Ala
50 55 60
Lys Ala Met Asn Ser Trp Arg Leu Thr Glu Cys Thr Leu Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Asn Ser Arg Ile
85 90 95
Lys Arg Leu Val Tyr Gly Ala Phe Asp Glu Lys Gly Gly Ala Cys Ala
100 105 110
Ser Leu Met Glu Ile Phe Asp Tyr Pro Phe Asn His Arg Pro Met Val
115 120 125
Arg Ser Arg Val Leu Gln Asp Glu Cys Ala Lys Leu Leu Thr Glu Phe
130 135 140
Phe Lys Asp Leu Arg Thr
145 150
<210> 453
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 453
Met Thr Asp Thr Phe Thr Ala Thr Pro Ala His Met Gln Leu Ala Leu
1 5 10 15
Val Gln Ala Gln His Ala Trp Asp Leu Gly Glu Val Pro Val Gly Ala
20 25 30
Val Val Val Lys Asp Gly Glu Val Ile Ala Thr Gly Tyr Asn Gln Pro
35 40 45
Ile Gly Lys His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Ala Ala Ala Glu Ile Leu Gly Asn Tyr Arg Leu Pro Gly Cys Glu Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Met His
85 90 95
Ala Arg Leu Ala Arg Val Val Tyr Gly Ala Ala Asp Pro Lys Thr Gly
100 105 110
Ala Cys Gly Ser Val Val Asn Leu Phe Ala Gln Glu Glu Leu Asn His
115 120 125
His Thr Glu Leu Val Gly Gly Val Met Ala Glu Ala Cys Gly Gln Met
130 135 140
Leu Lys Ser Phe Phe Ser Glu Arg Arg Glu Gln Leu Lys Gln Glu Arg
145 150 155 160
Leu Gln Arg Gln Ala Ile Ala His Ala His Ala Asn Ala His Ser Ile
165 170 175
Asp Asp Glu Ala Asn Asp
180
<210> 454
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 454
Met His Lys Ile Phe Leu Glu Glu Ala Tyr Lys Glu Ala Ile Lys Ala
1 5 10 15
Leu Gln Glu Gln Glu Val Pro Val Gly Cys Val Ile Val Gln Asn Lys
20 25 30
Gln Ile Leu Ser Arg Ser His Asn Leu Thr Asn Lys Leu His Asp Pro
35 40 45
Leu Ala His Ala Glu Ile Asn Gly Leu Arg Glu Leu Leu Gln Gln Ser
50 55 60
Gln Ile Thr Asp Asp Leu Thr Phe Tyr Ile Thr Cys Glu Pro Cys Ile
65 70 75 80
Met Cys Leu Gly Ile Leu Asn Arg Ile Lys Ala Arg Ile Tyr Tyr Gly
85 90 95
Cys Lys Asn Ile Ile Phe Gly Gly Ile Thr Ile Leu Glu Thr Pro Ser
100 105 110
Asp Ser His Phe Ile Glu Asp Lys Arg Cys Tyr Glu Ile Leu Gln Lys
115 120 125
Phe Tyr Ser Asn Glu Asn Glu Phe Ala Pro Glu Glu Lys Arg Lys Lys
130 135 140
Lys Asn Asn Arg Asn Asn Gly Val Pro Leu
145 150
<210> 455
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 455
Met Leu Thr Ser Leu Lys Ala Thr Arg His Ala Glu Phe Leu Gly Ile
1 5 10 15
Asp Glu Ile Leu Ser Lys Tyr Asp Lys Asp Val Phe Lys Glu Thr Asp
20 25 30
Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu Arg
35 40 45
Gln Leu Glu Ile Arg Lys Val Tyr Phe Gly Ala Ala Asn Asp Arg Phe
50 55 60
Gly Gly Cys Gly Ser Val Leu Ser Leu His Asn His Ala Lys Leu Pro
65 70 75 80
Glu Pro Ala Tyr Asn Val Tyr Pro Gly Phe Tyr Arg Asp Glu Ala Ile
85 90 95
Val Met Leu Arg Lys Phe Tyr Val Gln Glu Asn Thr Lys Ala Pro Val
100 105 110
Pro Arg Gly Lys Lys Thr Arg Glu Leu Lys Leu Glu Val Glu Asp Asn
115 120 125
Phe Asp Tyr Ser Lys Phe Val Gly Ser Glu Glu Glu Phe Ile Asn Val
130 135 140
Tyr Gly Lys Glu Arg Leu Ser Glu Tyr Arg Lys Leu Ser Ser Lys
145 150 155
<210> 456
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 456
Met Lys Ser Asp Glu Phe Tyr Met Lys Leu Ala Ile Glu Glu Ala Lys
1 5 10 15
Arg Ala Ala Glu Ile Asn Glu Val Pro Ile Gly Ala Val Leu Val Ser
20 25 30
Asn Asp Glu Val Ile Ala Thr Ala His Asn Leu Arg Glu Thr Glu Gln
35 40 45
Arg Ser Ile Ala His Ala Glu Leu Leu Val Ile Asp Glu Ala Cys Arg
50 55 60
Arg Thr Gly Ser Trp Arg Leu Glu Asn Ala Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Ser Gly Ala Ile Val Leu Ser Arg Val Asn
85 90 95
Arg Val Val Tyr Gly Ala Ser Asp Pro Lys Gly Gly Cys Ala Gly Thr
100 105 110
Leu Met Asn Leu Leu Gln Glu Lys Arg Phe Asn His Gln Ala Glu Val
115 120 125
Leu Ser Gly Val Cys Glu Glu Glu Cys Gly Gln Leu Leu Ser Ser Phe
130 135 140
Phe Arg Gly Ile Arg Glu Arg Lys Lys Lys Glu Lys Val Asn Tyr Ile
145 150 155 160
Gln Gln Lys Ser Ala Thr Ser Asn Glu
165
<210> 457
<211> 171
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 457
Met Arg Asp Asn Asn Leu Tyr Met Arg Glu Ala Leu Lys Glu Ala Tyr
1 5 10 15
Ile Ala Ala Glu Leu Gly Glu Val Pro Val Gly Ala Val Ile Val Lys
20 25 30
Ala Gly Glu Ile Ile Ala Lys Ala His Asn Met Val Glu Ala Tyr Ala
35 40 45
Ser Ser Ser Ala His Ala Glu Met Leu Ala Met Asp Ala Ala Glu Ala
50 55 60
Arg Leu Gly Ser Lys Trp Leu Ser Gly Cys Glu Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Ser Met Cys Ala Gly Ala Met Val Leu Ala Arg Leu Glu
85 90 95
Lys Leu Cys Ile Gly Thr Met Asp Pro Lys Asn Gly Ala Ser Gly Ser
100 105 110
Ile Phe Asp Ile Thr Gly Ser Asp Ser Leu Asn His Arg Ile Asp Val
115 120 125
Glu Arg Gly Ile Leu Ala Asp Glu Cys Ala Glu Ala Leu Thr Ser Phe
130 135 140
Phe Arg Glu Leu Arg Ile Thr Lys Ala Gln Leu Arg Lys Ser Asn Ile
145 150 155 160
Val Lys Asp Lys Val Asp Ile Pro Glu Glu Lys
165 170
<210> 458
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 458
Met Leu Glu Asp Phe Met Arg Val Ala Leu Glu Glu Ala Lys Lys Ala
1 5 10 15
Tyr Lys Gln Gly Glu Val Pro Val Gly Ala Val Ile Val Lys Asn Gly
20 25 30
Lys Val Ile Ser Lys Ala His Asn Glu Thr Arg Gln Lys Lys Asn Ala
35 40 45
Val Ala His Ala Glu Ile Leu Ala Ile Asp Lys Ala Cys Lys Lys Leu
50 55 60
Glu Asn Glu Arg Leu Val Asp Thr Glu Met Tyr Val Thr Leu Glu Pro
65 70 75 80
Cys Ala Met Cys Ala Gly Ala Ile Val Gln Ala Arg Ile Pro Glu Val
85 90 95
Met Ile Gly Thr Arg Asp Leu Lys Ser Gly Ala Ala Asn Thr Ile Leu
100 105 110
Asn Val Leu Glu Asn Glu Lys Leu Asn His Arg Ala Glu Leu Arg Phe
115 120 125
Gly Ile Phe Glu Glu Glu Cys Ser Glu Ile Leu Lys Thr Phe Phe Lys
130 135 140
Glu Leu Arg Asp Glu Arg Lys
145 150
<210> 459
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 459
Met Thr Arg Asp Glu Met Tyr Met Arg Lys Ala Leu Glu Leu Ala Ala
1 5 10 15
Leu Ala Ala Asp Glu Asp Glu Val Pro Val Gly Ala Val Val Val Lys
20 25 30
Lys Ser Thr Gly Glu Ile Val Gly Arg Gly Phe Asn Arg Arg Glu Tyr
35 40 45
Gly Arg Ser Pro Leu Thr His Ala Glu Ile Val Ala Ile Asp Glu Ala
50 55 60
Ser Arg Lys Leu Gly Gly Trp Arg Leu Ile Asp Cys Glu Leu Phe Val
65 70 75 80
Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val Ile Asn Ser Arg
85 90 95
Val Glu Arg Val Val Phe Gly Ala Tyr Asp Lys Lys Ala Gly Ser Cys
100 105 110
Gly Ser Val Val Asp Leu Phe Gly Leu Pro Tyr Asn His Lys Pro Glu
115 120 125
Cys Ile Gly Gly Val Leu Glu Glu Glu Cys Ala Ala Val Leu Thr Glu
130 135 140
Phe Phe Lys Gly Leu Arg Lys Arg Lys Val Lys Val Asn Glu
145 150 155
<210> 460
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 460
Met Val Thr Val Thr Arg Glu Phe Ser Pro Ser Asp Leu Ala Phe Met
1 5 10 15
Glu Leu Ala Leu Lys Gln Ala Lys Phe Ala Met Ser Asn Leu Glu Val
20 25 30
Pro Val Gly Cys Val Val Val Val Asp Gly Lys Ile Val Ala Ser Gly
35 40 45
Cys Asn Arg Thr Asn Glu Thr Arg Asn Ala Thr Arg His Ala Glu Met
50 55 60
Glu Ala Ile Asp Leu Leu Leu Glu Gln Trp Gln Lys Ala Gly Leu Ser
65 70 75 80
Gln Val Glu Val Ala Glu Lys Phe Ser Arg Cys Val Leu Tyr Val Thr
85 90 95
Cys Glu Pro Cys Ile Met Cys Ala Thr Ala Leu Ser Ile Leu Gly Ile
100 105 110
Arg Asp Val Tyr Tyr Gly Cys Ala Asn Asp Lys Phe Gly Gly Cys Gly
115 120 125
Ser Ile Leu Ser Leu His Glu Ser Gly Cys Glu Gln Leu Phe Arg Ser
130 135 140
Ser His Glu Asn Gly Phe Arg Cys Ser Gly Gly Leu Met Ala Ser Glu
145 150 155 160
Ala Ile Ala Leu Leu Arg Ser Phe Tyr Glu Gln Gly Asn Pro Asn Ala
165 170 175
Pro Lys Pro His Arg Pro Val Arg Met Thr Gln Glu Asp Ser Thr
180 185 190
<210> 461
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 461
Met Pro Ser His Asn Asn Thr Asp Lys Tyr Trp Met Gln Gln Ala Ile
1 5 10 15
Asp Gln Ala Lys Leu Ala Tyr Asn Lys Gly Glu Val Pro Ile Gly Ala
20 25 30
Val Ile Val Lys Asp Glu Gln Leu Ile Ala Thr Gly Phe Asn Lys Arg
35 40 45
Glu Thr Ser Gln Asp Ala Thr Ser His Ala Glu Ile Ile Ala Ile Gln
50 55 60
Ser Ala Cys Asn Tyr Leu Gly Gly Trp Arg Leu Leu Asp Cys Thr Leu
65 70 75 80
Tyr Val Thr Ile Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln
85 90 95
Ser Arg Ile Thr Lys Leu Val Phe Gly Thr Glu Asp Pro Lys Ala Trp
100 105 110
Gly Glu Leu Ser Ile Ser Gln Leu Leu Gln Asn Pro Gln Leu Asn His
115 120 125
Gln Val Asp Ile Val Glu Gly Ile Cys Lys Glu Glu Ser Lys Asp Ile
130 135 140
Ile Lys Gln Phe Phe His Glu Leu Arg Lys Arg Lys Lys Asn
145 150 155
<210> 462
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 462
Met Asp Arg Tyr Met Thr Arg Ala Leu Glu Leu Ala Arg Leu Ala Phe
1 5 10 15
Asp Glu Gly Glu Val Pro Val Gly Ala Val Val Val Lys Lys Thr Thr
20 25 30
Gly Glu Ile Ile Gly Glu Gly Arg Asn Met Arg Glu Gly Ala Lys Asn
35 40 45
Ala Leu Ala His Ala Glu Ile Ile Ala Ile Asp Gln Ala Cys Arg Thr
50 55 60
Leu Gly Gly Trp Arg Leu Pro Glu Cys Ala Ile Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Cys Gly Ala Ile Ile Asn Ala Arg Ile Asp Asn
85 90 95
Val Ile Phe Gly Ala Tyr Asp Leu Lys Ser Gly Ser Ala Ala Ser Val
100 105 110
Gln Lys Met Phe Glu Leu Pro Tyr Asn Tyr Arg Pro Glu Val Thr Gly
115 120 125
Gly Ile Met Glu Gln Glu Cys Ala Asp Ile Leu Ser Glu Phe Phe Arg
130 135 140
Gln Leu Arg Ile Arg Lys Lys Thr
145 150
<210> 463
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 463
Met Glu Gln Asn Ser Pro Gly Ile Arg Phe Ala Asn Asp Ala Gln Lys
1 5 10 15
His Ala Phe Phe Met Lys Lys Ala Leu Asp Met Gly Glu Glu Ala Leu
20 25 30
Ala Ser Gly Glu Thr Pro Val Gly Cys Val Leu Val His Asn Asp Glu
35 40 45
Val Ile Gly Ser Gly Met Asn Asp Thr Asn Lys Ser Met Asn Gly Thr
50 55 60
Arg His Ala Glu Phe Leu Ala Ile Glu Glu Val Leu Arg Ser His Pro
65 70 75 80
Arg Ser Ile Phe Arg Glu Thr Asp Leu Tyr Val Thr Val Glu Pro Cys
85 90 95
Ile Met Cys Ala Ser Ala Leu Arg Gln Tyr Gln Ile Arg His Val Tyr
100 105 110
Phe Gly Cys Ala Asn Glu Arg Phe Gly Gly Thr Gly Gly Val Leu Lys
115 120 125
Leu His Ser Asp Pro Gly Ile Asp Pro Pro Tyr Gly Leu Thr Gly Gly
130 135 140
Leu Phe Arg Lys Glu Ala Ile Met Leu Leu Arg Arg Phe Tyr Ile Gln
145 150 155 160
Glu Asn Glu Arg Ala Pro Asn Pro Lys Pro Lys Lys Asp Arg Glu Leu
165 170 175
Lys Asp Asp Asp Phe Gly Asp Val Gly Ala Gly Met Glu Phe Ala Gly
180 185 190
Met Leu Pro Arg Pro
195
<210> 464
<211> 166
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 464
Met Thr Asp Phe Glu Leu Met Gly Leu Ala Leu Glu Glu Ala Ala Lys
1 5 10 15
Ala Ala Ala Leu Gly Glu Val Pro Val Gly Ala Val Val Ala Arg His
20 25 30
Gly Glu Val Ile Ala Thr Ala His Asn Thr Arg Glu Thr Glu Lys Asn
35 40 45
Ala Leu His His Ala Glu Leu Leu Ala Ile Asp Ala Ala Cys Lys Ala
50 55 60
Leu Gly Gly Trp Arg Leu Trp Glu Cys Glu Leu Phe Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Gly Ile Ile Asn Ser Arg Leu Arg Arg
85 90 95
Val Val Tyr Gly Ala Ala Asp Thr Lys Ala Gly Cys Cys Gly Ser Val
100 105 110
Thr Asp Leu Phe Ala Leu Pro Phe Asn His His Pro Val Val Glu Lys
115 120 125
Gly Leu Arg Glu Ala Glu Ala Gln Gln Leu Leu Gln Ala Phe Phe Val
130 135 140
Ser Leu Arg Glu Lys Arg Ala Gly Arg Pro Arg Trp Lys Pro Pro Val
145 150 155 160
Pro Glu Asn Arg Gly Lys
165
<210> 465
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 465
Met Asp His Lys Asp Tyr Met Ala Arg Ala Leu Glu Leu Ala Ala Gln
1 5 10 15
Ala Ala Glu His Gly Asp Val Pro Val Gly Cys Val Ile Val Lys Asp
20 25 30
Gly Lys Ile Val Gly Glu Gly Arg Asn Arg Arg Glu Glu His Gly Asp
35 40 45
Ala Thr Ala His Ala Glu Leu Glu Ala Ile Arg Asp Ala Cys Ala Arg
50 55 60
Leu Gly Ser Trp Arg Leu His Gly Cys Thr Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Gly Ile Ile Asn Ser Arg Ile Glu Thr
85 90 95
Val Arg Tyr Gly Ala Arg Asp Glu Lys Ala Gly Cys Cys Ser Ser Val
100 105 110
Leu Asn Leu Phe Glu Glu Arg Phe Asn His His Pro Arg Ile Tyr Arg
115 120 125
Gly Pro Leu Glu Pro Gln Cys Gln Lys Ile Leu Gln Asp Phe Phe Leu
130 135 140
Asp Leu Arg Glu Asp Gly Glu Asn
145 150
<210> 466
<211> 188
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 466
Met Glu Glu Lys Val Glu Ser Thr Thr Val Pro Asp Gly Ser Cys Val
1 5 10 15
Val Ser Val Gln Glu Thr Glu Lys Trp Met Glu Glu Ala Met Arg Met
20 25 30
Ala Lys Glu Ala Leu Glu Asn Ile Glu Val Pro Val Gly Cys Leu Met
35 40 45
Val Tyr Asn Asn Glu Val Val Gly Lys Gly Arg Asn Glu Val Asn Gln
50 55 60
Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Pro Phe Asp Gln Val
65 70 75 80
Asp Trp Cys His His Thr Gly Gln Pro Ser Ala Val Phe Glu His Thr
85 90 95
Val Leu Tyr Val Thr Val Pro Cys Ile Met Cys Ala Ala Val Leu Ala
100 105 110
Leu Met Ser Ile Pro Leu Ala Ala Ser Gly Gln Arg Thr Asp Arg Arg
115 120 125
Thr Thr Arg Arg Ser Ala Leu Asn Ile Gly Phe Cys Phe Leu Phe Asn
130 135 140
Ala Gly Arg Pro Phe Gln Cys Ile Pro Gly Tyr Arg Ala Glu Glu Ala
145 150 155 160
Val Glu Leu Leu Lys Thr Phe Tyr Lys Gln Glu Asn Pro Asn Ala Pro
165 170 175
Lys Ser Lys Val Arg Lys Lys Asp Cys Gln Lys Ser
180 185
<210> 467
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 467
Met Lys Glu Ala Leu Lys Glu Ala Arg Lys Ala Ala Glu Met Gly Glu
1 5 10 15
Ile Pro Val Gly Ala Val Ile Val Lys Asp Gly Glu Ile Ile Ser Arg
20 25 30
Gly His Asn Leu Thr Glu Thr Thr Lys Asp Pro Thr Ala His Ala Glu
35 40 45
Met Ile Ala Ile Arg Glu Ala Ala Lys Leu Leu Arg Gly Trp Arg Leu
50 55 60
Thr Gly Cys Asp Met Tyr Val Thr Met Glu Pro Cys Ser Met Cys Ala
65 70 75 80
Gly Ala Leu Val Trp Ser Arg Ile Glu His Leu Tyr Ile Gly Ala Asp
85 90 95
Asp Pro Lys Thr Gly Ala Cys Gly Ser Val Phe Asn Ile Val Gln Asp
100 105 110
Asp Arg Leu Asn His Gln Ile Ala Val Asp Arg Gly Ile Met Ala Glu
115 120 125
Glu Ser Ser Gln Leu Val Arg Glu Phe Phe Arg Asn Leu Arg Asn Lys
130 135 140
Thr Lys Lys Pro Glu Glu Glu
145 150
<210> 468
<211> 163
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 468
Met Ser Ala Gln Ser Glu His Glu Lys Trp Met Ala Arg Ala Ile Gln
1 5 10 15
Leu Ala Lys Gln Ala Glu Thr Leu Gly Glu Val Pro Ile Gly Ala Val
20 25 30
Ile Val Lys Glu Gly Glu Val Leu Gly Glu Gly Tyr Asn Arg Arg Glu
35 40 45
Ile Asp Arg Asn Pro Leu Ala His Ala Glu Leu Met Ala Ile Gln Gln
50 55 60
Ala Cys Glu Arg Leu Gly Gly Trp Arg Leu Ala Gly Cys Asp Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ala
85 90 95
Arg Leu Arg Arg Val Ile Tyr Gly Thr Glu Asp Pro Lys Ala Gly Tyr
100 105 110
Ala Gly Ser Leu His Asn Thr Leu Gln Asp Glu Arg Leu Asn His Gln
115 120 125
Thr Asp Val Ile Ala Gly Ile Arg Arg Glu Glu Cys Gln His Leu Leu
130 135 140
Lys Asp Phe Phe Arg Arg Leu Arg Glu Gln Lys Lys Ala Ala Lys Gly
145 150 155 160
Met Ser Thr
<210> 469
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 469
Met Asp Arg Asp Asn Tyr Phe Leu Lys Glu Ala Val Lys Gln Ala Lys
1 5 10 15
Lys Ala Gly Glu Ile Gly Asp Val Pro Ile Gly Cys Val Ile Val Phe
20 25 30
Glu Asp Lys Ile Ile Ala Arg Gly Tyr Asn Arg Arg Asn Lys Asp Lys
35 40 45
Ser Thr Leu Ser His Ala Glu Ile Ile Ala Ile Lys Lys Ala Cys Lys
50 55 60
Lys Ile Gly Asp Trp Arg Leu Glu Asp Cys Thr Met Tyr Ile Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Gln Ser Arg Ile Lys
85 90 95
Arg Val Val Leu Gly Ala Met Asn Pro Lys Ala Gly Cys Ala Gly Ser
100 105 110
Ile Ile Asn Ile Leu Gln Thr Glu Gly Phe Asn His Lys Thr Glu Ile
115 120 125
Ser Leu Ile Asp Glu Pro Leu His Ser Glu Cys Val Ser Leu Leu Thr
130 135 140
Ser Phe Phe Lys Ala Leu Arg Glu Asn Lys Lys
145 150 155
<210> 470
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 470
Met Pro Glu Leu Ile His Val Met Asn Leu Ser Asn Glu Glu Arg Glu
1 5 10 15
Asp His Glu Tyr Trp Met Lys Glu Ala Met Lys Glu Ala Leu Lys Ala
20 25 30
Gln Glu Lys Asp Glu Val Pro Ile Gly Ala Val Ile Val Tyr Gln Gly
35 40 45
Arg Ile Ile Gly Arg Gly His Asn Ile Arg Glu Thr Gln Asn Leu Ala
50 55 60
Thr Gly His Ala Glu Ile Gln Ala Ile Glu Ala Ala Asn His Tyr Leu
65 70 75 80
Gly Ala Trp Arg Leu Glu Gly Ala Arg Leu Tyr Val Thr Leu Glu Pro
85 90 95
Cys Pro Met Cys Ala Gly Ala Ala Val Leu Ala Arg Ile Glu Thr Ile
100 105 110
Ile Tyr Ala Cys Arg Asp Pro Lys Gly Gly Cys Thr Gly Ser Leu Met
115 120 125
Asn Leu Ala Gln Glu Asp Arg Phe Asn His Gln Thr Gln Val Ile Glu
130 135 140
Gly Val Leu Asp Ala Ala Cys Ser Gln Met Met Lys Asp Phe Phe Lys
145 150 155 160
Lys Leu Arg Lys Arg Lys Lys Leu Glu Lys Leu Ser Thr Lys Thr Val
165 170 175
Asp Asn Ala Asp Leu
180
<210> 471
<211> 99
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 471
Met Asp Leu Thr Gln His Phe Gln Arg Met Gly Leu Ser Leu Phe Val
1 5 10 15
Ala Phe Lys Ala Leu Ser Ile Asn Glu Thr Pro Val Ala Cys Ile Leu
20 25 30
Val Ser Lys Lys Ser Ser Gln Val Ile Ser Ile Gly Tyr Asn Asp Thr
35 40 45
Asn Arg Ser Leu Asn Gly Thr Arg His Ala Glu Phe Ile Ala Ile Asp
50 55 60
Tyr Val Leu Asp Asn Val Val Asp Thr Leu Pro Val Asp Asp Leu Ile
65 70 75 80
Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Lys
85 90 95
Gln Val Gly
<210> 472
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 472
Met Glu Gly Ile Gln His Glu Leu Phe Met Arg Glu Ala Leu Lys Glu
1 5 10 15
Ala Glu Lys Ala Arg Glu Leu Asp Glu Val Pro Ile Gly Ala Val Val
20 25 30
Val Arg Asp Gly Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Ser
35 40 45
Thr Arg Asn Ala Thr Met His Ala Glu Met Val Ala Ile Gln Glu Ala
50 55 60
Asn Glu Gln Leu Ala Asn Trp Arg Leu Glu Glu Cys Asp Leu Tyr Val
65 70 75 80
Thr Val Glu Pro Cys Val Met Cys Gly Gly Ala Ile Ile Trp Ser Arg
85 90 95
Met Arg Thr Val Tyr Phe Gly Ala His Asp Pro Lys Gly Gly Ala Ala
100 105 110
Gly Ser Leu Leu Asn Val Leu Glu Asp Asp Arg Phe Asn His Thr Ala
115 120 125
Thr Val Tyr Ser Gly Leu Leu Ala Glu Glu Ser Gln Arg Leu Leu Lys
130 135 140
Asp Phe Phe Arg Glu Leu Arg Lys Arg Lys Lys Gln Lys Asn Gly Glu
145 150 155 160
His Ala
<210> 473
<211> 98
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 473
Met Val Glu Leu Glu Lys His Tyr Glu Phe Met Arg Tyr Ala Leu Arg
1 5 10 15
Leu Ala Asn Asn Ala Leu His Thr Asn Glu Val Pro Val Ala Cys Val
20 25 30
Phe Val Tyr Asp Gly Gln Ile Ile Ser Tyr Gly Ser Asn Asn Thr Asn
35 40 45
Asp Ser Leu Ser Gly Ile Thr His Ala Glu Phe Arg Gly Ile Asn Ile
50 55 60
Ile Leu Asp Lys Val Lys Ser Ser Pro Asp Phe Gln Gln Val Tyr Gln
65 70 75 80
Asn Pro Gln Asp Ile Phe Lys Asp Ile Asp Leu Tyr Val Thr Val Glu
85 90 95
Pro Cys
<210> 474
<211> 202
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 474
Met Asn Asp Ser Thr Glu Gln Thr Asp Ser Asp Leu Gln Leu Glu Gln
1 5 10 15
Glu His Ile Gln Trp Met Arg Val Ala Met Glu Met Ala Glu Glu Ala
20 25 30
Leu Val Ala Lys Glu Val Pro Val Gly Cys Ile Phe Val Arg Asp Gly
35 40 45
Arg Ile Ile Ala Arg Ala Arg Asn Arg Thr Asn Glu Leu Arg Asn Ala
50 55 60
Thr Arg His Ala Glu Leu Glu Ala Ile Asp Gly Ile Leu Ser Asp Lys
65 70 75 80
Asp Leu Thr Pro Val Leu Thr Asp Tyr Pro Leu Ser Glu Thr Thr Leu
85 90 95
Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Arg Gln
100 105 110
Met Gly Ile Lys Lys Val Phe Tyr Gly Cys Ala Asn Asp Arg Phe Gly
115 120 125
Gly Cys Gly Ser Val Leu Gly Val Asn Arg Ser Leu Thr His Pro Arg
130 135 140
His Pro Ala Tyr Gln Ala Val Gly Gly Tyr Leu Arg Glu Asp Ala Ile
145 150 155 160
Met Ile Leu Arg Arg Phe Tyr Val Thr Glu Asn Thr Asn Ala Pro Ala
165 170 175
Pro Lys Ser Lys Ala Asn Arg Val Thr Thr Lys Cys Ile Thr Ser Ala
180 185 190
Ile Tyr Val Tyr Tyr Arg Ser Ser Arg Ile
195 200
<210> 475
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 475
Met Thr Ser His Gln Tyr Tyr Met Ser Leu Ala Leu Glu Glu Ala Arg
1 5 10 15
Glu Ala Ala Lys Lys Gly Glu Val Pro Ile Gly Ala Ile Ile Val Lys
20 25 30
Asn Glu Lys Val Ile Ala Arg Ala His Asn Leu Arg Glu Thr Asn Gln
35 40 45
Asn Pro Thr Ala His Ala Glu His Leu Ala Ile Glu Gln Ala Ala Glu
50 55 60
Thr Leu Gly Thr Trp Arg Leu Glu Gly Cys Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Val Met Cys Ala Gly Thr Ile Val Met Ser Arg Val Asp
85 90 95
Thr Val Val Phe Gly Ala Tyr Asp Pro Lys Gly Gly Cys Thr Gly Ser
100 105 110
Leu Met Asn Leu Val Gln Asp Gln Arg Met Asn His Arg Ala Lys Val
115 120 125
Ile Glu Gly Val Leu Ala Tyr Ser Cys Gly Glu Ile Leu Arg Gln Phe
130 135 140
Phe Arg Thr Leu Arg Gln Arg Lys Ala Ala Lys Ala Met Ser Asn
145 150 155
<210> 476
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 476
Met Val Ser Ser Ser Lys Thr Val Lys Leu Ser Leu Glu Pro Glu Ile
1 5 10 15
Gly Pro Thr Ser Gly Glu Met Cys Val Ile Leu Ser Leu Pro Tyr Arg
20 25 30
Ser Ser Ser Asp Leu Pro Gln Ala Thr Leu His Ala Glu Leu Glu Ala
35 40 45
Ile Asp His Leu Leu Pro Asn Asn Pro Ala Pro Leu Ser Ser Ile Thr
50 55 60
Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu Arg
65 70 75 80
Gln Ile Gly Ile Gly Lys Val Ile Tyr Gly Cys Gly Asn Asp Arg Phe
85 90 95
Gly Gly Cys Gly Ser Val Ile Asn Val Asn Ser Ser Phe Val Leu Leu
100 105 110
Gly Arg Val Gly Glu Ala Gly Cys
115 120
<210> 477
<211> 165
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 477
Met Ser Pro Gly Tyr Arg Gly Tyr Ala Asp Leu Val Ser Leu Pro Val
1 5 10 15
Pro Ala Ala Asp Asp Ala Ala Met Thr Arg Ala Leu Glu Leu Ala Ala
20 25 30
Asp Ala Pro Ala His Asp Asp Val Pro Val Gly Ala Val Val Thr Arg
35 40 45
Gly Gly Gln Val Val Gly Glu Gly Arg Asn Leu Arg Glu Arg Asp Gly
50 55 60
Asp Pro Leu Ala His Ala Glu Ile Val Ala Leu Arg Ala Ala Ala Ser
65 70 75 80
Ala Leu Gly Ser Trp Asn Leu Glu Asp Cys Thr Leu Val Val Thr Leu
85 90 95
Glu Pro Cys Val Met Cys Ala Gly Ala Ile Leu Gln Thr Arg Val Gly
100 105 110
Arg Val Val Phe Gly Ala Trp Asp Glu Lys Ala Gly Ala Ala Gly Ser
115 120 125
Val His Asp Leu Leu Arg Asp Arg Arg Met Pro His Arg Ala Glu Val
130 135 140
Leu Gly Gly Val Arg Ala Ala Glu Ser Ala Ala Leu Leu Arg Asp Phe
145 150 155 160
Phe Gly Gln Lys Arg
165
<210> 478
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 478
Met Val Leu Glu Glu Asn Phe Met Leu Glu Ala Ile Glu Glu Ala Lys
1 5 10 15
Lys Ala Phe Asn Lys Lys Glu Val Pro Ile Gly Ala Val Val Val Lys
20 25 30
Asp Asn Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Thr Thr Lys
35 40 45
Asn Ser Ile Ser His Ala Glu Ile Met Ala Ile Gln Glu Ala Cys Lys
50 55 60
Phe Leu Gly Gly Trp Arg Leu Thr Asp Cys Thr Leu Tyr Val Thr Ile
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Gln
85 90 95
Lys Val Val Ile Gly Ala Met Asp Pro Lys Ala Gly Ala Cys Gly Ser
100 105 110
Leu Val Asn Leu Leu Asn Asp Ser Arg Phe Asn His Gln Thr Glu Ile
115 120 125
Glu Gln Gly Val Leu Glu Glu Glu Cys Ser Leu Leu Met Lys Glu Phe
130 135 140
Phe Lys Ala Leu Arg Glu Lys Arg Phe Gly
145 150
<210> 479
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 479
Met Lys His Ile Thr Tyr Met Gln Ala Ala Ile Glu Glu Ala Lys Lys
1 5 10 15
Ala Gln Asn Leu Gly Glu Val Pro Ile Gly Ala Val Ile Val Lys Asp
20 25 30
Gly Glu Ile Ile Ala Arg Gly Tyr Asn Leu Arg Glu Thr Ser Gln Leu
35 40 45
Ser Asn Ala His Ala Glu Met Ile Ala Ile Ala Lys Ala Asn Glu Met
50 55 60
Val Gly Ser Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg Ile Pro Thr
85 90 95
Val Val Phe Gly Ala His Asp Pro Lys Gly Gly Cys Cys Gly Thr Ile
100 105 110
Tyr Asn Leu Leu Asp Glu Ser Lys Phe Asn His Arg Cys Glu Leu Val
115 120 125
Ser Gly Val Leu Glu Glu Glu Cys Gly Gln Leu Leu Ser Asp Phe Phe
130 135 140
Arg Asn Leu Arg Gln Lys Lys Lys Gln Gln Arg Val Asp Asn Glu Thr
145 150 155 160
Ser Asn
<210> 480
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 480
Met Arg Thr Asp Asn Asp Tyr Met Arg Leu Ala Ile Lys Glu Ala Arg
1 5 10 15
Lys Ala Gln Glu Leu Gly Glu Val Pro Ile Gly Ala Val Ile Val Lys
20 25 30
Asp Asn His Val Ile Ala Arg Ala His Asn Leu Arg Glu Thr Leu Gln
35 40 45
Gln Pro Thr Ala His Ala Glu His Ile Ala Ile Glu Arg Ala Ser Glu
50 55 60
Val Ile Gly Ser Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Val Met Cys Ala Gly Ala Ile Val Met Ser Arg Ile Pro
85 90 95
Arg Val Val Tyr Gly Ala Ile Asp Pro Lys Gly Gly Cys Thr Gly Ser
100 105 110
Leu Met Asn Leu Leu Ala Gln Pro Gln Phe Asn His Arg Ala Ile Val
115 120 125
Glu Ser Gly Ile Leu Glu Asn Glu Cys Ser Thr Leu Leu Arg Glu Phe
130 135 140
Phe Lys Asn Ile Arg Gln Gln Lys Arg Ser Leu Lys Gln Ala Lys Ile
145 150 155 160
Gln Asn Asp Thr Asn Leu Leu Glu
165
<210> 481
<211> 181
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 481
Met Asp Thr Asn Glu Pro Leu Thr Asn Gly Ala Gly Ala Ser Glu Gln
1 5 10 15
Asp Leu Gln Phe Met Gly Gln Ala Ile Leu Glu Ala Lys Lys Ala Glu
20 25 30
Ala Ile Gly Glu Val Pro Ile Gly Ala Val Ile Val Arg Asp Gly Lys
35 40 45
Val Ile Ala Ala Ser His Asn Leu Arg Glu Arg Asp Gln Glu Ala Thr
50 55 60
Ala His Ala Glu Leu Ala Ala Ile Thr Glu Ala Cys Arg Lys Thr Gly
65 70 75 80
Ser Trp Arg Leu Glu Asp Thr Val Leu Tyr Val Thr Leu Glu Pro Cys
85 90 95
Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Pro Arg Val Val
100 105 110
Tyr Gly Ala Arg Asp Pro Lys Ala Gly Cys Val Asp Ser Leu Tyr Arg
115 120 125
Leu Leu Asp Asp Pro Arg Phe Asn His Arg Cys Asp Val Thr Glu Gly
130 135 140
Val Leu Ala Asp Glu Cys Gly Ala Leu Leu Thr Asn Phe Phe Arg Gly
145 150 155 160
Ile Arg Lys Arg Arg Lys Ala Glu Lys Gln Ala Arg Arg Ala Leu Glu
165 170 175
Ser Glu Gln Gly Glu
180
<210> 482
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 482
Met Ser Arg Asp Glu Tyr Phe Met Asp Ile Ala Leu Lys Glu Ala Lys
1 5 10 15
Lys Ala Tyr Asn Lys Gly Glu Val Pro Ile Gly Cys Val Ile Val Lys
20 25 30
Asp Asp Lys Ile Val Ser Arg Gly His Asn Gln Val Leu Ser Lys Lys
35 40 45
Ser Gly Val Asn His Ala Glu Ile Ile Ala Ile Asn Lys Ala Gly Gln
50 55 60
Lys Leu Gly Asp Phe Arg Leu Glu Asp Thr Glu Leu Phe Val Thr Leu
65 70 75 80
Glu Pro Cys Cys Met Cys Ala Gly Ala Ile Val Asn Ser Arg Ile Lys
85 90 95
Arg Val Ile Ile Gly Ala Met Asp Val Lys Arg Gly Phe Cys Gly Ser
100 105 110
Ile Glu Asn Val Leu Asp Arg Gln Glu Leu Asn His Arg Ser Ile Ile
115 120 125
Lys Thr Gly Val Leu Glu Gln Lys Cys Leu Asp Ile Leu Gln Asp Phe
130 135 140
Phe Lys Asn Leu Arg Ser Glu Lys Lys Asn Lys
145 150 155
<210> 483
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 483
Met Lys Thr Ser Gln Gln Leu Lys Asp Glu Ala Tyr Met Lys Glu Ala
1 5 10 15
Leu Thr Glu Ala Asp Lys Ala Glu Ala Ile Gly Glu Val Pro Ile Gly
20 25 30
Ala Val Ile Val Lys Asp Asp Ile Ile Ile Ala Arg Gly Tyr Asn Glu
35 40 45
Arg Glu Thr Lys Gln Arg Ala Thr Gly His Ala Glu Leu Val Ala Ile
50 55 60
Glu Glu Ala Cys Arg Ile Leu Lys Thr Trp Arg Leu Glu Gly Cys Thr
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val
85 90 95
Gln Ser Arg Ile Asp Arg Val Val Tyr Gly Ala Asp Asp Pro Lys Gly
100 105 110
Gly Ser Cys Gly Thr Val Val Asn Leu Leu Asp Glu Pro Lys Phe Asn
115 120 125
His Ala Pro Leu Val Thr Ser Gly Thr Leu Lys Glu Glu Ala Ala Asp
130 135 140
Arg Leu Ser Ser Phe Phe Arg Ala Leu Arg Glu Ala Arg Lys Gln Lys
145 150 155 160
Lys Lys Glu Gly Ile Pro His Glu Thr Glu Ser Asp Phe Thr
165 170
<210> 484
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 484
Met Asn His Glu Tyr Phe Met Lys Ile Ala Ile Glu Glu Ala Lys Lys
1 5 10 15
Cys Leu Phe Leu Asp Glu Val Pro Val Gly Ala Ile Ile Val Lys Asp
20 25 30
Gly Lys Ile Ile Ala Arg Ala His Asn Leu Arg Glu Thr Leu Arg Asp
35 40 45
Ala Thr Ala His Ala Glu Ile Leu Ala Ile Asn Glu Ala Cys Met Ala
50 55 60
Leu Gly Gly Trp Arg Leu Leu Asp Cys Thr Met Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Leu Val Asn Ser Arg Ile Lys Thr
85 90 95
Leu Ile Phe Gly Thr Arg Asp Pro Lys Gly Gly Ala Cys Gly Ser Leu
100 105 110
Tyr Asn Ile Val Ala Asp Glu Arg Leu Asn His Arg Ile Glu Ile Ile
115 120 125
Glu Gly Val Leu Gln Asp Glu Cys Ser Lys Leu Leu Lys Glu Phe Phe
130 135 140
Lys Ser Lys Arg Lys Lys Asp
145 150
<210> 485
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 485
Met Ile Val Leu Glu Arg Arg Pro Val Tyr Ala Ser Asn Ser Ser Gln
1 5 10 15
Ala Glu Arg Leu Leu Arg Cys Asp Cys Val Leu Asn Ser Gly Tyr Gly
20 25 30
Thr Leu Met Val Arg Ile Val His Phe Ser Met Ser Gly Ala Glu Gln
35 40 45
Met Glu His Glu Lys Phe Met Arg Glu Ala Leu Gln Glu Ala Glu Lys
50 55 60
Ala Ile Lys Trp Gly Glu Val Pro Ile Gly Ala Val Val Val Arg Glu
65 70 75 80
Gly Gln Val Ile Ala Arg Gly His Asn Met Arg Glu Thr Trp Lys Asp
85 90 95
Pro Thr Ala His Ala Glu Ile Val Ala Leu Arg Glu Ala Ser Arg Val
100 105 110
Leu Gly Gly Trp Arg Leu Thr Gly Cys Lys Leu Tyr Val Thr Leu Glu
115 120 125
Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Leu Ala Arg Ile Asp Glu
130 135 140
Val Ile Phe Gly Ala Arg Glu Pro Lys Phe Gly Ala Ala Gly Ser Ile
145 150 155 160
Val Asn Leu Ile Glu Thr Asp Arg Phe Asn His Gln Pro Gln Leu Thr
165 170 175
Ser Gly Val Leu Ala Glu Glu Cys Gly Met Ile Leu Lys Glu Phe Phe
180 185 190
Arg Gln Arg Arg Lys
195
<210> 486
<211> 171
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 486
Met Thr Asn Leu Glu Arg Asp Glu Lys Met Met Arg Arg Ala Leu Glu
1 5 10 15
Leu Ala Arg Gln Ala Ala Leu Glu Gly Glu Val Pro Val Gly Ala Val
20 25 30
Val Ala Arg Gly Asp Glu Ile Ile Ala Glu Gly Arg Asn Arg Arg Glu
35 40 45
Ala Cys Lys Asn Ala Leu Cys His Ala Glu Ile Glu Ala Ile Asp Ala
50 55 60
Ala Cys Arg Ala Leu His Gly Trp Arg Leu Trp Glu Cys Asp Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Leu Asn Ala
85 90 95
Arg Ile Ala Arg Val Ile Phe Gly Ala Ser Asp Pro Lys Ala Gly Ser
100 105 110
Cys Gly Ser Ile Val Asn Leu Phe Asp Leu Pro Tyr Asn His His Pro
115 120 125
Gln Leu Val Ser Gly Val Leu Arg Glu Glu Cys Gly Glu Val Leu Thr
130 135 140
Glu Phe Phe Gln Arg Leu Arg Asp Gln Arg Ala Val Lys Lys Pro Ser
145 150 155 160
Glu Pro Lys Ser Pro Ala Lys Asp Gly Thr Glu
165 170
<210> 487
<211> 157
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 487
Met Asn Arg Glu His Glu Ala Trp Met Asp Leu Ala Leu Asp Glu Ala
1 5 10 15
Arg Ala Ala Leu Ala Thr Asp Asp Val Pro Ile Gly Ala Val Val Ile
20 25 30
Ser Pro Asp Gly Lys Leu Leu Ser Thr Gly Arg Asn Glu Arg Glu Ala
35 40 45
Leu Lys Asp Pro Thr Ala His Ala Glu Val Val Ala Ile Arg Asn Ala
50 55 60
Val Ser Ala Leu Ala Ala Arg Gly Ala Asp Asp Gly Trp Arg Leu Glu
65 70 75 80
Asp Cys Thr Leu Val Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly
85 90 95
Ala Ile Val Leu Ala Arg Ile Pro Arg Val Val Phe Gly Ala Trp Asp
100 105 110
Glu Lys Ala Gly Ala Cys Gly Ser Val Phe Asp Ile Val Arg Glu Pro
115 120 125
Arg Leu Asn His Trp Val Glu Val Tyr Pro Arg Val Arg Glu Gln Glu
130 135 140
Cys Ala Asp Leu Leu Arg Asp Phe Phe Arg Ser Lys Arg
145 150 155
<210> 488
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 488
Met Glu Ala Lys Val Gly Ser Thr Gln Ile Thr Gly Gly Ala Cys Ser
1 5 10 15
Val Leu Ala Glu Glu Thr Glu Lys Trp Met Glu Gln Ala Met Gln Met
20 25 30
Ala Lys Glu Ala Leu Glu Asn Ile Glu Val Pro Val Gly Cys Leu Leu
35 40 45
Val Tyr Asn Asn Glu Val Val Gly Lys Gly Arg Asn Glu Val Asn Gln
50 55 60
Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp Gln Ala
65 70 75 80
Leu Asp Trp Cys Arg Arg His Gly Lys Ser Pro Ser Glu Val Phe Glu
85 90 95
His Met Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala
100 105 110
Ala Leu Arg Leu Met Lys Ile Pro Leu Val Val Tyr Gly Cys Gln Asn
115 120 125
Glu Arg Phe Gly Gly Cys Gly Ser Val Leu Asp Ile Ala Ser Ala Asp
130 135 140
Leu Pro Asn Thr Gly Arg Pro Phe Gln Cys Phe Glu Ile Leu Lys Lys
145 150 155 160
Leu Pro Ile Pro Gln Ala Ser Gly Cys Cys Val Phe Tyr Phe Tyr Leu
165 170 175
Val Gly Leu Gly Cys Gly
180
<210> 489
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 489
Met Glu Ser Asp Arg Tyr Tyr Met Lys Lys Ala Ile Glu Glu Ala Glu
1 5 10 15
Lys Ala Glu Ala Leu Gly Glu Val Pro Ile Gly Ala Val Leu Val His
20 25 30
Glu Gly Glu Val Ile Ala Arg Gly His Asn Leu Arg Glu Thr Thr Gln
35 40 45
Lys Thr Ser Ser His Ala Glu Cys Ile Thr Ile Asp Arg Ala Asn Asp
50 55 60
Val Ile Gly Ser Trp Arg Leu Glu Glu Cys Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Pro
85 90 95
Val Leu Val Tyr Gly Ala Tyr Asp Arg Lys Ala Gly Cys Ala Gly Thr
100 105 110
Leu Met Asn Leu Leu Asp Asp Asp Arg Phe Asn His Arg Thr Ala Ile
115 120 125
Arg Ala Gly Val Met Glu Glu Glu Cys Gly Glu Met Leu Ser Ser Phe
130 135 140
Phe Arg Arg Ile Arg Lys Lys Arg Lys Asp Lys
145 150 155
<210> 490
<211> 149
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 490
Met His Ile Gln Ala Glu Glu Ala Leu His Ser Asp Glu Val Pro Val
1 5 10 15
Gly Cys Val Phe Val Lys Gly Asp Thr Ala Ile Ala Arg Ala Arg Asn
20 25 30
Arg Thr Asn Glu Trp Arg Asn Ala Thr Leu His Ala Glu Leu Glu Ala
35 40 45
Ile Asp His Leu Leu Pro Asp His Pro Ala Pro Leu Ser Glu Ile Thr
50 55 60
Leu Tyr Val Thr Val Glu Pro Cys Val Met Cys Ala Ser Ala Leu Arg
65 70 75 80
Gln Ile Gly Ile Gly Arg Val Val Tyr Gly Cys Gly Asn Glu Arg Phe
85 90 95
Gly Gly Cys Gly Ser Val Ile Asp Ile His Ala Ser Tyr Val Leu Val
100 105 110
Leu Thr Ser Ser Gly Ala Lys Ala Gly Ala Gly Arg Arg Val Gly Ser
115 120 125
His Ser Glu Ser Arg Pro Ser Arg Arg Glu Ser Arg Arg Asn Ala Arg
130 135 140
Thr Glu Ala Arg Leu
145
<210> 491
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 491
Met Glu Glu Glu Glu Ala Ala Thr Leu Asp Trp Met Asp Gln Ala Phe
1 5 10 15
Asp Met Ala Lys Glu Ala Leu Glu Cys Gly Glu Val Pro Val Gly Cys
20 25 30
Leu Leu Val His Asn Gly Gln Ala Ile Gly Arg Gly Arg Asn Glu Val
35 40 45
Asn Glu Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp
50 55 60
Arg Val Leu Asp Trp Cys Lys Gln His Asn Arg Asp Tyr Thr Glu Val
65 70 75 80
Phe Pro Gln Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys
85 90 95
Ala Ala Ala Val Arg Leu Met Ser Ile Leu Ser Cys Leu Phe Met Leu
100 105 110
Gly Asn Gln Met Leu Lys Cys Tyr Ser Phe Gly Asn Thr Gly Glu Pro
115 120 125
Phe Glu Cys Val Ser Gly Tyr Arg Ala Lys Glu Ala Val Glu Met Leu
130 135 140
Lys Ala Phe Tyr Arg Gln Glu Asn Pro Asn Ala Pro Lys Ser Lys Val
145 150 155 160
Arg Lys Lys Asp His Arg Asn
165
<210> 492
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 492
Met Leu Pro Leu Asp Asp Pro Asp Thr Arg Phe Met Gln Gln Ala Leu
1 5 10 15
Thr Leu Ala Arg Ser Ala Pro Leu Ile Gly Glu Val Pro Ile Ala Ala
20 25 30
Leu Leu Val His Glu Gly Ile Val Ile Ala Gln Ala His Asn Leu Arg
35 40 45
Glu Thr Arg Gln Asp Pro Thr Ala His Ala Glu Val Ile Val Ile Gln
50 55 60
Asp Ala Ala Arg His Met Gly Ser Trp Arg Leu Ile Asn Thr Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ile Gly Ala Ile Val Leu
85 90 95
Ala Arg Ile Pro Arg Leu Val Phe Ala Ala Thr Asp Pro Lys Ala Gly
100 105 110
Ala Cys Gly Ser Ile Met Asn Ile Pro Pro Glu Pro Arg Leu Asn His
115 120 125
Arg Val Glu Val Val Gly Gly Val Cys Ala Glu Glu Ser Gln Ala Leu
130 135 140
Leu Gln Asp Phe Phe Gln Gln Leu Arg Lys Asp Ala Ala Arg Arg Glu
145 150 155 160
Thr Thr
<210> 493
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 493
Met Val Arg Pro Gln Ala Glu Glu Ala Phe Thr Ala Ser Glu Ile Pro
1 5 10 15
Val Gly Cys Val Leu Val His Gln Gly Arg Ile Ile Ala Lys Gly Arg
20 25 30
Asn Arg Thr Asn Glu Gly Arg Asn Ala Thr Leu His Ala Glu Phe Asp
35 40 45
Ala Leu Arg His Leu Leu Pro Asp Arg Ser His Thr Val Thr Pro Gln
50 55 60
Leu Thr Arg Pro Phe Thr Pro Gln Glu Gly Glu Arg Lys Ile Trp Glu
65 70 75 80
Thr Pro Leu Glu Gly Val Val Leu Tyr Val Thr Val Glu Pro Cys Ile
85 90 95
Met Cys Ala Ala Ala Met Arg Gln Val Gly Ile Glu Lys Val Ile Tyr
100 105 110
Gly Cys Gly Asn Asp Arg Phe Gly Gly Thr Gly Gly Val Gln Ser Ile
115 120 125
His Ser Glu Ser Val Arg Phe Pro Phe Asp Leu Leu Asp Arg Val Ala
130 135 140
Asn Ser Cys Leu Val Arg Ser Phe Val Ala Leu Asp Cys Cys Thr Leu
145 150 155 160
Arg Arg Ile Gln Leu Thr Ala Ile Thr Glu Glu Lys Arg Arg Leu Cys
165 170 175
Cys Tyr Gly Asp Ser Ile
180
<210> 494
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 494
Met Gln Glu Asp Ala Tyr Tyr Met Arg Leu Ala Leu Glu Glu Ala Gln
1 5 10 15
Lys Ala Tyr Asp Leu Glu Glu Val Pro Ile Gly Ala Val Leu Val Asp
20 25 30
Arg Glu Gly Glu Val Val Ala Arg Gly His Asn Met Arg Glu Val Trp
35 40 45
His Asp Ala Thr Ala His Ala Glu Met Ile Ala Ile Arg Glu Ala Cys
50 55 60
Ala Lys Glu Gly Arg Trp Arg Leu Ser Gly Leu Thr Leu Tyr Val Thr
65 70 75 80
Ile Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Met Ser Arg Val
85 90 95
Asp Arg Val Val Tyr Gly Ser Thr Asp Ala Arg Ala Gly Ala Cys Glu
100 105 110
Ser Val Phe Asn Ile Pro Gly Cys Pro Ala Leu Asn His Arg Pro Glu
115 120 125
Met Thr Ala Gly Val Leu Gln Glu Glu Cys Ala Gly Ile Met Lys Arg
130 135 140
Phe Phe Lys Glu Arg Arg Ala Lys Arg Lys Ala Leu Arg Gln Gln Ala
145 150 155 160
Ala Gly Ser Pro Glu Thr Ala Glu Arg
165
<210> 495
<211> 146
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 495
Met Ala Thr Arg His Ala Glu Leu Glu Ala Ile Asp Phe Ile Leu Ser
1 5 10 15
Gln His Pro Pro Lys Glu Gln Asp Phe Pro Ile Ser Pro His Ser Gly
20 25 30
Pro Ser Gly Asp Asn Pro Phe Ala Glu Thr Thr Leu Tyr Val Thr Ile
35 40 45
Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Arg Gln Val Gly Ile Lys
50 55 60
Arg Val Val Phe Gly Ala Gly Asn Glu Arg Phe Gly Gly Asn Gly Ser
65 70 75 80
Val Leu Pro Val His Thr Asp Ala Gln Leu Lys Asn Ala Pro Ala Tyr
85 90 95
Glu Ala Val Gly Gly Tyr Tyr Arg Glu Asp Ala Ile Met Leu Leu Arg
100 105 110
Arg Phe Tyr Leu Thr Glu Asn Val Phe Ala Pro Asn Pro Arg Ser Lys
115 120 125
Ala Lys Arg Val Leu Lys Thr Tyr Phe Gln Arg Glu Ser Arg Pro Phe
130 135 140
Cys Phe
145
<210> 496
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 496
Met Gly Val Ala Arg Thr Leu Ala Glu Gln Ala Ser Ala Glu Gly Glu
1 5 10 15
Val Pro Val Gly Ala Leu Val Val Lys Asp Gly Glu Ile Ile Gly Arg
20 25 30
Gly Tyr Asn Gln Pro Ile Gly Arg His Asp Pro Ser Ala His Ala Glu
35 40 45
Met Gln Ala Leu Arg Asp Ala Ala Ala Arg Leu Gly Asn Tyr Arg Leu
50 55 60
Asp Gly Cys Asp Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ser
65 70 75 80
Gly Ala Ile Leu His Ala Arg Ile Ala Arg Val Ile Tyr Gly Ala Ala
85 90 95
Asp Ala Lys Thr Gly Ala Ala Gly Ser Thr Val Asp Leu Phe Ala Asp
100 105 110
Ala Arg Leu Asn His His Ala Ala Val Phe Gly Gly Val Glu Ala Glu
115 120 125
Thr Cys Ala Glu Gln Leu Ser Ala Phe Phe Arg Gln Arg Arg Arg Ser
130 135 140
Ala Gly Asp Gly Glu Glu
145 150
<210> 497
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 497
Met Glu Gln Glu Asn Tyr Met Arg Arg Ala Leu Thr Leu Ala Arg Glu
1 5 10 15
Ala Gly Asp Ala Gly Glu Val Pro Val Gly Cys Val Ile Val Arg Asp
20 25 30
Gly Lys Val Val Gly Glu Gly Arg Asn Arg Arg Glu Glu Leu Thr Ser
35 40 45
Ala Ala Ser His Ala Glu Met Glu Ala Ile Ala Ala Ala Asn Glu Arg
50 55 60
Leu Gly Ser Trp Arg Leu Glu Gly Cys Ala Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Asn Ala Arg Val Ser Lys
85 90 95
Val Phe Tyr Gly Ala Arg Asp Pro Ala Phe Gly Ala Cys Gly Gly Val
100 105 110
Thr Asn Leu Phe Met Glu Asp Phe Pro Asn Arg Pro Ala Leu Val Gly
115 120 125
Gly Val Leu Ala Glu Glu Cys Arg Glu Val Leu Arg Ala Phe Phe Gln
130 135 140
Lys Leu Arg Asn Asp Gly Gly Thr Gly Glu Ser Pro Glu Pro Lys Ile
145 150 155 160
<210> 498
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 498
Met Glu Asp Asp Ile Lys Tyr Met Lys Met Ala Leu Ala Glu Ala Arg
1 5 10 15
Lys Ala Tyr Gln Arg Ala Glu Val Pro Ile Gly Ala Val Val Ile Cys
20 25 30
Asp Asp Lys Val Val Gly Arg Gly Phe Asn Leu Arg Glu Gln Thr Gln
35 40 45
Asp Pro Thr Ser His Ala Glu Met Ile Ala Leu Arg Glu Ala Ala Lys
50 55 60
Asn Glu Ala Ser Trp Arg Leu Glu Asn Cys Gln Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile Lys
85 90 95
Arg Leu Val Tyr Gly Ala Ser Asp Pro Lys Ala Gly Ala Val Asn Ser
100 105 110
Leu Tyr Gln Leu Leu Asn Asp Glu Arg Phe Asn His Gln Val Glu Val
115 120 125
Glu Ala Gly Val Met Lys Lys Glu Ala Ala Gln Leu Leu Lys Asp Phe
130 135 140
Phe Arg Asp Leu Arg Glu Arg Lys Asp Gly
145 150
<210> 499
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 499
Met Gln Glu Ala Leu Val Glu Ala Ser Ala Ala Ala Arg Leu Gly Glu
1 5 10 15
Val Pro Val Gly Ala Val Val Val Lys Asp Gly Met Ile Ile Gly Arg
20 25 30
Gly His Asn Leu Arg Glu Thr Ser Asn Asp Pro Thr Thr His Ala Glu
35 40 45
Met Ile Ala Ile Arg Gln Ala Ala Ala Ala Ile Asp Ser Trp Arg Leu
50 55 60
Ile Gly Cys Thr Leu Tyr Val Thr Leu Glu Pro Cys Val Met Cys Met
65 70 75 80
Gly Ala Ile Ile Leu Ala Arg Ile Pro Arg Leu Val Phe Gly Ser Arg
85 90 95
Asp Pro Arg Val Gly Ala Val Gly Ser Ile Phe Asp Leu Ser Arg Asp
100 105 110
Glu Arg Phe Asn His Gln Val Ala Val Thr Glu Gly Val Leu Ala Leu
115 120 125
Glu Ser Ser Asp Met Leu Ser Gly Phe Phe Arg Gln Leu Arg Ala Glu
130 135 140
Lys Lys Ser Arg Lys Arg Lys Ala Ala Asp Ser Glu Asp Gln Thr
145 150 155
<210> 500
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 500
Met Asn Asp Asn Asp Phe Met Gly Glu Ala Leu Arg Leu Ala Gly Cys
1 5 10 15
Ala Ala Glu Arg Gly Glu Val Pro Val Gly Ala Val Val Val Cys Asp
20 25 30
Gly Gln Ile Val Gly Thr Gly Phe Asn Arg Arg Glu Thr Gly Lys Asn
35 40 45
Ala Leu Ala His Ala Glu Leu Glu Ala Ile Asp Ala Ala Cys Arg Arg
50 55 60
Leu Gly Gly Trp Arg Leu His Arg Cys Glu Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Asn Ala Arg Ile Arg Arg
85 90 95
Leu Val Phe Gly Ala Arg Asp Pro Lys Ser Gly Cys Phe Gly Ser Val
100 105 110
Ser Asp Phe Asn Ala Leu Ala Phe Asn His Lys Pro Gln Val Val Cys
115 120 125
Gly Val Arg Gly Glu Glu Cys Ala Gln Ile Leu Ser Ala Phe Phe Gln
130 135 140
Lys Leu Arg Arg Gly Arg Gln
145 150
<210> 501
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 501
Met Glu Lys Asp Ile Glu Phe Met Lys Gln Ala Leu Ile Glu Ala Glu
1 5 10 15
Lys Ala Phe Thr Leu Asp Glu Ala Pro Ile Gly Ala Val Ile Val Tyr
20 25 30
Lys Glu Gln Val Ile Gly Arg Gly His Asn Arg Arg Asn Thr Asp Lys
35 40 45
Asn Ala Leu Ala His Ala Glu Val Met Ala Ile Asn Glu Ala Cys Lys
50 55 60
His Ile Lys Asp Trp Arg Leu Glu Glu Cys Thr Ile Tyr Ile Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ser Gly Ala Ile Val Gln Ala Arg Leu Pro
85 90 95
Arg Val Val Phe Gly Ala Arg Ser Pro Lys Ala Gly Phe Gly Gly Ser
100 105 110
Val Leu Asn Ile Leu Gln Met Asp Glu Leu Asn His Arg Cys Glu Val
115 120 125
Val Glu Gly Val Cys Glu Glu Glu Ala Ser Gln Leu Leu Lys Ser Tyr
130 135 140
Phe Lys Gln Met Arg Gln Lys Asn Lys Ile Ile Gly Gly Glu Leu Trp
145 150 155 160
Gln Gln Ile Gln Asp Ile Arg Lys Gln Glu Cys Leu Glu Ile Leu
165 170 175
<210> 502
<211> 112
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 502
Met Val Tyr Asn Asn Glu Ile Val Gly Lys Gly Arg Asn Glu Val Asn
1 5 10 15
Glu Thr Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Ile Asp Gln
20 25 30
Val Leu Asp Trp Cys Gln Gln His Lys Lys Gln Pro Glu Asp Val Phe
35 40 45
Thr His Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala
50 55 60
Ala Ala Leu Arg Met Met Asn Ile Gly Glu Pro Phe Gln Cys Ile Ala
65 70 75 80
Gly Tyr Arg Ser Glu Glu Ala Val Glu Met Leu Lys Thr Phe Tyr Arg
85 90 95
Gln Glu Asn Pro Asn Ala Pro Lys Ser Lys Val Arg Lys Lys Glu Phe
100 105 110
<210> 503
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 503
Met Lys Asp His Ser Tyr Tyr Met Glu Met Ala Leu Glu Glu Ala Arg
1 5 10 15
Arg Ala Tyr Ala Lys Gly Glu Val Pro Ile Gly Ala Val Leu Val Val
20 25 30
Asp Gly Glu Val Ile Ala Lys Ala His Asn Thr Arg Glu Glu His Gln
35 40 45
Gln Ala Leu Asn His Ala Glu Met Leu Ala Ile Lys Glu Ala Cys Glu
50 55 60
Lys Gln Gly Phe Trp Arg Leu Asp Asn Ser Tyr Leu Tyr Thr Thr Val
65 70 75 80
Glu Pro Cys Val Met Cys Ser Gly Ala Ile Val Gln Ala Arg Val Glu
85 90 95
Asn Val Ile Tyr Gly Ala Ser Asp Pro Lys Tyr Gly Cys Cys Gly Ser
100 105 110
Cys Ile Asp Leu Val Gly Glu Asn Lys Phe Asn His Gln Ala Glu Val
115 120 125
Ile Ser Gly Val Leu Glu Glu Glu Cys Ser Met Leu Met Lys Asn Phe
130 135 140
Phe Lys Glu Leu Arg Glu Lys Lys Lys Lys Gln
145 150 155
<210> 504
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 504
Met Lys Phe Ser Glu Glu Lys Asn Leu Ser Phe Met Gln Met Ala Leu
1 5 10 15
Asp Gln Ala Gln Leu Ala Gln Ala Asp Gly Glu Val Pro Ile Gly Cys
20 25 30
Leu Ile Val Asp Asn Gln Thr Ser Glu Ile Ile Ala Thr Gly Phe Asn
35 40 45
Glu Arg Glu Gln Thr Gln Asp Ala Ile Lys His Ala Glu Ile Ile Ala
50 55 60
Ile Glu Lys Ala Cys Gln Lys Val Gly Ser Trp Arg Leu Glu His Thr
65 70 75 80
Ser Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile
85 90 95
Ile Asn Ser Arg Ile Glu Glu Val Ile Phe Gly Ala Tyr Asp Pro Lys
100 105 110
Ala Gly Ser Val Gly Ser Ile Asn Asn Leu Phe Glu Glu Lys Arg Tyr
115 120 125
Asn His His Pro Asp Phe Leu Gly Gly Met Leu Ala Asp Asp Ser Ala
130 135 140
Ser Leu Leu Gln Asn Phe Phe Arg Glu Ile Arg Arg Lys Lys
145 150 155
<210> 505
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 505
Met Met Glu Gln Ala Ala Asp Glu Arg Phe Met Arg Arg Ala Leu Glu
1 5 10 15
Leu Ala Glu Glu Ala Ala Arg Trp Gly Glu Val Pro Val Gly Ala Val
20 25 30
Val Val Glu Asn Gly Arg Ile Val Gly Glu Gly Phe Asn Arg Arg Glu
35 40 45
Thr Trp Arg Asp Gly Thr Ala His Ala Glu Met Leu Ala Ile Glu Glu
50 55 60
Ala Ser Arg Arg Leu Gly Gly Trp Arg Leu Thr Asn Cys Val Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Leu Ser
85 90 95
Arg Val Gln Arg Val Val Tyr Gly Ala Thr Asp Ala Lys Gly Gly Ala
100 105 110
Val Ala Ser Lys Val Arg Leu Leu Glu Pro Gly Leu Trp Asn His Ala
115 120 125
Pro Gln Ile Thr Ser Gly Ile Leu Ala Asp Asp Cys Ala Lys Leu Leu
130 135 140
Thr Asp Phe Phe Arg Lys Arg Arg Leu Lys Arg Arg Asp Gly Glu Val
145 150 155 160
Ser
<210> 506
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 506
Met Glu Glu Phe Asn Glu Lys Trp Met Lys Val Ala Ile Glu Leu Ala
1 5 10 15
Glu Lys Ala Leu Ala Gln Gly Glu Val Pro Val Gly Cys Ile Phe Val
20 25 30
Arg Gly Glu Glu Ile Ile Ala Lys Gly Arg Asn Asp Val Asn Arg Thr
35 40 45
Arg Asn Ala Thr Arg His Ala Glu Met Ile Cys Ile Asp Glu Val Phe
50 55 60
Glu Arg Phe Lys Thr Thr Asp Val Phe Lys Glu Val Thr Val Val Val
65 70 75 80
Thr Val Glu Pro Cys Ile Met Cys Ala Gly Ala Leu His Asp Leu Gly
85 90 95
Val Arg Gly Val Val Phe Gly Cys Ala Asn Asp Arg Phe Gly Gly Cys
100 105 110
Gly Ser Val Phe Asp Val Ala Ala Val His His Thr Pro Val Pro Val
115 120 125
His Gly Gly Val Phe Ala Ser Lys Ala Met Glu Leu Leu Lys Thr Phe
130 135 140
Tyr Met Gly Val Asn Pro Asn Ala Pro Pro Ser Lys Val Lys Thr Arg
145 150 155 160
Lys Lys Thr Glu Leu Ser Met Asn
165
<210> 507
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 507
Met Arg Gln Arg Ser Lys Ile Phe Met His Leu Arg Gln Val Leu Phe
1 5 10 15
Tyr Ser Glu Glu Leu Gln Lys Cys Thr Asp Gln Lys Gly Gly Asp Arg
20 25 30
Met His Gly Glu Asp Glu Arg Tyr Met Ala Leu Ala Ile Asp Glu Ala
35 40 45
Ala Lys Ala Arg Ala Ile Gly Glu Val Pro Ile Gly Ala Val Ile Val
50 55 60
Arg Glu Gly Ala Val Ile Ala Gln Ala Tyr Asn Gln Arg Glu Thr Leu
65 70 75 80
Gln Glu Pro Thr Ala His Ala Glu Leu Ser Ala Leu Arg Glu Ala Gly
85 90 95
Arg Lys Leu Gly Thr Trp Arg Leu Thr Gly Cys Thr Leu Tyr Val Thr
100 105 110
Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val Val Leu Ser Arg Ile
115 120 125
Asp Arg Leu Val Phe Gly Ala Pro Asp Pro Lys Ala Gly Cys Ala Gly
130 135 140
Thr Leu Met Asn Leu Val Gln Asp Ser Arg Phe Asn His Gln Ala Glu
145 150 155 160
Val Ala Gly Asn Val Leu Gly Glu Gln Cys Gly Ala Leu Leu Thr Asp
165 170 175
Phe Phe Ser Asn Leu Arg Arg Glu Lys Arg Gly Arg Ala Asn Asp Arg
180 185 190
Pro Glu Ile
195
<210> 508
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 508
Met Pro Leu Leu Ser Leu Glu Cys Tyr Pro Leu Ser Asp Ala Glu Leu
1 5 10 15
Thr His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Gln Arg Ala
20 25 30
Trp Asp Glu Gly Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn
35 40 45
Gln Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro
50 55 60
Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Gln
65 70 75 80
Gln Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro
85 90 95
Cys Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Gly Arg Leu
100 105 110
Ile Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu Ile
115 120 125
Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Val Val Glu
130 135 140
Gly Ile Leu Arg Asp Glu Cys Ala Gly Met Leu Ser Ala Phe Phe Arg
145 150 155 160
Gln Arg Arg Ala Glu Lys Lys Ala Leu Lys Lys Gly Ala Thr Asp Val
165 170 175
Leu
<210> 509
<211> 178
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 509
Met Gly Glu Tyr Phe Met Arg Lys Tyr Thr Glu Asp Glu Lys Phe Met
1 5 10 15
Lys Glu Ala Ile Lys Gln Ala Lys Lys Ala Glu Ala Ile Gly Asp Val
20 25 30
Pro Ile Gly Cys Val Ile Val His Asp Gly Lys Ile Ile Ala Arg Gly
35 40 45
Tyr Asn Lys Arg Asn Lys Asp Lys Thr Val Leu Ala His Ala Glu Leu
50 55 60
Leu Ala Met Lys Lys Ala Cys Lys Lys Leu Gly Asp Trp Arg Leu Glu
65 70 75 80
Asp Cys Thr Met Tyr Ile Thr Leu Glu Pro Cys Gln Met Cys Ala Gly
85 90 95
Ala Ile Val Gln Ala Arg Val Thr Arg Val Val Ile Gly Ser Met Asn
100 105 110
Ala Lys Ala Gly Cys Gly Gly Ser Ile Leu Asn Leu Leu Glu Met Gln
115 120 125
Glu Phe Asn His Gln Ala Glu Val Glu Arg Gly Val Leu Gln Glu Glu
130 135 140
Cys Ser Glu Met Leu Ser Ala Phe Phe Arg Lys Leu Arg Glu Ile Gln
145 150 155 160
Lys Glu Lys Lys Lys Lys Arg Lys Leu Ile Gln Glu Glu Asn Gln Thr
165 170 175
Asp Asn
<210> 510
<211> 164
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 510
Met Lys Thr His Glu Glu Tyr Met Glu Leu Ala Leu Glu Glu Ala Arg
1 5 10 15
Lys Ala Glu Glu Ile Asp Glu Val Pro Val Gly Cys Val Ile Val Cys
20 25 30
Asp Gly Glu Val Ile Ser Arg Gly His Asn Leu Lys Glu Gln Leu Asn
35 40 45
Gln Ala Tyr Ala His Ala Glu Met Met Ala Ile Gln Lys Ala Ala Glu
50 55 60
Val Lys Gly Asn Trp Cys Leu Asn Asp Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Met Met Cys Thr Gly Ile Ile Asn Leu Ser Arg Ile Arg
85 90 95
Thr Val Tyr Tyr Gly Thr Gln Asp Pro Lys Gly Gly Cys Leu Glu Thr
100 105 110
Val Ile Asp Leu Lys Lys Ile Asn Arg Leu Asn His Tyr Pro Asn Ile
115 120 125
Val Gly Asn Ile Leu Gln Lys Glu Cys Ser Glu Ile Leu Thr Asn Tyr
130 135 140
Phe Arg Lys Lys Arg Glu Ile Ile Lys Glu Lys Lys Gln Lys Asn Lys
145 150 155 160
Ala Asn Ile Gln
<210> 511
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 511
Met Gln Glu Lys Asp His Glu Phe Phe Met Arg Glu Ala Leu Lys Glu
1 5 10 15
Ala Arg Lys Ala Phe Glu Gln Asp Glu Val Pro Val Gly Ala Val Ile
20 25 30
Ala Tyr Glu Gly Ser Ile Ile Ala Arg Ala His Asn Leu Arg Glu Arg
35 40 45
Ser Gln Asp Ala Thr Ala His Ala Glu Val Leu Ala Ile Lys Ala Ala
50 55 60
Cys Glu Ala Met Gly Thr Trp Arg Leu Thr Gly Cys Ser Leu Tyr Val
65 70 75 80
Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Leu Ala Arg
85 90 95
Leu Asp Arg Val Val Phe Gly Ala Pro Asp Pro Lys Ala Gly Ala Ala
100 105 110
Gly Ser Val Val Asp Leu Phe Lys Val Glu Arg Phe Asn His His Pro
115 120 125
Glu Val Val Ser Gly Val Leu Ala Glu Glu Cys Gly Ile Leu Leu Lys
130 135 140
Asp Phe Phe Arg Gln Lys Arg Leu
145 150
<210> 512
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 512
Met Val Gln Asn Ala Gly Asn Ser Leu Ala Gly Gln Arg Asp Val His
1 5 10 15
Phe Met Glu Met Ala Leu Glu Glu Ala Arg Gln Ala Ala Arg Glu Gly
20 25 30
Glu Ile Pro Val Gly Ala Val Leu Val Arg Asp Gly Gln Val Leu Ala
35 40 45
Arg Asp His Asn Arg Arg Glu Gln Asp Arg Asp Ala Thr Ala His Ala
50 55 60
Glu Phe Leu Val Ile Arg Gln Ala Cys Arg Leu Leu Arg Arg Trp Arg
65 70 75 80
Leu Ser Asp Thr Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys
85 90 95
Ala Gly Ala Ile Trp Asn Ala Arg Val Gly Arg Leu Val Tyr Gly Ala
100 105 110
Trp Asp Ser Ala Ala Gly Ser Cys Gly Ser Gln Phe Asn Leu Pro Ala
115 120 125
His Pro Ser Leu Asn Phe Arg Thr Glu Val Thr Ala Gly Val Leu Glu
130 135 140
Glu Glu Cys Arg Lys Ile Leu Gln Asp Phe Leu Lys Ala Arg Arg
145 150 155
<210> 513
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 513
Met Gln Glu Val Gly Val Asp Pro Glu Lys Asn Asp Phe Leu Gln Pro
1 5 10 15
Ser Asp Ser Glu Val Gln Thr Trp Met Ala Lys Ala Phe Asp Met Ala
20 25 30
Val Glu Ala Leu Glu Asn Gly Glu Val Pro Val Gly Cys Leu Met Val
35 40 45
Tyr Asn Asn Glu Ile Ile Gly Lys Gly Arg Asn Glu Val Asn Glu Thr
50 55 60
Lys Asn Ala Thr Arg His Ala Glu Met Val Ala Leu Asp Gln Val Leu
65 70 75 80
Asp Trp Cys Arg Leu Arg Glu Lys Asp Cys Lys Glu Val Cys Glu Gln
85 90 95
Thr Val Leu Tyr Val Thr Val Glu Pro Cys Ile Met Cys Ala Ala Ala
100 105 110
Leu Arg Leu Leu Arg Ile Pro Phe Val Val Tyr Gly Cys Lys Asn Glu
115 120 125
Arg Phe Gly Gly Cys Gly Ser Val Leu Asp Val Ser Ser Asp His Leu
130 135 140
Pro His Thr Gly Thr Ser Phe Lys Cys Ile Ala Gly Tyr Arg Ala Glu
145 150 155 160
Glu Ala Val Glu Met Leu Lys Thr Phe Tyr Lys Gln Glu Asn Pro Asn
165 170 175
Ala Pro Lys Pro Lys Val Arg Lys Asp Ser Ile Asn Pro Gln Asp Gly
180 185 190
Ala Ala Val Ile Gln Val Met Arg Gly Pro Pro Asp Glu Glu Thr Glu
195 200 205
Thr Ile Ala His Leu Ser
210
<210> 514
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 514
Met Thr Glu Gln Gln Tyr Tyr Met Thr Glu Ala Leu Ile Glu Ala Lys
1 5 10 15
Lys Ala Phe Ala Leu Lys Glu Val Pro Ile Gly Ala Val Met Val Arg
20 25 30
Lys Gly Glu Ile Ile Ala Arg Gly Tyr Asn Leu Arg Asn Ser Ala Lys
35 40 45
Asn Pro Leu Cys His Ala Glu Ile Asp Val Ile Asp Lys Ser Ala Lys
50 55 60
Ile Val Gly Asp Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Val
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Gln Ser Arg Ile Pro
85 90 95
Lys Ile Val Phe Gly Thr Arg Asn Asn Lys Ala Gly Cys Ala Gly Ser
100 105 110
Ile Leu Asn Ile Leu Gln Glu Pro Arg Phe Asn His Gln Val Glu Ile
115 120 125
Glu Glu Asn Val Leu Gln Gln Glu Cys Ala Glu Leu Met Arg Ala Phe
130 135 140
Phe Lys Asn Phe Arg Lys Lys Ser Asn Met
145 150
<210> 515
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 515
Met Glu Leu Ala Thr Asp Glu Glu Lys Met Tyr Met Glu Glu Ala Leu
1 5 10 15
Lys Glu Ala Ala Leu Ala Ala Leu Glu Gly Glu Ile Pro Val Gly Ala
20 25 30
Ile Leu Val Gln Asp Gly Arg Val Ile Ala Arg Asn His Asn Arg Arg
35 40 45
Glu Arg Ala His Asp Ala Thr Ala His Ala Glu Ile Leu Val Ile Arg
50 55 60
Glu Ala Cys Glu Lys Leu Arg Arg Trp Arg Leu Ala Asp Ser Thr Leu
65 70 75 80
Tyr Val Thr Met Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Tyr Asn
85 90 95
Ala Arg Ile Gly Arg Val Val Phe Gly Ala Ser Asp Ser Val Ala Gly
100 105 110
Ala Cys Gly Ser Leu Phe Gln Ile Pro Leu His Pro Ser Leu His Ala
115 120 125
Asn Thr Ile Ile Lys Ala Gly Ile Glu Ala Glu Arg Cys Lys Lys Ile
130 135 140
Leu Gln Glu Phe Phe Thr Arg Arg Arg
145 150
<210> 516
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 516
Met Ala Lys Val Pro Thr Phe Ser Glu Gln Gln Ile Asp Tyr Phe Met
1 5 10 15
Gln Glu Ala Leu Asn Glu Ala Lys Leu Ala Gly Ser Glu Gly Glu Val
20 25 30
Pro Ile Gly Ala Val Ile Val Phe Glu Asn Gln Ile Ile Ala Arg Ala
35 40 45
His Asn His Arg Glu Arg Asp Gln Leu Ala Thr Ala His Ala Glu Leu
50 55 60
Ile Ala Ile Glu Arg Ala Asn Gln Ala Leu Lys Ser Trp Arg Leu Glu
65 70 75 80
Asp Thr Ala Leu Phe Val Thr Leu Glu Pro Cys Ile Met Cys Ala Gly
85 90 95
Ala Ile Ile Asn Ala Arg Val Pro Ala Val Tyr Tyr Gly Ala Gln Asp
100 105 110
Ala Lys Gly Gly Gly Thr Gln Ser Leu Tyr Gln Leu Leu Glu Asp Glu
115 120 125
Arg Leu Asn His Arg Val Ala Val Gln Ala Gly Val Arg Ala Glu Glu
130 135 140
Ser Thr Lys Ile Leu Gln Gln Phe Phe Ala Asp Ile Arg Ala Lys Arg
145 150 155 160
Lys
<210> 517
<211> 171
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 517
Met Cys Val Cys Val Cys Leu Gln Pro Asn Met Asp His Phe Met Glu
1 5 10 15
Gln Ala Leu Glu Gln Ala Arg Lys Ala Glu Gln Leu Lys Glu Val Pro
20 25 30
Val Gly Cys Val Phe Val Tyr Arg Gly Glu Ile Ile Ala Asn Gly Cys
35 40 45
Asn Leu Val Asn Glu Thr Lys Asn Ala Thr Arg His Val Glu Phe Ile
50 55 60
Cys Ile Asp Gln Val Leu Glu Tyr Cys Lys Asn Arg Ser Leu Lys His
65 70 75 80
Glu Asp Val Phe Arg Glu Val Thr Val Val Val Thr Val Glu Pro Cys
85 90 95
Ile Met Cys Ala Ala Ala Leu Ile Glu Leu Asn Val Arg Glu Val Ile
100 105 110
Tyr Gly Cys Lys Asn Asp Arg Phe Gly Gly Cys Thr Val Leu Asp Val
115 120 125
Pro Gly Leu Leu Lys Thr Ser Ile Pro Ile Arg Gly Gly Val Arg Ala
130 135 140
Asp Glu Ala Met Glu Leu Leu Lys Glu Phe Tyr Lys Gly Glu Asn Pro
145 150 155 160
Ser Ala Pro Val Pro Lys Val Lys Ser Gln Lys
165 170
<210> 518
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 518
Met Asp His Glu Lys Phe Met Ala Glu Ala Leu Lys Glu Ala Glu Lys
1 5 10 15
Ala Ala Leu Gln Gly Glu Val Pro Val Gly Ala Val Val Val Tyr Asn
20 25 30
Gly Glu Ile Ile Gly Arg Gly His Asn Leu Arg Glu Thr Phe Ser Asp
35 40 45
Pro Thr Ala His Ala Glu Ile Val Ala Leu Lys Glu Ala Ala Ser Lys
50 55 60
Leu Lys Asn Trp Gln Leu Lys Asp Cys Thr Leu Tyr Val Thr Val Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Ile Tyr Gln Ala Arg Ile Lys Thr
85 90 95
Leu Val Tyr Gly Ala Pro Asp Leu Lys Ala Gly Ala Val Asp Thr Leu
100 105 110
Phe Asp Leu Val Arg Asn Pro Arg Leu Asn His Arg Val Glu Val Ile
115 120 125
Ser Gly Val Leu Ala Ala Glu Ala Ser Lys Ile Ile Thr Asp Phe Phe
130 135 140
Arg Glu Lys Arg Asn Arg Gly Lys Phe
145 150
<210> 519
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 519
Met Arg Asn Asn Tyr Ile Asn Leu Val Ile Glu Thr Ala Leu Asn Glu
1 5 10 15
Ala Glu Ile Ala Leu Leu Glu Gly Glu Val Pro Val Ser Cys Val Met
20 25 30
Lys Phe Gly Asn Ile Ile Ile Lys Thr His Asn Thr Thr Asn Lys Ser
35 40 45
Cys Asp Pro Leu Lys His Cys Glu Leu Asp Ala Ile Arg Glu Tyr Gln
50 55 60
Arg Phe His Met Ser Asn Thr Asn Asp Ile Ile Met Phe Ile Thr Leu
65 70 75 80
Glu Pro Cys Thr Met Cys Cys Arg Ile Ile Thr Asp Phe Lys Glu Arg
85 90 95
Phe Ile Lys Cys Asn Leu Lys Leu Phe Phe Gly Val Tyr Asn Asp Ile
100 105 110
Phe Gly Asn Leu Lys Ile Thr Gly Asn Thr Phe Gly Glu Cys Ile Tyr
115 120 125
Asp Glu Arg Cys Ile Glu Ile Ile Lys Arg Phe Tyr Glu Gln Gln Asn
130 135 140
Pro Asn Thr Val Asn Ile
145 150
<210> 520
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 520
Met Tyr Thr Asp Gln Phe Tyr Met Lys Ile Ala Leu Glu Glu Ala Arg
1 5 10 15
Lys Ala Ser Ala Ile Gly Glu Val Pro Ile Gly Ala Ile Val Val Lys
20 25 30
Asp Asn Glu Val Ile Ser Arg Ala His Asn Leu Arg Glu Ser Thr Gln
35 40 45
Asp Pro Thr Ala His Ala Glu His Ile Ala Ile Gln Lys Ala Ala Lys
50 55 60
Gln Leu Asn Ser Trp Arg Leu Ala Ser Cys Lys Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Val Met Cys Ser Gly Ala Ile Val Met Ser Arg Ile Pro
85 90 95
Glu Val Ile Tyr Gly Ala Gln Asp Leu Lys Gly Gly Cys Ala Gly Ser
100 105 110
Leu Met Asn Leu Leu Gln Glu Ser Arg Phe Asn His Arg Ala Lys Ile
115 120 125
Thr Thr Gly Val Leu Ala Glu Glu Cys Ser His Leu Leu Lys Thr Phe
130 135 140
Phe Lys Asp Ile Arg Gln Lys Lys Lys Ile Ile Arg Thr Glu Asp Asn
145 150 155 160
Thr Asn Ser Glu Thr Phe Gly Lys Ile
165
<210> 521
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 521
Met Thr Asp Glu Asp Tyr Met Glu Leu Ala Leu Ala Glu Ala Ile Lys
1 5 10 15
Ala Ala Gln Leu Gly Glu Val Pro Ile Gly Ala Leu Leu Val Tyr Gln
20 25 30
Asp Glu Val Val Ala Lys Ala Phe Asn Leu Arg Glu Ala Leu Gln Thr
35 40 45
Thr Ala Ser His Ala Glu Met Leu Val Ile Asp Lys Gly Asn Glu Val
50 55 60
Ile Asn Ser Trp Arg Leu Glu Asp Cys Thr Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ala Arg Ile Pro Arg
85 90 95
Val Val Phe Gly Ala Tyr Asp Pro Lys Ala Gly Cys Ala Gly Ser Ile
100 105 110
Leu Asn Leu Leu Asp Asp Lys Arg Phe Asn His Gln Val Glu Val Thr
115 120 125
Arg Gly Val Leu Ala Glu Ala Cys Gly His Leu Leu Lys Asp Phe Phe
130 135 140
Lys Gln Leu Arg Ser Arg Lys Gln Glu Ala Glu Val Val Ser Leu Ala
145 150 155 160
Asp Tyr Lys Glu Glu Asn Asn Asn Gly
165
<210> 522
<211> 127
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 522
Met Ala Pro Asp Leu Ser Gln His Phe Lys Phe Met Ala Val Ala Leu
1 5 10 15
Phe Val Gly Tyr Lys Ala Leu Leu Lys Asn Glu Thr Pro Val Ala Cys
20 25 30
Val Val Thr Arg Gly Cys Gln Ile Ile Ser Ile Gly Tyr Asn His Thr
35 40 45
Asn Ile Thr Leu Asn Gly Thr Lys His Ala Glu Phe Ile Ala Leu Gly
50 55 60
Arg Leu Lys Glu Pro Val Asp Tyr Lys Asn Leu Thr Leu Tyr Val Thr
65 70 75 80
Val Glu Pro Cys Ile Met Cys Ala Ser Tyr Leu Arg Gln Leu Gly Leu
85 90 95
Lys Asn Val Ile Tyr Gly Cys Gly Asn Asp Arg Phe Gly Gly Ala Gly
100 105 110
Thr Ile Leu Pro Leu His Asn Asp Pro Lys Leu Pro His Lys Pro
115 120 125
<210> 523
<211> 170
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 523
Met Val Ser Leu Ser Val Pro Leu Ser Ser His Ser Phe Pro Pro Thr
1 5 10 15
Leu Ala Pro Ser Arg Ala Lys Leu Asn Asp Leu Tyr Ala Gly Ala Gln
20 25 30
Gly Glu Glu Ala Leu Asp Val Arg Glu Ile Pro Val Gly Cys Val Leu
35 40 45
Val His Glu Gly Lys Ile Ile Ala Arg Gly Arg Asn Arg Thr Asn Glu
50 55 60
Gly Arg Asn Ala Thr Leu His Ala Glu Phe Asp Ala Leu Arg His Leu
65 70 75 80
Leu Pro Asp Arg Ser Pro Ser Gln Thr Pro Gly Leu Val Arg Pro Tyr
85 90 95
Thr Pro Gln Thr Asp Asp Val Leu Ala Ala Ala Gly Tyr Asp Ser Ala
100 105 110
Ala Gly Arg Lys Val Trp Gln Thr Pro Leu Lys Gly Val Val Leu Tyr
115 120 125
Val Thr Val Glu Pro Cys Leu Met Cys Ala Ser Ala Met Arg Gln Val
130 135 140
Gly Ile Glu Lys Val Val Tyr Gly Cys Ala Asn Asp Arg Phe Gly Gly
145 150 155 160
Asn Gly Gly Val Gln Ser Ile His Ala Glu
165 170
<210> 524
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 524
Met Thr Lys Asp Leu Met Asp Ser Thr Glu Leu Asn Thr Met Asp Glu
1 5 10 15
Arg Ser Arg Asp Glu Tyr Phe Met Ser Leu Ala Ile Glu Glu Gly Lys
20 25 30
Lys Ala Tyr Ala Leu Gly Glu Ile Pro Ile Gly Ala Ile Leu Val His
35 40 45
Asn Asn Gln Val Ile Ser Arg His His Asn Arg Arg Glu Leu Asp His
50 55 60
Asp Ala Thr Ala His Ala Glu Val Leu Val Ile Arg Glu Ala Cys Asn
65 70 75 80
Ser Leu Lys Arg Trp Arg Leu Thr Gly Cys Thr Leu Tyr Val Thr Ile
85 90 95
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile Asn Ser Arg Ile Asp
100 105 110
Arg Val Val Tyr Gly Ala Ser Asp Tyr Lys Gly Gly Ala Val Glu Ser
115 120 125
Leu Phe Asn Val Leu Ser His Pro Gly Leu Asn His Glu Pro Gln Leu
130 135 140
Gln Ala Gly Ile Leu Ala Asp Glu Cys Ser Gln Leu Met Lys Asp Phe
145 150 155 160
Phe Lys Glu Arg Arg Lys Ala Arg Arg Ser Thr Gln Glu Ala Glu Gly
165 170 175
Ser Ala Leu Glu Met Arg
180
<210> 525
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 525
Met Phe Asn Lys Phe Met Ala Glu Ala Ile Glu Glu Ala Lys Lys Ala
1 5 10 15
Leu Ala Glu Asp Glu Val Pro Val Gly Ala Val Ile Thr His Arg Gly
20 25 30
Lys Ile Ile Ala Ala Ala His Asn Leu Arg Glu Thr Leu Asn Arg Ala
35 40 45
Thr Ala His Ala Glu Ile Leu Ala Ile Glu Lys Ala Cys Ser Ile Leu
50 55 60
Asn Ser Trp Tyr Leu Thr Asp Cys Asp Leu Tyr Val Thr Leu Glu Pro
65 70 75 80
Cys Ile Met Cys Ala Gly Ala Ile Val Asn Ala Arg Ile Arg Ser Leu
85 90 95
Tyr Phe Gly Ala Phe Asp Pro Lys Ala Gly Ala Cys Gly Ser Val Ile
100 105 110
Asp Val Phe Arg Leu Lys Glu Leu Asn His Arg Val Thr Val Tyr Ala
115 120 125
Gly Ile Met Glu Asp Glu Cys Ala Ser Leu Leu Thr Lys Phe Phe Arg
130 135 140
Ser Lys Arg
145
<210> 526
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 526
Met Thr Val Asn Thr Gly Ser Met His Glu Thr Trp Met Arg Leu Ala
1 5 10 15
Leu Glu Gln Ala Glu Arg Ala Gly Arg Glu Gly Glu Val Pro Ile Gly
20 25 30
Ala Val Ile Val Lys Asp Gly Ala Ala Leu Ala Val Gly Arg Asn Arg
35 40 45
Arg Glu Thr Asp His Asn Ala Leu Ala His Ala Glu Ala Glu Ala Ile
50 55 60
Arg Ala Ala Cys Ala Ala Leu Gly Ser Trp Arg Leu Ser Gly Cys Thr
65 70 75 80
Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Ile
85 90 95
Asn Ala Arg Val Asp Thr Val Val Phe Gly Ala Tyr Asp Pro Lys Ala
100 105 110
Gly Ala Ser Gly Ser Val Ile Asp Leu Phe Ser Cys Pro Phe Asn His
115 120 125
His Pro Ala Val Met Gly Gly Val Leu Glu Glu Asp Cys Arg Arg Leu
130 135 140
Leu Gln Asp Phe Phe Ala Gly Leu Arg Arg Pro Lys Asn Asp Gly Cys
145 150 155 160
<210> 527
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 527
Met Asn His Glu Ile Phe Met Gln Met Ala Ile Asp Glu Ala Lys Lys
1 5 10 15
Ala Tyr Lys Ile Asn Glu Val Pro Ile Gly Ala Val Val Ile Lys His
20 25 30
Gly Glu Val Ile Gly Arg Gly His Asn Leu Arg Glu Ser Ser Gln Asn
35 40 45
Pro Leu Met His Ala Glu Val Val Ala Ile Asn Glu Ala Ser Lys Asn
50 55 60
Ile Gly Ser Trp Arg Leu Glu Glu Cys Val Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Val Met Cys Ser Gly Ala Ile Val Met Ser Arg Ile Pro Thr
85 90 95
Val Val Tyr Gly Ala His Asp Ala Lys Gly Gly Cys Ser Gly Ser Leu
100 105 110
Met Asn Leu Leu His Glu Ser Arg Phe Asn His Gln Ala Thr Val Ile
115 120 125
Ala Gly Ile Lys His Glu Glu Cys Ser Met Leu Leu Lys Asp Phe Phe
130 135 140
Lys Ser Leu Arg Asn Asn Lys Leu Leu Glu Lys Asn Lys Lys Leu Glu
145 150 155 160
Glu
<210> 528
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 528
Met Pro Thr Leu Glu Tyr Gln Lys Asp Asp Phe Phe Phe Met Arg Gln
1 5 10 15
Ala Ile Gln Glu Ala Lys Arg Ala Met Glu Ile Asp Glu Val Pro Ile
20 25 30
Gly Ala Val Ile Val Lys Ala Asp Glu Val Ile Ala Arg Ala His Asn
35 40 45
Leu Arg Glu Thr Leu Gln Asp Ala Thr Ala His Ala Glu Leu Leu Ala
50 55 60
Ile Arg Lys Ala Cys Glu Val Leu Gly Thr Trp Arg Leu Glu Gly Cys
65 70 75 80
Thr Leu Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val
85 90 95
Ile Leu Ser Arg Val Asp Arg Leu Val Phe Gly Ala Lys Asp Pro Lys
100 105 110
Gly Gly Ala Cys Gly Ser Leu Met Asn Leu Pro Ala Asp Glu Arg Phe
115 120 125
Asn His Arg Pro Lys Ile Ala Ala Gly Ile Met Ala Asp Glu Cys Gly
130 135 140
Asn Ile Leu Lys Lys Phe Phe Gln Asp Lys Arg Met Asn Lys Lys Ala
145 150 155 160
<210> 529
<211> 201
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 529
Met Asp Glu Pro Ile Thr Glu His Glu Ile Thr Pro Ala Val Ser Glu
1 5 10 15
Asn Ser Lys His Ala Ser Trp Met Lys Gln Ala Leu Met Met Gly Glu
20 25 30
Gln Ala Leu Glu His Gly Glu Thr Pro Val Gly Cys Val Leu Val Tyr
35 40 45
Asp Asn Lys Ile Val Gly Arg Gly Met Asn Asp Thr Asn Arg Ser Met
50 55 60
Asn Gly Thr Arg His Ala Glu Phe Leu Ala Ile Ala Glu Met Leu Gln
65 70 75 80
Ser Tyr Pro Lys Ser Ala Leu Gln Ser Thr Asp Leu Tyr Val Thr Val
85 90 95
Glu Pro Cys Ile Met Cys Ala Ser Ala Leu Arg Gln Tyr Gly Ile Arg
100 105 110
Ser Val Tyr Phe Gly Cys Ala Asn Asp Arg Phe Gly Gly Thr Gly Gly
115 120 125
Val Leu Asn Ile His Ser Asp Arg Ser Ile Asp Pro Pro Tyr Pro Val
130 135 140
Tyr Gly Gly Leu Phe Gln Lys Glu Ala Ile Met Leu Leu Arg Arg Phe
145 150 155 160
Tyr Ile Gln Glu Asn Asp Lys Ala Pro Lys Pro Arg Pro Lys Arg Asn
165 170 175
Arg Glu Leu Asn Thr Ala Phe Asp Arg Val Pro Glu Ile Gly Gly Ala
180 185 190
Asn Gly Gly Asn Ile Glu Gln Ser Ser
195 200
<210> 530
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 530
Met Trp Arg Gly Thr Cys Gly Arg Asp Lys Lys Leu Thr Val Asn Lys
1 5 10 15
Lys Phe Met Glu Gln Phe Met Ser Glu Ala Phe Ile Glu Ala Lys Ser
20 25 30
Val Leu Glu Ala Gly Glu Val Pro Val Gly Cys Ile Phe Leu Tyr His
35 40 45
Gly Asp Gly Lys Asn Glu Val Ile Ala Arg Ala Gly Asn Asn Val Asn
50 55 60
Ala Thr Lys Asn Ala Thr Arg His Ala Glu Phe Leu Cys Ile Asp Gln
65 70 75 80
Thr Leu Glu Phe Cys Thr Arg Asn Ser Leu Ser Ile Lys Asp Val Phe
85 90 95
Ser Lys Ile Ser Val Val Val Thr Val Glu Pro Cys Ile Met Cys Ser
100 105 110
Ala Ala Leu His Asp Leu Gly Val Lys Glu Ile Leu Tyr Gly Cys Ala
115 120 125
Asn Asp Arg Phe Gly Gly Lys Thr Leu Val Asp Val Pro Phe Val Thr
130 135 140
Asn Arg Arg Asp Gly Gln Thr Gln Val Asn Gly Gly Val Cys Ala Asp
145 150 155 160
Glu Ala Met Ala Leu Leu Lys Asp Phe Tyr Lys Gly Asp Asn Pro Ser
165 170 175
Ala Pro Ile Thr Lys Thr Lys Arg
180
<210> 531
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 531
Met Glu Asn Asn Asp Glu Lys Phe Met Met Lys Ala Ile Glu Gln Ala
1 5 10 15
Lys Ile Ala Tyr Asp Met Asp Glu Val Pro Val Gly Cys Val Ile Val
20 25 30
Lys Asp Gly Glu Ile Ile Ala Gln Ala Tyr Asn Ser Val Glu Lys Asp
35 40 45
Lys Asn Ala Thr Met His Ala Glu Leu Lys Ala Ile Asn Gln Ala Thr
50 55 60
Glu Phe Ile Gly Asn Phe Arg Leu Asp Asp Cys Ile Met Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Val Met Cys Thr Gly Ala Leu Val Tyr Ser Arg Ile
85 90 95
Pro Lys Val Val Phe Gly Ala Phe Asp Lys Lys Arg Gly Ala Cys Gly
100 105 110
Ser Leu Ile Ser Leu Asn Asp Tyr Glu Gly Leu Asn His Lys Ile Glu
115 120 125
Val Lys Ser Ile Met Glu Lys Glu Cys Val Glu Leu Met Gln Ser Phe
130 135 140
Phe Arg Arg Ile Arg Glu Lys Asn Arg Asn Lys
145 150 155
<210> 532
<211> 97
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 532
Met Met Asp Leu Thr Asn Glu Phe Gly Phe Met Ala Ile Ala Thr Phe
1 5 10 15
Val Ala Phe Arg Ala Leu Lys Asn Gly Glu Thr Pro Val Ala Cys Ile
20 25 30
Phe Val His Glu Pro Thr His Thr Ile Leu Ser Phe Gly Cys Asn Asp
35 40 45
Thr Asn Gly Ser Leu Asn Gly Thr Met His Ala Glu Phe Val Ala Ile
50 55 60
Glu Lys Ile Leu Gln Gly Phe Asn Leu Tyr Lys Lys Gly Arg Glu Glu
65 70 75 80
Ile Ile Glu Phe Phe Met Asp Val Thr Leu Tyr Val Thr Val Glu Pro
85 90 95
Cys
<210> 533
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 533
Met Ser Asp Asp Ile Ala Phe Met Gln Gln Ala Leu Glu Leu Ala Arg
1 5 10 15
Glu Ala Ala Ser Leu Gly Glu Val Pro Val Gly Ala Val Ala Val Leu
20 25 30
Asp Gly Asn Val Val Gly Thr Gly Tyr Asn Arg Arg Glu Cys Asp Arg
35 40 45
Asn Pro Phe Ala His Ala Glu Met Leu Ala Leu Ala Ala Ala Ala Lys
50 55 60
Ala Arg Asp Ala Trp Arg Leu Ser Gly Val Thr Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val Gln Ser Arg Val Thr
85 90 95
Arg Leu Val Phe Gly Thr Met Asp Pro Lys Ala Gly Ala Val Gly Ser
100 105 110
Leu Tyr Asn Leu Val Glu Glu Pro Arg His Asn His Arg Leu Gln Val
115 120 125
Thr Ser Gly Ile Leu Ala Glu Asp Ser Arg Gln Leu Leu Lys Thr Phe
130 135 140
Phe Glu Arg Leu Arg Ala Lys Arg Arg Glu Asn
145 150 155
<210> 534
<211> 161
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 534
Met Val Asp Gln Met Thr Asp Glu Tyr Tyr Met Gly Leu Ala Leu Ala
1 5 10 15
Glu Ala Gln Ala Ala Phe Gln Ile Gly Glu Val Pro Ile Gly Ala Val
20 25 30
Ile Val Met Asp Gly Gln Val Val Ala Ala Gly His Asn Leu Arg Glu
35 40 45
Thr Trp His Asp Ala Thr Ala His Ala Glu Ile Ile Ala Ile Arg Gln
50 55 60
Ala Cys Glu Arg Leu Ser Arg Trp Arg Leu Thr Gly Ala Thr Leu Tyr
65 70 75 80
Val Thr Ile Glu Pro Cys Pro Met Cys Ala Gly Ala Leu Ile Met Ser
85 90 95
Arg Ile Asp Arg Leu Val Tyr Gly Ser Ser Asp Tyr Lys Ala Gly Ala
100 105 110
Val Glu Ser Ile Phe Asn Ile Val Gln Asn Glu Ala Leu Asn His Gln
115 120 125
Leu Ala Val Thr Ala Gly Val Arg Ala Glu Glu Cys Ala Arg Ile Met
130 135 140
Arg Asp Phe Phe Arg Met Arg Arg Ser Gly Glu Met Arg Ser Ile Ser
145 150 155 160
Glu
<210> 535
<211> 159
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 535
Met Thr Lys Asp Glu Phe Tyr Met Gly Lys Ala Leu Glu Glu Ala Lys
1 5 10 15
Lys Ala Ala Ala Val Gly Glu Ile Pro Ile Gly Ala Val Ile Val His
20 25 30
Lys Lys Lys Ala Val Ala Arg Ala His Asn Leu Arg Glu Thr Leu Pro
35 40 45
Cys Ala Thr Ala His Ala Glu Leu Leu Ala Ile Ala Glu Ala Cys Arg
50 55 60
Val Leu Gly Arg Trp Arg Leu Thr Gly Cys Thr Leu Tyr Val Thr Val
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Val Asn Ser Arg Leu Asp
85 90 95
Arg Val Val Tyr Gly Cys Ala Asp Thr Lys Gly Gly Gly Thr Arg Ser
100 105 110
Leu Tyr Lys Ile Val Asp Asp Glu Arg Leu Asn His Arg Ala Ile Val
115 120 125
Thr Ala Gly Ile Arg Glu Thr Glu Cys Ala Ala Leu Leu Lys Asp Phe
130 135 140
Phe Arg Lys Arg Arg Ala Glu Glu Lys Arg Lys Thr Val Ser Asp
145 150 155
<210> 536
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 536
Met Glu Arg His Glu His Tyr Met Arg Leu Ala Met Gln Glu Ala Lys
1 5 10 15
Lys Ala Glu Ala Ile Gly Glu Val Pro Ile Gly Cys Val Ile Val Lys
20 25 30
Gly Asp Glu Val Ile Ala Ser Gly Tyr Asn His Arg Glu Thr Asn Arg
35 40 45
Gln Ala Thr Ala His Ala Glu Leu Leu Ala Ile Glu Ala Ala Cys Glu
50 55 60
Lys Leu Ala Asn Trp Arg Leu Glu Gly Cys Glu Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Met Leu Ser Arg Ile Glu
85 90 95
His Val Ile Phe Gly Ala Val Asp Pro Lys Gly Gly Cys Cys Gly Thr
100 105 110
Leu Met Asn Leu Val Gln Asp Asp Arg Phe Asn His Val Ser Gln Leu
115 120 125
Thr Gly Gly Ile Leu Glu Gln Glu Cys Gly Glu Met Leu Thr Ser Phe
130 135 140
Phe Arg Glu Leu Arg Ala Lys Lys Lys Gln Gln Lys Arg Ala Met Gly
145 150 155 160
Cys Asn Ala Thr Asn Glu Thr Val
165
<210> 537
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 537
Met His Thr Cys Ile Ile Leu Pro Asn Lys Pro Thr Ile Ile Lys Ser
1 5 10 15
Ala Val Glu Lys Asp Asp Val Trp Trp Met Gly Ser Ala Ile Arg Glu
20 25 30
Ala Glu Lys Ala Ala Glu Arg Gly Glu Val Pro Ile Gly Ala Val Ile
35 40 45
Val Arg Asp Gly Lys Ile Ile Ser Arg Gly Tyr Asn Leu Arg Glu Gly
50 55 60
Lys Gln Asp Pro Ala Ala His Ala Glu Leu Ile Ala Ile Arg Lys Ala
65 70 75 80
Ala Lys Lys Leu Gly Asn Trp Arg Leu Ala Gly Thr Thr Leu Tyr Val
85 90 95
Thr Leu Glu Pro Cys Ile Met Cys Met Gly Ala Ile Leu Leu Ala Arg
100 105 110
Val Glu Lys Val Val Phe Gly Cys Tyr Asp Pro Lys Gly Gly Ala Ala
115 120 125
Gly Ser Leu Tyr Asp Leu Ser Asp Asp Lys Arg Leu Asn His Arg Val
130 135 140
Thr Leu Val Ala Gly Ile Arg Gln Ala Glu Cys Ala Ala Leu Leu Ser
145 150 155 160
Gly Phe Phe Ala Ala Leu Arg Ala Glu Lys Lys Arg Ala Lys Leu Gln
165 170 175
<210> 538
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 538
Met Glu Asp Ser Thr Gly Lys His Glu Tyr Phe Met Arg Gln Ala Leu
1 5 10 15
Ala Glu Ala Arg Lys Ala Ala Glu Lys Asp Glu Val Pro Ile Gly Ala
20 25 30
Val Ile Val Tyr Glu Asn His Ile Ile Ala Arg Ala His Asn Gln Arg
35 40 45
Glu Met Leu Asn Asp Pro Thr Ala His Ala Glu Met Ile Ala Ile Thr
50 55 60
Gln Ala Ala Ala His Leu Gln Asn Trp Arg Leu Thr Gly Thr Thr Ile
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Leu Val Gln
85 90 95
Ser Arg Ile Asp Thr Leu Val Tyr Gly Thr Pro Asp Lys Lys Ala Gly
100 105 110
Ala Cys Ala Ser Val Ile Asn Leu Val Gln Glu Pro Arg Phe Asn His
115 120 125
Arg Leu Asn Val Leu Ser Asn Val Leu Ala Asp Glu Cys Lys His Ile
130 135 140
Leu Gln Lys Phe Phe Leu Glu Asn Cys Arg Thr Lys
145 150 155
<210> 539
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 539
Met Phe Ser Ser Glu Glu Lys Lys His Tyr Met Glu Leu Ala Phe Ala
1 5 10 15
Glu Ala Glu Lys Ala Glu Ala Gln Asp Glu Val Pro Ile Gly Ala Ile
20 25 30
Val Val Ala Pro Asp Gly Gln Val Ile Gly Arg Gly Tyr Asn Arg Arg
35 40 45
Glu Leu Asp Asn Ile Ala Thr His His Ala Glu Ile Leu Ala Ile Asn
50 55 60
Glu Ala Cys Lys Asn Leu Asn Ser Trp Arg Leu Ile Asp Cys Ser Leu
65 70 75 80
Phe Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly Ala Ile Ile Asn
85 90 95
Ala Arg Leu Lys Glu Val Phe Tyr Gly Ala Pro Asp His Lys Ala Gly
100 105 110
Ala Ser Gly Ser Val Val Asp Leu Phe Ala Val Glu Lys Phe Asn His
115 120 125
His Pro Gln Val Ile Arg Gly Leu Tyr Ser Glu Lys Ala Ser Asn Met
130 135 140
Leu Thr Asn Phe Phe Arg Ala Ile Arg Ala Lys Gln Lys Glu Lys Lys
145 150 155 160
Leu Lys Ala Lys Thr Lys Glu Asn Asp Ala Ser Pro Ser Gln Ile Asp
165 170 175
<210> 540
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 540
Met Ser Lys Gly Asp Ser Asp Gln Lys Tyr Met Gln Gln Ala Ile Gln
1 5 10 15
Leu Ala Leu Gln Ala Gln Ala Gln Gly Glu Val Pro Ile Gly Ala Leu
20 25 30
Leu Val Lys Asp Asp Lys Ile Val Ala Gln Ala Tyr Asn Leu Arg Glu
35 40 45
Asn Asn Gln Asp Ala Thr Ala His Ala Glu Leu Met Val Ile Gln Ala
50 55 60
Ala Cys Lys Gln Leu Asn Ser Trp Arg Leu Thr Gly Cys Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Leu Val Leu Ser
85 90 95
Arg Val Glu Arg Val Val Tyr Gly Ala Leu Asp Pro Lys Ala Gly Ala
100 105 110
Val His Ser Leu Phe Asn Ile Leu Thr His Pro Leu Leu Asn His Gln
115 120 125
Ile Glu Val Gln Gly Gly Val Cys Glu Ala Glu Cys Arg Gln Leu Leu
130 135 140
Lys Asn Phe Phe Gln Gln Arg Arg Gln Glu Asn Lys Leu Lys Lys Gln
145 150 155 160
Met Arg Gln Asn Val Ser Leu Glu Arg Glu Val Glu
165 170
<210> 541
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 541
Met Asp Asp Phe Ala Tyr Met Arg Gln Ala Met Glu Leu Ala Glu Gln
1 5 10 15
Ala Ala Ala Leu Gly Glu Ile Pro Val Gly Ala Leu Val Val Gln Asp
20 25 30
Ala Thr Gly Glu Val Leu Gly Arg Gly Tyr Asn Arg Arg Glu Val Asp
35 40 45
His Asp Pro Thr Ala His Ala Glu Val Leu Ala Ile Arg Gln Ala Ala
50 55 60
Leu Ala Ile Gly Ser Trp Arg Leu Ser Gly Cys Thr Leu Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Pro Met Cys Cys Gly Thr Ile Ile Asn Ala Arg Val
85 90 95
Arg Arg Val Val Phe Gly Ala Tyr Asp Ser Lys Ala Gly Ser Ala Asp
100 105 110
Ser Val Ile Asn Leu Phe Ala Leu Pro Tyr Asn His Lys Pro Ala Val
115 120 125
Thr Gly Gly Leu Leu Glu Asp Ala Cys Lys Glu Gln Leu Gln Arg Phe
130 135 140
Phe Ser Gly Leu Arg Glu Lys
145 150
<210> 542
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 542
Met Glu Asp Gln Asp His Tyr Phe Met Glu Gln Ala Leu Ala Glu Ala
1 5 10 15
Lys Lys Ala Glu Glu Ile Gly Glu Val Pro Ile Gly Ala Val Val Val
20 25 30
Lys Asp Gly Arg Val Ile Ala Thr Ala His Asn Leu Arg Glu Ser Lys
35 40 45
Gln Gln Ala Thr Ala His Ala Glu Val Leu Ala Ile Glu Gln Ala Ser
50 55 60
Leu Glu Thr Gly Phe Trp Arg Leu Asp Asp Cys Ala Leu Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Gln Ser Arg Ile
85 90 95
Ser Lys Leu Val Tyr Gly Ala Lys Asp Pro Lys Ala Gly Cys Val His
100 105 110
Ser Leu Tyr Ser Leu Leu Glu Asp Pro Arg Phe Asn His Gln Val Glu
115 120 125
Val Ile Ala Gly Val Asn Glu Glu Glu Cys Gly Glu Arg Leu Thr Gln
130 135 140
Phe Phe Arg Gln Leu Arg Ala Asn Lys Arg Glu Lys Lys Ser Glu Ser
145 150 155 160
<210> 543
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 543
Met Val Gly Lys Lys Met Asn Ile Thr Tyr Asn Asp Asp Asp Tyr Met
1 5 10 15
Lys Glu Ala Ile Glu Glu Ala Lys Lys Ala Gly Glu Leu Gly Glu Val
20 25 30
Pro Ile Gly Ala Val Val Val Leu Asp Gly Lys Ile Ile Ser Arg Ala
35 40 45
His Asn Leu Arg Glu Ser Asn Gln Asn Ala Val Ala His Ala Glu Leu
50 55 60
Leu Ala Ile Glu Glu Ala Cys Gly Met Leu Gly Thr Trp Arg Leu Glu
65 70 75 80
Asp Ala Ala Leu Tyr Val Thr Leu Glu Pro Cys Ala Met Cys Ser Gly
85 90 95
Ala Ile Ile Leu Ser Arg Ile Lys Arg Val Val Tyr Gly Ala Ala Asp
100 105 110
Pro Lys Gly Gly Cys Ala Gly Thr Phe Met Asn Leu Leu Gln Asp Glu
115 120 125
Arg Phe Asn His Gln Ser Glu Val Ser Ala Gly Val Leu Glu Glu Glu
130 135 140
Cys Gly Ser Leu Leu Thr Asp Phe Phe Arg Ala Leu Arg Glu Arg Lys
145 150 155 160
Lys Glu Glu Lys Arg Arg Arg Lys Gln Leu Leu Asp Leu Gln Glu Gly
165 170 175
Ile Asp Arg Pro
180
<210> 544
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 544
Met Val Gly Cys Val Phe Val Tyr Gln Gly Lys Ile Ile Gly Arg Gly
1 5 10 15
Met Asn Ala Thr Asn Arg Thr Leu Asn Gly Thr Arg His Ala Glu Phe
20 25 30
Met Ala Ile Ser His Ile Leu Ser Pro Pro Ala Tyr Ser Glu Asp Lys
35 40 45
Ala Tyr Pro Pro Thr Val Phe His Asp Thr Asp Leu Tyr Val Thr Val
50 55 60
Glu Pro Cys Ile Met Cys Ala Ser Leu Leu Arg Gln Phe Gly Ile Arg
65 70 75 80
Lys Val Tyr Phe Gly Ala Ser Asn Asp Lys Phe Gly Gly Thr Gly Gly
85 90 95
Val Leu Asn Ile His Ala Asp Glu Asp Ile Gly Asn
100 105
<210> 545
<211> 185
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 545
Met Val Glu Ala Gly Val Thr Ala Ala Ser Ala Ala Thr Ala Ala Thr
1 5 10 15
Ala Ala Ser Ala Thr Ser Ala Ala Ala Phe Leu Pro Trp Thr Glu Glu
20 25 30
Asp Ala Arg Tyr Ile Arg Leu Ala Leu Glu Glu Ala Gln Ala Ala Tyr
35 40 45
Asp Ile Gly Glu Val Pro Val Gly Ala Leu Val Val Ser Ala Lys Gly
50 55 60
Glu Ile Leu Gly Arg Gly Tyr Asn Arg Thr Ile Ile Asp His Asp Pro
65 70 75 80
Thr Ala His Ala Glu Ile Val Ala Leu Arg Asn Ala Ala Arg Gln Leu
85 90 95
Glu Asn Tyr Arg Leu Pro Gly Ile Thr Val Tyr Val Thr Leu Glu Pro
100 105 110
Cys Val Met Cys Ile Gly Ala Met Leu His Ala Arg Leu Ala Arg Val
115 120 125
Val Phe Gly Ala Tyr Asp Pro Lys Thr Gly Ala Cys Gly Ser Val Leu
130 135 140
Asp Val Gly Ala Val Pro Lys Leu Asn His His Thr Ser Val Thr Gly
145 150 155 160
Gly Val Leu Ala Glu Pro Cys Gly Asp Leu Leu Arg Arg Phe Phe Arg
165 170 175
Glu Arg Arg Ala Lys Glu Ser Ile Ala
180 185
<210> 546
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 546
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 547
<211> 1072
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 547
Met Ser Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser
1 5 10 15
Ile Gly Trp Gly Val Ile Glu Leu Phe Trp Asn Lys Asp Arg Glu Arg
20 25 30
Tyr Glu Lys Val Arg Ile Val Asp Lys Gly Val Arg Met Phe Asp Lys
35 40 45
Ala Glu Ile Pro Asn Lys Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile
50 55 60
Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys
65 70 75 80
Glu Ile Arg Asn Leu Leu Val Gln His Gly Met Ile Thr Gln Glu Glu
85 90 95
Leu Asp Leu Leu Tyr Pro Leu Ser Lys Lys Ser Ile Asp Ile Trp Asp
100 105 110
Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Leu Glu Trp Ala
115 120 125
Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg
130 135 140
Lys Ser Glu Leu Lys Asp Ala Glu Thr Gly Lys Val Leu Ser Ser Ile
145 150 155 160
Gln Val Asn Glu Lys Arg Leu Phe Leu Tyr Arg Thr Val Gly Glu Met
165 170 175
Trp Ile Lys Asp Ala Glu Phe Ser Lys Tyr Asp Arg Arg Arg Asn Ser
180 185 190
Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Asp Leu Glu Lys Glu
195 200 205
Ile Val Thr Leu Phe Glu Ala Gln Arg Lys Phe Gln Ser Ser Tyr Ala
210 215 220
Ser Lys Asn Leu Gln Glu Thr Tyr Leu Gln Ile Trp Ala His Gln Leu
225 230 235 240
Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser
245 250 255
Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe
260 265 270
Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro
275 280 285
Asp Phe Gln Pro Phe Thr Gln Glu Gln Lys Glu Ile Ile Leu Asp Lys
290 295 300
Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val
305 310 315 320
Ser Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln
325 330 335
Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu
340 345 350
Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Lys Lys Val
355 360 365
Val Ala Asn Tyr Ala Glu Arg Thr Asn Glu Ala Phe Ser Thr Leu Asp
370 375 380
Tyr Asp Ala Ile Ala Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp
385 390 395 400
Ile Arg Ser Tyr Leu Lys Lys Ser Asn Asn Leu Ser Lys Arg Cys Tyr
405 410 415
Asp Asp Gln Leu Ile Glu Glu Leu Phe Thr Leu Ser Tyr Thr Lys Phe
420 425 430
Gly His Leu Ser Phe Lys Ala Ile Asn His Val Leu Pro Ile Met Gln
435 440 445
Glu Gly Arg Thr Tyr Gln Glu Ala Ile His Gln Leu Gly Tyr Asp Thr
450 455 460
Thr Asn Leu Lys Lys Glu Asn Arg Ser Met Phe Leu Pro Leu Ile Pro
465 470 475 480
Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Ile Thr Gln Ala Arg
485 490 495
Lys Val Val Asn Ala Ile Ile Arg Arg Tyr Gly Ser Pro Asn Ser Val
500 505 510
His Ile Ala Leu Ala Arg Glu Leu Ser Lys Ser His Asp Glu Arg Lys
515 520 525
Lys Ile Met Thr Ala His Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala
530 535 540
Ile Ser Ile Leu Ile Glu Asn Gly Ile Leu Asn Pro Thr Gly Tyr Asp
545 550 555 560
Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr
565 570 575
Ser Leu Lys Glu Ile Pro Pro Asp Thr Phe Phe Asn Glu Leu Lys Lys
580 585 590
Glu Arg Asn Gly Ser Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr
595 600 605
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser
610 615 620
Asp Glu Asn Arg Asn Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu
625 630 635 640
Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn
645 650 655
Lys Leu Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Lys Thr Tyr
660 665 670
Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr
675 680 685
Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln
690 695 700
Phe Lys Glu Val Glu Val Asn Leu Arg Lys Lys Arg Val Gln Thr Val
705 710 715 720
Asn Gly Val Ile Thr Ala His Leu Arg Lys Arg Trp Gly Leu Glu Lys
725 730 735
Asn Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val
740 745 750
Ala Cys Thr Asp His His Met Val Thr Arg Ile Thr Glu Tyr Tyr Gln
755 760 765
Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro
770 775 780
Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro
785 790 795 800
Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Ser
805 810 815
Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala
820 825 830
Ala His Asp Gln Thr Ile Arg Arg Lys Gly Gly Ile Asp Lys Lys Gly
835 840 845
Lys Thr Ile Ile Ile Lys Arg Val Arg Leu Lys Asp Ile Lys Phe Asp
850 855 860
Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Leu Ala Thr
865 870 875 880
Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Arg Lys Asn Ser Lys
885 890 895
Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly
900 905 910
Asn Leu Ile Lys Arg Val Lys Ile Glu Gly Gln Thr Lys Ala Phe Val
915 920 925
Arg Glu Val Asn Gly Gly Val Ala Gln Asn Ser Asp Leu Val Arg Val
930 935 940
Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val
945 950 955 960
Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Lys Ser Gly
965 970 975
Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys
980 985 990
Ser Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asn Glu
995 1000 1005
Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg
1010 1015 1020
Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Gln Asn Glu Tyr
1025 1030 1035
Arg Tyr Ser Leu Lys Thr Ile Glu Asn Leu Glu Lys Tyr Glu Val
1040 1045 1050
Gly Val Leu Gly Asp Leu Arg Leu Val Lys Gln Glu Thr Arg Arg
1055 1060 1065
Ile Phe Asn Arg
1070
<210> 548
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 548
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 549
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 549
aggagcgaag gcatgaaacc atatcgtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 550
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 550
acgcacaaac gtcgtatctc cgcacgtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 551
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 551
tatctccgca ctcggcccag gcggtgtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 552
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 552
cagctgtctc agtttatgga ccagagtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttatt 135
<210> 553
<211> 1071
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 553
Met Arg Glu Leu Asp Tyr Arg Ile Gly Leu Ala Ile Gly Thr Asn Ser
1 5 10 15
Ile Gly Trp Gly Val Ile Glu Leu Ser Trp Asn Lys Asp Arg Glu Arg
20 25 30
Tyr Glu Lys Val Arg Ile Val Asp Gln Gly Val Arg Met Phe Asp Arg
35 40 45
Ala Glu Met Pro Lys Thr Gly Ala Ser Leu Ala Glu Pro Arg Arg Ile
50 55 60
Ala Arg Ser Ser Arg Arg Arg Leu Asn Arg Lys Ser Gln Arg Lys Lys
65 70 75 80
Asn Ile Arg Asn Leu Leu Val Gln His Gly Val Ile Thr Gln Glu Glu
85 90 95
Leu Asp Ser Leu Tyr Pro Leu Ser Lys Lys Ser Met Asp Ile Trp Gly
100 105 110
Ile Arg Leu Asp Gly Leu Asp Arg Leu Leu Asn His Phe Glu Trp Ala
115 120 125
Arg Leu Leu Ile His Leu Ala Gln Arg Arg Gly Phe Lys Ser Asn Arg
130 135 140
Lys Ser Glu Leu Lys Asp Thr Glu Thr Gly Lys Val Leu Ser Ser Ile
145 150 155 160
Gln Leu Asn Glu Lys Arg Leu Ser Leu Tyr Arg Thr Val Gly Glu Met
165 170 175
Trp Met Lys Asp Pro Asp Phe Ser Lys Tyr Asp Arg Lys Arg Asn Ser
180 185 190
Pro Asn Glu Tyr Val Phe Ser Val Ser Arg Ala Glu Leu Glu Lys Glu
195 200 205
Ile Val Thr Leu Phe Ala Ala Gln Arg Arg Phe Gln Ser Pro Tyr Ala
210 215 220
Ser Lys Asp Leu Gln Glu Thr Tyr Leu Gln Ile Trp Thr His Gln Leu
225 230 235 240
Pro Phe Ala Ser Gly Asn Ala Ile Leu Asn Lys Val Gly Tyr Cys Ser
245 250 255
Leu Leu Lys Gly Lys Glu Arg Arg Ile Pro Lys Ala Thr Tyr Thr Phe
260 265 270
Gln Tyr Phe Ser Ala Leu Asp Gln Val Asn Arg Thr Arg Leu Gly Pro
275 280 285
Asp Phe Gln Pro Phe Thr Lys Glu Gln Arg Glu Ile Ile Leu Asn Asn
290 295 300
Met Phe Gln Arg Thr Asp Tyr Tyr Lys Lys Lys Thr Ile Pro Glu Val
305 310 315 320
Thr Tyr Tyr Asp Ile Arg Lys Trp Leu Glu Leu Asp Glu Thr Ile Gln
325 330 335
Phe Lys Gly Leu Asn Tyr Asp Pro Asn Glu Glu Leu Lys Lys Ile Glu
340 345 350
Lys Lys Pro Phe Ile Asn Leu Lys Ala Phe Tyr Glu Ile Asn Lys Val
355 360 365
Val Ala Asn Tyr Ser Glu Arg Thr Asn Glu Thr Phe Ser Thr Leu Asp
370 375 380
Tyr Asp Gly Ile Gly Tyr Ala Leu Thr Val Tyr Lys Thr Asp Lys Asp
385 390 395 400
Ile Arg Ser Tyr Leu Lys Ser Ser His Asn Leu Pro Lys Arg Cys Tyr
405 410 415
Asp Asp Gln Leu Ile Glu Glu Leu Leu Ser Leu Ser Tyr Thr Lys Phe
420 425 430
Gly His Leu Ser Leu Lys Ala Ile Asn His Val Leu Ser Ile Met Gln
435 440 445
Lys Gly Asn Thr Tyr Lys Glu Ala Val Asp Gln Leu Gly Tyr Asp Thr
450 455 460
Ser Gly Leu Lys Lys Glu Lys Arg Ser Lys Phe Leu Pro Pro Ile Ser
465 470 475 480
Asp Glu Ile Thr Asn Pro Ile Val Lys Arg Ala Leu Thr Gln Ala Arg
485 490 495
Lys Val Val Asn Ala Ile Ile Arg Arg His Gly Ser Pro His Ser Val
500 505 510
His Ile Glu Leu Ala Arg Glu Leu Ser Lys Asn His Asp Glu Arg Thr
515 520 525
Lys Ile Val Ser Ala Gln Asp Glu Asn Tyr Lys Lys Asn Lys Gly Ala
530 535 540
Ile Ser Ile Leu Ser Glu His Gly Ile Leu Asn Pro Thr Gly Tyr Asp
545 550 555 560
Ile Val Arg Tyr Lys Leu Trp Lys Glu Gln Gly Glu Arg Cys Ala Tyr
565 570 575
Ser Leu Lys Glu Ile Pro Ala Asp Thr Phe Phe Asn Glu Leu Lys Lys
580 585 590
Glu Arg Asn Gly Ala Pro Ile Leu Glu Val Asp His Ile Leu Pro Tyr
595 600 605
Ser Gln Ser Phe Ile Asp Ser Tyr His Asn Lys Val Leu Val Tyr Ser
610 615 620
Asp Glu Asn Arg Lys Lys Gly Asn Arg Ile Pro Tyr Thr Tyr Phe Leu
625 630 635 640
Glu Thr Asn Lys Asp Trp Glu Ala Phe Glu Arg Tyr Val Arg Ser Asn
645 650 655
Lys Phe Phe Ser Lys Lys Lys Arg Glu Tyr Leu Leu Lys Arg Ala Tyr
660 665 670
Leu Pro Arg Glu Ser Glu Leu Ile Lys Glu Arg His Leu Asn Asp Thr
675 680 685
Arg Tyr Ala Ser Thr Phe Leu Lys Asn Phe Ile Glu Gln Asn Leu Gln
690 695 700
Phe Lys Glu Ala Glu Asp Asn Pro Arg Lys Arg Arg Val Gln Thr Val
705 710 715 720
Asn Gly Val Ile Thr Ala His Phe Arg Lys Arg Trp Gly Leu Glu Lys
725 730 735
Asp Arg Gln Glu Thr Tyr Leu His His Ala Met Asp Ala Ile Ile Val
740 745 750
Ala Cys Thr Asp His His Met Val Thr Arg Val Thr Glu Tyr Tyr Gln
755 760 765
Ile Lys Glu Ser Asn Lys Ser Val Lys Lys Pro Tyr Phe Pro Met Pro
770 775 780
Trp Glu Gly Phe Arg Asp Glu Leu Leu Ser His Leu Ala Ser Gln Pro
785 790 795 800
Ile Ala Lys Lys Ile Ser Glu Glu Leu Lys Ala Gly Tyr Gln Ser Leu
805 810 815
Asp Tyr Ile Phe Val Ser Arg Met Pro Lys Arg Ser Ile Thr Gly Ala
820 825 830
Ala His Lys Gln Thr Ile Met Arg Lys Gly Gly Ile Asp Lys Lys Gly
835 840 845
Lys Thr Ile Ile Ile Glu Arg Leu His Leu Lys Asp Ile Lys Phe Asp
850 855 860
Glu Asn Gly Asp Phe Lys Met Val Gly Lys Glu Gln Asp Met Ala Thr
865 870 875 880
Tyr Glu Ala Ile Lys Gln Arg Tyr Leu Glu His Gly Lys Asn Ser Lys
885 890 895
Lys Ala Phe Glu Thr Pro Leu Tyr Lys Pro Ser Lys Lys Gly Thr Gly
900 905 910
Asn Leu Ile Lys Arg Val Lys Val Glu Gly Gln Ala Lys Ser Phe Val
915 920 925
Arg Glu Val Asn Gly Gly Val Ala Gln Asn Gly Asp Leu Val Arg Val
930 935 940
Asp Leu Phe Glu Lys Asp Asp Lys Tyr Tyr Met Val Pro Ile Tyr Val
945 950 955 960
Pro Asp Thr Val Cys Ser Glu Leu Pro Lys Lys Val Val Ala Ser Ser
965 970 975
Lys Gly Tyr Glu Gln Trp Leu Thr Leu Asp Asn Ser Phe Thr Phe Lys
980 985 990
Phe Ser Leu Tyr Pro Tyr Asp Leu Val Arg Leu Val Lys Gly Asp Glu
995 1000 1005
Asp Arg Phe Leu Tyr Phe Gly Thr Leu Asp Ile Asp Ser Asp Arg
1010 1015 1020
Leu Asn Phe Lys Asp Val Asn Lys Pro Ser Lys Lys Asn Glu Tyr
1025 1030 1035
Arg Tyr Ser Leu Lys Thr Ile Glu Asp Leu Glu Lys Tyr Glu Val
1040 1045 1050
Gly Val Leu Gly Asp Leu Arg Leu Val Arg Lys Glu Thr Arg Arg
1055 1060 1065
Asn Phe His
1070
<210> 554
<211> 213
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 554
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Gly Met Asp Arg His Ala
1 5 10 15
Phe Asn Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro Ser Lys Leu
35 40 45
Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Arg Pro Lys Leu Gln
50 55 60
Ser Asn Arg Arg Tyr Glu Leu Ser Asn Trp Glu Cys Arg Lys His Val
65 70 75 80
Tyr Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe
85 90 95
Cys Gly Asn Gln Leu Pro Ala His Lys Arg Phe Gln Ile Thr Trp Phe
100 105 110
Val Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe
115 120 125
Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu
130 135 140
Tyr Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu His
145 150 155 160
Gln Ala Gly Ala Arg Val Lys Ile Met Asp Tyr Glu Glu Phe Ala Tyr
165 170 175
Cys Trp Glu Asn Phe Val Tyr Asn Glu Gly Gln Ser Phe Met Pro Trp
180 185 190
Asp Lys Phe Asp Asp Asn Tyr Ala Phe Leu His His Lys Leu Lys Glu
195 200 205
Ile Leu Arg Asn Pro
210
<210> 555
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 555
Met Glu Ala Thr Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu
1 5 10 15
Arg Lys Ala Tyr Gly Arg Asn Glu Thr Trp Leu Cys Phe Thr Met Glu
20 25 30
Ile Ile Lys Gln His Ser Thr Val Phe Trp Glu Thr Gly Val Phe Arg
35 40 45
Asn Gln Val Tyr Pro Glu Ser Leu Cys His Ala Glu Arg Cys Phe Leu
50 55 60
Ser Trp Phe Cys Glu Asp Ile Leu Ser Pro Asn Thr Asp Tyr Arg Val
65 70 75 80
Thr Trp Tyr Thr Ser Trp Ser Pro Cys Leu Asp Cys Ala Gly Glu Val
85 90 95
Ala Glu Phe Leu Ala Arg His Ser Asn Val Lys Leu Ala Ile Phe Ala
100 105 110
Ala Arg Leu Tyr Tyr Phe Trp Asp Pro His Tyr Gln Gln Gly Leu Arg
115 120 125
Ser Leu Ser Glu Lys Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp
130 135 140
Phe Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Gly Asp Glu Pro Phe
145 150 155 160
Lys Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys
165 170 175
Leu Gln Glu Ile Leu Gln
180
<210> 556
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 556
aggttttaat ggcccagcct gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60
tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120
cccatttatt 130
<210> 557
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 557
catggcagta cattagagca gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60
tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120
cccatttatt 130
<210> 558
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 558
cacatctcga gcaagacgtt gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60
tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120
cccatttatt 130
<210> 559
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 559
cttctatagc ctccttcccc gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60
tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120
cccatttatt 130
<210> 560
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 560
cctgaatgct gtgcggctct gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60
tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120
cccatttatt 130
<210> 561
<211> 130
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 561
gccgcacagc attcaggtcg gtcatagttc cattaaagcc aaaagtggct ttgatgtttc 60
tatgataagg gtttcgaccc gtggcgtcgg ggatcgcctg cccattgaaa tgggcttctc 120
cccatttatt 130
<210> 562
<211> 4923
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 562
gccaccatgg tgtctaaggg cgaggaactg ttcaccggcg tggtgcccat cctggtggaa 60
ctggacgggg atgtgaacgg ccacaagttc agcgtgtccg gcgagggaga gggcgacgcc 120
acatacggca agctgaccct gaaattcatc tgcaccacag gaaagctccc cgtgccttgg 180
cctaccctgg tcaccaccct gacgcatggc gtgcaatgtt tcagccgcta ccccgaccac 240
atgaaacagc acgacttttt caaaagcgcc atgcctgagg gctacgtgca agagcggacc 300
atcttcttca aggacgacgg aaattacaag accagagccg aggtgaagtt cgagggcgac 360
accctggtga atagaatcga gctgaagggc atcgacttca aggaagatgg caacatcctg 420
ggccacaagc tggaatacaa ctacaacagc cacaacgtgt acatcatggc cgacaagcag 480
aagaacggca tcaaggtgaa cttcaagatc agacacaaca tcgaggacgg cagcgtgcaa 540
ctggccgatc attaccagca gaacacccct atcggcgatg gtcctgtgct gctgcctgac 600
aaccactacc tgagcaccca gagcgccctg tctaaagatc ctaacgagaa gcgggaccac 660
atggtcctgc tggaattcgt gaccgccgct ggcataacac tcggcatgga cgagctgtac 720
aagtaaggat ccgcaggcct ctgctagctt gactgactga gatacagcgt accttcagct 780
cacagacatg ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa 840
aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg 900
caataaacaa gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt 960
gtgggaggtt ttttaaagca agtaaaacct ctacaaatgt ggtattggcc catctctatc 1020
ggtatcgtag cataacccct tggggcctct aaacgggtct tgaggggttt tttgtgcccc 1080
tcgggccgga ttgctatcta ccggcattgg cgcagaaaaa aatgcctgat gcgacgctgc 1140
gcgtcttata ctcccacata tgccagattc agcaacggat acggcttccc caacttgccc 1200
acttccatac gtgtcctcct taccagaaat ttatccttaa ggtcgtcagc tatcctgcag 1260
gcgatctctc gatttcgatc aagacattcc tttaatggtc ttttctggac accactaggg 1320
gtcagaagta gttcatcaaa ctttcttccc tccctaatct cattggttac cttgggctat 1380
cgaaacttaa ttaaccagtc aagtcagcta cttggcgaga tcgacttgtc tgggtttcga 1440
ctacgctcag aattgcgtca gtcaagttcg atctggtcct tgctattgca cccgttctcc 1500
gattacgagt ttcatttaaa tcatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 1560
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1620
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1680
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1740
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1800
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1860
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1920
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1980
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 2040
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 2100
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 2160
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2220
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2280
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2340
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2400
agttgcattt aaatttccga actctccaag gccctcgtcg gaaaatcttc aaacctttcg 2460
tccgatccat cttgcaggct acctctcgaa cgaactatcg caagtctctt ggccggcctt 2520
gcgccttggc tattgcttgg cagcgcctat cgccaggtat tactccaatc ccgaatatcc 2580
gagatcggga tcacccgaga gaagttcaac ctacatcctc aatcccgatc tatccgagat 2640
ccgaggaata tcgaaatcgg ggcgcgcctg gtgtaccgag aacgatcctc tcagtgcgag 2700
tctcgacgat ccatatcgtt gcttggcagt cagccagtcg gaatccagct tgggacccag 2760
gaagtccaat cgtcagatat tgtactcaag cctggtcacg gcagcgtacc gatctgttta 2820
aacctagata ttgatagtct gatcggtcaa cgtataatcg agtcctagct tttgcaaaca 2880
tctatcaaga gacaggatca gcaggaggct ttcgcatgag tattcaacat ttccgtgtcg 2940
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 3000
tgaaagtaaa agatgctgaa gatcagttgg gtgcgcgagt gggttacatc gaactggatc 3060
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgctttcca atgatgagca 3120
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 3180
tcggtcgccg catacactat tctcagaatg acttggttga gtattcacca gtcacagaaa 3240
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 3300
ataacactgc ggccaactta cttctgacaa cgattggagg accgaaggag ctaaccgctt 3360
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 3420
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaaccttgc 3480
gtaaactatt aactggcgaa ctacttactc tagcttcccg gcaacagttg atagactgga 3540
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 3600
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 3660
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 3720
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaaccga 3780
ttctaggtgc attggcgcag aaaaaaatgc ctgatgcgac gctgcgcgtc ttatactccc 3840
acatatgcca gattcagcaa cggatacggc ttccccaact tgcccacttc catacgtgtc 3900
ctccttacca gaaatttatc cttaagatcc cgaatcgttt aaactcgact ctggctctat 3960
cgaatctccg tcgtttcgag cttacgcgaa cagccgtggc gctcatttgc tcgtcgggca 4020
tcgaatctcg tcagctatcg tcagcttacc tttttggcag cgatcgcggc tcccgacatc 4080
ttggaccatt agctccacag gtatcttctt ccctctagtg gtcataacag cagcttcagc 4140
tacctctcaa ttcaaaaaac ccctcaagac ccgtttagag gccccaaggg gttatgctat 4200
caatcgttgc gttacacaca caaaaaacca acacacatcc atcttcgatg gatagcgatt 4260
ttattatcta actgctgatc gagtgtagcc agatctagta atcaattacg gggtcattag 4320
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 4380
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 4440
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 4500
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 4560
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 4620
tctacgtatt agtcatcgct attaccatgc tgatgcggtt ttggcagtac atcaatgggc 4680
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 4740
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 4800
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 4860
tgaaccgtca gatcagatct ttgtcgatcc taccatccac tcgacacacc cgccagcggc 4920
cgc 4923
<210> 563
<211> 140
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 563
accctgacgc atggcgtgca atgttgtcat agttccatga aagccaaaag tggctttgat 60
gtttctatga taagggtttc ggcccgtggc gtcggggatc gcctgcccat tccgatgggc 120
ttctccccat ttattttttt 140
<210> 564
<211> 4923
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 564
cgctcatttg ctcgtcgggc atcgaatctc gtcagctatc gtcagcttac ctttttggca 60
gcgatcgcgg ctcccgacat cttggaccat tagctccaca ggtatcttct tccctctagt 120
ggtcataaca gcagcttcag ctacctctca attcaaaaaa cccctcaaga cccgtttaga 180
ggccccaagg ggttatgcta tcaatcgttg cgttacacac acaaaaaacc aacacacatc 240
catcttcgat ggatagcgat tttattatct aactgctgat cgagtgtagc cagatctagt 300
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 360
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 420
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 480
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta 540
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg 600
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg ctgatgcggt 660
tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 720
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 780
gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 840
atataagcag agctggttta gtgaaccgtc agatcagatc tttgtcgatc ctaccatcca 900
ctcgacacac ccgccagcgg ccgcgccacc atggtgtcta agggcgagga actgttcacc 960
ggcgtggtgc ccatcctggt ggaactggac ggggatgtga acggccacaa gttcagcgtg 1020
tccggcgagg gagagggcga cgccacatac ggcaagctga ccctgaaatt catctgcacc 1080
acaggaaagc tccccgtgcc ttgacctacc ctggtcacca ccctgacgta cggcgtgcaa 1140
tgtttcagcc gctaccccga ccacatgaaa cagcacgact ttttcaaaag cgccatgcct 1200
gagggctacg tgcaagagcg gaccatcttc ttcaaggacg acggaaatta caagaccaga 1260
gccgaggtga agttcgaggg cgacaccctg gtgaatagaa tcgagctgaa gggcatcgac 1320
ttcaaggaag atggcaacat cctgggccac aagctggaat acaactacaa cagccacaac 1380
gtgtacatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatcagacac 1440
aacatcgagg acggcagcgt gcaactggcc gatcattacc agcagaacac ccctatcggc 1500
gatggtcctg tgctgctgcc tgacaaccac tacctgagca cccagagcgc cctgtctaaa 1560
gatcctaacg agaagcggga ccacatggtc ctgctggaat tcgtgaccgc cgctggcata 1620
acactcggca tggacgagct gtacaagtaa ggatccgcag gcctctgcta gcttgactga 1680
ctgagataca gcgtaccttc agctcacaga catgataaga tacattgatg agtttggaca 1740
aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 1800
tttatttgta accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt 1860
tatgtttcag gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa 1920
atgtggtatt ggcccatctc tatcggtatc gtagcataac cccttggggc ctctaaacgg 1980
gtcttgaggg gttttttgtg cccctcgggc cggattgcta tctaccggca ttggcgcaga 2040
aaaaaatgcc tgatgcgacg ctgcgcgtct tatactccca catatgccag attcagcaac 2100
ggatacggct tccccaactt gcccacttcc atacgtgtcc tccttaccag aaatttatcc 2160
ttaaggtcgt cagctatcct gcaggcgatc tctcgatttc gatcaagaca ttcctttaat 2220
ggtcttttct ggacaccact aggggtcaga agtagttcat caaactttct tccctcccta 2280
atctcattgg ttaccttggg ctatcgaaac ttaattaacc agtcaagtca gctacttggc 2340
gagatcgact tgtctgggtt tcgactacgc tcagaattgc gtcagtcaag ttcgatctgg 2400
tccttgctat tgcacccgtt ctccgattac gagtttcatt taaatcatgt gagcaaaagg 2460
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 2520
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 2580
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 2640
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 2700
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 2760
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 2820
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 2880
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 2940
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 3000
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 3060
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 3120
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 3180
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 3240
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 3300
gatctgtcta tttcgttcat ccatagttgc atttaaattt ccgaactctc caaggccctc 3360
gtcggaaaat cttcaaacct ttcgtccgat ccatcttgca ggctacctct cgaacgaact 3420
atcgcaagtc tcttggccgg ccttgcgcct tggctattgc ttggcagcgc ctatcgccag 3480
gtattactcc aatcccgaat atccgagatc gggatcaccc gagagaagtt caacctacat 3540
cctcaatccc gatctatccg agatccgagg aatatcgaaa tcggggcgcg cctggtgtac 3600
cgagaacgat cctctcagtg cgagtctcga cgatccatat cgttgcttgg cagtcagcca 3660
gtcggaatcc agcttgggac ccaggaagtc caatcgtcag atattgtact caagcctggt 3720
cacggcagcg taccgatctg tttaaaccta gatattgata gtctgatcgg tcaacgtata 3780
atcgagtcct agcttttgca aacatctatc aagagacagg atcagcagga ggctttcgca 3840
tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 3900
tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcgc 3960
gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 4020
aagaacgctt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 4080
gtattgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 4140
ttgagtattc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 4200
gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgattg 4260
gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 4320
atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 4380
ctgtagcaat ggcaacaacc ttgcgtaaac tattaactgg cgaactactt actctagctt 4440
cccggcaaca gttgatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 4500
cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 4560
gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 4620
cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 4680
cactgattaa gcattggtaa ccgattctag gtgcattggc gcagaaaaaa atgcctgatg 4740
cgacgctgcg cgtcttatac tcccacatat gccagattca gcaacggata cggcttcccc 4800
aacttgccca cttccatacg tgtcctcctt accagaaatt tatccttaag atcccgaatc 4860
gtttaaactc gactctggct ctatcgaatc tccgtcgttt cgagcttacg cgaacagccg 4920
tgg 4923
<210> 565
<211> 2714
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 565
ctccaataac tgtgatccac cacaagcgcc agggttttcc cagtcacgac gttgtaaaac 60
gacggccagt catgcataat ccgcacgcat ctggaataag gaagtgccat tccgcctgac 120
cttgtacaaa aaagcaggct ttaaaggaac caattcagtc gactggatcc ggtaccaagg 180
tcgggcagga agagggccta tttcccatga ttccttcata tttgcatata cgatacaagg 240
ctgttagaga gataattaga attaatttga ctgtaaacac aaagatatta gtacaaaata 300
cgtgacgtag aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa 360
tggactatca tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct 420
tgtggaaagg acgaaacacc gcccgtgcct tgacctaccc tggtcagtca tagttccatg 480
aaagccaaaa gtggctttga tgtttctatg ataagggttt cggcccgtgg cgtcggggat 540
cgcctgccca ttccgatggg cttctcccca tttatttttt tctagaccca gctttcttgt 600
acaaagttgg cattaaggct aggtggaggc tcagtgatga taagtctgcg atggtggatg 660
catgtgtcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcag agggcacaat 720
cctattccgc gctatccgac aatctccaag acattaggtg gagttcagtt cggcgtatgg 780
catatgtcgc tggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 840
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 900
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 960
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 1020
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 1080
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 1140
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 1200
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 1260
agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 1320
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 1380
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 1440
gatctcaaga agatcctttg atcttttcta cggggtctga cgctctattc aacaaagccg 1500
ccgtcccgtc aagtcagcgt aaatgggtag ggggcttcaa atcgtcctcg tgataccaat 1560
tcggagcctg cttttttgta caaacttgtt gataatggca attcaaggat cttcacctag 1620
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1680
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 1740
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 1800
tctggcccca gtgctgcaat gataccgcga gagccacgct caccggctcc agatttatca 1860
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 1920
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 1980
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 2040
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 2100
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 2160
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 2220
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 2280
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 2340
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 2400
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 2460
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 2520
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 2580
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 2640
ataggggttc cgcgcacatt tccccgaaaa gtgccagata cctgaaacaa aacccatcgt 2700
acggccaagg aagt 2714
<210> 566
<211> 663
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 566
atgggtgaga aaaaaatcac cggatatacc accgttgata tatcccaatg gcatcgtaaa 60
gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg 120
gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt 180
attcacattc ttgcccgcct gatgaatgct catccggaat ttcgtatggc aatgaaagac 240
ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact 300
gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata 360
tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt 420
gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac 480
gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa 540
ggcgacaagg tgctgatgcc gctggcgatt caggttcatc gcgccgtttg tgatggcttc 600
catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg 660
taa 663
<210> 567
<211> 663
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 567
atgggtgaga aaaaaatcac cggatatacc accgttgata tatcccaatg gcatcgtaaa 60
gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac cgttcagctg 120
gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta tccggccttt 180
attcacattc ttgcccgcct gatgaatgct catccggaat ttcgtatggc aatgaaagac 240
ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca tgagcaaact 300
gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt tctacacata 360
tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa agggtttatt 420
gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt tgatttaaac 480
gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata ttatacgcaa 540
ggcgacaagg tgctgatgcc gctggcgatt caggttcact acgccgtttg tgatggcttc 600
catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca gggcggggcg 660
taa 663
<210> 568
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 568
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 569
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 569
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 570
<211> 82
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 570
Thr Asn Leu Ser Asp His Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
1 5 10 15
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly
20 25 30
Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
35 40 45
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys
50 55 60
Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
65 70 75 80
Met Leu
<210> 571
<211> 199
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 571
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 572
<211> 164
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 572
Met Lys Thr His Glu Glu Tyr Met Glu Leu Ala Leu Glu Glu Ala Arg
1 5 10 15
Lys Ala Glu Glu Ile Asp Glu Val Pro Val Gly Cys Val Ile Val Cys
20 25 30
Asp Gly Glu Val Ile Ser Arg Gly His Asn Leu Lys Glu Gln Leu Asn
35 40 45
Gln Ala Tyr Ala His Ala Glu Met Met Ala Ile Gln Lys Ala Ala Glu
50 55 60
Val Lys Gly Asn Trp Cys Leu Asn Asp Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Met Met Cys Thr Gly Ile Ile Asn Leu Ser Arg Ile Arg
85 90 95
Thr Val Tyr Tyr Gly Lys Gln Tyr Pro Thr Gly Gly Cys Leu Glu Thr
100 105 110
Val Ile Asp Leu Lys Lys Ile Asn Arg Leu Asn His Tyr Pro Asn Ile
115 120 125
Val Gly Asn Ile Leu Gln Lys Glu Cys Ser Glu Ile Leu Thr Asn Tyr
130 135 140
Phe Arg Lys Lys Arg Glu Ile Ile Lys Glu Lys Lys Gln Lys Asn Lys
145 150 155 160
Ala Asn Ile Gln
<210> 573
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 573
Met Leu Glu Asp Phe Met Arg Val Ala Leu Glu Glu Ala Lys Lys Ala
1 5 10 15
Tyr Lys Gln Gly Glu Val Pro Val Gly Ala Val Ile Val Lys Asn Gly
20 25 30
Lys Val Ile Ser Lys Ala His Asn Glu Thr Arg Gln Lys Lys Asn Ala
35 40 45
Val Ala His Ala Glu Ile Leu Ala Ile Asp Lys Ala Cys Lys Lys Leu
50 55 60
Glu Asn Glu Arg Leu Val Asp Thr Glu Met Tyr Val Thr Leu Glu Pro
65 70 75 80
Cys Ala Met Cys Ala Gly Ala Ile Leu Gln Ala Arg Ile Pro Arg Leu
85 90 95
Leu Phe Gly Ala Glu Asn Pro Lys Ala Gly Phe Cys Gly Ser Val Leu
100 105 110
Asp Ile Leu Gln Leu Ser Ala Leu Asn His Arg Val Glu Leu Leu Pro
115 120 125
Pro Val Leu Arg Glu Asp Cys Lys Arg Leu Met Thr Asp Phe Phe Gly
130 135 140
Arg Leu Arg Ala His Ser Asp Ser Glu Glu
145 150
<210> 574
<211> 160
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 574
Met Glu Gln Glu Asn Tyr Met Arg Arg Ala Leu Thr Leu Ala Arg Glu
1 5 10 15
Ala Gly Asp Ala Gly Glu Val Pro Val Gly Cys Val Ile Val Arg Asp
20 25 30
Gly Lys Val Val Gly Glu Gly Arg Asn Arg Arg Glu Glu Leu Thr Ser
35 40 45
Ala Ala Ser His Ala Glu Met Glu Ala Ile Ala Ala Ala Asn Glu Arg
50 55 60
Leu Gly Ser Trp Arg Leu Glu Gly Cys Ala Leu Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Ala Gly Ala Ile Leu Asn Ala Arg Val Ser Lys
85 90 95
Val Phe Tyr Gly Glu Arg Ser Pro Lys Phe Gly Ala Cys Gly Gly Val
100 105 110
Thr Asn Leu Phe Met Glu Asp Phe Pro Asn Arg Pro Ala Leu Val Gly
115 120 125
Gly Val Leu Ala Glu Glu Cys Arg Glu Val Leu Arg Ala Phe Phe Gln
130 135 140
Lys Leu Arg Asn Asp Gly Gly Thr Gly Glu Ser Pro Glu Pro Lys Ile
145 150 155 160
<210> 575
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 575
Met Asp Arg Tyr Met Thr Arg Ala Leu Glu Leu Ala Arg Leu Ala Phe
1 5 10 15
Asp Glu Gly Glu Val Pro Val Gly Ala Val Val Val Lys Lys Thr Thr
20 25 30
Gly Glu Ile Ile Gly Glu Gly Arg Asn Met Arg Glu Gly Ala Lys Asn
35 40 45
Ala Leu Ala His Ala Glu Ile Ile Ala Ile Asp Gln Ala Cys Arg Thr
50 55 60
Leu Gly Gly Trp Arg Leu Pro Glu Cys Ala Ile Tyr Val Thr Leu Glu
65 70 75 80
Pro Cys Pro Met Cys Cys Gly Ala Ile Ile Asn Ala Arg Ile Asp Asn
85 90 95
Val Ile Phe Gly Lys Tyr Leu Leu Glu Ser Gly Ser Ala Ala Ser Val
100 105 110
Gln Lys Met Phe Glu Leu Pro Tyr Asn Tyr Arg Pro Glu Val Thr Gly
115 120 125
Gly Ile Met Glu Gln Glu Cys Ala Asp Ile Leu Ser Glu Phe Phe Arg
130 135 140
Gln Leu Arg Ile Arg Lys Lys Thr
145 150
<210> 576
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 576
Met Glu Asn Asn Asp Glu Lys Phe Met Met Lys Ala Ile Glu Gln Ala
1 5 10 15
Lys Ile Ala Tyr Asp Met Asp Glu Val Pro Val Gly Cys Val Ile Val
20 25 30
Lys Asp Gly Glu Ile Ile Ala Gln Ala Tyr Asn Ser Val Glu Lys Asp
35 40 45
Lys Asn Ala Thr Met His Ala Glu Leu Lys Ala Ile Asn Gln Ala Thr
50 55 60
Glu Phe Ile Gly Asn Phe Arg Leu Asp Asp Cys Ile Met Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Val Met Cys Thr Gly Ala Leu Val Tyr Ser Arg Ile
85 90 95
Pro Lys Val Val Phe Gly Ala Phe Ala Lys Arg Arg Gly Ala Cys Gly
100 105 110
Ser Leu Ile Ser Leu Asn Asp Tyr Glu Gly Leu Asn His Lys Ile Glu
115 120 125
Val Lys Ser Ile Met Glu Lys Glu Cys Val Glu Leu Met Gln Ser Phe
130 135 140
Phe Arg Arg Ile Arg Glu Lys Asn Arg Asn Lys
145 150 155
<210> 577
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 577
Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg
1 5 10 15
Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg
20 25 30
Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys
35 40 45
Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys
50 55 60
Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys
85 90 95
Thr Val Tyr Tyr Gly Gly Pro Ser Leu Arg Ala Gly Ser Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val
115 120 125
Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe
130 135 140
Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln
145 150 155 160
Ala Gln Met Asn Asp Leu Asn Glu Ile
165
<210> 578
<211> 151
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 578
Met Asp Asp Phe Ala Tyr Met Arg Gln Ala Met Glu Leu Ala Glu Gln
1 5 10 15
Ala Ala Ala Leu Gly Glu Ile Pro Val Gly Ala Leu Val Val Gln Asp
20 25 30
Ala Thr Gly Glu Val Leu Gly Arg Gly Tyr Asn Arg Arg Glu Val Asp
35 40 45
His Asp Pro Thr Ala His Ala Glu Val Leu Ala Ile Arg Gln Ala Ala
50 55 60
Leu Ala Ile Gly Ser Trp Arg Leu Ser Gly Cys Thr Leu Tyr Val Thr
65 70 75 80
Leu Glu Pro Cys Pro Met Cys Cys Gly Thr Ile Ile Asn Ala Arg Val
85 90 95
Arg Arg Val Val Phe Gly Ala Tyr Ser Ser Thr Ala Gly Ser Ala Asp
100 105 110
Ser Val Ile Asn Leu Phe Ala Leu Pro Tyr Asn His Lys Pro Ala Val
115 120 125
Thr Gly Gly Leu Leu Glu Asp Ala Cys Lys Glu Gln Leu Gln Arg Phe
130 135 140
Phe Ser Gly Leu Arg Glu Lys
145 150
<210> 579
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 579
Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg
1 5 10 15
Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg
20 25 30
Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys
35 40 45
Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys
50 55 60
Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys
85 90 95
Thr Val Tyr Tyr Gly Ser Pro Gln Leu Gly Ala Gly Ser Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val
115 120 125
Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe
130 135 140
Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln
145 150 155 160
Ala Gln Met Asn Asp Leu Asn Glu Ile
165
<210> 580
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 580
Met Glu Lys Glu Glu Ala Ser Leu Gln Gly Ile His Glu Arg Trp Met
1 5 10 15
Arg Gln Ala Leu Glu Glu Ala Asp Lys Ala Glu Gln Leu Asn Glu Val
20 25 30
Pro Ile Gly Ala Ile Ile Val Lys Asp Gln Gln Ile Ile Gly Arg Gly
35 40 45
Tyr Asn Val Arg Glu Thr Gln His Gln Ala Thr Gly His Ala Glu Ile
50 55 60
Gln Ala Ile Glu Asp Ala Asn Arg His Gln Gln Ala Trp Arg Leu Glu
65 70 75 80
Gly Ala Thr Met Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly
85 90 95
Ala Leu Ile Asn Ser Arg Ile Gln Thr Val Val Tyr Gly Ala Ser Gly
100 105 110
Leu Lys Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu Gln Asp Asp
115 120 125
Arg Phe Asn His Gln Val Glu Val Ile Ser Gly Val Leu Ala Glu Glu
130 135 140
Cys Gly Asp Lys Leu Ser Tyr Phe Phe Arg Lys Leu Arg Gln Arg Lys
145 150 155 160
Gly Lys Asn Ile Asp Arg Ala Glu
165
<210> 581
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 581
Met Thr Arg Asp Glu Met Tyr Met Arg Lys Ala Leu Glu Leu Ala Ala
1 5 10 15
Leu Ala Ala Asp Glu Asp Glu Val Pro Val Gly Ala Val Val Val Lys
20 25 30
Lys Ser Thr Gly Glu Ile Val Gly Arg Gly Phe Asn Arg Arg Glu Tyr
35 40 45
Gly Arg Ser Pro Leu Thr His Ala Glu Ile Val Ala Ile Asp Glu Ala
50 55 60
Ser Arg Lys Leu Gly Gly Trp Arg Leu Ile Asp Cys Glu Leu Phe Val
65 70 75 80
Thr Leu Glu Pro Cys Pro Met Cys Ala Gly Ala Val Ile Asn Ser Arg
85 90 95
Val Glu Arg Val Val Phe Gly Gln Tyr Gly Lys Arg Ala Gly Ser Cys
100 105 110
Gly Ser Val Val Asp Leu Phe Gly Leu Pro Tyr Asn His Lys Pro Glu
115 120 125
Cys Ile Gly Gly Val Leu Glu Glu Glu Cys Ala Ala Val Leu Thr Glu
130 135 140
Phe Phe Lys Gly Leu Arg Lys Arg Lys Val Lys Val Asn Glu
145 150 155
<210> 582
<211> 164
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 582
Met Lys Thr His Glu Glu Tyr Met Glu Leu Ala Leu Glu Glu Ala Arg
1 5 10 15
Lys Ala Glu Glu Ile Asp Glu Val Pro Val Gly Cys Val Ile Val Cys
20 25 30
Asp Gly Glu Val Ile Ser Arg Gly His Asn Leu Lys Glu Gln Leu Asn
35 40 45
Gln Ala Tyr Ala His Ala Glu Met Met Ala Ile Gln Lys Ala Ala Glu
50 55 60
Val Lys Gly Asn Trp Cys Leu Asn Asp Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Met Met Cys Thr Gly Ile Ile Asn Leu Ser Arg Ile Arg
85 90 95
Thr Val Tyr Tyr Gly Arg Gln Trp Pro Glu Gly Gly Cys Leu Glu Thr
100 105 110
Val Ile Asp Leu Lys Lys Ile Asn Arg Leu Asn His Tyr Pro Asn Ile
115 120 125
Val Gly Asn Ile Leu Gln Lys Glu Cys Ser Glu Ile Leu Thr Asn Tyr
130 135 140
Phe Arg Lys Lys Arg Glu Ile Ile Lys Glu Lys Lys Gln Lys Asn Lys
145 150 155 160
Ala Asn Ile Gln
<210> 583
<211> 169
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 583
Met Thr Glu His Glu Lys Phe Met Asn Ala Ala Leu Lys Leu Ala Arg
1 5 10 15
Lys Ala Ala Ala Glu Gly Glu Val Pro Val Gly Cys Val Val Val Arg
20 25 30
Asp Gly Val Ile Val Gly Arg Gly Arg Asn Arg Arg Glu Thr Lys Lys
35 40 45
Asp Ala Leu Gly His Ala Glu Ile Glu Ala Ile His Lys Ala Cys Lys
50 55 60
Lys Leu Gly Gly Trp Arg Leu His Gln Cys Asp Leu Tyr Val Thr Leu
65 70 75 80
Glu Pro Cys Pro Met Cys Thr Gly Ala Ile Ile Asn Ala Arg Ile Lys
85 90 95
Thr Val Tyr Tyr Gly Ala Pro Arg Leu Ser Ala Gly Ser Cys Gly Ser
100 105 110
Val Val Asn Leu Phe Asp Leu Pro Tyr Asn His Lys Pro Glu Leu Val
115 120 125
Ser Gly Leu Met Glu Gln Glu Cys Thr Glu Glu Leu Gln Lys Phe Phe
130 135 140
Arg Gln Leu Arg Glu Arg Lys Lys Leu Glu Lys Gln Leu Arg Lys Gln
145 150 155 160
Ala Gln Met Asn Asp Leu Asn Glu Ile
165
<210> 584
<211> 168
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 584
Met Glu Lys Glu Glu Ala Ser Leu Gln Gly Ile His Glu Arg Trp Met
1 5 10 15
Arg Gln Ala Leu Glu Glu Ala Asp Lys Ala Glu Gln Leu Asn Glu Val
20 25 30
Pro Ile Gly Ala Ile Ile Val Lys Asp Gln Gln Ile Ile Gly Arg Gly
35 40 45
Tyr Asn Val Arg Glu Thr Gln His Gln Ala Thr Gly His Ala Glu Ile
50 55 60
Gln Ala Ile Glu Asp Ala Asn Arg His Gln Gln Ala Trp Arg Leu Glu
65 70 75 80
Gly Ala Thr Met Tyr Val Thr Leu Glu Pro Cys Pro Met Cys Ala Gly
85 90 95
Ala Leu Ile Asn Ser Arg Ile Gln Thr Val Val Tyr Gly Phe Ser Ser
100 105 110
Leu Thr Ala Gly Cys Ala Gly Thr Leu Met Asn Leu Leu Gln Asp Asp
115 120 125
Arg Phe Asn His Gln Val Glu Val Ile Ser Gly Val Leu Ala Glu Glu
130 135 140
Cys Gly Asp Lys Leu Ser Tyr Phe Phe Arg Lys Leu Arg Gln Arg Lys
145 150 155 160
Gly Lys Asn Ile Asp Arg Ala Glu
165
<210> 585
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> SITE
<222> (1)..(150)
<223> /note="This sequence may encompass 1-30 'Gly Gly Gly Gly Ser'
repeating units"
<400> 585
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70 75 80
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
100 105 110
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
115 120 125
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser
145 150
<210> 586
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> SITE
<222> (1)..(30)
<223> /note="This sequence may encompass 1-30 residues"
<400> 586
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
1 5 10 15
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
20 25 30
<210> 587
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> SITE
<222> (1)..(150)
<223> /note="This sequence may encompass 1-30 'Glu Ala Ala Ala Lys'
repeating units"
<400> 587
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
1 5 10 15
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
20 25 30
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
35 40 45
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
50 55 60
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
65 70 75 80
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
85 90 95
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
100 105 110
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
115 120 125
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
130 135 140
Lys Glu Ala Ala Ala Lys
145 150
<210> 588
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> SITE
<222> (1)..(60)
<223> /note="This sequence may encompass 1-30 'Xaa Pro'
repeating units"
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(7)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (9)..(9)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (17)..(17)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (19)..(19)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (21)..(21)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (23)..(23)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (25)..(25)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (27)..(27)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (29)..(29)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (31)..(31)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (33)..(33)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (35)..(35)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (37)..(37)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (39)..(39)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (41)..(41)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (43)..(43)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (45)..(45)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (47)..(47)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (49)..(49)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (51)..(51)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (53)..(53)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (55)..(55)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (57)..(57)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (59)..(59)
<223> Any amino acid
<400> 588
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
1 5 10 15
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
20 25 30
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
35 40 45
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
50 55 60
<210> 589
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(29)
<223> Any amino acid
<220>
<221> SITE
<222> (4)..(29)
<223> /note="This region may encompass 23-26 residues"
<220>
<221> MOD_RES
<222> (32)..(35)
<223> Any amino acid
<220>
<221> SITE
<222> (32)..(35)
<223> /note="This region may encompass 2-4 residues"
<400> 589
His Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Cys Xaa
20 25 30
Xaa Xaa Xaa Cys
35
<210> 590
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 590
Gly Gly Gly Gly Ser
1 5
<210> 591
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 591
Glu Ala Ala Ala Lys
1 5
<210> 592
<211> 80
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> SITE
<222> (1)..(80)
<223> /note="This sequence may encompass 1-20 'Ser Gly Gly Ser'
repeating units"
<400> 592
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
1 5 10 15
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
35 40 45
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
50 55 60
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
65 70 75 80
<210> 593
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
6xHis tag"
<400> 593
His His His His His His
1 5
<210> 594
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
10xHis tag"
<400> 594
His His His His His His His His His His
1 5 10
<210> 595
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 595
gtctgattgc ctgtcgttgc ccctcccaag gagttggcag a 41
<210> 596
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 596
gtctgattgc ctgtcgttgc ccctaagtgt attaagcatt gtctcagaga ttttggagga 60
gttggcaga 69
<210> 597
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 597
gtctgattgc ctgtcgttgc ccctggagga gttggcaga 39
<210> 598
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 598
gtctgattgc ctgtcgttgc ccctcccaga tcggaggagt tggcaga 47
<210> 599
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 599
gtctgattgc ctgtcgttgc ccctcccaga taggagttgg caga 44
<210> 600
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 600
gtctgattgc ctgtcgttgc ccatctggga gttggcaga 39
<210> 601
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 601
gtctgattgc ctgtcgttgc ccctctggag gagttggcag a 41
<210> 602
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 602
gtctgattgg aggagttggc aga 23
<210> 603
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 603
gtctgattgc ctgtcgttgc ccctcggagg agttggcaga 40
<210> 604
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 604
gtctgattgc ctgtcgttgc ccctccagga ggagttggca ga 42
<210> 605
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 605
gtctgattgc ctgtcgttgc ccggagttgg caga 34
<210> 606
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 606
gtctgattgc ctgtcgttgc ccatcatgga ggagttggca ga 42
<210> 607
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 607
gtctgattgc ctgtcgttgc ccctccatgg aggagttggc aga 43
<210> 608
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 608
gtctgattgc ctgtcgttgc ccctcccagt act 33
<210> 609
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 609
gtctgattgc ctgtcgttgc cccaatcttg gaggagttgg caga 44
<210> 610
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 610
gtctgattgc ctgtcgttgc cctgggatgg aggagttggc aga 43
<210> 611
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 611
gtctgattgc ctgtcgttgc ccctcagttg gcaga 35
<210> 612
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 612
gtctgattgc ctgtcgttgc ccctcatgga ggagttggca ga 42
<210> 613
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace="His" or "Cys"
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (4)..(48)
<223> Any amino acid
<220>
<221> SITE
<222> (4)..(48)
<223> /note="This region may encompass 15-45 residues"
<220>
<221> MOD_RES
<222> (51)..(52)
<223> Any amino acid
<220>
<221> SITE
<222> (1)..(53)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 613
Asp Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Pro Cys Xaa Xaa Cys
50
<210> 614
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 614
Glu Glu Gln Leu
1
<210> 615
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 615
Ala Glu Val Ser Gln Ala
1 5
<210> 616
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 616
Gly Glu Gln Leu
1
<210> 617
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 617
Ala Glu Val Ser Lys Ala
1 5
Claims (45)
- RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
상기 RGN 폴리펩티드는 표적 DNA 서열과 혼성화할 수 있는 가이드 RNA (gRNA)에 결합할 때 RNA-가이드된 서열 특이적인 방식으로 상기 표적 DNA 서열에 결합하고,
RGN 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자. - 제1항에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하는 것인 핵산 분자.
- 제2항에 있어서, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
- 제1항 내지 제3항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
- 제4항에 있어서, 상기 벡터가 상기 가이드 RNA를 코딩하는 적어도 하나의 뉴클레오티드 서열을 추가로 포함하고, 가이드 RNA가 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 CRISPR 반복 서열을 포함하는 CRISPR RNA를 포함하는 것인 벡터.
- 제4항 또는 제5항에 있어서, 가이드 RNA가 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 tracrRNA를 포함하는 것인 벡터.
- 제1항 내지 제3항 중 어느 한 항의 핵산 분자 또는 제4항 내지 제6항 중 어느 한 항의 벡터를 포함하는 세포.
- CRISPR RNA (crRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 crRNA는 스페이서 서열 및 CRISPR 반복 서열을 포함하고, 상기 CRISPR 반복 서열은 서열식별번호: 2, 17, 25, 36, 44, 51 또는 63과 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하고;
a) 상기 crRNA; 및
b) 상기 crRNA의 상기 CRISPR 반복 서열에 혼성화된 트랜스-활성화 CRISPR RNA (tracrRNA)
를 포함하는 가이드 RNA는
상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드에 결합할 때, 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열에 혼성화할 수 있고,
crRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자. - 제8항의 핵산 분자를 포함하는 벡터.
- 제9항에 있어서, 상기 벡터가 상기 tracrRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
- 서열식별번호: 3, 18, 26, 37, 45, 52 또는 62와 적어도 95% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 트랜스-활성화 CRISPR RNA (tracrRNA)를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며;
a) 상기 tracrRNA; 및
b) 스페이서 서열 및 CRISPR 반복 서열을 포함하는 crRNA
- 상기 tracrRNA는 상기 crRNA의 상기 CRISPR 반복 서열과 혼성화함
를 포함하는 가이드 RNA는
상기 가이드 RNA가 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드에 결합할 때, 상기 crRNA의 스페이서 서열을 통해 서열 특이적인 방식으로 표적 DNA 서열에 혼성화할 수 있고,
tracrRNA를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자. - 제11항의 핵산 분자를 포함하는 벡터.
- 제12항에 있어서, 상기 벡터가 상기 crRNA를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 벡터.
- 표적 DNA 서열에 결합하기 위한 시스템이며, 상기 시스템은
a) 상기 표적 DNA 서열과 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는 RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드, 또는 RGN 폴리펩티드를 코딩하는 뉴클레오티드 서열
을 포함하고;
하나 이상의 가이드 RNA를 코딩하고 RGN 폴리펩티드를 코딩하는 상기 뉴클레오티드 서열 각각은 상기 각각의 뉴클레오티드 서열에 대해 이종성인 프로모터에 작동가능하게 연결되고;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하고,
하나 이상의 가이드 RNA는 RGN 폴리펩티드와 복합체를 형성하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하는 것인 시스템. - 제14항에 있어서, 표적 DNA 서열이 진핵생물 세포 내에 있는 것인 시스템.
- 제14항 또는 제15항에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하고, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 시스템.
- 제14항 또는 제15항에 있어서, 상기 시스템이 하나 이상의 공여자 폴리뉴클레오티드, 또는 하나 이상의 공여자 폴리뉴클레오티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 추가로 포함하고, 하나 이상의 공여자 폴리뉴클레오티드를 코딩하는 상기 뉴클레오티드 서열 각각이 상기 각각의 뉴클레오티드 서열에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 시스템.
- 제14항 내지 제17항 중 어느 한 항에 따른 시스템을 표적 DNA 서열 또는 표적 DNA 서열을 포함하는 세포에 전달하는 것을 포함하는, 표적 DNA 서열에 결합시키는 방법.
- 표적 DNA 서열을
a) RNA-가이드된 뉴클레아제 (RGN) 폴리펩티드 - 여기서 상기 RGN은 서열식별번호: 1, 16, 24, 35, 43 또는 50과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함함;
b) (a)의 RGN을 표적 DNA 서열에 표적화시킬 수 있는 하나 이상의 가이드 RNA
와 접촉시키는 것을 포함하며;
하나 이상의 가이드 RNA는 표적 DNA 서열과 혼성화하여, 상기 RGN 폴리펩티드가 상기 표적 DNA 서열에 결합하도록 지시하고, 상기 표적 DNA 서열의 절단 및/또는 변형이 일어나는 것인, 표적 DNA 서열을 절단하고/거나 변형시키는 방법. - 제19항에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로부터 적어도 하나의 뉴클레오티드의 결실 또는 돌연변이를 포함하는 것인 방법.
- 제19항 또는 제20항에 있어서, 상기 RGN 폴리펩티드가 뉴클레아제 데드이거나 또는 닉카제로서 기능하고, RGN 폴리펩티드가 염기-편집 폴리펩티드에 작동가능하게 연결된 것인 방법.
- 제19항에 있어서, 상기 변형된 표적 DNA 서열이 표적 DNA 서열로의 이종성 DNA의 삽입을 포함하는 것인 방법.
- 제19항 내지 제22항 중 어느 한 항에 있어서, 표적 DNA 서열이 세포 내에 있는 것인 방법.
- 제23항에 있어서, 세포가 진핵생물 세포인 방법.
- 제23항 또는 제24항에 있어서, RGN 폴리펩티드가 발현되고 표적 DNA 서열을 절단하여 변형된 DNA 서열을 생성하는 조건하에 세포를 배양하고; 상기 변형된 DNA 서열을 포함하는 세포를 선택하는 것을 추가로 포함하는 방법.
- 제25항의 방법에 따른 변형된 표적 DNA 서열을 포함하는 세포.
- 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고;
상기 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키고;
데아미나제 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자. - 제27항에 있어서, 상기 데아미나제 폴리펩티드가 상기 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 RNA-가이드된 뉴클레아제 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
- 제28항에 있어서, 상기 RNA-가이드된 뉴클레아제 폴리펩티드가 닉카제인 핵산 분자.
- 제27항 내지 제29항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
- 제27항 내지 제29항 중 어느 한 항의 핵산 분자 또는 제30항의 벡터를 포함하는 세포.
- 아데노신 데아미나제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자이며, 상기 폴리뉴클레오티드는 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고:
a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키고;
아데노신 데아미나제 폴리펩티드를 코딩하는 상기 폴리뉴클레오티드는 상기 폴리뉴클레오티드에 대해 이종성인 프로모터에 작동가능하게 연결된 것인 핵산 분자. - 제32항에 있어서, 상기 아데노신 데아미나제 폴리펩티드가 상기 아데노신 데아미나제 폴리펩티드를 상기 표적 폴리뉴클레오티드에 국재화시키는 RNA-가이드된 뉴클레아제 폴리펩티드에 작동가능하게 융합된 것인 핵산 분자.
- 제33항에 있어서, 상기 RNA-가이드된 뉴클레아제 폴리펩티드가 닉카제인 핵산 분자.
- 제32항 내지 제34항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
- 제31항 내지 제33항 중 어느 한 항의 핵산 분자 또는 제35항의 벡터를 포함하는 세포.
- 하기를 포함하는 융합 단백질이며:
a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
b) 데아미나제 폴리펩티드,
상기 데아미나제 폴리펩티드는 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 융합 단백질. - 제37항에 있어서, DNA-결합 폴리펩티드가 닉카제 활성을 갖는 RNA-가이드된 뉴클레아제인 융합 단백질.
- 하기를 포함하는 융합 단백질이며:
a) 표적 폴리뉴클레오티드에 결합하는 DNA-결합 폴리펩티드; 및
b) 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드:
i) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
ii) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
iii) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
iv) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
v) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
vi) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
vii) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
viii) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
ix) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
x) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
xi) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
xii) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
xiii) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
xiv) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 융합 단백질. - 제39항에 있어서, DNA-결합 폴리펩티드가 닉카제 활성을 갖는 RNA-가이드된 뉴클레아제인 융합 단백질.
- 하기를 포함하는, 표적 폴리뉴클레오티드 서열을 변형시키기 위한 시스템이며:
a) 상기 표적 폴리뉴클레오티드 서열에 혼성화할 수 있는 하나 이상의 가이드 RNA, 또는 하나 이상의 가이드 RNA (gRNA)를 코딩하는 하나 이상의 뉴클레오티드 서열; 및
b) 제37항 내지 제40항 중 어느 한 항의 융합 단백질, 또는 상기 융합 단백질을 코딩하는 뉴클레오티드 서열;
하나 이상의 가이드 RNA를 코딩하고 융합 단백질을 코딩하는 상기 뉴클레오티드 서열 각각은 상기 뉴클레오티드 서열에 대해 이종성인 프로모터에 대해 작동가능하게 연결되고;
하나 이상의 가이드 RNA는 표적 폴리뉴클레오티드 서열에 혼성화하고,
하나 이상의 가이드 RNA는 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열에 결합하여 그를 변형시키도록 지시하는 것인 시스템. - 표적 폴리뉴클레오티드를 서열식별번호: 374, 383, 397, 399, 407, 408, 411, 414, 416 또는 420과 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 데아미나제와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 탈아미노화시키는 방법이며, 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
- 표적 폴리뉴클레오티드를 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 아데노신 데아미나제 폴리펩티드와 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 방법이며:
a) 서열식별번호: 514와 적어도 90% 서열 동일성을 갖는 아미노산 서열;
b) 서열식별번호: 572와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 572의 위치 102에 상응하는 위치에서 리신, 서열식별번호: 572의 위치 104에 상응하는 위치에서 티로신, 및 서열식별번호: 572의 위치 106에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
c) 서열식별번호: 573과 적어도 90% 서열 동일성을 갖는 아미노산 서열;
d) 서열식별번호: 574와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 574의 위치 101에 상응하는 위치에서 글루탐산, 서열식별번호: 574의 위치 103에 상응하는 위치에서 세린, 및 서열식별번호: 574의 위치 105에 상응하는 위치에서 리신을 포함하는 아미노산 서열;
e) 서열식별번호: 575와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 575의 위치 101에 상응하는 위치에서 리신, 서열식별번호: 575의 위치 103에 상응하는 위치에서 류신, 및 서열식별번호: 575의 위치 105에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
f) 서열식별번호: 576과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 576의 위치 105에 상응하는 위치에서 알라닌 및 서열식별번호: 576의 위치 107에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
g) 서열식별번호: 577과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 577의 위치 102에 상응하는 위치에서 글리신, 서열식별번호: 577의 위치 104에 상응하는 위치에서 세린, 및 서열식별번호: 577의 위치 106에 상응하는 위치에서 아르기닌을 포함하는 아미노산 서열;
h) 서열식별번호: 578과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 578의 위치 105에 상응하는 위치에서 세린 및 서열식별번호: 578의 위치 107에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
i) 서열식별번호: 579와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 579의 위치 102에 상응하는 위치에서 세린, 서열식별번호: 579의 위치 104에 상응하는 위치에서 글루타민, 및 서열식별번호: 579의 위치 106에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
j) 서열식별번호: 580과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 580의 위치 111에 상응하는 위치에서 글리신을 포함하는 아미노산 서열;
k) 서열식별번호: 581과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 581의 위치 104에 상응하는 위치에서 글루타민, 서열식별번호: 581의 위치 106에 상응하는 위치에서 글리신, 및 서열식별번호: 581의 위치 108에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
l) 서열식별번호: 582와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 582의 위치 102에 상응하는 위치에서 아르기닌, 서열식별번호: 582의 위치 104에 상응하는 위치에서 트립토판, 및 서열식별번호: 582의 위치 106에 상응하는 위치에서 글루탐산을 포함하는 아미노산 서열;
m) 서열식별번호: 583과 적어도 90% 서열 동일성을 갖고, 서열식별번호: 583의 위치 104에 상응하는 위치에서 아르기닌 및 서열식별번호: 583의 위치 106에 상응하는 위치에서 세린을 포함하는 아미노산 서열; 및
n) 서열식별번호: 584와 적어도 90% 서열 동일성을 갖고, 서열식별번호: 584의 위치 110에 상응하는 위치에서 페닐알라닌, 서열식별번호: 584의 위치 112에 상응하는 위치에서 세린, 및 서열식별번호: 584의 위치 114에 상응하는 위치에서 트레오닌을 포함하는 아미노산 서열;
상기 아데노신 데아미나제 폴리펩티드는 표적 폴리뉴클레오티드에서 적어도 하나의 아데노신을 탈아미노화시키는 것인 방법. - 표적 폴리뉴클레오티드를 제37항 또는 제39항의 융합 단백질과 접촉시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며, 상기 DNA-결합 폴리펩티드는 상기 표적 폴리뉴클레오티드에 결합하고, 상기 데아미나제는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시키는 것인 방법.
- 표적 폴리뉴클레오티드를 제38항 또는 제40항의 융합 단백질과 접촉시키고, 하나 이상의 가이드 RNA (gRNA), 또는 하나 이상의 gRNA를 코딩하는 하나 이상의 뉴클레오티드 서열을 도입시키는 것을 포함하는, 표적 폴리뉴클레오티드를 변형시키는 방법이며;
하나 이상의 gRNA는 상기 표적 폴리뉴클레오티드에 혼성화하고, 융합 단백질의 RNA-가이드된 DNA-결합 폴리펩티드와의 복합체를 형성하여, 상기 융합 단백질이 상기 표적 폴리뉴클레오티드 서열에 결합하도록 지시하고, 융합 단백질의 상기 데아미나제 폴리펩티드는 상기 표적 폴리뉴클레오티드에서 적어도 하나의 뉴클레오티드를 탈아미노화시켜, 상기 표적 폴리뉴클레오티드를 변형시키는 것인 방법.
Applications Claiming Priority (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862785391P | 2018-12-27 | 2018-12-27 | |
US62/785,391 | 2018-12-27 | ||
US201962790261P | 2019-01-09 | 2019-01-09 | |
US201962790258P | 2019-01-09 | 2019-01-09 | |
US201962790256P | 2019-01-09 | 2019-01-09 | |
US201962790262P | 2019-01-09 | 2019-01-09 | |
US201962790266P | 2019-01-09 | 2019-01-09 | |
US62/790,256 | 2019-01-09 | ||
US62/790,262 | 2019-01-09 | ||
US62/790,266 | 2019-01-09 | ||
US62/790,258 | 2019-01-09 | ||
US62/790,261 | 2019-01-09 | ||
US201962932169P | 2019-11-07 | 2019-11-07 | |
US62/932,169 | 2019-11-07 | ||
PCT/US2019/068079 WO2020139783A2 (en) | 2018-12-27 | 2019-12-20 | Polypeptides useful for gene editing and methods of use |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210149686A true KR20210149686A (ko) | 2021-12-09 |
Family
ID=69182752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217023648A KR20210149686A (ko) | 2018-12-27 | 2019-12-20 | 유전자 편집에 유용한 폴리펩티드 및 사용 방법 |
Country Status (13)
Country | Link |
---|---|
US (2) | US20220145296A1 (ko) |
EP (2) | EP4339286A2 (ko) |
JP (2) | JP2022516130A (ko) |
KR (1) | KR20210149686A (ko) |
CN (1) | CN113631704A (ko) |
AU (1) | AU2019416108A1 (ko) |
BR (1) | BR112021012665A2 (ko) |
ES (1) | ES2970169T3 (ko) |
IL (1) | IL284400A (ko) |
MX (1) | MX2021007835A (ko) |
SG (1) | SG11202106977PA (ko) |
TW (1) | TW202039847A (ko) |
WO (1) | WO2020139783A2 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW202208626A (zh) | 2020-04-24 | 2022-03-01 | 美商生命編輯公司 | Rna引導核酸酶及其活性片段與變體,以及使用方法 |
CA3174356A1 (en) | 2020-07-01 | 2022-01-06 | Santosh NARAYAN | Compositions and methods for cellular reprogramming using circular rna |
JP2023534693A (ja) | 2020-07-15 | 2023-08-10 | ライフエディット セラピューティクス,インコーポレイティド | ウラシル安定化タンパク質並びにその活性断片及びバリアント並びに使用方法 |
TW202227624A (zh) | 2020-09-11 | 2022-07-16 | 美商生命編輯治療學公司 | Dna修飾酶及活性片段,及其變異體與使用方法 |
CN117295817A (zh) | 2021-03-22 | 2023-12-26 | 生命编辑制药股份有限公司 | Dna修饰酶及其活性片段和变体以及使用方法 |
EP4101928A1 (en) * | 2021-06-11 | 2022-12-14 | Bayer AG | Type v rna programmable endonuclease systems |
AU2022290382A1 (en) * | 2021-06-11 | 2023-11-23 | Bayer Aktiengesellschaft | Type v rna programmable endonuclease systems |
WO2022261394A1 (en) | 2021-06-11 | 2022-12-15 | LifeEDIT Therapeutics, Inc. | Rna polymerase iii promoters and methods of use |
AU2022336615A1 (en) | 2021-09-02 | 2024-04-11 | Sanofi | Compositions and methods for rna affinity purification |
CA3234107A1 (en) | 2021-10-05 | 2023-04-13 | Florent PERAL | Methods for freezing and freeze-drying lipid nanoparticles (lnps) and lnps obtained with the same |
WO2023118068A1 (en) * | 2021-12-23 | 2023-06-29 | Bayer Aktiengesellschaft | Novel small type v rna programmable endonuclease systems |
WO2023135305A1 (en) | 2022-01-17 | 2023-07-20 | Sanofi | Lipidic compounds, and uses thereof |
WO2023141602A2 (en) | 2022-01-21 | 2023-07-27 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2023242425A1 (en) | 2022-06-17 | 2023-12-21 | Sanofi | Compositions and methods for circular rna affinity purification |
WO2024020346A2 (en) | 2022-07-18 | 2024-01-25 | Renagade Therapeutics Management Inc. | Gene editing components, systems, and methods of use |
WO2024033901A1 (en) | 2022-08-12 | 2024-02-15 | LifeEDIT Therapeutics, Inc. | Rna-guided nucleases and active fragments and variants thereof and methods of use |
WO2024042489A1 (en) | 2022-08-25 | 2024-02-29 | LifeEDIT Therapeutics, Inc. | Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing |
WO2024044723A1 (en) | 2022-08-25 | 2024-02-29 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2024095245A2 (en) | 2022-11-04 | 2024-05-10 | LifeEDIT Therapeutics, Inc. | Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4196265A (en) | 1977-06-15 | 1980-04-01 | The Wistar Institute | Method of producing antibodies |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
US4853331A (en) | 1985-08-16 | 1989-08-01 | Mycogen Corporation | Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera |
US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US5039523A (en) | 1988-10-27 | 1991-08-13 | Mycogen Corporation | Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin |
KR920701453A (ko) | 1989-03-17 | 1992-08-11 | 미리엄 디. 멕코나헤이 | 유전자발현의 외부조절 |
ATE225853T1 (de) | 1990-04-12 | 2002-10-15 | Syngenta Participations Ag | Gewebe-spezifische promotoren |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
CA2051562C (en) | 1990-10-12 | 2003-12-02 | Jewel M. Payne | Bacillus thuringiensis isolates active against dipteran pests |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
DE69230290T2 (de) | 1991-08-27 | 2000-07-20 | Novartis Ag | Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz |
TW261517B (ko) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
US5659026A (en) | 1995-03-24 | 1997-08-19 | Pioneer Hi-Bred International | ALS3 promoter |
US6072050A (en) | 1996-06-11 | 2000-06-06 | Pioneer Hi-Bred International, Inc. | Synthetic promoters |
CA2315546C (en) | 1998-02-26 | 2008-04-29 | Pioneer Hi-Bred International, Inc. | Constitutive maize promoters |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
CA2371442A1 (en) | 1999-05-04 | 2000-11-09 | Monsanto Technology Llc | Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants |
US6593293B1 (en) | 1999-09-15 | 2003-07-15 | Monsanto Technology, Llc | Lepidopteran-active Bacillus thuringiensis δ-endotoxin compositions and methods of use |
AU2002360291A1 (en) | 2001-12-17 | 2003-06-30 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (aav) serotype 8 sequences |
US20050183161A1 (en) | 2003-10-14 | 2005-08-18 | Athenix Corporation | AXMI-010, a delta-endotoxin gene and methods for its use |
WO2005066202A2 (en) | 2003-12-22 | 2005-07-21 | E.I. Du Pont De Nemours And Company | Bacillus cry9 family members |
BRPI0713646B1 (pt) | 2006-06-14 | 2017-11-21 | Athenix Corporation | Nucleic acid molecule; vector; hospedeira cell; polipeptídeo with pesticide activity and method for their production; composition; method for obtaining a plant, as well as methods for control of pest populations; to exterminate a plague of lepidópteros or coleópteros; to protect a plant of a nematode prague |
DK2334794T3 (en) | 2008-09-15 | 2017-02-20 | Children's Medical Center Corp | MODULATION OF BCL11A FOR TREATMENT OF HEMOGLOBINOPATHIES |
WO2010132092A2 (en) | 2009-05-12 | 2010-11-18 | The Scripps Research Institute | Cytidine deaminase fusions and related methods |
RS55550B1 (sr) | 2009-07-02 | 2017-05-31 | Athenix Corp | Axmi-205 pesticidni gen i postupci za njegovu upotrebu |
WO2011084324A2 (en) | 2009-12-21 | 2011-07-14 | Pioneer Hi-Bred International, Inc. | Novel bacillus thuringiensis gene with lepidopteran activity |
CN103154247A (zh) | 2010-08-19 | 2013-06-12 | 先锋国际良种公司 | 对鳞翅目昆虫具有活性的新苏云金杆菌基因 |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
MA37663B1 (fr) | 2012-05-25 | 2019-12-31 | Univ California | Procédés et compositions permettant la modification de l'adn cible dirigée par l'arn et la modulation de la transcription dirigée par l'arn |
ES2813080T3 (es) | 2012-07-11 | 2021-03-22 | Sangamo Therapeutics Inc | Métodos y composiciones para el tratamiento de enfermedades por almacenamiento lisosomal |
KR20150105634A (ko) * | 2012-12-12 | 2015-09-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화 |
US20150166985A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting von willebrand factor point mutations |
US10450584B2 (en) | 2014-08-28 | 2019-10-22 | North Carolina State University | Cas9 proteins and guiding features for DNA targeting and genome editing |
AU2015101792A4 (en) * | 2014-12-24 | 2016-01-28 | Massachusetts Institute Of Technology | Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
CA3000917A1 (en) * | 2015-10-09 | 2017-04-13 | Monsanto Technology Llc | Rna-guided nucleases and uses thereof |
JP7067793B2 (ja) | 2015-10-23 | 2022-05-16 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸塩基編集因子およびその使用 |
KR102547316B1 (ko) | 2016-08-03 | 2023-06-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
CN109957569B (zh) * | 2017-12-22 | 2022-10-25 | 苏州齐禾生科生物科技有限公司 | 基于cpf1蛋白的碱基编辑系统和方法 |
-
2019
- 2019-12-20 EP EP23199688.5A patent/EP4339286A2/en active Pending
- 2019-12-20 ES ES19839624T patent/ES2970169T3/es active Active
- 2019-12-20 US US17/418,498 patent/US20220145296A1/en active Pending
- 2019-12-20 CN CN201980091657.4A patent/CN113631704A/zh active Pending
- 2019-12-20 SG SG11202106977PA patent/SG11202106977PA/en unknown
- 2019-12-20 AU AU2019416108A patent/AU2019416108A1/en active Pending
- 2019-12-20 EP EP19839624.4A patent/EP3902911B1/en active Active
- 2019-12-20 WO PCT/US2019/068079 patent/WO2020139783A2/en active Application Filing
- 2019-12-20 MX MX2021007835A patent/MX2021007835A/es unknown
- 2019-12-20 JP JP2021538143A patent/JP2022516130A/ja active Pending
- 2019-12-20 BR BR112021012665A patent/BR112021012665A2/pt unknown
- 2019-12-20 KR KR1020217023648A patent/KR20210149686A/ko active Search and Examination
- 2019-12-24 TW TW108147446A patent/TW202039847A/zh unknown
-
2021
- 2021-06-27 IL IL284400A patent/IL284400A/en unknown
-
2023
- 2023-05-12 US US18/316,698 patent/US20230272398A1/en active Pending
-
2024
- 2024-01-24 JP JP2024008844A patent/JP2024050676A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230272398A1 (en) | 2023-08-31 |
AU2019416108A1 (en) | 2021-08-12 |
CN113631704A (zh) | 2021-11-09 |
ES2970169T3 (es) | 2024-05-27 |
US20220145296A1 (en) | 2022-05-12 |
BR112021012665A2 (pt) | 2021-11-03 |
WO2020139783A3 (en) | 2020-07-23 |
SG11202106977PA (en) | 2021-07-29 |
JP2022516130A (ja) | 2022-02-24 |
TW202039847A (zh) | 2020-11-01 |
MX2021007835A (es) | 2021-08-11 |
EP3902911A2 (en) | 2021-11-03 |
EP3902911C0 (en) | 2023-12-13 |
EP3902911B1 (en) | 2023-12-13 |
JP2024050676A (ja) | 2024-04-10 |
WO2020139783A2 (en) | 2020-07-02 |
EP4339286A2 (en) | 2024-03-20 |
IL284400A (en) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210149686A (ko) | 유전자 편집에 유용한 폴리펩티드 및 사용 방법 | |
US11162114B2 (en) | RNA-guided nucleases and active fragments and variants thereof and methods of use | |
JP2021166513A (ja) | 配列操作のためのCRISPR−Cas成分系、方法および組成物 | |
KR20150107739A (ko) | 유전자 산물의 발현의 변경을 위한 crispr―cas 시스템 및 방법 | |
KR20160034901A (ko) | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 | |
KR20220062289A (ko) | Rna-가이드된 뉴클레아제 및 그의 활성 단편 및 변이체 및 사용 방법 | |
US11859181B2 (en) | RNA-guided nucleases and active fragments and variants thereof and methods of use | |
CA3125175A1 (en) | Polypeptides useful for gene editing and methods of use | |
TW202346583A (zh) | Rna引導核酸酶、其活性片段與變體,及使用方法 | |
JP2024501892A (ja) | 新規の核酸誘導型ヌクレアーゼ | |
AU2021254373A1 (en) | Genome engineering method and genome engineering kit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |