KR20200121782A - 아데노신 염기 편집제의 용도 - Google Patents

아데노신 염기 편집제의 용도 Download PDF

Info

Publication number
KR20200121782A
KR20200121782A KR1020207013985A KR20207013985A KR20200121782A KR 20200121782 A KR20200121782 A KR 20200121782A KR 1020207013985 A KR1020207013985 A KR 1020207013985A KR 20207013985 A KR20207013985 A KR 20207013985A KR 20200121782 A KR20200121782 A KR 20200121782A
Authority
KR
South Korea
Prior art keywords
seq
nucleic acid
acid sequence
sequence
mutation
Prior art date
Application number
KR1020207013985A
Other languages
English (en)
Inventor
데이비드 알. 리우
니콜 고델리
마이클 에스. 파커
그레고리 뉴비
Original Assignee
더 브로드 인스티튜트, 인코퍼레이티드
프레지던트 앤드 펠로우즈 오브 하바드 칼리지
빔 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 브로드 인스티튜트, 인코퍼레이티드, 프레지던트 앤드 펠로우즈 오브 하바드 칼리지, 빔 테라퓨틱스, 인크. filed Critical 더 브로드 인스티튜트, 인코퍼레이티드
Publication of KR20200121782A publication Critical patent/KR20200121782A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/795Porphyrin- or corrin-ring-containing peptides
    • C07K14/805Haemoglobins; Myoglobins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

본 개시내용은 혈액 질환/장애, 예컨대 겸상 적혈구 질환, 혈색소증, 혈우병 및 베타-지중해빈혈을 치료하기 위한 방법 및 조성물을 제공한다. 예를 들어, 본 개시내용은 HBG1/2의 프로모터를 표적화하여 태아성 헤모글로빈의 발현을 증가시키는 점 돌연변이를 생성하는 치료적 가이드 RNA를 제공한다. 또 다른 예로서, 본 개시내용은 HBB, 인자 VIII 및 HFE 내의 돌연변이를 표적화하여 겸상 적혈구 질환, 베타-지중해빈혈, 혈우병 및 혈색소증을 치료하는 치료적 가이드 RNA를 제공한다. 본 개시내용은 또한 Cas9 (예를 들어, Cas9 니카제) 도메인 및 DNA 내의 아데노신을 탈아미노화시키는 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 융합 단백질은 융합 단백질을 DNA 서열 (예를 들어, HBG1 또는 HBG2 프로모터 서열, 또는 HFE, GBB 또는 F8 유전자 서열)에 표적화하는 핵산, 예컨대 가이드 RNA (gRNA)와 복합체화된다. 이러한 복합체는 태아성 헤모글로빈의 발현을 증가시키거나 또는 HFE 내의 점 돌연변이 (예를 들어, C282Y)를 교정하는데 유용할 수 있다.

Description

아데노신 염기 편집제의 용도
핵산 서열의 표적화된 편집, 예를 들어 표적화된 절단 또는 게놈 DNA 내로의 특정 변형의 표적화된 도입은 유전자 기능의 연구를 위한 고도로 유망한 접근법이고, 또한 인간 유전 질환에 대한 새로운 요법을 제공하는 잠재력을 갖는다. 많은 유전 질환은 원칙적으로 게놈 내 특정 위치에서 특정 뉴클레오티드 변화 (예를 들어, 질환과 연관된 유전자의 특정 코돈에서 A에서 G로 또는 T에서 C로의 변화)를 유발함으로써 치료될 수 있기 때문에, 이러한 정확한 유전자 편집을 달성하기 위한 프로그램가능한 방식의 개발은 강력한 신규 연구 도구, 뿐만 아니라 유전자 편집-기반 치료제에 대한 잠재적 신규 접근법 둘 다를 나타낸다.
본 개시내용은 혈액 질환/장애, 예컨대 겸상 적혈구 질환, 혈색소증, 혈우병 및 베타-지중해빈혈을 치료하기 위한 방법 및 조성물을 제공한다. 예를 들어, 본 개시내용은 HBG1/2의 프로모터를 표적화하여 태아성 헤모글로빈의 발현을 증가시키는 점 돌연변이를 생성하는 치료적 가이드 RNA를 제공한다. 또 다른 예로서, 본 개시내용은 HBB, 인자 VIII 및 HFE 내의 돌연변이 (예를 들어, 병원성 돌연변이)를 표적화하여 겸상 적혈구 질환, 베타-지중해빈혈 (예를 들어, Hb C 및 Hb E), 혈우병 및 혈색소증을 치료하는 치료적 가이드 RNA를 제공한다. 본원에 제공된 가이드 RNA는 염기 편집제 단백질 (예를 들어, 아데노신 염기 편집제)과 복합체화되어 유전자 또는 유전자 프로모터 내의 점 돌연변이를 생성할 수 있으며, 이는 병원성 돌연변이를 교정하거나, 비-병원성 점 돌연변이를 생성하거나, 또는 유전자의 발현을 조정할 (예를 들어, 증가시킬)할 수 있다.
아데노신 데아미나제 및 핵산 프로그램가능한 DNA 결합 단백질 (예를 들어, Cas9)을 사용하여 폴리뉴클레오티드 (예를 들어, DNA)를 변형시키는 조성물, 키트 및 방법이 본원에 제공된다. 본 개시내용의 일부 측면은 DNA와 관련하여 아데노신의 가수분해성 탈아미노화 (구아닌 (G)과 같이 염기 쌍을 형성하는 이노신을 형성함)를 촉매하는 핵염기 편집 단백질을 제공한다. DNA에 작용하는 공지된 자연 발생 아데노신 데아미나제는 존재하지 않는다. 대신에, 공지된 아데노신 데아미나제는 RNA (예를 들어, tRNA 또는 mRNA)에 작용한다. 이러한 결점을 극복하기 위해, 최초 데옥시아데노신 데아미나제를 진화시켜 DNA 기질을 받아들이고 데옥시아데노신 (dA)을 데옥시이노신으로 탈아미노화시키도록 하였다. 이러한 아데노신 데아미나제는 2017년 8월 3일에 출원된 국제 출원 번호: PCT/US2017/045,381에 기재되어 있고; 이의 전체 내용은 본원에 참조로 포함된다. 에스케리키아 콜라이(Escherichia coli)로부터의 tRNA에 작용하는 아데노신 데아미나제 (ADAT) (tRNA 아데노신 데아미나제 A, TadA)를 dCas9 또는 Cas9 니카제 도메인에 공유 융합시키고, 구축물의 데아미나제 부분에 돌연변이를 함유하는 융합 단백질을 조립하였다. 이. 콜라이 TadA (ecTadA) 이외에도, 다른 자연 발생 아데노신 데아미나제, 예컨대 인간 ADAR (RNA에 작용하는 아데노신 데아미나제), 마우스 ADA (아데노신 데아미나제) 및 인간 ADAT2가 dCas9 또는 Cas9 니카제 도메인에 융합되어 아데노신 핵염기 편집제 (ABE) 융합 단백질 구축물을 생성할 수 있다. 이들 융합 단백질의 방향적 진화는, 특히 게놈 편집의 현재 Cas9 뉴클레아제-매개된 HDR 방법과 비교하였을 때, 표적 A-T 염기 쌍을 G-C 염기 쌍으로 낮은 오프-타겟 변형 및 낮은 비율의 삽입결실(indel) (확률적 삽입 또는 결실) 형성 하에 효율적으로 전환시키는 프로그램가능한 아데노신 염기 편집제를 생성하였다. 본원에 개시된 ABE는 질환-연관 점 돌연변이의 교정 및 질환-억제 점 돌연변이의 도입 (예를 들어, 단일 뉴클레오티드 다형성) 둘 다에 사용될 수 있다.
핵염기 편집 단백질의 데아미나제 도메인 내의 돌연변이는 아데노신 데아미나제를 진화시킴으로써 제조되었다. 예를 들어, DNA 내의 아데노신을 탈아미노화시킬 수 있는 ecTadA 변이체는 서열식별번호(SEQ ID NO): 1의 하기 돌연변이: W23L, W23R, R26G, H36L, N37S, P48S, P48T, P48A, I49V, R51L, N72D, L84F, S97C, D108N, A106V, H123Y, G125A, A142N, S146C, D147Y, R152H, R152P, E155V, I156F, K157N 및 K161T 중 1개 이상을 포함한다. 그러나, DNA 내의 아데노신을 탈아미노화시킬 수 있는 변이체를 생성하기 위해 다른 아데노신 데아미나제에서 상동 돌연변이가 만들어질 수 있다는 것이 인지되어야 한다. 도 7은 본원에 개시된 방법에 유용할 수 있는 ecTadA 변이체를 예시한다.
본원에 제공된 예에서, 진화된 융합 단백질의 일반 구조를 갖는 예시적인 핵염기 편집제, 예컨대 ecTadA(D108X; X=G, V 또는 N)-XTEN-nCas9는 세포, 예컨대 진핵 세포 (예를 들어, Hek293T 포유동물 세포)에서 A에서 G로의 전이 돌연변이를 촉매하였다. 다른 예에서, 예시적인 핵염기 편집제는 2개의 ecTadA 도메인 및 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 함유한다. 2개의 ecTadA 도메인은 동일할 수 있거나 (예를 들어, 동종이량체), 또는 2개의 상이한 ecTadA 도메인일 수 있다 (예를 들어, 이종이량체 (예를 들어, 야생형 ecTadA 및 ecTadA(A106V/D108N))). 예를 들어, 핵염기 편집제는 일반 구조 ecTadA-ecTadA*-nCas9를 가질 수 있으며, 여기서 ecTadA*는 서열식별번호: 1의 1개 이상의 돌연변이를 포함하는 진화된 ecTadA를 나타낸다. 본원에 제공된 ecTadA 변이체를 함유하는 핵염기 편집제의 추가의 예는 포유동물 세포에서의 핵염기 편집제의 성능 개선을 입증한다.
어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 본원에 기재된 아데노신 핵염기 편집제는 DNA 내의 A 염기를 탈아미노화시키는 ecTadA 변이체를 사용하여 이노신 형성을 통해 A에서의 G로의 돌연변이를 유발함으로써 작용한다. 이노신은 우선적으로 C와 수소 결합하여 DNA 복제 동안 A에서 G로의 돌연변이를 유발한다. Cas9 (또는 또 다른 핵산 프로그램가능한 DNA 결합 단백질)에 공유 테더링되는 경우에, 아데노신 데아미나제 (예를 들어, ecTadA)는 관심 유전자에 국재화되고 ssDNA 기질에서 A에서 G로의 돌연변이를 촉매한다. 이 편집제는 A에서 G로의 복귀가 요구되는 질환-관련 유전자에서 단일 뉴클레오티드 다형성 (SNP)을 표적화하고 되돌리는데 사용될 수 있다. 이 편집제는 또한 T에 대향하는 A를 G로 돌연변이시킴으로써 T에서 C로의 복귀가 요구되는 질환-관련 유전자에서 단일 뉴클레오티드 다형성 (SNP)을 표적화하고 되돌리는데 사용될 수도 있다. 이때, T는, 예를 들어 염기 절제 복구 메카니즘에 의해 C로 대체될 수 있거나, 또는 DNA 복제의 후속 라운드에서 변화될 수 있다. 따라서, 본원에 기재된 아데노신 염기 편집제는 A 핵염기를 탈아미노화시켜, 질환 또는 장애와 연관되지 않은 뉴클레오티드 서열을 제공할 수 있다. 일부 측면에서, 본원에 기재된 아데노신 염기 편집제는 유전자 프로모터 내의 아데노신 (A) 핵염기를 탈아미노화시키는데 유용할 수 있다. 일부 실시양태에서, 탈아미노화는 유전자의 전사를 유도하도록 한다. 유전자의 전사의 유도는 유전자에 의해 코딩되는 단백질 (예를 들어, 유전자 산물)의 발현의 증가를 일으킨다. 염기 편집제에 결합된 가이드 RNA (gRNA)는 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 HBG1 및/또는 HBG2 유전자의 프로모터 내의 핵산 서열이다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 핵산 서열
Figure pct00001
를 포함한다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 핵산 서열
Figure pct00002
를 포함한다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 서열식별번호: 838-845 중 어느 하나의 핵산 위치 14에서의 T (볼드체로 제시됨)를 포함하고, 위치 14에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열에서 T에서 C로의 돌연변이를 유발한다. 일부 실시양태에서, 표적 핵산은 서열식별번호: 838-845 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함한다. 일부 실시양태에서, 가이드 RNA는 프로모터 내의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 26개의 인접 핵산을 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열
Figure pct00003
를 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열
Figure pct00004
를 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 서열식별번호: 254-280 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 염기 편집제는 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질을 포함하고, (ii) 아데노신 데아미나제는 핵염기를 탈아미노화시키기 위해 관심 표적 서열에 상보적인 가이드 RNA와 조합되어 사용된다. 일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제일 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 1개 이상의 돌연변이를 포함하는 이. 콜라이 TadA (ecTadA)이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함하는 ecTadA이다.
따라서, 일부 측면에서, 본원에 기재된 염기 편집제 및 가이드 RNA 복합체는 HBG1 및/또는 HBG2 유전자의 프로모터 내 C에서 T로의 돌연변이에 의해 유발되는 질환 또는 장애를 치료하는데 유용할 수 있다. 일부 실시양태에서, 질환 또는 장애는 혈액의 질환 또는 장애이다. 특정 실시양태에서, 질환 또는 장애는 빈혈이다. 일부 실시양태에서, 빈혈은 겸상 적혈구성 빈혈이다. 예를 들어, HBG1 및/또는 HBG2 유전자의 프로모터 내 -198C에서 T로의 돌연변이는 γ-글로빈 발현 수준의 감소를 일으켜, 겸상 적혈구 질환 (SCD) 및 β-지중해빈혈의 발생을 촉진할 수 있다. HBG1 및/또는 HBG2 유전자의 프로모터 내의 아데노신 핵염기의 탈아미노화는 프로모터 내의 T-A 염기 쌍이 프로모터 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 아데노신 핵염기의 탈아미노화는 태아성 헤모글로빈의 유전성 지속 (HPFH)이 촉진되는 서열을 촉진한다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 단백질의 양의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG2 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG2 단백질의 양의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 및 HBG2 유전자 둘 다의 전사의 증가를 일으킨다. 일부 실시양태에서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBG1 및 HBG2 단백질 둘 다의 양의 증가를 일으킨다.
또 다른 측면에서, 본원에 기재된 아데노신 염기 편집제는 유전자 내의 아데노신 (A) 핵염기를 탈아미노화시켜 유전자 내의 점 돌연변이를 교정하는데 유용할 수 있다. 일부 실시양태에서, 유전자는 야생형 코돈과 비교하여 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 유발하는 코돈 내의 돌연변이를 포함할 수 있다. 염기 편집제에 결합된 가이드 RNA (gRNA)는 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 HFE 유전자 내의 핵산 서열이다. 일부 실시양태에서, HFE 유전자는 C에서 T로의 돌연변이를 포함한다. 본원에 기재된 염기 편집제 및 가이드 RNA 복합체에 의한 T에 상보적인 A 핵염기의 탈아미노화는 C에서 T로의 돌연변이를 교정한다 (예를 들어, 도 7 참조). 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 핵산 서열을 포함한다. 일부 실시양태에서, HFE 유전자는 Cys에서 Tyr로의 돌연변이 (예를 들어, C282Y)를 포함하는 인간 혈색소증 (HFE) 단백질을 코딩한다. 본원에 기재된 염기 편집제 및 가이드 RNA 복합체에 의한 T에 상보적인 A 핵염기의 탈아미노화는 HFE 단백질 내의 Cys에서 Tyr로의 돌연변이를 교정하여, 야생형 단백질의 발현을 유발한다. 일부 실시양태에서, HFE 유전자 내의 표적 핵산 서열은 핵산 서열
Figure pct00005
를 포함한다. 일부 실시양태에서, 표적 핵산은 서열식별번호: 854-861의 핵산 서열 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함한다. 일부 실시양태에서, HFE 유전자 내의 표적 핵산 서열은 핵산 서열
Figure pct00006
를 포함한다. 일부 실시양태에서, 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 26개의 인접 핵산을 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열
Figure pct00007
를 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 서열식별번호: 862-869의 핵산 서열 중 어느 하나의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 가이드 서열은 핵산 서열
Figure pct00008
를 포함한다. 일부 실시양태에서, 염기 편집제는 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질을 포함하고, (ii) 아데노신 데아미나제는 핵염기를 탈아미노화시키기 위해 관심 표적 서열에 상보적인 가이드 RNA와 조합되어 사용된다. 일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제일 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 1개 이상의 돌연변이를 포함하는 이. 콜라이 TadA (ecTadA)이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함하는 ecTadA이다.
따라서, 일부 측면에서, 본원에 기재된 염기 편집제 및 가이드 RNA 복합체는 HFE 유전자 내 C에서 T로의 돌연변이에 의해 유발되는 질환 또는 장애를 치료하는데 유용할 수 있다. 일부 실시양태에서, 장애는 철 축적 장애이다. 일부 실시양태에서, 철 축적 장애는 유전성 혈색소증 (HHC)이다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자 내의 T-A 염기 쌍이 HFE 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자로부터 전사된 HFE 단백질 기능의 증가를 일으킨다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 유전성 혈색소증 (HHC)과 연관된 서열을 교정하도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 철 축적 장애의 1종 이상의 증상을 호전시킨다.
일부 실시양태에서, 본원에 제공된 아데노신 데아미나제는 핵산 분자 내의 아데노신을 탈아미노화시킬 수 있다. 일부 실시양태에서, 아데노신 핵염기를 탈아미노화시키는 방법은 세포 내의 핵산 분자를 (i) 아데노신 염기 편집제 및 (ii) 가이드 RNA를 포함하는 복합체와 시험관내에서 접촉시키는 것을 포함한다. 일부 실시양태에서, 아데노신 핵염기를 탈아미노화시키는 방법은 세포 내의 핵산 분자를 (i) 아데노신 염기 편집제 및 (ii) 가이드 RNA를 포함하는 복합체와 생체내에서 접촉시키는 것을 포함한다. 일부 실시양태에서, 아데노신 핵염기를 탈아미노화시키는 방법은 세포 내의 핵산 분자를 (i) 아데노신 염기 편집제 및 (ii) 가이드 RNA를 포함하는 복합체와 접촉시키는 것을 포함하며, 여기서 세포는 대상체 내에 존재한다. 일부 실시양태에서, 세포는 불멸화 림프모구성 세포 (LCL)이다. 본 개시내용의 다른 측면은 Cas9 도메인 및 아데노신 데아미나제 도메인, 예를 들어 DNA 내의 아데노신을 탈아미노화시킬 수 있는 조작된 데아미나제 도메인을 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 융합 단백질은 핵 국재화 서열 (NLS), 이노신 염기 절제 복구의 억제제 (예를 들어, dISN) 및/또는 1종 이상의 링커 중 하나 이상을 포함한다.
일부 측면에서, 본 개시내용은 데옥시리보핵산 (DNA) 기질 내의 아데노신을 탈아미노화시킬 수 있는 아데노신 데아미나제를 제공한다. 일부 실시양태에서, 아데노신 데아미나제는 박테리아, 예를 들어, 이. 콜라이 또는 에스. 아우레우스로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 TadA 데아미나제이다. 일부 실시양태에서, TadA 데아미나제는 이. 콜라이 TadA 데아미나제 (ecTadA)이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, X는 G, N, V, A 또는 Y이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, X는 V, G, I, L 또는 A이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X 및 D108X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 및 D108N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 A106X, D108X, D147X, E155X, L84X, H123X 및 I156X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 A106V, D108N, D147Y, E155V, L84F, H123Y 및 I156F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 A106X, D108X, D147X, E155X, L84X, H123X, I156X, H36X, R51X, S146X 및 K157X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 A106V, D108N, D147Y, E155V, L84F, H123Y, I156F, H36L, R51L, S146C 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신은 A106X, D108X, D147X, E155V, L84X, H123X, I156X, H36X, R51X, S146X, K157X, W23X, P48X 및 R152X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 단백질에서 발견되는 아미노산 이외의 임의의 아미노산이다. 일부 실시양태에서, 아데노신 데아미나제는 A106V, D108N, D147Y, E155V, L84F, H123Y, I156F, H36L, R51L, S146C, K157N, W23R, P48A 및 R152P 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 본원에 제공된 아데노신 데아미나제는 본원에 제공된 돌연변이 중 1개 이상을 임의의 조합으로 함유할 수 있는 것으로 인지되어야 한다.
또 다른 측면에서, 본 개시내용은 광범위한 표적 서열 상용성을 갖는 아데노신 핵염기 편집제 (ABE)를 제공한다. 일반적으로, 천연 ecTadA는 tRNAArg의 안티코돈 루프의 서열 UAC (예를 들어, 표적 서열)에서의 아데닌을 탈아미노화한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 1개 이상의 ecTadA 도메인, 예컨대 본원에 제공된 임의의 아데노신 데아미나제를 포함하는 ABE의 유용성을 확장시키기 위해, 아데노신 데아미나제 단백질이 아데노신 핵염기 편집제 복합체의 편집 효율을 손상시키지 않으면서 프로토스페이서 서열 내의 폭넓게 다양한 표적 서열을 인식하도록 최적화되었다. 일부 실시양태에서, 표적 서열은 5'-NAN-3'이며, 여기서 N은 T, C, G 또는 A이다. 예를 들어, 표적 서열은 도 3a에 제시된다. 일부 실시양태에서, 표적 서열은 5'-TAC-3'를 포함한다. 일부 실시양태에서, 표적 서열은 5'-GAA-3'를 포함한다.
일부 실시양태에서, 염기 편집제는 서열식별번호: 707의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 708의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 709의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 710의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 염기 편집제는 서열식별번호: 711의 아미노산 서열을 포함하거나 이로 이루어진다.
또 다른 측면에서, 본 개시내용은 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), (ii) 아데노신 데아미나제를 포함하는 융합 단백질, 및 (iii) 융합 단백질을 관심 표적 서열에 지시하는 가이드 RNA를 포함하는 복합체; 및 임의로 제약상 허용되는 부형제를 포함하는 제약 조성물을 제공한다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제 도메인 또는 그의 임의의 조합일 수 있다. 일부 실시양태에서, napDNAbp는 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HBG1 및/또는 HBG2 유전자의 프로모터로 지시하는 가이드 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 핵산 서열은 서열식별번호: 846-853의 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HFE 유전자로 지시하는 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 핵산 서열은 서열식별번호: 862-870의 핵산 서열을 포함한다. 일부 실시양태에서, 제약 조성물은 그를 필요로 하는 대상체에게 (예를 들어, 질환 또는 장애를 치료하기 위해) 투여된다. 일부 실시양태에서, 대상체는 혈액 질환을 갖는다. 일부 실시양태에서, 혈액 질환은 빈혈이다. 일부 실시양태에서, 빈혈은 겸상 적혈구성 빈혈이다. 일부 실시양태에서, 대상체는 철 축적 장애를 갖는다. 일부 실시양태에서, 철 축적 장애는 유전성 혈색소증 (HHC)이다. 또 다른 측면에서, 본 개시내용은 (a) (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 (ii) 아데노신 데아미나제를 포함하는 융합 단백질을 코딩하는 핵산 서열; (b) (a)의 서열의 발현을 구동하는 이종 프로모터; 및 (c) 가이드 RNA 백본을 코딩하는 발현 구축물을 포함하며, 여기서 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 RNA 백본 내로의 클로닝을 가능하게 하도록 위치된 클로닝 부위를 포함하는 것인 핵산 구축물을 포함하는 키트를 제공한다. 아데노신 데아미나제는 본원에 기재된 임의의 아데노신 데아미나제 도메인 또는 그의 임의의 조합일 수 있다. 일부 실시양태에서, napDNAbp는 Cas9 도메인이다. 일부 실시양태에서, Cas9 도메인은 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HBG1 및/또는 HBG2 유전자의 프로모터로 지시하는 핵산 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 서열식별번호: 838-845 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 융합 단백질을 HFE 유전자로 지시하는 핵산 서열을 포함한다. 일부 실시양태에서, 표적 핵산 서열은 서열식별번호: 854-861 중 어느 하나의 핵산 서열을 포함한다.
상기 개요는 비제한적 방식으로 본원에 개시된 기술의 실시양태, 이점, 특색 및 용도의 일부를 예시하는 것으로 의도된다. 본원에 개시된 기술의 다른 실시양태, 이점, 특색 및 용도는 상세한 설명, 도면, 실시예 및 청구범위로부터 분명해질 것이다.
도 1a 내지 1c는 A·T에서 G·C로의 염기 편집제 (ABE)에 의한 염기 편집의 범주 및 개관을 보여준다. 도 1a: ClinVar 데이터베이스에서 공지된 병원성 인간 SNP를 교정하는데 요구되는 염기 쌍 변화의 상대 분포. 도 1b: 아데노신 (A)의 가수분해성 탈아미노화는 이노신 (I)을 형성하며, 이는 폴리머라제 효소에 의해 구아노신 (G)으로 판독된다. 도 1c: ABE-매개된 A·T에서 G·C로의 염기 편집 전략. ABE는 자연에 존재하는 것으로 공지되지 않은 가설 데옥시아데노신 데아미나제 및 촉매적으로 손상된 Cas9를 함유한다. 이들은 관심 이중-가닥 DNA 표적에 가이드 RNA-프로그램화 방식으로 결합하여, "R-루프" 복합체에서 단일 가닥 DNA의 소형 버블을 노출시킨다. 데옥시아데노신 데아미나제 도메인은 이러한 단일-가닥 버블 내에서 데옥시아데노신에서 데옥시이노신으로의 형성을 촉매한다. DNA 복구 또는 복제 후, 원래의 A·T 염기 쌍은 표적 부위에서 G·C 염기 쌍으로 대체된다.
도 2a 내지 2c는 ABE의 단백질 진화 및 조작을 보여준다. 도 2a: RNA 아데노신 데아미나제로부터 출발하여 DNA 데옥시아데노신 데아미나제를 진화시키는 전략. 이. 콜라이 세포의 라이브러리는 각각 촉매 기능상실 Cas9 (dCas9)에 융합된 돌연변이체 ecTadA (TadA*) 유전자를 발현하는 플라스미드, 및 항생제 내성을 회복시키기 위해 1개 이상의 A·T에서 G·C로의 돌연변이를 요구하는 결함성 항생제 내성 유전자를 발현하는 선택 플라스미드를 보유한다. 각 라운드의 돌연변이 및 선택에서 생존한 TadA* 변이체로부터의 돌연변이를 포유동물 ABE 아키텍처 내로 도입하고, 인간 세포에서 프로그램가능한 A·T에서 G·C로의 염기 편집 활성에 대해 검정하였다. 도 2b: 각 라운드의 진화로부터 발생하는 진화된 ABE의 하위세트의 유전자형. 본 연구에서 특징화된 모든 57개의 진화된 ABE 유전자형의 목록에 대해서는, 도 7을 참조한다. 이량체화 상태 (단량체, 진화된 TadA* 도메인의 동종이량체, 또는 야생형 TadA-진화된 TadA*의 이종이량체) 및 링커 길이 (아미노산의 수)가 또한 열거된다. 돌연변이는 이들이 확인된 진화 라운드에 기초하여 착색되어 있다. 도 2c: tRNAArg2와 복합체화된 에스. 아우레우스 TadA (제시되지 않음)의 구조 (PDB 2B3J)와 정렬된 이. 콜라이 TadA 데아미나제 구조 (PDB 1Z3A)의 3개의 도면. tRNA의 UAC 안티코돈 루프는 야생형 TadA의 내인성 기질이다. TadA 이량체 및 tRNA 안티코돈 루프가 좌측에 제시되고; 기질 아데노신 상류의 U의 리보스의 2' 히드록실 기 근처의 잔기가 중간에 제시되고; ABE 진화 동안 돌연변이되고 UAC 기질을 둘러싸는 잔기가 우측에 제시된다. 야생형 잔기는 각 라운드의 진화로부터 나타나는 돌연변이 및 도 2b에서의 유전자형 표에 상응하도록 착색되어 있다.
도 3a 내지 3c는 초기- 및 중간-단계 진화된 ABE가 인간 게놈 DNA 부위에서 A·T에서 G·C로의 염기 편집을 매개한다는 것을 보여준다. 도 3a: 19개의 인간 게놈 DNA 시험 부위 (좌측)와 상응하는 인간 염색체 상의 위치 (우측)의 표. 편집된 A (적색)의 서열 콘텍스트 (표적 모티프)가 각각의 부위에 대해 제시되어 있다. PAM 서열은 청색으로 제시되어 있다. 도 3b: HEK293T 세포 내 6개의 인간 게놈 DNA 부위에서 라운드 1 및 라운드 2 ABE의 A·T에서 G·C로의 염기 편집 효율. 도 3c: HEK293T 세포 내 6개의 인간 게놈 DNA 부위에서 라운드 3, 라운드 4 및 라운드 5 ABE의 A·T에서 G·C로의 염기 편집 효율. ABE2.9 편집이 비교를 위해 제시되어 있다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 동종이량체는 융합된 TadA*-TadA*-Cas9 니카제 아키텍처를 나타내고; 이종이량체는 융합된 wtTadA-TadA*-Cas9 니카제 아키텍처를 나타낸다. 서열은 상단에서 하단으로 서열식별번호: 91-109에 상응한다.
도 4a 및 4b는 후기-단계 진화된 ABE가 게놈 DNA 편집을 보다 큰 활성 및 보다 넓은 서열 상용성으로 매개한다는 것을 보여준다. 도 4a: HEK293T 세포 내 6개의 인간 게놈 DNA 부위에서 라운드 6 및 라운드 7 ABE의 A·T에서 G·C로의 염기 편집 효율. ABE5.3 편집이 비교를 위해 제시되어 있다. 도 4b: HEK293T 세포 내 확장 세트의 인간 게놈 부위에서 라운드 6 및 라운드 7 ABE의 A·T에서 G·C로의 염기 편집 효율. 부위 1-17은 표적 A에 플랭킹된 모든 가능한 NAN 서열 콘텍스트를 집합적으로 포함한다. ABE5.3 편집이 비교를 위해 제시되어 있다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 도 4a 및 4b에 제시된 모든 ABE는 wtTadA-TadA*-Cas9 니카제 아키텍처의 이종이량체이다.
도 5a 내지 5c는 후기-단계 ABE의 활성 윈도우 및 생성물 순도를 보여준다. 도 5a: HEK293T 세포 내 각각의 프로토스페이서 위치 1-9에서 A가 함께 배치된 2개의 인간 게놈 DNA 부위에서 이들 위치에서의 후기-단계 ABE의 상대 A·T에서 G·C로의 염기 편집 효율. 값을 각각의 ABE = 1에 대해 각각의 2개 부위에서의 최대 관찰 효율에 대해 정규화하였다. 도 5b: HEK293T 세포 내 시험된 모든 19개의 인간 게놈 DNA 부위에 걸쳐 프로토스페이서 위치 1-18 및 20에서의 후기-단계 ABE의 상대 A·T에서 G·C로의 염기 편집 효율. 값을 각각의 ABE = 1에 대해 각각의 19개 부위에서의 최대 관찰 효율에 대해 정규화하였다. 도 5c: ABE7.10 또는 ABE7.9 및 상응하는 sgRNA로 처리된 HEK293T 세포 또는 비처리된 HEK293T 세포 내 2개의 대표적인 인간 게놈 DNA 부위에서의 생성물 분포. 삽입결실 빈도는 우측에 제시되어 있다. 도 5a 및 5b의 경우, 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 서열은 상단에서 하단으로 서열식별번호: 110-111에 상응한다.
도 6a 내지 6c는 ABE7.10-매개된 염기 편집 및 Cas9-매개된 HDR의 비교, 및 ABE7.10의 두 질환-관련 SNP에 대한 적용을 보여준다. 도 6a: ABE7.10 또는 Cas9 뉴클레아제 및 5개의 인간 게놈 DNA 부위에 표적화된 ssDNA 공여자 주형 (CORRECT HDR 방법41에 따름)으로 처리된 HEK293T 세포에서의 A·T에서 G·C로의 염기 편집 효율. 도 6b: 도 6a에 기재된 바와 같이 처리된 HEK293T 세포에서의 삽입결실 형성의 비교. 도 6c: 질환-억제 SNP를 설치하거나 또는 질환 유도 SNP를 교정하기 위한 ABE의 적용. 상단: HEK293T 세포에서 HBG1 및 HBG2 유전자의 프로모터 영역 내 ABE7.10-매개된 -198T→C로의 돌연변이 (서열분석 데이터 표에 제시된 것에 상보적인 가닥 상). 표적 A는 프로토스페이서의 위치 7에 있다. 하단: LCL 세포에서 HFE 유전자 내 C282Y 돌연변이의 ABE7.10-매개된 복귀. 이러한 돌연변이는 유전성 혈색소증의 통상적인 원인이다. 표적 A는 프로토스페이서의 위치 5에 있다.
도 7은 본 연구에 기재된 모든 ABE의 유전자형 표를 보여준다. 돌연변이는 이들이 확인된 진화 라운드에 기초하여 착색되어 있다.
도 8a 내지 8d는 추가의 초기-단계 ABE 변이체의 염기 편집 효율을 보여준다. 도 8a: HEK293T 세포 내 6개의 인간 게놈 표적 DNA 부위에서 Cas9 니카제에 융합된 다양한 야생형 RNA 아데닌 데아미나제의 A·T에서 G·C로의 염기 편집 효율. 값은 상이한 날에 수행된 3회의 생물학적 반복실험의 평균 및 표준 편차를 반영한다. 도 8b: HEK293T 세포 내 6개의 인간 게놈 표적 DNA 부위에서 변경된 융합 배향 및 링커 길이를 갖는 ABE2 편집제의 A·T에서 G·C로의 염기 편집 효율. 도 8c: HEK293T 세포 내 6개의 인간 게놈 표적 DNA 부위에서 DNA 내의 이노신에 결합하는 2종의 단백질인 촉매적으로 불활성화된 알킬-아데노신 글리코실라제 (AAG) 또는 엔도뉴클레아제 V (엔도V)에 융합된 ABE2 편집제의 A·T에서 G·C로의 염기 편집 효율. 도 8d: HAP1 세포 내 AAG의 존재 또는 부재 하에 부위 1에서 ABE2.1의 A·T에서 G·C로의 염기 편집 효율. 도 8b 및 8c에서의 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 9는 ABE2.1 및 각각의 6개의 인간 게놈 부위를 표적화하는 sgRNA로 처리된 HEK293T 세포의 고처리량 DNA 서열분석 분석을 보여준다. 하나의 대표적인 반복실험이 제시되어 있다. 비처리된 HEK293T 세포로부터의 데이터가 비교를 위해 제시되어 있다.
도 10a 내지 10c는 추가의 ABE2 및 ABE3 변이체의 염기 편집 효율, 및 이. 콜라이에서 항생제 선택 생존에 대한 TadA*-dCas9 융합체에의 A142N 부가의 효과를 보여준다. 도 10a: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 상이한 조작된 이량체 상태를 갖는 ABE2 변이체의 A·T에서 G·C로의 염기 편집 효율. 플롯팅된 데이터는 3회의 생물학적 반복실펌의 평균 값이다. 도 10b: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 이량체 상태 (TadA*-TadA*-Cas9 니카제의 동종이량체, 또는 야생형 TadA-TadA*-Cas9 니카제의 이종이량체), TadA-TadA 링커의 길이 및 TadA-Cas9 니카제 링커의 길이가 상이한 ABE3.1 변이체의 A·T에서 G·C로의 염기 편집 효율. ABE 유전자형 및 아키텍처에 대해서는 도 7을 참조한다. 도 10c: 스펙티노마이신 내성 유전자 내의 I89T 결함을 표적화하는 sgRNA 및 진화 라운드 4에서 확인된 A142N 돌연변이가 결여되거나 함유된 TadA*-dCas9 편집제를 발현하는 이. 콜라이 세포의 256 μg/mL의 스펙티노마이신 함유 2xYT 한천 상에서의 콜로니-형성 단위. 표적 부위에서 성공적인 A·T에서 G·C로의 염기 편집은 스펙티노마이신 내성을 회복시킨다. 도 10a 및 10b에서의 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 11a 및 11b는 추가의 ABE5 변이체의 염기 편집 효율을 보여준다. 도 11a: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 라운드 5 라이브러리의 스펙티노마이신 선택으로부터 단리된 2개의 돌연변이 쌍을 갖는 2개의 ABE3.1 변이체의 A·T에서 G·C로의 염기 편집 효율. 도 11b: HEK293T 세포 내 6개 인간 게놈 표적 DNA 부위에서 상이한 링커 길이를 갖는 ABE5 변이체의 A·T에서 G·C로의 염기 편집 효율. ABE 유전자형 및 아키텍처에 대해서는 도 7을 참조한다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 12a 내지 12c는 17개 게놈 부위에서 ABE7 변이체의 염기 편집 효율을 보여준다. HEK293T 세포 내 17개 인간 게놈 표적 DNA 부위에서 ABE7.1-7.5 (도 12a) 및 ABE7.6-7.10 (도 12b)의 A·T에서 G·C로의 염기 편집 효율. ABE 유전자형 및 아키텍처에 대해서는 도 7을 참조한다. 도 12c: U2OS 세포 내 6개 인간 게놈 표적 DNA 부위에서 ABE7.8-7.10의 A·T에서 G·C로의 염기 편집 효율. HEK293T 세포와 비교하여 U2OS 세포에서 관찰된 더 낮은 편집 효율은 두 세포주 사이의 형질감염 효율 차이와 일치하며; 본 연구에서 사용된 조건 하에 HEK293T 세포에서의 65-80%와 비교하여 U2OS 세포에서 ~40 내지 55%의 전형적인 형질감염 효율이 관찰되었다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험의 평균 및 표준 편차를 반영한다.
도 13은 수회 라운드의 진화 및 조작이 ABE 프로세싱성을 증가시켰다는 것을 보여준다. 각 라운드의 진화 및 조작으로부터 나타나는 가장 활성인 ABE에 대한 6 내지 17개의 인간 게놈 표적 DNA 부위에서의 근처 표적 A들 사이의 계산된 평균 정규화된 연관 불균형 (LD). 보다 높은 LD 값은 동일한 DNA 가닥 (동일한 서열분석 판독물) 내의 근처 A가 또한 편집될 경우 ABE가 A를 편집할 가능성이 더 크다는 것을 나타낸다. LD 값은 편집 효율과 독립적이도록 0 내지 1로 정규화된다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복실험으로부터의 정규화 LD 값의 평균 및 표준 편차를 반영한다.
도 14a 및 14b는 5개의 후기-단계 ABE 변이체 및 HBG1 및 HBG2의 프로모터 내의 -198T를 표적화하는 sgRNA로 처리된 HEK293T 세포의 고처리량 DNA 서열 분석을 보여준다. 하나의 대표적인 반복실험이 HBG1 (도 14a) 및 HBG2 (도 14b) 프로모터 표적에서 DNA 서열로 제시된다. ABE-매개된 염기 편집은 서열분석 데이터 표에 제시된 것에 상보적인 가닥 상에 -198T→C 돌연변이를 설치한다. 비처리된 HEK293T 세포로부터의 데이터가 비교를 위해 제시되어 있다.
도 15는 염기 편집제 ABE7.10 및 HBG1/2의 프로모터 영역을 표적화하는 12개의 gRNA를 사용하는 염기 편집 데이터를 보여준다. gRNA 표적 서열의 정체는 (1) 서열식별번호: 259, (2) 서열식별번호: 260, (3) 서열식별번호: 266, (4) 서열식별번호: 267, (5) 서열식별번호: 268, (6) 서열식별번호: 269, (7) 서열식별번호: 270, (8) 서열식별번호: 276, (9) 서열식별번호: 277, (10) 서열식별번호: 278, (11) 서열식별번호: 279, 및 (12) 서열식별번호: 280이다.
정의
본원 및 청구범위에 사용된 단수 형태는 문맥이 달리 명백하게 나타내지 않는 한 단수 및 복수 지시대상을 포함한다. 따라서, 예를 들어, "작용제"에 대한 언급은 단일 작용제 및 복수의 이러한 작용제를 포함한다.
용어 "데아미나제" 또는 "데아미나제 도메인"은 탈아미노화 반응을 촉매하는 단백질 또는 효소를 지칭한다. 일부 실시양태에서, 데아미나제는 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 각각 아데노신 또는 데옥시아데노신의 이노신 또는 데옥시이노신으로의 가수분해성 탈아미노화를 촉매하는 아데노신 데아미나제 이다. 일부 실시양태에서, 아데노신 데아미나제는 데옥시리보핵산 (DNA) 내의 아데닌 또는 아데노신의 가수분해성 탈아미노화를 촉매한다. 본원에 제공된 아데노신 데아미나제 (예를 들어 조작된 아데노신 데아미나제, 진화된 아데노신 데아미나제)는 임의의 유기체, 예컨대 박테리아로부터의 것일 수 있다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 유기체로부터의 자연 발생 데아미나제의 변이체이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연에서 발생하지 않는다. 예를 들어, 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연 발생 데아미나제에 대해 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일하다. 일부 실시양태에서, 아데노신 데아미나제는 박테리아, 예컨대 이. 콜라이(E. coli), 에스. 아우레우스(S. aureus), 에스. 티피(S. typhi), 에스. 푸트레파시엔스(S. putrefaciens), 에이치. 인플루엔자에(H. influenzae) 또는 씨. 크레센투스(C. crescentus)로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 TadA 데아미나제이다. 일부 실시양태에서, TadA 데아미나제는 이. 콜라이 TadA 데아미나제 (ecTadA)이다. 일부 실시양태에서, TadA 데아미나제는 말단절단된 이. 콜라이 TadA 데아미나제이다. 예를 들어, 말단절단된 ecTadA는 전장 ecTadA에 비해 1개 이상의 N-말단 아미노산이 결여되어 있을 수 있다. 일부 실시양태에서, 말단절단된 ecTadA는 전장 ecTadA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19 또는 20개의 N-말단 아미노산 잔기가 결여되어 있을 수 있다. 일부 실시양태에서, 말단절단된 ecTadA는 전장 ecTadA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 6, 17, 18, 19 또는 20개의 C-말단 아미노산 잔기가 결여되어 있을 수 있다. 일부 실시양태에서, ecTadA 데아미나제는 N-말단 메티오닌을 포함하지 않는다.
일부 실시양태에서, TadA 데아미나제는 N-말단 말단절단된 TadA이다. 특정 실시양태에서, 아데노신 데아미나제는 하기 아미노산 서열을 포함한다:
Figure pct00009
일부 실시양태에서 TadA 데아미나제는 전장 이. 콜라이 TadA 데아미나제이다. 예를 들어, 특정 실시양태에서, 아데노신 데아미나제는 하기 아미노산 서열을 포함한다:
Figure pct00010
그러나, 본 출원에 유용한 추가의 아데노신 데아미나제는 통상의 기술자에게 분명할 것이고 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다. 예를 들어, 아데노신 데아미나제는 ADAT의 상동체일 수 있다. 예시적인 ADAT 상동체는 비제한적으로 하기를 포함한다:
스타필로코쿠스 아우레우스(Staphylococcus aureus) TadA:
Figure pct00011
바실루스 서브틸리스(Bacillus subtilis) TadA:
Figure pct00012
살모넬라 티피무리움(Salmonella typhimurium) (에스. 티피무리움) TadA:
Figure pct00013
슈와넬라 푸트레파시엔스(Shewanella putrefaciens) (에스. 푸트레파시엔스) TadA:
Figure pct00014
헤모필루스 인플루엔자에(Haemophilus influenzae) F3031 (에이치. 인플루엔자에) TadA:
Figure pct00015
카울로박터 크레센투스(Caulobacter crescentus) (씨. 크레센투스) TadA:
Figure pct00016
게오박터 술푸레두센스(Geobacter sulfurreducens) (지. 술푸레두센스) TadA:
Figure pct00017
용어 "염기 편집제 (BE)" 또는 "핵염기 편집제 (NBE)"는 핵산 서열 (예를 들어, DNA 또는 RNA) 내의 염기 (예를 들어, A, T, C, G 또는 U)에 변형을 가할 수 있는 폴리펩티드를 포함하는 작용제를 지칭한다. 일부 실시양태에서, 염기 편집제는 핵산 내의 염기를 탈아미노화시킬 수 있다. 일부 실시양태에서, 염기 편집제는 DNA 분자 내의 염기를 탈아미노화시킬 수 있다. 일부 실시양태에서, 염기 편집제는 DNA 내의 아데닌 (A)을 탈아미노화시킬 수 있다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질이다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 Cas9 단백질이다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 염기 편집제는 아데노신 데아미나제에 융합된 뉴클레아제-불활성 Cas9 (dCas9)이다. 일부 실시양태에서, 염기 편집제는 염기 절제 복구의 억제제, 예를 들어 UGI 도메인 또는 dISN 도메인에 융합된다. 일부 실시양태에서, 융합 단백질은 데아미나제에 융합된 Cas9 니카제 및 염기 절제 복구의 억제제, 예컨대 UGI 또는 dISN 도메인을 포함한다. 일부 실시양태에서, 융합 단백질의 dCas9 도메인은 서열식별번호: 52의 D10A 및 H840A 돌연변이, 또는 서열식별번호: 108-357 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 이는 Cas9 단백질의 뉴클레아제 활성을 불활성화킨다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 52의 D10A 돌연변이를 포함하고, 잔기 840에서의 히스티딘, 또는 서열식별번호: 108-357 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 이는 Cas9가 핵산 듀플렉스의 단지 한 가닥만을 절단할 수 있게 한다. Cas9 니카제의 예는 서열식별번호: 35에 제시된다.
본원에 사용된 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어 융합 단백질의 2개의 도메인, 예컨대, 예를 들어 뉴클레아제-불활성 Cas9 도메인 및 핵산-편집 도메인 (예를 들어, 아데노신 데아미나제)을 연결하는 결합 (예를 들어, 공유 결합), 화학적 기 또는 분자를 지칭한다. 일부 실시양태에서, 링커는 Cas9 뉴클레아제 도메인을 포함한 RNA-프로그램가능한 뉴클레아제의 gRNA 결합 도메인, 및 핵산-편집 단백질의 촉매 도메인을 연결한다. 일부 실시양태에서, 링커는 dCas9 및 핵산-편집 단백질을 연결한다. 전형적으로, 링커는 2개의 기, 분자 또는 다른 모이어티 사이에 위치되거나, 그에 플랭킹되고, 공유 결합을 통해 서로 연결되어, 2개를 연결한다. 일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 서열식별번호: 10, 37-40, 384-386, 685-688 또는 800-801 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 링커는 5-100개 아미노산의 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-150 또는 150-200개 아미노산의 길이이다. 보다 긴 또는 보다 짧은 링커가 또한 고려된다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10)를 포함하며, 이는 또한 XTEN 링커로 지칭될 수 있다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS (서열식별번호: 37)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함하며, 이는 또한 (SGGS)2-XTEN-(SGGS)2로 지칭될 수 있다. 일부 실시양태에서, 링커는 (SGGS)n (서열식별번호: 37), (GGGS)n (서열식별번호: 38), (GGGGS)n (서열식별번호: 39), (G)n, (EAAAK)n (서열식별번호: 40), (GGS)n, SGSETPGTSESATPES (서열식별번호: 10), (SGGS)n-SGSETPGTSESATPES-(SGGS)n (서열식별번호: 801) 또는 (XP)n 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이고, X는 임의의 아미노산이다. 일부 실시양태에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다.
본원에 사용된 용어 "돌연변이"는 서열, 예를 들어 핵산 또는 아미노산 서열 내의 잔기의 또 다른 잔기로의 치환, 또는 서열 내의 1개 이상의 잔기의 결실 또는 삽입을 지칭한다. 돌연변이는 전형적으로 원래 잔기에 이어서 서열 내의 그 잔기의 위치 및 이어서 새롭게 치환된 잔기의 정체를 확인함으로써 본원에 기재된다. 본원에 제공된 아미노산 치환 (돌연변이)을 만드는 다양한 방법은 관련 기술분야에 널리 공지되어 있고, 예를 들어 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))]에 제공되어 있다.
용어 "핵 국재화 서열" 또는 "NLS"는, 예를 들어 핵 수송에 의한 세포 핵 내로의 단백질의 도입을 촉진하는 아미노산 서열을 지칭한다. 핵 국재화 서열은 관련 기술분야에 공지되어 있고 통상의 기술자에게 분명할 것이다. 예를 들어, NLS 서열은 2000년 11월 23일 출원되고 2001년 5월 31일에 WO/2001/038547로 공개된 국제 PCT 출원 PCT/EP2000/011690 (Plank et al.)에 기재되어 있으며, 상기 문헌의 내용은 예시적인 핵 국재화 서열의 개시내용에 대해 본원에 참조로 포함된다. 일부 실시양태에서, NLS는 아미노산 서열 PKKKRKV (서열식별번호: 4), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열식별번호: 5), MKRTADGSEFEPKKKRKV (서열식별번호: 342), 또는 KRTADGSEFEPKKKRKV (서열식별번호: 343)를 포함한다.
용어 "핵산 프로그램가능한 DNA 결합 단백질" 또는 "napDNAbp"는 핵산 (예를 들어, DNA 또는 RNA), 예컨대 napDNAbp를 특이적 핵산 서열로 가이드하는 가이드 핵산과 회합되는 단백질을 지칭한다. 예를 들어, Cas9 단백질은 Cas9 단백질을 가이드 RNA에 상보적인 특정 DNA 서열로 가이드하는 가이드 RNA와 회합될 수 있다. 일부 실시양태에서, napDNAbp는 부류 2 미생물 CRISPR-Cas 이펙터이다. 일부 실시양태에서, napDNAbp는 Cas9 도메인, 예를 들어 뉴클레아제 활성 Cas9, Cas9 니카제 (nCas9) 또는 뉴클레아제 불활성 Cas9 (dCas9)이다. 핵산 프로그램가능한 DNA 결합 단백질의 예는, 비제한적으로, Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2C3 및 아르고노트를 포함한다. 그러나, 핵산 프로그램가능한 DNA 결합 단백질은 또한 RNA에 결합하는 핵산 프로그램가능한 단백질을 포함한다는 것이 인지되어야 한다. 예를 들어, napDNAbp는 napDNAbp를 RNA로 가이드하는 핵산과 회합될 수 있다. 다른 핵산 프로그램가능한 DNA 결합 단백질은 이들이 본 개시내용에 구체적으로 열거되어 있지 않을 수 있더라도 또한 본 개시내용의 범주 내에 있다.
용어 "Cas9" 또는 "Cas9 뉴클레아제"는 Cas9 단백질, 또는 그의 단편 (예를 들어, Cas9의 활성, 불활성, 또는 부분적 활성 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA-가이드 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 또한 때때로 casn1 뉴클레아제 또는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)-연관 뉴클레아제로 지칭된다. CRISPR은 이동성 유전 요소 (바이러스, 전위가능 요소 및 접합 플라스미드)에 대한 보호를 제공하는 적응 면역계이다. CRISPR 클러스터는 스페이서, 선행 이동성 요소에 상보적인 서열, 및 표적 침입 핵산을 함유한다. CRISPR 클러스터는 전사되고, CRISPR RNA (crRNA)로 프로세싱된다. 유형 II CRISPR 시스템에서 프리-crRNA의 교정 프로세싱은 트랜스-코딩된 소형 RNA (tracrRNA), 내인성 리보뉴클레아제 3 (rnc) 및 Cas9 단백질을 요구한다. tracrRNA는 프리-crRNA의 리보뉴클레아제 3-보조된 프로세싱을 위한 가이드로서의 역할을 한다. 후속적으로, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 핵산내부분해로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 핵산내부분해로 절단된 다음, 핵산외부분해로 3'-5' 트리밍된다. 사실상, DNA-결합 및 절단은 전형적으로 단백질 및 둘 다의 RNA를 요구한다. 그러나, 단일 가이드 RNA ("sgRNA" 또는 간단히 "gNRA")는 crRNA 및 tracrRNA 둘 다의 측면을 단일 RNA 종 내로 혼입하도록 조작될 수 있다. 예를 들어, 문헌 [Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)]을 참조하며, 그의 전체 내용은 본원에 참조로 포함된다. Cas9는 자기 대 비-자기를 구별하는 것을 돕기 위한 CRISPR 반복 서열 (PAM 또는 프로토스페이서 인접 모티프)에서의 짧은 모티프를 인식한다. Cas9 뉴클레아제 서열 및 구조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨). Cas9 오르토로그는 에스. 피오게네스(S. pyogenes) 및 에스. 써모필루스(S. thermophilus)를 포함하나 이에 제한되지는 않는 다양한 종에서 설명되었다. 추가의 적합한 Cas9 뉴클레아제 및 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이며, 이러한 Cas9 뉴클레아제 및 서열은 문헌 [Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737] (그의 전체 내용은 본원에 참조로 포함됨)에 개시된 유기체 및 유전자좌로부터의 Cas9 서열을 포함한다. 일부 실시양태에서, Cas9 뉴클레아제는 불활성 (예를 들어, 불활성화된) DNA 절단 도메인을 가지며, 즉, Cas9는 니카제이다.
뉴클레아제-불활성화된 Cas9 단백질은 "dCas9" 단백질 (뉴클레아제-"기능상실" Cas9에 대한 것)로 상호교환가능하게 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 단백질 (또는 그의 단편)을 생성하는 방법은 공지되어 있다 (예를 들어, 문헌 [Jinek et al., Science. 337:816-821(2012); Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28;152(5):1173-83] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨). 예를 들어, Cas9의 DNA 절단 도메인은 2종의 서브도메인인 HNH 뉴클레아제 서브도메인 및 RuvC1 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA에 상보적인 가닥을 절단하고, 반면에 RuvC1 서브도메인은 비-상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H840A는 에스. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다 (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). 일부 실시양태에서, Cas9의 단편을 포함하는 단백질이 제공된다. 예를 들어, 일부 실시양태에서, 단백질은 다음 2개의 Cas9 도메인 중 1개를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인. 일부 실시양태에서, Cas9 또는 그의 단편을 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9 또는 그의 단편에 대한 상동성을 공유한다. 예를 들어 Cas9 변이체는 야생형 Cas9에 대해 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하다. 일부 실시양태에서, Cas9 변이체는 야생형 Cas9와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 아미노산 변화를 가질 수 있다. 일부 실시양태에서, Cas9 변이체는 Cas9의 단편 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)을 포함하며, 이러한 단편은 야생형 Cas9의 상응하는 단편에 대해 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일하다. 일부 실시양태에서, 단편은 상응하는 야생형 Cas9의 아미노산 길이의 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5%이다.
일부 실시양태에서, 단편은 적어도 100개 아미노산의 길이이다. 일부 실시양태에서, 단편은 적어도 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250 또는 1300개 아미노산의 길이이다. 일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스로부터의 Cas9 (NCBI 참조 서열: NC_017053.1, 서열식별번호: 47 (뉴클레오티드); 서열식별번호: 48 (아미노산))에 상응한다.
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, 야생형 Cas9는 서열식별번호: 49 (뉴클레오티드) 및/또는 서열식별번호: 50 (아미노산)에 상응하거나 또는 이를 포함한다:
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스로부터의 Cas9 (NCBI 참조 서열: NC_002737.2, 서열식별번호: 51 (뉴클레오티드); 및 유니프롯 참조 서열: Q99ZW2, 서열식별번호: 52 (아미노산))에 상응한다.
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, Cas9는 하기로부터의 Cas9를 지칭한다: 코리네박테리움 울세란스(Corynebacterium ulcerans) (NCBI Ref: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria) (NCBI Ref: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola) (NCBI Ref: NC_021284.1); 프레보텔라 인터메디아(Prevotella intermedia) (NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨세(Spiroplasma taiwanense) (NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니아에(Streptococcus iniae) (NCBI Ref: NC_021314.1); 벨리엘라 발티카(Belliella baltica) (NCBI Ref: NC_018010.1); 사이크로플렉수스 토르퀴시(Psychroflexus torquisI) (NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (NCBI Ref: YP_820832.1); 리스테리아 인노쿠아(Listeria innocua) (NCBI Ref: NP_472073.1); 캄필로박터 제주니(Campylobacter jejuni) (NCBI Ref: YP_002344900.1); 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus) (NCBI Ref: NZ_CP008934.1); 또는 네이세리아 메닌기티디스(Neisseria meningitidis) (NCBI Ref: YP_002342100.1); 또는 임의의 다른 유기체로부터의 Cas9.
일부 실시양태에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화시키는 1개 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 상응하거나, 또는 이를 부분적으로 또는 전체적으로 포함한다. 예를 들어, 일부 실시양태에서, dCas9 도메인은 서열식별번호: 52의 D10A 및 H840A 돌연변이 또는 또 다른 Cas9에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, dCas9는 서열식별번호: 53의 아미노산 서열을 포함한다.
dCas9 (D10A 및 H840A):
Figure pct00030
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, Cas9 도메인은 D10A 돌연변이를 포함하고, 반면에 위치 840 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 위치에서의 잔기는 서열식별번호: 52에 제공된 아미노산 서열에서의 히스티딘을 유지한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 촉매 잔기 H840의 존재는 표적화된 A에 대향하는 T를 함유하는 비-편집 (예를 들어, 비-탈아미노화) 가닥을 절단하기 위한 Cas9의 활성을 유지한다. H840의 회복 (예를 들어, dCas9의 A840으로부터)은 A를 함유하는 표적 가닥의 절단을 유발하지 않는다. 이러한 Cas9 변이체는 gRNA-한정된 표적 서열에 기초하여 특정 위치에서 단일-가닥 DNA 파괴 (닉)를 생성할 수 있어, 비-편집 가닥의 복구를 유도하여, 궁극적으로 비-편집 가닥 상의 T에서 C로의 변화를 유발한다. 이 과정의 개략적 표현은 도 1c에 제시되어 있다. 간략하게, 및 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, A-T 염기 쌍의 A는 아데노신 데아미나제, 예를 들어 DNA 내의 아데노신을 탈아미노화시키는 아데노신 데아미나제에 의해 이노신 (I)으로 탈아미노화될 수 있다. T를 갖는 비-편집 가닥을 니킹하는 것은 미스매치 복구 메카니즘을 통한 T의 제거를 용이하게 한다. UGI 도메인 또는 촉매 불활성 이노신-특이적 뉴클레아제 (dISN)는 이노신-특이적 뉴클레아제를 (예를 들어, 입체적으로) 억제할 수 있고, 이에 의해 이노신 (I)의 제거를 방지한다.
다른 실시양태에서, 예를 들어 뉴클레아제 불활성화된 Cas9 (dCas9)를 유발하는, D10A 및 H840A 이외의 돌연변이를 갖는 dCas9 변이체가 제공된다. 이러한 돌연변이는, 예로서, D10 및 H840에서의 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인 내에서의 다른 치환 (예를 들어, HNH 뉴클레아제 서브도메인 및/또는 RuvC1 서브도메인 내에서의 치환)을 포함한다. 일부 실시양태에서, 서열식별번호: 10에 대해 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 또는 적어도 약 99.9% 동일한 dCas9의 변이체 또는 상동체 (예를 들어, 서열식별번호: 53의 변이체)가 제공된다. 일부 실시양태에서, 약 5개 아미노산, 약 10개 아미노산, 약 15개 아미노산, 약 20개 아미노산, 약 25개 아미노산, 약 30개 아미노산, 약 40개 아미노산, 약 50개 아미노산, 약 75개 아미노산, 약 100개 아미노산 또는 그 초과만큼 서열식별번호: 53보다 더 짧거나 더 긴 아미노산 서열을 갖는 dCas9의 변이체 (예를 들어, 서열식별번호: 53의 변이체)가 제공된다.
일부 실시양태에서, 본원에 제공된 바와 같은 Cas9 융합 단백질은 Cas9 단백질의 전장 아미노산 서열, 예를 들어 본원에 제공된 Cas9 서열 중 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에 제공된 바와 같은 융합 단백질은 전장 Cas9 서열을 포함하는 것이 아니라, 단지 그의 단편만을 포함한다. 예를 들어, 일부 실시양태에서, 본원에 제공된 Cas9 융합 단백질은 Cas9 단편을 포함하며, 여기서 단편은 crRNA 및 tracrRNA 또는 sgRNA에 결합하지만, 예를 들어 그것이 단지 뉴클레아제 도메인의 말단절단된 형태만을 포함하거나 또는 뉴클레아제 도메인을 전혀 포함하지 않는다는 점에서 기능적 뉴클레아제 도메인을 포함하지 않는다.
적합한 Cas9 도메인 및 Cas9 단편의 예시적인 아미노산 서열은 본원에 제공되며, Cas9 도메인 및 단편의 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 분명할 것이다.
일부 실시양태에서, Cas9는 하기로부터의 Cas9를 지칭한다: 코리네박테리움 울세란스 (NCBI Ref: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아 (NCBI Ref: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라 (NCBI Ref: NC_021284.1); 프레보텔라 인터메디아 (NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨세 (NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니아에 (NCBI Ref: NC_021314.1); 벨리엘라 발티카 (NCBI Ref: NC_018010.1); 사이크로플렉수스 토르퀴시 (NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스 (NCBI Ref: YP_820832.1); 리스테리아 인노쿠아 (NCBI Ref: NP_472073.1); 캄필로박터 제주니 (NCBI Ref: YP_002344900.1); 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus) (NCBI Ref: NZ_CP008934.1); 또는 네이세리아 메닌기티디스 (NCBI Ref: YP_002342100.1).
추가의 Cas9 단백질 (예를 들어, 뉴클레아제 기능상실 Cas9 (dCas9), Cas9 니카제 (nCas9) 또는 뉴클레아제 활성 Cas9)은, 그의 변이체 및 상동체를 포함하여, 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다. 예시적인 Cas9 단백질은, 비제한적으로, 하기 제공된 것을 포함한다. 일부 실시양태에서, Cas9 단백질은 뉴클레아제 기능상실 Cas9 (dCas9)이다. 일부 실시양태에서, dCas9는 아미노산 서열 (서열식별번호: 34)을 포함한다. 일부 실시양태에서, Cas9 단백질은 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, nCas9는 아미노산 서열 (서열식별번호: 35)을 포함한다. 일부 실시양태에서, Cas9 단백질은 뉴클레아제 활성 Cas9이다. 일부 실시양태에서, 뉴클레아제 활성 Cas9는 아미노산 서열 (서열식별번호: 36)을 포함한다.
예시적인 촉매 불활성 Cas9 (dCas9):
Figure pct00031
예시적인 Cas9 니카제 (nCas9):
Figure pct00032
예시적인 촉매 활성 Cas9:
Figure pct00033
일부 실시양태에서, Cas9는 단세포형 원핵 미생물의 도메인 및 계를 구성하는 고세균 (예를 들어 나노고세균)으로부터의 Cas9를 지칭한다. 일부 실시양태에서, Cas9는 CasX 또는 CasY를 지칭하며, 이는 예를 들어 문헌 [Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21] (이의 전체 내용은 본원에 참조로 포함됨)에 기재되었다. 게놈-분해 메타유전체학을 사용하여, 생명체의 고세균 도메인에서 최초 보고된 Cas9를 포함한, 수많은 CRISPR-Cas 시스템이 확인되었다. 이 분기 Cas9 단백질은 활성 CRISPR-Cas 시스템의 일부로서 거의 연구되지 않은 나노고세균에서 발견되었다. 박테리아에서, 2종의 이전에 공지되지 않은 시스템인 CRISPR-CasX 및 CRISPR-CasY가 발견되었으며, 이는 이제껏 발견된 시스템 중 가장 소형이다. 일부 실시양태에서, Cas9는 CasX 또는 CasX의 변이체를 지칭한다. 일부 실시양태에서, Cas9는 CasY 또는 CasY의 변이체를 지칭한다. 다른 RNA-가이드 DNA 결합 단백질은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)로서 사용될 수 있고 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다.
일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 CasX 또는 CasY 단백질일 수 있다. 일부 실시양태에서, napDNAbp는 CasX 단백질이다. 일부 실시양태에서, napDNAbp는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 자연 발생 CasX 또는 CasY 단백질에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 자연 발생 CasX 또는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 서열식별번호: 417-419 중 어느 하나에 대해 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 서열식별번호: 417-419 중 어느 하나의 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 CasX 및 CasY는 또한 본 개시내용에 따라 사용될 수 있다는 것이 인지되어야 한다.
Figure pct00034
Figure pct00035
Figure pct00036
본원에 사용된 용어 "유효량"은 목적하는 생물학적 반응을 도출해내기에 충분한 생물학적 활성제의 양을 지칭한다. 예를 들어, 일부 실시양태에서, 핵염기 편집제의 유효량은 핵염기 편집제에 의해 특이적으로 결합되고 돌연변이되는 표적 부위의 돌연변이를 유도하기에 충분한 핵염기 편집제의 양을 지칭할 수 있다. 일부 실시양태에서, 본원에 제공된 융합 단백질, 예를 들어 핵산 프로그램가능한 DNA 결합 단백질 및 데아미나제 도메인 (예를 들어, 아데노신 데아미나제 도메인)을 포함하는 융합 단백질의 유효량은 융합 단백질에 의해 특이적으로 결합되고 편집되는 표적 부위의 편집을 유도하기에 충분한 융합 단백질의 양을 지칭할 수 있다. 통상의 기술자에 의해 인지될 바와 같이, 작용제, 예를 들어 융합 단백질, 핵염기 편집제, 데아미나제, 하이브리드 단백질, 단백질 이량체, 단백질 (또는 단백질 이량체) 및 폴리뉴클레오티드의 복합체, 또는 폴리뉴클레오티드의 유효량은, 예를 들어 목적하는 생물학적 반응, 예를 들어 편집될 특이적 대립유전자, 게놈 또는 표적 부위, 표적화될 세포 또는 조직, 및 사용될 작용제와 같은 다양한 인자에 따라 달라질 수 있다.
본원에 사용된 용어 "핵산" 및 "핵산 분자"는 핵염기 및 산성 모이어티, 예를 들어 뉴클레오시드, 뉴클레오티드, 또는 뉴클레오티드의 중합체를 포함하는 화합물을 지칭한다. 전형적으로, 중합체 핵산, 예를 들어 3개 이상의 뉴클레오티드를 포함하는 핵산 분자는 선형 분자이며, 여기서 인접 뉴클레오티드는 포스포디에스테르 연결을 통해 서로 연결된다. 일부 실시양태에서, "핵산"은 개별 핵산 잔기 (예를 들어 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 실시양태에서, "핵산"은 3개 이상의 개별 뉴클레오티드 잔기를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에 사용된 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 뉴클레오티드의 중합체 (예를 들어, 일련의 적어도 3개의 뉴클레오티드)를 지칭하는 것으로 상호교환가능하게 사용될 수 있다. 일부 실시양태에서, "핵산"은 RNA 뿐만 아니라 단일 및/또는 이중-가닥 DNA를 포괄한다. 핵산은, 예를 들어 게놈, 전사체, mRNA, tRNA, rRNA, siRNA, snRNA, 플라스미드, 코스미드, 염색체, 크로마티드 또는 다른 자연 발생 핵산 분자와 관련하여 자연 발생일 수 있다. 다른 한편으로, 핵산 분자는 비-자연 발생 분자, 예를 들어 재조합 DNA 또는 RNA, 인공 염색체, 조작된 게놈, 또는 그의 단편, 또는 합성 DNA, RNA, DNA/RNA 하이브리드이거나, 또는 비-자연 발생 뉴클레오티드 또는 뉴클레오시드를 포함할 수 있다. 추가로, 용어 "핵산", "DNA", "RNA", 및/또는 유사한 용어는 핵산 유사체, 예를 들어 포스포디에스테르 백본 이외의 것을 갖는 유사체를 포함한다. 핵산은 천연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생성되고, 임의로 정제되고, 화학적으로 합성 등이 될 수 있다. 적절한 경우, 예를 들어 화학적으로 합성된 분자의 경우, 핵산은 뉴클레오시드 유사체, 예컨대 화학적으로 변형된 염기 또는 당, 및 백본 변형을 갖는 유사체를 포함할 수 있다. 핵산 서열은 달리 나타내지 않는 한 5'에서 3'로의 방향으로 제시된다. 일부 실시양태에서, 핵산은 천연 뉴클레오시드 (예를 들어 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신 및 데옥시시티딘); 뉴클레오시드 유사체 (예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌 및 2-티오시티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기 (예를 들어, 메틸화 염기); 삽입된 염기; 변형된 당 (예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스 및 헥소스); 및/또는 변형된 포스페이트 기 (예를 들어, 포스포로티오에이트 및 5'-N-포스포르아미다이트 연결)이거나 또는 이를 포함한다.
본원에 사용된 용어 "프로모터"는 핵산 서열의 나머지 부분의 개시 및 전사 속도를 제어하는 핵산 서열의 제어 영역을 지칭한다. 프로모터는 또한 조절 단백질 및 분자, 예컨대 RNA 폴리머라제 및 다른 전사 인자가 결합할 수 있는 하위영역를 함유할 수 있다.
용어 "단백질", "펩티드" 및 "폴리펩티드"는 본원에서 상호교환가능하게 사용되며, 펩티드 (아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 상기 용어는 임의의 크기, 구조 또는 기능의 단백질, 펩티드 또는 폴리펩티드를 지칭한다. 전형적으로, 단백질, 펩티드 또는 폴리펩티드는 적어도 3개의 아미노산 길이일 것이다. 단백질, 펩티드 또는 폴리펩티드는 개별 단백질 또는 단백질의 집합을 지칭할 수 있다. 단백질, 펩티드 또는 폴리펩티드에서의 아미노산 중 1개 이상은, 예를 들어 화학 물질, 예컨대 탄수화물 기, 히드록실 기, 포스페이트 기, 파르네실 기, 이소파르네실 기, 지방산 기, 접합용 링커의 첨가, 관능화, 또는 다른 변형 등에 의해 변형될 수 있다. 단백질, 펩티드 또는 폴리펩티드는 또한 단일 분자일 수 있거나 또는 다중-분자 복합체일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 단지 자연 발생 단백질 또는 펩티드의 단편일 수 있다. 단백질, 펩티드 또는 폴리펩티드는 자연 발생, 재조합 또는 합성, 또는 그의 임의의 조합일 수 있다. 본원에 사용된 용어 "융합 단백질"은 적어도 2종의 상이한 단백질로부터의 단백질 도메인을 포함하는 하이브리드 폴리펩티드를 지칭한다. 1종의 단백질은 융합 단백질의 아미노-말단 (N-말단) 부분에 또는 카르복시-말단 (C-말단) 단백질에 위치하며, 따라서 각각 "아미노-말단 융합 단백질" 또는 "카르복시-말단 융합 단백질"을 형성할 수 있다. 단백질은 핵산 편집 단백질의 상이한 도메인, 예를 들어 핵산 결합 도메인 (예를 들어, 표적 부위에 대한 단백질의 결합을 지시하는 Cas9의 gRNA 결합 도메인) 및 핵산 절단 도메인 또는 촉매 도메인을 포함할 수 있다. 일부 실시양태에서, 단백질은 단백질성 부분, 예를 들어 핵산 결합 도메인을 구성하는 아미노산 서열, 및 유기 화합물, 예를 들어 핵산 절단제로서 작용할 수 있는 화합물을 포함한다. 일부 실시양태에서, 단백질은 핵산, 예를 들어 RNA와 복합체로 존재하거나 또는 그와 회합된다. 본원에 제공된 임의의 단백질은 관련 기술분야에 공지된 임의의 방법에 의해 생성될 수 있다. 예를 들어, 본원에 제공된 단백질은 펩티드 링커를 포함하는 융합 단백질에 특별히 적합한 재조합 단백질 발현 및 정제를 통해 생성될 수 있다. 재조합 단백질 발현 및 정제를 위한 방법은 널리 공지되어 있고 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012)] (이의 전체 내용은 본원에 참조로 포함됨)에 기재된 것을 포함한다.
용어 "RNA-프로그램가능한 뉴클레아제" 및 "RNA-가이드 뉴클레아제"는 본원에서 상호교환가능하게 사용되며, 절단을 위한 표적이 아닌 1개 이상의 RNA(들)와 복합체를 형성하는 (예를 들어, 그와 결합하거나 회합하는) 뉴클레아제를 지칭한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는, RNA와의 복합체로 존재하는 경우, 뉴클레아제:RNA 복합체로 지칭될 수 있다. 전형적으로, 결합된 RNA(들)는 가이드 RNA (gRNA)로 지칭된다. gRNA는 2개 이상의 RNA의 복합체로서, 또는 단일 RNA 분자로서 존재할 수 있다. 단일 RNA 분자로서 존재하는 gRNA는 단일-가이드 RNA (sgRNA)로 지칭될 수 있으며, "gRNA"는 단일 분자로서 또는 2개 이상의 분자의 복합체로서 존재하는 가이드 RNA를 지칭하는데 상호교환가능하게 사용된다. 전형적으로, 단일 RNA 종으로서 존재하는 gRNA는 다음 2개의 도메인을 포함한다: (1) 표적 핵산에 대한 상동성을 공유하는 (예를 들어, 표적에 대한 Cas9 복합체의 결합을 지시하는) 도메인 (가이드 서열로 지칭됨); 및 (2) Cas9 단백질에 결합하는 도메인. 일부 실시양태에서, 도메인 (1)은 HBG1 및/또는 HBG2 유전자의 프로모터 내의 서열과 상동성을 공유한다. 일부 실시양태에서, 도메인 (1)은 서열 5'-GTGGGGAAGGGGCCCCCAAGAGG-3' (서열식별번호: 2)와 상동성을 공유한다. 일부 실시양태에서, 도메인 (1)은 HFE 유전자 내의 서열과 상동성을 공유한다. 일부 실시양태에서, 도메인 (1)은 서열 5'-TATACGTACCAGGTGGAGCACCCAGG-3' (서열식별번호: 3)와 상동성을 공유한다. 일부 실시양태에서, 도메인 (2)는 tracrRNA로 공지된 서열에 상응하며, 스템-루프 구조를 포함한다. 예를 들어, 일부 실시양태에서, 도메인 (2)는 문헌 [Jinek et al., Science 337:816-821(2012)] (이의 전체 내용은 본원에 참조로 포함됨)에 제공된 바와 같은 tracrRNA와 동일하거나 상동이다. gRNA의 다른 예 (예를 들어, 도메인 2를 포함하는 것)는 2013년 9월 6일에 출원된 발명의 명칭 "스위칭가능한 Cas9 뉴클레아제 및 그의 용도"인 미국 특허 가출원 U.S.S.N. 61/874,682, 및 2013년 9월 6일에 출원된 발명의 명칭 "기능적 뉴클레아제를 위한 전달 시스템"인 미국 특허 가출원 U.S.S.N. 61/874,746에서 발견될 수 있으며, 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, gRNA는 도메인 (1) 및 (2) 중 2개 이상을 포함하며, "연장된 gRNA"로 지칭될 수 있다. 예를 들어, 연장된 gRNA는, 예를 들어 본원에 기재된 바와 같이 2종 이상의 Cas9 단백질에 결합하고, 2개 이상의 별개의 영역에서 표적 핵산에 결합할 것이다. gRNA는 표적 부위를 보완하는 뉴클레오티드 서열을 포함하며, 이는 상기 표적 부위에 대한 뉴클레아제/RNA 복합체의 결합을 매개하여, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는 (CRISPR-연관 시스템) Cas9 엔도뉴클레아제, 예를 들어 스트렙토코쿠스 피오게네스로부터의 Cas9 (Csn1)이다 (예를 들어, 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨).
RNA-프로그램가능한 뉴클레아제 (예를 들어, Cas9)는 DNA 절단 부위를 표적화하기 위해 RNA:DNA 혼성화를 사용하기 때문에, 이들 단백질은 원칙적으로 가이드 RNA에 의해 특정된 임의의 서열에 표적화될 수 있다. 부위-특이적 절단 (예를 들어, 게놈을 변형시키기 위함)을 위해 RNA-프로그램가능한 뉴클레아제, 예컨대 Cas9를 사용하는 방법은 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al., RNA-programmed genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic acids research (2013); Jiang, W. et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature biotechnology 31, 233-239 (2013)] 참조, 상기 문헌 각각의 전체 내용은 본원에 참조로 포함됨).
본원에 사용된 용어 "대상체"는 개별 유기체, 예를 들어 개별 포유동물을 지칭한다. 일부 실시양태에서, 대상체는 인간이다. 일부 실시양태에서, 대상체는 비-인간 포유동물이다. 일부 실시양태에서, 대상체는 비-인간 영장류이다. 일부 실시양태에서, 대상체는 설치류이다. 일부 실시양태에서, 대상체는 양, 염소, 소, 고양이 또는 개이다. 일부 실시양태에서, 대상체는 척추동물, 양서류, 파충류, 어류, 곤충, 파리 또는 선충류이다. 일부 실시양태에서, 대상체는 연구용 동물이다. 일부 실시양태에서, 대상체는 유전자 조작되며, 예를 들어 유전자 조작된 비-인간 대상체이다. 대상체는 어느 한 성별일 수 있고 임의의 발달 단계에 있을 수 있다.
용어 "표적 부위"는 데아미나제 또는 데아미나제를 포함하는 융합 단백질 (예를 들어, 본원에 제공된 dCas9-아데노신 데아미나제 융합 단백질)에 의해 탈아미노화되는 핵산 분자 내의 서열을 지칭한다.
용어 "치료", "치료하다" 및 "치료하는"은 본원에 기재된 바와 같은 질환 또는 장애, 또는 그의 1종 이상의 증상을 역전시키거나, 완화시키거나, 그의 발병을 지연시키거나 또는 그의 진행을 억제하는 것을 목표로 하는 임상 개입을 지칭한다. 본원에 사용된 용어 "치료", "치료하다" 및 "치료하는"은 본원에 기재된 바와 같은 질환 또는 장애, 또는 그의 1종 이상의 증상을 역전시키거나, 완화시키거나, 그의 발병을 지연시키거나 또는 그의 진행을 억제하는 것을 목표로 하는 임상 개입을 지칭한다. 일부 실시양태에서, 치료는 1종 이상의 증상이 발생하였고/거나 질환이 진단된 후에 투여될 수 있다. 다른 실시양태에서, 치료는 증상의 부재 하에서, 예를 들어 증상의 발병을 예방 또는 지연시키거나, 또는 질환의 발병 또는 진행을 억제하기 위해 투여될 수 있다. 예를 들어, 치료는 증상의 발병 전에 (예를 들어, 증상의 병력에 비추어 및/또는 유전적 또는 다른 감수성 인자에 비추어) 걸리기 쉬운 개체에게 투여될 수 있다. 치료는 또한, 예를 들어 그의 재발을 방지 또는 지연시키기 위해, 증상이 해소된 후에 계속될 수 있다.
단백질 또는 핵산과 관련하여 본원에 사용된 용어 "재조합"은 자연에서 발생하는 것이 아니라 인간 조작의 생성물인 단백질 또는 핵산을 지칭한다. 예를 들어, 일부 실시양태에서, 재조합 단백질 또는 핵산 분자는 임의의 자연 발생 서열과 비교하여 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개 또는 적어도 7개의 돌연변이를 포함하는 아미노산 또는 뉴클레오티드 서열을 포함한다.
발명의 상세한 설명
본 개시내용의 일부 측면은 핵염기 아데닌을 탈아미노화시키는 단백질에 관한 것이다. 본 개시내용은 데옥시리보핵산 (DNA) 내의 데옥시아데노신 잔기의 아데닌을 탈아미노화 (즉, 아민 기 제거)시킬 수 있는 아데노신 데아미나제 단백질을 제공한다. 예를 들어, 본원에 제공된 아데노신 데아미나제는 DNA의 데옥시아데노신 잔기의 아데닌을 탈아미노화시킬 수 있다. 본 개시내용의 다른 측면은 아데노신 데아미나제 (예를 들어, 본원에 기재된 바와 같은 DNA 내의 데옥시아데노신을 탈아미노화시키는 아데노신 데아미나제) 및 특이적 뉴클레오티드 서열에 결합할 수 있는 도메인 (예를 들어, Cas9 또는 Cpf1 단백질)을 포함하는 융합 단백질을 제공한다. 아데노신 데아미나제에 의한 아데노신의 탈아미노화는 점 돌연변이를 유도할 수 있으며, 이 과정은 본원에서 핵산 편집으로 지칭된다. 예를 들어, 아데노신은 이노신 잔기로 전환될 수 있으며, 이는 전형적으로 시토신 잔기와 염기 쌍을 이룬다. 이러한 융합 단백질은 특히 핵산 서열의 표적화된 편집에 유용하다. 이러한 융합 단백질은 시험관내 DNA의 표적화된 편집, 예를 들어 돌연변이체 세포 또는 동물의 생성; 표적화된 돌연변이의 도입, 예를 들어 생체외 세포에서의, 예를 들어 대상체로부터 수득된 후 후속적으로 동일한 또는 또 다른 대상체 내로 재-도입되는 세포에서의 유전적 결함의 교정; 및 생체내 표적화된 돌연변이의 도입, 예를 들어 대상체에서의 질환-연관된 유전자 내 유전적 결함의 교정 또는 탈활성화 돌연변이의 도입에 사용될 수 있다. 예로서, A에서 G 또는 T에서 C로의 돌연변이를 만듦으로써 치료될 수 있는 질환은 본원에 제공된 핵염기 편집제를 사용하여 치료될 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 겸상 적혈구성 빈혈과 같은 특정 빈혈은 전형적으로 성인에서 침묵되는 태아성 헤모글로빈과 같은 헤모글로빈의 발현을 유도함으로써 치료될 수 있다. 한 예로서, HBG1 및 HBG2 유전자 발현을 구동하는 프로모터 내 -198T를 C로 돌연변이시키는 것은 HBG1 및 HBG2의 증가된 발현을 유발한다.
또 다른 예로, 유전자 내 G에서 A로의 돌연변이로부터 유발되는 장애의 부류는 철 축적 장애이며, 여기서 HFE 유전자는 C282Y 돌연변이체 HFE 단백질의 발현을 유발하는 G에서 A로의 돌연변이를 포함한다. 따라서, 본원에 기재된 아데노신 염기 편집제는 이러한 G에서 A로의 돌연변이의 표적화된 편집 (예를 들어, 표적화된 게놈 편집)에 이용될 수 있다. 본 발명은 데아미나제 및 핵염기 편집제를 이용하는, 데아미나제, 융합 단백질, 핵산, 벡터, 세포, 조성물, 방법, 키트, 시스템 등을 제공한다.
일부 실시양태에서, 본원에 제공된 핵염기 편집제는 1개 이상의 단백질 도메인을 함께 융합시켜 융합 단백질을 생성함으로써 제조될 수 있다. 특정 실시양태에서, 본원에 제공된 융합 단백질은 융합 단백질의 염기 편집 활성 (예를 들어, 효율, 선택성 및 특이성)을 개선시키는 1개 이상의 특색을 포함한다. 예를 들어, 본원에 제공된 융합 단백질은 감소된 뉴클레아제 활성을 갖는 Cas9 도메인을 포함할 수 있다. 일부 실시양태에서, 본원에 제공된 융합 단백질은 뉴클레아제 활성을 갖지 않는 Cas9 도메인 (dCas9), 또는 Cas9 니카제 (nCas9)로 지칭되는, 듀플렉스 DNA 분자의 한 가닥을 절단하는 Cas9 도메인을 가질 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 촉매 잔기 (예를 들어, H840) 돌연변이의 존재는 표적화된 A에 대향하는 T를 함유하는 비-편집 (예를 들어, 비-탈아미노화) 가닥을 절단하기 위한 Cas9의 활성을 유지한다. Cas9의 촉매 잔기의 돌연변이 (예를 들어, D10에서 A10으로)는 표적화된 A 잔기를 함유하는 편집된 가닥의 절단을 방지한다. 이러한 Cas9 변이체는 gRNA-한정된 표적 서열에 기초하여 특정 위치에서 단일-가닥 DNA 파괴 (닉)를 생성할 수 있어, 비-편집 가닥의 복구를 유도하여, 궁극적으로 비-편집 가닥 상의 T에서 C로의 변화를 유발한다.
아데노신 데아미나제
본 개시내용의 일부 측면은 아데노신 데아미나제를 제공한다. 일부 실시양태에서, 본원에 제공된 아데노신 데아미나제는 아데닌을 탈아미노화시킬 수 있다. 일부 실시양태에서, 본원에 제공된 아데노신 데아미나제는 DNA의 데옥시아데노신 잔기에서의 아데닌을 탈아미노화시킬 수 있다. 아데노신 데아미나제는 임의의 적합한 유기체 (예를 들어, 이. 콜라이)로부터 유래될 수 있다. 일부 실시양태에서, 아데닌 데아미나제는 본원에 제공된 임의의 돌연변이 (예를 들어, ecTadA에서의 돌연변이)에 상응하는 1개 이상의 돌연변이를 포함하는 자연 발생 아데노신 데아미나제이다. 관련 기술분야의 통상의 기술자는 관련 기술분야에 널리 공지된 방법, 예를 들어 서열 정렬 및 상동 잔기의 결정에 의해 임의의 상동 단백질 및 각각의 코딩 핵산에서 상응하는 잔기를 확인할 수 있을 것이다. 따라서, 관련 기술분야의 통상의 기술자는 본원에 기재된 임의의 돌연변이, 예를 들어 ecTadA에서 확인된 임의의 돌연변이에 상응하는 임의의 자연 발생 아데노신 데아미나제 (예를 들어, ecTadA에 대한 상동성을 갖는 것)에 돌연변이를 생성시킬 수 있을 것이다. 일부 실시양태에서, 아데노신 데아미나제는 원핵생물로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 박테리아로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 에스케리키아 콜라이, 스타필로코쿠스 아우레우스, 살모넬라 티피, 슈와넬라 푸트레파시엔스, 헤모필루스 인플루엔자에, 카울로박터 크레센투스 또는 바실루스 서브틸리스로부터의 것이다. 일부 실시양태에서, 아데노신 데아미나제는 이. 콜라이로부터의 것이다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 본원에 제공된 아데노신 데아미나제는 1개 이상의 돌연변이 (예를 들어, 본원에 제공된 임의의 돌연변이)를 포함할 수 있다는 것이 인지되어야 한다. 본 개시내용은 임의의 데아미나제 도메인에 특정 퍼센트 동일성 플러스 본원에 기재된 임의의 돌연변이 또는 그의 조합을 제공한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160 또는 적어도 170개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 D108X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108G, D108N, D108V, D108A 또는 D108Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D108N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 그러나, 추가의 데아미나제가 본원에 제공된 바와 같이 돌연변이될 수 있는 상동 아미노산 잔기를 확인하기 위해 유사하게 정렬될 수 있다는 것이 인지되어야 한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 A106X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 E155X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 E155D, E155G 또는 E155V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 E155V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D147X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 D147Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
본원에 제공된 임의의 돌연변이 (예를 들어, 서열식별번호: 1의 ecTadA 아미노산 서열에 기초함)는 다른 아데노신 데아미나제, 예컨대 에스. 아우레우스 TadA (saTadA) 또는 다른 아데노신 데아미나제 (예를 들어, 박테리아 아데노신 데아미나제) 내로 도입될 수 있다는 것이 인지되어야 한다. ecTadA에서의 돌연변이된 잔기에 상동인 다른 아데노신 데아미나제로부터의 아미노산 잔기를 확인하는 방법은 통상의 기술자에게 분명할 것이다. 따라서, ecTadA에서 확인된 임의의 돌연변이는 상동 아미노산 잔기를 갖는 다른 아데노신 데아미나제에서 만들어질 수 있다. 또한 본원에 제공된 임의의 돌연변이는 ecTadA 또는 또 다른 아데노신 데아미나제에서 개별적으로 또는 임의의 조합으로 만들어질 수 있다는 것인 인지되어야 한다. 예를 들어, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 D108N, A106V, E155V 및/또는 D147Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 함유할 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 하기 돌연변이의 군 (돌연변이의 군은 ";"으로 구분됨) 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다: D108N 및 A106V; D108N 및 E155V; D108N 및 D147Y; A106V 및 E155V; A106V 및 D147Y; E155V 및 D147Y; D108N, A106V, 및 E55V; D108N, A106V, 및 D147Y; D108N, E55V, 및 D147Y; A106V, E55V, 및 D147Y; 및 D108N, A106V, E55V, 및 D147Y. 그러나, 본원에 제공된 상응하는 돌연변이의 임의의 조합이 아데노신 데아미나제 (예를 들어, ecTadA)에서 만들어질 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 아데노신 데아미나제는 ecTadA에서 만들어진 개별 돌연변이 및 돌연변이의 조합을 확인시켜 주는 도 7에 제시된 돌연변이 중 1개 이상을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 본원에 제공된 임의의 돌연변이 또는 돌연변이의 조합을 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 L84X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 H123X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H123Y 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 I156X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 I156F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84X, A106X, D108X, H123X, D147X, E155X 및 I156X로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F, A106V, D108N, H123Y, D147Y, E155V 및 I156F로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S2A, I49F, A106V, D108N, D147Y 및 E155V로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5 또는 6개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H8Y, A106T, D108N, N127S 및 K160S로 이루어진 군으로부터 선택된 1, 2, 3, 4 또는 5개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 A142X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A142N, A142D, A142G 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A142N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 H36X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 N37X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 N37T 또는 N37S 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 N37S 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 P48X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48T, P48S, P48A 또는 P48L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48T 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48S 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 P48A 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 R51X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R51H 또는 R51L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R51L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 S146X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S146R 또는 S146C 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S146C 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 K157X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 W23X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R 또는 W23L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 R152X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R152P 또는 R52H 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R152P 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R152H 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 R26X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 R26G 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 I49X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 I49V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 N72X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 N72D 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 S97X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 S97C 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 G125X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 G125A 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 ecTadA 서열식별번호: 1에서의 K161X 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 K161T 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, N37X, P48X, I49X, R51X, N72X, L84X, S97X, A106X, D108X, H123X, G125X, A142X, S146X, D147X, R152X, E155X, I156X, K157X 및/또는 K161X 돌연변이 중 1개 이상 또는 또 다른 아데노신 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하며, 여기서 X의 존재는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산을 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, W23R, H36L, P48S, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및/또는 K157N 돌연변이 중 1개 이상 또는 또 다른 아데노신 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에 상응하는 도 7에 제공된 돌연변이 중 1개 이상 또는 또 다른 아데노신 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X 및 D108X로부터 선택된 1 또는 2개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V 및 D108N으로부터 선택된 1 또는 2개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106X, D108X, D147X 및 E155X로부터 선택된 1, 2, 3 또는 4개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V, D108N, D147Y 및 E155V로부터 선택된 1, 2, 3 또는 4개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 A106V, D108N, D147Y 및 E155V 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84X, A106X, D108X, H123X, D147X, E155X 및 I156X로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F, A106V, D108N, H123Y, D147Y, E155V 및 I156F로부터 선택된 1, 2, 3, 4, 5, 6 또는 7개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 L84F, A106V, D108N, H123Y, D147Y, E155V 및 I156F 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36X, R51X, L84X, A106X, D108X, H123X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36X, P48X, R51X, L84X, A106X, D108X, H123X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36X, P48X, R51X, L84X, A106X, D108X, H123X, A142X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, P48X, R51X, L84X, A106X, D108X, H123X, A142X, S146X, D147X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, P48X, R51X, L84X, A106X, D108X, H123X, S146X, D147X, R152X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23X, H36X, P48X, R51X, L84X, A106X, D108X, H123X, A142X, S146X, D147X, R152X, E155X, I156X 및 K157X로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어지며, 여기서 X는 야생형 아데노신 데아미나제에서의 상응하는 아미노산 이외의 임의의 아미노산의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이 또는 돌연변이들을 포함하거나 이로 이루어진다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함하거나 이로 이루어진다.
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에 상응하는 도 7에 제공된 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이 중 1개 이상을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 도 7에 제공된 서열식별번호: 1의 변이체 또는 또 다른 아데노신 데아미나제에서의 상응하는 변이체를 포함하거나 이로 이루어진다.
아데노신 데아미나제 (예를 들어, 제1 또는 제2 아데노신 데아미나제)는 도 7에 제시된 임의의 아데노신 데아미나제 (예를 들어, ecTadA 아데노신 데아미나제)에 제공된 돌연변이 중 1개 이상을 포함할 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 아데노신 데아미나제는 도 7에 제시된 임의의 아데노신 데아미나제 (예를 들어, ecTadA 아데노신 데아미나제)에 제공된 돌연변이의 조합을 포함한다. 예를 들어, 아데노신 데아미나제는 돌연변이 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N (서열식별번호: 1에 대한 것)을 포함할 수 있으며, 이는 도 7에서 ABE7.10으로 제시된다. 일부 실시양태에서, 아데노신 데아미나제는 돌연변이 H36L, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N (서열식별번호: 1에 대한 것)을 포함할 수 있다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1에 대해 하기 돌연변이의 조합 중 임의의 것을 포함하며, 여기서 조합의 각각의 돌연변이는 "_"로 분리되고 돌연변이의 각각의 조합은 괄호 사이에 있다:
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제와 비교하여 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160 또는 적어도 166개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제의 아미노산 서열을 포함한다. 일부 실시양태에서, 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684, 802-805 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제의 아미노산 서열로 이루어진다. 하기 제공된 ecTadA 서열은 ecTadA (서열식별번호: 1)로부터 N-말단 메티오닌 (M)이 부재하는 것이다. 하기 제공된 saTadA 서열은 saTadA (서열식별번호: 8)로부터 N-말단 메티오닌 (M)이 부재하는 것이다. 명확성을 위해, 다양한 아미노산 돌연변이를 확인하는데 사용된 아미노산 넘버링 스킴은 이. 콜라이 TadA 대한 ecTadA (서열식별번호: 1) 및 에스. 아우레우스 TadA 대한 saTadA (서열식별번호: 8)로부터 유래된다. 서열식별번호: 1 (ecTadA) 또는 서열식별번호: 8 (saTadA)에 대한 아미노산 돌연변이는 밑줄표시에 의해 나타나 있다.
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
핵염기 편집제의 Cas9 도메인
일부 측면에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cas9 도메인이다. 비제한적, 예시적인 Cas9 도메인이 본원에 제공된다. Cas9 도메인은 뉴클레아제 활성 Cas9 도메인, 뉴클레아제 불활성 Cas9 도메인 또는 Cas9 니카제일 수 있다. 일부 실시양태에서, Cas9 도메인은 뉴클레아제 활성 도메인이다. 예를 들어, Cas9 도메인은 듀플렉스 핵산의 양쪽 가닥 (예를 들어, 듀플렉스 DNA 분자의 양쪽 가닥)을 절단하는 Cas9 도메인일 수 있다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 바와 같은 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100 또는 적어도 1200개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, Cas9 도메인은 뉴클레아제-불활성 Cas9 도메인 (dCas9)이다. 예를 들어, dCas9 도메인은 듀플렉스 핵산 분자의 어느 하나의 가닥을 절단하지 않고 듀플렉스 핵산 분자에 (예를 들어, gRNA 분자를 통해) 결합할 수 있다. 일부 실시양태에서, 뉴클레아제-불활성 dCas9 도메인은 서열식별번호: 52에 제시된 아미노산 서열의 D10X 돌연변이 및 H840X 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산 변화이다. 일부 실시양태에서, 뉴클레아제-불활성 dCas9 도메인은 서열식별번호: 52에 제시된 아미노산 서열의 D10A 돌연변이 및 H840A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 한 예로서, 뉴클레아제-불활성 Cas9 도메인은 서열식별번호: 54에 제시된 아미노산 서열을 포함한다 (클로닝 벡터 pPlatTET-gRNA2, 수탁 번호 BAV54124).
Figure pct00051
예를 들어, 문헌 [Qi et al., "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression." Cell. 2013; 152(5):1173-83] 참조, 이의 전체 내용은 본원에 참조로 포함됨).
추가의 적합한 뉴클레아제-불활성 dCas9 도메인은 본 개시내용 및 관련 기술분야의 지식에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이며, 본 개시내용의 범주 내에 있다. 이러한 추가의 예시적인 적합한 뉴클레아제-불활성 Cas9 도메인은 D10A/H840A, D10A/D839A/H840A 및 D10A/D839A/H840A/N863A 돌연변이체 도메인을 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Prashant et al., CAS9 transcriptional activators for target specificity screening 및 paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838] 참조, 이의 전체 내용은 본원에 참조로 포함됨). 일부 실시양태에서 dCas9 도메인은 본원에 제공된 dCas9 도메인 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 108-357에 제시된 아미노산 서열 중 어느 하나와 비교하여 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100 또는 적어도 1200개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, Cas9 도메인은 Cas9 니카제이다. Cas9 니카제는 듀플렉스 핵산 분자 (예를 들어, 듀플렉스 DNA 분자)의 단지 1개의 가닥만을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 실시양태에서, Cas9 니카제는 듀플렉스 핵산 분자의 표적 가닥을 절단하며, 이는 Cas9 니카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)에 염기 쌍형성된 (그에 상보적인) 가닥을 절단함을 의미한다. 일부 실시양태에서, Cas9 니카제는 D10A 돌연변이를 포함하며, 서열식별번호: 52의 위치 840에 히스티딘 또는 서열식별번호: 108-357 중 임의의 것에서의 돌연변이를 갖는다. 한 예로서, Cas9 니카제는 서열식별번호: 35에 제시된 바와 같은 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, Cas9 니카제는 듀플렉스 핵산 분자의 비-표적, 비-염기-편집 가닥을 절단하며, 이는 Cas9 니카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)에 염기 쌍형성되지 않은 가닥을 절단함을 의미한다. 일부 실시양태에서, Cas9 니카제는 H840A 돌연변이를 포함하며, 서열식별번호: 52의 위치 10에 아스파르트산 잔기 또는 서열식별번호: 108-357 중 임의의 것에서의 상응하는 돌연변이를 갖는다. 일부 실시양태에서 Cas9 니카제는 본원에 제공된 Cas9 니카제 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 추가의 적합한 Cas9 니카제는 본 개시내용 및 관련 기술분야의 지식에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이며, 본 개시내용의 범주 내에 있다.
감소된 PAM 배타성을 갖는 Cas9 도메인
본 개시내용의 일부 측면은 상이한 PAM 특이성을 갖는 Cas9 도메인을 제공한다. 전형적으로, Cas9 단백질, 예컨대 에스. 피오게네스로부터의 Cas9 (spCas9)는 정규 NGG PAM 서열이 특정한 핵산 영역에 결합할 것을 요구하며, 여기서 "NGG" 내 "N"은 아데닌 (A), 티민 (T), 구아닌 (G) 또는 시토신 (C)이고, G는 구아닌이다. 이는 게놈 내에서 목적하는 염기를 편집하는 능력을 제한할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집 융합 단백질은, 예를 들어 표적 염기가 PAM의 대략 15개 염기 상류에 있는 4개의 염기 영역 (예를 들어, "탈아미노화 윈도우") 내인 정확한 위치에 놓일 필요가 있을 수 있다. 문헌 [Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016)]을 참조하며, 이의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, 탈아미노화 윈도우는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 염기 영역 내이다. 일부 실시양태에서, 탈아미노화 윈도우는 PAM의 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개 염기 상류에 있다. 따라서, 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 정규 (예를 들어, NGG) PAM 서열을 함유하지 않는 뉴클레오티드 서열에 결합할 수 있는 Cas9 도메인을 함유할 수 있다. 비-정규 PAM 서열에 결합하는 Cas9 도메인은 관련 기술분야에 기재되었으며, 통상의 기술자에게 분명할 것이다. 예를 들어, 비-정규 PAM 서열에 결합하는 Cas9 도메인은 문헌 [Kleinstiver, B. P., et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities" Nature 523, 481-485 (2015); 및 Kleinstiver, B. P., et al., "Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" Nature Biotechnology 33, 1293-1298 (2015)] (각각의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.
일부 실시양태에서, Cas9 도메인은 스타필로코쿠스 아우레우스로부터의 Cas9 도메인 (SaCas9)이다. 일부 실시양태에서, SaCas9 도메인은 뉴클레아제 활성 SaCas9, 뉴클레아제 불활성 SaCas9 (SaCas9d), 또는 SaCas9 니카제 (SaCas9n)이다. 일부 실시양태에서, SaCas9는 아미노산 서열 서열식별번호: 55를 포함한다. 일부 실시양태에서, SaCas9는 서열식별번호: 55의 N579X 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 N을 제외한 임의의 아미노산이다. 일부 실시양태에서, SaCas9는 서열식별번호: 55의 N579A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, SaCas9 도메인, SaCas9d 도메인 또는 SaCas9n 도메인은 비-정규 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SaCas9 도메인, SaCas9d 도메인 또는 SaCas9n 도메인은 NNGRRT PAM 서열을 갖는 핵산 서열에 결합할 수 있으며, 여기서 N = A, T, C 또는 G 및 R = A 또는 G이다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 55의 E781X, N967X 및 R1014X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 55의 E781K, N967K 및 R1014H 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 1개 이상의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 55의 E781K, N967K 또는 R1014H 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 55-57 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 55-57 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 55-57 중 어느 하나의 아미노산 서열로 이루어진다.
예시적인 SaCas9 서열
Figure pct00052
밑줄표시 및 볼드체인 서열식별번호: 55의 잔기 N579는 돌연변이되어 (예를 들어, A579로) SaCas9 니카제를 생성할 수 있다.
예시적인 SaCas9n 서열
Figure pct00053
서열식별번호: 55의 N579로부터 돌연변이되어 SaCas9 니카제를 생성할 수 있는 서열식별번호: 56의 잔기 A579는 밑줄표시되어 있고 볼드체이다.
예시적인 SaKKH Cas9
Figure pct00054
서열식별번호: 55의 N579로부터 돌연변이되어 SaCas9 니카제를 생성할 수 있는 서열식별번호: 57의 잔기 A579는 밑줄표시되어 있고 볼드체이다. 서열식별번호: 55의 E781, N967 및 R1014로부터 돌연변이되어 SaKKH Cas9를 생성할 수 있는 서열식별번호: 57의 잔기 K781, K967 및 H1014는 밑줄표시되어 있고 이탤릭체이다.
일부 실시양태에서, Cas9 도메인은 스트렙토코쿠스 피오게네스로부터의 Cas9 도메인 (SpCas9)이다. 일부 실시양태에서, SpCas9 도메인은 뉴클레아제 활성 SpCas9, 뉴클레아제 불활성 SpCas9 (SpCas9d) 또는 SpCas9 니카제 (SpCas9n)이다. 일부 실시양태에서, SpCas9는 아미노산 서열 서열식별번호: 58을 포함한다. 일부 실시양태에서, SpCas9는 서열식별번호: 58의 D9X 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 D를 제외한 임의의 아미노산이다. 일부 실시양태에서, SpCas9는 서열식별번호: 58의 D9A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인, SpCas9d 도메인 또는 SpCas9n 도메인은 비-정규 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SpCas9 도메인, SpCas9d 도메인 또는 SpCas9n 도메인은 NGG, NGA 또는 NGCG PAM 서열을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134X, R1334X 및 T1336X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134E, R1334Q 및 T1336R 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134E, R1334Q 및 T1336R 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134X, R1334X 및 T1336X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, R1334Q 및 T1336R 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, R1334Q 및 T1336R 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134X, G1217X, R1334X 및 T1336X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, G1217R, R1334Q 및 T1336R 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 58의 D1134V, G1217R, R1334Q 및 T1336R 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 58-62 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 58-62 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 Cas9 도메인은 서열식별번호: 58-62 중 어느 하나의 아미노산 서열로 이루어진다.
예시적인 SpCas9
Figure pct00055
예시적인 SpCas9n
Figure pct00056
예시적인 SpEQR Cas9
Figure pct00057
서열식별번호: 58의 D1134, R1334 및 T1336으로부터 돌연변이되어 SpEQR Cas9를 생성할 수 있는 서열식별번호: 60의 잔기 E1134, Q1334 및 R1336은 밑줄표시되어 있고 볼드체이다.
예시적인 SpVQR Cas9
Figure pct00058
서열식별번호: 58의 D1134, R1334 및 T1336으로부터 돌연변이되어 SpVQR Cas9를 생성할 수 있는 서열식별번호: 61의 잔기 V1134, Q1334 및 R1336은 밑줄표시되어 있고 볼드체이다.
예시적인 SpVRER Cas9
Figure pct00059
서열식별번호: 58의 D1134, G1217, R1334 및 T1336으로부터 돌연변이되어 SpVRER Cas9를 생성할 수 있는 서열식별번호: 62의 잔기 V1134, R1217, Q1334 및 R1336은 밑줄표시되어 있고 볼드체이다.
고충실도 Cas9 도메인
본 개시내용의 일부 측면은 본원에 제공된 핵염기 편집제의 고충실도 Cas9 도메인을 제공한다. 일부 실시양태에서, 고충실도 Cas9 도메인은 상응하는 야생형 Cas9 도메인과 비교하여, Cas9 도메인과 DNA의 당-포스페이트 백본 사이의 정전기적 상호작용을 감소시키는 1개 이상의 돌연변이를 포함하는 조작된 Cas9 도메인이다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, DNA의 당-포스페이트 백본과의 감소된 정전기적 상호작용을 갖는 고충실도 Cas9 도메인은 보다 적은 오프-타겟 효과를 가질 수 있다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 야생형 Cas9 도메인)은 Cas9 도메인과 DNA의 당-포스페이트 백본 사이의 회합을 감소시키는 1개 이상의 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인은 Cas9 도메인과 DNA의 당-포스페이트 백본 사이의 회합을 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70% 또는 그 초과만큼 감소시키는 1개 이상의 돌연변이를 포함한다.
일부 실시양태에서, 본원에 제공된 임의의 Cas9 융합 단백질은 서열식별번호: 52에 제공된 아미노산 서열의 N497X, R661X, Q695X 및/또는 Q926X 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, 본원에 제공된 임의의 Cas9 융합 단백질은 서열식별번호: 52에 제공된 아미노산 서열의 N497A, R661A, Q695A 및/또는 Q926A 돌연변이 중 1개 이상 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 52에 제공된 아미노산 서열의 D10A 돌연변이 또는 서열식별번호: 108-357에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 본원에 제공된 임의의 융합 단백질의 것)은 서열식별번호: 62에 제시된 바와 같은 아미노산 서열을 포함한다. 고충실도를 갖는 Cas9 도메인은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 분명할 것이다. 예를 들어, 고충실도를 갖는 Cas9 도메인은 문헌 [Kleinstiver, B.P., et al. "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects." Nature 529, 490-495 (2016); 및 Slaymaker, I.M., et al. "Rationally engineered Cas9 nucleases with improved specificity." Science 351, 84-88 (2015)] (각각의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.
본원에 제공된 임의의 염기 편집제, 예를 들어 본원에 제공된 아데노신 데아미나제 임의의 염기 편집제는 본원에 기재된 바와 같이 Cas9 도메인을 변형시킴으로써 고충실도 염기 편집제로 전환되어 고충실도 염기 편집제, 예를 들어 고충실도 아데노신 염기 편집제를 생성할 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 고충실도 Cas9 도메인은 dCas9 도메인이다. 일부 실시양태에서, 고충실도 Cas9 도메인은 nCas9 도메인이다.
서열식별번호: 10의 Cas9에 대한 돌연변이가 볼드체 및 밑줄로 제시된 고충실도 Cas9 도메인
Figure pct00060
핵산 프로그램가능한 DNA 결합 단백질
본 개시내용의 일부 측면은 단백질, 예컨대 염기 편집제를 특정 핵산 (예를 들어, DNA 또는 RNA) 서열에 가이드하는데 사용될 수 있는 핵산 프로그램가능한 DNA 결합 단백질을 제공한다. 핵산 프로그램가능한 DNA 결합 단백질은, 비제한적으로, Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2C3, 및 아르고노트를 포함한다. Cas9와 상이한 PAM 특이성을 갖는 핵산 프로그램가능한 DNA 결합 단백질의 한 예는 프레보텔라 및 프란시셀라 1로부터의 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (Cpf1)이다. Cas9와 유사하게, Cpf1도 또한 부류 2 CRISPR 이펙터이다. Cpf1은 Cas9와는 다른 특색을 가지면서 강건한 DNA 간섭을 매개하는 것으로 밝혀졌다. Cpf1은 tracrRNA가 결여된 단일 RNA-가이드 엔도뉴클레아제이고, T-풍부 프로토스페이서-인접 모티프 (TTN, TTTN 또는 YTN)를 이용한다. 더욱이, Cpf1은 엇갈린 DNA 이중-가닥을 통해 DNA를 절단한다. 16종의 Cpf1-패밀리 단백질 중에서, 아시다미노코쿠스(Acidaminococcus) 및 라크노스피라세아에(Lachnospiraceae)로부터의 2종의 효소는 인간 세포에서의 효율적인 게놈-편집 활성을 갖는 것으로 밝혀져 있다. Cpf1 단백질은 관련 기술분야에 공지되어 있고, 이전에, 예를 들어 문헌 [Yamano et al., "Crystal structure of Cpf1 in complex with guide RNA and target DNA." Cell (165) 2016, p. 949-962] (이의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 미생물 CRISPR-Cas 시스템의 단일 이펙터이다. 미생물 CRISPR-Cas 시스템의 단일 이펙터는, 비제한적으로, Cas9, Cpf1, C2c1, C2c2 및 C2c3을 포함한다. 전형적으로, 미생물 CRISPR-Cas 시스템은 부류 1 및 부류 2 시스템으로 나누어진다. 부류 1 시스템은 멀티서브유닛 이펙터 복합체를 갖고, 반면에 부류 2 시스템은 단일 단백질 이펙터를 갖는다. 예를 들어, Cas9 및 Cpf1은 부류 2 이펙터이다. Cas9 및 Cpf1 이외에, 3종의 특유한 부류 2 CRISPR-Cas 시스템 (C2c1, C2c2 및 C2c3)이 문헌 [Shmakov et al., "Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems", Mol. Cell, 2015 Nov 5; 60(3): 385-397] (이의 전체 내용은 본원에 참조로 포함됨)에 기재되었다.
뉴클레아제 프로그램가능한 DNA 결합 단백질 및 아데노신 데아미나제를 포함하는 융합 단백질
본 개시내용의 일부 측면은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 염기 편집제이다. 일부 실시양태에서, napDNAbp는 Cas9 도메인, Cpf1 도메인, CasX 도메인, CasY 도메인, C2c1 도메인, C2c2 도메인, aC2c3 도메인 또는 아르고노트 도메인이다. 일부 실시양태에서, napDNAbp는 본원에 제공된 임의의 napDNAbp이다. 본 개시내용의 일부 측면은 Cas9 도메인 및 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. Cas9 도메인은 본원에 제공된 Cas9 도메인 또는 Cas9 단백질 (예를 들어, dCas9 또는 nCas9) 중 임의의 것일 수 있다. 일부 실시양태에서, 본원에 제공된 Cas9 도메인 또는 Cas9 단백질 (예를 들어, dCas9 또는 nCas9) 중 임의의 것은 본원에 제공된 임의의 아데노신 데아미나제와 융합될 수 있다. 일부 실시양태에서, 융합 단백질은 하기 구조를 포함한다:
NH2-[아데노신 데아미나제]-[napDNAbp]-COOH; 또는
NH2-[napDNAbp]-[아데노신 데아미나제]-COOH
일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp (예를 들어, Cas9 도메인)를 포함하는 융합 단백질은 링커 서열을 포함하지 않는다. 일부 실시양태에서, 링커는 아데노신 데아미나제 도메인과 napDNAbp 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 본원에 제공된 임의의 링커를 통해 융합된다. 예를 들어, 일부 실시양태에서 아데노신 데아미나제 및 napDNAbp는 하기 "링커" 표제의 섹션에 제공된 임의의 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 1 내지 200개의 아미노산을 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 1 내지 5, 1 내지 10, 1 내지 20, 1 내지 30, 1 내지 40, 1 내지 50, 1 내지 60, 1 내지 80, 1 내지 100, 1 내지 150, 1 내지 200, 5 내지 10, 5 내지 20, 5 내지 30, 5 내지 40, 5 내지 60, 5 내지 80, 5 내지 100, 5 내지 150, 5 내지 200, 10 내지 20, 10 내지 30, 10 내지 40, 10 내지 50, 10 내지 60, 10 내지 80, 10 내지 100, 10 내지 150, 10 내지 200, 20 내지 30, 20 내지 40, 20 내지 50, 20 내지 60, 20 내지 80, 20 내지 100, 20 내지 150, 20 내지 200, 30 내지 40, 30 내지 50, 30 내지 60, 30 내지 80, 30 내지 100, 30 내지 150, 30 내지 200, 40 내지 50, 40 내지 60, 40 내지 80, 40 내지 100, 40 내지 150, 40 내지 200, 50 내지 60 50 내지 80, 50 내지 100, 50 내지 150, 50 내지 200, 60 내지 80, 60 내지 100, 60 내지 150, 60 내지 200, 80 내지 100, 80 내지 150, 80 내지 200, 100 내지 150, 100 내지 200, 또는 150 내지 200개 아미노산의 길이를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 3, 4, 16, 24, 32, 64, 100 또는 104개 아미노산의 길이를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 SGSETPGTSESATPES (서열식별번호: 10), SGGS (서열식별번호: 37), SGGSSGSETPGTSESATPESSGGS (서열식별번호: 384), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 385) 또는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS (서열식별번호: 386)의 아미노산 서열을 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp는 XTEN 링커로 또한 지칭될 수 있는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10)를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 링커는 24개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES (서열식별번호: 685)를 포함한다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)2-XTEN-(SGGS)2로 또한 지칭될 수 있는 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 (SGGS)n-SGSETPGTSESATPES-(SGGS)n (서열식별번호: 801)을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 링커는 40개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS (서열식별번호: 686)를 포함한다. 일부 실시양태에서, 링커는 64개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 687)를 포함한다. 일부 실시양태에서, 링커는 92개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS (서열식별번호: 688)를 포함한다.
핵 국재화 서열 (NLS)을 포함하는 융합 단백질
일부 실시양태에서, 본원에 제공된 융합 단백질은 1개 이상의 핵 표적화 서열, 예를 들어 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 NLS를 포함하는 단백질의 세포 핵 내로의 도입 (예를 들어, 핵 수송에 의해)을 용이하게 하는 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 융합 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 융합 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 IBR (예를 들어, dISN)의 N-말단에 융합된다. 일부 실시양태에서, NLS는 IBR (예를 들어, dISN)의 C-말단에 융합된다. 일부 실시양태에서, NLS는 napDNAbp의 N-말단에 융합된다. 일부 실시양태에서, NLS는 napDNAbp의 C-말단에 융합된다. 일부 실시양태에서, NLS는 아데노신 데아미나제의 N-말단에 융합된다. 일부 실시양태에서, NLS는 아데노신 데아미나제의 C-말단에 융합된다. 일부 실시양태에서, NLS는 1개 이상의 링커를 통해 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 링커 없이 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 본원에 제공되거나 언급된 NLS 서열 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, NLS는 서열식별번호: 4 또는 서열식별번호: 5에 제시된 바와 같은 아미노산 서열을 포함한다. 추가의 핵 국재화 서열은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 분명할 것이다. 예를 들어, NLS 서열은 PCT/EP2000/011690 (Plank et al.)에 기재되어 있으며, 상기 문헌의 내용은 예시적인 핵 국재화 서열의 개시내용에 대해 본원에 참조로 포함된다. 일부 실시양태에서, NLS는 아미노산 서열 PKKKRKV (서열식별번호: 4), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열식별번호: 5), MKRTADGSEFEPKKKRKV (서열식별번호: 342), 또는 KRTADGSEFEPKKKRKV (서열식별번호: 343)를 포함한다.
일부 실시양태에서, 아데노신 데아미나제 및 napDNAbp를 갖는 예시적인 융합 단백질의 일반적 아키텍처는 하기 구조 중 어느 하나를 포함하며, 여기서 NLS는 핵 국재화 서열 (예를 들어, 본원에 제공된 임의의 NLS), NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다.
아데노신 데아미나제, napDNAbp 및 NLS를 포함하는 융합 단백질.
NH2-[NLS]-[아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[아데노신 데아미나제]-[NLS]-[napDNAbp]-COOH;
NH2-[아데노신 데아미나제]-[napDNAbp]-[NLS]-COOH;
NH2-[NLS]-[napDNAbp]-[아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[NLS]-[아데노신 데아미나제]-COOH; 및
NH2-[napDNAbp]-[아데노신 데아미나제]-[NLS]-COOH.
일부 실시양태에서, 본원에 제공된 융합 단백질은 링커를 포함하지 않는다. 일부 실시양태에서, 링커는 도메인 또는 단백질 (예를 들어, 아데노신 데아미나제, napDNAbp 및/또는 NLS) 중 1개 이상 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다.
본 개시내용의 일부 측면은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 적어도 2개의 아데노신 데아미나제 도메인을 포함하는 융합 단백질을 제공한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 아데노신 데아미나제의 이량체화 (예를 들어, 시스 또는 트랜스)는 융합 단백질이 핵산 염기를 변형시키는, 예를 들어 아데닌을 탈아미노화시키는 능력 (예를 들어, 효율)을 개선시킬 수 있다. 일부 실시양태에서, 융합 단백질 중 임의의 것은 2, 3, 4 또는 5개의 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 2개의 아데노신 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 단지 2개의 아데노신 데아미나제만을 함유한다. 일부 실시양태에서, 아데노신 데아미나제는 동일하다. 일부 실시양태에서, 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이다. 일부 실시양태에서, 아데노신 데아미나제는 상이하다. 일부 실시양태에서, 제1 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이고, 제2 아데노신은 본원에 제공된 임의의 아데노신 데아미나제이지만 제1 아데노신 데아미나제와는 동일하지 않다. 한 예로서, 융합 단백질은 둘 다가 ecTadA (서열식별번호: 1)로부터의 A106V, D108N, D147Y 및 E155V 돌연변이를 함유하는 서열식별번호: 72의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제를 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 682의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 802의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 803의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 804의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 1로부터의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이를 함유하는 서열식별번호: 805의 아미노산 서열을 포함하는 제1 아데노신 데아미나제 및 야생형 ecTadA의 아미노산 서열 (서열식별번호: 1)을 포함하는 제2 아데노신 데아미나제 도메인을 포함할 수 있다. 2개의 아데노신 데아미나제 도메인을 포함하는 추가의 융합 단백질 구축물이 도 7에 예시되어 있다.
일부 실시양태에서, 융합 단백질은 2개의 아데노신 데아미나제 (예를 들어, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제)를 포함한다. 일부 실시양태에서, 융합 단백질은 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제를 포함한다. 일부 실시양태에서, 제1 아데노신 데아미나제는 융합 단백질에서 제2 아데노신 데아미나제의 N-말단에 있다. 일부 실시양태에서, 제1 아데노신 데아미나제는 융합 단백질에서 제2 아데노신 데아미나제의 C-말단. 일부 실시양태에서, 제1 아데노신 데아미나제 및 제2 데아미나제는 직접적으로 또는 링커를 통해 융합된다. 일부 실시양태에서, 링커는 본원에 제공된 임의의 링커, 예를 들어 "링커" 섹션에 기재된 임의의 링커이다. 일부 실시양태에서, 링커는 서열식별번호: 10, 37-40, 384-386, 685-688 또는 800-801 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)2-XTEN-(SGGS)2로 또한 지칭될 수 있는 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 (SGGS)n-SGSETPGTSESATPES-(SGGS)n (서열식별번호: 801)을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 제1 아데노신 데아미나제는 제2 아데노신 데아미나제와 동일하다. 일부 실시양태에서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 본원에 기재된 아데노신 데아미나제 중 임의의 것이다. 일부 실시양태에서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 상이하다. 일부 실시양태에서, 제1 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이다. 일부 실시양태에서, 제2 아데노신 데아미나제는 본원에 제공된 임의의 아데노신 데아미나제이지만 제1 아데노신 데아미나제와 동일하지 않다. 일부 실시양태에서, 제1 아데노신 데아미나제는 ecTadA 아데노신 데아미나제이다. 일부 실시양태에서, 제1 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 아데노신 데아미나제는 서열식별번호: 1, 64-84, 420-437, 672-684 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 아데노신 데아미나제에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 아데노신 데아미나제는 서열식별번호: 1의 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질의 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 ecTadA (서열식별번호: 1)에서의 돌연변이, 또는 표 4에 제공된 구축물 (예를 들어, pNMG-371, pNMG-477, pNMG-576, pNMG-586 및 pNMG-616) 중 어느 하나에 제시된 바와 같은 또 다른 아데노신 데아미나제에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 융합 단백질은 표 4에서의 구축물 (예를 들어, pNMG-371, pNMG-477, pNMG-576, pNMG-586 및 pNMG-616) 중 어느 하나의 2개의 아데노신 데아미나제 (예를 들어, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제)를 포함한다.
일부 실시양태에서, 제1 아데노신 데아미나제, 제2 아데노신 데아미나제 및 napDNAbp를 갖는 예시적인 융합 단백질의 일반적 아키텍처는 하기 구조 중 어느 하나를 포함하며, 여기서 NLS는 핵 국재화 서열 (예를 들어, 본원에 제공된 임의의 NLS)이고, NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다.
제1 아데노신 데아미나제, 제2 아데노신 데아미나제 및 napDNAbp를 포함하는 융합 단백질.
NH2-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[제1 아데노신 데아미나제]-[napDNAbp]-[제2 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-COOH;
NH2-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[제2 아데노신 데아미나제]-[napDNAbp]-[제1 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-COOH;
일부 실시양태에서, 본원에 제공된 융합 단백질은 링커를 포함하지 않는다. 일부 실시양태에서, 링커는 도메인 또는 단백질 (예를 들어, 제1 아데노신 데아미나제, 제2 아데노신 데아미나제 및/또는 napDNAbp) 중 1개 이상 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다.
제1 아데노신 데아미나제, 제2 아데노신 데아미나제, napDNAbp 및 NLS를 포함하는 융합 단백질.
NH2-[NLS]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[제1 아데노신 데아미나제]-[NLS]-[제2 아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[NLS]-[napDNAbp]-COOH;
NH2-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-[NLS]-COOH;
NH2-[NLS]-[제1 아데노신 데아미나제]-[napDNAbp]-[제2 아데노신 데아미나제]-COOH;
NH2-[제1 아데노신 데아미나제]-[NLS]-[napDNAbp]-[제2 아데노신 데아미나제]-COOH;
NH2-[제1 아데노신 데아미나제]-[napDNAbp]-[NLS]-[제2 아데노신 데아미나제]-COOH;
NH2-[제1 아데노신 데아미나제]-[napDNAbp]-[제2 아데노신 데아미나제]-[NLS]-COOH;
NH2-[NLS]-[napDNAbp]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[NLS]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[제1 아데노신 데아미나제]-[NLS]-[제2 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[NLS]-COOH;
NH2-[NLS]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[제2 아데노신 데아미나제]-[NLS]-[제1 아데노신 데아미나제]-[napDNAbp]-COOH;
NH2-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[NLS]-[napDNAbp]-COOH;
NH2-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-[NLS]-COOH;
NH2-[NLS]-[제2 아데노신 데아미나제]-[napDNAbp]-[제1 아데노신 데아미나제]-COOH;
NH2-[제2 아데노신 데아미나제]-[NLS]-[napDNAbp]-[제1 아데노신 데아미나제]-COOH;
NH2-[제2 아데노신 데아미나제]-[napDNAbp]-[NLS]-[제1 아데노신 데아미나제]-COOH;
NH2-[제2 아데노신 데아미나제]-[napDNAbp]-[제1 아데노신 데아미나제]-[NLS]-COOH;
NH2-[NLS]-[napDNAbp]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[NLS]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[제2 아데노신 데아미나제]-[NLS]-[제1 아데노신 데아미나제]-COOH;
NH2-[napDNAbp]-[제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[NLS]-COOH;
일부 실시양태에서, 본원에 제공된 융합 단백질은 링커를 포함하지 않는다. 일부 실시양태에서, 링커는 도메인 또는 단백질 (예를 들어, 제1 아데노신 데아미나제, 제2 아데노신 데아미나제, napDNAbp 및/또는 NLS) 중 1개 이상 사이에 존재한다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커의 존재를 나타낸다.
본 개시내용의 융합 단백질은 1개 이상의 추가의 특색을 포함할 수 있다는 것이 인지되어야 한다. 예를 들어, 일부 실시양태에서, 융합 단백질은 세포질 국재화 서열, 유출 서열, 예컨대 핵 유출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제 또는 검출에 유용한 서열 태그 포함할 수 있다. 본원에 제공된 적합한 단백질 태그는 또한 비오틴 카르복실라제 담체 단백질 (BCCP) 태그, myc-태그, 칼모둘린-태그, FLAG-태그, 헤마글루티닌 (HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질 (MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제 (GST)-태그, 녹색 형광 단백질 (GFP)-태그, 티오레독신-태그, S-태그, 소프태그 (예를 들어, 소프태그 1, 소프태그 3), 스트렙-태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그를 포함하나 이에 제한되지는 않는다. 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 분명할 것이다. 일부 실시양태에서, 융합 단백질은 1종 이상의 His 태그를 포함한다.
링커
특정 실시양태에서, 링커는 본원에 기재된 단백질 또는 단백질 도메인 중 임의의 것을 연결하는데 사용될 수 있다. 링커는 공유 결합만큼 단순할 수 있거나 또는 다수의 원자 길이의 중합체 링커일 수 있다. 특정 실시양태에서, 링커는 폴리펩티드이거나 또는 아미노산을 기재로 한다. 다른 실시양태에서, 링커는 펩티드-유사가 아니다. 특정 실시양태에서, 링커는 공유 결합 (예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로원자 결합 등)이다. 특정 실시양태에서, 링커는 아미드 연결의 탄소-질소 결합이다. 특정 실시양태에서, 링커는 시클릭 또는 비-시클릭, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커이다. 특정 실시양태에서, 링커는 중합체 (예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다. 특정 실시양태에서, 링커는 아미노알칸산의 단량체, 이량체 또는 중합체를 포함한다. 특정 실시양태에서, 링커는 아미노알칸산 (예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다. 특정 실시양태에서, 링커는 아미노헥산산 (Ahx)의 단량체, 이량체 또는 중합체를 포함한다. 특정 실시양태에서, 링커는 카르보시클릭 모이어티 (예를 들어, 시클로펜탄, 시클로헥산)를 기재로 한다. 다른 실시양태에서, 링커는 폴리에틸렌 글리콜 모이어티 (PEG)를 포함한다. 다른 실시양태에서, 링커는 아미노산을 포함한다. 특정 실시양태에서, 링커는 펩티드를 포함한다. 특정 실시양태에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다. 특정 실시양태에서, 링커는 페닐 고리를 기재로 한다. 링커는 펩티드에서 링커로 친핵체 (예를 들어, 티올, 아미노)의 부착을 용이하게 하는 관능화된 모이어티를 포함할 수 있다. 임의의 친전자체는 링커의 일부로서 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용자, 알킬 할라이드, 아릴 할라이드, 아실 할라이드 및 이소티오시아네이트를 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 결합 (예를 들어, 공유 결합), 유기 분자, 기, 중합체 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 5-100개 아미노산의 길이, 예를 들어 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80-90, 90-100, 100-110, 110-120, 120-130, 130-140, 140-150 또는 150-200개 아미노산의 길이이다. 보다 긴 또는 보다 짧은 링커도 또한 고려된다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10)를 포함하며, 이는 또한 XTEN 링커로 지칭될 수 있다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)2-XTEN-(SGGS)2로 또한 지칭될 수 있는 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS (서열식별번호: 37)를 포함한다. 일부 실시양태에서, 링커는 (SGGS)n (서열식별번호: 37), (GGGS)n (서열식별번호: 38), (GGGGS)n (서열식별번호: 39), (G)n, (EAAAK)n (서열식별번호: 40), (SGGS)n-SGSETPGTSESATPES-(SGGS)n (서열식별번호: 801), (GGS)n, SGSETPGTSESATPES (서열식별번호: 10), 또는 (XP)n 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이고, X는 임의의 아미노산이다. 일부 실시양태에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다. 일부 실시양태에서, 링커는 SGSETPGTSESATPES (서열식별번호: 10) 및 SGGS (서열식별번호: 37)를 포함한다. 일부 실시양태에서, 링커는 SGGSSGSETPGTSESATPESSGGS (서열식별번호: 384)를 포함한다. 일부 실시양태에서, 링커는 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 385)를 포함한다. 일부 실시양태에서, 링커는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS (서열식별번호: 386)를 포함한다. 일부 실시양태에서, 링커는 24개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES (서열식별번호: 685)를 포함한다. 일부 실시양태에서, 링커는 40개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS (서열식별번호: 686)를 포함한다. 일부 실시양태에서, 링커는 64개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 687)를 포함한다. 일부 실시양태에서, 링커는 92개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS (서열식별번호: 688)를 포함한다. 본원에 제공된 임의의 링커는 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제; 아데노신 데아미나제 (예를 들어, 제1 또는 제2 아데노신 데아미나제) 및 napDNAbp; napDNAbp 및 NLS; 또는 아데노신 데아미나제 (예를 들어, 제1 또는 제2 아데노신 데아미나제) 및 NLS를 연결하는데 사용될 수 있다는 것이 인지되어야 한다.
일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 링커를 통해 서로에 융합된 아데노신 데아미나제 및 napDNAbp를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 링커를 통해 서로에 융합된 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질은 아데노신 데아미나제 (예를 들어, 제1 및/또는 제2 아데노신 데아미나제), 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), 및/또는 염기 복구의 억제제 (IBR)에 융합될 수 있는 NLS를 포함한다. 아데노신 데아미나제 (예를 들어, 조작된 ecTadA)와 napDNAbp (예를 들어, Cas9 도메인) 사이 및/또는 제1 아데노신 데아미나제와 제2 아데노신 데아미나제 사이에 다양한 링커 길이 및 가요성이 사용되어 (예를 들어, 형태 (GGGGS)n (서열식별번호: 38), (GGGGS)n (서열식별번호: 39) 및 (G)n의 매우 가요성인 링커에서 형태 (EAAAK)n (서열식별번호: 40), (SGGS)n (서열식별번호: 37), SGSETPGTSESATPES (서열식별번호: 10) (예를 들어, 문헌 [Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82] (전체 내용은 본원에 참조로 포함됨) 및 (XP)n의 보다 강성인 링커에 이르는 범위) 특정한 적용을 위한 데아미나제 활성을 위한 최적 길이를 달성할 수 있다. 일부 실시양태에서, n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다. 일부 실시양태에서, 링커는 (GGS)n 모티프를 포함하며, 여기서 n은 1, 3 또는 7이다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질의 아데노신 데아미나제 및 napDNAbp 및/또는 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 10), SGGS (서열식별번호: 37), SGGSSGSETPGTSESATPESSGGS (서열식별번호: 384), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 385) 또는 GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS (서열식별번호: 386)를 포함하는 링커를 통해 융합된다. 일부 실시양태에서, 링커는 24개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPES (서열식별번호: 685)를 포함한다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 32개 아미노산의 길이이다. 일부 실시양태에서, 링커는 (SGGS)2-XTEN-(SGGS)2로 또한 지칭될 수 있는 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열을 포함하며, 여기서 n은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 링커는 40개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS (서열식별번호: 686)를 포함한다. 일부 실시양태에서, 링커는 64개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 687)를 포함한다. 일부 실시양태에서, 링커는 92개 아미노산의 길이이다. 일부 실시양태에서, 링커는 아미노산 서열 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATS (서열식별번호: 688)를 포함한다.
본 개시내용의 일부 측면은 Cas9 도메인 및 아데노신 데아미나제를 포함하는 융합 단백질을 제공한다. 예시적인 융합 단백질은, 비제한적으로, 하기 융합 단백질을 포함한다 (명확성의 목적을 위해, 아데노신 데아미나제 도메인은 볼드체로 제시되고; ecTadA 데아미나제 도메인의 돌연변이는 볼드체 밑줄표시로 제시되고; XTEN 링커는 이탤릭체로 제시되고; UGI/AAG/EndoV 도메인은 볼드체 이탤릭체로 제시되고; NLS는 밑줄표시된 이탤릭체로 제시된다):
ecTadA(wt)-XTEN-nCas9-NLS:
Figure pct00061
ecTadA(D108N)-XTEN-nCas9-NLS: (포유동물 구축물, DNA, A에서 G로의 편집에 대해 활성):
Figure pct00062
ecTadA(D108G)-XTEN-nCas9-NLS: (포유동물 구축물, DNA, A에서 G로의 편집에 대해 활성):
Figure pct00063
ecTadA(D108V)-XTEN-nCas9-NLS: (포유동물 구축물, DNA, A에서 G로의 편집에 대해 활성):
Figure pct00064
제1 라운드의 진화로부터 생성된 변이체 (박테리아에서) ecTadA(H8Y_D108N_N127S)-XTEN-dCas9:
Figure pct00065
제2 라운드의 진화로부터의 풍부화된 변이체 (박테리아에서) ecTadA (H8Y_D108N_N127S_E155X)-XTEN-dCas9; X=D, G 또는 V:
Figure pct00066
ABE7.7:
Figure pct00067
Figure pct00068
pNMG-624 아미노산 서열:
Figure pct00069
Figure pct00070
ABE3.2:
Figure pct00071
Figure pct00072
ABE5.3:
Figure pct00073
Figure pct00074
pNMG-558 아미노산 서열:
Figure pct00075
pNMG-576 아미노산 서열:
Figure pct00076
Figure pct00077
pNMG-577 아미노산 서열:
Figure pct00078
Figure pct00079
pNMG-586 아미노산 서열:
Figure pct00080
Figure pct00081
ABE7.2:
Figure pct00082
Figure pct00083
pNMG-620 아미노산 서열:
Figure pct00084
Figure pct00085
pNMG-617 아미노산 서열:
Figure pct00086
Figure pct00087
pNMG-618 아미노산 서열:
Figure pct00088
Figure pct00089
pNMG-620 아미노산 서열:
Figure pct00090
Figure pct00091
pNMG-621 아미노산 서열:
Figure pct00092
Figure pct00093
pNMG-622 아미노산 서열:
Figure pct00094
Figure pct00095
pNMG-623 아미노산 서열:
Figure pct00096
Figure pct00097
ABE6.3:
Figure pct00098
Figure pct00099
ABE6.4:
Figure pct00100
Figure pct00101
ABE7.8:
Figure pct00102
Figure pct00103
ABE7.9:
Figure pct00104
ABE7.10:
Figure pct00105
Figure pct00106
일부 실시양태에서, 융합 단백질은 서열식별번호: 11-28, 387, 388, 440, 691-711 중 어느 하나에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 융합 단백질에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 11-28, 387, 388, 440, 691-711에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 융합 단백질과 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 11-28, 387, 388, 440, 691-711에 제시된 아미노산 서열 중 어느 하나 또는 본원에 제공된 임의의 융합 단백질과 비교하여 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160, 적어도 170, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100, 적어도 1200, 적어도 1300, 적어도 1400, 적어도 1500, 적어도 1600, 적어도 1700, 적어도 1750 또는 적어도 1800개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)과 가이드 핵산의 복합체
본 개시내용의 일부 측면은 본원에 제공된 임의의 융합 단백질, 예를 들어 본원에 제공된 임의의 아데노신 염기 편집제 및 융합 단백질의 napDNAbp에 결합된 가이드 핵산을 포함하는 복합체를 제공한다. 일부 실시양태에서, 본 개시내용은 본원에 제공된 임의의 가이드 RNA에 결합된 본원에 제공된 임의의 융합 단백질 (예를 들어, 아데노신 염기 편집제)을 제공한다. 일부 실시양태에서, 융합 단백질 (예를 들어, 아데노신 염기 편집제)의 napDNAbp는 가이드 RNA에 결합된 Cas9 도메인 (예를 들어, dCas9, 뉴클레아제 활성 Cas9 또는 Cas9 니카제)이다. 일부 실시양태에서, 본원에 제공된 복합체는, 예를 들어 유전자 (예를 들어, HFE, HBB 또는 F8) 내의 점 돌연변이를 교정하거나 또는 프로모터 (예를 들어, HBG1 또는 HBG2 프로모터)를 돌연변이시켜 이러한 프로모터의 제어 하에 있는 1개 이상의 단백질 (예를 들어, 감마 글로빈 단백질)의 발현을 조정하기 위한 핵산 내 돌연변이를 생성하도록 구성된다.
일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 HBG1 또는 HBG2 유전자의 프로모터 영역, 예를 들어 인간 HBG1 또는 HBG2 유전자의 프로모터 영역 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 인간 헤모글로빈 서브유닛 감마 1 (HBG1)은 유전자 ID: 3047의 HBG1이다. 일부 실시양태에서, 인간 헤모글로빈 서브유닛 감마 2 (HBG2)는 유전자 ID: 3048의 HBG2이다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 프로모터이다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 인간 HBG1 또는 HBG2 프로모터이다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 HBG1 또는 HBG2 유전자의 100 내지 300개 뉴클레오티드 상류에 있다. 일부 실시양태에서, HBG1 또는 HBG2 프로모터는 HBG1 또는 HBG2 유전자의 100 내지 300, 110 내지 290, 120 내지 280, 130 내지 270, 140 내지 260, 150 내지 250, 160 내지 240, 160 내지 230, 170 내지 220, 180 내지 210 또는 190 내지 200개 뉴클레오티드 상류에 있다. 일부 실시양태에서, HBG1 발현을 구동하는 프로모터는 HBG1의 198개 뉴클레오티드 상류에 있는 T (-198T)를 포함한다. 일부 실시양태에서, 본원에 제공된 임의의 융합 단백질 (예를 들어, 아데노신 염기 편집제)과 복합체화된 gRNA는 HBG1 또는 HBG2에 대해 위치 -198에서 T를 표적화하도록 설계되어, T에서 C로의 돌연변이를 유도한다. 예시적인 HBG1 및 HBG2 프로모터 서열은 각각 서열식별번호: 344 및 345로서 제공된다. 예시적인 HBG1 및 HBG2 프로모터 영역은 예시적인 것이고 제한적인 것으로 의도되지 않음이 인지되어야 한다.
일부 실시양태에서, HBG1 또는 HBG2 프로모터는 하기 서열, 예컨대 핵산의 5' 말단에 CCT를 갖는 서열식별번호: 838-846, 297-323 및 서열식별번호: 838-846 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다.
Figure pct00107
일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 5' 말단에 CCT를 추가로 포함하는 서열식별번호: 838-845, 297-323 및 서열식별번호: 838-845) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. 프로모터 서열은 개체의 게놈 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간 게놈 내의 HBG1 또는 HBG2 프로모터 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.
일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 846-853 및 254-280 중 어느 하나를 포함하는 가이드 서열을 포함한다.
Figure pct00108
개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 846-853 및 254-280에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 846-853 및 254-280 중 어느 하나에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 846-853 및 254-280을 제공한다.
일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 혈색소증 (HFE) 유전자 내의 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 인간 HFE 유전자 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, HFE 유전자는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 HFE 유전자이다. 일부 실시양태에서, HFE 유전자는 인간 HFE 유전자이다. 일부 실시양태에서, HFE 유전자는 유전자 ID: 3077의 HFE 유전자이며, 이는 또한 HH, HFE1, HLA-H, MVCD7 및 TFQTL2로 지칭된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 이러한 유전자에 의해 코딩되는 HFE 단백질은 MHC 부류 I-유형 단백질과 유사하고 베타2-마이크로글로불린 (베타2M)과 회합하는 막 단백질이다. 이러한 단백질은 트랜스페린과 트랜스페린 수용체의 상호작용을 조절함으로써 철 흡수를 조절하는 기능을 하는 것으로 생각된다. 철 축적 장애인 유전성 혈색소증은 이러한 유전자 내의 결함으로부터 유발되는 열성 유전 장애이다. 적어도 9종의 대안적으로 스플라이싱된 변이체가 상기 유전자에 대해 기재되었다. 추가의 변이체가 또한 발견되었다.
HFE 유전자의 예시적인 코딩 서열이 하기에 제시되며, 여기서 아미노산 잔기 282의 Cys (C)에서 Tyr (Y)로의 돌연변이 (C282Y)를 야기하는, A로 돌연변이되는 야생형 G가 볼드체 및 밑줄로 제시된다. 일부 실시양태에서, 이러한 돌연변이는 혈색소증 (예를 들어, 유전성 혈색소증)을 유발한다:
Figure pct00109
상기 HFE 핵산 코딩 서열로부터 코딩되는 예시적인 HFE 아미노산 서열은 하기 (서열식별번호: 750)에 제시되며, 여기서 혈색소증에서 Y로 돌연변이되는 위치 282에서의 C가 볼드체 및 밑줄로 표시된다:
Figure pct00110
일부 실시양태에서, HFE 유전자는 HFE 유전자의 코딩 서열 내에 G에서 A로의 돌연변이를 포함하며, 이는 HFE 단백질에서 C에서 Y로의 돌연변이, 예를 들어 서열식별번호: 750에서의 C282Y 돌연변이를 야기한다. 일부 실시양태에서, HFE 유전자는 서열식별번호: 871의 핵산 잔기 845에 G에서 A로의 돌연변이를 포함하며, 이는 코딩된 HFE 단백질에서 C에서 Y로의 돌연변이를 야기한다. 일부 실시양태에서, 본원에 제공된 복합체는 혈색소증을 유발하는 HFE에서의 C에서 Y로의 돌연변이 (예를 들어, 서열식별번호: 750의 C282Y 돌연변이)를 교정하도록 설계된다. HFE의 코딩 서열은 개체들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본원에 제공된 임의의 gRNA의 가이드 서열은 혈색소증을 유발하는 HFE에서의 C에서 Y로의 돌연변이를 교정하기 위해 이러한 차이를 설명하도록 조작될 수 있다.
일부 실시양태에서, HFE 유전자는 하기 서열, 예컨대 핵산의 5' 말단에 CCT를 갖는 서열식별번호 854-861 및 서열식별번호: 854-861 중 어느 하나의 핵산 서열을 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다. 표적화된 T에 대향하는 A는 본원에 제공된 임의의 복합체를 사용하여 탈아미노화될 수 있다. 하기 제공된 서열은 HFE 유전자의 코딩 서열의 부분의 역 상보체이다.
Figure pct00111
일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 서열식별번호: 854-861 및 5' 말단에 CCT를 갖는 서열식별번호: 854-861) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. HFE 유전자 서열은 개체의 게놈들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간의 게놈 내의 HFE 유전자 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.
일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 862-869 중 어느 하나를 포함하는 가이드 서열을 포함한다.
Figure pct00112
개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 862-869에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 862-869 중 임의의 것에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 862-869를 제공한다.
일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 베타 글로빈 (HBB) 유전자 내의 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 인간 HBB 유전자 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, HBB 유전자는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 HBB 유전자이다. 일부 실시양태에서, HBB 유전자는 인간 HBB 유전자이다. 일부 실시양태에서, HBB 유전자는 유전자 ID: 3043의 HBB 유전자이며, 이는 또한 ECYT6, CD113t-C 및 베타-글로빈으로 지칭된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 헤모글로빈 서브유닛 베타는 글로빈 단백질이고, 이는 알파 글로빈 (HBA)과 함께, 성인 인간에서 헤모글로빈의 가장 흔한 형태를 구성한다. 유전자 내의 돌연변이는 유전 장애, 예컨대 겸상 적혈구 질환 및 베타 지중해빈혈, 예컨대 헤모글로빈 C 질환 (Hb C) 및 헤모글로빈 E 질환 (Hb E)과 연관된 단백질의 여러 변이체를 생산한다.
HBB 유전자의 예시적인 코딩 서열이 하기에 제시된다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, A에서 T로의 돌연변이) 겸상 적혈구 질환 (단백질 내의 E6V 돌연변이)을 유발한다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, G에서 A로의 돌연변이) Hb C (단백질 내의 E6K 돌연변이)를 유발한다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, G에서 A로의 돌연변이) HbE (단백질 내의 E26K 돌연변이)를 유발한다.
예시적인 HBB 유전자:
Figure pct00113
예시적인 HBB 아미노산 서열은 하기 (서열식별번호: 340)에 제시되며, 여기서 겸상 적혈구 질환에서 V로 돌연변이되거나 또는 Hb C에서 K로 돌연변이되는 위치 6에서의 E가 볼드체 및 밑줄로 표시된다. Hb E에서 K로 돌연변이되는 위치 26에서의 E가 또한 볼드체 및 밑줄로 표시된다.
Figure pct00114
일부 실시양태에서, HBB 유전자는 HBB 유전자의 코딩 서열 내에 G에서 A로 또는 A에서 T로의 돌연변이를 포함하고, 이는 HBB에서 E6V, E6K 또는 E26K 돌연변이, 예를 들어 서열식별번호: 340에서의 E6V, E6K 또는 E26K 돌연변이를 야기한다. 일부 실시양태에서, 본원에 제공된 복합체는 각각 겸상 적혈구 질환, Hb C 및 Hb E를 유발하는 HBB에서의 E6V 돌연변이를 교정하거나 (예를 들어, 병원성 V 돌연변이에서 비-병원성 A 돌연변이로 변화시킴), E6K 또는 E26K 돌연변이를 교정하도록 설계된다. HBB의 코딩 서열은 개체들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본원에 제공된 임의의 gRNA의 가이드 서열은 본원에 제공된 돌연변이를 교정하기 위해 이러한 차이를 설명하도록 조작될 수 있다.
일부 실시양태에서, HBB 유전자는 하기 서열, 예컨대 서열식별번호: 324-337 중 어느 하나의 핵산 서열 또는 그의 역 상보체를 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다. 표적화된 T에 대향하는 A는 본원에 제공된 임의의 복합체를 사용하여 탈아미노화될 수 있다.
Figure pct00115
일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 서열식별번호: 324-337) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함하는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. BB 유전자 서열은 개체의 게놈들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간의 게놈 내의 HBB 유전자 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.
일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 281-294 중 어느 하나를 포함하는 가이드 서열을 포함한다. 서열식별번호: 281-290은 겸상 적혈구 질환을 치료하도록 설계된다 (예를 들어, E6V 돌연변이를 비-병원성인 위치 6에서의 A를 갖도록 변화시킴). 서열식별번호: 291은 Hb C를 치료하도록 설계된다 (예를 들어, E6K 돌연변이). 서열식별번호: 292-294는 Hb E를 치료하도록 설계된다 (예를 들어, E26K 돌연변이).
Figure pct00116
개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 281-294에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 281-294 중 임의의 것에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 281-294를 제공한다.
일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 응고 인자 VIII (F8) 유전자 내의 표적 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 인간 F8 유전자 내의 DNA 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 포함한다. 일부 실시양태에서, F8 유전자는 인간, 침팬지, 유인원, 원숭이, 개, 마우스 또는 래트 F8 유전자이다. 일부 실시양태에서, F8 유전자는 인간 F8 유전자이다. 일부 실시양태에서, F8 유전자는 유전자 ID: 2157의 F8 유전자이며, 이는 또한 AHF, F8B, F8C, HEMA, FVIII 및 DXS1253E로 지칭된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, F8은 혈액 응고의 고유 경로에 참여하는 응고 인자 VIII을 코딩하고; 인자 VIII은 Ca+2 및 인지질의 존재 하에 인자 X를 활성화된 형태 Xa로 전환시키는 인자 IXa에 대한 보조인자이다. 이 유전자 내의 결함은 통상의 열성 X-연관 응고 장애인 A형 혈우병을 유발한다.
F8 유전자의 예시적인 코딩 서열은 서열식별번호: 347로 제공된다. 일부 실시양태에서, 이러한 서열은 돌연변이되어 (예를 들어, C에서 T로의 돌연변이) A형 혈우병 (단백질 내의 R612C 돌연변이)을 유발한다.
예시적인 응고 인자 VIII 아미노산 서열은 하기 (서열식별번호: 341)에 제시되며, 여기서 A형 혈우병에서 C로 돌연변이되는 위치 612에서의 R이 볼드체 및 밑줄로 표시된다.
Figure pct00117
Figure pct00118
일부 실시양태에서, F8 유전자는 F8 유전자의 코딩 서열 내에 C에서 T로의 돌연변이를 포함하고, 이는 응고 인자 VIII에서 R에서 C로의 돌연변이, 예를 들어 서열식별번호: 341에서의 R612C 돌연변이를 야기한다. 일부 실시양태에서, 본원에 제공된 복합체는 A형 혈우병을 유발하는 F8에서의 R에서 C로의 (예를 들어, R612C) 돌연변이를 교정하도록 설계된다. F8의 코딩 서열은 개체들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본원에 제공된 임의의 gRNA의 가이드 서열은 본원에 제공된 돌연변이를 교정하기 위해 이러한 차이를 설명하도록 조작될 수 있다.
일부 실시양태에서, F8 유전자는 하기 서열, 예컨대 서열식별번호: 338-339 중 어느 하나의 핵산 서열 또는 그의 역 상보체를 포함한다. 일부 실시양태에서, C로의 돌연변이를 위해 표적화되는 T는 하기 서열에서 볼드체로 표시된다. 표적화된 T에 대향하는 A는 본원에 제공된 임의의 복합체를 사용하여 탈아미노화될 수 있다.
Figure pct00119
일부 실시양태에서, 본원에 제공된 임의의 복합체는 상기 제공된 핵산 서열 (예를 들어, 서열식별번호: 338-339) 중 어느 하나에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 포함한다. gRNA의 가이드 서열은 표적 서열에 상보적이지 않은 1개 이상의 뉴클레오티드를 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 존재한다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 일부 실시양태에서, gRNA의 5' 말단에서의 G는 표적 서열과 상보적이지 않다. 일부 실시양태에서, gRNA의 가이드 서열은 표적 서열 (예를 들어, 본원에 제공된 임의의 표적 서열)에 상보적이지 않은 1, 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드를 포함한다. F8 유전자 서열은 개체의 게놈들 사이에서 달라질 수 있는 것으로 인지되어야 한다. 따라서, 본 개시내용은 인간의 게놈 내의 F8 유전자 표적 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 인접 핵산을 포함하는 가이드 서열을 갖는 gRNA를 제공한다.
일부 실시양태에서, gRNA는 하기 제공된 서열식별번호: 295-296 중 어느 하나를 포함하는 가이드 서열을 포함하며, 이는 A형 혈우병을 치료하도록 설계된다 (예를 들어 서열식별번호: 341의, 예를 들어 R612C 돌연변이).
Figure pct00120
개체의 게놈 내의 표적 서열이 달라질 수 있다는 것을 고려하여, 서열식별번호: 295-296에 제공된 RNA 서열은 1개 이상의 핵염기에 의해 달라질 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, 본원에 제공된 임의의 가이드 RNA 서열의 가이드 서열은 서열식별번호: 295-295 중 임의의 것에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵염기 변화를 포함할 수 있다. 일부 실시양태에서, gRNA의 가이드 서열은 gRNA의 5' 말단에 G를 추가로 포함한다. 따라서, 본 출원은 5' 말단에 G를 추가로 포함하는 서열식별번호: 295-296을 제공한다.
일부 실시양태에서, 가이드 핵산 (예를 들어, 가이드 RNA)은 15-150개 뉴클레오티드의 길이이고, 표적 서열에 상보적인 적어도 10개의 인접 뉴클레오티드의 가이드 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 또는 150개 뉴클레오티드의 길이이다. 일부 실시양태에서, 가이드 RNA는 표적 서열, 예를 들어 본원에 제공된 임의의 HBG1 또는 HBG2 프로모터 서열 또는 본원에 제공된 임의의 HFE, HBB 또는 F8 표적 서열에 상보적인 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 인접 뉴클레오티드의 가이드 서열을 포함한다. 일부 실시양태에서, 표적 서열은 DNA 서열이다. 일부 실시양태에서, 표적 서열은 포유동물 게놈 내의 서열이다. 일부 실시양태에서, 표적 서열은 인간 게놈 내의 서열이다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접한다. 일부 실시양태에서, 가이드 핵산 (예를 들어, 가이드 RNA)은 질환 또는 장애, 예를 들어 태아성 헤모글로빈의 유전성 지속 (HPFH), 베타-지중해빈혈, 유전성 혈색소증 (HHC), 겸상 적혈구 질환, Hb C, Hb E 또는 혈우병 (예를 들어, A형 혈우병)과 연관된 서열에 상보적이다.
아데노신 데아미나제 및 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 도메인을 포함하는 융합 단백질을 사용하는 방법
본 개시내용의 일부 측면은 본원에 제공된 융합 단백질 또는 가이드 핵산 (예를 들어, gRNA) 및 핵염기 편집제를 포함하는 복합체를 사용하는 방법을 제공한다. 예를 들어, 본 개시내용의 일부 측면은 DNA 또는 RNA 분자를 본원에 제공된 임의의 융합 단백질 및 적어도 1종의 가이드 핵산 (예를 들어, 가이드 RNA)과 접촉시키는 것을 포함하며, 여기서 가이드 핵산 (예를 들어, 가이드 RNA)은 표적 서열에 100% 상보적인 적어도 10개 (예를 들어, 적어도 10, 15, 20, 25 또는 30개)의 인접 뉴클레오티드의 서열 (예를 들어, DNA 표적 서열에 결합하는 가이드 서열)을 포함하는 것인 방법을 제공한다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접한다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접하지 않는다. 일부 실시양태에서, 표적 서열의 3' 말단은 AGC, GAG, TTT, GTG 또는 CAA 서열에 바로 인접한다.
헤모글로빈 발현
본 개시내용의 일부 측면은 세포 (예를 들어, 포유동물 세포)에 질환-억제 돌연변이를 도입하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 헤모글로빈 유전자 (예를 들어, HBG1 및/또는 HBG2)의 발현을 조정하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HBG1 및/또는 HBG2의 프로모터 영역에 A에서 T로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다.
희귀 양성 상태인 태아성 헤모글로빈의 유전성 지속 (HPFH)을 갖는 인간은 겸상 적혈구성 빈혈을 포함한 일부 β-글로빈 질환에 내성이 있다. 특정 환자에서, 이러한 표현형은 출생 즈음 인간에서는 통상 침묵되는 태아성 헤모글로빈의 지속 발현을 가능하게 하는 γ-글로빈 유전자 HBG1 및 HBG2의 프로모터 내의 돌연변이에 의해 매개된다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, HBG1 또는 HBG2의 프로모터 영역 내의 1개 이상의 돌연변이를 생성하는 것은 HBG1 및/또는 HBG2의 발현을 증가시켜 β-글로빈 질환을 치료할 수 있다.
일부 실시양태에서, 방법은 HBG1 또는 HBG2 유전자의 프로모터를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시킴으로써 상기 프로모터 내의 아데노신 핵염기 (A)를 탈아미노화시키는 것을 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함한다. HBG1 및 HBG2 유전자의 프로모터는 본원에 기재된 HBG1 및 HBG2 프로모터의 임의의 서열을 포함할 수 있는 것으로 인지되어야 한다. 일부 실시양태에서, gRNA의 가이드 서열은 HBG1 또는 HBG2의 프로모터 서열 내의 표적 핵산 서열에 100% 상보적인 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40개 또는 그 초과의 인접 핵산을 포함한다.
일부 실시양태에서, 방법은 표적 서열을 니킹하는 것을 추가로 포함하며, 이는 핵산 프로그램가능한 결합 단백질 (napDNAbp), 예컨대 gRNA의 가이드 서열에 상보적인 표적 서열을 니킹하는 Cas9 니카제 (nCas9)를 사용함으로써 달성될 수 있다. 일부 실시양태에서, 프로모터 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:
Figure pct00121
서열식별번호: 297-323 중 어느 하나.
서열식별번호: 838-845의 핵산 중 임의의 것은 그의 5' 말단에 5'-CCT-3'를 추가로 포함할 수 있는 것으로 인지되어야 한다.
일부 실시양태에서, gRNA의 가이드 서열은 하기 핵산 서열을 포함한다:
Figure pct00122
서열식별번호: 254-280 중 어느 하나.
서열식별번호: 846-853 또는 254-280의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.
일부 실시양태에서, HBG1 또는 HBG2의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 프로모터 내의 T-A 염기 쌍이 프로모터 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 태아성 헤모글로빈의 유전성 지속 (HPFH)과 연관된 서열을 생성한다. 태아성 헤모글로빈의 유전성 지속은, 일부 실시양태에서, 태아성 헤모글로빈 (예를 들어, 헤모글로빈 F)이 성인에서 발현되는 양성 상태를 특징으로 한다. 일부 실시양태에서, HPFH는 2세 이상, 5세 이상, 10세 이상, 15세 이상, 20세 이상, 25세 이상 또는 30세 이상의 대상체에서의 태아성 헤모글로빈의 발현을 특징으로 한다. 일부 실시양태에서, HPFH는 2세 이상, 5세 이상, 10세 이상, 15세 이상, 20세 이상, 25세 이상 또는 30세 이상의 정상 대상체에서 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80% 또는 그 초과 더 큰 수준으로 발현되는 경우에 성인에서 발현되는 것으로 간주된다.
일부 실시양태에서, HBG1 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG1을 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG1 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, HBG2 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG1을 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG2 유전자의 전사의 증가를 일으킨다. 일부 실시양태에서, HBG1 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG1을 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG1 단백질 수준의 증가를 일으킨다. 일부 실시양태에서, HBG2 유전자의 프로모터에서 아데노신 핵염기를 탈아미노화시키는 것은 건강한 성인 또는 HBG2를 발현하는 태아에 비해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, 1000% 또는 그 초과 HBG2 단백질 수준의 증가를 일으킨다.
일부 실시양태에서, 방법은 시험관내, 예를 들어 배양된 세포에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 혈액 질환 또는 장애를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 질환 또는 장애는 빈혈이다. 일부 실시양태에서, 빈혈은 철 결핍성 빈혈, 재생불량성 빈혈, 용혈성 빈혈, 지중해빈혈, 겸상 적혈구성 빈혈, 악성 빈혈, 또는 판코니 빈혈이다. 일부 실시양태에서, 질환 또는 장애는 글로빈 단백질을 코딩하는 유전자, 예를 들어 CYGB, HBA1, HBA2, HBB, HBD, HBE1, HBG1, HBG2, HBM, HBQ1, HBZ 또는 MB, 또는 이러한 유전자의 프로모터 내의 돌연변이에 의해 유발된다.
HFE 유전자 내의 돌연변이의 교정
본 개시내용의 일부 측면은 HFE 유전자 내의 점 돌연변이를 교정하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HFE 유전자에 A에서 G로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HFE 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HFE 유전자 내의 아데노신 핵염기 (A)를 탈아미노화시키는 방법을 제공한다. 일부 실시양태에서, HFE 유전자는 C에서 T로 또는 G에서 A로의 돌연변이를 포함한다. 일부 실시양태에서, HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 HFE 유전자에 의해 코딩되는 HFE 단백질의 기능을 손상시킨다. 일부 실시양태에서, HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 HFE 유전자에 의해 코딩되는 HFE 단백질의 기능을 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 손상시킨다. 일부 실시양태에서, HFE 단백질의 기능은 철 흡수이다.
일부 실시양태에서, T에 상보적인 아데노신 (A) 핵염기를 탈아미노화시키는 것은 HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이를 교정한다. 일부 실시양태에서, HFE 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 HFE 유전자에 의해 코딩되는 HFE 단백질 내의 Cys (C)에서 Tyr (Y)로의 돌연변이를 일으킨다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 HFE 단백질 내의 Cys에서 Tyr로의 돌연변이를 교정한다.
일부 실시양태에서, gRNA의 가이드 서열은 HFE 유전자의 표적 핵산 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 인접 핵산을 포함한다. 일부 실시양태에서, 염기 편집제는 가이드 서열에 상보적인 표적 서열을 니킹한다. 일부 실시양태에서, HFE 유전자 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:
Figure pct00123
서열식별번호: 854-861의 핵산 중 임의의 것은 그의 5' 말단에 5'-CCT-3'를 추가로 포함할 수 있는 것으로 인지되어야 한다.
일부 실시양태에서, gRNA의 가이드 서열은 하기 핵산 서열을 포함한다:
Figure pct00124
서열식별번호: 862-869의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.
일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자 내의 T-A 염기 쌍이 HFE 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 유전성 혈색소증 (HHC)과 연관된 서열을 교정하도록 한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 야생형 HFE 단백질 기능과 비교하여 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 적어도 100% HFE 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈색소증의 1종 이상의 증상의 감소를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 철 흡수 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 정상 철 흡수 수준, 예를 들어 혈색소증을 갖지 않는 대상체에서의 철 흡수 수준의 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99%로 철 흡수 기능의 증가를 가져온다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 유전자로부터 전사된 HFE 단백질의 기능의 증가를 일으킨다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HFE 안정성 또는 반감기의 증가, 예를 들어 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 증가를 일으킨다.
일부 실시양태에서, HFE 유전자는 세포, 예컨대 배양물 내의 세포 (예를 들어, 불멸화 림프모구성 세포 (LCL)) 또는 대상체 내의 세포에 존재한다. 일부 실시양태에서, HFE 유전자는 Cys에서 Tyr로의 돌연변이를 포함하는 HFE 단백질을 코딩한다. 일부 실시양태에서, HFE 단백질은 서열식별번호: 750의 아미노산 서열의 잔기 282에서의 Cys에서 Tyr로의 돌연변이 (C282Y)를 포함하며, 여기서 위치 282에서의 Cys는 볼드체로 제시된다:
Figure pct00125
일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 철 축적 장애를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 혈색소증을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 유전성 혈색소증 (HHC)을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 HFE 유전자 내의 돌연변이를 가지며, 여기서 A로 돌연변이되는 야생형 G (예를 들어, 서열식별번호: 871에서의 G845A 돌연변이)가, 예를 들어 서열식별번호: 750의 아미노산 잔기 282에서의 Cys (C)에서 Tyr (Y)로의 돌연변이 (C282Y)를 야기한다. 일부 실시양태에서, 이러한 돌연변이는 혈색소증 (예를 들어, 유전성 혈색소증)을 유발한다. 일부 실시양태에서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 대상체에서 철 축적 장애의 1종 이상의 증상을 호전시킨다.
HBB 유전자 내의 돌연변이의 교정/생성
본 개시내용의 일부 측면은 HBB 유전자 내의 점 돌연변이를 교정하거나 또는 비-병원성인 점 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HBB 유전자에 A에서 G로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 HBB 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HBB 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HBB 유전자 내의 아데노신 핵염기 (A)를 탈아미노화시키는 방법을 제공한다. 일부 실시양태에서, HBB 유전자는 A에서 T로 또는 G에서 A로의 돌연변이를 포함한다. 일부 실시양태에서, HBB 유전자 내의 A에서 T로 또는 G에서 A로의 돌연변이는 HBB 유전자에 의해 코딩되는 베타 글로빈 단백질의 기능을 손상시킨다. 일부 실시양태에서, HBB 유전자 내의 A에서 T로 또는 G에서 A로의 돌연변이는 HBB 유전자에 의해 코딩되는 HBB 단백질의 기능을 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 손상시킨다. 일부 실시양태에서, HBB 단백질의 기능은 산소 운반 능력이다. 일부 실시양태에서, A에서 T로의 돌연변이는 겸상 적혈구 질환을 유발하고, T:A 염기 쌍을 C:G 염기 쌍으로 변화시키는 것은 헤모글로빈의 중합 능력을, 예를 들어 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 감소시키는 비-병원성 점 돌연변이를 생성한다.
일부 실시양태에서, T에 상보적인 아데노신 (A) 핵염기를 탈아미노화시키는 것은 HBB 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이를 교정하거나 또는 비-병원성 돌연변이를 생성한다. 일부 실시양태에서, HBB 유전자 내의 A에서 T로 또는 G에서 A로의 돌연변이는 HBB 유전자에 의해 코딩되는 HBB 단백질 내의 E에서 V로의 돌연변이 또는 E에서 K로의 돌연변이를 일으킨다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 HBB 단백질 내의 E에서 K로의 돌연변이를 교정한다. 예를 들어, T에 상보적인 아데노신 핵염기의 탈아미노화시키는 것은, 예를 들어 서열식별번호: 340과 비교하여 HBB 내의 E6K (Hb C) 또는 E26K (Hb E) 돌연변이를 교정한다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 병원성 돌연변이를 비-병원성 돌연변이로 변화시킨다. 예를 들어, HBB 내의 E6V 돌연변이 (예를 들어, 서열식별번호: 340과 비교하여)는 위치 6에서의 A를 생성하도록 돌연변이되어 (예를 들어, V6A 돌연변이) 비-병원성 돌연변이를 생성할 수 있다.
일부 실시양태에서, gRNA의 가이드 서열은 HBB 유전자의 표적 핵산 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 인접 핵산을 포함한다. 일부 실시양태에서, 염기 편집제는 가이드 서열에 상보적인 표적 서열을 니킹한다. 일부 실시양태에서, HBB 유전자 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:
Figure pct00126
일부 실시양태에서, gRNA의 가이드 서열은 하기 핵산 서열을 포함한다:
Figure pct00127
서열식별번호: 281-294의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.
일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 유전자 내의 T-A 염기 쌍이 HBB 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 Hb C 또는 Hb E와 연관된 서열을 교정하도록 하거나; 또는 비-병원성 돌연변이를 생성하도록 한다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 야생형 HBB 단백질 기능과 비교하여 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 적어도 100% HBB 단백질 기능의 증가를 가져온다. 일부 실시양태에서, HBB 유전자의 아데노신 핵염기를 탈아미노화시키는 것은 겸상 적혈구 질환, Hb C 또는 Hb E의 1종 이상의 증상의 감소를 가져온다. 일부 실시양태에서, HBB 유전자의 아데노신 핵염기를 탈아미노화시키는 것은 산소 운반 기능의 증가 또는 베타 글로빈의 중합의 감소 또는 겸상 적혈구화의 감소를 가져온다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 정상 산소 운반 기능 수준, 예를 들어 겸상 적혈구, Hb C 및/또는 Hb E를 갖지 않는 대상체에서의 산소 운반 기능 (예를 들어, 산소 포화도) 수준의 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99%로 산소 운반 기능의 증가를 가져온다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 유전자로부터 전사된 HBB 단백질의 기능의 증가를 일으킨다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 HBB 안정성 또는 반감기의 증가, 예를 들어 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 증가를 일으킨다.
일부 실시양태에서, HBB 유전자는 세포, 예컨대 배양물 내의 세포 또는 대상체 내의 세포에 존재한다. 일부 실시양태에서, HBB 유전자는 E에서 V로 또는 E에서 K로의 돌연변이를 포함하는 HBB 단백질을 코딩한다. 일부 실시양태에서, HBB 단백질은 서열식별번호: 340의 아미노산 서열의 잔기 6에서의 E에서 V로의 돌연변이 (E6V)를 포함하며 (겸상 적혈구 질환), 여기서 위치 6에서의 E는 볼드체로 제시된다. 일부 실시양태에서, HBB 단백질은 서열식별번호: 340의 아미노산 서열의 잔기 6에서의 E에서 K로의 돌연변이 (E6K)를 포함하며 (Hb C), 여기서 위치 6에서의 E는 볼드체로 제시된다. 일부 실시양태에서, HBB 단백질은 서열식별번호: 340의 아미노산 서열의 잔기 6에서의 E에서 K로의 돌연변이 (E26K)를 포함하며 (Hb E), 여기서 위치 26에서의 E는 볼드체 및 밑줄로 제시된다.
Figure pct00128
일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 철 축적 장애를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 겸상 적혈구 질환 또는 베타-지중해빈혈을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 Hb C 또는 Hb E를 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 HBB 유전자 내의 돌연변이를 가지며, 여기서 야생형 A가 T로 돌연변이되거나 야생형 G가 A로 돌연변이된다. 일부 실시양태에서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 대상체에서 겸상 적혈구 질환, Hb C 또는 Hb E의 1종 이상의 증상을 호전시킨다.
F8 유전자 내의 돌연변이의 교정
본 개시내용의 일부 측면은 F8 유전자 내의 점 돌연변이를 교정하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 F 유전자에 A에서 G로 및/또는 T에서 C로의 돌연변이를 생성하기 위해 염기 편집제 (예를 들어, 본원에 제공된 임의의 융합 단백질) 및 gRNA를 사용하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 F8 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 F8 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, F8 유전자 내의 아데노신 핵염기 (A)를 탈아미노화시키는 방법을 제공한다. 일부 실시양태에서, F8 유전자는 C에서 T로 또는 G에서 A로의 돌연변이를 포함한다. 일부 실시양태에서, F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 F8 유전자에 의해 코딩되는 응고 인자 VIII 단백질의 기능을 손상시킨다. 일부 실시양태에서, F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 F8 유전자에 의해 코딩되는 응고 인자 VIII 단백질의 기능을 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 손상시킨다. 일부 실시양태에서, 응고 인자 VIII 단백질의 기능은 혈액 응고이다.
일부 실시양태에서, T에 상보적인 아데노신 (A) 핵염기를 탈아미노화시키는 것은 F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이를 교정한다. 일부 실시양태에서, F8 유전자 내의 C에서 T로 또는 G에서 A로의 돌연변이는 F8 유전자에 의해 코딩되는 인자 VIII 단백질 내의 R에서 C로의 돌연변이를 일으킨다. 일부 실시양태에서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것은 인자 VIII 단백질 내의 R에서 C로의 돌연변이를 교정한다.
일부 실시양태에서, gRNA의 가이드 서열은 F8 유전자의 표적 핵산 서열에 100% 상보적인 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 인접 핵산을 포함한다. 일부 실시양태에서, 염기 편집제는 가이드 서열에 상보적인 표적 서열을 니킹한다. 일부 실시양태에서, F8 유전자 내의 표적 핵산 서열은 하기 핵산 서열을 포함한다:
Figure pct00129
일부 실시양태에서, gRNA의 가이드 서열은 하기 핵산 서열을 포함한다:
Figure pct00130
서열식별번호: 295-296의 핵산 중 임의의 것은 그의 5' 말단에 G를 추가로 포함할 수 있는 것으로 인지되어야 한다.
일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 F8 유전자 내의 T-A 염기 쌍이 F8 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 한다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈우병 (예를 들어, A형 혈우병)과 연관된 서열을 교정하도록 한다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 인자 VIII 단백질 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 야생형 인자 VIII 단백질 기능과 비교하여 적어도 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 적어도 100%로 인자 VIII 단백질 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈우병의 1종 이상의 증상의 감소를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 혈액 응고 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 정상 혈액 응고 기능 수준, 예를 들어 혈우병을 갖지 않는 대상체에서의 혈액 응고 기능 수준의 적어도 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99%로 혈액 응고 기능의 증가를 가져온다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 F8 유전자로부터 전사된 인자 VIII 단백질의 기능의 증가를 일으킨다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 인자 VIII 안정성 또는 반감기의 증가, 예를 들어 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 적어도 99% 증가를 일으킨다.
일부 실시양태에서, F8 유전자는 세포, 예컨대 배양물 내의 세포 또는 대상체 내의 세포에 존재한다. 일부 실시양태에서, F8 유전자는 R에서 C로의 돌연변이를 포함하는 인자 VIII 단백질을 코딩한다. 일부 실시양태에서, 인자 VIII 단백질은 서열식별번호: 341의 아미노산 서열의 잔기 612에서의 R에서 C로의 돌연변이 (R612C)를 포함하며, 여기서 위치 612에서의 R은 볼드체로 제시된다:
Figure pct00131
Figure pct00132
일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체내에서 수행된다. 일부 실시양태에서, 방법은 생체외에서 수행된다. 일부 실시양태에서, 방법은 대상체의 세포에서 수행된다. 일부 실시양태에서, 대상체는 혈우병을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 A형 혈우병을 갖거나 갖는 것으로 의심된다. 일부 실시양태에서, 대상체는 F8 유전자 내의 돌연변이를 가지며, 여기서 A로 돌연변이되는 야생형 G는, 예를 들어 서열식별번호: 341의 아미노산 잔기 612에서의 R에서 C로의 돌연변이 (R612C)를 야기한다. 일부 실시양태에서, 이러한 돌연변이는 혈우병 (예를 들어, A형 혈우병)을 유발한다. 일부 실시양태에서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것은 대상체에서 혈우병의 1종 이상의 증상을 호전시킨다.
일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함한다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 점 돌연변이를 포함한다. 일부 실시양태에서, 융합 단백질 (예를 들어, 아데노신 데아미나제 및 Cas9 도메인을 포함함) 또는 복합체의 활성은 점 돌연변이의 교정을 유발한다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 G→A 또는 C→T 점 돌연변이를 포함하며, 여기서 돌연변이체 A 염기의 탈아미노화는 질환 또는 장애와 연관되지 않은 서열을 생성한다. 일부 실시양태에서, 표적 DNA 서열은 단백질을 코딩하고, 점 돌연변이는 코돈에 있으며, 야생형 코돈과 비교하여 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 유발한다. 일부 실시양태에서, 돌연변이체 A의 탈아미노화는 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 유발한다. 일부 실시양태에서, 돌연변이체 A의 탈아미노화는 야생형 아미노산을 코딩하는 코돈을 유발한다. 일부 실시양태에서, 접촉은 대상체의 생체내에서 이루어진다. 일부 실시양태에서, 대상체는 질환 또는 장애를 갖거나 갖는 것으로 진단되었다.
일부 실시양태는 본원에 제공된 DNA 편집 융합 단백질을 사용하는 방법을 제공한다. 일부 실시양태에서, 융합 단백질은 표적 핵염기, 예를 들어 A 잔기를 탈아미노화함으로써 점 돌연변이를 핵산 내로 도입하는데 사용된다. 일부 실시양태에서, 표적 핵염기의 탈아미노화는 유전적 결함의 교정, 예를 들어 유전자 산물에서의 기능 상실을 일으키는 점 돌연변이의 교정을 유발한다. 일부 실시양태에서, 유전적 결함은 질환 또는 장애, 예를 들어 유전성 혈색소증과 연관된다. 일부 실시양태에서, 본원에 제공된 방법은 유전자 (예를 들어, HBG1 또는 HBG2)의 발현을 조정하는 (예를 들어, 증가 또는 감소시키는) 점 돌연변이를 상기 유전자의 프로모터 내로 도입하기 위해 사용된다. 예를 들어, 일부 실시양태에서, DNA 편집 융합 단백질을 사용하여 점 돌연변이를 HBG1 또는 HBG2의 프로모터 영역 내로 도입함으로써 HBG1 또는 HBG2의 발현을 증가시키는 방법이 본원에 제공된다. 이러한 점 돌연변이는, 일부 실시양태에서, 대상체에서 HBG1 또는 HBG2의 발현을 증가시킬 수 있으며, 이는 겸상 적혈구성 빈혈을 포함한 β-글로빈 질환을 치료하는데 유용할 수 있다.
일부 실시양태에서, 본원에 제공된 방법의 목적은 게놈 편집을 통해 기능이상 유전자의 기능을 회복시키는 것이다. 본원에 제공된 핵염기 편집 단백질은, 예를 들어 인간 세포 배양물에서 질환-연관 돌연변이를 교정함으로써, 시험관내에서 유전자 편집-기반 인간 치료제에 대해 검증될 수 있다. 본원에 제공된 핵염기 편집 단백질, 예를 들어 핵산 프로그램가능한 DNA 결합 단백질 (예를 들어, Cas9) 및 아데노신 데아미나제 도메인을 포함하는 융합 단백질은 임의의 단일 점 G에서 A로 또는 C에서 T로의 돌연변이를 교정하는데 사용될 수 있다는 것이 통상의 기술자에 의해 이해될 것이다. 전자의 경우에, 돌연변이체 A에서 I로의 탈아미노화는 돌연변이를 교정하고, 후자의 경우에, 돌연변이체 T와 염기-쌍형성된 A의 탈아미노화, 이어서 복제 라운드 또는 이어서 염기 편집 복구 활성은 돌연변이를 교정한다.
본 개시내용은 본원에 제공된 DNA 편집 융합 단백질에 의해 교정될 수 있는 점 돌연변이와 연관되거나 그에 의해 유발되는 질환을 갖는 것으로 진단된 대상체의 치료 방법을 제공한다. 예를 들어, 일부 실시양태에서, 이러한 질환, 예를 들어 빈혈 또는 혈색소증을 갖는 대상체에게, 유전자 (예를 들어, HFE) 내의 점 돌연변이를 교정하거나 또는 유전자의 프로모터 영역 (예를 들어, HBG1 또는 HBG2의 프로모터 영역) 내로 돌연변이를 도입하는 아데노신 데아미나제 융합 단백질의 유효량을 투여하는 것을 포함하는 방법이 제공된다. 일부 실시양태에서, 질환은 유전 질환이다. 일부 실시양태에서, 질환은 빈혈과 연관된 질환이다. 일부 실시양태에서, 질환은 철 축적 질환 (예를 들어, 유전성 혈색소증)이다. 일부 실시양태에서, 질환은 리소솜 축적 질환이다. 점 돌연변이를 교정하거나 탈활성화 돌연변이를 질환-연관 유전자 내로 도입함으로써 치료될 수 있는 다른 질환은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이며, 본 개시내용은 이에 관하여 제한되지 않는다.
일부 실시양태에서, 융합 단백질은 정규 PAM을 인식하고 따라서 플랭킹 서열에서 각각 정규 PAM, 예를 들어 NGG에 의해 병원성 G에서 A로 또는 C에서 T로의 돌연변이를 교정할 수 있다. 예를 들어, 정규 PAM을 인식하는 Cas9 단백질은 서열식별번호: 52에 의해 제공된 바와 같은 스트렙토코쿠스 피오게네스 Cas9의 아미노산 서열에 대해, 또는 서열식별번호: 52의 RuvC 및 HNH 도메인을 포함하는 그의 단편에 대해 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함한다.
본원에 개시된 바와 같은 Cas9 도메인 및 아데노신 데아미나제를 포함하는 융합 단백질 중 임의의 것을 표적 부위, 예를 들어 편집될 점 돌연변이를 포함하는 부위에 표적화하기 위해, 전형적으로 융합 단백질을 가이드 RNA, 예를 들어 sgRNA와 함께 공-발현시킬 필요가 있다는 것은 관련 기술분야의 통상의 기술자에게 분명할 것이다. 본원의 다른 곳에서 보다 상세히 설명된 바와 같이, 가이드 RNA는 전형적으로 Cas9 결합을 허용하는 tracrRNA 프레임워크, 및 가이드 서열을 포함하며, 이는 Cas9:핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여한다. 일부 실시양태에서, 가이드 RNA는 구조 5'-[가이드 서열]-guuuuagagcuagaaauagcaaguuaaaauaaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuuu-3' (서열식별번호: 389)를 포함하며, 여기서 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 일부 실시양태에서, 가이드 서열은 표 2에 제공된 뉴클레오티드 서열 중 임의의 것을 포함한다. 가이드 서열은 전형적으로 20개 뉴클레오티드의 길이이다. Cas9:핵산 편집 효소/도메인 융합 단백질을 특이적 게놈 표적 부위에 표적화하는데 적합한 가이드 RNA의 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 분명할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집될 표적 뉴클레오티드의 50개 뉴클레오티드 상류 또는 하류 내의 핵 서열에 상보적인 가이드 서열을 포함한다. 제공된 융합 단백질 중 임의의 것을 특이적 표적 서열에 표적화하는데 적합한 일부 예시적인 가이드 RNA 서열이 본원에 제공된다. 추가의 가이드 서열은 그의 유전자좌를 포함하여, 하기 표 3에 제시된다.
염기 편집제 효율
본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 비율의 삽입결실을 생성하지 않으면서 특이적 뉴클레오티드 염기를 변형시킬 수 있다는 인식에 기초한다. 본원에 사용된 "삽입결실"은 핵산 내의 뉴클레오티드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내의 프레임 시프트 돌연변이를 일으킬 수 있다. 일부 실시양태에서, 핵산에서 다수의 삽입 또는 결실 (즉, 삽입결실)을 생성하지 않으면서, 핵산 내의 특이적 뉴클레오티드를 효율적으로 변형시키는 (예를 들어 돌연변이시키거나 탈아미노화시키는) 염기 편집제를 생성하는 것이 바람직하다. 특정 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 보다 큰 비율의 의도된 변형 (예를 들어, 점 돌연변이 또는 탈아미노화) 대 삽입결실을 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제는 1:1 초과인 의도된 점 돌연변이 대 삽입결실의 비를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1 또는 적어도 1000:1 또는 그 초과의 의도된 점 돌연변이 대 삽입결실의 비를 생성할 수 있다. 의도된 돌연변이 및 삽입결실의 수는 임의의 적합한 방법, 예를 들어 하기 실시예에 사용된 방법을 사용하여 결정될 수 있다. 일부 실시양태에서, 삽입결실 빈도를 계산하기 위해, 서열분석 판독물을 삽입결실이 발생할 수 있는 윈도우의 양쪽 측면에 플랭킹되어 있는 2개의 10-bp 서열에 대한 정확한 매치에 대해 스캐닝한다. 정확한 매치가 위치하지 않는 경우에, 판독물을 분석으로부터 제외한다. 이 삽입결실 윈도우의 길이가 참조 서열에 정확하게 매치되는 경우에, 판독물을 삽입결실을 함유하지 않는 것으로서 분류한다. 삽입결실 윈도우가 참조 서열보다 2개 이상의 염기 더 길거나 더 짧은 경우에, 서열분석 판독물을 각각 삽입 또는 결실로서 분류한다.
일부 실시양태에서, 본원에 제공된 염기 편집제는 핵산의 영역에서의 삽입결실의 형성을 제한할 수 있다. 일부 실시양태에서, 영역은 염기 편집제에 의해 표적화되는 뉴클레오티드, 또는 염기 편집제에 의해 표적화되는 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오티드 내의 영역에 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 핵산의 영역에서의 삽입결실의 형성을 1% 미만, 1.5% 미만, 2% 미만, 2.5% 미만, 3% 미만, 3.5% 미만, 4% 미만, 4.5% 미만, 5% 미만, 6% 미만, 7% 미만, 8% 미만, 9% 미만, 10% 미만, 12% 미만, 15% 미만 또는 20% 미만으로 제한할 수 있다. 핵산 영역에서 형성된 삽입결실의 수는 핵산 (예를 들어, 세포의 게놈 내의 핵산)이 염기 편집제에 노출되는 시간의 양에 의존할 수 있다. 일부 실시양태에서, 삽입결실의 수 또는 비율은 염기 편집제에 핵산 (예를 들어, 세포의 게놈 내의 핵산)을 노출시킨지 적어도 1시간, 적어도 2시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 7일, 적어도 10일 또는 적어도 14일 후에 결정된다.
본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 수의 비의도된 돌연변이, 예컨대 비의도된 점 돌연변이를 생성하지 않으면서 핵산 (예를 들어 대상체의 게놈 내의 핵산)에서 의도된 돌연변이, 예컨대 점 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초한다. 일부 실시양태에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된 gRNA에 결합된 특이적 염기 편집제에 의해 생성된 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 아데닌 (A)에서 구아닌 (G)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 티민 (T)에서 시토신 (C)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 코딩 영역 내의 아데닌 (A)에서 구아닌 (G)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 코딩 영역 내의 티민 (T)에서 시토신 (C)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 정지 코돈, 예를 들어 유전자의 코딩 영역 내의 조기 정지 코돈을 생성하는 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 정지 코돈을 제거하는 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 스플라이싱을 변경시키는 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 조절 서열 (예를 들어, 유전자 프로모터 또는 유전자 리프레서)을 변경시키는 돌연변이이다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 1:1 초과인 의도된 돌연변이 대 비의도된 돌연변이 (예를 들어, 의도된 점 돌연변이:비의도된 점 돌연변이)의 비를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 150:1, 적어도 200:1, 적어도 250:1, 적어도 500:1 또는 적어도 1000:1 또는 그 초과인 의도된 돌연변이 대 비의도된 돌연변이 (예를 들어, 의도된 점 돌연변이:비의도된 점 돌연변이)의 비를 생성할 수 있다. 본원에서 "염기 편집제 효율" 섹션에 기재된 염기 편집제의 특징은 본원에 제공된 융합 단백질 또는 융합 단백질을 사용하는 방법 중 임의의 것에 적용될 수 있다는 것이 인지되어야 한다.
핵산을 편집하는 방법
본 개시내용의 일부 측면은 핵산을 편집하는 방법을 제공한다. 일부 실시양태에서, 방법은 핵산의 핵염기 (예를 들어, 이중-가닥 DNA 서열의 염기 쌍)를 편집하는 방법이다. 일부 실시양태에서, 방법은 하기 단계를 포함한다: a) 핵산의 표적 영역 (예를 들어, 이중-가닥 DNA 서열)을 염기 편집제 (예를 들어, 아데노신 데아미나제 도메인에 융합된 Cas9 도메인) 및 가이드 핵산 (예를 들어, gRNA)을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적화된 핵염기 쌍을 포함하는 것인 단계, b) 상기 표적 영역의 가닥 분리를 유도하는 단계, c) 표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계, 및 d) 상기 표적 영역의 1개 이하의 가닥을 절단하는 단계이며, 여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되는 것인 단계. 일부 실시양태에서, 방법은 핵산에서 20% 미만의 삽입결실 형성을 유발한다. 일부 실시양태에서, 단계 b는 생략된다는 것이 인지되어야 한다. 일부 실시양태에서, 제1 핵염기는 아데닌이다. 일부 실시양태에서, 제2 핵염기는 탈아미노화된 아데닌 또는 이노신이다. 일부 실시양태에서, 제3 핵염기는 티민이다. 일부 실시양태에서, 제4 핵염기는 시토신이다. 일부 실시양태에서, 방법은 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 미만 또는 0.1% 미만의 삽입결실 형성을 유발한다. 일부 실시양태에서, 방법은 제2 핵염기를 제4 핵염기에 상보적인 제5 핵염기로 대체함으로써, 의도된 편집된 염기 쌍 (예를 들어, A:T에서 G:C로)을 생성하는 것을 추가로 포함한다. 일부 실시양태에서, 제5 핵염기는 구아닌이다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 5%가 편집된다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45% 또는 50%가 편집된다.
일부 실시양태에서, 표적 뉴클레오티드에서의 의도된 생성물 대 비의도된 생성물의 비는 적어도 2:1, 5:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1 또는 200:1 또는 그 초과이다. 일부 실시양태에서, 의도된 점 돌연변이 대 삽입결실 형성의 비는 1:1, 10:1, 50:1, 100:1, 500:1 또는 1000:1 또는 그 초과보다 더 크다. 일부 실시양태에서, 절단된 단일 가닥 (니킹된 가닥)은 가이드 핵산에 혼성화된다. 일부 실시양태에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥에 대향한다. 일부 실시양태에서, 염기 편집제는 Cas9 도메인을 포함한다. 일부 실시양태에서, 제1 염기는 아데닌이고 제2 염기는 G, C, A 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 이노신이다. 일부 실시양태에서, 제1 염기는 아데닌이다. 일부 실시양태에서, 제2 염기는 G, C, A 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 이노신이다. 일부 실시양태에서, 염기 편집제는 편집된 가닥의 염기 절제 복구를 억제한다. 일부 실시양태에서, 염기 편집제는 비-편집 가닥을 보호하거나 그에 결합한다. 일부 실시양태에서, 염기 편집제는 UGI 활성을 포함한다. 일부 실시양태에서, 염기 편집제는 촉매 불활성 이노신-특이적 뉴클레아제를 포함한다. 일부 실시양태에서, 염기 편집제는 니카제 활성을 포함한다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기쌍은 PAM 부위의 하류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 하류에 있다. 일부 실시양태에서, 방법은 정규 (예를 들어, NGG) PAM 부위를 요구하지 않는다. 일부 실시양태에서, 핵염기 편집제는 링커를 포함한다. 일부 실시양태에서, 링커는 1 내지 25개 아미노산의 길이이다. 일부 실시양태에서, 링커는 5 내지 20개 아미노산의 길이이다. 일부 실시양태에서, 링커는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 아미노산의 길이이다. 일부 실시양태에서, 표적 영역은 표적 윈도우를 포함하며, 여기서 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 실시양태에서, 표적 윈도우는 1-10개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 윈도우는 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3, 1-2 또는 1개 뉴클레오티드의 길이이다. 일부 실시양태에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드의 길이이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 표적 윈도우 내에 있다. 일부 실시양태에서, 표적 윈도우는 의도된 편집된 염기 쌍을 포함한다. 일부 실시양태에서, 방법은 본원에 제공된 염기 편집제 중 임의의 것을 사용하여 수행된다. 일부 실시양태에서, 표적 윈도우는 탈아미노화 윈도우이다.
일부 실시양태에서, 본 개시내용은 뉴클레오티드를 편집하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 이중-가닥 DNA 서열의 핵염기 쌍을 편집하는 방법을 제공한다. 일부 실시양태에서, 방법은 a) 이중-가닥 DNA 서열의 표적 영역을 염기 편집제 및 가이드 핵산 (예를 들어, gRNA)을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적 핵염기 쌍을 포함하는 것인 단계, b) 상기 표적 영역의 가닥 분리를 유도하는 단계, c) 표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계, d) 상기 표적 영역의 1개 이하의 가닥을 절단하는 단계를 포함하며, 여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되고, 제2 핵염기는 제4 핵염기에 상보적인 제5 핵염기로 대체됨으로써, 의도된 편집된 염기 쌍을 생성하고, 의도된 편집된 염기 쌍을 생성하는 효율은 적어도 5%이다. 일부 실시양태에서, 단계 b는 생략된다는 것이 인지되어야 한다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 5%가 편집된다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45% 또는 50%가 편집된다. 일부 실시양태에서, 방법은 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 미만 또는 0.1% 미만의 삽입결실 형성을 유발한다. 일부 실시양태에서, 표적 뉴클레오티드에서의 의도된 생성물 대 비의도된 생성물의 비는 적어도 2:1, 5:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1 또는 200:1 또는 그 초과보다 더 크다. 일부 실시양태에서, 의도된 점 돌연변이 대 삽입결실 형성의 비는 1:1, 10:1, 50:1, 100:1, 500:1 또는 1000:1 또는 그 초과보다 더 크다. 일부 실시양태에서, 절단된 단일 가닥은 가이드 핵산에 혼성화된다. 일부 실시양태에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥에 대향한다. 일부 실시양태에서, 제1 염기는 아데닌이다. 일부 실시양태에서, 제2 핵염기는 G, C, A 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 이노신이다. 일부 실시양태에서, 염기 편집제는 편집된 가닥의 염기 절제 복구를 억제한다. 일부 실시양태에서, 염기 편집제는 비-편집 가닥을 보호하거나 (예를 들어, 염기 절제 복구를 형성하거나) 또는 그에 결합한다. 일부 실시양태에서, 핵염기 편집제는 UGI 활성을 포함한다. 일부 실시양태에서, 염기 편집제는 촉매 불활성 이노신-특이적 뉴클레아제를 포함한다. 일부 실시양태에서, 핵염기 편집제는 니카제 활성을 포함한다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 상류에 있다. 일부 실시양태에서, 의도된 편집된 염기쌍은 PAM 부위의 하류에 있다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 하류에 있다. 일부 실시양태에서, 방법은 정규 (예를 들어, NGG) PAM 부위를 요구하지 않는다. 일부 실시양태에서, 핵염기 편집제는 링커를 포함한다. 일부 실시양태에서, 링커는 1 내지 25개 아미노산의 길이이다. 일부 실시양태에서, 링커는 5 내지 20개 아미노산의 길이이다. 일부 실시양태에서, 링커는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 아미노산의 길이이다. 일부 실시양태에서, 표적 영역은 표적 윈도우를 포함하며, 여기서 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 실시양태에서, 표적 윈도우는 1-10개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 윈도우는 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3, 1-2 또는 1개 뉴클레오티드의 길이이다. 일부 실시양태에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드의 길이이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 표적 윈도우 내에서 발생한다. 일부 실시양태에서, 표적 윈도우는 의도된 편집된 염기 쌍을 포함한다. 일부 실시양태에서, 핵염기 편집제는 본원에 제공된 염기 편집제 중 어느 하나이다.
제약 조성물
본 개시내용의 다른 측면은 본원에 기재된 아데노신 데아미나제, 융합 단백질 또는 융합 단백질-gRNA 복합체 중 어느 것을 포함하는 제약 조성물에 관한 것이다. 본원에 사용된 용어 "제약 조성물"은 제약 용도를 위해 제제화된 조성물을 지칭한다. 일부 실시양태에서, 제약 조성물은 제약상 허용되는 담체를 추가로 포함한다. 일부 실시양태에서, 제약 조성물은 추가의 작용제 (예를 들어 특정 전달, 반감기 증가 또는 다른 치료 화합물을 위해)를 포함한다.
본원에 사용된 용어 "제약상 허용되는 담체"는 신체의 한 부위 (예를 들어, 전달 부위)로부터 또 다른 부위 (예를 들어, 신체의 기관, 조직 또는 부분)로 화합물을 운반하거나 수송하는데 수반되는 제약상 허용되는 물질, 조성물 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 제조 보조제 (예를 들어, 윤활제, 활석, 스테아르산마그네슘, 스테아르산칼슘 또는 스테아르산아연, 또는 스테아르산), 또는 용매 캡슐화 물질을 의미한다. 제약상 허용되는 담체는 제제의 다른 성분과 상용성이고 대상체의 조직에 유해하지 않다는 (예를 들어, 생리학상 상용성, 멸균, 생리적 pH 등) 의미에서 "허용된다". 제약상 허용되는 담체로서의 역할을 할 수 있는 물질의 일부 예는 하기를 포함한다: (1) 당, 예컨대 락토스, 글루코스 및 수크로스; (2) 전분, 예컨대 옥수수 전분 및 감자 전분; (3) 셀룰로스 및 그의 유도체, 예컨대 소듐 카르복시메틸 셀룰로스, 메틸셀룰로스, 에틸 셀룰로스, 미세결정질 셀룰로스 및 셀룰로스 아세테이트; (4) 분말화 트라가칸트; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대 스테아르산마그네슘, 소듐 라우릴 술페이트 및 활석; (8) 부형제, 예컨대 코코아 버터 및 좌제 왁스; (9) 오일, 예컨대 땅콩 오일, 목화씨 오일, 홍화 오일, 참깨 오일, 올리브 오일, 옥수수 오일 및 대두 오일; (10) 글리콜, 예컨대 프로필렌 글리콜; (11) 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜 (PEG); (12) 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; (13) 한천; (14) 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; (15) 알긴산; (16) 발열원 무함유 물; (17) 등장성 염수; (18) 링거액; (19) 에틸 알콜; (20) pH 완충 용액; (21) 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; (22) 벌킹제, 예컨대 폴리펩티드 및 아미노산 (23) 혈청 성분, 예컨대 혈청 알부민, HDL 및 LDL; (22) C2-C12 알콜, 예컨대 에탄올; 및 (23) 제약 제제에 사용된 다른 비-독성 상용성 물질. 습윤제, 착색제, 방출제, 코팅제, 감미제, 향미제, 퍼퓸제, 보존제 및 항산화제가 또한 제제에 존재할 수 있다. "부형제", "담체", "제약상 허용되는 담체" 등과 같은 용어는 본원에서 상호교환가능하게 사용된다.
일부 실시양태에서, 제약 조성물은 대상체에의 전달을 위해, 예를 들어 유전자 편집을 위해 제제화된다. 본원에 기재된 제약 조성물을 투여하는 적합한 경로는 비제한적으로 하기를 포함한다: 국소, 피하, 경피, 피내, 병변내, 관절내, 복강내, 방광내, 경점막, 치은, 치아내, 안구내, 경고실, 기관내, 경막외, 척수강내, 근육내, 정맥내, 혈관내, 골내, 안구주위, 종양내, 뇌내 및 뇌실내 투여.
일부 실시양태에서, 본원에 기재된 제약 조성물은 이환 부위 (예를 들어, 종양 부위)에 국부로 투여된다. 일부 실시양태에서, 본원에 기재된 제약 조성물은 주사에 의해, 카테터에 의해, 좌제에 의해 또는 이식물에 의해 대상체에게 투여되며, 이식물은 막, 예컨대 실라스틱 막, 또는 섬유를 포함한, 다공성, 비-다공성 또는 젤라틴성 물질이다.
다른 실시양태에서, 본원에 기재된 제약 조성물은 제어 방출 시스템으로 전달된다. 한 실시양태에서, 펌프가 사용될 수 있다 (예를 들어, 문헌 [Langer, 1990, Science 249:1527-1533; Sefton, 1989, CRC Crit. Ref. Biomed. Eng. 14:201; Buchwald et al., 1980, Surgery 88:507; Saudek et al., 1989, N. Engl. J. Med. 321:574] 참조). 또 다른 실시양태에서, 중합체 물질이 사용될 수 있다. (예를 들어, 문헌 [Medical Applications of Controlled Release (Langer and Wise eds., CRC Press, Boca Raton, Fla., 1974); Controlled Drug Bioavailability, Drug Product Design and Performance (Smolen and Ball eds., Wiley, New York, 1984); Ranger and Peppas, 1983, Macromol. Sci. Rev. Macromol. Chem. 23:61] 참조. 또한, 문헌 [Levy et al., 1985, Science 228:190; During et al., 1989, Ann. Neurol. 25:351; Howard et al., 1989, J. Neurosurg. 71:105] 참조.). 다른 제어 방출 시스템은, 예를 들어 [Langer, 상기 문헌]에서 논의된다.
일부 실시양태에서, 제약 조성물은 대상체, 예를 들어 인간에의 정맥내 또는 피하 투여에 적합화된 조성물로서 상용 절차에 따라 제제화된다. 일부 실시양태에서, 주사에 의한 투여를 위한 제약 조성물은 멸균 등장성 수성 완충제 중 용액이다. 필요한 경우, 제약은 또한 가용화제 및 주사 부위에서 통증을 완화시키기 위한 국부 마취제, 예컨대 리그노카인을 포함할 수 있다. 일반적으로, 성분은 개별적으로 또는 함께 혼합되어 단위 투여 형태로, 예를 들어 활성제의 양을 표시하는 기밀 용기, 예컨대 앰플 또는 사쉐 내의 건조 동결건조 분말 또는 무수 농축물로서 공급된다. 제약이 주입에 의해 투여될 경우에, 이는 멸균 제약 등급 물 또는 염수를 함유하는 주입 병으로 분배될 수 있다. 제약 조성물이 주사에 의해 투여되는 경우에, 성분이 투여 전에 혼합될 수 있도록 멸균 주사용수 또는 염수의 앰플이 제공될 수 있다.
전신 투여를 위한 제약 조성물은 액체, 예를 들어 멸균 염수, 락테이트화된 링거액 또는 행크 용액일 수 있다. 추가로, 제약 조성물은 고체 형태일 수 있고, 사용 직전 재-용해되거나 현탁될 수 있다. 동결건조된 형태가 또한 고려된다.
제약 조성물은 지질 입자 또는 소포, 예컨대 리포솜 또는 미세결정 내에 함유될 수 있으며, 이는 또한 비경구 투여에 적합하다. 입자는 조성물이 그 안에 함유되는 한, 임의의 적합한 구조, 예컨대 단층 또는 복수층일 수 있다. 화합물은 융합생성 지질 디올레오일포스파티딜에탄올아민 (DOPE), 낮은 수준 (5-10 몰%)의 양이온성 지질을 함유하는 "안정화된 플라스미드-지질 입자" (SPLP)에 포획될 수 있고, 폴리에틸렌글리콜 (PEG) 코팅에 의해 안정화될 수 있다 (Zhang Y. P. et al., Gene Ther. 1999, 6:1438-47). 양으로 하전된 지질, 예컨대 N-[1-(2,3-디올레오일옥시)프로필]-N,N,N-트리메틸-암모늄메틸술페이트 또는 "DOTAP"는 이러한 입자 및 소포에 특히 바람직하다. 이러한 지질 입자의 제조는 널리 공지되어 있다. 예를 들어, 미국 특허 번호 4,880,635; 4,906,477; 4,911,928; 4,917,951; 4,920,016 및 4,921,757 (이들 각각은 본원에 참조로 포함됨)을 참조한다.
본원에 기재된 제약 조성물은, 예를 들어 단위 용량으로 투여되거나 포장될 수 있다. 본 개시내용의 제약 조성물에 관하여 사용되는 경우 용어 "단위 용량"은 대상체에 대한 단일 투여량으로서 적합한 물리적 이산 단위를 지칭하며, 각각의 단위는 요구되는 희석제; 즉, 담체 또는 비히클과 함께 목적하는 치료 효과를 생성하도록 계산된 미리 결정된 양의 활성 물질을 함유한다.
추가로, 제약 조성물은 (a) 동결건조 형태의 본 발명의 화합물을 함유하는 용기 및 (b) 주사용 제약상 허용되는 희석제 (예를 들어, 멸균수)를 함유하는 제2 용기를 포함하는 제약 키트로서 제공될 수 있다. 제약상 허용되는 희석제는 본 발명의 동결건조 화합물의 재구성 또는 희석을 위해 사용될 수 있다. 인간 투여를 위한 제조, 사용 또는 판매의 기관에 의한 승인을 반영하는, 제약 또는 생물학적 제품의 제조, 사용 또는 판매를 관할하는 정부 기관에 의해 규정된 형태의 통지서가 이러한 용기(들)에 임의로 회합될 수 있다.
또 다른 측면에서, 상기 기재된 질환의 치료에 유용한 물질을 함유하는 제조 물품이 포함된다. 일부 실시양태에서, 제조 물품은 용기 및 라벨을 포함한다. 적합한 용기는, 예를 들어 병, 바이알, 시린지 및 시험 튜브를 포함한다. 용기는 다양한 물질, 예컨대 유리 또는 플라스틱으로 형성될 수 있다. 일부 실시양태에서, 용기는 본원에 기재된 질환을 치료하는데 효과적인 조성물을 보유하며, 멸균 접근 포트를 가질 수 있다. 예를 들어, 용기는 피하 주사 바늘에 의해 뚫릴 수 있는 마개를 갖는 정맥내 용액 백 또는 바이알일 수 있다. 조성물 중 활성제는 본 발명의 화합물이다. 일부 실시양태에서, 용기 상의 또는 그와 회합된 라벨은 조성물이 선택 질환을 치료하는데 사용된다는 것을 표시한다. 제조 물품은 제약상 허용되는 완충제, 예컨대 포스페이트 완충 염수, 링거액 또는 덱스트로스 용액을 함유하는 제2 용기를 추가로 포함할 수 있다. 이는 다른 완충제, 희석제, 필터, 바늘, 시린지, 및 사용에 대한 지침서를 갖는 패키지 삽입물을 포함한, 상업적 및 사용자 관점에서 바람직한 다른 물질을 추가로 포함할 수 있다.
키트, 벡터, 세포
본 개시내용의 일부 측면은 데옥시리보핵산 (DNA) 분자 내의 아데노신을 탈아미노화시킬 수 있는 아데노신 데아미나제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 구축물을 포함하는 키트를 제공한다. 일부 실시양태에서, 뉴클레오티드 서열은 본원에 제공된 임의의 아데노신 데아미나제를 코딩한다. 일부 실시양태에서, 뉴클레오티드 서열은 아데노신 데아미나제의 발현을 유도하는 이종 프로모터를 포함한다.
본 개시내용의 일부 측면은 (a) 본원에 제공된 바와 같은, 아데노신 데아미나제에 융합된 napDNAbp (예를 들어, Cas9 도메인), 또는 napDNAbp (예를 들어, Cas9 도메인) 및 아데노신 데아미나제를 포함하는 융합 단백질을 코딩하는 뉴클레오티드 서열; 및 (b) (a)의 서열의 발현을 유도하는 이종 프로모터를 포함하는 핵산 구축물을 포함하는 키트를 제공한다. 일부 실시양태에서, 키트는 가이드 핵산 백본 (예를 들어, 가이드 RNA 백본)을 코딩하는 발현 구축물을 추가로 포함하며, 여기서 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 핵산 백본 (예를 들어, 가이드 RNA 백본) 내로의 클로닝을 허용하도록 위치된 클로닝 부위를 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 아데노신 데아미나제, 융합 단백질 또는 복합체 중 임의의 것을 포함하는 세포를 제공한다. 일부 실시양태에서, 세포는 본원에 제공된 아데노신 데아미나제 또는 융합 단백질 중 임의의 것을 코딩하는 뉴클레오티드를 포함한다. 일부 실시양태에서, 세포는 본원에 제공된 뉴클레오티드 또는 벡터 중 임의의 것을 포함한다.
상기 리포터 시스템의 예시적인 실시양태의 설명은 단지 예시 목적으로 제공되며, 제한하는 것으로 의도되지 않는다. 추가의 리포터 시스템, 예를 들어 상기 상세히 기재된 예시적인 시스템의 변형은 또한 본 개시내용에 의해 포함된다.
그러나 추가의 융합 단백질이 본 개시내용 및 관련 기술분야의 지식에 기초하여 통상의 기술자에게 분명할 것이라는 것이 인지되어야 한다.
본 발명의 이들 및 다른 실시양태의 기능 및 이점은 하기 실시예로부터 보다 완전히 이해될 것이다. 하기 실시예는 본 발명의 이익을 예시하고 특정한 실시양태를 기재하고자 의도된 것이지만, 본 발명의 전체 범주를 예시하고자 의도된 것은 아니다. 따라서, 실시예는 본 발명의 범주를 제한하는 것으로 의도되지 않는다는 것이 이해될 것이다.
실시예
하기 실시예에 제공된 데이터는 DNA와 관련하여 아데노신의 가수분해성 탈아미노화 (구아닌 (G)과 같이 염기 쌍을 형성하는 이노신을 형성함)를 촉매할 수 있는 염기 편집제의 조작을 기재한다. DNA에 작용하는 공지된 자연 발생 아데노신 데아미나제는 존재하지 않는다. 대신에, 공지된 아데노신 데아미나제는 RNA (예를 들어, tRNA 또는 mRNA)에 작용한다. 최초 데옥시아데노신 데아미나제를 진화시켜 DNA 기질을 받아들이고 데옥시아데노신 (dA)을 데옥시이노신으로 탈아미노화시키도록 하였다. 한 예로서, DNA에 작용하는 아데노신 데아미나제를 조작하기 위해, 에스케리키아 콜라이로부터의 tRNA에 작용하는 아데노신 데아미나제 (ADAT) (tRNA 아데노신 데아미나제 A, TadA)를 사용하여 진화 실험을 수행하였다. 간략하게, ecTadA를 dCas9 도메인에 공유 융합시키고, 구축물의 데아미나제 부분에 돌연변이를 함유하는 상기 융합체의 라이브러리를 조립하였다. 하기 기재된 진화 실험에서, ecTadA 내 여러 돌연변이는 DNA 내의 아데노신을 탈아미노화시키는 ecTadA의 능력을 개선시키는 것으로 발견되었다. 박테리아 및 인간 세포에서 A·T에서 G·C 염기 쌍으로의 프로그램가능한 전환을 매개하는 아데닌 염기 편집제 (ABE)의 방향적 진화, 조작 및 특징화가 본원에서 보고된다. 실제로, 공지된 병원성 단일 뉴클레오티드 다형성의 대략 절반은 C·G에서 T·A로의 전이이다. 따라서 프로그램가능하고 효율적이며 정확한 방식으로 A·T 염기 쌍을 G·C 염기 쌍으로 전환시키는 능력은 유전 질환을 연구하고 치료하기 위한 노력을 실질적으로 진보시킬 수 있다. ABE 효율 및 서열 일반성을 최대화하기 위한 광범위한 진화 및 조작은 제7-세대 아데닌 염기 편집제, 예컨대 ABE7.10을 생성하였으며, 이는 비처리 세포의 경우와 대등한 매우 높은 생성물 순도 (전형적으로 > 99%) 및 매우 낮은 비율의 삽입결실 (전형적으로 ≤ 0.1%)로 표적 A·T를 G·C 염기 쌍으로 효율적으로 전환시킨다 (인간 세포에서 17개의 게놈 부위에 걸쳐 평균 53%). 하기 실시예에서 ABE7 변이체는 현재 Cas9 뉴클레아제-매개된 HDR 방법보다 훨씬 더 효율적으로 및 깨끗하게 점 돌연변이를 도입하고, Cas9 뉴클레아제보다 더 적은 오프-타겟 게놈 변형을 유도하며, 배양된 인간 세포에서 질환-연관 SNP의 교정 및 질환-억제 SNP의 도입 둘 다에 사용될 수 있는 것으로 제시된다.
각각 시토신 및 5-메틸시토신의 자발적 가수분해성 탈아미노화로부터의 우라실 및 티민의 형성은1,2 인간에서 1일에 세포당 100-500회의 추정치로 발생하고1 , 모든 공지된 병원성 SNP의 대략 절반을 차지하는 C·G에서 T·A로의 돌연변이를 유발할 수 있다 (도 1a). 따라서, 변형되지 않은 세포의 게놈 DNA 내의 표적 유전자좌에서 A·T 염기 쌍을 G·C 염기 쌍으로 전환시키는 능력은 질환과 연관된 상당한 분율의 인간 SNP의 교정을 가능하게 할 수 있다.
염기 편집은 이중 가닥 DNA 파괴 (DSB), 상동성-지정 복구 (HDR) 과정 또는 공여자 DNA 주형을 요구하지 않으면서 표적 게놈 유전자좌에서의 한 염기 쌍에서 또 다른 염기 쌍으로의 직접적인 비가역적 전환을 가능하게 하는 게놈 편집의 형태이다3-5. 점 돌연변이를 도입하기 위한 표준 게놈 편집 방법과 비교하여, 염기 편집은 보다 효율적으로6, 및 보다 적은 바람직하지 않은 생성물, 예컨대 확률적 삽입 또는 결실 (삽입결실) 또는 전위로4,6-8 진행될 수 있다.
가장 통상적으로 사용되는 염기 편집제는 (i) DSB를 만들 수 없는 촉매적으로 손상된 CRISPR-Cas9 돌연변이체, (ii) Cas9에 의해 생성된 단일-가닥 DNA 버블에서 작은 윈도우 (~5개 뉴클레오티드) 이내에서 C를 우라실 (U)로 전환시키는 단일-가닥-특이적 시티딘 데아미나제, (iii) 염기 편집 효율 및 생성물 순도를 감소시키는 우라실 절제 및 하류 방법을 저해하는 우라실 글리코실라제 억제제 (UGI)9, 및 (iv) 비-편집 DNA 가닥을 니킹하여 G-함유 DNA 가닥을 대체하는 세포성 미스매치 복구를 지시하는 니카제 활성6,9으로 이루어진 제3-세대 설계 (BE3)이다. 종합하면, 이들 성분은 박테리아, 효모4,10, 식물11,12, 제브라피쉬13, 포유동물 세포14,15, 마우스16,17, 및 심지어 인간 배아18,19에서 효율적이고 영구적인 C·G에서 T·A로의 염기 쌍 전환을 가능하게 한다. 염기 편집 능력은 상이한 프로토스페이서-인접 모티프 (PAM) 상용성7, 좁은 편집 윈도우7, 증진된 DNA 특이성8, 및 소분자 의존성20을 갖는 염기 편집제의 개발을 통해 확장되었다. 제4-세대 염기 편집제 (BE4 및 BE4-Gam)는 C·G에서 T·A로의 편집 효율 및 생성물 순도를 추가로 개선시켰다.9
현재까지, 모든 보고된 염기 편집제는 C·G에서 T·A로의 전환을 매개한다. 본 연구에서, 단백질 진화 및 조작을 사용하여 박테리아 및 인간 세포에서 DNA 내의 A·T를 G·C 염기 쌍으로 전환시키는 새로운 부류의 아데닌 염기 편집제 (ABE)를 개발하였다. 제7-세대 ABE, 예컨대 ABE7.10 (도 7)은 ~50%의 전형적인 효율 및 매우 높은 정도의 생성물 순도 (> 99%)로 인간 세포 내 폭넓은 범위의 표적 게놈 유전자좌에서 A·T를 G·C로 전환시키며, 이는 BE3의 전형적인 성능 특징을 능가한다. ABE는 염기 편집의 범주를 크게 확장시키고, 이전에 기재된 염기 편집제와 함께, 살아있는 세포의 게놈 내의 모든 4개의 전이 돌연변이 (C에서 T로, A에서 G로, T에서 C로 및 G에서 A로)의 프로그램가능한 설치를 가능하게 한다.
실시예 1 - DNA 상에서 작동하는 아데닌 데아미나제의 진화
아데노신의 가수분해성 탈아미노화는 이노신을 생성한다 (도 1b). 폴리머라제 활성 부위의 제약 내에서, 이노신은 C와 가장 안정적으로 쌍형성하고, 따라서 G로 판독 또는 복제된다21. 기존 염기 편집제의 시티딘 데아미나제 도메인을 아데닌 데아미나제로 대체하는 것이 이론상 ABE를 제공할 수 있지만 (도 1c), DNA에서 아데닌을 탈아미노화시키는 효소는 공지되어 있지 않다. 아데닌 데아미나제의 모든 보고된 예들이 유리 아데닌, 유리 아데노신, RNA 내 또는 잘못 쌍형성된 RNA:DNA 헤테로듀플렉스 내의 아데노신을 프로세싱하거나22, 또는 이상하게도, 단일-가닥 DNA 상에서 C에서 U로의 형성을 촉매하지만23, 본 발명의 노력은 BE3의 APOBEC1 성분을 천연 아데닌 데아미나제, 예컨대 이. 콜라이 TadA24-26, 인간 ADAR27,28, 마우스 ADA29, 및 인간 ADAT230,31 (보충 서열 1)로 대체하여 높은 유효 몰농도의 단일-가닥 DNA가 DNA 상에서의 그의 불량한 활성을 극복할 수 있는지의 가능성을 시험함으로써 시작되었다. 불행하게도, 이들 아데닌 데아미나제-Cas9 D10A 니카제 융합체를 코딩하는 플라스미드 DNA 구축물을 상응하는 단일-가이드 RNA (sgRNA)와 함께 HEK293T 세포 내로 형질감염시켰을 때, 비처리 세포의 경우를 상회하는 유의한 A·T에서 G·C로의 편집은 관찰되지 않았다 (도 8a). 이들 결과는 시험된 천연 아데닌 데아미나제 효소가 DNA를 프로세싱할 수 없다는 것이 ABE에서의 그의 직접적인 사용을 배제시킨다는 것을 시사한다.
이들 결과를 고려하여, 자연 발생 RNA 아데닌 데아미나제로부터 출발하여 기질로서 DNA를 받아들이는 아데닌 데아미나제 변이체를 진화시키고자 하였다. 중요한 위치에서의 점 돌연변이를 함유하는 항생제 내성 유전자를 생성함으로써 염기 편집을 위한 박테리아 선택을 개발하였다 (표 8 및 보충 서열 2). 염기 편집제에 의한 이들 돌연변이의 복귀는 항생제의 존재 하에 박테리아 생존을 가능하게 한다. 선택을 검증하기 위해, 박테리아 코돈 최적화된 버전의 BE26 (dCas9 및 UGI에 융합된 APOBEC1 시티딘 데아미나제)를 사용하였는데, 이는 박테리아가 BE3에 의한 보다 효율적인 염기 편집을 가능하게 하는 닉-지정 미스매치 복구 기구가 결여되어 있기 때문이다32. 표적 돌연변이 선택, 프로모터 강도, 선택 플라스미드 카피수, 인큐베이션 시간 및 항생제 선택 엄격도를 최적화한 후에, 불활성화 돌연변이로의 염기 편집을 지시하도록 프로그램화된 sgRNA 및 BE2에 의한 촉매 잔기에서의 A·T에서 G·C로의 돌연변이 (H193R)를 함유하는 결함성 클로람페니콜 아세틸 트랜스퍼라제 (CamR)의 성공적인 구제가 관찰되었으며, 1 μg/mL에서 32μg/mL로 클로람페니콜 최소 억제 농도 (MIC)가 증가하였다. DNA 서열분석은 선택에서 생존한 박테리아 세포가 CamR 기능을 회복시키는 C·G에서 T·A로의 돌연변이를 함유하였다는 것을 확인시켜 주었다.
다음으로, 선택 플라스미드를 CamR 유전자 내에 C·G에서 T·A로의 돌연변이를 도입함으로써 ABE 활성에 대해 개조하여, 1 μg/mL 클로람페니콜의 MIC를 부여하는 H193Y 치환을 생성시켰다 (표 8 및 보충 서열 2). H193Y 돌연변이에서의 A·T를 G·C로 전환시키는 것은 클로람페니콜 내성을 회복시켜, ABE 활성을 클로람페니콜의 존재 하의 박테리아 생존과 연관시킬 것이다.
이전에 기재된 염기 편집제6-9는 단일-가닥 DNA 상에서 작동하고 이중-가닥 DNA를 거부하는 시티딘 데아미나제 효소의 사용을 이용한다. 이러한 단일-가닥 DNA 요건은 Cas9에 의해 생성된 단일-가닥 버블 내 작은 윈도우의 뉴클레오티드에 데아미나제 활성을 집중시켜, 표적 뉴클레오티드(들) 이외의 바람직하지 않은 탈아미노화 사건을 최소화하는데 중요하다. TadA는 tRNAArg의 단일-가닥 안티코돈 루프 내 아데닌을 이노신 (I)으로 전환시키는 tRNA 아데닌 데아미나제이다24. 이. 콜라이 TadA는 원래의 염기 편집제에 사용되는 APOBEC 패밀리의 효소33와 상동성을 공유하고, 구조적 연구는 일부 APOBEC가 TadA에 결합된 tRNA의 입체형태와 닮은 입체형태로 단일-가닥 DNA에 결합한다는 것을 밝혀냈다33. TadA는 (ADAR34과 대조적으로) 소분자 활성화제를 요구하지 않고, (ADA29와 달리) 폴리핵산에 작용한다. 이들 고찰에 기초하여, DNA 아데닌 데아미나제를 진화시키기 위한 노력의 출발점으로서 이. 콜라이 TadA를 선택하였다.
편집제의 Cas9 부분의 유리한 특성을 변경하는 것을 피하기 위해 구축물의 아데닌 데아미나제 부분에서만 돌연변이를 함유하는 ecTadA-dCas9 융합체의 비편향 플라스미드 라이브러리를 생성하였다. 생성된 플라스미드 라이브러리를 CamR H193Y 선택을 보유하는 이. 콜라이 내로 형질전환시키고, ~5.0 x 106개의 형질전환체를 2 내지 16 μg/mL 클로람페니콜을 함유하는 배지 상에 플레이팅하였다 (도 2a). 생존 콜로니에는 TadA 돌연변이 A106V 및 D108N이 강하게 풍부하였다 (도 2b). 진화된 이. 콜라이 TadA를, tRNAArg와 복합체화된 구조가 보고된 바 있는35 상동체인 에스. 아우레우스 TadA와 함께 서열 정렬시키는 것은, D108의 측쇄가 기질 아데노신의 바로 상류의 우리딘 뉴클레오티드에서의 리보스의 2'-OH 기와 수소 결합을 이룬다는 것을 예측해 준다 (도 2c). D108에서의 돌연변이는 아마도 이러한 수소 결합을 제거하여, 기질-결합 부위 내에 DNA를 받아들이는 에너지 기회 비용을 감소시킨다. DNA 서열분석은 선택에서 생존한 모든 박테리아 클론이 CamR 내의 표적화 부위에서 실질적인 A·T에서 G·C로의 복귀를 보여주었음을 확인시켜 주었다. 종합하면, 이들 결과는 TadA D108에서 또는 그 근처에서의 돌연변이가 TadA로 하여금 DNA 기질에 대한 아데닌 탈아미노화를 수행하는 것을 가능하게 한다는 것을 나타낸다.
목적하는 염기 편집 결과를 유리하게 하도록 세포성 DNA 미스매치 복구를 조작하기 위해 박테리아 진화에 사용된 dCas9를 BE3에 사용된 Cas9 D10A 니카제로 대체하고 C-말단 핵 국재화 신호 (NLS)를 부가한 포유동물 코돈-최적화된 TadA-Cas9 니카제 융합 구축물 내로 TadA A106V 및 D108N 돌연변이를 혼입시켰다. TadA*가 진화된 TadA 변이체를 나타내고 XTEN이 BE36에 사용된 16개-아미노산 링커인 생성된 TadA*-XTEN-nCas9-NLS 구축물을 ABE1.2로 지정하였다. ABE1.2 및 6개의 인간 게놈 부위를 표적화하는 sgRNA를 발현하는 플라스미드의 형질감염 (도 3a)은, PAM을 위치 21-23으로서 카운팅하여 프로토스페이서 위치 5에서 또는 그 근처에서 (도 3b) 인간 게놈 내의 6개의 다양한 표적 부위에 걸쳐 (도 2a) 매우 낮지만 관찰가능한 A에서 G로의 편집 효율 (3.2±0.88%; 모든 편집 효율은 달리 언급되지 않는 한 형질감염된 세포에 대해 형질감염된 세포에 대한 풍부화 없이 3회의 생물학적 반복실험의 평균±SD로 보고됨)을 나타냈다. 이들 데이터는 낮은 수준의 A·T에서 G·C로의 전환을 촉매할 수 있는 ABE가 제1 라운드의 단백질 진화 및 조작으로부터 나타났다는 것을 확인시켜 주었다.
실시예 2 - 개선된 데아미나제 변이체 및 ABE 아키텍처
제2 라운드의 진화를 통해 ABE1.2의 편집 효율을 개선시키고자 하였다. ABE1.2 변이체의 비편향 라이브러리를 상기와 같이 생성하고, 생성된 TadA* 1.2-dCas9 돌연변이체를 라운드 1에서 사용된 것보다 더 높은 농도의 클로람페니콜 (16 내지 128 μg/mL)을 사용하여 박테리아에서 챌린지하였다 (표 7 및 8). 이러한 제2 라운드의 진화로부터, TadA 내 기질에 인접한 나선에 놓여있는 것으로 예측되는 2개의 돌연변이 D147Y 및 E155V를 확인하였다 (도 2c). 포유동물 세포에서, ABE2.1 (ABE1.2 + D147Y + E155V)은 시험된 6개의 게놈 부위에서 ABE1.2보다 2배 내지 7배 더 높은 활성을 나타냈으며, 이는 평균 11±2.9%의 A·T에서 G·C로의 염기 편집을 유발하였다 (도 3b).
다음으로, ABE2.1 편집 효율을 추가의 단백질 조작을 통해 개선시키고자 하였다. TadA(2.1)* 도메인을 Cas9 니카제의 N-말단 대신 C-말단에 융합시키는 것은 편집 활성의 완전한 상실을 유발하였으며 (도 7 및 8b), 이는 BE36을 사용한 이전 발견과 일치한다. 또한, TadA(2.1)*와 Cas9 니카제 사이의 링커 길이를 변화시켰다. ABE2.1에서의 원래 16개-잔기 XTEN 링커의 2배 길이의 링커 (32개 아미노산, (SGGS)2-XTEN-(SGGS)2)를 갖는 ABE2 변이체 (ABE2.6)는 ABE2.1과 비교하여 보통 더 높은 편집 효율을 제공하였으며, 본 발명에서 시험된 6개의 게놈 유전자좌에 걸쳐 평균 14±2.4%였다 (도 7 및 8b).
우라실 N-글리코실라제 (UNG)가 DNA로부터 우라실의 제거를 촉매하고 염기 절제 복구를 개시하는 메카니즘과 유사하게, 알킬 아데닌 DNA 글리코실라제 (AAG)는 DNA 내의 이노신의 글리코시드 결합의 절단을 촉매한다36,37. 이노신 절제가 ABE 성능을 저해하는지를 시험하기 위해, 이노신 염기 절제 복구 (BER)의 잠재적 공급원을 최소화하도록 설계된 ABE2 변이체를 생성하였다. AAG의 공지된 단백질 억제제가 부재한다는 것을 고려하여, 이노신 결합 또는 제거에 관여하는 효소의 촉매적으로 불활성화된 버전: 인간 AAG (E125Q 돌연변에 의해 불활성화됨38) 또는 이. 콜라이 엔도 V (D35A 돌연변이에 의해 불활성화됨39)를 ABE2.1의 C-말단에 개별적으로 융합시킴으로써 내인성 AAG가 이노신 중간체에 접근하는 것이 차단되도록 시도하였다. ABE2.1-AAG(E125Q) (ABE2.2) 및 ABE2.1-엔도 V(D35A) (ABE2.3) 둘 다는 ABE2.1과 비교하여 HEK293T 세포에서 변경된 A·T에서 G·C로의 편집 효율을 나타내지 않았다 (도 7 및 8c). 실제로, AAG가 결여된 Hap1 세포에서 ABE2.1을 사용하는 것은 야생형 AAG를 함유하는 Hap1 세포와 비교하여 염기 편집 효율의 증가, 생성물 순도의 증가, 또는 삽입결실 빈도의 감소를 유발하지 않았다 (도 8d). 더욱이, ABE2.1은 시험된 6개의 유전자좌에서 실질적으로 삽입결실 부재 (≤ 0.1%) 또는 A·T에서 비-G·C로의 생성물 (≤ 0.1%)을 유도하였으며, 이는 이노신 중간체의 비효율적인 절제와 일치한다 (도 11a 내지 11b). 종합하면, 이들 관찰은 ABE에 의해 생성된 이노신 중간체의 세포 복구가 비효율적이라는 것을 강하게 시사하며, 이는 BER과 같은 방법을 뒤엎을 필요성을 제거한다. 이러한 상황은 염기 편집 효율 및 생성물 순도를 최대화하고 삽입결실 형성을 억제하기 위해 우라실 절제를 억제하는 것에 강하게 의존하는 BE3 및 BE4의 상황과 대조적이다6,9.
최종 ABE2 조작 연구로서, 인간 세포에서의 염기 편집 효율에 대한 TadA* 이량체화 상태의 역할을 조사하였다. 천연 형태에서, TadA는 동종이량체로서 작동하며, 하나의 단량체는 A에서 I로의 탈아미노화를 촉매하고, 다른 단량체는 tRNA 기질에 대한 도킹 스테이션으로서 작용한다40. 이. 콜라이에서의 선택 동안, 내인성 TadA는 비-촉매 단량체로서의 역할을 하는 것으로 추측된다. 포유동물 세포에서, 추가의 야생형 또는 진화된 TadA 단량체를 테더링하는 것은 분자간 ABE 이량체화에 대한 의존성을 최소화함으로써 편집 효율을 개선시킬 수 있는 것으로 가정된다. 실제로, ABE2.1을 야생형 TadA 또는 TadA*2.1과 함께 공동-발현시켜 트랜스로 ABE2.1:TadA 또는 ABE2.1:TadA*2.1 이량체 형성을 촉진하는 것 (각각 ABE2.7 및 ABE2.8), 뿐만 아니라 진화된 또는 야생형 TadA를 ABE2.1의 N-말단에 직접 융합시키는 것 (각각 ABE2.9 및 ABE2.10)은, 실질적으로 편집 효율을 개선시켰다 (도 3b, 7 및 10a). 융합된 TadA-ABE2.1 아키텍처 (ABE2.9)가 최고 편집 효율을 제공하는 것으로 확인하였으며 (6개의 게놈 유전자좌에 걸쳐 평균 20±3.8%, 및 ABE1.2에 비해 각각의 부위에서 7.6±2.6배 평균 개선), 이를 모든 후속 실험에서 사용하였다 (도 2b 및 3b). 2개의 야생형 TadA 도메인을 함유하고 진화된 TadA* 도메인을 함유하지 않는 대조군 ABE 변이체는 시험된 6개의 게놈 부위에서 A·T에서 G·C로의 편집을 유발하지 않았으며 (도 10a), 이는 이량체화 단독으로는 ABE 활성을 매개하는데 불충분하다는 것을 확인시켜 준다.
이들 결과는 TadA 이량체화를 ABE 편집 효율의 중요한 성분으로서 연루시켰기 때문에, TadA-ABE2 융합체 내의 2개의 TadA 서브유닛 중 어느 것이 A에서 I로의 촉매작용을 담당하는지를 결정하였다. 불활성화 E59A 돌연변이24를 ABE2.9의 N-말단 또는 내부 TadA 단량체 내로 도입하여, 각각 ABE2.11 또는 ABE2.12를 생성하였다. 불활성화된 N-말단 TadA 서브유닛을 갖는 변이체 (ABE2.11)는 ABE2와 대등한 편집 효율을 나타냈고, 반면 불활성화된 내부 TadA 서브유닛을 갖는 변이체는 모든 편집 활성을 상실하였다 (도 7 및 10a). 이들 결과는 내부 TadA 서브유닛이 A에서 I로의 촉매작용을 담당한다는 것을 확립시켜 준다.
실시예 3 - 표적의 하위세트를 효율적으로 편집하는 ABE
다음으로, A·T에서 G·C로의 편집 효율을 추가로 증가시키기 위해 TadA*2.1-dCas9로 출발하여 (내인성 이. 콜라이 TadA와 또는 그 자체와의 트랜스 이량체화에 의존함) 제3 라운드의 박테리아 진화를 수행하였다. 카나마이신 내성 유전자 (KanR, 아미노글리코시드 포스포트랜스퍼라제, 표 8 및 보충 서열 2)에 2개의 초기 정지 코돈 (Q4정지 및 W15정지)을 도입함으로써 선택의 엄격도를 증가시켰다. 각각의 돌연변이는 조기 정지 코돈을 교정하기 위해 A·T에서 G·C로의 복귀를 요구하였다. 진화 라운드 3 선택 플라스미드를 보유하는 숙주 세포에 대한 MIC는 ~8 μg/mL 카나마이신이었고, 카나마이신 내성을 회복시키기 위해서는 동일한 플라스미드 상에서 두 KanR 돌연변이의 염기 편집이 요구되었다 (표 8). TadA 도메인 내의 돌연변이를 함유하는 TadA*2.1-dCas9 변이체의 라이브러리를 16 내지 128 μg/mL 카나마이신의 존재 하에 이보다 더 높은 엄격도 선택에 적용하여, 3개의 새로운 TadA 돌연변이: L84F, H123Y 및 I157F의 강한 풍부화를 유발하였다. 이들 돌연변이를 ABE2.9 포유동물 구축물 내로 도입하여 ABE3.1을 생성하였다 (도 2b). HEK293T 세포에서, ABE3.1은 6개의 시험된 부위에 걸쳐 평균 29±2.6%의 편집 효율, ABE2.9에 비해 각각의 부위에서 A·T에서 G·C로의 전환의 1.6배 평균 증가, 및 ABE1.2에 비해 11배 평균 개선을 가져왔다 (도 3c). 2개의 TadA 단량체들 사이 또는 TadA*와 Cas9 니카제 사이의 더 긴 (64개- 또는 100개-아미노산) 링커를 또한 시험하였고, ABE3.1과 비교하여 편집 효율에 대한 음성 효과가 관찰되었다 (도 7 및 10b).
비록 ABE3.1-매개된 염기 편집 효율이 일부 부위, 예컨대 CAC 콘텍스트 내 프로토스페이서 위치 5에 편집된 A를 배치한 부위 1에서 높았지만 (65±4.2% 전환), 다른 부위, 예컨대 GAG 콘텍스트 내 편집된 A를 배치한 부위 5의 경우 편집 효율은 훨씬 더 낮았다 (8.3±0.67% 전환) (도 3c). 표적 A 주위의 상이한 서열 콘텍스트를 갖는 6개의 게놈 유전자좌로부터의 결과는, 라운드 1-3으로부터의 ABE가 YAC의 표적 서열 콘텍스트 (여기서 Y = T 또는 C임)를 강하게 선호하였다는 것을 시사한다. 이러한 서열 콘텍스트 선호는 tRNAArg의 안티코돈 루프의 UAC 콘텍스트 내 A를 탈아미노화시키는 천연 이. 콜라이 TadA의 기질 특이성으로부터 유전되었을 가능성이 있다. 그러나, 염기 편집 적용에 대한 ABE의 유용성이 이러한 표적 서열 제한에 의해 크게 제한될 것이다.
ABE3.1의 YAC 서열 선호를 극복하기 위해, 표적 A의 상류 및 하류 뉴클레오티드와 상호작용하는 것으로 예측된 TadA 잔기에서의 돌연변이유발에 촛점을 맞춘 제4 진화 캠페인을 개시하였다. 에스. 아우레우스 TadA·tRNA 공-결정 구조의 검사35는 이. 콜라이 TadA E25, R26, R107, A142 및 A143에 상응하는, tRNA 기질의 안티코돈 루프와 직접 접촉하는 잔기를 밝혀냈다. 이들 위치에서의 무작위화 잔기를 함유하는 TadA*2.1- dCas9 라이브러리 (표 7)를, 비-YAC 표적 (스펙티노마이신 내성 단백질 내의 T89I 돌연변이를 야기하는 GAT)의 A·T에서 G·C로의 전환이 항생제 내성 (표 8 및 보충 서열 2)을 회복시키는 새로운 박테리아 선택에 적용하였다. 선택 플라스미드를 보유하는 세포 내의 라이브러리 구성원 (MIC ~32 μg/mL 스펙티노마이신, 표 8)을 고농도의 스펙티노마이신 (64 내지 512 μg/mL)으로 챌린지하였다. 생존 박테리아는 TadA 돌연변이 A142N에 강하게 수렴하였다. 박테리아 세포에서 TadA*4.3-dCas9 (TadA*3.1+A142N-dCas9)에 의한 겉보기 A·T에서 G·C로의 염기 편집 효율이 스펙티노마이신 MIC에 의해 판단하였을 때 TadA*3.1-dCas9에 의한 경우보다 더 높았지만 (도 10c), ABE4.3은 일반적으로 포유동물 세포에서 ABE3.1과 비교하여 감소된 염기 편집 효율 (평균 16±5.8%)을 나타냈다 (도 2b 및 3c). A142N 돌연변이는 콘텍스트-의존성 방식으로 염기 편집에 이로울 수 있는 것으로 가정되었고, 이후 라운드의 진화에서의 그의 포함을 재논의하였다 (하기 참조).
제5 라운드의 진화를 수행하여 ABE 촉매 성능을 증가시키고 표적 서열 상용성을 확장시켰다. TadA* 도메인 전체에 걸쳐 비편향 돌연변이를 함유하는 TadA*3.1-dCas9 변이체의 라이브러리를 상기와 같이 생성하였다 (표 7). 보다 빠른 동역학을 갖는 ABE 구축물에 유리하도록, 이러한 라이브러리를 이전 라운드의 진화 (~ 14시간)의 절반의 지속기간 (7시간) 동안만 ABE 발현을 허용한 후에 더 높은 용량의 클로람페니콜 (≥ 128 μg/mL)을 사용한 CamR H193Y 선택에 적용하였다. 생존 클론은 TadA의 N- 및 C-말단 도메인 근처에 다양한 돌연변이를 함유하였다. 놀랍게도, 이들 돌연변이의 컨센서스 세트 (H36L, R51L, S146C 및 K157N)를 ABE3.1 내로 도입하여 ABE5.1을 생성하는 것은, HEK293T 세포에서의 전체 편집 효율을 1.7±0.29배 감소시켰다 (도 2b 및 3c).
ABE5.1은 ABE2.1에 대한 이전 이량체화 상태 실험 이후 7개의 돌연변이를 포함하였기 때문에, 이들 새로운 돌연변이의 축적은 비-촉매적 N-말단 TadA 서브유닛이 포유동물 세포에서 그의 구조적 역할을 수행하는 능력을 손상시킬 수 있는 것으로 추측되었다. 이. 콜라이에서, 내인성 야생형 TadA 단량체는 트랜스로 제공되며, 이는 잠재적으로 박테리아 선택 표현형과 포유동물 세포 편집 효율 사이의 단절을 설명한다. 따라서, ABE5 변이체의 N-말단 비-촉매적 TadA 도메인에 진화된 TadA* 변이체 대신 야생형 TadA를 사용하는 효과를 조사하였다. 이들 연구는 내부 진화된 TadA*에 융합된 야생형 이. 콜라이 TadA로 구성된 이종이량체 구축물 (ABE5.3)이 2개의 동일한 진화된 TadA* 도메인을 갖는 동종이량체 ABE5.1과 비교하여 크게 개선된 편집 효율을 나타냈다는 것을 밝혀냈다. 6개의 게놈 시험 부위에 걸친 ABE5.3 편집 효율은 평균 39±5.9%이고, ABE5.1에 비해 각각의 부위에서의 평균 개선은 2.9±0.78배였다 (도 2b 및 3c). ABE3.1과 비교하여, ABE5.3은 각각의 시험된 부위에서 평균 1.8±0.39배 편집 효율을 증가시켰다. 중요하게는, ABE5.3은 또한 본 발명에서 부위 3 (AAG), 부위 4 (CAA), 부위 5 (GAG) 및 부위 6 (GAC)을 포함한 비-YAC 표적의 22-33% 편집을 가능하게 한 확장된 서열 상용성을 나타냈다 (도 3c).
동시에, 라운드 5 라이브러리를 라운드 4에 사용된 비-YAC 스펙티노마이신 선택에 적용하였다. 고도로 풍부화된 돌연변이가 나타나지는 않았지만, 이러한 선택으로부터 나타나는 2개의 유전자형으로부터의 새로운 돌연변이, N72D + G125A; 및 P48S + S97C (도 7)를 후속 라이브러리 생성 단계에 포함시켰다. 이들 돌연변이를 ABE3.1에 단순 부가한 것 (각각 ABE5.13 및 ABE5.14를 생성함)은 편집 효율을 개선시키지 않았다 (도 7 및 11a).
ABE3 링커 연구는 32개 아미노산보다 훨씬 더 긴 링커가 ABE 활성을 감소시켰다는 것을 입증하였기 때문에 (도 7 및 10b), ABE5 링커를 최적화하기 위해 보다 정밀화된 접근법을 취하였다. TadA 도메인들 사이 또는 TadA와 Cas9 니카제 사이의 24개-, 32개- 또는 40개-잔기 링커를 함유하는 8개의 이종이량체 야생형 TadA-TadA* ABE5.3 변이체 (ABE5.5 내지 ABE5.12)를 HEK293T 세포에서 시험하였으며, 이는 염기 편집 효율에 있어서 명백한 개선을 가져오지 않았다 (도 7 및 11b). 따라서, 모든 후속 연구는 2개의 32개-잔기 링커를 갖는 이종이량체 wtTadA-TadA*-Cas9 니카제를 함유하는 ABE5.3 아키텍처를 사용하였다.
실시예 4 - 넓은 서열 상용성을 갖는 고도로 활성인 ABE
제6 라운드의 진화는 DNA 셔플링에 의해 임의의 비-유익한 돌연변이를 제거하고, 다른 돌연변이에 의해 음성 상위성으로부터 유리되었을 때 ABE 성능에 대해 상이한 효과를 가질 수 있는 이전 라운드의 진화로부터의 돌연변이를 재조사하는 것을 목표로 하였다. 야생형 이. 콜라이 TadA와 함께 라운드 1 내지 5로부터의 진화된 TadA*-dCas9 변이체를 셔플링하고, 스펙티노마이신 내성 T89I 선택 플라스미드를 보유하는 이. 콜라이 내로 형질전환시키고, 384 μg/mL 스펙티노마이신이 보충된 배지 상에서 선택하였다. 이러한 선택으로부터 2개의 돌연변이를 강하게 풍부화시켰다: P48S/T 및 A142N (라운드 4에서 처음 볼 수 있음). 이들 돌연변이를 개별적으로 또는 함께 ABE5.3에 부가하여 ABE6.1 내지 ABE6.6을 형성하였다 (도 7). ABE6.3 (ABE5.3+P48S)은 각각의 시험된 6개 게놈 부위에서 ABE5.3에 비해 1.3±0.28배더 높은 평균 A·T에서 G·C로의 편집 및 47±5.8%의 평균 전환 효율을 유발하였다 (도 2b 및 4a). P48은 TadA 결정 구조에서 기질 아데닌 핵염기 및 2'-히드록실로부터 ~5 A에 놓여있는 것으로 예측되고 (도 2c), 이 잔기를 Ser으로 돌연변이시키는 것은 데옥시아데노신 기질과의 상용성을 개선시킬 수 있는 것으로 추측되었다. 대부분의 부위에서 A142N 돌연변이를 함유한 ABE6 변이체는 이러한 돌연변이가 결여된 ABE보다 덜 활성이었지만, 프로토스페이서 내의 위치 7에서 표적 A를 함유하는 부위 6에서의 ABE6.4 (ABE6.3 + A142N)에 의한 편집은, ABE6.3에 의한 편집보다 1.5±0.13배 더 효율적이었고, ABE5.3에 의한 편집보다 1.8±0.16배 더 효율적이었다 (도 4a). 이들 결과는 A142N 변이체가 위치 5 보다 PAM에 더 가까운 표적 아데닌의 개선된 편집을 제공할 수 있다는 것을 시사한다.
6 라운드의 진화 및 조작이 실질적인 개선을 가져왔지만, ABE6 편집제는 표적화된 A 근처에 다수의 아데닌을 함유하는 표적 서열, 예컨대 부위 3 (AAG) 및 부위 4 (CAA)에서 감소된 편집 효율 (~20-40%)을 여전히 겪었다 (도 4a). 이러한 난제를 다루기 위해, 새로 생성된 TadA*6-dCas9 변이체의 라이브러리를 카나마이신 내성 유전자 내의 2개의 별개의 부위: TAT 모티프 편집을 필요로 하는 라운드 3에 사용된 Q4정지 돌연변이 및 TAA 서열 편집을 필요로 하는 새로운 D208N 돌연변이로 표적화시키는 제7 라운드의 진화를 수행하였다 (표 7 및 8, 보충 서열 2). 라운드 7 선택 플라스미드를 보유하는 숙주 세포의 MIC는 8 μg/mL 카나마이신이었다 (표 8). 돌연변이된 TadA*6-dCas9 변이체의 비편향 라이브러리를 이. 콜라이 내로 형질전환시키고, 64 μg/mL 내지 384 μg/mL 카나마이신을 함유하는 배지 상에서 선택하였다. 생존 클론은 3개의 풍부화된 돌연변이 세트: W23L/R, P48A 및 R152H/P를 함유하였다.
이들 돌연변이를 개별적으로 또는 조합하여 포유동물 세포 ABE (ABE7.1 내지 ABE7.10) 내로 도입한 것은, 특히 다수의 A 잔기를 함유하는 표적에서 A·T에서 G·C로의 편집 효율의 실질적인 증가를 가져왔다 (도 2b, 4a, 4b, 7, 12a 및 12b). ABE7.10은 6개 게놈 시험 부위를 평균 효율 58±4.0%로 편집하였고, 각각의 부위에서 ABE6.3에 비해 1.3±0.20배의 평균 개선 (도 4a) 및 ABE1.2와 비교하여 29±7.4배의 평균 개선을 가져왔다. 돌연변이 정밀조사는 모든 3개의 새로운 돌연변이가 편집 효율의 증가에 기여하는 것으로 밝혀냈지만 (도 7, 12a 및 12b), R152P 치환이 특히 주목할 만하다. 정렬된 ecTadA 결정 구조는 R152가 C-말단 나선에 있고 tRNA 기질의 UAC 안티코돈 루프에서 C와 접촉하는 것으로 예측한다 (도 2b 및 2c). Arg에서 Pro로의 치환은 이러한 나선을 파괴하고 염기-특이적 효소:DNA 상호작용을 제거할 수 있는 것으로 추측된다.
실시예 5 - 후기-단계 ABE의 특징화
라운드 5-7로부터의 가장 유망한 ABE를 심층적으로 특징화하였다. 표적 A를 프로토스페이서의 위치 5 또는 7에 배치하고 집합적으로 모든 가능한 NAN 서열 콘텍스트를 포함하는 확장된 17개 인간 게놈 표적 세트를 선택하였다 (도 3a). 전체적으로, HEK293T 세포에서 ABE5로부터 ABE7 변이체로의 진행 동안 A·T에서 G·C로의 편집 효율의 강한 개선이 관찰되었다 (도 4b). 전체에서 가장 활성인 편집제 ABE7.10의 염기 편집 효율은 시험된 17개 부위에서 평균 53±3.7%였고, 이들 부위 중 11개에서 50%를 초과하였으며, 34-68% 범위였다 (도 4a 및 4b). 이들 효율은 BE36의 전형적인 C·G에서의 T·A로의 편집 효율보다 유리한 것으로 비교된다.
다음으로, 후기-단계 ABE의 염기 편집 활성 윈도우를 추가로 특징화하고자 하였다. 프로토스페이서 내의 2 내지 9의 모든 홀수 위치 (부위 18) 또는 모든 짝수 위치 (부위 19)에 A가 배치되도록 2개의 sgRNA 중 어느 하나로 표적화될 수 있는 교대 5'-A-N-A-N-A-N-3' 서열을 함유하는 인간 게놈 부위를 선택하였다 (도 3a). 생성된 편집 결과 (도 5a)는, 시험된 모든 19개 부위 전체에 걸쳐 모든 프로토스페이서 위치에서의 편집 효율의 분석 (도 5b)과 함께, 후기-단계 변이체의 활성 윈도우가 PAM을 위치 21-23으로서 카운팅하여 ABE7.10의 경우 프로토스페이서 위치 ~4-7에서 및 ABE6.3, ABE7.8 및 ABE7.9의 경우 위치 ~4-9에서 대략 4-6개 뉴클레오티드 폭이라는 것을 시사한다 (도 5a 내지 5c). 정확한 편집 윈도우 경계는 BE3 및 BE4의 경우와 같이 표적-의존성 방식으로 달라질 수 있음을 주목한다 (표 1). 또한 U2OS 세포 내 부위 1-6에서 ABE7.8, ABE7.9 및 ABE7.10을 시험하였고, HEK293T 세포에서와 유사한 편집 결과가 관찰되었으며 (도 12c), 이는 ABE 활성이 HEK293T 세포에 제한되지 않는다는 것을 입증한다.
HEK293T 세포 내 6 내지 17개의 게놈 부위에서의 ABE 편집으로부터의 개별 고처리량 DNA 서열분석 판독물의 분석은 편집 윈도우 내의 근처 아데닌에서의 염기 편집 결과가 통계적으로 독립적인 사건이 아니라는 것을 밝혀냈다. 근처 표적 아데닌들 사이의 평균 정규화된 연관 불평형 (LD)은 ABE 진화가 진행됨에 따라 꾸준히 증가하여, ABE1.2, ABE3.1, ABE5.3 및 ABE7.10의 정규화 LD는 각각 0.17±0.12, 0.56±0.27, 0.67±0.25 및 0.94±0.08이었다 (도 14a 및 14b). 따라서, 초기-단계 ABE는 근처 아데닌들을 더 독립적으로 편집하고, 반면 후기-단계 ABE는 근처 아데닌들을 더 프로세싱적으로 편집하여 동일한 DNA 가닥 내의 근처 A가 또한 편집될 경우 A를 편집할 가능성이 더 크다. 이들 발견은, 진화 과정 동안 TadA가 편집 윈도우 내의 추가의 A가 전환되기 전에 기질 방출 가능성을 감소시키는 진화된 동역학적 변화를 가져, BE36의 거동과 유사한 프로세싱성을 유발할 수 있다는 것을 시사한다.
시티딘의 BE3-매개된 염기 편집으로부터 발생할 수 있는 C에서 비-T로의 편집 및 삽입결실의 형성과 대조적으로, ABE는 HEK293T 및 U2OS 세포에서 매우 깨끗하게 A·T를 G·C로 전환시키며, 비처리 대조군 세포의 경우와 유사하게 평균 < 0.1% 삽입결실이 일어나고, 시험된 17개의 게놈 NAN 부위 중 비처리 세포의 경우보다 많은 A에서 비-G로의 편집은 관찰되지 않았다 (도 5c 및 표 1). 최근에는 BE3의 바람직하지 않은 생성물이 우라실 절제 및 하류 복구 과정으로부터 일어난다는 것이 밝혀졌다9. BE3과 비교하여 모든 시험된 ABE 변이체의 현저한 생성물 순도는, DNA로부터 이노신을 제거하는 효소의 활성 또는 존재비가 UNG의 경우와 비교하여 낮아 아데닌 염기 편집 후 최소 염기 절제 복구를 가져올 수 있다는 것을 시사한다.
ABE7.10 촉매된 A·T에서 G·C로의 편집 효율을 최신 기술의 Cas9 뉴클레아제-매개된 HDR 방법 CORRECT41의 경우와 비교하였다. HEK293T 세포에서 최적화된 48시간 조건 하에 CORRECT HDR 방법을 사용하여 HEK293T 세포 내 5개의 게놈 유전자좌에서 0.47% 내지 4.2% 범위의 평균 표적 돌연변이 빈도와 3.3% 내지 10.6% 삽입결실이 관찰되었다 (도 6a). 이들 동일한 5개의 게놈 유전자좌에서, ABE7.10은 48시간 후 10-35% 및 120시간 후 55-68%의 평균 표적 돌연변이 빈도 (도 6a)와 < 0.1% 삽입결실 (도 6b)을 유발하였다. 표적 돌연변이:삽입결실 비는 CORRECT HDR의 경우 평균 0.43이고 ABE7.10의 경우 > 500이었으며, 이는 ABE7.10에 유리한 생성물 선택성의 > 1,000배 개선을 나타낸다. 이들 결과는 ABE7.10이 현재 Cas9 뉴클레아제-매개된 HDR 방법보다 훨씬 더 높은 효율 및 훨씬 더 적은 바람직하지 않은 생성물로 A·T에서 G·C로의 점 돌연변이를 도입할 수 있다는 것을 입증한다.
다음으로, ABE7 변이체의 오프-타겟 활성을 조사하였다. ABE의 오프-타겟 활성을 포괄적으로 프로파일링하는 방법이 아직 존재하지 않기 때문에, BE3을 사용한 경우에서 관찰된 바와 같이6,8,9,42, 오프-타겟 ABE 편집은 Cas9 뉴클레아제가 특정한 가이드 RNA와 복합체화되는 경우에 편집되는 것과 동일한 오프-타겟 부위에서 주로 발생하는 것으로 가정되었다. HEK293T 세포를 3종의 잘-특징화되어 있는 가이드 RNA (HEK 부위 2, 3 및 4를 표적화함)43 및 Cas9 뉴클레아제 또는 ABE7 변이체로 처리하고, 게놈-와이드 GUIDE-Seq 방법에 의해 확인된 바와 같이 이들 가이드 RNA와 연관된 12개의 가장 활성인 오프-타겟 인간 게놈 유전자좌 및 온-타겟 유전자좌를 서열분석하였다.43 Cas9에 의한 온-타겟 삽입결실의 효율 및 ABE7.10에 의한 온-타겟 염기 편집의 효율은 둘 다 평균 54%였다 (표 2-4). Cas9 뉴클레아제에 의한 검출가능한 변형 (≥ 0.2% 삽입결실)은 공지된 오프-타겟 유전자좌 12개 중 9개 (75%)에서 관찰되었다 (도 6c 및 표 2-4). 이와 대조적으로, 동일한 sgRNA와 복합체화된 경우, ABE7.10, ABE7.9 또는 ABE7.8은 공지된 Cas9 오프-타겟 부위 12개 중 단지 4개 (33%)에서만 ≥ 0.2% 오프-타겟 염기 편집을 일으켰다. 또한, 9개의 확인된 Cas9 오프-타겟 유전자좌는 평균 14% 삽입결실의 효율로 변형되었고, 반면 4개의 확인된 ABE 오프-타겟 유전자좌는 단지 평균 1.3% A·T에서 G·C로의 돌연변이로 변형되었다 (표 2-4). 9개의 확인된 Cas9 오프-타겟 유전자좌 중 7개가 ABE 활성 윈도우 내 적어도 1개의 A를 함유하였지만, 이들 7개의 오프-타겟 유전자좌 중 3개는 ABE7.8, 7.9 또는 7.10에 의해 검출가능하게 편집되지 않았다. 종합하면, 이들 데이터는 ABE7 변이체가, 편집가능한 A를 함유하는 오프-타겟 부위에 대해서도 Cas9 뉴클레아제보다 오프-타겟 게놈 변형에 덜 취약할 수 있다는 것을 시사한다. 추가로, ABE 처리 후 온-타겟 또는 오프-타겟 프로토스페이서 외부에서 ABE-유도된 A·T에서 G·C로의 편집의 증거는 검출되지 않았다.
실시예 6 - 인간 질환과 관련된 돌연변이의 ABE-매개된 교정 및 설치
마지막으로, 포유동물 세포에서 병원성 돌연변이를 교정하고 질환-억제 돌연변이를 도입하기 위한 ABE의 잠재력을 시험하였다. b-글로빈 유전자 내의 돌연변이는 다양한 혈액 질환을 유발한다. 희귀 양성 상태인 HPFH (태아성 헤모글로빈의 유전성 지속)를 갖는 인간은 겸상 적혈구성 빈혈을 포함한 일부 b-글로빈 질환에 대해 내성을 갖는다. 특정 환자에서, 이러한 표현형은 출생 즈음 인간에서는 통상 침묵되는 태아성 헤모글로빈의 지속 발현을 가능하게 하는 g-글로빈 유전자 HBG1 및 HBG2의 프로모터 내의 돌연변이에 의해 매개된다44,45. 표적 A·T 염기 쌍을 프로토스페이서 위치 7에 배치함으로써 HBG1 발현을 구동하는 프로모터에서 -198T를 C로, 및 HBG2 발현을 구동하는 프로모터에서 -198T를 C로 동시에 돌연변이시키도록 ABE를 프로그램화하는 sgRNA를 설계하였다. 이들 돌연변이는 브리티쉬-유형 HPFH를 부여하고, 성인에서 태아성 헤모글로빈 생산을 가능하게 하는 것으로 공지되어 있다46. ABE7.10은 HEK293T 세포 내 HBG1 및 HBG2 프로모터에 목적하는 T·A에서 C·G로의 돌연변이를 각각 29% 및 30% 효율로 설치하였다 (도 6c 및 14).
철 축적 장애인 유전성 혈색소증 (HHC)은 HFE 단백질 내 C282Y 돌연변이를 생성하는, 인간 HFE 유전자 내 뉴클레오티드 845에서의 G에서 A로의 돌연변이에 의해 통상적으로 유발되는 상염색체 열성 유전 장애이다47,48. 이러한 돌연변이는 간 철 호르몬인 헵시딘의 불충분한 생산을 일으켜 과도한 장 철 흡수 및 잠재적으로 생명-위협 혈청 페리틴 상승을 유발한다. ABE7.10을 코딩하는 DNA 및 프로토스페이서 위치 5에 표적 A를 배치하는 가이드 RNA를, HFE C282Y 게놈 돌연변이를 보유하는 불멸화 림프모구성 세포주 (LCL) 내로 형질감염시켰다. 형질감염에 대한 LCL 세포의 극한 내성으로 인해, 형질감염된 세포를 단리하고, 편집 효율을 생성된 게놈 DNA의 HTS에 의해 측정하였다. 형질감염된 세포로부터의 총 DNA 서열분석 판독물의 28%에서 Tyr282로부터 Cys282 코돈으로의 깨끗한 전환이 관찰되었으며, 온-타겟 유전자좌에서 바람직하지 않은 편집 또는 삽입결실의 증거는 없었다 (도 6c). 이들 ABE 편집 전략을 글로빈병증, HHC 및 유전 성분을 갖는 다른 질환에 대한 잠재적인 향후 임상 요법으로 개발하기 위해서는 많은 추가의 연구가 필요하지만, 이들 실시예는 집합적으로 인간 세포에서 질환-구동 돌연변이를 교정하고 유전 질환 표현형을 억제하는 것으로 공지된 돌연변이를 설치하는 ABE의 잠재력을 입증한다.
요약하면, 7 라운드의 진화 및 조작은, DNA (야생형 TadA-dCas9 융합체) 내의 표적 유전자좌에서의 아데닌을 탈아미노화시키는 능력을 초기에 나타내지 않은 단백질을, DNA를 약하게 편집하는 형태 (ABE1 및 ABE2), 부위의 제한된 하위세트를 효율적으로 편집하는 변이체 (ABE3, ABE4 및 ABE5), 및 궁극적으로 넓은 서열 상용성을 갖는 고도로 활성인 아데닌 염기 편집제 (ABE6 및 ABE7)로 형질전환시켰다. ABE의 개발은 이중-가닥 DNA 파괴를 도입하지 않으면서 게놈 편집에 의해 다루어질 수 있는 병원성 SNP의 분율 및 염기 편집의 능력을 크게 확장시킨다 (도 1a). 추가로, ABE는 63개의 비-동의 코돈 변화, 개시 코돈의 파괴 또는 생성, 조기 정지 코돈의 파괴, 스플라이싱 공여자 또는 수용자 부위의 복구, 및 조절 서열의 변형을 포함한 광범위한 유용성의 정확한 유전적 변화를 만들기 위해 또한 사용될 수 있다. ABE7.10은 일반적인 A·T에서 G·C로의 염기 편집에 권장된다. 표적 A가 프로토스페이서 위치 8-10에 존재하는 경우에, 이들 위치에서의 전환 효율이 전형적으로 프로토스페이서 위치 4-7에서보다 더 낮긴 하지만, ABE7.9, ABE7.8 또는 ABE6.3은 ABE7.10보다 더 높은 편집 효율을 제공할 수 있다. BE3 및 BE49와 함께, 이들 ABE는 최소의 바람직하지 않은 부산물로 살아있는 세포 내 표적 유전자좌에 모든 4개의 돌연변이의 직접 설치를 가능하게 함으로써 게놈 편집 분야를 진보시킨다.
데이터 이용가능성. ABE6.3, ABE7.8, ABE7.9 및 ABE7.10을 코딩하는 발현 벡터는 애드진(Addgene)으로부터 입수가능하다. 고처리량 DNA 서열분석 데이터는 NCBI 서열 판독물 아카이브에 기탁될 것이다.
방법
일반적 방법. 달리 언급되지 않는 한 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 (써모피셔 사이언티픽(ThermoFisher Scientific)) 또는 Q5 핫 스타트 하이-피델리티 2x 마스터 믹스 (뉴 잉글랜드 바이오랩스(New England BioLabs))를 사용하여 PCR에 의해 DNA 증폭을 수행하였다. 이러한 연구에서 생성된 모든 포유동물 세포 및 박테리아 플라스미드를 이전에 기재된 바와 같이49 USER 클로닝 방법을 사용하여 조립하고, 출발 물질 유전자 주형을 박테리아 또는 포유동물 코돈-최적화된 g블록 유전자 단편 (인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies))으로서 합성적으로 접근하였다. 모든 sgRNA 발현 플라스미드를 목적하는 sgRNA 표적화 부위에 상응하는 가변 20-nt 서열을 함유하는 PCR 생성물의 1-조각 평활-말단 라이게이션에 의해 구축하였다. 이러한 연구에 사용된 모든 sgRNA 플라스미드의 합성에 사용된 프라이머 및 주형은 표 5에 열거되어 있다. 모든 포유동물 ABE 구축물 sgRNA 플라스미드 및 박테리아 구축물을 형질전환시키고, recA-인 Mach1 T1R 컴피턴트 셀 (써모 피셔 사이언티픽)에 -80℃에서 글리세롤 스톡으로 저장하였다. 분자 생물학 등급 하이클론 물 (지이 헬스케어 라이프 사이언시스(GE Healthcare Life Sciences))을 모든 검정 및 PCR 반응에 사용하였다. 내독소 제거를 포함하는 지모퓨어 플라스미드 미디프렙 (지모 리서치 코포레이션(Zymo Research Corporation))을 사용하여 진화 실험 및 포유동물 세포 검정에 사용된 모든 벡터를 정제하였다. 진화 동안 플라스미드 유지 또는 선택을 위해 사용된 항생제는 골드 바이오테크놀로지(Gold Biotechnology)로부터 구입하였다.
박테리아 TadA* 라이브러리의 생성 (진화 라운드 1-3, 5 및 7). 간략하게, 돌연변이유발된 이. 콜라이 TadA 유전자를 함유하는 PCR 생성물 및 편집제 플라스미드의 나머지 부분 (XTEN 링커, dCas9, sgRNA, 선택 마커, 복제 기점 및 프로모터 포함)을 함유하는 PCR 생성물의 2-조각 USER 조립에 의해 박테리아 ABE 구축물의 라이브러리를 생성하였다. 구체적으로, 뮤타자임 II (애질런트 테크놀로지스(Agilent Technologies))를 제조업체의 프로토콜에 따라 사용하고 프라이머 NMG-823 및 824 (표 6)를 사용하여 75 ng-1.2 μg의 주형을 함유하는 8 x 25 μL PCR 반응물에서 출발 주형 내로 돌연변이를 도입하였다 (표 7). 증폭 후, 생성된 PCR 생성물을 풀링하고, 민엘루트 PCR 정제 키트 (퀴아젠(Qiagen))를 사용하여 폴리머라제 및 반응 완충제로부터 정제하였다. PCR 생성물을 37℃에서 2시간 동안 Dpn1 (NEB)로 처리하여 임의의 잔류 주형 플라스미드를 소화시켰다. 후속적으로 목적하는 PCR 생성물을 0.5 μg/mL 브로민화에틸마그네슘을 함유하는 1% 아가로스 겔을 사용하여 겔 전기영동에 의해 정제하였다. 퀴아퀵 겔 추출 키트 (퀴아젠)를 사용하여 겔로부터 PCR 생성물을 추출하고, 30 μL의 H2O로 용리시켰다. 겔 정제 후에, 돌연변이유발된 ecTadA DNA 단편을 프라이머 NMG-825 및 NMG-826 (표 6)에 의해 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 (8 x 50 μL PCR 반응물, 66℃ 어닐링, 20초 연장)를 사용하여 증폭시켜 적절한 USER 접합부 서열을 단편의 5' 및 3' 말단 상에 설치하였다. 생성된 PCR 생성물을 겔 전기영동에 의해 정제하였다. 다음으로, 박테리아 염기 편집제 플라스미드 주형의 백본 (표 7)을 프라이머 NMG-799 및 NMG-824 (표 6) 및 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 (98-웰 PCR 플레이트에서 웰당 100 μL, 총 5-6개의 플레이트, Tm 66℃, 4.5분 연장)를 제조업체의 프로토콜에 따라 사용하여 증폭시켰다. 각각의 PCR 반응물을 300 mL의 PB DNA 결합 완충제 (퀴아젠)와 합하고, 25 mL의 용액을 하이바인드 DNA 미디 칼럼 (오메가 바이오-테크(Omega Bio-Tek)) 상에 로딩하였다. 결합된 DNA를 5 칼럼 부피의 PE 세척 완충제 (퀴아젠)로 세척하고, DNA 단편을 칼럼당 800 μL의 H2O로 용리시켰다. 두 DNA 단편을 나노드롭 1000 분광광도계 (써모 피셔 사이언티픽)를 사용하여 정량화하였다.
TadA* 라이브러리를 이전에 보고된 USER 조립 절차49에 따라 하기 조건을 사용하여 조립하였다: 10 μL의 USER 조립 혼합물당 0.22 pmol의 ecTadA 돌연변이유발된 DNA 단편 1, 0.22 pmol의 플라스미드 백본 단편 2, 1 U의 USER (우라실-특이적 절제 시약, 뉴 잉글랜드 바이오랩스) 효소 및 1 U의 DpnI 효소 (뉴 잉글랜드 바이오랩스)를 50 mM 아세트산칼륨, 20 mM 트리스-아세테이트, 10 mM 아세트산마그네슘, 100 μg/mL BSA (pH7.9) (1x 컷스마트 완충제, 뉴 잉글랜드 바이오랩스) 중에서 합하였다. 일반적으로, 각각의 진화 라운드는 ~1 mL의 USER 조립 혼합물 (22 nmol의 각각의 DNA 조립 단편)을 필요로 하였으며, 이를 다중 8-웰 PCR 스트립에 걸쳐 10-μL 분취량으로 분배하였다. 반응물을 60분 동안 37℃로 가온한 다음, 3분 동안 80℃로 가열하여 2종의 효소를 변성시켰다. 조립 혼합물을 써모사이클러에서 0.1℃/s로 12℃로 서서히 냉각시켜 2개의 USER 접합부의 새로 생성된 말단의 어닐링을 촉진시켰다.
수동으로 구축물의 라이브러리를 사용하여, 5 부피의 PB 완충제 (퀴아젠)를 조립 반응 혼합물에 첨가하고 물질을 민엘루트 칼럼 상에 결합시킴으로서 (칼럼당 480 μL), 변성된 효소 및 반응 완충제를 조립 혼합물로부터 제거하였다. ABE 혼성화된 라이브러리 구축물을 칼럼당 30 μL의 H2O 중에 용리시키고, 2 μL의 상기 용리된 물질을 20 μL의 NEB 10-베타 전기적격 이. 콜라이에 첨가하고, 16-웰 뉴클레오큐벳 스트립에서 박테리아 프로그램 5를 사용하여 론자(Lonza) 4D-뉴클레오펙터 시스템으로 전기천공하였다. 전형적인 진화 라운드는 5-10백만개의 콜로니 형성 단위 (cfu)를 생성하기 위해 ~300회의 전기천공을 사용하였다. 새로 전기천공된 이. 콜라이를 37℃에서 200 mL의 미리-가온된 데이비스 풍부 배지 (DRM) 내에서 회수하고, 500-mL 배기 배플형 플라스크 내에서 200 rpm으로 진탕시키면서 15분 동안 인큐베이션한 후, 카르베니실린 (플라스미드 유지를 위함)을 30 μg/mL로 첨가하였다. 배양물을 200 rpm으로 진탕시키면서 37℃에서 18시간 동안인큐베이션하였다. 플라스미드 라이브러리를 칼럼당 200 μL의 미리-가온된 물 중에서 용리시키는 것을 제외하고는, 플라스미드 라이브러리를 지모퓨어 플라스미드 미디프렙 키트로 제조업체의 절차에 따라 단리하였다 (DNA 칼럼당 50 mL 배양물). 진화 라운드 1-3, 5 및 7은 이러한 절차를 따라 부차 변이를 갖는 상응하는 라이브러리를 생성하였다 (표 7).
부위-포화 박테리아 TadA* 라이브러리의 생성 (진화 라운드 4). 주형으로서 ecTadA*(2.1)-dCas9를 사용하고 적절하게 설계된 축중성 NNK-함유 프라이머를 사용하여 증폭시킴으로써 ecTadA의 Arg24, Glu25, Arg107, Ala142 및 Ala143에서의 돌연변이유발을 달성하였다 (표 6). 간략하게, ecTadA*(2.1)-dCas9 주형을 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스를 사용하여 2 세트의 프라이머: NMG-1197 + NMG-1200 및 NMG-1199 + NMG-1200으로 개별적으로 증폭시켜, 각각 PCR 생성물 1 및 PCR 생성물 2를 형성하였다. 두 PCR 생성물을 PB 결합 완충제 및 민엘루트 칼럼을 사용하여 개별적으로 정제하고, 200 μL의 PCR 반응물당 20 μL의 H2O로 용리시켰다. 제3 PCR 반응에서, 1 μL의 PCR 생성물 1 및 1 μL의 PCR 생성물 2를 외부 우라실-함유 프라이머 NMG-1202 및 NMG-1197과 조합하고, 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스에 의해 증폭시켜 플랭킹 우라실-함유 USER 접합부를 갖는 목적하는 연장-중첩 PCR 생성물을 형성하였다. 제4 PCR 반응에서, ecTadA*(2.1)-dCas9를 NMG-1201 및 NMG-1198로 증폭시켜, USER 조립을 위한 백본 DNA 단편을 생성하였다. 두 USER 조립 단편의 DpnI 소화 및 겔 정제 후에, 연장-중첩 PCR 생성물 (ecTadA 내의 목적하는 NNK 돌연변이를 함유함)을 상기 기재된 바와 같이 USER 조립에 의해 ecTadA*(2.1)-dCas9 백본 내로 혼입시켰다. 새로 생성된 NNK 라이브러리를 NEB 10-베타 전기적격 이. 콜라이 내로 형질전환시키고, DNA를 상기 기재된 바와 같이 수거하였다.
DNA-셔플링된 박테리아 TadA* 라이브러리의 생성 (진화 라운드 6). DNA 셔플링을 변형된 버전의 뉴클레오티드 교환 및 절제 기술 (NExT) DNA 셔플링 방법에 의해 달성하였다50. 각각 10 mM의 dATP, dCTP, dGTP 및 dTTP/dUTP의 용액 (3부 dUTP: 7부 dTTP)을 새로 제조하였다. 다음으로, Taq DNA 폴리머라제 (NEB), 프라이머 NMG-822 및 NMG-823 (표 6), 및 1x 써모폴 반응 완충제 (Tm 63 ℃, 1.5분 연장 시간) 중 각각 400 μM의 dATP, dCTP, dGTP 및 dUTP/dTTP (3:7)를 사용하여 등몰 농도로 진화 라운드 1-5로부터 단리된 TadA*-XTEN-dCas9 박테리아 구축물의 풀 20 fmol로부터 TadA* 단편을 증폭시켰다. 새로 생성된 우라실-함유 DNA 라이브러리 단편을 겔 전기영동에 의해 정제하고, 퀴아퀵 겔 추출 키트 (퀴아젠)로 추출하고, 칼럼당 20 μL의 H2O로 용리시켜 정제하였다. 정제된 DNA 생성물을 37℃에서 1x 컷스마트 완충제 중 40 μL당 2 U의 USER 효소로 소화시키고, 소화가 완료될 때까지 분석적 아가로스 겔 전기영동에 의해 모니터링하였다. 출발 물질이 더 이상 관찰되지 않을 때 (전형적으로 37℃에서 3-4시간) 10 부피의 PN1 결합 완충제 (퀴아젠)로 반응을 켄칭하였다. 필요한 경우에 추가의 USER 효소를 반응에 첨가하였다. 소화된 물질을 퀴아엑스II 키트 (퀴아젠)로 제조업체의 프로토콜을 사용하여 정제하고, DNA 단편을 칼럼당 50 μL의 미리-가온된 H2O 중에 용리시켰다.
정제된 셔플링된 TadA* 단편을 내부 프라이머 연장 절차에 의해 전장 TadA*-XTENdCas9 생성물로 재조립하였다. 용리된 소화된 DNA 단편 (25 μL)을 0.5 mM MgSO4가 보충된 1x 써모폴 완충제 중 4 U의 벤트 폴리머라제 (NEB), 각각 800 μM의 dATP, dCTP, dGTP 및 dTTP, 1 U의 Taq DNA 폴리머라제와 합하였다. 재조립 절차를 위한 써모사이클러 프로그램은 하기와 같다: 3분 동안 94℃, 30초 동안 92℃에서 변성의 40 사이클, 30℃에서 출발하여 사이클당 1℃ 추가되면서 증가하는 온도에서 60초에 걸쳐 어닐링 (냉각 기울기 = 1℃/초), 및 사이클당 4초 추가되면서 60초 동안 72℃에서 연장, 10분 동안 72℃의 한 최종 사이클로 종료. 재조립된 생성물을 하기 조건을 사용하여 PCR에 의해 증폭시켰다: 15 μL의 정제되지 않은 내부 조립물을 각각 1 μM의 USER 프라이머 NMG-825 및 NMG-826, 100 μL의 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스 및 H2O와 200 μL의 최종 부피로 합함, 63℃ 어닐링, 30초의 연장 시간. PCR 생성물을 겔 전기영동에 의해 정제하고, USER 방법을 사용하여 상기와 같이 USER 프라이머 NMG-799 및 NMG-824를 사용하여 백본의 증폭으로부터 생성된 상응하는 플랭킹 USER 접합부를 갖는 상응하는 ecTadA*-XTEN-dCas9 백본 내로 조립하였다. 혼성화된 라이브러리를 NEB 10-베타 전기적격 이. 콜라이 내로 형질전환시킨 후에 지모퓨어 플라스미드 미디프렙 키트를 제조업체의 절차에 따라 사용하여 진화 6 구축물의 라이브러리를 단리하였다.
TadA 변이체의 박테리아 진화. 이전에 기재된 균주 S103051을 모든 진화 실험에서 사용하였고, 각각의 진화 라운드에 특이적인 적절한 선택 플라스미드를 보유하는 전기적격 버전의 박테리아를 이전에 기재된 바와 같이49 제조하였다 (표 7). 간략하게, 상기 기재된 바와 같이 제조된 2 μL의 새로 생성된 TadA* 라이브러리 (300-600 ng/μL)를 표적 선택 플라스미드를 함유하는 새로 제조된 전기적격 S1030 세포 22 μL에 첨가하고, 16-웰 뉴클레오큐벳 스트립에서 론자 4D-뉴클레오펙터 시스템으로 박테리아 프로그램 5를 사용하여 전기천공하였다. 전형적인 선택은 5-10 x 106 cfu를 사용하였다. 전기천공 후에, 새로 형질전환된 S1030 세포를 15분 동안 200 rpm으로 진탕시키면서 37℃에서 총 250 mL의 미리-가온된 DRM 배지에서 회수하였다. 이러한 짧은 회수 인큐베이션 후에, 선택 플라스미드를 유지하기 위한 적절한 항생제와 함께, 라이브러리 플라스미드를 유지하기 위한 카르베니실린을 30 μg/mL의 최종 농도로 첨가하였으며; 각 라운드에 대해 사용된 항생제를 포함한 선택 조건의 목록에 대해서는 표 7을 참조한다. 플라스미드 유지 항생제의 첨가 직후에, 100 mM의 L-아라비노스를 배양물에 첨가하여 TadA*-dCas9 융합 라이브러리 구성원의 번역을 유도하였으며, 이는 PBAD 프로모터로부터 발현되었다. 배양물을 18시간 동안 200 rpm으로 진탕시키면서 37℃에서 포화로 성장시켰으며, 예외로 진화 라운드 5에 대한 인큐베이션 시간은 단지 7시간이었다.
1.8% 한천-2xYT, 30 μg/mL의 플라스미드 유지 항생제, 및 항생제 단독을 보유하는 S1030 균주의 MIC를 초과하도록 미리 결정된 농도의 선택 항생제 (표 8)를 함유하는 각각 4개의 500-cm2 정사각형 배양 접시 상에 10 mL의 포화 배양물을 플레이팅함으로써 라이브러리 구성원을 챌린지하였다. 플레이트를 37℃에서 2일 동안 인큐베이션하고, ~500개의 생존 콜로니를 단리하였다. 이들 콜로니로부터의 TadA* 유전자를 프라이머 NMG-822 및 NMG-823 (표 6)으로 PCR에 의해 증폭시키고, DNA 서열분석을 위해 제출하였다. 공동으로, 콜로니를 96-딥 웰 플레이트 내 1-mL DRM 배양물에 개별적으로 접종하고, 37℃, 200 r.p.m에서 밤새 성장시켰다. 각각의 밤샘 배양물의 분취물 (100 μL)을 풀링하고, 플라스미드 DNA를 단리하고, TadA* 유전자를 USER 프라이머 NMG-825 및 NMG-826 (표 6)으로 증폭시켰다. TadA* 유전자를 상기 기재된 사용자 USER 조립 프로토콜을 사용하여 플라스미드 백본 (XTEN 링커-dCas9 및 적절한 가이드 RNA를 함유함) 내로 다시 서브클로닝하였다. 이러한 풍부화된 라이브러리를 적절한 S1030 (+선택 플라스미드) 전기적격 세포 내로 형질전환시키고, 유지 항생제 및 L-Ara와 함께 인큐베이션하고, 선택 조건으로 재-챌린지하였다. 2-일 인큐베이션 후에, 300-400개의 생존 클론을 상기 기재된 바와 같이 단리하고, 그의 TadA* 유전자를 서열분석하였다. 각각의 선택 라운드로부터 발생한 돌연변이를 포유동물 ABE 구축물 내로 도입하고, 하기 기재된 바와 같이 포유동물 세포에서 시험하였다.
일반적 포유동물 세포 배양 조건. HEK293T (ATCC CRL-3216) 및 U2OS (ATTC HTB-96)를 ATCC로부터 구입하고, 10% (v/v) 태아 소 혈청 (FBS)이 보충된 둘베코 변형 이글 배지 (DMEM) 플러스 글루타맥스 (써모피셔 사이언티픽)에서 배양 및 계대배양하였다. Hap1 (호리즌 디스커버리(Horizon Discovery), C631) 및 Hap1 AAG세포 (호리즌 디스커버리, HZGHC001537c002)를 10% (v/v) FBS가 보충된 이스코브 변형 둘베코 배지 (IMDM) 플러스 글루타맥스 (써모피셔 사이언티픽)에서 유지하였다. HFE 유전자에 C282Y 돌연변이를 함유하는 림프모구성 세포주 (LCL) (코리엘 바이오레포지토리(Coriell Biorepository), GM14620)를 20% FBS가 보충된 로스웰 파크 메모리얼 인스티튜트 배지 1640 (RPMI-1640) 플러스 글루타맥스 (써모피셔 사이언티픽)에서 유지하였다. 모든 세포 유형을 인큐베이션하고, 유지하고, 37℃에서 5% CO2 하에 배양하였다.
HEK293T 조직 배양 형질감염 프로토콜 및 게놈 DNA 제조. 항생제의 부재 하에 성장시킨 HEK293T 세포를 48-웰 폴리-D-리신 코팅된 플레이트 (코닝) 상에 시딩하였다. 시딩 12-14시간 후에, 세포를 대략 70% 전면생장률에서 1.5 μL의 리포펙타민 2000 (써모 피셔 사이언티픽)을 제조업체의 프로토콜에 따라 사용하고, 750 ng의 ABE 플라스미드, 250ng의 sgRNA 발현 플라스미드 및 10 ng의 GFP 발현 플라스미드 (론자)를 사용하여 형질감염시켰다. 달리 언급되지 않는 한, 세포를 제3일에 배지 교체하면서 5일 동안 배양하였다. 배지를 제거하고, 세포를 1x PBS 용액 (써모 피셔 사이언티픽)으로 세척하고, 100 μL의 새로 제조된 용해 완충제 (10 mM 트리스-HCl, pH 7.0, 0.05% SDS, 25 μg/mL 프로테이나제 K (써모피셔 사이언티픽))를 조직 배양 플레이트의 각 웰에 직접 첨가함으로써 게놈 DNA를 추출하였다. 게놈 DNA 혼합물을 96-웰 PCR 플레이트로 옮기고, 37℃에서 1시간 동안 인큐베이션하고, 이어서 80℃ 효소 변성 단계를 30분 동안 수행하였다. 포유동물 세포 게놈 DNA 증폭에 사용된 프라이머는 표 9에 열거되어 있다.
HAP1 및 HAP1 AAG- 세포의 뉴클레오펙션 및 게놈 DNA 추출. SE 세포주 4D-뉴클레오펙터 X 키트 S를 제조업체의 프로토콜에 따라 사용하여 HAP1 및 HAP1 AAG- 세포를 뉴클레오펙션시켰다. 간략하게, 4 x 105개 세포를 4D-뉴클레오펙터 프로그램 DZ-113을 사용하여 300 ng의 ABE 플라스미드 및 100 ng의 sgRNA 발현 플라스미드로 뉴클레오펙션시키고, 48-웰 폴리-D-리신 코팅된 배양 플레이트 내 250 μL의 배지에서 3일 동안 배양하였다. 상기 기재된 바와 같이 DNA를 추출하였다.
U2OS 세포의 뉴클레오펙션 및 게놈 DNA 추출. SG 세포주 4D-뉴클레오펙터 X 키트 (론자)를 제조업체의 프로토콜에 따라 사용하여 U2OS 세포를 뉴클레오펙션시켰다. 간략하게, 1.25 x 105개 세포를 16-웰 뉴클레오큐벳 스트립에서 (웰당 20 μL의 세포) 4D-뉴클레오펙터 프로그램 EH-100을 사용하여 20 μL의 SG 완충제 중 500 ng의 ABE 플라스미드 및 100 ng의 sgRNA 발현 플라스미드로 뉴클레오펙션시켰다. 새로 뉴클레오펙션된 세포를 48-웰 폴리-D-리신 코팅된 배양 플레이트 내 250 μL의 배지 내로 옮겼다. 세포를 5일 동안 인큐베이션하고, 배지를 매일 교체하였다. 상기 기재된 바와 같이 DNA를 추출하였다.
LCL HFE C828Y 세포의 전기천공. 진 펄서 엑스셀 전기천공기 (바이오라드(BioRad)) 및 0.4 cm 갭 진 펄서 전기천공 큐벳 (바이오라드)을 사용하여 LCL 세포를 전기천공하였다. 간략하게, 1 x 107개 LCL 세포를 250 μL RPMI-160 플러스 글루타맥스 중에 재현탁시켰다. 이 배지에 ABE7.10, GFP 및 HFE 유전자 내의 C282Y 돌연변이를 표적화하는 상응하는 sgRNA를 발현하는 플라스미드 65 μg을 첨가하였다. 혼합물을 사전냉각된 0.4 cm 갭 전기천공 큐벳에 첨가하고, 세포/DNA 혼합물을 얼음 상의 큐벳 내에서 10분 동안 인큐베이션하였다. 세포를 250 V 및 950 μF에서 3 ms 동안 펄싱하였다. 세포를 얼음 상에 10분 동안 다시 옮기고, 이어서 T-75 플라스크 내 20% FBS가 보충된 사전-가온된 RPMI-160 15 mL로 옮겼다. 다음날, 추가 5 mL의 배지를 플라스크에 첨가하고, 세포를 총 5일 동안 인큐베이션되도록 하였다. 인큐베이션 후, 세포를 원심분리에 의해 단리하고, 400 μL의 배지 중에 재현탁시키고, 40 μm 스트레이너 (써모 피셔 사이언티픽)를 통해 여과하고, FACSAria III 유동 세포측정기 (벡톤 딕킨슨 바이오사이언시스(Becton Dickenson Biosciences))를 사용하여 GFP 형광에 대해 분류하였다. GFP-양성 세포를 500 μL의 배지를 함유하는 1.5-mL 튜브에 수집하였다. 원심분리 후, 배지를 제거하고, 세포를 600 μL의 1x PBS (써모 피셔 사이언티픽)로 2회 세척하였다. 게놈 DNA를 상기 기재된 바와 같이 추출하였다.
'CORRECT' 방법52을 사용하는 ABE7.10과 상동성 지정 복구 사이의 비교. 항생제의 부재하에서 성장시킨 HEK293T 세포를 48-웰 폴리-D리신 코팅된 플레이트 (코닝) 상에 시딩하였다. 12-14시간 후, 세포를 ~70% 전면생장률에서 750 ng의 Cas9 또는 염기 편집제 플라스미드, 250 ng의 sgRNA 발현 플라스미드, 1.5 μL의 리포펙타민 3000 (써모 피셔 사이언티픽), 및 HDR 검정을 위한 0.7 μg의 단일-가닥 공여자 DNA 주형 (100 nt, IDT로부터 PAGE-정제됨)을 제조업체의 지침에 따라 사용하여 형질감염시켰다. 100-량체 단일-가닥 올리고뉴클레오티드 공여자 주형은 표 10에 열거되어 있다.
아젠코트 DNA드밴스 게놈 DNA 단리 키트 (베크만 쿨터(Beckman Coulter))를 사용하여 (CORRECT 방법52의 개발 동안 문헌 [Tessier-Lavigne et al.]에 기재된 바와 같이) 형질감염 48시간 후에 게놈 DNA를 수거하였다. 크기-선택적 DNA 단리 단계는 후속 PCR 증폭 및 서열분석 단계에서 단일 가닥 공여자 DNA 주형에 의한 오염의 위험이 없도록 보장하였다. 공여자 올리고 주형 증폭의 위험이 최소이도록 보장하기 위해 증폭 프라이머를 재-설계하였다.
게놈 DNA 샘플의 고처리량 DNA 서열분석 (HTS). 관심 영역 및 적절한 일루미나 정방향 및 역방향 어댑터에 대한 상동성을 함유하는 프라이머 (표 9)를 사용하여 PCR에 의해 관심 게놈 부위를 증폭시켰다. 이러한 연구에서 논의된 모든 게놈 부위에 대한 제1 라운드의 PCR (PCR 1)에서 사용된 프라이머 쌍을 표 9에서 찾아볼 수 있다. 구체적으로, 0.5 μM의 각각의 정방향 및 역방향 프라이머, 1 μL의 게놈 DNA 추출물 및 12.5 μL의 퓨션 U 그린 멀티플렉스 PCR 마스터 믹스를 함유하는 25 μL의 주어진 PCR 1 반응물을 조립하였다. PCR 반응을 하기와 같이 수행하였다: 95℃에서 2분 동안, 이어서 [95℃에서 15초 동안, 62℃에서 20초 동안 및 72℃에서 20초 동안]의 30 사이클, 이어서 2분 동안 최종 72℃ 연장. 브로민화에티듐이 보충된 2% 아가로스 겔 상에서 DNA 표준물 (퀵-로드 100 bp DNA 래더)과의 비교에 의해 PCR 생성물을 검증하였다. 2차 PCR 반응 (PCR 2)에서 각각의 샘플에 고유한 일루미나 바코딩 프라이머 쌍을 첨가하였다. 구체적으로, 0.5 μM의 각각의 고유한 정방향 및 역방향 일루미나 바코딩 프라이머 쌍, 2 μL의 비정제된 PCR 1 반응 혼합물 및 12.5 μL의 Q5 핫 스타트 하이-피델리티 2x 마스터 믹스를 함유하는 25 μL의 주어진 PCR 2 반응물을 조립하였다. 바코딩 PCR 2 반응을 하기와 같이 수행하였다: 95℃에서 2분 동안, 이어서 [95℃에서 15초 동안, 61℃에서 20초 동안 및 72℃에서 20초 동안]의 15 사이클, 이어서 2분 동안 최종 72℃ 연장. 퀴아퀵 겔 추출 키트를 사용하여 2% 아가로스 겔에서 30 μL의 H2O로 용리시키면서 전기영동하여 PCR 생성물을 정제하였다. DNA 농도를 KAPA 라이브러리 정량화 키트-일루미나 (카파 바이오시스템즈(KAPA Biosystems))로 정량화하고, 일루미나 MiSeq 기기 상에서 제조업체의 프로토콜에 따라 서열분석하였다.
일반적 HTS 데이터 분석. 서열분석 판독물을 MiSeq 리포터 (일루미나)에서 디멀티플렉싱하였다. 개선된 출력 포맷을 갖는 매트랩 스크립트 (보충 노트 1)를 사용하여 이전에 기재된 바와 같이 앰플리콘 서열의 참조 서열에 대한 정렬을 수행하였다. 간략하게, 스미스-워터맨 알고리즘을 사용하여 삽입결실이 없는 서열을 참조 서열에 대해 정렬하고; 30 미만의 품질 점수를 갖는 염기를 'N'으로 전환시켜 서열분석 오류의 결과로서의 염기 오호출을 방지하였다. 품질 점수 Q30 미만의 염기 호출의 절반 초과를 갖는 서열분석 판독물을 필터링하는 변형된 버전의 이전에 기재된 매트랩 스크립트 (보충 노트 2)를 사용하여 삽입결실을 개별적으로 정량화하였다. 예측된 Cas9 절단 부위를 둘러싸는 30-bp 윈도우 내에서 1 bp 이상의 삽입 또는 결실을 함유한 판독물로서 삽입결실을 카운팅하였다.
HBG1 및 HBG2 유전자좌에서의 상동성으로 인해, 단일 PCR 반응 내에서 두 유전자좌를 증폭시킬 프라이머를 설계하였다. 이들 2개의 게놈 부위의 서열을 계산상 분리시키기 위해, 이러한 앰플리콘을 포함하는 서열분석 실험을 개별 파이톤 스크립트 (보충 노트 3)를 사용하여 프로세싱하였다. 간략하게, 염기 호출의 절반 초과가 Q30 미만이고, Q30 미만의 품질 점수를 갖는 염기 호출이 'N'으로 전환된 경우에 판독물을 무시하였다. 부위들 사이에 상이한 2개의 SNP를 함유하는 37-bp 서열에 대해 정확한 매치를 갖는 것으로 HBG1 또는 HBG2 판독물을 확인하였다. 프로토스페이서 서열에 중심을 둔 43-bp 윈도우의 양측 상의 10-bp 플랭킹 서열에 대한 정확한 매치에 의해 염기 호출 및 삽입결실 윈도우를 규정하였다. 이러한 염기 호출 윈도우가 ≥ 1 bp 상이한 길이인 판독물로서 삽입결실을 카운팅하였다. 이러한 파이톤 스크립트는 동일한 품질 (추정된 염기 호출 오류율 1,000개 중 < 1개)을 갖는 출력을 산출하지만, 정렬 단계의 부재로 인해 훨씬 더 짧은 시간 안에 이루어진다.
편집된 판독물의 총수를 성공적으로 서열분석된 판독물의 총수의 비율로서 계산하기 위해, 정렬 알고리즘에 의해 측정된 바와 같은 편집된 판독물의 분율에 [1 - 삽입결실을 함유하는 판독물의 분율]을 곱하였다.
연관 불평형 분석. 맞춤 파이톤 스크립트 (보충 노트 4)를 사용하여 1차 표적 A (P1), 2차 표적 A (P2) 및 1차 및 2차 표적 A 둘 다 (P1,2)에서의 편집 확률을 평가하였다. 이어서 연관 불평형 (LD)을 P1,2 - (P1 x P2)로서 평가하였다. LD 값을 Min(P1(1 - P2), (1 - P1)P2)의 정규화 인자로 정규화하였다. 이러한 정규화는 대립유전자 빈도를 제어하고 0 내지 1의 정규화된 LD 값을 산출한다.
실시예 7 - 인간 질환, 예컨대 겸상 적혈구 질환 및 베타-지중해빈혈을 치료하기 위한 HBG1/2 프로모터 내 ABE-매개된 돌연변이 설치
도 15에 나타낸 sgRNA는 성인에서 태아성 헤모글로빈 상향조절을 부여하는 공지된 돌연변이 또는 그 근처의 부위에 주로 초점이 맞추어진 HBG1/2 프로모터 내의 부위를 표적화한다. ABE7.10 및 개별 sgRNA 플라스미드 (750ng의 편집제, 250ng의 가이드)를 HEK293T 세포 내로 리포펙션시켰다. HEK293T 세포에서 3일의 발현 후에, 배지를 흡인하고, 신선한 배지를 첨가하였다. 2일의 성장 후에, DNA를 추출하였다. PCR을 수행하여 HBG1/2 프로모터 영역을 증폭시켰다. 일루미나 MiSeq를 사용하여 PCR 생성물을 서열분석하고, 각각의 샘플에 대해 편집을 정량화하였다. 도 15에 나타낸 가이드로 처리된 세포에 대한 윈도우 내에서 관찰된 최고 편집이 플롯팅되어 있다. 이들 결과는 성인에서 태아성 헤모글로빈을 상향조절할 수 있는 돌연변이가 도입될 수 있다는 것을 확립시켜 준다. 이러한 돌연변이의 도입은 겸상 적혈구 질환 및 베타 지중해빈혈에 치료적일 수 있다.
참고문헌
Figure pct00133
Figure pct00134
Figure pct00135
Figure pct00136
표 1. 비처리 HEK293T 세포 및 17개의 게놈 부위에서 ABE6.3, ABE7.8, ABE7.9 또는 ABE7.10으로 처리되고 상응하는 sgRNA 발현 플라스미드로 공동-형질감염된 HEK293T 세포의 HTS 서열분석 결과 및 %삽입결실. 하나의 임의적으로 선택된 복제물이 제시되어 있고; 모든 복제물에 대한 데이터는 NCBI 서열분석 판독물 아카이브로부터 입수가능하다.
Figure pct00137
Figure pct00138
Figure pct00139
Figure pct00140
Figure pct00141
Figure pct00142
Figure pct00143
Figure pct00144
Figure pct00145
Figure pct00146
Figure pct00147
Figure pct00148
Figure pct00149
Figure pct00150
Figure pct00151
Figure pct00152
Figure pct00153
표 2. 에스. 피오게네스 Cas9 뉴클레아제에 대해 이전에 특징화된 HEK2 온-타겟 및 오프-타겟 부위에서의 ABE7.8, ABE7.9 및 ABE7.10의 활성.1
Figure pct00154
표 3. 에스. 피오게네스 Cas9 뉴클레아제에 의한 온-타켓 및 오프-타겟 변형에 대해 이전에 특징화된 HEK3 부위에서의 ABE7.8, ABE7.9 및 ABE7.10의 활성.1
Figure pct00155
표 4. 에스. 피오게네스 Cas9 뉴클레아제에 의한 온-타겟 및 오프-타겟 변형에 대해 이전에 특징화된 HEK4 부위에서의 ABE7.8, ABE7.9 및 ABE7.10의 활성.1 HEK4 오프-타겟 부위 3은 ABE 처리시 상당한 삽입결실 형성을 나타냈지만, 이러한 유전자좌는 또한 Cas9 뉴클레아제에 의해 비통상적으로 높은 (89%) 삽입결실 형성을 나타냈고, Cas9 니카제로의 처리시에 삽입결실 형성을 나타내는 유일한 시험된 오프-타겟 부위였다. 이러한 유전자좌는 비통상적으로 취약하고, 여기서의 삽입결실 형성은 ABE-매개된 아데닌 탈아미노화보다는 단순히 부위의 니킹으로부터 발생한 것으로 추측된다.
Figure pct00156
표 5. sgRNA 플라스미드를 생성하는데 사용된 프라이머. 20-nt 표적 프로토스페이서가 적색으로 제시되어 있다. 표적 DNA 서열이 'G'로 시작되지 않은 경우에는, 인간 U6 프로모터가 전사 개시 부위에 'G'를 선호하기 때문에 프라이머의 5' 말단에 'G'를 부가하였다2-4. 이전에 기재된 pFYF sgRNA 플라스미드5를 PCR 증폭을 위한 주형으로서 사용하였다.
Figure pct00157
표 6. 박테리아 TadA* 라이브러리를 생성하는데 사용된 프라이머.
Figure pct00158
표 7. 이. 콜라이에서 각 라운드의 TadA* 돌연변이유발 및 선택에 사용된 출발 구축물. 모든 플라스미드는 SC101 복제 기점, 카르베니실린에 의한 플라스미드 유지를 위한 β-락타마제 유전자, TadA*-dCas9 발현을 구동하는 PBAD 프로모터 및 sgRNA 전사를 구동하는 lac 프로모터를 함유한다. 박테리아 선택 동안 사용된 염기 편집제의 아키텍처는 TadA*-링커(16 aa)-dCas9이다.
Figure pct00159
표 8. 항생제 선택 플라스미드 및 그의 상응하는 이. 콜라이 항생제 최소 억제 농도 (MIC).
Figure pct00160
표 9. 포유동물 세포 게놈 DNA 증폭에 사용된 프라이머.
Figure pct00161
Figure pct00162
표 10. HDR 실험에 사용된 100-량체 단일-가닥 올리고뉴클레오티드 공여자 주형 (ssODN).
Figure pct00163
보충 서열 1. 본 연구에 사용된 아데닌 데아미나제의 DNA 서열.
박테리아 코돈-최적화된 ecTadA (야생형):
Figure pct00164
포유동물 코돈-최적화된 ecTadA (야생형):
Figure pct00165
포유동물 코돈-최적화된 mADA:
Figure pct00166
포유동물 코돈 최적화된 hADAR2 (촉매 도메인):
Figure pct00167
포유동물 코돈 최적화된 hADAT2:
Figure pct00168
보충 서열 2. 본 연구에 사용된 항생제 내성 유전자의 DNA 서열. 불활성화 돌연변이는 볼드체로 제시된다.
클로람페니콜 내성 유전자 (CamR) H193Y:
Figure pct00169
카나마이신 내성 유전자 (KanR) Q4정지 및 W15정지:
Figure pct00170
스펙티노마이신 내성 유전자 (SpectR) T89I:
Figure pct00171
카나마이신 내성 유전자 (KanR) Q4정지 및 D208N:
Figure pct00172
보충 노트 1. 염기 호출을 위한 매트랩 스크립트.
Figure pct00173
Figure pct00174
Figure pct00175
Figure pct00176
보충 노트 2. 삽입결실 분석을 위한 매트랩 스크립트.
Figure pct00177
Figure pct00178
Figure pct00179
보충 노트 3. HBG1 및 HBG2 염기 편집 및 삽입결실의 분석을 위한 파이톤 스크립트.
Figure pct00180
Figure pct00181
Figure pct00182
Figure pct00183
Figure pct00184
Figure pct00185
Figure pct00186
Figure pct00187
Figure pct00188
등가물 및 범주, 참조로 포함
관련 기술분야의 통상의 기술자는 상용 실험에 지나지 않는 것을 사용하여, 본원에 기재된 본 발명의 구체적 실시양태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 본 발명의 범주는 상기 설명에 제한되도록 의도된 것은 아니며, 오히려 첨부된 청구범위에 제시된 바와 같다.
청구범위에서 단수표현은 달리 나타내지 않는 한 또는 달리 문맥으로부터 명백하지 않는 한 하나 또는 하나 초과를 의미할 수 있다. 군의 하나 이상의 구성원들 사이에 "또는"을 포함하는 청구범위 또는 설명은 달리 나타내지 않는 한 또는 달리 문맥으로부터 명백하지 않는 한 군 구성원 중 하나, 하나 초과 또는 모두가 주어진 생성물 또는 공정에 존재하거나, 그에 사용되거나, 또는 그와 달리 관련되어 있는 경우에 충족된 것으로 간주된다. 본 발명은 군의 정확하게 하나의 구성원이 주어진 생성물 또는 공정에 존재하거나, 그에 사용되거나, 또는 그와 달리 관련되어 있는 실시양태를 포함한다. 본 발명은 또한 군 구성원의 하나 초과 또는 모두가 주어진 생성물 또는 공정에 존재하거나, 그에 사용되거나, 또는 그와 달리 관련되어 있는 실시양태를 포함한다.
추가로, 본 발명은 하나 이상의 청구항 또는 명세서의 관련 부분으로부터의 하나 이상의 제한, 요소, 절, 서술적 용어 등이 또 다른 청구항 내에 도입되는 모든 변동, 조합 및 순열을 포괄하는 것으로 이해될 것이다. 예를 들어, 또 다른 청구항에 대해 종속항인 임의의 청구항은 동일 기반 청구항에 대해 종속항인 임의의 다른 청구항에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 추가로, 청구항이 조성물을 인용하는 경우에, 달리 나타내지 않거나 또는 모순 또는 불일치가 발생할 것임이 관련 기술분야의 통상의 기술자에게 분명하지 않는 한, 본원에 개시된 임의의 목적을 위해 상기 조성물을 사용하는 방법이 포함되고, 본원에 개시된 임의의 제조 방법 또는 관련 기술분야에 공지된 다른 방법에 따라 상기 조성물을 제조하는 방법이 포함되는 것으로 이해될 것이다.
요소들이, 예를 들어 마쿠쉬 군 포맷의 목록으로서 제시되는 경우에, 요소의 각각의 하위군이 또한 개시되고, 임의의 요소(들)가 이러한 군으로부터 제거될 수 있는 것으로 이해될 것이다. 또한 용어 "포함하는"은 개방된 것을 의도하고 추가의 요소 또는 단계의 포함을 허용한다는 것에 주의한다. 일반적으로, 본 발명 또는 본 발명의 측면이 특정한 요소, 특색, 단계 등을 포함하는 것으로 언급된 경우, 본 발명 또는 본 발명의 측면의 특정 실시양태가 그러한 요소, 특색, 단계 등으로 이루어지거나 본질적으로 이루어지는 것으로 이해되어야 한다. 단순성의 목적을 위해, 그 실시양태는 본원에 구체적으로 제시되지 않았다. 따라서, 하나 이상의 요소, 특색, 단계 등을 포함하는 본 발명의 각각의 실시양태에 대해, 본 발명은 또한 그 요소, 특색, 단계 등으로 이루어지거나 본질적으로 이루어지는 실시양태를 제공한다.
범위가 주어진 경우, 종점들이 포함된다. 추가로, 달리 나타내지 않는 한 또는 달리 문맥 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 문맥이 달리 명백하게 지시하지 않는 한 본 발명의 상이한 실시양태에서 언급된 범위 내에 있는 임의의 특정 값을 상기 범위의 하한치의 단위의 10분의 1로 취할 수 있는 것으로 이해될 것이다. 달리 나타내지 않는 한 또는 달리 문맥 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 주어진 범위 내에 있는 임의의 하위범위를 취할 수 있며, 여기서 하위범위의 종점은 상기 범위의 하한치의 단위의 10분의 1과 동일한 정도의 정확도로 표현되는 것으로 또한 이해될 것이다.
추가로, 본 발명의 임의의 특정한 실시양태는 어느 하나 이상의 청구항으로부터 명백하게 배제될 수 있는 것으로 이해될 것이다. 범위가 주어지는 경우에, 범위 내에 있는 임의의 값은 어느 하나 이상의 청구항으로부터 명백하게 배제될 수 있다. 본 발명의 조성물 및/또는 방법의 임의의 실시양태, 요소, 특색, 적용 또는 측면은 어느 하나 이상의 청구항으로부터 배제될 수 있다. 간결성의 목적을 위해, 하나 이상의 요소, 특색, 목적 또는 측면이 배제된 모든 실시양태는 본원에 명백하게 제시되지 않는다.
상기 열거된 항목을 포함한, 본원에 언급된 모든 공개물, 특허 및 서열 데이터베이스 목록은 마치 각각의 개별 공개물 또는 특허가 구체적으로 및 개별적으로 참조로 포함되는 것으로 나타내어진 바와 같이 그 전문이 본원에 참조로 포함된다. 상충되는 경우에, 본원의 임의의 정의를 포함한 본 출원이 우선할 것이다.
SEQUENCE LISTING <110> The Broad Institute, Inc. President and Fellows of Harvard College Beam Therapeutics Inc. <120> USES OF ADENOSINE BASE EDITORS <130> B1195.70048WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 62/573,127 <151> 2017-10-16 <160> 871 <170> PatentIn version 3.5 <210> 1 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 1 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp 165 <210> 2 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 2 gtggggaagg ggcccccaag agg 23 <210> 3 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 3 tatacgtacc aggtggagca cccagg 26 <210> 4 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 4 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 5 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 5 Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys 1 5 10 15 Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys 20 25 30 <210> 6 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 6 cctcttgggg gccccttccc cacacta 27 <210> 7 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 7 cctcttgggg gccccttccc cacact 26 <210> 8 <211> 160 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 8 Met Gly Ser His Met Thr Asn Asp Ile Tyr Phe Met Thr Leu Ala Ile 1 5 10 15 Glu Glu Ala Lys Lys Ala Ala Gln Leu Gly Glu Val Pro Ile Gly Ala 20 25 30 Ile Ile Thr Lys Asp Asp Glu Val Ile Ala Arg Ala His Asn Leu Arg 35 40 45 Glu Thr Leu Gln Gln Pro Thr Ala His Ala Glu His Ile Ala Ile Glu 50 55 60 Arg Ala Ala Lys Val Leu Gly Ser Trp Arg Leu Glu Gly Cys Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Thr Ile Val Met 85 90 95 Ser Arg Ile Pro Arg Val Val Tyr Gly Ala Asp Asp Pro Lys Gly Gly 100 105 110 Cys Ser Gly Ser Leu Met Asn Leu Leu Gln Gln Ser Asn Phe Asn His 115 120 125 Arg Ala Ile Val Asp Lys Gly Val Leu Lys Glu Ala Cys Ser Thr Leu 130 135 140 Leu Thr Thr Phe Phe Lys Asn Leu Arg Ala Asn Lys Lys Ser Thr Asn 145 150 155 160 <210> 9 <211> 161 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 9 Met Thr Gln Asp Glu Leu Tyr Met Lys Glu Ala Ile Lys Glu Ala Lys 1 5 10 15 Lys Ala Glu Glu Lys Gly Glu Val Pro Ile Gly Ala Val Leu Val Ile 20 25 30 Asn Gly Glu Ile Ile Ala Arg Ala His Asn Leu Arg Glu Thr Glu Gln 35 40 45 Arg Ser Ile Ala His Ala Glu Met Leu Val Ile Asp Glu Ala Cys Lys 50 55 60 Ala Leu Gly Thr Trp Arg Leu Glu Gly Ala Thr Leu Tyr Val Thr Leu 65 70 75 80 Glu Pro Cys Pro Met Cys Ala Gly Ala Val Val Leu Ser Arg Val Glu 85 90 95 Lys Val Val Phe Gly Ala Phe Asp Pro Lys Gly Gly Cys Ser Gly Thr 100 105 110 Leu Met Asn Leu Leu Gln Glu Glu Arg Phe Asn His Gln Ala Glu Val 115 120 125 Val Ser Gly Val Leu Glu Glu Glu Cys Gly Gly Met Leu Ser Ala Phe 130 135 140 Phe Arg Glu Leu Arg Lys Lys Lys Lys Ala Ala Arg Lys Asn Leu Ser 145 150 155 160 Glu <210> 10 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 10 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1 5 10 15 <210> 11 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 11 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 12 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 12 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 13 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 13 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Gly Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 14 <211> 1561 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 14 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Val Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 15 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 15 cctcttgggg gccccttccc cacac 25 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 16 cctcttgggg gccccttccc caca 24 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 17 cctcttgggg gccccttccc cac 23 <210> 18 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 18 cctcttgggg gccccttccc ca 22 <210> 19 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 19 cctcttgggg gccccttccc c 21 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 20 cctcttgggg gccccttccc 20 <210> 21 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 21 cctgggtgct ccacctggta cgtatat 27 <210> 22 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 22 cctgggtgct ccacctggta cgtata 26 <210> 23 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 23 cctgggtgct ccacctggta cgtat 25 <210> 24 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 24 cctgggtgct ccacctggta cgta 24 <210> 25 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 25 cctgggtgct ccacctggta cgt 23 <210> 26 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 26 cctgggtgct ccacctggta cg 22 <210> 27 <211> 1550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 27 Met Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp 1550 <210> 28 <211> 1550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> misc_feature <222> (155)..(155) <223> Xaa can be any naturally occurring amino acid <400> 28 Met Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Xaa Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser 165 170 175 Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 180 185 190 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 195 200 205 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 210 215 220 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 225 230 235 240 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 245 250 255 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 260 265 270 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 275 280 285 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 290 295 300 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 305 310 315 320 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 325 330 335 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 340 345 350 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 355 360 365 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 370 375 380 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 385 390 395 400 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 405 410 415 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 420 425 430 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 435 440 445 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 450 455 460 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 465 470 475 480 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 485 490 495 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 500 505 510 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 515 520 525 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 530 535 540 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 545 550 555 560 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 565 570 575 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 580 585 590 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 595 600 605 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 610 615 620 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 625 630 635 640 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 645 650 655 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 660 665 670 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 675 680 685 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 690 695 700 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 705 710 715 720 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 725 730 735 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 740 745 750 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 755 760 765 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 770 775 780 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 785 790 795 800 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 805 810 815 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 820 825 830 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 835 840 845 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 850 855 860 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 865 870 875 880 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 885 890 895 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 900 905 910 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 915 920 925 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 930 935 940 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 945 950 955 960 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 965 970 975 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 980 985 990 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 995 1000 1005 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile 1010 1015 1020 Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val 1025 1030 1035 Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro 1040 1045 1050 Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu 1055 1060 1065 Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr 1070 1075 1080 Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe 1085 1090 1095 Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val 1100 1105 1110 Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn 1115 1120 1125 Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 1130 1135 1140 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 1145 1150 1155 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala 1160 1165 1170 Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser 1175 1180 1185 Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met 1190 1195 1200 Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr 1205 1210 1215 Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr 1220 1225 1230 Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn 1235 1240 1245 Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala 1250 1255 1260 Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys 1265 1270 1275 Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu 1280 1285 1290 Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp 1295 1300 1305 Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr 1310 1315 1320 Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys 1325 1330 1335 Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg 1340 1345 1350 Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly 1355 1360 1365 Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 1370 1375 1380 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1385 1390 1395 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys 1400 1405 1410 Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys 1415 1420 1425 Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln 1430 1435 1440 His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe 1445 1450 1455 Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu 1460 1465 1470 Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala 1475 1480 1485 Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro 1490 1495 1500 Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr 1505 1510 1515 Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser 1520 1525 1530 Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly 1535 1540 1545 Gly Asp 1550 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 29 cctgggtgct ccacctggta c 21 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 30 cctgggtgct ccacctggta 20 <210> 31 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 31 atgtctgaag tcgaatttag ccacgaatac tggatgcgtc acgcgctgac gctggcgaaa 60 cgtgcctggg atgagcggga agtgccggtc ggcgcggtat tagtgcataa caatcgggta 120 atcggcgaag gctggaaccg cccgattggt cgccatgatc ccaccgcaca tgcagaaatc 180 atggccctgc ggcagggtgg tctggtgatg caaaattatc gtctgatcga cgccacgttg 240 tatgtcacgc ttgaaccatg tgtaatgtgt gccggagcga tgatccacag tcgcattggt 300 cgcgtggtct ttggtgcgcg tgacgcgaaa actggcgctg cgggatcttt aatggatgtg 360 ctgcatcatc cgggtatgaa tcaccgagtg gaaattacgg aaggaatact ggcggatgag 420 tgcgcggcgt tgctcagtga cttctttcgc atgcgccgcc aggaaattaa agcgcagaaa 480 aaagcgcaat cctcgacgga t 501 <210> 32 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 32 atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60 agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120 atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180 atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240 tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300 cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360 ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420 tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480 aaagcacaat cctctactga c 501 <210> 33 <211> 1056 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 33 atggcccaga cacccgcatt caacaaaccc aaagtagagt tacacgtcca cctggatgga 60 gccatcaagc cagaaaccat cttatacttt ggcaagaaga gaggcatcgc cctcccggca 120 gatacagtgg aggagctgcg caacattatc ggcatggaca agcccctctc gctcccaggc 180 ttcctggcca agtttgacta ctacatgcct gtgattgcgg gctgcagaga ggccatcaag 240 aggatcgcct acgagtttgt ggagatgaag gcaaaggagg gcgtggtcta tgtggaagtg 300 cgctatagcc cacacctgct ggccaattcc aaggtggacc caatgccctg gaaccagact 360 gaaggggacg tcacccctga tgacgttgtg gatcttgtga accagggcct gcaggaggga 420 gagcaagcat ttggcatcaa ggtccggtcc attctgtgct gcatgcgcca ccagcccagc 480 tggtcccttg aggtgttgga gctgtgtaag aagtacaatc agaagaccgt ggtggctatg 540 gacttggctg gggatgagac cattgaagga agtagcctct tcccaggcca cgtggaagcc 600 tatgagggcg cagtaaagaa tggcattcat cggaccgtcc acgctggcga ggtgggctct 660 cctgaggttg tgcgtgaggc tgtggacatc ctcaagacag agagggtggg acatggttat 720 cacaccatcg aggatgaagc tctctacaac agactactga aagaaaacat gcactttgag 780 gtctgcccct ggtccagcta cctcacaggc gcctgggatc ccaaaacgac gcatgcggtt 840 gttcgcttca agaatgataa ggccaactac tcactcaaca cagacgaccc cctcatcttc 900 aagtccaccc tagacactga ctaccagatg accaagaaag acatgggctt cactgaggag 960 gagttcaagc gactgaacat caacgcagcg aagtcaagct tcctcccaga ggaagagaag 1020 aaggaacttc tggaacggct ctacagagaa taccaa 1056 <210> 34 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 34 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 35 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 35 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 36 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 36 Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 37 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (5)..(120) <223> May be absent <400> 37 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 1 5 10 15 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 35 40 45 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 65 70 75 80 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 85 90 95 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 100 105 110 Ser Gly Gly Ser Ser Gly Gly Ser 115 120 <210> 38 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (5)..(120) <223> May be absent <400> 38 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 20 25 30 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 35 40 45 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 50 55 60 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 85 90 95 Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser 100 105 110 Gly Gly Gly Ser Gly Gly Gly Ser 115 120 <210> 39 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (6)..(150) <400> 39 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 50 55 60 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 65 70 75 80 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 85 90 95 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 100 105 110 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 115 120 125 Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly 130 135 140 Ser Gly Gly Gly Gly Ser 145 150 <210> 40 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (6)..(150) <400> 40 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 1 5 10 15 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 20 25 30 Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala 35 40 45 Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 50 55 60 Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys 65 70 75 80 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 85 90 95 Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala 100 105 110 Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala 115 120 125 Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 130 135 140 Lys Glu Ala Ala Ala Lys 145 150 <210> 41 <211> 1209 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 41 atgcatctcg atcaaacccc gagccgccaa ccaatcccga gtgaaggcct gcaactgcat 60 ctgccacaag ttctggcgga tgccgttagc cgcctggtct tgggtaagtt cggtgatctg 120 acagacaact tttctagtcc acatgctcgc cgtaaggtgc tggctggcgt tgtgatgacc 180 acaggtacag acgtcaaaga tgctaaagtg atttctgtgt ctactggcac gaagtgcatt 240 aacggcgaat atatgtctga ccgtggctta gcgcttaacg attgtcatgc cgaaatcatc 300 tcccgtcgtt cattgcttcg cttcctgtac acgcagttgg aactgtatct gaataacaaa 360 gacgatcaga agcgttctat tttccagaag tctgagcgcg gcgggttccg tcttaaagag 420 aatgtgcagt ttcaccttta tatttcaacc tctccttgtg gtgatgcccg tattttttca 480 ccacacgaac ctattttaga ggaaccggcc gatcgtcatc cgaaccgcaa agcccgtggg 540 cagctgcgta cgaaaatcga atcaggtgaa ggcaccattc ccgtccgctc caatgcgagc 600 attcaaacgt gggacggtgt gttacagggc gaacgcctgt taaccatgag ctgctcagac 660 aaaattgcac gttggaacgt ggtaggcatc cagggctcgt tattgagcat tttcgtggag 720 ccgatttatt ttagttccat cattttgggc tcactctacc acggcgatca ccttagccgc 780 gcgatgtacc agcgcattag taacatcgaa gatttaccgc ccctgtatac cctgaacaaa 840 ccactgttaa gcggtatttc taacgcggag gcgcgtcagc ctggtaaagc cccgaacttc 900 agtgtgaact ggactgtggg tgattctgca attgaggtaa ttaacgcgac gacgggtaaa 960 gatgaactgg gccgtgcctc tcgtctgtgt aaacacgcgc tgtactgtcg ttggatgcgc 1020 gtgcacggta aagttcccag tcatctgtta cgtagcaaga tcaccaagcc aaatgtctac 1080 cacgaatcga agctggccgc gaaagaatac caagcggcta aggcgcgtct gttcaccgcc 1140 tttattaagg ctggcttagg ggcctgggtg gaaaaaccaa ccgagcaaga tcaattcagt 1200 ctgaccccg 1209 <210> 42 <211> 573 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 42 atggaggcga aggcggcacc caagccagct gcaagcggcg cgtgctcggt gtcggcagag 60 gagaccgaaa agtggatgga ggaggcgatg cacatggcca aagaagccct cgaaaatact 120 gaagttcctg ttggctgtct tatggtctac aacaatgaag ttgtagggaa ggggagaaat 180 gaagttaacc aaaccaaaaa tgctactcga catgcagaaa tggtggccat cgatcaggtc 240 ctcgattggt gtcgtcaaag tggcaagagt ccctctgaag tatttgaaca cactgtgttg 300 tatgtcactg tggagccgtg cattatgtgt gcagctgctc tccgcctgat gaaaatcccg 360 ctggttgtat atggctgtca gaatgaacga tttggtggtt gtggctctgt tctaaatatt 420 gcctctgctg acctaccaaa cactgggaga ccatttcagt gtatccctgg atatcgggct 480 gaggaagcag tggaaatgtt aaagaccttc tacaaacaag aaaatccaaa tgcaccaaaa 540 tcgaaagttc ggaaaaagga atgtcagaaa tct 573 <210> 43 <211> 660 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 43 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 60 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggagttcc gtatggcaat gaaagacggt 240 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 300 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 360 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 420 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 480 gccaatatgg acaacttctt cgcccccgtt ttcactatgg gcaaatatta tacgcaaggc 540 gacaaggtgc tgatgccgct ggccatccag gtgcactacg ccgtatgcga cggcttccat 600 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 660 <210> 44 <211> 795 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 44 atgatcgaat aagatggatt gcacgcaggt tctccggccg cttaggtgga gcgcctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 300 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 360 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 420 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 480 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 540 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 600 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 660 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 720 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 780 gacgagttct tctaa 795 <210> 45 <211> 792 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 45 atgagggaag cggtgatcgc cgaagtatcg actcaactat cagaggtagt tggcgtcatc 60 gagcgccatc tcgaaccgac gttgctggcc gtacatttgt acggctccgc agtggatggc 120 ggcctgaagc cacacagtga tattgatttg ctggttacgg tgaccgtaag gcttgatgaa 180 acaacgcggc gagctttgat caacgacctt ttggaaactt cggcttcccc tggagagagc 240 gagattctcc gcgctgtaga agtcatcatt gttgtgcacg acgacatcat tccgtggcgt 300 tatccagcta agcgcgaact gcaatttgga gaatggcagc gcaatgacat tcttgcaggt 360 atcttcgagc cagccacgat cgacattgat ctggctatct tgctgacaaa agcaagagaa 420 catagcgttg ccttggtagg tccagcggcg gaggaactct ttgatccggt tcctgaacag 480 gatctatttg aggcgctaaa tgaaacctta acgctatgga actcgccgcc cgactgggct 540 ggcgatgagc gaaatgtagt gcttacgttg tcccgcattt ggtacagcgc agtaaccggc 600 aaaatcgcgc cgaaggatgt cgctgccgac tgggcaatgg agcgcctgcc ggcccagtat 660 cagcccgtca tacttgaagc tagacaggct tatcttggac aagaagaaga tcgcttggcc 720 tcgcgcgcag atcagttgga agaatttgtc cactacgtga aaggcgagat caccaaggta 780 gtcggcaaat aa 792 <210> 46 <211> 815 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 46 atgatcgaat aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 60 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 120 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 180 caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 240 ctcgacgttg tcactgaagc gggaagggac tggctgctat agccggccac agttaatgaa 300 tgggcgaagt gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat 360 ccatcatggc tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg 420 accaccaagc gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg 480 atcaggatga tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc 540 tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc 600 cgaatatcat ggtggaaaat ggccgctttt ctggattcat taactgtggc cggctgggtg 660 tggcggaccg ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg 720 gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca 780 tcgccttcta tcgccttctt gacgagttct tctaa 815 <210> 47 <211> 4104 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 47 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg attataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg gcagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggcag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa atctacaatc aattatttga agaaaaccct 600 attaacgcaa gtagagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga gaaatggctt gtttgggaat 720 ctcattgctt tgtcattggg attgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatagt gaaataacta aggctcccct atcagcttca 960 atgattaagc gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgagggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggcgcct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agataggggg atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga tattcaaaaa gcacaggtgt ctggacaagg ccatagttta 2160 catgaacaga ttgctaactt agctggcagt cctgctatta aaaaaggtat tttacagact 2220 gtaaaaattg ttgatgaact ggtcaaagta atggggcata agccagaaaa tatcgttatt 2280 gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340 aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400 gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctacaaaa tggaagagac 2460 atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520 gttccacaaa gtttcattaa agacgattca atagacaata aggtactaac gcgttctgat 2580 aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640 tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700 aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760 gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820 aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880 ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940 catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000 ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060 attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120 atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180 ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240 acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300 acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360 cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420 tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480 gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540 ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600 agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660 aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720 tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780 cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840 ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900 atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960 gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020 gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080 ttgagtcagc taggaggtga ctga 4104 <210> 48 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 48 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu 705 710 715 720 His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 49 <211> 4212 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 49 atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60 ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120 cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180 gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240 tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300 ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360 aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420 aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480 atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540 gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600 ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660 cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720 cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780 gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840 caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900 ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960 atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020 cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080 ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140 gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200 aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260 gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320 gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380 cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440 gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500 aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560 tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620 agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680 gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740 tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800 attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860 ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920 cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980 cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040 gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100 tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160 cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220 gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280 atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340 atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400 gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460 gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520 attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580 gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640 aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700 actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760 ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820 acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880 aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940 taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000 tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060 atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120 aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180 cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240 gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300 cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360 gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420 tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480 aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540 ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600 tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660 caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720 cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780 cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840 atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900 cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960 ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020 gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080 gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140 tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200 aaggctgcag ga 4212 <210> 50 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 50 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 51 <211> 4107 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 51 atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60 atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120 cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180 gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240 tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300 cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360 aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420 aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480 atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540 gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600 attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660 cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720 ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780 gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840 caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900 ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960 atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020 caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080 ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140 gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200 aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260 gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320 gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380 cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440 gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500 aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560 tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620 tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680 gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740 tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860 ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920 cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980 cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040 gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100 agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160 catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220 gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280 attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340 atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400 gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460 gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520 attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580 gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640 aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700 acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760 ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820 actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880 aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940 taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000 tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060 atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120 aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180 cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240 gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300 cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360 gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420 tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480 aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540 tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600 tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660 caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720 cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780 cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840 attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900 ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960 cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020 gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080 gatttgagtc agctaggagg tgactga 4107 <210> 52 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 52 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 53 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 53 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 54 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 54 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 55 <211> 1052 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 55 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 56 <211> 1052 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 56 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 57 <211> 1052 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 57 Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly 1 5 10 15 Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val 20 25 30 Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser 35 40 45 Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln 50 55 60 Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser 65 70 75 80 Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser 85 90 95 Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala 100 105 110 Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly 115 120 125 Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu 130 135 140 Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp 145 150 155 160 Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val 165 170 175 Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu 180 185 190 Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg 195 200 205 Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp 210 215 220 Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro 225 230 235 240 Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn 245 250 255 Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu 260 265 270 Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys 275 280 285 Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val 290 295 300 Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro 305 310 315 320 Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala 325 330 335 Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys 340 345 350 Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr 355 360 365 Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn 370 375 380 Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn 385 390 395 400 Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile 405 410 415 Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln 420 425 430 Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val 435 440 445 Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile 450 455 460 Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu 465 470 475 480 Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg 485 490 495 Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly 500 505 510 Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met 515 520 525 Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp 530 535 540 Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg 545 550 555 560 Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln 565 570 575 Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser 580 585 590 Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu 595 600 605 Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr 610 615 620 Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe 625 630 635 640 Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met 645 650 655 Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val 660 665 670 Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys 675 680 685 Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala 690 695 700 Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu 705 710 715 720 Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln 725 730 735 Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile 740 745 750 Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr 755 760 765 Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile Asn 770 775 780 Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile 785 790 795 800 Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys 805 810 815 Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp 820 825 830 Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp 835 840 845 Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu 850 855 860 Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys 865 870 875 880 Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr 885 890 895 Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg 900 905 910 Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys 915 920 925 Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys 930 935 940 Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu 945 950 955 960 Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly Glu 965 970 975 Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu 980 985 990 Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn 995 1000 1005 Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr 1010 1015 1020 Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr 1025 1030 1035 Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 58 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 58 Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 59 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 59 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 60 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 60 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 61 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 61 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 62 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 62 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Glu Tyr Arg Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 63 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 63 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Ala 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Ala Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Ala Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Ala Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 64 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 64 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 65 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 65 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 66 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 66 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Gly Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 67 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 67 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Val Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 68 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 68 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 69 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 69 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Asp Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 70 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 70 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Gly Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 71 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 71 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Val Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 72 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 72 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 73 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 73 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 74 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 74 Ala Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Phe 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 75 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 75 Ser Glu Val Glu Phe Ser Tyr Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Thr Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Ser His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Ser Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 76 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 76 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val His Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Asp Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 77 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 77 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Gly Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val His Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Asp Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 78 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 78 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Asp Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Lys Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Gly Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 79 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 79 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Gln Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 80 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 80 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Met Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Pro Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Asp Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 81 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 81 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Cys Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val His Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 82 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 82 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Leu Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 83 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 83 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 84 <211> 178 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 84 Met Arg Arg Ala Phe Ile Thr Gly Val Phe Phe Leu Ser Glu Val Glu 1 5 10 15 Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg 20 25 30 Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn 35 40 45 Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp 50 55 60 Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val 65 70 75 80 Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr Val Thr Leu Glu 85 90 95 Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg 100 105 110 Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu 115 120 125 Met Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Thr 130 135 140 Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu Ser Asp Phe Phe 145 150 155 160 Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys Ala Gln Ser Ser 165 170 175 Thr Asp <210> 85 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 85 cggtgggagg tctatataag cagagctggt ttagtgaacc gtcagatccg ctagagatcc 60 gcggccgcta atacgactca ccctagggag agccgccacc gtggtgagca agggcgagga 120 gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 180 gttcagcgtg tccggcgag 199 <210> 86 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 86 gtttttctct aatttattct tccctttagc tagtttc 37 <210> 87 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 87 atttttctct aatttattct tccctttagc tagtttt 37 <210> 88 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 88 gtttttctct aatttattct tccctttagc tagtttc 37 <210> 89 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 89 atttttctct aatttattct tccctttagc tagtttt 37 <210> 90 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 90 ttaatttttt 10 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 91 gaacacaaag catagactgc ggg 23 <210> 92 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 92 gagtatgagg catagactgc agg 23 <210> 93 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 93 gtcaagaaag cagagactgc cgg 23 <210> 94 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 94 gagcaaagac aatagactgt agg 23 <210> 95 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 95 gatgagataa tgatgagtca ggg 23 <210> 96 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 96 ggattgaccc aggccagggc tgg 23 <210> 97 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 97 gaatactaag catagactcc agg 23 <210> 98 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 98 gtaaacaaag catagactga ggg 23 <210> 99 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 99 gaagaccaag gatagactgc tgg 23 <210> 100 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 100 gaacataaag aatagaatga tgg 23 <210> 101 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 101 ggacaggcag catagactgt ggg 23 <210> 102 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 102 gtagaaaaag tatagactgc agg 23 <210> 103 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 103 gaagatagag aatagactgc tgg 23 <210> 104 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 104 ggctaaagac catagactgt ggg 23 <210> 105 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 105 gtctagaaag cttagactgc tgg 23 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 106 gggaataatc atagaatcct gg 22 <210> 107 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 107 gacaaagagg aagagagacg ggg 23 <210> 108 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 108 acacacacac ttagaatctg tgg 23 <210> 109 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 109 cacacacact tagaatctgt ggg 23 <210> 110 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 110 acacacacac ttagaatctg tgg 23 <210> 111 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 111 cacacacact tagaatctgt ggg 23 <210> 112 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 112 ggtgtttcgt cctttccaca ag 22 <210> 113 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 113 gaacacaaag catagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 114 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 114 gagtatgagg catagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 115 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 115 gtcaagaaag cagagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 116 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 116 gagcaaagag aatagactgt gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 117 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 117 gatgagataa tgatgagtca gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 118 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 118 ggattgaccc aggccagggc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 119 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 119 gaatactaag catagactcc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 120 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 120 gtaaacaaag catagactga gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 121 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 121 gaagaccaag gatagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 122 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 122 gaacataaag aatagaatga gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 123 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 123 ggacaggcag catagactgt gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 124 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 124 gtagaaaaag tatagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 125 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 125 gaagatagag aatagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 126 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 126 ggctaaagac catagactgt gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 127 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 127 gtctagaaag cttagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 128 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 128 gggaataaat catagaatcc gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 129 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 129 gacaaagagg aagagagacg gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 130 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 130 gacacacaca cttagaatct ggttttagag ctagaaatag caagttaaaa taaggc 56 <210> 131 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 131 gcacacacac ttagaatctg tgttttagag ctagaaatag caagttaaaa taaggc 56 <210> 132 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 132 gtggggaagg ggcccccaag gttttagagc tagaaatagc aagttaaaat aaggc 55 <210> 133 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 133 gacgtaccag gtggagcacc cgttttagag ctagaaatag caagttaaaa taaggc 56 <210> 134 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (12)..(12) <223> U is ideoxyU <400> 134 agttgtacgc guccaaaaaa acggg 25 <210> 135 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 135 agattagcgg atcctacctg ac 22 <210> 136 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 136 gcggtctgta tttcccagaa c 21 <210> 137 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <400> 137 accggggact tcagaaucgg c 21 <210> 138 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <400> 138 attctgaagt ccccggugtt tcg 23 <210> 139 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (12)..(12) <223> U is ideoxyU <400> 139 acgcgtacaa cucaaaggag gaaaaaaaaa tg 32 <210> 140 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (15)..(15) <223> U is ideoxyU <220> <221> misc_feature <222> (25)..(26) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (28)..(29) <223> n is a, c, g, t or u <400> 140 acgctggcga aacgugcctg ggatnnknnk gaagtgccgg tcggcgc 47 <210> 141 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (15)..(15) <223> U is ideoxyU <400> 141 acgtttcgcc agcgucagcg cgtgacg 27 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <400> 142 acgcgaaaac tggcgcugcg 20 <210> 143 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (17)..(17) <223> U is ideoxyU <220> <221> misc_feature <222> (20)..(21) <223> n is a, c, g, t or u <400> 143 agcgccagtt ttcgcgutmn ncacaccaaa gaccacgcga cc 42 <210> 144 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (14)..(14) <223> U is ideoxyU <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (20)..(21) <223> n is a, c, g, t or u <400> 144 agtggcggat gagugcnnkn nkttgctcag ttacttcttt cgcatgcg 48 <210> 145 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (14)..(14) <223> U is ideoxyU <400> 145 actcatccgc caguattcct tccg 24 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 146 tacggcgtag tgcacctgga 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 147 tacggcgtag tgcacctgga 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 148 atcttattcg atcatgcgaa 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 149 caatgatgac ttctacagcg 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 150 caatgatgac ttctacagcg 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 151 caatgatgac ttctacagcg 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 152 ttcattaact gtggccggct 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 153 gcttaggtgg agcgcctatt 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 154 tacggcgtag tgcacctgga 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 155 tacggcgtag tgcacctgga 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 156 atcttattcg atcatgcgaa 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 157 tacggcgtag tgcacctgga 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 158 tacggcgtag tgcacctgga 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 159 atcttattgg agcgcctatt 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 160 gcttaggtgg agcgcctatt 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 161 caatgatgac ttctacagcg 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 162 tacggcgtag tgcacctgga 20 <210> 163 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 163 caatgatgac ttctacagcg 20 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 164 tacggcgtag tgcacctgga 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 165 caatgatgac ttctacagcg 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 166 tacggcgtag tgcacctgga 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 167 atcttattcg atcatgcgaa 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 168 ttcattaact gtggccggct 20 <210> 169 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 169 acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57 <210> 170 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 170 tggagttcag acgtgtgctc ttccgatctt gaatggattc cttggaaaca atga 54 <210> 171 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 171 acactctttc cctacacgac gctcttccga tctnnnnaga gactgattgc gtggagt 57 <210> 172 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 172 tggagttcag acgtgtgctc ttccgatctc actccagcct aggcaacaa 49 <210> 173 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 173 acactctttc cctacacgac gctcttccga tctnnnnccg acagccagtg gttaagt 57 <210> 174 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 174 tggagttcag acgtgtgctc ttccgatctg cttttcaccg actgcacag 49 <210> 175 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 175 acactctttc cctacacgac gctcttccga tctnnnnctg cacctagcct ccatgtc 57 <210> 176 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 176 tggagttcag acgtgtgctc ttccgatctc cttgcactga gaccgtgaa 49 <210> 177 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 177 acactctttc cctacacgac gctcttccga tctnnnngtc tgaggtcaca cagtggg 57 <210> 178 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 178 tggagttcag acgtgtgctc ttccgatctc tgagagcagg gaccacatc 49 <210> 179 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 179 acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57 <210> 180 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 180 tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49 <210> 181 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 181 acactctttc cctacacgac gctcttccga tctnnnngat gccctccatc ttctccg 57 <210> 182 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 182 tggagttcag acgtgtgctc ttccgatcta ggtttgcata gacctgccc 49 <210> 183 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 183 acactctttc cctacacgac gctcttccga tctnnnnccc tgttcctaaa gcccacc 57 <210> 184 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 184 tggagttcag acgtgtgctc ttccgatcta ctggttctgt ttgtggcca 49 <210> 185 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 185 acactctttc cctacacgac gctcttccga tctnnnnttg cttattgctg aggggca 57 <210> 186 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 186 tggagttcag acgtgtgctc ttccgatcta cctctctcct ccagctgag 49 <210> 187 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 187 acactctttc cctacacgac gctcttccga tctnnnntcc acctccccac ttctctt 57 <210> 188 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 188 tggagttcag acgtgtgctc ttccgatctg gtgaaatgag caaggcaca 49 <210> 189 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 189 acactctttc cctacacgac gctcttccga tctnnnnccc taaaccacct gcagagg 57 <210> 190 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 190 tggagttcag acgtgtgctc ttccgatctc agccccagcc acattctat 49 <210> 191 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 191 acactctttc cctacacgac gctcttccga tctnnnnacc catgtgcctg acatagg 57 <210> 192 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 192 tggagttcag acgtgtgctc ttccgatctt ggtgattatg gttacacagc g 51 <210> 193 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 193 acactctttc cctacacgac gctcttccga tctnnnntca cttcagccca ggagtat 57 <210> 194 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 194 tggagttcag acgtgtgctc ttccgatctt ctctttctct cccccaccc 49 <210> 195 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 195 acactctttc cctacacgac gctcttccga tctnnnngaa cctgaagcct ttcccca 57 <210> 196 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 196 tggagttcag acgtgtgctc ttccgatcta acctgtgtga cacttggca 49 <210> 197 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 197 acactctttc cctacacgac gctcttccga tctnnnngca gacacccaca actgtct 57 <210> 198 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 198 tggagttcag acgtgtgctc ttccgatctg cactcagcta gacttaactc cc 52 <210> 199 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 199 acactctttc cctacacgac gctcttccga tctnnnnggg aggtggagag aggatgt 57 <210> 200 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 200 tggagttcag acgtgtgctc ttccgatctt cctgaggtct aggaacccg 49 <210> 201 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 201 acactctttc cctacacgac gctcttccga tctnnnncgc gggctgaagt agatcaa 57 <210> 202 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 202 tggagttcag acgtgtgctc ttccgatctc ctgtctctgc tcctttgtcc cc 52 <210> 203 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 203 acactctttc cctacacgac gctcttccga tctnnnngca ttacctggga gcctgtt 57 <210> 204 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 204 tggagttcag acgtgtgctc ttccgatcta acttcagcgg gcatcagaa 49 <210> 205 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 205 acactctttc cctacacgac gctcttccga tctnnnngtg gagtttagcc agggacc 57 <210> 206 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 206 tggagttcag acgtgtgctc ttccgatctt acaggcctca ctggagcta 49 <210> 207 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 207 acactctttc cctacacgac gctcttccga tctnnnnggc tggataacct tggctgt 57 <210> 208 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 208 tggagttcag acgtgtgctc ttccgatctt cctcaggcac tcctctcaa 49 <210> 209 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 209 acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57 <210> 210 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 210 tggagttcag acgtgtgctc ttccgatctt gaatggattc cttggaaaca atga 54 <210> 211 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 211 acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57 <210> 212 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 212 tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49 <210> 213 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 213 acactctttc cctacacgac gctcttccga tctnnnngaa cccaggtagc cagagac 57 <210> 214 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 214 tggagttcag acgtgtgctc ttccgatctt cctttcaacc cgaacggag 49 <210> 215 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 215 acactctttc cctacacgac gctcttccga tctnnnngtg tggagagtga gtaagcca 58 <210> 216 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 216 tggagttcag acgtgtgctc ttccgatcta cggtaggatg atttcaggca 50 <210> 217 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 217 acactctttc cctacacgac gctcttccga tctnnnncac aaagcagtgt agctcagg 58 <210> 218 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 218 tggagttcag acgtgtgctc ttccgatctt ttttggtact cgagtgttat tcag 54 <210> 219 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 219 acactctttc cctacacgac gctcttccga tctnnnntcc cctgttgacc tggagaa 57 <210> 220 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 220 tggagttcag acgtgtgctc ttccgatctc actgtacttg ccctgacca 49 <210> 221 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 221 acactctttc cctacacgac gctcttccga tctnnnnttg gtgttgacag ggagcaa 57 <210> 222 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 222 tggagttcag acgtgtgctc ttccgatctc tgagatgtgg gcagaaggg 49 <210> 223 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 223 acactctttc cctacacgac gctcttccga tctnnnntga gagggaacag aagggct 57 <210> 224 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 224 tggagttcag acgtgtgctc ttccgatctg tccaaaggcc caagaacct 49 <210> 225 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 225 acactctttc cctacacgac gctcttccga tctnnnntcc tagcactttg gaaggtcg 58 <210> 226 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 226 tggagttcag acgtgtgctc ttccgatctg ctcatcttaa tctgctcagc c 51 <210> 227 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 227 acactctttc cctacacgac gctcttccga tctnnnnaaa ggagcagctc ttcctgg 57 <210> 228 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 228 tggagttcag acgtgtgctc ttccgatctg tctgcaccat ctcccacaa 49 <210> 229 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 229 acactctttc cctacacgac gctcttccga tctnnnnggc atggcttctg agactca 57 <210> 230 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 230 tggagttcag acgtgtgctc ttccgatctg tctcccttgc actccctgtc ttt 53 <210> 231 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 231 acactctttc cctacacgac gctcttccga tctnnnnttt ggcaatggag gcattgg 57 <210> 232 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 232 tggagttcag acgtgtgctc ttccgatctg aagaggctgc ccatgagag 49 <210> 233 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 233 acactctttc cctacacgac gctcttccga tctnnnnggt ctgaggctcg aatcctg 57 <210> 234 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 234 tggagttcag acgtgtgctc ttccgatctc tgtggcctcc atatccctg 49 <210> 235 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 235 acactctttc cctacacgac gctcttccga tctnnnnttt ccaccagaac tcagccc 57 <210> 236 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 236 tggagttcag acgtgtgctc ttccgatctc ctcggttcct ccacaacac 49 <210> 237 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 237 acactctttc cctacacgac gctcttccga tctnnnncac gggaaggaca ggagaag 57 <210> 238 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 238 tggagttcag acgtgtgctc ttccgatctg caggggaggg ataaagcag 49 <210> 239 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 239 acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57 <210> 240 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 240 tggagttcag acgtgtgctc ttccgatctt gaatggattc cttggaaaca atga 54 <210> 241 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 241 acactctttc cctacacgac gctcttccga tctnnnnccc tgagatacag tcacgaggt 59 <210> 242 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 242 tggagttcag acgtgtgctc ttccgatctc ctgaaatgct gtgcgtgtct a 51 <210> 243 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 243 acactctttc cctacacgac gctcttccga tctnnnngcc cacattacct tggtgcata 59 <210> 244 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 244 tggagttcag acgtgtgctc ttccgatctg gcaggcagat tatcattccc a 51 <210> 245 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 245 acactctttc cctacacgac gctcttccga tctnnnnaaa gtgctgcgat tacaggc 57 <210> 246 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 246 tggagttcag acgtgtgctc ttccgatctg tggcatccag agacatggt 49 <210> 247 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (34)..(37) <223> n is a, c, g, or t <400> 247 acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57 <210> 248 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 248 tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49 <210> 249 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 249 ttttccagcc cgctggccct gtaaaggaaa ctggaacgca aagcatagac tgcgcggcgg 60 gccagcctga atagctgcaa acaagtgcag aatatctgat 100 <210> 250 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 250 catgaaaaag agactgattg cgtggagttc atggagtgtg aggcatagac tgcacgagac 60 ataaaccatg acttgcagat gaagaagcat tttaaaagt 99 <210> 251 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 251 gacagccagt ggttaagtca gaacccgact caggtcagga aagcagagac tgcccggggt 60 tgggaaggcg gtgaactcag agatagaaac agggtgggtg 100 <210> 252 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 252 attttaagct gtagtattat gaagggaaat ctggagcgaa gagaatagac tgtacggaaa 60 ccagttaaga aataggacat ggaggctagg tgcagtggct 100 <210> 253 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 253 cctctgccat cacgtgctca gtctgggccc caaggattgg cccaggccag ggctcgagaa 60 gcagaaaaaa agcatcaagc ctacaaatgc atgcttactt 100 <210> 254 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 254 gacagauauu ugcauugaga uagugugg 28 <210> 255 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 255 acagauauuu gcauugagau agugugg 27 <210> 256 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 256 cagauauuug cauugagaua gugugg 26 <210> 257 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 257 agauauuugc auugagauag ugugg 25 <210> 258 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 258 gauauuugca uugagauagu gugg 24 <210> 259 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 259 auauuugcau ugagauagug ugg 23 <210> 260 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 260 augcaaauau cugucugaaa cgg 23 <210> 261 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 261 gcaaauaucu gucugaaacg gucccugg 28 <210> 262 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 262 caaauaucug ucugaaacgg ucccugg 27 <210> 263 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 263 aaauaucugu cugaaacggu cccugg 26 <210> 264 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 264 aauaucuguc ugaaacgguc ccugg 25 <210> 265 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 265 auaucugucu gaaacggucc cugg 24 <210> 266 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 266 uaucugucug aaacgguccc ugg 23 <210> 267 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 267 agauauuugc auugagauag ugu 23 <210> 268 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 268 acagauauuu gcauugagau agu 23 <210> 269 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 269 guggggaagg ggcccccaag agg 23 <210> 270 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 270 cuugaccaau agccuugaca agg 23 <210> 271 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 271 cuugucaagg cuauugguca aggcaagg 28 <210> 272 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 272 uugucaaggc uauuggucaa ggcaagg 27 <210> 273 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 273 ugucaaggcu auuggucaag gcaagg 26 <210> 274 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 274 gucaaggcua uuggucaagg caagg 25 <210> 275 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 275 ucaaggcuau uggucaaggc aagg 24 <210> 276 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 276 caaggcuauu ggucaaggca agg 23 <210> 277 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 277 uugucaaggc uauuggucaa ggc 23 <210> 278 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 278 cuugucaagg cuauugguca agg 23 <210> 279 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 279 uugaccaaua gccuugacaa ggc 23 <210> 280 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 280 uagccuugac aaggcaaacu uga 23 <210> 281 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 281 uucuccacag gagucagaug cac 23 <210> 282 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 282 ucuccacagg agucagaugc acc 23 <210> 283 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 283 uucuccacag gagucagaug caccaugg 28 <210> 284 <211> 27 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 284 ucuccacagg agucagaugc accaugg 27 <210> 285 <211> 26 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 285 cuccacagga gucagaugca ccaugg 26 <210> 286 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 286 uccacaggag ucagaugcac caugg 25 <210> 287 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 287 ccacaggagu cagaugcacc augg 24 <210> 288 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 288 cacaggaguc agaugcacca ugg 23 <210> 289 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 289 acuucuccac aggagucaga ugc 23 <210> 290 <211> 28 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 290 ucuccacagg agucagaugc accauggu 28 <210> 291 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 291 acuccuaagg agaagucugc cgu 23 <210> 292 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 292 uuggugguaa ggcccugggc agg 23 <210> 293 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 293 uggugguaag gcccugggca ggu 23 <210> 294 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 294 ugguaaggcc cugggcaggu ugg 23 <210> 295 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 295 agcauuguau auucucugug agg 23 <210> 296 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 296 aaagcauugu auauucucug uga 23 <210> 297 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 297 ccacactatc tcaatgcaaa tatctgtc 28 <210> 298 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 298 ccacactatc tcaatgcaaa tatctgt 27 <210> 299 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 299 ccacactatc tcaatgcaaa tatctg 26 <210> 300 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 300 ccacactatc tcaatgcaaa tatct 25 <210> 301 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 301 ccacactatc tcaatgcaaa tatc 24 <210> 302 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 302 ccacactatc tcaatgcaaa tat 23 <210> 303 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 303 ccgtttcaga cagatatttg cat 23 <210> 304 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 304 ccagggaccg tttcagacag atatttgc 28 <210> 305 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 305 ccagggaccg tttcagacag atatttg 27 <210> 306 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 306 ccagggaccg tttcagacag atattt 26 <210> 307 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 307 ccagggaccg tttcagacag atatt 25 <210> 308 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 308 ccagggaccg tttcagacag atat 24 <210> 309 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 309 ccagggaccg tttcagacag ata 23 <210> 310 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 310 acactatctc aatgcaaata tct 23 <210> 311 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 311 actatctcaa tgcaaatatc tgt 23 <210> 312 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 312 cctcttgggg gccccttccc cac 23 <210> 313 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 313 ccttgtcaag gctattggtc aag 23 <210> 314 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 314 ccttgccttg accaatagcc ttgacaag 28 <210> 315 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 315 ccttgccttg accaatagcc ttgacaa 27 <210> 316 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 316 ccttgccttg accaatagcc ttgaca 26 <210> 317 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 317 ccttgccttg accaatagcc ttgac 25 <210> 318 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 318 ccttgccttg accaatagcc ttga 24 <210> 319 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 319 ccttgccttg accaatagcc ttg 23 <210> 320 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 320 gccttgacca atagccttga caa 23 <210> 321 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 321 ccttgaccaa tagccttgac aag 23 <210> 322 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 322 gccttgtcaa ggctattggt caa 23 <210> 323 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 323 tcaagtttgc cttgtcaagg cta 23 <210> 324 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 324 gtgcatctga ctcctgtgga gaa 23 <210> 325 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 325 ggtgcatctg actcctgtgg aga 23 <210> 326 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 326 ccatggtgca tctgactcct gtggagaa 28 <210> 327 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 327 ccatggtgca tctgactcct gtggaga 27 <210> 328 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 328 ccatggtgca tctgactcct gtggag 26 <210> 329 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 329 ccatggtgca tctgactcct gtgga 25 <210> 330 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 330 ccatggtgca tctgactcct gtgg 24 <210> 331 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 331 ccatggtgca tctgactcct gtg 23 <210> 332 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 332 gcatctgact cctgtggaga agt 23 <210> 333 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 333 accatggtgc atctgactcc tgtggaga 28 <210> 334 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 334 acggcagact tctccttagg agt 23 <210> 335 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 335 cctgcccagg gccttaccac caa 23 <210> 336 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 336 acctgcccag ggccttacca cca 23 <210> 337 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 337 ccaacctgcc cagggcctta cca 23 <210> 338 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 338 cctcacagag aatatacaat gct 23 <210> 339 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 339 tcacagagaa tatacaatgc ttt 23 <210> 340 <211> 146 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 340 Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp Gly 1 5 10 15 Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu Leu 20 25 30 Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp Leu 35 40 45 Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His Gly 50 55 60 Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp Asn 65 70 75 80 Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys Leu 85 90 95 His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val Cys 100 105 110 Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln Ala 115 120 125 Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His Lys 130 135 140 Tyr His 145 <210> 341 <211> 2351 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 341 Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe 1 5 10 15 Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg 35 40 45 Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val 50 55 60 Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile 65 70 75 80 Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln 85 90 95 Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser 100 105 110 His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser 115 120 125 Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp 130 135 140 Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu 145 150 155 160 Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser 165 170 175 Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile 180 185 190 Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr 195 200 205 Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly 210 215 220 Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp 225 230 235 240 Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr 245 250 255 Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val 260 265 270 Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile 275 280 285 Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser 290 295 300 Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met 305 310 315 320 Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His 325 330 335 Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro 340 345 350 Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp 355 360 365 Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser 370 375 380 Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro 755 760 765 Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp 770 775 780 Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys 785 790 795 800 Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser 805 810 815 Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr 820 825 830 Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn 835 840 845 Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly 850 855 860 Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu 865 870 875 880 Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys 885 890 895 Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn 900 905 910 Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met 915 920 925 Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys 930 935 940 Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu 945 950 955 960 Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu 965 970 975 Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe 980 985 990 Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala 995 1000 1005 Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser 1010 1015 1020 Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser 1025 1030 1035 Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu 1040 1045 1050 Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg 1055 1060 1065 Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met 1070 1075 1080 Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln 1085 1090 1095 Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met 1100 1105 1110 Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile 1115 1120 1125 Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro 1130 1135 1140 Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu 1145 1150 1155 Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys 1160 1165 1170 Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro 1175 1180 1185 Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu 1190 1195 1200 Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu 1205 1210 1215 Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile 1220 1225 1230 His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu 1235 1240 1245 Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr 1250 1255 1260 Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn 1265 1270 1275 Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu 1280 1285 1290 Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu 1295 1300 1305 Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln 1310 1315 1320 Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg 1325 1330 1335 Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp 1340 1345 1350 Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro 1355 1360 1365 Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala 1370 1375 1380 Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser 1385 1390 1395 Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser 1400 1405 1410 Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe 1415 1420 1425 Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys 1430 1435 1440 Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys 1445 1450 1455 Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly 1460 1465 1470 Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser 1475 1480 1485 Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp 1490 1495 1500 Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His 1505 1510 1515 Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser 1520 1525 1530 Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr 1535 1540 1545 Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val 1550 1555 1560 Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser 1565 1570 1575 Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln 1580 1585 1590 Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys 1595 1600 1605 Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys 1610 1615 1620 Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys 1625 1630 1635 Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg 1640 1645 1650 Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu 1655 1660 1665 Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 1670 1675 1680 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile 1685 1690 1695 Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys 1700 1705 1710 Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr 1715 1720 1725 Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser 1730 1735 1740 Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr 1745 1750 1755 Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu 1760 1765 1770 His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp 1775 1780 1785 Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser 1790 1795 1800 Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly 1805 1810 1815 Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr 1820 1825 1830 Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu 1835 1840 1845 Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu 1850 1855 1860 Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His 1865 1870 1875 Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln 1880 1885 1890 Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp 1895 1900 1905 Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1910 1915 1920 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His 1925 1930 1935 Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met 1940 1945 1950 Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser 1955 1960 1965 Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr 1970 1975 1980 Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr 1985 1990 1995 Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly 2000 2005 2010 Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly 2015 2020 2025 Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro 2030 2035 2040 Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala 2045 2050 2055 Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His 2060 2065 2070 Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser 2075 2080 2085 Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile 2090 2095 2100 Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser 2105 2110 2115 Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr 2120 2125 2130 Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn 2135 2140 2145 Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 2150 2155 2160 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg 2165 2170 2175 Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys 2180 2185 2190 Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln 2195 2200 2205 Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser 2210 2215 2220 Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp 2225 2230 2235 Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe 2240 2245 2250 Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys 2255 2260 2265 Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser 2270 2275 2280 Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys 2285 2290 2295 Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val 2300 2305 2310 Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His 2315 2320 2325 Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu 2330 2335 2340 Gly Cys Glu Ala Gln Asp Leu Tyr 2345 2350 <210> 342 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 342 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg 1 5 10 15 Lys Val <210> 343 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 343 Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys 1 5 10 15 Val <210> 344 <211> 343 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 344 ctgacaaaag aagtcctggt atcctctatg atgggagaag gaaactagct aaagggaaga 60 ataaattaga gaaaaactgg aatgactgaa tcggaacaag gcaaaggcta taaaaaaaat 120 tagcagtatc ctcttggggg ccccttcccc acactatctc aatgcaaata tctgtctgaa 180 acggtccctg gctaaactcc acccatgggt tggccagcct tgccttgacc aatagccttg 240 acaaggcaaa cttgaccaat agtcttagag tatccagtga ggccaggggc cggcggctgg 300 ctagggatga agaataaaag gaagcaccct tcagcagttc cac 343 <210> 345 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 345 ggtgggagaa gaaaactagc taaagggaag aataaattag agaaaaattg gaatgactga 60 atcggaacaa ggcaaaggct ataaaaaaaa ttaagcagca gtatcctctt gggggcccct 120 tccccacact atctcaatgc aaatatctgt ctgaaacggt ccctggctaa actccaccca 180 tgggttggcc agccttgcct tgaccaatag ccttgacaag gcaaacttga ccaatagtct 240 tagagtatcc agtgaggcca ggggccggcg gctggctagg gatgaagaat aaaaggaagc 300 acccttcagc agttccac 318 <210> 346 <211> 1606 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 346 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atggtgcatc 60 tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac gtggatgaag 120 ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt aaggagacca 180 atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg cactgactct 240 ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc ttggacccag 300 aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 360 gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 420 aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 480 cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc ttcttttcta 540 tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag aatgggaaac 600 agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt ttatttgctg 660 ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct tctccgcaat 720 ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata tctctgagat 780 acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac tatttggaat 840 atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt atttttaatt 900 gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata tgtgtacaca 960 tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt cttcttttaa 1020 tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat 1080 aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg 1140 ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat tgtaactgat 1200 gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg cttttatttt 1260 atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt 1320 catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca 1380 tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg 1440 tgtggctaat gccctggccc acaagtatca ctaagctcgc tttcttgctg tccaatttct 1500 attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt atgaagggcc 1560 ttgagcatct ggattctgcc taataaaaaa catttatttt cattgc 1606 <210> 347 <211> 9036 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 347 gcttagtgct gagcacatcc agtgggtaaa gttccttaaa atgctctgca aagaaattgg 60 gacttttcat taaatcagaa attttacttt tttcccctcc tgggagctaa agatatttta 120 gagaagaatt aaccttttgc ttctccagtt gaacatttgt agcaataagt catgcaaata 180 gagctctcca cctgcttctt tctgtgcctt ttgcgattct gctttagtgc caccagaaga 240 tactacctgg gtgcagtgga actgtcatgg gactatatgc aaagtgatct cggtgagctg 300 cctgtggacg caagatttcc tcctagagtg ccaaaatctt ttccattcaa cacctcagtc 360 gtgtacaaaa agactctgtt tgtagaattc acggatcacc ttttcaacat cgctaagcca 420 aggccaccct ggatgggtct gctaggtcct accatccagg ctgaggttta tgatacagtg 480 gtcattacac ttaagaacat ggcttcccat cctgtcagtc ttcatgctgt tggtgtatcc 540 tactggaaag cttctgaggg agctgaatat gatgatcaga ccagtcaaag ggagaaagaa 600 gatgataaag tcttccctgg tggaagccat acatatgtct ggcaggtcct gaaagagaat 660 ggtccaatgg cctctgaccc actgtgcctt acctactcat atctttctca tgtggacctg 720 gtaaaagact tgaattcagg cctcattgga gccctactag tatgtagaga agggagtctg 780 gccaaggaaa agacacagac cttgcacaaa tttatactac tttttgctgt atttgatgaa 840 gggaaaagtt ggcactcaga aacaaagaac tccttgatgc aggataggga tgctgcatct 900 gctcgggcct ggcctaaaat gcacacagtc aatggttatg taaacaggtc tctgccaggt 960 ctgattggat gccacaggaa atcagtctat tggcatgtga ttggaatggg caccactcct 1020 gaagtgcact caatattcct cgaaggtcac acatttcttg tgaggaacca tcgccaggcg 1080 tccttggaaa tctcgccaat aactttcctt actgctcaaa cactcttgat ggaccttgga 1140 cagtttctac tgttttgtca tatctcttcc caccaacatg atggcatgga agcttatgtc 1200 aaagtagaca gctgtccaga ggaaccccaa ctacgaatga aaaataatga agaagcggaa 1260 gactatgatg atgatcttac tgattctgaa atggatgtgg tcaggtttga tgatgacaac 1320 tctccttcct ttatccaaat tcgctcagtt gccaagaagc atcctaaaac ttgggtacat 1380 tacattgctg ctgaagagga ggactgggac tatgctccct tagtcctcgc ccccgatgac 1440 agaagttata aaagtcaata tttgaacaat ggccctcagc ggattggtag gaagtacaaa 1500 aaagtccgat ttatggcata cacagatgaa acctttaaga ctcgtgaagc tattcagcat 1560 gaatcaggaa tcttgggacc tttactttat ggggaagttg gagacacact gttgattata 1620 tttaagaatc aagcaagcag accatataac atctaccctc acggaatcac tgatgtccgt 1680 cctttgtatt caaggagatt accaaaaggt gtaaaacatt tgaaggattt tccaattctg 1740 ccaggagaaa tattcaaata taaatggaca gtgactgtag aagatgggcc aactaaatca 1800 gatcctcggt gcctgacccg ctattactct agtttcgtta atatggagag agatctagct 1860 tcaggactca ttggccctct cctcatctgc tacaaagaat ctgtagatca aagaggaaac 1920 cagataatgt cagacaagag gaatgtcatc ctgttttctg tatttgatga gaaccgaagc 1980 tggtacctca cagagaatat acaacgcttt ctccccaatc cagctggagt gcagcttgag 2040 gatccagagt tccaagcctc caacatcatg cacagcatca atggctatgt ttttgatagt 2100 ttgcagttgt cagtttgttt gcatgaggtg gcatactggt acattctaag cattggagca 2160 cagactgact tcctttctgt cttcttctct ggatatacct tcaaacacaa aatggtctat 2220 gaagacacac tcaccctatt cccattctca ggagaaactg tcttcatgtc gatggaaaac 2280 ccaggtctat ggattctggg gtgccacaac tcagactttc ggaacagagg catgaccgcc 2340 ttactgaagg tttctagttg tgacaagaac actggtgatt attacgagga cagttatgaa 2400 gatatttcag catacttgct gagtaaaaac aatgccattg aaccaagaag cttctcccag 2460 aattcaagac accctagcac taggcaaaag caatttaatg ccaccacaat tccagaaaat 2520 gacatagaga agactgaccc ttggtttgca cacagaacac ctatgcctaa aatacaaaat 2580 gtctcctcta gtgatttgtt gatgctcttg cgacagagtc ctactccaca tgggctatcc 2640 ttatctgatc tccaagaagc caaatatgag actttttctg atgatccatc acctggagca 2700 atagacagta ataacagcct gtctgaaatg acacacttca ggccacagct ccatcacagt 2760 ggggacatgg tatttacccc tgagtcaggc ctccaattaa gattaaatga gaaactgggg 2820 acaactgcag caacagagtt gaagaaactt gatttcaaag tttctagtac atcaaataat 2880 ctgatttcaa caattccatc agacaatttg gcagcaggta ctgataatac aagttcctta 2940 ggacccccaa gtatgccagt tcattatgat agtcaattag ataccactct atttggcaaa 3000 aagtcatctc cccttactga gtctggtgga cctctgagct tgagtgaaga aaataatgat 3060 tcaaagttgt tagaatcagg tttaatgaat agccaagaaa gttcatgggg aaaaaatgta 3120 tcgtcaacag agagtggtag gttatttaaa gggaaaagag ctcatggacc tgctttgttg 3180 actaaagata atgccttatt caaagttagc atctctttgt taaagacaaa caaaacttcc 3240 aataattcag caactaatag aaagactcac attgatggcc catcattatt aattgagaat 3300 agtccatcag tctggcaaaa tatattagaa agtgacactg agtttaaaaa agtgacacct 3360 ttgattcatg acagaatgct tatggacaaa aatgctacag ctttgaggct aaatcatatg 3420 tcaaataaaa ctacttcatc aaaaaacatg gaaatggtcc aacagaaaaa agagggcccc 3480 attccaccag atgcacaaaa tccagatatg tcgttcttta agatgctatt cttgccagaa 3540 tcagcaaggt ggatacaaag gactcatgga aagaactctc tgaactctgg gcaaggcccc 3600 agtccaaagc aattagtatc cttaggacca gaaaaatctg tggaaggtca gaatttcttg 3660 tctgagaaaa acaaagtggt agtaggaaag ggtgaattta caaaggacgt aggactcaaa 3720 gagatggttt ttccaagcag cagaaaccta tttcttacta acttggataa tttacatgaa 3780 aataatacac acaatcaaga aaaaaaaatt caggaagaaa tagaaaagaa ggaaacatta 3840 atccaagaga atgtagtttt gcctcagata catacagtga ctggcactaa gaatttcatg 3900 aagaaccttt tcttactgag cactaggcaa aatgtagaag gttcatatga cggggcatat 3960 gctccagtac ttcaagattt taggtcatta aatgattcaa caaatagaac aaagaaacac 4020 acagctcatt tctcaaaaaa aggggaggaa gaaaacttgg aaggcttggg aaatcaaacc 4080 aagcaaattg tagagaaata tgcatgcacc acaaggatat ctcctaatac aagccagcag 4140 aattttgtca cgcaacgtag taagagagct ttgaaacaat tcagactccc actagaagaa 4200 acagaacttg aaaaaaggat aattgtggat gacacctcaa cccagtggtc caaaaacatg 4260 aaacatttga ccccgagcac cctcacacag atagactaca atgagaagga gaaaggggcc 4320 attactcagt ctcccttatc agattgcctt acgaggagtc atagcatccc tcaagcaaat 4380 agatctccat tacccattgc aaaggtatca tcatttccat ctattagacc tatatatctg 4440 accagggtcc tattccaaga caactcttct catcttccag cagcatctta tagaaagaaa 4500 gattctgggg tccaagaaag cagtcatttc ttacaaggag ccaaaaaaaa taacctttct 4560 ttagccattc taaccttgga gatgactggt gatcaaagag aggttggctc cctggggaca 4620 agtgccacaa attcagtcac atacaagaaa gttgagaaca ctgttctccc gaaaccagac 4680 ttgcccaaaa catctggcaa agttgaattg cttccaaaag ttcacattta tcagaaggac 4740 ctattcccta cggaaactag caatgggtct cctggccatc tggatctcgt ggaagggagc 4800 cttcttcagg gaacagaggg agcgattaag tggaatgaag caaacagacc tggaaaagtt 4860 ccctttctga gagtagcaac agaaagctct gcaaagactc cctccaagct attggatcct 4920 cttgcttggg ataaccacta tggtactcag ataccaaaag aagagtggaa atcccaagag 4980 aagtcaccag aaaaaacagc ttttaagaaa aaggatacca ttttgtccct gaacgcttgt 5040 gaaagcaatc atgcaatagc agcaataaat gagggacaaa ataagcccga aatagaagtc 5100 acctgggcaa agcaaggtag gactgaaagg ctgtgctctc aaaacccacc agtcttgaaa 5160 cgccatcaac gggaaataac tcgtactact cttcagtcag atcaagagga aattgactat 5220 gatgatacca tatcagttga aatgaagaag gaagattttg acatttatga tgaggatgaa 5280 aatcagagcc cccgcagctt tcaaaagaaa acacgacact attttattgc tgcagtggag 5340 aggctctggg attatgggat gagtagctcc ccacatgttc taagaaacag ggctcagagt 5400 ggcagtgtcc ctcagttcaa gaaagttgtt ttccaggaat ttactgatgg ctcctttact 5460 cagcccttat accgtggaga actaaatgaa catttgggac tcctggggcc atatataaga 5520 gcagaagttg aagataatat catggtaact ttcagaaatc aggcctctcg tccctattcc 5580 ttctattcta gccttatttc ttatgaggaa gatcagaggc aaggagcaga acctagaaaa 5640 aactttgtca agcctaatga aaccaaaact tacttttgga aagtgcaaca tcatatggca 5700 cccactaaag atgagtttga ctgcaaagcc tgggcttatt tctctgatgt tgacctggaa 5760 aaagatgtgc actcaggcct gattggaccc cttctggtct gccacactaa cacactgaac 5820 cctgctcatg ggagacaagt gacagtacag gaatttgctc tgtttttcac catctttgat 5880 gagaccaaaa gctggtactt cactgaaaat atggaaagaa actgcagggc tccctgcaat 5940 atccagatgg aagatcccac ttttaaagag aattatcgct tccatgcaat caatggctac 6000 ataatggata cactacctgg cttagtaatg gctcaggatc aaaggattcg atggtatctg 6060 ctcagcatgg gcagcaatga aaacatccat tctattcatt tcagtggaca tgtgttcact 6120 gtacgaaaaa aagaggagta taaaatggca ctgtacaatc tctatccagg tgtttttgag 6180 acagtggaaa tgttaccatc caaagctgga atttggcggg tggaatgcct tattggcgag 6240 catctacatg ctgggatgag cacacttttt ctggtgtaca gcaataagtg tcagactccc 6300 ctgggaatgg cttctggaca cattagagat tttcagatta cagcttcagg acaatatgga 6360 cagtgggccc caaagctggc cagacttcat tattccggat caatcaatgc ctggagcacc 6420 aaggagccct tttcttggat caaggtggat ctgttggcac caatgattat tcacggcatc 6480 aagacccagg gtgcccgtca gaagttctcc agcctctaca tctctcagtt tatcatcatg 6540 tatagtcttg atgggaagaa gtggcagact tatcgaggaa attccactgg aaccttaatg 6600 gtcttctttg gcaatgtgga ttcatctggg ataaaacaca atatttttaa ccctccaatt 6660 attgctcgat acatccgttt gcacccaact cattatagca ttcgcagcac tcttcgcatg 6720 gagttgatgg gctgtgattt aaatagttgc agcatgccat tgggaatgga gagtaaagca 6780 atatcagatg cacagattac tgcttcatcc tactttacca atatgtttgc cacctggtct 6840 ccttcaaaag ctcgacttca cctccaaggg aggagtaatg cctggagacc tcaggtgaat 6900 aatccaaaag agtggctgca agtggacttc cagaagacaa tgaaagtcac aggagtaact 6960 actcagggag taaaatctct gcttaccagc atgtatgtga aggagttcct catctccagc 7020 agtcaagatg gccatcagtg gactctcttt tttcagaatg gcaaagtaaa ggtttttcag 7080 ggaaatcaag actccttcac acctgtggtg aactctctag acccaccgtt actgactcgc 7140 taccttcgaa ttcaccccca gagttgggtg caccagattg ccctgaggat ggaggttctg 7200 ggctgcgagg cacaggacct ctactgaggg tggccactgc agcacctgcc actgccgtca 7260 cctctccctc ctcagctcca gggcagtgtc cctccctggc ttgccttcta cctttgtgct 7320 aaatcctagc agacactgcc ttgaagcctc ctgaattaac tatcatcagt cctgcatttc 7380 tttggtgggg ggccaggagg gtgcatccaa tttaacttaa ctcttaccta ttttctgcag 7440 ctgctcccag attactcctt ccttccaata taactaggca aaaagaagtg aggagaaacc 7500 tgcatgaaag cattcttccc tgaaaagtta ggcctctcag agtcaccact tcctctgttg 7560 tagaaaaact atgtgatgaa actttgaaaa agatatttat gatgttaaca tttcaggtta 7620 agcctcatac gtttaaaata aaactctcag ttgtttatta tcctgatcaa gcatggaaca 7680 aagcatgttt caggatcaga tcaatacaat cttggagtca aaaggcaaat catttggaca 7740 atctgcaaaa tggagagaat acaataacta ctacagtaaa gtctgtttct gcttccttac 7800 acatagatat aattatgtta tttagtcatt atgaggggca cattcttatc tccaaaacta 7860 gcattcttaa actgagaatt atagatgggg ttcaagaatc cctaagtccc ctgaaattat 7920 ataaggcatt ctgtataaat gcaaatgtgc atttttctga cgagtgtcca tagatataaa 7980 gccatttggt cttaattctg accaataaaa aaataagtca ggaggatgca attgttgaaa 8040 gctttgaaat aaaataacaa tgtcttcttg aaatttgtga tggccaagaa agaaaatgat 8100 gatgacatta ggcttctaaa ggacatacat ttaatatttc tgtggaaata tgaggaaaat 8160 ccatggttat ctgagatagg agatacaaac tttgtaattc taataatgca ctcagtttac 8220 tctctccctc tactaatttc ctgctgaaaa taacacaaca aaaatgtaac aggggaaatt 8280 atataccgtg actgaaaact agagtcctac ttacatagtt gaaatatcaa ggaggtcaga 8340 agaaaattgg actggtgaaa acagaaaaaa cactccagtc tgccatatca ccacacaata 8400 ggatccccct tcttgccctc cacccccata agattgtgaa gggtttactg ctccttccat 8460 ctgcctgacc ccttcactat gactacacag aatctcctga tagtaaaggg ggctggagac 8520 aaggataagt tatagagcag ttggaggaag catccaaaga ttgcaaccca gggcaaatgg 8580 aaaacaggag atcctaatat gaaagaaaaa tggatcccaa tctgagaaaa ggcaaaagaa 8640 tggctacttt tttctatgct ggagtatttt ctaataatcc tgcttgaccc ttatctgacc 8700 tctttggaaa ctataacata gctgtcacag tatagtcaca atccacaaat gatgcaggtg 8760 caaatggttt atagccctgt gaagttctta aagtttagag gctaacttac agaaatgaat 8820 aagttgtttt gttttatagc ccggtagagg agttaacccc aaaggtgata tggttttatt 8880 tcctgttatg tttaacttga taatcttatt ttggcattct tttcccattg actatataca 8940 tctctatttc tcaaatgttc atggaactag ctcttttatt ttcctgctgg tttcttcagt 9000 aatgagttaa ataaaacatt gacacataca aacaaa 9036 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <400> 369 000 <210> 370 <400> 370 000 <210> 371 <211> 183 <212> PRT <213> Salmonella typhimurium <400> 371 Met Pro Pro Ala Phe Ile Thr Gly Val Thr Ser Leu Ser Asp Val Glu 1 5 10 15 Leu Asp His Glu Tyr Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg 20 25 30 Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val Leu Val His Asn 35 40 45 His Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp 50 55 60 Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val 65 70 75 80 Leu Gln Asn Tyr Arg Leu Leu Asp Thr Thr Leu Tyr Val Thr Leu Glu 85 90 95 Pro Cys Val Met Cys Ala Gly Ala Met Val His Ser Arg Ile Gly Arg 100 105 110 Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala Ala Gly Ser Leu 115 120 125 Ile Asp Val Leu His His Pro Gly Met Asn His Arg Val Glu Ile Ile 130 135 140 Glu Gly Val Leu Arg Asp Glu Cys Ala Thr Leu Leu Ser Asp Phe Phe 145 150 155 160 Arg Met Arg Arg Gln Glu Ile Lys Ala Leu Lys Lys Ala Asp Arg Ala 165 170 175 Glu Gly Ala Gly Pro Ala Val 180 <210> 372 <211> 164 <212> PRT <213> Shewanella putrefaciens <400> 372 Met Asp Glu Tyr Trp Met Gln Val Ala Met Gln Met Ala Glu Lys Ala 1 5 10 15 Glu Ala Ala Gly Glu Val Pro Val Gly Ala Val Leu Val Lys Asp Gly 20 25 30 Gln Gln Ile Ala Thr Gly Tyr Asn Leu Ser Ile Ser Gln His Asp Pro 35 40 45 Thr Ala His Ala Glu Ile Leu Cys Leu Arg Ser Ala Gly Lys Lys Leu 50 55 60 Glu Asn Tyr Arg Leu Leu Asp Ala Thr Leu Tyr Ile Thr Leu Glu Pro 65 70 75 80 Cys Ala Met Cys Ala Gly Ala Met Val His Ser Arg Ile Ala Arg Val 85 90 95 Val Tyr Gly Ala Arg Asp Glu Lys Thr Gly Ala Ala Gly Thr Val Val 100 105 110 Asn Leu Leu Gln His Pro Ala Phe Asn His Gln Val Glu Val Thr Ser 115 120 125 Gly Val Leu Ala Glu Ala Cys Ser Ala Gln Leu Ser Arg Phe Phe Lys 130 135 140 Arg Arg Arg Asp Glu Lys Lys Ala Leu Lys Leu Ala Gln Arg Ala Gln 145 150 155 160 Gln Gly Ile Glu <210> 373 <211> 173 <212> PRT <213> Haemophilus influenzae <400> 373 Met Asp Ala Ala Lys Val Arg Ser Glu Phe Asp Glu Lys Met Met Arg 1 5 10 15 Tyr Ala Leu Glu Leu Ala Asp Lys Ala Glu Ala Leu Gly Glu Ile Pro 20 25 30 Val Gly Ala Val Leu Val Asp Asp Ala Arg Asn Ile Ile Gly Glu Gly 35 40 45 Trp Asn Leu Ser Ile Val Gln Ser Asp Pro Thr Ala His Ala Glu Ile 50 55 60 Ile Ala Leu Arg Asn Gly Ala Lys Asn Ile Gln Asn Tyr Arg Leu Leu 65 70 75 80 Asn Ser Thr Leu Tyr Val Thr Leu Glu Pro Cys Thr Met Cys Ala Gly 85 90 95 Ala Ile Leu His Ser Arg Ile Lys Arg Leu Val Phe Gly Ala Ser Asp 100 105 110 Tyr Lys Thr Gly Ala Ile Gly Ser Arg Phe His Phe Phe Asp Asp Tyr 115 120 125 Lys Met Asn His Thr Leu Glu Ile Thr Ser Gly Val Leu Ala Glu Glu 130 135 140 Cys Ser Gln Lys Leu Ser Thr Phe Phe Gln Lys Arg Arg Glu Glu Lys 145 150 155 160 Lys Ile Glu Lys Ala Leu Leu Lys Ser Leu Ser Asp Lys 165 170 <210> 374 <211> 161 <212> PRT <213> Caulobacter crescentus <400> 374 Met Arg Thr Asp Glu Ser Glu Asp Gln Asp His Arg Met Met Arg Leu 1 5 10 15 Ala Leu Asp Ala Ala Arg Ala Ala Ala Glu Ala Gly Glu Thr Pro Val 20 25 30 Gly Ala Val Ile Leu Asp Pro Ser Thr Gly Glu Val Ile Ala Thr Ala 35 40 45 Gly Asn Gly Pro Ile Ala Ala His Asp Pro Thr Ala His Ala Glu Ile 50 55 60 Ala Ala Met Arg Ala Ala Ala Ala Lys Leu Gly Asn Tyr Arg Leu Thr 65 70 75 80 Asp Leu Thr Leu Val Val Thr Leu Glu Pro Cys Ala Met Cys Ala Gly 85 90 95 Ala Ile Ser His Ala Arg Ile Gly Arg Val Val Phe Gly Ala Asp Asp 100 105 110 Pro Lys Gly Gly Ala Val Val His Gly Pro Lys Phe Phe Ala Gln Pro 115 120 125 Thr Cys His Trp Arg Pro Glu Val Thr Gly Gly Val Leu Ala Asp Glu 130 135 140 Ser Ala Asp Leu Leu Arg Gly Phe Phe Arg Ala Arg Arg Lys Ala Lys 145 150 155 160 Ile <210> 375 <211> 179 <212> PRT <213> Geobacter sulfurreducens <400> 375 Met Ser Ser Leu Lys Lys Thr Pro Ile Arg Asp Asp Ala Tyr Trp Met 1 5 10 15 Gly Lys Ala Ile Arg Glu Ala Ala Lys Ala Ala Ala Arg Asp Glu Val 20 25 30 Pro Ile Gly Ala Val Ile Val Arg Asp Gly Ala Val Ile Gly Arg Gly 35 40 45 His Asn Leu Arg Glu Gly Ser Asn Asp Pro Ser Ala His Ala Glu Met 50 55 60 Ile Ala Ile Arg Gln Ala Ala Arg Arg Ser Ala Asn Trp Arg Leu Thr 65 70 75 80 Gly Ala Thr Leu Tyr Val Thr Leu Glu Pro Cys Leu Met Cys Met Gly 85 90 95 Ala Ile Ile Leu Ala Arg Leu Glu Arg Val Val Phe Gly Cys Tyr Asp 100 105 110 Pro Lys Gly Gly Ala Ala Gly Ser Leu Tyr Asp Leu Ser Ala Asp Pro 115 120 125 Arg Leu Asn His Gln Val Arg Leu Ser Pro Gly Val Cys Gln Glu Glu 130 135 140 Cys Gly Thr Met Leu Ser Asp Phe Phe Arg Asp Leu Arg Arg Arg Lys 145 150 155 160 Lys Ala Lys Ala Thr Pro Ala Leu Phe Ile Asp Glu Arg Lys Val Pro 165 170 175 Pro Glu Pro <210> 376 <400> 376 000 <210> 377 <400> 377 000 <210> 378 <400> 378 000 <210> 379 <400> 379 000 <210> 380 <400> 380 000 <210> 381 <400> 381 000 <210> 382 <400> 382 000 <210> 383 <400> 383 000 <210> 384 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 384 Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala 1 5 10 15 Thr Pro Glu Ser Ser Gly Gly Ser 20 <210> 385 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 385 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 <210> 386 <211> 104 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 386 Gly Gly Ser Gly Gly Ser Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser 1 5 10 15 Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly 20 25 30 Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly 35 40 45 Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly 50 55 60 Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly 65 70 75 80 Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala 85 90 95 Thr Ser Gly Gly Ser Gly Gly Ser 100 <210> 387 <400> 387 000 <210> 388 <400> 388 000 <210> 389 <211> 82 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 389 guuuuagagc uagaaauagc aaguuaaaau aaaggcuagu ccguuaucaa cuugaaaaag 60 uggcaccgag ucggugcuuu uu 82 <210> 390 <400> 390 000 <210> 391 <400> 391 000 <210> 392 <400> 392 000 <210> 393 <400> 393 000 <210> 394 <400> 394 000 <210> 395 <400> 395 000 <210> 396 <400> 396 000 <210> 397 <400> 397 000 <210> 398 <400> 398 000 <210> 399 <400> 399 000 <210> 400 <400> 400 000 <210> 401 <400> 401 000 <210> 402 <400> 402 000 <210> 403 <400> 403 000 <210> 404 <400> 404 000 <210> 405 <400> 405 000 <210> 406 <400> 406 000 <210> 407 <400> 407 000 <210> 408 <400> 408 000 <210> 409 <400> 409 000 <210> 410 <400> 410 000 <210> 411 <400> 411 000 <210> 412 <400> 412 000 <210> 413 <400> 413 000 <210> 414 <400> 414 000 <210> 415 <400> 415 000 <210> 416 <400> 416 000 <210> 417 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 417 Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln 1 5 10 15 Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu 20 25 30 Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile 35 40 45 Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys 50 55 60 Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu 65 70 75 80 Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys 85 90 95 Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe 100 105 110 Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys 115 120 125 Pro Glu Phe Tyr Glu Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr 130 135 140 Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Ile Ala Ala 145 150 155 160 Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly 165 170 175 Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr 180 185 190 Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu 195 200 205 Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr 210 215 220 Asn Pro Asn Val Ser Val Val Arg Ile Tyr Thr Ile Ser Asp Ala Val 225 230 235 240 Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr 245 250 255 Lys Leu Leu Glu Lys Arg Tyr Leu Leu Ser Glu Arg Leu Glu Ala Ile 260 265 270 Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile 275 280 285 Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu 290 295 300 Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn 305 310 315 320 Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val 325 330 335 Asn Gly Glu Leu Ile Arg Gly Glu Gly 340 345 <210> 418 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 418 Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln 1 5 10 15 Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu 20 25 30 Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile 35 40 45 Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys 50 55 60 Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu 65 70 75 80 Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys 85 90 95 Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe 100 105 110 Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys 115 120 125 Pro Glu Phe Tyr Lys Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr 130 135 140 Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Met Ala Ala 145 150 155 160 Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly 165 170 175 Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr 180 185 190 Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu 195 200 205 Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr 210 215 220 Asn Pro Asn Val Ser Val Val Ser Ile Tyr Thr Ile Ser Asp Ala Val 225 230 235 240 Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr 245 250 255 Lys Leu Leu Glu Lys Arg Asp Leu Leu Ser Glu Arg Leu Glu Ala Ile 260 265 270 Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile 275 280 285 Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu 290 295 300 Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn 305 310 315 320 Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val 325 330 335 Asn Gly Glu Leu Ile Arg Gly Glu Gly 340 345 <210> 419 <211> 1210 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 419 Met Ser Lys Arg His Pro Arg Ile Ser Gly Val Lys Gly Tyr Arg Leu 1 5 10 15 His Ala Gln Arg Leu Glu Tyr Thr Gly Lys Ser Gly Ala Met Arg Thr 20 25 30 Ile Lys Tyr Pro Leu Tyr Ser Ser Pro Ser Gly Gly Arg Thr Val Pro 35 40 45 Arg Glu Ile Val Ser Ala Ile Asn Asp Asp Tyr Val Gly Leu Tyr Gly 50 55 60 Leu Ser Asn Phe Asp Asp Leu Tyr Asn Ala Glu Lys Arg Asn Glu Glu 65 70 75 80 Lys Val Tyr Ser Val Leu Asp Phe Trp Tyr Asp Cys Val Gln Tyr Gly 85 90 95 Ala Val Phe Ser Tyr Thr Ala Pro Gly Leu Leu Lys Asn Val Ala Glu 100 105 110 Val Arg Gly Gly Ser Tyr Glu Leu Thr Lys Thr Leu Lys Gly Ser His 115 120 125 Leu Tyr Asp Glu Leu Gln Ile Asp Lys Val Ile Lys Phe Leu Asn Lys 130 135 140 Lys Glu Ile Ser Arg Ala Asn Gly Ser Leu Asp Lys Leu Lys Lys Asp 145 150 155 160 Ile Ile Asp Cys Phe Lys Ala Glu Tyr Arg Glu Arg His Lys Asp Gln 165 170 175 Cys Asn Lys Leu Ala Asp Asp Ile Lys Asn Ala Lys Lys Asp Ala Gly 180 185 190 Ala Ser Leu Gly Glu Arg Gln Lys Lys Leu Phe Arg Asp Phe Phe Gly 195 200 205 Ile Ser Glu Gln Ser Glu Asn Asp Lys Pro Ser Phe Thr Asn Pro Leu 210 215 220 Asn Leu Thr Cys Cys Leu Leu Pro Phe Asp Thr Val Asn Asn Asn Arg 225 230 235 240 Asn Arg Gly Glu Val Leu Phe Asn Lys Leu Lys Glu Tyr Ala Gln Lys 245 250 255 Leu Asp Lys Asn Glu Gly Ser Leu Glu Met Trp Glu Tyr Ile Gly Ile 260 265 270 Gly Asn Ser Gly Thr Ala Phe Ser Asn Phe Leu Gly Glu Gly Phe Leu 275 280 285 Gly Arg Leu Arg Glu Asn Lys Ile Thr Glu Leu Lys Lys Ala Met Met 290 295 300 Asp Ile Thr Asp Ala Trp Arg Gly Gln Glu Gln Glu Glu Glu Leu Glu 305 310 315 320 Lys Arg Leu Arg Ile Leu Ala Ala Leu Thr Ile Lys Leu Arg Glu Pro 325 330 335 Lys Phe Asp Asn His Trp Gly Gly Tyr Arg Ser Asp Ile Asn Gly Lys 340 345 350 Leu Ser Ser Trp Leu Gln Asn Tyr Ile Asn Gln Thr Val Lys Ile Lys 355 360 365 Glu Asp Leu Lys Gly His Lys Lys Asp Leu Lys Lys Ala Lys Glu Met 370 375 380 Ile Asn Arg Phe Gly Glu Ser Asp Thr Lys Glu Glu Ala Val Val Ser 385 390 395 400 Ser Leu Leu Glu Ser Ile Glu Lys Ile Val Pro Asp Asp Ser Ala Asp 405 410 415 Asp Glu Lys Pro Asp Ile Pro Ala Ile Ala Ile Tyr Arg Arg Phe Leu 420 425 430 Ser Asp Gly Arg Leu Thr Leu Asn Arg Phe Val Gln Arg Glu Asp Val 435 440 445 Gln Glu Ala Leu Ile Lys Glu Arg Leu Glu Ala Glu Lys Lys Lys Lys 450 455 460 Pro Lys Lys Arg Lys Lys Lys Ser Asp Ala Glu Asp Glu Lys Glu Thr 465 470 475 480 Ile Asp Phe Lys Glu Leu Phe Pro His Leu Ala Lys Pro Leu Lys Leu 485 490 495 Val Pro Asn Phe Tyr Gly Asp Ser Lys Arg Glu Leu Tyr Lys Lys Tyr 500 505 510 Lys Asn Ala Ala Ile Tyr Thr Asp Ala Leu Trp Lys Ala Val Glu Lys 515 520 525 Ile Tyr Lys Ser Ala Phe Ser Ser Ser Leu Lys Asn Ser Phe Phe Asp 530 535 540 Thr Asp Phe Asp Lys Asp Phe Phe Ile Lys Arg Leu Gln Lys Ile Phe 545 550 555 560 Ser Val Tyr Arg Arg Phe Asn Thr Asp Lys Trp Lys Pro Ile Val Lys 565 570 575 Asn Ser Phe Ala Pro Tyr Cys Asp Ile Val Ser Leu Ala Glu Asn Glu 580 585 590 Val Leu Tyr Lys Pro Lys Gln Ser Arg Ser Arg Lys Ser Ala Ala Ile 595 600 605 Asp Lys Asn Arg Val Arg Leu Pro Ser Thr Glu Asn Ile Ala Lys Ala 610 615 620 Gly Ile Ala Leu Ala Arg Glu Leu Ser Val Ala Gly Phe Asp Trp Lys 625 630 635 640 Asp Leu Leu Lys Lys Glu Glu His Glu Glu Tyr Ile Asp Leu Ile Glu 645 650 655 Leu His Lys Thr Ala Leu Ala Leu Leu Leu Ala Val Thr Glu Thr Gln 660 665 670 Leu Asp Ile Ser Ala Leu Asp Phe Val Glu Asn Gly Thr Val Lys Asp 675 680 685 Phe Met Lys Thr Arg Asp Gly Asn Leu Val Leu Glu Gly Arg Phe Leu 690 695 700 Glu Met Phe Ser Gln Ser Ile Val Phe Ser Glu Leu Arg Gly Leu Ala 705 710 715 720 Gly Leu Met Ser Arg Lys Glu Phe Ile Thr Arg Ser Ala Ile Gln Thr 725 730 735 Met Asn Gly Lys Gln Ala Glu Leu Leu Tyr Ile Pro His Glu Phe Gln 740 745 750 Ser Ala Lys Ile Thr Thr Pro Lys Glu Met Ser Arg Ala Phe Leu Asp 755 760 765 Leu Ala Pro Ala Glu Phe Ala Thr Ser Leu Glu Pro Glu Ser Leu Ser 770 775 780 Glu Lys Ser Leu Leu Lys Leu Lys Gln Met Arg Tyr Tyr Pro His Tyr 785 790 795 800 Phe Gly Tyr Glu Leu Thr Arg Thr Gly Gln Gly Ile Asp Gly Gly Val 805 810 815 Ala Glu Asn Ala Leu Arg Leu Glu Lys Ser Pro Val Lys Lys Arg Glu 820 825 830 Ile Lys Cys Lys Gln Tyr Lys Thr Leu Gly Arg Gly Gln Asn Lys Ile 835 840 845 Val Leu Tyr Val Arg Ser Ser Tyr Tyr Gln Thr Gln Phe Leu Glu Trp 850 855 860 Phe Leu His Arg Pro Lys Asn Val Gln Thr Asp Val Ala Val Ser Gly 865 870 875 880 Ser Phe Leu Ile Asp Glu Lys Lys Val Lys Thr Arg Trp Asn Tyr Asp 885 890 895 Ala Leu Thr Val Ala Leu Glu Pro Val Ser Gly Ser Glu Arg Val Phe 900 905 910 Val Ser Gln Pro Phe Thr Ile Phe Pro Glu Lys Ser Ala Glu Glu Glu 915 920 925 Gly Gln Arg Tyr Leu Gly Ile Asp Ile Gly Glu Tyr Gly Ile Ala Tyr 930 935 940 Thr Ala Leu Glu Ile Thr Gly Asp Ser Ala Lys Ile Leu Asp Gln Asn 945 950 955 960 Phe Ile Ser Asp Pro Gln Leu Lys Thr Leu Arg Glu Glu Val Lys Gly 965 970 975 Leu Lys Leu Asp Gln Arg Arg Gly Thr Phe Ala Met Pro Ser Thr Lys 980 985 990 Ile Ala Arg Ile Arg Glu Ser Leu Val His Ser Leu Arg Asn Arg Ile 995 1000 1005 His His Leu Ala Leu Lys His Lys Ala Lys Ile Val Tyr Glu Leu 1010 1015 1020 Glu Val Ser Arg Phe Glu Glu Gly Lys Gln Lys Ile Lys Lys Val 1025 1030 1035 Tyr Ala Thr Leu Lys Lys Ala Asp Val Tyr Ser Glu Ile Asp Ala 1040 1045 1050 Asp Lys Asn Leu Gln Thr Thr Val Trp Gly Lys Leu Ala Val Ala 1055 1060 1065 Ser Glu Ile Ser Ala Ser Tyr Thr Ser Gln Phe Cys Gly Ala Cys 1070 1075 1080 Lys Lys Leu Trp Arg Ala Glu Met Gln Val Asp Glu Thr Ile Thr 1085 1090 1095 Thr Gln Glu Leu Ile Gly Thr Val Arg Val Ile Lys Gly Gly Thr 1100 1105 1110 Leu Ile Asp Ala Ile Lys Asp Phe Met Arg Pro Pro Ile Phe Asp 1115 1120 1125 Glu Asn Asp Thr Pro Phe Pro Lys Tyr Arg Asp Phe Cys Asp Lys 1130 1135 1140 His His Ile Ser Lys Lys Met Arg Gly Asn Ser Cys Leu Phe Ile 1145 1150 1155 Cys Pro Phe Cys Arg Ala Asn Ala Asp Ala Asp Ile Gln Ala Ser 1160 1165 1170 Gln Thr Ile Ala Leu Leu Arg Tyr Val Lys Glu Glu Lys Lys Val 1175 1180 1185 Glu Asp Tyr Phe Glu Arg Phe Arg Lys Leu Lys Asn Ile Lys Val 1190 1195 1200 Leu Gly Gln Met Lys Lys Ile 1205 1210 <210> 420 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 420 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Ala Gly Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Asn Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Glu Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 421 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 421 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 422 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 422 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Thr Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Thr Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 423 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 423 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Ser Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 424 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 424 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 425 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 425 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Arg Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 426 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 426 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Leu Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 427 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 427 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 428 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 428 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 429 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 429 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Arg Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 430 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 430 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Ser Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly His His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 431 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 431 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 432 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 432 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly His His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 433 <400> 433 000 <210> 434 <400> 434 000 <210> 435 <400> 435 000 <210> 436 <400> 436 000 <210> 437 <400> 437 000 <210> 438 <400> 438 000 <210> 439 <400> 439 000 <210> 440 <400> 440 000 <210> 441 <400> 441 000 <210> 442 <400> 442 000 <210> 443 <400> 443 000 <210> 444 <400> 444 000 <210> 445 <400> 445 000 <210> 446 <400> 446 000 <210> 447 <400> 447 000 <210> 448 <400> 448 000 <210> 449 <400> 449 000 <210> 450 <400> 450 000 <210> 451 <400> 451 000 <210> 452 <400> 452 000 <210> 453 <400> 453 000 <210> 454 <400> 454 000 <210> 455 <400> 455 000 <210> 456 <400> 456 000 <210> 457 <400> 457 000 <210> 458 <400> 458 000 <210> 459 <400> 459 000 <210> 460 <400> 460 000 <210> 461 <400> 461 000 <210> 462 <400> 462 000 <210> 463 <400> 463 000 <210> 464 <400> 464 000 <210> 465 <400> 465 000 <210> 466 <400> 466 000 <210> 467 <400> 467 000 <210> 468 <400> 468 000 <210> 469 <400> 469 000 <210> 470 <400> 470 000 <210> 471 <400> 471 000 <210> 472 <400> 472 000 <210> 473 <400> 473 000 <210> 474 <400> 474 000 <210> 475 <400> 475 000 <210> 476 <400> 476 000 <210> 477 <400> 477 000 <210> 478 <400> 478 000 <210> 479 <400> 479 000 <210> 480 <400> 480 000 <210> 481 <400> 481 000 <210> 482 <400> 482 000 <210> 483 <400> 483 000 <210> 484 <400> 484 000 <210> 485 <400> 485 000 <210> 486 <400> 486 000 <210> 487 <400> 487 000 <210> 488 <400> 488 000 <210> 489 <400> 489 000 <210> 490 <400> 490 000 <210> 491 <400> 491 000 <210> 492 <400> 492 000 <210> 493 <400> 493 000 <210> 494 <400> 494 000 <210> 495 <400> 495 000 <210> 496 <400> 496 000 <210> 497 <400> 497 000 <210> 498 <400> 498 000 <210> 499 <400> 499 000 <210> 500 <400> 500 000 <210> 501 <400> 501 000 <210> 502 <400> 502 000 <210> 503 <400> 503 000 <210> 504 <400> 504 000 <210> 505 <400> 505 000 <210> 506 <400> 506 000 <210> 507 <400> 507 000 <210> 508 <400> 508 000 <210> 509 <400> 509 000 <210> 510 <400> 510 000 <210> 511 <400> 511 000 <210> 512 <400> 512 000 <210> 513 <400> 513 000 <210> 514 <400> 514 000 <210> 515 <400> 515 000 <210> 516 <400> 516 000 <210> 517 <400> 517 000 <210> 518 <400> 518 000 <210> 519 <400> 519 000 <210> 520 <400> 520 000 <210> 521 <400> 521 000 <210> 522 <400> 522 000 <210> 523 <400> 523 000 <210> 524 <400> 524 000 <210> 525 <400> 525 000 <210> 526 <400> 526 000 <210> 527 <400> 527 000 <210> 528 <400> 528 000 <210> 529 <400> 529 000 <210> 530 <400> 530 000 <210> 531 <400> 531 000 <210> 532 <400> 532 000 <210> 533 <400> 533 000 <210> 534 <400> 534 000 <210> 535 <400> 535 000 <210> 536 <400> 536 000 <210> 537 <400> 537 000 <210> 538 <400> 538 000 <210> 539 <400> 539 000 <210> 540 <400> 540 000 <210> 541 <400> 541 000 <210> 542 <400> 542 000 <210> 543 <400> 543 000 <210> 544 <400> 544 000 <210> 545 <400> 545 000 <210> 546 <400> 546 000 <210> 547 <400> 547 000 <210> 548 <400> 548 000 <210> 549 <400> 549 000 <210> 550 <400> 550 000 <210> 551 <400> 551 000 <210> 552 <400> 552 000 <210> 553 <400> 553 000 <210> 554 <400> 554 000 <210> 555 <400> 555 000 <210> 556 <400> 556 000 <210> 557 <400> 557 000 <210> 558 <400> 558 000 <210> 559 <400> 559 000 <210> 560 <400> 560 000 <210> 561 <400> 561 000 <210> 562 <400> 562 000 <210> 563 <400> 563 000 <210> 564 <400> 564 000 <210> 565 <400> 565 000 <210> 566 <400> 566 000 <210> 567 <400> 567 000 <210> 568 <400> 568 000 <210> 569 <400> 569 000 <210> 570 <400> 570 000 <210> 571 <400> 571 000 <210> 572 <400> 572 000 <210> 573 <400> 573 000 <210> 574 <400> 574 000 <210> 575 <400> 575 000 <210> 576 <400> 576 000 <210> 577 <400> 577 000 <210> 578 <400> 578 000 <210> 579 <400> 579 000 <210> 580 <400> 580 000 <210> 581 <400> 581 000 <210> 582 <400> 582 000 <210> 583 <400> 583 000 <210> 584 <400> 584 000 <210> 585 <400> 585 000 <210> 586 <400> 586 000 <210> 587 <400> 587 000 <210> 588 <400> 588 000 <210> 589 <400> 589 000 <210> 590 <400> 590 000 <210> 591 <400> 591 000 <210> 592 <400> 592 000 <210> 593 <400> 593 000 <210> 594 <400> 594 000 <210> 595 <400> 595 000 <210> 596 <400> 596 000 <210> 597 <400> 597 000 <210> 598 <400> 598 000 <210> 599 <400> 599 000 <210> 600 <400> 600 000 <210> 601 <400> 601 000 <210> 602 <400> 602 000 <210> 603 <400> 603 000 <210> 604 <400> 604 000 <210> 605 <400> 605 000 <210> 606 <400> 606 000 <210> 607 <400> 607 000 <210> 608 <400> 608 000 <210> 609 <400> 609 000 <210> 610 <400> 610 000 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <400> 651 000 <210> 652 <400> 652 000 <210> 653 <400> 653 000 <210> 654 <400> 654 000 <210> 655 <400> 655 000 <210> 656 <400> 656 000 <210> 657 <400> 657 000 <210> 658 <400> 658 000 <210> 659 <400> 659 000 <210> 660 <400> 660 000 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 672 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 673 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 673 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Thr Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 674 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 674 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 675 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 675 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 676 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 676 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 677 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 677 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 678 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 678 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Pro Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 679 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 679 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met His Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 680 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 680 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 681 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 681 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 682 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 682 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 683 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 683 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 684 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 684 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 685 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 685 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser 20 <210> 686 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 686 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser 35 40 <210> 687 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 687 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 35 40 45 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 <210> 688 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 688 Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser 1 5 10 15 Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser 20 25 30 Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu 35 40 45 Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser 50 55 60 Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr 65 70 75 80 Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser 85 90 <210> 689 <400> 689 000 <210> 690 <400> 690 000 <210> 691 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 691 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 692 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 692 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 693 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 693 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val His Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Pro Ile Gly Arg His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Ser Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Lys Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 694 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 694 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Pro Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 695 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 695 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Pro Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 696 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 696 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 697 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 697 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 698 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 698 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 699 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 699 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 700 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 700 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 701 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 701 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 702 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 702 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 703 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 703 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 704 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 704 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 705 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 705 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 706 <211> 1767 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 706 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 385 390 395 400 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 405 410 415 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 420 425 430 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 435 440 445 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 450 455 460 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 465 470 475 480 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 485 490 495 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 500 505 510 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 515 520 525 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 530 535 540 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 545 550 555 560 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 565 570 575 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 580 585 590 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 595 600 605 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 610 615 620 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 625 630 635 640 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 645 650 655 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 660 665 670 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 675 680 685 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 690 695 700 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 705 710 715 720 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 725 730 735 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 740 745 750 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 755 760 765 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 770 775 780 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 785 790 795 800 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 805 810 815 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 820 825 830 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 835 840 845 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 850 855 860 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 865 870 875 880 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 885 890 895 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 900 905 910 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 915 920 925 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 930 935 940 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 945 950 955 960 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 965 970 975 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 980 985 990 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 995 1000 1005 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg 1010 1015 1020 Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 1025 1030 1035 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys 1040 1045 1050 Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu 1055 1060 1065 Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln 1070 1075 1080 Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys 1085 1090 1095 Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala 1100 1105 1110 Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr 1115 1120 1125 Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys 1130 1135 1140 Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr 1145 1150 1155 Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 1160 1165 1170 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 1175 1180 1185 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr 1190 1195 1200 Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 1205 1210 1215 Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser 1220 1225 1230 Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 1235 1240 1245 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val 1250 1255 1260 Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 1265 1270 1275 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg 1280 1285 1290 Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln 1295 1300 1305 Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu 1310 1315 1320 Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile 1325 1330 1335 Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp 1340 1345 1350 Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn 1355 1360 1365 Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr 1370 1375 1380 Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr 1385 1390 1395 Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser 1400 1405 1410 Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1415 1420 1425 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly 1430 1435 1440 Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly 1445 1450 1455 Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys 1460 1465 1470 Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val 1475 1480 1485 Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn 1490 1495 1500 Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys 1505 1510 1515 Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val 1520 1525 1530 Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val 1535 1540 1545 Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu 1550 1555 1560 Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val 1565 1570 1575 Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu 1580 1585 1590 Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu 1595 1600 1605 Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe 1610 1615 1620 Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu 1625 1630 1635 Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 1640 1645 1650 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1655 1660 1665 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn 1670 1675 1680 Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile 1685 1690 1695 His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys 1700 1705 1710 Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys 1715 1720 1725 Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu 1730 1735 1740 Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly 1745 1750 1755 Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 <210> 707 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 707 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 708 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 708 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ser Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 709 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 709 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Arg Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 710 <211> 1773 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 710 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Leu Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Gly Glu Gly 225 230 235 240 Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile 245 250 255 Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile 260 265 270 Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly 275 280 285 Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn 290 295 300 Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro 305 310 315 320 Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu 325 330 335 Cys Asn Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe 340 345 350 Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser 355 360 365 Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr 370 375 380 Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser 385 390 395 400 Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr 405 410 415 Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr 420 425 430 Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp 435 440 445 Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg 450 455 460 Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe 465 470 475 480 Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu 485 490 495 Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile 500 505 510 Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr 515 520 525 Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp 530 535 540 Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly 545 550 555 560 His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp 565 570 575 Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu 580 585 590 Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala 595 600 605 Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro 610 615 620 Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu 625 630 635 640 Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala 645 650 655 Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu 660 665 670 Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys 675 680 685 Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr 690 695 700 Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp 705 710 715 720 Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln 725 730 735 Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly 740 745 750 Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys 755 760 765 Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu 770 775 780 Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp 785 790 795 800 Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile 805 810 815 Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu 820 825 830 Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro 835 840 845 Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu 850 855 860 Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala 865 870 875 880 Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu 885 890 895 Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe 900 905 910 Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met 915 920 925 Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp 930 935 940 Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu 945 950 955 960 Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly 965 970 975 Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu 980 985 990 Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp 995 1000 1005 Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg 1010 1015 1020 Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp 1025 1030 1035 Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp 1040 1045 1050 Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln 1055 1060 1065 Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 1070 1075 1080 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 1085 1090 1095 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser 1100 1105 1110 Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 1115 1120 1125 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys 1130 1135 1140 Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 1145 1150 1155 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu 1160 1165 1170 Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 1175 1180 1185 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu 1190 1195 1200 Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val 1205 1210 1215 Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp 1220 1225 1230 His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn 1235 1240 1245 Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn 1250 1255 1260 Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg 1265 1270 1275 Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn 1280 1285 1290 Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala 1295 1300 1305 Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 1310 1315 1320 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 1325 1330 1335 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys 1340 1345 1350 Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 1355 1360 1365 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu 1370 1375 1380 Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu 1385 1390 1395 Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg 1400 1405 1410 Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala 1415 1420 1425 Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu 1430 1435 1440 Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu 1445 1450 1455 Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp 1460 1465 1470 Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile 1475 1480 1485 Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser 1490 1495 1500 Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys 1505 1510 1515 Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val 1520 1525 1530 Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser 1535 1540 1545 Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met 1550 1555 1560 Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1565 1570 1575 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro 1580 1585 1590 Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu 1595 1600 1605 Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro 1610 1615 1620 Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys 1625 1630 1635 Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val 1640 1645 1650 Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser 1655 1660 1665 Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys 1670 1675 1680 Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu 1685 1690 1695 Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly 1700 1705 1710 Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys 1715 1720 1725 Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His 1730 1735 1740 Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln 1745 1750 1755 Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1760 1765 1770 <210> 711 <211> 1775 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 711 Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu 1 5 10 15 Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala 20 25 30 Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro 35 40 45 Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg 50 55 60 Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu 65 70 75 80 Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His 85 90 95 Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly 100 105 110 Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His 115 120 125 Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu 130 135 140 Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys 145 150 155 160 Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser 165 170 175 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 180 185 190 Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr 195 200 205 Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg 210 215 220 Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly 225 230 235 240 Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala 245 250 255 Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg 260 265 270 Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys 275 280 285 Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val 290 295 300 Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His 305 310 315 320 Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala 325 330 335 Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln 340 345 350 Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly 355 360 365 Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser 370 375 380 Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys 385 390 395 400 Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val 405 410 415 Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly 420 425 430 Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu 435 440 445 Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala 450 455 460 Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu 465 470 475 480 Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg 485 490 495 Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His 500 505 510 Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr 515 520 525 Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys 530 535 540 Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe 545 550 555 560 Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp 565 570 575 Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe 580 585 590 Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu 595 600 605 Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln 610 615 620 Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu 625 630 635 640 Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu 645 650 655 Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp 660 665 670 Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala 675 680 685 Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val 690 695 700 Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg 705 710 715 720 Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg 725 730 735 Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys 740 745 750 Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe 755 760 765 Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu 770 775 780 Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr 785 790 795 800 Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His 805 810 815 Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn 820 825 830 Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val 835 840 845 Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys 850 855 860 Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys 865 870 875 880 Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys 885 890 895 Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu 900 905 910 Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu 915 920 925 Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile 930 935 940 Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu 945 950 955 960 Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile 965 970 975 Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp 980 985 990 Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn 995 1000 1005 Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu 1010 1015 1020 Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu 1025 1030 1035 Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 1040 1045 1050 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 1055 1060 1065 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly 1070 1075 1080 Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 1085 1090 1095 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly 1100 1105 1110 Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 1115 1120 1125 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu 1130 1135 1140 Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 1145 1150 1155 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser 1160 1165 1170 Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly 1175 1180 1185 Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln 1190 1195 1200 Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met 1205 1210 1215 Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp 1220 1225 1230 Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile 1235 1240 1245 Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser 1250 1255 1260 Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr 1265 1270 1275 Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 1280 1285 1290 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 1295 1300 1305 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile 1310 1315 1320 Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 1325 1330 1335 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr 1340 1345 1350 Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 1355 1360 1365 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala 1370 1375 1380 Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro 1385 1390 1395 Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp 1400 1405 1410 Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala 1415 1420 1425 Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys 1430 1435 1440 Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu 1445 1450 1455 Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly 1460 1465 1470 Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val 1475 1480 1485 Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys 1490 1495 1500 Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg 1505 1510 1515 Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro 1520 1525 1530 Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1535 1540 1545 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr 1550 1555 1560 Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu 1565 1570 1575 Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys 1580 1585 1590 Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg 1595 1600 1605 Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala 1610 1615 1620 Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr 1625 1630 1635 Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu 1640 1645 1650 Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln 1655 1660 1665 Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu 1670 1675 1680 Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile 1685 1690 1695 Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn 1700 1705 1710 Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp 1715 1720 1725 Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu 1730 1735 1740 Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu 1745 1750 1755 Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg 1760 1765 1770 Lys Val 1775 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <400> 743 000 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <211> 347 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 750 Met Gly Pro Arg Ala Arg Pro Ala Leu Leu Leu Leu Met Leu Leu Gln 1 5 10 15 Thr Ala Val Leu Gln Gly Arg Leu Leu Arg Ser His Ser Leu His Tyr 20 25 30 Leu Phe Met Gly Ala Ser Glu Gln Asp Leu Gly Leu Ser Leu Phe Glu 35 40 45 Ala Leu Gly Tyr Val Asp Asp Gln Leu Phe Val Phe Tyr Asp His Glu 50 55 60 Ser Arg Arg Val Glu Pro Arg Thr Pro Trp Val Ser Ser Arg Ile Ser 65 70 75 80 Ser Gln Met Trp Leu Gln Leu Ser Gln Ser Leu Lys Gly Trp Asp His 85 90 95 Met Phe Thr Val Asp Phe Trp Thr Ile Met Glu Asn His Asn His Ser 100 105 110 Lys Glu Ser His Thr Leu Gln Val Ile Leu Gly Cys Glu Met Gln Glu 115 120 125 Asp Asn Ser Thr Glu Gly Tyr Trp Lys Tyr Gly Tyr Asp Gly Gln Asp 130 135 140 His Leu Glu Phe Cys Pro Asp Thr Leu Asp Trp Arg Ala Ala Glu Pro 145 150 155 160 Arg Ala Trp Pro Thr Lys Leu Glu Trp Glu Arg His Lys Ile Arg Ala 165 170 175 Arg Gln Asn Arg Ala Tyr Leu Glu Arg Asp Cys Pro Ala Gln Leu Gln 180 185 190 Gln Leu Leu Glu Leu Gly Arg Gly Val Leu Asp Gln Gln Val Pro Pro 195 200 205 Leu Val Lys Val Thr His His Val Thr Ser Ser Val Thr Thr Leu Arg 210 215 220 Cys Arg Ala Leu Asn Tyr Tyr Pro Gln Asn Ile Thr Met Lys Trp Leu 225 230 235 240 Lys Asp Lys Gln Pro Met Asp Ala Lys Glu Phe Glu Pro Lys Asp Val 245 250 255 Leu Pro Asn Gly Asp Gly Thr Tyr Gln Gly Trp Ile Thr Leu Ala Val 260 265 270 Pro Pro Gly Glu Glu Gln Arg Tyr Thr Cys Gln Val Glu His Pro Gly 275 280 285 Leu Asp Gln Pro Leu Ile Val Ile Trp Glu Pro Ser Pro Ser Gly Thr 290 295 300 Leu Val Ile Gly Val Ile Ser Gly Ile Ala Val Phe Val Val Ile Leu 305 310 315 320 Phe Ile Gly Ile Leu Phe Ile Ile Leu Arg Lys Arg Gln Gly Ser Arg 325 330 335 Gly Ala Met Gly His Tyr Val Leu Ala Glu Arg 340 345 <210> 751 <400> 751 000 <210> 752 <400> 752 000 <210> 753 <400> 753 000 <210> 754 <400> 754 000 <210> 755 <400> 755 000 <210> 756 <400> 756 000 <210> 757 <400> 757 000 <210> 758 <400> 758 000 <210> 759 <400> 759 000 <210> 760 <400> 760 000 <210> 761 <400> 761 000 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 800 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 1 5 10 15 Ser Glu Ser Ala Thr Pro Glu Ser 20 <210> 801 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <222> (5)..(120) <223> May be absent <220> <221> MISC_FEATURE <222> (137)..(256) <223> May be absent <400> 801 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 1 5 10 15 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 20 25 30 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 35 40 45 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 50 55 60 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 65 70 75 80 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 85 90 95 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 100 105 110 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 115 120 125 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 130 135 140 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 145 150 155 160 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 165 170 175 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 180 185 190 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 195 200 205 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 210 215 220 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 225 230 235 240 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser 245 250 255 <210> 802 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 802 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ser Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 803 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 803 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Arg Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 804 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 804 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Asn Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 805 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <400> 805 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Leu Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp 165 <210> 806 <400> 806 000 <210> 807 <400> 807 000 <210> 808 <400> 808 000 <210> 809 <400> 809 000 <210> 810 <400> 810 000 <210> 811 <400> 811 000 <210> 812 <400> 812 000 <210> 813 <400> 813 000 <210> 814 <400> 814 000 <210> 815 <400> 815 000 <210> 816 <400> 816 000 <210> 817 <400> 817 000 <210> 818 <400> 818 000 <210> 819 <400> 819 000 <210> 820 <400> 820 000 <210> 821 <400> 821 000 <210> 822 <400> 822 000 <210> 823 <400> 823 000 <210> 824 <400> 824 000 <210> 825 <400> 825 000 <210> 826 <400> 826 000 <210> 827 <400> 827 000 <210> 828 <400> 828 000 <210> 829 <400> 829 000 <210> 830 <400> 830 000 <210> 831 <400> 831 000 <210> 832 <400> 832 000 <210> 833 <400> 833 000 <210> 834 <400> 834 000 <210> 835 <400> 835 000 <210> 836 <400> 836 000 <210> 837 <400> 837 000 <210> 838 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 838 cttgggggcc ccttccccac acta 24 <210> 839 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 839 cttgggggcc ccttccccac act 23 <210> 840 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 840 cttgggggcc ccttccccac ac 22 <210> 841 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 841 cttgggggcc ccttccccac a 21 <210> 842 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 842 cttgggggcc ccttccccac 20 <210> 843 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 843 cttgggggcc ccttcccca 19 <210> 844 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 844 cttgggggcc ccttcccc 18 <210> 845 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 845 cttgggggcc ccttccc 17 <210> 846 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 846 ucaugugggg aaggggcccc caag 24 <210> 847 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 847 caugugggga aggggccccc aag 23 <210> 848 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 848 auguggggaa ggggccccca ag 22 <210> 849 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 849 uguggggaag gggcccccaa g 21 <210> 850 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 850 guggggaagg ggcccccaag 20 <210> 851 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 851 uggggaaggg gcccccaag 19 <210> 852 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 852 ggggaagggg cccccaag 18 <210> 853 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 853 gggaaggggc ccccaag 17 <210> 854 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 854 gggtgctcca cctggtacgt atat 24 <210> 855 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 855 gggtgctcca cctggtacgt ata 23 <210> 856 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 856 gggtgctcca cctggtacgt at 22 <210> 857 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 857 gggtgctcca cctggtacgt a 21 <210> 858 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 858 gggtgctcca cctggtacgt 20 <210> 859 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 859 gggtgctcca cctggtacg 19 <210> 860 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 860 gggtgctcca cctggtac 18 <210> 861 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 861 gggtgctcca cctggta 17 <210> 862 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 862 auauacguac cagguggagc accc 24 <210> 863 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 863 uauacguacc agguggagca ccc 23 <210> 864 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 864 auacguacca gguggagcac cc 22 <210> 865 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 865 uacguaccag guggagcacc c 21 <210> 866 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 866 acguaccagg uggagcaccc 20 <210> 867 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 867 cguaccaggu ggagcaccc 19 <210> 868 <211> 18 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 868 guaccaggug gagcaccc 18 <210> 869 <211> 17 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 869 uaccaggugg agcaccc 17 <210> 870 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 870 gacguaccag guggagcacc c 21 <210> 871 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 871 atgggcccgc gagccaggcc ggcgcttctc ctcctgatgc ttttgcagac cgcggtcctg 60 caggggcgct tgctgcgttc acactctctg cactacctct tcatgggtgc ctcagagcag 120 gaccttggtc tttccttgtt tgaagctttg ggctacgtgg atgaccagct gttcgtgttc 180 tatgatcatg agagtcgccg tgtggagccc cgaactccat gggtttccag tagaatttca 240 agccagatgt ggctgcagct gagtcagagt ctgaaagggt gggatcacat gttcactgtt 300 gacttctgga ctattatgga aaatcacaac cacagcaagg agtcccacac cctgcaggtc 360 atcctgggct gtgaaatgca agaagacaac agtaccgagg gctactggaa gtacgggtat 420 gatgggcagg accaccttga attctgccct gacacactgg attggagagc agcagaaccc 480 agggcctggc ccaccaagct ggagtgggaa aggcacaaga ttcgggccag gcagaacagg 540 gcctacctgg agagggactg ccctgcacag ctgcagcagt tgctggagct ggggagaggt 600 gttttggacc aacaagtgcc tcctttggtg aaggtgacac atcatgtgac ctcttcagtg 660 accactctac ggtgtcgggc cttgaactac tacccccaga acatcaccat gaagtggctg 720 aaggataagc agccaatgga tgccaaggag ttcgaaccta aagacgtatt gcccaatggg 780 gatgggacct accagggctg gataaccttg gctgtacccc ctggggaaga gcagagatat 840 acgtgccagg tggagcaccc aggcctggat cagcccctca ttgtgatctg ggagccctca 900 ccgtctggca ccctagtcat tggagtcatc agtggaattg ctgtttttgt cgtcatcttg 960 ttcattggaa ttttgttcat aatattaagg aagaggcagg gttcaagagg agccatgggg 1020 cactacgtct tagctgaacg tgagtga 1047

Claims (272)

  1. HBG1 또는 HBG2 유전자의 프로모터를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HBG1 또는 HBG2 유전자의 프로모터의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
  2. 제1항에 있어서, 가이드 서열이 프로모터의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵염기를 포함하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 염기 편집제가 표적 핵산 서열을 니킹하는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 표적 핵산 서열이 하기를 포함하는 것인 방법.
    Figure pct00189
  5. 제4항에 있어서, 표적 핵산 서열이 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 표적 핵산 서열이
    Figure pct00190
    를 포함하는 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00191
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 가이드 서열이
    Figure pct00192
    를 포함하는 것인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00193

    여기서 서열식별번호: 845의 위치 14에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  10. 제1항 내지 제3항 중 어느 한 항에 있어서, 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00194
  11. 제10항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00195

    여기서 서열식별번호: 302의 위치 21에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  12. 제10항 또는 제11항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845를 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  13. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00196
  14. 제13항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00197

    여기서 서열식별번호: 303의 위치 15, 17, 18 또는 19 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  15. 제13항 또는 제14항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845 또는 서열식별번호: 302를 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853 또는 서열식별번호: 259를 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  16. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00198
  17. 제16항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00199

    여기서 서열식별번호: 309의 위치 22에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  18. 제16항 또는 제17항에 있어서,
    제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302 또는 서열식별번호: 303을 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259 또는 서열식별번호: 260을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  19. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00200
  20. 제19항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00201

    여기서 서열식별번호: 310의 위치 19에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  21. 제19항 또는 제20항에 있어서,
    제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303 또는 서열식별번호: 309를 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  22. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00202
  23. 제22항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00203

    여기서 서열식별번호: 311의 위치 17에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  24. 제22항 또는 제23항에 있어서, 제1항 내지 제21항 중 어느 한 항의 방법을 수행하는 것을 추가로 포함하는 방법.
  25. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00204
  26. 제25항에 있어서, 프로모터의 표적 핵산 서열이 하기의 핵산 위치 16 및 17에서의 T를 포함하며,
    Figure pct00205

    여기서 위치 16 또는 17 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 T에서 C로의 돌연변이를 유발하는 것인 방법.
  27. 제25항 또는 제26항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309 또는 서열식별번호: 311을 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266 또는 서열식별번호: 268을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  28. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00206
  29. 제28항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00207

    여기서 서열식별번호: 313의 위치 15, 16 또는 19 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  30. 제28항 또는 제29항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311 또는 서열식별번호: 312를 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268 또는 서열식별번호: 269를 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  31. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00208
  32. 제28항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00209

    여기서 서열식별번호: 319의 위치 16, 21 또는 22 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  33. 제31항 또는 제32항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312 또는 서열식별번호: 313을 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269 또는 서열식별번호: 270을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  34. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00210
  35. 제34항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00211

    여기서 서열식별번호: 320의 위치 17 또는 18 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  36. 제34항 또는 제35항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313 또는 서열식별번호: 319를 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270 또는 서열식별번호: 276을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  37. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00212
  38. 제37항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00213

    여기서 서열식별번호: 321의 위치 16 또는 17 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  39. 제37항 또는 제38항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313, 서열식별번호: 319 또는 서열식별번호: 320을 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270, 서열식별번호: 276 또는 서열식별번호: 277을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  40. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00214
  41. 제40항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00215

    여기서 서열식별번호: 322의 위치 16, 17 또는 20 중 어느 하나에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  42. 제40항 또는 제41항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313, 서열식별번호: 319, 서열식별번호: 320 또는 서열식별번호: 321을 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270, 서열식별번호: 276, 서열식별번호: 277 또는 서열식별번호: 278을 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  43. 제1항 내지 제3항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00216
  44. 제43항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00217

    여기서 서열식별번호: 323의 위치 15에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  45. 제43항 또는 제44항에 있어서, 제2 표적 핵산 서열에 상보적인 제2 가이드 서열을 포함하는 제2 gRNA를 사용하여 프로모터의 센스 또는 안티센스 가닥 내의 제2 A 핵염기를 탈아미노화시키는 것을 추가로 포함하며, 여기서
    (a) 제2 표적 핵산은 서열식별번호: 845, 서열식별번호: 302, 서열식별번호: 303, 서열식별번호: 309, 서열식별번호: 311, 서열식별번호: 312, 서열식별번호: 313, 서열식별번호: 319, 서열식별번호: 320, 서열식별번호: 321 또는 서열식별번호: 322를 포함하거나;
    (b) 제2 가이드 서열은 서열식별번호: 853, 서열식별번호: 259, 서열식별번호: 260 또는 서열식별번호: 266, 서열식별번호: 268, 서열식별번호: 269, 서열식별번호: 270, 서열식별번호: 276, 서열식별번호: 277, 서열식별번호: 278 또는 서열식별번호: 279를 포함하거나; 또는
    (c) (a) 및 (b) 둘 다인 방법.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 프로모터 내의 T-A 염기 쌍에서 프로모터 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
  47. 제1항 내지 제46항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 태아성 헤모글로빈의 유전성 지속 (HPFH)과 연관된 서열을 생성하는 것인 방법.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 유전자의 전사의 증가를 일으키는 것인 방법.
  49. 제1항 내지 제48항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 단백질의 증가를 일으키는 것인 방법.
  50. 제1항 내지 제49항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG2 유전자의 전사의 증가를 일으키는 것인 방법.
  51. 제1항 내지 제50항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG2 단백질의 증가를 일으키는 것인 방법.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 및 HBG2 유전자 둘 다의 전사의 증가를 일으키는 것인 방법.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBG1 및 HBG2 단백질의 양의 증가를 일으키는 것인 방법.
  54. 제1항 내지 제53항 중 어느 한 항에 있어서, HBG1 또는 HBG2 유전자의 프로모터가 세포 내에 존재하는 것인 방법.
  55. 제1항 내지 제54항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
  56. 제1항 내지 제54항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
  57. 제56항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
  58. 제56항 또는 제57항에 있어서, 프로모터 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에게 태아성 헤모글로빈의 유전성 지속 (HPFH)을 부여하는 것인 방법.
  59. 제56항 내지 제58항 중 어느 한 항에 있어서, 대상체가 혈액 질환 또는 장애를 갖는 것인 방법.
  60. 제59항에 있어서, 질환 또는 장애가 빈혈인 방법.
  61. 제60항에 있어서, 빈혈이 겸상 적혈구성 빈혈인 방법.
  62. 제59항에 있어서, 질환 또는 장애가 베타-지중해빈혈인 방법.
  63. 제59항 내지 제62항 중 어느 한 항에 있어서, 질환 또는 장애가 글로빈 단백질을 코딩하는 유전자 또는 이러한 유전자의 프로모터 내의 돌연변이에 의해 유발되는 것인 방법.
  64. 제63항에 있어서, 유전자가 CYGB, HBA1, HBA2, HBB, HBD, HBE1, HBG1, HBG2, HBM, HBQ1, HBZ 또는 MB인 방법.
  65. HFE 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HFE 유전자의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
  66. 제65항에 있어서, HFE 유전자가 C에서 T로의 돌연변이를 포함하는 것인 방법.
  67. 제66항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 C에서 T로의 돌연변이를 교정하는 것인 방법.
  68. 제66항에 있어서, HFE 유전자가 Cys에서 Tyr로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
  69. 제68항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Cys에서 Tyr로의 돌연변이를 교정하는 것인 방법.
  70. 제65항 내지 제69항 중 어느 한 항에 있어서, 가이드 서열이 HFE 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
  71. 제65항 내지 제70항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
  72. 제65항 내지 제71항 중 어느 한 항에 있어서, HFE 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
    Figure pct00218
  73. 제72항에 있어서, 표적 핵산 서열이 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 방법.
  74. 제65항 내지 제73항 중 어느 한 항에 있어서, HFE 유전자의 표적 핵산 서열이
    Figure pct00219
    를 포함하는 것인 방법.
  75. 제65항 내지 제74항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00220
  76. 제75항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
  77. 제65항 내지 제76항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 핵산 서열
    Figure pct00221
    를 포함하는 것인 방법.
  78. 제65항 내지 제77항 중 어느 한 항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00222

    여기서 서열식별번호: 861의 위치 16에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  79. 제65항 내지 제78항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HFE 유전자 내의 T-A 염기 쌍에서 HFE 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
  80. 제65항 내지 제79항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 유전성 혈색소증 (HHC)과 연관된 서열을 교정하도록 하는 것인 방법.
  81. 제65항 내지 제80항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HFE 유전자로부터 전사된 HFE 단백질의 기능 증가를 일으키는 것인 방법.
  82. 제65항 내지 제81항 중 어느 한 항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HFE 안정성 또는 반감기의 증가를 일으키는 것인 방법.
  83. 제65항 내지 제82항 중 어느 한 항에 있어서, HFE 유전자가 세포 내에 존재하는 것인 방법.
  84. 제83항에 있어서, HFE 유전자가 Cys에서 Tyr로의 돌연변이를 포함하는 HFE 단백질을 코딩하는 것인 방법.
  85. 제84항에 있어서, HFE 단백질이 하기 아미노산 서열의 잔기 282에서의 Cys에서 Tyr로의 돌연변이 (C282Y)를 포함하는 것인 방법.
    Figure pct00223
  86. 제83항 내지 제85항 중 어느 한 항에 있어서, 세포가 불멸화 림프모구성 세포 (LCL)인 방법.
  87. 제65항 내지 제86항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
  88. 제65항 내지 제85항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
  89. 제88항에 있어서, 대상체가 철 축적 장애를 갖는 것인 방법.
  90. 제89항에 있어서, 철 축적 장애가 유전성 혈색소증 (HHC)인 방법.
  91. 제88항 내지 제90항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
  92. 제90항에 있어서, HFE 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에서 철 축적 장애의 1종 이상의 증상을 호전시키는 것인 방법.
  93. HBB 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 HBB 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, HBB 유전자의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
  94. 제93항에 있어서, HBB 유전자가 C에서 T로의 돌연변이를 포함하는 것인 방법.
  95. 제94항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 C에서 T로의 돌연변이를 교정하는 것인 방법.
  96. 제94항에 있어서, HBB 유전자가 Glu에서 Val로의 돌연변이 또는 Glu에서 Lys로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
  97. 제96항에 있어서, Glu에서 Val로의 돌연변이 또는 Glu에서 Lys로의 돌연변이가 하기 아미노산 서열의 아미노산 위치 6에서의 것인 방법.
    Figure pct00224
  98. 제97항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Glu에서 Val로의 돌연변이 또는 Glu에서 Lys로의 돌연변이를 교정하는 것인 방법.
  99. 제93항 내지 제98항 중 어느 한 항에 있어서, 가이드 서열이 HBB 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
  100. 제93항 내지 제99항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
  101. 제93항 내지 제100항 중 어느 한 항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
    Figure pct00225
  102. 제101항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00226

    여기서 서열식별번호: 324의 위치 17에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  103. 제101항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00227

    여기서 서열식별번호: 325의 위치 18에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  104. 제101항에 있어서, 표적 핵산 서열이 하기를 포함하며,
    Figure pct00228

    여기서 서열식별번호: 331의 위치 22에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  105. 제101항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00229

    여기서 서열식별번호: 332의 위치 15에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  106. 제101항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00230

    여기서 서열식별번호: 333의 위치 23에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  107. 제101항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00231

    여기서 서열식별번호: 334의 위치 17에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  108. 제93항 내지 제107항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00232
  109. 제108항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
  110. 제93항 내지 제109항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자 내의 T-A 염기 쌍에서 HBB 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
  111. 제93항 내지 제110항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 겸상 적혈구 질환과 연관된 서열을 교정하도록 하는 것인 방법.
  112. 제93항 내지 제110항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 Hb C 베타-지중해빈혈과 연관된 서열을 교정하도록 하는 것인 방법.
  113. 제93항 내지 제112항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자로부터 전사된 베타-글로빈 단백질의 기능 증가를 일으키는 것인 방법.
  114. 제93항 내지 제113항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-글로빈 안정성 또는 반감기의 증가를 일으키는 것인 방법.
  115. 제93항 내지 제114항 중 어느 한 항에 있어서, HBB 유전자가 세포 내에 존재하는 것인 방법.
  116. 제93항 내지 제115항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
  117. 제93항 내지 제116항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
  118. 제117항에 있어서, 대상체가 겸상 적혈구 질환을 갖는 것인 방법.
  119. 제117항에 있어서, 대상체가 베타-지중해빈혈을 갖는 것인 방법.
  120. 제119항에 있어서, 대상체가 Hb C 베타-지중해빈혈 (헤모글로빈 C 질환)을 갖는 것인 방법.
  121. 제93항 내지 제120항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
  122. 제118항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에서 겸상 적혈구 질환의 1종 이상의 증상을 호전시키는 것인 방법.
  123. 제119항 또는 제120항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-지중해빈혈의 1종 이상의 증상을 호전시키는 것인 방법.
  124. 제94항에 있어서, HBB 유전자가 Glu에서 Lys로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
  125. 제124항에 있어서, Glu에서 Lys로의 돌연변이가 하기 아미노산 서열의 아미노산 위치 26에서의 것인 방법.
    Figure pct00233
  126. 제125항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Glu에서 Lys로의 돌연변이를 교정하는 것인 방법.
  127. 제124항 내지 제126항 중 어느 한 항에 있어서, 가이드 서열이 HBB 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
  128. 제124항 내지 제127항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
  129. 제124항 내지 제128항 중 어느 한 항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
    Figure pct00234
  130. 제129항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00235

    여기서 서열식별번호: 335의 위치 15에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  131. 제129항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00236

    여기서 서열식별번호: 336의 위치 16에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  132. 제129항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00237

    여기서 위치 19에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  133. 제124항 내지 제132항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00238
  134. 제133항에 있어서, gRNA의 가이드 서열이 5'에 G를 추가로 포함하는 것인 방법.
  135. 제124항 내지 제134항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자 내의 T-A 염기 쌍에서 HBB 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
  136. 제124항 내지 제136항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 Hb E 베타-지중해빈혈과 연관된 서열을 교정하도록 하는 것인 방법.
  137. 제124항 내지 제136항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 HBB 유전자로부터 전사된 베타-글로빈 단백질의 기능 증가를 일으키는 것인 방법.
  138. 제124항 내지 제137항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-글로빈 안정성 또는 반감기의 증가를 일으키는 것인 방법.
  139. 제124항 내지 제138항 중 어느 한 항에 있어서, HBB 유전자가 세포 내에 존재하는 것인 방법.
  140. 제124항 내지 제139항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
  141. 제124항 내지 제140항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
  142. 제141항에 있어서, 대상체가 베타-지중해빈혈을 갖는 것인 방법.
  143. 제142항에 있어서, 대상체가 Hb E 베타-지중해빈혈 (헤모글로빈 E 질환)을 갖는 것인 방법.
  144. 제124항 내지 제143항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
  145. 제141항, 제142항 및 제144항 중 어느 한 항에 있어서, HBB 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 베타-지중해빈혈의 1종 이상의 증상을 호전시키는 것인 방법.
  146. F8 유전자를 염기 편집제 및 염기 편집제에 결합된 가이드 RNA와 접촉시키는 것을 포함하며, 여기서 가이드 RNA는 F8 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인, F8 유전자의 센스 또는 안티센스 가닥 내의 아데노신 (A) 핵염기를 탈아미노화시키는 방법.
  147. 제146항에 있어서, F8 유전자가 C에서 T로의 돌연변이를 포함하는 것인 방법.
  148. 제147항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 C에서 T로의 돌연변이를 교정하는 것인 방법.
  149. 제148항에 있어서, F8 유전자가 Arg에서 Cys로의 돌연변이를 포함하는 단백질을 코딩하는 것인 방법.
  150. 제149항에 있어서, Arg에서 Cys로의 돌연변이가 하기 아미노산 서열의 아미노산 위치 612에서의 것인 방법.
    Figure pct00239

    Figure pct00240
  151. 제150항에 있어서, T에 상보적인 아데노신 핵염기를 탈아미노화시키는 것이 Arg에서 Cys로의 돌연변이를 교정하는 것인 방법.
  152. 제146항 내지 제151항 중 어느 한 항에 있어서, 가이드 서열이 F8 유전자의 표적 핵산 서열에 100% 상보적인 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 인접 핵산을 포함하는 것인 방법.
  153. 제146항 내지 제152항 중 어느 한 항에 있어서, 염기 편집제가 표적 서열을 니킹하는 것인 방법.
  154. 제146항 내지 제153항 중 어느 한 항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기를 포함하는 것인 방법.
    Figure pct00241
  155. 제154항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00242

    여기서 서열식별번호: 388의 위치 20에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  156. 제154항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기를 포함하며,
    Figure pct00243

    여기서 서열식별번호: 339의 위치 18에서의 T에 상보적인 A 핵염기의 탈아미노화는 표적 핵산 서열 내의 T에서 C로의 돌연변이를 유발하는 것인 방법.
  157. 제146항 내지 제156항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 하기를 포함하는 것인 방법.
    Figure pct00244
  158. 제157항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
  159. 제146항 내지 제158항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 F8 유전자 내의 T-A 염기 쌍에서 F8 유전자 내의 C-G 염기 쌍으로 돌연변이되도록 하는 것인 방법.
  160. 제146항 내지 제159항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 혈우병과 연관된 서열을 교정하도록 하는 것인 방법.
  161. 제160항에 있어서, 혈우병이 A형 혈우병인 방법.
  162. 제146항 내지 제161항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 혈우병과 연관된 서열을 교정하도록 하는 것인 방법.
  163. 제146항 내지 제162항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 F8 유전자로부터 전사된 인자 VIII 단백질의 기능 증가를 일으키는 것인 방법.
  164. 제146항 내지 제163항 중 어느 한 항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 인자 VIII 안정성 또는 반감기의 증가를 일으키는 것인 방법.
  165. 제146항 내지 제164항 중 어느 한 항에 있어서, F8 유전자가 세포 내에 존재하는 것인 방법.
  166. 제146항 내지 제165항 중 어느 한 항에 있어서, 시험관내에서 수행되는 방법.
  167. 제146항 내지 제166항 중 어느 한 항에 있어서, 세포가 대상체 내의 세포인 방법.
  168. 제167항에 있어서, 대상체가 혈우병을 갖는 것인 방법.
  169. 제168항에 있어서, 대상체가 A형 혈우병을 갖는 것인 방법.
  170. 제146항 내지 제169항 중 어느 한 항에 있어서, 생체내 또는 생체외에서 수행되는 방법.
  171. 제168항 또는 제169항에 있어서, F8 유전자 내의 아데노신 핵염기를 탈아미노화시키는 것이 대상체에서 혈우병의 1종 이상의 증상을 호전시키는 것인 방법.
  172. 제1항 내지 제171항 중 어느 한 항에 있어서, 염기 편집제가 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 (ii) 아데노신 데아미나제를 포함하는 융합 단백질을 포함하는 것인 방법.
  173. 제172항에 있어서, 융합 단백질이 핵 국재화 신호 (NLS)를 추가로 포함하는 것인 방법.
  174. 제173항에 있어서, NLS가 이분된 NLS인 방법.
  175. 제173항 또는 제174항에 있어서, NLS가 아미노산 서열
    Figure pct00245
    를 포함하는 것인 방법.
  176. 제172항 내지 제175항 중 어느 한 항에 있어서, 아데노신 데아미나제가 이. 콜라이(E. coli) TadA (ecTadA)인 방법.
  177. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
  178. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
  179. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열을 포함하는 것인 방법.
  180. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열로 이루어진 것인 방법.
  181. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  182. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  183. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  184. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 H36L, P48S, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  185. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  186. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  187. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  188. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 W23L, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, A142N, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  189. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 중 1개 이상 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  190. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 각각의 W23R, H36L, P48A, R51L, L84F, A106V, D108N, H123Y, S146C, D147Y, R152P, E155V, I156F 및 K157N 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  191. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 도 7의 ABE 중 어느 하나로부터의 1개 이상의 돌연변이 또는 또 다른 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 것인 방법.
  192. 제172항 내지 제176항 중 어느 한 항에 있어서, 아데노신 데아미나제가 서열식별번호: 1에서의 도 7의 ABE 중 어느 하나로부터의 각각의 돌연변이 또는 또 다른 데아미나제에서의 상응하는 돌연변이를 포함하는 것인 방법.
  193. 제172항 내지 제192항 중 어느 한 항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 Cas9 도메인, Cpf1 도메인, CasX 도메인, CasY 도메인, C2c1 도메인, C2c2 도메인 또는 C2c3 도메인인 방법.
  194. 제193항에 있어서, Cas9 도메인이 기능상실 Cas9 (dCas9) 도메인, Cas9 니카제 (nCas9) 도메인 및 뉴클레아제 활성 Cas9 도메인으로 이루어진 군으로부터 선택된 것인 방법.
  195. 제194항에 있어서, Cas9 도메인이 Cas9 니카제 (nCas9) 도메인인 방법.
  196. 제195항에 있어서, Cas9 니카제 도메인이 서열식별번호: 35에 제시된 아미노산 서열을 포함하는 것인 방법.
  197. 제172항 내지 제196항 중 어느 한 항에 있어서, 융합 단백질이 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)과 아데노신 데아미나제 사이에 1개 이상의 링커를 추가로 포함하는 것인 방법.
  198. 제197항에 있어서, 1개 이상의 링커가 서열식별번호: 10, 37-40, 384-386, 685-688 또는 800-801 중 어느 하나에 제시된 아미노산 서열을 포함하는 것인 방법.
  199. 제198항에 있어서, 링커가 서열식별번호: 800에 제시된 아미노산 서열을 포함하는 것인 방법.
  200. 제172항 내지 제199항 중 어느 한 항에 있어서, 융합 단백질이 제2 아데노신 데아미나제를 추가로 포함하는 것인 방법.
  201. 제200항에 있어서, 제2 아데노신 데아미나제가 ecTadA인 방법.
  202. 제201항에 있어서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제가 동일한 것인 방법.
  203. 제201항에 있어서, 제1 아데노신 데아미나제 및 제2 아데노신 데아미나제가 상이한 것인 방법.
  204. 제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열을 포함하는 것인 방법.
  205. 제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열로 이루어진 것인 방법.
  206. 제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
  207. 제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열을 포함하는 것인 방법.
  208. 제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1, 64-84, 420-437, 672-684 또는 802-805 중 어느 하나의 아미노산 서열로 이루어진 것인 방법.
  209. 제200항 내지 제203항 중 어느 한 항에 있어서, 제2 아데노신 데아미나제가 서열식별번호: 1의 아미노산 서열에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 99.5% 동일한 아미노산 서열을 포함하는 것인 방법.
  210. 제172항 내지 제209항 중 어느 한 항에 있어서, 융합 단백질이 하기 구조를 포함하며,
    [제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp];
    [제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp];
    [제1 아데노신 데아미나제]-[제2 아데노신 데아미나제]-[napDNAbp]-[NLS]; 또는
    [제2 아데노신 데아미나제]-[제1 아데노신 데아미나제]-[napDNAbp]-[NLS];
    여기서 napDNAbp는 Cas9 도메인이고, "-"는 임의적 링커 서열의 존재를 나타내는 것인 방법.
  211. 제210항에 있어서, Cas9 도메인이 Cas9 니카제 (nCas9)인 방법.
  212. 제200항 내지 제211항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 및 제2 데아미나제가 아미노산 서열 (SGGS)n-SGSETPGTSESATPES-(SGGS)n (서열식별번호: 801) (여기서 n은 1, 2, 3, 4 또는 5임)을 포함하는 링커를 통해 융합된 것인 방법.
  213. 제200항 내지 제212항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 및 제2 데아미나제가 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함하는 링커를 통해 융합된 것인 방법.
  214. 제200항 내지 제213항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 또는 제2 아데노신 데아미나제가 아미노산 서열 (SGGS)n-SGSETPGTSESATPES-(SGGS)n (서열식별번호: 801) (여기서 n은 1, 2, 3, 4 또는 5임)을 포함하는 링커를 통해 napDNAbp에 융합된 것인 방법.
  215. 제200항 내지 제214항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제 또는 제2 아데노신 데아미나제가 아미노산 서열 (SGGS)2-SGSETPGTSESATPES-(SGGS)2 (서열식별번호: 800)를 포함하는 링커를 통해 napDNAbp에 융합된 것인 방법.
  216. 제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 805의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
  217. 제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 804의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
  218. 제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 803의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
  219. 제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 802의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
  220. 제200항 내지 제215항 중 어느 한 항에 있어서, 제1 아데노신 데아미나제가 서열식별번호: 682의 아데노신 데아미나제이고; 제2 아데노신 데아미나제가 서열식별번호: 1의 아데노신 데아미나제인 방법.
  221. 제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
  222. 제221항에 있어서, 가이드 RNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00246
  223. 제222항에 있어서, gRNA의 가이드 서열이 5' 말단에 G를 추가로 포함하는 것인 방법.
  224. 제222항 또는 제223항에 있어서, gRNA의 가이드 서열이
    Figure pct00247
    를 포함하는 것인 방법.
  225. 제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA는 HFE 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
  226. 제225항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00248
  227. 제226항에 있어서, gRNA의 가이드 서열이 제226항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
  228. 제225항 내지 제227항 중 어느 한 항에 있어서, gRNA의 가이드 서열이 핵산 서열
    Figure pct00249
    를 포함하는 것인 방법.
  229. 제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA (gRNA)는 HBG1 및/또는 HBG2 유전자의 프로모터 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
  230. 제229항에 있어서, 가이드 RNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00250
  231. 제230항에 있어서, gRNA의 가이드 서열이 제230항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
  232. 제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA는 HBB 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
  233. 제232항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00251
  234. 제233항에 있어서, gRNA의 가이드 서열이 제233항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
  235. 제172항 내지 제220항 중 어느 한 항에 있어서, 융합 단백질이 (ii) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)에 결합된 가이드 RNA를 추가로 포함하며, 여기서 가이드 RNA는 F8 유전자 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 방법.
  236. 제235항에 있어서, gRNA의 가이드 서열이 하기 핵산 서열을 포함하는 것인 방법.
    Figure pct00252
  237. 제236항에 있어서, gRNA의 가이드 서열이 제236항에 열거된 서열 중 어느 하나의 5' 말단에 G를 추가로 포함하는 것인 방법.
  238. 제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 707의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
  239. 제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 708의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
  240. 제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 709의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
  241. 제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 710의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
  242. 제1항 내지 제237항 중 어느 한 항에 있어서, 염기 편집제가 서열식별번호: 711의 아미노산 서열을 포함하거나 이로 이루어진 것인 방법.
  243. 제1항 내지 제242항 중 어느 한 항에 있어서, 20%, 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 또는 0.1% 미만의 삽입결실(indel) 형성을 유발하는 방법.
  244. 제1항 내지 제243항 중 어느 한 항에 있어서, A 핵염기의 탈아미노화 효율이 적어도 5%인 방법.
  245. 제244항에 있어서, A 핵염기의 탈아미노화 효율이 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95% 또는 98%인 방법.
  246. (a) (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp) 및 (ii) DNA 내의 아데노신을 탈아미노화시킬 수 있는 아데노신 데아미나제를 포함하는 염기 편집제 융합 단백질을 코딩하는 핵산 서열;

    (b) 가이드 RNA 또는 가이드 RNA를 코딩하는 발현 구축물
    을 포함하며, 여기서 가이드 RNA는
    (i) HBG1 및/또는 HBG2 유전자의 프로모터;
    (ii) HFE 유전자;
    (iii) HBB 유전자; 또는
    (iv) F8 유전자
    의 센스 또는 안티센스 가닥 내의 표적 핵산 서열에 상보적인 가이드 서열을 포함하는 것인 핵산 구축물을 포함하는 키트.
  247. 제246항에 있어서, 표적 핵산 서열이 HBG1 및/또는 HBG2 유전자의 프로모터 내의 핵산 서열인 키트.
  248. 제247항에 있어서, 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
    Figure pct00253
  249. 제248항에 있어서, 표적 핵산이 제238항에 열거된 서열 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 키트.
  250. 제247항 내지 제249항 중 어느 한 항에 있어서, 프로모터 내의 표적 핵산 서열이 핵산 서열
    Figure pct00254
    를 포함하는 것인 키트.
  251. 제246항에 있어서, 표적 핵산 서열이 HFE 유전자 내의 핵산 서열인 키트.
  252. 제250항에 있어서, HFE 유전자 내의 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
    Figure pct00255
  253. 제251항에 있어서, 표적 핵산이 제241항에 열거된 서열 중 어느 하나의 5' 말단에 5'-CCT-3'를 추가로 포함하는 것인 키트.
    [청구항 253]
    제250항 내지 제252항 중 어느 한 항에 있어서, HFE 유전자 내의 표적 핵산 서열이 핵산 서열
    Figure pct00256
    를 포함하는 것인 키트.
  254. 제246항에 있어서, 표적 핵산 서열이 HBG1 및/또는 HBG2 유전자의 프로모터 내의 핵산 서열인 키트.
  255. 제254항에 있어서, 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
    Figure pct00257
  256. 제256항에 있어서, 표적 핵산 서열이 HBB 유전자 내의 핵산 서열인 키트.
  257. 제256항에 있어서, HBB 유전자 내의 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
    Figure pct00258
  258. 제246항에 있어서, 표적 핵산 서열이 F8 유전자 내의 핵산 서열인 키트.
  259. 제258항에 있어서, F8 유전자 내의 표적 핵산 서열이 하기 핵산 서열을 포함하는 것인 키트.
    Figure pct00259
  260. (i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
    Figure pct00260
  261. (i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
    Figure pct00261
  262. (i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
    Figure pct00262
  263. (i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
    Figure pct00263
  264. (i) 본원에 제공된 임의의 융합 단백질 및 (ii) 가이드 RNA를 포함하는 복합체이며, 여기서 가이드 RNA는 하기 핵산 서열을 포함하는 가이드 서열을 포함하는 것인 복합체.
    Figure pct00264
  265. 하기 핵산 서열을 포함하는 가이드 RNA (sgRNA).
    Figure pct00265

    Figure pct00266

    Figure pct00267
  266. 제265항에 있어서, 단일-가이드 RNA (sgRNA)인 가이드 RNA.
  267. 제265항 또는 제266항의 가이드 RNA를 코딩하는 핵산.
  268. 제267항의 핵산을 포함하는 벡터.
  269. 제268항에 있어서, 가이드 RNA의 발현을 구동하는 이종 프로모터를 포함하는 벡터.
  270. 제260항 또는 제264항의 복합체; 제265항 또는 제266항의 가이드 RNA; 제267항의 핵산; 또는 제268항 또는 제269항의 벡터를 포함하는 제약 조성물.
  271. 제270항에 있어서, 제약상 허용되는 부형제를 추가로 포함하는 제약 조성물.
  272. 제270항 또는 제271항에 있어서, 양이온성 지질 또는 양이온성 중합체를 추가로 포함하는 제약 조성물.
KR1020207013985A 2017-10-16 2018-10-16 아데노신 염기 편집제의 용도 KR20200121782A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762573127P 2017-10-16 2017-10-16
US62/573,127 2017-10-16
PCT/US2018/056146 WO2019079347A1 (en) 2017-10-16 2018-10-16 USES OF BASIC EDITORS ADENOSINE

Publications (1)

Publication Number Publication Date
KR20200121782A true KR20200121782A (ko) 2020-10-26

Family

ID=64184201

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207013985A KR20200121782A (ko) 2017-10-16 2018-10-16 아데노신 염기 편집제의 용도

Country Status (8)

Country Link
US (1) US11795443B2 (ko)
EP (1) EP3697906A1 (ko)
JP (2) JP2021500036A (ko)
KR (1) KR20200121782A (ko)
CN (1) CN111757937A (ko)
AU (1) AU2018352592A1 (ko)
CA (1) CA3082251A1 (ko)
WO (1) WO2019079347A1 (ko)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
CA3002827A1 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
CN109804066A (zh) 2016-08-09 2019-05-24 哈佛大学的校长及成员们 可编程cas9-重组酶融合蛋白及其用途
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
KR20200121782A (ko) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
CN112534054A (zh) * 2018-05-11 2021-03-19 比姆医疗股份有限公司 使用可编程碱基编辑器系统取代病原性氨基酸的方法
WO2020051360A1 (en) 2018-09-05 2020-03-12 The Broad Institute, Inc. Base editing for treating hutchinson-gilford progeria syndrome
GB201815670D0 (en) 2018-09-26 2018-11-07 Univ Oxford Innovation Ltd Protein editing
CN116497067A (zh) 2019-02-13 2023-07-28 比姆医疗股份有限公司 治疗血红素病变的组合物和方法
WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
US20220170013A1 (en) 2019-03-06 2022-06-02 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
MX2021011325A (es) 2019-03-19 2022-01-06 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleotidos.
US20220307003A1 (en) 2019-04-17 2022-09-29 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
AU2020279751A1 (en) * 2019-05-21 2021-12-02 Beam Therapeutics Inc. Methods of editing a single nucleotide polymorphism using programmable base editor systems
WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
WO2021046155A1 (en) 2019-09-03 2021-03-11 Voyager Therapeutics, Inc. Vectorized editing of nucleic acids to correct overt mutations
CN114667149A (zh) * 2019-09-09 2022-06-24 比姆医疗股份有限公司 新型核碱基编辑器及其使用方法
WO2021056302A1 (en) * 2019-09-26 2021-04-01 Syngenta Crop Protection Ag Methods and compositions for dna base editing
WO2021108717A2 (en) 2019-11-26 2021-06-03 The Broad Institute, Inc Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
CN110964742B (zh) * 2019-12-20 2022-03-01 北京市农林科学院 一种抗除草剂水稻的制备方法
WO2021158921A2 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Adenine base editors and uses thereof
US20230108687A1 (en) 2020-02-05 2023-04-06 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
EP4118206A1 (en) 2020-03-11 2023-01-18 The Broad Institute Inc. Stat3-targeted base editor therapeutics for the treatment of melanoma and other cancers
WO2021211894A1 (en) * 2020-04-15 2021-10-21 Shape Therapeutics Inc. Targeted rna editing using engineered adenosine deaminase acting on trna (adat) systems
US20230159913A1 (en) 2020-04-28 2023-05-25 The Broad Institute, Inc. Targeted base editing of the ush2a gene
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
AU2021300169A1 (en) * 2020-06-30 2023-02-02 Pairwise Plants Services, Inc. Compositions, systems, and methods for base diversification
CN111876416B (zh) * 2020-07-01 2021-09-03 广州瑞风生物科技有限公司 激活γ-珠蛋白基因表达的方法和组合物
CA3188280A1 (en) * 2020-07-31 2022-02-03 Inari Agriculture Technology, Inc. Generation of plants with improved transgenic loci by genome editing
US20240011043A1 (en) 2020-07-31 2024-01-11 Inari Agriculture Technology, Inc. Generation of plants with improved transgenic loci by genome editing
CN112111470B (zh) * 2020-09-10 2022-06-14 武汉大学 一种R-环结合蛋白GST-His6-1/2×HBD及全基因组R-环的检测方法
CN114560946A (zh) * 2020-11-27 2022-05-31 华东师范大学 无pam限制的腺嘌呤单碱基编辑产品、方法和应用
WO2022147759A1 (en) * 2021-01-08 2022-07-14 Susheng Biotech (Hainan) Co., Ltd. Grna molecule targeting intron i or intron ii of hbb gene, synthetic method thereof, and method to correct types of hbb gene mutations
WO2022204476A1 (en) 2021-03-26 2022-09-29 The Board Of Regents Of The University Of Texas System Nucleotide editing to reframe dmd transcripts by base editing and prime editing
EP4314308A1 (en) * 2021-04-02 2024-02-07 Shanghaitech University Gene therapy for treating beta-hemoglobinopathies
WO2023052366A1 (en) * 2021-09-28 2023-04-06 INSERM (Institut National de la Santé et de la Recherche Médicale) Base editing approaches for the treatment of beta-hemoglobinopathies
WO2023064871A1 (en) * 2021-10-14 2023-04-20 Asimov Inc. Integrases, landing pad architectures, and engineered cells comprising the same
WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
WO2023196802A1 (en) 2022-04-04 2023-10-12 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
WO2023212715A1 (en) 2022-04-28 2023-11-02 The Broad Institute, Inc. Aav vectors encoding base editors and uses thereof
WO2024040083A1 (en) 2022-08-16 2024-02-22 The Broad Institute, Inc. Evolved cytosine deaminases and methods of editing dna using same
WO2024052681A1 (en) 2022-09-08 2024-03-14 The University Court Of The University Of Edinburgh Rett syndrome therapy
CN116515000A (zh) * 2023-06-30 2023-08-01 迦进生物医药(上海)有限公司 Hfe融合蛋白及其应用

Family Cites Families (1777)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4182449A (en) 1978-04-18 1980-01-08 Kozlow William J Adhesive bandage and package
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4880635B1 (en) 1984-08-08 1996-07-02 Liposome Company Dehydrated liposomes
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4921757A (en) 1985-04-26 1990-05-01 Massachusetts Institute Of Technology System for delayed and pulsed release of biologically active substances
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US4737323A (en) 1986-02-13 1988-04-12 Liposome Technology, Inc. Liposome extrusion method
US5017492A (en) 1986-02-27 1991-05-21 Life Technologies, Inc. Reverse transcriptase and method for its production
JP2874751B2 (ja) 1986-04-09 1999-03-24 ジェンザイム・コーポレーション 希望する蛋白質をミルク中へ分泌する遺伝子移植動物
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
WO1992006200A1 (en) 1990-09-28 1992-04-16 F. Hoffmann-La-Roche Ag 5' to 3' exonuclease mutations of thermostable dna polymerases
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4920016A (en) 1986-12-24 1990-04-24 Linear Technology, Inc. Liposomes with enhanced circulation time
JPH0825869B2 (ja) 1987-02-09 1996-03-13 株式会社ビタミン研究所 抗腫瘍剤包埋リポソ−ム製剤
US4911928A (en) 1987-03-13 1990-03-27 Micro-Pak, Inc. Paucilamellar lipid vesicles
US4917951A (en) 1987-07-28 1990-04-17 Micro-Pak, Inc. Lipid vesicles formed of surfactants and steroids
EP0357610B1 (en) 1987-04-23 1992-09-16 FMC Corporation Insecticidal cyclopropyl-substituted di(aryl) compounds
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
MC2115A1 (fr) 1987-12-15 1991-07-05 Gene Shears Pty Ltd Ribozynes
US5244797B1 (en) 1988-01-13 1998-08-25 Life Technologies Inc Cloned genes encoding reverse transcriptase lacking rnase h activity
FR2632821B1 (fr) 1988-06-22 1990-11-16 Inst Kriobiologii Procede de conservation a basse temperature des embryons
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
EP0436597B1 (en) 1988-09-02 1997-04-02 Protein Engineering Corporation Generation and selection of recombinant varied binding proteins
US5270179A (en) 1989-08-10 1993-12-14 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity
US5047342A (en) 1989-08-10 1991-09-10 Life Technologies, Inc. Cloning and expression of T5 DNA polymerase
AU637800B2 (en) 1989-08-31 1993-06-10 City Of Hope Chimeric dna-rna catalytic sequences
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5637459A (en) 1990-06-11 1997-06-10 Nexstar Pharmaceuticals, Inc. Systematic evolution of ligands by exponential enrichment: chimeric selex
US5580737A (en) 1990-06-11 1996-12-03 Nexstar Pharmaceuticals, Inc. High-affinity nucleic acid ligands that discriminate between theophylline and caffeine
DE553264T1 (de) 1990-10-05 1994-04-28 Wayne M Barnes Thermostabile dna polymerase.
ES2061416T3 (es) 1990-10-12 1997-03-01 Max Planck Gesellschaft Ribozimas modificadas.
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
NZ241310A (en) 1991-01-17 1995-03-28 Gen Hospital Corp Trans-splicing ribozymes
NZ314630A (en) 1991-01-17 2000-11-24 Harvard College Use of trans-splicing ribozymes for genetic modification and cell ablation in a host cell
JP3672306B2 (ja) 1991-04-10 2005-07-20 ザ スクリップス リサーチ インスティテュート ファージミドを使用するヘテロ二量体受容体ライブラリー
DE4216134A1 (de) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog Synthetische katalytische oligonukleotidstrukturen
US6872816B1 (en) 1996-01-24 2005-03-29 Third Wave Technologies, Inc. Nucleic acid detection kits
US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
JPH05274181A (ja) 1992-03-25 1993-10-22 Nec Corp ブレークポイント設定・解除方式
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US5834247A (en) 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5496714A (en) 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
US5434058A (en) 1993-02-09 1995-07-18 Arch Development Corporation Apolipoprotein B MRNA editing protein compositions and methods
US5436149A (en) 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension
KR960702518A (ko) 1993-05-17 1996-04-27 린다 에스, 스티븐슨 Hiv 감염 및 aids에 대한 리보자임 유전자 치료(ribozyme gene therapy for hiv infection and aids)
US5512462A (en) 1994-02-25 1996-04-30 Hoffmann-La Roche Inc. Methods and reagents for the polymerase chain reaction amplification of long DNA sequences
US5651981A (en) 1994-03-29 1997-07-29 Northwestern University Cationic phospholipids for transfection
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US5614365A (en) 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
US5449639A (en) 1994-10-24 1995-09-12 Taiwan Semiconductor Manufacturing Company Ltd. Disposable metal anti-reflection coating process used together with metal dry/wet etch
US5767099A (en) 1994-12-09 1998-06-16 Genzyme Corporation Cationic amphiphiles containing amino acid or dervatized amino acid groups for intracellular delivery of therapeutic molecules
US6057153A (en) 1995-01-13 2000-05-02 Yale University Stabilized external guide sequences
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5830430A (en) 1995-02-21 1998-11-03 Imarx Pharmaceutical Corp. Cationic lipids and the use thereof
US5851548A (en) 1995-06-07 1998-12-22 Gen-Probe Incorporated Liposomes containing cationic lipids and vitamin D
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
NO953680D0 (no) 1995-09-18 1995-09-18 Hans Prydz Cellesyklusenzymer
US5962313A (en) 1996-01-18 1999-10-05 Avigen, Inc. Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme
WO1997044348A1 (en) 1996-05-17 1997-11-27 Thomas Jefferson University Ribozyme-mediated gene replacement
US6887707B2 (en) 1996-10-28 2005-05-03 University Of Washington Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA
GB9701425D0 (en) 1997-01-24 1997-03-12 Bioinvent Int Ab A method for in vitro molecular evolution of protein function
US5981182A (en) 1997-03-13 1999-11-09 Albert Einstein College Of Medicine Of Yeshiva University Vector constructs for the selection and identification of open reading frames
US20040203109A1 (en) 1997-06-06 2004-10-14 Incyte Corporation Human regulatory proteins
US5849528A (en) 1997-08-21 1998-12-15 Incyte Pharmaceuticals, Inc.. Polynucleotides encoding a human S100 protein
US6355415B1 (en) 1997-09-29 2002-03-12 Ohio University Compositions and methods for the use of ribozymes to determine gene function
US6156509A (en) 1997-11-12 2000-12-05 Genencor International, Inc. Method of increasing efficiency of directed evolution of a gene using phagemid
US6429301B1 (en) 1998-04-17 2002-08-06 Whitehead Institute For Biomedical Research Use of a ribozyme to join nucleic acids and peptides
US6183998B1 (en) 1998-05-29 2001-02-06 Qiagen Gmbh Max-Volmer-Strasse 4 Method for reversible modification of thermostable enzymes
US8097648B2 (en) 1998-06-17 2012-01-17 Eisai R&D Management Co., Ltd. Methods and compositions for use in treating cancer
US6429298B1 (en) 1998-10-13 2002-08-06 Board Of Regents, The University Of Texas System Assays for identifying functional alterations in the p53 tumor suppressor
AU772847B2 (en) 1998-11-12 2004-05-06 Invitrogen Corporation Transfection reagents
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6503717B2 (en) 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US20090130718A1 (en) 1999-02-04 2009-05-21 Diversa Corporation Gene site saturation mutagenesis
WO2000058480A1 (fr) 1999-03-29 2000-10-05 Kansai Technology Licensing Organization Co., Ltd. Nouvelle cytidine desaminase
US6365410B1 (en) 1999-05-19 2002-04-02 Genencor International, Inc. Directed evolution of microorganisms
GB9920194D0 (en) 1999-08-27 1999-10-27 Advanced Biotech Ltd A heat-stable thermostable DNA polymerase for use in nucleic acid amplification
ATE445643T1 (de) 1999-11-18 2009-10-15 Pharmexa Inc Heteroklitische analoga von klasse-i epitopen
EP1235914A2 (en) 1999-11-24 2002-09-04 Joseph Rosenecker Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
WO2001059450A2 (en) 2000-02-08 2001-08-16 Sangamo Biosciences, Inc. Cells expressing zinc finger protein for drug discovery
US7378248B2 (en) 2000-03-06 2008-05-27 Rigel Pharmaceuticals, Inc. In vivo production of cyclic peptides for inhibiting protein-protein interaction
US7078208B2 (en) 2000-05-26 2006-07-18 Invitrogen Corporation Thermostable reverse transcriptases and uses thereof
US6573092B1 (en) 2000-10-10 2003-06-03 Genvec, Inc. Method of preparing a eukaryotic viral vector
EP2284182A1 (en) 2000-10-27 2011-02-16 Novartis Vaccines and Diagnostics S.r.l. Nucleic acids and proteins from streptococcus groups A and B
US20040003420A1 (en) 2000-11-10 2004-01-01 Ralf Kuhn Modified recombinase
US7067650B1 (en) 2000-11-22 2006-06-27 National Institute Of Advanced Industrial Science And Technology Ribozymes targeting bradeion transcripts and use thereof
ATE375394T1 (de) 2001-01-25 2007-10-15 Evolva Ltd Concatemere unterschiedlich exprimierter multipler gene
US20050222030A1 (en) 2001-02-21 2005-10-06 Anthony Allison Modified annexin proteins and methods for preventing thrombosis
EP1392846B1 (en) 2001-02-27 2008-06-11 University of Rochester METHODS AND COMPOSITIONS FOR MODIFYING APOLIPOPROTEIN B mRNA EDITING
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
AU2002257076A1 (en) 2001-03-19 2002-10-03 President And Fellows Of Harvard College Nucleic acid shuffling
US7476500B1 (en) 2001-03-19 2009-01-13 President And Fellows Of Harvard College In vivo selection system for enzyme activity
IL158000A0 (en) 2001-03-19 2004-03-28 Harvard College Evolving new molecular function
WO2002085923A2 (en) 2001-04-19 2002-10-31 The Scripps Research Institute In vivo incorporation of unnatural amino acids
AU2002330714A1 (en) 2001-05-30 2003-01-02 Biomedical Center In silico screening for phenotype-associated expressed sequences
DE60232523D1 (de) 2001-07-26 2009-07-16 Stratagene California Multi-stellen-mutagenese
US20030167533A1 (en) 2002-02-04 2003-09-04 Yadav Narendra S. Intein-mediated protein splicing
DK1506288T3 (da) 2002-05-10 2013-07-22 Medical Res Council Aktiveringsinduceret deaminase (aid)
US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
US9388459B2 (en) 2002-06-17 2016-07-12 Affymetrix, Inc. Methods for genotyping
US20040175719A1 (en) 2002-07-12 2004-09-09 Affymetrix, Inc. Synthetic tag genes
AU2003263937B2 (en) 2002-08-19 2010-04-01 The President And Fellows Of Harvard College Evolving new molecular function
CA2499770A1 (en) 2002-09-20 2004-04-01 Yale University Riboswitches, methods for their use, and compositions for use with riboswitches.
US8017323B2 (en) 2003-03-26 2011-09-13 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
AU2004230592B2 (en) 2003-04-14 2007-10-04 Caliper Life Sciences, Inc. Reduction of migration shift assay interference
US8017755B2 (en) 2003-05-23 2011-09-13 President And Fellows Of Harvard College RNA-based transcriptional regulators
WO2005002527A2 (en) 2003-07-03 2005-01-13 Massachusetts Institute Of Technology Sirt1 modulation of adipogenesis and adipose function
EP1666604B1 (en) 2003-07-07 2008-02-13 The Scripps Research Institute Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
EP2927318B1 (en) 2003-08-08 2020-05-20 Sangamo Therapeutics, Inc. Methods and compositions for targeted cleavage and recombination
US7670807B2 (en) 2004-03-10 2010-03-02 East Tennessee State Univ. Research Foundation RNA-dependent DNA polymerase from Geobacillus stearothermophilus
US7192739B2 (en) 2004-03-30 2007-03-20 President And Fellows Of Harvard College Ligand-dependent protein splicing
US7595179B2 (en) 2004-04-19 2009-09-29 Applied Biosystems, Llc Recombinant reverse transcriptases
US7919277B2 (en) 2004-04-28 2011-04-05 Danisco A/S Detection and typing of bacterial strains
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
US9012140B2 (en) 2004-07-06 2015-04-21 Societe de Commercialisation des Produits de la Recherche Appliquée Socpra Sciences et Génie S.E.C. Target-dependent nucleic acid adapter
US7851658B2 (en) 2004-08-17 2010-12-14 President And Fellows Of Harvard College Palladium-catalyzed carbon-carbon bond forming reactions
US8728526B2 (en) 2004-08-19 2014-05-20 The United States of America, Represented by Secretary of Department of Health and Human Services, NIH Coacervate microparticles useful for the sustained release administration of therapeutic agents
ATE514776T1 (de) 2004-10-05 2011-07-15 California Inst Of Techn Aptamer-regulierte nukleinsäuren und verwendungen davon
WO2006089045A2 (en) 2005-02-18 2006-08-24 Monogram Biosciences, Inc. Methods and compositions for determining hypersusceptibility of hiv-1 to non-nucleoside reverse transcriptase inhibitors
JP2006248978A (ja) 2005-03-10 2006-09-21 Mebiopharm Co Ltd 新規なリポソーム製剤
WO2006138666A2 (en) 2005-06-17 2006-12-28 President And Fellows Of Harvard College Iterated branching reaction pathways via nucleic acid-mediated chemistry
WO2007011722A2 (en) 2005-07-15 2007-01-25 President And Fellows Of Harvard College Reaction discovery system
US9783791B2 (en) 2005-08-10 2017-10-10 Agilent Technologies, Inc. Mutant reverse transcriptase and methods of use
DK2325332T3 (da) 2005-08-26 2013-01-28 Dupont Nutrition Biosci Aps Anvendelse af CRISPR-associerede gener (CAS)
AU2012244264B2 (en) 2005-08-26 2015-08-06 Dupont Nutrition Biosciences Aps Use
AU2015252023B2 (en) 2005-08-26 2017-06-29 Dupont Nutrition Biosciences Aps Use
KR100784478B1 (ko) 2005-12-05 2007-12-11 한국과학기술원 기능요소의 동시 삽입에 의한 신기능을 갖는 단백질을제조하는 방법
US20080051317A1 (en) 2005-12-15 2008-02-28 George Church Polypeptides comprising unnatural amino acids, methods for their production and uses therefor
EP2015780B1 (en) 2006-05-05 2012-12-12 Molecular Transfer, Inc. Novel reagents for transfection of eukaryotic cells
DK2018441T3 (da) 2006-05-19 2012-01-02 Danisco Mærkede mikroorganismer og fremgangsmåde til mærkning
AU2007256780B2 (en) 2006-06-02 2013-08-29 President And Fellows Of Harvard College Protein surface remodeling
WO2008005529A2 (en) 2006-07-07 2008-01-10 The Trustees Columbia University In The City Of New York Cell-mediated directed evolution
US20120322861A1 (en) 2007-02-23 2012-12-20 Barry John Byrne Compositions and Methods for Treating Diseases
AU2008223544B2 (en) 2007-03-02 2014-06-05 Dupont Nutrition Biosciences Aps Cultures with improved phage resistance
FR2919804B1 (fr) 2007-08-08 2010-08-27 Erytech Pharma Composition et vaccin therapeutique anti-tumoral
WO2009033027A2 (en) 2007-09-05 2009-03-12 Medtronic, Inc. Suppression of scn9a gene expression and/or function for the treatment of pain
KR101657504B1 (ko) 2007-09-27 2016-09-19 상가모 바이오사이언스 인코포레이티드 생물학적으로 활성인 뉴클레아제의 신속한 생체내 확인
US9029524B2 (en) 2007-12-10 2015-05-12 California Institute Of Technology Signal activated RNA interference
EP2087789A1 (en) 2008-02-06 2009-08-12 Heinrich-Heine-Universität Düsseldorf Fto-modified non-human mammal
AU2009212247A1 (en) 2008-02-08 2009-08-13 Sangamo Therapeutics, Inc. Treatment of chronic pain with zinc finger proteins
GB0806562D0 (en) 2008-04-10 2008-05-14 Fermentas Uab Production of nucleic acid
WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
EP2297182A4 (en) 2008-04-28 2012-08-15 Harvard College SUPER-LOADED PROTEINS FOR CELL PENETRATION
US8394604B2 (en) 2008-04-30 2013-03-12 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
JP2010033344A (ja) 2008-07-29 2010-02-12 Azabu Jui Gakuen 核酸構成塩基の偏在性を表す方法
EP2159286A1 (en) 2008-09-01 2010-03-03 Consiglio Nazionale Delle Ricerche Method for obtaining oligonucleotide aptamers and uses thereof
EP2331071A1 (en) 2008-09-05 2011-06-15 Institut National De La Sante Et De La Recherche Medicale Novel multimodular assembly useful for intracellular delivery
EP2342336B1 (en) 2008-09-05 2016-12-14 President and Fellows of Harvard College Continuous directed evolution of proteins and nucleic acids
US8636884B2 (en) 2008-09-15 2014-01-28 Abbott Diabetes Care Inc. Cationic polymer based wired enzyme formulations for use in analyte sensors
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
DK2362915T3 (en) 2008-11-07 2017-03-27 Dupont Nutrition Biosci Aps CRISPR SEQUENCES OF BIFIDOBACTERIA
US20110016540A1 (en) 2008-12-04 2011-01-20 Sigma-Aldrich Co. Genome editing of genes associated with trinucleotide repeat expansion disorders in animals
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
BRPI0922411A2 (pt) 2008-12-11 2018-06-05 Pacific Biosciences California Inc classificação de templates de ácido nucléico
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
US20100305197A1 (en) 2009-02-05 2010-12-02 Massachusetts Institute Of Technology Conditionally Active Ribozymes And Uses Thereof
WO2010091294A2 (en) 2009-02-05 2010-08-12 The Regents Of The University Of California New targeted antimicrobial moieties
AU2010221284B2 (en) 2009-03-04 2015-10-01 Board Of Regents, The University Of Texas System Stabilized reverse transcriptase fusion proteins
EP3249045A1 (en) 2009-03-06 2017-11-29 Synthetic Genomics, Inc. Methods for cloning and manipulating genomes
WO2010129019A2 (en) 2009-04-27 2010-11-11 Pacific Biosciences Of California, Inc. Real-time sequencing methods and systems
US9221886B2 (en) 2009-04-28 2015-12-29 President And Fellows Of Harvard College Supercharged proteins for cell penetration
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
WO2010144150A2 (en) 2009-06-12 2010-12-16 Pacific Biosciences Of California, Inc. Real-time analytical methods and systems
AU2010266705B2 (en) 2009-06-30 2014-06-05 Sangamo Therapeutics, Inc. Rapid screening of biologically active nucleases and isolation of nuclease-modified cells
WO2011000106A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Improved cationic lipids and methods for the delivery of therapeutic agents
EP2462230B1 (en) 2009-08-03 2015-07-15 Recombinetics, Inc. Methods and compositions for targeted gene modification
WO2011017293A2 (en) 2009-08-03 2011-02-10 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
GB0913681D0 (en) 2009-08-05 2009-09-16 Glaxosmithkline Biolog Sa Immunogenic composition
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
MX2012005069A (es) 2009-10-30 2012-07-17 Synthetic Genomics Inc Codificar texto hacia secuencias de acido nucleico.
LT3460056T (lt) 2009-11-02 2020-12-28 University Of Washington Terapinės nukleazės kompozicijos ir būdai
US9175340B2 (en) 2009-11-04 2015-11-03 President And Fellows Of Harvard College Reactivity-dependent and interaction-dependent PCR
US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
WO2011068916A1 (en) 2009-12-01 2011-06-09 Intezyne Technologies, Incorporated Pegylated polyplexes for polynucleotide delivery
SI2506857T1 (en) 2009-12-01 2018-08-31 Translate Bio, Inc. Delivery of mRNA for the enrichment of proteins and enzymes in human genetic diseases
PL2510096T5 (pl) 2009-12-10 2018-06-29 Regents Of The University Of Minnesota Modyfikacja DNA zależna od efektora TAL
WO2011075627A1 (en) 2009-12-18 2011-06-23 The Board Of Trustees Of The Leland Stanford Junior University Use of cytidine deaminase-related agents to promote demethylation and cell reprogramming
NZ600546A (en) 2010-01-22 2014-08-29 Dow Agrosciences Llc Excision of transgenes in genetically modified organisms
NZ601247A (en) 2010-01-22 2014-10-31 Dow Agrosciences Llc Targeted genomic alteration
WO2011091396A1 (en) 2010-01-25 2011-07-28 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of mylip/idol gene
JP2013520989A (ja) 2010-03-05 2013-06-10 シンセティック ジェノミクス インコーポレーテッド ゲノムのクローニングおよび操作のための方法
WO2011123830A2 (en) 2010-04-02 2011-10-06 Amunix Operating Inc. Alpha 1-antitrypsin compositions and methods of making and using same
CA2798703A1 (en) 2010-05-10 2011-11-17 The Regents Of The University Of California Endoribonuclease compositions and methods of use thereof
CN103025344B (zh) 2010-05-17 2016-06-29 桑格摩生物科学股份有限公司 新型dna-结合蛋白及其用途
GB201008267D0 (en) 2010-05-18 2010-06-30 Univ Edinburgh Cationic lipids
BR112012030522A2 (pt) 2010-05-27 2020-10-13 Heinrich-Pette-Institut Leibniz-Institut Fur Experimentelle Virologie - Stiftung Burgerlichen Rechts Método para preparo de um vetor de expressão que codifica uma recombinase configurada, método para preparo de uma célula transformada, ácido nucleico, recombinase configurada codificada pelo ácido nucleico, célula transformada ecomposição farmacêutica"
DK2575767T3 (en) 2010-06-04 2017-03-13 Sirna Therapeutics Inc HOWEVER UNKNOWN LOW MOLECULAR CATIONIC LIPIDS TO PROCESS OIGONUCLEOTIDES
US20110201118A1 (en) 2010-06-14 2011-08-18 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
WO2012016186A1 (en) 2010-07-29 2012-02-02 President And Fellows Of Harvard College Macrocyclic kinase inhibitors and uses thereof
EP3578205A1 (en) 2010-08-06 2019-12-11 ModernaTX, Inc. A pharmaceutical formulation comprising engineered nucleic acids and medical use thereof
WO2012020759A1 (ja) 2010-08-13 2012-02-16 国立大学法人京都大学 変異型逆転写酵素
WO2012040234A1 (en) 2010-09-20 2012-03-29 Spi Pharma, Inc. Microencapsulation process and product
AU2011316980A1 (en) 2010-10-20 2013-04-18 Dupont Nutrition Biosciences Aps Lactococcus CRISPR-Cas sequences
US9458484B2 (en) 2010-10-22 2016-10-04 Bio-Rad Laboratories, Inc. Reverse transcriptase mixtures with improved storage stability
WO2012070031A1 (en) 2010-11-26 2012-05-31 University Of The Witwatersrand, Johannesburg Polymeric matrix of polymer-lipid nanoparticles as a pharmaceutical dosage form
KR101255338B1 (ko) 2010-12-15 2013-04-16 포항공과대학교 산학협력단 표적 세포에 대한 폴리뉴클레오티드 전달체
CA2821805A1 (en) 2010-12-16 2012-06-21 Celgene Corporation Controlled release oral dosage forms of poorly soluble drugs and uses thereof
CA2825370A1 (en) 2010-12-22 2012-06-28 President And Fellows Of Harvard College Continuous directed evolution
US9499592B2 (en) 2011-01-26 2016-11-22 President And Fellows Of Harvard College Transcription activator-like effectors
KR101818126B1 (ko) 2011-02-09 2018-01-15 (주)바이오니아 열안정성이 증가된 역전사효소
US9528124B2 (en) 2013-08-27 2016-12-27 Recombinetics, Inc. Efficient non-meiotic allele introgression
US9200045B2 (en) 2011-03-11 2015-12-01 President And Fellows Of Harvard College Small molecule-dependent inteins and uses thereof
US9164079B2 (en) 2011-03-17 2015-10-20 Greyledge Technologies Llc Systems for autologous biological therapeutics
US20120244601A1 (en) 2011-03-22 2012-09-27 Bertozzi Carolyn R Riboswitch based inducible gene expression platform
JP2012210172A (ja) 2011-03-30 2012-11-01 Japan Science & Technology Agency 外部環境に応答して内部の物質組成を変えるリポソーム
US8709466B2 (en) 2011-03-31 2014-04-29 International Business Machines Corporation Cationic polymers for antimicrobial applications and delivery of bioactive materials
EP3320910A1 (en) 2011-04-05 2018-05-16 Cellectis Method for the generation of compact tale-nucleases and uses thereof
WO2012148953A1 (en) 2011-04-25 2012-11-01 Stc.Unm Solid compositions for pharmaceutical use
AU2012249390B2 (en) 2011-04-27 2017-03-30 Amyris, Inc. Methods for genomic modification
WO2012158985A2 (en) 2011-05-17 2012-11-22 Transposagen Biopharmaceuticals, Inc. Methods for site-specific genetic modification in spermatogonial stem cells using zinc finger nuclease (zfn) for the creation of model organisms
US8691750B2 (en) 2011-05-17 2014-04-08 Axolabs Gmbh Lipids and compositions for intracellular delivery of biologically active compounds
US20140201858A1 (en) 2011-05-17 2014-07-17 Transposagen Biopharmaceuticals, Inc Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms
US20140113376A1 (en) 2011-06-01 2014-04-24 Rotem Sorek Compositions and methods for downregulating prokaryotic genes
PL2717893T3 (pl) 2011-06-08 2019-12-31 Translate Bio, Inc. Kompozycje nanocząstek lipidowych i sposoby do dostarczania mRNA
EP2726467A4 (en) 2011-07-01 2015-01-21 Harvard College MACROCYCLIC INHIBITORS OF INSULIN DEGRADATION ENZYME (IDE) AND USES THEREOF
EP2732038B1 (en) 2011-07-15 2018-09-05 The General Hospital Corporation Methods of transcription activator like effector assembly
US20140289882A1 (en) 2011-07-19 2014-09-25 Oregon Health And Science University Compositions and methods for re-programming cells without genetic modification for repairing cartilage damage
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
EP2755693A4 (en) 2011-09-12 2015-05-20 Moderna Therapeutics Inc MODIFIED NUCLEIC ACIDS AND METHODS OF USE
EP2755986A4 (en) 2011-09-12 2015-05-20 Moderna Therapeutics Inc MODIFIED NUCLEIC ACIDS AND METHODS OF USE
KR102096534B1 (ko) 2011-09-28 2020-04-03 에라 바이오테크, 에스.에이. 분할된 인테인 및 그의 이용
US9567589B2 (en) 2011-09-28 2017-02-14 Ribomic Inc. NGF aptamer and application thereof
ES2935606T3 (es) 2011-12-08 2023-03-08 Sarepta Therapeutics Inc Análogos de oligonucleótidos dirigidos a LMNA humana
JP2015500648A (ja) 2011-12-16 2015-01-08 ターゲットジーン バイオテクノロジーズ リミテッド 所定の標的核酸配列を修飾するための組成物及び方法
CA3018046A1 (en) 2011-12-16 2013-06-20 Moderna Therapeutics, Inc. Modified nucleoside, nucleotide, and nucleic acid compositions
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013119602A1 (en) 2012-02-06 2013-08-15 President And Fellows Of Harvard College Arrdc1-mediated microvesicles (armms) and uses thereof
US20150166969A1 (en) 2012-02-24 2015-06-18 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies
AU2013225950B2 (en) 2012-02-29 2018-02-15 Sangamo Therapeutics, Inc. Methods and compositions for treating huntington's disease
JP2015512255A (ja) 2012-03-17 2015-04-27 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ざ瘡の高速診断および個人化された治療
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013152359A1 (en) 2012-04-06 2013-10-10 The Regents Of The University Of California Novel tetrazines and method of synthesizing the same
EP2841581B2 (en) 2012-04-23 2023-03-08 BASF Agricultural Solutions Seed US LLC Targeted genome engineering in plants
EP2844754B1 (en) 2012-05-02 2018-10-24 Dow AgroSciences LLC Targeted modification of malate dehydrogenase
RU2650819C2 (ru) 2012-05-07 2018-04-17 Сангамо Терапьютикс, Инк. Способы и композиции для опосредованной нуклеазой направленной интеграции трансгенов
WO2013169398A2 (en) 2012-05-09 2013-11-14 Georgia Tech Research Corporation Systems and methods for improving nuclease specificity and activity
LT3241902T (lt) 2012-05-25 2018-06-25 The Regents Of The University Of California Būdai ir kompozicijos, skirti rnr nukreiptos tikslinės dnr modifikacijai ir rnr nukreiptos transkripcijos moduliacijai
US20150017136A1 (en) 2013-07-15 2015-01-15 Cellectis Methods for engineering allogeneic and highly active t cell for immunotherapy
SG11201407802WA (en) 2012-05-25 2015-01-29 Cellectis Methods for engineering allogeneic and immunosuppressive resistant t cell for immunotherapy
KR20150027756A (ko) 2012-05-30 2015-03-12 베일러 칼리지 오브 메디신 Dna 수복, 변경 및 대체를 위한 도구로서의 초나선 미니벡터
WO2013188037A2 (en) 2012-06-11 2013-12-19 Agilent Technologies, Inc Method of adaptor-dimer subtraction using a crispr cas6 protein
WO2013188522A2 (en) 2012-06-12 2013-12-19 Genentech, Inc. Methods and compositions for generating conditional knock-out alleles
EP2674501A1 (en) 2012-06-14 2013-12-18 Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail Method for detecting and identifying enterohemorrhagic Escherichia coli
US9688971B2 (en) 2012-06-15 2017-06-27 The Regents Of The University Of California Endoribonuclease and methods of use thereof
WO2013192278A1 (en) 2012-06-19 2013-12-27 Regents Of The University Of Minnesota Gene targeting in plants using dna viruses
US9267127B2 (en) 2012-06-21 2016-02-23 President And Fellows Of Harvard College Evolution of bond-forming enzymes
EP3431497B1 (en) 2012-06-27 2022-07-27 The Trustees of Princeton University Split inteins, conjugates and uses thereof
PL2867361T3 (pl) 2012-06-29 2018-07-31 Massachusetts Institute Of Technology Masowo równoległa genetyka kombinatoryczna
US9125508B2 (en) 2012-06-30 2015-09-08 Seasons 4, Inc. Collapsible tree system
CA2878037C (en) 2012-07-11 2021-08-31 Sangamo Biosciences, Inc. Methods and compositions for delivery of biologics
US9877988B2 (en) 2012-07-11 2018-01-30 Sangamo Therapeutics, Inc. Method of treating lysosomal storage diseases using nucleases and a transgene
EP2877213B1 (en) 2012-07-25 2020-12-02 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
US10058078B2 (en) 2012-07-31 2018-08-28 Recombinetics, Inc. Production of FMDV-resistant livestock by allele substitution
EP2879678B1 (en) 2012-07-31 2023-03-01 Yeda Research and Development Co. Ltd. Enoxacin for treating amyotrophic lateral sclerosis
EP2880171B1 (en) 2012-08-03 2018-10-03 The Regents of The University of California Methods and compositions for controlling gene expression by rna processing
SG10201701601WA (en) 2012-08-29 2017-04-27 Sangamo Biosciences Inc Methods and compositions for treatment of a genetic condition
WO2014039513A2 (en) 2012-09-04 2014-03-13 The Trustees Of The University Of Pennsylvania Inhibition of diacylglycerol kinase to augment adoptive t cell transfer
MX367730B (es) 2012-09-04 2019-09-04 Cellectis Receptor de antigeno quimerico multi-cadena y usos del mismo.
BR112015004696B1 (pt) 2012-09-04 2022-07-19 The Scripps Research Institute Polipeptídeos quiméricos tendo especificidade de ligação direcionada, método de geração de um domínio n-terminal (ntd) de proteína efetora tipo ativador de transcrição (tale) e método para a recombinação sítio-específica
NZ705745A (en) 2012-09-07 2018-11-30 Sangamo Biosciences Inc Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
TWI670004B (zh) 2012-09-07 2019-09-01 美商陶氏農業科學公司 用來產生植物之螢光激活細胞分選富增技術
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
GB201216564D0 (en) 2012-09-17 2012-10-31 Univ Edinburgh Genetically edited animal
WO2014047103A2 (en) 2012-09-18 2014-03-27 The Translational Genomics Research Institute Isolated genes and transgenic organisms for producing biofuels
US9181535B2 (en) 2012-09-24 2015-11-10 The Chinese University Of Hong Kong Transcription activator-like effector nucleases (TALENs)
US9963707B2 (en) 2012-10-03 2018-05-08 Agrivida, Inc. Multiprotein expression cassettes
JO3470B1 (ar) 2012-10-08 2020-07-05 Merck Sharp & Dohme مشتقات 5- فينوكسي-3h-بيريميدين-4-أون واستخدامها كمثبطات ناسخ عكسي ل hiv
EP3763810A3 (en) 2012-10-10 2021-07-14 Sangamo Therapeutics, Inc. T cell modifying compounds and uses thereof
WO2014059255A1 (en) 2012-10-12 2014-04-17 The General Hospital Corporation Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
US20140115728A1 (en) 2012-10-24 2014-04-24 A. Joseph Tector Double knockout (gt/cmah-ko) pigs, organs and tissues
KR20150100651A (ko) 2012-10-30 2015-09-02 리컴비네틱스 인코포레이티드 동물의 성적 성숙 조절
BR112015009812A2 (pt) 2012-10-31 2017-08-22 Cellectis Método para a inserção genética específica em um genoma de planta, célula de planta transformada e seu uso, planta resistente a herbicidas, kit, vetor, e célula hospedeira
MX2015005466A (es) 2012-10-31 2015-07-23 Two Blades Foundation Identificacion de un gen resistente a xantomonas euvesicatoria del pimiento (capsicum annuum) y metodo para generar plantas con resistencia.
WO2014071235A1 (en) 2012-11-01 2014-05-08 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
EP2914728B1 (en) 2012-11-01 2020-07-08 Factor Bioscience Inc. Methods and products for expressing proteins in cells
US20140127752A1 (en) 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
JP6410237B2 (ja) 2012-11-09 2018-10-24 マルコ アーケッティ 拡散性因子および癌細胞
WO2014081855A1 (en) 2012-11-20 2014-05-30 Universite De Montreal Methods and compositions for muscular dystrophies
WO2014081730A1 (en) 2012-11-20 2014-05-30 Cold Spring Harbor Laboratory Mutations in solanaceae plants that modulate shoot architecture and enhance yield-related phenotypes
CA2891956A1 (en) 2012-11-20 2014-05-30 J.R. Simplot Company Tal-mediated transfer dna insertion
EP2925864B1 (en) 2012-11-27 2018-10-31 The Children's Medical Center Corporation Targeting bcl11a distal regulatory elements for fetal hemoglobin reinduction
WO2014085261A1 (en) 2012-11-29 2014-06-05 North Carolina State University Synthetic pathway for biological carbon dioxide sequestration
US20150299702A1 (en) 2012-11-30 2015-10-22 Aarhus Universitet Circular rna for inhibition of microrna
US20160010154A1 (en) 2012-11-30 2016-01-14 The Parkinson's Institute Screening assays for therapeutics for parkinson's disease
WO2014089212A1 (en) 2012-12-05 2014-06-12 Sangamo Biosciences, Inc. Methods and compositions for regulation of metabolic disorders
WO2014089513A1 (en) 2012-12-06 2014-06-12 Synthetic Genomics, Inc. Autonomous replication sequences and episomal dna molecules
EP2929029B1 (en) 2012-12-06 2018-07-25 Synthetic Genomics, Inc. Algal mutants having a locked-in high light acclimated phenotype
PL3138912T3 (pl) 2012-12-06 2019-04-30 Sigma Aldrich Co Llc Modyfikacja i regulacja genomu oparta na CRISPR
US10272163B2 (en) 2012-12-07 2019-04-30 The Regents Of The University Of California Factor VIII mutation repair and tolerance induction
US9914931B2 (en) 2012-12-07 2018-03-13 Synthetic Genomics, Inc. Nannochloropsis spliced leader sequences and uses therefor
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
SG11201504519TA (en) 2012-12-12 2015-07-30 Broad Inst Inc Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20140179770A1 (en) 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
CN110982844A (zh) 2012-12-12 2020-04-10 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
PT2921557T (pt) 2012-12-12 2016-10-19 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
DK2921557T3 (en) 2012-12-12 2016-11-07 Broad Inst Inc Design of systems, methods and optimized sequence manipulation guide compositions
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
EP3434776A1 (en) 2012-12-12 2019-01-30 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
RU2701662C9 (ru) 2012-12-12 2019-10-31 Те Брод Инститьют, Инк. Компоненты системы crispr-cas, способы и композиции для манипуляции с последовательностями
JP2016500268A (ja) 2012-12-13 2016-01-12 ダウ アグロサイエンシィズ エルエルシー トウモロコシにおける特定の遺伝子座に対する精密な遺伝子標的化
WO2014093736A1 (en) 2012-12-13 2014-06-19 Dow Agrosciences Llc Dna detection methods for site specific nuclease activity
AU2013358998B2 (en) 2012-12-13 2019-04-18 Massachusetts Institute Of Technology Recombinase-based logic and memory systems
DK2931891T3 (da) 2012-12-17 2019-08-19 Harvard College Rna-styret modificering af menneskelige genomer
US9708589B2 (en) 2012-12-18 2017-07-18 Monsanto Technology Llc Compositions and methods for custom site-specific DNA recombinases
PL2934097T3 (pl) 2012-12-21 2018-11-30 Cellectis Ziemniaki o ograniczonej słodkości indukowanej chłodem
WO2014104878A1 (en) 2012-12-27 2014-07-03 Keygene N.V. Method for removing genetic linkage in a plant
US9988625B2 (en) 2013-01-10 2018-06-05 Dharmacon, Inc. Templates, libraries, kits and methods for generating molecules
AU2014205134B2 (en) 2013-01-14 2020-01-16 Recombinetics, Inc. Hornless livestock
CN113005148A (zh) 2013-01-16 2021-06-22 爱默蕾大学 Cas9-核酸复合物及其相关用途
CN103233028B (zh) 2013-01-25 2015-05-13 南京徇齐生物技术有限公司 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列
AU2014215025B2 (en) 2013-02-05 2018-08-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cell lines for virus production and methods of use
WO2014124226A1 (en) 2013-02-07 2014-08-14 The Rockefeller University Sequence specific antimicrobials
US11466306B2 (en) 2013-02-14 2022-10-11 Osaka University Method for isolating specific genomic regions with use of molecule capable of specifically binding to endogenous DNA sequence
WO2014127287A1 (en) 2013-02-14 2014-08-21 Massachusetts Institute Of Technology Method for in vivo tergated mutagenesis
SG11201505968WA (en) 2013-02-20 2015-08-28 Regeneron Pharma Genetic modification of rats
US20150353885A1 (en) 2013-02-21 2015-12-10 Cellectis Method to counter-select cells or organisms by linking loci to nuclease components
ES2522765B2 (es) 2013-02-22 2015-03-18 Universidad De Alicante Método para dectectar inserciones de espaciadores en estructuras CRISPR
JP6491113B2 (ja) 2013-02-25 2019-03-27 サンガモ セラピューティクス, インコーポレイテッド ヌクレアーゼ媒介性遺伝子破壊を増強するための方法および組成物
WO2014131833A1 (en) 2013-02-27 2014-09-04 Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) Gene editing in the oocyte by cas9 nucleases
US10047366B2 (en) 2013-03-06 2018-08-14 The Johns Hopkins University Telomerator-a tool for chromosome engineering
WO2014143381A1 (en) 2013-03-09 2014-09-18 Agilent Technologies, Inc. Methods of in vivo engineering of large sequences using multiple crispr/cas selections of recombineering events
CN105283539A (zh) 2013-03-12 2016-01-27 桑格摩生物科学股份有限公司 用于hla的修饰的方法和组合物
US10329574B2 (en) 2013-03-12 2019-06-25 E I Du Pont De Nemours And Company Methods for the identification of variant recognition sites for rare-cutting engineered double-strand-break-inducing agents and compositions and uses thereof
WO2014158593A1 (en) 2013-03-13 2014-10-02 President And Fellows Of Harvard College Mutants of cre recombinase
WO2014153118A1 (en) 2013-03-14 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1)
ES2901396T3 (es) 2013-03-14 2022-03-22 Caribou Biosciences Inc Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico
US20140283156A1 (en) 2013-03-14 2014-09-18 Cold Spring Harbor Laboratory Trans-splicing ribozymes and silent recombinases
ES2692363T3 (es) 2013-03-14 2018-12-03 Translate Bio, Inc. Composiciones terapéuticas de ARNm y su uso para tratar enfermedades y trastornos
WO2014144094A1 (en) 2013-03-15 2014-09-18 J.R. Simplot Company Tal-mediated transfer dna insertion
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
CN105209624A (zh) 2013-03-15 2015-12-30 明尼苏达大学董事会 采用CRISPR/Cas系统的植物基因组的工程改造
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
CN108823238B (zh) 2013-03-15 2022-02-01 希博斯美国有限公司 采用寡核苷酸介导的基因修复提高靶向基因修饰的效率的方法和组合物
WO2014144592A2 (en) 2013-03-15 2014-09-18 The General Hospital Corporation Using truncated guide rnas (tru-grnas) to increase specificity for rna-guided genome editing
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
WO2015099850A1 (en) 2013-12-26 2015-07-02 The General Hospital Corporation Multiplex guide rnas
US20160046959A1 (en) 2013-03-15 2016-02-18 Carlisle P. Landel Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm)
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
US9937207B2 (en) 2013-03-21 2018-04-10 Sangamo Therapeutics, Inc. Targeted disruption of T cell receptor genes using talens
EP2981614A1 (en) 2013-04-02 2016-02-10 Bayer CropScience NV Targeted genome engineering in eukaryotes
DK2981607T3 (da) 2013-04-03 2020-11-16 Memorial Sloan Kettering Cancer Center Effektiv generering af tumormålrettede t-celler afledt af pluripotente stamceller
EP2981612B1 (en) 2013-04-04 2019-07-03 Trustees of Dartmouth College Compositions and methods for in vivo excision of hiv-1 proviral dna
EP4286517A3 (en) 2013-04-04 2024-03-13 President and Fellows of Harvard College Therapeutic uses of genome editing with crispr/cas systems
EP2981166B1 (en) 2013-04-05 2020-09-09 Dow AgroSciences LLC Methods and compositions for integration of an exogenous sequence within the genome of plants
US20150056629A1 (en) 2013-04-14 2015-02-26 Katriona Guthrie-Honea Compositions, systems, and methods for detecting a DNA sequence
US20160186208A1 (en) 2013-04-16 2016-06-30 Whitehead Institute For Biomedical Research Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal
EP2986709A4 (en) 2013-04-16 2017-03-15 University Of Washington Through Its Center For Commercialization Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering
SG10201808935WA (en) 2013-04-16 2018-11-29 Regeneron Pharma Targeted modification of rat genome
EP2989214A4 (en) 2013-04-23 2016-12-28 Harvard College IN SITU INTERACTION DETERMINATION
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
CN103224947B (zh) 2013-04-28 2015-06-10 陕西师范大学 一种基因打靶系统
EP2994531B1 (en) 2013-05-10 2018-03-28 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
EP3693398A1 (en) 2013-05-10 2020-08-12 Whitehead Institute for Biomedical Research In vitro production of red blood cells with sortaggable proteins
CN109897100A (zh) 2013-05-13 2019-06-18 瑟勒提斯公司 Cd19特异性嵌合抗原受体及其用途
KR102220382B1 (ko) 2013-05-13 2021-02-25 셀렉티스 면역요법을 위한 매우 활성인 t 세포를 조작하는 방법
EP2997146A4 (en) 2013-05-15 2017-04-26 Sangamo BioSciences, Inc. Methods and compositions for treatment of a genetic condition
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
WO2014190181A1 (en) 2013-05-22 2014-11-27 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
US11414695B2 (en) 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
AU2014273490B2 (en) 2013-05-29 2019-05-09 Cellectis Methods for engineering T cells for immunotherapy by using RNA-guided Cas nuclease system
EP3004349B1 (en) 2013-05-29 2018-03-28 Cellectis S.A. A method for producing precise dna cleavage using cas9 nickase activity
US11685935B2 (en) 2013-05-29 2023-06-27 Cellectis Compact scaffold of Cas9 in the type II CRISPR system
WO2014194190A1 (en) 2013-05-30 2014-12-04 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
AU2014273089B2 (en) 2013-05-31 2018-02-22 Cellectis A LAGLIDADG homing endonuclease cleaving the C-C Chemokine Receptor Type-5 (CCR5) gene and uses thereof
ES2716867T3 (es) 2013-05-31 2019-06-17 Cellectis Sa Endonucleasa de asentamiento LAGLIDADG que escinde el gen de receptor de células T alfa y usos de la misma
US20140359796A1 (en) 2013-05-31 2014-12-04 Recombinetics, Inc. Genetically sterile animals
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
MX2015016798A (es) 2013-06-04 2016-10-26 Harvard College Regulacion transcripcional guiada por acido ribonucleico.
CA2914519A1 (en) 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
CA2905229C (en) 2013-06-11 2023-10-10 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
EP3008181B1 (en) 2013-06-11 2019-11-06 The Regents of The University of California Methods and compositions for target dna modification
US20150315252A1 (en) 2013-06-11 2015-11-05 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
CN105531372A (zh) 2013-06-14 2016-04-27 塞尔克蒂斯股份有限公司 植物中非转基因基因组编辑方法
DK3011031T3 (da) 2013-06-17 2020-12-21 Broad Inst Inc Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi
JP6625971B2 (ja) 2013-06-17 2019-12-25 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化
JP6738729B2 (ja) 2013-06-17 2020-08-12 ザ・ブロード・インスティテュート・インコーポレイテッド 分裂終了細胞の疾患および障害をターゲティングおよびモデリングするための系、方法および組成物の送達、エンジニアリングおよび最適化
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
CA2915837A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
EP3011034B1 (en) 2013-06-17 2019-08-07 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
SG11201510297QA (en) 2013-06-19 2016-01-28 Sigma Aldrich Co Llc Targeted integration
CA2915779A1 (en) 2013-06-25 2014-12-31 Cellectis Modified diatoms for biofuel production
US20160369268A1 (en) 2013-07-01 2016-12-22 The Board Of Regents Of The University Of Texas System Transcription activator-like effector (tale) libraries and methods of synthesis and use
SG10201800111SA (en) 2013-07-09 2018-02-27 Harvard College Multiplex rna-guided genome engineering
JP2016528890A (ja) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いるゲノム編集の治療用の使用
CA2917639C (en) 2013-07-10 2024-01-02 President And Fellows Of Harvard College Orthogonal cas9 proteins for rna-guided gene regulation and editing
MX2016000306A (es) 2013-07-10 2016-08-08 Novartis Ag Celulas de hongos filamentosos deficientes en multiples proteasas y métodos de uso de las mismas.
KR102297747B1 (ko) 2013-07-10 2021-09-06 에프스톡 엘엘씨 Mrap2 녹아웃
HUE056760T2 (hu) 2013-07-11 2022-03-28 Modernatx Inc A CRISPR-hez kapcsolódó fehérjéket és a szintetikus SGRNS-ket kódoló szintetikus polinukleotidokat tartalmazó készítmények és felhasználási módjaik
CN106222197A (zh) 2013-07-16 2016-12-14 中国科学院上海生命科学研究院 植物基因组定点修饰方法
CN105392885B (zh) 2013-07-19 2020-11-03 赖瑞克斯生物科技公司 用于产生双等位基因敲除的方法和组合物
GB201313235D0 (en) 2013-07-24 2013-09-04 Univ Edinburgh Antiviral Compositions Methods and Animals
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
CN103388006B (zh) 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
US10421957B2 (en) 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
ES2915377T3 (es) 2013-08-02 2022-06-22 Enevolv Inc Procedimientos y células huésped para ingeniería genómica, de vías y biomolécular
ITTO20130669A1 (it) 2013-08-05 2015-02-06 Consiglio Nazionale Ricerche Vettore adeno-associato ricombinante muscolo-specifico e suo impiego nel trattamento di patologie muscolari
US20150044772A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
WO2015024017A2 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Rna polymerase, methods of purification and methods of use
WO2015021990A1 (en) 2013-08-16 2015-02-19 University Of Copenhagen Rna probing method and reagents
CN105705640B (zh) 2013-08-20 2019-02-15 非营利性组织佛兰芒综合大学生物技术研究所 抑制lncRNA用于治疗黑素瘤
CA3157565A1 (en) 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9567609B2 (en) 2013-08-28 2017-02-14 Sangamo Biosciences, Inc. Compositions for linking DNA-binding domains and cleavage domains
GB201315321D0 (en) 2013-08-28 2013-10-09 Koninklijke Nederlandse Akademie Van Wetenschappen Transduction Buffer
EA037850B1 (ru) 2013-08-29 2021-05-27 Тэмпл Юниверсити Оф Зе Коммонвэлс Систем Оф Хайе Эдьюкейшн Способы и композиции для рнк-направленного лечения вич-инфекции
CA2922823C (en) 2013-09-04 2023-01-17 Dow Agrosciences Llc Rapid targeting analysis in crops for determining donor insertion
US10167466B2 (en) 2013-09-04 2019-01-01 Csir Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression
WO2015032494A2 (de) 2013-09-04 2015-03-12 Kws Saat Ag Helminthosporium turcicum-resistente pflanze
EP4074330A1 (en) 2013-09-05 2022-10-19 Massachusetts Institute of Technology Tuning microbial populations with programmable nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
WO2015040075A1 (en) 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
ES2844174T3 (es) 2013-09-18 2021-07-21 Kymab Ltd Métodos, células y organismos
WO2015042393A2 (en) 2013-09-20 2015-03-26 President And Fellows Of Harvard College Evolved sortases and uses thereof
EP3049116B1 (en) 2013-09-23 2019-01-02 Rensselaer Polytechnic Institute Nanoparticle-mediated gene delivery, genomic editing and ligand-targeted modification in various cell populations
US10822606B2 (en) 2013-09-27 2020-11-03 The Regents Of The University Of California Optimized small guide RNAs and methods of use
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
US20160237451A1 (en) 2013-09-30 2016-08-18 Regents Of The University Of Minnesota Conferring resistance to geminiviruses in plants using crispr/cas systems
US20160368995A1 (en) 2013-09-30 2016-12-22 The Regents Of The University Of California Identification of cxcr8, a novel chemokine receptor
EP3052110A4 (en) 2013-10-02 2017-07-12 Northeastern University Methods and compositions for generation of developmentally-incompetent eggs in recipients of nuclear genetic transfer
JP5774657B2 (ja) 2013-10-04 2015-09-09 国立大学法人京都大学 エレクトロポレーションを利用した哺乳類の遺伝子改変方法
WO2015054315A1 (en) 2013-10-07 2015-04-16 Northeastern University Methods and compositions for ex vivo generation of developmentally competent eggs from germ line cells using autologous cell systems
WO2015052231A2 (en) 2013-10-08 2015-04-16 Technical University Of Denmark Multiplex editing system
DE102013111099B4 (de) 2013-10-08 2023-11-30 Eberhard Karls Universität Tübingen Medizinische Fakultät Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA
JP2015076485A (ja) 2013-10-08 2015-04-20 株式会社ジャパンディスプレイ 表示装置
US20150098954A1 (en) 2013-10-08 2015-04-09 Elwha Llc Compositions and Methods Related to CRISPR Targeting
EP3055423B1 (en) 2013-10-11 2019-12-25 Cellectis Method for detecting nucleic acid sequences of interest using talen protein
WO2015057671A1 (en) 2013-10-14 2015-04-23 The Broad Institute, Inc. Artificial transcription factors comprising a sliding domain and uses thereof
AU2014337385B2 (en) 2013-10-15 2020-04-30 The Scripps Research Institute Chimeric antigen receptor T cell switches and uses thereof
WO2015057834A1 (en) 2013-10-15 2015-04-23 The California Institute For Biomedical Research Peptidic chimeric antigen receptor t cell switches and uses thereof
EP3058072B1 (en) 2013-10-17 2021-05-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
EP3057432B1 (en) 2013-10-17 2018-11-21 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
US10759764B2 (en) 2013-10-18 2020-09-01 President And Fellows Of Harvard College Fluorination of organic compounds
CA2927965A1 (en) 2013-10-25 2015-04-30 Cellectis Design of rare-cutting endonucleases for efficient and specific targeting dna sequences comprising highly repetitive motives
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
US10584358B2 (en) 2013-10-30 2020-03-10 North Carolina State University Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri
WO2015066638A2 (en) 2013-11-04 2015-05-07 Dow Agrosciences Llc Optimal maize loci
MX358066B (es) 2013-11-04 2018-08-03 Dow Agrosciences Llc Óptimos loci de soya.
BR102014027448A8 (pt) 2013-11-04 2021-08-24 Dow Agrosciences Llc cassete de doador de polinucleotídeo, uso de uma planta, de uma parte de planta, ou de uma célula vegetal compreendendo o referido cassete, e método para integração direcionada do mesmo
UA120503C2 (uk) 2013-11-04 2019-12-26 Дау Агросайєнсиз Елелсі Спосіб одержання трансгенної клітини рослини кукурудзи
US10752906B2 (en) 2013-11-05 2020-08-25 President And Fellows Of Harvard College Precise microbiota engineering at the cellular level
KR102380245B1 (ko) 2013-11-07 2022-03-30 에디타스 메디신, 인코포레이티드 지배적인 gRNA를 이용하는 CRISPR-관련 방법 및 조성물
WO2015077058A2 (en) 2013-11-08 2015-05-28 The Broad Institute, Inc. Compositions and methods for selecting a treatment for b-cell neoplasias
AU2014346424B2 (en) 2013-11-11 2020-09-17 Sangamo Therapeutics, Inc. Methods and compositions for treating Huntington's Disease
WO2015070193A1 (en) 2013-11-11 2015-05-14 Liu Oliver Compositions and methods for targeted gene disruption in prokaryotes
EP3492593B1 (en) 2013-11-13 2021-08-18 Children's Medical Center Corporation Nuclease-mediated regulation of gene expression
US9951353B2 (en) 2013-11-15 2018-04-24 The United States Of America, As Represented By The Secretary, Dept. Of Health And Human Services Engineering neural stem cells using homologous recombination
AU2014350051A1 (en) 2013-11-18 2016-07-07 Crispr Therapeutics Ag CRISPR-Cas system materials and methods
WO2015073990A1 (en) 2013-11-18 2015-05-21 Yale University Compositions and methods of using transposons
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
US10787684B2 (en) 2013-11-19 2020-09-29 President And Fellows Of Harvard College Large gene excision and insertion
CN105960413B (zh) 2013-11-20 2020-03-27 泰莱托恩基金会 人工dna-结合蛋白及其用途
DK3071696T3 (da) 2013-11-22 2019-10-07 Mina Therapeutics Ltd C/ebp alfa kort aktiverings-rna-sammensætninger og fremgangsmåder til anvendelse
AU2014351871B2 (en) 2013-11-22 2020-02-13 Cellectis Method for generating batches of allogeneic T-cells with averaged potency
AU2014351797B2 (en) 2013-11-22 2021-03-11 Cellectis Method of engineering chemotherapy drug resistant T-cells for immunotherapy
CN103642836A (zh) 2013-11-26 2014-03-19 苏州同善生物科技有限公司 一种基于crispr基因敲除技术建立脆性x综合症灵长类动物模型的方法
CN103614415A (zh) 2013-11-27 2014-03-05 苏州同善生物科技有限公司 一种基于crispr基因敲除技术建立肥胖症大鼠动物模型的方法
EP3074515B1 (en) 2013-11-28 2018-11-14 Horizon Discovery Limited Somatic haploid human cell line
AU2014364051B2 (en) 2013-12-09 2018-12-20 Sangamo Therapeutics, Inc. Methods and compositions for treating hemophilia
RU2685914C1 (ru) 2013-12-11 2019-04-23 Регенерон Фармасьютикалс, Инк. Способы и композиции для направленной модификации генома
EP3835419A1 (en) 2013-12-12 2021-06-16 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
JP6712948B2 (ja) 2013-12-12 2020-06-24 ザ・ブロード・インスティテュート・インコーポレイテッド 組成物、及びヌクレオチドリピート障害におけるcrispr−cas系の使用方法
BR112016013201B1 (pt) 2013-12-12 2023-01-31 The Broad Institute, Inc. Uso de uma composição compreendendo um sistema crispr-cas no tratamento de uma doença genética ocular
WO2015089427A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP4219699A1 (en) 2013-12-12 2023-08-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
CA2932479A1 (en) 2013-12-12 2015-06-18 The Rockefeller University Delivery, use and therapeutic applications of the crispr-cas systems and compositions for hbv and viral diseases and disorders
JP6793547B2 (ja) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
CN106536729A (zh) 2013-12-12 2017-03-22 布罗德研究所有限公司 使用粒子递送组分靶向障碍和疾病的crispr‑cas系统和组合物的递送、用途和治疗应用
CA2933134A1 (en) 2013-12-13 2015-06-18 Cellectis Cas9 nuclease platform for microalgae genome engineering
AU2014363479A1 (en) 2013-12-13 2016-06-23 Cellectis New method of selection of algal-transformed cells using nuclease
US20150191744A1 (en) 2013-12-17 2015-07-09 University Of Massachusetts Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling
PT3083958T (pt) 2013-12-19 2019-06-27 Amyris Inc Métodos de integração genómica
WO2015103057A1 (en) 2013-12-30 2015-07-09 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Fusion genes associated with progressive prostate cancer
US9963689B2 (en) 2013-12-31 2018-05-08 The Regents Of The University Of California Cas9 crystals and methods of use thereof
CN103668472B (zh) 2013-12-31 2014-12-24 北京大学 利用CRISPR/Cas9系统构建真核基因敲除文库的方法
JP6747974B2 (ja) 2014-01-08 2020-08-26 プレジデント アンド フェローズ オブ ハーバード カレッジ Rna誘導型遺伝子ドライブ
RU2016133286A (ru) 2014-01-14 2018-02-20 Лэм Терапьютикс, Инк. Способы мутагенеза
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
US10179911B2 (en) 2014-01-20 2019-01-15 President And Fellows Of Harvard College Negative selection and stringency modulation in continuous evolution systems
GB201400962D0 (en) 2014-01-21 2014-03-05 Kloehn Peter C Screening for target-specific affinity binders using RNA interference
WO2015109752A1 (en) 2014-01-21 2015-07-30 The Institute Of Genetics And Developmental Biology Chinese Academy Of Sciences Modified plants
EP3097212A4 (en) 2014-01-24 2017-10-04 North Carolina State University Methods and compositions for sequences guiding cas9 targeting
JP6479024B2 (ja) 2014-01-24 2019-03-06 ザ チルドレンズ メディカル センター コーポレーション 抗体親和性の最適化のための高スループットマウスモデル
WO2015113063A1 (en) 2014-01-27 2015-07-30 Georgia Tech Research Corporation Methods and systems for identifying crispr/cas off-target sites
CN104805078A (zh) 2014-01-28 2015-07-29 北京大学 用于高效基因组编辑的rna分子的设计、合成及其应用
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
US20150291969A1 (en) 2014-01-30 2015-10-15 Chromatin, Inc. Compositions for reduced lignin content in sorghum and improving cell wall digestibility, and methods of making the same
US10233456B2 (en) 2014-01-30 2019-03-19 The Board Of Trustees Of The University Of Arkansas Method, vectors, cells, seeds and kits for stacking genes into a single genomic site
AU2015210769B2 (en) 2014-01-31 2019-02-07 Factor Bioscience Inc. Methods and products for nucleic acid production and delivery
GB201401707D0 (en) 2014-01-31 2014-03-19 Sec Dep For Health The Adeno-associated viral vectors
WO2015117081A2 (en) 2014-02-03 2015-08-06 Sangamo Biosciences, Inc. Methods and compositions for treatment of a beta thalessemia
WO2015115903A1 (en) 2014-02-03 2015-08-06 Academisch Ziekenhuis Leiden H.O.D.N. Lumc Site-specific dna break-induced genome editing using engineered nucleases
EP3102722B1 (en) 2014-02-04 2020-08-26 Jumpcode Genomics, Inc. Genome fractioning
CA2937058C (en) 2014-02-07 2022-07-19 Vib Vzw Inhibition of neat1 for treatment of solid tumors
CN111705365A (zh) 2014-02-11 2020-09-25 科罗拉多州立大学董事会(法人团体) Crispr支持的多路基因组工程化
CN106232814B (zh) 2014-02-13 2021-05-11 宝生物工程(美国)有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
HUE041497T2 (hu) 2014-02-14 2019-05-28 Cellectis Immunsejteken és patológiás sejteken egyaránt jelen lévõ antigént célzó génmódosított sejtek immunterápia célra
CA2940084A1 (en) 2014-02-18 2015-08-27 Duke University Compositions for the inactivation of virus replication and methods of making and using the same
CA2939053C (en) 2014-02-20 2022-02-22 Dsm Ip Assets B.V. Phage insensitive streptococcus thermophilus
CA2939711C (en) 2014-02-21 2020-09-29 Cellectis Method for in situ inhibition of regulatory t cells
US20170015994A1 (en) 2014-02-24 2017-01-19 Massachusetts Institute Of Technology Methods for in vivo genome editing
US10370680B2 (en) 2014-02-24 2019-08-06 Sangamo Therapeutics, Inc. Method of treating factor IX deficiency using nuclease-mediated targeted integration
JP6521669B2 (ja) 2014-02-25 2019-05-29 国立研究開発法人農業・食品産業技術総合研究機構 標的dnaに変異が導入された植物細胞、及びその製造方法
ES2898460T3 (es) 2014-02-27 2022-03-07 Monsanto Technology Llc Composiciones y procedimientos para la modificación genómica dirigida al sitio
CN103820454B (zh) 2014-03-04 2016-03-30 上海金卫生物技术有限公司 CRISPR-Cas9特异性敲除人PD1基因的方法以及用于特异性靶向PD1基因的sgRNA
CN103820441B (zh) 2014-03-04 2017-05-17 黄行许 CRISPR‑Cas9特异性敲除人CTLA4基因的方法以及用于特异性靶向CTLA4基因的sgRNA
DK3115457T3 (da) 2014-03-05 2019-11-04 Univ Kobe Nat Univ Corp Fremgangsmåde til modificering af genomsekvens til specifikt at konvertere nukleinsyrebaser af målrettet dna-sekvens og molekylært kompleks til anvendelse i samme
WO2015134812A1 (en) 2014-03-05 2015-09-11 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
ES2745769T3 (es) 2014-03-10 2020-03-03 Editas Medicine Inc Procedimientos y composiciones relacionados con CRISPR/CAS para tratar la amaurosis congénita de Leber 10 (LCA10)
HUE048558T2 (hu) 2014-03-11 2020-07-28 Cellectis Eljárás allogén transzplantációra kompatibilis T-sejtek létrehozására
WO2015138739A2 (en) 2014-03-12 2015-09-17 Precision Biosciences, Inc. Dystrophin gene oxon deletion using engineered nucleases
WO2015138870A2 (en) 2014-03-13 2015-09-17 The Trustees Of The University Of Pennsylvania Compositions and methods for targeted epigenetic modification
US20170088845A1 (en) 2014-03-14 2017-03-30 The Regents Of The University Of California Vectors and methods for fungal genome engineering by crispr-cas9
PT3116305T (pt) 2014-03-14 2024-03-07 Cibus Us Llc Métodos e composições para aumentar a eficiência da modificação genética direccionada utilizando a reparação genética mediada por oligonucleótidos
US9624498B2 (en) 2014-03-18 2017-04-18 Sangamo Biosciences, Inc. Methods and compositions for regulation of zinc finger protein expression
JP2017514513A (ja) 2014-03-20 2017-06-08 ユニベルシテ ラバル フラタキシンレベルを増加させるためのcrispr系の方法及び生成物、ならびにそれらの使用
MX2016011690A (es) 2014-03-21 2016-11-07 Univ Leland Stanford Junior Edicion del genoma sin nucleasas.
EP3122766B1 (en) 2014-03-24 2021-02-17 Immco Diagnostics, Inc. Improved anti-nuclear antibody detection and diagnostics for systemic and non-systemic autoimmune disorders
SI3122878T1 (sl) 2014-03-24 2019-05-31 Translate Bio, Inc. MRNA terapija za zdravljenje očesnih bolezni
CA2943622A1 (en) 2014-03-25 2015-10-01 Editas Medicine Inc. Crispr/cas-related methods and compositions for treating hiv infection and aids
WO2015148680A1 (en) 2014-03-25 2015-10-01 Ginkgo Bioworks, Inc. Methods and genetic systems for cell engineering
WO2015148863A2 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating sickle cell disease
CN106459951A (zh) 2014-03-26 2017-02-22 马里兰大学派克分院 驯养的大型动物的受精卵中的靶向基因组编辑
WO2015148860A1 (en) 2014-03-26 2015-10-01 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta-thalassemia
KR20160138210A (ko) 2014-03-28 2016-12-02 아포센스 엘티디. 분자의 막횡단 전달을 위한 화합물 및 방법
US9993563B2 (en) 2014-03-28 2018-06-12 Aposense Ltd. Compounds and methods for trans-membrane delivery of molecules
EP3498845B1 (en) 2014-04-01 2022-06-22 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1)
WO2015153760A2 (en) 2014-04-01 2015-10-08 Sangamo Biosciences, Inc. Methods and compositions for prevention or treatment of a nervous system disorder
WO2015153791A1 (en) 2014-04-01 2015-10-08 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2)
US10507232B2 (en) 2014-04-02 2019-12-17 University Of Florida Research Foundation, Incorporated Materials and methods for the treatment of latent viral infection
US20170029850A1 (en) 2014-04-02 2017-02-02 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating primary open angle glaucoma
EP3126503A1 (en) 2014-04-03 2017-02-08 Massachusetts Institute Of Technology Methods and compositions for the production of guide rna
CN103911376B (zh) 2014-04-03 2017-02-15 黄行许 CRISPR‑Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA
CN106460003A (zh) 2014-04-08 2017-02-22 北卡罗来纳州立大学 用于使用crispr相关基因rna引导阻遏转录的方法和组合物
WO2015157070A2 (en) 2014-04-09 2015-10-15 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating cystic fibrosis
EP3129488B1 (en) 2014-04-10 2019-06-12 The Regents of The University of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
AU2015245469B2 (en) 2014-04-11 2020-11-12 Cellectis Method for generating immune cells resistant to arginine and/or tryptophan depleted microenvironment
JP2017513477A (ja) 2014-04-14 2017-06-01 マックスサイト インコーポレーティッド ゲノムdnaを改変するための方法および組成物
SI3132034T1 (sl) 2014-04-14 2020-12-31 Nemesis Bioscience Ltd. Zdravstveni pripomočki
CN103923911B (zh) 2014-04-14 2016-06-08 上海金卫生物技术有限公司 CRISPR-Cas9特异性敲除人CCR5基因的方法以及用于特异性靶向CCR5基因的sgRNA
GB201406968D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Deletion mutants
GB201406970D0 (en) 2014-04-17 2014-06-04 Green Biologics Ltd Targeted mutations
KR20230152175A (ko) 2014-04-18 2023-11-02 에디타스 메디신, 인코포레이티드 암 면역요법을 위한 crispr-cas-관련 방법, 조성물 및 구성성분
CN105039399A (zh) 2014-04-23 2015-11-11 复旦大学 多能干细胞-遗传性心肌病心肌细胞及其制备方法
KR20200138445A (ko) 2014-04-24 2020-12-09 보드 오브 리전츠, 더 유니버시티 오브 텍사스 시스템 입양 세포 요법 생성물을 생성하기 위한 유도 만능 줄기 세포의 응용
KR101823661B1 (ko) 2014-04-24 2018-01-30 기초과학연구원 마이크로 상동 기반의 유전자 녹아웃을 위한 뉴클레아제 표적 서열을 확인하는 방법
US9522936B2 (en) 2014-04-24 2016-12-20 Sangamo Biosciences, Inc. Engineered transcription activator like effector (TALE) proteins
WO2015168125A1 (en) 2014-04-28 2015-11-05 Recombinetics, Inc. Multiplex gene editing in swine
WO2015168158A1 (en) 2014-04-28 2015-11-05 Fredy Altpeter Targeted genome editing to modify lignin biosynthesis and cell wall composition
RU2016143352A (ru) 2014-04-28 2018-05-28 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Трансформация гаплоидной кукурузы
US10494422B2 (en) 2014-04-29 2019-12-03 Seattle Children's Hospital CCR5 disruption of cells expressing anti-HIV chimeric antigen receptor (CAR) derived from broadly neutralizing antibodies
CN104178506B (zh) 2014-04-30 2017-03-01 清华大学 Taler蛋白通过空间位阻发挥转录抑制作用及其应用
WO2015165276A1 (zh) 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路的试剂盒
WO2015168404A1 (en) 2014-04-30 2015-11-05 Massachusetts Institute Of Technology Toehold-gated guide rna for programmable cas9 circuitry with rna input
WO2015165275A1 (zh) 2014-04-30 2015-11-05 清华大学 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路
US20170037431A1 (en) 2014-05-01 2017-02-09 University Of Washington In vivo Gene Engineering with Adenoviral Vectors
GB201407852D0 (en) 2014-05-02 2014-06-18 Iontas Ltd Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules
WO2015171603A1 (en) 2014-05-06 2015-11-12 Two Blades Foundation Methods for producing plants with enhanced resistance to oomycete pathogens
CN106413760B (zh) 2014-05-08 2020-01-14 桑格摩生物科学股份有限公司 用于治疗亨廷顿病的方法和组合物
US10487336B2 (en) 2014-05-09 2019-11-26 The Regents Of The University Of California Methods for selecting plants after genome editing
EP3140403A4 (en) 2014-05-09 2017-12-20 Université Laval Prevention and treatment of alzheimer's disease by genome editing using the crispr/cas system
CA2948580A1 (en) 2014-05-09 2015-11-12 Adam Zlotnick Methods and compositions for treating hepatitis b virus infections
CA2947622A1 (en) 2014-05-13 2015-11-19 Sangamo Biosciences, Inc. Genome editing methods and compositions for prevention or treatment of a disease
US20170088819A1 (en) 2014-05-16 2017-03-30 Vrije Universiteit Brussel Genetic correction of myotonic dystrophy type 1
CN104004782B (zh) 2014-05-16 2016-06-08 安徽省农业科学院水稻研究所 一种延长水稻生育期的育种方法
CN104017821B (zh) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 定向编辑颖壳颜色决定基因OsCHI创制褐壳水稻材料的方法
CN103981212B (zh) 2014-05-16 2016-06-01 安徽省农业科学院水稻研究所 将黄色颖壳的水稻品种的颖壳颜色改为褐色的育种方法
CN103981211B (zh) 2014-05-16 2016-07-06 安徽省农业科学院水稻研究所 一种创制闭颖授粉水稻材料的育种方法
WO2015179540A1 (en) 2014-05-20 2015-11-26 Regents Of The University Of Minnesota Method for editing a genetic sequence
CA2852593A1 (en) 2014-05-23 2015-11-23 Universite Laval Methods for producing dopaminergic neurons and uses thereof
US10653123B2 (en) 2014-05-27 2020-05-19 Dana-Farber Cancer Institute, Inc. Methods and compositions for perturbing gene expression in hematopoietic stem cell lineages in vivo
JP2017516500A (ja) 2014-05-28 2017-06-22 ツールゲン インコーポレイテッドToolgen Incorporated 標的特異的ヌクレアーゼを用いた標的dnaの敏感な検出方法
BR112016028023A2 (pt) 2014-05-30 2017-08-22 Univ Leland Stanford Junior Composições e métodos de administração de tratamentos para infecções virais latentes
US9970001B2 (en) 2014-06-05 2018-05-15 Sangamo Therapeutics, Inc. Methods and compositions for nuclease design
WO2015188094A1 (en) 2014-06-06 2015-12-10 President And Fellows Of Harvard College Methods for targeted modification of genomic dna
PL3152312T3 (pl) 2014-06-06 2020-08-10 Regeneron Pharmaceuticals, Inc. Sposoby i kompozycje do modyfikowania docelowego locus
WO2015188135A1 (en) 2014-06-06 2015-12-10 The California Institute For Biomedical Research Constant region antibody fusion proteins and compositions thereof
WO2015188191A1 (en) 2014-06-06 2015-12-10 Wong Wilson W Dna recombinase circuits for logical control of gene expression
KR20170010893A (ko) 2014-06-06 2017-02-01 더 캘리포니아 인스티튜트 포 바이오메디칼 리써치 아미노 말단 면역글로불린 융합 단백질 및 이의 조성물을 구축하는 방법
CN104004778B (zh) 2014-06-06 2016-03-02 重庆高圣生物医药有限责任公司 含有CRISPR/Cas9系统的靶向敲除载体及其腺病毒和应用
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
US11274302B2 (en) 2016-08-17 2022-03-15 Diacarta Ltd Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency
WO2015191899A1 (en) 2014-06-11 2015-12-17 Howard Tom E FACTOR VIII MUTATION REPAIR AND TOLERANCE INDUCTION AND RELATED CDNAs, COMPOSITIONS, METHODS AND SYSTEMS
WO2016053397A2 (en) 2014-06-11 2016-04-07 Duke University Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
WO2015191911A2 (en) 2014-06-12 2015-12-17 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
WO2015189693A1 (en) 2014-06-12 2015-12-17 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using crispr/cas9
WO2015195547A1 (en) 2014-06-16 2015-12-23 University Of Washington Methods for controlling stem cell potential and for gene editing in stem cells
WO2015195621A1 (en) 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
CA2952613A1 (en) 2014-06-17 2015-12-23 Poseida Therapeutics, Inc. A method for directing proteins to specific loci in the genome and uses thereof
CA2952906A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
KR102425438B1 (ko) 2014-06-23 2022-07-27 더 제너럴 하스피탈 코포레이션 서열결정에 의해 평가된 DSB의 게놈 전체에 걸친 비편향된 확인 (GUIDE-Seq)
RS60366B1 (sr) 2014-06-23 2020-07-31 Regeneron Pharma Sastavljanje dnk posredovano nukleazom
WO2015200555A2 (en) 2014-06-25 2015-12-30 Caribou Biosciences, Inc. Rna modification to engineer cas9 activity
SI3161128T1 (sl) 2014-06-26 2019-02-28 Regeneron Pharmaceuticals, Inc. Postopki in sestavki za ciljano genetsko spremembo in postopki uporabe
GB201411344D0 (en) 2014-06-26 2014-08-13 Univ Leicester Cloning
CN106662033B (zh) 2014-06-30 2019-01-18 日产自动车株式会社 内燃机
EP3162328B1 (en) 2014-06-30 2022-01-19 Kao Corporation Adhesive sheet for cooling
WO2016004010A1 (en) 2014-07-01 2016-01-07 Board Of Regents, The University Of Texas System Regulated gene expression from viral vectors
JP6782171B2 (ja) 2014-07-02 2020-11-11 シャイアー ヒューマン ジェネティック セラピーズ インコーポレイテッド メッセンジャーrnaのカプセル化
US20170198268A1 (en) 2014-07-09 2017-07-13 Gen9, Inc. Compositions and Methods for Site-Directed DNA Nicking and Cleaving
EP2966170A1 (en) 2014-07-10 2016-01-13 Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - HBV inactivation
BR122023024818A2 (pt) 2014-07-11 2023-12-26 Pioneer Hi-Bred International, Inc. Rna guia, polinucleotídeo e complexo de ribonucleoproteínas
AU2015288157A1 (en) 2014-07-11 2017-01-19 E. I. Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
US11254933B2 (en) 2014-07-14 2022-02-22 The Regents Of The University Of California CRISPR/Cas transcriptional modulation
CN104109687A (zh) 2014-07-14 2014-10-22 四川大学 运动发酵单胞菌CRISPR-Cas9系统的构建与应用
WO2016011210A2 (en) 2014-07-15 2016-01-21 Juno Therapeutics, Inc. Engineered cells for adoptive cell therapy
WO2016011428A1 (en) 2014-07-17 2016-01-21 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Methods of treating cells containing fusion genes
US9944933B2 (en) 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
US10975406B2 (en) 2014-07-18 2021-04-13 Massachusetts Institute Of Technology Directed endonucleases for repeatable nucleic acid cleavage
US20160053272A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Modifying A Sequence Using CRISPR
SG11201700476VA (en) 2014-07-21 2017-02-27 Novartis Ag Treatment of cancer using humanized anti-bcma chimeric antigen receptor
AU2015294354B2 (en) 2014-07-21 2021-10-28 Illumina, Inc. Polynucleotide enrichment using CRISPR-Cas systems
CN106415742B (zh) 2014-07-22 2019-07-26 松下知识产权经营株式会社 复合磁性材料、使用其的线圈部件以及复合磁性材料的制造方法
EP3172315B1 (en) 2014-07-24 2020-09-30 DSM IP Assets B.V. Phage resistant lactic acid bacteria
US20170211048A1 (en) 2014-07-25 2017-07-27 Boehringer Ingelheim International Gmbh Enhanced reprogramming to ips cells
US9757420B2 (en) 2014-07-25 2017-09-12 Sangamo Therapeutics, Inc. Gene editing for HIV gene therapy
US9816074B2 (en) 2014-07-25 2017-11-14 Sangamo Therapeutics, Inc. Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells
WO2016016119A1 (en) 2014-07-26 2016-02-04 Consiglio Nazionale Delle Ricerche Compositions and methods for treatment of muscular dystrophy
FR3024464A1 (fr) 2014-07-30 2016-02-05 Centre Nat Rech Scient Ciblage de vecteurs integratifs non-viraux dans les sequences d'adn nucleolaires chez les eucaryotes
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
US9616090B2 (en) 2014-07-30 2017-04-11 Sangamo Biosciences, Inc. Gene correction of SCID-related genes in hematopoietic stem and progenitor cells
US9850521B2 (en) 2014-08-01 2017-12-26 Agilent Technologies, Inc. In vitro assay buffer for Cas9
EP2982758A1 (en) 2014-08-04 2016-02-10 Centre Hospitalier Universitaire Vaudois (CHUV) Genome editing for the treatment of huntington's disease
US10280402B2 (en) 2014-08-06 2019-05-07 College Of Medicine Pochon Cha University Industry-Academic Cooperation Foundation Immune-compatible cells created by nuclease-mediated editing of genes encoding HLA
AU2015299850B2 (en) 2014-08-06 2020-08-13 Institute For Basic Science Genome editing using Campylobacter jejuni CRISPR/CAS system-derived RGEN
US9932566B2 (en) 2014-08-07 2018-04-03 Agilent Technologies, Inc. CIS-blocked guide RNA
US11299732B2 (en) 2014-08-07 2022-04-12 The Rockefeller University Compositions and methods for transcription-based CRISPR-Cas DNA editing
US20160058889A1 (en) 2014-08-11 2016-03-03 The Board Of Regents Of The University Of Texas System Prevention of muscular dystrophy by crispr/cas9-mediated gene editing
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
CN104178461B (zh) 2014-08-14 2017-02-01 北京蛋白质组研究中心 携带cas9的重组腺病毒及其应用
US11071289B2 (en) 2014-08-14 2021-07-27 Biocytogen Boston Corp DNA knock-in system
US9879270B2 (en) 2014-08-15 2018-01-30 Wisconsin Alumni Research Foundation Constructs and methods for genome editing and genetic engineering of fungi and protists
EP3686279B1 (en) 2014-08-17 2023-01-04 The Broad Institute, Inc. Genome editing using cas9 nickases
EP3183367B1 (en) 2014-08-19 2019-06-26 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
JP6806668B2 (ja) 2014-08-19 2021-01-06 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸をプロービングおよびマッピングするためのrna誘導型システム
WO2016026444A1 (en) 2014-08-20 2016-02-25 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Biomarker and therapeutic target for triple negative breast cancer
KR101946180B1 (ko) 2014-08-25 2019-02-08 지니위브 바이오사이언시스, 인코포레이티드 비-복제 형질도입 입자 및 형질도입 입자-기반 리포터 시스템
CA2958767A1 (en) 2014-08-26 2016-03-03 The Regents Of The University Of California Hypersensitive aba receptors
AU2015308910B2 (en) 2014-08-27 2017-12-07 Caribou Biosciences, Inc. Methods for increasing Cas9-mediated engineering efficiency
EP3633032A3 (en) 2014-08-28 2020-07-29 North Carolina State University Novel cas9 proteins and guiding features for dna targeting and genome editing
WO2016036754A1 (en) 2014-09-02 2016-03-10 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification
WO2016035044A1 (en) 2014-09-05 2016-03-10 Vilnius University Programmable rna shredding by the type iii-a crispr-cas system of streptococcus thermophilus
WO2016037157A2 (en) 2014-09-05 2016-03-10 The Johns Hopkins University Targeting capn9/capns2 activity as a therapeutic strategy for the treatment of myofibroblast differentiation and associated pathologies
WO2016040594A1 (en) 2014-09-10 2016-03-17 The Regents Of The University Of California Reconstruction of ancestral cells by enzymatic recording
WO2016040030A1 (en) 2014-09-12 2016-03-17 E. I. Du Pont De Nemours And Company Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
US9738646B2 (en) 2014-09-16 2017-08-22 Gilead Sciences, Inc. Solid forms of a toll-like receptor modulator
KR20170054445A (ko) 2014-09-16 2017-05-17 상가모 테라퓨틱스, 인코포레이티드 뉴클레아제-매개된 게놈 엔지니어링 및 조혈 줄기세포에서의 교정을 위한 방법 및 조성물
WO2016049024A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
EP3800260A1 (en) 2014-09-24 2021-04-07 City of Hope Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
WO2016049163A2 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016049251A1 (en) 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes
WO2016046635A1 (en) 2014-09-25 2016-03-31 Institut Pasteur Methods for characterizing human papillomavirus associated cervical lesions
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
US20160090603A1 (en) 2014-09-30 2016-03-31 Sandia Corporation Delivery platforms for the domestication of algae and plants
WO2016054326A1 (en) 2014-10-01 2016-04-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
EP3204503A1 (en) * 2014-10-06 2017-08-16 Arthrogen BV Aav-based gene therapy
WO2016057951A2 (en) 2014-10-09 2016-04-14 Life Technologies Corporation Crispr oligonucleotides and gene editing
EP3204399A4 (en) 2014-10-09 2018-04-25 Seattle Children's Hospital, dba Seattle Children's Research Institute Long poly (a) plasmids and methods for introduction of long poly (a) sequences into the plasmid
CN107530399B (zh) 2014-10-10 2022-03-18 马萨诸塞眼科耳科诊所 治疗分子在体外和体内的有效递送
CA2963693A1 (en) 2014-10-10 2016-04-14 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
WO2016061073A1 (en) 2014-10-14 2016-04-21 Memorial Sloan-Kettering Cancer Center Composition and method for in vivo engineering of chromosomal rearrangements
KR20170070136A (ko) 2014-10-15 2017-06-21 리제너론 파마슈티칼스 인코포레이티드 만능성 세포를 생성하거나 유지하는 방법 및 조성물
EP3207131B1 (en) 2014-10-17 2022-09-28 Howard Hughes Medical Institute Genomic probes
CN104342457A (zh) 2014-10-17 2015-02-11 杭州师范大学 一种将外源基因定点整合到靶标基因的方法
EP3207139A1 (en) 2014-10-17 2017-08-23 The Penn State Research Foundation Methods and compositions for multiplex rna guided genome editing and other rna technologies
AU2015336086C1 (en) 2014-10-20 2021-07-29 Envirologix Inc. Compositions and methods for detecting an RNA virus
WO2016077052A2 (en) 2014-10-22 2016-05-19 President And Fellows Of Harvard College Evolution of proteases
US20170306306A1 (en) 2014-10-24 2017-10-26 Life Technologies Corporation Compositions and Methods for Enhancing Homologous Recombination
US20170247762A1 (en) 2014-10-27 2017-08-31 The Board Institute Inc. Compositions, methods and use of synthetic lethal screening
WO2016069774A1 (en) 2014-10-28 2016-05-06 Agrivida, Inc. Methods and compositions for stabilizing trans-splicing intein modified proteases
WO2016069910A1 (en) 2014-10-29 2016-05-06 Massachusetts Eye And Ear Infirmary Methods for efficient delivery of therapeutic molecules in vitro and in vivo
EP3212165B1 (en) 2014-10-30 2024-02-28 President and Fellows of Harvard College Delivery of negatively charged proteins using cationic lipids
MA40880A (fr) 2014-10-30 2017-09-05 Temple Univ Of The Commonwealth Éradication guidée par l'arn du virus jc humain et d'autres polyomavirus
DK3212789T3 (da) 2014-10-31 2020-07-27 Massachusetts Inst Technology Massiv parallel kombinatorisk genetik til crispr
US9816080B2 (en) 2014-10-31 2017-11-14 President And Fellows Of Harvard College Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs)
EA201790953A1 (ru) 2014-10-31 2017-10-31 Дзе Трастиз Оф Дзе Юниверсити Оф Пенсильвания Изменение экспрессии гена в cart-клетках и их применения
CN104504304B (zh) 2014-11-03 2017-08-25 深圳先进技术研究院 一种成簇的规律间隔的短回文重复序列识别方法及装置
CN104404036B (zh) 2014-11-03 2017-12-01 赛业(苏州)生物科技有限公司 基于CRISPR/Cas9技术的条件性基因敲除方法
WO2016072936A1 (en) 2014-11-03 2016-05-12 Nanyang Technological University Novel recombinant expression systems
EP3216867B1 (en) 2014-11-04 2020-04-15 National University Corporation Kobe University Method for modifying genome sequence to introduce specific mutation to targeted dna sequence by base-removal reaction, and molecular complex used therein
US20180291382A1 (en) 2014-11-05 2018-10-11 The Regents Of The University Of California Methods for Autocatalytic Genome Editing and Neutralizing Autocatalytic Genome Editing
EA038321B1 (ru) 2014-11-06 2021-08-09 Е.И. Дюпон Де Немур Энд Компани Опосредуемая пептидом доставка направляемой рнк эндонуклеазы в клетки
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
ES2706531T3 (es) 2014-11-11 2019-03-29 Illumina Inc Amplificación de polinucleótidos empleando sistemas CRISPR-Cas
WO2016077273A1 (en) 2014-11-11 2016-05-19 Q Therapeutics, Inc. Engineering mesenchymal stem cells using homologous recombination
JP6621820B2 (ja) 2014-11-14 2019-12-18 インスティチュート フォー ベーシック サイエンスInstitute For Basic Science ゲノムでプログラマブルヌクレアーゼの非標的位置を検出する方法
DK3218490T3 (en) 2014-11-15 2019-02-18 Zumutor Biologics Inc DNA BINDING DOMAIN OF CRISPR SYSTEM FOR PRODUCING NON-FUCOSYLED AND PARTICULAR FUCOSYLED PROTEINS
WO2016080097A1 (ja) 2014-11-17 2016-05-26 国立大学法人東京医科歯科大学 簡便で高効率の遺伝子改変非ヒト哺乳動物の作製方法
CN107109422B (zh) 2014-11-19 2021-08-13 基础科学研究院 使用由两个载体表达的拆分的Cas9的基因组编辑
US11319555B2 (en) 2014-11-20 2022-05-03 Duke University Compositions, systems and methods for cell therapy
PT3221457T (pt) 2014-11-21 2019-06-27 Regeneron Pharma Métodos e composições para modificação genética visada através da utilização de arn guia emparelhados
US10227661B2 (en) 2014-11-21 2019-03-12 GeneWeave Biosciences, Inc. Sequence-specific detection and phenotype determination
WO2016086177A2 (en) 2014-11-25 2016-06-02 Drexel University Compositions and methods for hiv quasi-species excision from hiv-1-infected patients
CN107208070B (zh) 2014-11-26 2021-09-07 技术创新动力基金(以色列)有限合伙公司 细菌基因的靶向消除
CN105695485B (zh) 2014-11-27 2020-02-21 中国科学院上海生命科学研究院 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用
GB201421096D0 (en) 2014-11-27 2015-01-14 Imp Innovations Ltd Genome editing methods
KR20170081268A (ko) 2014-11-27 2017-07-11 단지거 이노베이션즈 엘티디. 게놈 편집용 핵산 구조체
WO2016082135A1 (zh) 2014-11-27 2016-06-02 中国农业科学院北京畜牧兽医研究所 一种利用定点切割系统对猪h11位点定点插入的方法
WO2016089866A1 (en) 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
EP3227446A1 (en) 2014-12-01 2017-10-11 Novartis AG Compositions and methods for diagnosis and treatment of prostate cancer
CA2969619A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
CN104450774A (zh) 2014-12-04 2015-03-25 中国农业科学院作物科学研究所 一种大豆CRISPR/Cas9体系的构建及其在大豆基因修饰中的应用
CN107208079B (zh) 2014-12-05 2021-06-29 应用干细胞有限公司 整合转基因的位点定向crispr/重组酶组合物和方法
CN104531705A (zh) 2014-12-09 2015-04-22 中国农业大学 利用CRISPR-Cas9系统敲除动物myostatin基因的方法
CN104531704B (zh) 2014-12-09 2019-05-21 中国农业大学 利用CRISPR-Cas9系统敲除动物FGF5基因的方法
EP3229586A4 (en) 2014-12-10 2018-10-24 Regents of the University of Minnesota Genetically modified cells, tissues, and organs for treating disease
EP3889260A1 (en) 2014-12-12 2021-10-06 The Broad Institute, Inc. Protected guide rnas (pgrnas)
CN104480144B (zh) 2014-12-12 2017-04-12 武汉大学 用于艾滋病基因治疗的CRISPR/Cas9重组慢病毒载体及其慢病毒
CN107532162A (zh) 2014-12-12 2018-01-02 托德·M·伍尔夫 用于利用寡核苷酸编辑细胞中核酸的组合物和方法
WO2016094874A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Escorted and functionalized guides for crispr-cas systems
WO2016094880A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs)
EP3230460B2 (en) 2014-12-12 2023-11-29 James Zhu Methods and compositions for selectively eliminating cells of interest
EP3230452A1 (en) * 2014-12-12 2017-10-18 The Broad Institute Inc. Dead guides for crispr transcription factors
CN113215115A (zh) 2014-12-16 2021-08-06 C3J治疗公司 用于体外病毒基因组工程的组合物和方法
KR102350405B1 (ko) 2014-12-16 2022-01-11 다니스코 유에스 인크. 진균 게놈 변형 시스템 및 사용 방법
EP3234134B1 (en) 2014-12-17 2020-05-27 ProQR Therapeutics II B.V. Targeted rna editing
WO2016097231A2 (en) 2014-12-17 2016-06-23 Cellectis INHIBITORY CHIMERIC ANTIGEN RECEPTOR (iCAR OR N-CAR) EXPRESSING NON-T CELL TRANSDUCTION DOMAIN
US20170369866A1 (en) 2014-12-17 2017-12-28 E I Du Pont De Nemours And Company Compositions and methods for efficient gene editing in e. coli using guide rna/cas endonuclease systems in combination with circular polynucleotide modification templates
CN112877327A (zh) 2014-12-18 2021-06-01 综合基因技术公司 基于crispr的组合物和使用方法
WO2016097751A1 (en) 2014-12-18 2016-06-23 The University Of Bath Method of cas9 mediated genome engineering
CN104745626B (zh) 2014-12-19 2018-05-01 中国航天员科研训练中心 一种条件性基因敲除动物模型的快速构建方法及应用
WO2016100974A1 (en) 2014-12-19 2016-06-23 The Broad Institute Inc. Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing
EP3957745A1 (en) 2014-12-20 2022-02-23 Arc Bio, LLC Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
CN104560864B (zh) 2014-12-22 2017-08-11 中国科学院微生物研究所 利用CRISPR‑Cas9系统构建的敲除IFN‑β基因的293T细胞系
US10190106B2 (en) 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras
US11053271B2 (en) 2014-12-23 2021-07-06 The Regents Of The University Of California Methods and compositions for nucleic acid integration
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016103233A2 (en) 2014-12-24 2016-06-30 Dana-Farber Cancer Institute, Inc. Systems and methods for genome modification and regulation
CN104651398A (zh) 2014-12-24 2015-05-27 杭州师范大学 利用CRISPR-Cas9特异敲出microRNA基因家族的方法
AU2015101792A4 (en) 2014-12-24 2016-01-28 Massachusetts Institute Of Technology Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation
AU2015369725A1 (en) 2014-12-24 2017-06-29 Massachusetts Institute Of Technology CRISPR having or associated with destabilization domains
WO2016104716A1 (ja) 2014-12-26 2016-06-30 国立研究開発法人理化学研究所 遺伝子のノックアウト方法
CN104498493B (zh) 2014-12-30 2017-12-26 武汉大学 CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA
WO2016108926A1 (en) 2014-12-30 2016-07-07 The Broad Institute Inc. Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
US20180002706A1 (en) 2014-12-30 2018-01-04 University Of South Florida Methods and compositions for cloning into large vectors
CN104651399B (zh) 2014-12-31 2018-11-16 广西大学 一种利用CRISPR/Cas系统在猪胚胎细胞中实现基因敲除的方法
EP3240889A4 (en) 2014-12-31 2018-06-20 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
CN104651392B (zh) 2015-01-06 2018-07-31 华南农业大学 一种利用CRISPR/Cas9系统定点突变P/TMS12-1获得温敏不育系的方法
DK3242950T3 (da) 2015-01-06 2021-12-20 Dsm Ip Assets Bv Crispr-cas-system til en trådformet svampeværtscelle
EP3242948B1 (en) 2015-01-06 2021-12-22 DSM IP Assets B.V. A crispr-cas system for a yarrowia host cell
ES2886194T3 (es) 2015-01-06 2021-12-16 Univ Yonsei Iacf Endonucleasa dirigida al gen del factor VIII de coagulación sanguínea y composición para el tratamiento de la hemofilia que comprende el mismo
WO2016110512A1 (en) 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell
CN104593422A (zh) 2015-01-08 2015-05-06 中国农业大学 一种抗蓝耳病克隆猪的制备方法
US20180155708A1 (en) 2015-01-08 2018-06-07 President And Fellows Of Harvard College Split Cas9 Proteins
US10280451B2 (en) 2015-01-09 2019-05-07 Bio-Rad Laboratories, Inc. Detection of genome editing
US11125739B2 (en) 2015-01-12 2021-09-21 Massachusetts Institute Of Technology Gene editing through microfluidic delivery
US11208638B2 (en) 2015-01-12 2021-12-28 The Regents Of The University Of California Heterodimeric Cas9 and methods of use thereof
WO2016112963A1 (en) 2015-01-13 2016-07-21 Riboxx Gmbh Delivery of biomolecules into cells
MA41349A (fr) 2015-01-14 2017-11-21 Univ Temple Éradication de l'herpès simplex de type i et d'autres virus de l'herpès associés guidée par arn
CN107405378B (zh) 2015-01-14 2021-09-24 埃克斯-马赛大学 用于治疗与非降解异常蛋白的积聚相关的病症或癌症的蛋白酶体抑制剂
CN107429263A (zh) 2015-01-15 2017-12-01 斯坦福大学托管董事会 调控基因组编辑的方法
CN104611370A (zh) 2015-01-16 2015-05-13 深圳市科晖瑞生物医药有限公司 一种剔除β2-微球蛋白基因片段的方法
EA201791633A1 (ru) 2015-01-19 2018-03-30 Инститьют Оф Дженетикс Энд Девелопментал Байолоджи, Чайниз Акэдеми Оф Сайенсиз Способ точной модификации растения посредством транзиентной экспрессии гена
CN104725626B (zh) 2015-01-22 2016-06-29 漳州亚邦化学有限公司 一种适用于人造石英石的不饱和树脂的制备方法
CN105821072A (zh) 2015-01-23 2016-08-03 深圳华大基因研究院 用于DNA组装的CRISPR-Cas9系统及DNA组装方法
WO2016123071A1 (en) 2015-01-26 2016-08-04 Cold Spring Harbor Laboratory Methods of identifying essential protein domains
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
CN104561095B (zh) 2015-01-27 2017-08-22 深圳市国创纳米抗体技术有限公司 一种能够生产人神经生长因子的转基因小鼠的制备方法
WO2016123243A1 (en) 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
RU2713328C2 (ru) 2015-01-28 2020-02-04 Пайонир Хай-Бред Интернэшнл, Инк. Гибридные днк/рнк-полинуклеотиды crispr и способы применения
BR112017016045A2 (pt) 2015-01-29 2018-04-03 Meiogenix método para induzir recombinações meióticas endereçadas em uma célula eucariótica, proteína de fusão, ácido nucleico, cassete de expressão ou um vetor, célula hospedeira, método para gerar variantes de um organismo eucariótico, método para identificar ou localizar as informações genéticas, kit, e, uso de um kit
WO2016123578A1 (en) 2015-01-30 2016-08-04 The Regents Of The University Of California Protein delivery in primary hematopoietic cells
EP3892726A1 (en) 2015-02-02 2021-10-13 Meiragtx UK II Limited Regulation of gene expression by aptamer-mediated modulation of alternative splicing
CN104593418A (zh) 2015-02-06 2015-05-06 中国医学科学院医学实验动物研究所 一种人源化大鼠药物评价动物模型建立的方法
JP6929791B2 (ja) 2015-02-09 2021-09-01 デューク ユニバーシティ エピゲノム編集のための組成物および方法
KR101584933B1 (ko) 2015-02-10 2016-01-13 성균관대학교산학협력단 항생제 내성 억제용 재조합 벡터 및 이의 용도
WO2016130697A1 (en) 2015-02-11 2016-08-18 Memorial Sloan Kettering Cancer Center Methods and kits for generating vectors that co-express multiple target molecules
CN104928321B (zh) 2015-02-12 2018-06-01 中国科学院西北高原生物研究所 一种由Crispr/Cas9诱导的鳞片缺失斑马鱼模式及建立方法
CN104726494B (zh) 2015-02-12 2018-10-23 中国人民解放军第二军医大学 CRISPR-Cas9技术构建染色体易位干细胞及动物模型的方法
US10584321B2 (en) 2015-02-13 2020-03-10 University Of Massachusetts Compositions and methods for transient delivery of nucleases
US20160244784A1 (en) 2015-02-15 2016-08-25 Massachusetts Institute Of Technology Population-Hastened Assembly Genetic Engineering
WO2016132122A1 (en) 2015-02-17 2016-08-25 University Of Edinburgh Assay construct
US20180064073A1 (en) 2015-02-19 2018-03-08 Tokushima University Method for Transferring Cas9 mRNA Into Mammalian Fertilized Egg by Electroporation
WO2016137949A1 (en) 2015-02-23 2016-09-01 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
CN107532182A (zh) 2015-02-23 2018-01-02 克里斯珀医疗股份公司 治疗血红蛋白病的材料和方法
US20180200387A1 (en) 2015-02-23 2018-07-19 Crispr Therapeutics Ag Materials and methods for treatment of human genetic diseases including hemoglobinopathies
BR112017018327A2 (pt) 2015-02-25 2018-04-17 Pioneer Hi-Bred International, Inc. método para a expressão regulada de um complexo, planta ou célula vegetal, semente, método para modificação de uma sequência, método para alteração da expressão de pelo menos um polinucleotídeo
KR20160103953A (ko) 2015-02-25 2016-09-02 연세대학교 산학협력단 Crispr 시스템을 이용한 다중 위치 염기서열의 동시 포획 방법
WO2016135507A1 (en) 2015-02-27 2016-09-01 University Of Edinburgh Nucleic acid editing systems
CN104805099B (zh) 2015-03-02 2018-04-13 中国人民解放军第二军医大学 一种安全编码Cas9蛋白的核酸分子及其表达载体
EP3265559B1 (en) 2015-03-03 2021-01-06 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
CN104673816A (zh) 2015-03-05 2015-06-03 广东医学院 一种pCr-NHEJ载体及其构建方法及其用于细菌基因定点敲除的应用
CN104651401B (zh) 2015-03-05 2019-03-08 东华大学 一种mir-505双等位基因敲除的方法
US20180271891A1 (en) 2015-03-11 2018-09-27 The Broad Institute Inc. Selective treatment of prmt5 dependent cancer
US20160264934A1 (en) 2015-03-11 2016-09-15 The General Hospital Corporation METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS
GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
AU2016228599A1 (en) 2015-03-12 2017-08-17 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Method for increasing ability of plant to resist invading DNA virus
EP3268472B1 (en) 2015-03-13 2021-05-05 The Jackson Laboratory A three-component crispr/cas complex system and uses thereof
CN106032540B (zh) 2015-03-16 2019-10-25 中国科学院上海生命科学研究院 CRISPR/Cas9核酸内切酶体系的腺相关病毒载体构建及其用途
CN105985943B (zh) 2015-03-16 2021-07-06 中国科学院遗传与发育生物学研究所 一种利用非遗传物质对植物基因组进行定点改造的方法
WO2016149484A2 (en) 2015-03-17 2016-09-22 Temple University Of The Commonwealth System Of Higher Education Compositions and methods for specific reactivation of hiv latent reservoir
CN113846144B (zh) 2015-03-17 2023-09-26 生物辐射实验室股份有限公司 检测基因组编辑
MA41382A (fr) 2015-03-20 2017-11-28 Univ Temple Édition génique basée sur le système crispr/endonucléase à induction par tat
EP3271461A1 (en) 2015-03-20 2018-01-24 Danmarks Tekniske Universitet Crispr/cas9 based engineering of actinomycetal genomes
CN104726449A (zh) 2015-03-23 2015-06-24 国家纳米科学中心 一种用于预防和/或治疗HIV的CRISPR-Cas9系统及其制备方法和用途
CN106148416B (zh) 2015-03-24 2019-12-17 华东师范大学 Cyp基因敲除大鼠的培育方法及其肝微粒体的制备方法
WO2016154596A1 (en) 2015-03-25 2016-09-29 Editas Medicine, Inc. Crispr/cas-related methods, compositions and components
WO2016154579A2 (en) 2015-03-26 2016-09-29 Editas Medicine, Inc. Crispr/cas-mediated gene conversion
US11046959B2 (en) 2015-03-30 2021-06-29 The Board Of Regents Of The Nevada System Of Higher Education On Behalf Of The University Of Nevada, Las Vegas Compositions comprising TALENs and methods of treating HIV
US20180080051A1 (en) 2015-03-31 2018-03-22 Exeligen Scientific, Inc. Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism
WO2016161380A1 (en) 2015-04-01 2016-10-06 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy
US20160287678A1 (en) 2015-04-02 2016-10-06 Agenovir Corporation Gene delivery methods and compositions
US20170166928A1 (en) 2015-04-03 2017-06-15 Whitehead Institute For Biomedical Research Compositions And Methods For Genetically Modifying Yeast
CN106167810A (zh) 2015-04-03 2016-11-30 内蒙古中科正标生物科技有限责任公司 基于CRISPR/Cas9技术的单子叶植物基因敲除载体及其应用
AU2016243052C1 (en) 2015-04-03 2022-11-24 Dana-Farber Cancer Institute, Inc. Composition and methods of genome editing of B-cells
WO2016164356A1 (en) 2015-04-06 2016-10-13 The Board Of Trustees Of The Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
US11214779B2 (en) 2015-04-08 2022-01-04 University of Pittsburgh—of the Commonwealth System of Higher Education Activatable CRISPR/CAS9 for spatial and temporal control of genome editing
WO2016167300A1 (ja) 2015-04-13 2016-10-20 国立大学法人東京大学 光依存的に又は薬物存在下でヌクレアーゼ活性若しくはニッカーゼ活性を示す、又は標的遺伝子の発現を抑制若しくは活性化するポリペプチドのセット
US10155938B2 (en) 2015-04-14 2018-12-18 City Of Hope Coexpression of CAS9 and TREX2 for targeted mutagenesis
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
WO2016168631A1 (en) 2015-04-17 2016-10-20 President And Fellows Of Harvard College Vector-based mutagenesis system
EP3286322A1 (en) 2015-04-21 2018-02-28 Novartis AG Rna-guided gene editing system and uses thereof
CN104805118A (zh) 2015-04-22 2015-07-29 扬州大学 一种苏禽黄鸡胚胎干细胞特定基因进行靶向敲除方法
CN104762321A (zh) 2015-04-22 2015-07-08 东北林业大学 基于CRISPR/Cas9系统靶向敲除KHV基因的敲除载体构建方法及其crRNA原件
AU2016253150B2 (en) 2015-04-24 2022-04-21 Editas Medicine, Inc. Evaluation of Cas9 molecule/guide RNA molecule complexes
US11268158B2 (en) 2015-04-24 2022-03-08 St. Jude Children's Research Hospital, Inc. Assay for safety assessment of therapeutic genetic manipulations, gene therapy vectors and compounds
CN107614012A (zh) 2015-04-24 2018-01-19 加利福尼亚大学董事会 使用工程化的细胞检测、监测或治疗疾病或病况的系统及制备和使用它们的方法
US11104897B2 (en) 2015-04-27 2021-08-31 Genethon Compositions and methods for the treatment of nucleotide repeat expansion disorders
JP6851319B2 (ja) 2015-04-27 2021-03-31 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア ヒト疾患のCRISPR/Cas9媒介性の修正のためのデュアルAAVベクター系
EP3087974A1 (en) 2015-04-29 2016-11-02 Rodos BioTarget GmbH Targeted nanocarriers for targeted drug delivery of gene therapeutics
US20190002920A1 (en) 2015-04-30 2019-01-03 The Brigham And Women's Hospital, Inc. Methods and kits for cloning-free genome editing
EP4008780A1 (en) 2015-04-30 2022-06-08 The Trustees of Columbia University in the City of New York Gene therapy for autosomal dominant diseases
US20160346359A1 (en) 2015-05-01 2016-12-01 Spark Therapeutics, Inc. Adeno-associated Virus-Mediated CRISPR-Cas9 Treatment of Ocular Disease
EP3289076B1 (en) 2015-05-01 2021-11-17 Precision Biosciences, Inc. Precise deletion of chromoscomal sequences in vivo
CN108026566A (zh) 2015-05-04 2018-05-11 特拉维夫大学拉莫特有限公司 用于使dna片段化的方法和试剂盒
CN104894068A (zh) 2015-05-04 2015-09-09 南京凯地生物科技有限公司 一种利用CRISPR/Cas9制备CAR-T细胞的方法
GB2531454A (en) 2016-01-10 2016-04-20 Snipr Technologies Ltd Recombinogenic nucleic acid strands in situ
EP3563684A1 (en) 2015-05-06 2019-11-06 Snipr Technologies Limited Altering microbial populations & modifying microbiota
US11572543B2 (en) 2015-05-08 2023-02-07 The Children's Medical Center. Corporation Targeting BCL11A enhancer functional regions for fetal hemoglobin reinduction
WO2016182893A1 (en) 2015-05-08 2016-11-17 Teh Broad Institute Inc. Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof
AU2016262521A1 (en) 2015-05-11 2017-12-14 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating HIV infection and AIDS
CA2986310A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
KR101785847B1 (ko) 2015-05-12 2017-10-17 연세대학교 산학협력단 선형 이중가닥 DNA를 활용한 CRISPR/Cas9 시스템을 이용한 표적 유전체 교정
MX2017014446A (es) 2015-05-12 2018-06-13 Sangamo Therapeutics Inc Regulacion de expresion genica mediada por nucleasa.
CN105886498A (zh) 2015-05-13 2016-08-24 沈志荣 CRISPR-Cas9特异性敲除人PCSK9基因的方法以及用于特异性靶向PCSK9基因的sgRNA
US20180119174A1 (en) 2015-05-13 2018-05-03 Seattle Children's Hospita (dba Seattle Children's Research Institute Enhancing endonuclease based gene editing in primary cells
US10920221B2 (en) 2015-05-13 2021-02-16 President And Fellows Of Harvard College Methods of making and using guide RNA for use with Cas9 systems
US11267899B2 (en) 2015-05-13 2022-03-08 Zumutor Biologics Inc. Afucosylated protein, cell expressing said protein and associated methods
EP3294879A4 (en) 2015-05-14 2019-02-20 University of Southern California OPTIMIZED GENETIZATION WITH A RECOMBINANT ENDONUCLEASE SYSTEM
US20180291372A1 (en) 2015-05-14 2018-10-11 Massachusetts Institute Of Technology Self-targeting genome editing system
WO2016186946A1 (en) 2015-05-15 2016-11-24 Pioneer Hi-Bred International, Inc. Rapid characterization of cas endonuclease systems, pam sequences and guide rna elements
US20180142236A1 (en) 2015-05-15 2018-05-24 Ge Healthcare Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
PL3298134T3 (pl) 2015-05-16 2023-09-18 Genzyme Corporation Edycja genów mutacji głęboko intronowych
WO2016185411A1 (en) 2015-05-18 2016-11-24 King Abdullah University Of Science And Technology Method of inhibiting plant virus pathogen infections by crispr/cas9-mediated interference
CN104846010B (zh) 2015-05-18 2018-07-06 安徽省农业科学院水稻研究所 一种删除转基因水稻筛选标记基因的方法
EP3095870A1 (en) 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
CN106011104B (zh) 2015-05-21 2019-09-27 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
US20160340622A1 (en) 2015-05-22 2016-11-24 Nabil Radi Abdou Bar Soap Anchoring Core
CN105518135B (zh) 2015-05-22 2020-11-24 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA
WO2016187904A1 (zh) 2015-05-22 2016-12-01 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA
WO2016187717A1 (en) 2015-05-26 2016-12-01 Exerkine Corporation Exosomes useful for genome editing
EP3302575A4 (en) 2015-05-28 2019-01-16 Coda Biotherapeutics GENOME EDITION VECTORS
CN104894075B (zh) 2015-05-28 2019-08-06 华中农业大学 CRISPR/Cas9和Cre/lox系统编辑伪狂犬病毒基因组制备疫苗方法和应用
CN105624146B (zh) 2015-05-28 2019-02-15 中国科学院微生物研究所 基于CRISPR/Cas9和酿酒酵母细胞内源的同源重组的分子克隆方法
JP2018516983A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション ウイルス感染を処置するための組成物および方法
JP2018516984A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション 細胞を標的にしたhpv処置のための組成物および方法
EP4039816A1 (en) 2015-05-29 2022-08-10 North Carolina State University Methods for screening bacteria, archaea, algae, and yeast using crispr nucleic acids
US20160346362A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cytomegalovirus infections
WO2016196499A1 (en) 2015-05-29 2016-12-08 Clark Atlanta University Human cell lines mutant for zic2
JP2018516596A (ja) 2015-05-29 2018-06-28 アジェノビア コーポレーション 抗ウイルスの方法および組成物
US20160348074A1 (en) 2015-05-29 2016-12-01 Agenovir Corporation Methods and compositions for treating cells for transplant
US10117911B2 (en) 2015-05-29 2018-11-06 Agenovir Corporation Compositions and methods to treat herpes simplex virus infections
WO2016191869A1 (en) 2015-06-01 2016-12-08 The Hospital For Sick Children Delivery of structurally diverse polypeptide cargo into mammalian cells by a bacterial toxin
AU2016270702B2 (en) 2015-06-01 2022-01-20 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions for RNA-guided treatment of HIV infection
CN105112445B (zh) 2015-06-02 2018-08-10 广州辉园苑医药科技有限公司 一种基于CRISPR-Cas9基因敲除技术的miR-205基因敲除试剂盒
US10392607B2 (en) 2015-06-03 2019-08-27 The Regents Of The University Of California Cas9 variants and methods of use thereof
CN108368502B (zh) 2015-06-03 2022-03-18 内布拉斯加大学董事委员会 使用单链dna的dna编辑
US10626393B2 (en) 2015-06-04 2020-04-21 Arbutus Biopharma Corporation Delivering CRISPR therapeutics with lipid nanoparticles
US20180245074A1 (en) 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
WO2016196805A1 (en) 2015-06-05 2016-12-08 The Regents Of The University Of California Methods and compositions for generating crispr/cas guide rnas
CN105039339B (zh) 2015-06-05 2017-12-19 新疆畜牧科学院生物技术研究所 一种以RNA介导的特异性敲除绵羊FecB基因的方法及其专用sgRNA
US11911415B2 (en) 2015-06-09 2024-02-27 Editas Medicine, Inc. CRISPR/Cas-related methods and compositions for improving transplantation
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
ES2807440T3 (es) 2015-06-10 2021-02-23 Firmenich & Cie Procedimiento de identificación de compuestos de almizcle
WO2016198500A1 (en) 2015-06-10 2016-12-15 INSERM (Institut National de la Santé et de la Recherche Médicale) Methods and compositions for rna-guided treatment of human cytomegalovirus (hcmv) infection
CA2987078A1 (en) 2015-06-10 2016-12-15 Firmenich Sa Cell lines for screening odorant and aroma receptors
CN105518138B (zh) 2015-06-11 2021-07-27 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪GFRA1基因的方法及用于特异性靶向GFRA1基因的sgRNA
CN105593367A (zh) 2015-06-11 2016-05-18 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-1基因的方法及用于特异性靶向SLA-1基因的sgRNA
WO2016197361A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪GGTA1基因的方法及用于特异性靶向GGTA1基因的sgRNA
CN105518137B (zh) 2015-06-11 2021-04-30 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SALL1基因的方法及用于特异性靶向SALL1基因的sgRNA
WO2016197362A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪vWF基因的方法及用于特异性靶向vWF基因的sgRNA
WO2016197354A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪PDX1基因的方法及用于特异性靶向PDX1基因的sgRNA
CN105518139B (zh) 2015-06-11 2021-02-02 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪FGL2基因的方法及用于特异性靶向FGL2基因的sgRNA
WO2016197356A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-2基因的方法及用于特异性靶向SLA-2基因的sgRNA
WO2016197357A1 (zh) 2015-06-11 2016-12-15 深圳市第二人民医院 CRISPR-Cas9特异性敲除猪SLA-3基因的方法及用于特异性靶向SLA-3基因的sgRNA
US20180187190A1 (en) 2015-06-12 2018-07-05 Erasmus University Medical Center Rotterdam New crispr assays
GB201510296D0 (en) 2015-06-12 2015-07-29 Univ Wageningen Thermostable CAS9 nucleases
WO2016201138A1 (en) 2015-06-12 2016-12-15 The Regents Of The University Of California Reporter cas9 variants and methods of use thereof
JP7051438B2 (ja) 2015-06-15 2022-04-11 ノース カロライナ ステート ユニバーシティ 核酸およびrnaに基づく抗菌剤の効率的な送達のための方法および組成物
WO2016205728A1 (en) 2015-06-17 2016-12-22 Massachusetts Institute Of Technology Crispr mediated recording of cellular events
CA2989858A1 (en) 2015-06-17 2016-12-22 The Uab Research Foundation Crispr/cas9 complex for introducing a functional polypeptide into cells of blood cell lineage
WO2016205623A1 (en) 2015-06-17 2016-12-22 North Carolina State University Methods and compositions for genome editing in bacteria using crispr-cas9 systems
US11643668B2 (en) 2015-06-17 2023-05-09 The Uab Research Foundation CRISPR/Cas9 complex for genomic editing
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP3800255A3 (en) 2015-06-18 2021-06-23 Robert D. Bowles Rna-guided transcriptional regulation and methods of using the same for the treatment of back pain
US9957501B2 (en) 2015-06-18 2018-05-01 Sangamo Therapeutics, Inc. Nuclease-mediated regulation of gene expression
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2016205745A2 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
KR102575342B1 (ko) 2015-06-18 2023-09-05 더 브로드 인스티튜트, 인코퍼레이티드 표적외 효과를 감소시키는 crispr 효소 돌연변이
WO2016205764A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
WO2017004279A2 (en) 2015-06-29 2017-01-05 Massachusetts Institute Of Technology Compositions comprising nucleic acids and methods of using the same
GB201511376D0 (en) 2015-06-29 2015-08-12 Ecolab Usa Inc Process for the treatment of produced water from chemical enhanced oil recovery
EP3313989A4 (en) 2015-06-29 2018-12-05 Ionis Pharmaceuticals, Inc. Modified crispr rna and modified single crispr rna and uses thereof
WO2017001572A1 (en) 2015-06-30 2017-01-05 Cellectis Methods for improving functionality in nk cell by gene inactivation using specific endonuclease
WO2017004616A1 (en) 2015-07-02 2017-01-05 The Johns Hopkins University Crispr/cas9-based treatments
US20170009242A1 (en) 2015-07-06 2017-01-12 Whitehead Institute For Biomedical Research CRISPR-Mediated Genome Engineering for Protein Depletion
EP3320091B1 (en) 2015-07-06 2020-11-11 DSM IP Assets B.V. Guide rna assembly vector
CN105132451B (zh) 2015-07-08 2019-07-23 电子科技大学 一种CRISPR/Cas9单一转录单元定向修饰骨架载体及其应用
CA2991301A1 (en) 2015-07-13 2017-01-19 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
EP3322797B1 (en) 2015-07-13 2023-11-29 Institut Pasteur Improving sequence-specific antimicrobials by blocking dna repair
US20170014449A1 (en) 2015-07-13 2017-01-19 Elwha LLC, a limited liability company of the State of Delaware Site-specific epigenetic editing
WO2017010556A1 (ja) 2015-07-14 2017-01-19 学校法人福岡大学 部位特異的rna変異導入方法およびそれに使用する標的編集ガイドrnaならびに標的rna-標的編集ガイドrna複合体
CN108291218B (zh) * 2015-07-15 2022-08-19 新泽西鲁特格斯州立大学 核酸酶非依赖性靶向基因编辑平台及其用途
MA42895A (fr) 2015-07-15 2018-05-23 Juno Therapeutics Inc Cellules modifiées pour thérapie cellulaire adoptive
US20170020922A1 (en) 2015-07-16 2017-01-26 Batu Biologics Inc. Gene editing for immunological destruction of neoplasia
WO2017015101A1 (en) 2015-07-17 2017-01-26 University Of Washington Methods for maximizing the efficiency of targeted gene correction
WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
US10392674B2 (en) 2015-07-22 2019-08-27 President And Fellows Of Harvard College Evolution of site-specific recombinases
EP3325018A4 (en) 2015-07-22 2019-04-24 Duke University HIGH EFFICIENCY SCREENING OF REGULATORY ELEMENT FUNCTION USING EPIGENOUS EDITING TECHNOLOGIES
CA2997535A1 (en) 2015-07-23 2017-01-26 Mayo Foundation For Medical Education And Research Editing mitochondrial dna
US20180360994A1 (en) 2015-07-25 2018-12-20 Habib Frost System, device and a method for providing a therapy or a cure for cancer and other pathological states
CN106399360A (zh) 2015-07-27 2017-02-15 上海药明生物技术有限公司 基于crispr技术敲除fut8基因的方法
CN105063061B (zh) 2015-07-28 2018-10-30 华南农业大学 一种水稻千粒重基因tgw6突变体及其制备方法与应用
JP6937740B2 (ja) 2015-07-28 2021-09-22 ダニスコ・ユーエス・インク ゲノム編集システムおよび使用方法
CN106701808A (zh) 2015-07-29 2017-05-24 深圳华大基因研究院 Dna聚合酶i缺陷型菌株及其构建方法
WO2017019895A1 (en) 2015-07-30 2017-02-02 President And Fellows Of Harvard College Evolution of talens
EP3328399B1 (en) 2015-07-31 2023-12-27 Regents of the University of Minnesota Modified cells and methods of therapy
WO2017069829A2 (en) 2015-07-31 2017-04-27 The Trustees Of Columbia University In The City Of New York High-throughput strategy for dissecting mammalian genetic interactions
WO2017024047A1 (en) 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
WO2017023974A1 (en) 2015-08-03 2017-02-09 President And Fellows Of Harvard College Cas9 genome editing and transcriptional regulation
EP3331905B1 (en) 2015-08-06 2022-10-05 Dana-Farber Cancer Institute, Inc. Targeted protein degradation to attenuate adoptive t-cell therapy associated adverse inflammatory responses
CN104962523B (zh) 2015-08-07 2018-05-25 苏州大学 一种测定非同源末端连接修复活性的方法
EP3332014A4 (en) 2015-08-07 2019-01-23 Commonwealth Scientific and Industrial Research Organisation METHOD FOR PRODUCING ANIMAL WITH GENETIC GLAND CARBON MODIFICATION
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
JP2018522907A (ja) 2015-08-11 2018-08-16 セレクティスCellectis Cd38抗原を標的とするためおよびcd38遺伝子を不活化するために操作された、免疫療法用の細胞
CN105255937A (zh) 2015-08-14 2016-01-20 西北农林科技大学 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用
EP3334832A4 (en) 2015-08-14 2019-06-26 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences METHOD FOR OBTAINING GLYPHOSATE-RESISTANT RICE BY DIRECTED NUCLEOTIDE SUBSTITUTION
EP3337898B1 (en) 2015-08-19 2021-07-28 Arc Bio, LLC Capture of nucleic acids using a nucleic acid-guided nuclease-based system
CN107922953B (zh) 2015-08-20 2022-03-04 应用干细胞有限公司 提高基因编辑效率的核酸酶
CN105112519A (zh) 2015-08-20 2015-12-02 郑州大学 一种基于crispr的大肠杆菌o157:h7菌株检测试剂盒及检测方法
CN105177126B (zh) 2015-08-21 2018-12-04 东华大学 一种利用荧光pcr技术对小鼠的分型鉴定方法
CA2996001A1 (en) 2015-08-25 2017-03-02 Duke University Compositions and methods of improving specificity in genomic engineering using rna-guided endonucleases
CN106480083B (zh) 2015-08-26 2021-12-14 中国科学院分子植物科学卓越创新中心 CRISPR/Cas9介导的大片段DNA拼接方法
CN114875012A (zh) 2015-08-28 2022-08-09 通用医疗公司 工程化的CRISPR-Cas9核酸酶
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
WO2017040709A1 (en) 2015-08-31 2017-03-09 Caribou Biosciences, Inc. Directed nucleic acid repair
EP3344771A4 (en) 2015-08-31 2019-03-20 Agilent Technologies, Inc. COMPOUNDS AND METHODS FOR GENOME EDITING BASED ON CRISPR / CAS BY HOMOLOGOUS RECOMBINATION
CN105087620B (zh) 2015-08-31 2017-12-29 中国农业大学 一种过表达猪共刺激受体4‑1bb载体及其应用
AU2016316027B2 (en) 2015-09-01 2022-04-07 Dana-Farber Cancer Institute Inc. Systems and methods for selection of gRNA targeting strands for Cas9 localization
US11390908B2 (en) 2015-09-02 2022-07-19 University Of Massachusetts Detection of gene loci with CRISPR arrayed repeats and/or polychromatic single guide ribonucleic acids
WO2017040786A1 (en) 2015-09-04 2017-03-09 Massachusetts Institute Of Technology Multilayer genetic safety kill circuits based on single cas9 protein and multiple engineered grna in mammalian cells
CN105400810B (zh) 2015-09-06 2019-05-07 吉林大学 采用敲除技术建立低磷性佝偻病模型的方法
WO2017044419A1 (en) 2015-09-08 2017-03-16 University Of Massachusetts Dnase h activity of neisseria meningitidis cas9
US20190024098A1 (en) 2015-09-09 2019-01-24 National University Corporation Kobe University Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method
WO2017043656A1 (ja) 2015-09-09 2017-03-16 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換する、グラム陽性菌のゲノム配列の変換方法、及びそれに用いる分子複合体
WO2017044776A1 (en) 2015-09-10 2017-03-16 Texas Tech University System Single-guide rna (sgrna) with improved knockout efficiency
CA2998158A1 (en) 2015-09-10 2017-03-16 Youhealth Biotech, Limited Methods and compositions for the treatment of glaucoma
CN105274144A (zh) 2015-09-14 2016-01-27 徐又佳 通过CRISPR/Cas9技术得到敲除铁调素基因斑马鱼的制备方法
US10301613B2 (en) 2015-09-15 2019-05-28 Arizona Board Of Regents On Behalf Of Arizona State University Targeted remodeling of prokaryotic genomes using CRISPR-nickases
US10109551B2 (en) 2015-09-15 2018-10-23 Intel Corporation Methods and apparatuses for determining a parameter of a die
CN105210981B (zh) 2015-09-15 2018-09-28 中国科学院生物物理研究所 建立可应用于人类疾病研究的雪貂模型的方法及其应用
CN105112422B (zh) 2015-09-16 2019-11-08 中山大学 基因miR408和UCL在培育高产水稻中的应用
US11261439B2 (en) 2015-09-18 2022-03-01 President And Fellows Of Harvard College Methods of making guide RNA
US20180237800A1 (en) 2015-09-21 2018-08-23 The Regents Of The University Of California Compositions and methods for target nucleic acid modification
CN105132427B (zh) 2015-09-21 2019-01-08 新疆畜牧科学院生物技术研究所 一种以RNA介导的特异性敲除双基因获得基因编辑绵羊的方法及其专用sgRNA
JP6799058B2 (ja) 2015-09-21 2020-12-09 アークトゥラス・セラピューティクス・インコーポレイテッドArcturus Therapeutics,Inc. アレル選択的な遺伝子編集およびその使用
JP6853257B2 (ja) 2015-09-23 2021-03-31 サンガモ セラピューティクス, インコーポレイテッド Httリプレッサー及びその使用
EP3337909B1 (en) 2015-09-24 2020-03-18 Sigma Aldrich Co. LLC Methods and reagents for molecular proximity detection using rna-guided nucleic acid binding proteins
EP3353297A1 (en) 2015-09-24 2018-08-01 Crispr Therapeutics AG Novel family of rna-programmable endonucleases and their uses in genome editing and other applications
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
WO2017053729A1 (en) 2015-09-25 2017-03-30 The Board Of Trustees Of The Leland Stanford Junior University Nuclease-mediated genome editing of primary cells and enrichment thereof
EP3353309A4 (en) 2015-09-25 2019-04-10 Tarveda Therapeutics, Inc. COMPOSITIONS AND METHOD FOR GENERIC EDITING
KR101795999B1 (ko) 2015-09-25 2017-11-09 전남대학교산학협력단 Crispr/cas9 시스템을 이용한 베타2-마이크로글로불린 유전자 제거용 시발체
KR101745863B1 (ko) 2015-09-25 2017-06-12 전남대학교산학협력단 Crispr/cas9 시스템을 이용한 프로히비틴2 유전자 제거용 시발체
EP3147363B1 (en) 2015-09-26 2019-10-16 B.R.A.I.N. Ag Activation of taste receptor genes in mammalian cells using crispr-cas-9
CN108779447A (zh) 2015-09-28 2018-11-09 天普大学-联邦高等教育系统 用于hiv感染的rna引导治疗的方法和组合物
US20170088828A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Compositions and methods for treatment of latent viral infections
CN108601883A (zh) 2015-09-29 2018-09-28 埃吉诺维亚公司 递送方法和组合物
CN105177038B (zh) 2015-09-29 2018-08-24 中国科学院遗传与发育生物学研究所 一种高效定点编辑植物基因组的CRISPR/Cas9系统
US20170088587A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Antiviral fusion proteins and genes
US20170087225A1 (en) 2015-09-29 2017-03-30 Agenovir Corporation Compositions and methods for latent viral transcription regulation
CN105331627B (zh) 2015-09-30 2019-04-02 华中农业大学 一种利用内源CRISPR-Cas系统进行原核生物基因组编辑的方法
EP3356520B1 (en) 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentiviral protein delivery system for rna-guided genome editing
AU2016336452B2 (en) 2015-10-06 2022-10-06 The Children's Hospital Of Philadelphia Compositions and methods for treating fragile X syndrome and related syndromes
WO2017062754A1 (en) 2015-10-07 2017-04-13 New York University Compositions and methods for enhancing crispr activity by polq inhibition
CN108513580A (zh) 2015-10-08 2018-09-07 哈佛学院董事及会员团体 多重基因组编辑
WO2017062886A1 (en) 2015-10-08 2017-04-13 Cellink Corporation Battery interconnects
EP3359662A4 (en) 2015-10-09 2019-06-19 The Children's Hospital of Philadelphia COMPOSITIONS AND METHODS OF TREATING HUNTINGTON DISEASE AND RELATED DISEASES
WO2017062855A1 (en) 2015-10-09 2017-04-13 Monsanto Technology Llc Novel rna-guided nucleases and uses thereof
CA2999050A1 (en) 2015-10-12 2017-04-20 E. I. Du Pont De Nemours And Company Protected dna templates for gene modification and increased homologous recombination in cells and methods of use
EP3362571A4 (en) 2015-10-13 2019-07-10 Duke University GENOMIC ENGINEERING WITH TYPE I CRISPRISMS IN EUKARYOTIC CELLS
CN108367081A (zh) 2015-10-14 2018-08-03 生命技术公司 核糖核蛋白转染剂
CN105400779A (zh) 2015-10-15 2016-03-16 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
JP2018531261A (ja) 2015-10-16 2018-10-25 テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション Cpf1を用いた、rnaガイド遺伝子編集方法および組成物
FR3042506B1 (fr) 2015-10-16 2018-11-30 IFP Energies Nouvelles Outil genetique de transformation de bacteries clostridium
SI3362461T1 (sl) 2015-10-16 2022-05-31 Modernatx, Inc. Analogi kape MRNA z modificirano fosfatno povezavo
AU2016337408B2 (en) 2015-10-16 2022-11-03 Astrazeneca Ab Inducible modification of a cell genome
EP3365269A4 (en) 2015-10-19 2019-06-19 The Methodist Hospital DISTRIBUTION, BY MEMBRANE DEFORMATION, FROM CRISPR-CAS9 TO DIFFICULT CELLS TO BE TRANSFERRED
CN105331607A (zh) 2015-10-19 2016-02-17 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
CA2996329A1 (en) 2015-10-20 2017-04-27 Pioneer Hi-Bred International, Inc. Restoring function to a non-functional gene product via guided cas systems and methods of use
CN105316324A (zh) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
CN105331608A (zh) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 脑膜炎双球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
JP7059179B2 (ja) 2015-10-20 2022-04-25 アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル 遺伝子操作のための方法及び製品
CN105331609A (zh) 2015-10-20 2016-02-17 芜湖医诺生物技术有限公司 脑膜炎双球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用
CN105316337A (zh) 2015-10-20 2016-02-10 芜湖医诺生物技术有限公司 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用
CA3001351A1 (en) 2015-10-21 2017-04-27 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating hepatitis b virus
CN109153980B (zh) 2015-10-22 2023-04-14 布罗德研究所有限公司 Vi-b型crispr酶和系统
CN105219799A (zh) 2015-10-22 2016-01-06 天津吉诺沃生物科技有限公司 一种基于CRISPR/Cas系统的多年生黑麦草的育种方法
CA3002827A1 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
ES2699848T3 (es) 2015-10-23 2019-02-13 Caribou Biosciences Inc Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos
TW201715041A (zh) 2015-10-26 2017-05-01 國立清華大學 細菌基因編輯方法
US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
WO2017075261A1 (en) 2015-10-27 2017-05-04 Recombinetics, Inc. Engineering of humanized car t-cells and platelets by genetic complementation
US20180230489A1 (en) 2015-10-28 2018-08-16 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
AU2016344609B2 (en) 2015-10-28 2022-05-12 Vertex Pharmaceuticals Incorporated Materials and methods for treatment of duchenne muscular dystrophy
MX2018005272A (es) 2015-10-28 2018-09-18 Sangamo Therapeutics Inc Construcciones específicas del hígado, casetes de expresión del factor viii y métodos de uso de estos.
US11111508B2 (en) 2015-10-30 2021-09-07 Brandeis University Modified CAS9 compositions and methods of use
AU2016343991B2 (en) 2015-10-30 2022-12-01 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating herpes simplex virus
CN105238806B (zh) 2015-11-02 2018-11-27 中国科学院天津工业生物技术研究所 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用
CN105316327B (zh) 2015-11-03 2019-01-29 中国农业科学院作物科学研究所 小麦TaAGO4a基因CRISPR/Cas9载体及其应用
CN108463227A (zh) 2015-11-04 2018-08-28 宾夕法尼亚大学董事会 在造血干细胞中基因编辑的方法和组合物
CN115806940A (zh) 2015-11-04 2023-03-17 菲特治疗公司 多能细胞的基因组工程改造
WO2017079428A1 (en) 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
CA3004171A1 (en) 2015-11-05 2017-05-11 Fundacion Instituto De Investigacion Sanitaria Fundacion Jimenez Diaz Process of gene-editing of cells isolated from a subject suffering from a metabolic disease affecting the erythroid lineage, cells obtained by said process and uses thereof
GB2544270A (en) 2015-11-05 2017-05-17 Fundació Centre De Regulació Genòmica Nucleic acids, peptides and methods
WO2017078751A1 (en) 2015-11-06 2017-05-11 The Methodist Hospital Micoluidic cell deomailiy assay for enabling rapid and efficient kinase screening via the crispr-cas9 system
CA3004497A1 (en) 2015-11-06 2017-05-11 The Jackson Laboratory Large genomic dna knock-in and uses thereof
EP3374507A1 (en) 2015-11-09 2018-09-19 IFOM Fondazione Istituto Firc di Oncologia Molecolare Crispr-cas sgrna library
WO2017083722A1 (en) 2015-11-11 2017-05-18 Greenberg Kenneth P Crispr compositions and methods of using the same for gene therapy
US11566052B2 (en) 2015-11-11 2023-01-31 Lonza Ltd. CRISPR-associated (Cas) proteins with reduced immunogenicity
EP3373979A1 (en) 2015-11-12 2018-09-19 Pfizer Inc Tissue-specific genome engineering using crispr-cas9
US11306308B2 (en) 2015-11-13 2022-04-19 Massachusetts Institute Of Technology High-throughput CRISPR-based library screening
KR101885901B1 (ko) 2015-11-13 2018-08-07 기초과학연구원 5' 말단의 인산기가 제거된 rna를 포함하는 리보핵산단백질 전달용 조성물
US20170191047A1 (en) 2015-11-13 2017-07-06 University Of Georgia Research Foundation, Inc. Adenosine-specific rnase and methods of use
IL259441B2 (en) 2015-11-16 2024-01-01 Res Inst Nationwide Childrens Hospital Materials and methods for the treatment of titin-based myopathies and other titinopathy
US11905521B2 (en) 2015-11-17 2024-02-20 The Chinese University Of Hong Kong Methods and systems for targeted gene manipulation
AU2016359629B2 (en) 2015-11-23 2023-03-09 Ranjan BATRA Tracking and manipulating cellular RNA via nuclear delivery of CRISPR/Cas9
CN105602987A (zh) 2015-11-23 2016-05-25 深圳市默赛尔生物医学科技发展有限公司 一种高效的dc细胞xbp1基因敲除方法
US20170145438A1 (en) 2015-11-24 2017-05-25 University Of South Carolina Viral Vectors for Gene Editing
US10240145B2 (en) 2015-11-25 2019-03-26 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer
US10612044B2 (en) 2015-11-25 2020-04-07 National University Corporation Gunma University DNA methylation editing kit and DNA methylation editing method
US20180346940A1 (en) 2015-11-27 2018-12-06 The Regents Of The University Of California Compositions and methods for the production of hydrocarbons, hydrogen and carbon monoxide using engineered azotobacter strains
CN105505979A (zh) 2015-11-28 2016-04-20 湖北大学 一种以CRISPR/Cas9基因编辑技术打靶Badh2基因获得香稻品系的方法
KR101906491B1 (ko) 2015-11-30 2018-12-05 기초과학연구원 F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
CN106811479B (zh) 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用
RU2634395C1 (ru) 2015-12-01 2017-10-26 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Балтийский Федеральный Университет имени Иммануила Канта" (БФУ им. И. Канта) Генетическая конструкция на основе системы редактирования генома crispr/cas9, кодирующая нуклеазу cas9, специфически импортируемую в митохондрии клеток человека
CN105296518A (zh) 2015-12-01 2016-02-03 中国农业大学 一种用于CRISPR/Cas9技术的同源臂载体构建方法
US11118189B2 (en) 2015-12-02 2021-09-14 Ceres, Inc. Methods for genetic modification of plants
US11085057B2 (en) 2015-12-02 2021-08-10 The Regents Of The University Of California Compositions and methods for modifying a target nucleic acid
WO2017093370A1 (en) 2015-12-03 2017-06-08 Technische Universität München T-cell specific genome editing
EP3384027A1 (en) 2015-12-04 2018-10-10 Novartis AG Compositions and methods for immunooncology
CN105779449B (zh) 2015-12-04 2018-11-27 新疆农业大学 一种棉花启动子GbU6-5PS及应用
CN105779448B (zh) 2015-12-04 2018-11-27 新疆农业大学 一种棉花启动子GbU6-7PS及应用
CN105462968B (zh) 2015-12-07 2018-10-16 北京信生元生物医学科技有限公司 一种靶向apoCⅢ的CRISPR-Cas9系统及其应用
CN106845151B (zh) 2015-12-07 2019-03-26 中国农业大学 CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置
EP3387001A4 (en) 2015-12-09 2019-08-14 Excision Biotherapeutics, Inc. METHODS AND COMPOSITIONS OF GENE EDITION TO ELIMINATE THE RISK OF ACTIVATING JC VIRUS AND PML (PROGRESSIVE MULTIFOCAL LEUCOENCEPHALEPATHY) DURING IMMUNOSUPPRESSE TREATMENT
DK3387134T3 (da) 2015-12-11 2020-12-21 Danisco Us Inc Fremgangsmåder og sammensætninger til øget nukleasemedieret genommodifikation og reducerede virkninger uden for målstedet
CN105463003A (zh) 2015-12-11 2016-04-06 扬州大学 一种消除卡那霉素耐药基因活性的重组载体及其构建方法
CN105296537A (zh) 2015-12-12 2016-02-03 西南大学 一种基于睾丸内注射的基因定点编辑技术
CN105400773B (zh) 2015-12-14 2018-06-26 同济大学 应用于大规模筛选癌症基因的CRISPR/Cas9富集测序方法
WO2017105350A1 (en) 2015-12-14 2017-06-22 Cellresearch Corporation Pte Ltd A method of generating a mammalian stem cell carrying a transgene, a mammalian stem cell generated by the method and pharmaceuticals uses of the mammalian stem cell
WO2017106616A1 (en) 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
NO343153B1 (en) 2015-12-17 2018-11-19 Hydra Systems As A method of assessing the integrity status of a barrier plug
CN105463027A (zh) 2015-12-17 2016-04-06 中国农业大学 一种高肌肉量及肥厚型心肌病模型克隆猪的制备方法
WO2017105991A1 (en) 2015-12-18 2017-06-22 Danisco Us Inc. Methods and compositions for t-rna based guide rna expression
WO2017106767A1 (en) 2015-12-18 2017-06-22 The Scripps Research Institute Production of unnatural nucleotides using a crispr/cas9 system
KR20180088911A (ko) 2015-12-18 2018-08-07 상가모 테라퓨틱스, 인코포레이티드 Mhc 세포 수용체의 표적화된 붕괴
KR20180086430A (ko) 2015-12-18 2018-07-31 다니스코 유에스 인크. 중합효소 ii(pol-ii) 기반의 가이드 rna 발현을 위한 방법 및 조성물
EP3392337B1 (en) 2015-12-18 2024-03-06 Japan Science and Technology Agency Genetic modification non-human organism, egg cells, fertilized eggs, and method for modifying target genes
CN108778297B (zh) 2015-12-18 2024-02-09 桑格摩生物治疗股份有限公司 T细胞受体的靶向破坏
US11118194B2 (en) 2015-12-18 2021-09-14 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
US20190233814A1 (en) 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2017109134A1 (en) 2015-12-22 2017-06-29 Curevac Ag Method for producing rna molecule compositions
WO2017112620A1 (en) 2015-12-22 2017-06-29 North Carolina State University Methods and compositions for delivery of crispr based antimicrobials
CN109312339B (zh) 2015-12-23 2022-01-28 克里斯珀医疗股份公司 用于治疗肌萎缩侧索硬化症和/或额颞叶变性的材料和方法
CN105543270A (zh) 2015-12-24 2016-05-04 中国农业科学院作物科学研究所 双抗性CRISPR/Cas9载体及应用
CN105543266A (zh) 2015-12-25 2016-05-04 安徽大学 一种维吉尼亚链霉菌IBL14中的CRISPR-Cas系统及应用其进行基因编辑的方法
CN105505976A (zh) 2015-12-25 2016-04-20 安徽大学 一种维吉尼亚链霉菌ibl14产青霉素重组菌株的构建方法
JP2019500043A (ja) 2015-12-28 2019-01-10 ノバルティス アーゲー 異常ヘモグロビン症の治療用組成物および方法
US10995327B2 (en) 2015-12-29 2021-05-04 Monsanto Technology Llc CRISPR-associated transposases and uses thereof
CN105441451B (zh) 2015-12-31 2019-03-22 暨南大学 一种特异靶向人ABCB1基因的sgRNA导向序列及应用
CN105567735A (zh) 2016-01-05 2016-05-11 华东师范大学 一种凝血因子基因突变的定点修复载体系统及方法
CN108473986A (zh) 2016-01-08 2018-08-31 诺维信公司 芽孢杆菌宿主细胞的基因组编辑
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
CN105647922A (zh) 2016-01-11 2016-06-08 中国人民解放军疾病预防控制所 基于一种新gRNA序列的CRISPR-Cas9系统在制备乙肝治疗药物中的应用
US11427837B2 (en) 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
US20190010496A1 (en) 2016-01-14 2019-01-10 The Brigham And Women`S Hospital, Inc. Genome Editing for Treating Glioblastoma
WO2017124100A1 (en) 2016-01-14 2017-07-20 Memphis Meats, Inc. Methods for extending the replicative capacity of somatic cells during an ex vivo cultivation process
CN109414001A (zh) 2016-01-15 2019-03-01 杰克逊实验室 通过cas9蛋白的多循环电穿孔产生的遗传修饰的非人哺乳动物
WO2017126987A1 (ru) 2016-01-18 2017-07-27 Анатолий Викторович ЗАЗУЛЯ Эритроциты для направленного транспорта лекарственного средства
CN105567738A (zh) 2016-01-18 2016-05-11 南开大学 使用基因组编辑技术CRISPR-Cas9诱导CCR5Δ32缺失的方法
CN105567734A (zh) 2016-01-18 2016-05-11 丹弥优生物技术(湖北)有限公司 一种基因组dna序列精准编辑方法
JP6914274B2 (ja) 2016-01-22 2021-08-04 ザ・ブロード・インスティテュート・インコーポレイテッド Crisprcpf1の結晶構造
CN108603196A (zh) 2016-01-25 2018-09-28 酶切生物技术公司 Rna向导的对人类jc病毒和其他多瘤病毒的根除
CN105567689B (zh) 2016-01-25 2019-04-09 重庆威斯腾生物医药科技有限责任公司 CRISPR/Cas9靶向敲除人TCAB1基因及其特异性gRNA
CA3011874A1 (en) 2016-01-25 2017-08-03 Excision Biotherapeutics, Inc. Methods and compositions for rna-guided treatment of hiv infection
CN105543228A (zh) 2016-01-25 2016-05-04 宁夏农林科学院 一种快速将水稻转化为香稻的方法
EP3199632A1 (en) 2016-01-26 2017-08-02 ACIB GmbH Temperature-inducible crispr/cas system
CN105567688A (zh) 2016-01-27 2016-05-11 武汉大学 一种可用于艾滋病基因治疗的CRISPR/SaCas9系统
FI3408292T3 (fi) 2016-01-29 2023-06-30 Univ Princeton Jaettuja inteiinejä, joilla on poikkeuksellinen silmukoitumisaktiivisuus
EP3409776A4 (en) 2016-01-30 2019-12-25 Bonac Corporation ARN UNIQUE ARTIFICIAL GUIDE AND ITS USE
CN107022562B (zh) 2016-02-02 2020-07-17 中国种子集团有限公司 利用CRISPR/Cas9系统对玉米基因定点突变的方法
CN105647968B (zh) 2016-02-02 2019-07-23 浙江大学 一种CRISPR/Cas9工作效率快速测试系统及其应用
US11845933B2 (en) 2016-02-03 2023-12-19 Massachusetts Institute Of Technology Structure-guided chemical modification of guide RNA and its applications
CN105671083B (zh) 2016-02-03 2017-09-29 安徽柯顿生物科技有限公司 PD‑1基因重组病毒质粒及构建、重组逆转录病毒Lenti‑PD‑1‑Puro及包装与应用
US11208652B2 (en) 2016-02-04 2021-12-28 President And Fellows Of Harvard College Mitochondrial genome editing and regulation
US20190038780A1 (en) 2016-02-05 2019-02-07 Regents Of The University Of Minnesota Vectors and system for modulating gene expression
WO2017139264A1 (en) 2016-02-09 2017-08-17 President And Fellows Of Harvard College Dna-guided gene editing and regulation
US11666666B2 (en) 2016-02-11 2023-06-06 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
RU2016104674A (ru) 2016-02-11 2017-08-16 Анатолий Викторович Зазуля Устройство модификации эритроцита с механизмом направленного транспорта лекарственного средства для функций генной терапии crispr/cas9
CN109415728A (zh) 2016-02-15 2019-03-01 天普大学-联邦高等教育系统 逆转录病毒核酸序列的切除
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
CN105647962A (zh) 2016-02-15 2016-06-08 浙江大学 运用CRISPR-Cas9系统敲除水稻MIRNA393b茎环序列的基因编辑方法
CN105647969B (zh) 2016-02-16 2020-12-15 湖南师范大学 一种基因敲除选育stat1a基因缺失型斑马鱼的方法
AU2017221405A1 (en) 2016-02-16 2018-09-20 Carnegie Mellon University Compositions for enhancing targeted gene editing and methods of use thereof
CN105594664B (zh) 2016-02-16 2018-10-02 湖南师范大学 一种基因敲除选育stat1a基因缺失型斑马鱼的方法
CN105624187A (zh) 2016-02-17 2016-06-01 天津大学 酿酒酵母基因组定点突变的方法
WO2017142999A2 (en) 2016-02-18 2017-08-24 President And Fellows Of Harvard College Methods and systems of molecular recording by crispr-cas system
ES2847252T3 (es) 2016-02-22 2021-08-02 Caribou Biosciences Inc Procedimientos de modulación de resultados de reparación de ADN
US20170275665A1 (en) 2016-02-24 2017-09-28 Board Of Regents, The University Of Texas System Direct crispr spacer acquisition from rna by a reverse-transcriptase-cas1 fusion protein
CN105646719B (zh) 2016-02-24 2019-12-20 无锡市妇幼保健院 一种高效定点转基因的工具及其应用
US20170247703A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Antiviral nuclease methods
US20170246260A1 (en) 2016-02-25 2017-08-31 Agenovir Corporation Modified antiviral nuclease
WO2017147278A1 (en) 2016-02-25 2017-08-31 The Children's Medical Center Corporation Customized class switch of immunoglobulin genes in lymphoma and hybridoma by crispr/cas9 technology
EP3420077A4 (en) 2016-02-25 2019-12-25 Agenovir Corporation VIRAL AND ONCOVIRAL NUCLEASE TREATMENT
CN109072245B (zh) 2016-02-26 2022-06-14 朗泽科技新西兰有限公司 用于c1固定菌的crispr/cas系统
WO2017151444A1 (en) 2016-02-29 2017-09-08 Agilent Technologies, Inc. Methods and compositions for blocking off-target nucleic acids from cleavage by crispr proteins
WO2017151719A1 (en) 2016-03-01 2017-09-08 University Of Florida Research Foundation, Incorporated Molecular cell diary system
CN105671070B (zh) 2016-03-03 2019-03-19 江南大学 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法
CA3016331A1 (en) 2016-03-04 2017-09-08 Editas Medicine, Inc. Crispr-cpf1-related methods, compositions and components for cancer immunotherapy
CN105821040B (zh) 2016-03-09 2018-12-14 李旭 联合免疫基因抑制高危型HPV表达的sgRNA、基因敲除载体及其应用
CN107177591A (zh) 2016-03-09 2017-09-19 北京大学 利用CRISPR技术编辑CCR5基因的sgRNA序列及其用途
CN105821039B (zh) 2016-03-09 2020-02-07 李旭 联合免疫基因抑制HBV复制的特异性sgRNA、表达载体及其应用
CN105861547A (zh) 2016-03-10 2016-08-17 黄捷 身份证号码永久嵌入基因组的方法
CA3010628A1 (en) 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
CA3017956A1 (en) * 2016-03-14 2017-09-21 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating beta hemoglobinopathies
US20180112234A9 (en) 2016-03-14 2018-04-26 Intellia Therapeutics, Inc. Methods and compositions for gene editing
CN108885048B (zh) 2016-03-15 2020-10-23 开利公司 冷藏销售柜
CN109152848B (zh) 2016-03-15 2022-12-09 马萨诸塞大学 抗-crispr化合物以及使用方法
EP3219799A1 (en) 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
US20200291370A1 (en) 2016-03-18 2020-09-17 President And Fellows Of Harvard College Mutant Cas Proteins
US11512311B2 (en) 2016-03-25 2022-11-29 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
AU2017241592A1 (en) 2016-03-28 2018-10-18 The Charles Stark Draper Laboratory, Inc. Bacteriophage engineering methods
CN106047803A (zh) 2016-03-28 2016-10-26 青岛市胶州中心医院 CRISPR/Cas9靶向敲除兔BMP2基因的细胞模型及其应用
WO2017173004A1 (en) 2016-03-30 2017-10-05 Mikuni Takayasu A method for in vivo precise genome editing
JP7245651B2 (ja) 2016-03-30 2023-03-24 インテリア セラピューティクス,インコーポレイテッド Crispr/cas構成成分のための脂質ナノ粒子製剤
US20190093128A1 (en) 2016-03-31 2019-03-28 The Regents Of The University Of California Methods for genome editing in zygotes
US20190112599A1 (en) 2016-03-31 2019-04-18 President And Fellows Of Harvard College Methods and Compositions for the Single Tube Preparation of Sequencing Libraries Using Cas9
CN106167525B (zh) 2016-04-01 2019-03-19 北京康明百奥新药研发有限公司 筛选超低岩藻糖细胞系的方法和应用
US10301619B2 (en) 2016-04-01 2019-05-28 New England Biolabs, Inc. Compositions and methods relating to synthetic RNA polynucleotides created from synthetic DNA oligonucleotides
KR20180132705A (ko) 2016-04-04 2018-12-12 에테하 취리히 단백질 생산 및 라이브러리(Library) 생성을 위한 포유동물 세포주
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
CN105802980A (zh) 2016-04-08 2016-07-27 北京大学 Gateway兼容性CRISPR/Cas9系统及其应用
CN106399306B (zh) 2016-04-12 2019-11-05 西安交通大学第一附属医院 靶向人lncRNA-UCA1抑制膀胱癌的sgRNA、基因载体及其应用
EP3443086B1 (en) 2016-04-13 2021-11-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US20190127713A1 (en) 2016-04-13 2019-05-02 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
EP3443088A1 (en) 2016-04-13 2019-02-20 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
WO2017178590A1 (en) 2016-04-14 2017-10-19 Université de Lausanne Treatment and/or prevention of dna-triplet repeat diseases or disorders
AU2017250683A1 (en) 2016-04-14 2018-11-01 Boco Silicon Valley, Inc. Genome editing of human neural stem cells using nucleases
CN105821116A (zh) 2016-04-15 2016-08-03 扬州大学 一种绵羊mstn基因定向敲除及其影响成肌分化的检测方法
WO2017181107A2 (en) 2016-04-16 2017-10-19 Ohio State Innovation Foundation Modified cpf1 mrna, modified guide rna, and uses thereof
US20190119678A1 (en) 2016-04-18 2019-04-25 Ruprecht-Karls-Universität Heidelberg Means and methods for inactivating therapeutic dna in a cell
WO2017184334A1 (en) 2016-04-18 2017-10-26 The Board Of Regents Of The University Of Texas System Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells
AU2017253089B2 (en) 2016-04-19 2023-07-20 Massachusetts Institute Of Technology Novel CRISPR enzymes and systems
WO2017189308A1 (en) 2016-04-19 2017-11-02 The Broad Institute Inc. Novel crispr enzymes and systems
CN106086062A (zh) 2016-04-19 2016-11-09 上海市农业科学院 一种获得番茄基因组定点敲除突变体的方法
WO2017184786A1 (en) 2016-04-19 2017-10-26 The Broad Institute Inc. Cpf1 complexes with reduced indel activity
CN105886616B (zh) 2016-04-20 2020-08-07 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法
CN105821075B (zh) 2016-04-22 2017-09-12 湖南农业大学 一种茶树咖啡因合成酶CRISPR/Cas9基因组编辑载体的构建方法
CN107304435A (zh) 2016-04-22 2017-10-31 中国科学院青岛生物能源与过程研究所 一种Cas9/RNA系统及其应用
US11248216B2 (en) 2016-04-25 2022-02-15 The Regents Of The University Of California Methods and compositions for genomic editing
CN105861552B (zh) 2016-04-25 2019-10-11 西北农林科技大学 一种T7 RNA聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法
CN107326046A (zh) 2016-04-28 2017-11-07 上海邦耀生物科技有限公司 一种提高外源基因同源重组效率的方法
WO2017190041A1 (en) 2016-04-29 2017-11-02 Sarepta Therapeutics, Inc. Oligonucleotide analogues targeting human lmna
CN105821049B (zh) 2016-04-29 2019-06-04 中国农业大学 一种Fbxo40基因敲除猪的制备方法
CN105886534A (zh) 2016-04-29 2016-08-24 苏州溯源精微生物科技有限公司 一种抑制肿瘤转移的方法
EP3448990B1 (en) 2016-04-29 2021-06-09 BASF Plant Science Company GmbH Methods for modification of target nucleic acids using a fusion molecule of guide and donor rna, fusion rna molecule and vector systems encoding the fusion rna molecule
WO2017190257A1 (en) 2016-05-01 2017-11-09 Neemo Inc Harnessing heterologous and endogenous crispr-cas machineries for efficient markerless genome editing in clostridium
WO2017192544A1 (en) 2016-05-02 2017-11-09 Massachusetts Institute Of Technology AMPHIPHILIC NANOPARTICLES FOR CODELIVERY OF WATER-INSOLUBLE SMALL MOLECULES AND RNAi
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
WO2017191210A1 (en) 2016-05-04 2017-11-09 Novozymes A/S Genome editing by crispr-cas9 in filamentous fungal host cells
CN105950639A (zh) 2016-05-04 2016-09-21 广州美格生物科技有限公司 金黄色葡萄球菌CRISPR/Cas9系统的制备及其在构建小鼠模型中的应用
CN106244591A (zh) 2016-08-23 2016-12-21 苏州吉玛基因股份有限公司 修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
CN105907785B (zh) 2016-05-05 2020-02-07 苏州吉玛基因股份有限公司 化学合成的crRNA用于CRISPR/Cpf1系统在基因编辑中的应用
WO2017190664A1 (zh) 2016-05-05 2017-11-09 苏州吉玛基因股份有限公司 化学合成的crRNA和修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用
US20190093092A1 (en) 2016-05-05 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Rna guided eradication of varicella zoster virus
WO2017193029A2 (en) 2016-05-05 2017-11-09 Duke University Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy
CA3022319A1 (en) 2016-05-06 2017-11-09 Tod M. Woolf Improved methods for genome editing with and without programmable nucleases
CN105985985B (zh) 2016-05-06 2019-12-31 苏州大学 Crispr技术编辑并用igf优化的异体间充质干细胞的制备方法及在治疗心梗中应用
WO2017196768A1 (en) 2016-05-09 2017-11-16 President And Fellows Of Harvard College Self-targeting guide rnas in crispr system
EP3455347A4 (en) 2016-05-10 2019-10-02 United States Government as Represented by The Department of Veterans Affairs LENTIVIRAL DELIVERY OF CRISPR / CAS CONSTRUCTS COLUMNS ESSENTIAL GENES FOR HIV-1 INFECTION AND REPLICATION
CN105861554B (zh) 2016-05-10 2020-01-31 华南农业大学 一种基于对Rbmy基因进行编辑来实现动物性别控制的方法和应用
WO2017197301A1 (en) 2016-05-12 2017-11-16 Hanley Brian P Safe delivery of crispr and other gene therapies to large fractions of somatic cells in humans and animals
CN107365786A (zh) 2016-05-12 2017-11-21 中国科学院微生物研究所 一种将spacer序列克隆至CRISPR-Cas9系统中的方法及其应用
US20190345483A1 (en) 2016-05-12 2019-11-14 President And Fellows Of Harvard College AAV Split Cas9 Genome Editing and Transcriptional Regulation
KR101922989B1 (ko) 2016-05-13 2018-11-28 연세대학교 산학협력단 CRISPR/Retron 시스템을 이용한 유전체상의 치환 변이 생성과 추적 방법
CN105838733A (zh) 2016-05-18 2016-08-10 云南省农业科学院花卉研究所 Cas9 介导的香石竹基因编辑载体和应用
CN106011171B (zh) 2016-05-18 2019-10-11 西北农林科技大学 一种利用CRISPR/Cas9技术基于SSA修复的基因无缝编辑方法
CN105907758B (zh) 2016-05-18 2020-06-05 世翱(上海)生物医药科技有限公司 CRISPR-Cas9引导序列及其引物、转基因表达载体及其构建方法
CN106446600B (zh) 2016-05-20 2019-10-18 同济大学 一种基于CRISPR/Cas9的sgRNA的设计方法
SG11201809552SA (en) 2016-05-20 2018-11-29 Regeneron Pharma Methods for breaking immunological tolerance using multiple guide rnas
WO2017205423A1 (en) 2016-05-23 2017-11-30 Washington University Pulmonary targeted cas9/crispr for in vivo editing of disease genes
US20190300867A1 (en) 2016-05-23 2019-10-03 The Trustees Of Columbia University In The City Of New York Bypassing the pam requirement of the crispr-cas system
CN105950560B (zh) 2016-05-24 2019-07-23 苏州系统医学研究所 人源化pd-l1肿瘤细胞系及具有该细胞系的动物模型与应用
CN106011167B (zh) 2016-05-27 2019-11-01 上海交通大学 雄性不育基因OsDPW2的应用及水稻育性恢复的方法
CN109642232A (zh) 2016-06-01 2019-04-16 Kws种子欧洲股份公司 用于基因组改造的杂合核酸序列
PT3272867T (pt) 2016-06-02 2019-12-04 Sigma Aldrich Co Llc Utilização de proteínas de ligação ao dna programáveis para intensificar a modificação de genoma direcionada
WO2017208247A1 (en) 2016-06-02 2017-12-07 Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. Assay for the removal of methyl-cytosine residues from dna
US11140883B2 (en) 2016-06-03 2021-10-12 Auburn University Gene editing of reproductive hormones to sterilize aquatic animals
RU2018144877A (ru) 2016-06-03 2020-07-09 Темпл Юниверсити - Оф Де Коммонвелт Систем Оф Хаер Эдьюкейшн Регуляция HIV-1 по механизму отрицательной обратной связи с помощью стратегии редактирования генов
CN106119275A (zh) 2016-06-07 2016-11-16 湖北大学 基于CRISPR/Cas9技术将非糯性水稻株系改造成糯性株系的打靶载体和方法
WO2017213898A2 (en) 2016-06-07 2017-12-14 Temple University - Of The Commonwealth System Of Higher Education Rna guided compositions for preventing and treating hepatitis b virus infections
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
CN106086008B (zh) 2016-06-10 2019-03-12 中国农业科学院植物保护研究所 烟粉虱MED隐种TRP基因的CRISPR/cas9系统及其应用
US11779657B2 (en) 2016-06-10 2023-10-10 City Of Hope Compositions and methods for mitochondrial genome editing
BR112018076027A2 (pt) 2016-06-14 2019-03-26 Pioneer Hi-Bred International, Inc. método para modificar uma sequência-alvo no genoma de uma célula vegetal; método para editar uma sequência de nucleotídeos no genoma de uma célula vegetal; método para modificar simultaneamente múltiplas sequências-alvo no genoma de uma célula vegetal; método para modificar uma sequênciaalvo de dna no genoma de uma célula vegetal e modelo de modificação de polinucleotídeo
CN106434752A (zh) 2016-06-14 2017-02-22 南通大学附属医院 敲除Wnt3a基因的过程及其验证方法
CN106167808A (zh) 2016-06-16 2016-11-30 郑州大学 一种基于CRISPR/Cas9技术消除mecA质粒的方法
CN105950633B (zh) 2016-06-16 2019-05-03 复旦大学 基因OsARF4在控制水稻粒长和千粒重中的应用
CN106167821A (zh) 2016-06-16 2016-11-30 郑州大学 一种金黄色葡萄球菌crispr位点检测试剂盒及检测方法
US20190330603A1 (en) 2016-06-17 2019-10-31 Genesis Technologies Limited Crispr-cas system, materials and methods
KR20230156150A (ko) 2016-06-17 2023-11-13 더 브로드 인스티튜트, 인코퍼레이티드 제vi형 crispr 오솔로그 및 시스템
CN105950626B (zh) 2016-06-17 2018-09-28 新疆畜牧科学院生物技术研究所 基于CRISPR/Cas9获得不同毛色绵羊的方法及靶向ASIP基因的sgRNA
EP3472311A4 (en) 2016-06-17 2020-03-04 Montana State University BIDIRECTIONAL TARGETING FOR GENOMEDITATION
EP3472325B1 (en) 2016-06-20 2024-04-03 Keygene N.V. Method for targeted dna alteration in plant cells
US20170362635A1 (en) 2016-06-20 2017-12-21 University Of Washington Muscle-specific crispr/cas9 editing of genes
US20190100745A1 (en) 2016-06-20 2019-04-04 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use
WO2017223107A1 (en) 2016-06-20 2017-12-28 Unity Biotechnology, Inc. Genome modifying enzyme therapy for diseases modulated by senescent cells
CN106148370A (zh) 2016-06-21 2016-11-23 苏州瑞奇生物医药科技有限公司 肥胖症大鼠动物模型和构建方法
JP2019522481A (ja) 2016-06-22 2019-08-15 アイカーン スクール オブ メディシン アット マウント サイナイ 自己切断リボザイムを利用したrnaのウイルス送達およびそのcrisprベースの適用
EP3475424A1 (en) 2016-06-22 2019-05-01 ProQR Therapeutics II B.V. Single-stranded rna-editing oligonucleotides
CN106047877B (zh) 2016-06-24 2019-01-11 中山大学附属第一医院 一种靶向敲除FTO基因的sgRNA及CRISPR/Cas9慢病毒系统与应用
CN106119283A (zh) 2016-06-24 2016-11-16 广西壮族自治区水牛研究所 一种利用CRISPR‑Cas9靶向敲除MSTN基因的方法
CN105925608A (zh) 2016-06-24 2016-09-07 广西壮族自治区水牛研究所 一种利用CRISPR-Cas9靶向敲除ALK6基因的方法
US20190185849A1 (en) 2016-06-29 2019-06-20 Crispr Therapeutics Ag Compositions and methods for gene editing
WO2018005873A1 (en) 2016-06-29 2018-01-04 The Broad Institute Inc. Crispr-cas systems having destabilization domain
US11913017B2 (en) 2016-06-29 2024-02-27 The Regents Of The University Of California Efficient genetic screening method
CN106148286B (zh) 2016-06-29 2019-10-29 牛刚 一种用于检测热原的细胞模型的构建方法和细胞模型及热原检测试剂盒
US10927383B2 (en) 2016-06-30 2021-02-23 Ethris Gmbh Cas9 mRNAs
US20180004537A1 (en) 2016-07-01 2018-01-04 Microsoft Technology Licensing, Llc Molecular State Machines
US10892034B2 (en) 2016-07-01 2021-01-12 Microsoft Technology Licensing, Llc Use of homology direct repair to record timing of a molecular event
US10669558B2 (en) 2016-07-01 2020-06-02 Microsoft Technology Licensing, Llc Storage through iterative DNA editing
BR112019000057A2 (pt) 2016-07-05 2019-04-02 The Johns Hopkins University composições e métodos com base em crispr/cas9 para o tratamento de degeneração de retina
CN106191057B (zh) 2016-07-06 2018-12-25 中山大学 一种用于敲除人CYP2E1基因的sgRNA序列、CYP2E1基因缺失细胞株的构建方法及其应用
EP3481959A1 (en) 2016-07-06 2019-05-15 Novozymes A/S Improving a microorganism by crispr-inhibition
CN106051058A (zh) 2016-07-07 2016-10-26 上海格昆机电科技有限公司 用于航天贮箱和粒子治疗仪的旋转机架及其传动机构
WO2018009822A1 (en) 2016-07-08 2018-01-11 Ohio State Innovation Foundation Modified nucleic acids, hybrid guide rnas, and uses thereof
CN107586777A (zh) 2016-07-08 2018-01-16 上海吉倍生物技术有限公司 人PDCD1基因sgRNA的用途及其相关药物
CN106047930B (zh) 2016-07-12 2020-05-19 北京百奥赛图基因生物技术有限公司 一种PS1基因条件性敲除flox大鼠的制备方法
BR112019000430A2 (pt) 2016-07-13 2019-07-09 Dsm Ip Assets Bv sistema crispr-cas para uma célula hospedeira de algas
WO2018013990A1 (en) 2016-07-15 2018-01-18 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase
EP3485023B1 (en) 2016-07-15 2023-11-15 Salk Institute for Biological Studies Methods and compositions for genome editing in non-dividing cells
CN106191062B (zh) 2016-07-18 2019-06-14 广东华南疫苗股份有限公司 一种tcr-/pd-1-双阴性t细胞及其构建方法
CN106190903B (zh) 2016-07-18 2019-04-02 华中农业大学 鸭疫里氏杆菌Cas9基因缺失突变株及其应用
CN106191061B (zh) 2016-07-18 2019-06-18 暨南大学 一种特异靶向人ABCG2基因的sgRNA导向序列及其应用
CN106434651B (zh) 2016-07-19 2021-05-18 广西大学 根癌农杆菌和CRISPR-Cas9介导的基因定点插入失活方法及其应用
JP2019525756A (ja) 2016-07-19 2019-09-12 デューク ユニバーシティ Cpf1に基づくゲノム編集の治療適用
WO2018015936A2 (en) 2016-07-21 2018-01-25 Maxcyte, Inc. Methods and compositions for modifying genomic dna
WO2018015444A1 (en) 2016-07-22 2018-01-25 Novozymes A/S Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi
CN106191107B (zh) 2016-07-22 2020-03-20 湖南农业大学 一种降低水稻籽粒落粒性的分子改良方法
CN106191064B (zh) 2016-07-22 2019-06-07 中国农业大学 一种制备mc4r基因敲除猪的方法
WO2018022480A1 (en) 2016-07-25 2018-02-01 Mayo Foundation For Medical Education And Research Treating cancer
WO2018018979A1 (zh) 2016-07-26 2018-02-01 浙江大学 植物重组载体及无转基因成分的基因编辑植株的筛选方法
CN106222193B (zh) 2016-07-26 2019-09-20 浙江大学 一种重组载体及无转基因基因编辑植株的筛选方法
EP3491133A4 (en) 2016-07-26 2020-05-06 The General Hospital Corporation VARIANTS OF CRISPR OF PREVOTELLA AND FRANCISELLA 1 (CPF1)
CN106191099A (zh) 2016-07-27 2016-12-07 苏州泓迅生物科技有限公司 一种基于CRISPR‑Cas9系统的酿酒酵母基因组并行多重编辑载体及其应用
CN106086061A (zh) 2016-07-27 2016-11-09 苏州泓迅生物科技有限公司 一种基于CRISPR‑Cas9系统的酿酒酵母基因组编辑载体及其应用
WO2018021878A1 (ko) 2016-07-28 2018-02-01 주식회사 비엠티 옥외 배관용 히팅재킷
CN106191124B (zh) 2016-07-29 2019-10-11 中国科学院重庆绿色智能技术研究院 一种利用鱼卵保存液提高CRISPR-Cas9基因编辑和传代效率的鱼类育种方法
CN106191113B (zh) 2016-07-29 2020-01-14 中国农业大学 一种mc3r基因敲除猪的制备方法
GB201613135D0 (en) 2016-07-29 2016-09-14 Medical Res Council Genome editing
CN106191114B (zh) 2016-07-29 2020-02-11 中国科学院重庆绿色智能技术研究院 利用CRISPR-Cas9系统敲除鱼类MC4R基因的育种方法
CN106434748A (zh) 2016-07-29 2017-02-22 中国科学院重庆绿色智能技术研究院 一种热激诱导型 Cas9 酶转基因斑马鱼的研制及应用
WO2018026723A1 (en) 2016-08-01 2018-02-08 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Human induced pluripotent stem cells for high efficiency genetic engineering
CN106434688A (zh) 2016-08-01 2017-02-22 云南纳博生物科技有限公司 一种水稻直立密穗dep1基因人工定点突变体及其应用
CN106011150A (zh) 2016-08-01 2016-10-12 云南纳博生物科技有限公司 一种水稻穗粒数Gn1a基因人工定点突变体及其应用
WO2018025206A1 (en) 2016-08-02 2018-02-08 Kyoto University Method for genome editing
AU2017305404B2 (en) 2016-08-02 2023-11-30 Editas Medicine, Inc. Compositions and methods for treating CEP290 associated disease
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
CN106282241A (zh) 2016-08-05 2017-01-04 无锡市第二人民医院 通过CRISPR/Cas9得到敲除bmp2a基因的斑马鱼的方法
CN109804066A (zh) 2016-08-09 2019-05-24 哈佛大学的校长及成员们 可编程cas9-重组酶融合蛋白及其用途
KR101710026B1 (ko) 2016-08-10 2017-02-27 주식회사 무진메디 Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물
CN106222203A (zh) 2016-08-10 2016-12-14 云南纳博生物科技有限公司 利用CRISPR/Cas技术获得家蚕丝素重链基因突变体及突变方法和应用
CN106172238B (zh) 2016-08-12 2019-01-22 中南大学 miR-124基因敲除小鼠动物模型的构建方法和应用
CN106222177B (zh) 2016-08-13 2018-06-26 江苏集萃药康生物科技有限公司 一种靶向人STAT6的CRISPR-Cas9系统及其用于治疗过敏性疾病的应用
WO2018035300A1 (en) 2016-08-17 2018-02-22 The Regents Of The University Of California Split trans-complementing gene-drive system for suppressing aedes aegypti mosquitos
WO2018035250A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
WO2018035503A1 (en) 2016-08-18 2018-02-22 The Regents Of The University Of California Crispr-cas genome engineering via a modular aav delivery system
CA3034101A1 (en) 2016-08-19 2018-02-22 Bluebird Bio, Inc. Genome editing enhancers
EP3500677A4 (en) 2016-08-20 2020-04-01 Avellino Lab USA, Inc. UNIQUE GUIDE RNA, CRISPR / CAS9 SYSTEMS AND METHODS OF USE
CN106191116B (zh) 2016-08-22 2019-10-08 西北农林科技大学 基于CRISPR/Cas9的外源基因敲入整合系统及其建立方法和应用
CN106191071B (zh) 2016-08-22 2018-09-04 广州资生生物科技有限公司 一种CRISPR-Cas9系统及其用于治疗乳腺癌疾病的应用
CN106086028B (zh) 2016-08-23 2019-04-23 中国农业科学院作物科学研究所 一种通过基因组编辑提高水稻抗性淀粉含量的方法及其专用sgRNA
CN106244555A (zh) 2016-08-23 2016-12-21 广州医科大学附属第三医院 一种提高基因打靶的效率的方法及β‑球蛋白基因位点的碱基原位修复方法
PL3504229T3 (pl) 2016-08-24 2022-04-19 Sangamo Therapeutics, Inc. Regulacja ekspresji genów przy użyciu nukleaz poddanych inżynierii
KR101856345B1 (ko) 2016-08-24 2018-06-20 경상대학교산학협력단 CRISPR/Cas9 시스템을 이용하여 APOBEC3H 및 APOBEC3CH 이중-넉아웃 고양이를 제조하는 방법
US10975393B2 (en) 2016-08-24 2021-04-13 Sangamo Therapeutics, Inc. Engineered target specific nucleases
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN106109417A (zh) 2016-08-24 2016-11-16 李因传 一种肝细胞膜仿生脂质体药物载体、制作方法及其应用
CN106244609A (zh) 2016-08-24 2016-12-21 浙江理工大学 一种调节pi3k‑akt信号通路的非编码基因的筛选系统及筛选方法
CN106544357B (zh) 2016-08-25 2018-08-21 湖南杂交水稻研究中心 一种培育镉低积累籼稻品种的方法
CN106350540A (zh) 2016-08-26 2017-01-25 苏州系统医学研究所 一种由慢病毒介导的高效可诱导型CRISPR/Cas9基因敲除载体及其应用
CN107784200B (zh) 2016-08-26 2020-11-06 深圳华大生命科学研究院 一种筛选新型CRISPR-Cas系统的方法和装置
CN106318973B (zh) 2016-08-26 2019-09-13 深圳市第二人民医院 一种基于CRISPR-Cas9的基因调控装置及基因调控方法
CN106244557B (zh) 2016-08-29 2019-10-25 中国农业科学院北京畜牧兽医研究所 定点突变ApoE基因与LDLR基因的方法
CN106399367A (zh) 2016-08-31 2017-02-15 深圳市卫光生物制品股份有限公司 提高crispr介导的同源重组效率的方法
CN106480097A (zh) 2016-10-13 2017-03-08 南京凯地生物科技有限公司 利用CRISPR/Cas9技术敲除人PD‑1基因构建可靶向MSLN新型CAR‑T细胞的方法及其应用
CN106399375A (zh) 2016-08-31 2017-02-15 南京凯地生物科技有限公司 利用CRISPR/Cas9敲除人PD‑1基因构建靶向CD19CAR‑T细胞的方法
CN107794272B (zh) 2016-09-06 2021-10-12 中国科学院上海营养与健康研究所 一种高特异性的crispr基因组编辑体系
WO2018049077A1 (en) 2016-09-07 2018-03-15 Flagship Pioneering, Inc. Methods and compositions for modulating gene expression
CN106399311A (zh) 2016-09-07 2017-02-15 同济大学 用于Chip‑seq全基因组结合谱的内源蛋白标记的方法
CN106399377A (zh) 2016-09-07 2017-02-15 同济大学 一种基于CRISPR/Cas9高通量技术筛选药物靶点基因的方法
WO2018048827A1 (en) 2016-09-07 2018-03-15 Massachusetts Institute Of Technology Rna-guided endonuclease-based dna assembly
CN106367435B (zh) 2016-09-07 2019-11-08 电子科技大学 一种水稻miRNA定向敲除的方法
CN107574179B (zh) 2016-09-09 2018-07-10 康码(上海)生物科技有限公司 一种为克鲁维酵母优化的CRISPR/Cas9高效基因编辑系统
EP3510151A4 (en) 2016-09-09 2020-04-15 The Board of Trustees of the Leland Stanford Junior University HIGH-THROUGHPUT PRECISION GENE EDITING
WO2018051347A1 (en) 2016-09-14 2018-03-22 Yeda Research And Development Co. Ltd. Crisp-seq, an integrated method for massively parallel single cell rna-seq and crispr pooled screens
CN106318934B (zh) 2016-09-21 2020-06-05 上海交通大学 胡萝卜β(1,2)木糖转移酶的基因全序列及用于转染双子叶植物的CRISPR/CAS9的质粒构建
WO2017216392A1 (en) 2016-09-23 2017-12-21 Dsm Ip Assets B.V. A guide-rna expression system for a host cell
EP3516058A1 (en) 2016-09-23 2019-07-31 Casebia Therapeutics Limited Liability Partnership Compositions and methods for gene editing
CN106957858A (zh) 2016-09-23 2017-07-18 西北农林科技大学 一种利用CRISPR/Cas9系统共同敲除绵羊MSTN、ASIP、BCO2基因的方法
US9580698B1 (en) 2016-09-23 2017-02-28 New England Biolabs, Inc. Mutant reverse transcriptase
US11319546B2 (en) 2016-09-28 2022-05-03 Cellivery Therapeutics, Inc. Cell-permeable (CP)-Cas9 recombinant protein and uses thereof
KR20190071725A (ko) 2016-09-30 2019-06-24 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
CN107881184B (zh) 2016-09-30 2021-08-27 中国科学院分子植物科学卓越创新中心 一种基于Cpf1的DNA体外拼接方法
CN107880132B (zh) 2016-09-30 2022-06-17 北京大学 一种融合蛋白及使用其进行同源重组的方法
BR112019006388A2 (pt) 2016-09-30 2019-06-25 Univ California enzimas modificadoras de ácido nucleico guiadas por rna e métodos de uso das mesmas
CN106480027A (zh) 2016-09-30 2017-03-08 重庆高圣生物医药有限责任公司 CRISPR/Cas9 靶向敲除人PD‑1基因及其特异性gRNA
WO2018064516A1 (en) 2016-09-30 2018-04-05 Monsanto Technology Llc Method for selecting target sites for site-specific genome modification in plants
US11730823B2 (en) 2016-10-03 2023-08-22 President And Fellows Of Harvard College Delivery of therapeutic RNAs via ARRDC1-mediated microvesicles
US20190241899A1 (en) 2016-10-05 2019-08-08 President And Fellows Of Harvard College Methods of Crispr Mediated Genome Modulation in V. Natriegens
US10669539B2 (en) 2016-10-06 2020-06-02 Pioneer Biolabs, Llc Methods and compositions for generating CRISPR guide RNA libraries
WO2018068053A2 (en) 2016-10-07 2018-04-12 Integrated Dna Technologies, Inc. S. pyogenes cas9 mutant genes and polypeptides encoded by same
CN106479985A (zh) 2016-10-09 2017-03-08 上海吉玛制药技术有限公司 病毒介导的Cpf1蛋白在CRISPR/Cpf1基因编辑系统中的应用
WO2018071623A2 (en) 2016-10-12 2018-04-19 Temple University - Of The Commonwealth System Of Higher Education Combination therapies for eradicating flavivirus infections in subjects
CN106434663A (zh) 2016-10-12 2017-02-22 遵义医学院 CRISPR/Cas9靶向敲除人ezrin基因增强子关键区的方法及其特异性gRNA
IT201600102542A1 (it) 2016-10-12 2018-04-12 Univ Degli Studi Di Trento Plasmide e sistema lentivirale contenente un circuito autolimitante della Cas9 che ne incrementa la sicurezza.
JP7399710B2 (ja) 2016-10-14 2023-12-18 ザ ジェネラル ホスピタル コーポレイション エピジェネティックに調節される部位特異的ヌクレアーゼ
CN106434782B (zh) 2016-10-14 2020-01-10 南京工业大学 一种产顺式-4-羟脯氨酸的方法
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
US20190330620A1 (en) 2016-10-14 2019-10-31 Emendobio Inc. Rna compositions for genome editing
US11840694B2 (en) 2016-10-17 2023-12-12 Nanyang Technological University Truncated CRISPR-Cas proteins for DNA targeting
US10640810B2 (en) 2016-10-19 2020-05-05 Drexel University Methods of specifically labeling nucleic acids using CRISPR/Cas
EP3532616A1 (en) 2016-10-28 2019-09-04 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating herpes simplex virus
WO2018081534A1 (en) 2016-10-28 2018-05-03 President And Fellows Of Harvard College Assay for exo-site binding molecules
US20180127759A1 (en) 2016-10-28 2018-05-10 Massachusetts Institute Of Technology Dynamic genome engineering
US20180119141A1 (en) 2016-10-28 2018-05-03 Massachusetts Institute Of Technology Crispr/cas global regulator screening platform
US11795453B2 (en) 2016-10-31 2023-10-24 Emendobio, Inc. Compositions for genome editing
RU2711516C1 (ru) 2016-10-31 2020-01-17 Егути Хай Фриквенси Ко., Лтд. Дроссель
WO2018085288A1 (en) 2016-11-01 2018-05-11 President And Fellows Of Harvard College Inhibitors of rna guided nucleases and uses thereof
EP3535396A1 (en) 2016-11-01 2019-09-11 Novartis AG Methods and compositions for enhancing gene editing
US11732258B2 (en) 2016-11-02 2023-08-22 President And Fellows Of Harvard College Engineered guide RNA sequences for in situ detection and sequencing
GB201618507D0 (en) 2016-11-02 2016-12-14 Stichting Voor De Technische Wetenschappen And Wageningen Univ Microbial genome editing
CN106544353A (zh) 2016-11-08 2017-03-29 宁夏医科大学总医院 一种利用CRISPR‑Cas9清除鲍曼不动杆菌耐药性基因的方法
CN106755088A (zh) 2016-11-11 2017-05-31 广东万海细胞生物科技有限公司 一种自体car‑t细胞制备方法及应用
US11180778B2 (en) 2016-11-11 2021-11-23 The Regents Of The University Of California Variant RNA-guided polypeptides and methods of use
BR112019002455A2 (pt) 2016-11-14 2019-06-25 Inst Genetics & Developmental Biology Cas método para edição de base em plantas
CN106566838B (zh) 2016-11-14 2019-11-01 上海伯豪生物技术有限公司 一种基于CRISPR-Cas9技术的miR-126全长基因敲除试剂盒及其应用
CN106554969A (zh) 2016-11-15 2017-04-05 陕西理工学院 基于抑菌杀菌的多靶点CRISPR/Cas9表达载体
CN106754912B (zh) 2016-11-16 2019-11-08 上海交通大学 一类定向清除肝细胞中HBVcccDNA的质粒及制剂
KR20190077568A (ko) 2016-11-16 2019-07-03 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 CRISPR-Cas9의 억제제
US20180282722A1 (en) 2016-11-21 2018-10-04 Massachusetts Institute Of Technology Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing
CN106480067A (zh) 2016-11-21 2017-03-08 中国农业科学院烟草研究所 烟草NtNAC096基因控制烟草衰老的应用
KR20190082318A (ko) 2016-11-22 2019-07-09 인티그레이티드 디엔에이 테크놀로지스 아이엔씨. Crispr/cpf1 시스템 및 방법
CN106755091A (zh) 2016-11-28 2017-05-31 中国人民解放军第三军医大学第附属医院 基因敲除载体,mh7a细胞nlrp1基因敲除方法
EP3545090A1 (en) 2016-11-28 2019-10-02 The Board of Regents of The University of Texas System Prevention of muscular dystrophy by crispr/cpf1-mediated gene editing
CN106480036B (zh) 2016-11-30 2019-04-09 华南理工大学 一种具有启动子功能的dna片段及其应用
CN107043779B (zh) 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CN106834323A (zh) 2016-12-01 2017-06-13 安徽大学 一种基于维吉尼亚链霉菌IBL14基因cas7‑5‑3的基因编辑方法
US20200056206A1 (en) 2016-12-01 2020-02-20 UNIVERSITé LAVAL Crispr-based treatment of friedreich ataxia
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
CN108165573B (zh) 2016-12-07 2022-01-14 中国科学院分子植物科学卓越创新中心 叶绿体基因组编辑方法
CN106701830B (zh) 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
EP3551757A1 (en) 2016-12-08 2019-10-16 Intellia Therapeutics, Inc. Modified guide rnas
CN106544351B (zh) 2016-12-08 2019-09-10 江苏省农业科学院 CRISPR-Cas9体外敲除耐药基因mcr-1的方法及其专用细胞穿透肽
US11192929B2 (en) 2016-12-08 2021-12-07 Regents Of The University Of Minnesota Site-specific DNA base editing using modified APOBEC enzymes
ES2927463T3 (es) 2016-12-09 2022-11-07 Broad Inst Inc Diagnósticos basados en el sistema efector CRISPR
WO2018107103A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr-systems for modifying a trait of interest in a plant
US20190032131A1 (en) 2016-12-12 2019-01-31 Integrated Dna Technologies, Inc. Genome editing detection
US11293022B2 (en) 2016-12-12 2022-04-05 Integrated Dna Technologies, Inc. Genome editing enhancement
CN107893074A (zh) 2016-12-13 2018-04-10 广东赤萌医疗科技有限公司 一种用于敲除CXCR4基因的gRNA、表达载体、敲除系统、试剂盒
WO2018109101A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
CA3046824A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
WO2018112336A1 (en) 2016-12-16 2018-06-21 Ohio State Innovation Foundation Systems and methods for dna-guided rna cleavage
KR101748575B1 (ko) 2016-12-16 2017-06-20 주식회사 엠젠플러스 Ins 유전자 녹아웃 당뇨병 또는 당뇨병 합병증 동물모델 및 이의 제조방법
CN106755026A (zh) 2016-12-18 2017-05-31 吉林大学 sgRNA表达载体的构建及牙釉质钙化不全模型的建立
US20190338363A1 (en) 2016-12-18 2019-11-07 Selonterra, Inc. Use of apoe4 motif-mediated genes for diagnosis and treatment of alzheimer's disease
JP7456605B2 (ja) 2016-12-23 2024-03-27 プレジデント アンド フェローズ オブ ハーバード カレッジ Pcsk9の遺伝子編集
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
CN107354173A (zh) 2016-12-26 2017-11-17 浙江省医学科学院 基于crispr技术和水动力尾静脉注射建立肝脏特异性敲除小鼠模型的方法
CN106755424B (zh) 2016-12-26 2020-11-06 郑州大学 一种基于crispr的大肠杆菌st131系菌株检测引物、试剂盒及检测方法
CN106755097A (zh) 2016-12-27 2017-05-31 安徽省农业科学院畜牧兽医研究所 一种山羊tlr4基因敲除载体及其构建方法
CN106834347A (zh) 2016-12-27 2017-06-13 安徽省农业科学院畜牧兽医研究所 一种山羊cdk2基因敲除载体及其构建方法
CN106597260B (zh) 2016-12-29 2020-04-03 合肥工业大学 基于连续小波分析和elm网络的模拟电路故障诊断方法
CN106834341B (zh) 2016-12-30 2020-06-16 中国农业大学 一种基因定点突变载体及其构建方法和应用
CN106755077A (zh) 2016-12-30 2017-05-31 华智水稻生物技术有限公司 利用crispr‑cas9技术对水稻cenh3基因定点突变的方法
CN106868008A (zh) 2016-12-30 2017-06-20 重庆高圣生物医药有限责任公司 CRISPR/Cas9靶向敲除人Lin28A基因及其特异性gRNA
CN106701763B (zh) 2016-12-30 2019-07-19 重庆高圣生物医药有限责任公司 CRISPR/Cas9靶向敲除人乙肝病毒P基因及其特异性gRNA
CN106701818B (zh) 2017-01-09 2020-04-24 湖南杂交水稻研究中心 一种培育水稻普通核不育系的方法
US20190352634A1 (en) 2017-01-11 2019-11-21 Oxford University Innovation Limited Crispr rna
CN107012164B (zh) 2017-01-11 2023-03-03 电子科技大学 CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用
KR102084186B1 (ko) 2017-01-17 2020-03-03 기초과학연구원 Dna 단일가닥 절단에 의한 염기 교정 비표적 위치 확인 방법
US20180201921A1 (en) 2017-01-18 2018-07-19 Excision Biotherapeutics, Inc. CRISPRs
CN106701823A (zh) 2017-01-18 2017-05-24 上海交通大学 生产无岩藻糖单克隆抗体的cho细胞系建立及其应用
CN107058372A (zh) 2017-01-18 2017-08-18 四川农业大学 一种应用于植物上的CRISPR/Cas9载体的构建方法
CN106801056A (zh) 2017-01-24 2017-06-06 中国科学院广州生物医药与健康研究院 一种sgRNA及其构建的慢病毒载体和应用
KR20190112771A (ko) 2017-01-30 2019-10-07 케이더블유에스 에스에이에이티 에스이 운트 코. 카게아아 게놈 조작을 위한 엔도뉴클레아제에 대한 복구 주형 연결
TWI608100B (zh) 2017-02-03 2017-12-11 國立清華大學 Cas9表達質體、大腸桿菌基因剪輯系統及其方法
TW201839136A (zh) * 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
US10465187B2 (en) 2017-02-06 2019-11-05 Trustees Of Boston University Integrated system for programmable DNA methylation
WO2018148256A1 (en) 2017-02-07 2018-08-16 The Regents Of The University Of California Gene therapy for haploinsufficiency
WO2018148246A1 (en) 2017-02-07 2018-08-16 Massachusetts Institute Of Technology Methods and compositions for rna-guided genetic circuits
WO2018148647A2 (en) 2017-02-10 2018-08-16 Lajoie Marc Joseph Genome editing reagents and their use
IT201700016321A1 (it) 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.
US20200063127A1 (en) 2017-02-15 2020-02-27 Massachusetts Institute Of Technology Dna writers, molecular recorders and uses thereof
WO2018149915A1 (en) 2017-02-15 2018-08-23 Keygene N.V. Methods of targeted genetic alteration in plant cells
CN106957855B (zh) 2017-02-16 2020-04-17 上海市农业科学院 使用CRISPR/Cas9技术靶向敲除水稻矮杆基因SD1的方法
WO2018152418A1 (en) 2017-02-17 2018-08-23 Temple University - Of The Commonwealth System Of Higher Education Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5
WO2018149418A1 (en) 2017-02-20 2018-08-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Genome editing system and method
WO2018154380A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders
WO2018154412A1 (en) 2017-02-22 2018-08-30 Crispr Therapeutics Ag Materials and methods for treatment of merosin-deficient cogenital muscular dystrophy (mdcmd) and other laminin, alpha 2 (lama2) gene related conditions or disorders
EP3585898A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of spinocerebellar ataxia type 1 (sca1) and other spinocerebellar ataxia type 1 protein (atxn1) gene related conditions or disorders
EP3585897A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of dystrophic epidermolysis bullosa (deb) and other collagen type vii alpha 1 chain (col7a1) gene related conditions or disorders
WO2018156372A1 (en) 2017-02-22 2018-08-30 The Regents Of The University Of California Genetically modified non-human animals and products thereof
EP3585900B1 (en) 2017-02-22 2022-12-21 CRISPR Therapeutics AG Materials and methods for treatment of spinocerebellar ataxia type 2 (sca2) and other spinocerebellar ataxia type 2 protein (atxn2) gene related conditions or disorders
EP3585807A1 (en) 2017-02-22 2020-01-01 CRISPR Therapeutics AG Materials and methods for treatment of early onset parkinson's disease (park1) and other synuclein, alpha (snca) gene related conditions or disorders
US11920148B2 (en) 2017-02-22 2024-03-05 Crispr Therapeutics Ag Compositions and methods for gene editing
US11407997B2 (en) 2017-02-22 2022-08-09 Crispr Therapeutics Ag Materials and methods for treatment of primary hyperoxaluria type 1 (PH1) and other alanine-glyoxylate aminotransferase (AGXT) gene related conditions or disorders
WO2018156824A1 (en) 2017-02-23 2018-08-30 President And Fellows Of Harvard College Methods of genetic modification of a cell
CN106868031A (zh) 2017-02-24 2017-06-20 北京大学 一种基于分级组装的多个sgRNA串联并行表达的克隆方法及应用
US20200010903A1 (en) 2017-03-03 2020-01-09 Yale University AAV-Mediated Direct In vivo CRISPR Screen in Glioblastoma
US11111492B2 (en) 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
EP3592381A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Cancer vaccine
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11332727B2 (en) 2017-03-14 2022-05-17 The Regents Of The University Of California Method for reducing an immune response by administering an immune evading adeno-associated AAV8 or AAVDJ viral vector
AU2018234832A1 (en) 2017-03-15 2019-10-10 Massachusetts Institute Of Technology CRISPR effector system based diagnostics for virus detection
CN106978428A (zh) 2017-03-15 2017-07-25 上海吐露港生物科技有限公司 一种Cas蛋白特异结合靶标DNA、调控靶标基因转录的方法及试剂盒
CN106906242A (zh) 2017-03-16 2017-06-30 重庆高圣生物医药有限责任公司 一种提高CRIPSR/Cas9靶向敲除基因产生非同源性末端接合效率的方法
WO2018175502A2 (en) 2017-03-21 2018-09-27 Shuber Anthony P Treating cancer with cas endonuclease complexes
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
CN107012213A (zh) 2017-03-24 2017-08-04 南开大学 结直肠癌的生物标记物
CN106947780A (zh) 2017-03-28 2017-07-14 扬州大学 一种兔mstn基因的编辑方法
PT3526324T (pt) 2017-03-28 2021-10-20 Locanabio Inc Proteína associada a crispr (cas)
CN106906240A (zh) 2017-03-29 2017-06-30 浙江大学 运用CRISPR‑Cas9系统敲除大麦VE合成通路中的关键基因HPT的方法
WO2018179578A1 (ja) 2017-03-30 2018-10-04 国立大学法人京都大学 ゲノム編集によるエクソンスキッピング誘導方法
CN108660161B (zh) 2017-03-31 2023-05-09 中国科学院脑科学与智能技术卓越创新中心 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法
CN107058358B (zh) 2017-04-01 2020-06-09 中国科学院微生物研究所 一种双spacer序列识别切割CRISPR-Cas9载体构建及其在疣孢菌中的应用
CN106967726B (zh) 2017-04-05 2020-12-29 华南农业大学 一种创建亚洲栽培稻与非洲栽培稻种间杂种亲和系的方法和应用
US9938288B1 (en) 2017-04-05 2018-04-10 President And Fellows Of Harvard College Macrocyclic compound and uses thereof
CN107142282A (zh) 2017-04-06 2017-09-08 中山大学 一种利用CRISPR/Cas9在哺乳动物细胞中实现大片段DNA定点整合的方法
CN107034229A (zh) 2017-04-07 2017-08-11 江苏贝瑞利生物科技有限公司 一种植物中高效筛选CRISPR/CAS9基因编辑系统候选sgRNA系统及应用
JP6928668B2 (ja) 2017-04-11 2021-09-01 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 増大した熱安定性を有する変異型逆転写酵素、ならびにそれに関する生成物、方法および使用
CN107058320B (zh) 2017-04-12 2019-08-02 南开大学 Il7r基因缺失斑马鱼突变体的制备及其应用
EP3610009A1 (en) 2017-04-12 2020-02-19 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
CN106916852B (zh) 2017-04-13 2020-12-04 上海科技大学 一种碱基编辑系统及其构建和应用方法
CN108728476A (zh) 2017-04-14 2018-11-02 复旦大学 一种利用crispr系统产生多样性抗体文库的方法
CN107298701B (zh) 2017-04-18 2020-10-30 上海大学 玉米转录因子ZmbZIP22及其应用
JP2020517301A (ja) 2017-04-20 2020-06-18 イージェネシス,インコーポレイテッド 遺伝子改変動物の作成方法
CN106957844A (zh) 2017-04-20 2017-07-18 华侨大学 一种能有效敲除HTLV‑1病毒基因组的CRISPR/Cas9的gRNA序列
US11591589B2 (en) 2017-04-21 2023-02-28 The General Hospital Corporation Variants of Cpf1 (Cas12a) with altered PAM specificity
US11773409B2 (en) 2017-04-21 2023-10-03 The Board Of Trustees Of The Leland Stanford Junior University CRISPR/Cas 9-mediated integration of polynucleotides by sequential homologous recombination of AAV donor vectors
CN107043775B (zh) 2017-04-24 2020-06-16 中国农业科学院生物技术研究所 一种能促进棉花侧根发育的sgRNA及其应用
WO2018197495A1 (en) 2017-04-24 2018-11-01 Dupont Nutrition Biosciences Aps Novel anti-crispr genes and proteins and methods of use
CN206970581U (zh) 2017-04-26 2018-02-06 重庆威斯腾生物医药科技有限责任公司 一种用于辅助CRISPR/cas9基因敲除的试剂盒
US20180312822A1 (en) 2017-04-26 2018-11-01 10X Genomics, Inc. Mmlv reverse transcriptase variants
WO2018197020A1 (en) 2017-04-27 2018-11-01 Novozymes A/S Genome editing by crispr-cas9 using short donor oligonucleotides
US20200407737A1 (en) 2017-05-03 2020-12-31 KWS SAAT SE & Co. KGaA Use of crispr-cas endonucleases for plant genome engineering
EP3619302A4 (en) 2017-05-04 2021-01-20 The Trustees of The University of Pennsylvania COMPOSITIONS AND METHODS OF GENEDITATION IN T CELLS USING CRISPR / CPF1
CN107012174A (zh) 2017-05-04 2017-08-04 昆明理工大学 CRISPR/Cas9技术在获得家蚕锌指蛋白基因突变体中的应用
CN107254485A (zh) 2017-05-08 2017-10-17 南京农业大学 一种能够快速构建植物基因定点敲除载体的新反应体系
WO2018208755A1 (en) 2017-05-09 2018-11-15 The Regents Of The University Of California Compositions and methods for tagging target proteins in proximity to a nucleotide sequence of interest
CN107129999A (zh) 2017-05-09 2017-09-05 福建省农业科学院畜牧兽医研究所 利用稳转CRISPR/Cas9系统对病毒基因组进行靶向编辑的方法
EP3622070A2 (en) 2017-05-10 2020-03-18 Editas Medicine, Inc. Crispr/rna-guided nuclease systems and methods
AU2018265022A1 (en) 2017-05-10 2019-11-21 The Regents Of The University Of California Directed editing of cellular RNA via nuclear delivery of CRISPR/Cas9
CN107130000B (zh) 2017-05-12 2019-12-17 浙江卫未生物医药科技有限公司 一种同时敲除KRAS基因和EGFR基因的CRISPR-Cas9系统及其应用
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN106947750B (zh) 2017-05-16 2020-12-08 上海交通大学 一种Cas9核酸酶Q920P及其用途
CN106939303B (zh) 2017-05-16 2021-02-23 上海交通大学 一种Cas9核酸酶R919P及其用途
CN106957831B (zh) 2017-05-16 2021-03-12 上海交通大学 一种Cas9核酸酶K918A及其用途
CN106957830B (zh) 2017-05-16 2020-12-25 上海交通大学 一种Cas9核酸酶ΔF916及其用途
CN107012250B (zh) 2017-05-16 2021-01-29 上海交通大学 一种适用于CRISPR/Cas9系统的基因组DNA片段编辑精准度的分析方法及应用
US11692184B2 (en) 2017-05-16 2023-07-04 The Regents Of The University Of California Thermostable RNA-guided endonucleases and methods of use thereof
CN106987570A (zh) 2017-05-16 2017-07-28 上海交通大学 一种Cas9核酸酶R780A及其用途
CN106967697B (zh) 2017-05-16 2021-03-26 上海交通大学 一种Cas9核酸酶G915F及其用途
CN106916820B (zh) 2017-05-16 2019-09-27 吉林大学 能有效编辑猪ROSA26基因的sgRNA及其应用
CN107326042A (zh) 2017-05-16 2017-11-07 上海交通大学 水稻tms10基因的定点敲除系统及其应用
WO2018213726A1 (en) 2017-05-18 2018-11-22 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
EP3625343A1 (en) 2017-05-18 2020-03-25 The Broad Institute, Inc. Systems, methods, and compositions for targeted nucleic acid editing
WO2018213771A1 (en) 2017-05-18 2018-11-22 Cargill, Incorporated Genome editing system
EP3625359A4 (en) 2017-05-18 2021-03-03 Children's National Medical Center APTAMERIC AND NUCLEIC ACID PAYLOAD COMPOSITIONS AND METHODS OF USE
CN107236737A (zh) 2017-05-19 2017-10-10 上海交通大学 特异靶向拟南芥ILK2基因的sgRNA序列及其应用
CN107043787B (zh) 2017-05-19 2017-12-26 南京医科大学 一种基于CRISPR/Cas9获得MARF1定点突变小鼠模型的构建方法和应用
WO2018217852A1 (en) 2017-05-23 2018-11-29 Gettysburg College Crispr based tool for characterizing bacterial serovar diversity
CN107034188B (zh) 2017-05-24 2018-07-24 中山大学附属口腔医院 一种靶向骨的外泌体载体、CRISPR/Cas9基因编辑系统及应用
WO2018218166A1 (en) 2017-05-25 2018-11-29 The General Hospital Corporation Using split deaminases to limit unwanted off-target base editor deamination
CN107177625B (zh) 2017-05-26 2021-05-25 中国农业科学院植物保护研究所 一种定点突变的人工载体系统及定点突变方法
US20200263186A1 (en) 2017-05-26 2020-08-20 North Carolina State University Altered guide rnas for modulating cas9 activity and methods of use
CN107287245B (zh) 2017-05-27 2020-03-17 南京农业大学 一种基于CRISPR/Cas9技术的Glrx1基因敲除动物模型的构建方法
CN107142272A (zh) 2017-06-05 2017-09-08 南京金斯瑞生物科技有限公司 一种控制大肠杆菌中质粒复制的方法
CN107034218A (zh) 2017-06-07 2017-08-11 浙江大学 用于猪APN基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
CN107177595A (zh) 2017-06-07 2017-09-19 浙江大学 用于猪CD163基因编辑的靶向sgRNA、修饰载体及其制备方法和应用
CN107119071A (zh) 2017-06-07 2017-09-01 江苏三黍生物科技有限公司 一种降低植物直链淀粉含量的方法及应用
CN106987757A (zh) 2017-06-12 2017-07-28 苏州双金实业有限公司 一种耐腐蚀型奥氏体镍基合金
CN107236739A (zh) 2017-06-12 2017-10-10 上海捷易生物科技有限公司 CRISPR/SaCas9特异性敲除人CXCR4基因的方法
CN107083392B (zh) 2017-06-13 2020-09-08 中国医学科学院病原生物学研究所 一种CRISPR/Cpf1基因编辑系统及其在分枝杆菌中的应用
CN107227352A (zh) 2017-06-13 2017-10-03 西安医学院 基于eGFP的GPR120基因表达的检测方法及应用
CN107245502B (zh) 2017-06-14 2020-11-03 中国科学院武汉病毒研究所 Cd2结合蛋白(cd2ap)和其相互作用蛋白
CN107312798B (zh) 2017-06-16 2020-06-23 武汉大学 含特异靶向CCR5基因的gRNA序列的CRISPR/Cas9重组慢病毒载体及应用
CN107099850B (zh) 2017-06-19 2018-05-04 东北农业大学 一种通过酶切基因组构建CRISPR/Cas9基因组敲除文库的方法
CN107266541B (zh) 2017-06-20 2021-06-04 上海大学 玉米转录因子ZmbHLH167及其应用
CN107446951B (zh) 2017-06-20 2021-01-08 温氏食品集团股份有限公司 一种通过CRISPR/Cas9系统快速筛选重组鸡痘病毒的方法及其应用
CN107058328A (zh) 2017-06-22 2017-08-18 江苏三黍生物科技有限公司 一种提高植物直链淀粉含量的方法及应用
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
CN107099533A (zh) 2017-06-23 2017-08-29 东北农业大学 一种特异靶向猪IGFBP3基因的sgRNA导向序列及应用
CN107119053A (zh) 2017-06-23 2017-09-01 东北农业大学 一种特异靶向猪MC4R基因的sgRNA导向序列及其应用
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
CN107227307A (zh) 2017-06-23 2017-10-03 东北农业大学 一种特异靶向猪IRS1基因的sgRNA导向序列及其应用
EP3645054A4 (en) 2017-06-26 2021-03-31 The Broad Institute, Inc. COMPOSITIONS BASED ON CRISPR / CAS-ADENIN-DEAMINASE, SYSTEMS AND METHODS FOR TARGETED NUCLEIC ACID EDITING
CN107177631B (zh) 2017-06-26 2020-11-24 中国农业大学 利用CRISPR-CAS9技术敲除NRK细胞Slc22a2基因的方法
WO2019005886A1 (en) 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
CN107217075B (zh) 2017-06-28 2021-07-02 西安交通大学医学院第一附属医院 一种构建epo基因敲除斑马鱼动物模型的方法及引物、质粒与制备方法
CN107356793A (zh) 2017-07-01 2017-11-17 合肥东玖电气有限公司 一种防火电表箱
CN107312793A (zh) 2017-07-05 2017-11-03 新疆农业科学院园艺作物研究所 Cas9介导的番茄基因编辑载体及其应用
CN107190006A (zh) 2017-07-07 2017-09-22 南通大学附属医院 一种靶向IGF‑IR基因的sgRNA及其应用
WO2019010384A1 (en) 2017-07-07 2019-01-10 The Broad Institute, Inc. METHODS FOR DESIGNING GUIDE SEQUENCES FOR GUIDED NUCLEASES
CN107400677B (zh) 2017-07-19 2020-05-22 江南大学 一种基于CRISPR-Cas9系统的地衣芽孢杆菌基因组编辑载体及其制备方法
CN107190008A (zh) 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 一种基于Crispr/cas9的捕获基因组目标序列的方法及其在高通量测序中的应用
CN107354156B (zh) 2017-07-19 2021-02-09 广州医科大学附属第五医院 一种敲除野生型T细胞TCR beta链的gRNA及方法
CN107236741A (zh) 2017-07-19 2017-10-10 广州医科大学附属第五医院 一种敲除野生型T细胞TCR alpha链的gRNA及方法
CN107435069A (zh) 2017-07-28 2017-12-05 新乡医学院 一种细胞系CRISPR/Cas9基因敲除的快速检测方法
CN107418974A (zh) 2017-07-28 2017-12-01 新乡医学院 一种利用单克隆细胞分选快速获得CRISPR/Cas9基因敲除稳定细胞株的方法
CN107435051B (zh) 2017-07-28 2020-06-02 新乡医学院 一种通过CRISPR/Cas9系统快速获得大片段缺失的细胞系基因敲除方法
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
CN107446954A (zh) 2017-07-28 2017-12-08 新乡医学院 一种sd大鼠t细胞缺失遗传模型的制备方法
CN107267515B (zh) 2017-07-28 2020-08-25 重庆医科大学附属儿童医院 CRISPR/Cas9靶向敲除人CNE10基因及其特异性gRNA
CN107384922A (zh) 2017-07-28 2017-11-24 重庆医科大学附属儿童医院 CRISPR/Cas9靶向敲除人CNE9基因及其特异性gRNA
CN107217042B (zh) 2017-07-31 2020-03-06 江苏东抗生物医药科技有限公司 一种生产无岩藻糖基化蛋白的基因工程细胞系及其建立方法
CN107446922A (zh) 2017-08-03 2017-12-08 无锡市第二人民医院 一种敲除人成骨细胞株中hepcidin基因的gRNA序列及其使用方法
CN107502618B (zh) 2017-08-08 2021-03-12 中国科学院微生物研究所 可控载体消除方法及易用型CRISPR-Cas9工具
CN107312785B (zh) 2017-08-09 2019-12-06 四川农业大学 OsKTN80b基因在降低水稻株高方面的应用
CN107384926B (zh) 2017-08-13 2020-06-26 中国人民解放军疾病预防控制所 一种靶向清除细菌耐药性质粒的CRISPR-Cas9系统及应用
CN107446923B (zh) 2017-08-13 2019-12-31 中国人民解放军疾病预防控制所 rAAV8-CRISPR-SaCas9系统及在制备乙肝治疗药物中的应用
CN107365804B (zh) 2017-08-13 2019-12-20 中国人民解放军疾病预防控制所 一种使用温和噬菌体载体包装CRISPR-Cas9系统的方法
CN107815463A (zh) 2017-08-15 2018-03-20 西南大学 CRISPR/Cas9技术介导miR167前体序列编辑体系的建立方法
CN107446924B (zh) 2017-08-16 2020-01-14 中国科学院华南植物园 一种基于CRISPR-Cas9的猕猴桃基因AcPDS编辑载体及其构建方法和应用
CN108034656A (zh) 2017-08-16 2018-05-15 四川省农业科学院生物技术核技术研究所 与水稻红褐色颖壳性状有关的sgRNA、CRISPR/Cas9载体、载体构建、应用
CN107384894B (zh) 2017-08-21 2019-10-22 华南师范大学 功能化氧化石墨烯高效运载CRISPR/Cas9用于基因编辑的方法
CN107299114B (zh) 2017-08-23 2021-08-27 中国科学院分子植物科学卓越创新中心 一种高效的酵母菌染色体融合方法
CN107557393B (zh) 2017-08-23 2020-05-08 中国科学院上海应用物理研究所 一种磁性纳米材料介导的CRISPR/Cas9 T细胞内递送系统及其制备方法和应用
CN107312795A (zh) 2017-08-24 2017-11-03 浙江省农业科学院 运用CRISPR/Cas9系统创制粉色果实番茄的基因编辑方法
CN107460196A (zh) 2017-08-25 2017-12-12 同济大学 一种免疫缺陷小鼠动物模型的构建方法及应用
CN107488649A (zh) 2017-08-25 2017-12-19 南方医科大学 一种Cpf1和p300核心结构域的融合蛋白、相应的DNA靶向激活系统和应用
CN107541525B (zh) 2017-08-26 2021-12-10 内蒙古大学 一种基于CRISPR/Cas9技术介导山羊Tβ4基因定点敲入的方法
CN107446932B (zh) 2017-08-29 2020-02-21 江西省农业科学院 一个控制水稻雄性生殖发育基因及其应用
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
CN107519492B (zh) 2017-09-06 2019-01-25 武汉迈特维尔生物科技有限公司 使用CRISPR技术敲除miR-3187-3p在冠状动脉粥样硬化性心脏病中的应用
CN107641631A (zh) 2017-09-07 2018-01-30 浙江工业大学 一种由化学转化介导的基于CRISPR/Cas9系统敲除大肠杆菌基因的方法
CN107362372B (zh) 2017-09-07 2019-01-11 佛山波若恩生物科技有限公司 使用crispr技术在冠状动脉粥样硬化性心脏病中的应用
CN107502608B (zh) 2017-09-08 2020-10-16 中山大学 用于敲除人ALDH2基因的sgRNA、ALDH2基因缺失细胞株的构建方法及应用
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
CN107557455A (zh) 2017-09-15 2018-01-09 国家纳米科学中心 一种基于CRISPR‑Cas13a的特异性核酸片段的检测方法
CN107475300B (zh) 2017-09-18 2020-04-21 上海市同济医院 Ifit3-eKO1基因敲除小鼠动物模型的构建方法和应用
WO2019056002A1 (en) 2017-09-18 2019-03-21 President And Fellows Of Harvard College CONTINUOUS EVOLUTION FOR STABILIZED PROTEINS
CN107557390A (zh) 2017-09-18 2018-01-09 江南大学 一种筛选cho细胞系高表达位点的方法
CN107557378A (zh) 2017-09-19 2018-01-09 安徽大学 一种基于I型CRISPR‑Cas系统中基因cas7‑3的真核基因编辑方法
CN107630042A (zh) 2017-09-19 2018-01-26 安徽大学 一种源于I型Cas系统4个cas基因的原核生物基因编辑方法
CN107523583A (zh) 2017-09-19 2017-12-29 安徽大学 一种源于I型CRISPR‑Cas系统中基因cas5‑3的原核基因编辑方法
CN107630041A (zh) 2017-09-19 2018-01-26 安徽大学 一种基于维吉尼亚链霉菌IBL14 I‑B型Cas系统的真核基因编辑方法
CN107557373A (zh) 2017-09-19 2018-01-09 安徽大学 一种基于I‑B型CRISPR‑Cas系统基因cas3的基因编辑方法
CN107619837A (zh) 2017-09-20 2018-01-23 西北农林科技大学 利用Cas9切割核酸酶介导Ipr1定点插入获取转基因牛胎儿成纤维细胞的方法
CN107513531B (zh) 2017-09-21 2020-02-21 无锡市妇幼保健院 用于内源性过表达lncRNA-XIST的gRNA靶点序列及其应用
CN107686848A (zh) 2017-09-26 2018-02-13 中山大学孙逸仙纪念医院 转座子协同CRISPR/Cas9系统的稳定敲除单质粒载体及其应用
CN107760652A (zh) 2017-09-29 2018-03-06 华南理工大学 CRISPR/CAS9介导药物转运体靶向性敲除的caco‑2细胞模型及其方法
CN107557394A (zh) 2017-09-29 2018-01-09 南京鼓楼医院 降低CRISPR/Cas9介导的胚胎基因编辑脱靶率的方法
CN107630006B (zh) 2017-09-30 2020-09-11 山东兴瑞生物科技有限公司 一种制备tcr与hla双基因敲除的t细胞的方法
CN107760663A (zh) 2017-09-30 2018-03-06 新疆大学 油莎草pepc基因的克隆及表达载体的构建和应用
CN107828794A (zh) 2017-09-30 2018-03-23 上海市农业生物基因中心 一种水稻耐盐基因OsRR22突变体、其编码的氨基酸序列、植株及该突变体的创制方法
CN107604003A (zh) 2017-10-10 2018-01-19 南方医科大学 一种基于线性化crispr‑cas9慢病毒载体基因敲除试剂盒及其应用
CN107557381A (zh) 2017-10-12 2018-01-09 南京农业大学 一种白菜CRISPR‑Cas9基因编辑体系的建立及其应用
CN108102940B (zh) 2017-10-12 2021-07-13 中石化上海工程有限公司 一株利用CRISPR/Cas9系统敲除XKS1基因的工业酿酒酵母菌株及构建方法
CN107474129B (zh) 2017-10-12 2018-10-19 江西汉氏联合干细胞科技有限公司 特异性增强crispr-cas系统基因编辑效率的方法
CN108103586A (zh) 2017-10-13 2018-06-01 上海科技大学 一种CRISPR/Cas9随机文库及其构建和应用
CN107619829B (zh) 2017-10-14 2018-08-24 南京平港生物技术有限公司 使用crispr-cas系统对间充质干细胞进行gins2基因敲除的方法
CN107586779B (zh) 2017-10-14 2018-08-28 天津金匙生物科技有限公司 使用crispr-cas系统对间充质干细胞进行casp3基因敲除的方法
CN107523567A (zh) 2017-10-16 2017-12-29 遵义医学院 一种敲除人ezrin基因增强子的食管癌细胞株的构建方法
KR20200121782A (ko) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
CN107760715B (zh) 2017-10-17 2021-12-10 张业胜 一种转基因载体及其构建方法和应用
CN107937427A (zh) 2017-10-20 2018-04-20 广东石油化工学院 一种基于CRISPR/Cas9体系的同源修复载体构建方法
WO2019084062A1 (en) 2017-10-23 2019-05-02 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
CN107893086B (zh) 2017-10-24 2021-09-03 中国科学院武汉植物园 快速构建配对sgRNA的Cas9双元表达载体文库的方法
CN107760684B (zh) 2017-11-03 2018-09-25 上海拉德钫斯生物科技有限公司 使用crispr-cas系统对间充质干细胞进行rbm17基因敲除的方法
WO2019090367A1 (en) 2017-11-05 2019-05-09 Aveterra Corp Method and apparatus for automated composting of organic wastes
CN107858346B (zh) 2017-11-06 2020-06-16 天津大学 一种敲除酿酒酵母染色体的方法
CN107794276A (zh) 2017-11-08 2018-03-13 中国农业科学院作物科学研究所 一种crispr介导快速有效的农作物定点基因片段或等位基因替换方法和体系
CN107630043A (zh) 2017-11-14 2018-01-26 吉林大学 采用敲除技术建立Gadd45a敲除兔模型的方法
CN108441519A (zh) 2017-11-15 2018-08-24 中国农业大学 在crispr/cas9基因编辑中提高同源修复效率的方法
CN107858373B (zh) 2017-11-16 2020-03-17 山东省千佛山医院 内皮细胞条件性敲除ccr5基因小鼠模型的构建方法
CN108192956B (zh) 2017-11-17 2021-06-01 东南大学 一种基于Cas9核酸酶的DNA检测分析方法及其应用
CN107893075A (zh) 2017-11-17 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR‑Cas9靶向敲除人肠癌细胞RITA基因及其特异性的sgRNA
CN107828874B (zh) 2017-11-20 2020-10-16 东南大学 一种基于crispr的dna检测和分型方法及其应用
CN107904261A (zh) 2017-11-21 2018-04-13 福州大学 CRISPR/Cas9纳米基因系统的制备及其在转染方面的应用
CN107653256A (zh) 2017-11-21 2018-02-02 云南省烟草农业科学研究院 一种烟草多酚氧化酶基因NtPPO1及其定点突变方法与应用
CN107893076A (zh) 2017-11-23 2018-04-10 和元生物技术(上海)股份有限公司 CRISPR‑Cas9靶向敲除人乳腺癌细胞RASSF2基因及其特异性的sgRNA
CN107937501A (zh) 2017-11-24 2018-04-20 安徽师范大学 一种快速简便的筛选CRISPR/Cas基因编辑阳性对象的方法
CN107937432B (zh) 2017-11-24 2020-05-01 华中农业大学 一种基于crispr系统的基因组编辑方法及其应用
CN107828738A (zh) 2017-11-28 2018-03-23 新乡医学院 一种dna甲基转移酶缺陷型cho细胞系及其制备方法及应用
CN107988256B (zh) 2017-12-01 2020-07-28 暨南大学 人亨廷顿基因敲入用重组载体及其构建方法和在模型猪构建中的应用
CN108148873A (zh) 2017-12-06 2018-06-12 南方医科大学 一种cav-1基因缺失斑马鱼及其制备方法
CN108570479B (zh) 2017-12-06 2020-04-03 内蒙古大学 一种基于CRISPR/Cas9技术介导绒山羊VEGF基因定点敲入的方法
CN108315330B (zh) 2017-12-07 2020-05-19 嘉兴市第一医院 CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及敲除方法和应用
CN107974466B (zh) 2017-12-07 2020-09-29 中国科学院水生生物研究所 一种鲟鱼CRISPR/Cas9基因编辑方法
CN108148835A (zh) 2017-12-07 2018-06-12 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除SLC30A1基因及其特异性的sgRNA
CN108251423B (zh) 2017-12-07 2020-11-06 嘉兴市第一医院 CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及激活方法和应用
CN108103090B (zh) 2017-12-12 2021-06-15 中山大学附属第一医院 靶向RNA甲基化的RNA Cas9-m6A修饰载体系统及其构建方法和应用
CN107828826A (zh) 2017-12-12 2018-03-23 南开大学 一种体外高效获得神经干细胞的方法
CN108103098B (zh) 2017-12-14 2020-07-28 华南理工大学 一种化合物皮肤致敏体外评估细胞模型及其构建方法
WO2019118949A1 (en) 2017-12-15 2019-06-20 The Broad Institute, Inc. Systems and methods for predicting repair outcomes in genetic engineering
CN107988268A (zh) 2017-12-18 2018-05-04 湖南师范大学 一种基因敲除选育tcf25基因缺失型斑马鱼的方法
CN108018316A (zh) 2017-12-20 2018-05-11 湖南师范大学 一种基因敲除选育rmnd5b基因缺失型斑马鱼的方法
CN108048466B (zh) 2017-12-21 2020-02-07 嘉兴市第一医院 CRISPR-Cas13a系统特异性靶向人RSPO2基因的crRNA及系统和应用
WO2019123430A1 (en) 2017-12-21 2019-06-27 Casebia Therapeutics Llp Materials and methods for treatment of usher syndrome type 2a and/or non-syndromic autosomal recessive retinitis pigmentosa (arrp)
RU2652899C1 (ru) 2017-12-28 2018-05-03 Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) РНК-проводники для подавления репликации вируса гепатита B и для элиминации вируса гепатита B из клетки-хозяина
CN107893080A (zh) 2017-12-29 2018-04-10 江苏省农业科学院 一种靶向大鼠Inhba基因的sgRNA及其应用
CN107988229B (zh) 2018-01-05 2020-01-07 中国农业科学院作物科学研究所 一种利用CRISPR-Cas修饰OsTAC1基因获得分蘖改变的水稻的方法
CN108103092B (zh) 2018-01-05 2021-02-12 中国农业科学院作物科学研究所 利用CRISPR-Cas系统修饰OsHPH基因获得矮化水稻的系统及其应用
CN107988246A (zh) 2018-01-05 2018-05-04 汕头大学医学院 一种基因敲除载体及其斑马鱼胶质瘤模型
CN108559760A (zh) 2018-01-09 2018-09-21 陕西师范大学 基于CRISPR靶向基因组修饰技术建立荧光素酶knock-in细胞系的方法
WO2019139951A1 (en) 2018-01-09 2019-07-18 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Detecting protein interaction sites in nucleic acids
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
CN108148837A (zh) 2018-01-12 2018-06-12 南京医科大学 ApoE-CRISPR/Cas9载体及其在敲除ApoE基因中的应用
CN108559730B (zh) 2018-01-12 2021-09-24 中国人民解放军第四军医大学 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法
CN108251451A (zh) 2018-01-16 2018-07-06 西南大学 HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及其应用
CN108251452A (zh) 2018-01-17 2018-07-06 扬州大学 一种表达Cas9基因的转基因斑马鱼及其构建方法和应用
KR20200103769A (ko) 2018-01-23 2020-09-02 기초과학연구원 연장된 단일 가이드 rna 및 그 용도
CN108359712B (zh) 2018-02-09 2020-06-26 广东省农业科学院农业生物基因研究中心 一种快速高效筛选SgRNA靶向DNA序列的方法
CN108559745A (zh) 2018-02-10 2018-09-21 和元生物技术(上海)股份有限公司 基于CRISPR-Cas9技术提高B16F10细胞转染效率的方法
CN108359691B (zh) 2018-02-12 2021-09-28 中国科学院重庆绿色智能技术研究院 利用mito-CRISPR/Cas9系统敲除异常线粒体DNA的试剂盒及方法
CN108486145A (zh) 2018-02-12 2018-09-04 中国科学院遗传与发育生物学研究所 基于CRISPR/Cas9的植物高效同源重组方法
CN109021111B (zh) 2018-02-23 2021-12-07 上海科技大学 一种基因碱基编辑器
CN108396027A (zh) 2018-02-27 2018-08-14 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞DEAF1基因及其特异性的sgRNA
CN108486159B (zh) 2018-03-01 2021-10-22 南通大学附属医院 一种敲除GRIN2D基因的CRISPR-Cas9系统及其应用
CN108410906A (zh) 2018-03-05 2018-08-17 淮海工学院 一种适用于海洋甲壳类线粒体基因组的CRISPR/Cpf1基因编辑方法
CN108342480B (zh) 2018-03-05 2022-03-01 北京医院 一种基因变异检测质控物及其制备方法
CN108410907B (zh) 2018-03-08 2021-08-27 湖南农业大学 一种基于CRISPR/Cas9技术实现HMGCR基因敲除的方法
CN108410911B (zh) 2018-03-09 2021-08-20 广西医科大学 基于CRISPR/Cas9技术构建的LMNA基因敲除的细胞系
CN108486108B (zh) 2018-03-16 2020-10-09 华南农业大学 一种敲除人hmgb1基因的细胞株及其应用
CN108486146B (zh) 2018-03-16 2021-02-19 中国农业科学院作物科学研究所 LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用
CN108384784A (zh) 2018-03-23 2018-08-10 广西医科大学 一种利用CRISPR/Cas9技术敲除Endoglin基因的方法
CN108410877A (zh) 2018-03-27 2018-08-17 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人细胞SANIL1基因及其特异性的sgRNA
CN108504685A (zh) 2018-03-27 2018-09-07 宜明细胞生物科技有限公司 一种利用CRISPR/Cas9系统同源重组修复IL-2RG缺陷基因的方法
CN108486234B (zh) 2018-03-29 2022-02-11 东南大学 一种crispr分型pcr的方法及其应用
CN108424931A (zh) 2018-03-29 2018-08-21 内蒙古大学 CRISPR/Cas9技术介导山羊VEGF基因定点整合的方法
CN108753772B (zh) 2018-04-04 2020-10-30 南华大学 基于CRISPR/Cas技术敲除CAPNS1基因的人神经母细胞瘤细胞系的构建方法
CN108486154A (zh) 2018-04-04 2018-09-04 福州大学 一种唾液酸酶基因敲除小鼠模型的构建方法及其应用
CN108504693A (zh) 2018-04-04 2018-09-07 首都医科大学附属北京朝阳医院 利用Crispr技术敲除T合酶基因构建的O-型糖基化异常的结肠癌细胞系
CN108441520B (zh) 2018-04-04 2020-07-31 苏州大学 利用CRISPR/Cas9系统构建的基因条件性敲除方法
CN108486111A (zh) 2018-04-04 2018-09-04 山西医科大学 CRISPR-Cas9靶向敲除人SMYD3基因的方法及其特异性sgRNA
CN108504657B (zh) 2018-04-12 2019-06-14 中南民族大学 利用crispr-cas9技术敲除hek293t细胞kdm2a基因的方法
CN108588182A (zh) 2018-04-13 2018-09-28 中国科学院深圳先进技术研究院 基于crispr-链取代的等温扩增及检测技术
CN108753817A (zh) 2018-04-13 2018-11-06 北京华伟康信生物科技有限公司 增强细胞的抗癌能力的方法及采用该方法获得的增强型细胞
CN108823248A (zh) 2018-04-20 2018-11-16 中山大学 一种利用CRISPR/Cas9编辑陆川猪CD163基因的方法
CN108753832A (zh) 2018-04-20 2018-11-06 中山大学 一种利用CRISPR/Cas9编辑大白猪CD163基因的方法
CN108588071A (zh) 2018-04-25 2018-09-28 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞CNR1基因及其特异性的sgRNA
CN108546712B (zh) 2018-04-26 2020-08-07 中国农业科学院作物科学研究所 一种利用CRISPR/LbCpf1系统实现目的基因在植物中同源重组的方法
CN108588128A (zh) 2018-04-26 2018-09-28 南昌大学 一种高效率大豆CRISPR/Cas9系统的构建方法及应用
CN108707621B (zh) 2018-04-26 2021-02-12 中国农业科学院作物科学研究所 一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法
CN108642053A (zh) 2018-04-28 2018-10-12 和元生物技术(上海)股份有限公司 CRISPR-Cas9靶向敲除人肠癌细胞PPP1R1C基因及其特异性的sgRNA
CN108611364A (zh) 2018-05-03 2018-10-02 南京农业大学 一种非转基因crispr突变体的制备方法
CN108588123A (zh) 2018-05-07 2018-09-28 南京医科大学 CRISPR/Cas9载体组合在制备基因敲除猪的血液制品中的应用
CN112534054A (zh) 2018-05-11 2021-03-19 比姆医疗股份有限公司 使用可编程碱基编辑器系统取代病原性氨基酸的方法
CN108610399B (zh) 2018-05-14 2019-09-27 河北万玛生物医药有限公司 特异性增强crispr-cas系统在表皮干细胞中进行基因编辑效率的方法
CN108546717A (zh) 2018-05-15 2018-09-18 吉林大学 反义lncRNA介导顺式调控抑制靶基因表达的方法
CN108624622A (zh) 2018-05-16 2018-10-09 湖南艾佳生物科技股份有限公司 一种基于CRISPR-Cas9系统构建的能分泌小鼠白细胞介素-6的基因工程细胞株
CN108546718B (zh) 2018-05-16 2021-07-09 康春生 crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用
CN108642055B (zh) 2018-05-17 2021-12-03 吉林大学 能有效编辑猪miR-17-92基因簇的sgRNA
CN108642078A (zh) 2018-05-18 2018-10-12 江苏省农业科学院 基于CRISPR/Cas9基因编辑技术选育绿豆开花传粉突变体的方法及专用gRNA
CN108642077A (zh) 2018-05-18 2018-10-12 江苏省农业科学院 基于CRISPR/Cas9基因编辑技术选育绿豆不育突变体的方法及专用gRNA
CN108642090A (zh) 2018-05-18 2018-10-12 中国人民解放军总医院 基于CRISPR/Cas9技术获得Nogo-B敲除模式小鼠的方法及应用
CN108559732A (zh) 2018-05-21 2018-09-21 陕西师范大学 基于CRISPR/Cas9靶向基因组修饰技术建立KI-T2A-luciferase细胞系的方法
CN108707620A (zh) 2018-05-22 2018-10-26 西北农林科技大学 一种Gene drive载体及构建方法
US20210198330A1 (en) 2018-05-23 2021-07-01 The Broad Institute, Inc. Base editors and uses thereof
CN108690844B (zh) 2018-05-25 2021-10-15 西南大学 HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及HD细胞模型
CN108707629A (zh) 2018-05-28 2018-10-26 上海海洋大学 斑马鱼notch1b基因突变体的制备方法
CN108707628B (zh) 2018-05-28 2021-11-23 上海海洋大学 斑马鱼notch2基因突变体的制备方法
CN108823249A (zh) 2018-05-28 2018-11-16 上海海洋大学 CRISPR/Cas9构建notch1a突变体斑马鱼的方法
CN108753835A (zh) 2018-05-30 2018-11-06 中山大学 一种利用CRISPR/Cas9编辑猪BMP15基因的方法
CN108707604B (zh) 2018-05-30 2019-07-23 江西汉氏联合干细胞科技有限公司 表皮干细胞中采用CRISPR-Cas系统进行CNE10基因敲除
CN108753836B (zh) 2018-06-04 2021-10-12 北京大学 一种利用rna干扰机制的基因调控或编辑系统
WO2019236566A1 (en) 2018-06-05 2019-12-12 Lifeedit, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
CN108715850B (zh) 2018-06-05 2020-10-23 艾一生命科技(广东)有限公司 表皮干细胞中采用CRISPR-Cas系统进行GING2基因敲除
CN108753813B (zh) 2018-06-08 2021-08-24 中国水稻研究所 获得无标记转基因植物的方法
CN108753783A (zh) 2018-06-13 2018-11-06 上海市同济医院 Sqstm1全基因敲除小鼠动物模型的构建方法和应用
CN108728486A (zh) 2018-06-20 2018-11-02 江苏省农业科学院 一种茄子CRISPR/Cas9基因敲除载体的构建方法和应用
CN108841845A (zh) 2018-06-21 2018-11-20 广东石油化工学院 一种带有筛选标记的CRISPR/Cas9载体及其构建方法
CN108893529A (zh) 2018-06-25 2018-11-27 武汉博杰生物医学科技有限公司 一种基于CRISPR技术特异性检测人KRAS基因2号及3号外显子突变的crRNA
CN108866093B (zh) 2018-07-04 2021-07-09 广东三杰牧草生物科技有限公司 一种利用CRISPR/Cas9系统对紫花苜蓿基因定点突变的方法
CN108913714A (zh) 2018-07-05 2018-11-30 江西省超级水稻研究发展中心 一种利用CRISPR/Cas9系统敲除BADH2基因创制香稻的方法
CN108795902A (zh) 2018-07-05 2018-11-13 深圳三智医学科技有限公司 一种安全高效的CRISPR/Cas9基因编辑技术
EP3820495A4 (en) 2018-07-09 2022-07-20 The Broad Institute Inc. RNA PROGRAMMABLE EPIGENETIC RNA MODIFIERS AND THEIR USES
CN108913691B (zh) 2018-07-16 2020-09-01 山东华御生物科技有限公司 表皮干细胞中采用CRISPR-Cas系统进行Card3基因敲除
CN108913664B (zh) 2018-07-20 2020-09-04 嘉兴学院 一种CRISPR/Cas9基因编辑方法敲除卵巢癌细胞中CFP1基因的方法
CN108853133A (zh) 2018-07-25 2018-11-23 福州大学 一种PAMAM与CRISPR/Cas9系统重组质粒递送纳米粒的制备方法
CN108823291B (zh) 2018-07-25 2022-04-12 领航医学科技(深圳)有限公司 基于crispr技术的特异性核酸片段定量检测方法
SG11202102068TA (en) 2018-07-31 2021-03-30 Broad Inst Inc Novel crispr enzymes and systems
CN108913717A (zh) 2018-08-01 2018-11-30 河南农业大学 一种利用CRISPR/Cas9系统对水稻PHYB基因定点突变的方法
BR112021001904A2 (pt) 2018-08-03 2021-05-04 Beam Therapeutics Inc. editores de nucleobase multiefetores e métodos de usar os mesmos para modificar uma sequência alvo de ácido nucleico
WO2020041751A1 (en) 2018-08-23 2020-02-27 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
CN113286880A (zh) 2018-08-28 2021-08-20 旗舰先锋创新Vi有限责任公司 调控基因组的方法和组合物
WO2020051360A1 (en) 2018-09-05 2020-03-12 The Broad Institute, Inc. Base editing for treating hutchinson-gilford progeria syndrome
WO2020086908A1 (en) 2018-10-24 2020-04-30 The Broad Institute, Inc. Constructs for improved hdr-dependent genomic editing
WO2020092453A1 (en) 2018-10-29 2020-05-07 The Broad Institute, Inc. Nucleobase editors comprising geocas9 and uses thereof
WO2020102659A1 (en) 2018-11-15 2020-05-22 The Broad Institute, Inc. G-to-t base editors and uses thereof
CN109517841B (zh) 2018-12-05 2020-10-30 华东师范大学 一种用于核苷酸序列修饰的组合物、方法与应用
WO2020154500A1 (en) 2019-01-23 2020-07-30 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
WO2020157008A1 (en) 2019-01-28 2020-08-06 Proqr Therapeutics Ii B.V. Rna-editing oligonucleotides for the treatment of usher syndrome
CA3126833A1 (en) 2019-01-29 2020-08-06 University Of Washington A method of gene editing
WO2020180975A1 (en) 2019-03-04 2020-09-10 President And Fellows Of Harvard College Highly multiplexed base editing
WO2020181178A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through thymine alkylation
US20220170013A1 (en) 2019-03-06 2022-06-02 The Broad Institute, Inc. T:a to a:t base editing through adenosine methylation
WO2020181202A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to t:a base editing through adenine deamination and oxidation
WO2020181195A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
WO2020181180A1 (en) 2019-03-06 2020-09-10 The Broad Institute, Inc. A:t to c:g base editors and uses thereof
MX2021011325A (es) 2019-03-19 2022-01-06 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleotidos.
US20220204975A1 (en) 2019-04-12 2022-06-30 President And Fellows Of Harvard College System for genome editing
US20220307003A1 (en) 2019-04-17 2022-09-29 The Broad Institute, Inc. Adenine base editors with reduced off-target effects
WO2020236982A1 (en) 2019-05-20 2020-11-26 The Broad Institute, Inc. Aav delivery of nucleobase editors
US20220315906A1 (en) 2019-08-08 2022-10-06 The Broad Institute, Inc. Base editors with diversified targeting scope
WO2021030666A1 (en) 2019-08-15 2021-02-18 The Broad Institute, Inc. Base editing by transglycosylation
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
WO2021108717A2 (en) 2019-11-26 2021-06-03 The Broad Institute, Inc Systems and methods for evaluating cas9-independent off-target editing of nucleic acids
EP4097124A1 (en) 2020-01-28 2022-12-07 The Broad Institute Inc. Base editors, compositions, and methods for modifying the mitochondrial genome
WO2021158995A1 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Base editor predictive algorithm and method of use
WO2021158921A2 (en) 2020-02-05 2021-08-12 The Broad Institute, Inc. Adenine base editors and uses thereof
US20230108687A1 (en) 2020-02-05 2023-04-06 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
US20230159913A1 (en) 2020-04-28 2023-05-25 The Broad Institute, Inc. Targeted base editing of the ush2a gene
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物

Also Published As

Publication number Publication date
JP2024041081A (ja) 2024-03-26
CA3082251A1 (en) 2019-04-25
CN111757937A (zh) 2020-10-09
US11795443B2 (en) 2023-10-24
JP2021500036A (ja) 2021-01-07
AU2018352592A1 (en) 2020-06-04
US20200399626A1 (en) 2020-12-24
EP3697906A1 (en) 2020-08-26
WO2019079347A1 (en) 2019-04-25

Similar Documents

Publication Publication Date Title
KR20200121782A (ko) 아데노신 염기 편집제의 용도
US11912985B2 (en) Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US20220307003A1 (en) Adenine base editors with reduced off-target effects
CN113631708B (zh) 编辑rna的方法和组合物
KR102547316B1 (ko) 아데노신 핵염기 편집제 및 그의 용도
AU2022204298A1 (en) Nucleobase editors and uses thereof
WO2020051360A1 (en) Base editing for treating hutchinson-gilford progeria syndrome
JP2020534795A (ja) ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
CN114072496A (zh) 腺苷脱氨酶碱基编辑器及使用其修饰靶标序列中的核碱基的方法
JP2022546608A (ja) 新規核酸塩基エディター及びその使用方法
JP2022500017A (ja) 核酸塩基編集システムを送達するための組成物および方法
CN114072509A (zh) 脱氨反应脱靶减低的核碱基编辑器和使用其修饰核碱基靶序列的方法
WO2023023515A1 (en) Persistent allogeneic modified immune cells and methods of use thereof
JP2022533673A (ja) プログラム可能塩基エディターシステムを用いた一塩基多型編集法
CA3152861A1 (en) Compositions and methods for editing a mutation to permit transcription or expression
US20220290164A1 (en) Recombinant rabies viruses for gene therapy
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
EP4165182A2 (en) Genetic modification
US20230270840A1 (en) Viral guide rna delivery
US20240124866A1 (en) Uses of adenosine base editors
CA3225808A1 (en) Context-specific adenine base editors and uses thereof
KR20240012377A (ko) 염기 편집기의 자기-불활성화용 조성물 및 방법
CN117321198A (zh) 用于基因疗法的重组狂犬病病毒

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal