KR20230003467A - 지시된 게놈 편집을 위한 방법 및 조성물 - Google Patents

지시된 게놈 편집을 위한 방법 및 조성물 Download PDF

Info

Publication number
KR20230003467A
KR20230003467A KR1020227035994A KR20227035994A KR20230003467A KR 20230003467 A KR20230003467 A KR 20230003467A KR 1020227035994 A KR1020227035994 A KR 1020227035994A KR 20227035994 A KR20227035994 A KR 20227035994A KR 20230003467 A KR20230003467 A KR 20230003467A
Authority
KR
South Korea
Prior art keywords
nucleic acid
reverse transcriptase
composition
region
guide nucleic
Prior art date
Application number
KR1020227035994A
Other languages
English (en)
Inventor
샤케드 오메르 할페린
Original Assignee
인텔리아 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인텔리아 테라퓨틱스, 인크. filed Critical 인텔리아 테라퓨틱스, 인크.
Publication of KR20230003467A publication Critical patent/KR20230003467A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/122Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/123Hepatitis delta
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/128Type of nucleic acid catalytic nucleic acids, e.g. ribozymes processing or releasing ribozyme
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/53Methods for regulating/modulating their activity reducing unwanted side-effects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Compositions Of Macromolecular Compounds (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

표적 핵산의 편집 효율을 증가시키기 위한 조성물 및 방법이 본 명세서에 제공된다. 조성물은 가이드 핵산, Cas9 닉카제, 또는 역전사효소를 포함할 수 있다. 역전사효소는 Cas9 닉카제에 융합될 수 있다. 역전사효소는 Cas9 닉카제와 이종이량체화될 수 있다. 역전사효소는 가이드 핵산에 결합할 수 있다. 역전사효소는 연속성을 증가시키도록 조작될 수 있다. 가이드 핵산은 서열의 합성 또는 편집을 용이하게 하도록 조작될 수 있다. 가이드 핵산, Cas9 닉카제 및 역전사효소는 AAV 벡터 내에 맞도록 조작될 수 있다. 가이드 핵산은 유전자 편집을 개선하기 위해 가이드 핵산 상의 다른 영역에 결합하는 영역을 포함할 수 있다.

Description

지시된 게놈 편집을 위한 방법 및 조성물
교차-참조
본 출원은 2020년 3월 19일에 출원된 미국 가출원 번호 62/992,032, 2020년 7월 23일에 출원된 미국 가출원 번호 63/055,829 및 2021년 2월 24일에 출원된 미국 가출원 번호 63/153,161의 이익을 주장하며, 이들 모두는 그 전체가 참고로 본 명세서에 포함된다.
서열 목록의 참조에 의한 통합
본 출원은 ASCII 형식으로 전자적으로 제출되었고 이에 의해 그 전체가 참고로 포함되는 서열 목록을 함유한다. 2021년 3월 16일에 생성된 상기 ASCII 사본은 56385-701_601_SL.txt로 명명되고 크기는 609,554바이트이다.
표적 핵산에 이중-가닥 파손을 도입하는 Cas-지향된 게놈 편집 기술은 종종 p53의 서열 전위, 삽입, 결실, 및 DNA 손상 복구, 세포 주기 정지 또는 세포자멸 기능의 활성화를 포함한 바람직하지 않은 생성물을 초래한다. 단일-가닥 파손을 도입하는 편집 기술은 허용되는 돌연변이의 유형 및 크기에서 제한될 수 있거나 편집 효율성이 제한될 수 있다. 개선된 정확성, 효율성 및 다양성을 갖는 게놈 편집 기술이 필요하다.
다양한 양태에서, 본 개시내용은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 가지고 DNA 중합효소를 포함하는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하며, 상기 방법은: 기준선 dNTP 농도에 비해 세포에서 dNTP 농도를 증가시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 세포에서 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제를 억제하는 것을 포함한다. 다양한 양태에서, 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제는 SAM 도메인 및 HD 도메인-함유 단백질 1(SAMHD1)을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키는 것, 또는 세포에서 Vpx 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 BGLF4 단백질과 접촉시키는 것, 또는 세포에서 BGLF4 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키는 것, 또는 세포에서 마이크로RNA 또는 siRNA를 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 뉴클레오시드 또는 뉴클레오티드(예를 들어, dN, dNMP, 또는 NTP)를 세포에 투여하는 것을 포함한다. 다양한 양태에서, dNTP를 세포에 투여하는 것은 세포를 포함하는 대상체에게 뉴클레오시드 또는 뉴클레오티드를 투여하는 것을 포함한다. 다양한 양태에서, 투여는 경구이거나 주사에 의한 것이다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함한다. 다양한 양태에서, dNTP 합성 효소는 키나제를 포함한다. 다양한 양태에서, 키나제는 뉴클레오시드 키나제, 데옥시뉴클레오시드 키나제, 데옥시뉴클레오시드 모노포스페이트 키나제, 또는 데옥시뉴클레오티드 디포스페이트 키나제를 포함한다. 다양한 양태에서, DNA 중합효소는 역전사효소를 포함한다. 다양한 양태에서, 세포는 Cas9 프로그램가능한 뉴클레아제, 가이드 핵산, 또는 이의 조합을 추가로 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 비분할 세포에서 발견되는 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 활성화된 말초 혈액 단핵 세포에서 발견되는 dNTP 농도보다 낮다. 다양한 양태에서, 낮은 dNTP 농도는 1 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, dNTP 농도를 증가시키는 것은 dNTP 농도를 기준선 dNTP 측정에 비해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 또는 그 초과로 dNTP 농도를 증가시키는 것을 포함한다. 다양한 양태에서, dNTP 농도는 데옥시아데노신 트리포스페이트(dATP) 농도, 데옥시시티딘 트리포스페이트(dCTP) 농도, 데옥시구아노신 트리포스페이트(dGTP) 농도, 또는 데옥시티미딘 트리포스페이트(dTTP) 농도, 또는 이의 임의의 조합을 포함한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물 또는 본 명세서에 기재된 바와 같은 가이드 핵산을 발현하는 세포에서 Vpx 단백질을 발현시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다.
다양한 양태에서, 본 개시내용은 세포에서 dNTP 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법을 제공한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 발현하는 세포에서 SAMHD1을 억제하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 발현하는 세포에서 (예를 들어, SAMHD1을 억제함에 의해) dNTP 농도를 증가시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다.
일부 양태에서, SAMHD1을 억제하는 것은 세포에서 Vpx 단백질을 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 세포에서 SAMHD1에 대해 마이크로RNA를 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 세포를 소분자 SAMHD1 억제제로 처리하는 것을 포함한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제 및 역전사효소를 포함하는 조성물을 제공하며, 여기서 Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬이고 Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성한다.
일부 양태에서, Cas-역전사효소 이종이량체는 Cas 닉카제에 융합된 제1 이종이량체 도메인 및 역전사효소에 융합된 제2 이종이량체 도메인을 포함하며, 여기서 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합하여 이종이량체를 형성한다. 일부 양태에서, 제1 이종이량체 도메인은 류신 지퍼이고 제2 이종이량체 도메인은 류신 지퍼이다. 일부 양태에서, 역전사효소는 서열번호: 3 - 서열번호: 22 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제에 융합된 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제에 융합된 박테리아 II군 인트론으로부터의 서열을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함한다.
Cas 닉카제 및 역전사효소를 포함하는 조성물이 본 명세서에 개시되며, 여기서 Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제 및 역전사효소는 이종이량체화되도록 조작되지 않는다.
다양한 양태에서, 본 개시내용은 Cas 닉카제, 역전사효소, 및 가이드 핵산을 포함하는 조성물을 제공하며, 여기서 제1 폴리펩티드는 Cas 닉카제를 포함하고 제2 폴리펩티드는 역전사효소를 포함하고 가이드 핵산은 Cas 닉카제와 역전사효소에 결합한다.
일부 양태는 Cas 닉카제와 복합체를 형성하는 가이드 핵산을 포함하며, 여기서 복합체 형성 시 Cas 닉카제는 표적 핵산에서 표적 부위에 단일-가닥 파손을 도입할 수 있다. 일부 양태에서, 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함한다.
일부 양태에서, 역전사효소는 mcp 펩티드를 포함한다. 일부 양태에서, 역전사효소는 루프 영역을 포함한다. 일부 양태에서, 루프 영역은 2a 루프 또는 3a 루프이다. 일부 양태에서, 루프 영역은 2a 루프이다. 일부 양태에서, 루프 영역은 3a 루프이다. 일부 양태에서, 가이드 핵산은 MS2 헤어핀을 포함한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 서열번호: 3 - 서열번호: 22 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는 역전사효소를 포함하는 조성물을 제공한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 비-장 말단 반복 역전사가능한 요소로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물을 제공한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 박테리아 II군 인트론으로부터의 서열을 포함하는 역전사효소를 포함하는 조성물을 제공한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물을 제공한다.
일부 양태에서, 조성물은 Cas 닉카제 및 역전사효소와 복합체를 형성하는 가이드 핵산을 포함하며, 여기서 복합체 형성 시 Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입할 수 있다. 일부 양태에서, 조성물은 Cas 닉카제 또는 역전사효소에 융합된 핵 국소화 신호를 포함한다. 일부 양태에서, 역전사효소는 절삭된 역전사효소이다. 일부 양태에서, 역전사효소는 천연 역전사효소와 비교하여 증가된 연속성을 갖는다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 증가된 연속성을 갖는다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 표적 서열에서 더 긴 윈도우 길이를 편집한다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 감소된 면역원성을 갖는다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 세포로의 개선된 전달을 갖는다. 일부 양태에서, 역전사효소는 단일 결합 이벤트에서 20개 이상, 40개 이상, 45개 이상, 50개 이상, 60개 이상, 81개 이상, 100개 이상, 500개 이상, 또는 1000개 이상의 뉴클레오티드를 중합한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제 및 역전사효소, 또는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 조성물을 제공하며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부는 적어도 2개의 별도의 폴리펩티드 사슬에 포함된다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 이종이량체 도메인을 포함하는 별도의 폴리펩티드 사슬을 포함한다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 인테인을 포함하는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제는 아미노산 위치 1030 또는 아미노산 위치 1030 이후의 돌연변이를 포함하고, 돌연변이는 시스테인, 트레오닌, 알라닌 또는 세린에 대한 점 돌연변이, 또는 시스테인, 트레오닌, 알라닌 또는 세린의 삽입을 포함한다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 이종이량체 도메인을 포함하는 별도의 폴리펩티드 사슬을 포함한다. 일부 양태에서, 별도의 폴리펩티드 사슬은 이종이량체 도메인을 포함하는 융합 단백질을 포함한다. 일부 양태에서, 이종이량체 도메인은 류신 지퍼, PDZ 도메인, 스트렙타비딘 및 스트렙타비딘 결합 단백질, 폴돈 도메인, 소수성 폴리펩티드, Cas 닉카제에 결합하는 항체, 또는 역전사효소에 결합하는 항체, 또는 이의 하나 이상의 결합 단편을 포함한다. 일부 양태에서, 이종이량체 도메인은 제1 이종이량체 도메인 및 제2 이종이량체 도메인을 포함하고, Cas 닉카제는 제1 이종이량체 도메인을 포함하고 역전사효소는 제2 이종이량체 도메인을 포함한다. 일부 양태에서, 제1 이종이량체 도메인은 Cas 닉카제의 아미노 또는 카르복시 말단에 융합되고, 제2 이종이량체 도메인은 역전사효소의 아미노 또는 카르복시 말단에 융합된다. 일부 양태에서, 제1 이종이량체 도메인은 제1 류신 지퍼를 포함하고, 여기서 제2 이종이량체 도메인은 제2 류신 지퍼를 포함한다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 인테인을 포함하는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제는 아미노산 위치 1030 또는 아미노산 위치 1030 이후에서 돌연변이를 포함하고, 돌연변이는 시스테인, 트레오닌, 알라닌 또는 세린에 대한 점 돌연변이, 또는 시스테인, 트레오닌, 알라닌 또는 세린의 삽입을 포함한다. 일부 양태에서, 점 돌연변이는 시스테인에 대한 것이거나 삽입이 시스테인에 대한 것이다. 일부 양태에서, 점 돌연변이는 트레오닌에 대한 것이거나 삽입이 트레오닌에 대한 것이다. 일부 양태에서, 점 돌연변이는 알라닌에 대한 것이거나 삽입이 알라닌에 대한 것이다. 일부 양태에서, 점 돌연변이는 세린에 대한 것이거나 삽입이 세린에 대한 것이다. 일부 양태에서, 돌연변이는 점 돌연변이를 포함하며, 여기서 점 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, R1212, 또는 전술한 아미노산 위치 중 임의의 2개에 의해 한정된 범위에 있다. 일부 양태에서, 돌연변이는 점 돌연변이를 포함하고, 여기서 점 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 있다. 일부 양태에서, 돌연변이는 삽입 돌연변이를 포함하며, 여기서 삽입 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, R1212, 또는 전술한 아미노산 위치 중 임의의 2개에 의해 한정된 범위의 바로 상류 또는 하류에 있다. 일부 양태에서, 돌연변이는 삽입 돌연변이를 포함하며, 여기서 삽입 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류 또는 하류에 있다. 일부 양태에서, 인테인은 제1 인테인 및 제2 인테인을 포함하고, 여기서 Cas 닉카제는 제1 인테인을 포함하는 제1 분절, 및 돌연변이 및 제2 인테인을 포함하는 제2 분절을 포함한다. 일부 양태는 Cas 닉카제 또는 역전사효소에 결합하는 가이드 핵산을 포함한다. 일부 양태에서, 복합체의 Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입한다. 일부 양태에서, Cas 닉카제는 Cas9 닉카제 또는 이의 변이체를 포함한다. 일부 양태에서, Cas9 닉카제 또는 이의 변이체는 S. 피오게네스 Cas9 닉카제 또는 이의 변이체를 포함한다. 일부 양태에서, 역전사효소는 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체를 포함한다. 일부 양태에서, 역전사효소는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524에서 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, 조성물은 Cas 닉카제 및 역전사효소를 포함하고, 여기서 적어도 2개의 별도의 폴리펩티드 사슬은 2개의 별도의 폴리펩티드 사슬이다. 일부 양태에서, 조성물은 Cas 닉카제 및 역전사효소를 포함하고, 여기서 적어도 2개의 별도의 폴리펩티드 사슬은 Cas 닉카제의 제1 부분을 포함하는 제1 폴리펩티드 사슬, 및 Cas 닉카제의 제2 부분 및 역전사 효소를 포함하는 제2 폴리펩티드 사슬을 포함한다. 일부 양태는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 일부 양태에서, Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드는 Cas 닉카제의 제1 부분을 인코딩하는 제1 폴리뉴클레오티드, 및 Cas 닉카제의 제2 부분 및 역전사효소을 인코딩하는 제2 폴리뉴클레오티드를 포함한다. 일부 양태는 적어도 하나의 폴리뉴클레오티드를 포함하는 적어도 하나의 아데노-연관된 바이러스를 포함한다. 일부 양태에서, 조성물은 세포에 의해 생성된다.
다양한 양태에서, 본 개시내용은 Cas 닉카제 및 역전사효소, 또는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 조성물을 제공하며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함된다. 일부 양태에서, Cas 닉카제 또는 역전사효소는 제1 류신 지퍼를 포함한다. 일부 양태에서, Cas9 닉카제는 S. 피오제네스 Cas9 닉카제 또는 이의 변이체, 및 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에서의 점 돌연변이, 또는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류 또는 하류에 삽입 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 몰로니 백혈병 바이러스 역전사효소(mlvRT), 또는 이의 변이체, 및 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 포함한다. 일부 양태에서, 별도의 폴리펩티드 사슬은 이종이량체 도메인을 포함한다. 일부 양태에서, Cas 닉카제 및 역전사효소는 Cas 닉카제에 융합된 제1 이종이량체 도메인 및 역전사효소에 융합된 제2 이종이량체 도메인을 포함하는 이종이량체를 형성하며, 여기서 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합하여 이종이량체를 형성한다. 일부 양태에서, 제1 이종이량체 도메인은 제1 류신 지퍼를 포함한다. 일부 양태에서, 제2 이종이량체 도메인은 제2 류신 지퍼를 포함한다. 일부 양태에서, 역전사효소는 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80, 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제의 일부에 융합된 비-장 말단 반복 역전사성 요소의 도메인, Cas 닉카제의 일부에 융합된 박테리아 II군 인트론의 서열, 또는 Cas 닉카제의 일부에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함한다. 일부 양태는 Cas 닉카제 또는 역전사효소에 결합하는 가이드 핵산을 포함한다. 일부 양태에서, 복합체의 Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입한다. 일부 양태에서, 가이드 핵산은 헤어핀을 포함한다. 일부 양태에서, 헤어핀은 MS2 헤어핀을 포함한다. 일부 양태에서, 역전사효소는 헤어핀 결합 도메인을 포함하는 변형된 역전사효소를 포함한다. 일부 양태에서, 역전사효소는 MS2 코트 단백질(MCP) 펩티드를 포함하는 변형된 역전사효소를 포함한다. 일부 양태에서, 역전사효소는 루프 영역을 포함한다. 일부 양태에서, Cas9 닉카제는 Cas9 닉카제의 C-말단 절반에 점 돌연변이 또는 삽입 돌연변이를 포함한다. 일부 양태에서, Cas9 닉카제의 C-말단 절반에서의 점 돌연변이는 시스테인, 세린, 트레오닌 또는 알라닌에 대한 것이고; 또는 여기서 삽입 돌연변이는 시스테인 삽입 세린 삽입, 트레오닌 삽입, 또는 알라닌 삽입이다. 일부 양태에서, Cas9 닉카제는 Cas9 닉카제의 C-말단 절반에 점 돌연변이를 포함한다. 일부 양태에서, Cas9 닉카제는 Cas9 닉카제의 C-말단 절반에 삽입 돌연변이를 포함한다. 일부 양태에서, Cas9 닉카제는 제1 인테인을 포함하는 제1 분절, 및 점 돌연변이 또는 삽입 돌연변이 및 제2 인테인을 포함하는 제2 분절을 포함한다. 일부 양태에서, Cas9 닉카제는 S. 피오게네스 Cas9 닉카제 또는 이의 변이체를 포함한다. 일부 양태에서, Cas9 닉카제는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에서의 점 돌연변이, 또는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류 또는 하류에 삽입 돌연변이를 포함한다. 일부 양태에서, Cas 닉카제 또는 역전사효소는 핵 국소화 신호를 포함한다. 일부 양태에서, 역전사효소는 절삭된 역전사효소이다. 일부 양태에서, 역전사효소는 mlvRT 또는 이의 변이체를 포함한다. 일부 양태에서, 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서의 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함한다. 일부 양태에서, 조성물은 세포에 의해 생성된다. 일부 양태는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 일부 양태는 적어도 하나의 폴리뉴클레오티드를 포함하는 적어도 하나의 아데노-연관된 바이러스를 포함한다.
다양한 양태에서, 본 개시내용은 표적 핵산의 제1 영역에 역상보적인 스페이서, Cas 닉카제에 결합하도록 구성된 스캐폴드, 표적 핵산 내로 삽입되는 서열을 인코딩하는 역전사효소 주형, 및 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위를 포함하는 가이드 핵산을 제공한다.
일부 양태에서, 가이드 핵산은 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머를 추가로 포함한다. 일부 양태에서, 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있다. 일부 양태에서, 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적이다. 일부 양태에서, 가이드 핵산은 가이드 핵산의 3' 말단에서 절단가능한 서열을 추가로 포함한다. 일부 양태에서, 절단가능한 서열은 리보자임 절단가능한 서열이다. 일부 양태에서, 절단가능한 서열은 tRNA 절단가능한 서열이다. 일부 양태에서, 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성되고, 여기서 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터 역전사를 위한 주형으로 작용하도록 구성된다. 일부 양태에서, 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터의 전사를 위한 프라이머로 작용하도록 구성된다. 일부 양태에서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로서 작용한다. 일부 양태에서, 역전사효소 주형 영역의 영역에 혼성화하는 벨크로 영역.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 가이드를 포함하는 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물을 제공한다.
일부 양태에서, 제2 가이드 핵산은 본 명세서에 기재된 바와 같은 가이드를 포함한다. 일부 양태에서, 제1 가이드 핵산은 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산은 제2 Cas 닉카제에 결합한다. 일부 양태에서, 제1 가이드 핵산의 제1 스페이서는 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스페이서는 제2 Cas 닉카제에 결합하고, 제1 가이드 핵산의 제1 스캐폴드는 제2 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스캐폴드는 제1 Cas 닉카제에 결합한다. 일부 양태에서, 제1 가이드 핵산은 제1 링커를 포함하고 제2 가이드 핵산은 제2 링커를 포함하며, 여기서 제1 링커는 제2 링커에 혼성화한다.
다양한 양태에서, 본 개시내용은 표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위; 및 i. gRNA 위치화 시스템(GPS) 영역 및 GPS 영역에 혼성화하는 GPS 결합 부위, ii. 표적 핵산에서 프로토스페이서 인접 모티프(PAM) 서열을 파괴하는 역전사효소 주형에서의 변형, iii. 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서의 변형, 또는 iv. 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머 중 적어도 하나를 포함하는 가이드 핵산을 제공한다. 다양한 양태에서, 본 개시내용은 표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위; 및 i. gRNA 위치화 시스템(GPS) 영역 및 GPS 영역에 혼성화하는 GPS 결합 부위, ii. 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서의 변형, 또는 iii. 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머 중 적어도 하나를 포함하는 가이드 핵산을 제공한다. 일부 양태는 제2 가닥 프라이머를 포함한다. 일부 양태에서, 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터의 전사를 위한 프라이머로 작용하도록 구성된다. 일부 양태에서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로서 작용한다. 일부 양태에서, 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있다. 일부 양태에서, 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적이다. 일부 양태는 가이드 핵산의 3' 말단에 리보자임 절단가능한 서열을 포함한다. 일부 양태는 가이드 핵산의 3' 말단에 tRNA 절단가능한 서열을 포함한다. 일부 양태에서, 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성되고, 여기서 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터 역전사를 위한 주형으로 작용하도록 구성된다. 일부 양태는 GPS 영역 및 GPS 결합 부위를 포함한다. 일부 양태에서, GPS 영역 및 GPS 결합 부위는 함께 가이드 핵산의 다른 영역에 결합하여 가이드 핵산의 형태 변화에 영향을 미치고 유전자 편집을 개선하는 가이드 핵산의 영역을 포함한다. 일부 양태에서, GPS 영역과 GPS 결합 부위의 혼성화는 가이드 핵산을 형태적으로 변화시키고, GPS 영역 또는 GPS 결합 부위가 없는 가이드 핵산과 비교하여 편집 효율을 개선한다. 일부 양태에서, 역전사효소 주형 영역은 GPS 결합 부위를 포함한다. 일부 양태에서, GPS 결합 부위는 제1 가닥 프라이머 결합 부위의 5'이다. 일부 양태에서, GPS 결합 부위는 제1 가닥 프라이머 결합 부위의 3'이다. 일부 양태에서, GPS 영역은 역전사효소 주형의 5'이다. 일부 양태에서, GPS 영역은 역전사효소 주형의 3'이다. 일부 양태에서, GPS 영역은 스캐폴드의 5'이다. 일부 양태에서, GPS 영역은 길이가 5-100 뉴클레오티드이다. 일부 양태에서, GPS 결합 부위는 GPS 영역에 대해 적어도 50% 상보적이다. 일부 양태에서, 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함한다. 일부 양태에서, 스페이서는 서열번호: 96-119 중 임의의 하나와 적어도 85% 동일한 핵산 서열을 포함한다. 일부 양태는 표적 핵산에서 PAM 서열을 파괴하는 역전사효소 주형에서 변형을 포함한다. 일부 양태에서, PAM 서열은 Cas 뉴클레아제에 의해 인식되는 2-6개의 염기쌍 핵산 서열을 포함한다. 일부 양태에서, 표적 핵산에서 PAM 서열을 파괴하는 역전사효소 주형에서 변형은 변형이 없는 가이드 핵산에 비해 유전자 편집을 개선한다. 일부 양태는 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서 변형을 포함한다. 일부 양태에서, 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙은 폴리A 트랙을 포함한다. 일부 양태에서, 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서 변형은 변형이 없는 가이드 핵산에 비해 유전자 편집을 개선한다. 일부 양태에서, Cas 뉴클레아제는 Cas 닉카제를 포함한다. 일부 양태에서, 가이드 핵산은 가이드 RNA를 포함한다. 일부 양태는 가이드 핵산을 포함하는 조성물을 세포에 전달하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 양태에서, 조성물은 가이드 핵산을 포함하는 바이러스 벡터를 포함한다. 일부 양태는 제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역을 포함한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물 또는 본 명세서에 기재된 바와 같은 가이드 핵산을 발현하는 세포에 Orf1p를 전달하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물 또는 본 명세서에 기재된 바와 같은 가이드 핵산을 인코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 핵산을 포함하는 바이러스 벡터를 제공한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물, 본 명세서에 기재된 바와 같은 가이드 핵산, 본 명세서에 기재된 바와 같은 핵산, 또는 본 명세서에 기재된 바와 같은 바이러스 벡터를 포함하는 세포를 제공한다.
일부 양태에서, 세포는 원핵 세포이다. 일부 양태에서, 세포는 진핵 세포이다.
일부 양태에서, 본 개시내용은 인테인 촉매작용을 가능하게 하거나 개선하는 하나 이상의 점 돌연변이 또는 삽입 돌연변이를 포함하는 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물을 제공한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물을 제공하며, 여기서 Cas9 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제의 C-말단 절반에 위치한 시스테인 점 돌연변이를 포함한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물을 제공하며, 여기서 Cas9 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제의 C-말단 절반에 위치한 삽입 돌연변이(예를 들어, 시스테인 삽입 돌연변이)를 포함한다. 점 돌연변이는 시스테인 점 돌연변이, 세린 점 돌연변이, 트레오닌 점 돌연변이, 또는 알라닌 점 돌연변이일 수 있다. 삽입 돌연변이는 시스테인 삽입 돌연변이, 세린 삽입 돌연변이, 트레오닌 삽입 돌연변이, 또는 알라닌 삽입 돌연변이일 수 있다.
일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 Cas9 닉카제이다. 일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 S. 피오게네스 Cas9이다. 일부 양태에서, 점 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 위치된다. 일부 양태에서, 삽입 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류에 있다. 일부 양태에서, 시스테인 점 돌연변이는 S. 피오게네스 Cas9의 S1173C, D1079C, 또는 D1180C에 위치된다. 일부 양태에서, 시스테인 삽입 돌연변이는 S. 피오게네스 Cas9의 1173C, 1079C, 또는 1180C에 위치된다. 일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나의 서열을 포함한다.
일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 2개 이상의 분절로서 발현된다. 일부 양태에서, 2개 이상의 분절 중 제1 분절은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분 및 제1 인테인을 포함하고, 여기서 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분 및 제2 인테인을 포함한다. 일부 양태에서, 시스테인 점 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 위치된다. 일부 양태에서, 시스테인 삽입 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 위치된다. 일부 양태에서, 제1 인테인은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분의 C-말단에 융합되고, 여기서 제2 인테인은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 융합된다. 일부 양태에서, 제1 분절은 서열번호: 90의 서열을 포함하고, 여기서 제2 분절은 서열번호: 91의 서열을 포함한다. 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분에 융합된 역전사효소를 포함할 수 있다. 역전사효소는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 C-말단에 융합된 N-말단을 포함할 수 있다. 역전사효소는 mlvRT 또는 이의 변이체를 포함할 수 있다.
낮은 dNTP 농도에서 그 촉매 효율을 증가시키도록 변형된(예를 들어, dNTP에 대한 그 Km을 감소시키도록 변형된) 몰로니 백혈병 바이러스 역전사효소(mlvRT)로 게놈 편집을 수행하는 것을 포함하는 게놈 편집 효율을 최적화하는 방법이 본 명세서에 개시되어 있다. 역전사효소의 위치 221 또는 223에서 점 돌연변이를 포함하는, 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체로 게놈 편집을 수행하는 것을 포함하는, 제한적인 dNTP 조건에서 게놈 편집 효율을 최적화하는 방법이 본 명세서에 개시되어 있다. mlvRT 또는 이의 변이체는 위치 221에서 점 돌연변이를 포함할 수 있다. 위치 221에서 점 돌연변이는 Q221R을 포함할 수 있다. mlvRT 또는 이의 변이체는 위치 223에서 점 돌연변이를 포함할 수 있다. 위치 223에서 점 돌연변이는 V223A를 포함할 수 있다. 위치 223에서의 점 돌연변이는 V223M을 포함할 수 있다.
Cas 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩될 수 있다. 폴리뉴클레오티드를 포함하는 AAV가 본 명세서에 개시되어 있다. Cas 닉카제 및 RT의 적어도 일부는 별도의 AAV에 포괄되거나 포함될 수 있다. Cas 또는 Cas9 성분을 인코딩하는 제1 폴리뉴클레오티드를 포함하는 제1 AAV, 및 RT 성분을 인코딩하는 제2 폴리뉴클레오티드를 포함하는 제2 AAV를 포함하는 AAV가 본 명세서에 개시된다. AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB, 또는 AAV-PHP.S, 또는 이의 조합을 포함할 수 있다.
개선된 역전사효소(RT)를 스크리닝하거나 식별하는 방법이 본 명세서에 개시되며, 상기 방법은 세포에서 SAMHD1을 과발현시키거나 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현시키는 것; 세포에서 RT 활성을 식별하는 것; 및 RT 활성에 기반하여, RT를 개선된 RT로 식별하는 것을 포함한다.
스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA 또는 폴리뉴클레오티드를 포함하는 시스템이 본 명세서에 개시되며, 여기서 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산의 영역의 임의의 부분을 포함하지 않는 핵산에 결합한다.
표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 제1 영역의 임의의 부분을 포함하지 않고, 제1 영역의 역 상보체의 임의의 부분을 포함하지 않는 표적 핵산의 영역에 결합하는 제1 가닥 프라이머 결합 부위; 및 제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역을 포함하는 제1 가이드 핵산을 포함하는 시스템이 본 명세서에 개시된다. 표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 및 제1 영역의 임의의 부분을 포함하지 않고, 제1 영역의 역 상보체의 임의의 부분을 포함하지 않는 표적 핵산의 영역에 결합하는 제1 가닥 프라이머 결합 부위를 포함하는 제1 가이드 핵산을 포함하는 시스템이 본 명세서에 개시된다. 일부 양태는 제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역을 포함한다. 일부 양태는 제2 가이드 핵산을 포함한다. 제2 가이드 핵산은 GPS 결합 부위를 포함할 수 있다. 일부 양태에서, 제2 가이드 핵산은 표적 핵산의 또 다른 영역에 역상보적인 제2 스페이서를 포함한다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩에 근접시키거나 접촉하도록 할 수 있다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 표시된 것과 동일한 정도로 본 명세서에 참조로 포함된다.
개시내용의 신규 특징은 첨부된 청구범위에서 구체적으로 제시된다. 본 개시내용의 특징 및 이점의 더 나은 이해는 개시내용의 원리가 활용되는 예시적인 실시형태를 설명하는 다음의 상세한 설명 및 이하의 첨부 도면을 참조하여 얻어질 것이다:
도 1은 nCas9 및 몰로니 백혈병 바이러스 RT("mlvRT"), 및 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물("mlvRT 분할 스티치")을 포함하는 융합된 Cas9 닉카제(nCas9) 역전사효소(RT) 작제물("nCas9-mlvRT")의 편집 효율을 나타낸다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 별도 폴리펩티드 사슬 상에 포함한다. nCas9-LZ1은 류신 지퍼를 통해 mlvRT(서열번호: 13) 및 N-말단 류신 지퍼(서열번호: 24)를 포함하는 LZ2-mlvRT와 이종이량체화하는 C-말단 류신 지퍼(서열번호: 23) 및 SpCas9(서열번호: 32)를 포함한다. nCas9-mlvRT 작제물의 개략도 상단에 제공되어 있다.
도 2는 융합된 nCas9-RT 작제물("nCas9-mlvRT") 및 역전사효소에 융합된 nCas9 및 mcp 펩티드를 포함하는 분할 nCas9 및 mcp-mlvRT 작제물("mcp-mlvRTv")(서열번호: 27)의 편집 효율을 나타낸다. mcp 펩티드는 MS2 RNA 헤어핀과 상호작용한다. 분할 nCas9 및 mcp-mlvRT 작제물의 효율성은 gRNA 2.0를 포함하는 상이한 가이드 RNA(gRNA) 작제물(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")로 시험되었다.
도 3은 증가된 전사 연속성을 갖는 변형된 역전사효소를 포함하는 상이한 분할 nCas9-RT 작제물의 편집 효율을 나타낸다. 지오바실러스 스테아로테르모필루스(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레(ErRT, 서열번호: 4) 중 어느 하나로부터의 nCas9 및 역전사효소 및 R2 폴리단백질로부터의 아미노산 116-1016(R2(116-1016), 서열번호: 7)을 포함하는 작제물을 시험하였다. GsI-IICRT 역전사효소("스티치RT")의 개략도는 도 1 도 2에 사용된 mlvRT 역전사효소와 비교하여 도시된다.
도 4a는 본 개시내용의 조작된 gRNA("스티치 가이드")를 사용한 게놈 편집에 대한 방법을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위로 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥을 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합한다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화한다. 4-200 bp의 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합한다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥의 DNA는 흠집의 부위에서 표적 핵산에 합체될 수 있다.
도 4b는 pegRNA 또는 스티치 가이드 gRNA를 사용한 nCas9-RT 작제물의 편집 효율을 나타낸다. pegRNA와 스티치 가이드 gRNA의 개략도는 왼쪽에 도시되어 있다. 융합된 nCas9-mlvRTv 작제물이 이 검정에 사용되었다.
도 5a는 제1 가닥 프라이머 결합 부위의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'("흠집으로부터 nt")에 위치된 제2 가닥 프라이머(SSP) 20 뉴클레오티드(nt), 40 nt 또는 60 nt 길이를 포함하는 상이한 gRNA를 갖는 융합된 nCas9-RT 작제물("nCas9-mlvRTv")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA가 대조군으로 시험되었다. 모든 gRNA 서열은 HDV 리보자임(서열번호: 25)을 포함하였다.
도 5b는 제1 가닥 프라이머 결합 부위의 5' 말단의 6 nt, 36 nt, 또는 55 nt 3'("흠집으로부터 nt")에 위치된 제2 가닥 프라이머(SSP) 20 뉴클레오티드(nt), 40 nt 또는 60 nt 길이를 포함하는 상이한 gRNA를 갖는 nCas9-RT("nCas9-R2(116-1016)")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA가 대조군으로 시험되었다.
도 6은 nCas9-RT를 갖는 2개의 gRNA 시스템을 사용하는 게놈 편집의 4가지 방식을 예시한다. 2개의 가이드가 각각 편집된 가닥을 생성하는 2개의 단일 가이드 시스템(왼쪽 상단)에서, 각 gRNA는 상이한 nCas9에 결합하고 2개의 gRNA는 각각 역전사효소 주형 영역을 포함한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 2개의 단일 가이드 시스템(오른쪽 상단)에서, 각 gRNA는 상이한 nCas9에 결합하고 gRNA 중 하나만 역전사효소 주형 영역을 포함한다. 두 가이드가 각각 편집을 생성하는 이중 가이드 복합체 시스템(왼쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; 2개의 gRNA는 각각 역전사효소 주형 영역 및 프라이머 결합 부위(PBS) 영역을 포함한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 이중 가이드 복합체 시스템(오른쪽 아래)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고, 제2 gRNA의 스페이서는 제2 nCas9에 결합하고, 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고, 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; gRNA 중 하나만 역전사효소 주형 영역을 포함한다.
도 7은 유전자 편집의 효율을 증가시키는 방법을 예시한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 2개의 단일 가이드 시스템 또는 제2 가이드가 반대쪽 가닥에 흠집을 내는 이중 가이드 복합 시스템으로, 반대쪽 가닥 상의 흠집은 새롭게 합성된 DNA의 표적 핵산 안으로 합체를 용이하게 한다. 제2 가이드는 제1 새롭게 합성된 가닥의 영역에 역상보적인 플랩을 생성한다. 제1 합성 가닥은 제2 가닥 합성을 위한 주형으로 작용한다.
도 8a는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 제1 가닥 프라이머 결합 부위의 gRNA 5'의 영역에 역상보적인 역전사효소 주형 영역의 5'에 위치된 5 내지 200개의 뉴클레오티드를 포함한다.
도 8b는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 역전사효소 주형 영역의 영역에 역상보적인 제1 가닥 프라이머 결합 부위의 3'에 위치된 5 내지 100개의 뉴클레오티드를 포함한다.
도 9a도 8a도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-mlvRTv 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역(도 8a에 예시된 바와 같이 "V1")의 5'에 위치된 15 nt 벨크로 영역, 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위(도 8b에 예시된 바와 같이 "V2")의 3'에 위치된 벨크로 영역을 사용하여 비교되었다. gRNA는 107 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위를 함유했다. 편집은 흠집의 2 뉴클레오티드 3'에서 시작하는 ATCC 서열이 CATA로 돌연변이되도록 수행되었다.
도 9b도 8a도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-R2(116-1016) 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 벨크로 결합 부위의 말단과 프라이머 결합 부위의 시작 사이에 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역(도 8a에 예시된 바와 같이 "V1")의 5'에 위치된 15 nt 벨크로 영역, 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위(도 8b에 예시된 바와 같이 "V2")의 3'에 위치된 벨크로 영역을 사용하여 비교되었다.
도 10도 7에 도시된 바와 같은 2개의 gRNA 시스템의 편집 효율을 나타낸다. 청색 형광 단백질(BFP)을 인코딩하는 표적 핵산은 정지 코돈을 도입하도록 편집되었다. 세포에서 BFP 형광의 결여는 성공적인 편집을 나타낸다. BFP에 대해 음성인 세포의 백분율("% BFP-")로 측정된 편집 효율은 세포 단독(gRNA 없음), 단일 gRNA(3' 연장을 결하는 gRNA 2, 스텁이 없는 gRNA 1, 스텁이 있는 gRNA 1) 및 2개의 gRNA(스텁이 없는 gRNA 1 플러스 gRNA 2 및 스텁이 있는 gRNA 1 및 gRNA 2)에 대해 측정되었다.
도 11a는 프라임 편집기 2 시스템("PE2", 상단), 분할 프라임 편집기 2 시스템("분할 PE2", 중간), 및 2개의 류신 지퍼가 있는 분할 스티치 작제물("분할 스티치", 하단)의 도메인 배열을 나타낸다. 오른쪽에는 가이드 핵산과 복합체화된 2개의 류신 지퍼(LZ1 및 LZ2)에 의해 연결된 Cas9 닉카제(nCas9) 및 역전사효소(RT)를 포함하는 분할 스티치 작제물의 구조적 개략도이다. 분할 스티치 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 개별 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다.
도 11b는 다른 gRNA를 갖는 도 11a에 예시된 작제물의 편집 효율을 나타낸다. 편집 효율은 BFP를 GFP로 전환하기 위해 편집된 세포의 백분율(% GFP+)로 측정되었다. 편집 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다.
도 12a는 표적 핵산의 플랩에 대한 프라이머 결합 부위(PBS)의 혼성화의 속도를 가속화하기 위해 벨크로 영역이 없는(왼쪽) 또는 있는(중간 및 오른쪽) gRNA 작제물을 예시한다. V1 배열에서 벨크로 영역은 gRNA의 5' 말단 또는 그 근처에 위치될 수 있고 프라이머 결합 부위의 gRNA 5'의 영역("벨크로 V1", 중간)에 혼성화할 수 있다. V2 배열에서 벨크로 영역은 프라이머 결합 부위의 3'에 위치될 수 있고 gRNA의 5' 말단 또는 그 근처의 영역("벨크로 V2," 오른쪽)에 혼성화할 수 있다.
도 12b도 12a에 제공된 gRNA 작제물의 예측된 3-차원 구조를 예시한다. 벨크로 영역을 결하는 gRNA는 왼쪽에 도시되어 있다. 벨크로 V1 영역 또는 벨크로 V2 영역을 포함하는 gRNA는 각각 중간 및 오른쪽 패널에 표시된다.
도 12c는 129 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위 및 20 뉴클레오티드 벨크로 영역을 갖는 gRNA의 편집 효율을 나타낸다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 편집 효율은 원래의 gRNA("원래의 코딩") 또는 2차 구조를 제거하기 위해 gRNA 연장의 RT 주형 영역에서 침묵 돌연변이로 재코딩된 gRNA("재코딩됨")에 대해 비교되었다.
도 12d는 벨크로 서열의 상이한 길이를 갖는 gRNA의 편집 효율을 나타낸다. 각각의 gRNA는, 왼쪽 상의 개략도에 도시된 바와 같이, 5'에서 3'의 순서로 RT 주형, 프라이머 결합 부위, 벨크로 영역을 함유했다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. gRNA는 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위를 가졌다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다.
도 13a는 벨크로 영역과 2nd 가닥 프라이머를 포함하는 pegRNA 및 스티치 gRNA의 개략도(상단) 및 스티치 gRNA를 이용한 게놈 편집의 방법(하단)을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산 가닥에 흠집을 낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합화한다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화한다. 4-200 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 역할을 한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합화한다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안으로 통합될 수 있다.
도 13b는 다양한 길이의 것이고 닉킹 부위로부터 다양한 거리에서 혼성화하는 gRNA 제2 가닥 프라이머(SSP)의 편집 효율을 나타낸다. 흠집에서 6, 36 또는 55 뉴클레오티드에 위치된 제2 가닥 프라이머 20, 40 또는 60 뉴클레오티드(nt) 길이가 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다.
도 13c는 벨크로 영역 또는 제2 가닥 프라이머가 없는("벨크로 없음, SSP 없음"), 19 뉴클레오티드 벨크로 영역이 있는("19 nt 벨크로"), 또는 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머 둘 모두가 있는("19 nt 벨크로, 20 nt SSP") gRNA의 편집 효율을 나타낸다.
도 14a는 mlvRT 역전사효소에서 돌연변이에 대한 스크리닝 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, 또는 L671P 단일 점 돌연변이를 함유하는 mlvRT 작제물(각각 서열번호: 41 - 서열번호: 70)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 1 뉴클레오티드 갭, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균±일 표준 편차로서 도시된다.
도 14b는 mlvRT 역전사효소에서 돌연변이의 조합에 대한 스크리닝 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 T197A 및 D653N; T197A 및 T664N; T197A 및 L671P; T197A, D653N, T664N 및 L671P; 또는 P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P를 함유하는 mlvRT 작제물(각각 서열번호: 71 - 서열번호: 75)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15a는 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 예시한다. CDK1을 결하는 비-분열 세포에서, 인산화되지 않은 SAMHD1은 dNTP를 절단하여 세포에서 이용가능한 dNTP를 감소시킨다. 분열하는 세포에서 CDK1은 SAMHD1을 인산화하여 SAMHD1이 dNTP를 절단하는 것을 방지하고 세포에서 dNTP의 증가된 이용가능성을 초래한다. SAMHD1에서 단일 점 돌연변이(T592A)는 CDK1에 의한 SAMHD1의 인산화를 방지하여, 구성적으로 활성인 SAMHD1과 세포에서 dNTP의 낮은 이용가능성을 초래한다. T592A 돌연변이 SAMHD1을 사용하여 도 15b, 도 15d 도 15e에 도시된 검정에서 낮은 dNTP 환경을 유도하였다. Vpx의 추가는 SAMHD1을 억제하여 세포에서 dNTP의 증가된 이용가능성을 초래한다.
도 15b는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 Q221R; V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 76 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15c는 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 77 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15d는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15e는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15f는 RW2I로 VPXRH2-1 및 SAMHD1(T592A)의 공동발현이 VPX 없이 SAMHD1(T592A)을 발현함에 의해 야기된 편집 효율에서의 감소를 완전히 역전시켰다는 것을 나타낸다.
도 16은 닉킹 활성을 위해 변형되고 류신 지퍼를 통해 역전사효소에 연결된 Cas9 작제물의 편집 효율을 나타낸다. S. 피오게네스 Cas9("SpCas9") 작제물은 Cas9 닉카제(nCas9)를 생성하는 H840A 돌연변이를 함유했다. 시스테인 잔기를 D1079C, S1173C 또는 D1180C에서 Cas9 닉카제 안으로 도입하여 엑스테인-인테인 융합체로서의 발현을 위해 Cas9를 분할 인테인 Cas9(iCas9)로 분할할 수 있었다. H840A 및 D1079C(류신 지퍼를 갖는 서열번호: 85), H840A 및 S1173C(류신 지퍼를 갖는 서열번호: 86), 또는 H840A 및 D1180C(류신 지퍼를 갖는 서열번호: 87) 점 돌연변이를 함유하고 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 류신 지퍼 Cas9 작제물이 시험되었다. H840A 돌연변이를 함유하지만 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 부가 시스테인(류신 지퍼를 갖는 서열번호: 84)이 없는 Cas9 닉카제가 대조군으로 사용되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17a는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)에 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17b는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)과 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 18은 제2 가닥 프라이머의 바로 3'인, gRNA의 3' 말단에서 HDV 리보자임(왼쪽 막대) 또는 tRNA(오른쪽 막대)를 포함하는 gRNA의 존재에서 류신 지퍼 Cas9-RT 작제물의 편집 효율을 나타낸다. 류신 지퍼 Cas9-RT 작제물은 nCas9-LZ1(서열번호: 1) 및 LZ2-mlvRT5M(서열번호: 2)로 발현되었고, 류신 지퍼를 통해 연결되었다. tRNA는 서열번호: 94(GGTCCCATGGTGTAATGGTTAGCACTCTGGACTTTGAATCCAGCGATCCGAGTTCAAATCTCGGTGGGACCT)에 상응하는 서열을 가졌다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역, 20 뉴클레오티드 제2 가닥 프라이머, 및 제2 가닥 프라이머의 HDV 리보자임 또는 tRNA 3'을 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 19a는 AAV에 적합하거나 AAV 내에 적합하지 않은 일부 정밀 편집 작제물의 능력을 나타낸다. 프라임 편집기 2(PE2)와 분할 PE2 둘 모두는 몰로니 백혈병 바이러스 역전사효소 펜타뮤턴트(mlvRT5M)에 융합된 닉킹 Cas9(nCas9)를 이용할 수 있으며, 이는 AAV 내에 패키징되기에는 너무 큰 ORF에 의해 인코딩될 수 있다. AAV를 갖는 nCas9 및 mlvRT5M을 전달할 수 있는 아키텍처가 개발되었으며, 각각은 AAV의 운반 용량보다 각각 작은 2개의 ORF에 의해 인코딩되었다. 리라이터 a1(RWa1)은 nCas9, mlvRT5M에 융합된 MS2 코트 단백질(MCP) 펩티드 및 MCP 펩티드가 특이적으로 결합할 수 있는 MS2 헤어핀을 포함하는 gRNA를 활용할 수 있다. RWb1은 이종이량체화 류신 지퍼를 활용하여 nCas9 및 mlvRT5M을 공동국소화할 수 있다. RWc1은 AAV에 각각 맞는 ORF를 사용하여 nCas9-mlvRT5M 단백질을 생성하기 위해 Npu 인테인으로 분할될 수 있는 새로운 돌연변이체 nCas9를 활용할 수 있다. RWd1은 조작된 임의의 모집 구성요소 없이 nCas9 및 mlvRT5M을 공동발현할 수 있다.
도 19b는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 인테인 촉매작용 및 mlvRT5M을 제공하기 위한 시스테인 치환을 포함하는 nCas9의 C-말단 단편에 융합된 Npu C-말단 인테인과 쌍을 이루는 Npu N-말단 인테인에 융합된 nCas9의 N-말단 단편의 패널을 테스트한 결과 잔기 1172와 1173(nCas9(1-1172)-NpuN 및 nCas9(1173-1368; S1173C)-mlvRT5M) 사이의 Ser1173Cys nCas9-mlvRT5M 돌연변이체를 분할하는 것이 PE2보다 적어도 약 2-배 더 큰 편집 효율을 초래했다는 것이 밝혀졌다.
도 19c는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 표준 gRNA 스캐폴드로 RWa1, RWb1 및 RWc1을 동시형질감염하면 모두 40% 초과의 편집 효율을 초래했다. 40% 초과의 편집 효율은 RTT-PBS-MS2 gRNA 확장 아키텍처와 쌍을 이루는 RW1M과 50% 초과의 편집을 달성하는 RW1L 둘 모두에서 달성되었다. MS2 헤어핀을 함유하지 않는 gRNA의 nCas9 및 MCP-mlvRT5M 작제물과의 공동발현은 MS2 헤어핀(RWd1)을 포함하는 gRNA와 비교하여 대략적으로 동일한 편집 효율을 초래했다.
도 19d는 일부 편집 작제물로 형질도입된 세포에서의 GFP 발현을 나타낸다. 각 바이러스에 대해 2.8 x 105의 MOI에서 2개의 별도 AAV2 작제물로 패키징된 RWc1을 갖는 BFP를 발현하는 HEK293 세포를 형질도입하는 것은 74.8% GFP+ 세포를 초래했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다.
도 20a는 효소 및 가이드 RNA의 일부 공간적 배향을 나타낸다. RTT의 역전사는 일부 경우에 PBS가 게놈 플랩에 혼성화한 후에만 개시될 수 있다. RTT의 3' 영역과 혼성화하는 RTT의 서열 5'(GPS V1) 또는 RTT의 5' 부분과 혼성화하는 PBS의 서열 3'(GPS V2)을 삽입하면 PBS가 게놈 플랩에 더 가깝게 근접되도록 재배향할 수 있다.
도 20b는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. RWb1 및 107-nt RTT를 포함하는 가이드 RNA는 14% GFP+ 세포를 초래했으며, 이는 더 짧은 13-nt RTT를 사용하여 달성된 38%보다 현저하게 낮다. 20-nt GPS V2(RWb2)를 추가하면 편집 효율이 ~27%까지 증가했다.
도 20c는 일부 편집 작제물을 포함하는 세포에서 GFP 발현을 나타낸다. 129-nt 주형을 사용하여 흠집의 부위로부터 3-nt 돌연변이 65-nt를 정착하면 GPS V2를 합체함에 의해 4-배 증가되었다.
도 21은 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 벨크로와 SSP가 동시적으로 사용될 수 있어, ~41% 편집을 초래할 수 있다(리라이터 3.2). SSP가 제공하는 효율에서의 증가는 SSP의 말단 3-nt가 제1 합성 가닥에 상보적이지 않을 때 폐지되었다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다. * = P < 0.05; 양측 스튜던트스 t-테스트.
도 22는 SSP 후 인간 글루타메이트 tRNA를 합체하는 것이 SSP에 따른 HDV 리보자임과 비교하여 편집 효율에서 통계적으로 유의한 증가를 유도함을 나타낸다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다. * = P < 0.05; 양측 스튜던트스 t-테스트.
도 23은 SAMHD1p-와 리라이터 3.0의 공동발현이 흠집으로부터 돌연변이 65-nt를 정착하는 효율성을 극적으로 감소시켰음을 나타낸다. VPXROD의 추가 공동발현은 편집 효율을 SAMHD1p-의 부재에서 관찰된 효율의 78%로 복원했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플의 평균 ± 1 표준 편차이다.
도 24는 세포에서 함께 발현된 다양한 편집 구성요소의 편집 효율을 나타내는 그래프이다.
도 25a는 리라이터 작제물을 사용한 편집 효율을 나타내는 차트이다.
도 25b 25c는 가이드 RNA를 이용하여 수행된 일부 실험에 대한 정보를 예시한다.
도 25d는 2298T>C 돌연변이를 정착하기 위해 HEK293T를 RW2I 및 gRNA로 형질감염시키는 것이 인 실리코-예측된 표적-외 부위에서 스페이서의 상위 5개에서 돌연변이를 도입하지 않았음을 예시한다.
도 25e는 폴리A 트랙을 파괴하는 침묵 2307A>G 돌연변이를 포함하도록 RTT를 변형하는 것이 아데닌의 바람직하지 않은 삽입을 제거했음을 예시한다.
도 25f는 추가 RTT 길이를 스크리닝하는 것이 편집 효율을 41.6%로 증가시켰음을 예시한다.
도 25g는 스페이서의 PAM 서열을 파괴하는 RTT에서 침묵 돌연변이를 인코딩하는 것이 2298T>C 돌연변이를 정착하는 효율을 배가시켰음을 예시한다.
도 26은 가이드 핵산에서 벨크로(GPS로도 지칭됨)의 예시적인 구성을 나타낸다.
도 27은 일부 편집 시스템의 구성요소를 나타낸다.
도 28은 일부 편집 시스템 구성요소를 사용하여 수득된 편집 효율을 나타낸다.
도 29a-29f는 일부 편집 시스템의 사용 후 핵염기의 % 판독을 나타낸다.
도 30은 일부 편집 시스템의 구성요소를 나타낸다.
도 31a는 본 명세서에 기재된 일부 편집 구성요소로 처리 후 돌연변이를 갖는 판독의 %를 나타낸다.
도 31b는 야생형 세포에서 돌연변이를 갖는 판독의 %를 나타낸다.
도 32는 이중 가이드 시스템을 나타낸다.
도 33은 이중 가이드 시스템으로 편집 효율을 나타낸다.
CRISPR-Cas 시스템을 사용한 정확하고 효율적인 게놈 편집을 위한 방법 및 조성물이 본 명세서에 개시되어 있다. 데아미나제에 연결된 Cas9 닉카제(nCas9)를 포함하는 Cas9-기반 염기 편집기는 전이 돌연변이(예를 들어, A에서 G로 또는 C에서 T로)를 수행하는 것으로 제한될 수 있다. 역전사효소(RT)(예를 들어 몰로니 백혈병 바이러스 RT)에 연결된 nCas9를 포함하는 다른 Cas9-기반 편집기(예를 들어 "프라임 편집기")는 작은 삽입, 결실 또는 단일 뉴클레오티드 변경으로 제한될 수 있다. Cas 닉카제 및 역전사효소 작제물, 조작된 가이드 핵산, 및 게놈 편집의 개선된 효율, 다용도성, 정밀도 및 전달성을 위한 이의 사용 방법이 본 명세서에서 제공된다.
본 명세서에 기재된 방법 및 조성물은 Cas9 및 RT를 분할, 이량체화 또는 공동발현하는 것을 포함할 수 있다. Cas9 및 RT의 분할, 이량체화 또는 공동발현하는 것은 AAV 패키징을 가능하게 할 수 있다. Cas9 및 RT의 분할, 이량체화 또는 공동발현하는 것은 편집 효율을 증가시킬 수 있다.
AAV 전달가능한 정밀 편집 구성요소가 본 명세서에 기재되어 있다. 일부 실시형태는 Cas9 구성요소 및 RT 구성요소를 전달하는 AAV 입자를 포함한다. AAV와 함께 Cas+RT 시스템을 전달하기 위한 다양한 예가 제공된다. 제공된 예는 전형적인 AAV 운반 용량(예를 들어 약 4.5kb) 내에 맞게 정밀 편집 구성요소를 얻는 이전의 어려움을 극복할 수 있다.
또한 편집 효율을 향상시키는 점 돌연변이 또는 삽입 돌연변이와 같은 돌연변이가 제공된다. 예를 들어 Cas 닉카제 또는 RT(예를 들어 점 돌연변이 또는 삽입 돌연변이)가 포함된다. 일부 실시형태는 아미노산 돌연변이로 게놈 편집을 위한 mlvRT를 포함한다.
닉킹 Cas9 및 역전사효소 효소
Cas 닉카제를 포함하는 조성물이 본 명세서에서 제공된다. 역전사효소를 포함하는 조성물이 본 명세서에서 제공된다. Cas 닉카제 및 역전사효소를 포함하는 조성물이 본 명세서에서 제공된다. Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함될 수 있다. Cas 닉카제와 역전사효소는 완전하게 별도의 폴리펩티드 사슬에 있을 수 있다. 일부 실시형태는 Cas 닉카제의 기능적 단편을 포함한다. 일부 실시형태는 역전사효소의 기능적 단편을 포함한다.
Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성할 수 있다. Cas-역전사효소 이종이량체는 제1 이종이량체 도메인을 포함할 수 있다. 제1 이종이량체 도메인은 Cas 닉카제에 융합될 수 있다. Cas-역전사효소 이종이량체는 제2 이종이량체 도메인을 포함할 수 있다. 제2 이종이량체 도메인은 역전사효소에 융합될 수 있다. 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합할 수 있다. 이 결합은 Cas-역전사효소 이종이량체를 형성할 수 있다. 제1 이종이량체 도메인은 류신 지퍼를 포함할 수 있다. 제2 이종이량체 도메인은 류신 지퍼를 포함할 수 있다. 제1 또는 제2 이종이량체 도메인은 류신 지퍼 이외의 이종이량체 도메인, 예를 들어 본 명세서에 기재된 바와 같은 SpyCatcher 또는 SpyTag 모이어티를 포함할 수 있다.
Cas 프로그램가능한 뉴클레아제를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제를 포함할 수 있다. Cas 닉카제를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas 프로그램가능한 뉴클레아제는 Cas 닉카제를 포함할 수 있다. Cas 닉카제는 Cas9 닉카제(nCas9)를 포함할 수 있다. Cas9 프로그램가능한 뉴클레아제는 nCas9를 포함할 수 있다. Cas 닉카제는 Cas9 뉴클레아제 도메인을 돌연변이시킴에 의해 생성될 수 있다. Cas 닉카제는 이중-가닥 파손 이외의 단일-가닥을 생성할 수 있다.
역전사효소(RT)를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas 닉카제 및 RT를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas9 닉카제 및 RT를 포함하는 조작된 작제물이 본 명세서에서 제공된다. nCas9는 표적 핵산의 표적 부위에 단일 가닥 파손(SSB)을 도입할 수 있다. 역전사효소는 표적 부위에 삽입되는 서열의 역전사를 촉매할 수 있다. 일부 실시형태에서, nCas9-RT 작제물은 nCas9-RT 작제물에 융합될 수 있다. 융합된 nCas9-RT 작제물은 단일 폴리펩티드 사슬에 nCas9 및 역전사효소를 포함할 수 있다. 일부 실시형태에서, nCas9-RT 작제물은 분할 nCas9-RT 작제물일 수 있다. 분할 nCas9-RT 작제물은 제1 폴리펩티드 사슬에 nCas9 및 제2 폴리펩티드 사슬에 역전사효소를 포함할 수 있다. nCas9 및 분할 nCas9-RT 작제물의 역전사효소는 공동-발현될 때 이종이량체를 형성할 수 있다. 일부 실시형태에서, 제1 이량체화 도메인은 nCas9의 N-말단에 위치될 수 있다. 일부 실시형태에서, 제1 이량체화 도메인과 이량체화하는 제2 이량체화 도메인은 역전사효소의 C-말단에 위치될 수 있다. 일부 실시형태에서, 제1 이량체화 도메인은 nCas9의 C-말단에 위치될 수 있다. 일부 실시형태에서, 제1 이량체화 도메인과 이량체화하는 제2 이량체화 도메인은 역전사효소의 N-말단에 위치될 수 있다. 제1 이량체화 도메인은 류신 지퍼, FKBP, FRB, 칼시뉴린 A, CyP-Fas, GyrB, GAI, GID1, SNAP 태그, Halo 태그, Bcl-xL, Fab, 또는 LOV 도메인을 포함할 수 있다. 제2 이량체화 도메인은 류신 지퍼, FKBP, FRB, 칼시뉴린 A, CyP-Fas, GyrB, GAI, GID1, SNAP 태그, Halo 태그, Bcl-xL, Fab, 또는 LOV 도메인을 포함할 수 있다. 이량체화는 유도되거나 자발적일 수 있다. 이량체화는 화학적으로 또는 광학적으로 유도될 수 있다. 서열번호: 1은 C-말단에 류신 지퍼를 포함하는 nCas9의 예를 제공한다. 서열번호: 2는 N-말단에 류신 지퍼를 포함하는 역전사효소의 예를 제공한다.
일부 실시형태에서, 본 개시내용의 작제물은 핵 국소화 신호(NLS)를 포함할 수 있다. 본 명세서에 기재된 조성물은 Cas 닉카제에 융합된 핵 국소화 신호를 포함할 수 있다. 일부 실시형태에서, NLS에 융합된 Cas 닉카제는 서열번호: 138에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 본 명세서에 기재된 조성물은 RT에 융합된 핵 국소화 신호를 포함할 수 있다. 일부 실시형태에서, NLS에 융합된 RT는 서열번호: 95에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다.
역전사효소는 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함할 수 있다. 비-장 말단 반복 역전사성 요소는 Cas 닉카제의 일부에 융합될 수 있다. 역전사효소는 박테리아 그룹 II 인트론으로부터의 서열을 포함할 수 있다. 박테리아 그룹 II 인트론은 Cas 닉카제의 일부에 융합될 수 있다. 역전사효소는 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함할 수 있다. 레트로바이러스 gag-pol 폴리단백질로부터 도메인은 Cas 닉카제의 일부에 융합될 수 있다.
이량체화는 SpyTag/SpyCatcher 또는 관련된 시스템을 사용하여 달성될 수 있다. 예를 들어, RT는 SpyTag 모이어티에 접합될 수 있고 Cas 닉카제는 SpyCatcher 모이어티에 접합될 수 있다. 대안적으로, Cas 닉카제는 SpyTag 모이어티에 접합될 수 있고, RT는 SpyCatcher 모이어티에 접합될 수 있다. SpyTag/SpyCatcher 시스템을 사용한 이량체화는 이량체화된 분자 사이의 공유 결합을 포함할 수 있다(예를 들어 Cas 닉카제는 SpyTag 및 SpyCatcher 모이어티를 통해 RT에 공유적으로 접합될 수 있다. SpyTag 또는 SpyCatcher 모이어티에 접합된 Cas 닉카제는 제1 AAV에 제공될 수 있다. SpyCatcher 또는 SpyTag 모이어티에 접합된 RT는 제2 AAV에 제공될 수 있다.
다양한 역전사효소는 본 개시내용의 조성물 및 방법과 일치한다. 본 명세서에 개시된 역전사효소는 지오바실러스 스테레오테르모필루스 RT(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레 RT(ErRT, 서열번호: 4), 마라톤 RT(서열번호: 5), BmR2RT(서열번호: 6), R2 폴리단백질로부터 아미노산 116-1016(R2(116-1016), 서열번호: 7), BmR2en-RT(서열번호: 8), humanL1RT(서열번호: 9), humanL1en-RT(서열번호: 10), murineL1RT(서열번호: 11), ltrA(서열번호: 12), mlvRT5M(서열번호: 13), mlvRT5M(서열번호: 40), mlvRT(서열번호: 14), XMRV3VP35RT(서열번호: 15), galvRT(서열번호: 16), sfvRT(서열번호: 17), foamvRT(서열번호: 18), HIVP66(서열번호: 19) , HIVP51(서열번호: 20), rsvAlpha(서열번호: 21), 또는 rsvBeta(서열번호: 22)일 수 있다. 본 개시내용의 전사효소는 N-말단 메티오닌을 포함할 수 있거나, 본 개시내용의 전사효소는 N-말단 메티오닌을 결할 수 있다. 예를 들어, 역전사효소는 N-말단 메티오닌이 제거된 서열번호: 3 - 서열번호: 6, 서열번호: 8 - 서열번호: 12, 서열번호: 17, 서열번호: 18, 또는 서열번호: 40 - 서열번호: 80 중 임의의 하나에 상응하는 서열을 가질 수 있다. 다른 예에서, 역전사효소는 메티오닌이 N-말단에 부가된 서열번호: 7, 서열번호: 13 - 서열번호: 16, 또는 서열번호: 19 - 서열번호: 22 중 임의의 하나에 상응하는 서열을 가질 수 있다. 역전사효소는 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80 또는 이의 단편 중 임의의 하나에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 100% 서열 동일성, 또는 그 사이의 임의의 백분율을 갖는 서열을 포함할 수 있다.
서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80, 그 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는 역전사효소를 포함하는 조성물이 본 명세서에 개시된다. 역전사효소 또는 이의 단편은 Cas 닉카제에 융합될 수 있다. 일부 실시형태는 Cas 닉카제에 융합될 수 있는 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물을 포함한다. 일부 실시형태는 Cas 닉카제에 융합될 수 있는 박테리아 그룹 II 인트론으로부터의 서열을 포함하는 역전사효소를 포함한다. 일부 실시형태는 Cas 닉카제에 융합될 수 있는 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는 역전사효소를 포함한다. 역전사효소는 절삭될 수 있다.
제한된 dNTP 조건에서 게놈 편집 효율을 최적화하는 방법이 개시된다. 방법은 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체로 게놈 편집을 수행하는 것을 포함할 수 있다. mlvRT와 같은 본 명세서에 기재된 RT는 점 돌연변이와 같은 돌연변이를 포함할 수 있다. 점 돌연변이는 역전사효소의 위치 221에 있을 수 있다. mlvRT 또는 이의 변이체는 위치 221에서 점 돌연변이를 포함할 수 있다. 위치 221에서 점 돌연변이는 Q221R을 포함할 수 있다. 점 돌연변이는 역전사효소의 위치 223에 있을 수 있다. mlvRT 또는 이의 변이체는 위치 223에서 점 돌연변이를 포함할 수 있다. 위치 223에서 점 돌연변이는 V223A를 포함할 수 있다. 위치 223에서의 점 돌연변이는 V223M을 포함할 수 있다.
일부 실시형태는 낮은 dNTP 농도에서 그 촉매 효율을 증가시키도록 변형된 몰로니 백혈병 바이러스 역전사효소(mlvRT)로 게놈 편집을 수행하는 것을 포함하는, 게놈 편집 효율을 최적화하는 방법을 포함한다. 예를 들어, mvRT는 dNTP에 대한 그 Km을 줄이기 위해 변형될 수 있다.
본 개시내용의 역전사효소는 하나 이상의 돌연변이를 포함할 수 있다. 예를 들어, 역전사효소는 참조 역전사효소 서열(예를 들어, 서열번호: 81)에 비해 하나 이상의 돌연변이를 포함할 수 있다. 일부 실시형태에서, 역전사효소에서 점 돌연변이는 점 돌연변이를 결하는 참조 서열에 비해 Cas9-RT 작제물의 편집 효율을 증가시킬 수 있다. 역전사효소는 서열번호: 81에 비해 D200N, l603W, T330P, T306K, W313F, Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, L671P, Q221R, V223A, V223M 또는 이의 조합에 상응하는 하나 이상의 돌연변이를 포함할 수 있다. 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, L671, D524, P51, 또는 S67에서 하나 이상의 돌연변이(예를 들어, 점 돌연변이)를 포함할 수 있다. 역전사효소는 Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, D524A, P51L, 또는 S67R에 상응하는 하나 이상의 돌연변이(예를 들어, 점 돌연변이)를 포함할 수 있다. 하나 이상의 돌연변이는 서열번호: 81 또는 본 명세서에서 확인된 또 다른 서열과 관련될 수 있다. 하나 이상의 돌연변이는 서열번호: 81 또는 본 명세서에서 확인된 또 다른 서열에 아미노산 서열과 관련하여 적어도 75%, 적어도 80% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 동일 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 동일하거나 적어도 99% 동일할 수 있다. 일부 실시형태에서, 역전사효소는 D200N, 1603W, T330P, T306K, 및 W313F(예를 들어, 서열번호: 13 또는 서열번호: 40)에 상응하는 돌연변이를 포함할 수 있다. 일부 실시형태에서, 역전사효소는 D200N, 1603W, T330P, T306K, 및 W313F에 상응하는 돌연변이 및 하나 이상의 부가 돌연변이(예를 들어, 서열번호: 41 - 서열번호: 80)를 포함할 수 있다.
RT는 도 14b에 포함된 하나 이상의 돌연변이를 포함할 수 있다. 예를 들어, RT는 위치 51, 67, 84, 139, 197, 204, 435, 524, 653, 664, 또는 671, 또는 이의 조합에서의 돌연변이를 포함할 수 있다. RT는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524, 또는 이의 조합에서의 돌연변이를 포함할 수 있다. RT는 위치 51, 67, 84, 139, 197, 204, 435, 524, 653, 664, 및 671에서의 돌연변이를 포함할 수 있다. 돌연변이는 적어도 하나의 점 돌연변이를 포함할 수 있다. 적어도 하나의 점 돌연변이는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A, 또는 이의 조합에 있을 수 있다. RT는 위치 51에서의 돌연변이를 포함할 수 있다. 위치 51에서의 돌연변이는 P51L을 포함할 수 있다. RT는 위치 67에서의 돌연변이를 포함할 수 있다. 위치 67에서의 돌연변이는 S67R을 포함할 수 있다. RT는 위치 84에서의 돌연변이를 포함할 수 있다. 위치 84에서의 돌연변이는 Q84A를 포함할 수 있다. RT는 위치 139에서의 돌연변이를 포함할 수 있다. 위치 139에서의 돌연변이는 L139P를 포함할 수 있다. RT는 위치 197에서의 돌연변이를 포함할 수 있다. 위치 197에서의 돌연변이는 T197A를 포함할 수 있다. RT는 위치 204에서의 돌연변이를 포함할 수 있다. 위치 204에서의 돌연변이는 H204R을 포함할 수 있다. RT는 위치 435에서의 돌연변이를 포함할 수 있다. 위치 435에서의 돌연변이는 L435G를 포함할 수 있다. RT는 위치 524에서의 돌연변이를 포함할 수 있다. 위치 524에서의 돌연변이는 D524A를 포함할 수 있다. RT는 위치 653에서의 돌연변이를 포함할 수 있다. 위치 653에서의 돌연변이는 D653N을 포함할 수 있다. RT는 위치 664에서의 돌연변이를 포함할 수 있다. 위치 664에서의 돌연변이는 T664N을 포함할 수 있다. RT는 위치 671에서의 돌연변이를 포함할 수 있다. 위치 671에서의 돌연변이는 L671P를 포함할 수 있다. RT는 예를 들어, 상기 돌연변이의 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10, 또는 초과를 포함할 수 있다. RT는 mlvRT를 포함할 수 있다. RT는 mlvRT5M을 포함할 수 있다. 하나 이상의 돌연변이를 갖는 RT는 본 명세서에 제공된 RT 서열과 관련하여 하나 이상의 돌연변이를 포함할 수 있다. 하나 이상의 돌연변이는 하나 이상의 돌연변이를 갖지 않는 조성물과 관련하여 본 명세서에 기재된 조성물의 편집 효율을 증가시킬 수 있다. 돌연변이는 삽입 돌연변이이거나 이를 포함할 수 있다. 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524, 또는 이의 조합의 바로 상류(예를 들어, 아미노 말단 방향으로) 삽입 돌연변이를 포함한다. 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524 또는 이의 조합의 바로 하류(예를 들어, 카르복시 말단 방향으로) 삽입 돌연변이를 포함한다. 삽입 돌연변이는 점 돌연변이에 대해 본 명세서에 개시된 아미노산의 삽입을 포함할 수 있으며, 여기서 점 돌연변이는 아미노산에 대한 것이다.
일부 실시형태에서, 역전사효소는 위치 P51, S67, Q84, L139, T197, D200, H204, Q221, V223, T306, W313, T330, L435, D524, D653, T6164, 또는 L600, 또는 이의 조합에서 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524, 또는 이의 조합에서 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 위치 Q84, L139, Q221, V223, T664, 또는 L671, 또는 이의 조합에서 점 돌연변이를 갖는다.
일부 실시형태에서, 역전사효소는 P51L, S67R, Q84A, L139P, T197A, D200N, H204R, Q221R, V223A, V223M, T306K, W313F, T330P, L435G, D524A, D653N, T664N, L671P, 또는 L603W, 또는 이의 조합을 포함하는 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A, 또는 이의 조합을 포함하는 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A, 또는 이의 조합을 포함하는 점 돌연변이를 갖는다.
본 개시내용의 역전사효소는 루프 영역(예를 들어, 2a 루프 또는 3a 루프)을 포함할 수 있다. 본 개시내용의 역전사효소는 20 이상, 40 이상, 45 이상, 50 이상, 60 이상, 81 이상, 100 이상, 500 이상, 1000 이상, 2000 이상, 3000 이상, 4000 이상, 5000 이상, 6000 이상, 7000 이상, 8000 이상, 9000 이상, 또는 10,000 이상 뉴클레오티드의 편집 서열을 전사할 수 있다. 본 개시내용의 역전사효소는 최대 약 20, 최대 약 40, 최대 약 45, 최대 약 50, 최대 약 60, 최대 약 81, 최대 약 100, 최대 약 500, 최대 약 1000, 최대 약 2000, 최대 약 3000, 최대 약 4000, 최대 약 5000, 최대 약 6000, 최대 약 7000, 최대 약 8000, 최대 약 9000, 또는 최대 약 10,000 뉴클레오티드의 편집 서열을 전사할 수 있다. 본 개시내용의 역전사효소는 20 내지 10,000 뉴클레오티드의 편집 서열을 전사할 수 있다.
본 개시내용의 역전사효소는 증가된 연속성을 가질 수 있다. 연속성은 단일 결합 이벤트에서 역전사효소에 의해 촉매되는 포스포디에스테르 결합의 수에 의해 결정될 수 있다. 연속성은 천연 역전사효소와 비교될 수 있다. 역전사효소는 mlvRT와 비교하여 증가된 연속성을 포함할 수 있다. 증가된 연속성을 갖는 역전사효소는 표적 핵산의 표적 부위에서 더 긴 서열을 편집할 수 있다. 예를 들어, 증가된 연속성을 갖는 역전사효소는 프로그램가능한 뉴클레아제의 편집 윈도우 길이를 증가시킬 수 있다. 역전사효소는 mlvRT에 비해 표적 서열에서 더 긴 윈도우 길이를 편집할 수 있다. 증가된 연속성을 갖는 역전사효소는 삽입 서열을 포함할 수 있다. 일부 실시형태에서, 연속성을 증가시키는 삽입은 도메인 2와 3 사이 또는 도메인 3과 4 사이의 역전사효소 안으로 삽입될 수 있다. 증가된 연속성을 갖는 역전사효소는 결실을 포함할 수 있다. 예를 들어, 증가된 연속성을 갖는 역전사효소는 RNase 도메인을 결하거나 연결 도메인을 결할 수 있다. 증가된 연속성을 갖는 역전사효소는 단일 결합 이벤트에서 20 이상, 40 이상, 45 이상, 50 이상, 60 이상, 81 이상, 100 이상, 500 이상, 1000 이상, 2000 이상, 3000 이상, 4000 이상, 5000 이상, 6000 이상, 7000 이상, 8000 이상, 9000 이상, 또는 10,000 이상 포스포디에스테르 결합을 촉매할 수 있다. 증가된 연속성을 갖는 역전사효소는 단일 결합 이벤트에서 최대 약 20, 최대 약 40, 최대 약 45, 최대 약 50, 최대 약 60, 최대 약 81, 최대 약 100, 최대 약 500, 최대 약 1000, 최대 약 2000, 최대 약 3000, 최대 약 4000, 최대 약 5000, 최대 약 6000, 최대 약 7000, 최대 약 8000, 최대 약 9000, 또는 최대 10,000 포스포디에스테르 결합을 촉매할 수 있다.
일부 실시형태에서, 역전사효소는 mlvRT보다 표적 핵산의 표적 부위에서 더 긴 서열을 편집한다. 역전사효소는 프로그램가능한 뉴클레아제의 편집 윈도우 길이를 증가시킬 수 있다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 삽입 서열을 포함할 수 있다. 일부 실시형태에서, 삽입은 도메인 2와 3 사이 또는 도메인 3과 4 사이의 표적 부위에서 더 긴 서열을 편집하는 역전사효소 안으로 삽입된다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 결실을 포함할 수 있다. 예를 들어, 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 RNase 도메인을 결할 수 있거나 연결 도메인을 결할 수 있다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 단일 결합 이벤트에서 20 이상, 40 이상, 45 이상, 50 이상, 60 이상, 81 이상, 100 이상, 500 이상, 1000 이상, 2000 이상, 3000 이상, 4000 이상, 5000 이상, 6000 이상, 7000 이상, 8000 이상, 9000 이상, 또는 10,000 이상 포스포디에스테르 결합을 촉매할 수 있다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 단일 결합 이벤트에서 최대 약 20, 최대 약 40, 최대 약 45, 최대 약 50, 최대 약 60, 최대 약 81, 최대 약 100, 최대 약 500, 최대 약 1000, 최대 약 2000, 최대 약 3000, 최대 약 4000, 최대 약 5000, 최대 약 6000, 최대 약 7000, 최대 약 8000, 최대 약 9000, 또는 최대 10,000 포스포디에스테르 결합을 촉매할 수 있다. 일부 실시형태에서, 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 또한 본 명세서에 기재된 바와 같이 증가된 연속성을 갖는다.
본 발명의 역전사효소는 작은 역전사효소일 수 있다. 작은 역전사효소는 더 큰 역전사효소와 비교하여 세포로의 개선된 전달을 가질 수 있다. 역전사효소는 mlvRT와 비교하여 세포로의 개선된 전달을 포함할 수 있다. 작은 역전사효소는 더 큰 역전사효소와 비교하여 세포에서 개선된 발현을 가질 수 있다. 작은 역전사효소는 약 400 이하, 약 420 이하, 약 427 이하, 약 440 이하, 약 450 이하, 약 500 이하, 약 550 이하, 약 560 이하, 약 599 이하, 약 600 이하, 약 650 이하, 약 677 이하, 약 682 이하, 약 700 이하, 약 750 이하, 약 761 이하, 약 762 이하, 약 800 이하, 약 850 이하, 약 900 이하, 약 901 이하, 약 950 이하, 약 1000 이하, 약 1100 이하, 약 1114 이하, 약 1200 이하, 약 1275 이하, 약 1281 이하, 또는 약 1300 이하의 아미노산 잔기를 포함할 수 있다. 본 개시내용의 작제물은 작은 역전사효소, 이량체화 영역, 국소화 영역, 또는 이의 조합을 포함할 수 있다. 작은 역전사효소는 증가된 연속성을 가질 수 있거나, 표적 부위에서 더 긴 서열을 편집할 수 있거나 이의 조합을 가질 수 있다.
본 개시내용의 역전사효소는 몰로니 백혈병 바이러스 역전사효소와 비교하여 감소된 면역원성을 가질 수 있다. 감소된 면역원성을 갖는 역전사효소는 또한 작은 역전사효소일 수 있고, 증가된 연속성을 가질 수 있고, 표적 부위에서 더 긴 서열을 편집하거나, 이의 임의의 조합일 수 있다.
Cas 닉카제 또는 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물이 본 명세서에 개시되어 있다. 본 개시내용과 일치하는 Cas 닉카제 또는 Cas9 프로그램가능한 뉴클레아제의 예는 SpCas9(서열번호: 32), SaCas9(서열번호: 33), CjCas9(서열번호: 34), GeoCas9(서열번호: 35), HpaCas9(서열번호: 36), 및 NmeCas9(서열번호: 37)를 포함한다. 일부 실시형태에서, Cas 닉카제는 서열번호: 32-37 중 임의의 하나에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 본 개시내용의 Cas9 프로그램가능한 뉴클레아제는 천연 Cas9 프로그램가능한 뉴클레아제에 관하여 돌연변이, 삽입, 결실 또는 절단을 포함할 수 있다.
Cas 닉카제는 돌연변이를 포함할 수 있다. 돌연변이는 인테인 촉매작용을 가능하게 하거나 개선할 수 있다. 돌연변이는 삽입 돌연변이일 수 있다. 돌연변이는 점 돌연변이일 수 있다. Cas 닉카제는 시스테인 점 돌연변이를 포함할 수 있다. 시스테인 점 돌연변이는 Cas 닉카제의 C-말단 절반에 위치될 수 있다. 본 명세서에 기재된 Cas9는 Cas9의 C-말단 절반에 시스테인 점 돌연변이를 포함할 수 있다. 시스테인 점 돌연변이는 Cas 닉카제의 아미노산 위치 574 이후 어느 곳에나 위치될 수 있다. 돌연변이는 S. 피오게네스 Cas9 닉카제에 있을 수 있다. 시스테인 점 돌연변이는 S1173을 포함할 수 있다. 시스테인 점 돌연변이는 D1079를 포함할 수 있다. 시스테인 점 돌연변이는 D1180을 포함할 수 있다.
Cas9 닉카제(S. 피오게네스 Cas9 닉카제)는 점 돌연변이를 포함할 수 있다. 점 돌연변이는 인테인 촉매작용을 가능하게 할 수 있다. 점 돌연변이는 인테인 촉매작용을 개선할 수 있다. 일부 실시형태에서, 점 돌연변이는 시스테인 점 돌연변이, 세린 점 돌연변이, 트레오닌 점 돌연변이, 또는 알라닌 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 시스테인 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 세린 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 트레오닌 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 알라닌 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 D1079에 위치된다. 일부 실시형태에서, 점 돌연변이는 D1125에 위치된다. 일부 실시형태에서, 점 돌연변이는 D1130에 위치된다. 일부 실시형태에서, 점 돌연변이는 G1133에 위치된다. 일부 실시형태에서, 점 돌연변이는 A1140에 위치된다. 일부 실시형태에서, 점 돌연변이는 I1168에 위치된다. 일부 실시형태에서, 점 돌연변이는 S1173에 위치된다. 일부 실시형태에서, 점 돌연변이는 D1180에 위치된다. 일부 실시형태에서, 점 돌연변이는 G1186에 위치된다. 일부 실시형태에서, 점 돌연변이는 L1203에 위치된다. 일부 실시형태에서, 점 돌연변이는 R1212에 위치된다. 일부 실시형태에서, 점 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 위치된다.
Cas9 닉카제(S. 피오게네스 Cas9 닉카제)는 삽입 돌연변이를 포함할 수 있다. 삽입 돌연변이는 인테인 촉매작용을 가능하게 할 수 있다. 삽입 돌연변이는 인테인 촉매작용을 개선할 수 있다. 일부 실시형태에서, 삽입 돌연변이는 시스테인 삽입 돌연변이, 세린 삽입 돌연변이, 트레오닌 삽입 돌연변이, 또는 알라닌 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 시스테인 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 세린 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 트레오닌 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 알라닌 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1079에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1125에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1130에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1133에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1140에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1168에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1173에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1180에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1186에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1203에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1212에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212 바로 전에 위치된다.
Cas 닉카제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나의 서열을 포함할 수 있다. 일부 실시형태에서, Cas 닉카제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. Cas 닉카제는 2개 이상의 분절로 발현될 수 있다. 시스테인 점 돌연변이는 Cas 닉카제의 C-말단 부분의 N-말단에 위치될 수 있다. 제1 분절은 서열번호: 90의 서열을 포함할 수 있다.
이종이량체화 도메인을 포함하지 않는 Cas 닉카제 및 역전사효소를 포함하는 조성물이 본 명세서에 개시된다. 예를 들어, Cas 닉카제 및 역전사효소는 이종이량체화되도록 조작되지 않을 수 있다. 그럼에도 Cas 닉카제 및 역전사효소는 이종이량체화할 수 있고 상기 조작 또는 이종이량체화 도메인 없이 핵산 편집을 수행할 수 있다. Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함할 수 있다.
Cas 닉카제 및 역전사효소, 또는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 조성물이 본 명세서에 개시되며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부가 적어도 2개의 별도의 폴리펩티드 사슬에 포함되고, 여기서 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 이종이량체 도메인을 포함하는 별도의 폴리펩티드 사슬을 포함한다. 별도의 폴리펩티드 사슬은 이종이량체 도메인을 포함하는 융합 단백질을 포함할 수 있다. 이종이량체 도메인은 별도의 폴리펩티드 사슬에 융합될 수 있다. 이종이량체 도메인은 별도의 폴리펩티드 사슬의 아미노 또는 카르복시 말단에 융합될 수 있다. 이종이량체 도메인은 류신 지퍼를 포함할 수 있다. 이종이량체 도메인은 PDZ 도메인을 포함할 수 있다. 이종이량체 도메인은 스트렙타비딘을 포함할 수 있다. 이종이량체 도메인은 스트렙타비딘 결합 단백질을 포함할 수 있다. 이종이량체 도메인은 폴돈 도메인을 포함할 수 있다. 이종이량체 도메인은 소수성 폴리펩티드를 포함할 수 있다. 이종이량체 도메인은 항체를 포함할 수 있다. 이종이량체 도메인은 노브, 홀, 류신 지퍼, 코일링된 코일, 또는 정전기 상호작용을 형성할 수 있는 극성 아미노산 잔기를 포함할 수 있다. 이종이량체 도메인은 IgM(MHD2) 또는 IgE(EHD2)의 중쇄 도메인 2(CH2), 면역글로불린 Fc 영역, IgG 또는 IgA의 중쇄 도메인 3(CH3), IgM 또는 IgE의 중쇄 도메인 4(CH4), Fab, Fab2, 류신 지퍼 모티프, 바나제-바스타 이량체, 미니항체, 또는 ZIP 미니항체 중 임의의 것을 포함할 수 있다. 이종이량체 도메인은 피브리틴 폴돈 도메인을 포함할 수 있다. 이종이량체 도메인은 류신 지퍼, 폴돈 도메인, 단편 X, 콜라겐 도메인, 2G12 IgG 동종이량체, 미토콘드리아 항바이러스-시그널링 단백질 CARD 필라멘트, 심장 포스포람반 막횡단 오량체, 부갑상선 호르몬 이량체화 도메인, 글리코포린 A 막횡단, HIV Gp41 삼량체화 도메인, 또는 HPV45 종양단백질 E7 C-말단 이량체 도메인을 포함할 수 있다. 이종이량체 도메인은 Fc 도메인을 포함할 수 있다. 이종이량체 도메인은 류신 지퍼 도메인, PSD95-Dlgl-zo-1(PDZ) 도메인, 스트렙타비딘, 스트렙타비딘 결합 단백질(SBP), mTOR의 FKBP 결합 도메인(FRB), 사이클로필린-Fas 융합 단백질(CyP-Fas), 칼시뉴린 A(CNA) 및 FK506 결합 단백질(FKBP), Snap 태그, Halo 태그, PYL 또는 ABI를 포함할 수 있다. 이종이량체 도메인은 본 명세서에 기재된 이종이량체 도메인의 결합 단편을 포함할 수 있다.
인테인 기술을 사용한 분할 Cas9 작제물의 발현
일부 실시형태에서, Cas9 작제물(예를 들어, Cas9-RT)은 하나 이상의 인테인에 융합된 하나 이상의 엑스테인으로서 분할 작제물로서 발현될 수 있다. 인테인 기술은 단백질을 2개 이상의 더 짧은 펩티드 분절(엑스테인)로 발현시킴에 의해 세포 내로 큰 단백질을 전달하는 데 사용될 수 있다. 각각의 엑스테인은 인테인 펩티드(예를 들어, Npu C 인테인 또는 Npu N 인테인)와의 융합으로서 발현될 수 있다. 인테인은 2개 이상의 엑스테인의 융합을 자가촉매할 수 있고 그 상응하는 엑스테인으로부터 인테인의 절단을 자가촉매할 수 있다. 결과는 제2 엑스테인에 융합되고 인테인을 결하는 제1 엑스테인을 포함하는 단백질 복합체일 수 있다. 인테인은 엑스테인의 N-말단에 위될 수 있거나 인테인은 엑스테인의 C-말단에 위치될 수 있다. 엑스테인은 (예를 들어, 엑스테인의 C-말단의 말단에 융합된 인테인을 갖는 엑스테인의 C-말단의 말단에서) 인테인에 인접하게 위치된 시스테인 잔기를 포함할 수 있다. Cas 닉카제는 2개 이상의 분절로 발현될 수 있다. 제1의 Cas 닉카제 분절은 Cas 닉카제의 N-말단 부분을 포함할 수 있다. Cas 닉카제의 제1 분절은 제1 인테인을 포함할 수 있다. Cas 닉카제의 제2 분절은 Cas 닉카제의 C-말단 부분을 포함할 수 있다. Cas 닉카제의 제2 분절은 제2 인테인을 포함할 수 있다. 인테인은 Cas 닉카제의 N-말단 부분의 C-말단에 융합될 수 있다. 인테인은 Cas 닉카제의 C-말단 부분의 N-말단에 융합될 수 있다.
엑스테인-인테인 융합을 인코딩하는 핵산 서열은 전달 벡터(예를 들어, 아데노-연관된 바이러스(AAV) 벡터) 내에 피팅될 수 있다. 일부 실시형태에서, 인테인에 융합된 펩티드 분절 엑스테인을 인코딩하는 벡터는 세포에 전달될 수 있다. 일부 실시형태에서, 엑스테인-인테인 융합은 세포에서 발현될 수 있다. 제1 엑스테인-인테인 융합 펩티드는 하나 이상의 추가의 엑스테인-인테인 융합 펩티드에 융합될 수 있고, 인테인은 인테인을 결하는 큰 단백질 작제물을 생성하기 위해 절제될 수 있다. 일부 실시형태에서, 단백질은 엑스테인 융합 및 인테인 절제를 촉진하기 위해 시스테인 잔기를 도입하는 점 돌연변이를 포함할 수 있다. 일부 실시형태에서, 본 개시내용의 Cas9-RT는 2개 이상의 엑스테인-인테인 융합 펩티드로서 발현될 수 있다. 일부 실시형태에서, 본 개시내용의 Cas9(예를 들어, 서열번호: 32 - 서열번호: 37 또는 서열번호: 84 - 서열번호: 87)는 Cas9-RT 융합을 생성하기 위한 둘 이상의 엑스테인-인테인 융합 펩티드로서 본 개시내용의 역전사효소(예를 들어, 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80)와 연계하여 발현될 수 있다. 예를 들어, Cas9-RT는 nCas9(1-1172) - Npu N 인테인을 포함하는 제1 Cas9-RT 엑스테인-융합 및 Npu C 인테인 - nCas9(1173-1368) - mlvRT5M을 포함하는 제2 Cas9-RT 엑스테인-융합으로 발현될 수 있다. nCas9(1-1172)는 닉킹 Cas9의 잔기 1-1172(예를 들어, 서열번호: 84 - 서열번호: 87 중 임의의 하나의 잔기 1-1172)에 상응할 수 있다. nCas9(1173-1368)는 위치 1173에 시스테인을 갖는 닉킹 Cas9의 잔기 1173-1368(예를 들어, 서열번호: 86의 잔기 1-1172)에 상응할 수 있다. mlvRT5M은 5개 점 돌연변이를 포함하는 역전사효소(예를 들어, 서열번호: 13 또는 서열번호: 40)에 상응할 수 있다. 분절은 서열번호: 91의 서열을 포함할 수 있다. 분절은 Cas 닉카제(예를 들어, Cas 닉카제의 C-말단 부분)에 융합된 역전사효소를 포함할 수 있다. 역전사효소는 Cas 닉카제의 C-말단 부분의 C-말단에 융합된 N-말단을 포함할 수 있다. 역전사효소는 mlvRT 또는 이의 변이체를 포함할 수 있다.
가이드 핵산
프로그램가능한 뉴클레아제(예를 들어, nCas9)를 표적 핵산으로 지향시키는 가이드 핵산(예를 들어, gRNA)이 본 명세서에서 제공된다. 본 개시내용의 가이드 핵산은 표적 핵산의 표적 부위 안으로 삽입되어 지는 핵산 서열의 합성을 용이하게 할 수 있다. 본 개시내용의 가이드 핵산은 표적 핵산의 표적 부위에서 핵산 서열의 편집을 용이하게 할 수 있다.
일부 실시형태에서, 본 개시내용의 가이드 핵산은 표적 핵산의 제1 영역에 역상보적인 스페이서, Cas 닉카제에 결합하도록 구성된 스캐폴드, 표적 핵산 내로 합체되는 서열을 인코딩하는 역전사효소 주형(RTT), 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위, 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머, 또는 이의 조합을 포함할 수 있다. 일부 실시형태에서, 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있다. 일부 실시형태에서, 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적이다. 일부 실시형태에서, 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성된다. 일부 실시형태에서, 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터의 역전사를 위한 주형으로서 기능하도록 구성된다. 일부 실시형태에서, 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터 전사를 위한 프라이머로서 기능하도록 구성된다. 일부 실시형태에서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형일 수 있다.
본 개시내용의 가이드 핵산은 RTT를 포함할 수 있다. 이 방식으로 삽입되는 핵산 서열은 PAM에 돌연변이를 가질 수 있다. 이것은 이미 삽입된 핵산 서열의 재-편집을 방지할 수 있다. RTT는 프로토스페이서 인접 모티프(PAM) 서열을 파괴하는 변형을 포함할 수 있다. RTT는 하나 이상의 PAM 서열을 파괴하는 둘 이상의 변형을 포함할 수 있다. 변형은 PAM 서열과 부분적으로 상보적인 서열을 포함할 수 있다. 변형은 PAM 서열과의 불일치를 포함할 수 있다. PAM 서열은 표적 핵산에서 파괴될 수 있다. 표적 핵산은 파괴 이전에 자연적으로 발생하는 PAM 서열을 포함할 수 있다. PAM 서열은 2-6개 염기쌍 핵산 서열을 포함할 수 있다. PAM 서열의 예는 5'-NGG-3'이다. PAM 서열의 다른 예는 5'-TTTN-3' 또는 5'-YTN-3'을 포함한다. 임의의 이들 PAM 서열은 RTT에서 변형될 수 있다. 이러한 변형의 일부 예는 삽입, 결실 또는 점 돌연변이를 포함할 수 있다. PAM 서열은 Cas 닉카제에 의해 인식될 수 있다. 변형되거나 파괴된 PAM 서열은 일부 경우에 Cas 닉카제에 의해 인식되지 않을 수 있다. 변형은 게놈에서 PAM을 파괴하거나 제거하는 서열을 포함할 수 있다.
역전사효소 주형은 게놈에서 모노뉴클레오티드 트랙을 파괴하는 변형을 포함할 수 있다. 변형은 모노뉴클레오티드 트랙과 부분적으로 상보적인 서열을 포함할 수 있다. 변형은 모노뉴클레오티드 트랙과의 불일치를 포함할 수 있다. 역전사효소 주형은 게놈에서 하나 이상의 모노뉴클레오티드 트랙을 파괴하는 둘 이상의 변형을 포함할 수 있다. 변형은 게놈에서 모노뉴클레오티드 트랙을 파괴하거나 제거하는 서열을 포함할 수 있다. 가이드 핵산은 표적 핵산에서 동일한 염기의 적어도 4개 연속적인 뉴클레오티드의 하나 이상의 트랙을 제거하는 역전사효소 주형에 하나 이상의 변형을 포함할 수 있다.
표적 핵산은 폴리A 트랙 또는 긴 폴리A 트랙을 포함할 수 있다. RTT는 긴 폴리A 트랙을 포함할 수 있다. 폴리A 트랙을 파괴하도록 RTT에 변형을 도입하는 것을 편집 효율을 개선할 수 있다. 일부 실시형태에서, RTT는 동일한 뉴클레오티드 염기인 적어도 4개의 연속적인 뉴클레오티드의 트랙을 제거하거나 변형하는 하나 이상의 변형을 추가로 포함한다. 역전사효소 주형에서 하나 이상의 변형은 표적 핵산에서 동일한 염기의 연속적인 뉴클레오티드(예를 들어, 적어도 4개의 연속적인 뉴클레오티드)의 하나 이상의 트랙을 제거할 수 있다. RTT는 4개 이상의 연속적인 A 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 T 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 G 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 C 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 U 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 3개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 3개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 4개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 4개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 5개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 5개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 6개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 6개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 7개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 7개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 8개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 8개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 동일한 염기를 포함하는 5, 6, 7, 8, 9, 10개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 동일한 염기를 연속적으로 포함하는 연속적인 뉴클레오티드를 더 이상 포함하지 않도록 동일한 염기를 연속적으로 포함하는 4, 5, 6, 7, 8, 9, 10개 이상의 연속적인 뉴클레오티드를 변형하는 변형을 포함할 수 있다.
변형은 비변형된 가이드 핵산과 관련된 돌연변이를 포함할 수 있다. 돌연변이는 침묵 돌연변이일 수 있다. 일부 경우에, 돌연변이는 침묵 돌연변이가 아니다.
가이드 핵산은 유전자 편집을 개선하기 위해 가이드 핵산 상의 다른 영역 자체에 결합하는 영역을 포함할 수 있다. 본 개시내용의 가이드 핵산은 벨크로 영역을 포함할 수 있다. 벨크로 영역은 "벨크로 결합 부위"로 지칭되는 가이드 핵산의 다른 영역에 결합하는 가이드 핵산의 영역을 포함할 수 있다. 예를 들어, 벨크로 영역은 유전자 편집을 개선하기 위해 가이드 핵산의 다른 영역에 결합하는 가이드 핵산의 영역을 포함할 수 있다. 벨크로 결합 부위에 벨크로 영역의 결합은 가이드 핵산의 구조를 변경할 수 있다. 벨크로 결합 부위에 벨크로 영역의 결합에 의한 가이드 핵산의 변경된 구조는 유전자 편집을 향상시킬 수 있다. 가이드 핵산은 gRNA 위치화 시스템(GPS)을 포함할 수 있다. 벨크로 영역 또는 GPS는 gRNA의 영역(예를 들어 벨크로 결합 부위 또는 GPS 결합 부위)에 혼성화할 수 있다. 벨크로 영역 또는 GPS는 역전사효소 주형의 영역에 혼성화할 수 있다. "벨크로"와 "GPS"는 상호교환가능하게 사용될 수 있다. 예를 들어, "벨크로 영역"은 "GPS 영역"으로 지칭될 수 있으며, 그 반대의 경우도 마찬가지이다. 또는 "벨크로 결합 부위"는 "GPS 결합 부위"로 지칭될 수 있으며, 그 반대의 경우도 마찬가지이다. 벨크로 영역은 역전사효소 주형 영역의 영역에 혼성화할 수 있다. 벨크로 영역을 포함하는 gRNA는 제2 가닥 프라이머를 포함할 수 있다. 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, 벨크로 영역, RT 주형, SSP, 리보자임 또는 이의 조합을 포함할 수 있다. 예를 들어, 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, 벨크로 영역, RT 주형, SSP 및 리보자임을 포함할 수 있다. 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP, 리보자임 또는 이의 조합을 포함할 수 있다. 예를 들어, 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP 및 리보자임을 포함할 수 있다. 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP, 리보자임, 또는 프라이머 결합 부위(PBS), 또는 이의 조합을 포함할 수 있다. 예를 들어, 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP, 리보자임 및 PBS를 포함할 수 있다. 벨크로 영역을 포함하는 gRNA의 예는 도 8a도 8b도 12a도 12b에 도시되어 있다. 벨크로 영역은 표적 부위에서 표적 핵산 내로 삽입되는 핵산 서열의 역전사를 용이하게 할 수 있다.
GPS 영역을 포함하는 가이드 핵산은 가이드 RNA를 포함할 수 있다. GPS 영역을 포함하는 가이드 핵산은 가이드 RNA 이외의 가이드 핵산을 포함할 수 있다. GPS 결합 부위를 포함하는 가이드 핵산은 가이드 RNA를 포함할 수 있다. GPS 결합 부위를 포함하는 가이드 핵산은 가이드 RNA 이외의 가이드 핵산을 포함할 수 있다.
벨크로 영역은 합성일 수 있다. 벨크로 결합 부위는 합성일 수 있다. 벨크로 영역과 벨크로 결합 부위는 gRNA 안으로 삽입될 수 있다. 예를 들어, 합성 벨크로 결합 부위는 gRNA에서 RT 주형의 gRNA 5'에 포함될 수 있다.
일부 실시형태에서, 벨크로 영역 또는 벨크로 결합 부위가 본 명세서에 개시되어 있다. 일부 실시형태에서, 핵산은 벨크로 영역을 포함한다. 일부 실시형태에서, 하나 이상의 바이러스 벡터(예를 들어 아데노바이러스)는 벨크로 영역을 포함하는 핵산을 포함한다. 일부 실시형태에서, 세포는 벨크로 영역을 포함하는 핵산을 포함한다. 일부 실시형태에서, 가이드 핵산은 벨크로 영역을 포함한다. 벨크로 영역은 벨크로 결합 부위에 혼성화할 수 있다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 또는 적어도 75% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 50% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 60% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 70% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 80% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 90% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 100% 역상보적이다. 일부 실시형태에서, 역전사효소 주형 영역은 벨크로 결합 부위를 포함한다. 일부 실시형태에서, 벨크로 결합 부위는 프라이머 결합 부위(예를 들어 제1 가닥 프라이머 결합 부위, 또는 제2 가닥 프라이머 결합 부위)의 3'이다. 일부 실시형태에서, 벨크로 결합 부위는 프라이머 결합 부위의 5'이다. 일부 실시형태에서, 벨크로 영역은 역전사효소 주형의 3'이다. 일부 실시형태에서, 벨크로 영역은 역전사효소 주형의 5'이다. 일부 실시예에서 벨크로 영역은 스캐폴드의 5'이다. 일부 실시예에서, 벨크로 영역은 스캐폴드의 3'이다. 일부 실시형태에서, 스캐폴드는 표적 핵산(예를 들어 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산)에 상보적이다. 일부 실시형태에서, 합성 벨크로 서열은 PBS 후에 삽입되는 합성 벨크로 결합 부위에 대해 rev comp인 서열에 결합하는 RTT와 스캐폴드 사이에 삽입된다. 일부 실시형태에서, 벨크로 영역은 다른 벨크로 영역에 결합한다. 일부 실시형태에서, 벨크로 영역은 스페이서 서열의 PAM-근위 20 뉴클레오티드가 아닌 가이드 핵산의 영역에 혼성화한다.
일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 부분적으로 역상보적이다. 완벽한 상보성은 일부 경우에 절삭된 AAV 게놈에 기여할 수 있으므로 일부 돌출 또는 불완전한 상보성을 도입하면 AAV 패키징을 파괴함이 없이 GPS의 이점을 유지하는 데 도움이 될 수 있다. AAV 게놈 패키징은 일부 경우에 2차 구조에 의해 파괴될 수 있다. GPS는 파괴적인 2차 구조를 도입할 수 있다. 따라서, GPS와 GPS 결합 부위 간의 상보성의 정도를 감소시키는 것은 GPS에 의한 AAV 패키징의 파괴를 제거하는 경로를 제공한다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 50% 미만, 55% 미만, 60% 미만, 65% 미만, 70% 미만, 75% 미만, 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 99% 미만, 또는 100% 미만 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 99% 미만 또는 100% 미만 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 70% 미만의 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 80% 미만의 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 90% 미만의 역상보적이다. 일부 실시형태는 본 명세서에 개시된 임의의 2개 백분율에 의해 한정된 역상보성의 범위를 포함한다.
벨크로 영역의 비-제한적인 예시적인 구성이 도 26에 도시되어 있다. GPS 영역은 가이드 핵산 내의 임의의 구성에 있을 수 있다. GPS 영역은 가이드 핵산의 5' 말단에 있을 수 있다. GPS 영역은 스페이서에 대해 5'일 수 있다. GPS 영역은 스페이서 및 그에 인접한 5'일 수 있다. GPS 영역은 스캐폴드에서 대해 5'일 수 있다. GPS 영역은 스캐폴드 및 그에 인접한 5'일 수 있다. GPS 영역은 RTT에 대해 5'일 수 있다. GPS 영역은 RTT 및 그에 인접한 5'일 수 있다. GPS 영역은 PBS에 대해 5'일 수 있다. GPS 영역은 PBS 및 그에 인접한 5'일 수 있다. GPS 영역은 가이드 핵산의 3' 말단에 있을 수 있다. GPS 영역은 스페이서에 대해 3'일 수 있다. GPS 영역은 스페이서 및 그에 인접한 3'일 수 있다. GPS 영역은 스캐폴드에 대해 3'일 수 있다. GPS 영역은 스캐폴드 및 그에 인접한 3'일 수 있다. GPS 영역은 RTT에 대해 3'일 수 있다. GPS 영역은 RTT 및 그에 인접한 3'일 수 있다. GPS 영역은 PBS에 대해 3'일 수 있다. GPS 영역은 PBS 및 그에 인접한 3'일 수 있다. GPS 영역은 스캐폴드 내에 있을 수 있다. GPS 영역은 RTT 내에 있을 수 있다. GPS 영역은 PBS 내에 있을 수 있다. 일부 실시형태는 제2 GPS 영역을 포함한다. 제2 GPS 영역은 전술한 위치 중 임의의 위치에 있을 수 있다. 제2 GPS 영역은 제2 GPS 결합 부위에 혼성화할 수 있다. GPS 영역은 제2 GPS 영역에 혼성화할 수 있다.
GPS 영역은 뉴클레오티드의 길이를 포함할 수 있다. 예를 들어, GPS 영역은 길이가 5-100 뉴클레오티드, 또는 길이가 약 5-100 뉴클레오티드일 수 있다. GPS 영역은 길이가 10-50 뉴클레오티드, 또는 길이가 약 10-50 뉴클레오티드일 수 있다. GPS 영역은 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 이상의 뉴클레오티드, 또는 전술한 숫자 중 임의의 2개에 의해 한정된 뉴클레오티드의 범위를 포함할 수 있다. GPS 영역은 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 또는 적어도 100개의 뉴클레오티드를 포함할 수 있다. 일부 경우에, GPS 영역은 5 이하, 10 이하, 15 이하, 20 이하, 25 이하, 30 이하, 35 이하, 40 이하, 45 이하, 50 이하, 55 이하, 60 이하, 65 이하, 70 이하, 75 이하, 80 이하, 85 이하, 90 이하, 95 이하, 또는 100 이하의 뉴클레오티드를 포함한다. GPS 영역은 20개 뉴클레오티드 길이일 수 있다. GPS 영역은 약 20개 뉴클레오티드 길이일 수 있다.
GPS 영역은 GPS 결합 부위에 혼성화할 수 있다. GPS 영역은 GPS 결합 부위에 상보적일 수 있다. GPS 영역은 GPS 결합 부위에 대해 100% 상보적일 수 있다. GPS 영역은 GPS 결합 부위에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상보적일 수 있다. GPS 영역은 GPS 결합 부위에 대해 50% 미만, 60% 미만, 70% 미만, 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 또는 99% 미만 상보적일 수 있다.
GPS 영역은 GPS 결합 부위의 일부에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 상보적일 수 있다. 부분은 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 또는 적어도 100개 뉴클레오티드를 포함할 수 있다. 부분은 5 미만, 10 미만, 15 미만, 20 미만, 25 미만, 30 미만, 35 미만, 40 미만, 45 미만, 50 미만, 55 미만, 60 미만, 65 미만, 70 미만, 75 미만, 80 미만, 85 미만, 90 미만, 95 미만, 또는 100 미만의 뉴클레오티드를 포함할 수 있다.
GPS 영역은 GPS 결합 부위의 부분 (또는 제2 부분)에 대해 50% 미만, 60% 미만, 70% 미만, 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 99% 미만 또는 100% 상보적일 수 있다. 부분 (또는 제2 부분)은 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 또는 적어도 100개 뉴클레오티드를 포함할 수 있다. 부분 (또는 제2 부분)은 5 미만, 10 미만, 15 미만, 20 미만, 25 미만, 30 미만, 35 미만, 40 미만, 45 미만, 50 미만, 55 미만, 60 미만, 65 미만, 70 미만, 75 미만, 80 미만, 85 미만, 90 미만, 95 미만, 또는 100 미만의 뉴클레오티드를 포함할 수 있다.
일부 예에서, GPS 영역은 GPS 결합 부위의 5-10 뉴클레오티드에 상보적이다. 일부 예에서, GPS 영역은 GPS 결합 부위의 5-10 뉴클레오티드에 대해 적어도 80% 상보적이다. 일부 예에서, GPS 영역은 GPS 결합 부위의 11-100 뉴클레오티드에 상보적이다. 일부 예에서, GPS 영역은 GPS 결합 부위의 11-100 뉴클레오티드에 대해 적어도 80% 상보적이다.
일부 실시형태에서, 본 개시내용의 gRNA는, 예를 들어 도 13a에 도시된 바와 같이 자가-절단 리보자임을 포함할 수 있다. 일부 실시형태에서, gRNA의 제2 가닥 프라이머 영역은 제1 합성된 가닥 상에 위치된 주형 영역에 대해 100% 서열 상보성을 포함할 수 있다. 일부 실시형태에서, 제2 가닥 프라이머의 전사는 gRNA의 3' 말단 및 제2 가닥 프라이머의 3'에서 폴리-U 서열(예를 들어, UUUUU)을 생성할 수 있다. 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 존재는 제2 가닥 프라이머의 기능을 억제할 수 있다. 리보자임 서열은 gRNA에 포함될 수 있어 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 형성을 방지한다. 리보자임은 gRNA를 자가촉매적으로 스스로 절단해낼 수 있다. 일부 실시형태에서, 리보자임은 제2 가닥 프라이머의 3'에 위치될 수 있다. 제2 가닥 프라이머의 3'에 위치된 리보자임은 gRNA에서 자가촉매적으로 스스로 절단될 수 있어, 폴리-U 서열 없이 온전한 제2 가닥 프라이머를 남긴다. 제2 가닥 프라이머의 리보자임(예를 들어 HDV 리보자임) 3'의 함입은 제2 가닥 프라이머 기능을 억제하는 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 형성 없이 주형에 대한 제2 가닥 프라이머의 100% 상보성을 가능하게 할 수 있다. 일부 실시형태에서, 자가-절단 리보자임을 포함하는 gRNA는 제2 가닥 프라이머의 3'에 위치된 자가-절단 리보자임 서열을 가질 수 있다. 일부 실시형태에서, 리보자임(예를 들어, HDV 리보자임)은 리보자임의 자가촉매적 절단에 이어 gRNA의 3' 말단에서 2'3' 고리형 포스페이트를 남길 수 있다. 2'3' 고리형 포스페이트는 제2 가닥 프라이머의 기능을 억제할 수 있다. 2'3' 고리형 포스페이트는 폴리뉴클레오티드 키나제를 사용하여 3' 하이드록실로 전환될 수 있다. 일부 실시형태에서, 폴리뉴클레오티드 키나제는 gRNA를 발현하는 세포에 존재하는 내인성 폴리뉴클레오티드 키나제이다. 일부 실시형태에서, 폴리뉴클레오티드 키나제는 외인성으로 발현된다.
일부 실시형태에서, tRNA는 리보자임 대신에 gRNA에 융합되어 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 형성을 방지할 수 있다. 일부 실시형태에서, tRNA는 제2 가닥 프라이머의 3'에 위치될 수 있다. RNase P 효소는 나머지 gRNA 서열로부터 tRNA를 절단할 수 있다. 일부 실시형태에서, RNase P는 제2 가닥 프라이머의 3' 말단으로부터 tRNA를 절단하여, 제2 가닥 프라이머의 3' 말단에 3' 하이드록실을 남길 수 있다. 일부 실시형태에서, RNase P는 gRNA를 발현하는 세포에 존재하는 내인성 RNase P이다. 일부 실시형태에서, RNase P는 외인성으로 발현된다. 일부 실시형태에서, tRNA를 포함하는 gRNA는 제2 가닥 프라이머의 3'에 위치된 tRNA 서열을 가질 수 있다. tRNA는 RNase P에 의해 인식되는 임의의 tRNA에 상응하는 서열을 가질 수 있다. 일부 실시형태에서, tRNA는 서열번호: 94의 서열을 포함할 수 있다.
가이드 핵산은 스페이서를 포함할 수 있다. 스페이서는 표적 핵산의 제1 영역에 역상보적일 수 있다. 가이드 핵산은 스캐폴드를 포함할 수 있다. 스캐폴드는 Cas 닉카제에 결합할 수 있다. 가이드 핵산은 역전사효소 주형을 포함할 수 있다. 역전사효소 주형은 표적 핵산에 삽입되는 서열을 인코딩할 수 있다. 가이드 핵산은 제1 가닥 프라이머 결합 부위를 포함할 수 있다. 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 역상보적일 수 있다. 가이드 핵산은 제2 가닥 프라이머를 포함할 수 있다. 제2 가닥 프라이머는 역전사효소 주형의 영역의 서열을 포함할 수 있다.
일부 실시형태에서, 스캐폴드를 포함하는 가이드 핵산이 본 명세서에 개시되어 있다. 스캐폴드는 뉴클레아제에 결합할 수 있다. 스캐폴드는 Cas 뉴클레아제에 결합할 수 있다. 스캐폴드는 닉카제에 결합할 수 있다. 스캐폴드는 Cas 닉카제에 결합할 수 있다. 스캐폴드는 S. 피오게네스 Cas9 뉴클레아제에 결합할 수 있다. 스캐폴드는 S. 피오게네스 Cas9 닉카제에 결합할 수 있다. 스캐폴드는 스캐폴드 핵산 서열을 포함할 수 있다. 스캐폴드 핵산 서열은 서열번호: 139의 서열을 포함할 수 있다. 스캐폴드 핵산 서열은 서열번호: 139의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다.
일부 실시형태에서, 가이드 핵산(예를 들어, gRNA)이 본 명세서에 개시되어 있다. 가이드 핵산은 연장을 포함할 수 있다. 연장은 가이드 핵산의 5' 말단에 있을 수 있다. 연장은 가이드 핵산의 3' 말단에 있을 수 있다. 가이드 핵산은 연장을 포함하는 스캐폴드를 포함할 수 있다. 연장은 스캐폴드의 3' 말단 상에 있을 수 있다. 연장은 역전사효소 주형을 포함할 수 있다. 연장은 프라이머 결합 부위를 포함할 수 있다. 연장은 역전사효소 주형과 프라이머 결합 부위를 함유할 수 있다. 연장의 프라이머 결합 부위는 뉴클레아제 또는 닉카제에 의해 생성된 게놈 플랩에 혼성화할 수 있다. 연장은 벨크로 영역을 사용하여 방향이 지정될 수 있다. 연장은 벨크로 결합 부위를 사용하여 방향이 지정될 수 있다. 연장은 벨크로 영역과 벨크로 결합 부위를 사용하여 방향이 지정될 수 있다. 연장은 벨크로 영역을 포함할 수 있다. 벨크로 영역 (및 예를 들어, 벨크로 결합 부위에 대한 벨크로 영역의 결합)은 프라이머 결합 부위가 게놈 플랩 근처에 있도록 공간적으로 방향을 지정할 수 있다. 연장은 벨크로 결합 영역을 포함할 수 있다. 가이드 핵산은 연장의 외부에 벨크로 영역을 포함할 수 있다. 가이드 핵산은 연장의 외부에 벨크로 결합 영역을 포함할 수 있다.
표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있을 수 있다. 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있을 수 있다. 표적 핵산의 모든 제1 영역은 표적 핵산의 모든 제2 영역에 대해 역상보적일 수 있다. 표적 핵산의 모든 제1 영역은 표적 핵산의 제2 영역의 일부에 대해 역상보적일 수 있다. 표적 핵산의 제1 영역의 일부는 표적 핵산의 모든 제2 영역에 대해 역상보적일 수 있다. 표적 핵산의 제1 영역의 일부는 표적 핵산의 제2 영역의 일부에 대해 역상보적일 수 있다.
가이드 핵산은 절단가능한 서열을 포함할 수 있다. 절단가능한 서열은 가이드 핵산의 3' 말단에 있을 수 있다. 절단가능한 서열은 가이드 핵산의 5' 말단에 있을 수 있다. 절단가능한 서열은 리보자임 절단가능한 서열을 포함할 수 있다. 절단가능한 서열은 tRNA 절단가능한 서열을 포함할 수 있다. gRNA는 HDV 리보자임과 같은 자가 절단 리보자임을 포함할 수 있다. 리보자임은 제2 가닥 프라이머(SPP)의 3'일 수 있다. tRNA(예를 들어 인간 글루타메이트 tRNA)는 리보자임 대신 SPP 뒤에 합체될 수 있고, 이는 리보자임보다 편집 효율을 더 증가시킬 수 있다.
제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화할 수 있다. 역전사효소 주형은 역전사를 위한 주형으로 작용할 수 있다. 역전사는 표적 핵산의 제2 영역의 3' 말단에서 일어날 수 있다. 제2 가닥 프라이머는 주형으로부터 전사를 위한 프라이머로 작용할 수 있다. 주형은 역전사효소 주형에 대해 역상보적일 수 있다. 제1 합성 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로 작용할 수 있다.
제2 가닥 프라이머(SPP)는 gRNA에 포함될 수 있다. SPP는 길이가 약 10-30 또는 약 15-25 뉴클레오티드일 수 있다. SPP는 길이가 약 20 뉴클레오티드일 수 있다. 예를 들어 20 뉴클레오티드의 SPP의 함입은 편집의 효율성을 증가시킬 수 있다(예를 들어, 2x, 또는 약 20%에서 약 40%까지). SPP는 길이가 20, 40 또는 60 뉴클레오티드일 수 있거나, 전술한 뉴클레오티드 수 중 임의의 것에 의해 한정된 길이인 뉴클레오티드의 범위일 수 있다. 일부 실시형태는 제1 가닥에 상보적인 원하는 편집을 갖는 핵산(예를 들어, DNA) 가닥을 포함한다. 이는 RT가 제1 가닥을 주형으로 사용하는 것을 허용할 수 있다. SPP의 말단 3 뉴클레오티드는 제1 가닥에 상보적일 수 있다. SPP는 편집 부위에 3'인 제1 가닥의 일부에 혼성화할 수 있다. SPP는 2차 구조를 제거하도록 코딩되고, 이에 의해 편집 효율을 증가시킬 수 있다.
본 명세서에 기재된 조성물은 제1 가이드 핵산을 포함할 수 있다. 조성물은 제2 가이드 핵산을 포함할 수 있다. 제2 가이드 핵산은 본 명세서에 기재된 가이드 핵산을 포함할 수 있다. 제1 가이드 핵산은 제1 Cas 닉카제에 결합할 수 있다. 제2 가이드 핵산은 제2 Cas 닉카제에 결합할 수 있다. 제1 가이드 핵산의 제1 스페이서는 제1 Cas 닉카제를 결합할 수 있다. 제2 가이드 핵산의 제2 스페이서는 제2 Cas 닉카제를 결합할 수 있다. 제1 가이드 핵산의 제1 스캐폴드는 제2 Cas 닉카제를 결합할 수 있다. 제2 가이드 핵산의 제2 스캐폴드는 제1 Cas 닉카제를 결합할 수 있다. 제1 가이드 핵산은 제1 링커를 포함할 수 있다. 제2 가이드 핵산은 제2 링커를 포함할 수 있다. 제1 링커는 제2 링커에 혼성화할 수 있다.
가이드 핵산은 gRNA 2.0을 포함할 수 있다. 가이드 핵산은 13 뉴클레오티드 PBS를 포함할 수 있다. 가이드 핵산은 10-15 뉴클레오티드 PBS를 포함할 수 있다. 가이드 핵산은 13 뉴클레오티드 RTT를 포함할 수 있다. 가이드 핵산은 10-15 뉴클레오티드 RTT를 포함할 수 있다. RTT는 표적 핵산과 비교하여 돌연변이를 인코딩할 수 있다.
일부 실시형태에서, 제1 및 제2 가이드 핵산이 본 명세서에 개시되어 있다. 일부 실시형태에서, 제1 가이드 핵산은 역전사효소 주형(RTT)을 포함한다. 일부 실시형태에서, 제2 가이드 핵산은 역전사효소 주형을 포함한다. 제1 및 제2 가이드 핵산의 역전사효소 주형은 적어도 부분적으로 상보적일 수 있다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형의 일부는 제1 가이드 핵산의 역전사효소 주형의 일부에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형의 일부에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형의 일부는 제1 가이드 핵산의 역전사효소 주형에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형의 적어도 일부에 상보적(또는 적어도 부분적으로 상보적)이다. 제1 및 제2 가이드 핵산의 역전사효소 주형은 중첩하는 이중 연장된 fRNA의 것(ODEG)을 포함할 수 있으며 여기서 제2 gRNA의 역전사효소 주형의 일부는 제1 gRNA의 역전사효소 주형의 일부에 역상보적이다. 상보적인 부분은 적어도 5개 핵산, 적어도 10개 핵산, 적어도 20개 핵산, 적어도 30개 핵산, 적어도 40개 핵산, 적어도 50개 핵산, 적어도 60개 핵산, 적어도 70개 핵산, 적어도 80개 핵산, 적어도 90개 핵산, 적어도 100개 핵산, 또는 그 초과의 핵산을 포함할 수 있다. 상보적인 부분은 일부 경우에 5개 이하의 핵산, 10개 이하의 핵산, 20개 이하의 핵산, 30개 이하의 핵산, 40개 이하의 핵산, 50개 이하의 핵산, 60개 이하의 핵산, 70개 이하의 핵산, 80개 이하의 핵산, 90개 이하의 핵산, 100개 이하의 핵산 또는 더 적은 핵산을 포함할 수 있다.
가이드 핵산은 gRNA 위치화 시스템(GPS)을 포함할 수 있다. GPS는 가이드 핵산의 일부에 결합하는 RNA 서열을 포함할 수 있다. 이는 PBS를 gRNA의 5' 말단과 매우 근접하게 가져올 수 있다. GPS의 RNA 서열은 길이가 10, 15, 20, 25 또는 그 초과의 뉴클레오티드, 또는 전술한 정수 중 임의의 2개에 의해 한정된 길이인 뉴클레오티드의 범위일 수 있다. GPS를 사용하는 이점은 긴 RTT(예를 들어 적어도 20, 50 또는 100 뉴클레오티드의 RTT)를 사용할 때 편집 효율을 증가시키는 것을 포함할 수 있다.
GPS의 RNA 서열은 길이가 약 20 뉴클레오티드일 수 있다. GPS의 RNA 서열은 RTT의 일부에 혼성화할 수 있다. GPS의 RNA 서열이 혼성화하는 RTT의 부분은 길이가 10, 15, 20, 25 또는 그 초과의 뉴클레오티드, 또는 전술한 정수 중 임의의 2개에 의해 한정된 길이인 뉴클레오티드의 범위일 수 있다. GPS의 RNA 서열이 혼성화하는 RTT의 부분은 약 20 뉴클레오티드일 수 있다. GPS의 RNA 서열이 혼성화하는 RTT의 부분은 GPS와 동일하거나 대략 동일한 길이로 설계될 수 있거나, 그 반대도 마찬가지이다.
GPS는 버전 1 GPS를 포함할 수 있다. 가이드 핵산은 RTT의 5'에 삽입된 RNA 서열을 포함할 수 있다. RNA 서열은 RTT와 혼성화할 수 있다. RNA 서열은 RTT의 3' 영역과 혼성화할 수 있다.
GPS는 버전 2 GPS를 포함할 수 있다. 가이드 핵산은 PBS의 3'에 삽입된 RNA 서열을 포함할 수 있다. RNA 서열은 RTT와 혼성화할 수 있다. RNA 서열은 RTT의 5' 부분과 혼성화할 수 있다.
일부 경우에, 가이드 핵산은 하나의 가이드 핵산, 또는 하나의 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 단지 하나의 가이드 핵산, 또는 단지 하나의 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 하나 초과의 가이드 핵산, 또는 하나 초과의 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 2개의 가이드 핵산, 또는 2개 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 단지 2개의 가이드 핵산, 또는 단지 2개 유형의 가이드 핵산을 포함한다.
본 개시내용의 일부 양태는 단일 가이드 핵산 시스템을 포함한다. 일부 경우에 단일 가이드 핵산 시스템은 편집을 함유하지 않는 원래 게놈 가닥을 효율적으로 대체하지 않는 원하는 편집을 함유하는 플랩을 생성할 수 있다. 연장된 플랩의 게놈 안으로의 혼성화를 촉진하기 위한 조성물 또는 방법은 교체하고자 의도하는 게놈 가닥의 부근에서 연장된 플랩의 3' 말단을 앵커링할 수 있다. GPS-지원된 리앵커버 gRNA(GARG)가 이를 가능하게 할 수 있다. GARG는 연장된 플랩을 앵커링할 수 있다. GARG는 연장된 플랩의 3' 말단을 앵커링할 수 있다. 일부 실시형태에서, 가이드 핵산은 GARG를 포함한다.
GARG의 예가 도 32에 도시되어 있다. 도 32는 표적 핵산의 제1 영역을 표적화하는 스페이서뿐만 아니라, GPS-모집 가이드(GRG)라고 하는 다른 가이드에 의해 표적화된 게놈의 제2 영역에 혼성화하는 프라이머 결합 부위를 포함하는 GARG를 도시한다. GARG는 GRG의 일부인 GPS-결합 부위에 혼성화하도록 설계된 GPS 구성요소를 함유한다. 일부 실시형태에서, 가이드 핵산은 GRG를 포함한다. 일부 실시형태는 GARG 및 GRG를 포함하는 시스템을 포함한다. 시스템은 본 명세서에 기재된 것과 같은 다른 유전자 편집 구성요소를 포함할 수 있다.
가이드 핵산은 GARG를 포함할 수 있다. GARG는 스페이서를 포함할 수 있다. GARG의 스페이서는 표적 핵산의 제1 영역을 결합할 수 있다. GARG의 스페이서는 표적 핵산의 제1 영역에 역상보적일 수 있다. GARG는 RTT를 포함할 수 있다. RTT는 표적 핵산 안으로 삽입되는 서열을 인코딩할 수 있다. GARG는 스캐폴드를 포함할 수 있다. 스캐폴드는 Cas 뉴클레아제에 결합하거나 Cas 뉴클레아제에 결합하도록 구성될 수 있다. GARG는 프라이머 결합 부위(예를 들어 제1 프라이머 결합 부위)를 포함할 수 있다. GARG의 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산의 영역의 어떠한 부분도 포함하지 않는 표적 핵산 영역, 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산에 결합할 수 있다. GARG의 프라이머 결합 부위는 GARG의 스페이서에 상보적인 표적 핵산의 제1 영역의 어떠한 부분도 포함하지 않고, 제1 영역의 역상보체의 어떠한 부분도 포함하지 않는 표적 핵산의 영역에 결합할 수 있다. GARG의 프라이머 결합 부위는 표적 핵산의 제2 영역을 결합할 수 있다. GARG의 프라이머 결합 부위는 표적 핵산의 제2 영역에 역상보적일 수 있다. GARG는 GRG 결합 부위를 포함할 수 있다. GRG 결합 부위는 제2 가이드 핵산(GARG가 제1 가이드 핵산을 포함하는 경우)에 결합할 수 있다. 제2 가이드 핵산은 GRG를 포함할 수 있다. GRG 결합 부위는 GRG에 결합할 수 있다. GRG 결합 부위는 GRG의 부분에 역상보적일 수 있다. GRG 결합 부위에 역상보적인 GRG의 부분은 GARG-결합 부분으로 지칭될 수 있다. GARG는 GPS 영역을 포함할 수 있다. GRG 결합 부위는 GPS 영역일 수 있다. GRG는 GPS 결합 부위를 포함할 수 있다. GARG-결합 부분은 GPS 결합 부위일 수 있다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 근접하게 할 수 있다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 접촉하게 할 수 있다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 매우 근접하게 할 수 있다. GPS 영역 및 GPS 결합 부위의 함입은 GARG의 말단을 그것이 게놈 플랩을 결합할 수 있는 위치로 당길 수 있다. GARG는 DNA와 같은 핵산에 의해 인코딩될 수 있다. GARG의 임의의 구성요소는 GRG에 포함될 수 있다. GRG는 DNA와 같은 핵산에 의해 인코딩될 수 있다. GARG 및 GRG는 동일한 핵산 또는 별도의 핵산에 의해 인코딩된다. GARG 또는 GARG를 인코딩하는 핵산은 AAV와 같은 바이러스 입자에 의해 포괄될 수 있다. GRG 또는 GRG를 인코딩하는 핵산은 AAV와 같은 바이러스 입자에 의해 포괄될 수 있다. GARG 및 GRG는 동일한 바이러스 입자 또는 별도의 바이러스 입자에 의해 포괄된다.
일부 실시형태는 이중 가이드 시스템을 포함한다. 이중 가이드 시스템은 GARG 및 GRG를 포함할 수 있다. 일부 실시형태는 GARG 및 GRG를 포함하는 조성물을 포함한다. 일부 실시형태는 GARG 및 GRG를 사용하는 방법, 또는 GARG 및 GRG로 유전자를 편집하는 방법을 포함한다.
일부 실시형태는 GARG 및 GRG를 세포에 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GARG 및 GRG를 발현하는 하나 이상의 핵산을 세포에 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GARG 및 GRG를 세포에 발현시키는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GRG를 포함하는 세포에 GARG를 발현 또는 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GARG를 포함하는 세포에 GRG를 발현 또는 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에서 GARG 또는 GRG를 발현시키는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에서 GARG 및 GRG를 발현시키는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에 GARG 또는 GRG를 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에 GARG 및 GRG를 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 투여는 세포를 포함하는 대상체에 대한 것일 수 있다.
일부 양태에서, 스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA(또는 폴리뉴클레오티드)를 포함하는 조성물 또는 시스템이 본 명세서에 개시되며, 여기서 프라이머 결합 부위는 별도의 RNA에 의해 표적화된 핵산에 결합한다. 스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA 또는 폴리뉴클레오티드를 포함하는 시스템이 본 명세서에 개시되며, 여기서 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산의 영역의 어떠한 부분도 포함하지 않는 핵산 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산에 결합한다.
게놈 편집용 조성물
본 개시내용의 조성물은 표적 부위에서 표적 핵산의 효율적인 편집을 용이하게 할 수 있다. 본 개시내용의 조성물은 가이드 핵산, nCas9 및 역전사효소를 포함할 수 있다. 본 개시내용의 조성물은 가이드 핵산, nCas9, 역전사효소, 또는 이의 조합을 인코딩하는 서열을 포함할 수 있다. nCas9 및 역전사효소는 융합된 nCas9-RT 작제물일 수 있다. nCas9 및 역전사효소는 분할 nCas9-RT 작제물일 수 있다. 본 개시내용의 조성물은 표적 핵산을 포함하는 세포 안으로 도입되어, 이에 의해 표적 핵산을 편집할 수 있다. 일부 실시형태에서, 조성물의 하나 이상의 성분을 인코딩하는 서열 (예를 들어, 플라스미드)은 표적 핵산을 포함하는 세포 내로 도입될 수 있다. 조성물의 하나 이상의 성분은 세포에서 발현될 수 있다. 일부 실시형태에서, 본 개시내용의 조성물은 제1 가이드 핵산, 제1 nCas9, 제1 역전사효소, 제2 가이드 핵산, 제2 nCas9, 및 제2 역전사효소를 포함할 수 있다. 일부 실시형태에서, 제1 가이드 핵산은 제1 nCas9에 결합하고, 제2 가이드 핵산은 제2 nCas9에 결합한다. 일부 실시형태에서, 제1 가이드 핵산의 제1 스페이서는 제1 nCas9를 결합하고, 제2 가이드 핵산의 제2 스페이서는 제2 nCas9를 결합하고, 제1 가이드 핵산의 제1 스캐폴드는 제2 nCas9를 결합하고, 제2 가이드 핵산의 제2 스캐폴드는 제1 nCas9를 결합한다. 일부 실시형태에서, 제1 가이드 핵산은 제1 링커를 포함하고 제2 가이드 핵산은 제2 링커를 포함한다. 일부 실시형태에서, 제1 링커는 제2 링커에 혼성화한다.
제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 서열의 합성 또는 편집을 용이하게 할 수 있다. 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 표적 부위에서 표적 핵산의 편집을 용이하게 할 수 있다. 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 2개의 단일 가이드 시스템일 수 있다. 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 이중 가이드 시스템일 수 있다. 2개의 단일 가이드 시스템에서, 각 gRNA는 상이한 nCas9에 결합하고 2개의 gRNA는 각각 역전사효소 주형 영역을 포함한다. 이중 가이드 시스템에서, 각 gRNA는 상이한 nCas9에 결합할 수 있다. 2개의 단일 가이드 시스템에서, gRNA 중 하나만 역전사효소 주형 영역을 포함할 수 있다. 2개의 단일 가이드 시스템에서, 제2 가이드는 반대쪽 가닥을 흠집낼 수 있다. 이중 가이드 시스템에서, gRNA 중 하나만 역전사효소 주형 영역을 포함할 수 있다. 이중 가이드 시스템에서, 제2 가이드는 반대쪽 가닥을 흠집낼 수 있다. 이중 가이드 복합체에서, 제1 gRNA의 스페이서는 제1 nCas9를 결합할 수 있고, 제2 gRNA의 스페이서는 제2 nCas9를 결합할 수 있고, 제1 gRNA의 스캐폴드는 제2 nCas9를 결합할 수 있고, 제2 gRNA의 스캐폴드는 제1 nCas9를 결합할 수 있다.
가이드 핵산은 Cas 닉카제와 복합체를 형성할 수 있다. 가이드 핵산은 역전사효소와 복합체를 형성할 수 있다. 복합체 형성 시, Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입할 수 있다.
표적 핵산의 일부 비-제한적인 예는 낭포성 섬유증 막관통 전도도 조절자(CFTR) 핵산, 어셰린(USH2A) 핵산, ATP-결합 카세트 서브패밀리 A 구성원 4(ABCA4) 핵산, 윌슨 질환 단백질(ATP7B) 핵산, 또는 헌팅틴(HTT) 핵산을 포함한다. 일부 실시형태에서, 표적 핵산은 CFTR 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 USH2A 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 ABCA4 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 ATP7B 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 HTT 유전자를 포함한다.
Cas 닉카제, 역전사효소, 및 가이드 핵산을 포함하는 조성물이 본 명세서에 개시되어 있다. 제1 폴리펩티드는 Cas 닉카제를 포함할 수 있다. 제2 폴리펩티드는 역전사효소를 포함할 수 있다. 가이드 핵산은 Cas 닉카제에 결합할 수 있다. 가이드 핵산은 역전사효소에 결합할 수 있다.
RT는 MS2 코트 단백질(MCP) 펩티드를 포함할 수 있다. 일부 경우에, RT는 MS2 코트 단백질(MCP) 펩티드를 포함하지 않는다. 예를 들어, 조성물은 Rwa1을 포함할 수 있다. 가이드 핵산은 MS2 헤어핀을 포함할 수 있다. 일부 경우에, 가이드 핵산은 MS2 헤어핀을 포함하지 않는다. MCP 펩티드는 가이드 핵산에서의 MS2 헤어핀을 결합할 수 있다. MS2 헤어핀은 gRNA 스캐폴드와 RTT 사이에 있을 수 있다. 이것은 편집을 허용하기 위해 RT를 gRNA와 매우 근접하게 할 수 있다. MCP 펩티드와 MS2 헤어핀을 사용하는 이점은 RT와 Cas 닉카제(또는 그들의 일부)를 분리하고 그것을 AAV 벡터 내에 맞도록 하는 것이다. MCP 펩티드와 MS2 헤어핀은 필요하지 않을 수 있다. MCP 펩티드 또는 MS2 헤어핀을 포함하는 조성물은, 예를 들어, 세포 내로 형질감염된 경우 적어도 약 3% 또는 4%의 편집 효율을 가질 수 있다. MCP 펩티드 또는 MS2 헤어핀을 포함하는 조성물은, 예를 들어, 세포 내로 형질감염된 경우 적어도 약 10% 또는 15%의 편집 효율을 가질 수 있다.
RT 및 Cas 닉카제는 류신 지퍼를 포함할 수 있다. 예를 들어, 조성물은 RWb1을 포함할 수 있다. 류신 지퍼를 포함하는 조성물은, 예를 들어, 세포 내로 형질감염된 경우, 적어도 약 35% 또는 40%의 편집 효율을 가질 수 있다. 류신 지퍼를 포함하는 조성물은, 예를 들어, 세포 내로 형질도입된 경우, 적어도 약 3% 또는 4%의 편집 효율을 가질 수 있다. 류신 지퍼를 사용하는 이점은 RT와 Cas 닉카제(또는 그들의 일부)를 분리하고 그것을 AAV 벡터 내에 맞도록 하는 것이다. 그러나, 류신 지퍼는 필요하지 않을 수 있다.
RT 또는 Cas 닉카제는, 예를 들어 인테인 분할하기를 사용하여 분할될 수 있다. 일부 경우에, RT와 Cas 닉카제는 인테인 분할하기를 사용하여 분할되지 않는다. 인테인 분할하기를 사용하는 예는 RWc1이다. 분할은 Cas 닉카제의 잔기 1172와 1173 사이에 있을 수 있다. 분할 RT 또는 Cas 닉카제를 사용하는 조성물은, 예를 들어 세포 내로 형질감염된 경우 적어도 약 25% 또는 30%의 편집 효율을 가질 수 있다. RWc1 또는 유사한 분할하기 방법을 사용하는 이점은 RT 또는 Cas 닉카제를 인코딩하는 핵산 서열이 있는 AAV 벡터 내에 맞도록 허용될 수 있는 조절 요소와 같은 부가의 뉴클레오티드 서열을 위한 더 많은 공간을 허용할 수 있다는 것이다. 예를 들어, 분할하기 방법은 AAV 내에 맞는 부가의 뉴클레오티드 서열에 대해 약 500, 600 또는 700 (또는 전술한 정수 중 임의의 것에 의해 한정된 범위) 이상의 뉴클레오티드를 허용할 수 있다.
RT 또는 Cas 닉카제는 분리되어 있을 수 있고 함께 묶이지 않을 수 있다. 비-결합 RT 및 Cas 닉카제를 사용하는 예는 RWd1이다.
본 개시내용의 조성물은 단백질 복합체 또는 단백질 복합체를 인코딩하는 서열을 포함할 수 있다. 단백질 복합체는 보호성 단백질 복합체를 포함할 수 있다. 단백질 복합체는 가이드 핵산의 탈아미노화 또는 분해를 방지할 수 있다. 예를 들어, 보호성 복합체는 인간 Orf1p(서열번호: 38) 또는 뮤어라인 Orf1p(서열번호: 39)일 수 있다.
게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시되어 있다. 방법은 Orf1p를 세포에 전달하는 것을 포함할 수 있다. 세포는 본 명세서에 기재된 조성물 또는 가이드 핵산을 발현할 수 있다.
본 명세서에 기재된 조성물 또는 가이드 핵산을 인코딩하는 뉴클레오티드 서열을 포함하는 핵산이 본 명세서에 개시되어 있다. 핵산을 포함하는 바이러스 벡터가 본 명세서에 개시되어 있다. 본 명세서에 기재된 조성물을 포함하는 세포가 본 명세서에 개시되어 있다. 본 명세서에 기재된 핵산을 포함하는 세포가 본 명세서에 개시된다. 본 명세서에 기재된 가이드 핵산을 포함하는 세포가 본 명세서에 개시되어 있다. 본 명세서에 기재된 바이러스 벡터를 포함하는 세포가 본 명세서에 개시되어 있다. 세포는 원핵 세포일 수 있다. 세포는 진핵 세포일 수 있다.
일부 실시형태는 세포에서 dNTP 농도와 같은 dNTP 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법을 포함한다. SAMHD1을 억제하는 것은 dNTP 농도를 증가시킬 수 있다. dNTP를 투여하는 것은 세포에서 dNTP 농도를 증가시킬 수 있다. 일부 실시형태는 세포에서 SAMHD1을 억제하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 포함한다. 일부 실시형태는 dNTP를 대상체 또는 세포에 투여하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 포함한다
일부 실시형태에서, 본 개시내용의 조성물은 본 개시내용의 Cas9 작제물(예를 들어, 분할 Cas9-RT 작제물)의 편집 효율을 증가시키기 위한 단백질, 단백질을 인코딩하는 핵산, 또는 비-코딩 핵산을 포함할 수 있다. 일부 실시형태에서, Cas9 작제물의 편집 효율을 증가시키기 위한, 단백질, 단백질을 인코딩하는 핵산, 또는 비-코딩 핵산은 SAMHD1의 dNTP 절단 활성을 억제하는 단백질 또는 핵산 또는 SAMHD1의 dNTP 절단 활성을 억제하는 단백질을 인코딩하는 핵산을 포함할 수 있다. 예를 들어, SAMHD1의 dNTP 절단 활성을 억제하는 핵산은 SAMHD1 전사체를 분해하는 마이크로RNA를 포함할 수 있다.
일부 실시형태는 기준선 dNTP 농도와 비교하여 세포에서 dNTP 농도를 증가시키는 것을 포함한다. 일부 실시형태에서, dNTP 농도는 기준선 dNTP 측정과 비교하여 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 초과, 또는 전술한 백분율 중 임의의 2개에 의해 한정된 백분율의 범위까지 증가된다. 일부 실시형태에서, dNTP 농도는 기준선 dNTP 측정과 비교하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%까지 증가된다. 일부 실시형태에서, dNTP 농도는 기준선 dNTP 측정과 비교하여 5% 이하, 10% 이하, 15% 이하, 20% 이하, 25% 이하, 30% 이하, 40% 이하, 50% 이하, 60% 이하, 70% 이하, 80% 이하, 90% 이하, 100% 이하만큼 증가된다.
다양한 양태에서, 낮은 dNTP 농도는 0.5 마이크로몰, 0.6 마이크로몰, 0.7 마이크로몰, 0.8 마이크로몰, 0.9 마이크로몰, 1.0 마이크로몰, 또는 1.1 마이크로몰, 또는 전술한 dNTP 농도 중 임의의 2개에 의해 한정된 범위의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.5 마이크로몰, 약 0.6 마이크로몰, 약 0.7 마이크로몰, 약 0.8 마이크로몰, 약 0.9 마이크로몰, 약 1.0 마이크로몰, 또는 약 1.1 마이크로몰, 또는 전술한 dNTP 농도 중 임의의 2개에 의해 한정된 범위의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 1.1 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 1.0 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.9 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.8 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.7 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.6 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.5 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.9 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.8 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.7 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.6 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.5 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.4 마이크로몰 초과의 dNTP 농도를 포함한다.
다양한 양태에서, 본 개시내용은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 가지고 DNA 중합효소를 포함하는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하며, 상기 방법은: 기준선 dNTP 농도에 비해 세포에서 dNTP 농도를 증가시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 세포에서 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제를 억제하는 것을 포함한다. 다양한 양태에서, 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제는 SAM 도메인 및 HD 도메인-함유 단백질 1(SAMHD1)을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키는 것, 또는 세포에서 Vpx 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 BGLF4 단백질과 접촉시키는 것, 또는 세포에서 BGLF4 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키는 것, 또는 세포에서 마이크로RNA 또는 siRNA를 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP를 세포에 투여하는 것을 포함한다. 다양한 양태에서, 세포에 dNTP를 투여하는 것은 세포를 포함하는 대상체에게 dNTP를 투여하는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것을 포함한다. 뉴클레오시드 또는 뉴클레오티드는 데옥시뉴클레오시드(dN), 데옥시뉴클레오시드 모노포스페이트(dNMP), 또는 뉴클레오시드 트리포스페이트(NTP)를 포함할 수 있다. 일부 경우에 뉴클레오시드 또는 뉴클레오티드는 dNTP가 아니거나 dNTP를 포함하지 않는다. 다양한 양태에서, 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것은 뉴클레오시드 또는 뉴클레오티드를 세포를 포함하는 대상체에게 투여하는 것을 포함한다. 다양한 양태에서, 투여는 경구 또는 주사에 의한 것이다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함한다. 다양한 양태에서, dNTP 합성 효소는 키나제를 포함한다. 다양한 양태에서, 키나제는 뉴클레오시드 키나제, 데옥시뉴클레오시드 키나제, 데옥시뉴클레오시드 모노포스파제 키나제, 또는 데옥시뉴클레오티드 디포스페이트 키나제를 포함한다. 다양한 양태에서, DNA 중합효소는 역전사효소를 포함한다. DNA 중합효소는 유전자 편집에 적합할 수 있다. DNA 중합효소는 유전자 편집 중합효소일 수 있다. DNA 중합효소는 재조합 DNA 중합효소일 수 있다. 일부 실시형태는 DNA 중합효소를 세포 내로 도입하는 것을 포함한다. 일부 실시형태는 세포에서 DNA 중합효소를 발현하는 것을 포함한다. 다양한 양태에서, 세포는 Cas9 프로그램가능한 뉴클레아제, 가이드 핵산, 또는 이의 조합을 포함하거나 추가로 포함한다. 일부 실시형태는 세포 내로 도입하는 것, 또는 세포에서 Cas9 프로그램가능한 뉴클레아제를 발현하는 것을 포함한다. 일부 실시형태는 세포 내로 도입하는 것, 또는 세포에서 가이드 핵산을 발현하는 것을 포함한다. Cas9 프로그램가능한 뉴클레아제는 DNA 중합효소의 일부일 수 있거나 DNA 중합효소와 연관될 수 있다. 다양한 양태에서, 낮은 dNTP 농도는 비분할 세포에서 발견되는 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 활성화된 말초 혈액 단핵 세포에서 발견되는 dNTP 농도보다 낮다. 다양한 양태에서, 낮은 dNTP 농도는 1 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, dNTP 농도를 증가시키는 것은 기준선 dNTP 측정에 비하여 dNTP 농도를 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 또는 그 초과까지 증가시키는 것을 포함한다. 다양한 양태에서, dNTP 농도는 데옥시아데노신 트리포스페이트(dATP) 농도, 데옥시시티딘 트리포스페이트(dCTP) 농도, 데옥시구아노신 트리포스페이트(dGTP) 농도, 또는 데옥시티미딘 트리포스페이트(dTTP) 농도, 또는 이의 임의의 조합을 포함한다.
다양한 양태에서, 본 개시내용은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 갖는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하는 것으로, 이는 세포에서 dNTP 농도를 증가시키는 것을 포함하며, 여기서 세포는 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 포함한다. 다양한 양태에서, 본 개시내용은 낮은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 갖는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하는 것으로, 이는 세포를 낮은 dNTP 농도에서 효율적인 촉매작용을 위해 변형된 유전자 편집 효소와 접촉시키는 것, 또는 세포에 유전자 편집 효소를 발현시키는 것 포함한다. 일부 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 세포에서 SAMHD1을 억제하는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키는 것, 또는 세포에 Vpx 단백질을 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키는 것, 또는 세포에 마이크로RNA 또는 siRNA를 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함한다. 일부 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP를 세포에 투여하는 것을 포함한다. 일부 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함한다. 일부 양태에서, dNTP 합성 효소는 데옥시뉴클레오시드 디포스페이트(dNDP) 키나제를 포함한다. 일부 양태에서, 유전자 편집 효소는 Cas9 프로그램가능한 뉴클레아제 또는 역전사효소를 포함한다. 일부 양태에서, 역전사효소는 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 도입함에 의해 변형된다. 일부 실시형태에서, 방법은 dNTP 농도를 측정하는 것을 추가로 포함한다. 일부 실시형태는 dNTP 농도를 증가시킨 후 dNTP 농도를 측정하는 것, 및 기준선 dNTP 농도에 비교한 증가를 결정하는 것을 포함한다.
일부 실시형태는 dNTP 농도에서의 증가를 결정하는 것을 획득하는 것을 포함한다. 일부 실시형태는 dNTP 농도를 측정하는 것을 포함한다. 일부 실시형태에서, dNTP 농도는 흡광도 검정, 비색 검정 또는 효소-결합 면역흡착 검정과 같은 검정을 사용하여 측정된다. 일부 실시형태는 기준선 dNTP 농도를 측정하는 것을 포함한다. 일부 실시형태에서, 기준 dNTP 농도는 흡광도 검정, 비색 검정, 또는 효소-결합 면역흡착 검정과 같은 검정을 사용하여 측정된다.
게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시되어 있다. 방법은 세포에서 SAMHD1을 억제하는 것을 포함할 수 있다. 세포는 Cas9 프로그램가능한 뉴클레아제를 발현할 수 있다. 세포는 Cas 닉카제를 발현할 수 있다. 세포는 역전사효소를 발현할 수 있다. 세포는 가이드 핵산을 발현할 수 있다. SAMHD1을 억제하는 예는 세포를 소분자 SAMHD1 억제제와 같은 SAMHD1 억제제로 처리하는 것을 포함할 수 있다. SAMHD1을 억제하는 예는 세포에서 SAMHD1에 대한 마이크로RNA를 발현하는 것을 포함할 수 있다.
편집 효율을 증가시키기 위한 단백질은 Vpx 단백질(예를 들어, 서열번호: 82, 서열번호: 83, 또는 서열번호: 93)일 수 있다. Vpx는 일부 경우에 렌티바이러스 단백질이다. Vpx는 일부 경우에 (예를 들어 SAMHD1을 억제함에 의해) 편집 효율을 증가시키기 위해 사용할 수 있는 면역결핍 바이러스(SIV) 단백질이다. Vpx 단백질은 세포에서 dNTP의 이용가능성을 증가시킴에 의해 Cas9-RT 작제물의 편집 효율을 증가시킬 수 있다. 예를 들어, Vpx 단백질은 SAMHD1의 dNTP 절단 활성을 억제하여 세포에서 dNTP의 이용가능성을 증가시킬 수 있다. 일부 실시형태에서, Vpx 단백질은 본 개시내용의 Cas9-RT 작제물과 함께 세포에서 공동-발현될 수 있다. Vpx 단백질로 발현된 Cas9-RT 작제물은 Vpx 단백질의 부재에서 Cas9-RT 작제물에 비해 증가된 편집 효율을 가질 수 있다. Vpx 펩티드는 Hiv2-rod Vpx(예를 들어, 서열번호: 82)일 수 있다. 일부 실시형태에서, Vpx 단백질은 그 자신의 코딩 서열로서 발현될 수 있다. 일부 실시형태에서, Vpx 단백질은 역전사효소와 동일한 코딩 서열로 발현될 수 있다. 예를 들어, Vpx 단백질은 p2a 자가-절단 펩티드(예를 들어, 서열번호: 83)에 의해 분리된, 역전사효소와 동일한 코딩 서열로 발현될 수 있다. 일부 실시형태에서, Vpx 단백질은 Vpx RH-2-1 D8 단백질(예를 들어, 서열번호: 93)일 수 있다. 일부 실시형태에서, Vpx 단백질은 Cas9 단백질과 동일한 코딩 서열로 발현될 수 있다. SAMHD1을 억제하는 것은 세포에서 Vpx 단백질을 발현하는 것을 포함할 수 있다.
세포에서 Vpx 단백질을 발현시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시된다. 세포는 본 명세서에 기재된 조성물을 발현할 수 있다. 세포는 본 명세서에 기재된 가이드 핵산을 발현할 수 있다.
일부 실시형태는 SAMHD1과 같은 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제(dNTPase)를 억제함에 의해 세포에서 dNTP 농도를 증가시키거나, 유전자 편집을 개선하는 방법을 포함한다. 일부 실시형태는 SAMHD1을 억제하기 위한 조성물에 관한 것이다. Vpx 단백질을 사용하여 SAMHD1을 억제할 수 있다. BGLF4 단백질을 사용하여 SAMHD1을 억제할 수 있다. BGLF4는 SAMHD1을 인산화하고 이에 의해 SAMHD1의 dNTPase 활성을 억제할 수 있다. BGLF4는 일부 경우에 Epstein-Barr 바이러스(EBV)-인코딩된 단백질 키나제이다. EBV-인코딩된 단백질 키나아제는 (예를 들어 SAMHD1을 억제함에 의해) 편집 효율성을 증가시키기 위해 사용될 수 있다. SAMHD1 억제용 조성물은 소분자 SAMHD1 억제제를 포함할 수 있다. 소분자 SAMHD1 억제제는 pppCH2dU 또는 이의 염을 포함할 수 있다. 소분자 SAMHD1 억제제는 dGMPNPP 또는 이의 염을 포함할 수 있다.
세포에서 뉴클레오시드 또는 뉴클레오티드(예를 들어 dNTP)의 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시되어 있다. 세포는 Cas9 프로그램가능한 뉴클레아제를 발현할 수 있다. 세포는 Cas 닉카제를 발현할 수 있다. 세포는 역전사효소를 발현할 수 있다. 세포는 가이드 핵산을 발현할 수 있다. 세포에서 dNTP의 농도를 증가시키는 예는 뉴클레오티드 또는 뉴클레오시드를 세포에 전달하는 것을 포함한다. 세포에서 뉴클레오시드 또는 뉴클레오티드의 농도를 증가시키는 것은 세포로 뉴클레오시드 또는 뉴클레오티드의 전달을 포함할 수 있다. 그런 다음 뉴클레오티드 또는 뉴클레오시드는 세포에서 dNTP로 전환될 수 있다. 뉴클레오시드 또는 뉴클레오티드의 전달은 경구 전달 또는 주사를 포함할 수 있다. 뉴클레오시드 또는 뉴클레오티드의 dNTP로의 전환은 내인성 키나제 또는 시나데시스에 의한 인산화, 예를 들어 내인성 샐비지 경로를 통한 것일 수 있다. 방법은 뉴클레오티드 또는 뉴클레오시드를 세포에 전달하여 뉴클레오티드 또는 뉴클레오시드를 받지 않은 세포와 비교하여 세포에서 dNTP의 증가된 농도를 초래하는 것을 포함할 수 있다. 세포에서 dNTP의 증가된 농도는 본 명세서에 개시된 바와 같은 조성물을 포함하는 세포에서 증가된 편집 효율을 초래할 수 있다.
본 명세서에 dNTP 농도를 제한하는 데 더 잘 작동하는 RT 돌연변이를 스크리닝하기 위해 SAMHD1 과발현을 사용하는 것을 포함하는 방법이 개시되어 있다. 또한 SAMHD1 또는 SAMHD1의 인산화불가능한 돌연변이체를 과발현하도록 변형된 세포에서 개선된 RT를 스크리닝하거나 동정하기 위한 방법이 개시되어 있다. 일부 실시형태는 세포에서 SAMHD1을 과발현하는 것을 포함한다. 일부 실시형태는 세포에서 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현시키는 것을 포함한다. 일부 실시형태는 세포에서 RT 활성을 동정하는 것을 포함한다. 일부 실시형태는 RT 활성에 기반하여 개선된 RT로서 RT를 동정하는 것을 포함한다. 일부 실시형태는 개선된 역전사효소(RT)를 스크리닝하거나 동정하는 방법을 포함하는 것으로, 이는 SAMHD1을 과발현하거나, 세포에서 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현하는 것; 세포에서 RT 활성을 동정하는 것; 및 RT 활성에 기반하여, 개선된 RT로서 RT를 동정하는 것을 포함한다.
정밀 편집 구성요소의 전달을 위한 AAV 및 방법
Cas 닉카제, 역전사효소(RT), 또는 가이드 RNA(gRNA)와 같은 정밀 편집 구성요소가 본 명세서에 기술되어 있다. 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩될 수 있다. 폴리뉴클레오티드는 AAV에 의해 전달될 수 있다. 닉카제 및 RT를 인코딩하는 폴리뉴클레오티드는 AAV 내에 맞도록 조작될 수 있다. AAV 내에 맞도록 닉카제 및 RT를 조작하기 위한 예가 본 명세서에 제공된다. 예를 들어, 닉카제 및 RT는 이량체화하도록 조작될 수 있다. 닉카제와 RT는 공동발현될 수 있다. 닉카제는 인테인 시스템을 사용하여 분할될 수 있다. 닉카제의 일부는 RT와 융합 단백질로 결합될 수 있다. 예시적인 이량체화, 공동발현 및 분할 인테인 시스템의 목표는 4.5kb 담지 용량을 포함하는 AAV를 사용하여 게놈 편집 구성요소를 전달할 수 있도록 하는 것이다.
도 24는 nCas9 및 mcp-mlvRT5m을 발현하는 플라스미드가 ms2 헤어핀을 포함하거나 포함하지 않는 gRNA로 HEK293T-BFP 세포에서 공동형질감염되었을 때, 동일한 BFP 대 GFP 편집 효율이 달성되었음을 나타낸다. 이와 같이 동일한 세포에서 융합되지 않은 비-이량체화 nCas9와 역전사효소의 공동발현은 편집을 초래할 수 있다. 따라서 NLS-nCas9(서열번호: 138) 및 mlvRT5m-NLS(서열번호: 95)는 효율적인 편집을 달성하기 위해 별도의 AAV로부터 공동발현될 수 있다. 따라서, 동일한 세포에서 융합되지 않은 비-이량체화 Cas 닉카제와 역전사효소의 공동발현은 편집을 초래할 수 있다. 따라서 Cas 닉카제 및 RT는 효율적인 편집을 달성하기 위해 별도의 AAV로부터 공동발현될 수 있다. 마찬가지로, 이량체화하도록 조작된 Cas 닉카제 및 RT는 효율적인 편집을 달성하기 위해 별도의 AAV로부터 공동발현될 수 있다.
Cas 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩될 수 있다. Cas 닉카제 및 RT는 2개의 별도의 폴리뉴클레오티드에 의해 인코딩될 수 있거나, 하나의 일부가 다른 폴리뉴클레오티드에 포함될 수 있다(예를 들어, 본 명세서에 기재된 바와 같음). 하나 이상의 AAV는 폴리뉴클레오티드를 포함할 수 있다. Cas 닉카제 및 RT의 적어도 일부는 별도의 AAV 내에 포괄되거나 포함될 수 있다. Cas 닉카제 및 RT의 일부는 별도의 AAV 내에 포괄되거나 포함될 수 있다. Cas 닉카제 및 RT의 전부는 별도의 AAV 내에 포괄되거나 포함될 수 있다.
일부 경우에, Cas 닉카제 및 역전사효소를 포함하는 조성물이 포함되며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함되고, 여기서 Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성한다. 별도의 폴리펩티드 사슬은 별도의 폴리뉴클레오티드에 의해 인코딩될 수 있다. 별도의 폴리뉴클레오티드는 AAV와 같은 별도의 바이러스 벡터에 포함될 수 있다. 별도의 폴리뉴클레오티드는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 2개의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 2개 이하, 3개 이하, 4개 이하, 5개 이하, 6개 이하, 7개 이하, 8개 이하, 9개 이하, 또는 10개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 2개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 3개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 4개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다.
별도의 폴리뉴클레오티드는 별도의 AAV 게놈 내에 맞도록 충분히 짧을 수 있다(예를 들어 각각 약 4500bp 미만). 예를 들어, 별도의 폴리뉴클레오티드는 각각 약 도 19a에 기재된 크기일 수 있다. 별도의 폴리뉴클레오티드는 각각 약 도 19a에 기재된 크기보다 작거나 크지 않을 수 있다. 별도의 폴리뉴클레오티드는 각각 도 19a에 기재된 크기보다 약 10% 작거나 크지 않거나 또는 그보다 더 클 수 있다. 별도의 폴리뉴클레오티드는 각각 약 4500bp 미만일 수 있다. 별도의 폴리뉴클레오티드는 도 19a의 임의의 크기를 포함하는 범위, 또는 약 도 19a의 크기를 포함하는 범위와 같은, 폴리뉴클레오티드 크기의 범위를 포함할 수 있다.
일부 경우에, AAV는 제1 AAV를 포함한다. 제1 AAV는 제1 폴리뉴클레오티드를 포함할 수 있으며, 이는 본 명세서에 기재된 Cas 닉카제와 같은 Cas 또는 Cas 구성요소를 인코딩할 수 있다. AAV는 본 명세서에 기재된 RT와 같은 RT를 인코딩하는 제2 폴리뉴클레오티드를 포함할 수 있는 제2 AAV를 포함할 수 있다.
AAV의 예는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB, 또는 AAV-PHP.S, 또는 이의 조합을 포함할 수 있다. AAV의 예는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, 또는 AAV12와 같은 혈청형을 포함할 수 있다. AAV의 예는 AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB 또는 AAV-PHP.S와 같은 의사형을 포함할 수 있다.
AAV는 AAV 게놈을 포함할 수 있다. AAV 게놈은 pCMV-NLS-nSpCas9(1-1172)-NpuN-cMycNLS-48pA, 또는 이의 성분들의 임의의 조합을 포함할 수 있다. pCMV-NLS-nSpCas9(1-1172)-NpuN-cMycNLS-48pA를 포함하는 AAV 게놈은 서열번호: 142의 서열을 포함할 수 있다. AAV 게놈은 서열번호: 142의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다.
AAV 게놈은 pCMV-NpuC-nSpCas9(1173-1368;S1173C)-mlvRT14M-SV40 NLS-P2A-VPXrh21-48pA-pU6-ush2a-gRNA, 또는 이의 성분들의 임의의 조합을 포함할 수 있다. pCMV-NpuC-nSpCas9(1173-1368;S1173C)-mlvRT14M-SV40 NLS-P2A-VPXrh21-48pA-pU6-ush2a-gRNA를 포함하는 AAV 게놈은 서열번호: 143의 서열을 포함할 수 있다. AAV 게놈은 서열번호: 143의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다. AAV는 어셔 증후군의 치료, 또는 USH2A 돌연변이체를 복원하는데 유용할 수 있다. AAV는 어셔 증후군이 있는 대상체에게 투여될 수 있다.
대상체에게 AAV의 투여에 이어서, 대상체에서 게놈 편집이 측정되거나 분석될 수 있다. 하나 이상의 세포에 AAV의 투여에 이어서, 하나 이상의 세포에서 게놈 편집이 측정되거나 분석될 수 있다. 게놈 편집은 서열화에 의해 측정되거나 분석될 수 있다. 게놈 편집은 검정에 의해 측정되거나 분석될 수 있다. 검정은 대상체 또는 세포에서 편집된 게놈을 측정하거나 동정하는 것을 포함할 수 있다. 검정은 대상체 또는 세포에서 편집된 게놈으로부터 생성된 RNA를 측정하거나 동정하는 것을 포함할 수 있다. 검정은 대상체 또는 세포에서 편집된 게놈으로부터 생성된 단백질을 측정하거나 동정하는 것을 포함할 수 있다. 검정의 일부 예는 혼성화 검정, 면역검정, 비색 검정, 형광 검정 또는 질량분석을 포함한다.
일부 실시형태는 표적 유전자좌에서 DNA 분자의 뉴클레오티드 서열에 하나 이상의 변화를 도입하는 방법을 포함하는 것으로, 이는 표적 유전자좌에 프로그램가능한 뉴클레아제를 표적화하는 가이드 핵산 및 프로그래밍 가능한 뉴클레아제와 DNA 분자를 접촉시키는 것을 포함한다. 프로그램가능한 뉴클레아제는 역전사효소와 복합체를 형성할 수 있다.
정밀 편집 구성요소를 사용한 치료의 방법
일부 실시형태는 본 명세서에 기재된 방법 또는 조성물을 사용한 유전적 장애의 치료를 포함한다. 예를 들어, 일부 실시형태는 본 명세서에 기재된 유전자 편집 구성요소를 포함하거나 인코딩하는 하나 이상의 핵산을 투여하는 것을 포함한다. 예를 들어, 바이러스 벡터를 사용하여 투여된 핵산을 전달할 수 있다.
투여는 주사를 포함할 수 있다. 투여는 핵산을 포함하는 조성물의 투여를 포함할 수 있다. 투여는 바이러스 벡터를 포함하는 조성물의 투여를 포함할 수 있다. 조성물은 약학적 조성물을 포함할 수 있다. 조성물은 약학적 조성물을 포함할 수 있다. 약학적 조성물은 물, 완충액 또는 식염수와 같은 담체를 포함할 수 있다. 약학적 조성물은 리포좀을 포함할 수 있다.
투여는 이를 필요로 하는 대상체에 대한 것일 수 있다. 예를 들어, 투여는 유전적 장애가 있는 대상체에 대한 것일 수 있다. 대상체는 척추동물일 수 있다. 대상체는 포유동물일 수 있다. 대상체는 인간일 수 있다. 일부 실시형태에서, 투여는 대상체에서 질환-유발 유전자 돌연변이를 교정한다. 일부 실시형태에서, 투여는 대상체의 세포에서 질환-유발 유전자 돌연변이를 교정한다.
유전적 장애의 일부 비-제한적 예는 아데노신 탈아미노효소 결핍, 알파-1 항트립신 결핍, 낭포성 섬유증, 근이영양증(예를 들어 뒤센 근이영양증), 갈락토스혈증, 혈색소증, 헌팅턴병, 메이플 시럽 요증, 마르판 증후군, 신경섬유종증(예를 들어 유형 1), 선천성 후두염, 페닐케톤뇨증, 중증 복합 면역결핍증, 겸상적혈구병, 스미스-렘리-오피츠 증후군 또는 테이-삭스병을 포함한다. 일부 실시형태에서, 유전적 장애는 낭포성 섬유증, 스타가르트병, 어셔 증후군, 또는 헌팅턴병을 포함한다. 일부 실시형태에서, 유전적 장애는 낭포성 섬유증을 포함한다. 일부 실시형태에서, 유전적 장애는 스타가르트병을 포함한다. 일부 실시형태에서, 유전적 장애는 어셔 증후군을 포함한다. 일부 실시형태에서, 유전적 장애는 헌팅턴병을 포함한다. 일부 실시형태에서, 유전적 장애는 심장병, 고혈압, 알츠하이머병, 관절염, 당뇨병, 암 또는 비만과 같은 다유전자성 장애를 포함한다.
이중-가닥 파손 없는 AAV-전달가능한 정밀 편집
요약
게놈을 정확하게 편집하는 능력은 의료, 농업 또는 생명 과학에서 심오한 의미를 가질 수 있고 정확한 게놈 편집은 유전 질환을 치유할 수 있다. CRISPR 뉴클레아제가 이중 가닥 파손을 표적화하는 능력을 대중화했지만, 외래 상동 DNA를 사용하는 독성 이중-가닥 파손(DSB)의 부위에서 상동성-유도된 복구(HDR)의 비효율성으로 인해 정밀한 서열 변경을 생성하는 것은 어려웠다. 프라임 편집기는 HDR에 의존하지 않고 다양한 정밀 편집을 가능하게 했지만 유전자 전달 비히클 아데노-연관된 바이러스(AAV)로 전달되기에는 너무 큰 구성요소를 활용할 수 있거나, 제한된 편집 윈도우 길이를 가지거나, 효율적인 편집을 달성하기 위해 양 가닥을 모두 파손하거나, 또는 비-분열 세포에서 제한된 효율을 갖는다. 여기서 이들 제한은 리라이터라는 도구 세트로 극복되었다. 리라이터의 분할 시스템은 2개의 AAV 게놈 내에 유전자 편집 구성요소를 전달하기 위해 4개의 모듈식 아키텍처를 제공할 수 있다. 리라이터의 최적화된 역전사효소 및 가이드 RNA 위치화 시스템(GPS)은 하나의 단일-가닥 파손만 생성하면서 편집 효율과 편집 윈도우 길이를 증가시킬 수 있다. 마지막으로, 리라이터의 항-제한 인자는 비-분할 세포에서 편집을 증진한다. 리라이터는 65 뉴클레오티드 윈도우 내에서 75% 편집을 달성했으며, 이는 DSB를 생성하지 않고 포유류 세포에서 표적화된 다중-뉴클레오티드 변화에 대해 현재까지 보고된 가장 높은 효율이다. 마지막으로, 검출가능한 타겟-외 돌연변이가 없는 유전성 난청 및 실명 환자에서 일반적으로 돌연변이되는 게놈 부위를 정확하게 편집한 리라이터 구성요소가 개발되었다.
가이드 RNA 위치화 시스템(GPS), 제2 가닥 프라이머 및 비분할 세포에서 효율적인 편집을 제공하는 항-제한 인자를 사용하여 게놈과 인접한 정의된 이중 가닥 DNA의 합성을 위해 최적화된 역전사효소를 표적화하기 위해 조작된 Cas9 닉카제를 이용하는 이중 AAV-전달가능한 시스템인 리라이터를 사용하여 상동성-유도된 복구 또는 이중-가닥 파손 없이 다재다능한 효율적이고, 정확한 게놈 편집을 위한 조성물 및 방법이 본 명세서에 기재되어 있다. 리라이터는 65 뉴클레오티드 윈도우 내에서 최대 54% 효율로 복합 서열 변경을 정착했다. 이 시스템의 이점은 낭포성 섬유증이나 어셔 증후군과 같은 유전적 장애를 유발하는 돌연변이를 교정하는데 사용될 수 있다는 것이다. 어셔 증후군의 유전적 결함의 교정은 난청이나 실명을 예방하거나 치료하는데 사용될 수 있다. 리라이터의 안전성, 효율성, 정밀도 및 다용성은 질환을 치료하거나, 식품을 개선하거나 또는 기초 생물학 연구를 발전시키기 위해 사용될 수 있다.
도입
CRISPR 뉴클레아제는 게놈 DNA에서 표적화된 이중-가닥 파손을 생성하기 위한 간단한 접근법을 제공할 수 있다. 그러나, 게놈 표적의 서열을 정확하게 변경하는 것은 상동성-유도된 복구의 비효율성, 이중-가닥 파손의 독성, 상동 공여자 DNA를 전달하는 난제로 인해 어려웠다. DSB는 표적 유전자를 넘어 연장되는 길고 부정확한 결실을 초래할 수 있고 심지어 전체 염색체의 제거를 초래할 수도 있다. 부가적으로, 게놈 편집기 자체를 인코딩하는 벡터가 의도하지 않게 DSB의 부위에 통합될 수 있다. 마지막으로 단일 DSB라도 p53 경로를 활성화하여 세포자멸사를 초래할 수 있다. CRISPR-가이드된 뉴클레오티드 탈아미노효소 또는 염기 편집기는 이중-가닥 파손을 피할 수 있고 상동성-유도된 복구에 의존하지 않을 수 있지만 모든 치환의 하위집합을 만드는 것으로 또한 제한될 수 있고 게놈 및 전사체 표적-외 돌연변이를 야기할 수 있다. 프라임 편집은 Cas9 절단 부위의 프로토스페이서 인접 모티프(PAM)-근위측에서 30-뉴클레오티드(nt) 윈도우 내에 삽입, 삭제 및 복잡한 서열 변경을 정착하기 위한 보다 정확하고 다양한 접근법일 수 있다. 프라임 편집기(PE)는 CRISPR 가이드 RNA(gRNA)의 3' 연장에서 프라이머 결합 부위(PBS)에 혼성화할 수 있는 게놈 플랩을 생성하는 닉킹 스트렙토코커스 피오게네스 Cas9(nSpCas9)를 포함할 수 있다. nSpCas9에 융합된 5개 점 돌연변이(mlvRT5M)를 포함하는 몰로니 백혈병 바이러스 역전사효소는 게놈 플랩을 프라이머로 활용하여, 또한 gRNA의 3' 연장에 포함된 RT 주형(RTT)의 서열에 따라 원하는 편집을 포함하는 DNA의 가닥을 합성할 수 있다. 편집 효율은 다른 가닥을 흠집내는 제2 gRNA를 발현함에 의해 증가될 수 있다. 불행히도, PE는 일반적으로 너무 커서 아데노-연관된 바이러스(AAV)로 전달된다. 부가적으로, PE는 비-분할 세포에서 효율성이 제한적일 수 있고, 두 가닥 모두를 흠집낼 때 의도하지 않은 삽입 또는 결실을 생성하거나, 단일 작제물로 교정될 수 있고 편집 부위 근처에서 이용할 수 있는 PAM을 요할 수 있는 병원성 돌연변이의 수를 제한할 수 있는 짧은 편집 윈도우 길이를 가질 수 있다. 일부 경우에, 더 큰 윈도우 내에 임의의 유형의 돌연변이를 정착할 수 있고 이중-가닥 파손을 생성하지 않고 세포를 분열 및 비-분할하는데 있어서 프라임 편집기보다 더 높은 효율을 갖는, 리라이터라고 하는 유전자 편집 시스템이 본 명세서에 기술되어 있다. 이것은 AAV로 전달되는 구성요소를 사용하여 수행될 수 있다.
AAV에 맞는 정밀 편집기
프라임 편집기 및 분할 인테인 프라임 편집기는 표적 부위에 많은 유형의 돌연변이를 정착할 수 있는 반면, 그의 코딩 서열 단독은 너무 커서 AAV의 4.5 킬로베이스(kb) 담지 용량 내에 맞지 않을 수 있다(도 19a). 최소 2개의 AAV 게놈 내에서 전달될 수 있는 구성요소를 갖는 정밀 편집의 이점을 제공하기 위해, 리라이터 a1("RWa1" 또는 "RW1M")이 개발되었다. RWa1은 mlvRT5M에 융합된 MS2 코트 단백질(MCP) 펩티드와 공동발현된 nCas9 및 MCP 펩티드가 특이적으로 결합할 수 있는 MS2 헤어핀을 포함하는 gRNA를 포함할 수 있다. RW1M은 nSpCas9에 의해 결합된 gRNA 안으로 MS2 헤어핀을 통합하여 mlvRT5M에 융합된 MS2-결합 펩티드(MBP)를 모집할 수 있다. RW1M은 하나의 AAV에서 nSpCas9, 및 다른 AAV에서 MBP-mlvRT5M 및 gRNA의 전달을 허용할 수 있다(도 27).
도 27에 도시된 바와 같이, PE2를 포함하는 편집 시스템은 5개 점 돌연변이를 함유하는 몰로니 백혈병 바이러스 역전사효소(mlvRT5M)에 융합된 닉킹 Cas9(nCas9)를 포함할 수 있다. PE2에서 사용되는 가이드 RNA는 역전사효소 주형(RTT) 서열과 프라이머 결합 부위(PBS) 서열을 함유하는 스캐폴드 서열의 3' 말단에 연장을 포함할 수 있다. nCas9는 먼저 PBS와 혼성화하는 게놈 플랩을 방출하는 비-표적 가닥을 흠집낼 수 있다. 그런 다음 mlvRT5M은 RTT를 역전사하여 게놈 플랩을 연장할 수 있다. 분할 PE2를 포함하는 편집 시스템은 nCas9-mlvRT5M 융합 단백질을 형성하기 위해 함께 촉매적으로 스플라이싱하는 2개의 ORF를 발현하기 위해 Npu 분할 인테인을 이용할 수 있다. 리라이터 1M(RW1M)을 포함하는 편집 시스템은 nCas9, mlvRT5M에 융합된 MS2-결합 펩티드(MBP) 및 MBP가 특이적으로 결합하는 MS2 헤어핀을 포함하는 gRNA를 활용할 수 있다(도 27: 왼쪽: MS2 헤어핀은 gRNA 스캐폴드 내에 삽입될 수 있음; 중간: MS2 헤어핀은 gRNA 스캐폴드와 RTT 사이에 삽입될 수 있음; 오른쪽: MS2 헤어핀은 PBS 뒤에 삽입될 수 있음). RW1L을 포함하는 편집 시스템은 이종이량체화 류신 지퍼를 이용하여 nCas9 및 mlvRT5M을 공동국지화할 수 있다. RW1I를 포함하는 편집 시스템은 AAV에 각각 맞는 ORF를 사용하여 nCas9-mlvRT5M 단백질을 생성하기 위해 Npu 인테인으로 분할될 수 있는 신규한 돌연변이 nCas9를 이용할 수 있다. RW1N을 포함하는 편집 시스템은 임의의 조작된 모집 구성요소 없이 nCas9 및 mlvRT5M을 공동발현할 수 있다.
정밀 편집 효율은 특정 3-뉴클레오티드(nt) 돌연변이를 정착함에 의해 GFP로 편집될 수 있는, BFP를 안정적으로 발현하는 HEK293 세포주를 사용하여 결정되었다. 제1 단백질 성분(nSpCas9)을 발현하는 플라스미드, 제2 단백질 성분(MBP-mlvRT5M)을 발현하는 제2 플라스미드, 및 gRNA를 발현하는 제3 플라스미드를 HEK293 세포주 안으로 일시적으로 동시형질감염시켰다. Cas9-결합 스캐폴드 내에 MS2 헤어핀 삽입을 포함하고, PAM 부위를 제거하고 GFP 돌연변이를 정착하기 위한 +2 ATGG에서 CATA로의 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT로 추가 변형된, gRNA 2.0과 RWa1을 발현하는 플라스미드(nCas9 및 MCP-mlvRT5M)의 공동형질감염은, PE2로의 19%와 비교하여 3.7% GFP+ 세포를 초래했다(도 11b). MS2 헤어핀을 게놈 플랩과 PBS의 부위에 더 가깝게 삽입하면 모집된 MBP-mlvRT5M에 의한 역전사의 개시를 촉진할 수 있다. RWa1의 편집 효율은 비변형된 gRNA 스캐폴드와 RTT 사이에 MS2 헤어핀을 삽입함에 의해 15.5%로 증가되었다.
리라이터 b1("RWb1" 또는 "RW1L")은 2개의 AAV 게놈 내에서 편집 구성요소를 전달하기 위한 대안적인 접근법일 수 있다. 편집 구성요소는 mlvRT5M의 N-말단에 융합된 다른 류신 지퍼(LZ2-mlvRT5M)와 이종이량체화되는 류신 지퍼(nSpCas9-LZ1)에 융합된 nCas9를 포함할 수 있다(도 19a). +2 ATGG에서 CATA로 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT를 포함하는 gRNA 2.0과 RWb1을 발현하는 플라스미드(nSpCas9-LZ1 및 LZ2-mlvRT5M)의 공동형질감염은 38% GFP+ 세포를 초래했다(도 11b). 도 11b에 도시된 바와 같이, Cas9-결합 스캐폴드 내에 MS2 헤어핀 삽입을 함유할 수 있고, PAM 부위를 제거하고 GFP 돌연변이를 정착하기 위한 +2 ATGG에서 CATA로의 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT로 추가 변형된, gRNA 2.0과 PE2로 형질감염된 HEK293 세포는 19%의 편집 효율을 초래했다. 동일한 gRNA를 갖는 RWa1은 3.7% GFP+ 세포를 초래했다. 비변형된 gRNA 스캐폴드와 RTT 사이에 MS2 헤어핀을 삽입함에 의해 RWa1의 편집 효율을 15.5%로 증가되었다. RWb1 및 +2 ATGG에서 CATA로의 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT를 포함하는 gRNA 2.0 작제물은 38% GFP+ 세포를 초래했다. RW1L은 2개의 AAV 게놈 내에서 편집 구성요소를 전달하기 위한 대안적인 설계로 개발되었다. RW1L은 mlvRT5M의 N-말단에 융합된 상보적 류신 지퍼(LZ2-mlvRT5M)와 이종이량체화되는 류신 지퍼17에 융합된 nSpCas9(nSpCas9-LZ1)를 포함할 수 있다. (gRNA 2.0에서 MS2 헤어핀이 반드시 RW1L의 구성요소와 상호작용할 것으로 예상되지는 않았지만), RW1M과 직접 비교할 수 있도록 RW1L은 처음에 RW1M용으로 구축된 gRNA 2.0 스캐폴드를 함유하는 동일한 gRNA로 시험되었다.
RWa1 및 RWb1은 각각 AAV 패키징에 허용되는 크기 제한 내에 있는 2개의 폴리펩티드를 포함할 수 있지만, nSpCas9 및 nSpCas9-LZ1 개방 판독 프레임(ORF)의 크기는 제어 발현에 포함될 수 있는 조절 요소의 길이를 제한할 수 있다. 일부 경우에, Npu C-말단 엑스테인의 제1 잔기로 시스테인에 대한 가능한 요건에 기인하여, 분할 프라임 편집기 2는 nSpCas9-mlvRT5M을 nSpCas9에서 가장 C-말단 시스테인인 Cys574에서 2개의 단편으로 분할하는 인테인을 포함할 수 있다. 적절한 인테인-측접하는 서열이 nSpCas9의 잔기 700과 1250 사이에 도입될 수 있다면, 2개의 인테인-포함 ORF를 갖는 변형된 nSpCas9-mlvRT5M 융합 단백질이, 그렇지 않으면 RWa1 및 RWb1이 허용할 수 있는 것보다, 조절 요소를 위한 더 많은 공간을 갖는 2개의 재조합 AAV 게놈 내에서 인코딩될 수 있다고 고려되었다. mlvRT5M 및 (일부 경우에, 인테인 촉매를 제공하는) 시스테인 치환을 포함하는 nSpCas9의 C-말단 단편에 융합된 Npu C-말단 인테인과 쌍을 이룬 Npu N-말단 인테인에 융합된 nSpCas9의 N-말단 단편을 인코딩하는 작제물의 패널이 시험되었다. 잔기 1172와 1173(nCas9(1-1172)-NpuN 및 nCas9(1173-1368; S1173C)-mlvRT5M; "RWc1" 또는 "RW1I"로 명명됨) 사이의 Ser1173Cys nSpCas9-mlvRT5M 돌연변이체를 분할하는 것은 PE2보다 약 2-배 더 큰 편집 효율(29% 대 15%, 도 19b)을 초래했다.
표준 gRNA 스캐폴드를 사용하여, RWa1, RWb1 및 RWc1은 모두 40% 초과의 편집 효율을 초래하는 것으로 밝혀졌다(도 19c). 놀랍게도, MS2 헤어핀을 함유하지 않는 gRNA의 nCas9 및 MCP-mlvRT5M 작제물과의 공동발현은 MS2 헤어핀을 포함하는 gRNA와 비교하여 대략적으로 동일한 편집 효율을 초래하여, RT를 모집하거나 nCas9 부위에 융합하는 것이 항상 필요하지 않을 수 있거나, 단순히 nCas9와 RT를 공동발현하면 효율적인 편집을 초래할 수 있다는 것을 나타낸다. mlvRT를 능동적으로 모집하지 않은 작제물을 리라이터 d1("RWd1" 또는 "RW1N")이라고 한다. AAV 전달의 맥락에서, RWc1은 최대 대략적으로 670nt의 조절 요소를 수용할 수 있으므로 사용될 수 있다. 각 바이러스에 대해 2.8 x 105의 MOI에서 2개의 별도의 AAV2 작제물로 패키징된 RWc1로 BFP를 발현하는 HEK293 세포를 형질도입하는 것은 74.8% GFP+ 세포를 초래했다(도 19d).
리라이터의 AAV-매개된 전달을 입증하기 위해, 584-nt CMV 프로모터를 수용한 RW1I의 N-말단 단백질 성분을 AAV2 벡터 안으로 패키징하면서 별도의 AAV2 벡터 안으로, RW1I의 C-말단 단백질 성분(또한 CMV 프로모터에 의해 구동됨) 및 U6 프로모터에 의해 구동되는 BFP를 GFP로 전환시키는 gRNA를 패키징했다. 각 바이러스에 대해 2.8 x 105 VG/세포의 MOI에서 BFP-발현 HEK293 세포의 동시적인 AAV 공동-형질도입은 74.8% GFP+ 세포를 초래했다.
결과는 RW1M, RW1L, RW1I, 또는 RW1N이 상이한 gRNA 간에 상이한 편집 효율을 가질 수 있음을 나타내므로, 일부 실시형태는 주어진 gRNA로 효율을 최대화하기 위해 여러 아키텍처를 스크리닝하는 것을 포함한다. RW1I는 두 AAV 게놈 모두에서 조절 요소를 위한 가장 많은 공간을 제공할 수 있는 반면, RW1L 및 RW1N은 제2 AAV 게놈에서 다중 gRNA 카세트를 수용할 수 있다. RW1N은 놀랍게도 플라스미드 형질감염을 사용할 때 다른 아키텍처와 유사한 편집 효율을 제공했지만, 이는 활성 모집에 대한 가능한 필요성을 제거하기 위해 단백질 성분의 충분히 높은 세포내 농도를 요할 수 있다. 따라서, RW1N은 일부 경우에 대안적인 전달 전략 및 발현 수준으로 높은 편집 효율을 제공하지 않을 수 있다.
RNA 연장 재배향
가이드 RNA 연장의 공간적 재배향은 편집 효율 또는 윈도우 길이를 증가시킬 수 있다. 편집 윈도우 길이를 늘리면 주어진 돌연변이의 효율적인 편집을 위해 더 많은 gRNA를 스크리닝하는 것을 허용할 수 있거나 단일 gRNA로 더 많은 병원성 돌연변이를 교정할 수 있다. 부가적으로, 프라임 편집기 3b는 RT에 의해 생성된 서열에 결합하고 반대쪽 가닥을 흠집내는 제2 gRNA를 발현함에 의해 편집 효율을 증가시켜, 이에 의해 RT-합성된 편집의 닉-매개된 불일치 복구를 회피할 수 있다. 프라임 편집기 3b 접근법은 일부 경우에 프라임 편집기의 제한된 편집 윈도우 길이 내에 PAM 부위를 갖는 표적 부위로 제한될 수 있다. 편집 윈도우 길이를 증가시키는 것은 RTT의 길이를 증가시키는 것을 요할 수 있다. 리라이터와 PE의 편집 효율은 더 긴 RTT를 사용할 때 PBS와 게놈 플랩의 혼성화의 속도에 의해 제한될 수 있다는 가설을 세웠다. 또한 RTT의 길이가 증가할 수 있다면 감소가 gRNA 스캐폴드의 일부의 역전사의 빈도에 영향을 미칠 수 있으며, 이는 게놈 안으로 스캐폴드-주형 서열의 바람직하지 않은 삽입으로 의도치않게 이어질 수 있다는 것이 예측되었다. 여기에서 gRNA 위치화 시스템(GPS)으로 지칭되는 RNA 구성요소가 설계되었으며, 이는 RTT의 길이에 관계없이 PBS가 게놈 플랩 근처에 있도록 공간적으로 배향하기 위해 gRNA의 3' 연장 안으로 도입될 수 있다. GPS 버전 1(V1)은 RTT의 3' 영역과 혼성화할 수 있는 RTT의 5'에 삽입된 RNA 서열을 포함할 수 있고/있거나 GPS 버전 2(V2)는 RTT의 5' 부분과 혼성화할 수 있는 PBS의 3'에 삽입된 RNA 서열일 수 있다(도 20a). 전산적 RNA 접힘 분석은 GPS V1 및 V2가 PBS를 의도한 대로 gRNA의 3' 연장의 5' 말단에 더 가깝게 가져올 것이라고 예측했다(도 12b). RNA 접힘 분석은 GPS V1과 V2가 gRNA의 3' 연장의 구조를 변경하여 PBS를 gRNA 스캐폴드에 더 가깝게 가져올 수 있다고 예측했다.
GPS는 또한 벨크로로 지칭될 수 있다. 마찬가지로, 벨크로는 GPS로 지칭될 수 있다. GPS는 벨크로 또는 벨크로의 구성요소를 포함할 수 있다. 벨크로는 GPS 또는 GPS의 구성요소를 포함할 수 있다.
RWb1 및 107-nt RTT를 포함하는 가이드 RNA의 공동형질감염은 14% GFP+ 세포를 생성하였으며, 이는 더 짧은 13-nt RTT를 사용하여 달성된 38%보다 현저히 낮았고, 따라서 편집 윈도우를 넓히기 위해 RTT 길이를 증가시키는 것은 편집 효율을 감소시킬 수 있다는 것을 확인하였다. 20-nt GPS V2를 추가하는 것은 편집 효율을 27.4%로 증가시켰다. GPS V1은 편집 효율을 14%에서 24.8%로 증가시켰다. GPS V1은 GPS 서열의 역전사 및 게놈 삽입을 유발하는 데 사용될 수 있다. PBS의 3'인 20-nt GPS V2의 사용은 편집 효율을 27.4%로 증가시켰고 GPS 서열의 게놈 삽입 가능성이 없다. GPS V2가 진행되었고, GPS V2 구성요소를 사용한 리라이터 시스템은 "리라이터 2.0"으로 지칭될 수 있거나 "g"로 표시될 수 있다(예를 들어 "RW1I_g"). 다음으로, 129-nt 주형을 사용하여 흠집 부위로부터 3-nt 돌연변이 65-nt를 정착하는 것은 GPS V2를 통합함에 의해 4-배 증가되었다는 것이 발견되었다(도 20b). 표적 부위의 아미노산 서열을 유지하면서 역전사를 억제할 수 있는 2차 구조를 제거하기 위해 RTT를 재코딩함에 의해 이 편집을 만드는 효율이 21%로 증가되었다. 마지막으로, 다양한 길이와 결합 부위의 GPS의 패널이 생성되었고, RTT의 처음 20-nt에 혼성화된 20-nt GPS는 세트 중 가장 높은 편집 효율을 초래했다(도 12d). RTT의 처음 20-nt에 혼성화된 20-nt GPS는 다양한 길이와 결합 부위의 GPS V2의 패널 중에서 가장 높은 편집 효율을 초래했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균 ± 1 표준 편차로 도시된다.
제2 가닥 합성
다음으로, 편집 효율은 제1 합성된 가닥에 상보적인 원하는 편집을 포함하는 DNA의 제2 가닥을 합성함에 의해 더 증가될 수 있다는 가설을 세웠다. 제2 가닥 프라이머(SSP)가 도입되었다. SSP는 역전사효소가 제1 합성된 가닥을 제2 가닥 합성을 위한 주형으로 사용하는 것을 허용할 수 있다(도 13a). SSP는 3' gRNA 연장의 3' 말단 안으로 삽입될 수 있다. SSP는 편집 부위의 3'인 제1 합성된 가닥의 일부에 혼성화할 수 있다. PBS가 플랩에 혼성화되고 제1 가닥이 역전사된 후, SSP는 제1 합성된 가닥에 혼성화하여 역전사효소가 제1 합성된 가닥을 제2 가닥 합성을 위한 주형으로 사용하는 것을 허용할 수 있다.
SSP는 편집 부위의 3'인 제1 합성된 가닥의 일부에 혼성화할 수 있다. SSP의 시작부터 gRNA의 3' 말단까지의 영역이 제1 합성된 가닥에 상보적이 되도록 하기 위해, 자가-절단 간염 델타 바이러스(HDV) 리보자임이 SSP의 3'에 도입되었다. SSP가 PE2의 편집 효율을 개선할 수 있었는지 여부가 먼저 시험되었다. 20-nt SSP는 40-nt 또는 60-nt SSP보다 더 나은 성능을 발휘하는 것으로 밝혀졌다(도 13b). 20-nt SSP는 40- 및 60-nt SSP보다 더 나은 성능을 발휘했다. 흠집 부위에서 최대 6- 및 36-nt를 혼성화한 20-nt SSP를 통합하는 것은 SSP가 없는 경우에 비해 편집 효율이 대략적으로 2배 증가했다. 흠집 부위에서 최대 55-nt까지 혼성화한 20-nt SSP는 편집 효율을 개선시키지 않았다. 이것은 RTT의 더 원위 부분의 역전사의 낮은 효율에 기인하고, 이에 의해 SSP 결합 부위의 이용가능성이 제한되었기 때문인 것으로 예측되었다. 이 SSP 기술을 활용하는 시스템은 리라이터 3.0으로 명명되었다. 그런 다음 SSP는 리라이터 2.0을 사용한 벨크로 후에 삽입되어 편집 효율을 추가로 증가시킬 수 있어, ~41% 편집을 초래하였다는 것이 밝혀졌다(리라이터 3.2, 도 21). 또한 SSP의 말단 3-nt가 제1 합성된 가닥에 상보적이지 않을 때 SSP가 제공하는 효율에서의 증가가 폐지되었다는 것이 입증되었다.
HDV 리보자임은 3' 말단 상에 2'3' 사이클릭 포스페이트를 남길 수 있고 역전사는 프라이머로부터 합성을 개시하기 위해 3' 하이드록실을 사용할 수 있기 때문에, 인간 폴리뉴클레오티드 키나아제와 같은 내인성 효소는 2'3' 사이클릭 포스페이트를 3' 하이드록실로 전환할 수 있다. HDV 리보자임 대신에 SSP 후에 tRNA를 합체하는 것은 tRNA의 RNase P 절단에 이어 3' 하이드록실의 더 빠른 생성을 초래할 수 있다고 예측되었다. 인간 글루타메이트 tRNA를 합체하는 것은 50.9%로 편집 효율에서의 통계적으로 유의미한 증가를 초래했다. 닉으로부터 편집 65-nt를 만드는 효율은 표적 부위의 아미노산 서열을 유지하면서 역전사를 억제할 수 있는 2차 구조를 제거하기 위해 RTT를 다시 코딩함에 의해 약간 증가되었다.
mlvRT 조작
PE2는 시험관내 역전사효소 활성을 개선시키는 것으로 보고된 PE1의 mlvRT 안으로 돌연변이를 도입함에 의해 개발되었다. PE2에 사용된 mlvRT는 연속성, 열안정성, 기질 친화성을 증가시키거나 RNaseH 활성을 조절하는 돌연변이를 합체함에 의해 추가로 개선될 수 있다. 따라서, 시험관내 mlvRT 활성을 개선할 수 있는 mlvRT에서 31개 돌연변이가 스크리닝되었다(도 14a). 5개 돌연변이는 편집에서 통계적으로 유의한 증가를 가졌다. mlvRT5M 상의 이들 돌연변이의 조합의 효과를 테스트하여 편집 효율에서 잠재적인 증가를 결정했다. mlvRT5M에 9개 돌연변이를 추가함에 의해, 편집 효율이 mlvRT5M에 대해 ~43%에서 mlvRT14M에 대해 ~54%로 증가되었다(도 14b). mlvRT14M을 합체하는 시스템은 "리라이터 4" 또는 "리라이터 2"(예를 들어 "RW2I_g")로 지칭될 수 있다.
낮은 dNTP 농도 극복
PE 또는 리라이터의 일부 실시형태와 같은 역전사효소를 사용하여 DNA를 중합하는 게놈 편집기는 dNTP를 기질로 사용할 수 있다. 따라서 비-분열하거나 느리게 분열하는 세포(예컨대 망막 및 폐)의 낮은 dNTP 농도 특성은 배양에서 빠르게 분열하는 세포의 편집과 비교하여 가능하기로는 장벽을 제기할 수 있다고 생각할 수 있다. SAMHD1은 세포질 dNTP 농도를 조절할 수 있는 트리포스포히드롤라제이다. 비분열 세포에서, SAMHD1은 dNTP를 가수분해할 수 있다. 순환 세포에서, 사이클린 의존성 키나제 1(CDK1)은 SAMHD를 인산화할 수 있다. 이것은 dNTP 가수분해를 억제할 수 있다. 이것은 더 높은 dNTP 농도로 이어질 수 있다. SAMHD1 T592A 돌연변이체("SAMHD1p-" 또는 "SAMHD1(T592A)")는 일부 경우에 인산화되지 않을 수 있으며, 따라서 CDK1의 존재 여부에 관계없이 dNTP 풀을 고갈시킬 수 있다. VPX는 분해를 위해 SAMHD1을 특이적으로 표적화하도록 HIV-2에 의해 발현되는 작은 단백질일 수 있다. HEK293T 세포에서 비분열 및 느리게 분열하는 세포의 더 낮은 dNTP 농도는 SAMHD1p-를 발현함에 의해 모델링될 수 있는 것으로 예측되었다(도 15a).
도 15b는 SAMHD1p-로 리라이터 3.2("RW1L_g"로도 지칭될 수 있음)를 공동형질감염시키면 편집 효율을 2.7-배 감소시켜, dNTP 농도가 일부 경우에 게놈 편집을 제한할 수 있다는 아이디어를 뒷받침함을 나타낸다. SAMHD1(T592A)이 공동발현되었을 때 편집 효율은 2.7-배 감소했다. mlvRT5M에 대한 몇 가지 돌연변이는 SAMHD1(T592A)의 존재에서 편집 효율을 일부 회복했다. 일부 돌연변이는 dNTP에 대한 mlvRT의 K m 을 낮출 수 있다. 리라이터 안으로 일부 이러한 돌연변이를 도입하면 닉에서 멀리 떨어진 SAMHD1p- 2-nt의 존재에서 편집 효율을 일부 회복했다. 이들 돌연변이 중 하나인 V223A는 효율을 감소시키지 않는 것으로 확인되었다. V223A를 합체하는 작제물은 리라이터 5.0으로 명명되었다(도 15c). V223A 돌연변이를 mlvRT5M 안으로 도입하는 것은 닉에서 편집 65-nt를 정착하는 효율을 감소시키지 않았다(리라이터 5).
비분열 및 느리게 분열하는 세포에서 편집 효율을 증가시키기 위한 보완적 접근법으로 VPX가 이용되었다. VPX는 작은 HIV-2 단백질일 수 있다. VPX는 분해를 위해 SAMHD1을 구체적으로 표적화할 수 있다. VPXROD(ROD HIV-2 분리주로부터) 및 SAMHD1p-의 공동발현은 VPX 없이 SAMHD1p-를 발현함에 의해 야기되는 편집 효율에서의 감소를 완전히 역전시켰다(도 15d). 편집 효율에서 SAMHD1p--유도된 감소는 닉에서 65-nt에 돌연변이가 정착되었을 때 훨씬 더 과감했다. 거의 제로인 효율은 모든 dNTP 통합에 대한 DNA 합성 효율에서의 복합 감소로 인한 것일 수 있다. VPXROD의 공동발현은 편집 효율을 SAMHD1p-를 발현함이 없이 관찰된 효율의 78%로 회복시켰다(리라이터 5.1).
VPX의 변이체는 SAMHD1p-의 존재에서 닉으로부터 돌연변이 65-nt를 정착하는 효율을 완전히 회복시킨 HIV-2 임상 단리물 RH2-1(VPXRH2-1)로부터 동정되었다(리라이터 5.2; 도 15e). 도 15e에서 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플의 평균 ± 1 표준 편차로 도시된다. VPXRH2-1은 또한 SAMHD1(T592A)을 RW2I 및 닉으로부터 돌연변이 2-nt를 정착할 수 있는 gRNA와 공동발현할 때 VPXROD를 능가하여 64% 편집 효율을 생성하였고(도 15f), 뿐만 아니라 RW2I_g 및 닉으로부터 돌연변이 65-nt를 정착하는 gRNA를 갖는다(도 23). VPXRH2-1을 통합하는 리라이터 시스템은 "_v"로 지정될 수 있다(예를 들어: "RW2I_gv").
dNTP의 농도를 증가시키는 것은 세포에서 편집 효율을 증가시키기 위한 부가적인 상보적 접근법일 수 있다. 방법은 뉴클레오티드 또는 뉴클레오시드를 세포에 전달하여, 뉴클레오티드 또는 뉴클레오시드를 받지 않은 세포와 비교하여 세포에서 dNTP의 증가된 농도를 초래하는 것을 포함할 수 있다. 세포에서 dNTP의 증가된 농도는 본 명세서에 개시된 바와 같은 조성물을 포함하는 세포에서 증가된 편집 효율을 초래할 수 있다. 일부 경우에, dNTP는 대상체(예를 들어, 세포를 포함하는 대상체)에게 투여된다. 일부 실시형태에서, dNTP를 세포에 투여하는 것은 세포를 포함하는 대상체에게 dNTP를 투여하는 것을 포함한다. dNTP의 투여는 경구 투여를 포함할 수 있다. dNTP의 투여는 주사에 의한 것일 수 있다.
낭포성 섬유증 돌연변이 또는 기타 질환 돌연변이 교정
낭포성 섬유증에 대한 소-분자 요법은 땀 염화물, 폐 합병증 비율 및 강제 호기량의 완전한 기능적 회복이 아닌 것으로 나타났습다. 부가적으로, CFTR 유전자의 낭포성 섬유증(CF)-야기 돌연변이의 대부분은 이들 소분자에 의해 치료가능하지 않을 수 있다. 영향을 받은 세포에 CFTR 유전자의 기능적 카피를 전달하는 것은 CF 환자의 CFTR 유전자형에 관계없이 임의의 CF 환자를 치료할 수 있다. 그러나, CF를 치료하기 위한 유전자 요법 접근법은 CFTR 발현의 일시적이고 합성적인 조절뿐만 아니라 불완전한 활성을 나타내는 절삭된 CFTR의 사용을 요할 수 있는 AAV의 제한된 패키징 용량에 의해 제한되었다. CFTR 편집과 관련된 일부 데이터는 도 29b도 29c에 도시되어 있다.
대안으로, 그 자연 조절 요소에 의해 제어되는 CFTR 활성을 복원하기 위해 CF-야기 돌연변이를 편집하는 것은 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 이와 같이, 본 명세서에 기재된 방법 및 조성물의 일부 실시형태는 CF를 치료하는 데 사용될 수 있다. 일부 실시형태는 돌연변이 CFTR 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 CF를 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 CFTR 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 96의 핵산 서열을 포함한다. 스페이서는 서열번호: 96에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 97의 핵산 서열을 포함한다. 스페이서는 서열번호: 97에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 98의 핵산 서열을 포함한다. 스페이서는 서열번호: 98에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 99의 핵산 서열을 포함한다. 스페이서는 서열번호: 99에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 100의 핵산 서열을 포함한다. 스페이서는 서열번호: 100에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 101의 핵산 서열을 포함한다. 스페이서는 서열번호: 101에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 102의 핵산 서열을 포함한다. 스페이서는 서열번호: 102에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 103의 핵산 서열을 포함한다. 스페이서는 서열번호: 103에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 104의 핵산 서열을 포함한다. 스페이서는 서열번호: 104에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 105의 핵산 서열을 포함한다. 스페이서는 서열번호: 105에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 CF의 치료 파라미터를 개선한다.
[표 1] - 스페이서
Figure pct00001
마찬가지로, 본 명세서에 기술된 방법 및 조성물의 일부 실시형태는 다른 질환을 치료하는 데 사용될 수 있다. 표적 유전자에서 정확한 서열을 복원하기 위해 질환-야기 돌연변이를 편집하는 것은 질환이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 표적 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 질환을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 표적 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 일부 이러한 스페이서는 표 1에 포함되어 있다. 스페이서는 표 1의 스페이서에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 동일한 핵산 서열 또는 상보적인 서열을 포함할 수 있다. 일부 경우에, 스페이서는 유사한 서열을 포함하지만 T 대신 U를 포함한다. 일부 실시형태에서, 투여는 대상체에서 질환의 치료 파라미터를 개선한다.
본 명세서에 기재된 방법 및 조성물의 일부 실시형태는 어셔 증후군을 치료하는데 사용될 수 있다. USH2A를 복원하기 위해 어셔 증후군-야기 돌연변이를 편집하는 것은 어셔 증후군이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 USH2A 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 어셔 증후군을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 USH2A 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 106의 핵산 서열을 포함한다. 스페이서는 서열번호: 106에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 107의 핵산 서열을 포함한다. 스페이서는 서열번호: 107에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 어셔 증후군의 치료 파라미터를 개선한다. 일부 실시형태에서, 게놈 편집 구성요소은 도 25b에 도시된 돌연변이를 교정한다. USH2A 편집과 관련된 일부 데이터는 도 29a에 도시되어 있다.
USH2A.1 스페이서는 도 25a도 25b의 데이터를 생성하기 위해 사용되었다. 도 25a에서의 데이터에 대해, HEK293T 세포는 PBS, RTT 또는 GPS의 다양한 서열을 사용하여 RW2I로 형질감염되었다. 편집 효율은 의도된 2298T>C 돌연변이가 있는 판독의 백분율로 표시된다. 15-nt PBS, 52-nt RTT 및 20-nt GPS는 22% 편집을 초래했다. 편집 효율이 표 1에 포함된 유사한 실험이 또한 수행되었다. 도 25b에서의 데이타에 대해, 15-nt PBS, 52-nt RTT, 20-nt GPS 작제물에 의해 생성된 가장 빈번한 돌연변이체 대립유전자는 RTT에서 인코딩된 2298T>C 및 2316C>A 돌연변이 둘 모두를 함유하였다(18.8%). 판독의 부가 7.1%는 2316C>A PAM-파괴 돌연변이 단독 또는 표적 2298T>C 돌연변이 단독에 의해 표시되었다. 낮은 빈도의 아데닌 삽입도 표적 서열 내의 폴리-A 트랙을 따라 검출되었다. 도시된 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균 ± 1 표준 편차를 포함한다.
본 명세서에 기술된 방법 및 조성물의 일부 실시형태는 스타가르트병을 치료하는 데 사용될 수 있다. ABCA4를 복원하기 위해 스타가르트병-야기 돌연변이를 편집하는 것은 스타가르트병이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이 ABCA4 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 스타가르트병을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 ABCA4 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 108의 핵산 서열을 포함한다. 스페이서는 서열번호: 108에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 109의 핵산 서열을 포함한다. 스페이서는 서열번호: 109에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 110의 핵산 서열을 포함한다. 스페이서는 서열번호: 110에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 111의 핵산 서열을 포함한다. 스페이서는 서열번호: 111에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 스타가르트병의 치료 파라미터를 개선한다. ABCA4 편집과 관련된 일부 데이터는 도 29s-29f에 도시되어 있다.
본 명세서에 기재된 방법 및 조성물의 일부 실시형태는 윌슨병을 치료하는데 사용될 수 있다. ATP7B를 복원하기 위해 윌슨병-야기 돌연변이를 편집하는 것은 윌슨병이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 ATP7B 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 윌슨병을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 ATP7B 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 112의 핵산 서열을 포함한다. 스페이서는 서열번호: 112에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 113의 핵산 서열을 포함한다. 스페이서는 서열번호: 113에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 114의 핵산 서열을 포함한다. 스페이서는 서열번호: 114에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 115의 핵산 서열을 포함한다. 스페이서는 서열번호: 115에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 윌슨병의 치료 파라미터를 개선한다.
본 명세서에 기술된 방법 및 조성물의 일부 실시형태는 헌팅턴병을 치료하는 데 사용될 수 있다. HTT를 복원하기 위해 헌팅턴병-야기 돌연변이를 편집하는 것은 헌팅턴병이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 HTT 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 하나 이상의 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 헌팅턴병을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 HTT 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 116의 핵산 서열을 포함한다. 스페이서는 서열번호: 116에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 117의 핵산 서열을 포함한다. 스페이서는 서열번호: 117에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 118의 핵산 서열을 포함한다. 스페이서는 서열번호: 118에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 119의 핵산 서열을 포함한다. 스페이서는 서열번호: 119에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 헌팅턴병의 치료 파라미터를 개선한다.
연장을 포함하는 가이드 핵산이 본 명세서에 개시되어 있다. 연장은 HTT를 편집하기 위한 연장 핵산 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 140의 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 140의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다. 연장은 GPS 영역을 포함할 수 있다. 연장은 GPS 영역을 포함하지 않을 수 있다. GPS 영역을 포함하는 연장의 연장 서열의 예는 서열번호: 141에 포함된다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 141의 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 141의 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 141의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다.
어셔 증후군 유전자 리라이팅
어셔 증후군은 난청과 시력 상실이 결합된 가장 일반적인 유전 원인일 수 있다. 보청기와 귀 임플란트가 일부 어셔 환자에서 난청을 치료할 수 있지만, 그의 시력 상실은 현재로 치료불가능하다. 어셔 증후군을 야기하는 가장 흔한 돌연변이는 USH2A 유전자에서 단일-뉴클레오티드 결실인 2299delG일 수 있다. 리라이터는, 기능적 USH2A의 전달을 포함하는 유전자 요법이 그렇지 않으면 전형적인 AAV 및 렌티바이러스 패키징 용량을 초과하는 USH2A cDNA 크기(15.6kb)에 의해 방해받을 수 있고, 기본 편집기가 뉴클레오티드 삽입을 수행할 수 없기 때문에, 어셔 증후군이 있는 환자에 대한 치유적 치료를 제공하기 위한 접근법을 제공할 수 있다.
USH2A에서 2299G 영역을 리라이팅하기 위해 구성요소가 제공되었다. 편집 효율은 닉으로부터 RTT 23-nt에 인코딩된 2298T>C 침묵 돌연변이의 정착을 정량화함에 의해 야생형 HEK293T 세포에서 결정되었다. 2299G가 RTT에 의해 인코딩되지만, 야생형 HEK293T 세포는 이미 2299G를 함유하기 때문에 2298T>C도 대리 돌연변이로 포함되었다. 또한 의도된 편집이 달성된 후 nSpCas9가 계속해서 표적 부위를 흠집내는 것을 방지하도록 의도된 닉으로부터 RTT 5-nt에서 2316C>A PAM-비활성화 침묵 돌연변이가 인코딩되었다.
RW2I 시스템에서 15-nt PBS, 52-nt RTT 및 20-nt GPS의 사용을 통하여 22 퍼센트 편집이 달성되었다(도 25a). 도 25a에서의 데이터에 대해, HEK293T 세포는 PBS, RTT 및 GPS의 상이한 서열을 사용하여 RW2I로 형질감염되었다. 편집 효율은 판독의 백분율로서 의도된 2298T>C 돌연변이로 표시된다. 15-nt PBS, 52-nt RTT 및 20-nt GPS는 22% 편집 결과를 가져왔다.
9, 11, 13 및 15-nt의 PBS 길이가 시험되었고; 32, 34, 36, 52 및 56-nt의 RTT 길이가 평가되었고; 20-nt GPS가 52 및 56-nt RTT 작제물에 포함되었다. GPS를 포함하지 않은 모든 작제물은 6.3% 미만의 편집 결과를 얻었지만, 대조적으로 52-nt RTT 및 20-nt GPS가 있는 작제물은 9-nt PBS로 대략적으로 6.5%로부터 15-nt PBS로 22%까지 증가하여 가장 높은 편집 효율을 제공했다. 이들 결과는 GPS가 흠집의 부위에서 23-nt만큼 가까운 편집을 도입하는 효율을 유의하게 향상시킬 수 있음을 나타낸다. 스페이서의 상위 5개 인 실리코-예측된 표적-외 게놈 부위의 심층 서열화가 수행되었고, 리라이터 구성요소를 형질감염함에 의해 도입된 편집은 감지되지 않았다.
다음으로, 15-nt PBS, 52-nt RTT 및 20-nt GPS 작제물에 의해 생성된 대립유전자 변이체의 유형이 분석되었고, 가장 빈번한 변이체는 2316C>A 돌연변이 단독(3.9%), 그리고 그 다음 2298T>C 돌연변이 단독(3.2%)이 이어지는, 2298T>C 및 2316C>A 돌연변이 둘 모두를 함유하는 것(18.8%)으로 밝혀졌다(도 25b). 도 25b는 15-nt PBS, 52-nt RTT, 20-nt GPS 작제물에 의해 생성된 가장 빈번한 돌연변이 대립유전자가 RTT에서 인코딩된 2298T>C 및 2316C>A 돌연변이 둘 다를 포함했다(18.8%)는 것을 나타낸다. 판독의 부가 7.1%는 2316C>A PAM-파괴 돌연변이 단독 또는 표적 2298T>C 돌연변이 단독에 의해 표시되었다. 낮은 빈도의 아데닌 삽입은 또한 표적 서열 내의 폴리-A 트랙을 따라 검출되었다. 일부 부가 양태에 대한 일부 데이터는 도 28에 도시되어 있다.
PAM을 파괴하는 RTT에서 돌연변이를 인코딩하는 것은 편집 효율을 증가시킬 수 있다. PAM을 파괴하는 RTT에서 돌연변이를 인코딩하는 것은 편집 정밀도를 증가시킬 수 있다. PAM 부위를 파괴할 RTT에서 서열을 인코딩함에 의해 편집의 효율을 증가시켰고 바람직하지 않은 결실을 감소시키는 것이 밝혀졌다(도 25c도 25g).
프라임 편집기의 경우와 같이, nSpCas9 또는 스캐폴드 서열 삽입 이벤트에 의해 생성된 검출가능한 삽입결실은 없었다. 아데닌 삽입을 함유하는 2개의 대립유전자가 각각 0.4% 및 0.2%의 빈도에서 의도된 2298T>C 및 2316C>A 돌연변이에 부가하여 역전사된 영역 내에서 동정되었다. 각각의 아데닌 삽입은 폴리-A 트랙의 말단에 있었는데, 이는 잠재적으로 RT-매개된 게놈 편집 접근법이 RNA 주형의 모노뉴클레오티드 트랙에서 희귀한 프레임-이동 돌연변이를 합성할 수 있음을 나타낸다. 침묵 2307A>G 돌연변이로 RTT에서 폴리A 트랙 중 하나를 파괴하는 것이 해당 폴리A 트랙 내에서 아데닌의 바람직하지 않은 삽입을 제거했다는 것으로 밝혀졌다(도 25e). 또한 2298T>C 편집 효율이 RTT 길이를 54-nt로 증가시킴에 의해 41.6%로 증가하였다는 것이 밝혀졌다(도 25f). 마지막으로, 침묵 pam-파괴 2316C>A 돌연변이를 포함하지 않는 것은 2298T>C 편집을 만드는 효율을 2-배 감소시켰다는 것이 밝혀졌다(도 25g). 25a-25g 중 임의의 것에 도시된 그래픽 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균 ± 1 표준 편차를 포함한다; NS = 유의하지 않음(P < 0.05; 양측 스튜던트스 t-테스트); 및 ND = 검출되지 않음.
도 25e도 30에 도시된 바와 같이, 돌연변이는 연속적인 뉴클레오티드(예를 들어, 4+ 연속적인 뉴클레오티드)의 트랙을 분해하기 위해 RTT에 인코딩될 수 있다. 동일한 염기를 함유하는 적어도 4개의 연속적인 뉴클레오티드의 트랙 상에서 원하지 않는 삽입이 관찰되었다. 역전사효소는 RTT에서 그 주형 서열에 비하여 이들 모노뉴클레오티드 트랙 상에 희귀한 삽입을 만들었다는 것으로 간주되었다. 모노뉴클레오티드 트랙을 동일한 염기의 3개 이하의 연속 뉴클레오티드의 트랙으로 분해하는 돌연변이를 통합함에 의해 바람직하지 않은 삽입이 더 이상 검출되지 않았다는 것이 발견되었다. 도 25a에서의 예에 도시된 바와 같이, RTT의 폴리A 트랙에서 침묵 2307A>G 돌연변이를 인코딩함이 없이, 거의 0.5%의 판독이 위치 2305에서 원하지 않는 A 삽입을 함유했다. 바람직하지 않은 삽입은 RTT의 폴리A 트랙에서 침묵 2307A>G 돌연변이를 포함한 RTT로 검출되지 않았다. 동일한 염기의 것은 RTT에서 인코딩되지 않은 바람직하지 않은 편집을 제거한다.
어셔 증후군 데이터의 일부 하이라이트는 다음을 포함한다: GPS는 편집 효율을 약 4-배 향상시켰고, 표적 외 효과는 관찰되지 않았고, USH2A에 대해 바람직하지 않은 돌연변이는 발생하지 않았고, 40% 초과의 편집 효율이 달성되었다.
도 31a-31b는 트리뉴클레오티드 반복의 정확한 단축이 htt 유전자에서 달성되었음을 보여주며, 이는 헌팅턴병과 같은 질환을 치료하기 위한 본 명세서에 기술된 일부 시스템 및 방법의 적용가능성을 입증한다.
논의
리라이터와 같은 편집 시스템은 주어진 Cas9 표적 부위의 대략적으로 70-nt 내에 뉴클레오티드 치환, 삽입, 결실 또는 복잡한 서열 변경을 도입하기 위한 표적화된 효율적인 기술을 포함할 수 있다. 부가하여, AAV 내에 리라이터를 패키징하는 능력은 광범위한 유전 질환을 치료하기 위해 안전하고 조직-특이적 전달을 가능하게 할 것을 약속한다.
정밀 게놈 편집은 전통적으로 DSB 생성에 의존해 왔으며, 이는 일부 경우에 심지어 전체 염색체의 손실을 야기할 수 있는 유전독성 병변이다. 리라이터는 일반적으로 비교적 무해한 변형인, 하나의 단일-가닥 닉만 생성함에 의해 일부 DSB와 연관된 안전성 문제를 피할 수 있다. 부가적으로, 리라이터의 전달가능성과 안전성은 효율을 희생하지 않으면서 최대 64%의 편집이 달성되었으며, 이는 DSB를 생성함이 없이 인간 세포에서 표적화된 다중-염기 편집에 대해 지금까지 보고된 가장 높은 효율이다.
GPS는 gRNA 연장의 3차 구조를 제어함에 의해 편집 효율 및 윈도우 길이를 개선할 수 있는 리라이터 플랫폼에서 새로운 구성요소를 포함할 수 있다. GPS는 편집의 부위에 바로 인접한 PAM을 필요로 하는 제약을 완화할 수 있고 단일 작제물로 다중 병원성 돌연변이의 교정을 가능하게 할 수 있다. 예를 들어, 시의력 상실을 초래하는 두 번째로 가장 흔한 USH2A 돌연변이는 2276G>T일 수 있으며, 이는 가장 흔한 돌연변이인 2299delG로부터 23-nt일 수 있다. 일부 실시형태는 이들 돌연변이 중 하나를 갖는 환자를 치료할 수 있는 gRNA의 사용을 포함한다.
mlvRT 돌연변이체의 스크리닝은 보다 효율적인 mlvRT14M의 식별을 유도하여, 이 성분을 추가로 최적화할 가능성을 강조하였다. mlvRT14M 돌연변이체의 편향되지 않은 라이브러리는 편집을 개선하기 위해 모아진 형식에서 BFP에서 GFP로의 전환 검정으로 스크리닝될 수 있다. 아마 SAMHD1(T592A)의 과발현을 통해 낮은 dNTP 농도에서 RT의 라이브러리를 스크리닝하는 것은 dNTP가 비-분할 세포를 편집하기 위해 VPX에 대한 가능한 요구를 회피하기 위해 충분히 낮은 KM을 가진 변이체를 동정할 수 있다.
비-분할 세포에서의 정확한 편집은 전통적으로 상당한 도전이었다. SAMHD1에 의해 야기된 편집에서 제한에 대응하기 위해 VPX를 사용하여 본 명세서에 제공된 결과는 광수용체 및 뉴런과 같은 임상적으로 관련된 유사분열-후 세포 또는 많은 기관을 구성하는 천천히 분열하는 세포를 편집하는 경로를 제공한다. 편집을 위한 잠재적인 제한 인자로서 SAMHD1의 식별을 감안할 때, SAMHD1-억제 소분자는 세포질 dNTP 농도의 일시적인 증가를 제공하기 위해 평가될 수 있다.
AAV 전달 시 DSB를 생성함이 없이 인간 세포의 게놈에서 표적화된 복잡한 서열 변경을 정확하게 생성할 수 있는 제1 시스템으로서, 리라이터는 기능적 게놈 연구를 발전시키고 인간 질환을 치료하는 데 사용될 수 있다.
방법
일반적인 방법: Q5 DNA 중합효소(New England Biolabs)를 DNA 증폭에 사용했다. DNA 올리고뉴클레오티드는 Integrated DNA 기술에서 얻었다. 플라스미드는 골든 게이트 조립 방법에 의해 구축되었다. 포유류 세포 실험을 위한 벡터는 Plasmid Plus midiprep 키트(Qiagen) 또는 ZymoPURE miniprep 키트(Zymo Research)를 사용하여 정제되었다.
일반적인 포유동물 세포 배양: HEK293T 세포(ATCC CRL-3216)를 10%(v/v) 소태아혈청(Gibco) 및 항생제-항진균제(ThermoFisher Scientific)(DMEM+)가 보충된 둘베코의 변형된 이글 배지(DMEM) 및 GlutaMAX(ThermoFisher Scientific)에서 배양하고 계대했다. 세포를 37℃에서 5% CO2로 배양했다.
형질감염: HEK293T 세포를 96-웰 폴리-d-라이신 코팅된 플레이트(Corning) 상에 시딩하였다. 시딩 후 대략적으로 24시간 후에 배지를 Opti-MEM(Gibco)으로 교체하고 각 웰에 제조업체의 프로토콜에 따라 0.8ul 리포펙타민 2000(ThermoFisher Scientific)과 400ng의 총 플라스미드 DNA를 형질감염시켰다. 배지는 형질감염 후 6 내지 8시간 사이에 DMEM+로 교체하였다.
AAV 패키징, 수확 및 형질도입: HEK293T 세포는 3개의 플라스미드인 - Rep/Cap 플라스미드, 아데노바이러스 유전자를 함유하는 헬퍼 플라스미드 및 역방향 말단 반복에 측접된 패키징을 위해 의도된 카고를 함유하는 전달 플라스미드의 공동-형질감염에 의해 AAV 생산을 위한 삼중-형질감염 방법에 적용되었다. 형질감염은 25,000의 평균 분자량을 갖는 분지형 폴리에틸렌이민(PEI)(Sigma 408727)을 사용하여 수행되었다. 형질감염 3일 후, AAVpro 정제 키트 맥시(Takara 6666)를 사용하여 세포를 수확하고 정제하였다. 정제된 AAV 스톡의 역가는 SsoAdvanced Universal SYBR Green Supermix(Bio-Rad)를 사용하여 CFX96 실시간 시스템(Bio-Rad) 상에서 qPCR에 의해 결정되었다. BFP-발현 HEK293 세포는 동등한 수의 AAV-A 및 AAV-B 바이러스 입자로 공동-형질도입되었고, BFP-대-GFP의 편집은 형질도입 후 96-120시간에 유세포분석에 의해 결정되었다.
유세포분석: 형질감염 48시간 후, 배지를 제거하고 세포를 0.05% 트립신/EDTA(Gibco)로 분리하였다. 트립신을 DMEM+로 중화하고 현탁된 세포를 둥근-바닥 96-웰 플레이트에 배치하였다. Attune NxT 유세포모터(ThermooFisher Scientific)를 사용하여 웰당 30,000개 세포의 형광을 분석했다.
고-처리량 게놈 DNA 서열화: 관심있는 게놈 부위를 게놈 DNA 샘플로부터 증폭하고 Illumina MiSeq 상에서 서열화했다. Illumina 정방향 및 역방향 어댑터를 포함하는 증폭 프라이머는 관심있는 게놈 영역을 증폭하기 위한 1차 라운드의 PCR(PCR 1)에 사용되었다. PCR 1 반응물(25μl)은 0.5μM의 각 정방향 및 역방향 프라이머, 1μl 게놈 DNA 추출물 및 12.5μl Phusion U Green Multiplex PCR 마스터 믹스로 수행되었다. PCR 반응은 다음과 같이 수행되었다: 2분 동안 98℃, 그 다음 [98℃에서 10초, 61℃에서 20초, 및 72℃에서 30초]의 30 주기, 이어서 최종 72℃에서 연장 2분. 고유한 Illumina 바코딩 프라이머 쌍이 2차 PCR 반응(PCR 2)에서 각 샘플에 추가되었다. 구체적으로, 주어진 PCR 2 반응물 25μl는 각각의 고유한 정방향 및 역방향 Illumina 바코딩 프라이머 쌍 0.5μM, 정제되지 않은 PCR 1 반응 혼합물 1μl 및 Phusion U Green Multiplex PCR 2 마스터 믹스 12.5μl를 함유했다. 바코딩 PCR 2 반응은 다음과 같이 수행되었다: 2분 동안 98℃, 그 다음 [98℃에서 10초, 61℃에서 20초, 및 72℃에서 30초]의 12 주기, 이어서 최종 72℃에서 연장 2분. PCR 생성물은 1.5% 아가로스 겔에서 전기영동으로 분석적으로 평가되었다. PCR 2 생성물(일반 앰플리콘에 의해 풀링됨)은 40μl 물로 용리하는 QIAquick Gel Extraction Kit(Qiagen)를 사용하여 1.5% 아가로스 겔로 전기영동에 의해 정제되었다. DNA 농도는 형광 정량화(Qubit, ThermoFisher Scientific) 또는 qPCR(KAPA Library Quantification Kit-Illumina, KAPA Biosystems)에 의해 측정되었고 제조업체의 프로토콜에 따라 Illumina MiSeq 기기 상에서 서열화되었다. 서열화 판독은 MiSeq Reporter(Illumina)를 사용하여 역다중화되었다.
참조 서열에 대한 앰플리콘 서열의 정렬은 CRISPResso243을 사용하여 수행되었다. 모든 프라임 편집 수율 정량화의 경우 프라임 편집 효율성은 (삽입결실을 함유하지 않는 원하는 편집을 갖는 판독의 수)/(총 판독의 수)의 백분율로 계산되었다. 점 돌연변이 편집의 정량화를 위해, CRISPResso2는 "discard_indel_reads"가 켜진 표준 모드에서 실행되었다. 점 돌연변이의 정착을 위한 프라임 편집은 그 다음 다음과 같이 명시적으로 계산되었다: (비-폐기된 판독에서 지정된 점 돌연변이의 빈도) Å~ (비-폐기된 판독의 수)/(총 판독). 삽입 또는 결실 편집을 위해 CRISPResso2는 원하는 대립유전자를 예상된 대립유전자(e 플래그)로 사용하고 "discard_indel_reads"가 켜진 HDR 모드에서 실행되었다. 편집 수율은: (HDR-정렬된 판독의 수)/(총 판독)으로 계산되었다. 삽입결실 수율은: (판독을 포함하는 삽입결실의 수)/(총 판독)으로 계산되었다.
형질감염 36시간 후, 세포를 0.05% 트립신으로 탈리하고, 회전시키고, PBS로 세정하고, 다시 회전시켰다. 세포 펠렛을 10ul의 QuickExtract(Lucigen)에 재현탁하고 65℃에서 6분 동안 인큐베이션하였다. 그런 다음 샘플을 15초 동안 볼텍싱하고 98℃에서 2분 동안 인큐베이션했다. 10ul의 뉴클레아제-유리 물을 각 샘플에 첨가했다. 4ul의 샘플을 관심있는 게놈 영역을 증폭하도록 설계된 Illumina 어댑터를 함유하는 Q5 폴리머라제 및 프라이머를 갖는 PCR의 주형으로 사용했다. 그런 다음 샘플을 37℃에서 1시간 동안 Exo-CIP(NEB)로 처리했다. DNA 농도는 Qubit(ThermoFisher Scientific)로 측정되었고 샘플은 Amplicon-EZ 서비스를 사용하여 서열화를 위해 Genewiz로 보내졌다. PE-Analyzer(http://www.rgenome.net/pe-analyzer)를 사용하여 고-처리량 서열화 데이터를 분석했다. 임의의 게놈 편집 구성요소로 형질도입되지 않은 대조군 샘플에서 가장 높은 빈도 변이를 검출 임계값으로 설정하고 이 빈도 미만의 임의의 변이는 폐기했다. 2298T>C 돌연변이를 정착하는 효율은 (2298T>C 돌연변이만 함유하는 판독의 수 + 2298T>C 및 2316C>A 돌연변이만 함유하는 판독의 수)/(검출 임계값 초과의 빈도로 존재하는 대립유전자의 판독의 총 수)로 명시적으로 계산되었다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수 참조를 포함한다. 본 명세서에서 "또는"에 대한 임의의 언급은 달리 언급되지 않는 한 "및/또는"을 포괄하도록 의도된다.
용어 "적어도", "보다 큰" 또는 "보다 크거나 같은"이 2개 이상의 일련의 숫자 값에서 제1 숫자 값 앞에 올 때마다, 용어 "적어도", "보다 큰" 또는 "보다 크거나 같은"은 그 일련의 숫자 값에 있는 각각의 숫자 값에 적용된다. 예를 들어, 1, 2 또는 3보다 크거나 같은 것은 1보다 크거나 같거나, 2보다 크거나 같거나, 3보다 크거나 같은 것에 동등하다.
용어 "보다 많지 않은", "미만", "이하" 또는 "최대"는 2개 이상의 일련의 숫자 값에서 제1 숫자 값 앞에 올 때마다, 용어 "보다 많지 않은", "미만", 또는 "이하" 또는 "최대"는 그 일련의 숫자 값에 있는 각각의 숫자 값에 적용된다. 예를 들어, 3, 2 또는 1보다 작거나 같은 것은 3보다 작거나 같거나, 2보다 작거나 같거나, 1보다 작거나 같은 것에 동등하다.
값이 범위로 기술되는 경우, 그러한 개시는 그러한 범위 내의 모든 가능한 하위-범위뿐만 아니라 특정 숫자 값 또는 특정 하위-범위가 명시적으로 언급되었는지 여부와 상관없이 그러한 범위 내에 속하는 특정 숫자 값의 개시를 포함하는 것으로 이해될 것이다.
실시예
다음 실시예는 예시적이고 본 명세서에 기술된 장치, 방법, 시스템 및 키트의 범주에 비-제한적이다.
실시예 1
게놈 편집 효율 검정
본 실시예는 게놈 편집 효율 검정을 기술한다. 게놈 편집 작제물의 정밀 편집 속도는 녹색 형광 단백질(GFP)을 생성하기 위해 청색 형광 단백질(BFP) 유전자를 편집하는 빈도를 측정함에 의해 결정되었다. 구체적으로, 게놈적으로-통합된 BFP 유전자를 갖는 30,000개 HEK293T 세포를 10% 소태아혈청(FBS)을 함유하는 DMEM에서 96-웰 폴리-d-라이신 처리된 플레이트에 시딩하였다. 12-24시간 후, 배지는 opti-mem 배지로 교체되었다. Lipofectamine 2000은 게놈 편집 구성요소를 인코딩하는 플라스미드를 형질감염시키는 데 사용되었다. 총 400 나노그램의 플라스미드 DNA를 함유하는 25 마이크로리터의 opti-mem을 0.8 마이크로리터의 리포펙타민 2000을 함유하는 25 마이크로리터의 opti-mem에 첨가하였다. 20분 후, 50 마이크로리터 혼합물을 세포를 함유하는 웰에 점적 부가하였다. 6시간 후, 배지는 10% FBS를 함유하는 DMEM으로 교체되었다. GFP 및 BFP 수준은 Attune NxT 유세포분석기를 사용하여 36-60시간 후에 측정되었다.
실시예 2
분할 nCas9 역전사효소 작제물의 편집 효율
본 실시예는 분할 nCas9 역전사효소 작제물의 편집 효율을 기술한다. 융합된 nCas9-mlvRT 또는 분할 nCas9-RT 및 gRNA를 인코딩하는 플라스미드를 실시예 1에 기재된 바와 같이 제조하고 형질감염시켰다. 각 작제물의 편집 효율을 측정하였다. 도 1은 nCas9 및 몰로니 백혈병 바이러스 RT(mlvRT)를 포함하는 융합된 Cas9 닉카제(nCas9) 역전사효소(RT) 작제물("nCas9-mlvRT"), 및 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물("mlvRT 분할 스티치")의 편집 효율을 나타낸다. 분할 스티치는 리라이터(예를 들어 RWb1)로 지칭될 수 있거나 그 반대일 수도 있다. 일부 경우에, 분할 스티치는 리라이터(예를 들어 RWb1) 또는 리라이터 구성요소를 포함할 수 있다. 일부 경우에, 리라이터는 분할 스티치 또는 분할 스티치 구성요소를 포함할 수 있다. mlvRT 분할 스티치는 리라이터(예를 들어 RWb1)의 구성요소의 예일 수 있다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 별도의 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RRL12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다. nCas9-LZ1은 류신 지퍼를 통해 mlvRT(서열번호: 13) 및 N-말단 류신 지퍼(서열번호: 24)를 포함하는 LZ2-mlvRT와 이종이량체화하는 SpCas9(서열번호: 32) 및 C-말단 류신 지퍼(서열번호: 23)를 포함한다. nCas9-mlvRT 작제물의 개략도는 도면의 상단에 제공되어 있다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 융합된 nCas9-RT 작제물(약 21% 효율)의 것보다 거의 두 배 향상된 편집 효율(약 38% 효율)을 보여주었다.
도 11a는 프라임 편집기 2 시스템("PE2", 상단), 분할 프라임 편집기 2 시스템("분할 PE2", 중간), 및 2개의 류신 지퍼를 갖는 분할 스티치 작제물("분할 스티치", 하단)의 도메인 배열을 나타낸다. 오른쪽은 가이드 핵산과 복합된 2개의 류신 지퍼(LZ1 및 LZ2)에 의해 연결된 Cas9 닉카제(nCas9) 및 역전사효소(RT)를 포함하는 분할 스티치 작제물의 구조적 개략도이다. 분할 스티치 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 별도의 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다.
실시예 3
역전사효소 모집에 대한 gRNA 헤어핀 삽입물의 효과
본 실시예는 편집 효율에 대한 gRNA 헤어핀 삽입물의 효과를 기술한다. 융합된 nCas9-mlvRT 또는 분할 nCas9 및 mcp-RT와 gRNA를 인코딩하는 플라스미드를 실시예 1에 기재된 바와 같이 제조하고 형질감염시켰다. 융합된 nCas9-RT의 편집 효율은 pegRNA의 존재에서 측정하였다. 분할 nCas9-RT의 편집 효율은 스캐폴드에 포매된 헤어핀(gRNA 2.0) 또는 스캐폴드 뒤에 위치한 다양한 길이의 헤어핀(1xlongMS2, 1xshortMS2 또는 2xshortMS2)을 갖는 3가지 다른 gRNA의 존재에서 측정하였다. 도 2는 융합된 nCas9-RT 작제물("nCas9-mlvRT") 및 역전사효소(서열번호: 27)에 융합된 nCas9 및 mcp 펩티드를 포함하는 분할 nCas9 및 mcp-mlvRT 작제물("mcp-mlvRTv")의 편집 효율을 나타낸다. mcp 펩티드는 MS2 RNA 헤어핀과 상호작용한다. 분할 nCas9 및 mcp-mlvRT 작제물의 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다. 1xlongMS2 헤어핀을 갖는 gRNA와 1xshortMS2 헤어핀을 갖는 gRNA는 gRNA 2.0보다 개선된 편집 효율을 보여주었다.
도 11b는 다른 gRNA로 도 11a에 예시된 작제물의 편집 효율을 나타낸다. 편집 효율은 BFP를 GFP로 전환하기 위해 편집된 세포의 백분율(% GFP+)로 측정되었다. 편집 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다. 분할 스티치 작제물(이 경우 RWb1)은 프라임 편집기 2(PE2) 작제물보다 개선된 편집 효율을 보여주었다.
실시예 4
증가된 역전사효소 연속성을 갖는 분할 nCas9-RT 작제물
본 실시예는 증가된 역전사효소 연속성을 갖는 분할 nCas9-RT 작제물을 기술한다. 실시예 2에 기술된 분할 nCas9-RT 작제물은 역전사효소 중합효소 기능의 연속성을 증가시키도록 추가로 조작되었다. 증가된 연속성을 갖는 역전사효소는 실시예 2에 제공된 역전사효소보다 단일 결합 이벤트에서 더 많은 순차 포스포디에스테르 결합의 형성을 촉매할 수 있었다. 증가된 연속성은 더 긴 주형 서열의 역전사를 촉진하고 게놈의 표적 부위에서 더 긴 서열의 편집을 가능하게 할 수 있다. 증가된 연속성을 갖는 역전사효소가 있는 3개의 분할 nCas9-RT 작제물의 편집 효율을 시험했다.
도 3은 증가된 전사 연속성을 갖는 변형된 역전사효소를 포함하는 상이한 분할 nCas9-RT 작제물의 편집 효율을 나타낸다. 지오바실러스 스테아로테르모필루스(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레(ErRT, 서열번호: 4)로부터의 nCas9 및 역전사효소, 및 R2 폴리단백질로부터 아미노산 116-1016(R2(116-1016), 서열번호: 7)을 포함하는 작제물을 시험하였다. GsI-IICRT 역전사효소("스티치RT")의 개략도는 도 1도 2에 사용된 mlvRT 역전사효소와 비교하여 도시된다. 분할 스티치 R2(116-1016)는 시험된 전사 연속성이 증가된 변형된 역전사효소를 포함하는 3개의 분할 nCas9 및 RT 작제물 중 가장 높은 편집 효율을 보였다.
실시예 5
단일-가닥 파손에서 증가된 편집 효율을 위한 gRNA
본 실시예는 단일-가닥 파손에서 증가된 편집 효율을 위한 gRNA를 기술한다. gRNA는 gRNA의 3' 말단에 제2 가닥 프라이머를 합체함에 의해 단일-가닥 파손에서 편집 효율을 증가시키도록 설계되었다. 제2 가닥 프라이머는 새롭게 합성된 제1 가닥을 주형으로 사용하여 제2 가닥의 합성을 프라이밍했다. 제2 가닥 합성의 프라이밍은 이중-가닥 파손의 형성 없이 단일-가닥 파손의 부위 내에 합성된 서열의 삽입을 용이하게 하였다. 이중-가닥 파손의 형성은 원하지 않는 생성물의 형성의 속도를 증가시킬 수 있다.
도 4a는 본 개시내용의 조작된 gRNA("스티치 가이드")를 사용한 게놈 편집에 대한 방법을 예시한다. 일부 경우에, 스티치 가이드는 리라이터(예를 들어 리라이터 3.0, 리라이터 3.1 또는 리라이터 3.2) 또는 리라이터 구성요소를 포함할 수 있다. 일부 경우에, 리라이터는 스티치 가이드 또는 스티치 가이드 구성요소를 포함할 수 있다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥에 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합된다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화된다. 4-300 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합된다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안에 합체될 수 있다.
도 4b는 pegRNA gRNA 또는 스티치 가이드 gRNA를 사용한 nCas9-RT 작제물의 편집 효율을 나타낸다. pegRNA와 스티치 가이드 gRNA의 개략도는 왼쪽에 도시되어 있다. 스티치 가이드 gRNA에 제2 가닥 프라이머의 함입은 제2 가닥 프라이머를 결하는 pegRNA에 비해 편집 효율을 향상시켰다. 융합된 nCas9-mlvRTv 작제물이 이 검정에 사용되었다.
제2 검정에서, 분할 nCas9-RT 작제물의 편집 효율에 대한 제2 가닥 프라이머 길이 및 결합 부위의 효과가 시험되었다. 제2 가닥 프라이머의 길이뿐만 아니라 단일 가닥 파손의 위치에 대한 제2 가닥 프라이머의 결합 위치도 다양했다. 도 5a는 제1 가닥 프라이머 결합 부위("닉으로부터 nt")의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'에 위치된, 길이가 20 뉴클레오티드(nt), 40 nt 또는 60 nt인 제2 가닥 프라이머(SSP)를 포함하는 상이한 gRNA를 갖는 융합된 nCas9-RT 작제물("nCas9-mlvRTv")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA를 대조군으로 시험했다. 모든 gRNA 서열은 hdv 리보자임(서열번호: 25)을 포함한다. 도 5b는 제1 가닥 프라이머 결합 부위("닉으로부터 nt")의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'에 위치된, 길이가 20 뉴클레오티드(nt), 40 nt 또는 60 nt인 제2 가닥 프라이머(SSP)를 포함하는 상이한 gRNA를 갖는 nCas9-RT("nCas9-R2(116-1016)")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA를 대조군으로 시험했다. nCas9-mlvRTv와 nCas9 및 R2 작제물 둘 모두에서 더 짧은(예를 들어 20 nt) 제2 가닥 프라이머를 갖는 gRNA는 더 긴 제2 가닥 프라이머를 갖는 다른 gRNA와 비교하여 개선된 편집 효율을 보여주었다.
실시예 6
개선된 편집을 위한 이중 가이드 시스템
본 실시예는 개선된 편집을 위한 이중 가이드 시스템을 기술한다. 매우 근접한 반대쪽 가닥 상에 2개의 표적 부위를 표적화하는 2개의 gRNA를 포함하는 이중 가이드 시스템이 세포 내로 도입된다. 각 gRNA는 각 표적 부위에 대한 nCas9-RT 작제물을 모집하여, 각 표적 부위에서 단일 가닥 파손을 촉진한다. 2개의 gRNA는 향상된 전달 및 2개의 표적 부위에 대한 공동-국소화를 보장하기 위해 융합된다.
도 6은 nCas9-RT와 함께 2개의 gRNA 시스템을 사용하는 게놈 편집의 4가지 방식을 예시한다. 2개 가이드 각각이 편집된 가닥(왼쪽 상단)을 생성하는 2개 단일 가이드 시스템에서, 각각의 gRNA는 상이한 nCas9에 결합하고 2개 gRNA는 각각 역전사효소 주형 영역과 프라이머 결합 부위(PBS) 영역을 포함한다. 제2 가이드가 반대쪽 가닥을 흠집내는 2개 단일 가이드 시스템(오른쪽 상단)에서, 각각의 gRNA는 상이한 nCas9에 결합하고 gRNA 중 하나만 역전사효소 주형 영역과 프라이머 결합 부위(PBS) 영역을 포함한다. 2개 가이드가 각각 역전사효소 주형 영역과 프라이머 결합 부위(PBS) 영역을 포함하는 이중 가이드 복합체 시스템(왼쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고, 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; 2개 gRNA 각각은 역전사효소 주형 영역 및 PBS 영역을 포함한다. 제2 가이드가 반대쪽 가닥을 흠집내는 이중 가이드 복합체 시스템(오른쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고, 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; gRNA 중 하나만 역전사효소 주형 영역을 포함한다.
도 7은 유전자 편집의 효율을 증가시키는 방법을 예시한다. 제2 가이드가 반대쪽 가닥을 흠집내는 2개 단일 가이드 시스템 또는 제2 가이드가 반대쪽 가닥을 흠집내는 이중 가이드 복합체 시스템으로, 반대쪽 가닥 상의 닉은 표적 핵산 안으로 새롭게 합성된 DNA의 합체를 용이하게 한다. 제2 가이드는 새롭게 합성된 제1 가닥에서의 영역에 역상보적인 플랩을 생성한다. 합성된 제1 가닥은 제2 가닥 합성을 위한 주형으로 작용한다.
2개 gRNA 시스템의 편집 효율은 청색 형광 단백질을 인코딩하는 표적 핵산 안으로 정지 코돈을 도입함에 의해 측정되었다. 성공적인 편집이 BFP 형광의 결여에 의해 식별되었다는 점을 제외하고는 검정은 실시예 1에 기재된 바와 같이 수행되었다. 도 10도 7에 예시된 바와 같은 2개 gRNA 시스템의 편집 효율을 나타낸다. BFP에 대해 음성인 세포의 백분율("% BFP-")로 측정된 편집 효율은 세포 단독(gRNA 없음), 단일 gRNA(3' 연장을 결하는 gRNA 2, 스텁이 없는 gRNA 1, 및 스텁이 있는 gRNA 1) 및 2개 gRNA(스텁이 없는 gRNA 1 플러스 gRNA 2 및 스텁이 있는 gRNA 1 및 gRNA 2)에 대해 측정되었다. 2개 gRNA 시스템은 단일 gRNA 시스템에 비해 편집 효율을 증가시켰다. 2개 gRNA 시스템에서 gRNA 1에 스텁의 존재는 gRNA 1에 스텁을 결하는 2개 gRNA 시스템에 비해 편집 효율을 증가시켰다.
실시예 7
개선된 편집을 위한 gRNA 벨크로
본 실시예는 개선된 편집을 위한 gRNA 벨크로를 기술한다. 벨크로 영역을 포함하는 gRNA는 gRNA와 표적 핵산에서 흠집의 5'에 형성된 플랩 사이의 상호작용을 촉진하여 가닥 형성의 효율을 향상시켰다. 벨크로 영역은 역전사효소 주형 영역의 5' 또는 제1 가닥 프라이머 비닝 부위의 3'에 위치되었다. gRNA 벨크로 삽입은 실시예 2 - 실시예 5에 제공된 단일 가이드 시스템 또는 실시예 6에 제공된 이중 가이드 시스템과 호환되었다.
도 8a는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 제1 가닥 프라이머 결합 부위의 gRNA 5'의 영역에 역상보적인 역전사효소 주형 영역의 5'에 위치한 5 내지 200개 뉴클레오티드를 포함한다. 도 8b는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 역전사효소 주형 영역의 영역 5'에 역상보적인 제1 가닥 프라이머 결합 부위의 3'에 위치한 5 내지 100개 뉴클레오티드를 포함한다.
도 12a는 표적 핵산의 플랩에 대한 프라이머 결합 부위(PBS)의 혼성화 속도를 가속화하기 위해 벨크로 영역이 없는(왼쪽) 또는 있는(중간 및 오른쪽) gRNA 작제물을 예시한다. V1 배열에서 벨크로 영역은 gRNA의 5' 말단 또는 그 근처에 위치될 수 있고 프라이머 결합 부위의 gRNA 5'의 영역("벨크로 V1", 중간)에 혼성화할 수 있다. V2 배열에서 벨크로 영역은 프라이머 결합 부위의 3'에 위치될 수 있고 gRNA의 5' 말단 또는 그 근처의 영역("벨크로 V2," 오른쪽)에 혼성화할 수 있다.
도 12b도 12a에 제공된 gRNA 작제물의 예측된 3-차원 구조를 예시한다. 벨크로 영역을 결하는 gRNA는 왼쪽에 도시되어 있다. 벨크로 V1 영역 또는 벨크로 V2 영역을 포함하는 gRNA는 각각 중간 및 오른쪽 패널에 도시되어 있다.
도 9a도 8a도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-mlvRTv 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역의 5'에 위치한 15 nt 벨크로 영역(도 8a에 예시된 바와 같이 "V1"), 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위의 3'에 위치한 벨크로 영역(도 8b에 예시된 바와 같이 "V2")을 사용하여 비교되었다. gRNA는 107 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위를 함유했다. 편집은 흠집의 2 뉴클레오티드 3'에서 시작하는 ATCC 서열이 CATA로 돌연변이되도록 수행되었다. 도 9b도 8a도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-R2(116-1016) 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 벨크로 결합 부위의 말단과 프라이머 결합 부위의 시작 사이 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역의 5'에 위치한 15 nt 벨크로 영역(도 8a에 예시된 바와 같이 "V1"), 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위의 3'에 위치한 벨크로 영역(도 8b에 예시된 바와 같이 "V2")을 사용하여 비교되었다. 두 nCas9-RT 작제물 모두에서 벨크로 영역을 포함하는 특정 gRNA는 편집 효율을 증가시켰다. 특히, 1 nt 갭을 갖는 V1 벨크로 gRNA 및 20 nt 벨크로 gRNA는 nCas9-mlvRTv 작제물에서 편집 효율을 향상시켰고, 10 nt 갭을 갖는 V1 벨크로 gRNA 및 20 nt V2 벨크로 gRNA는 nCas9-R2 작제물에서 편집 효율을 향상시켰다.
도 12c는 129 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위 및 20 뉴클레오티드 벨크로 영역을 갖는 gRNA의 편집 효율을 나타낸다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 원래 gRNA("원래 코딩") 또는 2차 구조를 제거하기 위해 RT 주형에서 침묵 돌연변이로 코딩된 gRNA("재코딩됨")에 대한 편집 효율이 비교되었다. 침묵 돌연변이를 사용한 2차 구조의 제거는 원래 RT 주형에 비해 편집 효율을 개선하였다. 부가적으로, 벨크로 영역을 포함하는 gRNA의 사용은 닉킹 부위에서 65 뉴클레오티드 거리에서 효율적인 편집을 허용했다.
도 12d는 벨크로 서열의 상이한 길이를 갖는 gRNA의 편집 효율을 나타낸다. 각각의 gRNA는 5'에서 3'의 순서로 RT 주형, 프라이머 결합 부위, 및 벨크로 영역을, 왼쪽 상의 개략도에 도시된 바와 같이 함유했다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. gRNA는 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위를 가졌다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 갭이 없이 3' 말단에 위치된 20 뉴클레오티드 벨크로 영역을 갖는 gRNA는 시험된 다른 gRNA보다 높은 편집 효율을 나타냈다.
실시예 8
개선된 편집 시스템 전달을 위한 보호 복합체의 공동-전달
본 실시예는 본 명세서에 제공된 편집 시스템의 개선된 전달을 위한 보호 복합체의 공동-발현을 기술한다. 본 명세서에 제공된 nCas9-RT 작제물 및 본 명세서에 제공된 gRNA는 세포에 전달된다. nCas9-RT와 gRNA는 보호 단백질 복합체를 인코딩하는 개방 판독 프레임 서열과 공동-발현된다. 보호 단백질 복합체는 세포에서 발현되어 gRNA의 분해 또는 탈아미노화를 방지하여 편집 시스템의 전달을 개선한다. 개방 판독 프레임 서열은 인간 Orf1p(서열번호: 38) 또는 뮤어라인 Orf1p(서열번호: 39)이다.
실시예 9
벨크로 영역 및 제2 가닥 프라이머를 갖는 gRNA로 개선된 편집 효율
본 실시예는 벨크로 영역 및 제2 가닥 프라이머를 갖는 gRNA로 개선된 편집 효율을 기술한다. gRNA는 gRNA의 3' 말단에 제2 가닥 프라이머와 제2 가닥 프라이머의 벨크로 영역 5'을 합체함에 의해 단일-가닥 파손에서 편집의 효율을 증가시키도록 설계되었다. 제2 가닥 프라이머는 새롭게 합성된 제1 가닥을 주형으로 사용하여 제2 가닥의 합성을 프라이밍했다. 제2 가닥 합성의 프라이밍은 이중-가닥 파손의 형성 없이 단일-가닥 파손의 부위 안으로 합성된 서열의 삽입을 용이하게 하였다. 벨크로 영역은 gRNA와 표적 핵산에서 흠집의 5'에 형성된 플랩 사이의 상호작용을 촉진함에 의해 가닥 형성의 효율을 향상시켰다.
도 13a는 벨크로 영역과 2nd 가닥 프라이머를 포함하는 pegRNA 및 스티치 gRNA의 개략도(상단) 및 스티치 gRNA를 사용한 게놈 편집의 방법(하단)을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 표적 부위에 gRNA의 스페이서의 혼성화에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥에 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합된다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화된다. 4-200 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합된다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안으로 합체될 수 있다.
도 13b는 다양한 길이이고 닉킹 부위로부터 다양한 거리에서 혼성화된 gRNA 제2 가닥 프라이머(SSP)의 편집 효율을 나타낸다. 흠집으로부터 6, 36 또는 55 뉴클레오티드에 위치된 제2 가닥 프라이머 20, 40 또는 60 뉴클레오티드(nt) 길이가 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다.
도 13c는 벨크로 영역 또는 제2 가닥 프라이머가 없는("벨크로 없음, SSP 없음"), 19 뉴클레오티드 벨크로 영역이 있는("19 nt 벨크로") 또는 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머 둘 모두가 있는("19 nt 벨크로, 20 nt SSP") gRNA의 편집 효율성을 나타낸다. 편집 효율은 벨크로 영역과 제2 가닥 프라이머를 결하는 gRNA 또는 벨크로 영역을 함유하지만 제2 가닥 프라이머가 없는 gRNA와 비교하여 벨크로 영역과 제2 가닥 프라이머 둘 모두를 함유하는 gRNA를 사용하는 경우 증가되었다. 벨크로 영역과 제2 가닥 프라이머 둘 모두를 함유하는 gRNA를 사용하여 달성한 편집 효율은 단일 흠집에서 54%였으며, 이는 단일 흠집에서 편집 효율에 대한 50%의 예측 한계보다 높았다.
실시예 10
편집 효율을 증가시키기 위한 역전사효소 단백질 공학
본 실시예는 편집 효율을 증가시키기 위한 역전사효소 단백질 조작을 기술한다. 편집 효율을 개선하기 위해 mlvRT 작제물에서 점 돌연변이가 이루어졌다. 편집 효율은 돌연변이된 작제물을 사용하여 측정되었다.
도 14a는 mlvRT 역전사효소에서 돌연변이에 대한 스크리닝의 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40과 비교하여 Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, 또는 L671P 단일 점 돌연변이를 함유하는 mlvRT 작제물(각각 서열번호: 41 - 서열번호: 70)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 1 뉴클레오티드 갭, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. Q84A(서열번호: 46), T197A(서열번호: 48), D653N(서열번호: 68), T664N(서열번호: 69), 또는 L671P(서열번호: 70)를 함유하는 돌연변이는 서열번호: 40과 비교하여 유의하게 증가된 편집 효율을 나타났다.
도 14b는 mlvRT 역전사효소에서 돌연변이의 조합에 대한 스크리닝의 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 T197A 및 D653N; T197A 및 T664N; T197A 및 L671P; T197A, D653N, T664N 및 L671P; 또는 P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P를 함유하는 mlvRT 작제물(각각 서열번호: 71 - 서열번호: 75)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P 점 돌연변이를 함유하는 작제물(서열번호: 75)은 시험된 작제물의 가장 높은 편집 효율을 나타냈다.
도 15c는 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 77 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. V223A 점 돌연변이는 닉킹 부위에 비하여 원거리에서 편집 효율을 증가시켰다.
실시예 11
편집 효율을 증가시키기 위한 dNTP의 이용가능성 증가
본 실시예는 Cas9-RT 작제물의 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 기술한다. 세포에서 낮은 편집 효율에 기여할 수 있는 한 가지 요인은 dNTP의 제한된 이용가능성이다. 도 15a는 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 예시한다. CDK1을 결하는 비-분열 세포에서, 인산화되지 않은 SAMHD1은 dNTP를 절단하여 세포에서 이용가능한 dNTP를 감소시킨다. 분열하는 세포에서 CDK1은 SAMHD1을 인산화하여 SAMHD1이 dNTP를 절단하는 것을 방지하고 세포에서 dNTP의 증가된 이용가능성을 초래한다. SAMHD1에서 단일 점 돌연변이(T592A)는 CDK1에 의한 SAMHD1의 인산화를 방지하여, 구성적으로 활성인 SAMHD1과 세포에서 dNTP의 낮은 이용가능성을 초래한다. T592A 돌연변이 SAMHD1을 사용하여 도 15b, 도 15d 도 15e에 도시된 검정에서 낮은 dNTP 환경을 유도하였다. Vpx의 추가는 SAMHD1을 억제하여 세포에서 dNTP의 증가된 이용가능성을 초래한다. 편집 효율에 대한 낮은 세포질 dNTP의 효과를 시험하기 위해, 구성적으로 활성인 SAMHD1을 Cas9-RT 작제물과 공동-발현시키고 편집 효율을 측정했다.
도 15b는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 Q221R; V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 76 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 구성적으로 활성인 SAMHD1의 발현은 모든 시험된 작제물의 편집 효율을 감소시켰다.
구성적으로 활성인 SAMHD1을 발현하는 세포에서 편집 효율을 구하기 위해, Vpx 펩티드(서열번호: 82)가 또한 세포에서 발현되었다. 도 15d는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15e는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 세포에서 Vpx의 발현은 구성적으로 활성인 SAMHD1을 발현하는 세포와 구성적으로 활성인 SAMHD1을 발현하지 않는 세포 둘 모두에서 편집 효율을 증가시켰다. 부가적으로, Vpx는 닉킹 부위로부터 짧은 거리(도 15d) 및 닉킹 부위로부터 긴 거리(도 15e) 부위에서 편집 효율을 증가시켰다.
실시예 12
분할 Cas9 작제물의 세포질 발현을 위한 인테인
본 실시예는 Cas9 작제물의 세포질 발현을 위해 인테인을 사용하는 것을 기술한다. 제1 검정에서, nCas9의 C-말단 부분에서 시스테인 잔기의 치환에 도움이 되는 위치를 식별하기 위해 닉킹 Cas9(nCas9) 점 돌연변이의 스크린이 수행되었다. 시스테인 점 돌연변이는 류신 지퍼를 통해 연결된 nCas9-RT 작제물의 맥락에서 스크리닝되었다. 시스테인은 다른 지점에서 nCas9의 C-말단 부분 안으로 삽입되어 nCas9 및 역전사효소 조합된 서열의 중앙을 향해 위치된 시스테인 잔기를 갖는 작제물을 생성하였다. 시스테인 잔기는 N-말단에서 삽입된 시스테인까지의 Cas9 단백질의 각 부분 및 C-말단 플러스 역전사효소에 대해 삽입된 시스테인을 포함하는 Cas9 단백질의 부분이, 인테인 융합으로 발현될 때 AAV 벡터에 끼워지기에 충분히 작도록 위치되었다. 류신 지퍼 연결된 nCas9-RT 시스테인 돌연변이체의 편집 효율이 비교되었다.
도 16은 닉킹 활성을 위해 변형되고 류신 지퍼를 통해 역전사효소에 연결된 Cas9 작제물의 편집 효율을 나타낸다. S. 피오게네스 Cas9("SpCas9") 작제물은 Cas9 닉카제(nCas9)를 생성하는 H840A 돌연변이를 함유했다. 시스테인 잔기를 D1079C, S1173C 또는 D1180C에서 Cas9 닉카제 안으로 도입하여 엑스테인-인테인 융합체로서의 발현을 위해 Cas9를 분할 인테인 Cas9(iCas9)로 분할할 수 있었다. H840A 및 D1079C(류신 지퍼를 갖는 서열번호: 85), H840A 및 S1173C(류신 지퍼를 갖는 서열번호: 86), 또는 H840A 및 D1180C(류신 지퍼를 갖는 서열번호: 87) 점 돌연변이를 함유하고 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 류신 지퍼 Cas9 작제물이 시험되었다. H840A 돌연변이를 함유하지만 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 부가 시스테인(류신 지퍼를 갖는 서열번호: 84)이 없는 Cas9 닉카제가 대조군으로 사용되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
제2 검정에서, 제1 검정에서 식별된 시스테인 점 돌연변이를 이용하여 분할 인테인 Cas9 작제물을 생성했다. 2개의 엑스테인-인테인 융합체로 발현되는 식별된 S1173C 돌연변이를 포함하는 nCas9-RT 융합체의 편집 효율을 시험했다. nCas9-RT 융합체는 mlvRT5M(서열번호: 40)에 융합된 S1173C 점 돌연변이(서열번호: 86)를 갖는 nCas9를 함유하였다. 융합 단백질의 제1 분절은 제1 플라스미드 벡터에서 제1 인테인 융합 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었으며 융합 단백질의 제2 분절은 제2 플라스미드 벡터에서 발현된 제2 인테인 융합 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 인테인 도메인의 자가촉매 활성은 nCas9(1-1172) 엑스테인을 nCas9(S1173C를 갖는 1173-1368) - mlvRT5M 엑스테인에 융합하였고 Npu N(서열번호: 88) 및 Npu C(서열번호: 89) 인테인을 절단하여 융합된 nCas9(S1173C) - mlvRT5M 작제물(서열번호: 92)을 형성하였다. 분할 인테인 nCas9 작제물의 편집 효율은 닉킹 부위에 대해 두 위치에서 시험되었다.
도 17a는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)에 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17b는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)과 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
결과는 분할 인테인 Cas9-RT 융합 작제물이 류신 지퍼 분할 Cas9 작제물과 비교하여 강력한 편집 효율을 보였다는 것을 나타내었다.
실시예 13
개선된 편집 효율을 위한 gRNA의 3' 변형
본 실시예는 개선된 편집 효율을 위한 gRNA의 3' 변형을 기술한다. 제2 가닥 프라이머가 주형 영역에 100% 상보적이고 3' 말단에 위치한 gRNA는 제2 가닥 프라이머의 바로 3'에 폴리-U 서열로 전사되어, 프라이밍 기능을 억제할 수 있다. 이 문제를 해결하기 위해, 제2 가닥 프라이머의 3'에 위치된 절단가능한 RNA 서열을 갖는 gRNA가 개발되어 제2 가닥 프라이머의 3' 말단에서 폴리-U 서열의 형성을 방지하였다. HDV 자가-절단 리보자임 또는 제2 가닥 프라이머의 3'에 위치된 tRNA를 갖는 gRNA를 시험했다.
HDV 자가-절단 리보자임은 gRNA의 3' 말단으로부터 그 자체를 자가촉매적으로 절단하여 폴리-U 서열이 없는 제2 가닥 프라이머를 남겼다. HDV 리보자임은 제2 가닥 프라이머의 3' 말단에 2'3' 고리형 포스페이트를 남겨 제2 가닥 프라이머의 프라이머 연장을 억제했다. 내인성 폴리뉴클레오티드 키나아제는 2'3' 고리형 포스페이트를 3' OH로 전환하여 프라이머 연장을 가능하게 한다. tRNA는 내인성 RNase P에 의해 제2 가닥 프라이머의 3' 말단에서 절단되어, 프라이머 연장이 가능한 3' OH 및 폴리-U 서열이 없는 제2 가닥 프라이머를 남겼다.
도 18은 제2 가닥 프라이머의 바로 3'인, gRNA의 3' 말단에서 HDV 리보자임(왼쪽 막대) 또는 tRNA(오른쪽 막대)를 포함하는 gRNA의 존재에서 류신 지퍼 Cas9-RT 작제물의 편집 효율을 나타낸다. 류신 지퍼 Cas9-RT 작제물은 nCas9-LZ1(서열번호: 1) 및 LZ2-mlvRT5M(서열번호: 2)로 발현되었고, 류신 지퍼를 통해 연결되었다. tRNA는 서열번호: 94에 상응하는 서열을 가졌다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역, 20 뉴클레오티드 제2 가닥 프라이머, 및 제2 가닥 프라이머의 HDV 리보자임 또는 tRNA 3'을 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
실시예 14
GPS-지원된 리앵커버 gRNA(GARG) 및 GPS-모집 가이드(GRG)
GPS-지원된 리앵커버 gRNA(GARG)는, 예를 들어 단일 가이드 핵산 시스템이 그렇지 않으면 편집을 포함하지 않는 게놈 가닥을 충분히 치환하지 않는 원하는 편집을 함유하는 플랩을 생성하는 경우에 유전자 편집 효율을 개선할 수 있다. GARG는 연장된 플랩의 게놈 안으로의 혼성화를 촉진하는 데 유용할 수 있고, 교체하려는 게놈 가닥의 근처에 연장된 플랩의 3' 말단을 앵커링할 수 있다. 도 33은 이중 가이드 시스템으로부터의 데이터를 묘사한다. 2개 별도의 GARG가 시험되었고 포유동물 세포의 표적 핵산에서 유전자 편집이 성공적으로 이루어졌다. 따라서, GARG 및 GRG를 포함하는 이중 가이드 시스템을 이용하는 방법은 포유동물 세포와 같은 세포에서 정밀한 게놈 편집을 유도할 수 있다.
본 개시내용의 바람직한 실시형태가 본 명세서에서 도시되고 기술되었지만, 그러한 실시형태는 단지 예로서 제공된다는 것은 당업자에게 명백할 것이다. 수많은 변형, 변경 및 대체가 이제 개시내용을 벗어남이 없이 당업자에게 발생할 것이다. 본 명세서에 기술된 개시내용의 실시형태에 대한 다양한 대안이 개시내용을 실시하는데 이용될 수 있음을 이해해야 한다. 다음 청구범위는 개시내용의 범주를 정의하고 이들 청구범위 및 그 균등물의 범주 내의 방법 및 구조는 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING <110> EVOLVE BIOTECH, INC. <120> METHODS AND COMPOSITIONS FOR DIRECTED GENOME EDITING <130> 56385-701.601 <140> <141> <150> 63/153,161 <151> 2021-02-24 <150> 63/055,829 <151> 2020-07-23 <150> 62/992,032 <151> 2020-03-19 <160> 144 <170> PatentIn version 3.5 <210> 1 <211> 1460 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 1 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn 20 25 30 Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys 35 40 45 Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn 50 55 60 Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr 65 70 75 80 Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg 85 90 95 Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp 100 105 110 Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp 115 120 125 Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val 130 135 140 Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu 145 150 155 160 Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu 165 170 175 Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu 180 185 190 Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln 195 200 205 Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val 210 215 220 Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu 225 230 235 240 Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe 245 250 255 Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser 260 265 270 Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr 275 280 285 Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr 290 295 300 Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu 305 310 315 320 Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser 325 330 335 Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu 340 345 350 Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile 355 360 365 Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly 370 375 380 Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys 385 390 395 400 Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu 405 410 415 Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile 420 425 430 His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr 435 440 445 Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe 450 455 460 Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe 465 470 475 480 Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe 485 490 495 Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg 500 505 510 Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys 515 520 525 His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys 530 535 540 Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly 545 550 555 560 Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys 565 570 575 Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys 580 585 590 Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser 595 600 605 Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe 610 615 620 Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr 625 630 635 640 Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr 645 650 655 Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg 660 665 670 Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile 675 680 685 Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp 690 695 700 Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 705 710 715 720 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp 725 730 735 Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 740 745 750 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val 755 760 765 Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu 770 775 780 Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys 785 790 795 800 Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu 805 810 815 His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr 820 825 830 Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 835 840 845 Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe 850 855 860 Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys 865 870 875 880 Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys 885 890 895 Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln 900 905 910 Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu 915 920 925 Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln 930 935 940 Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 945 950 955 960 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu 965 970 975 Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 980 985 990 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 995 1000 1005 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1010 1015 1020 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1025 1030 1035 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1040 1045 1050 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1055 1060 1065 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1070 1075 1080 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1085 1090 1095 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1100 1105 1110 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1115 1120 1125 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1130 1135 1140 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1145 1150 1155 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1160 1165 1170 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1175 1180 1185 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1190 1195 1200 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1205 1210 1215 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1235 1240 1245 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1250 1255 1260 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1265 1270 1275 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1280 1285 1290 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1295 1300 1305 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1310 1315 1320 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1325 1330 1335 Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 1340 1345 1350 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1355 1360 1365 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1370 1375 1380 Gly Gly Asp Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu 1385 1390 1395 Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Arg 1400 1405 1410 Leu Glu Ile Arg Ala Ala Phe Leu Arg Gln Arg Asn Thr Ala Leu 1415 1420 1425 Arg Thr Glu Val Ala Glu Leu Glu Gln Glu Val Gln Arg Leu Glu 1430 1435 1440 Asn Glu Val Ser Gln Tyr Glu Thr Arg Tyr Gly Pro Leu Gly Gly 1445 1450 1455 Gly Lys 1460 <210> 2 <211> 779 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 2 Met Leu Glu Ile Glu Ala Ala Phe Leu Glu Arg Glu Asn Thr Ala Leu 1 5 10 15 Glu Thr Arg Val Ala Glu Leu Arg Gln Arg Val Gln Arg Leu Arg Asn 20 25 30 Arg Val Ser Gln Tyr Arg Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys 35 40 45 Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr 50 55 60 Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser 65 70 75 80 Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 85 90 95 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 100 105 110 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 115 120 125 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 130 135 140 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 145 150 155 160 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 165 170 175 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 180 185 190 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 195 200 205 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 210 215 220 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 225 230 235 240 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 245 250 255 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 260 265 270 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 275 280 285 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 290 295 300 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 305 310 315 320 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 325 330 335 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 340 345 350 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 355 360 365 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 370 375 380 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 385 390 395 400 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 405 410 415 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 420 425 430 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 435 440 445 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 450 455 460 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 465 470 475 480 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 485 490 495 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 500 505 510 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 515 520 525 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 530 535 540 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 545 550 555 560 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 565 570 575 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 580 585 590 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 595 600 605 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 610 615 620 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 625 630 635 640 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 645 650 655 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 660 665 670 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 675 680 685 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 690 695 700 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 705 710 715 720 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 725 730 735 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 740 745 750 Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly 755 760 765 Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val 770 775 <210> 3 <211> 420 <212> PRT <213> Geobacilus stereothermophilus <400> 3 Met Ala Leu Leu Glu Arg Ile Leu Ala Arg Asp Asn Leu Ile Thr Ala 1 5 10 15 Leu Lys Arg Val Glu Ala Asn Gln Gly Ala Pro Gly Ile Asp Gly Val 20 25 30 Ser Thr Asp Gln Leu Arg Asp Tyr Ile Arg Ala His Trp Ser Thr Ile 35 40 45 His Ala Gln Leu Leu Ala Gly Thr Tyr Arg Pro Ala Pro Val Arg Arg 50 55 60 Val Glu Ile Pro Lys Pro Gly Gly Gly Thr Arg Gln Leu Gly Ile Pro 65 70 75 80 Thr Val Val Asp Arg Leu Ile Gln Gln Ala Ile Leu Gln Glu Leu Thr 85 90 95 Pro Ile Phe Asp Pro Asp Phe Ser Ser Ser Ser Phe Gly Phe Arg Pro 100 105 110 Gly Arg Asn Ala His Asp Ala Val Arg Gln Ala Gln Gly Tyr Ile Gln 115 120 125 Glu Gly Tyr Arg Tyr Val Val Asp Met Asp Leu Glu Lys Phe Phe Asp 130 135 140 Arg Val Asn His Asp Ile Leu Met Ser Arg Val Ala Arg Lys Val Lys 145 150 155 160 Asp Lys Arg Val Leu Lys Leu Ile Arg Ala Tyr Leu Gln Ala Gly Val 165 170 175 Met Ile Glu Gly Val Lys Val Gln Thr Glu Glu Gly Thr Pro Gln Gly 180 185 190 Gly Pro Leu Ser Pro Leu Leu Ala Asn Ile Leu Leu Asp Asp Leu Asp 195 200 205 Lys Glu Leu Glu Lys Arg Gly Leu Lys Phe Cys Arg Tyr Ala Asp Asp 210 215 220 Cys Asn Ile Tyr Val Lys Ser Leu Arg Ala Gly Gln Arg Val Lys Gln 225 230 235 240 Ser Ile Gln Arg Phe Leu Glu Lys Thr Leu Lys Leu Lys Val Asn Glu 245 250 255 Glu Lys Ser Ala Val Asp Arg Pro Trp Lys Arg Ala Phe Leu Gly Phe 260 265 270 Ser Phe Thr Pro Glu Arg Lys Ala Arg Ile Arg Leu Ala Pro Arg Ser 275 280 285 Ile Gln Arg Leu Lys Gln Arg Ile Arg Gln Leu Thr Asn Pro Asn Trp 290 295 300 Ser Ile Ser Met Pro Glu Arg Ile His Arg Val Asn Gln Tyr Val Met 305 310 315 320 Gly Trp Ile Gly Tyr Phe Arg Leu Val Glu Thr Pro Ser Val Leu Gln 325 330 335 Thr Ile Glu Gly Trp Ile Arg Arg Arg Leu Arg Leu Cys Gln Trp Leu 340 345 350 Gln Trp Lys Arg Val Arg Thr Arg Ile Arg Glu Leu Arg Ala Leu Gly 355 360 365 Leu Lys Glu Thr Ala Val Met Glu Ile Ala Asn Thr Arg Lys Gly Ala 370 375 380 Trp Arg Thr Thr Lys Thr Pro Gln Leu His Gln Ala Leu Gly Lys Thr 385 390 395 400 Tyr Trp Thr Ala Gln Gly Leu Lys Ser Leu Thr Gln Arg Tyr Phe Glu 405 410 415 Leu Arg Gln Gly 420 <210> 4 <211> 427 <212> PRT <213> Eubacterium rectale <400> 4 Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu 1 5 10 15 Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val 20 25 30 Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly 35 40 45 Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro 50 55 60 Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu 65 70 75 80 Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln 85 90 95 Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly 100 105 110 Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn 115 120 125 Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys 130 135 140 Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg 145 150 155 160 Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val 165 170 175 Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 180 185 190 Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn 195 200 205 Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr 210 215 220 Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg 225 230 235 240 Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys 245 250 255 Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr 260 265 270 Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala 275 280 285 Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu 290 295 300 Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys 305 310 315 320 Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser 325 330 335 Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu 340 345 350 Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys 355 360 365 Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala 370 375 380 Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn 385 390 395 400 Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met 405 410 415 Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 420 425 <210> 5 <211> 427 <212> PRT <213> Unknown <220> <223> Description of Unknown: marathonRT seqeunce <400> 5 Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu 1 5 10 15 Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val 20 25 30 Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly 35 40 45 Glu Thr Ile Lys Gly Gln Leu Arg Thr Ala Ala Tyr Ala Pro Gln Pro 50 55 60 Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu 65 70 75 80 Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln 85 90 95 Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly 100 105 110 Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn 115 120 125 Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys 130 135 140 Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg 145 150 155 160 Thr Ile Ala Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val 165 170 175 Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 180 185 190 Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn 195 200 205 Glu Leu Asp Lys Glu Met Glu Ala Ala Gly Leu Asn Phe Val Arg Tyr 210 215 220 Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg 225 230 235 240 Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys 245 250 255 Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr 260 265 270 Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala 275 280 285 Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu 290 295 300 Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys 305 310 315 320 Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser 325 330 335 Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu 340 345 350 Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys 355 360 365 Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala 370 375 380 Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn 385 390 395 400 Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met 405 410 415 Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 420 425 <210> 6 <211> 1114 <212> PRT <213> Bombyx mori <400> 6 Met Met Ala Ser Thr Ala Leu Ser Leu Met Gly Arg Cys Asn Pro Asp 1 5 10 15 Gly Cys Thr Arg Gly Lys His Val Thr Ala Ala Pro Met Asp Gly Pro 20 25 30 Arg Gly Pro Ser Ser Leu Ala Gly Thr Phe Gly Trp Gly Leu Ala Ile 35 40 45 Pro Ala Gly Glu Pro Cys Gly Arg Val Cys Ser Pro Ala Thr Val Gly 50 55 60 Phe Phe Pro Val Ala Lys Lys Ser Asn Lys Glu Asn Arg Pro Glu Ala 65 70 75 80 Ser Gly Leu Pro Leu Glu Ser Glu Arg Thr Gly Asp Asn Pro Thr Val 85 90 95 Arg Gly Ser Ala Gly Ala Asp Pro Val Gly Gln Asp Ala Pro Gly Trp 100 105 110 Thr Cys Gln Phe Cys Glu Arg Thr Phe Ser Thr Asn Arg Gly Leu Gly 115 120 125 Val His Lys Arg Arg Ala His Pro Val Glu Thr Asn Thr Asp Ala Ala 130 135 140 Pro Met Met Val Lys Arg Arg Trp His Gly Glu Glu Ile Asp Leu Leu 145 150 155 160 Ala Arg Thr Glu Ala Arg Leu Leu Ala Glu Arg Gly Gln Cys Ser Gly 165 170 175 Gly Asp Leu Phe Gly Ala Leu Pro Gly Phe Gly Arg Thr Leu Glu Ala 180 185 190 Ile Lys Gly Gln Arg Arg Arg Glu Pro Tyr Arg Ala Leu Val Gln Ala 195 200 205 His Leu Ala Arg Phe Gly Ser Gln Pro Gly Pro Ser Ser Gly Gly Cys 210 215 220 Ser Ala Glu Pro Asp Phe Arg Arg Ala Ser Gly Ala Glu Glu Ala Gly 225 230 235 240 Glu Glu Arg Cys Ala Glu Asp Ala Ala Ala Tyr Asp Pro Ser Ala Val 245 250 255 Gly Gln Met Ser Pro Asp Ala Ala Arg Val Leu Ser Glu Leu Leu Glu 260 265 270 Gly Ala Gly Arg Arg Arg Ala Cys Arg Ala Met Arg Pro Lys Thr Ala 275 280 285 Gly Arg Arg Asn Asp Leu His Asp Asp Arg Thr Ala Ser Ala His Lys 290 295 300 Thr Ser Arg Gln Lys Arg Arg Ala Glu Tyr Ala Arg Val Gln Glu Leu 305 310 315 320 Tyr Lys Lys Cys Arg Ser Arg Ala Ala Ala Glu Val Ile Asp Gly Ala 325 330 335 Cys Gly Gly Val Gly His Ser Leu Glu Glu Met Glu Thr Tyr Trp Arg 340 345 350 Pro Ile Leu Glu Arg Val Ser Asp Ala Pro Gly Pro Thr Pro Glu Ala 355 360 365 Leu His Ala Leu Gly Arg Ala Glu Trp His Gly Gly Asn Arg Asp Tyr 370 375 380 Thr Gln Leu Trp Lys Pro Ile Ser Val Glu Glu Ile Lys Ala Ser Arg 385 390 395 400 Phe Asp Trp Arg Thr Ser Pro Gly Pro Asp Gly Ile Arg Ser Gly Gln 405 410 415 Trp Arg Ala Val Pro Val His Leu Lys Ala Glu Met Phe Asn Ala Trp 420 425 430 Met Ala Arg Gly Glu Ile Pro Glu Ile Leu Arg Gln Cys Arg Thr Val 435 440 445 Phe Val Pro Lys Val Glu Arg Pro Gly Gly Pro Gly Glu Tyr Arg Pro 450 455 460 Ile Ser Ile Ala Ser Ile Pro Leu Arg His Phe His Ser Ile Leu Ala 465 470 475 480 Arg Arg Leu Leu Ala Cys Cys Pro Pro Asp Ala Arg Gln Arg Gly Phe 485 490 495 Ile Cys Ala Asp Gly Thr Leu Glu Asn Ser Ala Val Leu Asp Ala Val 500 505 510 Leu Gly Asp Ser Arg Lys Lys Leu Arg Glu Cys His Val Ala Val Leu 515 520 525 Asp Phe Ala Lys Ala Phe Asp Thr Val Ser His Glu Ala Leu Val Glu 530 535 540 Leu Leu Arg Leu Arg Gly Met Pro Glu Gln Phe Cys Gly Tyr Ile Ala 545 550 555 560 His Leu Tyr Asp Thr Ala Ser Thr Thr Leu Ala Val Asn Asn Glu Met 565 570 575 Ser Ser Pro Val Lys Val Gly Arg Gly Val Arg Gln Gly Asp Pro Leu 580 585 590 Ser Pro Ile Leu Phe Asn Val Val Met Asp Leu Ile Leu Ala Ser Leu 595 600 605 Pro Glu Arg Val Gly Tyr Arg Leu Glu Met Glu Leu Val Ser Ala Leu 610 615 620 Ala Tyr Ala Asp Asp Leu Val Leu Leu Ala Gly Ser Lys Val Gly Met 625 630 635 640 Gln Glu Ser Ile Ser Ala Val Asp Cys Val Gly Arg Gln Met Gly Leu 645 650 655 Arg Leu Asn Cys Arg Lys Ser Ala Val Leu Ser Met Ile Pro Asp Gly 660 665 670 His Arg Lys Lys His His Tyr Leu Thr Glu Arg Thr Phe Asn Ile Gly 675 680 685 Gly Lys Pro Leu Arg Gln Val Ser Cys Val Glu Arg Trp Arg Tyr Leu 690 695 700 Gly Val Asp Phe Glu Ala Ser Gly Cys Val Thr Leu Glu His Ser Ile 705 710 715 720 Ser Ser Ala Leu Asn Asn Ile Ser Arg Ala Pro Leu Lys Pro Gln Gln 725 730 735 Arg Leu Glu Ile Leu Arg Ala His Leu Ile Pro Arg Phe Gln His Gly 740 745 750 Phe Val Leu Gly Asn Ile Ser Asp Asp Arg Leu Arg Met Leu Asp Val 755 760 765 Gln Ile Arg Lys Ala Val Gly Gln Trp Leu Arg Leu Pro Ala Asp Val 770 775 780 Pro Lys Ala Tyr Tyr His Ala Ala Val Gln Asp Gly Gly Leu Ala Ile 785 790 795 800 Pro Ser Val Arg Ala Thr Ile Pro Asp Leu Ile Val Arg Arg Phe Gly 805 810 815 Gly Leu Asp Ser Ser Pro Trp Ser Val Ala Arg Ala Ala Ala Lys Ser 820 825 830 Asp Lys Ile Arg Lys Lys Leu Arg Trp Ala Trp Lys Gln Leu Arg Arg 835 840 845 Phe Ser Arg Val Asp Ser Thr Thr Gln Arg Pro Ser Val Arg Leu Phe 850 855 860 Trp Arg Glu His Leu His Ala Ser Val Asp Gly Arg Glu Leu Arg Glu 865 870 875 880 Ser Thr Arg Thr Pro Thr Ser Thr Lys Trp Ile Arg Glu Arg Cys Ala 885 890 895 Gln Ile Thr Gly Arg Asp Phe Val Gln Phe Val His Thr His Ile Asn 900 905 910 Ala Leu Pro Ser Arg Ile Arg Gly Ser Arg Gly Arg Arg Gly Gly Gly 915 920 925 Glu Ser Ser Leu Thr Cys Arg Ala Gly Cys Lys Val Arg Glu Thr Thr 930 935 940 Ala His Ile Leu Gln Gln Cys His Arg Thr His Gly Gly Arg Ile Leu 945 950 955 960 Arg His Asn Lys Ile Val Ser Phe Val Ala Lys Ala Met Glu Glu Asn 965 970 975 Lys Trp Thr Val Glu Leu Glu Pro Arg Leu Arg Thr Ser Val Gly Leu 980 985 990 Arg Lys Pro Asp Ile Ile Ala Ser Arg Asp Gly Val Gly Val Ile Val 995 1000 1005 Asp Val Gln Val Val Ser Gly Gln Arg Ser Leu Asp Glu Leu His 1010 1015 1020 Arg Glu Lys Arg Asn Lys Tyr Gly Asn His Gly Glu Leu Val Glu 1025 1030 1035 Leu Val Ala Gly Arg Leu Gly Leu Pro Lys Ala Glu Cys Val Arg 1040 1045 1050 Ala Thr Ser Cys Thr Ile Ser Trp Arg Gly Val Trp Ser Leu Thr 1055 1060 1065 Ser Tyr Lys Glu Leu Arg Ser Ile Ile Gly Leu Arg Glu Pro Thr 1070 1075 1080 Leu Gln Ile Val Pro Ile Leu Ala Leu Arg Gly Ser His Met Asn 1085 1090 1095 Trp Thr Arg Phe Asn Gln Met Thr Ser Val Met Gly Gly Gly Val 1100 1105 1110 Gly <210> 7 <211> 901 <212> PRT <213> Bombyx mori <400> 7 Phe Cys Glu Arg Thr Phe Ser Thr Asn Arg Gly Leu Gly Val His Lys 1 5 10 15 Arg Arg Ala His Pro Val Glu Thr Asn Thr Asp Ala Ala Pro Met Met 20 25 30 Val Lys Arg Arg Trp His Gly Glu Glu Ile Asp Leu Leu Ala Arg Thr 35 40 45 Glu Ala Arg Leu Leu Ala Glu Arg Gly Gln Cys Ser Gly Gly Asp Leu 50 55 60 Phe Gly Ala Leu Pro Gly Phe Gly Arg Thr Leu Glu Ala Ile Lys Gly 65 70 75 80 Gln Arg Arg Arg Glu Pro Tyr Arg Ala Leu Val Gln Ala His Leu Ala 85 90 95 Arg Phe Gly Ser Gln Pro Gly Pro Ser Ser Gly Gly Cys Ser Ala Glu 100 105 110 Pro Asp Phe Arg Arg Ala Ser Gly Ala Glu Glu Ala Gly Glu Glu Arg 115 120 125 Cys Ala Glu Asp Ala Ala Ala Tyr Asp Pro Ser Ala Val Gly Gln Met 130 135 140 Ser Pro Asp Ala Ala Arg Val Leu Ser Glu Leu Leu Glu Gly Ala Gly 145 150 155 160 Arg Arg Arg Ala Cys Arg Ala Met Arg Pro Lys Thr Ala Gly Arg Arg 165 170 175 Asn Asp Leu His Asp Asp Arg Thr Ala Ser Ala His Lys Thr Ser Arg 180 185 190 Gln Lys Arg Arg Ala Glu Tyr Ala Arg Val Gln Glu Leu Tyr Lys Lys 195 200 205 Cys Arg Ser Arg Ala Ala Ala Glu Val Ile Asp Gly Ala Cys Gly Gly 210 215 220 Val Gly His Ser Leu Glu Glu Met Glu Thr Tyr Trp Arg Pro Ile Leu 225 230 235 240 Glu Arg Val Ser Asp Ala Pro Gly Pro Thr Pro Glu Ala Leu His Ala 245 250 255 Leu Gly Arg Ala Glu Trp His Gly Gly Asn Arg Asp Tyr Thr Gln Leu 260 265 270 Trp Lys Pro Ile Ser Val Glu Glu Ile Lys Ala Ser Arg Phe Asp Trp 275 280 285 Arg Thr Ser Pro Gly Pro Asp Gly Ile Arg Ser Gly Gln Trp Arg Ala 290 295 300 Val Pro Val His Leu Lys Ala Glu Met Phe Asn Ala Trp Met Ala Arg 305 310 315 320 Gly Glu Ile Pro Glu Ile Leu Arg Gln Cys Arg Thr Val Phe Val Pro 325 330 335 Lys Val Glu Arg Pro Gly Gly Pro Gly Glu Tyr Arg Pro Ile Ser Ile 340 345 350 Ala Ser Ile Pro Leu Arg His Phe His Ser Ile Leu Ala Arg Arg Leu 355 360 365 Leu Ala Cys Cys Pro Pro Asp Ala Arg Gln Arg Gly Phe Ile Cys Ala 370 375 380 Asp Gly Thr Leu Glu Asn Ser Ala Val Leu Asp Ala Val Leu Gly Asp 385 390 395 400 Ser Arg Lys Lys Leu Arg Glu Cys His Val Ala Val Leu Asp Phe Ala 405 410 415 Lys Ala Phe Asp Thr Val Ser His Glu Ala Leu Val Glu Leu Leu Arg 420 425 430 Leu Arg Gly Met Pro Glu Gln Phe Cys Gly Tyr Ile Ala His Leu Tyr 435 440 445 Asp Thr Ala Ser Thr Thr Leu Ala Val Asn Asn Glu Met Ser Ser Pro 450 455 460 Val Lys Val Gly Arg Gly Val Arg Gln Gly Asp Pro Leu Ser Pro Ile 465 470 475 480 Leu Phe Asn Val Val Met Asp Leu Ile Leu Ala Ser Leu Pro Glu Arg 485 490 495 Val Gly Tyr Arg Leu Glu Met Glu Leu Val Ser Ala Leu Ala Tyr Ala 500 505 510 Asp Asp Leu Val Leu Leu Ala Gly Ser Lys Val Gly Met Gln Glu Ser 515 520 525 Ile Ser Ala Val Asp Cys Val Gly Arg Gln Met Gly Leu Arg Leu Asn 530 535 540 Cys Arg Lys Ser Ala Val Leu Ser Met Ile Pro Asp Gly His Arg Lys 545 550 555 560 Lys His His Tyr Leu Thr Glu Arg Thr Phe Asn Ile Gly Gly Lys Pro 565 570 575 Leu Arg Gln Val Ser Cys Val Glu Arg Trp Arg Tyr Leu Gly Val Asp 580 585 590 Phe Glu Ala Ser Gly Cys Val Thr Leu Glu His Ser Ile Ser Ser Ala 595 600 605 Leu Asn Asn Ile Ser Arg Ala Pro Leu Lys Pro Gln Gln Arg Leu Glu 610 615 620 Ile Leu Arg Ala His Leu Ile Pro Arg Phe Gln His Gly Phe Val Leu 625 630 635 640 Gly Asn Ile Ser Asp Asp Arg Leu Arg Met Leu Asp Val Gln Ile Arg 645 650 655 Lys Ala Val Gly Gln Trp Leu Arg Leu Pro Ala Asp Val Pro Lys Ala 660 665 670 Tyr Tyr His Ala Ala Val Gln Asp Gly Gly Leu Ala Ile Pro Ser Val 675 680 685 Arg Ala Thr Ile Pro Asp Leu Ile Val Arg Arg Phe Gly Gly Leu Asp 690 695 700 Ser Ser Pro Trp Ser Val Ala Arg Ala Ala Ala Lys Ser Asp Lys Ile 705 710 715 720 Arg Lys Lys Leu Arg Trp Ala Trp Lys Gln Leu Arg Arg Phe Ser Arg 725 730 735 Val Asp Ser Thr Thr Gln Arg Pro Ser Val Arg Leu Phe Trp Arg Glu 740 745 750 His Leu His Ala Ser Val Asp Gly Arg Glu Leu Arg Glu Ser Thr Arg 755 760 765 Thr Pro Thr Ser Thr Lys Trp Ile Arg Glu Arg Cys Ala Gln Ile Thr 770 775 780 Gly Arg Asp Phe Val Gln Phe Val His Thr His Ile Asn Ala Leu Pro 785 790 795 800 Ser Arg Ile Arg Gly Ser Arg Gly Arg Arg Gly Gly Gly Glu Ser Ser 805 810 815 Leu Thr Cys Arg Ala Gly Cys Lys Val Arg Glu Thr Thr Ala His Ile 820 825 830 Leu Gln Gln Cys His Arg Thr His Gly Gly Arg Ile Leu Arg His Asn 835 840 845 Lys Ile Val Ser Phe Val Ala Lys Ala Met Glu Glu Asn Lys Trp Thr 850 855 860 Val Glu Leu Glu Pro Arg Leu Arg Thr Ser Val Gly Leu Arg Lys Pro 865 870 875 880 Asp Ile Ile Ala Ser Arg Asp Gly Val Gly Val Ile Val Asp Val Gln 885 890 895 Val Val Ser Gly Gln 900 <210> 8 <211> 1114 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Met Met Ala Ser Thr Ala Leu Ser Leu Met Gly Arg Cys Asn Pro Asp 1 5 10 15 Gly Cys Thr Arg Gly Lys His Val Thr Ala Ala Pro Met Asp Gly Pro 20 25 30 Arg Gly Pro Ser Ser Leu Ala Gly Thr Phe Gly Trp Gly Leu Ala Ile 35 40 45 Pro Ala Gly Glu Pro Cys Gly Arg Val Cys Ser Pro Ala Thr Val Gly 50 55 60 Phe Phe Pro Val Ala Lys Lys Ser Asn Lys Glu Asn Arg Pro Glu Ala 65 70 75 80 Ser Gly Leu Pro Leu Glu Ser Glu Arg Thr Gly Asp Asn Pro Thr Val 85 90 95 Arg Gly Ser Ala Gly Ala Asp Pro Val Gly Gln Asp Ala Pro Gly Trp 100 105 110 Thr Cys Gln Phe Cys Glu Arg Thr Phe Ser Thr Asn Arg Gly Leu Gly 115 120 125 Val His Lys Arg Arg Ala His Pro Val Glu Thr Asn Thr Asp Ala Ala 130 135 140 Pro Met Met Val Lys Arg Arg Trp His Gly Glu Glu Ile Asp Leu Leu 145 150 155 160 Ala Arg Thr Glu Ala Arg Leu Leu Ala Glu Arg Gly Gln Cys Ser Gly 165 170 175 Gly Asp Leu Phe Gly Ala Leu Pro Gly Phe Gly Arg Thr Leu Glu Ala 180 185 190 Ile Lys Gly Gln Arg Arg Arg Glu Pro Tyr Arg Ala Leu Val Gln Ala 195 200 205 His Leu Ala Arg Phe Gly Ser Gln Pro Gly Pro Ser Ser Gly Gly Cys 210 215 220 Ser Ala Glu Pro Asp Phe Arg Arg Ala Ser Gly Ala Glu Glu Ala Gly 225 230 235 240 Glu Glu Arg Cys Ala Glu Asp Ala Ala Ala Tyr Asp Pro Ser Ala Val 245 250 255 Gly Gln Met Ser Pro Asp Ala Ala Arg Val Leu Ser Glu Leu Leu Glu 260 265 270 Gly Ala Gly Arg Arg Arg Ala Cys Arg Ala Met Arg Pro Lys Thr Ala 275 280 285 Gly Arg Arg Asn Asp Leu His Asp Asp Arg Thr Ala Ser Ala His Lys 290 295 300 Thr Ser Arg Gln Lys Arg Arg Ala Glu Tyr Ala Arg Val Gln Glu Leu 305 310 315 320 Tyr Lys Lys Cys Arg Ser Arg Ala Ala Ala Glu Val Ile Asp Gly Ala 325 330 335 Cys Gly Gly Val Gly His Ser Leu Glu Glu Met Glu Thr Tyr Trp Arg 340 345 350 Pro Ile Leu Glu Arg Val Ser Asp Ala Pro Gly Pro Thr Pro Glu Ala 355 360 365 Leu His Ala Leu Gly Arg Ala Glu Trp His Gly Gly Asn Arg Asp Tyr 370 375 380 Thr Gln Leu Trp Lys Pro Ile Ser Val Glu Glu Ile Lys Ala Ser Arg 385 390 395 400 Phe Asp Trp Arg Thr Ser Pro Gly Pro Asp Gly Ile Arg Ser Gly Gln 405 410 415 Trp Arg Ala Val Pro Val His Leu Lys Ala Glu Met Phe Asn Ala Trp 420 425 430 Met Ala Arg Gly Glu Ile Pro Glu Ile Leu Arg Gln Cys Arg Thr Val 435 440 445 Phe Val Pro Lys Val Glu Arg Pro Gly Gly Pro Gly Glu Tyr Arg Pro 450 455 460 Ile Ser Ile Ala Ser Ile Pro Leu Arg His Phe His Ser Ile Leu Ala 465 470 475 480 Arg Arg Leu Leu Ala Cys Cys Pro Pro Asp Ala Arg Gln Arg Gly Phe 485 490 495 Ile Cys Ala Asp Gly Thr Leu Glu Asn Ser Ala Val Leu Asp Ala Val 500 505 510 Leu Gly Asp Ser Arg Lys Lys Leu Arg Glu Cys His Val Ala Val Leu 515 520 525 Asp Phe Ala Lys Ala Phe Asp Thr Val Ser His Glu Ala Leu Val Glu 530 535 540 Leu Leu Arg Leu Arg Gly Met Pro Glu Gln Phe Cys Gly Tyr Ile Ala 545 550 555 560 His Leu Tyr Asp Thr Ala Ser Thr Thr Leu Ala Val Asn Asn Glu Met 565 570 575 Ser Ser Pro Val Lys Val Gly Arg Gly Val Arg Gln Gly Asp Pro Leu 580 585 590 Ser Pro Ile Leu Phe Asn Val Val Met Asp Leu Ile Leu Ala Ser Leu 595 600 605 Pro Glu Arg Val Gly Tyr Arg Leu Glu Met Glu Leu Val Ser Ala Leu 610 615 620 Ala Tyr Ala Asp Asp Leu Val Leu Leu Ala Gly Ser Lys Val Gly Met 625 630 635 640 Gln Glu Ser Ile Ser Ala Val Asp Cys Val Gly Arg Gln Met Gly Leu 645 650 655 Arg Leu Asn Cys Arg Lys Ser Ala Val Leu Ser Met Ile Pro Asp Gly 660 665 670 His Arg Lys Lys His His Tyr Leu Thr Glu Arg Thr Phe Asn Ile Gly 675 680 685 Gly Lys Pro Leu Arg Gln Val Ser Cys Val Glu Arg Trp Arg Tyr Leu 690 695 700 Gly Val Asp Phe Glu Ala Ser Gly Cys Val Thr Leu Glu His Ser Ile 705 710 715 720 Ser Ser Ala Leu Asn Asn Ile Ser Arg Ala Pro Leu Lys Pro Gln Gln 725 730 735 Arg Leu Glu Ile Leu Arg Ala His Leu Ile Pro Arg Phe Gln His Gly 740 745 750 Phe Val Leu Gly Asn Ile Ser Asp Asp Arg Leu Arg Met Leu Asp Val 755 760 765 Gln Ile Arg Lys Ala Val Gly Gln Trp Leu Arg Leu Pro Ala Asp Val 770 775 780 Pro Lys Ala Tyr Tyr His Ala Ala Val Gln Asp Gly Gly Leu Ala Ile 785 790 795 800 Pro Ser Val Arg Ala Thr Ile Pro Asp Leu Ile Val Arg Arg Phe Gly 805 810 815 Gly Leu Asp Ser Ser Pro Trp Ser Val Ala Arg Ala Ala Ala Lys Ser 820 825 830 Asp Lys Ile Arg Lys Lys Leu Arg Trp Ala Trp Lys Gln Leu Arg Arg 835 840 845 Phe Ser Arg Val Asp Ser Thr Thr Gln Arg Pro Ser Val Arg Leu Phe 850 855 860 Trp Arg Glu His Leu His Ala Ser Val Asp Gly Arg Glu Leu Arg Glu 865 870 875 880 Ser Thr Arg Thr Pro Thr Ser Thr Lys Trp Ile Arg Glu Arg Cys Ala 885 890 895 Gln Ile Thr Gly Arg Asp Phe Val Gln Phe Val His Thr His Ile Asn 900 905 910 Ala Leu Pro Ser Arg Ile Arg Gly Ser Arg Gly Arg Arg Gly Gly Gly 915 920 925 Glu Ser Ser Leu Thr Cys Arg Ala Gly Cys Lys Val Arg Glu Thr Thr 930 935 940 Ala His Ile Leu Gln Gln Cys His Arg Thr His Gly Gly Arg Ile Leu 945 950 955 960 Arg His Asn Lys Ile Val Ser Phe Val Ala Lys Ala Met Glu Glu Asn 965 970 975 Lys Trp Thr Val Glu Leu Glu Pro Arg Leu Arg Thr Ser Val Gly Leu 980 985 990 Arg Lys Pro Ala Ile Ile Ala Ser Arg Asp Gly Val Gly Val Ile Val 995 1000 1005 Asp Val Gln Val Val Ser Gly Gln Arg Ser Leu Asp Glu Leu His 1010 1015 1020 Arg Glu Lys Arg Asn Lys Tyr Gly Asn His Gly Glu Leu Val Glu 1025 1030 1035 Leu Val Ala Gly Arg Leu Gly Leu Pro Lys Ala Glu Cys Val Arg 1040 1045 1050 Ala Thr Ser Cys Thr Ile Ser Trp Arg Gly Val Trp Ser Leu Thr 1055 1060 1065 Ser Tyr Lys Glu Leu Arg Ser Ile Ile Gly Leu Arg Glu Pro Thr 1070 1075 1080 Leu Gln Ile Val Pro Ile Leu Ala Leu Arg Gly Ser His Met Asn 1085 1090 1095 Trp Thr Arg Phe Asn Gln Met Thr Ser Val Met Gly Gly Gly Val 1100 1105 1110 Gly <210> 9 <211> 1275 <212> PRT <213> Homo sapiens <400> 9 Met Thr Gly Ser Asn Ser His Ile Thr Ile Leu Thr Leu Asn Val Asn 1 5 10 15 Gly Leu Asn Ser Pro Ile Lys Arg His Arg Leu Ala Ser Trp Ile Lys 20 25 30 Ser Gln Asp Pro Ser Val Cys Cys Ile Gln Glu Thr His Leu Thr Cys 35 40 45 Arg Asp Thr His Arg Leu Lys Ile Lys Gly Trp Arg Lys Ile Tyr Gln 50 55 60 Ala Asn Gly Lys Gln Lys Lys Ala Gly Val Ala Ile Leu Val Ser Asp 65 70 75 80 Lys Thr Asp Phe Lys Pro Thr Lys Ile Lys Arg Asp Lys Glu Gly His 85 90 95 Tyr Ile Met Val Lys Gly Ser Ile Gln Gln Glu Glu Leu Thr Ile Leu 100 105 110 Asn Ile Tyr Ala Pro Asn Thr Gly Ala Pro Arg Phe Ile Lys Gln Val 115 120 125 Leu Ser Asp Leu Gln Arg Asp Leu Asp Ser His Thr Leu Ile Met Gly 130 135 140 Asp Phe Asn Thr Pro Leu Ser Ile Leu Asp Arg Ser Thr Arg Gln Lys 145 150 155 160 Val Asn Lys Asp Thr Gln Glu Leu Asn Ser Ala Leu His Gln Thr Asp 165 170 175 Leu Ile Asp Ile Tyr Arg Thr Leu His Pro Lys Ser Thr Glu Tyr Thr 180 185 190 Phe Phe Ser Ala Pro His His Thr Tyr Ser Lys Ile Asp His Ile Val 195 200 205 Gly Ser Lys Ala Leu Leu Ser Lys Cys Lys Arg Thr Glu Ile Ile Thr 210 215 220 Asn Tyr Leu Ser Asp His Ser Ala Ile Lys Leu Glu Leu Arg Ile Lys 225 230 235 240 Asn Leu Thr Gln Ser Arg Ser Thr Thr Trp Lys Leu Asn Asn Leu Leu 245 250 255 Leu Asn Asp Tyr Trp Val His Asn Glu Met Lys Ala Glu Ile Lys Met 260 265 270 Phe Phe Glu Thr Asn Glu Asn Lys Asp Thr Thr Tyr Gln Asn Leu Trp 275 280 285 Asp Ala Phe Lys Ala Val Cys Arg Gly Lys Phe Ile Ala Leu Asn Ala 290 295 300 Tyr Lys Arg Lys Gln Glu Arg Ser Lys Ile Asp Thr Leu Thr Ser Gln 305 310 315 320 Leu Lys Glu Leu Glu Lys Gln Glu Gln Thr His Ser Lys Ala Ser Arg 325 330 335 Arg Gln Glu Ile Thr Lys Ile Arg Ala Glu Leu Lys Glu Ile Glu Thr 340 345 350 Gln Lys Thr Leu Gln Lys Ile Asn Glu Ser Arg Ser Trp Phe Phe Glu 355 360 365 Arg Ile Asn Lys Ile Asp Arg Pro Leu Ala Arg Leu Ile Lys Lys Lys 370 375 380 Arg Glu Lys Asn Gln Ile Asp Thr Ile Lys Asn Asp Lys Gly Asp Ile 385 390 395 400 Thr Thr Asp Pro Thr Glu Ile Gln Thr Thr Ile Arg Glu Tyr Tyr Lys 405 410 415 His Leu Tyr Ala Asn Lys Leu Glu Asn Leu Glu Glu Met Asp Thr Phe 420 425 430 Leu Asp Thr Tyr Thr Leu Pro Arg Leu Asn Gln Glu Glu Val Glu Ser 435 440 445 Leu Asn Arg Pro Ile Thr Gly Ser Glu Ile Val Ala Ile Ile Asn Ser 450 455 460 Leu Pro Thr Lys Lys Ser Pro Gly Pro Asp Gly Phe Thr Ala Glu Phe 465 470 475 480 Tyr Gln Arg Tyr Lys Glu Glu Leu Val Pro Phe Leu Leu Lys Leu Phe 485 490 495 Gln Ser Ile Glu Lys Glu Gly Ile Leu Pro Asn Ser Phe Tyr Glu Ala 500 505 510 Ser Ile Ile Leu Ile Pro Lys Pro Gly Arg Asp Thr Thr Lys Lys Glu 515 520 525 Asn Phe Arg Pro Ile Ser Leu Met Asn Ile Asp Ala Lys Ile Leu Asn 530 535 540 Lys Ile Leu Ala Asn Arg Ile Gln Gln His Ile Lys Lys Leu Ile His 545 550 555 560 His Asp Gln Val Gly Phe Ile Pro Gly Met Gln Gly Trp Phe Asn Ile 565 570 575 Arg Lys Ser Ile Asn Val Ile Gln His Ile Asn Arg Ala Lys Asp Lys 580 585 590 Asn His Val Ile Ile Ser Ile Asp Ala Glu Lys Ala Phe Asp Lys Ile 595 600 605 Gln Gln Pro Phe Met Leu Lys Thr Leu Asn Lys Leu Gly Ile Asp Gly 610 615 620 Met Tyr Leu Lys Ile Ile Arg Ala Ile Tyr Asp Lys Pro Thr Ala Asn 625 630 635 640 Ile Ile Leu Asn Gly Gln Lys Leu Glu Ala Phe Pro Leu Lys Thr Gly 645 650 655 Thr Arg Gln Gly Cys Pro Leu Ser Pro Leu Leu Phe Asn Ile Val Leu 660 665 670 Glu Val Leu Ala Arg Ala Ile Arg Gln Glu Lys Glu Ile Lys Gly Ile 675 680 685 Gln Leu Gly Lys Glu Glu Val Lys Leu Ser Leu Phe Ala Asp Asp Met 690 695 700 Ile Val Tyr Leu Glu Asn Pro Ile Val Ser Ala Gln Asn Leu Leu Lys 705 710 715 720 Leu Ile Ser Asn Phe Ser Lys Val Ser Gly Tyr Lys Ile Asn Val Gln 725 730 735 Lys Ser Gln Ala Phe Leu Tyr Asn Asn Asn Arg Gln Thr Glu Ser Gln 740 745 750 Ile Met Gly Glu Leu Pro Phe Thr Ile Ala Ser Lys Arg Ile Lys Tyr 755 760 765 Leu Gly Ile Gln Leu Thr Arg Asp Val Lys Asp Leu Phe Lys Glu Asn 770 775 780 Tyr Lys Pro Leu Leu Lys Glu Ile Lys Glu Asp Thr Asn Lys Trp Lys 785 790 795 800 Asn Ile Pro Cys Ser Trp Val Gly Arg Ile Asn Ile Val Lys Met Ala 805 810 815 Ile Leu Pro Lys Val Ile Tyr Arg Phe Asn Ala Ile Pro Ile Lys Leu 820 825 830 Pro Met Thr Phe Phe Thr Glu Leu Glu Lys Thr Thr Leu Lys Phe Ile 835 840 845 Trp Asn Gln Lys Arg Ala Arg Ile Ala Lys Ser Ile Leu Ser Gln Lys 850 855 860 Asn Lys Ala Gly Gly Ile Thr Leu Pro Asp Phe Lys Leu Tyr Tyr Lys 865 870 875 880 Ala Thr Val Thr Lys Thr Ala Trp Tyr Trp Tyr Gln Asn Arg Asp Ile 885 890 895 Asp Gln Trp Asn Arg Thr Glu Pro Ser Glu Ile Met Pro His Ile Tyr 900 905 910 Asn Tyr Leu Ile Phe Asp Lys Pro Glu Lys Asn Lys Gln Trp Gly Lys 915 920 925 Asp Ser Leu Leu Asn Lys Trp Cys Trp Glu Asn Trp Leu Ala Ile Cys 930 935 940 Arg Lys Leu Lys Leu Asp Pro Phe Leu Thr Pro Tyr Thr Lys Ile Asn 945 950 955 960 Ser Arg Trp Ile Lys Asp Leu Asn Val Lys Pro Lys Thr Ile Lys Thr 965 970 975 Leu Glu Glu Asn Leu Gly Ile Thr Ile Gln Asp Ile Gly Val Gly Lys 980 985 990 Asp Phe Met Ser Lys Thr Pro Lys Ala Met Ala Thr Lys Asp Lys Ile 995 1000 1005 Asp Lys Trp Asp Leu Ile Lys Leu Lys Ser Phe Cys Thr Ala Lys 1010 1015 1020 Glu Thr Thr Ile Arg Val Asn Arg Gln Pro Thr Thr Trp Glu Lys 1025 1030 1035 Ile Phe Ala Thr Tyr Ser Ser Asp Lys Gly Leu Ile Ser Arg Ile 1040 1045 1050 Tyr Asn Glu Leu Lys Gln Ile Tyr Lys Lys Lys Thr Asn Asn Pro 1055 1060 1065 Ile Lys Lys Trp Ala Lys Asp Met Asn Arg His Phe Ser Lys Glu 1070 1075 1080 Asp Ile Tyr Ala Ala Lys Lys His Met Lys Lys Cys Ser Ser Ser 1085 1090 1095 Leu Ala Ile Arg Glu Met Gln Ile Lys Thr Thr Met Arg Tyr His 1100 1105 1110 Leu Thr Pro Val Arg Met Ala Ile Ile Lys Lys Ser Gly Asn Asn 1115 1120 1125 Arg Cys Trp Arg Gly Cys Gly Glu Ile Gly Thr Leu Val His Cys 1130 1135 1140 Trp Trp Asp Cys Lys Leu Val Gln Pro Leu Trp Lys Ser Val Trp 1145 1150 1155 Arg Phe Leu Arg Asp Leu Glu Leu Glu Ile Pro Phe Asp Pro Ala 1160 1165 1170 Ile Pro Leu Leu Gly Ile Tyr Pro Lys Asp Tyr Lys Ser Cys Cys 1175 1180 1185 Tyr Lys Asp Thr Cys Thr Arg Met Phe Ile Ala Ala Leu Phe Thr 1190 1195 1200 Ile Ala Lys Thr Trp Asn Gln Pro Asn Cys Pro Thr Met Ile Asp 1205 1210 1215 Trp Ile Lys Lys Met Trp His Ile Tyr Thr Met Glu Tyr Tyr Ala 1220 1225 1230 Ala Ile Lys Asn Asp Glu Phe Ile Ser Phe Val Gly Thr Trp Met 1235 1240 1245 Lys Leu Glu Thr Ile Ile Leu Ser Lys Leu Ser Gln Glu Gln Lys 1250 1255 1260 Thr Lys His Arg Ile Phe Ser Leu Ile Gly Gly Asn 1265 1270 1275 <210> 10 <211> 1275 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Met Thr Gly Ser Asn Ser His Ile Thr Ile Leu Thr Leu Asn Val Asn 1 5 10 15 Gly Leu Asn Ser Pro Ile Lys Arg His Arg Leu Ala Ser Trp Ile Lys 20 25 30 Ser Gln Asp Pro Ser Val Cys Cys Ile Gln Glu Thr His Leu Thr Cys 35 40 45 Arg Asp Thr His Arg Leu Lys Ile Lys Gly Trp Arg Lys Ile Tyr Gln 50 55 60 Ala Asn Gly Lys Gln Lys Lys Ala Gly Val Ala Ile Leu Val Ser Asp 65 70 75 80 Lys Thr Asp Phe Lys Pro Thr Lys Ile Lys Arg Asp Lys Glu Gly His 85 90 95 Tyr Ile Met Val Lys Gly Ser Ile Gln Gln Glu Glu Leu Thr Ile Leu 100 105 110 Asn Ile Tyr Ala Pro Asn Thr Gly Ala Pro Arg Phe Ile Lys Gln Val 115 120 125 Leu Ser Asp Leu Gln Arg Asp Leu Asp Ser His Thr Leu Ile Met Gly 130 135 140 Asp Phe Asn Thr Pro Leu Ser Ile Leu Asp Arg Ser Thr Arg Gln Lys 145 150 155 160 Val Asn Lys Asp Thr Gln Glu Leu Asn Ser Ala Leu His Gln Thr Asp 165 170 175 Leu Ile Asp Ile Tyr Arg Thr Leu His Pro Lys Ser Thr Glu Tyr Thr 180 185 190 Phe Phe Ser Ala Pro His His Thr Tyr Ser Lys Ile Ala His Ile Val 195 200 205 Gly Ser Lys Ala Leu Leu Ser Lys Cys Lys Arg Thr Glu Ile Ile Thr 210 215 220 Asn Tyr Leu Ser Asp Ala Ser Ala Ile Lys Leu Glu Leu Arg Ile Lys 225 230 235 240 Asn Leu Thr Gln Ser Arg Ser Thr Thr Trp Lys Leu Asn Asn Leu Leu 245 250 255 Leu Asn Asp Tyr Trp Val His Asn Glu Met Lys Ala Glu Ile Lys Met 260 265 270 Phe Phe Glu Thr Asn Glu Asn Lys Asp Thr Thr Tyr Gln Asn Leu Trp 275 280 285 Asp Ala Phe Lys Ala Val Cys Arg Gly Lys Phe Ile Ala Leu Asn Ala 290 295 300 Tyr Lys Arg Lys Gln Glu Arg Ser Lys Ile Asp Thr Leu Thr Ser Gln 305 310 315 320 Leu Lys Glu Leu Glu Lys Gln Glu Gln Thr His Ser Lys Ala Ser Arg 325 330 335 Arg Gln Glu Ile Thr Lys Ile Arg Ala Glu Leu Lys Glu Ile Glu Thr 340 345 350 Gln Lys Thr Leu Gln Lys Ile Asn Glu Ser Arg Ser Trp Phe Phe Glu 355 360 365 Arg Ile Asn Lys Ile Asp Arg Pro Leu Ala Arg Leu Ile Lys Lys Lys 370 375 380 Arg Glu Lys Asn Gln Ile Asp Thr Ile Lys Asn Asp Lys Gly Asp Ile 385 390 395 400 Thr Thr Asp Pro Thr Glu Ile Gln Thr Thr Ile Arg Glu Tyr Tyr Lys 405 410 415 His Leu Tyr Ala Asn Lys Leu Glu Asn Leu Glu Glu Met Asp Thr Phe 420 425 430 Leu Asp Thr Tyr Thr Leu Pro Arg Leu Asn Gln Glu Glu Val Glu Ser 435 440 445 Leu Asn Arg Pro Ile Thr Gly Ser Glu Ile Val Ala Ile Ile Asn Ser 450 455 460 Leu Pro Thr Lys Lys Ser Pro Gly Pro Asp Gly Phe Thr Ala Glu Phe 465 470 475 480 Tyr Gln Arg Tyr Lys Glu Glu Leu Val Pro Phe Leu Leu Lys Leu Phe 485 490 495 Gln Ser Ile Glu Lys Glu Gly Ile Leu Pro Asn Ser Phe Tyr Glu Ala 500 505 510 Ser Ile Ile Leu Ile Pro Lys Pro Gly Arg Asp Thr Thr Lys Lys Glu 515 520 525 Asn Phe Arg Pro Ile Ser Leu Met Asn Ile Asp Ala Lys Ile Leu Asn 530 535 540 Lys Ile Leu Ala Asn Arg Ile Gln Gln His Ile Lys Lys Leu Ile His 545 550 555 560 His Asp Gln Val Gly Phe Ile Pro Gly Met Gln Gly Trp Phe Asn Ile 565 570 575 Arg Lys Ser Ile Asn Val Ile Gln His Ile Asn Arg Ala Lys Asp Lys 580 585 590 Asn His Val Ile Ile Ser Ile Asp Ala Glu Lys Ala Phe Asp Lys Ile 595 600 605 Gln Gln Pro Phe Met Leu Lys Thr Leu Asn Lys Leu Gly Ile Asp Gly 610 615 620 Met Tyr Leu Lys Ile Ile Arg Ala Ile Tyr Asp Lys Pro Thr Ala Asn 625 630 635 640 Ile Ile Leu Asn Gly Gln Lys Leu Glu Ala Phe Pro Leu Lys Thr Gly 645 650 655 Thr Arg Gln Gly Cys Pro Leu Ser Pro Leu Leu Phe Asn Ile Val Leu 660 665 670 Glu Val Leu Ala Arg Ala Ile Arg Gln Glu Lys Glu Ile Lys Gly Ile 675 680 685 Gln Leu Gly Lys Glu Glu Val Lys Leu Ser Leu Phe Ala Asp Asp Met 690 695 700 Ile Val Tyr Leu Glu Asn Pro Ile Val Ser Ala Gln Asn Leu Leu Lys 705 710 715 720 Leu Ile Ser Asn Phe Ser Lys Val Ser Gly Tyr Lys Ile Asn Val Gln 725 730 735 Lys Ser Gln Ala Phe Leu Tyr Asn Asn Asn Arg Gln Thr Glu Ser Gln 740 745 750 Ile Met Gly Glu Leu Pro Phe Thr Ile Ala Ser Lys Arg Ile Lys Tyr 755 760 765 Leu Gly Ile Gln Leu Thr Arg Asp Val Lys Asp Leu Phe Lys Glu Asn 770 775 780 Tyr Lys Pro Leu Leu Lys Glu Ile Lys Glu Asp Thr Asn Lys Trp Lys 785 790 795 800 Asn Ile Pro Cys Ser Trp Val Gly Arg Ile Asn Ile Val Lys Met Ala 805 810 815 Ile Leu Pro Lys Val Ile Tyr Arg Phe Asn Ala Ile Pro Ile Lys Leu 820 825 830 Pro Met Thr Phe Phe Thr Glu Leu Glu Lys Thr Thr Leu Lys Phe Ile 835 840 845 Trp Asn Gln Lys Arg Ala Arg Ile Ala Lys Ser Ile Leu Ser Gln Lys 850 855 860 Asn Lys Ala Gly Gly Ile Thr Leu Pro Asp Phe Lys Leu Tyr Tyr Lys 865 870 875 880 Ala Thr Val Thr Lys Thr Ala Trp Tyr Trp Tyr Gln Asn Arg Asp Ile 885 890 895 Asp Gln Trp Asn Arg Thr Glu Pro Ser Glu Ile Met Pro His Ile Tyr 900 905 910 Asn Tyr Leu Ile Phe Asp Lys Pro Glu Lys Asn Lys Gln Trp Gly Lys 915 920 925 Asp Ser Leu Leu Asn Lys Trp Cys Trp Glu Asn Trp Leu Ala Ile Cys 930 935 940 Arg Lys Leu Lys Leu Asp Pro Phe Leu Thr Pro Tyr Thr Lys Ile Asn 945 950 955 960 Ser Arg Trp Ile Lys Asp Leu Asn Val Lys Pro Lys Thr Ile Lys Thr 965 970 975 Leu Glu Glu Asn Leu Gly Ile Thr Ile Gln Asp Ile Gly Val Gly Lys 980 985 990 Asp Phe Met Ser Lys Thr Pro Lys Ala Met Ala Thr Lys Asp Lys Ile 995 1000 1005 Asp Lys Trp Asp Leu Ile Lys Leu Lys Ser Phe Cys Thr Ala Lys 1010 1015 1020 Glu Thr Thr Ile Arg Val Asn Arg Gln Pro Thr Thr Trp Glu Lys 1025 1030 1035 Ile Phe Ala Thr Tyr Ser Ser Asp Lys Gly Leu Ile Ser Arg Ile 1040 1045 1050 Tyr Asn Glu Leu Lys Gln Ile Tyr Lys Lys Lys Thr Asn Asn Pro 1055 1060 1065 Ile Lys Lys Trp Ala Lys Asp Met Asn Arg His Phe Ser Lys Glu 1070 1075 1080 Asp Ile Tyr Ala Ala Lys Lys His Met Lys Lys Cys Ser Ser Ser 1085 1090 1095 Leu Ala Ile Arg Glu Met Gln Ile Lys Thr Thr Met Arg Tyr His 1100 1105 1110 Leu Thr Pro Val Arg Met Ala Ile Ile Lys Lys Ser Gly Asn Asn 1115 1120 1125 Arg Cys Trp Arg Gly Cys Gly Glu Ile Gly Thr Leu Val His Cys 1130 1135 1140 Trp Trp Asp Cys Lys Leu Val Gln Pro Leu Trp Lys Ser Val Trp 1145 1150 1155 Arg Phe Leu Arg Asp Leu Glu Leu Glu Ile Pro Phe Asp Pro Ala 1160 1165 1170 Ile Pro Leu Leu Gly Ile Tyr Pro Lys Asp Tyr Lys Ser Cys Cys 1175 1180 1185 Tyr Lys Asp Thr Cys Thr Arg Met Phe Ile Ala Ala Leu Phe Thr 1190 1195 1200 Ile Ala Lys Thr Trp Asn Gln Pro Asn Cys Pro Thr Met Ile Asp 1205 1210 1215 Trp Ile Lys Lys Met Trp His Ile Tyr Thr Met Glu Tyr Tyr Ala 1220 1225 1230 Ala Ile Lys Asn Asp Glu Phe Ile Ser Phe Val Gly Thr Trp Met 1235 1240 1245 Lys Leu Glu Thr Ile Ile Leu Ser Lys Leu Ser Gln Glu Gln Lys 1250 1255 1260 Thr Lys His Arg Ile Phe Ser Leu Ile Gly Gly Asn 1265 1270 1275 <210> 11 <211> 1281 <212> PRT <213> Mus sp. <400> 11 Met Pro Thr Leu Thr Thr Lys Ile Lys Gly Ser Asn Asn Tyr Phe Ser 1 5 10 15 Leu Ile Ser Leu Asn Ile Asn Gly Leu Asn Ser Pro Ile Lys Arg His 20 25 30 Arg Leu Thr Asp Trp Leu His Lys Gln Asp Pro Thr Phe Cys Cys Leu 35 40 45 Gln Glu Thr His Leu Arg Glu Lys Asp Arg His Tyr Leu Arg Val Lys 50 55 60 Gly Trp Lys Thr Ile Phe Gln Ala Asn Gly Leu Lys Lys Gln Ala Gly 65 70 75 80 Val Ala Ile Leu Ile Leu Asp Lys Ile Asp Phe Gln Pro Lys Val Ile 85 90 95 Lys Lys Asp Lys Glu Gly His Phe Ile Leu Ile Lys Gly Lys Ile Leu 100 105 110 Gln Glu Glu Leu Ser Ile Leu Asn Ile Tyr Ala Pro Asn Ala Arg Ala 115 120 125 Ala Thr Phe Ile Arg Asp Thr Leu Val Lys Leu Lys Ala Tyr Ile Ala 130 135 140 Pro His Thr Ile Ile Val Gly Asp Phe Asn Thr Pro Leu Ser Ser Lys 145 150 155 160 Asp Arg Ser Trp Lys Gln Lys Leu Asn Arg Asp Thr Val Lys Leu Thr 165 170 175 Glu Val Met Lys Gln Met Asp Leu Thr Asp Ile Tyr Arg Thr Phe Tyr 180 185 190 Pro Lys Thr Lys Gly Tyr Thr Phe Phe Ser Ala Pro His Gly Thr Phe 195 200 205 Ser Lys Ile Asp His Ile Ile Gly His Lys Thr Gly Leu Asn Arg Tyr 210 215 220 Lys Asn Ile Glu Ile Val Pro Cys Ile Leu Ser Asp His His Gly Leu 225 230 235 240 Arg Leu Ile Phe Asn Asn Asn Ile Asn Asn Gly Lys Pro Thr Phe Thr 245 250 255 Trp Lys Leu Asn Asn Thr Leu Leu Asn Asp Thr Leu Val Lys Glu Gly 260 265 270 Ile Lys Lys Glu Ile Lys Asp Phe Leu Glu Phe Asn Glu Asn Glu Ala 275 280 285 Thr Thr Tyr Pro Asn Leu Trp Asp Thr Met Lys Ala Phe Leu Arg Gly 290 295 300 Lys Leu Ile Ala Leu Ser Ala Ser Lys Lys Lys Arg Glu Thr Ala His 305 310 315 320 Thr Ser Ser Leu Thr Thr His Leu Lys Ala Leu Glu Lys Lys Glu Ala 325 330 335 Asn Ser Pro Lys Arg Ser Arg Arg Gln Glu Ile Ile Lys Leu Arg Gly 340 345 350 Glu Ile Asn Gln Val Glu Lys Arg Arg Thr Ile Gln Arg Ile Asn Gln 355 360 365 Thr Arg Ser Trp Phe Phe Glu Lys Ile Asn Lys Ile Asp Lys Pro Leu 370 375 380 Ala Arg Leu Thr Lys Gly His Arg Asp Lys Ile Leu Ile Asn Lys Ile 385 390 395 400 Arg Asn Glu Lys Gly Asp Ile Thr Thr Asp Pro Glu Glu Ile Gln Asn 405 410 415 Thr Ile Arg Ser Phe Tyr Lys Arg Leu Tyr Ser Thr Lys Leu Glu Asn 420 425 430 Leu Asp Glu Met Asp Lys Phe Leu Asp Arg Tyr Gln Val Pro Lys Leu 435 440 445 Asn Gln Asp Gln Val Asp His Leu Asn Ser Pro Ile Ser Pro Lys Glu 450 455 460 Ile Glu Ala Val Ile Asn Ser Leu Pro Thr Lys Lys Ser Pro Gly Pro 465 470 475 480 Asp Gly Phe Ser Ala Glu Phe Tyr Gln Thr Phe Lys Glu Asp Leu Ile 485 490 495 Pro Ile Leu His Lys Leu Phe His Lys Ile Glu Val Glu Gly Thr Leu 500 505 510 Pro Asn Ser Phe Tyr Glu Ala Thr Ile Thr Leu Ile Pro Lys Pro Gln 515 520 525 Lys Asp Pro Thr Lys Ile Glu Asn Phe Arg Pro Ile Ser Leu Met Asn 530 535 540 Ile Asp Ala Lys Ile Leu Asn Lys Ile Leu Ala Asn Arg Ile Gln Glu 545 550 555 560 His Ile Lys Ala Ile Ile His Pro Asp Gln Val Gly Phe Ile Pro Gly 565 570 575 Met Gln Gly Trp Phe Asn Ile Arg Lys Ser Ile Asn Val Ile His Tyr 580 585 590 Ile Asn Lys Leu Lys Asp Lys Asn His Met Ile Ile Ser Leu Asp Ala 595 600 605 Glu Lys Ala Phe Asp Lys Ile Gln His Pro Phe Met Ile Lys Val Leu 610 615 620 Glu Arg Ser Gly Ile Gln Gly Pro Tyr Leu Asn Met Ile Lys Ala Ile 625 630 635 640 Tyr Ser Lys Pro Val Ala Asn Ile Lys Val Asn Gly Glu Lys Leu Glu 645 650 655 Ala Ile Pro Leu Lys Ser Gly Thr Arg Gln Gly Cys Pro Leu Ser Pro 660 665 670 Tyr Leu Phe Asn Ile Val Leu Glu Val Leu Ala Arg Ala Ile Arg Gln 675 680 685 Gln Lys Glu Ile Lys Gly Ile Gln Ile Gly Lys Glu Glu Val Lys Ile 690 695 700 Ser Leu Phe Ala Asp Asp Met Ile Val Tyr Ile Ser Asp Pro Lys Asn 705 710 715 720 Ser Thr Arg Glu Leu Leu Asn Leu Ile Asn Ser Phe Gly Glu Val Ala 725 730 735 Gly Tyr Lys Ile Asn Ser Asn Lys Ser Met Ala Phe Leu Tyr Thr Lys 740 745 750 Asn Lys Gln Ala Glu Lys Glu Ile Trp Glu Thr Thr Pro Phe Ser Ile 755 760 765 Val Thr Asn Asn Ile Lys Tyr Leu Gly Val Thr Leu Thr Lys Glu Val 770 775 780 Lys Asp Leu Tyr Asp Lys Asn Phe Lys Ser Leu Lys Lys Glu Ile Lys 785 790 795 800 Glu Asp Leu Arg Arg Trp Lys Asp Leu Pro Cys Ser Trp Ile Gly Arg 805 810 815 Ile Asn Ile Val Lys Met Ala Ile Leu Pro Lys Ala Ile Tyr Arg Phe 820 825 830 Asn Ala Ile Pro Ile Lys Ile Pro Thr Gln Phe Phe Asn Glu Leu Glu 835 840 845 Gly Ala Ile Cys Lys Phe Val Trp Asn Asn Lys Lys Pro Arg Ile Ala 850 855 860 Lys Ser Leu Leu Lys Asp Lys Arg Thr Ser Gly Gly Ile Thr Met Pro 865 870 875 880 Asp Leu Lys Leu Tyr Tyr Arg Ala Ile Val Ile Lys Thr Ala Trp Tyr 885 890 895 Trp Tyr Arg Asp Arg Gln Val Asp Gln Trp Asn Arg Ile Glu Asp Pro 900 905 910 Glu Met Asn Pro His Thr Tyr Gly His Leu Ile Phe Asp Lys Gly Asp 915 920 925 Lys Thr Ile Gln Trp Lys Lys Asp Ser Ile Phe Asn Asn Trp Cys Trp 930 935 940 His Asn Trp Leu Leu Ser Cys Arg Arg Met Arg Ile Asp Pro Tyr Leu 945 950 955 960 Ser Pro Cys Thr Lys Val Lys Ser Lys Trp Ile Lys Glu Leu His Ile 965 970 975 Lys Pro Glu Thr Leu Lys Leu Ile Glu Glu Lys Val Gly Lys Ser Leu 980 985 990 Glu Asp Met Gly Thr Gly Glu Lys Phe Leu Asn Arg Thr Ala Met Ala 995 1000 1005 Cys Ala Val Arg Ser Arg Ile Asp Lys Trp Asp Leu Met Lys Leu 1010 1015 1020 Gln Ser Phe Cys Lys Ala Lys Asp Thr Val Asn Lys Thr Lys Arg 1025 1030 1035 Pro Pro Thr Asp Trp Glu Arg Ile Phe Thr Tyr Pro Lys Ser Asp 1040 1045 1050 Arg Gly Leu Ile Ser Asn Ile Tyr Lys Glu Leu Lys Lys Val Asp 1055 1060 1065 Phe Arg Lys Ser Asn Asn Pro Ile Lys Lys Trp Gly Ser Glu Leu 1070 1075 1080 Asn Lys Glu Phe Ser Pro Glu Glu Tyr Arg Met Ala Glu Lys His 1085 1090 1095 Leu Lys Lys Cys Ser Thr Ser Leu Ile Ile Arg Glu Met Gln Ile 1100 1105 1110 Lys Thr Thr Leu Arg Phe His Leu Thr Pro Val Arg Met Ala Lys 1115 1120 1125 Ile Lys Asn Ser Gly Asp Ser Arg Cys Trp Arg Gly Cys Gly Glu 1130 1135 1140 Arg Gly Thr Leu Leu His Cys Trp Trp Glu Cys Arg Leu Val Gln 1145 1150 1155 Pro Leu Trp Lys Ser Val Trp Arg Phe Leu Arg Lys Leu Asp Ile 1160 1165 1170 Val Leu Pro Glu Asp Pro Ala Ile Pro Leu Leu Gly Ile Tyr Pro 1175 1180 1185 Glu Asp Ala Pro Thr Gly Lys Lys Asp Thr Cys Ser Thr Met Phe 1190 1195 1200 Ile Ala Ala Leu Phe Ile Ile Ala Arg Ser Trp Lys Glu Pro Arg 1205 1210 1215 Cys Pro Ser Thr Glu Glu Trp Ile Gln Lys Met Trp Tyr Ile Tyr 1220 1225 1230 Thr Met Glu Tyr Tyr Ser Ala Ile Lys Lys Asn Glu Phe Met Lys 1235 1240 1245 Phe Leu Ala Lys Trp Met Asp Leu Glu Gly Ile Ile Leu Ser Glu 1250 1255 1260 Val Thr His Ser Gln Arg Asn Ser His Asn Met Tyr Ser Leu Ile 1265 1270 1275 Ser Gly Tyr 1280 <210> 12 <211> 599 <212> PRT <213> Unknown <220> <223> Description of Unknown: ltrA seqeunce <400> 12 Met Lys Pro Thr Met Ala Ile Leu Glu Arg Ile Ser Lys Asn Ser Gln 1 5 10 15 Glu Asn Ile Asp Glu Val Phe Thr Arg Leu Tyr Arg Tyr Leu Leu Arg 20 25 30 Pro Asp Ile Tyr Tyr Val Ala Tyr Gln Asn Leu Tyr Ser Asn Lys Gly 35 40 45 Ala Ser Thr Lys Gly Ile Leu Asp Asp Thr Ala Asp Gly Phe Ser Glu 50 55 60 Glu Lys Ile Lys Lys Ile Ile Gln Ser Leu Lys Asp Gly Thr Tyr Tyr 65 70 75 80 Pro Gln Pro Val Arg Arg Met Tyr Ile Ala Lys Lys Asn Ser Lys Lys 85 90 95 Met Arg Pro Leu Gly Ile Pro Thr Phe Thr Asp Lys Leu Ile Gln Glu 100 105 110 Ala Val Arg Ile Ile Leu Glu Ser Ile Tyr Glu Pro Val Phe Glu Asp 115 120 125 Val Ser His Gly Phe Arg Pro Gln Arg Ser Cys His Thr Ala Leu Lys 130 135 140 Thr Ile Lys Arg Glu Phe Gly Gly Ala Arg Trp Phe Val Glu Gly Asp 145 150 155 160 Ile Lys Gly Cys Phe Asp Asn Ile Asp His Val Thr Leu Ile Gly Leu 165 170 175 Ile Asn Leu Lys Ile Lys Asp Met Lys Met Ser Gln Leu Ile Tyr Lys 180 185 190 Phe Leu Lys Ala Gly Tyr Leu Glu Asn Trp Gln Tyr His Lys Thr Tyr 195 200 205 Ser Gly Thr Pro Gln Gly Gly Ile Leu Ser Pro Leu Leu Ala Asn Ile 210 215 220 Tyr Leu His Glu Leu Asp Lys Phe Val Leu Gln Leu Lys Met Lys Phe 225 230 235 240 Asp Arg Glu Ser Pro Glu Arg Ile Thr Pro Glu Tyr Arg Glu Leu His 245 250 255 Asn Glu Ile Lys Arg Ile Ser His Arg Leu Lys Lys Leu Glu Gly Glu 260 265 270 Glu Lys Ala Lys Val Leu Leu Glu Tyr Gln Glu Lys Arg Lys Arg Leu 275 280 285 Pro Thr Leu Pro Cys Thr Ser Gln Thr Asn Lys Val Leu Lys Tyr Val 290 295 300 Arg Tyr Ala Asp Asp Phe Ile Ile Ser Val Lys Gly Ser Lys Glu Asp 305 310 315 320 Cys Gln Trp Ile Lys Glu Gln Leu Lys Leu Phe Ile His Asn Lys Leu 325 330 335 Lys Met Glu Leu Ser Glu Glu Lys Thr Leu Ile Thr His Ser Ser Gln 340 345 350 Pro Ala Arg Phe Leu Gly Tyr Asp Ile Arg Val Arg Arg Ser Gly Thr 355 360 365 Ile Lys Arg Ser Gly Lys Val Lys Lys Arg Thr Leu Asn Gly Ser Val 370 375 380 Glu Leu Leu Ile Pro Leu Gln Asp Lys Ile Arg Gln Phe Ile Phe Asp 385 390 395 400 Lys Lys Ile Ala Ile Gln Lys Lys Asp Ser Ser Trp Phe Pro Val His 405 410 415 Arg Lys Tyr Leu Ile Arg Ser Thr Asp Leu Glu Ile Ile Thr Ile Tyr 420 425 430 Asn Ser Glu Leu Arg Gly Ile Cys Asn Tyr Tyr Gly Leu Ala Ser Asn 435 440 445 Phe Asn Gln Leu Asn Tyr Phe Ala Tyr Leu Met Glu Tyr Ser Cys Leu 450 455 460 Lys Thr Ile Ala Ser Lys His Lys Gly Thr Leu Ser Lys Thr Ile Ser 465 470 475 480 Met Phe Lys Asp Gly Ser Gly Ser Trp Gly Ile Pro Tyr Glu Ile Lys 485 490 495 Gln Gly Lys Gln Arg Arg Tyr Phe Ala Asn Phe Ser Glu Cys Lys Ser 500 505 510 Pro Tyr Gln Phe Thr Asp Glu Ile Ser Gln Ala Pro Val Leu Tyr Gly 515 520 525 Tyr Ala Arg Asn Thr Leu Glu Asn Arg Leu Lys Ala Lys Cys Cys Glu 530 535 540 Leu Cys Gly Thr Ser Asp Glu Asn Thr Ser Tyr Glu Ile His His Val 545 550 555 560 Asn Lys Val Lys Asn Leu Lys Gly Lys Glu Lys Trp Glu Met Ala Met 565 570 575 Ile Ala Lys Gln Arg Lys Thr Leu Val Val Cys Phe His Cys His Arg 580 585 590 His Val Ile His Lys His Lys 595 <210> 13 <211> 677 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 13 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro 675 <210> 14 <211> 677 <212> PRT <213> Murine leukemia virus <400> 14 Thr Leu Asn Ile Glu Asp Glu His Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro 675 <210> 15 <211> 677 <212> PRT <213> Unknown <220> <223> Description of Unknown: XMRV3VP35RT sequence <400> 15 Thr Leu Asn Ile Glu Asn Lys Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Pro Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Gln Asp Cys Gln Arg Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Met Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Lys Glu Ala Pro His Asp Cys Leu 485 490 495 Glu Ile Leu Ala Glu Thr His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Ile Pro Asp Ala Asp Tyr Thr Trp Tyr Thr Asp Gly Ser Ser Phe 515 520 525 Leu Gln Glu Gly Gln Arg Arg Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Arg Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Val His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly 595 600 605 Arg Glu Ile Lys Asn Lys Asn Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly Asn Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Glu Ala Ala Met Lys Ala Val Leu Glu Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asp Ser Thr Pro 675 <210> 16 <211> 682 <212> PRT <213> Gibbon ape leukemia virus <400> 16 Val Leu Asn Leu Glu Glu Glu Tyr Arg Leu His Glu Lys Pro Val Pro 1 5 10 15 Ser Ser Ile Asp Pro Ser Trp Leu Gln Leu Phe Pro Thr Val Trp Ala 20 25 30 Glu Arg Ala Gly Met Gly Leu Ala Asn Gln Val Pro Pro Val Val Val 35 40 45 Glu Leu Arg Ser Gly Ala Ser Pro Val Ala Val Arg Gln Tyr Pro Met 50 55 60 Ser Lys Glu Ala Arg Glu Gly Ile Arg Pro His Ile Gln Lys Phe Leu 65 70 75 80 Asp Leu Gly Val Leu Val Pro Cys Arg Ser Pro Trp Asn Thr Pro Leu 85 90 95 Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp 100 105 110 Leu Arg Glu Ile Asn Lys Arg Val Gln Asp Ile His Pro Thr Val Pro 115 120 125 Asn Pro Tyr Asn Leu Leu Ser Ser Leu Pro Pro Ser Tyr Thr Trp Tyr 130 135 140 Ser Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro 145 150 155 160 Asn Ser Gln Pro Leu Phe Ala Phe Glu Trp Lys Asp Pro Glu Lys Gly 165 170 175 Asn Thr Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn 180 185 190 Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala Pro Phe 195 200 205 Arg Ala Leu Asn Pro Gln Val Val Leu Leu Gln Tyr Val Asp Asp Leu 210 215 220 Leu Val Ala Ala Pro Thr Tyr Glu Asp Cys Lys Lys Gly Thr Gln Lys 225 230 235 240 Leu Leu Gln Glu Leu Ser Lys Leu Gly Tyr Arg Val Ser Ala Lys Lys 245 250 255 Ala Gln Leu Cys Gln Arg Glu Val Thr Tyr Leu Gly Tyr Leu Leu Lys 260 265 270 Glu Gly Lys Arg Trp Leu Thr Pro Ala Arg Lys Ala Thr Val Met Lys 275 280 285 Ile Pro Val Pro Thr Thr Pro Arg Gln Val Arg Glu Phe Leu Gly Thr 290 295 300 Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Ser Leu Ala Ala 305 310 315 320 Pro Leu Tyr Pro Leu Thr Lys Glu Ser Ile Pro Phe Ile Trp Thr Glu 325 330 335 Glu His Gln Gln Ala Phe Asp His Ile Lys Lys Ala Leu Leu Ser Ala 340 345 350 Pro Ala Leu Ala Leu Pro Asp Leu Thr Lys Pro Phe Thr Leu Tyr Ile 355 360 365 Asp Glu Arg Ala Gly Val Ala Arg Gly Val Leu Thr Gln Thr Leu Gly 370 375 380 Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val 385 390 395 400 Ala Ser Gly Trp Pro Thr Cys Leu Lys Ala Val Ala Ala Val Ala Leu 405 410 415 Leu Leu Lys Asp Ala Asp Lys Leu Thr Leu Gly Gln Asn Val Thr Val 420 425 430 Ile Ala Ser His Ser Leu Glu Ser Ile Val Arg Gln Pro Pro Asp Arg 435 440 445 Trp Met Thr Asn Ala Arg Met Thr His Tyr Gln Ser Leu Leu Leu Asn 450 455 460 Glu Arg Val Ser Phe Ala Pro Pro Ala Val Leu Asn Pro Ala Thr Leu 465 470 475 480 Leu Pro Val Glu Ser Glu Ala Thr Pro Val His Arg Cys Ser Glu Ile 485 490 495 Leu Ala Glu Glu Thr Gly Thr Arg Arg Asp Leu Glu Asp Gln Pro Leu 500 505 510 Pro Gly Val Pro Thr Trp Tyr Thr Asp Gly Ser Ser Phe Ile Thr Glu 515 520 525 Gly Lys Arg Arg Ala Gly Ala Pro Ile Val Asp Gly Lys Arg Thr Val 530 535 540 Trp Ala Ser Ser Leu Pro Glu Gly Thr Ser Ala Gln Lys Ala Glu Leu 545 550 555 560 Val Ala Leu Thr Gln Ala Leu Arg Leu Ala Glu Gly Lys Asn Ile Asn 565 570 575 Ile Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly 580 585 590 Ala Ile Tyr Lys Gln Arg Gly Leu Leu Thr Ser Ala Gly Lys Asp Ile 595 600 605 Lys Asn Lys Glu Glu Ile Leu Ala Leu Leu Glu Ala Ile His Leu Pro 610 615 620 Arg Arg Val Ala Ile Ile His Cys Pro Gly His Gln Arg Gly Ser Asn 625 630 635 640 Pro Val Ala Thr Gly Asn Arg Arg Ala Asp Glu Ala Ala Lys Gln Ala 645 650 655 Ala Leu Ser Thr Arg Val Leu Ala Gly Thr Thr Lys Pro Gln Glu Pro 660 665 670 Ile Glu Pro Ala Gln Glu Lys Thr Arg Pro 675 680 <210> 17 <211> 761 <212> PRT <213> Unknown <220> <223> Description of Unknown: sfvRT sequence <400> 17 Met Asp Pro Leu Gln Leu Leu Gln Pro Leu Glu Ala Glu Ile Lys Gly 1 5 10 15 Thr Lys Leu Lys Ala His Trp Asp Ser Gly Ala Thr Ile Thr Cys Val 20 25 30 Pro Glu Ala Phe Leu Glu Asp Glu Arg Pro Ile Gln Thr Met Leu Ile 35 40 45 Lys Thr Ile His Gly Glu Lys Gln Gln Asp Val Tyr Tyr Leu Thr Phe 50 55 60 Lys Val Gln Gly Arg Lys Val Glu Ala Glu Val Leu Ala Ser Pro Tyr 65 70 75 80 Asp Tyr Ile Leu Leu Asn Pro Ser Asp Val Pro Trp Leu Met Lys Lys 85 90 95 Pro Leu Gln Leu Thr Val Leu Val Pro Leu His Glu Tyr Gln Glu Arg 100 105 110 Leu Leu Gln Gln Thr Ala Leu Pro Lys Glu Gln Lys Glu Leu Leu Gln 115 120 125 Lys Leu Phe Leu Lys Tyr Asp Ala Leu Trp Gln His Trp Glu Asn Gln 130 135 140 Val Gly His Arg Arg Ile Lys Pro His Asn Ile Ala Thr Gly Thr Leu 145 150 155 160 Ala Pro Arg Pro Gln Lys Gln Tyr Pro Ile Asn Pro Lys Ala Lys Pro 165 170 175 Ser Ile Gln Ile Val Ile Asp Asp Leu Leu Lys Gln Gly Val Leu Ile 180 185 190 Gln Gln Asn Ser Thr Met Asn Thr Pro Val Tyr Pro Val Pro Lys Pro 195 200 205 Asp Gly Lys Trp Arg Met Val Leu Asp Tyr Arg Glu Val Asn Lys Thr 210 215 220 Ile Pro Leu Ile Ala Ala Gln Asn Gln His Ser Ala Gly Ile Leu Ser 225 230 235 240 Ser Ile Tyr Arg Gly Lys Tyr Lys Thr Thr Leu Asp Leu Thr Asn Gly 245 250 255 Phe Trp Ala His Pro Ile Thr Pro Glu Ser Tyr Trp Leu Thr Ala Phe 260 265 270 Thr Trp Gln Gly Lys Gln Tyr Cys Trp Thr Arg Leu Pro Gln Gly Phe 275 280 285 Leu Asn Ser Pro Ala Leu Phe Thr Ala Asp Val Val Asp Leu Leu Lys 290 295 300 Glu Ile Pro Asn Val Gln Ala Tyr Val Asp Asp Ile Tyr Ile Ser His 305 310 315 320 Asp Asp Pro Gln Glu His Leu Glu Gln Leu Glu Lys Ile Phe Ser Ile 325 330 335 Leu Leu Asn Ala Gly Tyr Val Val Ser Leu Lys Lys Ser Glu Ile Ala 340 345 350 Gln Arg Glu Val Glu Phe Leu Gly Phe Asn Ile Thr Lys Glu Gly Arg 355 360 365 Gly Leu Thr Asp Thr Phe Lys Gln Lys Leu Leu Asn Ile Thr Pro Pro 370 375 380 Lys Asp Leu Lys Gln Leu Gln Ser Ile Leu Gly Leu Leu Asn Phe Ala 385 390 395 400 Arg Asn Phe Ile Pro Asn Tyr Ser Glu Leu Val Lys Pro Leu Tyr Thr 405 410 415 Ile Val Ala Asn Ala Asn Gly Lys Phe Ile Ser Trp Thr Glu Asp Asn 420 425 430 Ser Asn Gln Leu Gln His Ile Ile Ser Val Leu Asn Gln Ala Asp Asn 435 440 445 Leu Glu Glu Arg Asn Pro Glu Thr Arg Leu Ile Ile Lys Val Asn Ser 450 455 460 Ser Pro Ser Ala Gly Tyr Ile Arg Tyr Tyr Asn Glu Gly Ser Lys Arg 465 470 475 480 Pro Ile Met Tyr Val Asn Tyr Ile Phe Ser Lys Ala Glu Ala Lys Phe 485 490 495 Thr Gln Thr Glu Lys Leu Leu Thr Thr Met His Lys Gly Leu Ile Lys 500 505 510 Ala Met Asp Leu Ala Met Gly Gln Glu Ile Leu Val Tyr Ser Pro Ile 515 520 525 Val Ser Met Thr Lys Ile Gln Arg Thr Pro Leu Pro Glu Arg Lys Ala 530 535 540 Leu Pro Val Arg Trp Ile Thr Trp Met Thr Tyr Leu Glu Asp Pro Arg 545 550 555 560 Ile Gln Phe His Tyr Asp Lys Ser Leu Pro Glu Leu Gln Gln Ile Pro 565 570 575 Asn Val Thr Glu Asp Val Ile Ala Lys Thr Lys His Pro Ser Glu Phe 580 585 590 Ala Met Val Phe Tyr Thr Asp Gly Ser Ala Ile Lys His Pro Asp Val 595 600 605 Asn Lys Ser His Ser Ala Gly Met Gly Ile Ala Gln Val Gln Phe Ile 610 615 620 Pro Glu Tyr Lys Ile Val His Gln Trp Ser Ile Pro Leu Gly Asp His 625 630 635 640 Thr Ala Gln Leu Ala Glu Ile Ala Ala Val Glu Phe Ala Cys Lys Lys 645 650 655 Ala Leu Lys Ile Ser Gly Pro Val Leu Ile Val Thr Asp Ser Phe Tyr 660 665 670 Val Ala Glu Ser Ala Asn Lys Glu Leu Pro Tyr Trp Lys Ser Asn Gly 675 680 685 Phe Leu Asn Asn Lys Lys Lys Pro Leu Arg His Val Ser Lys Trp Lys 690 695 700 Ser Ile Ala Glu Cys Leu Gln Leu Lys Pro Asp Ile Ile Ile Met His 705 710 715 720 Glu Lys Gly His Gln Gln Pro Met Thr Thr Leu His Thr Glu Gly Asn 725 730 735 Asn Leu Ala Asp Lys Leu Ala Thr Gln Gly Ser Tyr Val Val His Cys 740 745 750 Asn Thr Thr Pro Ser Leu Asp Ala Glu 755 760 <210> 18 <211> 762 <212> PRT <213> Unknown <220> <223> Description of Unknown: foamyRT sequence <400> 18 Met Asn Pro Leu Gln Leu Leu Gln Pro Leu Pro Ala Glu Ile Lys Gly 1 5 10 15 Thr Lys Leu Leu Ala His Trp Asp Ser Gly Ala Thr Ile Thr Cys Ile 20 25 30 Pro Glu Ser Phe Leu Glu Asp Glu Gln Pro Ile Lys Lys Thr Leu Ile 35 40 45 Lys Thr Ile His Gly Glu Lys Gln Gln Asn Val Tyr Tyr Val Thr Phe 50 55 60 Lys Val Lys Gly Arg Lys Val Glu Ala Glu Val Ile Ala Ser Pro Tyr 65 70 75 80 Glu Tyr Ile Leu Leu Ser Pro Thr Asp Val Pro Trp Leu Thr Gln Gln 85 90 95 Pro Leu Gln Leu Thr Ile Leu Val Pro Leu Gln Glu Tyr Gln Glu Lys 100 105 110 Ile Leu Ser Lys Thr Ala Leu Pro Glu Asp Gln Lys Gln Gln Leu Lys 115 120 125 Thr Leu Phe Val Lys Tyr Asp Asn Leu Trp Gln His Trp Glu Asn Gln 130 135 140 Val Gly His Arg Lys Ile Arg Pro His Asn Ile Ala Thr Gly Asp Tyr 145 150 155 160 Pro Pro Arg Pro Gln Lys Gln Tyr Pro Ile Asn Pro Lys Ala Lys Pro 165 170 175 Ser Ile Gln Ile Val Ile Asp Asp Leu Leu Lys Gln Gly Val Leu Thr 180 185 190 Pro Gln Asn Ser Thr Met Asn Thr Pro Val Tyr Pro Val Pro Lys Pro 195 200 205 Asp Gly Arg Trp Arg Met Val Leu Asp Tyr Arg Glu Val Asn Lys Thr 210 215 220 Ile Pro Leu Thr Ala Ala Gln Asn Gln His Ser Ala Gly Ile Leu Ala 225 230 235 240 Thr Ile Val Arg Gln Lys Tyr Lys Thr Thr Leu Asp Leu Ala Asn Gly 245 250 255 Phe Trp Ala His Pro Ile Thr Pro Glu Ser Tyr Trp Leu Thr Ala Phe 260 265 270 Thr Trp Gln Gly Lys Gln Tyr Cys Trp Thr Arg Leu Pro Gln Gly Phe 275 280 285 Leu Asn Ser Pro Ala Leu Phe Thr Ala Asp Val Val Asp Leu Leu Lys 290 295 300 Glu Ile Pro Asn Val Gln Val Tyr Val Asp Asp Ile Tyr Leu Ser His 305 310 315 320 Asp Asp Pro Lys Glu His Val Gln Gln Leu Glu Lys Val Phe Gln Ile 325 330 335 Leu Leu Gln Ala Gly Tyr Val Val Ser Leu Lys Lys Ser Glu Ile Gly 340 345 350 Gln Lys Thr Val Glu Phe Leu Gly Phe Asn Ile Thr Lys Glu Gly Arg 355 360 365 Gly Leu Thr Asp Thr Phe Lys Thr Lys Leu Leu Asn Ile Thr Pro Pro 370 375 380 Lys Asp Leu Lys Gln Leu Gln Ser Ile Leu Gly Leu Leu Asn Phe Ala 385 390 395 400 Arg Asn Phe Ile Pro Asn Phe Ala Glu Leu Val Gln Pro Leu Tyr Asn 405 410 415 Leu Ile Ala Ser Ala Lys Gly Lys Tyr Ile Glu Trp Ser Glu Glu Asn 420 425 430 Thr Lys Gln Leu Asn Met Val Ile Glu Ala Leu Asn Thr Ala Ser Asn 435 440 445 Leu Glu Glu Arg Leu Pro Glu Gln Arg Leu Val Ile Lys Val Asn Thr 450 455 460 Ser Pro Ser Ala Gly Tyr Val Arg Tyr Tyr Asn Glu Thr Gly Lys Lys 465 470 475 480 Pro Ile Met Tyr Leu Asn Tyr Val Phe Ser Lys Ala Glu Leu Lys Phe 485 490 495 Ser Met Leu Glu Lys Leu Leu Thr Thr Met His Lys Ala Leu Ile Lys 500 505 510 Ala Met Asp Leu Ala Met Gly Gln Glu Ile Leu Val Tyr Ser Pro Ile 515 520 525 Val Ser Met Thr Lys Ile Gln Lys Thr Pro Leu Pro Glu Arg Lys Ala 530 535 540 Leu Pro Ile Arg Trp Ile Thr Trp Met Thr Tyr Leu Glu Asp Pro Arg 545 550 555 560 Ile Gln Phe His Tyr Asp Lys Thr Leu Pro Glu Leu Lys His Ile Pro 565 570 575 Asp Val Tyr Thr Ser Ser Gln Ser Pro Val Lys His Pro Ser Gln Tyr 580 585 590 Glu Gly Val Phe Tyr Thr Asp Gly Ser Ala Ile Lys Ser Pro Asp Pro 595 600 605 Thr Lys Ser Asn Asn Ala Gly Met Gly Ile Val His Ala Thr Tyr Lys 610 615 620 Pro Glu Tyr Gln Val Leu Asn Gln Trp Ser Ile Pro Leu Gly Asn His 625 630 635 640 Thr Ala Gln Met Ala Glu Ile Ala Ala Val Glu Phe Ala Cys Lys Lys 645 650 655 Ala Leu Lys Ile Pro Gly Pro Val Leu Val Ile Thr Asp Ser Phe Tyr 660 665 670 Val Ala Glu Ser Ala Asn Lys Glu Leu Pro Tyr Trp Lys Ser Asn Gly 675 680 685 Phe Val Asn Asn Lys Lys Lys Pro Leu Lys His Ile Ser Lys Trp Lys 690 695 700 Ser Ile Ala Glu Cys Leu Ser Met Lys Pro Asp Ile Thr Ile Gln His 705 710 715 720 Glu Lys Gly Ile Ser Leu Gln Ile Pro Val Phe Ile Leu Lys Gly Asn 725 730 735 Ala Leu Ala Asp Lys Leu Ala Thr Gln Gly Ser Tyr Val Val Asn Cys 740 745 750 Asn Thr Lys Lys Pro Asn Leu Asp Ala Glu 755 760 <210> 19 <211> 560 <212> PRT <213> Human immunodeficiency virus <400> 19 Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met 1 5 10 15 Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys 20 25 30 Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser 35 40 45 Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys 50 55 60 Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu 65 70 75 80 Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His 85 90 95 Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly 100 105 110 Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr 115 120 125 Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr 130 135 140 Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe 145 150 155 160 Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro 165 170 175 Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp 180 185 190 Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His 195 200 205 Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu 210 215 220 Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr 225 230 235 240 Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp 245 250 255 Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro 260 265 270 Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala 275 280 285 Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala 290 295 300 Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp 305 310 315 320 Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln 325 330 335 Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly 340 345 350 Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu 355 360 365 Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly 370 375 380 Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr 385 390 395 400 Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe 405 410 415 Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu 420 425 430 Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg 435 440 445 Glu Thr Lys Leu Gly Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln 450 455 460 Lys Val Val Thr Leu Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln 465 470 475 480 Ala Ile Tyr Leu Ala Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val 485 490 495 Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln 500 505 510 Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys 515 520 525 Glu Lys Val Tyr Leu Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly 530 535 540 Asn Glu Gln Val Asp Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu 545 550 555 560 <210> 20 <211> 440 <212> PRT <213> Human immunodeficiency virus <400> 20 Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met 1 5 10 15 Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys 20 25 30 Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser 35 40 45 Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys 50 55 60 Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu 65 70 75 80 Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His 85 90 95 Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly 100 105 110 Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr 115 120 125 Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr 130 135 140 Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe 145 150 155 160 Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro 165 170 175 Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp 180 185 190 Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His 195 200 205 Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu 210 215 220 Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr 225 230 235 240 Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp 245 250 255 Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro 260 265 270 Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala 275 280 285 Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala 290 295 300 Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp 305 310 315 320 Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln 325 330 335 Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly 340 345 350 Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu 355 360 365 Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly 370 375 380 Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr 385 390 395 400 Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe 405 410 415 Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu 420 425 430 Pro Ile Val Gly Ala Glu Thr Phe 435 440 <210> 21 <211> 572 <212> PRT <213> Rous sarcoma virus <400> 21 Thr Val Ala Leu His Leu Ala Ile Pro Leu Lys Trp Lys Pro Asp His 1 5 10 15 Thr Pro Val Trp Ile Asp Gln Trp Pro Leu Pro Glu Gly Lys Leu Val 20 25 30 Ala Leu Thr Gln Leu Val Glu Lys Glu Leu Gln Leu Gly His Ile Glu 35 40 45 Pro Ser Leu Ser Cys Trp Asn Thr Pro Val Phe Val Ile Arg Lys Ala 50 55 60 Ser Gly Ser Tyr Arg Leu Leu His Asp Leu Arg Ala Val Asn Ala Lys 65 70 75 80 Leu Val Pro Phe Gly Ala Val Gln Gln Gly Ala Pro Val Leu Ser Ala 85 90 95 Leu Pro Arg Gly Trp Pro Leu Met Val Leu Asp Leu Lys Asp Cys Phe 100 105 110 Phe Ser Ile Pro Leu Ala Glu Gln Asp Arg Glu Ala Phe Ala Phe Thr 115 120 125 Leu Pro Ser Val Asn Asn Gln Ala Pro Ala Arg Arg Phe Gln Trp Lys 130 135 140 Val Leu Pro Gln Gly Met Thr Cys Ser Pro Thr Ile Cys Gln Leu Val 145 150 155 160 Val Gly Gln Val Leu Glu Pro Leu Arg Leu Lys His Pro Ser Leu Cys 165 170 175 Met Leu His Tyr Met Asp Asp Leu Leu Leu Ala Ala Ser Ser His Asp 180 185 190 Gly Leu Glu Ala Ala Gly Glu Glu Val Ile Ser Thr Leu Glu Arg Ala 195 200 205 Gly Phe Thr Ile Ser Pro Asp Lys Val Gln Arg Glu Pro Gly Val Gln 210 215 220 Tyr Leu Gly Tyr Lys Leu Gly Ser Thr Tyr Val Ala Pro Val Gly Leu 225 230 235 240 Val Ala Glu Pro Arg Ile Ala Thr Leu Trp Asp Val Gln Lys Leu Val 245 250 255 Gly Ser Leu Gln Trp Leu Arg Pro Ala Leu Gly Ile Pro Pro Arg Leu 260 265 270 Met Gly Pro Phe Tyr Glu Gln Leu Arg Gly Ser Asp Pro Asn Glu Ala 275 280 285 Arg Glu Trp Asn Leu Asp Met Lys Met Ala Trp Arg Glu Ile Val Arg 290 295 300 Leu Ser Thr Thr Ala Ala Leu Glu Arg Trp Asp Pro Ala Leu Pro Leu 305 310 315 320 Glu Gly Ala Val Ala Arg Cys Glu Gln Gly Ala Ile Gly Val Leu Gly 325 330 335 Gln Gly Leu Ser Thr His Pro Arg Pro Cys Leu Trp Leu Phe Ser Thr 340 345 350 Gln Pro Thr Lys Ala Phe Thr Ala Trp Leu Glu Val Leu Thr Leu Leu 355 360 365 Ile Thr Lys Leu Arg Ala Ser Ala Val Arg Thr Phe Gly Lys Glu Val 370 375 380 Asp Ile Leu Leu Leu Pro Ala Cys Phe Arg Glu Asp Leu Pro Leu Pro 385 390 395 400 Glu Gly Ile Leu Leu Ala Leu Lys Gly Phe Ala Gly Lys Ile Arg Ser 405 410 415 Ser Asp Thr Pro Ser Ile Phe Asp Ile Ala Arg Pro Leu His Val Ser 420 425 430 Leu Lys Val Arg Val Thr Asp His Pro Val Pro Gly Pro Thr Val Phe 435 440 445 Thr Asp Ala Ser Ser Ser Thr His Lys Gly Val Val Val Trp Arg Glu 450 455 460 Gly Pro Arg Trp Glu Ile Lys Glu Ile Ala Asp Leu Gly Ala Ser Val 465 470 475 480 Gln Gln Leu Glu Ala Arg Ala Val Ala Met Ala Leu Leu Leu Trp Pro 485 490 495 Thr Thr Pro Thr Asn Val Val Thr Asp Ser Ala Phe Val Ala Lys Met 500 505 510 Leu Leu Lys Met Gly Gln Glu Gly Val Pro Ser Thr Ala Ala Ala Phe 515 520 525 Ile Leu Glu Asp Ala Leu Ser Gln Arg Ser Ala Met Ala Ala Val Leu 530 535 540 His Val Arg Ser His Ser Glu Val Pro Gly Phe Phe Thr Glu Gly Asn 545 550 555 560 Asp Val Ala Asp Ser Gln Ala Thr Phe Gln Ala Tyr 565 570 <210> 22 <211> 859 <212> PRT <213> Rous sarcoma virus <400> 22 Thr Val Ala Leu His Leu Ala Ile Pro Leu Lys Trp Lys Pro Asp His 1 5 10 15 Thr Pro Val Trp Ile Asp Gln Trp Pro Leu Pro Glu Gly Lys Leu Val 20 25 30 Ala Leu Thr Gln Leu Val Glu Lys Glu Leu Gln Leu Gly His Ile Glu 35 40 45 Pro Ser Leu Ser Cys Trp Asn Thr Pro Val Phe Val Ile Arg Lys Ala 50 55 60 Ser Gly Ser Tyr Arg Leu Leu His Asp Leu Arg Ala Val Asn Ala Lys 65 70 75 80 Leu Val Pro Phe Gly Ala Val Gln Gln Gly Ala Pro Val Leu Ser Ala 85 90 95 Leu Pro Arg Gly Trp Pro Leu Met Val Leu Asp Leu Lys Asp Cys Phe 100 105 110 Phe Ser Ile Pro Leu Ala Glu Gln Asp Arg Glu Ala Phe Ala Phe Thr 115 120 125 Leu Pro Ser Val Asn Asn Gln Ala Pro Ala Arg Arg Phe Gln Trp Lys 130 135 140 Val Leu Pro Gln Gly Met Thr Cys Ser Pro Thr Ile Cys Gln Leu Val 145 150 155 160 Val Gly Gln Val Leu Glu Pro Leu Arg Leu Lys His Pro Ser Leu Cys 165 170 175 Met Leu His Tyr Met Asp Asp Leu Leu Leu Ala Ala Ser Ser His Asp 180 185 190 Gly Leu Glu Ala Ala Gly Glu Glu Val Ile Ser Thr Leu Glu Arg Ala 195 200 205 Gly Phe Thr Ile Ser Pro Asp Lys Val Gln Arg Glu Pro Gly Val Gln 210 215 220 Tyr Leu Gly Tyr Lys Leu Gly Ser Thr Tyr Val Ala Pro Val Gly Leu 225 230 235 240 Val Ala Glu Pro Arg Ile Ala Thr Leu Trp Asp Val Gln Lys Leu Val 245 250 255 Gly Ser Leu Gln Trp Leu Arg Pro Ala Leu Gly Ile Pro Pro Arg Leu 260 265 270 Met Gly Pro Phe Tyr Glu Gln Leu Arg Gly Ser Asp Pro Asn Glu Ala 275 280 285 Arg Glu Trp Asn Leu Asp Met Lys Met Ala Trp Arg Glu Ile Val Arg 290 295 300 Leu Ser Thr Thr Ala Ala Leu Glu Arg Trp Asp Pro Ala Leu Pro Leu 305 310 315 320 Glu Gly Ala Val Ala Arg Cys Glu Gln Gly Ala Ile Gly Val Leu Gly 325 330 335 Gln Gly Leu Ser Thr His Pro Arg Pro Cys Leu Trp Leu Phe Ser Thr 340 345 350 Gln Pro Thr Lys Ala Phe Thr Ala Trp Leu Glu Val Leu Thr Leu Leu 355 360 365 Ile Thr Lys Leu Arg Ala Ser Ala Val Arg Thr Phe Gly Lys Glu Val 370 375 380 Asp Ile Leu Leu Leu Pro Ala Cys Phe Arg Glu Asp Leu Pro Leu Pro 385 390 395 400 Glu Gly Ile Leu Leu Ala Leu Lys Gly Phe Ala Gly Lys Ile Arg Ser 405 410 415 Ser Asp Thr Pro Ser Ile Phe Asp Ile Ala Arg Pro Leu His Val Ser 420 425 430 Leu Lys Val Arg Val Thr Asp His Pro Val Pro Gly Pro Thr Val Phe 435 440 445 Thr Asp Ala Ser Ser Ser Thr His Lys Gly Val Val Val Trp Arg Glu 450 455 460 Gly Pro Arg Trp Glu Ile Lys Glu Ile Ala Asp Leu Gly Ala Ser Val 465 470 475 480 Gln Gln Leu Glu Ala Arg Ala Val Ala Met Ala Leu Leu Leu Trp Pro 485 490 495 Thr Thr Pro Thr Asn Val Val Thr Asp Ser Ala Phe Val Ala Lys Met 500 505 510 Leu Leu Lys Met Gly Gln Glu Gly Val Pro Ser Thr Ala Ala Ala Phe 515 520 525 Ile Leu Glu Asp Ala Leu Ser Gln Arg Ser Ala Met Ala Ala Val Leu 530 535 540 His Val Arg Ser His Ser Glu Val Pro Gly Phe Phe Thr Glu Gly Asn 545 550 555 560 Asp Val Ala Asp Ser Gln Ala Thr Phe Gln Ala Tyr Pro Leu Arg Glu 565 570 575 Ala Lys Asp Leu His Thr Ala Leu His Ile Gly Pro Arg Ala Leu Ser 580 585 590 Lys Ala Cys Asn Ile Ser Met Gln Gln Ala Arg Glu Val Val Gln Thr 595 600 605 Cys Pro His Cys Asn Ser Ala Pro Ala Leu Glu Ala Gly Val Asn Pro 610 615 620 Arg Gly Leu Gly Pro Leu Gln Ile Trp Gln Thr Asp Phe Thr Leu Glu 625 630 635 640 Pro Arg Met Ala Pro Arg Ser Trp Leu Ala Val Thr Val Asp Thr Ala 645 650 655 Ser Ser Ala Ile Val Val Thr Gln His Gly Arg Val Thr Ser Val Ala 660 665 670 Val Gln His His Trp Ala Thr Ala Ile Ala Val Leu Gly Arg Pro Lys 675 680 685 Ala Ile Lys Thr Asp Asn Gly Ser Cys Phe Thr Ser Lys Ser Thr Arg 690 695 700 Glu Trp Leu Ala Arg Trp Gly Ile Ala His Thr Thr Gly Ile Pro Gly 705 710 715 720 Asn Ser Gln Gly Gln Ala Met Val Glu Arg Ala Asn Arg Leu Leu Lys 725 730 735 Asp Arg Ile Arg Val Leu Ala Glu Gly Asp Gly Phe Met Lys Arg Ile 740 745 750 Pro Thr Ser Lys Gln Gly Glu Leu Leu Ala Lys Ala Met Tyr Ala Leu 755 760 765 Asn His Phe Glu Arg Gly Glu Asn Thr Lys Thr Pro Ile Gln Lys His 770 775 780 Trp Arg Pro Thr Val Leu Thr Glu Gly Pro Pro Val Lys Ile Arg Ile 785 790 795 800 Glu Thr Gly Glu Trp Glu Lys Gly Trp Asn Val Leu Val Trp Gly Arg 805 810 815 Gly Tyr Ala Ala Val Lys Asn Arg Asp Thr Asp Lys Val Ile Trp Val 820 825 830 Pro Ser Arg Lys Val Lys Pro Asp Ile Thr Gln Lys Asp Glu Val Thr 835 840 845 Lys Lys Asp Glu Ala Ser Pro Leu Phe Ala Gly 850 855 <210> 23 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 23 Leu Glu Ile Arg Ala Ala Phe Leu Arg Gln Arg Asn Thr Ala Leu Arg 1 5 10 15 Thr Glu Val Ala Glu Leu Glu Gln Glu Val Gln Arg Leu Glu Asn Glu 20 25 30 Val Ser Gln Tyr Glu Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys 35 40 45 <210> 24 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Leu Glu Ile Glu Ala Ala Phe Leu Glu Arg Glu Asn Thr Ala Leu Glu 1 5 10 15 Thr Arg Val Ala Glu Leu Arg Gln Arg Val Gln Arg Leu Arg Asn Arg 20 25 30 Val Ser Gln Tyr Arg Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys 35 40 45 <210> 25 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 25 ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60 aatgggacac ag 72 <210> 26 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 26 gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgaa ggcgagggcg 120 atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgccggtgc 180 cctggcccac cctcgtgacc accctgacat acggcgtgca gtgcttcacc ctcgtgacca 240 ccctgaggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac atgcttcggc 300 atggcgaatg ggacacag 318 <210> 27 <211> 866 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 27 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly 20 25 30 Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile 35 40 45 Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr 50 55 60 Cys Ser Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys 65 70 75 80 Val Glu Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu 85 90 95 Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys 100 105 110 Ala Met Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile 115 120 125 Ala Ala Asn Ser Gly Ile Tyr Ser Gly Gly Ser Ser Gly Gly Ser Ser 130 135 140 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser 145 150 155 160 Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr 165 170 175 Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr 180 185 190 Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly 195 200 205 Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser 210 215 220 Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu 225 230 235 240 Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val 245 250 255 Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro 260 265 270 Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys 275 280 285 Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu 290 295 300 Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys 305 310 315 320 Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe 325 330 335 Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr 340 345 350 Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn 355 360 365 Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp 370 375 380 Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser 385 390 395 400 Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly 405 410 415 Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys 420 425 430 Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu 435 440 445 Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr 450 455 460 Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu 465 470 475 480 Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr 485 490 495 Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr 500 505 510 Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro 515 520 525 Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr 530 535 540 Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val 545 550 555 560 Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro 565 570 575 Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly 580 585 590 Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val 595 600 605 Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg 610 615 620 Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe 625 630 635 640 Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu 645 650 655 Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly 660 665 670 Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr 675 680 685 Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala 690 695 700 Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu 705 710 715 720 Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln 725 730 735 Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser 740 745 750 Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg 755 760 765 Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu 770 775 780 Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile 785 790 795 800 Ile His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg Gly 805 810 815 Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr 820 825 830 Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly 835 840 845 Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg 850 855 860 Lys Val 865 <210> 28 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat 120 cacccatgtg caccctgaca tacggcgtgc agtgctt 157 <210> 29 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat 120 cacccatgtg cgcgcacatg aggatcaccc atgtgcaccc tgacatacgg cgtgcagtgc 180 tt 182 <210> 30 <211> 166 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 30 gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60 aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcc aacatgagga 120 tcacccatgt ctgcagggcc accctgacat acggcgtgca gtgctt 166 <210> 31 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 gctgaagcac tgcacgccat gttttagagc taggccaaca tgaggatcac ccatgtctgc 60 agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 120 ccatgtctgc agggccaagt ggcaccgagt cggtgcaccc tgacatacgg cgtgcagtgc 180 tt 182 <210> 32 <211> 1368 <212> PRT <213> Streptococcus pyogenes <400> 32 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 33 <211> 1053 <212> PRT <213> Staphylococcus aureus <400> 33 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 34 <211> 984 <212> PRT <213> Campylobacter jejuni <400> 34 Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp 1 5 10 15 Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe 20 25 30 Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg 35 40 45 Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg 50 55 60 Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr 65 70 75 80 Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly 85 90 95 Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu 100 105 110 Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg 115 120 125 Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala 130 135 140 Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln 145 150 155 160 Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu 165 170 175 Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu 180 185 190 Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe 195 200 205 Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu 210 215 220 Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser 225 230 235 240 His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro 245 250 255 Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile 260 265 270 Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys 275 280 285 Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu 290 295 300 Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu 305 310 315 320 Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys 325 330 335 Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu 340 345 350 Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu 355 360 365 Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser 370 375 380 Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala 385 390 395 400 Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu 405 410 415 Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys 420 425 430 Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr 435 440 445 Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn 450 455 460 Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu 465 470 475 480 Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys 485 490 495 Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys 500 505 510 Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg 515 520 525 Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile 530 535 540 Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile 545 550 555 560 Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu 565 570 575 Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu 580 585 590 Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala 595 600 605 Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr 610 615 620 Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr 625 630 635 640 Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp 645 650 655 Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln 660 665 670 Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser 675 680 685 Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His 690 695 700 Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser 705 710 715 720 Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser 725 730 735 Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys 740 745 750 Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp 755 760 765 Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser 770 775 780 Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln 785 790 795 800 Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys 805 810 815 Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg 820 825 830 Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro 835 840 845 Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val 850 855 860 Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu 865 870 875 880 Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile 885 890 895 Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe 900 905 910 Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe 915 920 925 Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu 930 935 940 Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe 945 950 955 960 Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe 965 970 975 Arg Gln Arg Glu Asp Phe Lys Lys 980 <210> 35 <211> 1087 <212> PRT <213> Geobacilus stereothermophilus <400> 35 Met Arg Tyr Lys Ile Gly Leu Asp Ile Gly Ile Thr Ser Val Gly Trp 1 5 10 15 Ala Val Met Asn Leu Asp Ile Pro Arg Ile Glu Asp Leu Gly Val Arg 20 25 30 Ile Phe Asp Arg Ala Glu Asn Pro Gln Thr Gly Glu Ser Leu Ala Leu 35 40 45 Pro Arg Arg Leu Ala Arg Ser Ala Arg Arg Arg Leu Arg Arg Arg Lys 50 55 60 His Arg Leu Glu Arg Ile Arg Arg Leu Val Ile Arg Glu Gly Ile Leu 65 70 75 80 Thr Lys Glu Glu Leu Asp Lys Leu Phe Glu Glu Lys His Glu Ile Asp 85 90 95 Val Trp Gln Leu Arg Val Glu Ala Leu Asp Arg Lys Leu Asn Asn Asp 100 105 110 Glu Leu Ala Arg Val Leu Leu His Leu Ala Lys Arg Arg Gly Phe Lys 115 120 125 Ser Asn Arg Lys Ser Glu Arg Ser Asn Lys Glu Asn Ser Thr Met Leu 130 135 140 Lys His Ile Glu Glu Asn Arg Ala Ile Leu Ser Ser Tyr Arg Thr Val 145 150 155 160 Gly Glu Met Ile Val Lys Asp Pro Lys Phe Ala Leu His Lys Arg Asn 165 170 175 Lys Gly Glu Asn Tyr Thr Asn Thr Ile Ala Arg Asp Asp Leu Glu Arg 180 185 190 Glu Ile Arg Leu Ile Phe Ser Lys Gln Arg Glu Phe Gly Asn Met Ser 195 200 205 Cys Thr Glu Glu Phe Glu Asn Glu Tyr Ile Thr Ile Trp Ala Ser Gln 210 215 220 Arg Pro Val Ala Ser Lys Asp Asp Ile Glu Lys Lys Val Gly Phe Cys 225 230 235 240 Thr Phe Glu Pro Lys Glu Lys Arg Ala Pro Lys Ala Thr Tyr Thr Phe 245 250 255 Gln Ser Phe Ile Ala Trp Glu His Ile Asn Lys Leu Arg Leu Ile Ser 260 265 270 Pro Ser Gly Ala Arg Gly Leu Thr Asp Glu Glu Arg Arg Leu Leu Tyr 275 280 285 Glu Gln Ala Phe Gln Lys Asn Lys Ile Thr Tyr His Asp Ile Arg Thr 290 295 300 Leu Leu His Leu Pro Asp Asp Thr Tyr Phe Lys Gly Ile Val Tyr Asp 305 310 315 320 Arg Gly Glu Ser Arg Lys Gln Asn Glu Asn Ile Arg Phe Leu Glu Leu 325 330 335 Asp Ala Tyr His Gln Ile Arg Lys Ala Val Asp Lys Val Tyr Gly Lys 340 345 350 Gly Lys Ser Ser Ser Phe Leu Pro Ile Asp Phe Asp Thr Phe Gly Tyr 355 360 365 Ala Leu Thr Leu Phe Lys Asp Asp Ala Asp Ile His Ser Tyr Leu Arg 370 375 380 Asn Glu Tyr Glu Gln Asn Gly Lys Arg Met Pro Asn Leu Ala Asn Lys 385 390 395 400 Val Tyr Asp Asn Glu Leu Ile Glu Glu Leu Leu Asn Leu Ser Phe Thr 405 410 415 Lys Phe Gly His Leu Ser Leu Lys Ala Leu Arg Ser Ile Leu Pro Tyr 420 425 430 Met Glu Gln Gly Glu Val Tyr Ser Ser Ala Cys Glu Arg Ala Gly Tyr 435 440 445 Thr Phe Thr Gly Pro Lys Lys Lys Gln Lys Thr Met Leu Leu Pro Asn 450 455 460 Ile Pro Pro Ile Ala Asn Pro Val Val Met Arg Ala Leu Thr Gln Ala 465 470 475 480 Arg Lys Val Val Asn Ala Ile Ile Lys Lys Tyr Gly Ser Pro Val Ser 485 490 495 Ile His Ile Glu Leu Ala Arg Asp Leu Ser Gln Thr Phe Asp Glu Arg 500 505 510 Arg Lys Thr Lys Lys Glu Gln Asp Glu Asn Arg Lys Lys Asn Glu Thr 515 520 525 Ala Ile Arg Gln Leu Met Glu Tyr Gly Leu Thr Leu Asn Pro Thr Gly 530 535 540 His Asp Ile Val Lys Phe Lys Leu Trp Ser Glu Gln Asn Gly Arg Cys 545 550 555 560 Ala Tyr Ser Leu Gln Pro Ile Glu Ile Glu Arg Leu Leu Glu Pro Gly 565 570 575 Tyr Val Glu Val Asp His Val Ile Pro Tyr Ser Arg Ser Leu Asp Asp 580 585 590 Ser Tyr Thr Asn Lys Val Leu Val Leu Thr Arg Glu Asn Arg Glu Lys 595 600 605 Gly Asn Arg Ile Pro Ala Glu Tyr Leu Gly Val Gly Thr Glu Arg Trp 610 615 620 Gln Gln Phe Glu Thr Phe Val Leu Thr Asn Lys Gln Phe Ser Lys Lys 625 630 635 640 Lys Arg Asp Arg Leu Leu Arg Leu His Tyr Asp Glu Asn Glu Glu Thr 645 650 655 Glu Phe Lys Asn Arg Asn Leu Asn Asp Thr Arg Tyr Ile Ser Arg Phe 660 665 670 Phe Ala Asn Phe Ile Arg Glu His Leu Lys Phe Ala Glu Ser Asp Asp 675 680 685 Lys Gln Lys Val Tyr Thr Val Asn Gly Arg Val Thr Ala His Leu Arg 690 695 700 Ser Arg Trp Glu Phe Asn Lys Asn Arg Glu Glu Ser Asp Leu His His 705 710 715 720 Ala Val Asp Ala Ala Ile Val Ala Cys Thr Thr Pro Ser Asp Ile Ala 725 730 735 Lys Val Thr Ala Phe Tyr Gln Arg Arg Glu Gln Asn Lys Glu Leu Ala 740 745 750 Lys Lys Thr Glu Pro His Phe Pro Gln Pro Trp Pro His Phe Ala Asp 755 760 765 Glu Leu Arg Ala Arg Leu Ser Lys His Pro Lys Glu Ser Ile Lys Ala 770 775 780 Leu Asn Leu Gly Asn Tyr Asp Asp Gln Lys Leu Glu Ser Leu Gln Pro 785 790 795 800 Val Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala Ala His 805 810 815 Gln Glu Thr Leu Arg Arg Tyr Val Gly Ile Asp Glu Arg Ser Gly Lys 820 825 830 Ile Gln Thr Val Val Lys Thr Lys Leu Ser Glu Ile Lys Leu Asp Ala 835 840 845 Ser Gly His Phe Pro Met Tyr Gly Lys Glu Ser Asp Pro Arg Thr Tyr 850 855 860 Glu Ala Ile Arg Gln Arg Leu Leu Glu His Asn Asn Asp Pro Lys Lys 865 870 875 880 Ala Phe Gln Glu Pro Leu Tyr Lys Pro Lys Lys Asn Gly Glu Pro Gly 885 890 895 Pro Val Ile Arg Thr Val Lys Ile Ile Asp Thr Lys Asn Gln Val Ile 900 905 910 Pro Leu Asn Asp Gly Lys Thr Val Ala Tyr Asn Ser Asn Ile Val Arg 915 920 925 Val Asp Val Phe Glu Lys Asp Gly Lys Tyr Tyr Cys Val Pro Val Tyr 930 935 940 Thr Met Asp Ile Met Lys Gly Ile Leu Pro Asn Lys Ala Ile Glu Pro 945 950 955 960 Asn Lys Pro Tyr Ser Glu Trp Lys Glu Met Thr Glu Asp Tyr Thr Phe 965 970 975 Arg Phe Ser Leu Tyr Pro Asn Asp Leu Ile Arg Ile Glu Leu Pro Arg 980 985 990 Glu Lys Thr Val Lys Thr Ala Ala Gly Glu Glu Ile Asn Val Lys Asp 995 1000 1005 Val Phe Val Tyr Tyr Lys Thr Ile Asp Ser Ala Asn Gly Gly Leu 1010 1015 1020 Glu Leu Ile Ser His Asp His Arg Phe Ser Leu Arg Gly Val Gly 1025 1030 1035 Ser Arg Thr Leu Lys Arg Phe Glu Lys Tyr Gln Val Asp Val Leu 1040 1045 1050 Gly Asn Ile Tyr Lys Val Arg Gly Glu Lys Arg Val Gly Leu Ala 1055 1060 1065 Ser Ser Ala His Ser Lys Thr Gly Glu Thr Val Arg Pro Leu Gln 1070 1075 1080 Ser Thr Arg Asp 1085 <210> 36 <211> 1052 <212> PRT <213> Haemophilus parainfluenzae <400> 36 Met Glu Asn Lys Asn Leu His Tyr Ile Leu Gly Leu Asp Leu Gly Ile 1 5 10 15 Ala Ser Val Gly Trp Ala Val Val Glu Ile Asp Glu Lys Glu Asn Pro 20 25 30 Leu Arg Leu Ile Asp Val Gly Val Arg Thr Phe Glu Arg Ala Glu Thr 35 40 45 Gln Lys Gly Glu Ser Leu Ala Leu Ser Arg Arg Ser Ala Arg Ser Ala 50 55 60 Arg Arg Leu Thr Gln Arg Arg Val Ala Arg Leu Lys Lys Ala Lys Arg 65 70 75 80 Leu Leu Lys Ser Glu Asn Ile Leu Leu Ser Thr Asp Glu Arg Leu Pro 85 90 95 His Gln Val Trp Gln Leu Arg Val Glu Gly Leu Asp Arg Lys Leu Glu 100 105 110 Arg Gln Glu Trp Ala Ala Val Leu Leu His Leu Ile Lys His Arg Gly 115 120 125 Tyr Leu Ser Gln Arg Lys Asn Glu Ser Lys Ser Glu Asn Lys Glu Leu 130 135 140 Gly Ala Leu Leu Ser Gly Val Ala Ser Asn His Glu Leu Leu Gln Gln 145 150 155 160 Ala Thr Tyr Arg Thr Pro Ala Glu Leu Ala Val Lys Lys Phe Glu Val 165 170 175 Glu Glu Gly His Ile Arg Asn Gln Gln Gly Ala Tyr Thr His Thr Phe 180 185 190 Ser Arg Leu Asp Leu Leu Ala Glu Met Glu Leu Leu Phe Ser Arg Gln 195 200 205 Gln His Phe Gly Asn Pro Phe Ala Ser Glu Lys Leu Leu Glu Asn Leu 210 215 220 Thr Ala Leu Leu Met Trp Gln Lys Pro Ala Leu Ser Gly Glu Asp Ile 225 230 235 240 Leu Lys Met Leu Gly Lys Cys Thr Phe Glu Asp Glu Tyr Lys Ala Ala 245 250 255 Lys Asn Thr Tyr Thr Ala Glu Arg Phe Val Trp Ile Thr Lys Leu Asn 260 265 270 Asn Leu Arg Ile Gln Glu Asn Gly Leu Glu Arg Ala Leu Ser Asp Asn 275 280 285 Glu Arg Leu Met Leu Ile Glu Gln Pro Tyr Glu Lys Ala Lys Leu Thr 290 295 300 Tyr Ala Gln Val Arg Ser Ile Leu Asn Leu Ser Asp Asp Ala Ile Phe 305 310 315 320 Lys Gly Val Arg Tyr Ser Gly Glu Asp Lys Lys Ala Ile Glu Thr Lys 325 330 335 Thr Thr Leu Met Glu Met Lys Ala Tyr His Gln Ile Arg Lys Val Leu 340 345 350 Glu Gly Asn Asn Leu Lys Ala Glu Trp Val Ala Leu Lys Ala Asn Pro 355 360 365 Thr Leu Leu Asp Glu Ile Gly Thr Ala Phe Ser Leu Tyr Lys Thr Asp 370 375 380 Glu Asp Ile Ser Ala Tyr Leu Ala Gly Lys Leu Ser Gln Pro Val Leu 385 390 395 400 Asn Ala Leu Leu Glu Asn Leu Ser Phe Asp Lys Phe Ile Gln Leu Ser 405 410 415 Leu Lys Ala Leu Tyr Lys Leu Leu Pro Leu Met Gln Gln Gly Leu Arg 420 425 430 Tyr Asp Glu Ala Cys Arg Glu Ile Tyr Gly Asp His Tyr Gly Lys Lys 435 440 445 Thr Glu Glu Thr His His Phe Leu Pro Gln Ile Pro Ala Asp Glu Ile 450 455 460 Arg Asn Pro Val Val Leu Arg Thr Leu Thr Gln Ala Arg Lys Val Ile 465 470 475 480 Asn Gly Val Val Arg Leu Tyr Gly Ser Pro Ala Arg Ile His Ile Glu 485 490 495 Thr Gly Arg Glu Val Gly Lys Ser Tyr Lys Asp Arg His Glu Leu Lys 500 505 510 Lys Arg Gln Glu Glu Asn Arg Lys Gln Arg Glu Lys Thr Ile Ser Glu 515 520 525 Ile Lys Thr Leu Phe Pro Asn Phe Ser Gly Glu Pro Lys Gly Lys Asp 530 535 540 Ile Leu Lys Met Arg Leu Tyr Tyr Gln Gln Asn Ala Lys Cys Leu Tyr 545 550 555 560 Ser Gly Lys Pro Leu Glu Leu His Arg Leu Phe Glu Gln Lys Tyr Val 565 570 575 Glu Val Asp His Ala Leu Pro Leu Ser Arg Thr Trp Asp Asp Ser Phe 580 585 590 Asn Asn Lys Val Leu Val Leu Ala Asn Glu Asn Gln Asn Lys Gly Asn 595 600 605 Leu Thr Pro Phe Glu Trp Leu Asp Gly Lys Asn Asn Ser Glu Arg Trp 610 615 620 Arg Thr Phe Lys Ala Leu Val Glu Thr Ser Ala Phe Pro Tyr Ala Lys 625 630 635 640 Lys Gln Arg Ile Leu Ser Gln Lys Leu Asp Glu Lys Gly Phe Ile Glu 645 650 655 Arg Asn Leu Asn Asp Thr Arg Tyr Val Ala Arg Phe Leu Cys Asn Phe 660 665 670 Ile Ala Asp Asn Met His Leu Thr Gly Glu Gly Lys Arg Lys Val Phe 675 680 685 Ala Ser Asn Gly Gln Ile Thr Ala Leu Leu Arg Arg Arg Trp Gly Leu 690 695 700 Ala Lys Ser Arg Glu Asp Asn Asp Arg His His Ala Leu Asp Ala Val 705 710 715 720 Leu Val Ala Cys Ser Thr Val Ala Met Gln Gln Lys Ile Thr Arg Phe 725 730 735 Val Arg Phe Lys Ala Gly Asp Val Phe Thr Gly Glu Arg Ile Asp Arg 740 745 750 Glu Thr Gly Glu Ile Ile Pro Leu His Phe Pro Thr Pro Trp Gln Phe 755 760 765 Phe Lys Gln Glu Val Glu Ile Arg Ile Phe Ser Asp Asn Pro Lys Leu 770 775 780 Glu Leu Glu Asn Arg Leu Pro Asp Arg Pro Gln Ala Asn His Glu Phe 785 790 795 800 Val Gln Pro Leu Phe Val Ser Arg Met Pro Thr Arg Lys Met Thr Gly 805 810 815 Gln Gly His Met Glu Thr Val Lys Ser Ala Lys Arg Leu Asn Glu Gly 820 825 830 Ile Ser Met Ile Lys Met Pro Leu Thr Lys Leu Lys Leu Lys Asp Leu 835 840 845 Glu Leu Met Val Asn Arg Glu Arg Glu Lys Asp Leu Tyr Asp Ala Leu 850 855 860 Lys Thr Arg Leu Glu Ala Phe Asn Asp Asp Pro Ala Lys Ala Phe Ala 865 870 875 880 Glu Pro Phe Met Lys Lys Gly Gly Ala Ile Val Lys Ser Val Arg Val 885 890 895 Glu Gln Val Gln Lys Ser Gly Val Leu Val Arg Gln Gly Asn Gly Val 900 905 910 Ala Asp Asn Ala Ser Met Val Arg Val Asp Val Phe Thr Lys Asp Gly 915 920 925 Lys Tyr Phe Leu Val Pro Ile Tyr Thr Trp Gln Val Ala Lys Gly Ile 930 935 940 Leu Pro Asn Lys Ala Val Ile Gln Gly Lys Asp Glu Glu Asp Trp Glu 945 950 955 960 Asp Ile Asp Asp Ala Thr Phe Gln Phe Ser Leu His Pro Asn Asp Leu 965 970 975 Ile Ser Val Lys Thr Lys Lys Asp Glu Phe Leu Gly Tyr Phe Asn Gly 980 985 990 Leu Asn Arg His Thr Gly Gly Ile Asn Ile Arg Thr His Asp Leu Glu 995 1000 1005 Lys Ser Lys Gly Lys Gln Gly Ile Phe Glu Gly Ile Gly Val Lys 1010 1015 1020 Ile Ala Leu Ser Phe Glu Lys Tyr Gln Ile Asp Glu Leu Gly Lys 1025 1030 1035 Asn Ile Arg Leu Cys Lys Pro Ser Lys Arg Gln Pro Val Arg 1040 1045 1050 <210> 37 <211> 1082 <212> PRT <213> Neisseria meningitidis <400> 37 Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp 1 5 10 15 Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp 20 25 30 Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg 35 40 45 Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu 50 55 60 Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu 65 70 75 80 Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp 85 90 95 Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln 100 105 110 Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser 115 120 125 Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg 130 135 140 Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys 145 150 155 160 Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr 165 170 175 Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile 180 185 190 Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu 195 200 205 Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn 210 215 220 Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met 225 230 235 240 Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly 245 250 255 His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr 260 265 270 Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile 275 280 285 Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr 290 295 300 Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala 305 310 315 320 Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg 325 330 335 Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala 340 345 350 Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys 355 360 365 Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr 370 375 380 Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys 385 390 395 400 Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser 405 410 415 Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val 420 425 430 Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile 435 440 445 Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu 450 455 460 Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala 465 470 475 480 Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly 485 490 495 Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser 500 505 510 Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys 515 520 525 Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe 530 535 540 Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu 545 550 555 560 Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly 565 570 575 Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe 580 585 590 Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly 595 600 605 Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn 610 615 620 Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu 625 630 635 640 Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys 645 650 655 Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr 660 665 670 Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr 675 680 685 Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn 690 695 700 Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp 705 710 715 720 Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala 725 730 735 Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala 740 745 750 Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln 755 760 765 Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met 770 775 780 Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala 785 790 795 800 Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser 805 810 815 Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg 820 825 830 Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys 835 840 845 Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu 850 855 860 Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg 865 870 875 880 Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys 885 890 895 Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys 900 905 910 Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val 915 920 925 Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn 930 935 940 Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr 945 950 955 960 Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp 965 970 975 Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp 980 985 990 Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu 995 1000 1005 Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys 1010 1015 1020 His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp 1025 1030 1035 His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys 1040 1045 1050 Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys 1055 1060 1065 Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg 1070 1075 1080 <210> 38 <211> 338 <212> PRT <213> Homo sapiens <400> 38 Met Gly Lys Lys Gln Asn Arg Lys Thr Gly Asn Ser Lys Thr Gln Ser 1 5 10 15 Ala Ser Pro Pro Pro Lys Glu Arg Ser Ser Ser Pro Ala Thr Glu Gln 20 25 30 Ser Trp Met Glu Asn Asp Phe Asp Glu Leu Arg Glu Glu Gly Phe Arg 35 40 45 Arg Ser Asn Tyr Ser Glu Leu Arg Glu Asp Ile Gln Thr Lys Gly Lys 50 55 60 Glu Val Glu Asn Phe Glu Lys Asn Leu Glu Glu Cys Ile Thr Arg Ile 65 70 75 80 Thr Asn Thr Glu Lys Cys Leu Lys Glu Leu Met Glu Leu Lys Thr Lys 85 90 95 Ala Arg Glu Leu Arg Glu Glu Cys Arg Ser Leu Arg Ser Arg Cys Asp 100 105 110 Gln Leu Glu Glu Arg Val Ser Ala Met Glu Asp Glu Met Asn Glu Met 115 120 125 Lys Arg Glu Gly Lys Phe Arg Glu Lys Arg Ile Lys Arg Asn Glu Gln 130 135 140 Ser Leu Gln Glu Ile Trp Asp Tyr Val Lys Arg Pro Asn Leu Arg Leu 145 150 155 160 Ile Gly Val Pro Glu Ser Asp Val Glu Asn Gly Thr Lys Leu Glu Asn 165 170 175 Thr Leu Gln Asp Ile Ile Gln Glu Asn Phe Pro Asn Leu Ala Arg Gln 180 185 190 Ala Asn Val Gln Ile Gln Glu Ile Gln Arg Thr Pro Gln Arg Tyr Ser 195 200 205 Ser Arg Arg Ala Thr Pro Arg His Ile Ile Val Arg Phe Thr Lys Val 210 215 220 Glu Met Lys Glu Lys Met Leu Arg Ala Ala Arg Glu Lys Gly Arg Val 225 230 235 240 Thr Leu Lys Gly Lys Pro Ile Arg Leu Thr Ala Asp Leu Ser Ala Glu 245 250 255 Thr Leu Gln Ala Arg Arg Glu Trp Gly Pro Ile Phe Asn Ile Leu Lys 260 265 270 Glu Lys Asn Phe Gln Pro Arg Ile Ser Tyr Pro Ala Lys Leu Ser Phe 275 280 285 Ile Ser Glu Gly Glu Ile Lys Tyr Phe Ile Asp Lys Gln Met Leu Arg 290 295 300 Asp Phe Val Thr Thr Arg Pro Ala Leu Lys Glu Leu Leu Lys Glu Ala 305 310 315 320 Leu Asn Met Glu Arg Asn Asn Arg Tyr Gln Pro Leu Gln Asn His Ala 325 330 335 Lys Met <210> 39 <211> 357 <212> PRT <213> Mus sp. <400> 39 Met Ala Lys Gly Lys Arg Lys Asn Pro Thr Asn Arg Asn Gln Asp His 1 5 10 15 Ser Pro Ser Ser Glu Arg Ser Thr Pro Thr Pro Pro Ser Pro Gly His 20 25 30 Pro Asn Thr Thr Glu Asn Leu Asp Pro Asp Leu Lys Thr Phe Leu Met 35 40 45 Met Met Ile Glu Asp Ile Lys Lys Asp Phe His Lys Ser Leu Lys Asp 50 55 60 Leu Gln Glu Ser Thr Ala Lys Glu Leu Gln Ala Leu Lys Glu Lys Gln 65 70 75 80 Glu Asn Thr Ala Lys Gln Val Met Glu Met Asn Lys Thr Ile Leu Glu 85 90 95 Leu Lys Gly Glu Val Asp Thr Ile Lys Lys Thr Gln Ser Glu Ala Thr 100 105 110 Leu Glu Ile Glu Thr Leu Gly Lys Arg Ser Gly Thr Ile Asp Ala Ser 115 120 125 Ile Ser Asn Arg Ile Gln Glu Met Glu Glu Arg Ile Ser Gly Ala Glu 130 135 140 Asp Ser Ile Glu Asn Ile Asp Thr Thr Val Lys Glu Asn Thr Lys Cys 145 150 155 160 Lys Arg Ile Leu Thr Gln Asn Ile Gln Val Ile Gln Asp Thr Met Arg 165 170 175 Arg Pro Asn Leu Arg Ile Ile Gly Ile Asp Glu Asn Glu Asp Phe Gln 180 185 190 Leu Lys Gly Pro Ala Asn Ile Phe Asn Lys Ile Ile Glu Glu Asn Phe 195 200 205 Pro Asn Ile Lys Lys Glu Met Pro Met Ile Ile Gln Glu Ala Tyr Arg 210 215 220 Thr Pro Asn Arg Leu Asp Gln Lys Arg Asn Ser Ser Arg His Ile Ile 225 230 235 240 Ile Arg Thr Thr Asn Ala Leu Asn Lys Asp Arg Ile Leu Lys Ala Val 245 250 255 Arg Glu Lys Gly Gln Val Thr Tyr Lys Gly Arg Pro Ile Arg Ile Thr 260 265 270 Pro Asp Phe Ser Pro Glu Thr Met Lys Ala Arg Arg Ala Trp Thr Asp 275 280 285 Val Ile Gln Thr Leu Arg Glu His Lys Cys Gln Pro Arg Leu Leu Tyr 290 295 300 Pro Ala Lys Leu Ser Ile Thr Ile Asp Gly Glu Thr Lys Val Phe His 305 310 315 320 Asp Lys Thr Lys Phe Thr Gln Tyr Leu Ser Thr Asn Pro Ala Leu Gln 325 330 335 Arg Ile Ile Thr Glu Lys Lys Gln Tyr Lys Asp Gly Asn His Ala Leu 340 345 350 Glu Gln Pro Arg Lys 355 <210> 40 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 41 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Met Thr Leu Asn Ile Glu Asp Glu His Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 42 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Leu Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 43 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ala Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 44 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Arg Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 45 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Lys Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 46 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Ala Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 47 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 47 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Tyr Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 48 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 49 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 49 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu Arg Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 50 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 50 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Glu Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 51 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 51 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asp Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 52 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 52 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Arg Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 53 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 53 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Ile Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 54 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 54 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Leu Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 55 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 55 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Lys Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 56 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 56 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Asn Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 57 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 57 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Leu Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 58 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Gly Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 59 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 59 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Ala Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 60 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 60 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Gly Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 61 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 61 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asn Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 62 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 62 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Asp Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 63 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 63 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Arg Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 64 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 64 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asn Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 65 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 65 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Ser Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 66 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 66 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile Gln Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 67 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 67 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly Gly Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 68 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 68 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 69 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 69 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 70 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 70 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Pro 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 71 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 71 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 72 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 72 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 73 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 73 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Pro 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 74 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 74 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Pro 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 75 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 75 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Leu Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Arg Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu Arg Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Gly Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Ala Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Pro 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 76 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 76 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Arg Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 77 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 77 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Ala 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 78 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 78 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Met 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 79 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 79 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Arg Tyr Ala 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 80 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 80 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Arg Tyr Met 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 81 <211> 677 <212> PRT <213> Murine leukemia virus <400> 81 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Ile Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro 675 <210> 82 <211> 112 <212> PRT <213> Human immunodeficiency virus 2 <400> 82 Met Thr Asp Pro Arg Glu Thr Val Pro Pro Gly Asn Ser Gly Glu Glu 1 5 10 15 Thr Ile Gly Glu Ala Phe Ala Trp Leu Asn Arg Thr Val Glu Ala Ile 20 25 30 Asn Arg Glu Ala Val Asn His Leu Pro Arg Glu Leu Ile Phe Gln Val 35 40 45 Trp Gln Arg Ser Trp Arg Tyr Trp His Asp Glu Gln Gly Met Ser Glu 50 55 60 Ser Tyr Thr Lys Tyr Arg Tyr Leu Cys Ile Ile Gln Lys Ala Val Tyr 65 70 75 80 Met His Val Arg Lys Gly Cys Thr Cys Leu Gly Arg Gly His Gly Pro 85 90 95 Gly Gly Trp Arg Pro Gly Pro Pro Pro Pro Pro Pro Pro Gly Leu Val 100 105 110 <210> 83 <211> 134 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 83 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro Met Thr Asp Pro Arg Glu Thr Val Pro Pro 20 25 30 Gly Asn Ser Gly Glu Glu Thr Ile Gly Glu Ala Phe Ala Trp Leu Asn 35 40 45 Arg Thr Val Glu Ala Ile Asn Arg Glu Ala Val Asn His Leu Pro Arg 50 55 60 Glu Leu Ile Phe Gln Val Trp Gln Arg Ser Trp Arg Tyr Trp His Asp 65 70 75 80 Glu Gln Gly Met Ser Glu Ser Tyr Thr Lys Tyr Arg Tyr Leu Cys Ile 85 90 95 Ile Gln Lys Ala Val Tyr Met His Val Arg Lys Gly Cys Thr Cys Leu 100 105 110 Gly Arg Gly His Gly Pro Gly Gly Trp Arg Pro Gly Pro Pro Pro Pro 115 120 125 Pro Pro Pro Gly Leu Val 130 <210> 84 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 84 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 85 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 85 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Cys Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 86 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 86 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Cys 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 87 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 87 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Cys Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 88 <211> 102 <212> PRT <213> Unknown <220> <223> Description of Unknown: Npu N Intein sequence <400> 88 Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu 1 5 10 15 Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser 20 25 30 Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His 35 40 45 Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser 50 55 60 Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln 65 70 75 80 Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg 85 90 95 Val Asp Asn Leu Pro Asn 100 <210> 89 <211> 35 <212> PRT <213> Unknown <220> <223> Description of Unknown: Npu C Intein sequence <400> 89 Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp 1 5 10 15 Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile 20 25 30 Ala Ser Asn 35 <210> 90 <211> 1292 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 90 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn 20 25 30 Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys 35 40 45 Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn 50 55 60 Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr 65 70 75 80 Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg 85 90 95 Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp 100 105 110 Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp 115 120 125 Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val 130 135 140 Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu 145 150 155 160 Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu 165 170 175 Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu 180 185 190 Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln 195 200 205 Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val 210 215 220 Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu 225 230 235 240 Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe 245 250 255 Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser 260 265 270 Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr 275 280 285 Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr 290 295 300 Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu 305 310 315 320 Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser 325 330 335 Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu 340 345 350 Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile 355 360 365 Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly 370 375 380 Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys 385 390 395 400 Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu 405 410 415 Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile 420 425 430 His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr 435 440 445 Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe 450 455 460 Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe 465 470 475 480 Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe 485 490 495 Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg 500 505 510 Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys 515 520 525 His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys 530 535 540 Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly 545 550 555 560 Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys 565 570 575 Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys 580 585 590 Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser 595 600 605 Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe 610 615 620 Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr 625 630 635 640 Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr 645 650 655 Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg 660 665 670 Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile 675 680 685 Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp 690 695 700 Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 705 710 715 720 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp 725 730 735 Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 740 745 750 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val 755 760 765 Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu 770 775 780 Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys 785 790 795 800 Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu 805 810 815 His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr 820 825 830 Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 835 840 845 Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe 850 855 860 Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys 865 870 875 880 Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys 885 890 895 Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln 900 905 910 Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu 915 920 925 Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln 930 935 940 Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 945 950 955 960 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu 965 970 975 Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 980 985 990 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 995 1000 1005 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1010 1015 1020 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1025 1030 1035 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1040 1045 1050 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1055 1060 1065 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1070 1075 1080 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1085 1090 1095 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1100 1105 1110 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1115 1120 1125 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1130 1135 1140 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1145 1150 1155 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1160 1165 1170 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1175 1180 1185 Arg Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr 1190 1195 1200 Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys 1205 1210 1215 Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro 1220 1225 1230 Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr 1235 1240 1245 Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys 1250 1255 1260 Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe 1265 1270 1275 Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn 1280 1285 1290 <210> 91 <211> 953 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 91 Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp 1 5 10 15 Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile 20 25 30 Ala Ser Asn Cys Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 35 40 45 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr 50 55 60 Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 65 70 75 80 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 85 90 95 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 100 105 110 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr 115 120 125 Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile 130 135 140 Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His 145 150 155 160 Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe 165 170 175 Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr 180 185 190 Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala 195 200 205 Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp 210 215 220 Leu Ser Gln Leu Gly Gly Asp Gly Ser Glu Thr Pro Gly Thr Ser Glu 225 230 235 240 Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Thr 245 250 255 Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro 260 265 270 Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp 275 280 285 Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile 290 295 300 Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro 305 310 315 320 Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu 325 330 335 Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro 340 345 350 Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln 355 360 365 Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val 370 375 380 Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp 385 390 395 400 Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His 405 410 415 Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met 420 425 430 Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys 435 440 445 Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala Asp 450 455 460 Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp 465 470 475 480 Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg 485 490 495 Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys 500 505 510 Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu 515 520 525 Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met 530 535 540 Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly 545 550 555 560 Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala 565 570 575 Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly 580 585 590 Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr 595 600 605 Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe 610 615 620 Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu 625 630 635 640 Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro 645 650 655 Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 660 665 670 Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val 675 680 685 Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp 690 695 700 Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu 705 710 715 720 Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala 725 730 735 Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp 740 745 750 Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro 755 760 765 Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu 770 775 780 Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr Glu 785 790 795 800 Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala 805 810 815 Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys 820 825 830 Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile 835 840 845 His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys 850 855 860 Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe 865 870 875 880 Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly 885 890 895 His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg 900 905 910 Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile Glu 915 920 925 Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu 930 935 940 Phe Glu Pro Lys Lys Lys Arg Lys Val 945 950 <210> 92 <211> 2108 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 92 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn 20 25 30 Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys 35 40 45 Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn 50 55 60 Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr 65 70 75 80 Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg 85 90 95 Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp 100 105 110 Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp 115 120 125 Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val 130 135 140 Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu 145 150 155 160 Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu 165 170 175 Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu 180 185 190 Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln 195 200 205 Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val 210 215 220 Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu 225 230 235 240 Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe 245 250 255 Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser 260 265 270 Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr 275 280 285 Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr 290 295 300 Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu 305 310 315 320 Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser 325 330 335 Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu 340 345 350 Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile 355 360 365 Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly 370 375 380 Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys 385 390 395 400 Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu 405 410 415 Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile 420 425 430 His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr 435 440 445 Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe 450 455 460 Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe 465 470 475 480 Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe 485 490 495 Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg 500 505 510 Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys 515 520 525 His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys 530 535 540 Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly 545 550 555 560 Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys 565 570 575 Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys 580 585 590 Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser 595 600 605 Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe 610 615 620 Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr 625 630 635 640 Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr 645 650 655 Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg 660 665 670 Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile 675 680 685 Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp 690 695 700 Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 705 710 715 720 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp 725 730 735 Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 740 745 750 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val 755 760 765 Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu 770 775 780 Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys 785 790 795 800 Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu 805 810 815 His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr 820 825 830 Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 835 840 845 Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe 850 855 860 Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys 865 870 875 880 Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys 885 890 895 Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln 900 905 910 Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu 915 920 925 Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln 930 935 940 Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 945 950 955 960 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu 965 970 975 Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 980 985 990 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 995 1000 1005 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1010 1015 1020 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1025 1030 1035 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1040 1045 1050 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1055 1060 1065 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1070 1075 1080 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1085 1090 1095 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1100 1105 1110 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1115 1120 1125 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1130 1135 1140 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1145 1150 1155 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1160 1165 1170 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1175 1180 1185 Arg Ser Cys Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1190 1195 1200 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1205 1210 1215 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1235 1240 1245 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1250 1255 1260 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1265 1270 1275 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1280 1285 1290 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1295 1300 1305 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1310 1315 1320 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1325 1330 1335 Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 1340 1345 1350 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1355 1360 1365 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1370 1375 1380 Gly Gly Asp Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr 1385 1390 1395 Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn 1400 1405 1410 Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp 1415 1420 1425 Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp 1430 1435 1440 Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 1445 1450 1455 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 1460 1465 1470 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile 1475 1480 1485 Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 1490 1495 1500 Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp 1505 1510 1515 Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu 1520 1525 1530 Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly 1535 1540 1545 Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp 1550 1555 1560 Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe 1565 1570 1575 Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu 1580 1585 1590 Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu 1595 1600 1605 Phe Asn Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln 1610 1615 1620 His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu 1625 1630 1635 Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu 1640 1645 1650 Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys 1655 1660 1665 Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu 1670 1675 1680 Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 1685 1690 1695 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 1700 1705 1710 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala 1715 1720 1725 Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 1730 1735 1740 Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys 1745 1750 1755 Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr 1760 1765 1770 Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys 1775 1780 1785 Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala 1790 1795 1800 Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro 1805 1810 1815 Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala 1820 1825 1830 Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His 1835 1840 1845 Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser 1850 1855 1860 Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp 1865 1870 1875 Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu 1880 1885 1890 Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile 1895 1900 1905 Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro 1910 1915 1920 Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 1925 1930 1935 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 1940 1945 1950 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala 1955 1960 1965 Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 1970 1975 1980 Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe 1985 1990 1995 Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp 2000 2005 2010 Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu 2015 2020 2025 Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile 2030 2035 2040 His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg Gly 2045 2050 2055 Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu 2060 2065 2070 Thr Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser 2075 2080 2085 Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys 2090 2095 2100 Lys Lys Arg Lys Val 2105 <210> 93 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 93 Met Ala Asp Pro Arg Glu Ile Ile Pro Pro Gly Asn Ser Gly Glu Glu 1 5 10 15 Thr Val Gly Glu Ala Phe Ala Trp Leu Glu Arg Thr Val Glu Ala Ile 20 25 30 Asn Arg Glu Ala Val Asn His Leu Pro Arg Glu Leu Ile Phe Gln Val 35 40 45 Trp Gln Arg Ser Trp Arg Tyr Trp His Asp Glu Gln Gly Met Ser Ser 50 55 60 Ser Tyr Thr Lys Tyr Arg Tyr Leu Cys Leu Met Gln Lys Ala Met Phe 65 70 75 80 Ile His Phe Thr Arg Gly Cys Thr Cys Leu Gly Gly Gly His Gly Pro 85 90 95 Gly Gly Trp Gly Pro Gly Pro Pro Pro Pro Pro Pro Pro Gly Leu Val 100 105 110 <210> 94 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 94 ggtcccatgg tgtaatggtt agcactctgg actttgaatc cagcgatccg agttcaaatc 60 tcggtgggac ct 72 <210> 95 <211> 698 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 95 Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu 1 5 10 15 Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala 20 25 30 Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu 35 40 45 Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr 50 55 60 Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg 65 70 75 80 Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr 85 90 95 Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 100 105 110 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr 115 120 125 Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln 130 135 140 Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 145 150 155 160 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 165 170 175 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 180 185 190 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala 195 200 205 Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp 210 215 220 Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr 225 230 235 240 Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala 245 250 255 Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu 260 265 270 Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val 275 280 285 Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu 290 295 300 Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met 305 310 315 320 Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp 325 330 335 Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 340 345 350 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu 355 360 365 Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys 370 375 380 Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 385 390 395 400 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 405 410 415 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 420 425 430 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro 435 440 445 Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu 450 455 460 Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro 465 470 475 480 Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu 485 490 495 Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln 500 505 510 Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu 515 520 525 Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr 530 535 540 Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg 545 550 555 560 Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys 565 570 575 Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 580 585 590 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly 595 600 605 Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu 610 615 620 Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 625 630 635 640 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 645 650 655 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 660 665 670 Glu Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser 675 680 685 Glu Phe Glu Pro Lys Lys Lys Arg Lys Val 690 695 <210> 96 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 96 tctgtatcta tattcatcat 20 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 97 accattaaag aaaatatcat 20 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 98 ggagaactgg agccttcaga 20 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 99 gaaggtggaa tcacactgag 20 <210> 100 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 100 cttgctcgtt gacctccact 20 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 101 gtttgcagag aaagacaata 20 <210> 102 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 102 aggacatctc caagtttgca 20 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 103 cacctgtggt atcactccaa 20 <210> 104 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 104 caataacttt gcaacagtga 20 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 105 gaaggagaaa tccagatcga 20 <210> 106 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 106 ggtgtcacac tgaagtcctt 20 <210> 107 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 107 aattctgcaa tcctcactct 20 <210> 108 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 108 aggcacctcc agcccagcag 20 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 109 gcagagtacc cacctctcca 20 <210> 110 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 tcttgtagaa gaaagtacca 20 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 111 aagaaagtac caaggaagtg 20 <210> 112 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 112 ttggtgactg ccacgcccaa 20 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 tctggctgtg gtggggactg 20 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 ctctttgtgt tcattgccct 20 <210> 115 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 115 ttgccaagtg ttccagccac 20 <210> 116 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 116 agtccctcaa gtccttccag 20 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 117 gaccctggaa aagctgatga 20 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 118 ggcggctgag gaagctgagg 20 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 119 ggcggcggct gaggaagctg 20 <210> 120 <211> 57 <212> DNA <213> Unknown <220> <223> Description of Unknown: Reference sequence <400> 120 ctctgggcag tgtgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57 <210> 121 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 121 ctctgggcag tgcgagtgca aaaaagaagc aaaaggactt cagtgtgaca cctgcag 57 <210> 122 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 122 ctctgggcag tgtgagtgca aaaaagaagc aaaaggactt cagtgtgaca cctgcag 57 <210> 123 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 123 ctctgggcag tgcgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57 <210> 124 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 124 ctctgggcag tgcgagtgca aaaaagaagc aaaaaggact tcagtgtgac acctgcag 58 <210> 125 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 125 ctctgggcag tgcgagtgca aaaaaagaag caaaaggact tcagtgtgac acctgcag 58 <210> 126 <211> 57 <212> DNA <213> Unknown <220> <223> Description of Unknown: Reference sequence <400> 126 ctctgggcag tgtgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57 <210> 127 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 127 ctctgggcag tgcgagtgca aaaaagaagc aaaaggactt cagtgtgaca cctgcag 57 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 ggtgtcacac tgaagtcctt 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 129 aattctgcaa tcctcactct 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 130 gaaggtggaa tcacactgag 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 131 aagaaagtac caaggaagtg 20 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 132 aggcacctcc agcccagcag 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 133 gcagagtacc cacctctcca 20 <210> 134 <211> 57 <212> DNA <213> Unknown <220> <223> Description of Unknown: Reference sequence <400> 134 ctctgggcag tgtgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57 <210> 135 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 135 ctctgggcag tgcgagtgca aaaaagaagc aaaag 35 <210> 136 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 136 ctctgggcag tgcgagtgca agaaagaagc aaaag 35 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 agtccctcaa gtccttccag 20 <210> 138 <211> 1386 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 138 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn 20 25 30 Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys 35 40 45 Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn 50 55 60 Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr 65 70 75 80 Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg 85 90 95 Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp 100 105 110 Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp 115 120 125 Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val 130 135 140 Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu 145 150 155 160 Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu 165 170 175 Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu 180 185 190 Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln 195 200 205 Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val 210 215 220 Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu 225 230 235 240 Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe 245 250 255 Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser 260 265 270 Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr 275 280 285 Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr 290 295 300 Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu 305 310 315 320 Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser 325 330 335 Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu 340 345 350 Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile 355 360 365 Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly 370 375 380 Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys 385 390 395 400 Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu 405 410 415 Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile 420 425 430 His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr 435 440 445 Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe 450 455 460 Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe 465 470 475 480 Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe 485 490 495 Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg 500 505 510 Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys 515 520 525 His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys 530 535 540 Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly 545 550 555 560 Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys 565 570 575 Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys 580 585 590 Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser 595 600 605 Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe 610 615 620 Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr 625 630 635 640 Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr 645 650 655 Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg 660 665 670 Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile 675 680 685 Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp 690 695 700 Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu 705 710 715 720 Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp 725 730 735 Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys 740 745 750 Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val 755 760 765 Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu 770 775 780 Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys 785 790 795 800 Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu 805 810 815 His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr 820 825 830 Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile 835 840 845 Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe 850 855 860 Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys 865 870 875 880 Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys 885 890 895 Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln 900 905 910 Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu 915 920 925 Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln 930 935 940 Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys 945 950 955 960 Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu 965 970 975 Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys 980 985 990 Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn 995 1000 1005 Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu 1010 1015 1020 Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys 1025 1030 1035 Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys 1040 1045 1050 Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile 1055 1060 1065 Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr 1070 1075 1080 Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe 1085 1090 1095 Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val 1100 1105 1110 Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile 1115 1120 1125 Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp 1130 1135 1140 Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala 1145 1150 1155 Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys 1160 1165 1170 Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu 1175 1180 1185 Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys 1190 1195 1200 Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1205 1210 1215 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala 1220 1225 1230 Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser 1235 1240 1245 Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu 1250 1255 1260 Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu 1265 1270 1275 Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu 1280 1285 1290 Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val 1295 1300 1305 Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln 1310 1315 1320 Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala 1325 1330 1335 Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg 1340 1345 1350 Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln 1355 1360 1365 Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu 1370 1375 1380 Gly Gly Asp 1385 <210> 139 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 139 gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60 ttgaaaaagt ggcaccgagt cggtgc 86 <210> 140 <211> 113 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 140 agcggctgtg cctgcggcgg cggctgagga agctgaggag gcggcggcgg cggcggcggc 60 ggtggcggct gttgctgttg ctgctgttgc tggaaggact tgagggattt ttt 113 <210> 141 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 141 agcggctgtg cctgcggcgg cggctgagga agctgaggag gcggcggcgg cggcggcggc 60 ggtggcggct gttgctgttg ctgctgttgc tggaaggact tgagggaccg ccgcaggcac 120 agccgctttt ttt 133 <210> 142 <211> 4570 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 142 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctctctgg ctaactaccg 600 gtgccaccat gaaacggaca gccgacggaa gcgagttcga gtcaccaaag aagaagcgga 660 aagtcgacaa gaagtacagc atcggcctgg acatcggcac caactctgtg ggctgggccg 720 tgatcaccga cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc 780 ggcacagcat caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg 840 aggccacccg gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct 900 gctatctgca agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca 960 gactggaaga gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg 1020 gcaacatcgt ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa 1080 agaaactggt ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc 1140 acatgatcaa gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg 1200 acgtggacaa gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc 1260 ccatcaacgc cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca 1320 gacggctgga aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggaa 1380 acctgattgc cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg 1440 aggatgccaa actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg 1500 cccagatcgg cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca 1560 tcctgctgag cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct 1620 ctatgatcaa gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc 1680 ggcagcagct gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg 1740 ccggctacat tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc 1800 tggaaaagat ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc 1860 ggaagcagcg gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc 1920 acgccattct gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga 1980 tcgagaagat cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca 2040 gcagattcgc ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg 2100 aagtggtgga caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata 2160 agaacctgcc caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg 2220 tgtataacga gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc 2280 tgagcggcga gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga 2340 ccgtgaagca gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa 2400 tctccggcgt ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa 2460 ttatcaagga caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg 2520 tgctgaccct gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg 2580 cccacctgtt cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg 2640 gcaggctgag ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc 2700 tggatttcct gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg 2760 acagcctgac ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc 2820 tgcacgagca cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga 2880 cagtgaaggt ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg 2940 tgatcgaaat ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga 3000 gaatgaagcg gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc 3060 ccgtggaaaa cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc 3120 gggatatgta cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacg 3180 ctatcgtgcc tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa 3240 gcgacaagaa ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga 3300 agaactactg gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc 3360 tgaccaaggc cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac 3420 agctggtgga aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga 3480 acactaagta cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt 3540 ccaagctggt gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca 3600 actaccacca cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa 3660 agtaccctaa gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga 3720 agatgatcgc caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca 3780 gcaacatcat gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc 3840 ggcctctgat cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt 3900 ttgccaccgt gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg 3960 tgcagacagg cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga 4020 tcgccagaaa gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg 4080 cctattctgt gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg 4140 tgaaagagct gctggggatc accatcatgg aaagaagctg cctgtcctac gagacagaga 4200 tcctgacagt ggagtatggc ctgctgccaa tcggcaagat cgtggagaag aggatcgagt 4260 gtaccgtgta ctctgtggat aacaatggca acatctatac acagcccgtg gcacagtggc 4320 acgatagggg agagcaggag gtgttcgagt attgcctgga ggacggcagc ctgatcaggg 4380 caaccaagga ccacaagttc atgacagtgg atggccagat gctgcccatc gacgagattt 4440 tcgagcggga gctggacctg atgagagtgg ataacctgcc taatccagct gcgaaaagag 4500 tgaaactcga ttaataagaa ttcaataaaa gatctttatt ttcattagat ctgtgtgttg 4560 gttttttgtg 4570 <210> 143 <211> 4483 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 143 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta gtgaaccgtc 600 agatccgcta gagatccgcg gccgctaata cgactcacta tagggagagc cgccaccatg 660 atcaagattg ctacacggaa atacctggga aagcagaacg tgtacgacat cggcgtggag 720 cgggatcaca acttcgccct gaagaatggc tttatcgcca gcaattgttt cgagaagaat 780 cccatcgact ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag 840 ctgcctaagt actccctgtt cgagctggaa aacggccgga agagaatgct ggcctctgcc 900 ggcgaactgc agaagggaaa cgaactggcc ctgccctcca aatatgtgaa cttcctgtac 960 ctggccagcc actatgagaa gctgaagggc tcccccgagg ataatgagca gaaacagctg 1020 tttgtggaac agcacaagca ctacctggac gagatcatcg agcagatcag cgagttctcc 1080 aagagagtga tcctggccga cgctaatctg gacaaagtgc tgtccgccta caacaagcac 1140 cgggataagc ccatcagaga gcaggccgag aatatcatcc acctgtttac cctgaccaat 1200 ctgggagccc ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc 1260 agcaccaaag aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag 1320 acacggatcg acctgtctca gctgggaggt gacggcagcg agacaccagg aacaagcgag 1380 tcagcaacac cagagagcag tggcggcagc agcggcggca gcagcaccct aaatatagaa 1440 gatgagtatc ggctacatga gacctcaaaa gagccagatg tttctctagg gtccacatgg 1500 ctgtctgatt ttcctcaggc ctgggcggaa accgggggca tgggactggc agttcgccaa 1560 gctcctctga tcatactcct gaaagcaacc tctacccccg tgtccataaa acaatacccc 1620 atgcgccaag aagccagact ggggatcaag ccccacatac agagactgtt ggaccaggga 1680 atactggtac cctgccagtc cccctggaac acgcccctgc tacccgttaa gaaaccaggg 1740 actaatgatt ataggcctgt ccaggatctg agagaagtca acaagcgggt ggaagacatc 1800 caccccaccg tgcccaaccc ttacaacctc ttgagcgggc tcccaccgtc ccaccagtgg 1860 tacactgtgc ttgatttaaa ggatgccttt ttctgcctga gactccaccc caccagtcag 1920 cctctcttcg cctttgagtg gagagatcca gagatgggaa tctcaggaca attgacctgg 1980 accagactcc cacagggttt caaaaacagt cccgctctgt ttaatgaggc actgcggaga 2040 gacctagcag acttccggat ccagcaccca gacttgatcc tgctacagta cgtggatgac 2100 ttactgctgg ccgccacttc tgagctagac tgccaacaag gtactcgggc cctgttacaa 2160 accctaggga acctcgggta tcgggcctcg gccaagaaag cccaaatttg ccagaaacag 2220 gtcaagtatc tggggtatct tctaaaagag ggtcagagat ggctgactga ggccagaaaa 2280 gagactgtga tggggcagcc tactccgaag acccctcgac aactaaggga gttcctaggg 2340 aaggcaggct tctgtcgcct cttcatccct gggtttgcag aaatggcagc ccccctgtac 2400 cctctcacca aaccggggac tctgtttaat tggggcccag accaacaaaa ggcctatcaa 2460 gaaatcaagc aagctcttct aactgcccca gccctggggt tgccagattt gactaagccc 2520 tttgaactct ttgtcgacga gaagcagggc tacgccaaag gtgtcctaac gcaaaaactg 2580 ggaccttggc gtcggccggt ggcctacctg tccaaaaagc tagacccagt agcagctggg 2640 tggccccctt gcctacggat ggtagcagcc attgccgtac tgacaaagga tgcaggcaag 2700 ctaaccatgg gacagccact agtcattggc gccccccatg cagtagaggc actagtcaaa 2760 caaccccccg accgctggct ttccaacgcc cggatgactc actatcaggc cttgcttttg 2820 gacacggacc gggtccagtt cggaccggtg gtagccctga acccggctac gctgctccca 2880 ctgcctgagg aagggctgca acacaactgc cttgatatcc tggccgaagc ccacggaacc 2940 cgacccgacc taacggacca gccgctccca gacgccgacc acacctggta cacggccgga 3000 agcagtctct tacaagaggg acagcgtaag gcgggagctg cggtgaccac cgagaccgag 3060 gtaatctggg ctaaagccct gccagccggg acatccgctc agcgggctga actgatagca 3120 ctcacccagg ccctaaagat ggcagaaggt aagaagctaa atgtttatac tgatagccgt 3180 tatgcttttg ctactgccca tatccatgga gaaatataca gaaggcgtgg gtggctcaca 3240 tcagaaggca aagagatcaa aaataaagac gagatcttgg ccctactaaa agccctcttt 3300 ctgcccaaaa gacttagcat aatccattgt ccaggacatc aaaagggaca cagcgccgag 3360 gctagaggca accggatggc taaccaagcg gcccgaaagg cagccatcac agagaaccca 3420 gacacctcta ccctccccat agaaaattca tcaccctctg gcggctcaaa aagaaccgcc 3480 gacggcagcg aattcgagcc caagaagaag aggaaagtcg gaagcggagg atccggcgca 3540 acaaacttct ctctgctgaa acaagccgga gatgtcgaag agaatcctgg accgggaagc 3600 ggaatggccg atccacgaga aatcatccca cctggaaaca gtggagagga gacagttggt 3660 gaagccttcg catggctgga aagaacggtt gaggctatta atcgagaagc ggtcaatcac 3720 ttgccgcgcg aactcatctt tcaagtgtgg caacgatcct ggcggtattg gcacgacgaa 3780 caaggcatga gttctagtta tacaaaatac agatatctct gtctcatgca gaaagccatg 3840 tttatccact tcaccagagg ctgcacatgt ctcgggggcg gacacggacc aggtggatgg 3900 ggccctggac caccacctcc tccaccacct ggacttgttt aagaattcaa taaaagatct 3960 ttattttcat tagatctgtg tgttggtttt ttgtgaacca aaaaaaaaat tctgcaatcc 4020 tcactctgtc acactgaagt ccttttgctt cttttttgca ctcgcactgc ccagagtgag 4080 gattgcagaa tttgcaccga ctcggtgcca ctttttcaag ttgataacgg actagcctta 4140 tttaaacttg ctatgctgtt tccagcatag ctcttaaaca aggacttcag tgtgacaccg 4200 gtgtttcgtc ctttccacaa gatatataaa gccaagaaat cgaaatactt tcaagttacg 4260 gtaagcatat gatagtccat tttaaaacat aattttaaaa ctgcaaacta cccaagaaat 4320 tattactttc tacgtcacgt attttgtact aatatctttg tgtttacagt caaattaatt 4380 ctaattatct ctctaacagc cttgtatcgt atatgcaaat atgaaggaat catgggaaat 4440 aggccctctt cctgcccgac cttggtaccg gatccagtcg act 4483 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 caccctcgtg accaccctga 20

Claims (131)

  1. 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도가 낮고 유전자 편집용 DNA 중합효소를 포함하는 세포에서 유전자 편집 효율을 증가시키는 방법으로서, 상기 방법은:
    기준선 dNTP 농도에 비해 세포에서 dNTP 농도 증가시키는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 세포에서 dNTP 농도를 증가시키는 단계는 세포에서 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제를 억제하는 것을 포함하는, 방법.
  3. 제2항에 있어서, 상기 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제는 SAM 도메인 및 HD 도메인-함유 단백질 1(SAMHD1)을 포함하는, 방법.
  4. 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키거나 세포에서 Vpx 단백질을 발현시키는 것을 포함하는, 방법.
  5. 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 BGLF4 단백질과 접촉시키거나 세포에서 BGLF4 단백질을 발현시키는 것을 포함하는, 방법.
  6. 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키거나, 세포에서 마이크로RNA 또는 siRNA를 발현시키는 것을 포함하는, 방법.
  7. 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함하는, 방법.
  8. 제1항에 있어서, 세포에서 dNTP 농도를 증가시키는 것은 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것을 포함하고, 여기서 뉴클레오시드 또는 뉴클레오티드는 데옥시뉴클레오시드(dN), 데옥시뉴클레오시드 모노포스페이트(dNMP), 또는 뉴클레오시드 트리포스페이트(NTP)를 선택적으로 포함하는, 방법.
  9. 제8항에 있어서, 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것은 세포를 포함하는 대상체에게 뉴클레오시드 또는 뉴클레오티드를 투여하는 것을 포함하는, 방법.
  10. 제9항에 있어서, 상기 투여는 경구 또는 주사에 의한 것인, 방법.
  11. 제1항에 있어서, 상기 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함하는, 방법.
  12. 제11항에 있어서, 상기 dNTP 합성 효소는 키나제를 포함하는, 방법.
  13. 제12항에 있어서, 상기 키나제는 뉴클레오시드 키나제, 데옥시뉴클레오시드 키나제, 데옥시뉴클레오시드 모노포스페이트 키나제, 또는 데옥시뉴클레오티드 디포스페이트 키나제를 포함하는, 방법.
  14. 제1항에 있어서, 상기 DNA 중합효소는 역전사효소를 포함하는, 방법.
  15. 제1항에 있어서, 상기 세포는 Cas9 프로그램가능한 뉴클레아제, 가이드 핵산, 또는 이의 조합을 추가로 포함하는, 방법.
  16. 제1항에 있어서, 낮은 dNTP 농도는 비분열 세포에서 발견되는 dNTP 농도를 포함하는, 방법.
  17. 제1항에 있어서, 낮은 dNTP 농도는 활성화된 말초 혈액 단핵 세포에서 발견되는 dNTP 농도 미만인, 방법.
  18. 제1항에 있어서, 낮은 dNTP 농도는 1 마이크로몰 미만의 dNTP 농도를 포함하는, 방법.
  19. 제1항에 있어서, 상기 dNTP 농도를 증가시키는 것은 dNTP 농도를 기준선 dNTP 측정에 비해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 또는 그 초과로 증가시키는 것을 포함하는, 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 dNTP 농도는 데옥시아데노신 트리포스페이트(dATP) 농도, 데옥시시티딘 트리포스페이트(dCTP) 농도, 데옥시구아노신 트리포스페이트(dGTP) 농도, 또는 데옥시티미딘 트리포스페이트(dTTP) 농도, 또는 이의 임의의 조합을 포함하는, 방법.
  21. Cas 닉카제 및 역전사효소를 포함하는 조성물로서, 상기 Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함되고, 상기 Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성하는, 조성물.
  22. 제21항에 있어서, 상기 Cas-역전사효소 이종이량체는 Cas 닉카제에 융합된 제1 이종이량체 도메인 및 역전사효소에 융합된 제2 이종이량체 도메인을 포함하고, 여기서 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합하여 Cas-역전사효소 이종이량체를 형성하는, 조성물.
  23. 제22항에 있어서, 상기 제1 이종이량체 도메인은 류신 지퍼이고 제2 이종이량체 도메인은 류신 지퍼인, 조성물.
  24. 제21항 내지 제23항 중 어느 한 항에 있어서, 상기 역전사효소는 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80, 또는 이의 단편 중 임의의 하나에 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 조성물.
  25. 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 역전사효소는 Cas 닉카제의 일부에 융합된 비-장(long) 말단 반복 역전사성 요소로부터의 도메인을 포함하는, 조성물.
  26. 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 역전사효소는 Cas 닉카제의 일부에 융합된 박테리아 그룹 II 인트론으로부터의 서열을 포함하는, 조성물.
  27. 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 역전사효소는 Cas 닉카제의 일부에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는, 조성물.
  28. Cas 닉카제, 역전사효소, 및 가이드 핵산을 포함하는 조성물로서, 여기서 제1 폴리펩티드는 Cas 닉카제를 포함하고 제2 폴리펩티드는 역전사효소를 포함하고 가이드 핵산은 Cas 닉카제 및 역전사효소에 결합하는, 조성물.
  29. 제21항 내지 제28항 중 어느 한 항에 있어서, 상기 역전사효소는 mcp 펩티드를 포함하는, 조성물.
  30. 제21항 내지 제29항 중 어느 한 항에 있어서, 상기 역전사효소는 루프 영역을 포함하는, 조성물.
  31. 제30항에 있어서, 상기 루프 영역은 2a 루프 또는 3a 루프인, 조성물.
  32. 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 가이드 핵산은 MS2 헤어핀을 포함하는, 조성물.
  33. Cas 닉카제에 융합된 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 가지는 서열을 갖는 역전사효소를 포함하는 조성물.
  34. Cas 닉카제에 융합된 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물.
  35. Cas 닉카제에 융합된 박테리아 그룹 II 인트론으로부터의 서열을 포함하는 역전사효소를 포함하는 조성물.
  36. Cas 닉카제에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물.
  37. Cas 닉카제 및 역전사효소를 포함하는 조성물로서, 상기 Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제 및 역전사효소는 이종이량체화되도록 조작되지 않은, 조성물.
  38. 제21항 내지 제37항 중 어느 한 항에 있어서, 상기 Cas 닉카제와 복합체를 형성하는 가이드 핵산을 포함하고, 여기서 복합체 형성시, Cas 닉카제는 표적 핵산의 표적 부위에 단일-가닥 파손을 도입할 수 있는, 조성물.
  39. 제21항 내지 제38항 중 어느 한 항에 있어서, 상기 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함하는, 조성물.
  40. 제21항 내지 제39항 중 어느 한 항에 있어서, 상기 Cas 닉카제 또는 역전사효소에 융합된 핵 국소화 신호를 포함하는, 조성물.
  41. 제21항 내지 제40항 중 어느 한 항에 있어서, 상기 역전사효소는 절삭된 역전사효소인, 조성물.
  42. 제21항 내지 제41항 중 어느 한 항에 있어서, 상기 역전사효소는 천연 역전사효소와 비교하여 증가된 연속성을 갖는, 조성물.
  43. 제21항 내지 제42항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 증가된 연속성을 갖는, 조성물.
  44. 제21항 내지 제43항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 표적 서열에서 더 긴 윈도우 길이를 편집하는, 조성물.
  45. 제21항 내지 제44항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 감소된 면역원성을 갖는, 조성물.
  46. 제21항 내지 제45항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 세포로의 개선된 전달을 갖는, 조성물.
  47. 제21항 내지 제46항 중 어느 한 항에 있어서, 상기 역전사효소는 단일 결합 이벤트에서 20개 이상, 40개 이상, 45개 이상, 50개 이상, 60개 이상, 81개 이상, 100개 이상, 500개 이상, 또는 1000개 이상의 뉴클레오티드를 중합하는, 조성물.
  48. 가이드 핵산으로서,
    표적 핵산의 제1 영역에 역상보적인 스페이서,
    Cas 닉카제에 결합하도록 구성된 스캐폴드,
    표적 핵산 내로 삽입되는 서열을 인코딩하는 역전사효소 주형, 및
    표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위를 포함하는, 가이드 핵산.
  49. 제48항에 있어서, 상기 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머를 추가로 포함하는, 가이드 핵산.
  50. 제48항 또는 제49항에 있어서, 상기 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있는, 가이드 핵산.
  51. 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적인, 가이드 핵산.
  52. 제48항 내지 제51항 중 어느 한 항에 있어서, 상기 가이드 핵산의 3' 말단에 절단가능한 서열을 추가로 포함하는, 가이드 핵산.
  53. 제52항에 있어서, 상기 절단가능한 서열은 리보자임 절단가능한 서열인, 가이드 핵산.
  54. 제52항에 있어서, 상기 절단가능한 서열은 tRNA 절단가능한 서열인, 가이드 핵산.
  55. 제48항 내지 제54항 중 어느 한 항에 있어서, 상기 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성되고, 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터 역전사를 위한 주형으로 작용하도록 구성되는, 가이드 핵산.
  56. 제48항 내지 제55항 중 어느 한 항에 있어서, 상기 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터 전사를 위한 프라이머로서 작용하도록 구성되는, 가이드 핵산.
  57. 제48항 내지 제56항 중 어느 한 항에 있어서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로서 작용하는, 가이드 핵산.
  58. 제48항 내지 제57항 중 어느 한 항에 있어서, 벨크로 결합 부위에 혼성화하는 벨크로 영역을 추가로 포함하는, 가이드 핵산.
  59. 제58항에 있어서, 상기 벨크로 결합 부위는 벨크로 영역에 대해 100% 역상보적이고; 여기서 벨크로 결합 부위는 벨크로 영역에 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 역상보적이고/이거나; 여기서 벨크로 결합 부위는 벨크로 영역에 대해 55% 이하, 60% 이하, 65% 이하, 70% 이하, 75% 이하, 80% 이하, 85% 이하, 90% 이하, 91% 이하, 92% 이하, 93% 이하, 94% 이하, 95% 이하, 96% 이하, 97% 이하, 98% 이하, 99% 이하 역상보적인, 가이드 핵산.
  60. 제58항 또는 제59항에 있어서, 상기 역전사효소 주형 영역은 벨크로 결합 부위를 포함하는, 가이드 핵산.
  61. 제58항 또는 제59항에 있어서, 상기 벨크로 결합 부위는 제1 가닥 프라이머 결합 부위의 3'인, 가이드 핵산.
  62. 제48항 내지 제61항 중 어느 한 항에 있어서, 상기 벨크로 영역은 역전사효소 주형의 3'인, 가이드 핵산.
  63. 제48항 내지 제62항 중 어느 한 항에 있어서, 상기 벨크로 영역은 스캐폴드의 5'인, 가이드 핵산.
  64. 제48항 내지 제63항 중 어느 한 항에 있어서, 상기 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함하는, 가이드 핵산.
  65. 제48항 내지 제64항 중 어느 한 항에 있어서, 상기 스페이서는 서열번호: 96-119 중 임의의 하나에 적어도 85% 동일한 핵산 서열을 포함하는, 가이드 핵산.
  66. 제28항 내지 제32항 또는 제37항 내지 제65항 중 어느 한 항의 가이드를 포함하는 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물.
  67. 제66항에 있어서, 상기 제2 가이드 핵산은 제28항, 제32항 또는 제37항 또는 제48항 내지 제65항 중 어느 한 항의 가이드 핵산을 포함하는, 조성물.
  68. 제67항에 있어서, 상기 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형의 적어도 일부에 상보적인 (또는 적어도 부분적으로 상보적인), 조성물.
  69. 제66항 내지 제68항 중 어느 한 항에 있어서, 상기 제1 가이드 핵산은 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산은 제2 Cas 닉카제에 결합하는, 조성물.
  70. 제66항 내지 제68항 중 어느 한 항에 있어서, 상기 제1 가이드 핵산의 제1 스페이서는 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스페이서는 제2 Cas 닉카제에 결합하고, 제1 가이드 핵산의 제1 스캐폴드는 제2 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스캐폴드는 제1 Cas 닉카제에 결합하는, 조성물.
  71. 제66항 내지 제68항 또는 제70항 중 어느 한 항에 있어서, 상기 제1 가이드 핵산은 제1 링커를 포함하고 제2 가이드 핵산은 제2 링커를 포함하고, 상기 제1 링커는 제2 링커에 혼성화하는, 조성물.
  72. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물 또는 제38항 내지 제45항 중 어느 한 항의 가이드 핵산을 발현하는 세포에 Orf1p를 전달하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법.
  73. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물을 인코딩하거나, 또는 제48항 내지 제65항 중 어느 한 항의 가이드 핵산을 포함하는 하나 이상의 핵산.
  74. 제73항의 핵산을 포함하는 바이러스 벡터.
  75. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물, 제48항 내지 제65항 중 어느 한 항의 가이드 핵산, 제73항의 핵산, 또는 제74항의 바이러스 벡터를 포함하는 세포.
  76. 제72항 또는 제75항에 있어서, 세포는 원핵 세포인, 방법 또는 세포.
  77. 제72항 또는 제75항에 있어서, 세포는 진핵 세포인, 방법 또는 세포.
  78. 세포에서 Vpx 단백질을 발현시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법.
  79. 제78항에 있어서, 세포는 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물 또는 제48항 내지 제65항 중 어느 한 항의 가이드 핵산을 발현하는, 방법.
  80. 세포에서 dNTP 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법으로서, 예를 들어 세포에서 SAMHD1을 억제하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법.
  81. 제80항에 있어서, 세포는 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 발현하는, 방법.
  82. 제80항 또는 제81항에 있어서, SAMHD1을 억제하는 것은 세포에서 Vpx 단백질을 발현시키는 것을 포함하는, 방법.
  83. 제80항 또는 제81항에 있어서, SAMHD1을 억제하는 것은 세포에서 SAMHD1에 대한 마이크로RNA를 발현시키는 것을 포함하거나, 세포를 소분자 SAMHD1 억제제로 처리하는 것을 포함하는, 방법.
  84. 인테인 촉매작용을 가능하게 하거나 개선하는 하나 이상의 점 돌연변이 또는 삽입 돌연변이를 포함하는 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물.
  85. 제84항에 있어서, Cas9 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제의 C-말단 절반에 위치된 점 돌연변이 또는 삽입 돌연변이를 포함하거나, 또는 점 돌연변이 또는 삽입 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 아미노산 위치 574 후의 임의의 곳에 위치되는, 조성물.
  86. 제85항에 있어서, 점 돌연변이는 시스테인 점 돌연변이, 세린 점 돌연변이, 트레오닌 점 돌연변이, 또는 알라닌 점 돌연변이를 포함하거나; 또는 삽입 돌연변이는 시스테인 삽입 돌연변이, 세린 삽입 돌연변이, 트레오닌 삽입 돌연변이, 또는 알라닌 삽입 돌연변이를 포함하는, 조성물.
  87. 제85항에 있어서, 점 돌연변이는 시스테인 점 돌연변이를 포함하거나, 또는 삽입 돌연변이는 시스테인 삽입 돌연변이를 포함하는, 조성물.
  88. 제84항 내지 제87항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 Cas9 닉카제인, 조성물.
  89. 제84항 내지 제88항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 S. 피오게네스 Cas9인, 조성물.
  90. 제89항에 있어서, 점 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 위치되거나, 또는 삽입 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류에 위치되는, 조성물.
  91. 제84항 내지 제90항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나의 서열을 포함하는, 조성물.
  92. 제84항 내지 제91항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 2개 이상의 분절로 발현되는, 조성물.
  93. 제92항에 있어서, 2개 이상의 분절 중 제1 분절은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분 및 제1 인테인을 포함하고, 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분 및 제2 인테인을 포함하는, 조성물.
  94. 제93항에 있어서, 시스테인 점 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 위치되는, 조성물.
  95. 제93항 또는 제94항에 있어서, 제1 인테인은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분의 C-말단에 융합되고, 제2 인테인은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 융합되는, 조성물.
  96. 제93항 내지 제95항 중 어느 한 항에 있어서, 제1 분절은 서열번호: 90의 서열을 포함하고, 제2 분절은 서열번호: 91의 서열을 포함하는, 조성물.
  97. 제93항 내지 제96항 중 어느 한 항에 있어서, 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분에 융합된 역전사효소를 포함하는, 조성물.
  98. 제97항에 있어서, 역전사효소는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 C-말단에 융합된 N-말단을 포함하는, 조성물.
  99. 제97항 또는 제98항에 있어서, 역전사효소는 mlvRT 또는 이의 변이체를 포함하는, 조성물.
  100. 낮은 dNTP 농도에서 그 촉매적 효율을 증가시키도록 변형된(예를 들어, dNTP에 대한 그 Km을 감소시키도록 변형된) 몰로니 백혈병 바이러스 역전사효소(mlvRT)로 게놈 편집을 수행하는 것을 포함하는, 게놈 편집 효율을 최적화하는 방법.
  101. 역전사효소의 위치 221 또는 223에서 점 돌연변이를 포함하는, 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체로 게놈 편집을 수행하는 것을 포함하는, 제한적 dNTP 상태에서 게놈 편집 효율을 최적화하는 방법.
  102. 제100항 또는 제101항에 있어서, mlvRT 또는 이의 변이체는 위치 221에서 점 돌연변이를 포함하는, 방법.
  103. 제102항에 있어서, 위치 221에서 점 돌연변이는 Q221R을 포함하는, 방법.
  104. 제100항 또는 제101항에 있어서, mlvRT 또는 이의 변이체는 위치 223에서 점 돌연변이를 포함하는, 방법.
  105. 제104항에 있어서, 위치 223에서 점 돌연변이는 V223A를 포함하는, 방법.
  106. 제104항에 있어서, 위치 223에서 점 돌연변이는 V223M을 포함하는, 방법.
  107. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524에서 점 돌연변이를 포함하는, 방법.
  108. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A를 포함하는 점 돌연변이를 포함하는, 조성물.
  109. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 포함하는, 조성물.
  110. 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A를 포함하는 점 돌연변이를 포함하는, 조성물.
  111. 제21항 내지 제47항 중 어느 한 항에 있어서, Cas 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩되는, 조성물.
  112. 제111항의 폴리뉴클레오티드를 포함하는 AAV.
  113. 제112항에 있어서, Cas 닉카제 및 RT의 적어도 일부는 별도의 AAV에 포괄되는, AAV.
  114. 아데노-연관된 바이러스(AAV)로서, Cas 닉카제의 적어도 일부를 인코딩하는 제1 폴리뉴클레오티드를 포함하는 제1 AAV, 및 역전사효소를 인코딩하는 제2 폴리뉴클레오티드를 포함하는 제2 AAV를 포함하는, AAV.
  115. 제112항 내지 제114항 중 어느 한 항에 있어서, AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB, 또는 AAV-PHP.S, 또는 이의 조합을 포함하는, AAV.
  116. 제114항 또는 제115항에 있어서, Cas 닉카제 및 역전사효소는 서로 이종이량체를 형성하는, AAV.
  117. 제114항 내지 제116항 중 어느 한 항에 있어서, 제1 또는 제2 폴리뉴클레오티드는 Cas 닉카제 및 역전사효소에 결합하여 복합체를 형성하는 가이드 핵산을 추가로 인코딩하고, 여기서 복합체의 Cas 닉카제는 표적 핵산 내 표적 부위에서 단일-가닥 파손을 도입하는, AAV.
  118. 제114항 내지 제117항 중 어느 한 항에 있어서, Cas 닉카제는 S. 피오게네스 Cas9 닉카제와 같은 Cas9 닉카제를 포함하고, 역전사효소는 mlvRT 또는 이의 변이체를 포함하고, 여기서 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204 또는 D524에서 점 돌연변이를 포함하는, AAV.
  119. 제118항에 있어서, 점 돌연변이는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204A, 또는 D524A를 포함하는, AAV.
  120. 제114항 내지 제119항 중 어느 한 항에 있어서, Cas9 닉카제는 S. 피오게네스 Cas9 닉카제를 포함하고, 역전사효소는 mlvRT 또는 이의 변이체를 포함하고, 여기서 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204 또는 D524의 바로 상류에 삽입 돌연변이를 포함하는, AAV.
  121. 제114항 내지 제120항 중 어느 한 항의 제1 또는 제2 AAV를 포함하는 조성물을 대상체 또는 세포에 투여하는 것을 포함하는, 게놈 편집 방법.
  122. 제112항 내지 제120항 중 어느 한 항의 AAV를 포함하는 조성물을 대상체 또는 세포에 투여하는 것을 포함하는, 게놈 편집 방법.
  123. 제121항 또는 제122항에 있어서, 대상체 또는 세포에서 게놈 편집을 측정하는 것을 추가로 포함하는, 방법.
  124. 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도가 낮은 세포에서 유전자 편집 효율을 증가시키는 방법으로서,
    낮은 dNTP 농도에서 효율적인 촉매작용을 위해 변형된 유전자 편집 효소와 세포를 접촉시키거나, 세포에서 유전자 편집 효소를 발현시키는 것을 포함하는, 방법.
  125. 제124항에 있어서, 유전자 편집 효소는 위치 Q84, L139, Q221, V223, T664 또는 L671에 점 돌연변이를 도입함에 의해 변형된 역전사효소를 포함하는, 방법.
  126. 개선된 역전사효소(RT)를 스크리닝 또는 식별하는 방법으로서,
    세포에서, SAMHD1을 과발현하거나 또는 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현시키는 단계;
    세포에서 RT 활성을 식별하는 단계; 및
    RT 활성에 기반하여, RT를 개선된 RT로 식별하는 단계를 포함하는, 방법.
  127. 스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA 또는 폴리뉴클레오티드를 포함하는 시스템으로서, 여기서 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산의 영역의 임의의 부분을 포함하지 않는 핵산에 결합하는, 시스템.
  128. 시스템으로서,
    표적 핵산의 제1 영역에 역상보적인 스페이서;
    Cas 뉴클레아제에 결합하도록 구성된 스캐폴드;
    표적 핵산 안에 삽입되는 서열을 인코딩하는 역전사효소 주형;
    제1 영역의 임의의 부분을 포함하지 않고, 제1 영역의 역 상보체의 임의의 부분을 포함하지 않는 표적 핵산의 영역에 결합하는 제1 가닥 프라이머 결합 부위; 및
    제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역:
    을 포함하는 제1 가이드 핵산을 포함하는 시스템.
  129. 제128항에 있어서, GPS 결합 부위를 포함하는 제2 가이드 핵산을 추가로 포함하는, 시스템.
  130. 제129항에 있어서, 제2 가이드 핵산은 표적 핵산의 다른 영역에 역상보적인 제2 스페이서를 포함하는, 시스템.
  131. 제129항 또는 제130항에 있어서, 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 매우 근접하게 가져오는, 시스템.
KR1020227035994A 2020-03-19 2021-03-18 지시된 게놈 편집을 위한 방법 및 조성물 KR20230003467A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202062992032P 2020-03-19 2020-03-19
US62/992,032 2020-03-19
US202063055829P 2020-07-23 2020-07-23
US63/055,829 2020-07-23
US202163153161P 2021-02-24 2021-02-24
US63/153,161 2021-02-24
PCT/US2021/023041 WO2021188840A1 (en) 2020-03-19 2021-03-18 Methods and compositions for directed genome editing

Publications (1)

Publication Number Publication Date
KR20230003467A true KR20230003467A (ko) 2023-01-06

Family

ID=77747638

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227035994A KR20230003467A (ko) 2020-03-19 2021-03-18 지시된 게놈 편집을 위한 방법 및 조성물

Country Status (8)

Country Link
US (4) US11193123B2 (ko)
EP (1) EP4121522A1 (ko)
JP (1) JP2023518395A (ko)
KR (1) KR20230003467A (ko)
CN (1) CN115667505A (ko)
AU (1) AU2021236683A1 (ko)
MX (1) MX2022011562A (ko)
WO (1) WO2021188840A1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
CN115667505A (zh) 2020-03-19 2023-01-31 因特利亚治疗公司 用于定向基因组编辑的方法和组合物
KR20230019843A (ko) * 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
WO2022087235A1 (en) 2020-10-21 2022-04-28 Massachusetts Institute Of Technology Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
CA3231677A1 (en) * 2021-09-08 2023-03-16 Flagship Pioneering Innovations Vi, Llc Methods and compositions for modulating a genome
WO2023060256A1 (en) * 2021-10-08 2023-04-13 The General Hospital Corporation Improved crispr prime editors
CA3235826A1 (en) * 2021-10-21 2023-04-27 Wei Hsi Yeh Genome editing compositions and methods for treatment of usher syndrome type 3
WO2023086834A1 (en) * 2021-11-12 2023-05-19 Replace Therapeutics, Inc. Direct replacement genome editing
US11866728B2 (en) 2022-01-21 2024-01-09 Renagade Therapeutics Management Inc. Engineered retrons and methods of use
WO2023245108A2 (en) 2022-06-16 2023-12-21 Intellia Therapeutics, Inc. Compositions and methods for reducing mhc class i in a cell
CN115029374B (zh) * 2022-06-24 2023-12-26 安徽省农业科学院水稻研究所 一种用于骨干载体的pegRNA表达框及相应骨干载体和应用
WO2024020346A2 (en) 2022-07-18 2024-01-25 Renagade Therapeutics Management Inc. Gene editing components, systems, and methods of use
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69923274T2 (de) * 1998-10-12 2006-03-30 Roche Diagnostics Gmbh Deoxynukleotidtriphosphatkinase aus Insektenzellen zur Synthese von Nukleosidmonophosphaten
GB0806562D0 (en) * 2008-04-10 2008-05-14 Fermentas Uab Production of nucleic acid
US8603797B2 (en) 2010-03-17 2013-12-10 Cornell University Methods and compositions for targeted mutagenesis in bacteria
FR2973040B1 (fr) * 2011-03-23 2016-04-15 Centre Nat De La Rech Scient (C N R S) Methode de criblage de composes antiretroviraux et vaccin
US9161995B2 (en) 2011-07-25 2015-10-20 Sangamo Biosciences, Inc. Methods and compositions for alteration of a cystic fibrosis transmembrane conductance regulator (CFTR) gene
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
ES2901396T3 (es) * 2013-03-14 2022-03-22 Caribou Biosciences Inc Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico
WO2014186686A2 (en) 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
WO2015021426A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. A crispr/cas system-based novel fusion protein and its application in genome editing
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
US9963687B2 (en) 2014-08-27 2018-05-08 New England Biolabs, Inc. Fusion polymerase and method for using the same
WO2016036754A1 (en) 2014-09-02 2016-03-10 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification
KR102630014B1 (ko) * 2014-10-01 2024-01-25 더 제너럴 하스피탈 코포레이션 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법
EP3294879A4 (en) 2015-05-14 2019-02-20 University of Southern California OPTIMIZED GENETIZATION WITH A RECOMBINANT ENDONUCLEASE SYSTEM
EP3334823B1 (en) 2015-06-05 2024-05-22 The Regents of The University of California Method and kit for generating crispr/cas guide rnas
MX2017016425A (es) * 2015-06-17 2018-12-11 Univ Columbia Terapia con desoxinucleosidos para enfermedades generadas por grupos de nucleotidos desequilibrados, inclusive sindromes de agotamiento del adn mitocondrial.
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
IL258821B (en) 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
EP3163302A1 (en) * 2015-11-02 2017-05-03 Johann Wolfgang Goethe-Universität Frankfurt am Main Samhd1 modulation for treating resistance to cancer therapy
WO2017106616A1 (en) 2015-12-17 2017-06-22 The Regents Of The University Of Colorado, A Body Corporate Varicella zoster virus encoding regulatable cas9 nuclease
WO2017151719A1 (en) 2016-03-01 2017-09-08 University Of Florida Research Foundation, Incorporated Molecular cell diary system
EP3426353A4 (en) * 2016-03-09 2020-05-06 The University of Massachusetts USE OF MODIFIED HIV-1 TO GENERATE FULLY HUMAN ANTIBODIES
US20200263190A1 (en) 2016-04-19 2020-08-20 The Broad Institute, Inc. Novel crispr enzymes and systems
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
EP3510151A4 (en) * 2016-09-09 2020-04-15 The Board of Trustees of the Leland Stanford Junior University HIGH-THROUGHPUT PRECISION GENE EDITING
CN110249046A (zh) * 2016-12-05 2019-09-17 朱诺治疗学股份有限公司 用于过继细胞疗法的工程化细胞的产生
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2019051097A1 (en) 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
US11352611B2 (en) * 2017-10-03 2022-06-07 Board Of Regents, The University Of Texas System Non-LTR-retroelement reverse transcriptase and uses thereof
EP3820995A1 (en) * 2018-07-10 2021-05-19 Alia Therapeutics S.R.L. Vesicles for traceless delivery of guide rna molecules and/or guide rna molecule/rna-guided nuclease complex(es) and a production method thereof
WO2020047124A1 (en) * 2018-08-28 2020-03-05 Flagship Pioneering, Inc. Methods and compositions for modulating a genome
US20210301274A1 (en) * 2018-09-07 2021-09-30 Beam Therapeutics Inc. Compositions and Methods for Delivering a Nucleobase Editing System
WO2020191153A2 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN115667505A (zh) 2020-03-19 2023-01-31 因特利亚治疗公司 用于定向基因组编辑的方法和组合物

Also Published As

Publication number Publication date
AU2021236683A1 (en) 2022-11-17
CN115667505A (zh) 2023-01-31
MX2022011562A (es) 2022-12-13
US20210292753A1 (en) 2021-09-23
JP2023518395A (ja) 2023-05-01
US20230076357A1 (en) 2023-03-09
US20210292769A1 (en) 2021-09-23
US20220090064A1 (en) 2022-03-24
EP4121522A1 (en) 2023-01-25
WO2021188840A1 (en) 2021-09-23
US11193123B2 (en) 2021-12-07
US11352623B2 (en) 2022-06-07

Similar Documents

Publication Publication Date Title
KR20230003467A (ko) 지시된 게놈 편집을 위한 방법 및 조성물
US20240035049A1 (en) Methods and compositions for modulating a genome
JP6954890B2 (ja) ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法及び組成物
US20240076698A1 (en) Methods and compositions for modulating a genome
US20230242899A1 (en) Methods and compositions for modulating a genome
TW202028461A (zh) 核酸構築體及使用方法
CN113631708A (zh) 编辑rna的方法和组合物
EP3443088A1 (en) Grna fusion molecules, gene editing systems, and methods of use thereof
EP3116997A1 (en) Crispr/cas-related methods and compositions for treating leber&#39;s congenital amaurosis 10 (lca10)
CN113939591A (zh) 编辑rna的方法和组合物
TW202027799A (zh) 用於表現因子ix的組成物及方法
CN114207130A (zh) 用于从白蛋白基因座进行转基因表达的组合物和方法
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
JP2024515936A (ja) Cas酵素を用いたマルチプレックス編集
WO2020006708A1 (en) Compositions and methods for enhancement of homology-directed repair mediated precise gene editing by programming dna repair with a single rna-guided endonuclease
US20240082429A1 (en) Pah-modulating compositions and methods
JP2023542705A (ja) 核酸塩基編集のためのジンクフィンガー融合タンパク質
CA3234834A1 (en) Improved crispr prime editors