KR20230003467A - 지시된 게놈 편집을 위한 방법 및 조성물 - Google Patents
지시된 게놈 편집을 위한 방법 및 조성물 Download PDFInfo
- Publication number
- KR20230003467A KR20230003467A KR1020227035994A KR20227035994A KR20230003467A KR 20230003467 A KR20230003467 A KR 20230003467A KR 1020227035994 A KR1020227035994 A KR 1020227035994A KR 20227035994 A KR20227035994 A KR 20227035994A KR 20230003467 A KR20230003467 A KR 20230003467A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- reverse transcriptase
- composition
- region
- guide nucleic
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/12—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
- C12N2310/122—Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/12—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
- C12N2310/123—Hepatitis delta
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/12—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
- C12N2310/128—Type of nucleic acid catalytic nucleic acids, e.g. ribozymes processing or releasing ribozyme
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
- C12N2320/53—Methods for regulating/modulating their activity reducing unwanted side-effects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Compositions Of Macromolecular Compounds (AREA)
- Saccharide Compounds (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
표적 핵산의 편집 효율을 증가시키기 위한 조성물 및 방법이 본 명세서에 제공된다. 조성물은 가이드 핵산, Cas9 닉카제, 또는 역전사효소를 포함할 수 있다. 역전사효소는 Cas9 닉카제에 융합될 수 있다. 역전사효소는 Cas9 닉카제와 이종이량체화될 수 있다. 역전사효소는 가이드 핵산에 결합할 수 있다. 역전사효소는 연속성을 증가시키도록 조작될 수 있다. 가이드 핵산은 서열의 합성 또는 편집을 용이하게 하도록 조작될 수 있다. 가이드 핵산, Cas9 닉카제 및 역전사효소는 AAV 벡터 내에 맞도록 조작될 수 있다. 가이드 핵산은 유전자 편집을 개선하기 위해 가이드 핵산 상의 다른 영역에 결합하는 영역을 포함할 수 있다.
Description
교차-참조
본 출원은 2020년 3월 19일에 출원된 미국 가출원 번호 62/992,032, 2020년 7월 23일에 출원된 미국 가출원 번호 63/055,829 및 2021년 2월 24일에 출원된 미국 가출원 번호 63/153,161의 이익을 주장하며, 이들 모두는 그 전체가 참고로 본 명세서에 포함된다.
서열 목록의 참조에 의한 통합
본 출원은 ASCII 형식으로 전자적으로 제출되었고 이에 의해 그 전체가 참고로 포함되는 서열 목록을 함유한다. 2021년 3월 16일에 생성된 상기 ASCII 사본은 56385-701_601_SL.txt로 명명되고 크기는 609,554바이트이다.
표적 핵산에 이중-가닥 파손을 도입하는 Cas-지향된 게놈 편집 기술은 종종 p53의 서열 전위, 삽입, 결실, 및 DNA 손상 복구, 세포 주기 정지 또는 세포자멸 기능의 활성화를 포함한 바람직하지 않은 생성물을 초래한다. 단일-가닥 파손을 도입하는 편집 기술은 허용되는 돌연변이의 유형 및 크기에서 제한될 수 있거나 편집 효율성이 제한될 수 있다. 개선된 정확성, 효율성 및 다양성을 갖는 게놈 편집 기술이 필요하다.
다양한 양태에서, 본 개시내용은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 가지고 DNA 중합효소를 포함하는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하며, 상기 방법은: 기준선 dNTP 농도에 비해 세포에서 dNTP 농도를 증가시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 세포에서 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제를 억제하는 것을 포함한다. 다양한 양태에서, 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제는 SAM 도메인 및 HD 도메인-함유 단백질 1(SAMHD1)을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키는 것, 또는 세포에서 Vpx 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 BGLF4 단백질과 접촉시키는 것, 또는 세포에서 BGLF4 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키는 것, 또는 세포에서 마이크로RNA 또는 siRNA를 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 뉴클레오시드 또는 뉴클레오티드(예를 들어, dN, dNMP, 또는 NTP)를 세포에 투여하는 것을 포함한다. 다양한 양태에서, dNTP를 세포에 투여하는 것은 세포를 포함하는 대상체에게 뉴클레오시드 또는 뉴클레오티드를 투여하는 것을 포함한다. 다양한 양태에서, 투여는 경구이거나 주사에 의한 것이다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함한다. 다양한 양태에서, dNTP 합성 효소는 키나제를 포함한다. 다양한 양태에서, 키나제는 뉴클레오시드 키나제, 데옥시뉴클레오시드 키나제, 데옥시뉴클레오시드 모노포스페이트 키나제, 또는 데옥시뉴클레오티드 디포스페이트 키나제를 포함한다. 다양한 양태에서, DNA 중합효소는 역전사효소를 포함한다. 다양한 양태에서, 세포는 Cas9 프로그램가능한 뉴클레아제, 가이드 핵산, 또는 이의 조합을 추가로 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 비분할 세포에서 발견되는 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 활성화된 말초 혈액 단핵 세포에서 발견되는 dNTP 농도보다 낮다. 다양한 양태에서, 낮은 dNTP 농도는 1 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, dNTP 농도를 증가시키는 것은 dNTP 농도를 기준선 dNTP 측정에 비해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 또는 그 초과로 dNTP 농도를 증가시키는 것을 포함한다. 다양한 양태에서, dNTP 농도는 데옥시아데노신 트리포스페이트(dATP) 농도, 데옥시시티딘 트리포스페이트(dCTP) 농도, 데옥시구아노신 트리포스페이트(dGTP) 농도, 또는 데옥시티미딘 트리포스페이트(dTTP) 농도, 또는 이의 임의의 조합을 포함한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물 또는 본 명세서에 기재된 바와 같은 가이드 핵산을 발현하는 세포에서 Vpx 단백질을 발현시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다.
다양한 양태에서, 본 개시내용은 세포에서 dNTP 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법을 제공한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 발현하는 세포에서 SAMHD1을 억제하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 발현하는 세포에서 (예를 들어, SAMHD1을 억제함에 의해) dNTP 농도를 증가시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다.
일부 양태에서, SAMHD1을 억제하는 것은 세포에서 Vpx 단백질을 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 세포에서 SAMHD1에 대해 마이크로RNA를 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 세포를 소분자 SAMHD1 억제제로 처리하는 것을 포함한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제 및 역전사효소를 포함하는 조성물을 제공하며, 여기서 Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬이고 Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성한다.
일부 양태에서, Cas-역전사효소 이종이량체는 Cas 닉카제에 융합된 제1 이종이량체 도메인 및 역전사효소에 융합된 제2 이종이량체 도메인을 포함하며, 여기서 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합하여 이종이량체를 형성한다. 일부 양태에서, 제1 이종이량체 도메인은 류신 지퍼이고 제2 이종이량체 도메인은 류신 지퍼이다. 일부 양태에서, 역전사효소는 서열번호: 3 - 서열번호: 22 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제에 융합된 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제에 융합된 박테리아 II군 인트론으로부터의 서열을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함한다.
Cas 닉카제 및 역전사효소를 포함하는 조성물이 본 명세서에 개시되며, 여기서 Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제 및 역전사효소는 이종이량체화되도록 조작되지 않는다.
다양한 양태에서, 본 개시내용은 Cas 닉카제, 역전사효소, 및 가이드 핵산을 포함하는 조성물을 제공하며, 여기서 제1 폴리펩티드는 Cas 닉카제를 포함하고 제2 폴리펩티드는 역전사효소를 포함하고 가이드 핵산은 Cas 닉카제와 역전사효소에 결합한다.
일부 양태는 Cas 닉카제와 복합체를 형성하는 가이드 핵산을 포함하며, 여기서 복합체 형성 시 Cas 닉카제는 표적 핵산에서 표적 부위에 단일-가닥 파손을 도입할 수 있다. 일부 양태에서, 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함한다.
일부 양태에서, 역전사효소는 mcp 펩티드를 포함한다. 일부 양태에서, 역전사효소는 루프 영역을 포함한다. 일부 양태에서, 루프 영역은 2a 루프 또는 3a 루프이다. 일부 양태에서, 루프 영역은 2a 루프이다. 일부 양태에서, 루프 영역은 3a 루프이다. 일부 양태에서, 가이드 핵산은 MS2 헤어핀을 포함한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 서열번호: 3 - 서열번호: 22 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는 역전사효소를 포함하는 조성물을 제공한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 비-장 말단 반복 역전사가능한 요소로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물을 제공한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 박테리아 II군 인트론으로부터의 서열을 포함하는 역전사효소를 포함하는 조성물을 제공한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물을 제공한다.
일부 양태에서, 조성물은 Cas 닉카제 및 역전사효소와 복합체를 형성하는 가이드 핵산을 포함하며, 여기서 복합체 형성 시 Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입할 수 있다. 일부 양태에서, 조성물은 Cas 닉카제 또는 역전사효소에 융합된 핵 국소화 신호를 포함한다. 일부 양태에서, 역전사효소는 절삭된 역전사효소이다. 일부 양태에서, 역전사효소는 천연 역전사효소와 비교하여 증가된 연속성을 갖는다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 증가된 연속성을 갖는다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 표적 서열에서 더 긴 윈도우 길이를 편집한다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 감소된 면역원성을 갖는다. 일부 양태에서, 역전사효소는 mlvRT와 비교하여 세포로의 개선된 전달을 갖는다. 일부 양태에서, 역전사효소는 단일 결합 이벤트에서 20개 이상, 40개 이상, 45개 이상, 50개 이상, 60개 이상, 81개 이상, 100개 이상, 500개 이상, 또는 1000개 이상의 뉴클레오티드를 중합한다.
다양한 양태에서, 본 개시내용은 Cas 닉카제 및 역전사효소, 또는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 조성물을 제공하며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부는 적어도 2개의 별도의 폴리펩티드 사슬에 포함된다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 이종이량체 도메인을 포함하는 별도의 폴리펩티드 사슬을 포함한다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 인테인을 포함하는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제는 아미노산 위치 1030 또는 아미노산 위치 1030 이후의 돌연변이를 포함하고, 돌연변이는 시스테인, 트레오닌, 알라닌 또는 세린에 대한 점 돌연변이, 또는 시스테인, 트레오닌, 알라닌 또는 세린의 삽입을 포함한다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 이종이량체 도메인을 포함하는 별도의 폴리펩티드 사슬을 포함한다. 일부 양태에서, 별도의 폴리펩티드 사슬은 이종이량체 도메인을 포함하는 융합 단백질을 포함한다. 일부 양태에서, 이종이량체 도메인은 류신 지퍼, PDZ 도메인, 스트렙타비딘 및 스트렙타비딘 결합 단백질, 폴돈 도메인, 소수성 폴리펩티드, Cas 닉카제에 결합하는 항체, 또는 역전사효소에 결합하는 항체, 또는 이의 하나 이상의 결합 단편을 포함한다. 일부 양태에서, 이종이량체 도메인은 제1 이종이량체 도메인 및 제2 이종이량체 도메인을 포함하고, Cas 닉카제는 제1 이종이량체 도메인을 포함하고 역전사효소는 제2 이종이량체 도메인을 포함한다. 일부 양태에서, 제1 이종이량체 도메인은 Cas 닉카제의 아미노 또는 카르복시 말단에 융합되고, 제2 이종이량체 도메인은 역전사효소의 아미노 또는 카르복시 말단에 융합된다. 일부 양태에서, 제1 이종이량체 도메인은 제1 류신 지퍼를 포함하고, 여기서 제2 이종이량체 도메인은 제2 류신 지퍼를 포함한다. 일부 양태에서, 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 인테인을 포함하는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제는 아미노산 위치 1030 또는 아미노산 위치 1030 이후에서 돌연변이를 포함하고, 돌연변이는 시스테인, 트레오닌, 알라닌 또는 세린에 대한 점 돌연변이, 또는 시스테인, 트레오닌, 알라닌 또는 세린의 삽입을 포함한다. 일부 양태에서, 점 돌연변이는 시스테인에 대한 것이거나 삽입이 시스테인에 대한 것이다. 일부 양태에서, 점 돌연변이는 트레오닌에 대한 것이거나 삽입이 트레오닌에 대한 것이다. 일부 양태에서, 점 돌연변이는 알라닌에 대한 것이거나 삽입이 알라닌에 대한 것이다. 일부 양태에서, 점 돌연변이는 세린에 대한 것이거나 삽입이 세린에 대한 것이다. 일부 양태에서, 돌연변이는 점 돌연변이를 포함하며, 여기서 점 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, R1212, 또는 전술한 아미노산 위치 중 임의의 2개에 의해 한정된 범위에 있다. 일부 양태에서, 돌연변이는 점 돌연변이를 포함하고, 여기서 점 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 있다. 일부 양태에서, 돌연변이는 삽입 돌연변이를 포함하며, 여기서 삽입 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, R1212, 또는 전술한 아미노산 위치 중 임의의 2개에 의해 한정된 범위의 바로 상류 또는 하류에 있다. 일부 양태에서, 돌연변이는 삽입 돌연변이를 포함하며, 여기서 삽입 돌연변이는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류 또는 하류에 있다. 일부 양태에서, 인테인은 제1 인테인 및 제2 인테인을 포함하고, 여기서 Cas 닉카제는 제1 인테인을 포함하는 제1 분절, 및 돌연변이 및 제2 인테인을 포함하는 제2 분절을 포함한다. 일부 양태는 Cas 닉카제 또는 역전사효소에 결합하는 가이드 핵산을 포함한다. 일부 양태에서, 복합체의 Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입한다. 일부 양태에서, Cas 닉카제는 Cas9 닉카제 또는 이의 변이체를 포함한다. 일부 양태에서, Cas9 닉카제 또는 이의 변이체는 S. 피오게네스 Cas9 닉카제 또는 이의 변이체를 포함한다. 일부 양태에서, 역전사효소는 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체를 포함한다. 일부 양태에서, 역전사효소는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524에서 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, 조성물은 Cas 닉카제 및 역전사효소를 포함하고, 여기서 적어도 2개의 별도의 폴리펩티드 사슬은 2개의 별도의 폴리펩티드 사슬이다. 일부 양태에서, 조성물은 Cas 닉카제 및 역전사효소를 포함하고, 여기서 적어도 2개의 별도의 폴리펩티드 사슬은 Cas 닉카제의 제1 부분을 포함하는 제1 폴리펩티드 사슬, 및 Cas 닉카제의 제2 부분 및 역전사 효소를 포함하는 제2 폴리펩티드 사슬을 포함한다. 일부 양태는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 일부 양태에서, Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드는 Cas 닉카제의 제1 부분을 인코딩하는 제1 폴리뉴클레오티드, 및 Cas 닉카제의 제2 부분 및 역전사효소을 인코딩하는 제2 폴리뉴클레오티드를 포함한다. 일부 양태는 적어도 하나의 폴리뉴클레오티드를 포함하는 적어도 하나의 아데노-연관된 바이러스를 포함한다. 일부 양태에서, 조성물은 세포에 의해 생성된다.
다양한 양태에서, 본 개시내용은 Cas 닉카제 및 역전사효소, 또는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 조성물을 제공하며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함된다. 일부 양태에서, Cas 닉카제 또는 역전사효소는 제1 류신 지퍼를 포함한다. 일부 양태에서, Cas9 닉카제는 S. 피오제네스 Cas9 닉카제 또는 이의 변이체, 및 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에서의 점 돌연변이, 또는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류 또는 하류에 삽입 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 몰로니 백혈병 바이러스 역전사효소(mlvRT), 또는 이의 변이체, 및 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 포함한다. 일부 양태에서, 별도의 폴리펩티드 사슬은 이종이량체 도메인을 포함한다. 일부 양태에서, Cas 닉카제 및 역전사효소는 Cas 닉카제에 융합된 제1 이종이량체 도메인 및 역전사효소에 융합된 제2 이종이량체 도메인을 포함하는 이종이량체를 형성하며, 여기서 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합하여 이종이량체를 형성한다. 일부 양태에서, 제1 이종이량체 도메인은 제1 류신 지퍼를 포함한다. 일부 양태에서, 제2 이종이량체 도메인은 제2 류신 지퍼를 포함한다. 일부 양태에서, 역전사효소는 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80, 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 포함한다. 일부 양태에서, 역전사효소는 Cas 닉카제의 일부에 융합된 비-장 말단 반복 역전사성 요소의 도메인, Cas 닉카제의 일부에 융합된 박테리아 II군 인트론의 서열, 또는 Cas 닉카제의 일부에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함한다. 일부 양태는 Cas 닉카제 또는 역전사효소에 결합하는 가이드 핵산을 포함한다. 일부 양태에서, 복합체의 Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입한다. 일부 양태에서, 가이드 핵산은 헤어핀을 포함한다. 일부 양태에서, 헤어핀은 MS2 헤어핀을 포함한다. 일부 양태에서, 역전사효소는 헤어핀 결합 도메인을 포함하는 변형된 역전사효소를 포함한다. 일부 양태에서, 역전사효소는 MS2 코트 단백질(MCP) 펩티드를 포함하는 변형된 역전사효소를 포함한다. 일부 양태에서, 역전사효소는 루프 영역을 포함한다. 일부 양태에서, Cas9 닉카제는 Cas9 닉카제의 C-말단 절반에 점 돌연변이 또는 삽입 돌연변이를 포함한다. 일부 양태에서, Cas9 닉카제의 C-말단 절반에서의 점 돌연변이는 시스테인, 세린, 트레오닌 또는 알라닌에 대한 것이고; 또는 여기서 삽입 돌연변이는 시스테인 삽입 세린 삽입, 트레오닌 삽입, 또는 알라닌 삽입이다. 일부 양태에서, Cas9 닉카제는 Cas9 닉카제의 C-말단 절반에 점 돌연변이를 포함한다. 일부 양태에서, Cas9 닉카제는 Cas9 닉카제의 C-말단 절반에 삽입 돌연변이를 포함한다. 일부 양태에서, Cas9 닉카제는 제1 인테인을 포함하는 제1 분절, 및 점 돌연변이 또는 삽입 돌연변이 및 제2 인테인을 포함하는 제2 분절을 포함한다. 일부 양태에서, Cas9 닉카제는 S. 피오게네스 Cas9 닉카제 또는 이의 변이체를 포함한다. 일부 양태에서, Cas9 닉카제는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에서의 점 돌연변이, 또는 아미노산 위치 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류 또는 하류에 삽입 돌연변이를 포함한다. 일부 양태에서, Cas 닉카제 또는 역전사효소는 핵 국소화 신호를 포함한다. 일부 양태에서, 역전사효소는 절삭된 역전사효소이다. 일부 양태에서, 역전사효소는 mlvRT 또는 이의 변이체를 포함한다. 일부 양태에서, 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서의 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A를 포함하는 점 돌연변이를 포함한다. 일부 양태에서, Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함한다. 일부 양태에서, 조성물은 세포에 의해 생성된다. 일부 양태는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 일부 양태는 적어도 하나의 폴리뉴클레오티드를 포함하는 적어도 하나의 아데노-연관된 바이러스를 포함한다.
다양한 양태에서, 본 개시내용은 표적 핵산의 제1 영역에 역상보적인 스페이서, Cas 닉카제에 결합하도록 구성된 스캐폴드, 표적 핵산 내로 삽입되는 서열을 인코딩하는 역전사효소 주형, 및 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위를 포함하는 가이드 핵산을 제공한다.
일부 양태에서, 가이드 핵산은 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머를 추가로 포함한다. 일부 양태에서, 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있다. 일부 양태에서, 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적이다. 일부 양태에서, 가이드 핵산은 가이드 핵산의 3' 말단에서 절단가능한 서열을 추가로 포함한다. 일부 양태에서, 절단가능한 서열은 리보자임 절단가능한 서열이다. 일부 양태에서, 절단가능한 서열은 tRNA 절단가능한 서열이다. 일부 양태에서, 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성되고, 여기서 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터 역전사를 위한 주형으로 작용하도록 구성된다. 일부 양태에서, 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터의 전사를 위한 프라이머로 작용하도록 구성된다. 일부 양태에서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로서 작용한다. 일부 양태에서, 역전사효소 주형 영역의 영역에 혼성화하는 벨크로 영역.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 가이드를 포함하는 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물을 제공한다.
일부 양태에서, 제2 가이드 핵산은 본 명세서에 기재된 바와 같은 가이드를 포함한다. 일부 양태에서, 제1 가이드 핵산은 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산은 제2 Cas 닉카제에 결합한다. 일부 양태에서, 제1 가이드 핵산의 제1 스페이서는 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스페이서는 제2 Cas 닉카제에 결합하고, 제1 가이드 핵산의 제1 스캐폴드는 제2 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스캐폴드는 제1 Cas 닉카제에 결합한다. 일부 양태에서, 제1 가이드 핵산은 제1 링커를 포함하고 제2 가이드 핵산은 제2 링커를 포함하며, 여기서 제1 링커는 제2 링커에 혼성화한다.
다양한 양태에서, 본 개시내용은 표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위; 및 i. gRNA 위치화 시스템(GPS) 영역 및 GPS 영역에 혼성화하는 GPS 결합 부위, ii. 표적 핵산에서 프로토스페이서 인접 모티프(PAM) 서열을 파괴하는 역전사효소 주형에서의 변형, iii. 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서의 변형, 또는 iv. 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머 중 적어도 하나를 포함하는 가이드 핵산을 제공한다. 다양한 양태에서, 본 개시내용은 표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위; 및 i. gRNA 위치화 시스템(GPS) 영역 및 GPS 영역에 혼성화하는 GPS 결합 부위, ii. 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서의 변형, 또는 iii. 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머 중 적어도 하나를 포함하는 가이드 핵산을 제공한다. 일부 양태는 제2 가닥 프라이머를 포함한다. 일부 양태에서, 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터의 전사를 위한 프라이머로 작용하도록 구성된다. 일부 양태에서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로서 작용한다. 일부 양태에서, 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있다. 일부 양태에서, 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적이다. 일부 양태는 가이드 핵산의 3' 말단에 리보자임 절단가능한 서열을 포함한다. 일부 양태는 가이드 핵산의 3' 말단에 tRNA 절단가능한 서열을 포함한다. 일부 양태에서, 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성되고, 여기서 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터 역전사를 위한 주형으로 작용하도록 구성된다. 일부 양태는 GPS 영역 및 GPS 결합 부위를 포함한다. 일부 양태에서, GPS 영역 및 GPS 결합 부위는 함께 가이드 핵산의 다른 영역에 결합하여 가이드 핵산의 형태 변화에 영향을 미치고 유전자 편집을 개선하는 가이드 핵산의 영역을 포함한다. 일부 양태에서, GPS 영역과 GPS 결합 부위의 혼성화는 가이드 핵산을 형태적으로 변화시키고, GPS 영역 또는 GPS 결합 부위가 없는 가이드 핵산과 비교하여 편집 효율을 개선한다. 일부 양태에서, 역전사효소 주형 영역은 GPS 결합 부위를 포함한다. 일부 양태에서, GPS 결합 부위는 제1 가닥 프라이머 결합 부위의 5'이다. 일부 양태에서, GPS 결합 부위는 제1 가닥 프라이머 결합 부위의 3'이다. 일부 양태에서, GPS 영역은 역전사효소 주형의 5'이다. 일부 양태에서, GPS 영역은 역전사효소 주형의 3'이다. 일부 양태에서, GPS 영역은 스캐폴드의 5'이다. 일부 양태에서, GPS 영역은 길이가 5-100 뉴클레오티드이다. 일부 양태에서, GPS 결합 부위는 GPS 영역에 대해 적어도 50% 상보적이다. 일부 양태에서, 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함한다. 일부 양태에서, 스페이서는 서열번호: 96-119 중 임의의 하나와 적어도 85% 동일한 핵산 서열을 포함한다. 일부 양태는 표적 핵산에서 PAM 서열을 파괴하는 역전사효소 주형에서 변형을 포함한다. 일부 양태에서, PAM 서열은 Cas 뉴클레아제에 의해 인식되는 2-6개의 염기쌍 핵산 서열을 포함한다. 일부 양태에서, 표적 핵산에서 PAM 서열을 파괴하는 역전사효소 주형에서 변형은 변형이 없는 가이드 핵산에 비해 유전자 편집을 개선한다. 일부 양태는 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서 변형을 포함한다. 일부 양태에서, 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙은 폴리A 트랙을 포함한다. 일부 양태에서, 표적 핵산에서 동일한 염기의 적어도 4개의 연속적인 뉴클레오티드의 트랙을 파괴하는 역전사효소 주형에서 변형은 변형이 없는 가이드 핵산에 비해 유전자 편집을 개선한다. 일부 양태에서, Cas 뉴클레아제는 Cas 닉카제를 포함한다. 일부 양태에서, 가이드 핵산은 가이드 RNA를 포함한다. 일부 양태는 가이드 핵산을 포함하는 조성물을 세포에 전달하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 양태에서, 조성물은 가이드 핵산을 포함하는 바이러스 벡터를 포함한다. 일부 양태는 제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역을 포함한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물 또는 본 명세서에 기재된 바와 같은 가이드 핵산을 발현하는 세포에 Orf1p를 전달하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 제공한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물 또는 본 명세서에 기재된 바와 같은 가이드 핵산을 인코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 핵산을 포함하는 바이러스 벡터를 제공한다.
다양한 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물, 본 명세서에 기재된 바와 같은 가이드 핵산, 본 명세서에 기재된 바와 같은 핵산, 또는 본 명세서에 기재된 바와 같은 바이러스 벡터를 포함하는 세포를 제공한다.
일부 양태에서, 세포는 원핵 세포이다. 일부 양태에서, 세포는 진핵 세포이다.
일부 양태에서, 본 개시내용은 인테인 촉매작용을 가능하게 하거나 개선하는 하나 이상의 점 돌연변이 또는 삽입 돌연변이를 포함하는 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물을 제공한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물을 제공하며, 여기서 Cas9 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제의 C-말단 절반에 위치한 시스테인 점 돌연변이를 포함한다. 다양한 양태에서, 본 개시내용은 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물을 제공하며, 여기서 Cas9 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제의 C-말단 절반에 위치한 삽입 돌연변이(예를 들어, 시스테인 삽입 돌연변이)를 포함한다. 점 돌연변이는 시스테인 점 돌연변이, 세린 점 돌연변이, 트레오닌 점 돌연변이, 또는 알라닌 점 돌연변이일 수 있다. 삽입 돌연변이는 시스테인 삽입 돌연변이, 세린 삽입 돌연변이, 트레오닌 삽입 돌연변이, 또는 알라닌 삽입 돌연변이일 수 있다.
일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 Cas9 닉카제이다. 일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 S. 피오게네스 Cas9이다. 일부 양태에서, 점 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 위치된다. 일부 양태에서, 삽입 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류에 있다. 일부 양태에서, 시스테인 점 돌연변이는 S. 피오게네스 Cas9의 S1173C, D1079C, 또는 D1180C에 위치된다. 일부 양태에서, 시스테인 삽입 돌연변이는 S. 피오게네스 Cas9의 1173C, 1079C, 또는 1180C에 위치된다. 일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나의 서열을 포함한다.
일부 양태에서, Cas9 프로그램가능한 뉴클레아제는 2개 이상의 분절로서 발현된다. 일부 양태에서, 2개 이상의 분절 중 제1 분절은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분 및 제1 인테인을 포함하고, 여기서 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분 및 제2 인테인을 포함한다. 일부 양태에서, 시스테인 점 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 위치된다. 일부 양태에서, 시스테인 삽입 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 위치된다. 일부 양태에서, 제1 인테인은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분의 C-말단에 융합되고, 여기서 제2 인테인은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 융합된다. 일부 양태에서, 제1 분절은 서열번호: 90의 서열을 포함하고, 여기서 제2 분절은 서열번호: 91의 서열을 포함한다. 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분에 융합된 역전사효소를 포함할 수 있다. 역전사효소는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 C-말단에 융합된 N-말단을 포함할 수 있다. 역전사효소는 mlvRT 또는 이의 변이체를 포함할 수 있다.
낮은 dNTP 농도에서 그 촉매 효율을 증가시키도록 변형된(예를 들어, dNTP에 대한 그 Km을 감소시키도록 변형된) 몰로니 백혈병 바이러스 역전사효소(mlvRT)로 게놈 편집을 수행하는 것을 포함하는 게놈 편집 효율을 최적화하는 방법이 본 명세서에 개시되어 있다. 역전사효소의 위치 221 또는 223에서 점 돌연변이를 포함하는, 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체로 게놈 편집을 수행하는 것을 포함하는, 제한적인 dNTP 조건에서 게놈 편집 효율을 최적화하는 방법이 본 명세서에 개시되어 있다. mlvRT 또는 이의 변이체는 위치 221에서 점 돌연변이를 포함할 수 있다. 위치 221에서 점 돌연변이는 Q221R을 포함할 수 있다. mlvRT 또는 이의 변이체는 위치 223에서 점 돌연변이를 포함할 수 있다. 위치 223에서 점 돌연변이는 V223A를 포함할 수 있다. 위치 223에서의 점 돌연변이는 V223M을 포함할 수 있다.
Cas 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩될 수 있다. 폴리뉴클레오티드를 포함하는 AAV가 본 명세서에 개시되어 있다. Cas 닉카제 및 RT의 적어도 일부는 별도의 AAV에 포괄되거나 포함될 수 있다. Cas 또는 Cas9 성분을 인코딩하는 제1 폴리뉴클레오티드를 포함하는 제1 AAV, 및 RT 성분을 인코딩하는 제2 폴리뉴클레오티드를 포함하는 제2 AAV를 포함하는 AAV가 본 명세서에 개시된다. AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB, 또는 AAV-PHP.S, 또는 이의 조합을 포함할 수 있다.
개선된 역전사효소(RT)를 스크리닝하거나 식별하는 방법이 본 명세서에 개시되며, 상기 방법은 세포에서 SAMHD1을 과발현시키거나 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현시키는 것; 세포에서 RT 활성을 식별하는 것; 및 RT 활성에 기반하여, RT를 개선된 RT로 식별하는 것을 포함한다.
스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA 또는 폴리뉴클레오티드를 포함하는 시스템이 본 명세서에 개시되며, 여기서 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산의 영역의 임의의 부분을 포함하지 않는 핵산에 결합한다.
표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 제1 영역의 임의의 부분을 포함하지 않고, 제1 영역의 역 상보체의 임의의 부분을 포함하지 않는 표적 핵산의 영역에 결합하는 제1 가닥 프라이머 결합 부위; 및 제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역을 포함하는 제1 가이드 핵산을 포함하는 시스템이 본 명세서에 개시된다. 표적 핵산의 제1 영역에 역상보적인 스페이서; Cas 뉴클레아제에 결합하도록 구성된 스캐폴드; 표적 핵산 내에 삽입되는 서열을 인코딩하는 역전사효소 주형; 및 제1 영역의 임의의 부분을 포함하지 않고, 제1 영역의 역 상보체의 임의의 부분을 포함하지 않는 표적 핵산의 영역에 결합하는 제1 가닥 프라이머 결합 부위를 포함하는 제1 가이드 핵산을 포함하는 시스템이 본 명세서에 개시된다. 일부 양태는 제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역을 포함한다. 일부 양태는 제2 가이드 핵산을 포함한다. 제2 가이드 핵산은 GPS 결합 부위를 포함할 수 있다. 일부 양태에서, 제2 가이드 핵산은 표적 핵산의 또 다른 영역에 역상보적인 제2 스페이서를 포함한다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩에 근접시키거나 접촉하도록 할 수 있다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 표시된 것과 동일한 정도로 본 명세서에 참조로 포함된다.
개시내용의 신규 특징은 첨부된 청구범위에서 구체적으로 제시된다. 본 개시내용의 특징 및 이점의 더 나은 이해는 개시내용의 원리가 활용되는 예시적인 실시형태를 설명하는 다음의 상세한 설명 및 이하의 첨부 도면을 참조하여 얻어질 것이다:
도 1은 nCas9 및 몰로니 백혈병 바이러스 RT("mlvRT"), 및 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물("mlvRT 분할 스티치")을 포함하는 융합된 Cas9 닉카제(nCas9) 역전사효소(RT) 작제물("nCas9-mlvRT")의 편집 효율을 나타낸다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 별도 폴리펩티드 사슬 상에 포함한다. nCas9-LZ1은 류신 지퍼를 통해 mlvRT(서열번호: 13) 및 N-말단 류신 지퍼(서열번호: 24)를 포함하는 LZ2-mlvRT와 이종이량체화하는 C-말단 류신 지퍼(서열번호: 23) 및 SpCas9(서열번호: 32)를 포함한다. nCas9-mlvRT 작제물의 개략도 상단에 제공되어 있다.
도 2는 융합된 nCas9-RT 작제물("nCas9-mlvRT") 및 역전사효소에 융합된 nCas9 및 mcp 펩티드를 포함하는 분할 nCas9 및 mcp-mlvRT 작제물("mcp-mlvRTv")(서열번호: 27)의 편집 효율을 나타낸다. mcp 펩티드는 MS2 RNA 헤어핀과 상호작용한다. 분할 nCas9 및 mcp-mlvRT 작제물의 효율성은 gRNA 2.0를 포함하는 상이한 가이드 RNA(gRNA) 작제물(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")로 시험되었다.
도 3은 증가된 전사 연속성을 갖는 변형된 역전사효소를 포함하는 상이한 분할 nCas9-RT 작제물의 편집 효율을 나타낸다. 지오바실러스 스테아로테르모필루스(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레(ErRT, 서열번호: 4) 중 어느 하나로부터의 nCas9 및 역전사효소 및 R2 폴리단백질로부터의 아미노산 116-1016(R2(116-1016), 서열번호: 7)을 포함하는 작제물을 시험하였다. GsI-IICRT 역전사효소("스티치RT")의 개략도는 도 1 및 도 2에 사용된 mlvRT 역전사효소와 비교하여 도시된다.
도 4a는 본 개시내용의 조작된 gRNA("스티치 가이드")를 사용한 게놈 편집에 대한 방법을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위로 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥을 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합한다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화한다. 4-200 bp의 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합한다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥의 DNA는 흠집의 부위에서 표적 핵산에 합체될 수 있다.
도 4b는 pegRNA 또는 스티치 가이드 gRNA를 사용한 nCas9-RT 작제물의 편집 효율을 나타낸다. pegRNA와 스티치 가이드 gRNA의 개략도는 왼쪽에 도시되어 있다. 융합된 nCas9-mlvRTv 작제물이 이 검정에 사용되었다.
도 5a는 제1 가닥 프라이머 결합 부위의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'("흠집으로부터 nt")에 위치된 제2 가닥 프라이머(SSP) 20 뉴클레오티드(nt), 40 nt 또는 60 nt 길이를 포함하는 상이한 gRNA를 갖는 융합된 nCas9-RT 작제물("nCas9-mlvRTv")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA가 대조군으로 시험되었다. 모든 gRNA 서열은 HDV 리보자임(서열번호: 25)을 포함하였다.
도 5b는 제1 가닥 프라이머 결합 부위의 5' 말단의 6 nt, 36 nt, 또는 55 nt 3'("흠집으로부터 nt")에 위치된 제2 가닥 프라이머(SSP) 20 뉴클레오티드(nt), 40 nt 또는 60 nt 길이를 포함하는 상이한 gRNA를 갖는 nCas9-RT("nCas9-R2(116-1016)")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA가 대조군으로 시험되었다.
도 6은 nCas9-RT를 갖는 2개의 gRNA 시스템을 사용하는 게놈 편집의 4가지 방식을 예시한다. 2개의 가이드가 각각 편집된 가닥을 생성하는 2개의 단일 가이드 시스템(왼쪽 상단)에서, 각 gRNA는 상이한 nCas9에 결합하고 2개의 gRNA는 각각 역전사효소 주형 영역을 포함한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 2개의 단일 가이드 시스템(오른쪽 상단)에서, 각 gRNA는 상이한 nCas9에 결합하고 gRNA 중 하나만 역전사효소 주형 영역을 포함한다. 두 가이드가 각각 편집을 생성하는 이중 가이드 복합체 시스템(왼쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; 2개의 gRNA는 각각 역전사효소 주형 영역 및 프라이머 결합 부위(PBS) 영역을 포함한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 이중 가이드 복합체 시스템(오른쪽 아래)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고, 제2 gRNA의 스페이서는 제2 nCas9에 결합하고, 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고, 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; gRNA 중 하나만 역전사효소 주형 영역을 포함한다.
도 7은 유전자 편집의 효율을 증가시키는 방법을 예시한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 2개의 단일 가이드 시스템 또는 제2 가이드가 반대쪽 가닥에 흠집을 내는 이중 가이드 복합 시스템으로, 반대쪽 가닥 상의 흠집은 새롭게 합성된 DNA의 표적 핵산 안으로 합체를 용이하게 한다. 제2 가이드는 제1 새롭게 합성된 가닥의 영역에 역상보적인 플랩을 생성한다. 제1 합성 가닥은 제2 가닥 합성을 위한 주형으로 작용한다.
도 8a는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 제1 가닥 프라이머 결합 부위의 gRNA 5'의 영역에 역상보적인 역전사효소 주형 영역의 5'에 위치된 5 내지 200개의 뉴클레오티드를 포함한다.
도 8b는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 역전사효소 주형 영역의 영역에 역상보적인 제1 가닥 프라이머 결합 부위의 3'에 위치된 5 내지 100개의 뉴클레오티드를 포함한다.
도 9a는 도 8a 및 도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-mlvRTv 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역(도 8a에 예시된 바와 같이 "V1")의 5'에 위치된 15 nt 벨크로 영역, 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위(도 8b에 예시된 바와 같이 "V2")의 3'에 위치된 벨크로 영역을 사용하여 비교되었다. gRNA는 107 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위를 함유했다. 편집은 흠집의 2 뉴클레오티드 3'에서 시작하는 ATCC 서열이 CATA로 돌연변이되도록 수행되었다.
도 9b는 도 8a 및 도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-R2(116-1016) 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 벨크로 결합 부위의 말단과 프라이머 결합 부위의 시작 사이에 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역(도 8a에 예시된 바와 같이 "V1")의 5'에 위치된 15 nt 벨크로 영역, 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위(도 8b에 예시된 바와 같이 "V2")의 3'에 위치된 벨크로 영역을 사용하여 비교되었다.
도 10은 도 7에 도시된 바와 같은 2개의 gRNA 시스템의 편집 효율을 나타낸다. 청색 형광 단백질(BFP)을 인코딩하는 표적 핵산은 정지 코돈을 도입하도록 편집되었다. 세포에서 BFP 형광의 결여는 성공적인 편집을 나타낸다. BFP에 대해 음성인 세포의 백분율("% BFP-")로 측정된 편집 효율은 세포 단독(gRNA 없음), 단일 gRNA(3' 연장을 결하는 gRNA 2, 스텁이 없는 gRNA 1, 스텁이 있는 gRNA 1) 및 2개의 gRNA(스텁이 없는 gRNA 1 플러스 gRNA 2 및 스텁이 있는 gRNA 1 및 gRNA 2)에 대해 측정되었다.
도 11a는 프라임 편집기 2 시스템("PE2", 상단), 분할 프라임 편집기 2 시스템("분할 PE2", 중간), 및 2개의 류신 지퍼가 있는 분할 스티치 작제물("분할 스티치", 하단)의 도메인 배열을 나타낸다. 오른쪽에는 가이드 핵산과 복합체화된 2개의 류신 지퍼(LZ1 및 LZ2)에 의해 연결된 Cas9 닉카제(nCas9) 및 역전사효소(RT)를 포함하는 분할 스티치 작제물의 구조적 개략도이다. 분할 스티치 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 개별 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다.
도 11b는 다른 gRNA를 갖는 도 11a에 예시된 작제물의 편집 효율을 나타낸다. 편집 효율은 BFP를 GFP로 전환하기 위해 편집된 세포의 백분율(% GFP+)로 측정되었다. 편집 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다.
도 12a는 표적 핵산의 플랩에 대한 프라이머 결합 부위(PBS)의 혼성화의 속도를 가속화하기 위해 벨크로 영역이 없는(왼쪽) 또는 있는(중간 및 오른쪽) gRNA 작제물을 예시한다. V1 배열에서 벨크로 영역은 gRNA의 5' 말단 또는 그 근처에 위치될 수 있고 프라이머 결합 부위의 gRNA 5'의 영역("벨크로 V1", 중간)에 혼성화할 수 있다. V2 배열에서 벨크로 영역은 프라이머 결합 부위의 3'에 위치될 수 있고 gRNA의 5' 말단 또는 그 근처의 영역("벨크로 V2," 오른쪽)에 혼성화할 수 있다.
도 12b는 도 12a에 제공된 gRNA 작제물의 예측된 3-차원 구조를 예시한다. 벨크로 영역을 결하는 gRNA는 왼쪽에 도시되어 있다. 벨크로 V1 영역 또는 벨크로 V2 영역을 포함하는 gRNA는 각각 중간 및 오른쪽 패널에 표시된다.
도 12c는 129 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위 및 20 뉴클레오티드 벨크로 영역을 갖는 gRNA의 편집 효율을 나타낸다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 편집 효율은 원래의 gRNA("원래의 코딩") 또는 2차 구조를 제거하기 위해 gRNA 연장의 RT 주형 영역에서 침묵 돌연변이로 재코딩된 gRNA("재코딩됨")에 대해 비교되었다.
도 12d는 벨크로 서열의 상이한 길이를 갖는 gRNA의 편집 효율을 나타낸다. 각각의 gRNA는, 왼쪽 상의 개략도에 도시된 바와 같이, 5'에서 3'의 순서로 RT 주형, 프라이머 결합 부위, 벨크로 영역을 함유했다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. gRNA는 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위를 가졌다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다.
도 13a는 벨크로 영역과 2nd 가닥 프라이머를 포함하는 pegRNA 및 스티치 gRNA의 개략도(상단) 및 스티치 gRNA를 이용한 게놈 편집의 방법(하단)을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산 가닥에 흠집을 낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합화한다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화한다. 4-200 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 역할을 한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합화한다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안으로 통합될 수 있다.
도 13b는 다양한 길이의 것이고 닉킹 부위로부터 다양한 거리에서 혼성화하는 gRNA 제2 가닥 프라이머(SSP)의 편집 효율을 나타낸다. 흠집에서 6, 36 또는 55 뉴클레오티드에 위치된 제2 가닥 프라이머 20, 40 또는 60 뉴클레오티드(nt) 길이가 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다.
도 13c는 벨크로 영역 또는 제2 가닥 프라이머가 없는("벨크로 없음, SSP 없음"), 19 뉴클레오티드 벨크로 영역이 있는("19 nt 벨크로"), 또는 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머 둘 모두가 있는("19 nt 벨크로, 20 nt SSP") gRNA의 편집 효율을 나타낸다.
도 14a는 mlvRT 역전사효소에서 돌연변이에 대한 스크리닝 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, 또는 L671P 단일 점 돌연변이를 함유하는 mlvRT 작제물(각각 서열번호: 41 - 서열번호: 70)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 1 뉴클레오티드 갭, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균±일 표준 편차로서 도시된다.
도 14b는 mlvRT 역전사효소에서 돌연변이의 조합에 대한 스크리닝 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 T197A 및 D653N; T197A 및 T664N; T197A 및 L671P; T197A, D653N, T664N 및 L671P; 또는 P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P를 함유하는 mlvRT 작제물(각각 서열번호: 71 - 서열번호: 75)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15a는 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 예시한다. CDK1을 결하는 비-분열 세포에서, 인산화되지 않은 SAMHD1은 dNTP를 절단하여 세포에서 이용가능한 dNTP를 감소시킨다. 분열하는 세포에서 CDK1은 SAMHD1을 인산화하여 SAMHD1이 dNTP를 절단하는 것을 방지하고 세포에서 dNTP의 증가된 이용가능성을 초래한다. SAMHD1에서 단일 점 돌연변이(T592A)는 CDK1에 의한 SAMHD1의 인산화를 방지하여, 구성적으로 활성인 SAMHD1과 세포에서 dNTP의 낮은 이용가능성을 초래한다. T592A 돌연변이 SAMHD1을 사용하여 도 15b, 도 15d 및 도 15e에 도시된 검정에서 낮은 dNTP 환경을 유도하였다. Vpx의 추가는 SAMHD1을 억제하여 세포에서 dNTP의 증가된 이용가능성을 초래한다.
도 15b는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 Q221R; V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 76 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15c는 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 77 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15d는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15e는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15f는 RW2I로 VPXRH2-1 및 SAMHD1(T592A)의 공동발현이 VPX 없이 SAMHD1(T592A)을 발현함에 의해 야기된 편집 효율에서의 감소를 완전히 역전시켰다는 것을 나타낸다.
도 16은 닉킹 활성을 위해 변형되고 류신 지퍼를 통해 역전사효소에 연결된 Cas9 작제물의 편집 효율을 나타낸다. S. 피오게네스 Cas9("SpCas9") 작제물은 Cas9 닉카제(nCas9)를 생성하는 H840A 돌연변이를 함유했다. 시스테인 잔기를 D1079C, S1173C 또는 D1180C에서 Cas9 닉카제 안으로 도입하여 엑스테인-인테인 융합체로서의 발현을 위해 Cas9를 분할 인테인 Cas9(iCas9)로 분할할 수 있었다. H840A 및 D1079C(류신 지퍼를 갖는 서열번호: 85), H840A 및 S1173C(류신 지퍼를 갖는 서열번호: 86), 또는 H840A 및 D1180C(류신 지퍼를 갖는 서열번호: 87) 점 돌연변이를 함유하고 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 류신 지퍼 Cas9 작제물이 시험되었다. H840A 돌연변이를 함유하지만 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 부가 시스테인(류신 지퍼를 갖는 서열번호: 84)이 없는 Cas9 닉카제가 대조군으로 사용되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17a는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)에 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17b는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)과 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 18은 제2 가닥 프라이머의 바로 3'인, gRNA의 3' 말단에서 HDV 리보자임(왼쪽 막대) 또는 tRNA(오른쪽 막대)를 포함하는 gRNA의 존재에서 류신 지퍼 Cas9-RT 작제물의 편집 효율을 나타낸다. 류신 지퍼 Cas9-RT 작제물은 nCas9-LZ1(서열번호: 1) 및 LZ2-mlvRT5M(서열번호: 2)로 발현되었고, 류신 지퍼를 통해 연결되었다. tRNA는 서열번호: 94(GGTCCCATGGTGTAATGGTTAGCACTCTGGACTTTGAATCCAGCGATCCGAGTTCAAATCTCGGTGGGACCT)에 상응하는 서열을 가졌다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역, 20 뉴클레오티드 제2 가닥 프라이머, 및 제2 가닥 프라이머의 HDV 리보자임 또는 tRNA 3'을 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 19a는 AAV에 적합하거나 AAV 내에 적합하지 않은 일부 정밀 편집 작제물의 능력을 나타낸다. 프라임 편집기 2(PE2)와 분할 PE2 둘 모두는 몰로니 백혈병 바이러스 역전사효소 펜타뮤턴트(mlvRT5M)에 융합된 닉킹 Cas9(nCas9)를 이용할 수 있으며, 이는 AAV 내에 패키징되기에는 너무 큰 ORF에 의해 인코딩될 수 있다. AAV를 갖는 nCas9 및 mlvRT5M을 전달할 수 있는 아키텍처가 개발되었으며, 각각은 AAV의 운반 용량보다 각각 작은 2개의 ORF에 의해 인코딩되었다. 리라이터 a1(RWa1)은 nCas9, mlvRT5M에 융합된 MS2 코트 단백질(MCP) 펩티드 및 MCP 펩티드가 특이적으로 결합할 수 있는 MS2 헤어핀을 포함하는 gRNA를 활용할 수 있다. RWb1은 이종이량체화 류신 지퍼를 활용하여 nCas9 및 mlvRT5M을 공동국소화할 수 있다. RWc1은 AAV에 각각 맞는 ORF를 사용하여 nCas9-mlvRT5M 단백질을 생성하기 위해 Npu 인테인으로 분할될 수 있는 새로운 돌연변이체 nCas9를 활용할 수 있다. RWd1은 조작된 임의의 모집 구성요소 없이 nCas9 및 mlvRT5M을 공동발현할 수 있다.
도 19b는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 인테인 촉매작용 및 mlvRT5M을 제공하기 위한 시스테인 치환을 포함하는 nCas9의 C-말단 단편에 융합된 Npu C-말단 인테인과 쌍을 이루는 Npu N-말단 인테인에 융합된 nCas9의 N-말단 단편의 패널을 테스트한 결과 잔기 1172와 1173(nCas9(1-1172)-NpuN 및 nCas9(1173-1368; S1173C)-mlvRT5M) 사이의 Ser1173Cys nCas9-mlvRT5M 돌연변이체를 분할하는 것이 PE2보다 적어도 약 2-배 더 큰 편집 효율을 초래했다는 것이 밝혀졌다.
도 19c는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 표준 gRNA 스캐폴드로 RWa1, RWb1 및 RWc1을 동시형질감염하면 모두 40% 초과의 편집 효율을 초래했다. 40% 초과의 편집 효율은 RTT-PBS-MS2 gRNA 확장 아키텍처와 쌍을 이루는 RW1M과 50% 초과의 편집을 달성하는 RW1L 둘 모두에서 달성되었다. MS2 헤어핀을 함유하지 않는 gRNA의 nCas9 및 MCP-mlvRT5M 작제물과의 공동발현은 MS2 헤어핀(RWd1)을 포함하는 gRNA와 비교하여 대략적으로 동일한 편집 효율을 초래했다.
도 19d는 일부 편집 작제물로 형질도입된 세포에서의 GFP 발현을 나타낸다. 각 바이러스에 대해 2.8 x 105의 MOI에서 2개의 별도 AAV2 작제물로 패키징된 RWc1을 갖는 BFP를 발현하는 HEK293 세포를 형질도입하는 것은 74.8% GFP+ 세포를 초래했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다.
도 20a는 효소 및 가이드 RNA의 일부 공간적 배향을 나타낸다. RTT의 역전사는 일부 경우에 PBS가 게놈 플랩에 혼성화한 후에만 개시될 수 있다. RTT의 3' 영역과 혼성화하는 RTT의 서열 5'(GPS V1) 또는 RTT의 5' 부분과 혼성화하는 PBS의 서열 3'(GPS V2)을 삽입하면 PBS가 게놈 플랩에 더 가깝게 근접되도록 재배향할 수 있다.
도 20b는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. RWb1 및 107-nt RTT를 포함하는 가이드 RNA는 14% GFP+ 세포를 초래했으며, 이는 더 짧은 13-nt RTT를 사용하여 달성된 38%보다 현저하게 낮다. 20-nt GPS V2(RWb2)를 추가하면 편집 효율이 ~27%까지 증가했다.
도 20c는 일부 편집 작제물을 포함하는 세포에서 GFP 발현을 나타낸다. 129-nt 주형을 사용하여 흠집의 부위로부터 3-nt 돌연변이 65-nt를 정착하면 GPS V2를 합체함에 의해 4-배 증가되었다.
도 21은 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 벨크로와 SSP가 동시적으로 사용될 수 있어, ~41% 편집을 초래할 수 있다(리라이터 3.2). SSP가 제공하는 효율에서의 증가는 SSP의 말단 3-nt가 제1 합성 가닥에 상보적이지 않을 때 폐지되었다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다. * = P < 0.05; 양측 스튜던트스 t-테스트.
도 22는 SSP 후 인간 글루타메이트 tRNA를 합체하는 것이 SSP에 따른 HDV 리보자임과 비교하여 편집 효율에서 통계적으로 유의한 증가를 유도함을 나타낸다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다. * = P < 0.05; 양측 스튜던트스 t-테스트.
도 23은 SAMHD1p-와 리라이터 3.0의 공동발현이 흠집으로부터 돌연변이 65-nt를 정착하는 효율성을 극적으로 감소시켰음을 나타낸다. VPXROD의 추가 공동발현은 편집 효율을 SAMHD1p-의 부재에서 관찰된 효율의 78%로 복원했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플의 평균 ± 1 표준 편차이다.
도 24는 세포에서 함께 발현된 다양한 편집 구성요소의 편집 효율을 나타내는 그래프이다.
도 25a는 리라이터 작제물을 사용한 편집 효율을 나타내는 차트이다.
도 25b 및 25c는 가이드 RNA를 이용하여 수행된 일부 실험에 대한 정보를 예시한다.
도 25d는 2298T>C 돌연변이를 정착하기 위해 HEK293T를 RW2I 및 gRNA로 형질감염시키는 것이 인 실리코-예측된 표적-외 부위에서 스페이서의 상위 5개에서 돌연변이를 도입하지 않았음을 예시한다.
도 25e는 폴리A 트랙을 파괴하는 침묵 2307A>G 돌연변이를 포함하도록 RTT를 변형하는 것이 아데닌의 바람직하지 않은 삽입을 제거했음을 예시한다.
도 25f는 추가 RTT 길이를 스크리닝하는 것이 편집 효율을 41.6%로 증가시켰음을 예시한다.
도 25g는 스페이서의 PAM 서열을 파괴하는 RTT에서 침묵 돌연변이를 인코딩하는 것이 2298T>C 돌연변이를 정착하는 효율을 배가시켰음을 예시한다.
도 26은 가이드 핵산에서 벨크로(GPS로도 지칭됨)의 예시적인 구성을 나타낸다.
도 27은 일부 편집 시스템의 구성요소를 나타낸다.
도 28은 일부 편집 시스템 구성요소를 사용하여 수득된 편집 효율을 나타낸다.
도 29a-29f는 일부 편집 시스템의 사용 후 핵염기의 % 판독을 나타낸다.
도 30은 일부 편집 시스템의 구성요소를 나타낸다.
도 31a는 본 명세서에 기재된 일부 편집 구성요소로 처리 후 돌연변이를 갖는 판독의 %를 나타낸다.
도 31b는 야생형 세포에서 돌연변이를 갖는 판독의 %를 나타낸다.
도 32는 이중 가이드 시스템을 나타낸다.
도 33은 이중 가이드 시스템으로 편집 효율을 나타낸다.
도 1은 nCas9 및 몰로니 백혈병 바이러스 RT("mlvRT"), 및 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물("mlvRT 분할 스티치")을 포함하는 융합된 Cas9 닉카제(nCas9) 역전사효소(RT) 작제물("nCas9-mlvRT")의 편집 효율을 나타낸다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 별도 폴리펩티드 사슬 상에 포함한다. nCas9-LZ1은 류신 지퍼를 통해 mlvRT(서열번호: 13) 및 N-말단 류신 지퍼(서열번호: 24)를 포함하는 LZ2-mlvRT와 이종이량체화하는 C-말단 류신 지퍼(서열번호: 23) 및 SpCas9(서열번호: 32)를 포함한다. nCas9-mlvRT 작제물의 개략도 상단에 제공되어 있다.
도 2는 융합된 nCas9-RT 작제물("nCas9-mlvRT") 및 역전사효소에 융합된 nCas9 및 mcp 펩티드를 포함하는 분할 nCas9 및 mcp-mlvRT 작제물("mcp-mlvRTv")(서열번호: 27)의 편집 효율을 나타낸다. mcp 펩티드는 MS2 RNA 헤어핀과 상호작용한다. 분할 nCas9 및 mcp-mlvRT 작제물의 효율성은 gRNA 2.0를 포함하는 상이한 가이드 RNA(gRNA) 작제물(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")로 시험되었다.
도 3은 증가된 전사 연속성을 갖는 변형된 역전사효소를 포함하는 상이한 분할 nCas9-RT 작제물의 편집 효율을 나타낸다. 지오바실러스 스테아로테르모필루스(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레(ErRT, 서열번호: 4) 중 어느 하나로부터의 nCas9 및 역전사효소 및 R2 폴리단백질로부터의 아미노산 116-1016(R2(116-1016), 서열번호: 7)을 포함하는 작제물을 시험하였다. GsI-IICRT 역전사효소("스티치RT")의 개략도는 도 1 및 도 2에 사용된 mlvRT 역전사효소와 비교하여 도시된다.
도 4a는 본 개시내용의 조작된 gRNA("스티치 가이드")를 사용한 게놈 편집에 대한 방법을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위로 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥을 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합한다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화한다. 4-200 bp의 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합한다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥의 DNA는 흠집의 부위에서 표적 핵산에 합체될 수 있다.
도 4b는 pegRNA 또는 스티치 가이드 gRNA를 사용한 nCas9-RT 작제물의 편집 효율을 나타낸다. pegRNA와 스티치 가이드 gRNA의 개략도는 왼쪽에 도시되어 있다. 융합된 nCas9-mlvRTv 작제물이 이 검정에 사용되었다.
도 5a는 제1 가닥 프라이머 결합 부위의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'("흠집으로부터 nt")에 위치된 제2 가닥 프라이머(SSP) 20 뉴클레오티드(nt), 40 nt 또는 60 nt 길이를 포함하는 상이한 gRNA를 갖는 융합된 nCas9-RT 작제물("nCas9-mlvRTv")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA가 대조군으로 시험되었다. 모든 gRNA 서열은 HDV 리보자임(서열번호: 25)을 포함하였다.
도 5b는 제1 가닥 프라이머 결합 부위의 5' 말단의 6 nt, 36 nt, 또는 55 nt 3'("흠집으로부터 nt")에 위치된 제2 가닥 프라이머(SSP) 20 뉴클레오티드(nt), 40 nt 또는 60 nt 길이를 포함하는 상이한 gRNA를 갖는 nCas9-RT("nCas9-R2(116-1016)")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA가 대조군으로 시험되었다.
도 6은 nCas9-RT를 갖는 2개의 gRNA 시스템을 사용하는 게놈 편집의 4가지 방식을 예시한다. 2개의 가이드가 각각 편집된 가닥을 생성하는 2개의 단일 가이드 시스템(왼쪽 상단)에서, 각 gRNA는 상이한 nCas9에 결합하고 2개의 gRNA는 각각 역전사효소 주형 영역을 포함한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 2개의 단일 가이드 시스템(오른쪽 상단)에서, 각 gRNA는 상이한 nCas9에 결합하고 gRNA 중 하나만 역전사효소 주형 영역을 포함한다. 두 가이드가 각각 편집을 생성하는 이중 가이드 복합체 시스템(왼쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; 2개의 gRNA는 각각 역전사효소 주형 영역 및 프라이머 결합 부위(PBS) 영역을 포함한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 이중 가이드 복합체 시스템(오른쪽 아래)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고, 제2 gRNA의 스페이서는 제2 nCas9에 결합하고, 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고, 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; gRNA 중 하나만 역전사효소 주형 영역을 포함한다.
도 7은 유전자 편집의 효율을 증가시키는 방법을 예시한다. 제2 가이드가 반대쪽 가닥에 흠집을 내는 2개의 단일 가이드 시스템 또는 제2 가이드가 반대쪽 가닥에 흠집을 내는 이중 가이드 복합 시스템으로, 반대쪽 가닥 상의 흠집은 새롭게 합성된 DNA의 표적 핵산 안으로 합체를 용이하게 한다. 제2 가이드는 제1 새롭게 합성된 가닥의 영역에 역상보적인 플랩을 생성한다. 제1 합성 가닥은 제2 가닥 합성을 위한 주형으로 작용한다.
도 8a는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 제1 가닥 프라이머 결합 부위의 gRNA 5'의 영역에 역상보적인 역전사효소 주형 영역의 5'에 위치된 5 내지 200개의 뉴클레오티드를 포함한다.
도 8b는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 역전사효소 주형 영역의 영역에 역상보적인 제1 가닥 프라이머 결합 부위의 3'에 위치된 5 내지 100개의 뉴클레오티드를 포함한다.
도 9a는 도 8a 및 도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-mlvRTv 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역(도 8a에 예시된 바와 같이 "V1")의 5'에 위치된 15 nt 벨크로 영역, 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위(도 8b에 예시된 바와 같이 "V2")의 3'에 위치된 벨크로 영역을 사용하여 비교되었다. gRNA는 107 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위를 함유했다. 편집은 흠집의 2 뉴클레오티드 3'에서 시작하는 ATCC 서열이 CATA로 돌연변이되도록 수행되었다.
도 9b는 도 8a 및 도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-R2(116-1016) 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 벨크로 결합 부위의 말단과 프라이머 결합 부위의 시작 사이에 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역(도 8a에 예시된 바와 같이 "V1")의 5'에 위치된 15 nt 벨크로 영역, 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위(도 8b에 예시된 바와 같이 "V2")의 3'에 위치된 벨크로 영역을 사용하여 비교되었다.
도 10은 도 7에 도시된 바와 같은 2개의 gRNA 시스템의 편집 효율을 나타낸다. 청색 형광 단백질(BFP)을 인코딩하는 표적 핵산은 정지 코돈을 도입하도록 편집되었다. 세포에서 BFP 형광의 결여는 성공적인 편집을 나타낸다. BFP에 대해 음성인 세포의 백분율("% BFP-")로 측정된 편집 효율은 세포 단독(gRNA 없음), 단일 gRNA(3' 연장을 결하는 gRNA 2, 스텁이 없는 gRNA 1, 스텁이 있는 gRNA 1) 및 2개의 gRNA(스텁이 없는 gRNA 1 플러스 gRNA 2 및 스텁이 있는 gRNA 1 및 gRNA 2)에 대해 측정되었다.
도 11a는 프라임 편집기 2 시스템("PE2", 상단), 분할 프라임 편집기 2 시스템("분할 PE2", 중간), 및 2개의 류신 지퍼가 있는 분할 스티치 작제물("분할 스티치", 하단)의 도메인 배열을 나타낸다. 오른쪽에는 가이드 핵산과 복합체화된 2개의 류신 지퍼(LZ1 및 LZ2)에 의해 연결된 Cas9 닉카제(nCas9) 및 역전사효소(RT)를 포함하는 분할 스티치 작제물의 구조적 개략도이다. 분할 스티치 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 개별 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다.
도 11b는 다른 gRNA를 갖는 도 11a에 예시된 작제물의 편집 효율을 나타낸다. 편집 효율은 BFP를 GFP로 전환하기 위해 편집된 세포의 백분율(% GFP+)로 측정되었다. 편집 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다.
도 12a는 표적 핵산의 플랩에 대한 프라이머 결합 부위(PBS)의 혼성화의 속도를 가속화하기 위해 벨크로 영역이 없는(왼쪽) 또는 있는(중간 및 오른쪽) gRNA 작제물을 예시한다. V1 배열에서 벨크로 영역은 gRNA의 5' 말단 또는 그 근처에 위치될 수 있고 프라이머 결합 부위의 gRNA 5'의 영역("벨크로 V1", 중간)에 혼성화할 수 있다. V2 배열에서 벨크로 영역은 프라이머 결합 부위의 3'에 위치될 수 있고 gRNA의 5' 말단 또는 그 근처의 영역("벨크로 V2," 오른쪽)에 혼성화할 수 있다.
도 12b는 도 12a에 제공된 gRNA 작제물의 예측된 3-차원 구조를 예시한다. 벨크로 영역을 결하는 gRNA는 왼쪽에 도시되어 있다. 벨크로 V1 영역 또는 벨크로 V2 영역을 포함하는 gRNA는 각각 중간 및 오른쪽 패널에 표시된다.
도 12c는 129 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위 및 20 뉴클레오티드 벨크로 영역을 갖는 gRNA의 편집 효율을 나타낸다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 편집 효율은 원래의 gRNA("원래의 코딩") 또는 2차 구조를 제거하기 위해 gRNA 연장의 RT 주형 영역에서 침묵 돌연변이로 재코딩된 gRNA("재코딩됨")에 대해 비교되었다.
도 12d는 벨크로 서열의 상이한 길이를 갖는 gRNA의 편집 효율을 나타낸다. 각각의 gRNA는, 왼쪽 상의 개략도에 도시된 바와 같이, 5'에서 3'의 순서로 RT 주형, 프라이머 결합 부위, 벨크로 영역을 함유했다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. gRNA는 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위를 가졌다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다.
도 13a는 벨크로 영역과 2nd 가닥 프라이머를 포함하는 pegRNA 및 스티치 gRNA의 개략도(상단) 및 스티치 gRNA를 이용한 게놈 편집의 방법(하단)을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산 가닥에 흠집을 낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합화한다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화한다. 4-200 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 역할을 한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합화한다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안으로 통합될 수 있다.
도 13b는 다양한 길이의 것이고 닉킹 부위로부터 다양한 거리에서 혼성화하는 gRNA 제2 가닥 프라이머(SSP)의 편집 효율을 나타낸다. 흠집에서 6, 36 또는 55 뉴클레오티드에 위치된 제2 가닥 프라이머 20, 40 또는 60 뉴클레오티드(nt) 길이가 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다.
도 13c는 벨크로 영역 또는 제2 가닥 프라이머가 없는("벨크로 없음, SSP 없음"), 19 뉴클레오티드 벨크로 영역이 있는("19 nt 벨크로"), 또는 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머 둘 모두가 있는("19 nt 벨크로, 20 nt SSP") gRNA의 편집 효율을 나타낸다.
도 14a는 mlvRT 역전사효소에서 돌연변이에 대한 스크리닝 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, 또는 L671P 단일 점 돌연변이를 함유하는 mlvRT 작제물(각각 서열번호: 41 - 서열번호: 70)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 1 뉴클레오티드 갭, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균±일 표준 편차로서 도시된다.
도 14b는 mlvRT 역전사효소에서 돌연변이의 조합에 대한 스크리닝 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 T197A 및 D653N; T197A 및 T664N; T197A 및 L671P; T197A, D653N, T664N 및 L671P; 또는 P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P를 함유하는 mlvRT 작제물(각각 서열번호: 71 - 서열번호: 75)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15a는 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 예시한다. CDK1을 결하는 비-분열 세포에서, 인산화되지 않은 SAMHD1은 dNTP를 절단하여 세포에서 이용가능한 dNTP를 감소시킨다. 분열하는 세포에서 CDK1은 SAMHD1을 인산화하여 SAMHD1이 dNTP를 절단하는 것을 방지하고 세포에서 dNTP의 증가된 이용가능성을 초래한다. SAMHD1에서 단일 점 돌연변이(T592A)는 CDK1에 의한 SAMHD1의 인산화를 방지하여, 구성적으로 활성인 SAMHD1과 세포에서 dNTP의 낮은 이용가능성을 초래한다. T592A 돌연변이 SAMHD1을 사용하여 도 15b, 도 15d 및 도 15e에 도시된 검정에서 낮은 dNTP 환경을 유도하였다. Vpx의 추가는 SAMHD1을 억제하여 세포에서 dNTP의 증가된 이용가능성을 초래한다.
도 15b는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 Q221R; V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 76 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15c는 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 77 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15d는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15e는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15f는 RW2I로 VPXRH2-1 및 SAMHD1(T592A)의 공동발현이 VPX 없이 SAMHD1(T592A)을 발현함에 의해 야기된 편집 효율에서의 감소를 완전히 역전시켰다는 것을 나타낸다.
도 16은 닉킹 활성을 위해 변형되고 류신 지퍼를 통해 역전사효소에 연결된 Cas9 작제물의 편집 효율을 나타낸다. S. 피오게네스 Cas9("SpCas9") 작제물은 Cas9 닉카제(nCas9)를 생성하는 H840A 돌연변이를 함유했다. 시스테인 잔기를 D1079C, S1173C 또는 D1180C에서 Cas9 닉카제 안으로 도입하여 엑스테인-인테인 융합체로서의 발현을 위해 Cas9를 분할 인테인 Cas9(iCas9)로 분할할 수 있었다. H840A 및 D1079C(류신 지퍼를 갖는 서열번호: 85), H840A 및 S1173C(류신 지퍼를 갖는 서열번호: 86), 또는 H840A 및 D1180C(류신 지퍼를 갖는 서열번호: 87) 점 돌연변이를 함유하고 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 류신 지퍼 Cas9 작제물이 시험되었다. H840A 돌연변이를 함유하지만 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 부가 시스테인(류신 지퍼를 갖는 서열번호: 84)이 없는 Cas9 닉카제가 대조군으로 사용되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17a는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)에 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17b는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)과 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 18은 제2 가닥 프라이머의 바로 3'인, gRNA의 3' 말단에서 HDV 리보자임(왼쪽 막대) 또는 tRNA(오른쪽 막대)를 포함하는 gRNA의 존재에서 류신 지퍼 Cas9-RT 작제물의 편집 효율을 나타낸다. 류신 지퍼 Cas9-RT 작제물은 nCas9-LZ1(서열번호: 1) 및 LZ2-mlvRT5M(서열번호: 2)로 발현되었고, 류신 지퍼를 통해 연결되었다. tRNA는 서열번호: 94(GGTCCCATGGTGTAATGGTTAGCACTCTGGACTTTGAATCCAGCGATCCGAGTTCAAATCTCGGTGGGACCT)에 상응하는 서열을 가졌다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역, 20 뉴클레오티드 제2 가닥 프라이머, 및 제2 가닥 프라이머의 HDV 리보자임 또는 tRNA 3'을 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 19a는 AAV에 적합하거나 AAV 내에 적합하지 않은 일부 정밀 편집 작제물의 능력을 나타낸다. 프라임 편집기 2(PE2)와 분할 PE2 둘 모두는 몰로니 백혈병 바이러스 역전사효소 펜타뮤턴트(mlvRT5M)에 융합된 닉킹 Cas9(nCas9)를 이용할 수 있으며, 이는 AAV 내에 패키징되기에는 너무 큰 ORF에 의해 인코딩될 수 있다. AAV를 갖는 nCas9 및 mlvRT5M을 전달할 수 있는 아키텍처가 개발되었으며, 각각은 AAV의 운반 용량보다 각각 작은 2개의 ORF에 의해 인코딩되었다. 리라이터 a1(RWa1)은 nCas9, mlvRT5M에 융합된 MS2 코트 단백질(MCP) 펩티드 및 MCP 펩티드가 특이적으로 결합할 수 있는 MS2 헤어핀을 포함하는 gRNA를 활용할 수 있다. RWb1은 이종이량체화 류신 지퍼를 활용하여 nCas9 및 mlvRT5M을 공동국소화할 수 있다. RWc1은 AAV에 각각 맞는 ORF를 사용하여 nCas9-mlvRT5M 단백질을 생성하기 위해 Npu 인테인으로 분할될 수 있는 새로운 돌연변이체 nCas9를 활용할 수 있다. RWd1은 조작된 임의의 모집 구성요소 없이 nCas9 및 mlvRT5M을 공동발현할 수 있다.
도 19b는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 인테인 촉매작용 및 mlvRT5M을 제공하기 위한 시스테인 치환을 포함하는 nCas9의 C-말단 단편에 융합된 Npu C-말단 인테인과 쌍을 이루는 Npu N-말단 인테인에 융합된 nCas9의 N-말단 단편의 패널을 테스트한 결과 잔기 1172와 1173(nCas9(1-1172)-NpuN 및 nCas9(1173-1368; S1173C)-mlvRT5M) 사이의 Ser1173Cys nCas9-mlvRT5M 돌연변이체를 분할하는 것이 PE2보다 적어도 약 2-배 더 큰 편집 효율을 초래했다는 것이 밝혀졌다.
도 19c는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 표준 gRNA 스캐폴드로 RWa1, RWb1 및 RWc1을 동시형질감염하면 모두 40% 초과의 편집 효율을 초래했다. 40% 초과의 편집 효율은 RTT-PBS-MS2 gRNA 확장 아키텍처와 쌍을 이루는 RW1M과 50% 초과의 편집을 달성하는 RW1L 둘 모두에서 달성되었다. MS2 헤어핀을 함유하지 않는 gRNA의 nCas9 및 MCP-mlvRT5M 작제물과의 공동발현은 MS2 헤어핀(RWd1)을 포함하는 gRNA와 비교하여 대략적으로 동일한 편집 효율을 초래했다.
도 19d는 일부 편집 작제물로 형질도입된 세포에서의 GFP 발현을 나타낸다. 각 바이러스에 대해 2.8 x 105의 MOI에서 2개의 별도 AAV2 작제물로 패키징된 RWc1을 갖는 BFP를 발현하는 HEK293 세포를 형질도입하는 것은 74.8% GFP+ 세포를 초래했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다.
도 20a는 효소 및 가이드 RNA의 일부 공간적 배향을 나타낸다. RTT의 역전사는 일부 경우에 PBS가 게놈 플랩에 혼성화한 후에만 개시될 수 있다. RTT의 3' 영역과 혼성화하는 RTT의 서열 5'(GPS V1) 또는 RTT의 5' 부분과 혼성화하는 PBS의 서열 3'(GPS V2)을 삽입하면 PBS가 게놈 플랩에 더 가깝게 근접되도록 재배향할 수 있다.
도 20b는 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. RWb1 및 107-nt RTT를 포함하는 가이드 RNA는 14% GFP+ 세포를 초래했으며, 이는 더 짧은 13-nt RTT를 사용하여 달성된 38%보다 현저하게 낮다. 20-nt GPS V2(RWb2)를 추가하면 편집 효율이 ~27%까지 증가했다.
도 20c는 일부 편집 작제물을 포함하는 세포에서 GFP 발현을 나타낸다. 129-nt 주형을 사용하여 흠집의 부위로부터 3-nt 돌연변이 65-nt를 정착하면 GPS V2를 합체함에 의해 4-배 증가되었다.
도 21은 일부 편집 작제물을 포함하는 세포에서의 GFP 발현을 나타낸다. 벨크로와 SSP가 동시적으로 사용될 수 있어, ~41% 편집을 초래할 수 있다(리라이터 3.2). SSP가 제공하는 효율에서의 증가는 SSP의 말단 3-nt가 제1 합성 가닥에 상보적이지 않을 때 폐지되었다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다. * = P < 0.05; 양측 스튜던트스 t-테스트.
도 22는 SSP 후 인간 글루타메이트 tRNA를 합체하는 것이 SSP에 따른 HDV 리보자임과 비교하여 편집 효율에서 통계적으로 유의한 증가를 유도함을 나타낸다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플에서 평균 ± 1 표준 편차로 표시된다. * = P < 0.05; 양측 스튜던트스 t-테스트.
도 23은 SAMHD1p-와 리라이터 3.0의 공동발현이 흠집으로부터 돌연변이 65-nt를 정착하는 효율성을 극적으로 감소시켰음을 나타낸다. VPXROD의 추가 공동발현은 편집 효율을 SAMHD1p-의 부재에서 관찰된 효율의 78%로 복원했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플의 평균 ± 1 표준 편차이다.
도 24는 세포에서 함께 발현된 다양한 편집 구성요소의 편집 효율을 나타내는 그래프이다.
도 25a는 리라이터 작제물을 사용한 편집 효율을 나타내는 차트이다.
도 25b 및 25c는 가이드 RNA를 이용하여 수행된 일부 실험에 대한 정보를 예시한다.
도 25d는 2298T>C 돌연변이를 정착하기 위해 HEK293T를 RW2I 및 gRNA로 형질감염시키는 것이 인 실리코-예측된 표적-외 부위에서 스페이서의 상위 5개에서 돌연변이를 도입하지 않았음을 예시한다.
도 25e는 폴리A 트랙을 파괴하는 침묵 2307A>G 돌연변이를 포함하도록 RTT를 변형하는 것이 아데닌의 바람직하지 않은 삽입을 제거했음을 예시한다.
도 25f는 추가 RTT 길이를 스크리닝하는 것이 편집 효율을 41.6%로 증가시켰음을 예시한다.
도 25g는 스페이서의 PAM 서열을 파괴하는 RTT에서 침묵 돌연변이를 인코딩하는 것이 2298T>C 돌연변이를 정착하는 효율을 배가시켰음을 예시한다.
도 26은 가이드 핵산에서 벨크로(GPS로도 지칭됨)의 예시적인 구성을 나타낸다.
도 27은 일부 편집 시스템의 구성요소를 나타낸다.
도 28은 일부 편집 시스템 구성요소를 사용하여 수득된 편집 효율을 나타낸다.
도 29a-29f는 일부 편집 시스템의 사용 후 핵염기의 % 판독을 나타낸다.
도 30은 일부 편집 시스템의 구성요소를 나타낸다.
도 31a는 본 명세서에 기재된 일부 편집 구성요소로 처리 후 돌연변이를 갖는 판독의 %를 나타낸다.
도 31b는 야생형 세포에서 돌연변이를 갖는 판독의 %를 나타낸다.
도 32는 이중 가이드 시스템을 나타낸다.
도 33은 이중 가이드 시스템으로 편집 효율을 나타낸다.
CRISPR-Cas 시스템을 사용한 정확하고 효율적인 게놈 편집을 위한 방법 및 조성물이 본 명세서에 개시되어 있다. 데아미나제에 연결된 Cas9 닉카제(nCas9)를 포함하는 Cas9-기반 염기 편집기는 전이 돌연변이(예를 들어, A에서 G로 또는 C에서 T로)를 수행하는 것으로 제한될 수 있다. 역전사효소(RT)(예를 들어 몰로니 백혈병 바이러스 RT)에 연결된 nCas9를 포함하는 다른 Cas9-기반 편집기(예를 들어 "프라임 편집기")는 작은 삽입, 결실 또는 단일 뉴클레오티드 변경으로 제한될 수 있다. Cas 닉카제 및 역전사효소 작제물, 조작된 가이드 핵산, 및 게놈 편집의 개선된 효율, 다용도성, 정밀도 및 전달성을 위한 이의 사용 방법이 본 명세서에서 제공된다.
본 명세서에 기재된 방법 및 조성물은 Cas9 및 RT를 분할, 이량체화 또는 공동발현하는 것을 포함할 수 있다. Cas9 및 RT의 분할, 이량체화 또는 공동발현하는 것은 AAV 패키징을 가능하게 할 수 있다. Cas9 및 RT의 분할, 이량체화 또는 공동발현하는 것은 편집 효율을 증가시킬 수 있다.
AAV 전달가능한 정밀 편집 구성요소가 본 명세서에 기재되어 있다. 일부 실시형태는 Cas9 구성요소 및 RT 구성요소를 전달하는 AAV 입자를 포함한다. AAV와 함께 Cas+RT 시스템을 전달하기 위한 다양한 예가 제공된다. 제공된 예는 전형적인 AAV 운반 용량(예를 들어 약 4.5kb) 내에 맞게 정밀 편집 구성요소를 얻는 이전의 어려움을 극복할 수 있다.
또한 편집 효율을 향상시키는 점 돌연변이 또는 삽입 돌연변이와 같은 돌연변이가 제공된다. 예를 들어 Cas 닉카제 또는 RT(예를 들어 점 돌연변이 또는 삽입 돌연변이)가 포함된다. 일부 실시형태는 아미노산 돌연변이로 게놈 편집을 위한 mlvRT를 포함한다.
닉킹 Cas9 및 역전사효소 효소
Cas 닉카제를 포함하는 조성물이 본 명세서에서 제공된다. 역전사효소를 포함하는 조성물이 본 명세서에서 제공된다. Cas 닉카제 및 역전사효소를 포함하는 조성물이 본 명세서에서 제공된다. Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함될 수 있다. Cas 닉카제와 역전사효소는 완전하게 별도의 폴리펩티드 사슬에 있을 수 있다. 일부 실시형태는 Cas 닉카제의 기능적 단편을 포함한다. 일부 실시형태는 역전사효소의 기능적 단편을 포함한다.
Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성할 수 있다. Cas-역전사효소 이종이량체는 제1 이종이량체 도메인을 포함할 수 있다. 제1 이종이량체 도메인은 Cas 닉카제에 융합될 수 있다. Cas-역전사효소 이종이량체는 제2 이종이량체 도메인을 포함할 수 있다. 제2 이종이량체 도메인은 역전사효소에 융합될 수 있다. 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합할 수 있다. 이 결합은 Cas-역전사효소 이종이량체를 형성할 수 있다. 제1 이종이량체 도메인은 류신 지퍼를 포함할 수 있다. 제2 이종이량체 도메인은 류신 지퍼를 포함할 수 있다. 제1 또는 제2 이종이량체 도메인은 류신 지퍼 이외의 이종이량체 도메인, 예를 들어 본 명세서에 기재된 바와 같은 SpyCatcher 또는 SpyTag 모이어티를 포함할 수 있다.
Cas 프로그램가능한 뉴클레아제를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제를 포함할 수 있다. Cas 닉카제를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas 프로그램가능한 뉴클레아제는 Cas 닉카제를 포함할 수 있다. Cas 닉카제는 Cas9 닉카제(nCas9)를 포함할 수 있다. Cas9 프로그램가능한 뉴클레아제는 nCas9를 포함할 수 있다. Cas 닉카제는 Cas9 뉴클레아제 도메인을 돌연변이시킴에 의해 생성될 수 있다. Cas 닉카제는 이중-가닥 파손 이외의 단일-가닥을 생성할 수 있다.
역전사효소(RT)를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas 닉카제 및 RT를 포함하는 조작된 작제물이 본 명세서에서 제공된다. Cas9 닉카제 및 RT를 포함하는 조작된 작제물이 본 명세서에서 제공된다. nCas9는 표적 핵산의 표적 부위에 단일 가닥 파손(SSB)을 도입할 수 있다. 역전사효소는 표적 부위에 삽입되는 서열의 역전사를 촉매할 수 있다. 일부 실시형태에서, nCas9-RT 작제물은 nCas9-RT 작제물에 융합될 수 있다. 융합된 nCas9-RT 작제물은 단일 폴리펩티드 사슬에 nCas9 및 역전사효소를 포함할 수 있다. 일부 실시형태에서, nCas9-RT 작제물은 분할 nCas9-RT 작제물일 수 있다. 분할 nCas9-RT 작제물은 제1 폴리펩티드 사슬에 nCas9 및 제2 폴리펩티드 사슬에 역전사효소를 포함할 수 있다. nCas9 및 분할 nCas9-RT 작제물의 역전사효소는 공동-발현될 때 이종이량체를 형성할 수 있다. 일부 실시형태에서, 제1 이량체화 도메인은 nCas9의 N-말단에 위치될 수 있다. 일부 실시형태에서, 제1 이량체화 도메인과 이량체화하는 제2 이량체화 도메인은 역전사효소의 C-말단에 위치될 수 있다. 일부 실시형태에서, 제1 이량체화 도메인은 nCas9의 C-말단에 위치될 수 있다. 일부 실시형태에서, 제1 이량체화 도메인과 이량체화하는 제2 이량체화 도메인은 역전사효소의 N-말단에 위치될 수 있다. 제1 이량체화 도메인은 류신 지퍼, FKBP, FRB, 칼시뉴린 A, CyP-Fas, GyrB, GAI, GID1, SNAP 태그, Halo 태그, Bcl-xL, Fab, 또는 LOV 도메인을 포함할 수 있다. 제2 이량체화 도메인은 류신 지퍼, FKBP, FRB, 칼시뉴린 A, CyP-Fas, GyrB, GAI, GID1, SNAP 태그, Halo 태그, Bcl-xL, Fab, 또는 LOV 도메인을 포함할 수 있다. 이량체화는 유도되거나 자발적일 수 있다. 이량체화는 화학적으로 또는 광학적으로 유도될 수 있다. 서열번호: 1은 C-말단에 류신 지퍼를 포함하는 nCas9의 예를 제공한다. 서열번호: 2는 N-말단에 류신 지퍼를 포함하는 역전사효소의 예를 제공한다.
일부 실시형태에서, 본 개시내용의 작제물은 핵 국소화 신호(NLS)를 포함할 수 있다. 본 명세서에 기재된 조성물은 Cas 닉카제에 융합된 핵 국소화 신호를 포함할 수 있다. 일부 실시형태에서, NLS에 융합된 Cas 닉카제는 서열번호: 138에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 본 명세서에 기재된 조성물은 RT에 융합된 핵 국소화 신호를 포함할 수 있다. 일부 실시형태에서, NLS에 융합된 RT는 서열번호: 95에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다.
역전사효소는 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함할 수 있다. 비-장 말단 반복 역전사성 요소는 Cas 닉카제의 일부에 융합될 수 있다. 역전사효소는 박테리아 그룹 II 인트론으로부터의 서열을 포함할 수 있다. 박테리아 그룹 II 인트론은 Cas 닉카제의 일부에 융합될 수 있다. 역전사효소는 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함할 수 있다. 레트로바이러스 gag-pol 폴리단백질로부터 도메인은 Cas 닉카제의 일부에 융합될 수 있다.
이량체화는 SpyTag/SpyCatcher 또는 관련된 시스템을 사용하여 달성될 수 있다. 예를 들어, RT는 SpyTag 모이어티에 접합될 수 있고 Cas 닉카제는 SpyCatcher 모이어티에 접합될 수 있다. 대안적으로, Cas 닉카제는 SpyTag 모이어티에 접합될 수 있고, RT는 SpyCatcher 모이어티에 접합될 수 있다. SpyTag/SpyCatcher 시스템을 사용한 이량체화는 이량체화된 분자 사이의 공유 결합을 포함할 수 있다(예를 들어 Cas 닉카제는 SpyTag 및 SpyCatcher 모이어티를 통해 RT에 공유적으로 접합될 수 있다. SpyTag 또는 SpyCatcher 모이어티에 접합된 Cas 닉카제는 제1 AAV에 제공될 수 있다. SpyCatcher 또는 SpyTag 모이어티에 접합된 RT는 제2 AAV에 제공될 수 있다.
다양한 역전사효소는 본 개시내용의 조성물 및 방법과 일치한다. 본 명세서에 개시된 역전사효소는 지오바실러스 스테레오테르모필루스 RT(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레 RT(ErRT, 서열번호: 4), 마라톤 RT(서열번호: 5), BmR2RT(서열번호: 6), R2 폴리단백질로부터 아미노산 116-1016(R2(116-1016), 서열번호: 7), BmR2en-RT(서열번호: 8), humanL1RT(서열번호: 9), humanL1en-RT(서열번호: 10), murineL1RT(서열번호: 11), ltrA(서열번호: 12), mlvRT5M(서열번호: 13), mlvRT5M(서열번호: 40), mlvRT(서열번호: 14), XMRV3VP35RT(서열번호: 15), galvRT(서열번호: 16), sfvRT(서열번호: 17), foamvRT(서열번호: 18), HIVP66(서열번호: 19) , HIVP51(서열번호: 20), rsvAlpha(서열번호: 21), 또는 rsvBeta(서열번호: 22)일 수 있다. 본 개시내용의 전사효소는 N-말단 메티오닌을 포함할 수 있거나, 본 개시내용의 전사효소는 N-말단 메티오닌을 결할 수 있다. 예를 들어, 역전사효소는 N-말단 메티오닌이 제거된 서열번호: 3 - 서열번호: 6, 서열번호: 8 - 서열번호: 12, 서열번호: 17, 서열번호: 18, 또는 서열번호: 40 - 서열번호: 80 중 임의의 하나에 상응하는 서열을 가질 수 있다. 다른 예에서, 역전사효소는 메티오닌이 N-말단에 부가된 서열번호: 7, 서열번호: 13 - 서열번호: 16, 또는 서열번호: 19 - 서열번호: 22 중 임의의 하나에 상응하는 서열을 가질 수 있다. 역전사효소는 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80 또는 이의 단편 중 임의의 하나에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 100% 서열 동일성, 또는 그 사이의 임의의 백분율을 갖는 서열을 포함할 수 있다.
서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80, 그 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 갖는 서열을 갖는 역전사효소를 포함하는 조성물이 본 명세서에 개시된다. 역전사효소 또는 이의 단편은 Cas 닉카제에 융합될 수 있다. 일부 실시형태는 Cas 닉카제에 융합될 수 있는 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물을 포함한다. 일부 실시형태는 Cas 닉카제에 융합될 수 있는 박테리아 그룹 II 인트론으로부터의 서열을 포함하는 역전사효소를 포함한다. 일부 실시형태는 Cas 닉카제에 융합될 수 있는 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는 역전사효소를 포함한다. 역전사효소는 절삭될 수 있다.
제한된 dNTP 조건에서 게놈 편집 효율을 최적화하는 방법이 개시된다. 방법은 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체로 게놈 편집을 수행하는 것을 포함할 수 있다. mlvRT와 같은 본 명세서에 기재된 RT는 점 돌연변이와 같은 돌연변이를 포함할 수 있다. 점 돌연변이는 역전사효소의 위치 221에 있을 수 있다. mlvRT 또는 이의 변이체는 위치 221에서 점 돌연변이를 포함할 수 있다. 위치 221에서 점 돌연변이는 Q221R을 포함할 수 있다. 점 돌연변이는 역전사효소의 위치 223에 있을 수 있다. mlvRT 또는 이의 변이체는 위치 223에서 점 돌연변이를 포함할 수 있다. 위치 223에서 점 돌연변이는 V223A를 포함할 수 있다. 위치 223에서의 점 돌연변이는 V223M을 포함할 수 있다.
일부 실시형태는 낮은 dNTP 농도에서 그 촉매 효율을 증가시키도록 변형된 몰로니 백혈병 바이러스 역전사효소(mlvRT)로 게놈 편집을 수행하는 것을 포함하는, 게놈 편집 효율을 최적화하는 방법을 포함한다. 예를 들어, mvRT는 dNTP에 대한 그 Km을 줄이기 위해 변형될 수 있다.
본 개시내용의 역전사효소는 하나 이상의 돌연변이를 포함할 수 있다. 예를 들어, 역전사효소는 참조 역전사효소 서열(예를 들어, 서열번호: 81)에 비해 하나 이상의 돌연변이를 포함할 수 있다. 일부 실시형태에서, 역전사효소에서 점 돌연변이는 점 돌연변이를 결하는 참조 서열에 비해 Cas9-RT 작제물의 편집 효율을 증가시킬 수 있다. 역전사효소는 서열번호: 81에 비해 D200N, l603W, T330P, T306K, W313F, Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, L671P, Q221R, V223A, V223M 또는 이의 조합에 상응하는 하나 이상의 돌연변이를 포함할 수 있다. 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, L671, D524, P51, 또는 S67에서 하나 이상의 돌연변이(예를 들어, 점 돌연변이)를 포함할 수 있다. 역전사효소는 Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, D524A, P51L, 또는 S67R에 상응하는 하나 이상의 돌연변이(예를 들어, 점 돌연변이)를 포함할 수 있다. 하나 이상의 돌연변이는 서열번호: 81 또는 본 명세서에서 확인된 또 다른 서열과 관련될 수 있다. 하나 이상의 돌연변이는 서열번호: 81 또는 본 명세서에서 확인된 또 다른 서열에 아미노산 서열과 관련하여 적어도 75%, 적어도 80% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 동일 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 동일하거나 적어도 99% 동일할 수 있다. 일부 실시형태에서, 역전사효소는 D200N, 1603W, T330P, T306K, 및 W313F(예를 들어, 서열번호: 13 또는 서열번호: 40)에 상응하는 돌연변이를 포함할 수 있다. 일부 실시형태에서, 역전사효소는 D200N, 1603W, T330P, T306K, 및 W313F에 상응하는 돌연변이 및 하나 이상의 부가 돌연변이(예를 들어, 서열번호: 41 - 서열번호: 80)를 포함할 수 있다.
RT는 도 14b에 포함된 하나 이상의 돌연변이를 포함할 수 있다. 예를 들어, RT는 위치 51, 67, 84, 139, 197, 204, 435, 524, 653, 664, 또는 671, 또는 이의 조합에서의 돌연변이를 포함할 수 있다. RT는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524, 또는 이의 조합에서의 돌연변이를 포함할 수 있다. RT는 위치 51, 67, 84, 139, 197, 204, 435, 524, 653, 664, 및 671에서의 돌연변이를 포함할 수 있다. 돌연변이는 적어도 하나의 점 돌연변이를 포함할 수 있다. 적어도 하나의 점 돌연변이는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A, 또는 이의 조합에 있을 수 있다. RT는 위치 51에서의 돌연변이를 포함할 수 있다. 위치 51에서의 돌연변이는 P51L을 포함할 수 있다. RT는 위치 67에서의 돌연변이를 포함할 수 있다. 위치 67에서의 돌연변이는 S67R을 포함할 수 있다. RT는 위치 84에서의 돌연변이를 포함할 수 있다. 위치 84에서의 돌연변이는 Q84A를 포함할 수 있다. RT는 위치 139에서의 돌연변이를 포함할 수 있다. 위치 139에서의 돌연변이는 L139P를 포함할 수 있다. RT는 위치 197에서의 돌연변이를 포함할 수 있다. 위치 197에서의 돌연변이는 T197A를 포함할 수 있다. RT는 위치 204에서의 돌연변이를 포함할 수 있다. 위치 204에서의 돌연변이는 H204R을 포함할 수 있다. RT는 위치 435에서의 돌연변이를 포함할 수 있다. 위치 435에서의 돌연변이는 L435G를 포함할 수 있다. RT는 위치 524에서의 돌연변이를 포함할 수 있다. 위치 524에서의 돌연변이는 D524A를 포함할 수 있다. RT는 위치 653에서의 돌연변이를 포함할 수 있다. 위치 653에서의 돌연변이는 D653N을 포함할 수 있다. RT는 위치 664에서의 돌연변이를 포함할 수 있다. 위치 664에서의 돌연변이는 T664N을 포함할 수 있다. RT는 위치 671에서의 돌연변이를 포함할 수 있다. 위치 671에서의 돌연변이는 L671P를 포함할 수 있다. RT는 예를 들어, 상기 돌연변이의 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10, 또는 초과를 포함할 수 있다. RT는 mlvRT를 포함할 수 있다. RT는 mlvRT5M을 포함할 수 있다. 하나 이상의 돌연변이를 갖는 RT는 본 명세서에 제공된 RT 서열과 관련하여 하나 이상의 돌연변이를 포함할 수 있다. 하나 이상의 돌연변이는 하나 이상의 돌연변이를 갖지 않는 조성물과 관련하여 본 명세서에 기재된 조성물의 편집 효율을 증가시킬 수 있다. 돌연변이는 삽입 돌연변이이거나 이를 포함할 수 있다. 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524, 또는 이의 조합의 바로 상류(예를 들어, 아미노 말단 방향으로) 삽입 돌연변이를 포함한다. 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524 또는 이의 조합의 바로 하류(예를 들어, 카르복시 말단 방향으로) 삽입 돌연변이를 포함한다. 삽입 돌연변이는 점 돌연변이에 대해 본 명세서에 개시된 아미노산의 삽입을 포함할 수 있으며, 여기서 점 돌연변이는 아미노산에 대한 것이다.
일부 실시형태에서, 역전사효소는 위치 P51, S67, Q84, L139, T197, D200, H204, Q221, V223, T306, W313, T330, L435, D524, D653, T6164, 또는 L600, 또는 이의 조합에서 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524, 또는 이의 조합에서 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 위치 Q84, L139, Q221, V223, T664, 또는 L671, 또는 이의 조합에서 점 돌연변이를 갖는다.
일부 실시형태에서, 역전사효소는 P51L, S67R, Q84A, L139P, T197A, D200N, H204R, Q221R, V223A, V223M, T306K, W313F, T330P, L435G, D524A, D653N, T664N, L671P, 또는 L603W, 또는 이의 조합을 포함하는 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A, 또는 이의 조합을 포함하는 점 돌연변이를 갖는다. 일부 실시형태에서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A, 또는 이의 조합을 포함하는 점 돌연변이를 갖는다.
본 개시내용의 역전사효소는 루프 영역(예를 들어, 2a 루프 또는 3a 루프)을 포함할 수 있다. 본 개시내용의 역전사효소는 20 이상, 40 이상, 45 이상, 50 이상, 60 이상, 81 이상, 100 이상, 500 이상, 1000 이상, 2000 이상, 3000 이상, 4000 이상, 5000 이상, 6000 이상, 7000 이상, 8000 이상, 9000 이상, 또는 10,000 이상 뉴클레오티드의 편집 서열을 전사할 수 있다. 본 개시내용의 역전사효소는 최대 약 20, 최대 약 40, 최대 약 45, 최대 약 50, 최대 약 60, 최대 약 81, 최대 약 100, 최대 약 500, 최대 약 1000, 최대 약 2000, 최대 약 3000, 최대 약 4000, 최대 약 5000, 최대 약 6000, 최대 약 7000, 최대 약 8000, 최대 약 9000, 또는 최대 약 10,000 뉴클레오티드의 편집 서열을 전사할 수 있다. 본 개시내용의 역전사효소는 20 내지 10,000 뉴클레오티드의 편집 서열을 전사할 수 있다.
본 개시내용의 역전사효소는 증가된 연속성을 가질 수 있다. 연속성은 단일 결합 이벤트에서 역전사효소에 의해 촉매되는 포스포디에스테르 결합의 수에 의해 결정될 수 있다. 연속성은 천연 역전사효소와 비교될 수 있다. 역전사효소는 mlvRT와 비교하여 증가된 연속성을 포함할 수 있다. 증가된 연속성을 갖는 역전사효소는 표적 핵산의 표적 부위에서 더 긴 서열을 편집할 수 있다. 예를 들어, 증가된 연속성을 갖는 역전사효소는 프로그램가능한 뉴클레아제의 편집 윈도우 길이를 증가시킬 수 있다. 역전사효소는 mlvRT에 비해 표적 서열에서 더 긴 윈도우 길이를 편집할 수 있다. 증가된 연속성을 갖는 역전사효소는 삽입 서열을 포함할 수 있다. 일부 실시형태에서, 연속성을 증가시키는 삽입은 도메인 2와 3 사이 또는 도메인 3과 4 사이의 역전사효소 안으로 삽입될 수 있다. 증가된 연속성을 갖는 역전사효소는 결실을 포함할 수 있다. 예를 들어, 증가된 연속성을 갖는 역전사효소는 RNase 도메인을 결하거나 연결 도메인을 결할 수 있다. 증가된 연속성을 갖는 역전사효소는 단일 결합 이벤트에서 20 이상, 40 이상, 45 이상, 50 이상, 60 이상, 81 이상, 100 이상, 500 이상, 1000 이상, 2000 이상, 3000 이상, 4000 이상, 5000 이상, 6000 이상, 7000 이상, 8000 이상, 9000 이상, 또는 10,000 이상 포스포디에스테르 결합을 촉매할 수 있다. 증가된 연속성을 갖는 역전사효소는 단일 결합 이벤트에서 최대 약 20, 최대 약 40, 최대 약 45, 최대 약 50, 최대 약 60, 최대 약 81, 최대 약 100, 최대 약 500, 최대 약 1000, 최대 약 2000, 최대 약 3000, 최대 약 4000, 최대 약 5000, 최대 약 6000, 최대 약 7000, 최대 약 8000, 최대 약 9000, 또는 최대 10,000 포스포디에스테르 결합을 촉매할 수 있다.
일부 실시형태에서, 역전사효소는 mlvRT보다 표적 핵산의 표적 부위에서 더 긴 서열을 편집한다. 역전사효소는 프로그램가능한 뉴클레아제의 편집 윈도우 길이를 증가시킬 수 있다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 삽입 서열을 포함할 수 있다. 일부 실시형태에서, 삽입은 도메인 2와 3 사이 또는 도메인 3과 4 사이의 표적 부위에서 더 긴 서열을 편집하는 역전사효소 안으로 삽입된다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 결실을 포함할 수 있다. 예를 들어, 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 RNase 도메인을 결할 수 있거나 연결 도메인을 결할 수 있다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 단일 결합 이벤트에서 20 이상, 40 이상, 45 이상, 50 이상, 60 이상, 81 이상, 100 이상, 500 이상, 1000 이상, 2000 이상, 3000 이상, 4000 이상, 5000 이상, 6000 이상, 7000 이상, 8000 이상, 9000 이상, 또는 10,000 이상 포스포디에스테르 결합을 촉매할 수 있다. 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 단일 결합 이벤트에서 최대 약 20, 최대 약 40, 최대 약 45, 최대 약 50, 최대 약 60, 최대 약 81, 최대 약 100, 최대 약 500, 최대 약 1000, 최대 약 2000, 최대 약 3000, 최대 약 4000, 최대 약 5000, 최대 약 6000, 최대 약 7000, 최대 약 8000, 최대 약 9000, 또는 최대 10,000 포스포디에스테르 결합을 촉매할 수 있다. 일부 실시형태에서, 표적 부위에서 더 긴 서열을 편집하는 역전사효소는 또한 본 명세서에 기재된 바와 같이 증가된 연속성을 갖는다.
본 발명의 역전사효소는 작은 역전사효소일 수 있다. 작은 역전사효소는 더 큰 역전사효소와 비교하여 세포로의 개선된 전달을 가질 수 있다. 역전사효소는 mlvRT와 비교하여 세포로의 개선된 전달을 포함할 수 있다. 작은 역전사효소는 더 큰 역전사효소와 비교하여 세포에서 개선된 발현을 가질 수 있다. 작은 역전사효소는 약 400 이하, 약 420 이하, 약 427 이하, 약 440 이하, 약 450 이하, 약 500 이하, 약 550 이하, 약 560 이하, 약 599 이하, 약 600 이하, 약 650 이하, 약 677 이하, 약 682 이하, 약 700 이하, 약 750 이하, 약 761 이하, 약 762 이하, 약 800 이하, 약 850 이하, 약 900 이하, 약 901 이하, 약 950 이하, 약 1000 이하, 약 1100 이하, 약 1114 이하, 약 1200 이하, 약 1275 이하, 약 1281 이하, 또는 약 1300 이하의 아미노산 잔기를 포함할 수 있다. 본 개시내용의 작제물은 작은 역전사효소, 이량체화 영역, 국소화 영역, 또는 이의 조합을 포함할 수 있다. 작은 역전사효소는 증가된 연속성을 가질 수 있거나, 표적 부위에서 더 긴 서열을 편집할 수 있거나 이의 조합을 가질 수 있다.
본 개시내용의 역전사효소는 몰로니 백혈병 바이러스 역전사효소와 비교하여 감소된 면역원성을 가질 수 있다. 감소된 면역원성을 갖는 역전사효소는 또한 작은 역전사효소일 수 있고, 증가된 연속성을 가질 수 있고, 표적 부위에서 더 긴 서열을 편집하거나, 이의 임의의 조합일 수 있다.
Cas 닉카제 또는 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물이 본 명세서에 개시되어 있다. 본 개시내용과 일치하는 Cas 닉카제 또는 Cas9 프로그램가능한 뉴클레아제의 예는 SpCas9(서열번호: 32), SaCas9(서열번호: 33), CjCas9(서열번호: 34), GeoCas9(서열번호: 35), HpaCas9(서열번호: 36), 및 NmeCas9(서열번호: 37)를 포함한다. 일부 실시형태에서, Cas 닉카제는 서열번호: 32-37 중 임의의 하나에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. 본 개시내용의 Cas9 프로그램가능한 뉴클레아제는 천연 Cas9 프로그램가능한 뉴클레아제에 관하여 돌연변이, 삽입, 결실 또는 절단을 포함할 수 있다.
Cas 닉카제는 돌연변이를 포함할 수 있다. 돌연변이는 인테인 촉매작용을 가능하게 하거나 개선할 수 있다. 돌연변이는 삽입 돌연변이일 수 있다. 돌연변이는 점 돌연변이일 수 있다. Cas 닉카제는 시스테인 점 돌연변이를 포함할 수 있다. 시스테인 점 돌연변이는 Cas 닉카제의 C-말단 절반에 위치될 수 있다. 본 명세서에 기재된 Cas9는 Cas9의 C-말단 절반에 시스테인 점 돌연변이를 포함할 수 있다. 시스테인 점 돌연변이는 Cas 닉카제의 아미노산 위치 574 이후 어느 곳에나 위치될 수 있다. 돌연변이는 S. 피오게네스 Cas9 닉카제에 있을 수 있다. 시스테인 점 돌연변이는 S1173을 포함할 수 있다. 시스테인 점 돌연변이는 D1079를 포함할 수 있다. 시스테인 점 돌연변이는 D1180을 포함할 수 있다.
Cas9 닉카제(S. 피오게네스 Cas9 닉카제)는 점 돌연변이를 포함할 수 있다. 점 돌연변이는 인테인 촉매작용을 가능하게 할 수 있다. 점 돌연변이는 인테인 촉매작용을 개선할 수 있다. 일부 실시형태에서, 점 돌연변이는 시스테인 점 돌연변이, 세린 점 돌연변이, 트레오닌 점 돌연변이, 또는 알라닌 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 시스테인 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 세린 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 트레오닌 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 알라닌 점 돌연변이를 포함한다. 일부 실시형태에서, 점 돌연변이는 D1079에 위치된다. 일부 실시형태에서, 점 돌연변이는 D1125에 위치된다. 일부 실시형태에서, 점 돌연변이는 D1130에 위치된다. 일부 실시형태에서, 점 돌연변이는 G1133에 위치된다. 일부 실시형태에서, 점 돌연변이는 A1140에 위치된다. 일부 실시형태에서, 점 돌연변이는 I1168에 위치된다. 일부 실시형태에서, 점 돌연변이는 S1173에 위치된다. 일부 실시형태에서, 점 돌연변이는 D1180에 위치된다. 일부 실시형태에서, 점 돌연변이는 G1186에 위치된다. 일부 실시형태에서, 점 돌연변이는 L1203에 위치된다. 일부 실시형태에서, 점 돌연변이는 R1212에 위치된다. 일부 실시형태에서, 점 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 위치된다.
Cas9 닉카제(S. 피오게네스 Cas9 닉카제)는 삽입 돌연변이를 포함할 수 있다. 삽입 돌연변이는 인테인 촉매작용을 가능하게 할 수 있다. 삽입 돌연변이는 인테인 촉매작용을 개선할 수 있다. 일부 실시형태에서, 삽입 돌연변이는 시스테인 삽입 돌연변이, 세린 삽입 돌연변이, 트레오닌 삽입 돌연변이, 또는 알라닌 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 시스테인 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 세린 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 트레오닌 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 알라닌 삽입 돌연변이를 포함한다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1079에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1125에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1130에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1133에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1140에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1168에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1173에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1180에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1186에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1203에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 아미노산 위치 1212에 위치된다. 일부 실시형태에서, 삽입 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212 바로 전에 위치된다.
Cas 닉카제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나의 서열을 포함할 수 있다. 일부 실시형태에서, Cas 닉카제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 서열을 포함한다. Cas 닉카제는 2개 이상의 분절로 발현될 수 있다. 시스테인 점 돌연변이는 Cas 닉카제의 C-말단 부분의 N-말단에 위치될 수 있다. 제1 분절은 서열번호: 90의 서열을 포함할 수 있다.
이종이량체화 도메인을 포함하지 않는 Cas 닉카제 및 역전사효소를 포함하는 조성물이 본 명세서에 개시된다. 예를 들어, Cas 닉카제 및 역전사효소는 이종이량체화되도록 조작되지 않을 수 있다. 그럼에도 Cas 닉카제 및 역전사효소는 이종이량체화할 수 있고 상기 조작 또는 이종이량체화 도메인 없이 핵산 편집을 수행할 수 있다. Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함할 수 있다.
Cas 닉카제 및 역전사효소, 또는 Cas 닉카제 및 역전사효소를 인코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 조성물이 본 명세서에 개시되며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부가 적어도 2개의 별도의 폴리펩티드 사슬에 포함되고, 여기서 적어도 2개의 별도의 폴리펩티드 사슬은 서로 결합하는 이종이량체 도메인을 포함하는 별도의 폴리펩티드 사슬을 포함한다. 별도의 폴리펩티드 사슬은 이종이량체 도메인을 포함하는 융합 단백질을 포함할 수 있다. 이종이량체 도메인은 별도의 폴리펩티드 사슬에 융합될 수 있다. 이종이량체 도메인은 별도의 폴리펩티드 사슬의 아미노 또는 카르복시 말단에 융합될 수 있다. 이종이량체 도메인은 류신 지퍼를 포함할 수 있다. 이종이량체 도메인은 PDZ 도메인을 포함할 수 있다. 이종이량체 도메인은 스트렙타비딘을 포함할 수 있다. 이종이량체 도메인은 스트렙타비딘 결합 단백질을 포함할 수 있다. 이종이량체 도메인은 폴돈 도메인을 포함할 수 있다. 이종이량체 도메인은 소수성 폴리펩티드를 포함할 수 있다. 이종이량체 도메인은 항체를 포함할 수 있다. 이종이량체 도메인은 노브, 홀, 류신 지퍼, 코일링된 코일, 또는 정전기 상호작용을 형성할 수 있는 극성 아미노산 잔기를 포함할 수 있다. 이종이량체 도메인은 IgM(MHD2) 또는 IgE(EHD2)의 중쇄 도메인 2(CH2), 면역글로불린 Fc 영역, IgG 또는 IgA의 중쇄 도메인 3(CH3), IgM 또는 IgE의 중쇄 도메인 4(CH4), Fab, Fab2, 류신 지퍼 모티프, 바나제-바스타 이량체, 미니항체, 또는 ZIP 미니항체 중 임의의 것을 포함할 수 있다. 이종이량체 도메인은 피브리틴 폴돈 도메인을 포함할 수 있다. 이종이량체 도메인은 류신 지퍼, 폴돈 도메인, 단편 X, 콜라겐 도메인, 2G12 IgG 동종이량체, 미토콘드리아 항바이러스-시그널링 단백질 CARD 필라멘트, 심장 포스포람반 막횡단 오량체, 부갑상선 호르몬 이량체화 도메인, 글리코포린 A 막횡단, HIV Gp41 삼량체화 도메인, 또는 HPV45 종양단백질 E7 C-말단 이량체 도메인을 포함할 수 있다. 이종이량체 도메인은 Fc 도메인을 포함할 수 있다. 이종이량체 도메인은 류신 지퍼 도메인, PSD95-Dlgl-zo-1(PDZ) 도메인, 스트렙타비딘, 스트렙타비딘 결합 단백질(SBP), mTOR의 FKBP 결합 도메인(FRB), 사이클로필린-Fas 융합 단백질(CyP-Fas), 칼시뉴린 A(CNA) 및 FK506 결합 단백질(FKBP), Snap 태그, Halo 태그, PYL 또는 ABI를 포함할 수 있다. 이종이량체 도메인은 본 명세서에 기재된 이종이량체 도메인의 결합 단편을 포함할 수 있다.
인테인 기술을 사용한 분할 Cas9 작제물의 발현
일부 실시형태에서, Cas9 작제물(예를 들어, Cas9-RT)은 하나 이상의 인테인에 융합된 하나 이상의 엑스테인으로서 분할 작제물로서 발현될 수 있다. 인테인 기술은 단백질을 2개 이상의 더 짧은 펩티드 분절(엑스테인)로 발현시킴에 의해 세포 내로 큰 단백질을 전달하는 데 사용될 수 있다. 각각의 엑스테인은 인테인 펩티드(예를 들어, Npu C 인테인 또는 Npu N 인테인)와의 융합으로서 발현될 수 있다. 인테인은 2개 이상의 엑스테인의 융합을 자가촉매할 수 있고 그 상응하는 엑스테인으로부터 인테인의 절단을 자가촉매할 수 있다. 결과는 제2 엑스테인에 융합되고 인테인을 결하는 제1 엑스테인을 포함하는 단백질 복합체일 수 있다. 인테인은 엑스테인의 N-말단에 위될 수 있거나 인테인은 엑스테인의 C-말단에 위치될 수 있다. 엑스테인은 (예를 들어, 엑스테인의 C-말단의 말단에 융합된 인테인을 갖는 엑스테인의 C-말단의 말단에서) 인테인에 인접하게 위치된 시스테인 잔기를 포함할 수 있다. Cas 닉카제는 2개 이상의 분절로 발현될 수 있다. 제1의 Cas 닉카제 분절은 Cas 닉카제의 N-말단 부분을 포함할 수 있다. Cas 닉카제의 제1 분절은 제1 인테인을 포함할 수 있다. Cas 닉카제의 제2 분절은 Cas 닉카제의 C-말단 부분을 포함할 수 있다. Cas 닉카제의 제2 분절은 제2 인테인을 포함할 수 있다. 인테인은 Cas 닉카제의 N-말단 부분의 C-말단에 융합될 수 있다. 인테인은 Cas 닉카제의 C-말단 부분의 N-말단에 융합될 수 있다.
엑스테인-인테인 융합을 인코딩하는 핵산 서열은 전달 벡터(예를 들어, 아데노-연관된 바이러스(AAV) 벡터) 내에 피팅될 수 있다. 일부 실시형태에서, 인테인에 융합된 펩티드 분절 엑스테인을 인코딩하는 벡터는 세포에 전달될 수 있다. 일부 실시형태에서, 엑스테인-인테인 융합은 세포에서 발현될 수 있다. 제1 엑스테인-인테인 융합 펩티드는 하나 이상의 추가의 엑스테인-인테인 융합 펩티드에 융합될 수 있고, 인테인은 인테인을 결하는 큰 단백질 작제물을 생성하기 위해 절제될 수 있다. 일부 실시형태에서, 단백질은 엑스테인 융합 및 인테인 절제를 촉진하기 위해 시스테인 잔기를 도입하는 점 돌연변이를 포함할 수 있다. 일부 실시형태에서, 본 개시내용의 Cas9-RT는 2개 이상의 엑스테인-인테인 융합 펩티드로서 발현될 수 있다. 일부 실시형태에서, 본 개시내용의 Cas9(예를 들어, 서열번호: 32 - 서열번호: 37 또는 서열번호: 84 - 서열번호: 87)는 Cas9-RT 융합을 생성하기 위한 둘 이상의 엑스테인-인테인 융합 펩티드로서 본 개시내용의 역전사효소(예를 들어, 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80)와 연계하여 발현될 수 있다. 예를 들어, Cas9-RT는 nCas9(1-1172) - Npu N 인테인을 포함하는 제1 Cas9-RT 엑스테인-융합 및 Npu C 인테인 - nCas9(1173-1368) - mlvRT5M을 포함하는 제2 Cas9-RT 엑스테인-융합으로 발현될 수 있다. nCas9(1-1172)는 닉킹 Cas9의 잔기 1-1172(예를 들어, 서열번호: 84 - 서열번호: 87 중 임의의 하나의 잔기 1-1172)에 상응할 수 있다. nCas9(1173-1368)는 위치 1173에 시스테인을 갖는 닉킹 Cas9의 잔기 1173-1368(예를 들어, 서열번호: 86의 잔기 1-1172)에 상응할 수 있다. mlvRT5M은 5개 점 돌연변이를 포함하는 역전사효소(예를 들어, 서열번호: 13 또는 서열번호: 40)에 상응할 수 있다. 분절은 서열번호: 91의 서열을 포함할 수 있다. 분절은 Cas 닉카제(예를 들어, Cas 닉카제의 C-말단 부분)에 융합된 역전사효소를 포함할 수 있다. 역전사효소는 Cas 닉카제의 C-말단 부분의 C-말단에 융합된 N-말단을 포함할 수 있다. 역전사효소는 mlvRT 또는 이의 변이체를 포함할 수 있다.
가이드 핵산
프로그램가능한 뉴클레아제(예를 들어, nCas9)를 표적 핵산으로 지향시키는 가이드 핵산(예를 들어, gRNA)이 본 명세서에서 제공된다. 본 개시내용의 가이드 핵산은 표적 핵산의 표적 부위 안으로 삽입되어 지는 핵산 서열의 합성을 용이하게 할 수 있다. 본 개시내용의 가이드 핵산은 표적 핵산의 표적 부위에서 핵산 서열의 편집을 용이하게 할 수 있다.
일부 실시형태에서, 본 개시내용의 가이드 핵산은 표적 핵산의 제1 영역에 역상보적인 스페이서, Cas 닉카제에 결합하도록 구성된 스캐폴드, 표적 핵산 내로 합체되는 서열을 인코딩하는 역전사효소 주형(RTT), 표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위, 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머, 또는 이의 조합을 포함할 수 있다. 일부 실시형태에서, 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있다. 일부 실시형태에서, 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적이다. 일부 실시형태에서, 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성된다. 일부 실시형태에서, 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터의 역전사를 위한 주형으로서 기능하도록 구성된다. 일부 실시형태에서, 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터 전사를 위한 프라이머로서 기능하도록 구성된다. 일부 실시형태에서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형일 수 있다.
본 개시내용의 가이드 핵산은 RTT를 포함할 수 있다. 이 방식으로 삽입되는 핵산 서열은 PAM에 돌연변이를 가질 수 있다. 이것은 이미 삽입된 핵산 서열의 재-편집을 방지할 수 있다. RTT는 프로토스페이서 인접 모티프(PAM) 서열을 파괴하는 변형을 포함할 수 있다. RTT는 하나 이상의 PAM 서열을 파괴하는 둘 이상의 변형을 포함할 수 있다. 변형은 PAM 서열과 부분적으로 상보적인 서열을 포함할 수 있다. 변형은 PAM 서열과의 불일치를 포함할 수 있다. PAM 서열은 표적 핵산에서 파괴될 수 있다. 표적 핵산은 파괴 이전에 자연적으로 발생하는 PAM 서열을 포함할 수 있다. PAM 서열은 2-6개 염기쌍 핵산 서열을 포함할 수 있다. PAM 서열의 예는 5'-NGG-3'이다. PAM 서열의 다른 예는 5'-TTTN-3' 또는 5'-YTN-3'을 포함한다. 임의의 이들 PAM 서열은 RTT에서 변형될 수 있다. 이러한 변형의 일부 예는 삽입, 결실 또는 점 돌연변이를 포함할 수 있다. PAM 서열은 Cas 닉카제에 의해 인식될 수 있다. 변형되거나 파괴된 PAM 서열은 일부 경우에 Cas 닉카제에 의해 인식되지 않을 수 있다. 변형은 게놈에서 PAM을 파괴하거나 제거하는 서열을 포함할 수 있다.
역전사효소 주형은 게놈에서 모노뉴클레오티드 트랙을 파괴하는 변형을 포함할 수 있다. 변형은 모노뉴클레오티드 트랙과 부분적으로 상보적인 서열을 포함할 수 있다. 변형은 모노뉴클레오티드 트랙과의 불일치를 포함할 수 있다. 역전사효소 주형은 게놈에서 하나 이상의 모노뉴클레오티드 트랙을 파괴하는 둘 이상의 변형을 포함할 수 있다. 변형은 게놈에서 모노뉴클레오티드 트랙을 파괴하거나 제거하는 서열을 포함할 수 있다. 가이드 핵산은 표적 핵산에서 동일한 염기의 적어도 4개 연속적인 뉴클레오티드의 하나 이상의 트랙을 제거하는 역전사효소 주형에 하나 이상의 변형을 포함할 수 있다.
표적 핵산은 폴리A 트랙 또는 긴 폴리A 트랙을 포함할 수 있다. RTT는 긴 폴리A 트랙을 포함할 수 있다. 폴리A 트랙을 파괴하도록 RTT에 변형을 도입하는 것을 편집 효율을 개선할 수 있다. 일부 실시형태에서, RTT는 동일한 뉴클레오티드 염기인 적어도 4개의 연속적인 뉴클레오티드의 트랙을 제거하거나 변형하는 하나 이상의 변형을 추가로 포함한다. 역전사효소 주형에서 하나 이상의 변형은 표적 핵산에서 동일한 염기의 연속적인 뉴클레오티드(예를 들어, 적어도 4개의 연속적인 뉴클레오티드)의 하나 이상의 트랙을 제거할 수 있다. RTT는 4개 이상의 연속적인 A 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 T 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 G 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 C 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 4개 이상의 연속적인 U 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 3개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 3개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 4개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 4개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 5개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 5개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 6개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 6개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 7개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 7개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 8개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있으며, 여기서 8개 이상의 연속적인 뉴클레오티드는 모두 서로 동일한 핵염기를 포함한다. RTT는 동일한 염기를 포함하는 5, 6, 7, 8, 9, 10개 이상의 연속적인 뉴클레오티드를 제거하는 변형을 포함할 수 있다. RTT는 동일한 염기를 연속적으로 포함하는 연속적인 뉴클레오티드를 더 이상 포함하지 않도록 동일한 염기를 연속적으로 포함하는 4, 5, 6, 7, 8, 9, 10개 이상의 연속적인 뉴클레오티드를 변형하는 변형을 포함할 수 있다.
변형은 비변형된 가이드 핵산과 관련된 돌연변이를 포함할 수 있다. 돌연변이는 침묵 돌연변이일 수 있다. 일부 경우에, 돌연변이는 침묵 돌연변이가 아니다.
가이드 핵산은 유전자 편집을 개선하기 위해 가이드 핵산 상의 다른 영역 자체에 결합하는 영역을 포함할 수 있다. 본 개시내용의 가이드 핵산은 벨크로 영역을 포함할 수 있다. 벨크로 영역은 "벨크로 결합 부위"로 지칭되는 가이드 핵산의 다른 영역에 결합하는 가이드 핵산의 영역을 포함할 수 있다. 예를 들어, 벨크로 영역은 유전자 편집을 개선하기 위해 가이드 핵산의 다른 영역에 결합하는 가이드 핵산의 영역을 포함할 수 있다. 벨크로 결합 부위에 벨크로 영역의 결합은 가이드 핵산의 구조를 변경할 수 있다. 벨크로 결합 부위에 벨크로 영역의 결합에 의한 가이드 핵산의 변경된 구조는 유전자 편집을 향상시킬 수 있다. 가이드 핵산은 gRNA 위치화 시스템(GPS)을 포함할 수 있다. 벨크로 영역 또는 GPS는 gRNA의 영역(예를 들어 벨크로 결합 부위 또는 GPS 결합 부위)에 혼성화할 수 있다. 벨크로 영역 또는 GPS는 역전사효소 주형의 영역에 혼성화할 수 있다. "벨크로"와 "GPS"는 상호교환가능하게 사용될 수 있다. 예를 들어, "벨크로 영역"은 "GPS 영역"으로 지칭될 수 있으며, 그 반대의 경우도 마찬가지이다. 또는 "벨크로 결합 부위"는 "GPS 결합 부위"로 지칭될 수 있으며, 그 반대의 경우도 마찬가지이다. 벨크로 영역은 역전사효소 주형 영역의 영역에 혼성화할 수 있다. 벨크로 영역을 포함하는 gRNA는 제2 가닥 프라이머를 포함할 수 있다. 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, 벨크로 영역, RT 주형, SSP, 리보자임 또는 이의 조합을 포함할 수 있다. 예를 들어, 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, 벨크로 영역, RT 주형, SSP 및 리보자임을 포함할 수 있다. 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP, 리보자임 또는 이의 조합을 포함할 수 있다. 예를 들어, 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP 및 리보자임을 포함할 수 있다. 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP, 리보자임, 또는 프라이머 결합 부위(PBS), 또는 이의 조합을 포함할 수 있다. 예를 들어, 벨크로 영역을 포함하는 gRNA는 스페이서, 스캐폴드 영역, RT 주형, 벨크로 영역, SSP, 리보자임 및 PBS를 포함할 수 있다. 벨크로 영역을 포함하는 gRNA의 예는 도 8a 및 도 8b와 도 12a 및 도 12b에 도시되어 있다. 벨크로 영역은 표적 부위에서 표적 핵산 내로 삽입되는 핵산 서열의 역전사를 용이하게 할 수 있다.
GPS 영역을 포함하는 가이드 핵산은 가이드 RNA를 포함할 수 있다. GPS 영역을 포함하는 가이드 핵산은 가이드 RNA 이외의 가이드 핵산을 포함할 수 있다. GPS 결합 부위를 포함하는 가이드 핵산은 가이드 RNA를 포함할 수 있다. GPS 결합 부위를 포함하는 가이드 핵산은 가이드 RNA 이외의 가이드 핵산을 포함할 수 있다.
벨크로 영역은 합성일 수 있다. 벨크로 결합 부위는 합성일 수 있다. 벨크로 영역과 벨크로 결합 부위는 gRNA 안으로 삽입될 수 있다. 예를 들어, 합성 벨크로 결합 부위는 gRNA에서 RT 주형의 gRNA 5'에 포함될 수 있다.
일부 실시형태에서, 벨크로 영역 또는 벨크로 결합 부위가 본 명세서에 개시되어 있다. 일부 실시형태에서, 핵산은 벨크로 영역을 포함한다. 일부 실시형태에서, 하나 이상의 바이러스 벡터(예를 들어 아데노바이러스)는 벨크로 영역을 포함하는 핵산을 포함한다. 일부 실시형태에서, 세포는 벨크로 영역을 포함하는 핵산을 포함한다. 일부 실시형태에서, 가이드 핵산은 벨크로 영역을 포함한다. 벨크로 영역은 벨크로 결합 부위에 혼성화할 수 있다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 또는 적어도 75% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 50% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 60% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 70% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 80% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 적어도 90% 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 100% 역상보적이다. 일부 실시형태에서, 역전사효소 주형 영역은 벨크로 결합 부위를 포함한다. 일부 실시형태에서, 벨크로 결합 부위는 프라이머 결합 부위(예를 들어 제1 가닥 프라이머 결합 부위, 또는 제2 가닥 프라이머 결합 부위)의 3'이다. 일부 실시형태에서, 벨크로 결합 부위는 프라이머 결합 부위의 5'이다. 일부 실시형태에서, 벨크로 영역은 역전사효소 주형의 3'이다. 일부 실시형태에서, 벨크로 영역은 역전사효소 주형의 5'이다. 일부 실시예에서 벨크로 영역은 스캐폴드의 5'이다. 일부 실시예에서, 벨크로 영역은 스캐폴드의 3'이다. 일부 실시형태에서, 스캐폴드는 표적 핵산(예를 들어 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산)에 상보적이다. 일부 실시형태에서, 합성 벨크로 서열은 PBS 후에 삽입되는 합성 벨크로 결합 부위에 대해 rev comp인 서열에 결합하는 RTT와 스캐폴드 사이에 삽입된다. 일부 실시형태에서, 벨크로 영역은 다른 벨크로 영역에 결합한다. 일부 실시형태에서, 벨크로 영역은 스페이서 서열의 PAM-근위 20 뉴클레오티드가 아닌 가이드 핵산의 영역에 혼성화한다.
일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 부분적으로 역상보적이다. 완벽한 상보성은 일부 경우에 절삭된 AAV 게놈에 기여할 수 있으므로 일부 돌출 또는 불완전한 상보성을 도입하면 AAV 패키징을 파괴함이 없이 GPS의 이점을 유지하는 데 도움이 될 수 있다. AAV 게놈 패키징은 일부 경우에 2차 구조에 의해 파괴될 수 있다. GPS는 파괴적인 2차 구조를 도입할 수 있다. 따라서, GPS와 GPS 결합 부위 간의 상보성의 정도를 감소시키는 것은 GPS에 의한 AAV 패키징의 파괴를 제거하는 경로를 제공한다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 50% 미만, 55% 미만, 60% 미만, 65% 미만, 70% 미만, 75% 미만, 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 99% 미만, 또는 100% 미만 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 99% 미만 또는 100% 미만 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 70% 미만의 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 80% 미만의 역상보적이다. 일부 실시형태에서, 벨크로 결합 부위는 벨크로 영역에 대해 90% 미만의 역상보적이다. 일부 실시형태는 본 명세서에 개시된 임의의 2개 백분율에 의해 한정된 역상보성의 범위를 포함한다.
벨크로 영역의 비-제한적인 예시적인 구성이 도 26에 도시되어 있다. GPS 영역은 가이드 핵산 내의 임의의 구성에 있을 수 있다. GPS 영역은 가이드 핵산의 5' 말단에 있을 수 있다. GPS 영역은 스페이서에 대해 5'일 수 있다. GPS 영역은 스페이서 및 그에 인접한 5'일 수 있다. GPS 영역은 스캐폴드에서 대해 5'일 수 있다. GPS 영역은 스캐폴드 및 그에 인접한 5'일 수 있다. GPS 영역은 RTT에 대해 5'일 수 있다. GPS 영역은 RTT 및 그에 인접한 5'일 수 있다. GPS 영역은 PBS에 대해 5'일 수 있다. GPS 영역은 PBS 및 그에 인접한 5'일 수 있다. GPS 영역은 가이드 핵산의 3' 말단에 있을 수 있다. GPS 영역은 스페이서에 대해 3'일 수 있다. GPS 영역은 스페이서 및 그에 인접한 3'일 수 있다. GPS 영역은 스캐폴드에 대해 3'일 수 있다. GPS 영역은 스캐폴드 및 그에 인접한 3'일 수 있다. GPS 영역은 RTT에 대해 3'일 수 있다. GPS 영역은 RTT 및 그에 인접한 3'일 수 있다. GPS 영역은 PBS에 대해 3'일 수 있다. GPS 영역은 PBS 및 그에 인접한 3'일 수 있다. GPS 영역은 스캐폴드 내에 있을 수 있다. GPS 영역은 RTT 내에 있을 수 있다. GPS 영역은 PBS 내에 있을 수 있다. 일부 실시형태는 제2 GPS 영역을 포함한다. 제2 GPS 영역은 전술한 위치 중 임의의 위치에 있을 수 있다. 제2 GPS 영역은 제2 GPS 결합 부위에 혼성화할 수 있다. GPS 영역은 제2 GPS 영역에 혼성화할 수 있다.
GPS 영역은 뉴클레오티드의 길이를 포함할 수 있다. 예를 들어, GPS 영역은 길이가 5-100 뉴클레오티드, 또는 길이가 약 5-100 뉴클레오티드일 수 있다. GPS 영역은 길이가 10-50 뉴클레오티드, 또는 길이가 약 10-50 뉴클레오티드일 수 있다. GPS 영역은 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 이상의 뉴클레오티드, 또는 전술한 숫자 중 임의의 2개에 의해 한정된 뉴클레오티드의 범위를 포함할 수 있다. GPS 영역은 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 또는 적어도 100개의 뉴클레오티드를 포함할 수 있다. 일부 경우에, GPS 영역은 5 이하, 10 이하, 15 이하, 20 이하, 25 이하, 30 이하, 35 이하, 40 이하, 45 이하, 50 이하, 55 이하, 60 이하, 65 이하, 70 이하, 75 이하, 80 이하, 85 이하, 90 이하, 95 이하, 또는 100 이하의 뉴클레오티드를 포함한다. GPS 영역은 20개 뉴클레오티드 길이일 수 있다. GPS 영역은 약 20개 뉴클레오티드 길이일 수 있다.
GPS 영역은 GPS 결합 부위에 혼성화할 수 있다. GPS 영역은 GPS 결합 부위에 상보적일 수 있다. GPS 영역은 GPS 결합 부위에 대해 100% 상보적일 수 있다. GPS 영역은 GPS 결합 부위에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 상보적일 수 있다. GPS 영역은 GPS 결합 부위에 대해 50% 미만, 60% 미만, 70% 미만, 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 또는 99% 미만 상보적일 수 있다.
GPS 영역은 GPS 결합 부위의 일부에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 상보적일 수 있다. 부분은 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 또는 적어도 100개 뉴클레오티드를 포함할 수 있다. 부분은 5 미만, 10 미만, 15 미만, 20 미만, 25 미만, 30 미만, 35 미만, 40 미만, 45 미만, 50 미만, 55 미만, 60 미만, 65 미만, 70 미만, 75 미만, 80 미만, 85 미만, 90 미만, 95 미만, 또는 100 미만의 뉴클레오티드를 포함할 수 있다.
GPS 영역은 GPS 결합 부위의 부분 (또는 제2 부분)에 대해 50% 미만, 60% 미만, 70% 미만, 80% 미만, 85% 미만, 90% 미만, 91% 미만, 92% 미만, 93% 미만, 94% 미만, 95% 미만, 96% 미만, 97% 미만, 98% 미만, 99% 미만 또는 100% 상보적일 수 있다. 부분 (또는 제2 부분)은 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 또는 적어도 100개 뉴클레오티드를 포함할 수 있다. 부분 (또는 제2 부분)은 5 미만, 10 미만, 15 미만, 20 미만, 25 미만, 30 미만, 35 미만, 40 미만, 45 미만, 50 미만, 55 미만, 60 미만, 65 미만, 70 미만, 75 미만, 80 미만, 85 미만, 90 미만, 95 미만, 또는 100 미만의 뉴클레오티드를 포함할 수 있다.
일부 예에서, GPS 영역은 GPS 결합 부위의 5-10 뉴클레오티드에 상보적이다. 일부 예에서, GPS 영역은 GPS 결합 부위의 5-10 뉴클레오티드에 대해 적어도 80% 상보적이다. 일부 예에서, GPS 영역은 GPS 결합 부위의 11-100 뉴클레오티드에 상보적이다. 일부 예에서, GPS 영역은 GPS 결합 부위의 11-100 뉴클레오티드에 대해 적어도 80% 상보적이다.
일부 실시형태에서, 본 개시내용의 gRNA는, 예를 들어 도 13a에 도시된 바와 같이 자가-절단 리보자임을 포함할 수 있다. 일부 실시형태에서, gRNA의 제2 가닥 프라이머 영역은 제1 합성된 가닥 상에 위치된 주형 영역에 대해 100% 서열 상보성을 포함할 수 있다. 일부 실시형태에서, 제2 가닥 프라이머의 전사는 gRNA의 3' 말단 및 제2 가닥 프라이머의 3'에서 폴리-U 서열(예를 들어, UUUUU)을 생성할 수 있다. 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 존재는 제2 가닥 프라이머의 기능을 억제할 수 있다. 리보자임 서열은 gRNA에 포함될 수 있어 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 형성을 방지한다. 리보자임은 gRNA를 자가촉매적으로 스스로 절단해낼 수 있다. 일부 실시형태에서, 리보자임은 제2 가닥 프라이머의 3'에 위치될 수 있다. 제2 가닥 프라이머의 3'에 위치된 리보자임은 gRNA에서 자가촉매적으로 스스로 절단될 수 있어, 폴리-U 서열 없이 온전한 제2 가닥 프라이머를 남긴다. 제2 가닥 프라이머의 리보자임(예를 들어 HDV 리보자임) 3'의 함입은 제2 가닥 프라이머 기능을 억제하는 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 형성 없이 주형에 대한 제2 가닥 프라이머의 100% 상보성을 가능하게 할 수 있다. 일부 실시형태에서, 자가-절단 리보자임을 포함하는 gRNA는 제2 가닥 프라이머의 3'에 위치된 자가-절단 리보자임 서열을 가질 수 있다. 일부 실시형태에서, 리보자임(예를 들어, HDV 리보자임)은 리보자임의 자가촉매적 절단에 이어 gRNA의 3' 말단에서 2'3' 고리형 포스페이트를 남길 수 있다. 2'3' 고리형 포스페이트는 제2 가닥 프라이머의 기능을 억제할 수 있다. 2'3' 고리형 포스페이트는 폴리뉴클레오티드 키나제를 사용하여 3' 하이드록실로 전환될 수 있다. 일부 실시형태에서, 폴리뉴클레오티드 키나제는 gRNA를 발현하는 세포에 존재하는 내인성 폴리뉴클레오티드 키나제이다. 일부 실시형태에서, 폴리뉴클레오티드 키나제는 외인성으로 발현된다.
일부 실시형태에서, tRNA는 리보자임 대신에 gRNA에 융합되어 제2 가닥 프라이머의 바로 3' 폴리-U 서열의 형성을 방지할 수 있다. 일부 실시형태에서, tRNA는 제2 가닥 프라이머의 3'에 위치될 수 있다. RNase P 효소는 나머지 gRNA 서열로부터 tRNA를 절단할 수 있다. 일부 실시형태에서, RNase P는 제2 가닥 프라이머의 3' 말단으로부터 tRNA를 절단하여, 제2 가닥 프라이머의 3' 말단에 3' 하이드록실을 남길 수 있다. 일부 실시형태에서, RNase P는 gRNA를 발현하는 세포에 존재하는 내인성 RNase P이다. 일부 실시형태에서, RNase P는 외인성으로 발현된다. 일부 실시형태에서, tRNA를 포함하는 gRNA는 제2 가닥 프라이머의 3'에 위치된 tRNA 서열을 가질 수 있다. tRNA는 RNase P에 의해 인식되는 임의의 tRNA에 상응하는 서열을 가질 수 있다. 일부 실시형태에서, tRNA는 서열번호: 94의 서열을 포함할 수 있다.
가이드 핵산은 스페이서를 포함할 수 있다. 스페이서는 표적 핵산의 제1 영역에 역상보적일 수 있다. 가이드 핵산은 스캐폴드를 포함할 수 있다. 스캐폴드는 Cas 닉카제에 결합할 수 있다. 가이드 핵산은 역전사효소 주형을 포함할 수 있다. 역전사효소 주형은 표적 핵산에 삽입되는 서열을 인코딩할 수 있다. 가이드 핵산은 제1 가닥 프라이머 결합 부위를 포함할 수 있다. 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 역상보적일 수 있다. 가이드 핵산은 제2 가닥 프라이머를 포함할 수 있다. 제2 가닥 프라이머는 역전사효소 주형의 영역의 서열을 포함할 수 있다.
일부 실시형태에서, 스캐폴드를 포함하는 가이드 핵산이 본 명세서에 개시되어 있다. 스캐폴드는 뉴클레아제에 결합할 수 있다. 스캐폴드는 Cas 뉴클레아제에 결합할 수 있다. 스캐폴드는 닉카제에 결합할 수 있다. 스캐폴드는 Cas 닉카제에 결합할 수 있다. 스캐폴드는 S. 피오게네스 Cas9 뉴클레아제에 결합할 수 있다. 스캐폴드는 S. 피오게네스 Cas9 닉카제에 결합할 수 있다. 스캐폴드는 스캐폴드 핵산 서열을 포함할 수 있다. 스캐폴드 핵산 서열은 서열번호: 139의 서열을 포함할 수 있다. 스캐폴드 핵산 서열은 서열번호: 139의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다.
일부 실시형태에서, 가이드 핵산(예를 들어, gRNA)이 본 명세서에 개시되어 있다. 가이드 핵산은 연장을 포함할 수 있다. 연장은 가이드 핵산의 5' 말단에 있을 수 있다. 연장은 가이드 핵산의 3' 말단에 있을 수 있다. 가이드 핵산은 연장을 포함하는 스캐폴드를 포함할 수 있다. 연장은 스캐폴드의 3' 말단 상에 있을 수 있다. 연장은 역전사효소 주형을 포함할 수 있다. 연장은 프라이머 결합 부위를 포함할 수 있다. 연장은 역전사효소 주형과 프라이머 결합 부위를 함유할 수 있다. 연장의 프라이머 결합 부위는 뉴클레아제 또는 닉카제에 의해 생성된 게놈 플랩에 혼성화할 수 있다. 연장은 벨크로 영역을 사용하여 방향이 지정될 수 있다. 연장은 벨크로 결합 부위를 사용하여 방향이 지정될 수 있다. 연장은 벨크로 영역과 벨크로 결합 부위를 사용하여 방향이 지정될 수 있다. 연장은 벨크로 영역을 포함할 수 있다. 벨크로 영역 (및 예를 들어, 벨크로 결합 부위에 대한 벨크로 영역의 결합)은 프라이머 결합 부위가 게놈 플랩 근처에 있도록 공간적으로 방향을 지정할 수 있다. 연장은 벨크로 결합 영역을 포함할 수 있다. 가이드 핵산은 연장의 외부에 벨크로 영역을 포함할 수 있다. 가이드 핵산은 연장의 외부에 벨크로 결합 영역을 포함할 수 있다.
표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있을 수 있다. 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있을 수 있다. 표적 핵산의 모든 제1 영역은 표적 핵산의 모든 제2 영역에 대해 역상보적일 수 있다. 표적 핵산의 모든 제1 영역은 표적 핵산의 제2 영역의 일부에 대해 역상보적일 수 있다. 표적 핵산의 제1 영역의 일부는 표적 핵산의 모든 제2 영역에 대해 역상보적일 수 있다. 표적 핵산의 제1 영역의 일부는 표적 핵산의 제2 영역의 일부에 대해 역상보적일 수 있다.
가이드 핵산은 절단가능한 서열을 포함할 수 있다. 절단가능한 서열은 가이드 핵산의 3' 말단에 있을 수 있다. 절단가능한 서열은 가이드 핵산의 5' 말단에 있을 수 있다. 절단가능한 서열은 리보자임 절단가능한 서열을 포함할 수 있다. 절단가능한 서열은 tRNA 절단가능한 서열을 포함할 수 있다. gRNA는 HDV 리보자임과 같은 자가 절단 리보자임을 포함할 수 있다. 리보자임은 제2 가닥 프라이머(SPP)의 3'일 수 있다. tRNA(예를 들어 인간 글루타메이트 tRNA)는 리보자임 대신 SPP 뒤에 합체될 수 있고, 이는 리보자임보다 편집 효율을 더 증가시킬 수 있다.
제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화할 수 있다. 역전사효소 주형은 역전사를 위한 주형으로 작용할 수 있다. 역전사는 표적 핵산의 제2 영역의 3' 말단에서 일어날 수 있다. 제2 가닥 프라이머는 주형으로부터 전사를 위한 프라이머로 작용할 수 있다. 주형은 역전사효소 주형에 대해 역상보적일 수 있다. 제1 합성 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로 작용할 수 있다.
제2 가닥 프라이머(SPP)는 gRNA에 포함될 수 있다. SPP는 길이가 약 10-30 또는 약 15-25 뉴클레오티드일 수 있다. SPP는 길이가 약 20 뉴클레오티드일 수 있다. 예를 들어 20 뉴클레오티드의 SPP의 함입은 편집의 효율성을 증가시킬 수 있다(예를 들어, 2x, 또는 약 20%에서 약 40%까지). SPP는 길이가 20, 40 또는 60 뉴클레오티드일 수 있거나, 전술한 뉴클레오티드 수 중 임의의 것에 의해 한정된 길이인 뉴클레오티드의 범위일 수 있다. 일부 실시형태는 제1 가닥에 상보적인 원하는 편집을 갖는 핵산(예를 들어, DNA) 가닥을 포함한다. 이는 RT가 제1 가닥을 주형으로 사용하는 것을 허용할 수 있다. SPP의 말단 3 뉴클레오티드는 제1 가닥에 상보적일 수 있다. SPP는 편집 부위에 3'인 제1 가닥의 일부에 혼성화할 수 있다. SPP는 2차 구조를 제거하도록 코딩되고, 이에 의해 편집 효율을 증가시킬 수 있다.
본 명세서에 기재된 조성물은 제1 가이드 핵산을 포함할 수 있다. 조성물은 제2 가이드 핵산을 포함할 수 있다. 제2 가이드 핵산은 본 명세서에 기재된 가이드 핵산을 포함할 수 있다. 제1 가이드 핵산은 제1 Cas 닉카제에 결합할 수 있다. 제2 가이드 핵산은 제2 Cas 닉카제에 결합할 수 있다. 제1 가이드 핵산의 제1 스페이서는 제1 Cas 닉카제를 결합할 수 있다. 제2 가이드 핵산의 제2 스페이서는 제2 Cas 닉카제를 결합할 수 있다. 제1 가이드 핵산의 제1 스캐폴드는 제2 Cas 닉카제를 결합할 수 있다. 제2 가이드 핵산의 제2 스캐폴드는 제1 Cas 닉카제를 결합할 수 있다. 제1 가이드 핵산은 제1 링커를 포함할 수 있다. 제2 가이드 핵산은 제2 링커를 포함할 수 있다. 제1 링커는 제2 링커에 혼성화할 수 있다.
가이드 핵산은 gRNA 2.0을 포함할 수 있다. 가이드 핵산은 13 뉴클레오티드 PBS를 포함할 수 있다. 가이드 핵산은 10-15 뉴클레오티드 PBS를 포함할 수 있다. 가이드 핵산은 13 뉴클레오티드 RTT를 포함할 수 있다. 가이드 핵산은 10-15 뉴클레오티드 RTT를 포함할 수 있다. RTT는 표적 핵산과 비교하여 돌연변이를 인코딩할 수 있다.
일부 실시형태에서, 제1 및 제2 가이드 핵산이 본 명세서에 개시되어 있다. 일부 실시형태에서, 제1 가이드 핵산은 역전사효소 주형(RTT)을 포함한다. 일부 실시형태에서, 제2 가이드 핵산은 역전사효소 주형을 포함한다. 제1 및 제2 가이드 핵산의 역전사효소 주형은 적어도 부분적으로 상보적일 수 있다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형의 일부는 제1 가이드 핵산의 역전사효소 주형의 일부에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형의 일부에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형의 일부는 제1 가이드 핵산의 역전사효소 주형에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형에 상보적이다. 일부 실시형태에서, 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형의 적어도 일부에 상보적(또는 적어도 부분적으로 상보적)이다. 제1 및 제2 가이드 핵산의 역전사효소 주형은 중첩하는 이중 연장된 fRNA의 것(ODEG)을 포함할 수 있으며 여기서 제2 gRNA의 역전사효소 주형의 일부는 제1 gRNA의 역전사효소 주형의 일부에 역상보적이다. 상보적인 부분은 적어도 5개 핵산, 적어도 10개 핵산, 적어도 20개 핵산, 적어도 30개 핵산, 적어도 40개 핵산, 적어도 50개 핵산, 적어도 60개 핵산, 적어도 70개 핵산, 적어도 80개 핵산, 적어도 90개 핵산, 적어도 100개 핵산, 또는 그 초과의 핵산을 포함할 수 있다. 상보적인 부분은 일부 경우에 5개 이하의 핵산, 10개 이하의 핵산, 20개 이하의 핵산, 30개 이하의 핵산, 40개 이하의 핵산, 50개 이하의 핵산, 60개 이하의 핵산, 70개 이하의 핵산, 80개 이하의 핵산, 90개 이하의 핵산, 100개 이하의 핵산 또는 더 적은 핵산을 포함할 수 있다.
가이드 핵산은 gRNA 위치화 시스템(GPS)을 포함할 수 있다. GPS는 가이드 핵산의 일부에 결합하는 RNA 서열을 포함할 수 있다. 이는 PBS를 gRNA의 5' 말단과 매우 근접하게 가져올 수 있다. GPS의 RNA 서열은 길이가 10, 15, 20, 25 또는 그 초과의 뉴클레오티드, 또는 전술한 정수 중 임의의 2개에 의해 한정된 길이인 뉴클레오티드의 범위일 수 있다. GPS를 사용하는 이점은 긴 RTT(예를 들어 적어도 20, 50 또는 100 뉴클레오티드의 RTT)를 사용할 때 편집 효율을 증가시키는 것을 포함할 수 있다.
GPS의 RNA 서열은 길이가 약 20 뉴클레오티드일 수 있다. GPS의 RNA 서열은 RTT의 일부에 혼성화할 수 있다. GPS의 RNA 서열이 혼성화하는 RTT의 부분은 길이가 10, 15, 20, 25 또는 그 초과의 뉴클레오티드, 또는 전술한 정수 중 임의의 2개에 의해 한정된 길이인 뉴클레오티드의 범위일 수 있다. GPS의 RNA 서열이 혼성화하는 RTT의 부분은 약 20 뉴클레오티드일 수 있다. GPS의 RNA 서열이 혼성화하는 RTT의 부분은 GPS와 동일하거나 대략 동일한 길이로 설계될 수 있거나, 그 반대도 마찬가지이다.
GPS는 버전 1 GPS를 포함할 수 있다. 가이드 핵산은 RTT의 5'에 삽입된 RNA 서열을 포함할 수 있다. RNA 서열은 RTT와 혼성화할 수 있다. RNA 서열은 RTT의 3' 영역과 혼성화할 수 있다.
GPS는 버전 2 GPS를 포함할 수 있다. 가이드 핵산은 PBS의 3'에 삽입된 RNA 서열을 포함할 수 있다. RNA 서열은 RTT와 혼성화할 수 있다. RNA 서열은 RTT의 5' 부분과 혼성화할 수 있다.
일부 경우에, 가이드 핵산은 하나의 가이드 핵산, 또는 하나의 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 단지 하나의 가이드 핵산, 또는 단지 하나의 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 하나 초과의 가이드 핵산, 또는 하나 초과의 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 2개의 가이드 핵산, 또는 2개 유형의 가이드 핵산을 포함한다. 일부 경우에, 가이드 핵산은 단지 2개의 가이드 핵산, 또는 단지 2개 유형의 가이드 핵산을 포함한다.
본 개시내용의 일부 양태는 단일 가이드 핵산 시스템을 포함한다. 일부 경우에 단일 가이드 핵산 시스템은 편집을 함유하지 않는 원래 게놈 가닥을 효율적으로 대체하지 않는 원하는 편집을 함유하는 플랩을 생성할 수 있다. 연장된 플랩의 게놈 안으로의 혼성화를 촉진하기 위한 조성물 또는 방법은 교체하고자 의도하는 게놈 가닥의 부근에서 연장된 플랩의 3' 말단을 앵커링할 수 있다. GPS-지원된 리앵커버 gRNA(GARG)가 이를 가능하게 할 수 있다. GARG는 연장된 플랩을 앵커링할 수 있다. GARG는 연장된 플랩의 3' 말단을 앵커링할 수 있다. 일부 실시형태에서, 가이드 핵산은 GARG를 포함한다.
GARG의 예가 도 32에 도시되어 있다. 도 32는 표적 핵산의 제1 영역을 표적화하는 스페이서뿐만 아니라, GPS-모집 가이드(GRG)라고 하는 다른 가이드에 의해 표적화된 게놈의 제2 영역에 혼성화하는 프라이머 결합 부위를 포함하는 GARG를 도시한다. GARG는 GRG의 일부인 GPS-결합 부위에 혼성화하도록 설계된 GPS 구성요소를 함유한다. 일부 실시형태에서, 가이드 핵산은 GRG를 포함한다. 일부 실시형태는 GARG 및 GRG를 포함하는 시스템을 포함한다. 시스템은 본 명세서에 기재된 것과 같은 다른 유전자 편집 구성요소를 포함할 수 있다.
가이드 핵산은 GARG를 포함할 수 있다. GARG는 스페이서를 포함할 수 있다. GARG의 스페이서는 표적 핵산의 제1 영역을 결합할 수 있다. GARG의 스페이서는 표적 핵산의 제1 영역에 역상보적일 수 있다. GARG는 RTT를 포함할 수 있다. RTT는 표적 핵산 안으로 삽입되는 서열을 인코딩할 수 있다. GARG는 스캐폴드를 포함할 수 있다. 스캐폴드는 Cas 뉴클레아제에 결합하거나 Cas 뉴클레아제에 결합하도록 구성될 수 있다. GARG는 프라이머 결합 부위(예를 들어 제1 프라이머 결합 부위)를 포함할 수 있다. GARG의 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산의 영역의 어떠한 부분도 포함하지 않는 표적 핵산 영역, 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산에 결합할 수 있다. GARG의 프라이머 결합 부위는 GARG의 스페이서에 상보적인 표적 핵산의 제1 영역의 어떠한 부분도 포함하지 않고, 제1 영역의 역상보체의 어떠한 부분도 포함하지 않는 표적 핵산의 영역에 결합할 수 있다. GARG의 프라이머 결합 부위는 표적 핵산의 제2 영역을 결합할 수 있다. GARG의 프라이머 결합 부위는 표적 핵산의 제2 영역에 역상보적일 수 있다. GARG는 GRG 결합 부위를 포함할 수 있다. GRG 결합 부위는 제2 가이드 핵산(GARG가 제1 가이드 핵산을 포함하는 경우)에 결합할 수 있다. 제2 가이드 핵산은 GRG를 포함할 수 있다. GRG 결합 부위는 GRG에 결합할 수 있다. GRG 결합 부위는 GRG의 부분에 역상보적일 수 있다. GRG 결합 부위에 역상보적인 GRG의 부분은 GARG-결합 부분으로 지칭될 수 있다. GARG는 GPS 영역을 포함할 수 있다. GRG 결합 부위는 GPS 영역일 수 있다. GRG는 GPS 결합 부위를 포함할 수 있다. GARG-결합 부분은 GPS 결합 부위일 수 있다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 근접하게 할 수 있다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 접촉하게 할 수 있다. 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 매우 근접하게 할 수 있다. GPS 영역 및 GPS 결합 부위의 함입은 GARG의 말단을 그것이 게놈 플랩을 결합할 수 있는 위치로 당길 수 있다. GARG는 DNA와 같은 핵산에 의해 인코딩될 수 있다. GARG의 임의의 구성요소는 GRG에 포함될 수 있다. GRG는 DNA와 같은 핵산에 의해 인코딩될 수 있다. GARG 및 GRG는 동일한 핵산 또는 별도의 핵산에 의해 인코딩된다. GARG 또는 GARG를 인코딩하는 핵산은 AAV와 같은 바이러스 입자에 의해 포괄될 수 있다. GRG 또는 GRG를 인코딩하는 핵산은 AAV와 같은 바이러스 입자에 의해 포괄될 수 있다. GARG 및 GRG는 동일한 바이러스 입자 또는 별도의 바이러스 입자에 의해 포괄된다.
일부 실시형태는 이중 가이드 시스템을 포함한다. 이중 가이드 시스템은 GARG 및 GRG를 포함할 수 있다. 일부 실시형태는 GARG 및 GRG를 포함하는 조성물을 포함한다. 일부 실시형태는 GARG 및 GRG를 사용하는 방법, 또는 GARG 및 GRG로 유전자를 편집하는 방법을 포함한다.
일부 실시형태는 GARG 및 GRG를 세포에 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GARG 및 GRG를 발현하는 하나 이상의 핵산을 세포에 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GARG 및 GRG를 세포에 발현시키는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GRG를 포함하는 세포에 GARG를 발현 또는 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 GARG를 포함하는 세포에 GRG를 발현 또는 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에서 GARG 또는 GRG를 발현시키는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에서 GARG 및 GRG를 발현시키는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에 GARG 또는 GRG를 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 일부 실시형태는 유전자 편집 효소를 포함하는 세포에 GARG 및 GRG를 투여하는 것을 포함하는 유전자 편집 방법을 포함한다. 투여는 세포를 포함하는 대상체에 대한 것일 수 있다.
일부 양태에서, 스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA(또는 폴리뉴클레오티드)를 포함하는 조성물 또는 시스템이 본 명세서에 개시되며, 여기서 프라이머 결합 부위는 별도의 RNA에 의해 표적화된 핵산에 결합한다. 스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA 또는 폴리뉴클레오티드를 포함하는 시스템이 본 명세서에 개시되며, 여기서 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산의 영역의 어떠한 부분도 포함하지 않는 핵산 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산에 결합한다.
게놈 편집용 조성물
본 개시내용의 조성물은 표적 부위에서 표적 핵산의 효율적인 편집을 용이하게 할 수 있다. 본 개시내용의 조성물은 가이드 핵산, nCas9 및 역전사효소를 포함할 수 있다. 본 개시내용의 조성물은 가이드 핵산, nCas9, 역전사효소, 또는 이의 조합을 인코딩하는 서열을 포함할 수 있다. nCas9 및 역전사효소는 융합된 nCas9-RT 작제물일 수 있다. nCas9 및 역전사효소는 분할 nCas9-RT 작제물일 수 있다. 본 개시내용의 조성물은 표적 핵산을 포함하는 세포 안으로 도입되어, 이에 의해 표적 핵산을 편집할 수 있다. 일부 실시형태에서, 조성물의 하나 이상의 성분을 인코딩하는 서열 (예를 들어, 플라스미드)은 표적 핵산을 포함하는 세포 내로 도입될 수 있다. 조성물의 하나 이상의 성분은 세포에서 발현될 수 있다. 일부 실시형태에서, 본 개시내용의 조성물은 제1 가이드 핵산, 제1 nCas9, 제1 역전사효소, 제2 가이드 핵산, 제2 nCas9, 및 제2 역전사효소를 포함할 수 있다. 일부 실시형태에서, 제1 가이드 핵산은 제1 nCas9에 결합하고, 제2 가이드 핵산은 제2 nCas9에 결합한다. 일부 실시형태에서, 제1 가이드 핵산의 제1 스페이서는 제1 nCas9를 결합하고, 제2 가이드 핵산의 제2 스페이서는 제2 nCas9를 결합하고, 제1 가이드 핵산의 제1 스캐폴드는 제2 nCas9를 결합하고, 제2 가이드 핵산의 제2 스캐폴드는 제1 nCas9를 결합한다. 일부 실시형태에서, 제1 가이드 핵산은 제1 링커를 포함하고 제2 가이드 핵산은 제2 링커를 포함한다. 일부 실시형태에서, 제1 링커는 제2 링커에 혼성화한다.
제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 서열의 합성 또는 편집을 용이하게 할 수 있다. 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 표적 부위에서 표적 핵산의 편집을 용이하게 할 수 있다. 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 2개의 단일 가이드 시스템일 수 있다. 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물은 이중 가이드 시스템일 수 있다. 2개의 단일 가이드 시스템에서, 각 gRNA는 상이한 nCas9에 결합하고 2개의 gRNA는 각각 역전사효소 주형 영역을 포함한다. 이중 가이드 시스템에서, 각 gRNA는 상이한 nCas9에 결합할 수 있다. 2개의 단일 가이드 시스템에서, gRNA 중 하나만 역전사효소 주형 영역을 포함할 수 있다. 2개의 단일 가이드 시스템에서, 제2 가이드는 반대쪽 가닥을 흠집낼 수 있다. 이중 가이드 시스템에서, gRNA 중 하나만 역전사효소 주형 영역을 포함할 수 있다. 이중 가이드 시스템에서, 제2 가이드는 반대쪽 가닥을 흠집낼 수 있다. 이중 가이드 복합체에서, 제1 gRNA의 스페이서는 제1 nCas9를 결합할 수 있고, 제2 gRNA의 스페이서는 제2 nCas9를 결합할 수 있고, 제1 gRNA의 스캐폴드는 제2 nCas9를 결합할 수 있고, 제2 gRNA의 스캐폴드는 제1 nCas9를 결합할 수 있다.
가이드 핵산은 Cas 닉카제와 복합체를 형성할 수 있다. 가이드 핵산은 역전사효소와 복합체를 형성할 수 있다. 복합체 형성 시, Cas 닉카제는 표적 핵산에서의 표적 부위에 단일-가닥 파손을 도입할 수 있다.
표적 핵산의 일부 비-제한적인 예는 낭포성 섬유증 막관통 전도도 조절자(CFTR) 핵산, 어셰린(USH2A) 핵산, ATP-결합 카세트 서브패밀리 A 구성원 4(ABCA4) 핵산, 윌슨 질환 단백질(ATP7B) 핵산, 또는 헌팅틴(HTT) 핵산을 포함한다. 일부 실시형태에서, 표적 핵산은 CFTR 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 USH2A 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 ABCA4 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 ATP7B 유전자를 포함한다. 일부 실시형태에서, 표적 핵산은 HTT 유전자를 포함한다.
Cas 닉카제, 역전사효소, 및 가이드 핵산을 포함하는 조성물이 본 명세서에 개시되어 있다. 제1 폴리펩티드는 Cas 닉카제를 포함할 수 있다. 제2 폴리펩티드는 역전사효소를 포함할 수 있다. 가이드 핵산은 Cas 닉카제에 결합할 수 있다. 가이드 핵산은 역전사효소에 결합할 수 있다.
RT는 MS2 코트 단백질(MCP) 펩티드를 포함할 수 있다. 일부 경우에, RT는 MS2 코트 단백질(MCP) 펩티드를 포함하지 않는다. 예를 들어, 조성물은 Rwa1을 포함할 수 있다. 가이드 핵산은 MS2 헤어핀을 포함할 수 있다. 일부 경우에, 가이드 핵산은 MS2 헤어핀을 포함하지 않는다. MCP 펩티드는 가이드 핵산에서의 MS2 헤어핀을 결합할 수 있다. MS2 헤어핀은 gRNA 스캐폴드와 RTT 사이에 있을 수 있다. 이것은 편집을 허용하기 위해 RT를 gRNA와 매우 근접하게 할 수 있다. MCP 펩티드와 MS2 헤어핀을 사용하는 이점은 RT와 Cas 닉카제(또는 그들의 일부)를 분리하고 그것을 AAV 벡터 내에 맞도록 하는 것이다. MCP 펩티드와 MS2 헤어핀은 필요하지 않을 수 있다. MCP 펩티드 또는 MS2 헤어핀을 포함하는 조성물은, 예를 들어, 세포 내로 형질감염된 경우 적어도 약 3% 또는 4%의 편집 효율을 가질 수 있다. MCP 펩티드 또는 MS2 헤어핀을 포함하는 조성물은, 예를 들어, 세포 내로 형질감염된 경우 적어도 약 10% 또는 15%의 편집 효율을 가질 수 있다.
RT 및 Cas 닉카제는 류신 지퍼를 포함할 수 있다. 예를 들어, 조성물은 RWb1을 포함할 수 있다. 류신 지퍼를 포함하는 조성물은, 예를 들어, 세포 내로 형질감염된 경우, 적어도 약 35% 또는 40%의 편집 효율을 가질 수 있다. 류신 지퍼를 포함하는 조성물은, 예를 들어, 세포 내로 형질도입된 경우, 적어도 약 3% 또는 4%의 편집 효율을 가질 수 있다. 류신 지퍼를 사용하는 이점은 RT와 Cas 닉카제(또는 그들의 일부)를 분리하고 그것을 AAV 벡터 내에 맞도록 하는 것이다. 그러나, 류신 지퍼는 필요하지 않을 수 있다.
RT 또는 Cas 닉카제는, 예를 들어 인테인 분할하기를 사용하여 분할될 수 있다. 일부 경우에, RT와 Cas 닉카제는 인테인 분할하기를 사용하여 분할되지 않는다. 인테인 분할하기를 사용하는 예는 RWc1이다. 분할은 Cas 닉카제의 잔기 1172와 1173 사이에 있을 수 있다. 분할 RT 또는 Cas 닉카제를 사용하는 조성물은, 예를 들어 세포 내로 형질감염된 경우 적어도 약 25% 또는 30%의 편집 효율을 가질 수 있다. RWc1 또는 유사한 분할하기 방법을 사용하는 이점은 RT 또는 Cas 닉카제를 인코딩하는 핵산 서열이 있는 AAV 벡터 내에 맞도록 허용될 수 있는 조절 요소와 같은 부가의 뉴클레오티드 서열을 위한 더 많은 공간을 허용할 수 있다는 것이다. 예를 들어, 분할하기 방법은 AAV 내에 맞는 부가의 뉴클레오티드 서열에 대해 약 500, 600 또는 700 (또는 전술한 정수 중 임의의 것에 의해 한정된 범위) 이상의 뉴클레오티드를 허용할 수 있다.
RT 또는 Cas 닉카제는 분리되어 있을 수 있고 함께 묶이지 않을 수 있다. 비-결합 RT 및 Cas 닉카제를 사용하는 예는 RWd1이다.
본 개시내용의 조성물은 단백질 복합체 또는 단백질 복합체를 인코딩하는 서열을 포함할 수 있다. 단백질 복합체는 보호성 단백질 복합체를 포함할 수 있다. 단백질 복합체는 가이드 핵산의 탈아미노화 또는 분해를 방지할 수 있다. 예를 들어, 보호성 복합체는 인간 Orf1p(서열번호: 38) 또는 뮤어라인 Orf1p(서열번호: 39)일 수 있다.
게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시되어 있다. 방법은 Orf1p를 세포에 전달하는 것을 포함할 수 있다. 세포는 본 명세서에 기재된 조성물 또는 가이드 핵산을 발현할 수 있다.
본 명세서에 기재된 조성물 또는 가이드 핵산을 인코딩하는 뉴클레오티드 서열을 포함하는 핵산이 본 명세서에 개시되어 있다. 핵산을 포함하는 바이러스 벡터가 본 명세서에 개시되어 있다. 본 명세서에 기재된 조성물을 포함하는 세포가 본 명세서에 개시되어 있다. 본 명세서에 기재된 핵산을 포함하는 세포가 본 명세서에 개시된다. 본 명세서에 기재된 가이드 핵산을 포함하는 세포가 본 명세서에 개시되어 있다. 본 명세서에 기재된 바이러스 벡터를 포함하는 세포가 본 명세서에 개시되어 있다. 세포는 원핵 세포일 수 있다. 세포는 진핵 세포일 수 있다.
일부 실시형태는 세포에서 dNTP 농도와 같은 dNTP 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법을 포함한다. SAMHD1을 억제하는 것은 dNTP 농도를 증가시킬 수 있다. dNTP를 투여하는 것은 세포에서 dNTP 농도를 증가시킬 수 있다. 일부 실시형태는 세포에서 SAMHD1을 억제하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 포함한다. 일부 실시형태는 dNTP를 대상체 또는 세포에 투여하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법을 포함한다
일부 실시형태에서, 본 개시내용의 조성물은 본 개시내용의 Cas9 작제물(예를 들어, 분할 Cas9-RT 작제물)의 편집 효율을 증가시키기 위한 단백질, 단백질을 인코딩하는 핵산, 또는 비-코딩 핵산을 포함할 수 있다. 일부 실시형태에서, Cas9 작제물의 편집 효율을 증가시키기 위한, 단백질, 단백질을 인코딩하는 핵산, 또는 비-코딩 핵산은 SAMHD1의 dNTP 절단 활성을 억제하는 단백질 또는 핵산 또는 SAMHD1의 dNTP 절단 활성을 억제하는 단백질을 인코딩하는 핵산을 포함할 수 있다. 예를 들어, SAMHD1의 dNTP 절단 활성을 억제하는 핵산은 SAMHD1 전사체를 분해하는 마이크로RNA를 포함할 수 있다.
일부 실시형태는 기준선 dNTP 농도와 비교하여 세포에서 dNTP 농도를 증가시키는 것을 포함한다. 일부 실시형태에서, dNTP 농도는 기준선 dNTP 측정과 비교하여 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 초과, 또는 전술한 백분율 중 임의의 2개에 의해 한정된 백분율의 범위까지 증가된다. 일부 실시형태에서, dNTP 농도는 기준선 dNTP 측정과 비교하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%까지 증가된다. 일부 실시형태에서, dNTP 농도는 기준선 dNTP 측정과 비교하여 5% 이하, 10% 이하, 15% 이하, 20% 이하, 25% 이하, 30% 이하, 40% 이하, 50% 이하, 60% 이하, 70% 이하, 80% 이하, 90% 이하, 100% 이하만큼 증가된다.
다양한 양태에서, 낮은 dNTP 농도는 0.5 마이크로몰, 0.6 마이크로몰, 0.7 마이크로몰, 0.8 마이크로몰, 0.9 마이크로몰, 1.0 마이크로몰, 또는 1.1 마이크로몰, 또는 전술한 dNTP 농도 중 임의의 2개에 의해 한정된 범위의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.5 마이크로몰, 약 0.6 마이크로몰, 약 0.7 마이크로몰, 약 0.8 마이크로몰, 약 0.9 마이크로몰, 약 1.0 마이크로몰, 또는 약 1.1 마이크로몰, 또는 전술한 dNTP 농도 중 임의의 2개에 의해 한정된 범위의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 1.1 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 1.0 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.9 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.8 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.7 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.6 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.5 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.9 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.8 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.7 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.6 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.5 마이크로몰 초과의 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 약 0.4 마이크로몰 초과의 dNTP 농도를 포함한다.
다양한 양태에서, 본 개시내용은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 가지고 DNA 중합효소를 포함하는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하며, 상기 방법은: 기준선 dNTP 농도에 비해 세포에서 dNTP 농도를 증가시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 세포에서 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제를 억제하는 것을 포함한다. 다양한 양태에서, 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제는 SAM 도메인 및 HD 도메인-함유 단백질 1(SAMHD1)을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키는 것, 또는 세포에서 Vpx 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 BGLF4 단백질과 접촉시키는 것, 또는 세포에서 BGLF4 단백질을 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키는 것, 또는 세포에서 마이크로RNA 또는 siRNA를 발현시키는 것을 포함한다. 다양한 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP를 세포에 투여하는 것을 포함한다. 다양한 양태에서, 세포에 dNTP를 투여하는 것은 세포를 포함하는 대상체에게 dNTP를 투여하는 것을 포함한다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것을 포함한다. 뉴클레오시드 또는 뉴클레오티드는 데옥시뉴클레오시드(dN), 데옥시뉴클레오시드 모노포스페이트(dNMP), 또는 뉴클레오시드 트리포스페이트(NTP)를 포함할 수 있다. 일부 경우에 뉴클레오시드 또는 뉴클레오티드는 dNTP가 아니거나 dNTP를 포함하지 않는다. 다양한 양태에서, 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것은 뉴클레오시드 또는 뉴클레오티드를 세포를 포함하는 대상체에게 투여하는 것을 포함한다. 다양한 양태에서, 투여는 경구 또는 주사에 의한 것이다. 다양한 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함한다. 다양한 양태에서, dNTP 합성 효소는 키나제를 포함한다. 다양한 양태에서, 키나제는 뉴클레오시드 키나제, 데옥시뉴클레오시드 키나제, 데옥시뉴클레오시드 모노포스파제 키나제, 또는 데옥시뉴클레오티드 디포스페이트 키나제를 포함한다. 다양한 양태에서, DNA 중합효소는 역전사효소를 포함한다. DNA 중합효소는 유전자 편집에 적합할 수 있다. DNA 중합효소는 유전자 편집 중합효소일 수 있다. DNA 중합효소는 재조합 DNA 중합효소일 수 있다. 일부 실시형태는 DNA 중합효소를 세포 내로 도입하는 것을 포함한다. 일부 실시형태는 세포에서 DNA 중합효소를 발현하는 것을 포함한다. 다양한 양태에서, 세포는 Cas9 프로그램가능한 뉴클레아제, 가이드 핵산, 또는 이의 조합을 포함하거나 추가로 포함한다. 일부 실시형태는 세포 내로 도입하는 것, 또는 세포에서 Cas9 프로그램가능한 뉴클레아제를 발현하는 것을 포함한다. 일부 실시형태는 세포 내로 도입하는 것, 또는 세포에서 가이드 핵산을 발현하는 것을 포함한다. Cas9 프로그램가능한 뉴클레아제는 DNA 중합효소의 일부일 수 있거나 DNA 중합효소와 연관될 수 있다. 다양한 양태에서, 낮은 dNTP 농도는 비분할 세포에서 발견되는 dNTP 농도를 포함한다. 다양한 양태에서, 낮은 dNTP 농도는 활성화된 말초 혈액 단핵 세포에서 발견되는 dNTP 농도보다 낮다. 다양한 양태에서, 낮은 dNTP 농도는 1 마이크로몰 미만의 dNTP 농도를 포함한다. 다양한 양태에서, dNTP 농도를 증가시키는 것은 기준선 dNTP 측정에 비하여 dNTP 농도를 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 또는 그 초과까지 증가시키는 것을 포함한다. 다양한 양태에서, dNTP 농도는 데옥시아데노신 트리포스페이트(dATP) 농도, 데옥시시티딘 트리포스페이트(dCTP) 농도, 데옥시구아노신 트리포스페이트(dGTP) 농도, 또는 데옥시티미딘 트리포스페이트(dTTP) 농도, 또는 이의 임의의 조합을 포함한다.
다양한 양태에서, 본 개시내용은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 갖는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하는 것으로, 이는 세포에서 dNTP 농도를 증가시키는 것을 포함하며, 여기서 세포는 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 포함한다. 다양한 양태에서, 본 개시내용은 낮은 낮은 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도를 갖는 세포에서 유전자 편집 효율을 증가시키는 방법을 제공하는 것으로, 이는 세포를 낮은 dNTP 농도에서 효율적인 촉매작용을 위해 변형된 유전자 편집 효소와 접촉시키는 것, 또는 세포에 유전자 편집 효소를 발현시키는 것 포함한다. 일부 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 세포에서 SAMHD1을 억제하는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키는 것, 또는 세포에 Vpx 단백질을 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키는 것, 또는 세포에 마이크로RNA 또는 siRNA를 발현시키는 것을 포함한다. 일부 양태에서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함한다. 일부 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP를 세포에 투여하는 것을 포함한다. 일부 양태에서, 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함한다. 일부 양태에서, dNTP 합성 효소는 데옥시뉴클레오시드 디포스페이트(dNDP) 키나제를 포함한다. 일부 양태에서, 유전자 편집 효소는 Cas9 프로그램가능한 뉴클레아제 또는 역전사효소를 포함한다. 일부 양태에서, 역전사효소는 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 도입함에 의해 변형된다. 일부 실시형태에서, 방법은 dNTP 농도를 측정하는 것을 추가로 포함한다. 일부 실시형태는 dNTP 농도를 증가시킨 후 dNTP 농도를 측정하는 것, 및 기준선 dNTP 농도에 비교한 증가를 결정하는 것을 포함한다.
일부 실시형태는 dNTP 농도에서의 증가를 결정하는 것을 획득하는 것을 포함한다. 일부 실시형태는 dNTP 농도를 측정하는 것을 포함한다. 일부 실시형태에서, dNTP 농도는 흡광도 검정, 비색 검정 또는 효소-결합 면역흡착 검정과 같은 검정을 사용하여 측정된다. 일부 실시형태는 기준선 dNTP 농도를 측정하는 것을 포함한다. 일부 실시형태에서, 기준 dNTP 농도는 흡광도 검정, 비색 검정, 또는 효소-결합 면역흡착 검정과 같은 검정을 사용하여 측정된다.
게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시되어 있다. 방법은 세포에서 SAMHD1을 억제하는 것을 포함할 수 있다. 세포는 Cas9 프로그램가능한 뉴클레아제를 발현할 수 있다. 세포는 Cas 닉카제를 발현할 수 있다. 세포는 역전사효소를 발현할 수 있다. 세포는 가이드 핵산을 발현할 수 있다. SAMHD1을 억제하는 예는 세포를 소분자 SAMHD1 억제제와 같은 SAMHD1 억제제로 처리하는 것을 포함할 수 있다. SAMHD1을 억제하는 예는 세포에서 SAMHD1에 대한 마이크로RNA를 발현하는 것을 포함할 수 있다.
편집 효율을 증가시키기 위한 단백질은 Vpx 단백질(예를 들어, 서열번호: 82, 서열번호: 83, 또는 서열번호: 93)일 수 있다. Vpx는 일부 경우에 렌티바이러스 단백질이다. Vpx는 일부 경우에 (예를 들어 SAMHD1을 억제함에 의해) 편집 효율을 증가시키기 위해 사용할 수 있는 면역결핍 바이러스(SIV) 단백질이다. Vpx 단백질은 세포에서 dNTP의 이용가능성을 증가시킴에 의해 Cas9-RT 작제물의 편집 효율을 증가시킬 수 있다. 예를 들어, Vpx 단백질은 SAMHD1의 dNTP 절단 활성을 억제하여 세포에서 dNTP의 이용가능성을 증가시킬 수 있다. 일부 실시형태에서, Vpx 단백질은 본 개시내용의 Cas9-RT 작제물과 함께 세포에서 공동-발현될 수 있다. Vpx 단백질로 발현된 Cas9-RT 작제물은 Vpx 단백질의 부재에서 Cas9-RT 작제물에 비해 증가된 편집 효율을 가질 수 있다. Vpx 펩티드는 Hiv2-rod Vpx(예를 들어, 서열번호: 82)일 수 있다. 일부 실시형태에서, Vpx 단백질은 그 자신의 코딩 서열로서 발현될 수 있다. 일부 실시형태에서, Vpx 단백질은 역전사효소와 동일한 코딩 서열로 발현될 수 있다. 예를 들어, Vpx 단백질은 p2a 자가-절단 펩티드(예를 들어, 서열번호: 83)에 의해 분리된, 역전사효소와 동일한 코딩 서열로 발현될 수 있다. 일부 실시형태에서, Vpx 단백질은 Vpx RH-2-1 D8 단백질(예를 들어, 서열번호: 93)일 수 있다. 일부 실시형태에서, Vpx 단백질은 Cas9 단백질과 동일한 코딩 서열로 발현될 수 있다. SAMHD1을 억제하는 것은 세포에서 Vpx 단백질을 발현하는 것을 포함할 수 있다.
세포에서 Vpx 단백질을 발현시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시된다. 세포는 본 명세서에 기재된 조성물을 발현할 수 있다. 세포는 본 명세서에 기재된 가이드 핵산을 발현할 수 있다.
일부 실시형태는 SAMHD1과 같은 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제(dNTPase)를 억제함에 의해 세포에서 dNTP 농도를 증가시키거나, 유전자 편집을 개선하는 방법을 포함한다. 일부 실시형태는 SAMHD1을 억제하기 위한 조성물에 관한 것이다. Vpx 단백질을 사용하여 SAMHD1을 억제할 수 있다. BGLF4 단백질을 사용하여 SAMHD1을 억제할 수 있다. BGLF4는 SAMHD1을 인산화하고 이에 의해 SAMHD1의 dNTPase 활성을 억제할 수 있다. BGLF4는 일부 경우에 Epstein-Barr 바이러스(EBV)-인코딩된 단백질 키나제이다. EBV-인코딩된 단백질 키나아제는 (예를 들어 SAMHD1을 억제함에 의해) 편집 효율성을 증가시키기 위해 사용될 수 있다. SAMHD1 억제용 조성물은 소분자 SAMHD1 억제제를 포함할 수 있다. 소분자 SAMHD1 억제제는 pppCH2dU 또는 이의 염을 포함할 수 있다. 소분자 SAMHD1 억제제는 dGMPNPP 또는 이의 염을 포함할 수 있다.
세포에서 뉴클레오시드 또는 뉴클레오티드(예를 들어 dNTP)의 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법이 본 명세서에 개시되어 있다. 세포는 Cas9 프로그램가능한 뉴클레아제를 발현할 수 있다. 세포는 Cas 닉카제를 발현할 수 있다. 세포는 역전사효소를 발현할 수 있다. 세포는 가이드 핵산을 발현할 수 있다. 세포에서 dNTP의 농도를 증가시키는 예는 뉴클레오티드 또는 뉴클레오시드를 세포에 전달하는 것을 포함한다. 세포에서 뉴클레오시드 또는 뉴클레오티드의 농도를 증가시키는 것은 세포로 뉴클레오시드 또는 뉴클레오티드의 전달을 포함할 수 있다. 그런 다음 뉴클레오티드 또는 뉴클레오시드는 세포에서 dNTP로 전환될 수 있다. 뉴클레오시드 또는 뉴클레오티드의 전달은 경구 전달 또는 주사를 포함할 수 있다. 뉴클레오시드 또는 뉴클레오티드의 dNTP로의 전환은 내인성 키나제 또는 시나데시스에 의한 인산화, 예를 들어 내인성 샐비지 경로를 통한 것일 수 있다. 방법은 뉴클레오티드 또는 뉴클레오시드를 세포에 전달하여 뉴클레오티드 또는 뉴클레오시드를 받지 않은 세포와 비교하여 세포에서 dNTP의 증가된 농도를 초래하는 것을 포함할 수 있다. 세포에서 dNTP의 증가된 농도는 본 명세서에 개시된 바와 같은 조성물을 포함하는 세포에서 증가된 편집 효율을 초래할 수 있다.
본 명세서에 dNTP 농도를 제한하는 데 더 잘 작동하는 RT 돌연변이를 스크리닝하기 위해 SAMHD1 과발현을 사용하는 것을 포함하는 방법이 개시되어 있다. 또한 SAMHD1 또는 SAMHD1의 인산화불가능한 돌연변이체를 과발현하도록 변형된 세포에서 개선된 RT를 스크리닝하거나 동정하기 위한 방법이 개시되어 있다. 일부 실시형태는 세포에서 SAMHD1을 과발현하는 것을 포함한다. 일부 실시형태는 세포에서 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현시키는 것을 포함한다. 일부 실시형태는 세포에서 RT 활성을 동정하는 것을 포함한다. 일부 실시형태는 RT 활성에 기반하여 개선된 RT로서 RT를 동정하는 것을 포함한다. 일부 실시형태는 개선된 역전사효소(RT)를 스크리닝하거나 동정하는 방법을 포함하는 것으로, 이는 SAMHD1을 과발현하거나, 세포에서 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현하는 것; 세포에서 RT 활성을 동정하는 것; 및 RT 활성에 기반하여, 개선된 RT로서 RT를 동정하는 것을 포함한다.
정밀 편집 구성요소의 전달을 위한 AAV 및 방법
Cas 닉카제, 역전사효소(RT), 또는 가이드 RNA(gRNA)와 같은 정밀 편집 구성요소가 본 명세서에 기술되어 있다. 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩될 수 있다. 폴리뉴클레오티드는 AAV에 의해 전달될 수 있다. 닉카제 및 RT를 인코딩하는 폴리뉴클레오티드는 AAV 내에 맞도록 조작될 수 있다. AAV 내에 맞도록 닉카제 및 RT를 조작하기 위한 예가 본 명세서에 제공된다. 예를 들어, 닉카제 및 RT는 이량체화하도록 조작될 수 있다. 닉카제와 RT는 공동발현될 수 있다. 닉카제는 인테인 시스템을 사용하여 분할될 수 있다. 닉카제의 일부는 RT와 융합 단백질로 결합될 수 있다. 예시적인 이량체화, 공동발현 및 분할 인테인 시스템의 목표는 4.5kb 담지 용량을 포함하는 AAV를 사용하여 게놈 편집 구성요소를 전달할 수 있도록 하는 것이다.
도 24는 nCas9 및 mcp-mlvRT5m을 발현하는 플라스미드가 ms2 헤어핀을 포함하거나 포함하지 않는 gRNA로 HEK293T-BFP 세포에서 공동형질감염되었을 때, 동일한 BFP 대 GFP 편집 효율이 달성되었음을 나타낸다. 이와 같이 동일한 세포에서 융합되지 않은 비-이량체화 nCas9와 역전사효소의 공동발현은 편집을 초래할 수 있다. 따라서 NLS-nCas9(서열번호: 138) 및 mlvRT5m-NLS(서열번호: 95)는 효율적인 편집을 달성하기 위해 별도의 AAV로부터 공동발현될 수 있다. 따라서, 동일한 세포에서 융합되지 않은 비-이량체화 Cas 닉카제와 역전사효소의 공동발현은 편집을 초래할 수 있다. 따라서 Cas 닉카제 및 RT는 효율적인 편집을 달성하기 위해 별도의 AAV로부터 공동발현될 수 있다. 마찬가지로, 이량체화하도록 조작된 Cas 닉카제 및 RT는 효율적인 편집을 달성하기 위해 별도의 AAV로부터 공동발현될 수 있다.
Cas 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩될 수 있다. Cas 닉카제 및 RT는 2개의 별도의 폴리뉴클레오티드에 의해 인코딩될 수 있거나, 하나의 일부가 다른 폴리뉴클레오티드에 포함될 수 있다(예를 들어, 본 명세서에 기재된 바와 같음). 하나 이상의 AAV는 폴리뉴클레오티드를 포함할 수 있다. Cas 닉카제 및 RT의 적어도 일부는 별도의 AAV 내에 포괄되거나 포함될 수 있다. Cas 닉카제 및 RT의 일부는 별도의 AAV 내에 포괄되거나 포함될 수 있다. Cas 닉카제 및 RT의 전부는 별도의 AAV 내에 포괄되거나 포함될 수 있다.
일부 경우에, Cas 닉카제 및 역전사효소를 포함하는 조성물이 포함되며, 여기서 Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함되고, 여기서 Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성한다. 별도의 폴리펩티드 사슬은 별도의 폴리뉴클레오티드에 의해 인코딩될 수 있다. 별도의 폴리뉴클레오티드는 AAV와 같은 별도의 바이러스 벡터에 포함될 수 있다. 별도의 폴리뉴클레오티드는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 2개의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 2개 이하, 3개 이하, 4개 이하, 5개 이하, 6개 이하, 7개 이하, 8개 이하, 9개 이하, 또는 10개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 2개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 3개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다. 별도의 폴리뉴클레오티드는 4개 이하의 별도의 바이러스 벡터 안으로 분할될 수 있다.
별도의 폴리뉴클레오티드는 별도의 AAV 게놈 내에 맞도록 충분히 짧을 수 있다(예를 들어 각각 약 4500bp 미만). 예를 들어, 별도의 폴리뉴클레오티드는 각각 약 도 19a에 기재된 크기일 수 있다. 별도의 폴리뉴클레오티드는 각각 약 도 19a에 기재된 크기보다 작거나 크지 않을 수 있다. 별도의 폴리뉴클레오티드는 각각 도 19a에 기재된 크기보다 약 10% 작거나 크지 않거나 또는 그보다 더 클 수 있다. 별도의 폴리뉴클레오티드는 각각 약 4500bp 미만일 수 있다. 별도의 폴리뉴클레오티드는 도 19a의 임의의 크기를 포함하는 범위, 또는 약 도 19a의 크기를 포함하는 범위와 같은, 폴리뉴클레오티드 크기의 범위를 포함할 수 있다.
일부 경우에, AAV는 제1 AAV를 포함한다. 제1 AAV는 제1 폴리뉴클레오티드를 포함할 수 있으며, 이는 본 명세서에 기재된 Cas 닉카제와 같은 Cas 또는 Cas 구성요소를 인코딩할 수 있다. AAV는 본 명세서에 기재된 RT와 같은 RT를 인코딩하는 제2 폴리뉴클레오티드를 포함할 수 있는 제2 AAV를 포함할 수 있다.
AAV의 예는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB, 또는 AAV-PHP.S, 또는 이의 조합을 포함할 수 있다. AAV의 예는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, 또는 AAV12와 같은 혈청형을 포함할 수 있다. AAV의 예는 AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB 또는 AAV-PHP.S와 같은 의사형을 포함할 수 있다.
AAV는 AAV 게놈을 포함할 수 있다. AAV 게놈은 pCMV-NLS-nSpCas9(1-1172)-NpuN-cMycNLS-48pA, 또는 이의 성분들의 임의의 조합을 포함할 수 있다. pCMV-NLS-nSpCas9(1-1172)-NpuN-cMycNLS-48pA를 포함하는 AAV 게놈은 서열번호: 142의 서열을 포함할 수 있다. AAV 게놈은 서열번호: 142의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다.
AAV 게놈은 pCMV-NpuC-nSpCas9(1173-1368;S1173C)-mlvRT14M-SV40 NLS-P2A-VPXrh21-48pA-pU6-ush2a-gRNA, 또는 이의 성분들의 임의의 조합을 포함할 수 있다. pCMV-NpuC-nSpCas9(1173-1368;S1173C)-mlvRT14M-SV40 NLS-P2A-VPXrh21-48pA-pU6-ush2a-gRNA를 포함하는 AAV 게놈은 서열번호: 143의 서열을 포함할 수 있다. AAV 게놈은 서열번호: 143의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다. AAV는 어셔 증후군의 치료, 또는 USH2A 돌연변이체를 복원하는데 유용할 수 있다. AAV는 어셔 증후군이 있는 대상체에게 투여될 수 있다.
대상체에게 AAV의 투여에 이어서, 대상체에서 게놈 편집이 측정되거나 분석될 수 있다. 하나 이상의 세포에 AAV의 투여에 이어서, 하나 이상의 세포에서 게놈 편집이 측정되거나 분석될 수 있다. 게놈 편집은 서열화에 의해 측정되거나 분석될 수 있다. 게놈 편집은 검정에 의해 측정되거나 분석될 수 있다. 검정은 대상체 또는 세포에서 편집된 게놈을 측정하거나 동정하는 것을 포함할 수 있다. 검정은 대상체 또는 세포에서 편집된 게놈으로부터 생성된 RNA를 측정하거나 동정하는 것을 포함할 수 있다. 검정은 대상체 또는 세포에서 편집된 게놈으로부터 생성된 단백질을 측정하거나 동정하는 것을 포함할 수 있다. 검정의 일부 예는 혼성화 검정, 면역검정, 비색 검정, 형광 검정 또는 질량분석을 포함한다.
일부 실시형태는 표적 유전자좌에서 DNA 분자의 뉴클레오티드 서열에 하나 이상의 변화를 도입하는 방법을 포함하는 것으로, 이는 표적 유전자좌에 프로그램가능한 뉴클레아제를 표적화하는 가이드 핵산 및 프로그래밍 가능한 뉴클레아제와 DNA 분자를 접촉시키는 것을 포함한다. 프로그램가능한 뉴클레아제는 역전사효소와 복합체를 형성할 수 있다.
정밀 편집 구성요소를 사용한 치료의 방법
일부 실시형태는 본 명세서에 기재된 방법 또는 조성물을 사용한 유전적 장애의 치료를 포함한다. 예를 들어, 일부 실시형태는 본 명세서에 기재된 유전자 편집 구성요소를 포함하거나 인코딩하는 하나 이상의 핵산을 투여하는 것을 포함한다. 예를 들어, 바이러스 벡터를 사용하여 투여된 핵산을 전달할 수 있다.
투여는 주사를 포함할 수 있다. 투여는 핵산을 포함하는 조성물의 투여를 포함할 수 있다. 투여는 바이러스 벡터를 포함하는 조성물의 투여를 포함할 수 있다. 조성물은 약학적 조성물을 포함할 수 있다. 조성물은 약학적 조성물을 포함할 수 있다. 약학적 조성물은 물, 완충액 또는 식염수와 같은 담체를 포함할 수 있다. 약학적 조성물은 리포좀을 포함할 수 있다.
투여는 이를 필요로 하는 대상체에 대한 것일 수 있다. 예를 들어, 투여는 유전적 장애가 있는 대상체에 대한 것일 수 있다. 대상체는 척추동물일 수 있다. 대상체는 포유동물일 수 있다. 대상체는 인간일 수 있다. 일부 실시형태에서, 투여는 대상체에서 질환-유발 유전자 돌연변이를 교정한다. 일부 실시형태에서, 투여는 대상체의 세포에서 질환-유발 유전자 돌연변이를 교정한다.
유전적 장애의 일부 비-제한적 예는 아데노신 탈아미노효소 결핍, 알파-1 항트립신 결핍, 낭포성 섬유증, 근이영양증(예를 들어 뒤센 근이영양증), 갈락토스혈증, 혈색소증, 헌팅턴병, 메이플 시럽 요증, 마르판 증후군, 신경섬유종증(예를 들어 유형 1), 선천성 후두염, 페닐케톤뇨증, 중증 복합 면역결핍증, 겸상적혈구병, 스미스-렘리-오피츠 증후군 또는 테이-삭스병을 포함한다. 일부 실시형태에서, 유전적 장애는 낭포성 섬유증, 스타가르트병, 어셔 증후군, 또는 헌팅턴병을 포함한다. 일부 실시형태에서, 유전적 장애는 낭포성 섬유증을 포함한다. 일부 실시형태에서, 유전적 장애는 스타가르트병을 포함한다. 일부 실시형태에서, 유전적 장애는 어셔 증후군을 포함한다. 일부 실시형태에서, 유전적 장애는 헌팅턴병을 포함한다. 일부 실시형태에서, 유전적 장애는 심장병, 고혈압, 알츠하이머병, 관절염, 당뇨병, 암 또는 비만과 같은 다유전자성 장애를 포함한다.
이중-가닥 파손 없는 AAV-전달가능한 정밀 편집
요약
게놈을 정확하게 편집하는 능력은 의료, 농업 또는 생명 과학에서 심오한 의미를 가질 수 있고 정확한 게놈 편집은 유전 질환을 치유할 수 있다. CRISPR 뉴클레아제가 이중 가닥 파손을 표적화하는 능력을 대중화했지만, 외래 상동 DNA를 사용하는 독성 이중-가닥 파손(DSB)의 부위에서 상동성-유도된 복구(HDR)의 비효율성으로 인해 정밀한 서열 변경을 생성하는 것은 어려웠다. 프라임 편집기는 HDR에 의존하지 않고 다양한 정밀 편집을 가능하게 했지만 유전자 전달 비히클 아데노-연관된 바이러스(AAV)로 전달되기에는 너무 큰 구성요소를 활용할 수 있거나, 제한된 편집 윈도우 길이를 가지거나, 효율적인 편집을 달성하기 위해 양 가닥을 모두 파손하거나, 또는 비-분열 세포에서 제한된 효율을 갖는다. 여기서 이들 제한은 리라이터라는 도구 세트로 극복되었다. 리라이터의 분할 시스템은 2개의 AAV 게놈 내에 유전자 편집 구성요소를 전달하기 위해 4개의 모듈식 아키텍처를 제공할 수 있다. 리라이터의 최적화된 역전사효소 및 가이드 RNA 위치화 시스템(GPS)은 하나의 단일-가닥 파손만 생성하면서 편집 효율과 편집 윈도우 길이를 증가시킬 수 있다. 마지막으로, 리라이터의 항-제한 인자는 비-분할 세포에서 편집을 증진한다. 리라이터는 65 뉴클레오티드 윈도우 내에서 75% 편집을 달성했으며, 이는 DSB를 생성하지 않고 포유류 세포에서 표적화된 다중-뉴클레오티드 변화에 대해 현재까지 보고된 가장 높은 효율이다. 마지막으로, 검출가능한 타겟-외 돌연변이가 없는 유전성 난청 및 실명 환자에서 일반적으로 돌연변이되는 게놈 부위를 정확하게 편집한 리라이터 구성요소가 개발되었다.
가이드 RNA 위치화 시스템(GPS), 제2 가닥 프라이머 및 비분할 세포에서 효율적인 편집을 제공하는 항-제한 인자를 사용하여 게놈과 인접한 정의된 이중 가닥 DNA의 합성을 위해 최적화된 역전사효소를 표적화하기 위해 조작된 Cas9 닉카제를 이용하는 이중 AAV-전달가능한 시스템인 리라이터를 사용하여 상동성-유도된 복구 또는 이중-가닥 파손 없이 다재다능한 효율적이고, 정확한 게놈 편집을 위한 조성물 및 방법이 본 명세서에 기재되어 있다. 리라이터는 65 뉴클레오티드 윈도우 내에서 최대 54% 효율로 복합 서열 변경을 정착했다. 이 시스템의 이점은 낭포성 섬유증이나 어셔 증후군과 같은 유전적 장애를 유발하는 돌연변이를 교정하는데 사용될 수 있다는 것이다. 어셔 증후군의 유전적 결함의 교정은 난청이나 실명을 예방하거나 치료하는데 사용될 수 있다. 리라이터의 안전성, 효율성, 정밀도 및 다용성은 질환을 치료하거나, 식품을 개선하거나 또는 기초 생물학 연구를 발전시키기 위해 사용될 수 있다.
도입
CRISPR 뉴클레아제는 게놈 DNA에서 표적화된 이중-가닥 파손을 생성하기 위한 간단한 접근법을 제공할 수 있다. 그러나, 게놈 표적의 서열을 정확하게 변경하는 것은 상동성-유도된 복구의 비효율성, 이중-가닥 파손의 독성, 상동 공여자 DNA를 전달하는 난제로 인해 어려웠다. DSB는 표적 유전자를 넘어 연장되는 길고 부정확한 결실을 초래할 수 있고 심지어 전체 염색체의 제거를 초래할 수도 있다. 부가적으로, 게놈 편집기 자체를 인코딩하는 벡터가 의도하지 않게 DSB의 부위에 통합될 수 있다. 마지막으로 단일 DSB라도 p53 경로를 활성화하여 세포자멸사를 초래할 수 있다. CRISPR-가이드된 뉴클레오티드 탈아미노효소 또는 염기 편집기는 이중-가닥 파손을 피할 수 있고 상동성-유도된 복구에 의존하지 않을 수 있지만 모든 치환의 하위집합을 만드는 것으로 또한 제한될 수 있고 게놈 및 전사체 표적-외 돌연변이를 야기할 수 있다. 프라임 편집은 Cas9 절단 부위의 프로토스페이서 인접 모티프(PAM)-근위측에서 30-뉴클레오티드(nt) 윈도우 내에 삽입, 삭제 및 복잡한 서열 변경을 정착하기 위한 보다 정확하고 다양한 접근법일 수 있다. 프라임 편집기(PE)는 CRISPR 가이드 RNA(gRNA)의 3' 연장에서 프라이머 결합 부위(PBS)에 혼성화할 수 있는 게놈 플랩을 생성하는 닉킹 스트렙토코커스 피오게네스 Cas9(nSpCas9)를 포함할 수 있다. nSpCas9에 융합된 5개 점 돌연변이(mlvRT5M)를 포함하는 몰로니 백혈병 바이러스 역전사효소는 게놈 플랩을 프라이머로 활용하여, 또한 gRNA의 3' 연장에 포함된 RT 주형(RTT)의 서열에 따라 원하는 편집을 포함하는 DNA의 가닥을 합성할 수 있다. 편집 효율은 다른 가닥을 흠집내는 제2 gRNA를 발현함에 의해 증가될 수 있다. 불행히도, PE는 일반적으로 너무 커서 아데노-연관된 바이러스(AAV)로 전달된다. 부가적으로, PE는 비-분할 세포에서 효율성이 제한적일 수 있고, 두 가닥 모두를 흠집낼 때 의도하지 않은 삽입 또는 결실을 생성하거나, 단일 작제물로 교정될 수 있고 편집 부위 근처에서 이용할 수 있는 PAM을 요할 수 있는 병원성 돌연변이의 수를 제한할 수 있는 짧은 편집 윈도우 길이를 가질 수 있다. 일부 경우에, 더 큰 윈도우 내에 임의의 유형의 돌연변이를 정착할 수 있고 이중-가닥 파손을 생성하지 않고 세포를 분열 및 비-분할하는데 있어서 프라임 편집기보다 더 높은 효율을 갖는, 리라이터라고 하는 유전자 편집 시스템이 본 명세서에 기술되어 있다. 이것은 AAV로 전달되는 구성요소를 사용하여 수행될 수 있다.
AAV에 맞는 정밀 편집기
프라임 편집기 및 분할 인테인 프라임 편집기는 표적 부위에 많은 유형의 돌연변이를 정착할 수 있는 반면, 그의 코딩 서열 단독은 너무 커서 AAV의 4.5 킬로베이스(kb) 담지 용량 내에 맞지 않을 수 있다(도 19a). 최소 2개의 AAV 게놈 내에서 전달될 수 있는 구성요소를 갖는 정밀 편집의 이점을 제공하기 위해, 리라이터 a1("RWa1" 또는 "RW1M")이 개발되었다. RWa1은 mlvRT5M에 융합된 MS2 코트 단백질(MCP) 펩티드와 공동발현된 nCas9 및 MCP 펩티드가 특이적으로 결합할 수 있는 MS2 헤어핀을 포함하는 gRNA를 포함할 수 있다. RW1M은 nSpCas9에 의해 결합된 gRNA 안으로 MS2 헤어핀을 통합하여 mlvRT5M에 융합된 MS2-결합 펩티드(MBP)를 모집할 수 있다. RW1M은 하나의 AAV에서 nSpCas9, 및 다른 AAV에서 MBP-mlvRT5M 및 gRNA의 전달을 허용할 수 있다(도 27).
도 27에 도시된 바와 같이, PE2를 포함하는 편집 시스템은 5개 점 돌연변이를 함유하는 몰로니 백혈병 바이러스 역전사효소(mlvRT5M)에 융합된 닉킹 Cas9(nCas9)를 포함할 수 있다. PE2에서 사용되는 가이드 RNA는 역전사효소 주형(RTT) 서열과 프라이머 결합 부위(PBS) 서열을 함유하는 스캐폴드 서열의 3' 말단에 연장을 포함할 수 있다. nCas9는 먼저 PBS와 혼성화하는 게놈 플랩을 방출하는 비-표적 가닥을 흠집낼 수 있다. 그런 다음 mlvRT5M은 RTT를 역전사하여 게놈 플랩을 연장할 수 있다. 분할 PE2를 포함하는 편집 시스템은 nCas9-mlvRT5M 융합 단백질을 형성하기 위해 함께 촉매적으로 스플라이싱하는 2개의 ORF를 발현하기 위해 Npu 분할 인테인을 이용할 수 있다. 리라이터 1M(RW1M)을 포함하는 편집 시스템은 nCas9, mlvRT5M에 융합된 MS2-결합 펩티드(MBP) 및 MBP가 특이적으로 결합하는 MS2 헤어핀을 포함하는 gRNA를 활용할 수 있다(도 27: 왼쪽: MS2 헤어핀은 gRNA 스캐폴드 내에 삽입될 수 있음; 중간: MS2 헤어핀은 gRNA 스캐폴드와 RTT 사이에 삽입될 수 있음; 오른쪽: MS2 헤어핀은 PBS 뒤에 삽입될 수 있음). RW1L을 포함하는 편집 시스템은 이종이량체화 류신 지퍼를 이용하여 nCas9 및 mlvRT5M을 공동국지화할 수 있다. RW1I를 포함하는 편집 시스템은 AAV에 각각 맞는 ORF를 사용하여 nCas9-mlvRT5M 단백질을 생성하기 위해 Npu 인테인으로 분할될 수 있는 신규한 돌연변이 nCas9를 이용할 수 있다. RW1N을 포함하는 편집 시스템은 임의의 조작된 모집 구성요소 없이 nCas9 및 mlvRT5M을 공동발현할 수 있다.
정밀 편집 효율은 특정 3-뉴클레오티드(nt) 돌연변이를 정착함에 의해 GFP로 편집될 수 있는, BFP를 안정적으로 발현하는 HEK293 세포주를 사용하여 결정되었다. 제1 단백질 성분(nSpCas9)을 발현하는 플라스미드, 제2 단백질 성분(MBP-mlvRT5M)을 발현하는 제2 플라스미드, 및 gRNA를 발현하는 제3 플라스미드를 HEK293 세포주 안으로 일시적으로 동시형질감염시켰다. Cas9-결합 스캐폴드 내에 MS2 헤어핀 삽입을 포함하고, PAM 부위를 제거하고 GFP 돌연변이를 정착하기 위한 +2 ATGG에서 CATA로의 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT로 추가 변형된, gRNA 2.0과 RWa1을 발현하는 플라스미드(nCas9 및 MCP-mlvRT5M)의 공동형질감염은, PE2로의 19%와 비교하여 3.7% GFP+ 세포를 초래했다(도 11b). MS2 헤어핀을 게놈 플랩과 PBS의 부위에 더 가깝게 삽입하면 모집된 MBP-mlvRT5M에 의한 역전사의 개시를 촉진할 수 있다. RWa1의 편집 효율은 비변형된 gRNA 스캐폴드와 RTT 사이에 MS2 헤어핀을 삽입함에 의해 15.5%로 증가되었다.
리라이터 b1("RWb1" 또는 "RW1L")은 2개의 AAV 게놈 내에서 편집 구성요소를 전달하기 위한 대안적인 접근법일 수 있다. 편집 구성요소는 mlvRT5M의 N-말단에 융합된 다른 류신 지퍼(LZ2-mlvRT5M)와 이종이량체화되는 류신 지퍼(nSpCas9-LZ1)에 융합된 nCas9를 포함할 수 있다(도 19a). +2 ATGG에서 CATA로 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT를 포함하는 gRNA 2.0과 RWb1을 발현하는 플라스미드(nSpCas9-LZ1 및 LZ2-mlvRT5M)의 공동형질감염은 38% GFP+ 세포를 초래했다(도 11b). 도 11b에 도시된 바와 같이, Cas9-결합 스캐폴드 내에 MS2 헤어핀 삽입을 함유할 수 있고, PAM 부위를 제거하고 GFP 돌연변이를 정착하기 위한 +2 ATGG에서 CATA로의 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT로 추가 변형된, gRNA 2.0과 PE2로 형질감염된 HEK293 세포는 19%의 편집 효율을 초래했다. 동일한 gRNA를 갖는 RWa1은 3.7% GFP+ 세포를 초래했다. 비변형된 gRNA 스캐폴드와 RTT 사이에 MS2 헤어핀을 삽입함에 의해 RWa1의 편집 효율을 15.5%로 증가되었다. RWb1 및 +2 ATGG에서 CATA로의 돌연변이를 인코딩하는 13-nt PBS 및 13-nt RTT를 포함하는 gRNA 2.0 작제물은 38% GFP+ 세포를 초래했다. RW1L은 2개의 AAV 게놈 내에서 편집 구성요소를 전달하기 위한 대안적인 설계로 개발되었다. RW1L은 mlvRT5M의 N-말단에 융합된 상보적 류신 지퍼(LZ2-mlvRT5M)와 이종이량체화되는 류신 지퍼17에 융합된 nSpCas9(nSpCas9-LZ1)를 포함할 수 있다. (gRNA 2.0에서 MS2 헤어핀이 반드시 RW1L의 구성요소와 상호작용할 것으로 예상되지는 않았지만), RW1M과 직접 비교할 수 있도록 RW1L은 처음에 RW1M용으로 구축된 gRNA 2.0 스캐폴드를 함유하는 동일한 gRNA로 시험되었다.
RWa1 및 RWb1은 각각 AAV 패키징에 허용되는 크기 제한 내에 있는 2개의 폴리펩티드를 포함할 수 있지만, nSpCas9 및 nSpCas9-LZ1 개방 판독 프레임(ORF)의 크기는 제어 발현에 포함될 수 있는 조절 요소의 길이를 제한할 수 있다. 일부 경우에, Npu C-말단 엑스테인의 제1 잔기로 시스테인에 대한 가능한 요건에 기인하여, 분할 프라임 편집기 2는 nSpCas9-mlvRT5M을 nSpCas9에서 가장 C-말단 시스테인인 Cys574에서 2개의 단편으로 분할하는 인테인을 포함할 수 있다. 적절한 인테인-측접하는 서열이 nSpCas9의 잔기 700과 1250 사이에 도입될 수 있다면, 2개의 인테인-포함 ORF를 갖는 변형된 nSpCas9-mlvRT5M 융합 단백질이, 그렇지 않으면 RWa1 및 RWb1이 허용할 수 있는 것보다, 조절 요소를 위한 더 많은 공간을 갖는 2개의 재조합 AAV 게놈 내에서 인코딩될 수 있다고 고려되었다. mlvRT5M 및 (일부 경우에, 인테인 촉매를 제공하는) 시스테인 치환을 포함하는 nSpCas9의 C-말단 단편에 융합된 Npu C-말단 인테인과 쌍을 이룬 Npu N-말단 인테인에 융합된 nSpCas9의 N-말단 단편을 인코딩하는 작제물의 패널이 시험되었다. 잔기 1172와 1173(nCas9(1-1172)-NpuN 및 nCas9(1173-1368; S1173C)-mlvRT5M; "RWc1" 또는 "RW1I"로 명명됨) 사이의 Ser1173Cys nSpCas9-mlvRT5M 돌연변이체를 분할하는 것은 PE2보다 약 2-배 더 큰 편집 효율(29% 대 15%, 도 19b)을 초래했다.
표준 gRNA 스캐폴드를 사용하여, RWa1, RWb1 및 RWc1은 모두 40% 초과의 편집 효율을 초래하는 것으로 밝혀졌다(도 19c). 놀랍게도, MS2 헤어핀을 함유하지 않는 gRNA의 nCas9 및 MCP-mlvRT5M 작제물과의 공동발현은 MS2 헤어핀을 포함하는 gRNA와 비교하여 대략적으로 동일한 편집 효율을 초래하여, RT를 모집하거나 nCas9 부위에 융합하는 것이 항상 필요하지 않을 수 있거나, 단순히 nCas9와 RT를 공동발현하면 효율적인 편집을 초래할 수 있다는 것을 나타낸다. mlvRT를 능동적으로 모집하지 않은 작제물을 리라이터 d1("RWd1" 또는 "RW1N")이라고 한다. AAV 전달의 맥락에서, RWc1은 최대 대략적으로 670nt의 조절 요소를 수용할 수 있으므로 사용될 수 있다. 각 바이러스에 대해 2.8 x 105의 MOI에서 2개의 별도의 AAV2 작제물로 패키징된 RWc1로 BFP를 발현하는 HEK293 세포를 형질도입하는 것은 74.8% GFP+ 세포를 초래했다(도 19d).
리라이터의 AAV-매개된 전달을 입증하기 위해, 584-nt CMV 프로모터를 수용한 RW1I의 N-말단 단백질 성분을 AAV2 벡터 안으로 패키징하면서 별도의 AAV2 벡터 안으로, RW1I의 C-말단 단백질 성분(또한 CMV 프로모터에 의해 구동됨) 및 U6 프로모터에 의해 구동되는 BFP를 GFP로 전환시키는 gRNA를 패키징했다. 각 바이러스에 대해 2.8 x 105 VG/세포의 MOI에서 BFP-발현 HEK293 세포의 동시적인 AAV 공동-형질도입은 74.8% GFP+ 세포를 초래했다.
결과는 RW1M, RW1L, RW1I, 또는 RW1N이 상이한 gRNA 간에 상이한 편집 효율을 가질 수 있음을 나타내므로, 일부 실시형태는 주어진 gRNA로 효율을 최대화하기 위해 여러 아키텍처를 스크리닝하는 것을 포함한다. RW1I는 두 AAV 게놈 모두에서 조절 요소를 위한 가장 많은 공간을 제공할 수 있는 반면, RW1L 및 RW1N은 제2 AAV 게놈에서 다중 gRNA 카세트를 수용할 수 있다. RW1N은 놀랍게도 플라스미드 형질감염을 사용할 때 다른 아키텍처와 유사한 편집 효율을 제공했지만, 이는 활성 모집에 대한 가능한 필요성을 제거하기 위해 단백질 성분의 충분히 높은 세포내 농도를 요할 수 있다. 따라서, RW1N은 일부 경우에 대안적인 전달 전략 및 발현 수준으로 높은 편집 효율을 제공하지 않을 수 있다.
RNA 연장 재배향
가이드 RNA 연장의 공간적 재배향은 편집 효율 또는 윈도우 길이를 증가시킬 수 있다. 편집 윈도우 길이를 늘리면 주어진 돌연변이의 효율적인 편집을 위해 더 많은 gRNA를 스크리닝하는 것을 허용할 수 있거나 단일 gRNA로 더 많은 병원성 돌연변이를 교정할 수 있다. 부가적으로, 프라임 편집기 3b는 RT에 의해 생성된 서열에 결합하고 반대쪽 가닥을 흠집내는 제2 gRNA를 발현함에 의해 편집 효율을 증가시켜, 이에 의해 RT-합성된 편집의 닉-매개된 불일치 복구를 회피할 수 있다. 프라임 편집기 3b 접근법은 일부 경우에 프라임 편집기의 제한된 편집 윈도우 길이 내에 PAM 부위를 갖는 표적 부위로 제한될 수 있다. 편집 윈도우 길이를 증가시키는 것은 RTT의 길이를 증가시키는 것을 요할 수 있다. 리라이터와 PE의 편집 효율은 더 긴 RTT를 사용할 때 PBS와 게놈 플랩의 혼성화의 속도에 의해 제한될 수 있다는 가설을 세웠다. 또한 RTT의 길이가 증가할 수 있다면 감소가 gRNA 스캐폴드의 일부의 역전사의 빈도에 영향을 미칠 수 있으며, 이는 게놈 안으로 스캐폴드-주형 서열의 바람직하지 않은 삽입으로 의도치않게 이어질 수 있다는 것이 예측되었다. 여기에서 gRNA 위치화 시스템(GPS)으로 지칭되는 RNA 구성요소가 설계되었으며, 이는 RTT의 길이에 관계없이 PBS가 게놈 플랩 근처에 있도록 공간적으로 배향하기 위해 gRNA의 3' 연장 안으로 도입될 수 있다. GPS 버전 1(V1)은 RTT의 3' 영역과 혼성화할 수 있는 RTT의 5'에 삽입된 RNA 서열을 포함할 수 있고/있거나 GPS 버전 2(V2)는 RTT의 5' 부분과 혼성화할 수 있는 PBS의 3'에 삽입된 RNA 서열일 수 있다(도 20a). 전산적 RNA 접힘 분석은 GPS V1 및 V2가 PBS를 의도한 대로 gRNA의 3' 연장의 5' 말단에 더 가깝게 가져올 것이라고 예측했다(도 12b). RNA 접힘 분석은 GPS V1과 V2가 gRNA의 3' 연장의 구조를 변경하여 PBS를 gRNA 스캐폴드에 더 가깝게 가져올 수 있다고 예측했다.
GPS는 또한 벨크로로 지칭될 수 있다. 마찬가지로, 벨크로는 GPS로 지칭될 수 있다. GPS는 벨크로 또는 벨크로의 구성요소를 포함할 수 있다. 벨크로는 GPS 또는 GPS의 구성요소를 포함할 수 있다.
RWb1 및 107-nt RTT를 포함하는 가이드 RNA의 공동형질감염은 14% GFP+ 세포를 생성하였으며, 이는 더 짧은 13-nt RTT를 사용하여 달성된 38%보다 현저히 낮았고, 따라서 편집 윈도우를 넓히기 위해 RTT 길이를 증가시키는 것은 편집 효율을 감소시킬 수 있다는 것을 확인하였다. 20-nt GPS V2를 추가하는 것은 편집 효율을 27.4%로 증가시켰다. GPS V1은 편집 효율을 14%에서 24.8%로 증가시켰다. GPS V1은 GPS 서열의 역전사 및 게놈 삽입을 유발하는 데 사용될 수 있다. PBS의 3'인 20-nt GPS V2의 사용은 편집 효율을 27.4%로 증가시켰고 GPS 서열의 게놈 삽입 가능성이 없다. GPS V2가 진행되었고, GPS V2 구성요소를 사용한 리라이터 시스템은 "리라이터 2.0"으로 지칭될 수 있거나 "g"로 표시될 수 있다(예를 들어 "RW1I_g"). 다음으로, 129-nt 주형을 사용하여 흠집 부위로부터 3-nt 돌연변이 65-nt를 정착하는 것은 GPS V2를 통합함에 의해 4-배 증가되었다는 것이 발견되었다(도 20b). 표적 부위의 아미노산 서열을 유지하면서 역전사를 억제할 수 있는 2차 구조를 제거하기 위해 RTT를 재코딩함에 의해 이 편집을 만드는 효율이 21%로 증가되었다. 마지막으로, 다양한 길이와 결합 부위의 GPS의 패널이 생성되었고, RTT의 처음 20-nt에 혼성화된 20-nt GPS는 세트 중 가장 높은 편집 효율을 초래했다(도 12d). RTT의 처음 20-nt에 혼성화된 20-nt GPS는 다양한 길이와 결합 부위의 GPS V2의 패널 중에서 가장 높은 편집 효율을 초래했다. 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균 ± 1 표준 편차로 도시된다.
제2 가닥 합성
다음으로, 편집 효율은 제1 합성된 가닥에 상보적인 원하는 편집을 포함하는 DNA의 제2 가닥을 합성함에 의해 더 증가될 수 있다는 가설을 세웠다. 제2 가닥 프라이머(SSP)가 도입되었다. SSP는 역전사효소가 제1 합성된 가닥을 제2 가닥 합성을 위한 주형으로 사용하는 것을 허용할 수 있다(도 13a). SSP는 3' gRNA 연장의 3' 말단 안으로 삽입될 수 있다. SSP는 편집 부위의 3'인 제1 합성된 가닥의 일부에 혼성화할 수 있다. PBS가 플랩에 혼성화되고 제1 가닥이 역전사된 후, SSP는 제1 합성된 가닥에 혼성화하여 역전사효소가 제1 합성된 가닥을 제2 가닥 합성을 위한 주형으로 사용하는 것을 허용할 수 있다.
SSP는 편집 부위의 3'인 제1 합성된 가닥의 일부에 혼성화할 수 있다. SSP의 시작부터 gRNA의 3' 말단까지의 영역이 제1 합성된 가닥에 상보적이 되도록 하기 위해, 자가-절단 간염 델타 바이러스(HDV) 리보자임이 SSP의 3'에 도입되었다. SSP가 PE2의 편집 효율을 개선할 수 있었는지 여부가 먼저 시험되었다. 20-nt SSP는 40-nt 또는 60-nt SSP보다 더 나은 성능을 발휘하는 것으로 밝혀졌다(도 13b). 20-nt SSP는 40- 및 60-nt SSP보다 더 나은 성능을 발휘했다. 흠집 부위에서 최대 6- 및 36-nt를 혼성화한 20-nt SSP를 통합하는 것은 SSP가 없는 경우에 비해 편집 효율이 대략적으로 2배 증가했다. 흠집 부위에서 최대 55-nt까지 혼성화한 20-nt SSP는 편집 효율을 개선시키지 않았다. 이것은 RTT의 더 원위 부분의 역전사의 낮은 효율에 기인하고, 이에 의해 SSP 결합 부위의 이용가능성이 제한되었기 때문인 것으로 예측되었다. 이 SSP 기술을 활용하는 시스템은 리라이터 3.0으로 명명되었다. 그런 다음 SSP는 리라이터 2.0을 사용한 벨크로 후에 삽입되어 편집 효율을 추가로 증가시킬 수 있어, ~41% 편집을 초래하였다는 것이 밝혀졌다(리라이터 3.2, 도 21). 또한 SSP의 말단 3-nt가 제1 합성된 가닥에 상보적이지 않을 때 SSP가 제공하는 효율에서의 증가가 폐지되었다는 것이 입증되었다.
HDV 리보자임은 3' 말단 상에 2'3' 사이클릭 포스페이트를 남길 수 있고 역전사는 프라이머로부터 합성을 개시하기 위해 3' 하이드록실을 사용할 수 있기 때문에, 인간 폴리뉴클레오티드 키나아제와 같은 내인성 효소는 2'3' 사이클릭 포스페이트를 3' 하이드록실로 전환할 수 있다. HDV 리보자임 대신에 SSP 후에 tRNA를 합체하는 것은 tRNA의 RNase P 절단에 이어 3' 하이드록실의 더 빠른 생성을 초래할 수 있다고 예측되었다. 인간 글루타메이트 tRNA를 합체하는 것은 50.9%로 편집 효율에서의 통계적으로 유의미한 증가를 초래했다. 닉으로부터 편집 65-nt를 만드는 효율은 표적 부위의 아미노산 서열을 유지하면서 역전사를 억제할 수 있는 2차 구조를 제거하기 위해 RTT를 다시 코딩함에 의해 약간 증가되었다.
mlvRT 조작
PE2는 시험관내 역전사효소 활성을 개선시키는 것으로 보고된 PE1의 mlvRT 안으로 돌연변이를 도입함에 의해 개발되었다. PE2에 사용된 mlvRT는 연속성, 열안정성, 기질 친화성을 증가시키거나 RNaseH 활성을 조절하는 돌연변이를 합체함에 의해 추가로 개선될 수 있다. 따라서, 시험관내 mlvRT 활성을 개선할 수 있는 mlvRT에서 31개 돌연변이가 스크리닝되었다(도 14a). 5개 돌연변이는 편집에서 통계적으로 유의한 증가를 가졌다. mlvRT5M 상의 이들 돌연변이의 조합의 효과를 테스트하여 편집 효율에서 잠재적인 증가를 결정했다. mlvRT5M에 9개 돌연변이를 추가함에 의해, 편집 효율이 mlvRT5M에 대해 ~43%에서 mlvRT14M에 대해 ~54%로 증가되었다(도 14b). mlvRT14M을 합체하는 시스템은 "리라이터 4" 또는 "리라이터 2"(예를 들어 "RW2I_g")로 지칭될 수 있다.
낮은 dNTP 농도 극복
PE 또는 리라이터의 일부 실시형태와 같은 역전사효소를 사용하여 DNA를 중합하는 게놈 편집기는 dNTP를 기질로 사용할 수 있다. 따라서 비-분열하거나 느리게 분열하는 세포(예컨대 망막 및 폐)의 낮은 dNTP 농도 특성은 배양에서 빠르게 분열하는 세포의 편집과 비교하여 가능하기로는 장벽을 제기할 수 있다고 생각할 수 있다. SAMHD1은 세포질 dNTP 농도를 조절할 수 있는 트리포스포히드롤라제이다. 비분열 세포에서, SAMHD1은 dNTP를 가수분해할 수 있다. 순환 세포에서, 사이클린 의존성 키나제 1(CDK1)은 SAMHD를 인산화할 수 있다. 이것은 dNTP 가수분해를 억제할 수 있다. 이것은 더 높은 dNTP 농도로 이어질 수 있다. SAMHD1 T592A 돌연변이체("SAMHD1p-" 또는 "SAMHD1(T592A)")는 일부 경우에 인산화되지 않을 수 있으며, 따라서 CDK1의 존재 여부에 관계없이 dNTP 풀을 고갈시킬 수 있다. VPX는 분해를 위해 SAMHD1을 특이적으로 표적화하도록 HIV-2에 의해 발현되는 작은 단백질일 수 있다. HEK293T 세포에서 비분열 및 느리게 분열하는 세포의 더 낮은 dNTP 농도는 SAMHD1p-를 발현함에 의해 모델링될 수 있는 것으로 예측되었다(도 15a).
도 15b는 SAMHD1p-로 리라이터 3.2("RW1L_g"로도 지칭될 수 있음)를 공동형질감염시키면 편집 효율을 2.7-배 감소시켜, dNTP 농도가 일부 경우에 게놈 편집을 제한할 수 있다는 아이디어를 뒷받침함을 나타낸다. SAMHD1(T592A)이 공동발현되었을 때 편집 효율은 2.7-배 감소했다. mlvRT5M에 대한 몇 가지 돌연변이는 SAMHD1(T592A)의 존재에서 편집 효율을 일부 회복했다. 일부 돌연변이는 dNTP에 대한 mlvRT의 K m 을 낮출 수 있다. 리라이터 안으로 일부 이러한 돌연변이를 도입하면 닉에서 멀리 떨어진 SAMHD1p- 2-nt의 존재에서 편집 효율을 일부 회복했다. 이들 돌연변이 중 하나인 V223A는 효율을 감소시키지 않는 것으로 확인되었다. V223A를 합체하는 작제물은 리라이터 5.0으로 명명되었다(도 15c). V223A 돌연변이를 mlvRT5M 안으로 도입하는 것은 닉에서 편집 65-nt를 정착하는 효율을 감소시키지 않았다(리라이터 5).
비분열 및 느리게 분열하는 세포에서 편집 효율을 증가시키기 위한 보완적 접근법으로 VPX가 이용되었다. VPX는 작은 HIV-2 단백질일 수 있다. VPX는 분해를 위해 SAMHD1을 구체적으로 표적화할 수 있다. VPXROD(ROD HIV-2 분리주로부터) 및 SAMHD1p-의 공동발현은 VPX 없이 SAMHD1p-를 발현함에 의해 야기되는 편집 효율에서의 감소를 완전히 역전시켰다(도 15d). 편집 효율에서 SAMHD1p--유도된 감소는 닉에서 65-nt에 돌연변이가 정착되었을 때 훨씬 더 과감했다. 거의 제로인 효율은 모든 dNTP 통합에 대한 DNA 합성 효율에서의 복합 감소로 인한 것일 수 있다. VPXROD의 공동발현은 편집 효율을 SAMHD1p-를 발현함이 없이 관찰된 효율의 78%로 회복시켰다(리라이터 5.1).
VPX의 변이체는 SAMHD1p-의 존재에서 닉으로부터 돌연변이 65-nt를 정착하는 효율을 완전히 회복시킨 HIV-2 임상 단리물 RH2-1(VPXRH2-1)로부터 동정되었다(리라이터 5.2; 도 15e). 도 15e에서 돌연변이율 데이터는 3개의 생물학적으로 독립적인 샘플의 평균 ± 1 표준 편차로 도시된다. VPXRH2-1은 또한 SAMHD1(T592A)을 RW2I 및 닉으로부터 돌연변이 2-nt를 정착할 수 있는 gRNA와 공동발현할 때 VPXROD를 능가하여 64% 편집 효율을 생성하였고(도 15f), 뿐만 아니라 RW2I_g 및 닉으로부터 돌연변이 65-nt를 정착하는 gRNA를 갖는다(도 23). VPXRH2-1을 통합하는 리라이터 시스템은 "_v"로 지정될 수 있다(예를 들어: "RW2I_gv").
dNTP의 농도를 증가시키는 것은 세포에서 편집 효율을 증가시키기 위한 부가적인 상보적 접근법일 수 있다. 방법은 뉴클레오티드 또는 뉴클레오시드를 세포에 전달하여, 뉴클레오티드 또는 뉴클레오시드를 받지 않은 세포와 비교하여 세포에서 dNTP의 증가된 농도를 초래하는 것을 포함할 수 있다. 세포에서 dNTP의 증가된 농도는 본 명세서에 개시된 바와 같은 조성물을 포함하는 세포에서 증가된 편집 효율을 초래할 수 있다. 일부 경우에, dNTP는 대상체(예를 들어, 세포를 포함하는 대상체)에게 투여된다. 일부 실시형태에서, dNTP를 세포에 투여하는 것은 세포를 포함하는 대상체에게 dNTP를 투여하는 것을 포함한다. dNTP의 투여는 경구 투여를 포함할 수 있다. dNTP의 투여는 주사에 의한 것일 수 있다.
낭포성 섬유증 돌연변이 또는 기타 질환 돌연변이 교정
낭포성 섬유증에 대한 소-분자 요법은 땀 염화물, 폐 합병증 비율 및 강제 호기량의 완전한 기능적 회복이 아닌 것으로 나타났습다. 부가적으로, CFTR 유전자의 낭포성 섬유증(CF)-야기 돌연변이의 대부분은 이들 소분자에 의해 치료가능하지 않을 수 있다. 영향을 받은 세포에 CFTR 유전자의 기능적 카피를 전달하는 것은 CF 환자의 CFTR 유전자형에 관계없이 임의의 CF 환자를 치료할 수 있다. 그러나, CF를 치료하기 위한 유전자 요법 접근법은 CFTR 발현의 일시적이고 합성적인 조절뿐만 아니라 불완전한 활성을 나타내는 절삭된 CFTR의 사용을 요할 수 있는 AAV의 제한된 패키징 용량에 의해 제한되었다. CFTR 편집과 관련된 일부 데이터는 도 29b 및 도 29c에 도시되어 있다.
대안으로, 그 자연 조절 요소에 의해 제어되는 CFTR 활성을 복원하기 위해 CF-야기 돌연변이를 편집하는 것은 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 이와 같이, 본 명세서에 기재된 방법 및 조성물의 일부 실시형태는 CF를 치료하는 데 사용될 수 있다. 일부 실시형태는 돌연변이 CFTR 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 CF를 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 CFTR 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 96의 핵산 서열을 포함한다. 스페이서는 서열번호: 96에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 97의 핵산 서열을 포함한다. 스페이서는 서열번호: 97에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 98의 핵산 서열을 포함한다. 스페이서는 서열번호: 98에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 99의 핵산 서열을 포함한다. 스페이서는 서열번호: 99에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 100의 핵산 서열을 포함한다. 스페이서는 서열번호: 100에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 101의 핵산 서열을 포함한다. 스페이서는 서열번호: 101에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 102의 핵산 서열을 포함한다. 스페이서는 서열번호: 102에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 103의 핵산 서열을 포함한다. 스페이서는 서열번호: 103에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 104의 핵산 서열을 포함한다. 스페이서는 서열번호: 104에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 105의 핵산 서열을 포함한다. 스페이서는 서열번호: 105에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 CF의 치료 파라미터를 개선한다.
[표 1] - 스페이서
마찬가지로, 본 명세서에 기술된 방법 및 조성물의 일부 실시형태는 다른 질환을 치료하는 데 사용될 수 있다. 표적 유전자에서 정확한 서열을 복원하기 위해 질환-야기 돌연변이를 편집하는 것은 질환이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 표적 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 질환을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 표적 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 일부 이러한 스페이서는 표 1에 포함되어 있다. 스페이서는 표 1의 스페이서에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 동일한 핵산 서열 또는 상보적인 서열을 포함할 수 있다. 일부 경우에, 스페이서는 유사한 서열을 포함하지만 T 대신 U를 포함한다. 일부 실시형태에서, 투여는 대상체에서 질환의 치료 파라미터를 개선한다.
본 명세서에 기재된 방법 및 조성물의 일부 실시형태는 어셔 증후군을 치료하는데 사용될 수 있다. USH2A를 복원하기 위해 어셔 증후군-야기 돌연변이를 편집하는 것은 어셔 증후군이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 USH2A 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 어셔 증후군을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 USH2A 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 106의 핵산 서열을 포함한다. 스페이서는 서열번호: 106에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 107의 핵산 서열을 포함한다. 스페이서는 서열번호: 107에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 어셔 증후군의 치료 파라미터를 개선한다. 일부 실시형태에서, 게놈 편집 구성요소은 도 25b에 도시된 돌연변이를 교정한다. USH2A 편집과 관련된 일부 데이터는 도 29a에 도시되어 있다.
USH2A.1 스페이서는 도 25a 및 도 25b의 데이터를 생성하기 위해 사용되었다. 도 25a에서의 데이터에 대해, HEK293T 세포는 PBS, RTT 또는 GPS의 다양한 서열을 사용하여 RW2I로 형질감염되었다. 편집 효율은 의도된 2298T>C 돌연변이가 있는 판독의 백분율로 표시된다. 15-nt PBS, 52-nt RTT 및 20-nt GPS는 22% 편집을 초래했다. 편집 효율이 표 1에 포함된 유사한 실험이 또한 수행되었다. 도 25b에서의 데이타에 대해, 15-nt PBS, 52-nt RTT, 20-nt GPS 작제물에 의해 생성된 가장 빈번한 돌연변이체 대립유전자는 RTT에서 인코딩된 2298T>C 및 2316C>A 돌연변이 둘 모두를 함유하였다(18.8%). 판독의 부가 7.1%는 2316C>A PAM-파괴 돌연변이 단독 또는 표적 2298T>C 돌연변이 단독에 의해 표시되었다. 낮은 빈도의 아데닌 삽입도 표적 서열 내의 폴리-A 트랙을 따라 검출되었다. 도시된 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균 ± 1 표준 편차를 포함한다.
본 명세서에 기술된 방법 및 조성물의 일부 실시형태는 스타가르트병을 치료하는 데 사용될 수 있다. ABCA4를 복원하기 위해 스타가르트병-야기 돌연변이를 편집하는 것은 스타가르트병이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이 ABCA4 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 스타가르트병을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 ABCA4 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 108의 핵산 서열을 포함한다. 스페이서는 서열번호: 108에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 109의 핵산 서열을 포함한다. 스페이서는 서열번호: 109에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 110의 핵산 서열을 포함한다. 스페이서는 서열번호: 110에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 111의 핵산 서열을 포함한다. 스페이서는 서열번호: 111에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 스타가르트병의 치료 파라미터를 개선한다. ABCA4 편집과 관련된 일부 데이터는 도 29s-29f에 도시되어 있다.
본 명세서에 기재된 방법 및 조성물의 일부 실시형태는 윌슨병을 치료하는데 사용될 수 있다. ATP7B를 복원하기 위해 윌슨병-야기 돌연변이를 편집하는 것은 윌슨병이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 ATP7B 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 더 많은 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 윌슨병을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 ATP7B 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 112의 핵산 서열을 포함한다. 스페이서는 서열번호: 112에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 113의 핵산 서열을 포함한다. 스페이서는 서열번호: 113에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 114의 핵산 서열을 포함한다. 스페이서는 서열번호: 114에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 115의 핵산 서열을 포함한다. 스페이서는 서열번호: 115에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 윌슨병의 치료 파라미터를 개선한다.
본 명세서에 기술된 방법 및 조성물의 일부 실시형태는 헌팅턴병을 치료하는 데 사용될 수 있다. HTT를 복원하기 위해 헌팅턴병-야기 돌연변이를 편집하는 것은 헌팅턴병이 있는 대상체에 대한 장기간 및 잠재적으로 치료적 요법을 제공할 수 있다. 일부 실시형태는 돌연변이체 HTT 유전자를 교정하도록 구성된 본 명세서에 기재된 게놈 편집 구성요소를 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 하나 이상의 폴리뉴클레오티드를 포함하는 아데노바이러스와 같은 하나 이상의 바이러스를 이를 필요로 하는 대상체(예를 들어 헌팅턴병을 갖는 대상체)에게 투여하는 것을 포함한다. 이러한 구성요소의 예는 HTT 핵산의 영역에 역상보적인 스페이서를 포함하는 가이드 RNA를 포함한다. 스페이서는 서열번호: 116의 핵산 서열을 포함한다. 스페이서는 서열번호: 116에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 117의 핵산 서열을 포함한다. 스페이서는 서열번호: 117에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 118의 핵산 서열을 포함한다. 스페이서는 서열번호: 118에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 스페이서는 서열번호: 119의 핵산 서열을 포함한다. 스페이서는 서열번호: 119에 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 투여는 대상체에서 헌팅턴병의 치료 파라미터를 개선한다.
연장을 포함하는 가이드 핵산이 본 명세서에 개시되어 있다. 연장은 HTT를 편집하기 위한 연장 핵산 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 140의 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 140의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다. 연장은 GPS 영역을 포함할 수 있다. 연장은 GPS 영역을 포함하지 않을 수 있다. GPS 영역을 포함하는 연장의 연장 서열의 예는 서열번호: 141에 포함된다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 141의 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 141의 서열을 포함할 수 있다. HTT를 편집하기 위한 연장 핵산 서열은 서열번호: 141의 서열에 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 또는 적어도 95% 동일한 서열을 포함할 수 있다.
어셔 증후군 유전자 리라이팅
어셔 증후군은 난청과 시력 상실이 결합된 가장 일반적인 유전 원인일 수 있다. 보청기와 귀 임플란트가 일부 어셔 환자에서 난청을 치료할 수 있지만, 그의 시력 상실은 현재로 치료불가능하다. 어셔 증후군을 야기하는 가장 흔한 돌연변이는 USH2A 유전자에서 단일-뉴클레오티드 결실인 2299delG일 수 있다. 리라이터는, 기능적 USH2A의 전달을 포함하는 유전자 요법이 그렇지 않으면 전형적인 AAV 및 렌티바이러스 패키징 용량을 초과하는 USH2A cDNA 크기(15.6kb)에 의해 방해받을 수 있고, 기본 편집기가 뉴클레오티드 삽입을 수행할 수 없기 때문에, 어셔 증후군이 있는 환자에 대한 치유적 치료를 제공하기 위한 접근법을 제공할 수 있다.
USH2A에서 2299G 영역을 리라이팅하기 위해 구성요소가 제공되었다. 편집 효율은 닉으로부터 RTT 23-nt에 인코딩된 2298T>C 침묵 돌연변이의 정착을 정량화함에 의해 야생형 HEK293T 세포에서 결정되었다. 2299G가 RTT에 의해 인코딩되지만, 야생형 HEK293T 세포는 이미 2299G를 함유하기 때문에 2298T>C도 대리 돌연변이로 포함되었다. 또한 의도된 편집이 달성된 후 nSpCas9가 계속해서 표적 부위를 흠집내는 것을 방지하도록 의도된 닉으로부터 RTT 5-nt에서 2316C>A PAM-비활성화 침묵 돌연변이가 인코딩되었다.
RW2I 시스템에서 15-nt PBS, 52-nt RTT 및 20-nt GPS의 사용을 통하여 22 퍼센트 편집이 달성되었다(도 25a). 도 25a에서의 데이터에 대해, HEK293T 세포는 PBS, RTT 및 GPS의 상이한 서열을 사용하여 RW2I로 형질감염되었다. 편집 효율은 판독의 백분율로서 의도된 2298T>C 돌연변이로 표시된다. 15-nt PBS, 52-nt RTT 및 20-nt GPS는 22% 편집 결과를 가져왔다.
9, 11, 13 및 15-nt의 PBS 길이가 시험되었고; 32, 34, 36, 52 및 56-nt의 RTT 길이가 평가되었고; 20-nt GPS가 52 및 56-nt RTT 작제물에 포함되었다. GPS를 포함하지 않은 모든 작제물은 6.3% 미만의 편집 결과를 얻었지만, 대조적으로 52-nt RTT 및 20-nt GPS가 있는 작제물은 9-nt PBS로 대략적으로 6.5%로부터 15-nt PBS로 22%까지 증가하여 가장 높은 편집 효율을 제공했다. 이들 결과는 GPS가 흠집의 부위에서 23-nt만큼 가까운 편집을 도입하는 효율을 유의하게 향상시킬 수 있음을 나타낸다. 스페이서의 상위 5개 인 실리코-예측된 표적-외 게놈 부위의 심층 서열화가 수행되었고, 리라이터 구성요소를 형질감염함에 의해 도입된 편집은 감지되지 않았다.
다음으로, 15-nt PBS, 52-nt RTT 및 20-nt GPS 작제물에 의해 생성된 대립유전자 변이체의 유형이 분석되었고, 가장 빈번한 변이체는 2316C>A 돌연변이 단독(3.9%), 그리고 그 다음 2298T>C 돌연변이 단독(3.2%)이 이어지는, 2298T>C 및 2316C>A 돌연변이 둘 모두를 함유하는 것(18.8%)으로 밝혀졌다(도 25b). 도 25b는 15-nt PBS, 52-nt RTT, 20-nt GPS 작제물에 의해 생성된 가장 빈번한 돌연변이 대립유전자가 RTT에서 인코딩된 2298T>C 및 2316C>A 돌연변이 둘 다를 포함했다(18.8%)는 것을 나타낸다. 판독의 부가 7.1%는 2316C>A PAM-파괴 돌연변이 단독 또는 표적 2298T>C 돌연변이 단독에 의해 표시되었다. 낮은 빈도의 아데닌 삽입은 또한 표적 서열 내의 폴리-A 트랙을 따라 검출되었다. 일부 부가 양태에 대한 일부 데이터는 도 28에 도시되어 있다.
PAM을 파괴하는 RTT에서 돌연변이를 인코딩하는 것은 편집 효율을 증가시킬 수 있다. PAM을 파괴하는 RTT에서 돌연변이를 인코딩하는 것은 편집 정밀도를 증가시킬 수 있다. PAM 부위를 파괴할 RTT에서 서열을 인코딩함에 의해 편집의 효율을 증가시켰고 바람직하지 않은 결실을 감소시키는 것이 밝혀졌다(도 25c 및 도 25g).
프라임 편집기의 경우와 같이, nSpCas9 또는 스캐폴드 서열 삽입 이벤트에 의해 생성된 검출가능한 삽입결실은 없었다. 아데닌 삽입을 함유하는 2개의 대립유전자가 각각 0.4% 및 0.2%의 빈도에서 의도된 2298T>C 및 2316C>A 돌연변이에 부가하여 역전사된 영역 내에서 동정되었다. 각각의 아데닌 삽입은 폴리-A 트랙의 말단에 있었는데, 이는 잠재적으로 RT-매개된 게놈 편집 접근법이 RNA 주형의 모노뉴클레오티드 트랙에서 희귀한 프레임-이동 돌연변이를 합성할 수 있음을 나타낸다. 침묵 2307A>G 돌연변이로 RTT에서 폴리A 트랙 중 하나를 파괴하는 것이 해당 폴리A 트랙 내에서 아데닌의 바람직하지 않은 삽입을 제거했다는 것으로 밝혀졌다(도 25e). 또한 2298T>C 편집 효율이 RTT 길이를 54-nt로 증가시킴에 의해 41.6%로 증가하였다는 것이 밝혀졌다(도 25f). 마지막으로, 침묵 pam-파괴 2316C>A 돌연변이를 포함하지 않는 것은 2298T>C 편집을 만드는 효율을 2-배 감소시켰다는 것이 밝혀졌다(도 25g). 25a-25g 중 임의의 것에 도시된 그래픽 데이터는 3개의 생물학적으로 독립적인 샘플로부터 평균 ± 1 표준 편차를 포함한다; NS = 유의하지 않음(P < 0.05; 양측 스튜던트스 t-테스트); 및 ND = 검출되지 않음.
도 25e 및 도 30에 도시된 바와 같이, 돌연변이는 연속적인 뉴클레오티드(예를 들어, 4+ 연속적인 뉴클레오티드)의 트랙을 분해하기 위해 RTT에 인코딩될 수 있다. 동일한 염기를 함유하는 적어도 4개의 연속적인 뉴클레오티드의 트랙 상에서 원하지 않는 삽입이 관찰되었다. 역전사효소는 RTT에서 그 주형 서열에 비하여 이들 모노뉴클레오티드 트랙 상에 희귀한 삽입을 만들었다는 것으로 간주되었다. 모노뉴클레오티드 트랙을 동일한 염기의 3개 이하의 연속 뉴클레오티드의 트랙으로 분해하는 돌연변이를 통합함에 의해 바람직하지 않은 삽입이 더 이상 검출되지 않았다는 것이 발견되었다. 도 25a에서의 예에 도시된 바와 같이, RTT의 폴리A 트랙에서 침묵 2307A>G 돌연변이를 인코딩함이 없이, 거의 0.5%의 판독이 위치 2305에서 원하지 않는 A 삽입을 함유했다. 바람직하지 않은 삽입은 RTT의 폴리A 트랙에서 침묵 2307A>G 돌연변이를 포함한 RTT로 검출되지 않았다. 동일한 염기의 것은 RTT에서 인코딩되지 않은 바람직하지 않은 편집을 제거한다.
어셔 증후군 데이터의 일부 하이라이트는 다음을 포함한다: GPS는 편집 효율을 약 4-배 향상시켰고, 표적 외 효과는 관찰되지 않았고, USH2A에 대해 바람직하지 않은 돌연변이는 발생하지 않았고, 40% 초과의 편집 효율이 달성되었다.
도 31a-31b는 트리뉴클레오티드 반복의 정확한 단축이 htt 유전자에서 달성되었음을 보여주며, 이는 헌팅턴병과 같은 질환을 치료하기 위한 본 명세서에 기술된 일부 시스템 및 방법의 적용가능성을 입증한다.
논의
리라이터와 같은 편집 시스템은 주어진 Cas9 표적 부위의 대략적으로 70-nt 내에 뉴클레오티드 치환, 삽입, 결실 또는 복잡한 서열 변경을 도입하기 위한 표적화된 효율적인 기술을 포함할 수 있다. 부가하여, AAV 내에 리라이터를 패키징하는 능력은 광범위한 유전 질환을 치료하기 위해 안전하고 조직-특이적 전달을 가능하게 할 것을 약속한다.
정밀 게놈 편집은 전통적으로 DSB 생성에 의존해 왔으며, 이는 일부 경우에 심지어 전체 염색체의 손실을 야기할 수 있는 유전독성 병변이다. 리라이터는 일반적으로 비교적 무해한 변형인, 하나의 단일-가닥 닉만 생성함에 의해 일부 DSB와 연관된 안전성 문제를 피할 수 있다. 부가적으로, 리라이터의 전달가능성과 안전성은 효율을 희생하지 않으면서 최대 64%의 편집이 달성되었으며, 이는 DSB를 생성함이 없이 인간 세포에서 표적화된 다중-염기 편집에 대해 지금까지 보고된 가장 높은 효율이다.
GPS는 gRNA 연장의 3차 구조를 제어함에 의해 편집 효율 및 윈도우 길이를 개선할 수 있는 리라이터 플랫폼에서 새로운 구성요소를 포함할 수 있다. GPS는 편집의 부위에 바로 인접한 PAM을 필요로 하는 제약을 완화할 수 있고 단일 작제물로 다중 병원성 돌연변이의 교정을 가능하게 할 수 있다. 예를 들어, 시의력 상실을 초래하는 두 번째로 가장 흔한 USH2A 돌연변이는 2276G>T일 수 있으며, 이는 가장 흔한 돌연변이인 2299delG로부터 23-nt일 수 있다. 일부 실시형태는 이들 돌연변이 중 하나를 갖는 환자를 치료할 수 있는 gRNA의 사용을 포함한다.
mlvRT 돌연변이체의 스크리닝은 보다 효율적인 mlvRT14M의 식별을 유도하여, 이 성분을 추가로 최적화할 가능성을 강조하였다. mlvRT14M 돌연변이체의 편향되지 않은 라이브러리는 편집을 개선하기 위해 모아진 형식에서 BFP에서 GFP로의 전환 검정으로 스크리닝될 수 있다. 아마 SAMHD1(T592A)의 과발현을 통해 낮은 dNTP 농도에서 RT의 라이브러리를 스크리닝하는 것은 dNTP가 비-분할 세포를 편집하기 위해 VPX에 대한 가능한 요구를 회피하기 위해 충분히 낮은 KM을 가진 변이체를 동정할 수 있다.
비-분할 세포에서의 정확한 편집은 전통적으로 상당한 도전이었다. SAMHD1에 의해 야기된 편집에서 제한에 대응하기 위해 VPX를 사용하여 본 명세서에 제공된 결과는 광수용체 및 뉴런과 같은 임상적으로 관련된 유사분열-후 세포 또는 많은 기관을 구성하는 천천히 분열하는 세포를 편집하는 경로를 제공한다. 편집을 위한 잠재적인 제한 인자로서 SAMHD1의 식별을 감안할 때, SAMHD1-억제 소분자는 세포질 dNTP 농도의 일시적인 증가를 제공하기 위해 평가될 수 있다.
AAV 전달 시 DSB를 생성함이 없이 인간 세포의 게놈에서 표적화된 복잡한 서열 변경을 정확하게 생성할 수 있는 제1 시스템으로서, 리라이터는 기능적 게놈 연구를 발전시키고 인간 질환을 치료하는 데 사용될 수 있다.
방법
일반적인 방법: Q5 DNA 중합효소(New England Biolabs)를 DNA 증폭에 사용했다. DNA 올리고뉴클레오티드는 Integrated DNA 기술에서 얻었다. 플라스미드는 골든 게이트 조립 방법에 의해 구축되었다. 포유류 세포 실험을 위한 벡터는 Plasmid Plus midiprep 키트(Qiagen) 또는 ZymoPURE miniprep 키트(Zymo Research)를 사용하여 정제되었다.
일반적인 포유동물 세포 배양: HEK293T 세포(ATCC CRL-3216)를 10%(v/v) 소태아혈청(Gibco) 및 항생제-항진균제(ThermoFisher Scientific)(DMEM+)가 보충된 둘베코의 변형된 이글 배지(DMEM) 및 GlutaMAX(ThermoFisher Scientific)에서 배양하고 계대했다. 세포를 37℃에서 5% CO2로 배양했다.
형질감염: HEK293T 세포를 96-웰 폴리-d-라이신 코팅된 플레이트(Corning) 상에 시딩하였다. 시딩 후 대략적으로 24시간 후에 배지를 Opti-MEM(Gibco)으로 교체하고 각 웰에 제조업체의 프로토콜에 따라 0.8ul 리포펙타민 2000(ThermoFisher Scientific)과 400ng의 총 플라스미드 DNA를 형질감염시켰다. 배지는 형질감염 후 6 내지 8시간 사이에 DMEM+로 교체하였다.
AAV 패키징, 수확 및 형질도입: HEK293T 세포는 3개의 플라스미드인 - Rep/Cap 플라스미드, 아데노바이러스 유전자를 함유하는 헬퍼 플라스미드 및 역방향 말단 반복에 측접된 패키징을 위해 의도된 카고를 함유하는 전달 플라스미드의 공동-형질감염에 의해 AAV 생산을 위한 삼중-형질감염 방법에 적용되었다. 형질감염은 25,000의 평균 분자량을 갖는 분지형 폴리에틸렌이민(PEI)(Sigma 408727)을 사용하여 수행되었다. 형질감염 3일 후, AAVpro 정제 키트 맥시(Takara 6666)를 사용하여 세포를 수확하고 정제하였다. 정제된 AAV 스톡의 역가는 SsoAdvanced Universal SYBR Green Supermix(Bio-Rad)를 사용하여 CFX96 실시간 시스템(Bio-Rad) 상에서 qPCR에 의해 결정되었다. BFP-발현 HEK293 세포는 동등한 수의 AAV-A 및 AAV-B 바이러스 입자로 공동-형질도입되었고, BFP-대-GFP의 편집은 형질도입 후 96-120시간에 유세포분석에 의해 결정되었다.
유세포분석: 형질감염 48시간 후, 배지를 제거하고 세포를 0.05% 트립신/EDTA(Gibco)로 분리하였다. 트립신을 DMEM+로 중화하고 현탁된 세포를 둥근-바닥 96-웰 플레이트에 배치하였다. Attune NxT 유세포모터(ThermooFisher Scientific)를 사용하여 웰당 30,000개 세포의 형광을 분석했다.
고-처리량 게놈 DNA 서열화: 관심있는 게놈 부위를 게놈 DNA 샘플로부터 증폭하고 Illumina MiSeq 상에서 서열화했다. Illumina 정방향 및 역방향 어댑터를 포함하는 증폭 프라이머는 관심있는 게놈 영역을 증폭하기 위한 1차 라운드의 PCR(PCR 1)에 사용되었다. PCR 1 반응물(25μl)은 0.5μM의 각 정방향 및 역방향 프라이머, 1μl 게놈 DNA 추출물 및 12.5μl Phusion U Green Multiplex PCR 마스터 믹스로 수행되었다. PCR 반응은 다음과 같이 수행되었다: 2분 동안 98℃, 그 다음 [98℃에서 10초, 61℃에서 20초, 및 72℃에서 30초]의 30 주기, 이어서 최종 72℃에서 연장 2분. 고유한 Illumina 바코딩 프라이머 쌍이 2차 PCR 반응(PCR 2)에서 각 샘플에 추가되었다. 구체적으로, 주어진 PCR 2 반응물 25μl는 각각의 고유한 정방향 및 역방향 Illumina 바코딩 프라이머 쌍 0.5μM, 정제되지 않은 PCR 1 반응 혼합물 1μl 및 Phusion U Green Multiplex PCR 2 마스터 믹스 12.5μl를 함유했다. 바코딩 PCR 2 반응은 다음과 같이 수행되었다: 2분 동안 98℃, 그 다음 [98℃에서 10초, 61℃에서 20초, 및 72℃에서 30초]의 12 주기, 이어서 최종 72℃에서 연장 2분. PCR 생성물은 1.5% 아가로스 겔에서 전기영동으로 분석적으로 평가되었다. PCR 2 생성물(일반 앰플리콘에 의해 풀링됨)은 40μl 물로 용리하는 QIAquick Gel Extraction Kit(Qiagen)를 사용하여 1.5% 아가로스 겔로 전기영동에 의해 정제되었다. DNA 농도는 형광 정량화(Qubit, ThermoFisher Scientific) 또는 qPCR(KAPA Library Quantification Kit-Illumina, KAPA Biosystems)에 의해 측정되었고 제조업체의 프로토콜에 따라 Illumina MiSeq 기기 상에서 서열화되었다. 서열화 판독은 MiSeq Reporter(Illumina)를 사용하여 역다중화되었다.
참조 서열에 대한 앰플리콘 서열의 정렬은 CRISPResso243을 사용하여 수행되었다. 모든 프라임 편집 수율 정량화의 경우 프라임 편집 효율성은 (삽입결실을 함유하지 않는 원하는 편집을 갖는 판독의 수)/(총 판독의 수)의 백분율로 계산되었다. 점 돌연변이 편집의 정량화를 위해, CRISPResso2는 "discard_indel_reads"가 켜진 표준 모드에서 실행되었다. 점 돌연변이의 정착을 위한 프라임 편집은 그 다음 다음과 같이 명시적으로 계산되었다: (비-폐기된 판독에서 지정된 점 돌연변이의 빈도) Å~ (비-폐기된 판독의 수)/(총 판독). 삽입 또는 결실 편집을 위해 CRISPResso2는 원하는 대립유전자를 예상된 대립유전자(e 플래그)로 사용하고 "discard_indel_reads"가 켜진 HDR 모드에서 실행되었다. 편집 수율은: (HDR-정렬된 판독의 수)/(총 판독)으로 계산되었다. 삽입결실 수율은: (판독을 포함하는 삽입결실의 수)/(총 판독)으로 계산되었다.
형질감염 36시간 후, 세포를 0.05% 트립신으로 탈리하고, 회전시키고, PBS로 세정하고, 다시 회전시켰다. 세포 펠렛을 10ul의 QuickExtract(Lucigen)에 재현탁하고 65℃에서 6분 동안 인큐베이션하였다. 그런 다음 샘플을 15초 동안 볼텍싱하고 98℃에서 2분 동안 인큐베이션했다. 10ul의 뉴클레아제-유리 물을 각 샘플에 첨가했다. 4ul의 샘플을 관심있는 게놈 영역을 증폭하도록 설계된 Illumina 어댑터를 함유하는 Q5 폴리머라제 및 프라이머를 갖는 PCR의 주형으로 사용했다. 그런 다음 샘플을 37℃에서 1시간 동안 Exo-CIP(NEB)로 처리했다. DNA 농도는 Qubit(ThermoFisher Scientific)로 측정되었고 샘플은 Amplicon-EZ 서비스를 사용하여 서열화를 위해 Genewiz로 보내졌다. PE-Analyzer(http://www.rgenome.net/pe-analyzer)를 사용하여 고-처리량 서열화 데이터를 분석했다. 임의의 게놈 편집 구성요소로 형질도입되지 않은 대조군 샘플에서 가장 높은 빈도 변이를 검출 임계값으로 설정하고 이 빈도 미만의 임의의 변이는 폐기했다. 2298T>C 돌연변이를 정착하는 효율은 (2298T>C 돌연변이만 함유하는 판독의 수 + 2298T>C 및 2316C>A 돌연변이만 함유하는 판독의 수)/(검출 임계값 초과의 빈도로 존재하는 대립유전자의 판독의 총 수)로 명시적으로 계산되었다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수 참조를 포함한다. 본 명세서에서 "또는"에 대한 임의의 언급은 달리 언급되지 않는 한 "및/또는"을 포괄하도록 의도된다.
용어 "적어도", "보다 큰" 또는 "보다 크거나 같은"이 2개 이상의 일련의 숫자 값에서 제1 숫자 값 앞에 올 때마다, 용어 "적어도", "보다 큰" 또는 "보다 크거나 같은"은 그 일련의 숫자 값에 있는 각각의 숫자 값에 적용된다. 예를 들어, 1, 2 또는 3보다 크거나 같은 것은 1보다 크거나 같거나, 2보다 크거나 같거나, 3보다 크거나 같은 것에 동등하다.
용어 "보다 많지 않은", "미만", "이하" 또는 "최대"는 2개 이상의 일련의 숫자 값에서 제1 숫자 값 앞에 올 때마다, 용어 "보다 많지 않은", "미만", 또는 "이하" 또는 "최대"는 그 일련의 숫자 값에 있는 각각의 숫자 값에 적용된다. 예를 들어, 3, 2 또는 1보다 작거나 같은 것은 3보다 작거나 같거나, 2보다 작거나 같거나, 1보다 작거나 같은 것에 동등하다.
값이 범위로 기술되는 경우, 그러한 개시는 그러한 범위 내의 모든 가능한 하위-범위뿐만 아니라 특정 숫자 값 또는 특정 하위-범위가 명시적으로 언급되었는지 여부와 상관없이 그러한 범위 내에 속하는 특정 숫자 값의 개시를 포함하는 것으로 이해될 것이다.
실시예
다음 실시예는 예시적이고 본 명세서에 기술된 장치, 방법, 시스템 및 키트의 범주에 비-제한적이다.
실시예 1
게놈 편집 효율 검정
본 실시예는 게놈 편집 효율 검정을 기술한다. 게놈 편집 작제물의 정밀 편집 속도는 녹색 형광 단백질(GFP)을 생성하기 위해 청색 형광 단백질(BFP) 유전자를 편집하는 빈도를 측정함에 의해 결정되었다. 구체적으로, 게놈적으로-통합된 BFP 유전자를 갖는 30,000개 HEK293T 세포를 10% 소태아혈청(FBS)을 함유하는 DMEM에서 96-웰 폴리-d-라이신 처리된 플레이트에 시딩하였다. 12-24시간 후, 배지는 opti-mem 배지로 교체되었다. Lipofectamine 2000은 게놈 편집 구성요소를 인코딩하는 플라스미드를 형질감염시키는 데 사용되었다. 총 400 나노그램의 플라스미드 DNA를 함유하는 25 마이크로리터의 opti-mem을 0.8 마이크로리터의 리포펙타민 2000을 함유하는 25 마이크로리터의 opti-mem에 첨가하였다. 20분 후, 50 마이크로리터 혼합물을 세포를 함유하는 웰에 점적 부가하였다. 6시간 후, 배지는 10% FBS를 함유하는 DMEM으로 교체되었다. GFP 및 BFP 수준은 Attune NxT 유세포분석기를 사용하여 36-60시간 후에 측정되었다.
실시예 2
분할 nCas9 역전사효소 작제물의 편집 효율
본 실시예는 분할 nCas9 역전사효소 작제물의 편집 효율을 기술한다. 융합된 nCas9-mlvRT 또는 분할 nCas9-RT 및 gRNA를 인코딩하는 플라스미드를 실시예 1에 기재된 바와 같이 제조하고 형질감염시켰다. 각 작제물의 편집 효율을 측정하였다. 도 1은 nCas9 및 몰로니 백혈병 바이러스 RT(mlvRT)를 포함하는 융합된 Cas9 닉카제(nCas9) 역전사효소(RT) 작제물("nCas9-mlvRT"), 및 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물("mlvRT 분할 스티치")의 편집 효율을 나타낸다. 분할 스티치는 리라이터(예를 들어 RWb1)로 지칭될 수 있거나 그 반대일 수도 있다. 일부 경우에, 분할 스티치는 리라이터(예를 들어 RWb1) 또는 리라이터 구성요소를 포함할 수 있다. 일부 경우에, 리라이터는 분할 스티치 또는 분할 스티치 구성요소를 포함할 수 있다. mlvRT 분할 스티치는 리라이터(예를 들어 RWb1)의 구성요소의 예일 수 있다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 별도의 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RRL12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다. nCas9-LZ1은 류신 지퍼를 통해 mlvRT(서열번호: 13) 및 N-말단 류신 지퍼(서열번호: 24)를 포함하는 LZ2-mlvRT와 이종이량체화하는 SpCas9(서열번호: 32) 및 C-말단 류신 지퍼(서열번호: 23)를 포함한다. nCas9-mlvRT 작제물의 개략도는 도면의 상단에 제공되어 있다. 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 융합된 nCas9-RT 작제물(약 21% 효율)의 것보다 거의 두 배 향상된 편집 효율(약 38% 효율)을 보여주었다.
도 11a는 프라임 편집기 2 시스템("PE2", 상단), 분할 프라임 편집기 2 시스템("분할 PE2", 중간), 및 2개의 류신 지퍼를 갖는 분할 스티치 작제물("분할 스티치", 하단)의 도메인 배열을 나타낸다. 오른쪽은 가이드 핵산과 복합된 2개의 류신 지퍼(LZ1 및 LZ2)에 의해 연결된 Cas9 닉카제(nCas9) 및 역전사효소(RT)를 포함하는 분할 스티치 작제물의 구조적 개략도이다. 분할 스티치 분할 nCas9-LZ1 및 LZ2-mlvRT 작제물은 별도의 폴리펩티드 사슬 상에 nCas9-LZ1(서열번호: 1, NLS-SpCas9(H840A)-NLS-EE12RR345L(류신 지퍼)) 및 LZ2-mlvRT(서열번호: 2, RR12EE345L(류신 지퍼)-mlvRTv(nCas9-mlvRT(D200N, L603W, T306K, W313F, T330P)-NLS)를 포함한다.
실시예 3
역전사효소 모집에 대한 gRNA 헤어핀 삽입물의 효과
본 실시예는 편집 효율에 대한 gRNA 헤어핀 삽입물의 효과를 기술한다. 융합된 nCas9-mlvRT 또는 분할 nCas9 및 mcp-RT와 gRNA를 인코딩하는 플라스미드를 실시예 1에 기재된 바와 같이 제조하고 형질감염시켰다. 융합된 nCas9-RT의 편집 효율은 pegRNA의 존재에서 측정하였다. 분할 nCas9-RT의 편집 효율은 스캐폴드에 포매된 헤어핀(gRNA 2.0) 또는 스캐폴드 뒤에 위치한 다양한 길이의 헤어핀(1xlongMS2, 1xshortMS2 또는 2xshortMS2)을 갖는 3가지 다른 gRNA의 존재에서 측정하였다. 도 2는 융합된 nCas9-RT 작제물("nCas9-mlvRT") 및 역전사효소(서열번호: 27)에 융합된 nCas9 및 mcp 펩티드를 포함하는 분할 nCas9 및 mcp-mlvRT 작제물("mcp-mlvRTv")의 편집 효율을 나타낸다. mcp 펩티드는 MS2 RNA 헤어핀과 상호작용한다. 분할 nCas9 및 mcp-mlvRT 작제물의 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다. 1xlongMS2 헤어핀을 갖는 gRNA와 1xshortMS2 헤어핀을 갖는 gRNA는 gRNA 2.0보다 개선된 편집 효율을 보여주었다.
도 11b는 다른 gRNA로 도 11a에 예시된 작제물의 편집 효율을 나타낸다. 편집 효율은 BFP를 GFP로 전환하기 위해 편집된 세포의 백분율(% GFP+)로 측정되었다. 편집 효율은 gRNA 2.0(서열번호: 31), 긴 MS2 헤어핀을 갖는 gRNA(서열번호: 28), "gRNA-1xlongMS2"), 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 29, "gRNA-1xshortMS2"), 또는 2개의 짧은 MS2 헤어핀을 갖는 gRNA(서열번호: 30, "gRNA-2xshortMS2")를 포함하는 상이한 가이드 RNA(gRNA) 작제물로 시험되었다. 분할 스티치 작제물(이 경우 RWb1)은 프라임 편집기 2(PE2) 작제물보다 개선된 편집 효율을 보여주었다.
실시예 4
증가된 역전사효소 연속성을 갖는 분할 nCas9-RT 작제물
본 실시예는 증가된 역전사효소 연속성을 갖는 분할 nCas9-RT 작제물을 기술한다. 실시예 2에 기술된 분할 nCas9-RT 작제물은 역전사효소 중합효소 기능의 연속성을 증가시키도록 추가로 조작되었다. 증가된 연속성을 갖는 역전사효소는 실시예 2에 제공된 역전사효소보다 단일 결합 이벤트에서 더 많은 순차 포스포디에스테르 결합의 형성을 촉매할 수 있었다. 증가된 연속성은 더 긴 주형 서열의 역전사를 촉진하고 게놈의 표적 부위에서 더 긴 서열의 편집을 가능하게 할 수 있다. 증가된 연속성을 갖는 역전사효소가 있는 3개의 분할 nCas9-RT 작제물의 편집 효율을 시험했다.
도 3은 증가된 전사 연속성을 갖는 변형된 역전사효소를 포함하는 상이한 분할 nCas9-RT 작제물의 편집 효율을 나타낸다. 지오바실러스 스테아로테르모필루스(GsI-IICRT, 서열번호: 3), 유박테리움 렉탈레(ErRT, 서열번호: 4)로부터의 nCas9 및 역전사효소, 및 R2 폴리단백질로부터 아미노산 116-1016(R2(116-1016), 서열번호: 7)을 포함하는 작제물을 시험하였다. GsI-IICRT 역전사효소("스티치RT")의 개략도는 도 1 및 도 2에 사용된 mlvRT 역전사효소와 비교하여 도시된다. 분할 스티치 R2(116-1016)는 시험된 전사 연속성이 증가된 변형된 역전사효소를 포함하는 3개의 분할 nCas9 및 RT 작제물 중 가장 높은 편집 효율을 보였다.
실시예 5
단일-가닥 파손에서 증가된 편집 효율을 위한 gRNA
본 실시예는 단일-가닥 파손에서 증가된 편집 효율을 위한 gRNA를 기술한다. gRNA는 gRNA의 3' 말단에 제2 가닥 프라이머를 합체함에 의해 단일-가닥 파손에서 편집 효율을 증가시키도록 설계되었다. 제2 가닥 프라이머는 새롭게 합성된 제1 가닥을 주형으로 사용하여 제2 가닥의 합성을 프라이밍했다. 제2 가닥 합성의 프라이밍은 이중-가닥 파손의 형성 없이 단일-가닥 파손의 부위 내에 합성된 서열의 삽입을 용이하게 하였다. 이중-가닥 파손의 형성은 원하지 않는 생성물의 형성의 속도를 증가시킬 수 있다.
도 4a는 본 개시내용의 조작된 gRNA("스티치 가이드")를 사용한 게놈 편집에 대한 방법을 예시한다. 일부 경우에, 스티치 가이드는 리라이터(예를 들어 리라이터 3.0, 리라이터 3.1 또는 리라이터 3.2) 또는 리라이터 구성요소를 포함할 수 있다. 일부 경우에, 리라이터는 스티치 가이드 또는 스티치 가이드 구성요소를 포함할 수 있다. gRNA와 복합체화된 nCas9-RT 작제물은 gRNA의 스페이서를 표적 부위에 혼성화함에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥에 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합된다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화된다. 4-300 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합된다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안에 합체될 수 있다.
도 4b는 pegRNA gRNA 또는 스티치 가이드 gRNA를 사용한 nCas9-RT 작제물의 편집 효율을 나타낸다. pegRNA와 스티치 가이드 gRNA의 개략도는 왼쪽에 도시되어 있다. 스티치 가이드 gRNA에 제2 가닥 프라이머의 함입은 제2 가닥 프라이머를 결하는 pegRNA에 비해 편집 효율을 향상시켰다. 융합된 nCas9-mlvRTv 작제물이 이 검정에 사용되었다.
제2 검정에서, 분할 nCas9-RT 작제물의 편집 효율에 대한 제2 가닥 프라이머 길이 및 결합 부위의 효과가 시험되었다. 제2 가닥 프라이머의 길이뿐만 아니라 단일 가닥 파손의 위치에 대한 제2 가닥 프라이머의 결합 위치도 다양했다. 도 5a는 제1 가닥 프라이머 결합 부위("닉으로부터 nt")의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'에 위치된, 길이가 20 뉴클레오티드(nt), 40 nt 또는 60 nt인 제2 가닥 프라이머(SSP)를 포함하는 상이한 gRNA를 갖는 융합된 nCas9-RT 작제물("nCas9-mlvRTv")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA를 대조군으로 시험했다. 모든 gRNA 서열은 hdv 리보자임(서열번호: 25)을 포함한다. 도 5b는 제1 가닥 프라이머 결합 부위("닉으로부터 nt")의 5' 말단의 6 nt, 36, nt, 또는 55 nt 3'에 위치된, 길이가 20 뉴클레오티드(nt), 40 nt 또는 60 nt인 제2 가닥 프라이머(SSP)를 포함하는 상이한 gRNA를 갖는 nCas9-RT("nCas9-R2(116-1016)")의 편집 효율을 나타낸다. 제2 가닥 프라이머를 결하는 gRNA를 대조군으로 시험했다. nCas9-mlvRTv와 nCas9 및 R2 작제물 둘 모두에서 더 짧은(예를 들어 20 nt) 제2 가닥 프라이머를 갖는 gRNA는 더 긴 제2 가닥 프라이머를 갖는 다른 gRNA와 비교하여 개선된 편집 효율을 보여주었다.
실시예 6
개선된 편집을 위한 이중 가이드 시스템
본 실시예는 개선된 편집을 위한 이중 가이드 시스템을 기술한다. 매우 근접한 반대쪽 가닥 상에 2개의 표적 부위를 표적화하는 2개의 gRNA를 포함하는 이중 가이드 시스템이 세포 내로 도입된다. 각 gRNA는 각 표적 부위에 대한 nCas9-RT 작제물을 모집하여, 각 표적 부위에서 단일 가닥 파손을 촉진한다. 2개의 gRNA는 향상된 전달 및 2개의 표적 부위에 대한 공동-국소화를 보장하기 위해 융합된다.
도 6은 nCas9-RT와 함께 2개의 gRNA 시스템을 사용하는 게놈 편집의 4가지 방식을 예시한다. 2개 가이드 각각이 편집된 가닥(왼쪽 상단)을 생성하는 2개 단일 가이드 시스템에서, 각각의 gRNA는 상이한 nCas9에 결합하고 2개 gRNA는 각각 역전사효소 주형 영역과 프라이머 결합 부위(PBS) 영역을 포함한다. 제2 가이드가 반대쪽 가닥을 흠집내는 2개 단일 가이드 시스템(오른쪽 상단)에서, 각각의 gRNA는 상이한 nCas9에 결합하고 gRNA 중 하나만 역전사효소 주형 영역과 프라이머 결합 부위(PBS) 영역을 포함한다. 2개 가이드가 각각 역전사효소 주형 영역과 프라이머 결합 부위(PBS) 영역을 포함하는 이중 가이드 복합체 시스템(왼쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고, 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; 2개 gRNA 각각은 역전사효소 주형 영역 및 PBS 영역을 포함한다. 제2 가이드가 반대쪽 가닥을 흠집내는 이중 가이드 복합체 시스템(오른쪽 하단)에서, 제1 gRNA의 스페이서는 제1 nCas9에 결합하고 제2 gRNA의 스페이서는 제2 nCas9에 결합하고 제1 gRNA의 스캐폴드는 제2 nCas9에 결합하고, 제2 gRNA의 스캐폴드는 제1 nCas9에 결합하고; gRNA 중 하나만 역전사효소 주형 영역을 포함한다.
도 7은 유전자 편집의 효율을 증가시키는 방법을 예시한다. 제2 가이드가 반대쪽 가닥을 흠집내는 2개 단일 가이드 시스템 또는 제2 가이드가 반대쪽 가닥을 흠집내는 이중 가이드 복합체 시스템으로, 반대쪽 가닥 상의 닉은 표적 핵산 안으로 새롭게 합성된 DNA의 합체를 용이하게 한다. 제2 가이드는 새롭게 합성된 제1 가닥에서의 영역에 역상보적인 플랩을 생성한다. 합성된 제1 가닥은 제2 가닥 합성을 위한 주형으로 작용한다.
2개 gRNA 시스템의 편집 효율은 청색 형광 단백질을 인코딩하는 표적 핵산 안으로 정지 코돈을 도입함에 의해 측정되었다. 성공적인 편집이 BFP 형광의 결여에 의해 식별되었다는 점을 제외하고는 검정은 실시예 1에 기재된 바와 같이 수행되었다. 도 10은 도 7에 예시된 바와 같은 2개 gRNA 시스템의 편집 효율을 나타낸다. BFP에 대해 음성인 세포의 백분율("% BFP-")로 측정된 편집 효율은 세포 단독(gRNA 없음), 단일 gRNA(3' 연장을 결하는 gRNA 2, 스텁이 없는 gRNA 1, 및 스텁이 있는 gRNA 1) 및 2개 gRNA(스텁이 없는 gRNA 1 플러스 gRNA 2 및 스텁이 있는 gRNA 1 및 gRNA 2)에 대해 측정되었다. 2개 gRNA 시스템은 단일 gRNA 시스템에 비해 편집 효율을 증가시켰다. 2개 gRNA 시스템에서 gRNA 1에 스텁의 존재는 gRNA 1에 스텁을 결하는 2개 gRNA 시스템에 비해 편집 효율을 증가시켰다.
실시예 7
개선된 편집을 위한 gRNA 벨크로
본 실시예는 개선된 편집을 위한 gRNA 벨크로를 기술한다. 벨크로 영역을 포함하는 gRNA는 gRNA와 표적 핵산에서 흠집의 5'에 형성된 플랩 사이의 상호작용을 촉진하여 가닥 형성의 효율을 향상시켰다. 벨크로 영역은 역전사효소 주형 영역의 5' 또는 제1 가닥 프라이머 비닝 부위의 3'에 위치되었다. gRNA 벨크로 삽입은 실시예 2 - 실시예 5에 제공된 단일 가이드 시스템 또는 실시예 6에 제공된 이중 가이드 시스템과 호환되었다.
도 8a는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 제1 가닥 프라이머 결합 부위의 gRNA 5'의 영역에 역상보적인 역전사효소 주형 영역의 5'에 위치한 5 내지 200개 뉴클레오티드를 포함한다. 도 8b는 3' 연장된 가이드 RNA 내에 역상보의 영역을 생성함에 의해 프라이머 결합 부위와 플랩의 혼성화 속도를 가속화하기 위한 벨크로 영역을 포함하는 gRNA를 예시한다. 벨크로 영역은 역전사효소 주형 영역의 영역 5'에 역상보적인 제1 가닥 프라이머 결합 부위의 3'에 위치한 5 내지 100개 뉴클레오티드를 포함한다.
도 12a는 표적 핵산의 플랩에 대한 프라이머 결합 부위(PBS)의 혼성화 속도를 가속화하기 위해 벨크로 영역이 없는(왼쪽) 또는 있는(중간 및 오른쪽) gRNA 작제물을 예시한다. V1 배열에서 벨크로 영역은 gRNA의 5' 말단 또는 그 근처에 위치될 수 있고 프라이머 결합 부위의 gRNA 5'의 영역("벨크로 V1", 중간)에 혼성화할 수 있다. V2 배열에서 벨크로 영역은 프라이머 결합 부위의 3'에 위치될 수 있고 gRNA의 5' 말단 또는 그 근처의 영역("벨크로 V2," 오른쪽)에 혼성화할 수 있다.
도 12b는 도 12a에 제공된 gRNA 작제물의 예측된 3-차원 구조를 예시한다. 벨크로 영역을 결하는 gRNA는 왼쪽에 도시되어 있다. 벨크로 V1 영역 또는 벨크로 V2 영역을 포함하는 gRNA는 각각 중간 및 오른쪽 패널에 도시되어 있다.
도 9a는 도 8a 및 도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-mlvRTv 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역의 5'에 위치한 15 nt 벨크로 영역(도 8a에 예시된 바와 같이 "V1"), 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위의 3'에 위치한 벨크로 영역(도 8b에 예시된 바와 같이 "V2")을 사용하여 비교되었다. gRNA는 107 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위를 함유했다. 편집은 흠집의 2 뉴클레오티드 3'에서 시작하는 ATCC 서열이 CATA로 돌연변이되도록 수행되었다. 도 9b는 도 8a 및 도 8b에 예시된 바와 같이 벨크로 영역을 포함하는 gRNA 작제물을 갖는 nCas9-LZ1 및 LZ2-R2(116-1016) 작제물의 편집 효율을 나타낸다. 편집 효율은 벨크로 영역을 결하는 gRNA("벨크로 없음"), 벨크로 결합 부위의 말단과 프라이머 결합 부위의 시작 사이 1, 5 또는 10 nt의 갭 길이를 갖는 역전사효소 주형 영역의 5'에 위치한 15 nt 벨크로 영역(도 8a에 예시된 바와 같이 "V1"), 또는 길이가 10 또는 20 nt인 제1 가닥 프라이머 결합 부위의 3'에 위치한 벨크로 영역(도 8b에 예시된 바와 같이 "V2")을 사용하여 비교되었다. 두 nCas9-RT 작제물 모두에서 벨크로 영역을 포함하는 특정 gRNA는 편집 효율을 증가시켰다. 특히, 1 nt 갭을 갖는 V1 벨크로 gRNA 및 20 nt 벨크로 gRNA는 nCas9-mlvRTv 작제물에서 편집 효율을 향상시켰고, 10 nt 갭을 갖는 V1 벨크로 gRNA 및 20 nt V2 벨크로 gRNA는 nCas9-R2 작제물에서 편집 효율을 향상시켰다.
도 12c는 129 뉴클레오티드 RT 주형 및 13 뉴클레오티드 프라이머 결합 부위 및 20 뉴클레오티드 벨크로 영역을 갖는 gRNA의 편집 효율을 나타낸다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 원래 gRNA("원래 코딩") 또는 2차 구조를 제거하기 위해 RT 주형에서 침묵 돌연변이로 코딩된 gRNA("재코딩됨")에 대한 편집 효율이 비교되었다. 침묵 돌연변이를 사용한 2차 구조의 제거는 원래 RT 주형에 비해 편집 효율을 개선하였다. 부가적으로, 벨크로 영역을 포함하는 gRNA의 사용은 닉킹 부위에서 65 뉴클레오티드 거리에서 효율적인 편집을 허용했다.
도 12d는 벨크로 서열의 상이한 길이를 갖는 gRNA의 편집 효율을 나타낸다. 각각의 gRNA는 5'에서 3'의 순서로 RT 주형, 프라이머 결합 부위, 및 벨크로 영역을, 왼쪽 상의 개략도에 도시된 바와 같이 함유했다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. gRNA는 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위를 가졌다. 편집은 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 수행되었다. 갭이 없이 3' 말단에 위치된 20 뉴클레오티드 벨크로 영역을 갖는 gRNA는 시험된 다른 gRNA보다 높은 편집 효율을 나타냈다.
실시예 8
개선된 편집 시스템 전달을 위한 보호 복합체의 공동-전달
본 실시예는 본 명세서에 제공된 편집 시스템의 개선된 전달을 위한 보호 복합체의 공동-발현을 기술한다. 본 명세서에 제공된 nCas9-RT 작제물 및 본 명세서에 제공된 gRNA는 세포에 전달된다. nCas9-RT와 gRNA는 보호 단백질 복합체를 인코딩하는 개방 판독 프레임 서열과 공동-발현된다. 보호 단백질 복합체는 세포에서 발현되어 gRNA의 분해 또는 탈아미노화를 방지하여 편집 시스템의 전달을 개선한다. 개방 판독 프레임 서열은 인간 Orf1p(서열번호: 38) 또는 뮤어라인 Orf1p(서열번호: 39)이다.
실시예 9
벨크로 영역 및 제2 가닥 프라이머를 갖는 gRNA로 개선된 편집 효율
본 실시예는 벨크로 영역 및 제2 가닥 프라이머를 갖는 gRNA로 개선된 편집 효율을 기술한다. gRNA는 gRNA의 3' 말단에 제2 가닥 프라이머와 제2 가닥 프라이머의 벨크로 영역 5'을 합체함에 의해 단일-가닥 파손에서 편집의 효율을 증가시키도록 설계되었다. 제2 가닥 프라이머는 새롭게 합성된 제1 가닥을 주형으로 사용하여 제2 가닥의 합성을 프라이밍했다. 제2 가닥 합성의 프라이밍은 이중-가닥 파손의 형성 없이 단일-가닥 파손의 부위 안으로 합성된 서열의 삽입을 용이하게 하였다. 벨크로 영역은 gRNA와 표적 핵산에서 흠집의 5'에 형성된 플랩 사이의 상호작용을 촉진함에 의해 가닥 형성의 효율을 향상시켰다.
도 13a는 벨크로 영역과 2nd 가닥 프라이머를 포함하는 pegRNA 및 스티치 gRNA의 개략도(상단) 및 스티치 gRNA를 사용한 게놈 편집의 방법(하단)을 예시한다. gRNA와 복합체화된 nCas9-RT 작제물은 표적 부위에 gRNA의 스페이서의 혼성화에 의해 표적 핵산의 표적 부위에 모집된다. nCas9는 표적 부위에서 표적 핵산의 가닥에 흠집낸다. gRNA의 제1 가닥 프라이머 결합 부위는 흠집의 플랩 5'에 혼성화된다. RT는 gRNA의 역전사효소 주형 영역을 주형으로 사용하여 플랩의 3' 말단에서 중합된다. gRNA의 3' 말단에서 제2 가닥 프라이머("2nd 가닥 프라이머")는 새롭게 합성된 DNA 가닥의 3' 말단에 혼성화된다. 4-200 bp 제2 가닥 프라이머 영역은 제2 DNA 가닥의 합성을 위한 RNA 프라이머로 작용한다. RT는 새롭게 합성된 DNA 가닥을 주형으로 사용하여 gRNA의 3' 말단에서 중합된다. gRNA의 3' 말단 상의 리보자임은 제2 가닥 프라이머 서열의 gRNA 3'을 절단한다. 새롭게 합성된 이중 가닥 DNA는 흠집의 부위에서 표적 핵산 안으로 합체될 수 있다.
도 13b는 다양한 길이이고 닉킹 부위로부터 다양한 거리에서 혼성화된 gRNA 제2 가닥 프라이머(SSP)의 편집 효율을 나타낸다. 흠집으로부터 6, 36 또는 55 뉴클레오티드에 위치된 제2 가닥 프라이머 20, 40 또는 60 뉴클레오티드(nt) 길이가 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다.
도 13c는 벨크로 영역 또는 제2 가닥 프라이머가 없는("벨크로 없음, SSP 없음"), 19 뉴클레오티드 벨크로 영역이 있는("19 nt 벨크로") 또는 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머 둘 모두가 있는("19 nt 벨크로, 20 nt SSP") gRNA의 편집 효율성을 나타낸다. 편집 효율은 벨크로 영역과 제2 가닥 프라이머를 결하는 gRNA 또는 벨크로 영역을 함유하지만 제2 가닥 프라이머가 없는 gRNA와 비교하여 벨크로 영역과 제2 가닥 프라이머 둘 모두를 함유하는 gRNA를 사용하는 경우 증가되었다. 벨크로 영역과 제2 가닥 프라이머 둘 모두를 함유하는 gRNA를 사용하여 달성한 편집 효율은 단일 흠집에서 54%였으며, 이는 단일 흠집에서 편집 효율에 대한 50%의 예측 한계보다 높았다.
실시예 10
편집 효율을 증가시키기 위한 역전사효소 단백질 공학
본 실시예는 편집 효율을 증가시키기 위한 역전사효소 단백질 조작을 기술한다. 편집 효율을 개선하기 위해 mlvRT 작제물에서 점 돌연변이가 이루어졌다. 편집 효율은 돌연변이된 작제물을 사용하여 측정되었다.
도 14a는 mlvRT 역전사효소에서 돌연변이에 대한 스크리닝의 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40과 비교하여 Y8H, P51L, S56A, S67R, E69K, Q84A, F155Y, T197A, H204R, T246E, N249D, E286R, Q291I, R301L, E302K, F309N, M320L, L435G, D524A, D524G, D524N, E562D, K571R, D583N, Y586S, H594Q, H638G, D653N, T664N, 또는 L671P 단일 점 돌연변이를 함유하는 mlvRT 작제물(각각 서열번호: 41 - 서열번호: 70)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 1 뉴클레오티드 갭, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. Q84A(서열번호: 46), T197A(서열번호: 48), D653N(서열번호: 68), T664N(서열번호: 69), 또는 L671P(서열번호: 70)를 함유하는 돌연변이는 서열번호: 40과 비교하여 유의하게 증가된 편집 효율을 나타났다.
도 14b는 mlvRT 역전사효소에서 돌연변이의 조합에 대한 스크리닝의 결과 및 편집 효율에 대한 그 영향을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대하여 T197A 및 D653N; T197A 및 T664N; T197A 및 L671P; T197A, D653N, T664N 및 L671P; 또는 P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P를 함유하는 mlvRT 작제물(각각 서열번호: 71 - 서열번호: 75)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. P51L, S67R, T197A, H204R, L435G, D524A, D653N, T664N 및 L671P 점 돌연변이를 함유하는 작제물(서열번호: 75)은 시험된 작제물의 가장 높은 편집 효율을 나타냈다.
도 15c는 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 77 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. V223A 점 돌연변이는 닉킹 부위에 비하여 원거리에서 편집 효율을 증가시켰다.
실시예 11
편집 효율을 증가시키기 위한 dNTP의 이용가능성 증가
본 실시예는 Cas9-RT 작제물의 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 기술한다. 세포에서 낮은 편집 효율에 기여할 수 있는 한 가지 요인은 dNTP의 제한된 이용가능성이다. 도 15a는 편집 효율을 증가시키기 위해 세포에서 dNTP의 이용가능성을 증가시키는 방법을 예시한다. CDK1을 결하는 비-분열 세포에서, 인산화되지 않은 SAMHD1은 dNTP를 절단하여 세포에서 이용가능한 dNTP를 감소시킨다. 분열하는 세포에서 CDK1은 SAMHD1을 인산화하여 SAMHD1이 dNTP를 절단하는 것을 방지하고 세포에서 dNTP의 증가된 이용가능성을 초래한다. SAMHD1에서 단일 점 돌연변이(T592A)는 CDK1에 의한 SAMHD1의 인산화를 방지하여, 구성적으로 활성인 SAMHD1과 세포에서 dNTP의 낮은 이용가능성을 초래한다. T592A 돌연변이 SAMHD1을 사용하여 도 15b, 도 15d 및 도 15e에 도시된 검정에서 낮은 dNTP 환경을 유도하였다. Vpx의 추가는 SAMHD1을 억제하여 세포에서 dNTP의 증가된 이용가능성을 초래한다. 편집 효율에 대한 낮은 세포질 dNTP의 효과를 시험하기 위해, 구성적으로 활성인 SAMHD1을 Cas9-RT 작제물과 공동-발현시키고 편집 효율을 측정했다.
도 15b는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 mlvRT 역전사효소 작제물의 편집 효율을 나타낸다. 돌연변이는 5개 점 돌연변이(D200N, 1603W, T330P, T306K, 및 W313F, 서열번호: 40)를 함유하는 참조 mlvRT 작제물에서 이루어졌다. 아미노산 잔기는 N-말단 메티오닌을 결하는 mlvRT 작제물(예를 들어, 서열번호: 14)에 대해 계수된다. 서열번호: 40에 대해 Q221R; V223A; V223M; Q221R 및 V223A; 또는 Q221R 및 V223M을 함유하는 mlvRT 작제물(각각 서열번호: 76 - 서열번호: 80)이 시험되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 구성적으로 활성인 SAMHD1의 발현은 모든 시험된 작제물의 편집 효율을 감소시켰다.
구성적으로 활성인 SAMHD1을 발현하는 세포에서 편집 효율을 구하기 위해, Vpx 펩티드(서열번호: 82)가 또한 세포에서 발현되었다. 도 15d는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 15e는 세포에서 dNTP의 이용가능성을 감소시키기 위한 구성적으로 활성인 SAMHD1(SAMHD1(T592A))의 존재 또는 부재에서 그리고 SAMHD1을 억제하기 위한 Vpx(서열번호: 82)를 갖는 또는 갖지 않는 mlvRT 역전사효소의 편집 효율을 나타낸다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 129 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다. 세포에서 Vpx의 발현은 구성적으로 활성인 SAMHD1을 발현하는 세포와 구성적으로 활성인 SAMHD1을 발현하지 않는 세포 둘 모두에서 편집 효율을 증가시켰다. 부가적으로, Vpx는 닉킹 부위로부터 짧은 거리(도 15d) 및 닉킹 부위로부터 긴 거리(도 15e) 부위에서 편집 효율을 증가시켰다.
실시예 12
분할 Cas9 작제물의 세포질 발현을 위한 인테인
본 실시예는 Cas9 작제물의 세포질 발현을 위해 인테인을 사용하는 것을 기술한다. 제1 검정에서, nCas9의 C-말단 부분에서 시스테인 잔기의 치환에 도움이 되는 위치를 식별하기 위해 닉킹 Cas9(nCas9) 점 돌연변이의 스크린이 수행되었다. 시스테인 점 돌연변이는 류신 지퍼를 통해 연결된 nCas9-RT 작제물의 맥락에서 스크리닝되었다. 시스테인은 다른 지점에서 nCas9의 C-말단 부분 안으로 삽입되어 nCas9 및 역전사효소 조합된 서열의 중앙을 향해 위치된 시스테인 잔기를 갖는 작제물을 생성하였다. 시스테인 잔기는 N-말단에서 삽입된 시스테인까지의 Cas9 단백질의 각 부분 및 C-말단 플러스 역전사효소에 대해 삽입된 시스테인을 포함하는 Cas9 단백질의 부분이, 인테인 융합으로 발현될 때 AAV 벡터에 끼워지기에 충분히 작도록 위치되었다. 류신 지퍼 연결된 nCas9-RT 시스테인 돌연변이체의 편집 효율이 비교되었다.
도 16은 닉킹 활성을 위해 변형되고 류신 지퍼를 통해 역전사효소에 연결된 Cas9 작제물의 편집 효율을 나타낸다. S. 피오게네스 Cas9("SpCas9") 작제물은 Cas9 닉카제(nCas9)를 생성하는 H840A 돌연변이를 함유했다. 시스테인 잔기를 D1079C, S1173C 또는 D1180C에서 Cas9 닉카제 안으로 도입하여 엑스테인-인테인 융합체로서의 발현을 위해 Cas9를 분할 인테인 Cas9(iCas9)로 분할할 수 있었다. H840A 및 D1079C(류신 지퍼를 갖는 서열번호: 85), H840A 및 S1173C(류신 지퍼를 갖는 서열번호: 86), 또는 H840A 및 D1180C(류신 지퍼를 갖는 서열번호: 87) 점 돌연변이를 함유하고 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 류신 지퍼 Cas9 작제물이 시험되었다. H840A 돌연변이를 함유하지만 mlvRT5M(류신 지퍼를 갖는 서열번호: 40)에 연결된 부가 시스테인(류신 지퍼를 갖는 서열번호: 84)이 없는 Cas9 닉카제가 대조군으로 사용되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
제2 검정에서, 제1 검정에서 식별된 시스테인 점 돌연변이를 이용하여 분할 인테인 Cas9 작제물을 생성했다. 2개의 엑스테인-인테인 융합체로 발현되는 식별된 S1173C 돌연변이를 포함하는 nCas9-RT 융합체의 편집 효율을 시험했다. nCas9-RT 융합체는 mlvRT5M(서열번호: 40)에 융합된 S1173C 점 돌연변이(서열번호: 86)를 갖는 nCas9를 함유하였다. 융합 단백질의 제1 분절은 제1 플라스미드 벡터에서 제1 인테인 융합 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었으며 융합 단백질의 제2 분절은 제2 플라스미드 벡터에서 발현된 제2 인테인 융합 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 인테인 도메인의 자가촉매 활성은 nCas9(1-1172) 엑스테인을 nCas9(S1173C를 갖는 1173-1368) - mlvRT5M 엑스테인에 융합하였고 Npu N(서열번호: 88) 및 Npu C(서열번호: 89) 인테인을 절단하여 융합된 nCas9(S1173C) - mlvRT5M 작제물(서열번호: 92)을 형성하였다. 분할 인테인 nCas9 작제물의 편집 효율은 닉킹 부위에 대해 두 위치에서 시험되었다.
도 17a는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)에 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
도 17b는 닉킹 활성을 위해 변형되고 역전사효소에 융합되고 2개의 엑스테인-인테인 융합 단백질로서 발현되는 분할 인테인 Cas9(iCas9) S1173C 작제물의 편집 효율을 나타낸다. nCas9-RT 작제물의 N-말단 영역은 nCas9(1-1172) - Npu N 인테인(서열번호: 90)으로 발현되었고 nCas9-RT 작제물의 C-말단 영역은 Npu C 인테인 - nCas9(S1173C를 갖는 1173-1368) - mlvRT5M(서열번호: 91)으로 발현되었다. 분할 인테인 Cas9-RT 작제물(오른쪽 막대)의 편집 효율은 류신 지퍼 분할 Cas9 작제물(서열번호: 1 및 서열번호: 2, 왼쪽 막대)과 비교되었다. 편집 효율은 GFP 양성인 세포의 백분율(% GFP+)로 측정되었다. 흠집의 65 뉴클레오티드 3'에서 시작하는 ATG 서열이 CAT로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역 및 20 뉴클레오티드 제2 가닥 프라이머를 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
결과는 분할 인테인 Cas9-RT 융합 작제물이 류신 지퍼 분할 Cas9 작제물과 비교하여 강력한 편집 효율을 보였다는 것을 나타내었다.
실시예 13
개선된 편집 효율을 위한 gRNA의 3' 변형
본 실시예는 개선된 편집 효율을 위한 gRNA의 3' 변형을 기술한다. 제2 가닥 프라이머가 주형 영역에 100% 상보적이고 3' 말단에 위치한 gRNA는 제2 가닥 프라이머의 바로 3'에 폴리-U 서열로 전사되어, 프라이밍 기능을 억제할 수 있다. 이 문제를 해결하기 위해, 제2 가닥 프라이머의 3'에 위치된 절단가능한 RNA 서열을 갖는 gRNA가 개발되어 제2 가닥 프라이머의 3' 말단에서 폴리-U 서열의 형성을 방지하였다. HDV 자가-절단 리보자임 또는 제2 가닥 프라이머의 3'에 위치된 tRNA를 갖는 gRNA를 시험했다.
HDV 자가-절단 리보자임은 gRNA의 3' 말단으로부터 그 자체를 자가촉매적으로 절단하여 폴리-U 서열이 없는 제2 가닥 프라이머를 남겼다. HDV 리보자임은 제2 가닥 프라이머의 3' 말단에 2'3' 고리형 포스페이트를 남겨 제2 가닥 프라이머의 프라이머 연장을 억제했다. 내인성 폴리뉴클레오티드 키나아제는 2'3' 고리형 포스페이트를 3' OH로 전환하여 프라이머 연장을 가능하게 한다. tRNA는 내인성 RNase P에 의해 제2 가닥 프라이머의 3' 말단에서 절단되어, 프라이머 연장이 가능한 3' OH 및 폴리-U 서열이 없는 제2 가닥 프라이머를 남겼다.
도 18은 제2 가닥 프라이머의 바로 3'인, gRNA의 3' 말단에서 HDV 리보자임(왼쪽 막대) 또는 tRNA(오른쪽 막대)를 포함하는 gRNA의 존재에서 류신 지퍼 Cas9-RT 작제물의 편집 효율을 나타낸다. 류신 지퍼 Cas9-RT 작제물은 nCas9-LZ1(서열번호: 1) 및 LZ2-mlvRT5M(서열번호: 2)로 발현되었고, 류신 지퍼를 통해 연결되었다. tRNA는 서열번호: 94에 상응하는 서열을 가졌다. 흠집의 2 뉴클레오티드 3'에서 시작하는 ATGG 서열이 CATA로 돌연변이되도록 편집은 85 뉴클레오티드 RT 주형, 13 뉴클레오티드 프라이머 결합 부위, 19 뉴클레오티드 벨크로 영역, 20 뉴클레오티드 제2 가닥 프라이머, 및 제2 가닥 프라이머의 HDV 리보자임 또는 tRNA 3'을 갖는 gRNA를 사용하여 수행되어 부위를 편집하였다.
실시예 14
GPS-지원된 리앵커버 gRNA(GARG) 및 GPS-모집 가이드(GRG)
GPS-지원된 리앵커버 gRNA(GARG)는, 예를 들어 단일 가이드 핵산 시스템이 그렇지 않으면 편집을 포함하지 않는 게놈 가닥을 충분히 치환하지 않는 원하는 편집을 함유하는 플랩을 생성하는 경우에 유전자 편집 효율을 개선할 수 있다. GARG는 연장된 플랩의 게놈 안으로의 혼성화를 촉진하는 데 유용할 수 있고, 교체하려는 게놈 가닥의 근처에 연장된 플랩의 3' 말단을 앵커링할 수 있다. 도 33은 이중 가이드 시스템으로부터의 데이터를 묘사한다. 2개 별도의 GARG가 시험되었고 포유동물 세포의 표적 핵산에서 유전자 편집이 성공적으로 이루어졌다. 따라서, GARG 및 GRG를 포함하는 이중 가이드 시스템을 이용하는 방법은 포유동물 세포와 같은 세포에서 정밀한 게놈 편집을 유도할 수 있다.
본 개시내용의 바람직한 실시형태가 본 명세서에서 도시되고 기술되었지만, 그러한 실시형태는 단지 예로서 제공된다는 것은 당업자에게 명백할 것이다. 수많은 변형, 변경 및 대체가 이제 개시내용을 벗어남이 없이 당업자에게 발생할 것이다. 본 명세서에 기술된 개시내용의 실시형태에 대한 다양한 대안이 개시내용을 실시하는데 이용될 수 있음을 이해해야 한다. 다음 청구범위는 개시내용의 범주를 정의하고 이들 청구범위 및 그 균등물의 범주 내의 방법 및 구조는 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING
<110> EVOLVE BIOTECH, INC.
<120> METHODS AND COMPOSITIONS FOR DIRECTED GENOME EDITING
<130> 56385-701.601
<140>
<141>
<150> 63/153,161
<151> 2021-02-24
<150> 63/055,829
<151> 2020-07-23
<150> 62/992,032
<151> 2020-03-19
<160> 144
<170> PatentIn version 3.5
<210> 1
<211> 1460
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 1
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
20 25 30
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
35 40 45
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
50 55 60
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
65 70 75 80
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
85 90 95
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
100 105 110
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
115 120 125
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
130 135 140
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
145 150 155 160
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
165 170 175
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
180 185 190
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
195 200 205
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
210 215 220
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
225 230 235 240
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
245 250 255
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
260 265 270
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
275 280 285
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
290 295 300
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
305 310 315 320
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
325 330 335
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
340 345 350
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
355 360 365
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
370 375 380
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
385 390 395 400
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
405 410 415
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
420 425 430
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
435 440 445
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
465 470 475 480
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
485 490 495
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
500 505 510
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
515 520 525
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
530 535 540
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
545 550 555 560
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
565 570 575
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
580 585 590
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
595 600 605
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
610 615 620
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
625 630 635 640
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
645 650 655
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
660 665 670
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
675 680 685
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
690 695 700
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
705 710 715 720
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
725 730 735
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
740 745 750
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
755 760 765
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
785 790 795 800
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
805 810 815
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
820 825 830
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
835 840 845
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe
850 855 860
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
865 870 875 880
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
885 890 895
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
900 905 910
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
915 920 925
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
930 935 940
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
945 950 955 960
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
965 970 975
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
980 985 990
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
995 1000 1005
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1010 1015 1020
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1025 1030 1035
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1040 1045 1050
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1055 1060 1065
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1070 1075 1080
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1085 1090 1095
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1100 1105 1110
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1115 1120 1125
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1130 1135 1140
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1145 1150 1155
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1160 1165 1170
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1175 1180 1185
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1190 1195 1200
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1220 1225 1230
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1235 1240 1245
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1250 1255 1260
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1265 1270 1275
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1280 1285 1290
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1295 1300 1305
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1310 1315 1320
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1325 1330 1335
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1340 1345 1350
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1355 1360 1365
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1370 1375 1380
Gly Gly Asp Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu
1385 1390 1395
Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Gly Gly Arg
1400 1405 1410
Leu Glu Ile Arg Ala Ala Phe Leu Arg Gln Arg Asn Thr Ala Leu
1415 1420 1425
Arg Thr Glu Val Ala Glu Leu Glu Gln Glu Val Gln Arg Leu Glu
1430 1435 1440
Asn Glu Val Ser Gln Tyr Glu Thr Arg Tyr Gly Pro Leu Gly Gly
1445 1450 1455
Gly Lys
1460
<210> 2
<211> 779
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Met Leu Glu Ile Glu Ala Ala Phe Leu Glu Arg Glu Asn Thr Ala Leu
1 5 10 15
Glu Thr Arg Val Ala Glu Leu Arg Gln Arg Val Gln Arg Leu Arg Asn
20 25 30
Arg Val Ser Gln Tyr Arg Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys
35 40 45
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
50 55 60
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
65 70 75 80
Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
85 90 95
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
100 105 110
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
115 120 125
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
130 135 140
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
145 150 155 160
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
165 170 175
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
180 185 190
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
195 200 205
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
210 215 220
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
225 230 235 240
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
245 250 255
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
260 265 270
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
275 280 285
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
290 295 300
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
305 310 315 320
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
325 330 335
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
340 345 350
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
355 360 365
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
370 375 380
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
385 390 395 400
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
405 410 415
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
420 425 430
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
435 440 445
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
450 455 460
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
465 470 475 480
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
485 490 495
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
500 505 510
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
515 520 525
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
530 535 540
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
545 550 555 560
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
565 570 575
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
580 585 590
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
595 600 605
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
610 615 620
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
625 630 635 640
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
645 650 655
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
660 665 670
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
675 680 685
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
690 695 700
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
705 710 715 720
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
725 730 735
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
740 745 750
Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
755 760 765
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
770 775
<210> 3
<211> 420
<212> PRT
<213> Geobacilus stereothermophilus
<400> 3
Met Ala Leu Leu Glu Arg Ile Leu Ala Arg Asp Asn Leu Ile Thr Ala
1 5 10 15
Leu Lys Arg Val Glu Ala Asn Gln Gly Ala Pro Gly Ile Asp Gly Val
20 25 30
Ser Thr Asp Gln Leu Arg Asp Tyr Ile Arg Ala His Trp Ser Thr Ile
35 40 45
His Ala Gln Leu Leu Ala Gly Thr Tyr Arg Pro Ala Pro Val Arg Arg
50 55 60
Val Glu Ile Pro Lys Pro Gly Gly Gly Thr Arg Gln Leu Gly Ile Pro
65 70 75 80
Thr Val Val Asp Arg Leu Ile Gln Gln Ala Ile Leu Gln Glu Leu Thr
85 90 95
Pro Ile Phe Asp Pro Asp Phe Ser Ser Ser Ser Phe Gly Phe Arg Pro
100 105 110
Gly Arg Asn Ala His Asp Ala Val Arg Gln Ala Gln Gly Tyr Ile Gln
115 120 125
Glu Gly Tyr Arg Tyr Val Val Asp Met Asp Leu Glu Lys Phe Phe Asp
130 135 140
Arg Val Asn His Asp Ile Leu Met Ser Arg Val Ala Arg Lys Val Lys
145 150 155 160
Asp Lys Arg Val Leu Lys Leu Ile Arg Ala Tyr Leu Gln Ala Gly Val
165 170 175
Met Ile Glu Gly Val Lys Val Gln Thr Glu Glu Gly Thr Pro Gln Gly
180 185 190
Gly Pro Leu Ser Pro Leu Leu Ala Asn Ile Leu Leu Asp Asp Leu Asp
195 200 205
Lys Glu Leu Glu Lys Arg Gly Leu Lys Phe Cys Arg Tyr Ala Asp Asp
210 215 220
Cys Asn Ile Tyr Val Lys Ser Leu Arg Ala Gly Gln Arg Val Lys Gln
225 230 235 240
Ser Ile Gln Arg Phe Leu Glu Lys Thr Leu Lys Leu Lys Val Asn Glu
245 250 255
Glu Lys Ser Ala Val Asp Arg Pro Trp Lys Arg Ala Phe Leu Gly Phe
260 265 270
Ser Phe Thr Pro Glu Arg Lys Ala Arg Ile Arg Leu Ala Pro Arg Ser
275 280 285
Ile Gln Arg Leu Lys Gln Arg Ile Arg Gln Leu Thr Asn Pro Asn Trp
290 295 300
Ser Ile Ser Met Pro Glu Arg Ile His Arg Val Asn Gln Tyr Val Met
305 310 315 320
Gly Trp Ile Gly Tyr Phe Arg Leu Val Glu Thr Pro Ser Val Leu Gln
325 330 335
Thr Ile Glu Gly Trp Ile Arg Arg Arg Leu Arg Leu Cys Gln Trp Leu
340 345 350
Gln Trp Lys Arg Val Arg Thr Arg Ile Arg Glu Leu Arg Ala Leu Gly
355 360 365
Leu Lys Glu Thr Ala Val Met Glu Ile Ala Asn Thr Arg Lys Gly Ala
370 375 380
Trp Arg Thr Thr Lys Thr Pro Gln Leu His Gln Ala Leu Gly Lys Thr
385 390 395 400
Tyr Trp Thr Ala Gln Gly Leu Lys Ser Leu Thr Gln Arg Tyr Phe Glu
405 410 415
Leu Arg Gln Gly
420
<210> 4
<211> 427
<212> PRT
<213> Eubacterium rectale
<400> 4
Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu
1 5 10 15
Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val
20 25 30
Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly
35 40 45
Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro
50 55 60
Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu
65 70 75 80
Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln
85 90 95
Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly
100 105 110
Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn
115 120 125
Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys
130 135 140
Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg
145 150 155 160
Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val
165 170 175
Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr
180 185 190
Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn
195 200 205
Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr
210 215 220
Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg
225 230 235 240
Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys
245 250 255
Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr
260 265 270
Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala
275 280 285
Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu
290 295 300
Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys
305 310 315 320
Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser
325 330 335
Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu
340 345 350
Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys
355 360 365
Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala
370 375 380
Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn
385 390 395 400
Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met
405 410 415
Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys
420 425
<210> 5
<211> 427
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
marathonRT seqeunce
<400> 5
Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu
1 5 10 15
Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val
20 25 30
Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly
35 40 45
Glu Thr Ile Lys Gly Gln Leu Arg Thr Ala Ala Tyr Ala Pro Gln Pro
50 55 60
Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu
65 70 75 80
Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln
85 90 95
Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly
100 105 110
Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn
115 120 125
Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys
130 135 140
Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg
145 150 155 160
Thr Ile Ala Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val
165 170 175
Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr
180 185 190
Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn
195 200 205
Glu Leu Asp Lys Glu Met Glu Ala Ala Gly Leu Asn Phe Val Arg Tyr
210 215 220
Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg
225 230 235 240
Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys
245 250 255
Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr
260 265 270
Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala
275 280 285
Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu
290 295 300
Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys
305 310 315 320
Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser
325 330 335
Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu
340 345 350
Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys
355 360 365
Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala
370 375 380
Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn
385 390 395 400
Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met
405 410 415
Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys
420 425
<210> 6
<211> 1114
<212> PRT
<213> Bombyx mori
<400> 6
Met Met Ala Ser Thr Ala Leu Ser Leu Met Gly Arg Cys Asn Pro Asp
1 5 10 15
Gly Cys Thr Arg Gly Lys His Val Thr Ala Ala Pro Met Asp Gly Pro
20 25 30
Arg Gly Pro Ser Ser Leu Ala Gly Thr Phe Gly Trp Gly Leu Ala Ile
35 40 45
Pro Ala Gly Glu Pro Cys Gly Arg Val Cys Ser Pro Ala Thr Val Gly
50 55 60
Phe Phe Pro Val Ala Lys Lys Ser Asn Lys Glu Asn Arg Pro Glu Ala
65 70 75 80
Ser Gly Leu Pro Leu Glu Ser Glu Arg Thr Gly Asp Asn Pro Thr Val
85 90 95
Arg Gly Ser Ala Gly Ala Asp Pro Val Gly Gln Asp Ala Pro Gly Trp
100 105 110
Thr Cys Gln Phe Cys Glu Arg Thr Phe Ser Thr Asn Arg Gly Leu Gly
115 120 125
Val His Lys Arg Arg Ala His Pro Val Glu Thr Asn Thr Asp Ala Ala
130 135 140
Pro Met Met Val Lys Arg Arg Trp His Gly Glu Glu Ile Asp Leu Leu
145 150 155 160
Ala Arg Thr Glu Ala Arg Leu Leu Ala Glu Arg Gly Gln Cys Ser Gly
165 170 175
Gly Asp Leu Phe Gly Ala Leu Pro Gly Phe Gly Arg Thr Leu Glu Ala
180 185 190
Ile Lys Gly Gln Arg Arg Arg Glu Pro Tyr Arg Ala Leu Val Gln Ala
195 200 205
His Leu Ala Arg Phe Gly Ser Gln Pro Gly Pro Ser Ser Gly Gly Cys
210 215 220
Ser Ala Glu Pro Asp Phe Arg Arg Ala Ser Gly Ala Glu Glu Ala Gly
225 230 235 240
Glu Glu Arg Cys Ala Glu Asp Ala Ala Ala Tyr Asp Pro Ser Ala Val
245 250 255
Gly Gln Met Ser Pro Asp Ala Ala Arg Val Leu Ser Glu Leu Leu Glu
260 265 270
Gly Ala Gly Arg Arg Arg Ala Cys Arg Ala Met Arg Pro Lys Thr Ala
275 280 285
Gly Arg Arg Asn Asp Leu His Asp Asp Arg Thr Ala Ser Ala His Lys
290 295 300
Thr Ser Arg Gln Lys Arg Arg Ala Glu Tyr Ala Arg Val Gln Glu Leu
305 310 315 320
Tyr Lys Lys Cys Arg Ser Arg Ala Ala Ala Glu Val Ile Asp Gly Ala
325 330 335
Cys Gly Gly Val Gly His Ser Leu Glu Glu Met Glu Thr Tyr Trp Arg
340 345 350
Pro Ile Leu Glu Arg Val Ser Asp Ala Pro Gly Pro Thr Pro Glu Ala
355 360 365
Leu His Ala Leu Gly Arg Ala Glu Trp His Gly Gly Asn Arg Asp Tyr
370 375 380
Thr Gln Leu Trp Lys Pro Ile Ser Val Glu Glu Ile Lys Ala Ser Arg
385 390 395 400
Phe Asp Trp Arg Thr Ser Pro Gly Pro Asp Gly Ile Arg Ser Gly Gln
405 410 415
Trp Arg Ala Val Pro Val His Leu Lys Ala Glu Met Phe Asn Ala Trp
420 425 430
Met Ala Arg Gly Glu Ile Pro Glu Ile Leu Arg Gln Cys Arg Thr Val
435 440 445
Phe Val Pro Lys Val Glu Arg Pro Gly Gly Pro Gly Glu Tyr Arg Pro
450 455 460
Ile Ser Ile Ala Ser Ile Pro Leu Arg His Phe His Ser Ile Leu Ala
465 470 475 480
Arg Arg Leu Leu Ala Cys Cys Pro Pro Asp Ala Arg Gln Arg Gly Phe
485 490 495
Ile Cys Ala Asp Gly Thr Leu Glu Asn Ser Ala Val Leu Asp Ala Val
500 505 510
Leu Gly Asp Ser Arg Lys Lys Leu Arg Glu Cys His Val Ala Val Leu
515 520 525
Asp Phe Ala Lys Ala Phe Asp Thr Val Ser His Glu Ala Leu Val Glu
530 535 540
Leu Leu Arg Leu Arg Gly Met Pro Glu Gln Phe Cys Gly Tyr Ile Ala
545 550 555 560
His Leu Tyr Asp Thr Ala Ser Thr Thr Leu Ala Val Asn Asn Glu Met
565 570 575
Ser Ser Pro Val Lys Val Gly Arg Gly Val Arg Gln Gly Asp Pro Leu
580 585 590
Ser Pro Ile Leu Phe Asn Val Val Met Asp Leu Ile Leu Ala Ser Leu
595 600 605
Pro Glu Arg Val Gly Tyr Arg Leu Glu Met Glu Leu Val Ser Ala Leu
610 615 620
Ala Tyr Ala Asp Asp Leu Val Leu Leu Ala Gly Ser Lys Val Gly Met
625 630 635 640
Gln Glu Ser Ile Ser Ala Val Asp Cys Val Gly Arg Gln Met Gly Leu
645 650 655
Arg Leu Asn Cys Arg Lys Ser Ala Val Leu Ser Met Ile Pro Asp Gly
660 665 670
His Arg Lys Lys His His Tyr Leu Thr Glu Arg Thr Phe Asn Ile Gly
675 680 685
Gly Lys Pro Leu Arg Gln Val Ser Cys Val Glu Arg Trp Arg Tyr Leu
690 695 700
Gly Val Asp Phe Glu Ala Ser Gly Cys Val Thr Leu Glu His Ser Ile
705 710 715 720
Ser Ser Ala Leu Asn Asn Ile Ser Arg Ala Pro Leu Lys Pro Gln Gln
725 730 735
Arg Leu Glu Ile Leu Arg Ala His Leu Ile Pro Arg Phe Gln His Gly
740 745 750
Phe Val Leu Gly Asn Ile Ser Asp Asp Arg Leu Arg Met Leu Asp Val
755 760 765
Gln Ile Arg Lys Ala Val Gly Gln Trp Leu Arg Leu Pro Ala Asp Val
770 775 780
Pro Lys Ala Tyr Tyr His Ala Ala Val Gln Asp Gly Gly Leu Ala Ile
785 790 795 800
Pro Ser Val Arg Ala Thr Ile Pro Asp Leu Ile Val Arg Arg Phe Gly
805 810 815
Gly Leu Asp Ser Ser Pro Trp Ser Val Ala Arg Ala Ala Ala Lys Ser
820 825 830
Asp Lys Ile Arg Lys Lys Leu Arg Trp Ala Trp Lys Gln Leu Arg Arg
835 840 845
Phe Ser Arg Val Asp Ser Thr Thr Gln Arg Pro Ser Val Arg Leu Phe
850 855 860
Trp Arg Glu His Leu His Ala Ser Val Asp Gly Arg Glu Leu Arg Glu
865 870 875 880
Ser Thr Arg Thr Pro Thr Ser Thr Lys Trp Ile Arg Glu Arg Cys Ala
885 890 895
Gln Ile Thr Gly Arg Asp Phe Val Gln Phe Val His Thr His Ile Asn
900 905 910
Ala Leu Pro Ser Arg Ile Arg Gly Ser Arg Gly Arg Arg Gly Gly Gly
915 920 925
Glu Ser Ser Leu Thr Cys Arg Ala Gly Cys Lys Val Arg Glu Thr Thr
930 935 940
Ala His Ile Leu Gln Gln Cys His Arg Thr His Gly Gly Arg Ile Leu
945 950 955 960
Arg His Asn Lys Ile Val Ser Phe Val Ala Lys Ala Met Glu Glu Asn
965 970 975
Lys Trp Thr Val Glu Leu Glu Pro Arg Leu Arg Thr Ser Val Gly Leu
980 985 990
Arg Lys Pro Asp Ile Ile Ala Ser Arg Asp Gly Val Gly Val Ile Val
995 1000 1005
Asp Val Gln Val Val Ser Gly Gln Arg Ser Leu Asp Glu Leu His
1010 1015 1020
Arg Glu Lys Arg Asn Lys Tyr Gly Asn His Gly Glu Leu Val Glu
1025 1030 1035
Leu Val Ala Gly Arg Leu Gly Leu Pro Lys Ala Glu Cys Val Arg
1040 1045 1050
Ala Thr Ser Cys Thr Ile Ser Trp Arg Gly Val Trp Ser Leu Thr
1055 1060 1065
Ser Tyr Lys Glu Leu Arg Ser Ile Ile Gly Leu Arg Glu Pro Thr
1070 1075 1080
Leu Gln Ile Val Pro Ile Leu Ala Leu Arg Gly Ser His Met Asn
1085 1090 1095
Trp Thr Arg Phe Asn Gln Met Thr Ser Val Met Gly Gly Gly Val
1100 1105 1110
Gly
<210> 7
<211> 901
<212> PRT
<213> Bombyx mori
<400> 7
Phe Cys Glu Arg Thr Phe Ser Thr Asn Arg Gly Leu Gly Val His Lys
1 5 10 15
Arg Arg Ala His Pro Val Glu Thr Asn Thr Asp Ala Ala Pro Met Met
20 25 30
Val Lys Arg Arg Trp His Gly Glu Glu Ile Asp Leu Leu Ala Arg Thr
35 40 45
Glu Ala Arg Leu Leu Ala Glu Arg Gly Gln Cys Ser Gly Gly Asp Leu
50 55 60
Phe Gly Ala Leu Pro Gly Phe Gly Arg Thr Leu Glu Ala Ile Lys Gly
65 70 75 80
Gln Arg Arg Arg Glu Pro Tyr Arg Ala Leu Val Gln Ala His Leu Ala
85 90 95
Arg Phe Gly Ser Gln Pro Gly Pro Ser Ser Gly Gly Cys Ser Ala Glu
100 105 110
Pro Asp Phe Arg Arg Ala Ser Gly Ala Glu Glu Ala Gly Glu Glu Arg
115 120 125
Cys Ala Glu Asp Ala Ala Ala Tyr Asp Pro Ser Ala Val Gly Gln Met
130 135 140
Ser Pro Asp Ala Ala Arg Val Leu Ser Glu Leu Leu Glu Gly Ala Gly
145 150 155 160
Arg Arg Arg Ala Cys Arg Ala Met Arg Pro Lys Thr Ala Gly Arg Arg
165 170 175
Asn Asp Leu His Asp Asp Arg Thr Ala Ser Ala His Lys Thr Ser Arg
180 185 190
Gln Lys Arg Arg Ala Glu Tyr Ala Arg Val Gln Glu Leu Tyr Lys Lys
195 200 205
Cys Arg Ser Arg Ala Ala Ala Glu Val Ile Asp Gly Ala Cys Gly Gly
210 215 220
Val Gly His Ser Leu Glu Glu Met Glu Thr Tyr Trp Arg Pro Ile Leu
225 230 235 240
Glu Arg Val Ser Asp Ala Pro Gly Pro Thr Pro Glu Ala Leu His Ala
245 250 255
Leu Gly Arg Ala Glu Trp His Gly Gly Asn Arg Asp Tyr Thr Gln Leu
260 265 270
Trp Lys Pro Ile Ser Val Glu Glu Ile Lys Ala Ser Arg Phe Asp Trp
275 280 285
Arg Thr Ser Pro Gly Pro Asp Gly Ile Arg Ser Gly Gln Trp Arg Ala
290 295 300
Val Pro Val His Leu Lys Ala Glu Met Phe Asn Ala Trp Met Ala Arg
305 310 315 320
Gly Glu Ile Pro Glu Ile Leu Arg Gln Cys Arg Thr Val Phe Val Pro
325 330 335
Lys Val Glu Arg Pro Gly Gly Pro Gly Glu Tyr Arg Pro Ile Ser Ile
340 345 350
Ala Ser Ile Pro Leu Arg His Phe His Ser Ile Leu Ala Arg Arg Leu
355 360 365
Leu Ala Cys Cys Pro Pro Asp Ala Arg Gln Arg Gly Phe Ile Cys Ala
370 375 380
Asp Gly Thr Leu Glu Asn Ser Ala Val Leu Asp Ala Val Leu Gly Asp
385 390 395 400
Ser Arg Lys Lys Leu Arg Glu Cys His Val Ala Val Leu Asp Phe Ala
405 410 415
Lys Ala Phe Asp Thr Val Ser His Glu Ala Leu Val Glu Leu Leu Arg
420 425 430
Leu Arg Gly Met Pro Glu Gln Phe Cys Gly Tyr Ile Ala His Leu Tyr
435 440 445
Asp Thr Ala Ser Thr Thr Leu Ala Val Asn Asn Glu Met Ser Ser Pro
450 455 460
Val Lys Val Gly Arg Gly Val Arg Gln Gly Asp Pro Leu Ser Pro Ile
465 470 475 480
Leu Phe Asn Val Val Met Asp Leu Ile Leu Ala Ser Leu Pro Glu Arg
485 490 495
Val Gly Tyr Arg Leu Glu Met Glu Leu Val Ser Ala Leu Ala Tyr Ala
500 505 510
Asp Asp Leu Val Leu Leu Ala Gly Ser Lys Val Gly Met Gln Glu Ser
515 520 525
Ile Ser Ala Val Asp Cys Val Gly Arg Gln Met Gly Leu Arg Leu Asn
530 535 540
Cys Arg Lys Ser Ala Val Leu Ser Met Ile Pro Asp Gly His Arg Lys
545 550 555 560
Lys His His Tyr Leu Thr Glu Arg Thr Phe Asn Ile Gly Gly Lys Pro
565 570 575
Leu Arg Gln Val Ser Cys Val Glu Arg Trp Arg Tyr Leu Gly Val Asp
580 585 590
Phe Glu Ala Ser Gly Cys Val Thr Leu Glu His Ser Ile Ser Ser Ala
595 600 605
Leu Asn Asn Ile Ser Arg Ala Pro Leu Lys Pro Gln Gln Arg Leu Glu
610 615 620
Ile Leu Arg Ala His Leu Ile Pro Arg Phe Gln His Gly Phe Val Leu
625 630 635 640
Gly Asn Ile Ser Asp Asp Arg Leu Arg Met Leu Asp Val Gln Ile Arg
645 650 655
Lys Ala Val Gly Gln Trp Leu Arg Leu Pro Ala Asp Val Pro Lys Ala
660 665 670
Tyr Tyr His Ala Ala Val Gln Asp Gly Gly Leu Ala Ile Pro Ser Val
675 680 685
Arg Ala Thr Ile Pro Asp Leu Ile Val Arg Arg Phe Gly Gly Leu Asp
690 695 700
Ser Ser Pro Trp Ser Val Ala Arg Ala Ala Ala Lys Ser Asp Lys Ile
705 710 715 720
Arg Lys Lys Leu Arg Trp Ala Trp Lys Gln Leu Arg Arg Phe Ser Arg
725 730 735
Val Asp Ser Thr Thr Gln Arg Pro Ser Val Arg Leu Phe Trp Arg Glu
740 745 750
His Leu His Ala Ser Val Asp Gly Arg Glu Leu Arg Glu Ser Thr Arg
755 760 765
Thr Pro Thr Ser Thr Lys Trp Ile Arg Glu Arg Cys Ala Gln Ile Thr
770 775 780
Gly Arg Asp Phe Val Gln Phe Val His Thr His Ile Asn Ala Leu Pro
785 790 795 800
Ser Arg Ile Arg Gly Ser Arg Gly Arg Arg Gly Gly Gly Glu Ser Ser
805 810 815
Leu Thr Cys Arg Ala Gly Cys Lys Val Arg Glu Thr Thr Ala His Ile
820 825 830
Leu Gln Gln Cys His Arg Thr His Gly Gly Arg Ile Leu Arg His Asn
835 840 845
Lys Ile Val Ser Phe Val Ala Lys Ala Met Glu Glu Asn Lys Trp Thr
850 855 860
Val Glu Leu Glu Pro Arg Leu Arg Thr Ser Val Gly Leu Arg Lys Pro
865 870 875 880
Asp Ile Ile Ala Ser Arg Asp Gly Val Gly Val Ile Val Asp Val Gln
885 890 895
Val Val Ser Gly Gln
900
<210> 8
<211> 1114
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 8
Met Met Ala Ser Thr Ala Leu Ser Leu Met Gly Arg Cys Asn Pro Asp
1 5 10 15
Gly Cys Thr Arg Gly Lys His Val Thr Ala Ala Pro Met Asp Gly Pro
20 25 30
Arg Gly Pro Ser Ser Leu Ala Gly Thr Phe Gly Trp Gly Leu Ala Ile
35 40 45
Pro Ala Gly Glu Pro Cys Gly Arg Val Cys Ser Pro Ala Thr Val Gly
50 55 60
Phe Phe Pro Val Ala Lys Lys Ser Asn Lys Glu Asn Arg Pro Glu Ala
65 70 75 80
Ser Gly Leu Pro Leu Glu Ser Glu Arg Thr Gly Asp Asn Pro Thr Val
85 90 95
Arg Gly Ser Ala Gly Ala Asp Pro Val Gly Gln Asp Ala Pro Gly Trp
100 105 110
Thr Cys Gln Phe Cys Glu Arg Thr Phe Ser Thr Asn Arg Gly Leu Gly
115 120 125
Val His Lys Arg Arg Ala His Pro Val Glu Thr Asn Thr Asp Ala Ala
130 135 140
Pro Met Met Val Lys Arg Arg Trp His Gly Glu Glu Ile Asp Leu Leu
145 150 155 160
Ala Arg Thr Glu Ala Arg Leu Leu Ala Glu Arg Gly Gln Cys Ser Gly
165 170 175
Gly Asp Leu Phe Gly Ala Leu Pro Gly Phe Gly Arg Thr Leu Glu Ala
180 185 190
Ile Lys Gly Gln Arg Arg Arg Glu Pro Tyr Arg Ala Leu Val Gln Ala
195 200 205
His Leu Ala Arg Phe Gly Ser Gln Pro Gly Pro Ser Ser Gly Gly Cys
210 215 220
Ser Ala Glu Pro Asp Phe Arg Arg Ala Ser Gly Ala Glu Glu Ala Gly
225 230 235 240
Glu Glu Arg Cys Ala Glu Asp Ala Ala Ala Tyr Asp Pro Ser Ala Val
245 250 255
Gly Gln Met Ser Pro Asp Ala Ala Arg Val Leu Ser Glu Leu Leu Glu
260 265 270
Gly Ala Gly Arg Arg Arg Ala Cys Arg Ala Met Arg Pro Lys Thr Ala
275 280 285
Gly Arg Arg Asn Asp Leu His Asp Asp Arg Thr Ala Ser Ala His Lys
290 295 300
Thr Ser Arg Gln Lys Arg Arg Ala Glu Tyr Ala Arg Val Gln Glu Leu
305 310 315 320
Tyr Lys Lys Cys Arg Ser Arg Ala Ala Ala Glu Val Ile Asp Gly Ala
325 330 335
Cys Gly Gly Val Gly His Ser Leu Glu Glu Met Glu Thr Tyr Trp Arg
340 345 350
Pro Ile Leu Glu Arg Val Ser Asp Ala Pro Gly Pro Thr Pro Glu Ala
355 360 365
Leu His Ala Leu Gly Arg Ala Glu Trp His Gly Gly Asn Arg Asp Tyr
370 375 380
Thr Gln Leu Trp Lys Pro Ile Ser Val Glu Glu Ile Lys Ala Ser Arg
385 390 395 400
Phe Asp Trp Arg Thr Ser Pro Gly Pro Asp Gly Ile Arg Ser Gly Gln
405 410 415
Trp Arg Ala Val Pro Val His Leu Lys Ala Glu Met Phe Asn Ala Trp
420 425 430
Met Ala Arg Gly Glu Ile Pro Glu Ile Leu Arg Gln Cys Arg Thr Val
435 440 445
Phe Val Pro Lys Val Glu Arg Pro Gly Gly Pro Gly Glu Tyr Arg Pro
450 455 460
Ile Ser Ile Ala Ser Ile Pro Leu Arg His Phe His Ser Ile Leu Ala
465 470 475 480
Arg Arg Leu Leu Ala Cys Cys Pro Pro Asp Ala Arg Gln Arg Gly Phe
485 490 495
Ile Cys Ala Asp Gly Thr Leu Glu Asn Ser Ala Val Leu Asp Ala Val
500 505 510
Leu Gly Asp Ser Arg Lys Lys Leu Arg Glu Cys His Val Ala Val Leu
515 520 525
Asp Phe Ala Lys Ala Phe Asp Thr Val Ser His Glu Ala Leu Val Glu
530 535 540
Leu Leu Arg Leu Arg Gly Met Pro Glu Gln Phe Cys Gly Tyr Ile Ala
545 550 555 560
His Leu Tyr Asp Thr Ala Ser Thr Thr Leu Ala Val Asn Asn Glu Met
565 570 575
Ser Ser Pro Val Lys Val Gly Arg Gly Val Arg Gln Gly Asp Pro Leu
580 585 590
Ser Pro Ile Leu Phe Asn Val Val Met Asp Leu Ile Leu Ala Ser Leu
595 600 605
Pro Glu Arg Val Gly Tyr Arg Leu Glu Met Glu Leu Val Ser Ala Leu
610 615 620
Ala Tyr Ala Asp Asp Leu Val Leu Leu Ala Gly Ser Lys Val Gly Met
625 630 635 640
Gln Glu Ser Ile Ser Ala Val Asp Cys Val Gly Arg Gln Met Gly Leu
645 650 655
Arg Leu Asn Cys Arg Lys Ser Ala Val Leu Ser Met Ile Pro Asp Gly
660 665 670
His Arg Lys Lys His His Tyr Leu Thr Glu Arg Thr Phe Asn Ile Gly
675 680 685
Gly Lys Pro Leu Arg Gln Val Ser Cys Val Glu Arg Trp Arg Tyr Leu
690 695 700
Gly Val Asp Phe Glu Ala Ser Gly Cys Val Thr Leu Glu His Ser Ile
705 710 715 720
Ser Ser Ala Leu Asn Asn Ile Ser Arg Ala Pro Leu Lys Pro Gln Gln
725 730 735
Arg Leu Glu Ile Leu Arg Ala His Leu Ile Pro Arg Phe Gln His Gly
740 745 750
Phe Val Leu Gly Asn Ile Ser Asp Asp Arg Leu Arg Met Leu Asp Val
755 760 765
Gln Ile Arg Lys Ala Val Gly Gln Trp Leu Arg Leu Pro Ala Asp Val
770 775 780
Pro Lys Ala Tyr Tyr His Ala Ala Val Gln Asp Gly Gly Leu Ala Ile
785 790 795 800
Pro Ser Val Arg Ala Thr Ile Pro Asp Leu Ile Val Arg Arg Phe Gly
805 810 815
Gly Leu Asp Ser Ser Pro Trp Ser Val Ala Arg Ala Ala Ala Lys Ser
820 825 830
Asp Lys Ile Arg Lys Lys Leu Arg Trp Ala Trp Lys Gln Leu Arg Arg
835 840 845
Phe Ser Arg Val Asp Ser Thr Thr Gln Arg Pro Ser Val Arg Leu Phe
850 855 860
Trp Arg Glu His Leu His Ala Ser Val Asp Gly Arg Glu Leu Arg Glu
865 870 875 880
Ser Thr Arg Thr Pro Thr Ser Thr Lys Trp Ile Arg Glu Arg Cys Ala
885 890 895
Gln Ile Thr Gly Arg Asp Phe Val Gln Phe Val His Thr His Ile Asn
900 905 910
Ala Leu Pro Ser Arg Ile Arg Gly Ser Arg Gly Arg Arg Gly Gly Gly
915 920 925
Glu Ser Ser Leu Thr Cys Arg Ala Gly Cys Lys Val Arg Glu Thr Thr
930 935 940
Ala His Ile Leu Gln Gln Cys His Arg Thr His Gly Gly Arg Ile Leu
945 950 955 960
Arg His Asn Lys Ile Val Ser Phe Val Ala Lys Ala Met Glu Glu Asn
965 970 975
Lys Trp Thr Val Glu Leu Glu Pro Arg Leu Arg Thr Ser Val Gly Leu
980 985 990
Arg Lys Pro Ala Ile Ile Ala Ser Arg Asp Gly Val Gly Val Ile Val
995 1000 1005
Asp Val Gln Val Val Ser Gly Gln Arg Ser Leu Asp Glu Leu His
1010 1015 1020
Arg Glu Lys Arg Asn Lys Tyr Gly Asn His Gly Glu Leu Val Glu
1025 1030 1035
Leu Val Ala Gly Arg Leu Gly Leu Pro Lys Ala Glu Cys Val Arg
1040 1045 1050
Ala Thr Ser Cys Thr Ile Ser Trp Arg Gly Val Trp Ser Leu Thr
1055 1060 1065
Ser Tyr Lys Glu Leu Arg Ser Ile Ile Gly Leu Arg Glu Pro Thr
1070 1075 1080
Leu Gln Ile Val Pro Ile Leu Ala Leu Arg Gly Ser His Met Asn
1085 1090 1095
Trp Thr Arg Phe Asn Gln Met Thr Ser Val Met Gly Gly Gly Val
1100 1105 1110
Gly
<210> 9
<211> 1275
<212> PRT
<213> Homo sapiens
<400> 9
Met Thr Gly Ser Asn Ser His Ile Thr Ile Leu Thr Leu Asn Val Asn
1 5 10 15
Gly Leu Asn Ser Pro Ile Lys Arg His Arg Leu Ala Ser Trp Ile Lys
20 25 30
Ser Gln Asp Pro Ser Val Cys Cys Ile Gln Glu Thr His Leu Thr Cys
35 40 45
Arg Asp Thr His Arg Leu Lys Ile Lys Gly Trp Arg Lys Ile Tyr Gln
50 55 60
Ala Asn Gly Lys Gln Lys Lys Ala Gly Val Ala Ile Leu Val Ser Asp
65 70 75 80
Lys Thr Asp Phe Lys Pro Thr Lys Ile Lys Arg Asp Lys Glu Gly His
85 90 95
Tyr Ile Met Val Lys Gly Ser Ile Gln Gln Glu Glu Leu Thr Ile Leu
100 105 110
Asn Ile Tyr Ala Pro Asn Thr Gly Ala Pro Arg Phe Ile Lys Gln Val
115 120 125
Leu Ser Asp Leu Gln Arg Asp Leu Asp Ser His Thr Leu Ile Met Gly
130 135 140
Asp Phe Asn Thr Pro Leu Ser Ile Leu Asp Arg Ser Thr Arg Gln Lys
145 150 155 160
Val Asn Lys Asp Thr Gln Glu Leu Asn Ser Ala Leu His Gln Thr Asp
165 170 175
Leu Ile Asp Ile Tyr Arg Thr Leu His Pro Lys Ser Thr Glu Tyr Thr
180 185 190
Phe Phe Ser Ala Pro His His Thr Tyr Ser Lys Ile Asp His Ile Val
195 200 205
Gly Ser Lys Ala Leu Leu Ser Lys Cys Lys Arg Thr Glu Ile Ile Thr
210 215 220
Asn Tyr Leu Ser Asp His Ser Ala Ile Lys Leu Glu Leu Arg Ile Lys
225 230 235 240
Asn Leu Thr Gln Ser Arg Ser Thr Thr Trp Lys Leu Asn Asn Leu Leu
245 250 255
Leu Asn Asp Tyr Trp Val His Asn Glu Met Lys Ala Glu Ile Lys Met
260 265 270
Phe Phe Glu Thr Asn Glu Asn Lys Asp Thr Thr Tyr Gln Asn Leu Trp
275 280 285
Asp Ala Phe Lys Ala Val Cys Arg Gly Lys Phe Ile Ala Leu Asn Ala
290 295 300
Tyr Lys Arg Lys Gln Glu Arg Ser Lys Ile Asp Thr Leu Thr Ser Gln
305 310 315 320
Leu Lys Glu Leu Glu Lys Gln Glu Gln Thr His Ser Lys Ala Ser Arg
325 330 335
Arg Gln Glu Ile Thr Lys Ile Arg Ala Glu Leu Lys Glu Ile Glu Thr
340 345 350
Gln Lys Thr Leu Gln Lys Ile Asn Glu Ser Arg Ser Trp Phe Phe Glu
355 360 365
Arg Ile Asn Lys Ile Asp Arg Pro Leu Ala Arg Leu Ile Lys Lys Lys
370 375 380
Arg Glu Lys Asn Gln Ile Asp Thr Ile Lys Asn Asp Lys Gly Asp Ile
385 390 395 400
Thr Thr Asp Pro Thr Glu Ile Gln Thr Thr Ile Arg Glu Tyr Tyr Lys
405 410 415
His Leu Tyr Ala Asn Lys Leu Glu Asn Leu Glu Glu Met Asp Thr Phe
420 425 430
Leu Asp Thr Tyr Thr Leu Pro Arg Leu Asn Gln Glu Glu Val Glu Ser
435 440 445
Leu Asn Arg Pro Ile Thr Gly Ser Glu Ile Val Ala Ile Ile Asn Ser
450 455 460
Leu Pro Thr Lys Lys Ser Pro Gly Pro Asp Gly Phe Thr Ala Glu Phe
465 470 475 480
Tyr Gln Arg Tyr Lys Glu Glu Leu Val Pro Phe Leu Leu Lys Leu Phe
485 490 495
Gln Ser Ile Glu Lys Glu Gly Ile Leu Pro Asn Ser Phe Tyr Glu Ala
500 505 510
Ser Ile Ile Leu Ile Pro Lys Pro Gly Arg Asp Thr Thr Lys Lys Glu
515 520 525
Asn Phe Arg Pro Ile Ser Leu Met Asn Ile Asp Ala Lys Ile Leu Asn
530 535 540
Lys Ile Leu Ala Asn Arg Ile Gln Gln His Ile Lys Lys Leu Ile His
545 550 555 560
His Asp Gln Val Gly Phe Ile Pro Gly Met Gln Gly Trp Phe Asn Ile
565 570 575
Arg Lys Ser Ile Asn Val Ile Gln His Ile Asn Arg Ala Lys Asp Lys
580 585 590
Asn His Val Ile Ile Ser Ile Asp Ala Glu Lys Ala Phe Asp Lys Ile
595 600 605
Gln Gln Pro Phe Met Leu Lys Thr Leu Asn Lys Leu Gly Ile Asp Gly
610 615 620
Met Tyr Leu Lys Ile Ile Arg Ala Ile Tyr Asp Lys Pro Thr Ala Asn
625 630 635 640
Ile Ile Leu Asn Gly Gln Lys Leu Glu Ala Phe Pro Leu Lys Thr Gly
645 650 655
Thr Arg Gln Gly Cys Pro Leu Ser Pro Leu Leu Phe Asn Ile Val Leu
660 665 670
Glu Val Leu Ala Arg Ala Ile Arg Gln Glu Lys Glu Ile Lys Gly Ile
675 680 685
Gln Leu Gly Lys Glu Glu Val Lys Leu Ser Leu Phe Ala Asp Asp Met
690 695 700
Ile Val Tyr Leu Glu Asn Pro Ile Val Ser Ala Gln Asn Leu Leu Lys
705 710 715 720
Leu Ile Ser Asn Phe Ser Lys Val Ser Gly Tyr Lys Ile Asn Val Gln
725 730 735
Lys Ser Gln Ala Phe Leu Tyr Asn Asn Asn Arg Gln Thr Glu Ser Gln
740 745 750
Ile Met Gly Glu Leu Pro Phe Thr Ile Ala Ser Lys Arg Ile Lys Tyr
755 760 765
Leu Gly Ile Gln Leu Thr Arg Asp Val Lys Asp Leu Phe Lys Glu Asn
770 775 780
Tyr Lys Pro Leu Leu Lys Glu Ile Lys Glu Asp Thr Asn Lys Trp Lys
785 790 795 800
Asn Ile Pro Cys Ser Trp Val Gly Arg Ile Asn Ile Val Lys Met Ala
805 810 815
Ile Leu Pro Lys Val Ile Tyr Arg Phe Asn Ala Ile Pro Ile Lys Leu
820 825 830
Pro Met Thr Phe Phe Thr Glu Leu Glu Lys Thr Thr Leu Lys Phe Ile
835 840 845
Trp Asn Gln Lys Arg Ala Arg Ile Ala Lys Ser Ile Leu Ser Gln Lys
850 855 860
Asn Lys Ala Gly Gly Ile Thr Leu Pro Asp Phe Lys Leu Tyr Tyr Lys
865 870 875 880
Ala Thr Val Thr Lys Thr Ala Trp Tyr Trp Tyr Gln Asn Arg Asp Ile
885 890 895
Asp Gln Trp Asn Arg Thr Glu Pro Ser Glu Ile Met Pro His Ile Tyr
900 905 910
Asn Tyr Leu Ile Phe Asp Lys Pro Glu Lys Asn Lys Gln Trp Gly Lys
915 920 925
Asp Ser Leu Leu Asn Lys Trp Cys Trp Glu Asn Trp Leu Ala Ile Cys
930 935 940
Arg Lys Leu Lys Leu Asp Pro Phe Leu Thr Pro Tyr Thr Lys Ile Asn
945 950 955 960
Ser Arg Trp Ile Lys Asp Leu Asn Val Lys Pro Lys Thr Ile Lys Thr
965 970 975
Leu Glu Glu Asn Leu Gly Ile Thr Ile Gln Asp Ile Gly Val Gly Lys
980 985 990
Asp Phe Met Ser Lys Thr Pro Lys Ala Met Ala Thr Lys Asp Lys Ile
995 1000 1005
Asp Lys Trp Asp Leu Ile Lys Leu Lys Ser Phe Cys Thr Ala Lys
1010 1015 1020
Glu Thr Thr Ile Arg Val Asn Arg Gln Pro Thr Thr Trp Glu Lys
1025 1030 1035
Ile Phe Ala Thr Tyr Ser Ser Asp Lys Gly Leu Ile Ser Arg Ile
1040 1045 1050
Tyr Asn Glu Leu Lys Gln Ile Tyr Lys Lys Lys Thr Asn Asn Pro
1055 1060 1065
Ile Lys Lys Trp Ala Lys Asp Met Asn Arg His Phe Ser Lys Glu
1070 1075 1080
Asp Ile Tyr Ala Ala Lys Lys His Met Lys Lys Cys Ser Ser Ser
1085 1090 1095
Leu Ala Ile Arg Glu Met Gln Ile Lys Thr Thr Met Arg Tyr His
1100 1105 1110
Leu Thr Pro Val Arg Met Ala Ile Ile Lys Lys Ser Gly Asn Asn
1115 1120 1125
Arg Cys Trp Arg Gly Cys Gly Glu Ile Gly Thr Leu Val His Cys
1130 1135 1140
Trp Trp Asp Cys Lys Leu Val Gln Pro Leu Trp Lys Ser Val Trp
1145 1150 1155
Arg Phe Leu Arg Asp Leu Glu Leu Glu Ile Pro Phe Asp Pro Ala
1160 1165 1170
Ile Pro Leu Leu Gly Ile Tyr Pro Lys Asp Tyr Lys Ser Cys Cys
1175 1180 1185
Tyr Lys Asp Thr Cys Thr Arg Met Phe Ile Ala Ala Leu Phe Thr
1190 1195 1200
Ile Ala Lys Thr Trp Asn Gln Pro Asn Cys Pro Thr Met Ile Asp
1205 1210 1215
Trp Ile Lys Lys Met Trp His Ile Tyr Thr Met Glu Tyr Tyr Ala
1220 1225 1230
Ala Ile Lys Asn Asp Glu Phe Ile Ser Phe Val Gly Thr Trp Met
1235 1240 1245
Lys Leu Glu Thr Ile Ile Leu Ser Lys Leu Ser Gln Glu Gln Lys
1250 1255 1260
Thr Lys His Arg Ile Phe Ser Leu Ile Gly Gly Asn
1265 1270 1275
<210> 10
<211> 1275
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 10
Met Thr Gly Ser Asn Ser His Ile Thr Ile Leu Thr Leu Asn Val Asn
1 5 10 15
Gly Leu Asn Ser Pro Ile Lys Arg His Arg Leu Ala Ser Trp Ile Lys
20 25 30
Ser Gln Asp Pro Ser Val Cys Cys Ile Gln Glu Thr His Leu Thr Cys
35 40 45
Arg Asp Thr His Arg Leu Lys Ile Lys Gly Trp Arg Lys Ile Tyr Gln
50 55 60
Ala Asn Gly Lys Gln Lys Lys Ala Gly Val Ala Ile Leu Val Ser Asp
65 70 75 80
Lys Thr Asp Phe Lys Pro Thr Lys Ile Lys Arg Asp Lys Glu Gly His
85 90 95
Tyr Ile Met Val Lys Gly Ser Ile Gln Gln Glu Glu Leu Thr Ile Leu
100 105 110
Asn Ile Tyr Ala Pro Asn Thr Gly Ala Pro Arg Phe Ile Lys Gln Val
115 120 125
Leu Ser Asp Leu Gln Arg Asp Leu Asp Ser His Thr Leu Ile Met Gly
130 135 140
Asp Phe Asn Thr Pro Leu Ser Ile Leu Asp Arg Ser Thr Arg Gln Lys
145 150 155 160
Val Asn Lys Asp Thr Gln Glu Leu Asn Ser Ala Leu His Gln Thr Asp
165 170 175
Leu Ile Asp Ile Tyr Arg Thr Leu His Pro Lys Ser Thr Glu Tyr Thr
180 185 190
Phe Phe Ser Ala Pro His His Thr Tyr Ser Lys Ile Ala His Ile Val
195 200 205
Gly Ser Lys Ala Leu Leu Ser Lys Cys Lys Arg Thr Glu Ile Ile Thr
210 215 220
Asn Tyr Leu Ser Asp Ala Ser Ala Ile Lys Leu Glu Leu Arg Ile Lys
225 230 235 240
Asn Leu Thr Gln Ser Arg Ser Thr Thr Trp Lys Leu Asn Asn Leu Leu
245 250 255
Leu Asn Asp Tyr Trp Val His Asn Glu Met Lys Ala Glu Ile Lys Met
260 265 270
Phe Phe Glu Thr Asn Glu Asn Lys Asp Thr Thr Tyr Gln Asn Leu Trp
275 280 285
Asp Ala Phe Lys Ala Val Cys Arg Gly Lys Phe Ile Ala Leu Asn Ala
290 295 300
Tyr Lys Arg Lys Gln Glu Arg Ser Lys Ile Asp Thr Leu Thr Ser Gln
305 310 315 320
Leu Lys Glu Leu Glu Lys Gln Glu Gln Thr His Ser Lys Ala Ser Arg
325 330 335
Arg Gln Glu Ile Thr Lys Ile Arg Ala Glu Leu Lys Glu Ile Glu Thr
340 345 350
Gln Lys Thr Leu Gln Lys Ile Asn Glu Ser Arg Ser Trp Phe Phe Glu
355 360 365
Arg Ile Asn Lys Ile Asp Arg Pro Leu Ala Arg Leu Ile Lys Lys Lys
370 375 380
Arg Glu Lys Asn Gln Ile Asp Thr Ile Lys Asn Asp Lys Gly Asp Ile
385 390 395 400
Thr Thr Asp Pro Thr Glu Ile Gln Thr Thr Ile Arg Glu Tyr Tyr Lys
405 410 415
His Leu Tyr Ala Asn Lys Leu Glu Asn Leu Glu Glu Met Asp Thr Phe
420 425 430
Leu Asp Thr Tyr Thr Leu Pro Arg Leu Asn Gln Glu Glu Val Glu Ser
435 440 445
Leu Asn Arg Pro Ile Thr Gly Ser Glu Ile Val Ala Ile Ile Asn Ser
450 455 460
Leu Pro Thr Lys Lys Ser Pro Gly Pro Asp Gly Phe Thr Ala Glu Phe
465 470 475 480
Tyr Gln Arg Tyr Lys Glu Glu Leu Val Pro Phe Leu Leu Lys Leu Phe
485 490 495
Gln Ser Ile Glu Lys Glu Gly Ile Leu Pro Asn Ser Phe Tyr Glu Ala
500 505 510
Ser Ile Ile Leu Ile Pro Lys Pro Gly Arg Asp Thr Thr Lys Lys Glu
515 520 525
Asn Phe Arg Pro Ile Ser Leu Met Asn Ile Asp Ala Lys Ile Leu Asn
530 535 540
Lys Ile Leu Ala Asn Arg Ile Gln Gln His Ile Lys Lys Leu Ile His
545 550 555 560
His Asp Gln Val Gly Phe Ile Pro Gly Met Gln Gly Trp Phe Asn Ile
565 570 575
Arg Lys Ser Ile Asn Val Ile Gln His Ile Asn Arg Ala Lys Asp Lys
580 585 590
Asn His Val Ile Ile Ser Ile Asp Ala Glu Lys Ala Phe Asp Lys Ile
595 600 605
Gln Gln Pro Phe Met Leu Lys Thr Leu Asn Lys Leu Gly Ile Asp Gly
610 615 620
Met Tyr Leu Lys Ile Ile Arg Ala Ile Tyr Asp Lys Pro Thr Ala Asn
625 630 635 640
Ile Ile Leu Asn Gly Gln Lys Leu Glu Ala Phe Pro Leu Lys Thr Gly
645 650 655
Thr Arg Gln Gly Cys Pro Leu Ser Pro Leu Leu Phe Asn Ile Val Leu
660 665 670
Glu Val Leu Ala Arg Ala Ile Arg Gln Glu Lys Glu Ile Lys Gly Ile
675 680 685
Gln Leu Gly Lys Glu Glu Val Lys Leu Ser Leu Phe Ala Asp Asp Met
690 695 700
Ile Val Tyr Leu Glu Asn Pro Ile Val Ser Ala Gln Asn Leu Leu Lys
705 710 715 720
Leu Ile Ser Asn Phe Ser Lys Val Ser Gly Tyr Lys Ile Asn Val Gln
725 730 735
Lys Ser Gln Ala Phe Leu Tyr Asn Asn Asn Arg Gln Thr Glu Ser Gln
740 745 750
Ile Met Gly Glu Leu Pro Phe Thr Ile Ala Ser Lys Arg Ile Lys Tyr
755 760 765
Leu Gly Ile Gln Leu Thr Arg Asp Val Lys Asp Leu Phe Lys Glu Asn
770 775 780
Tyr Lys Pro Leu Leu Lys Glu Ile Lys Glu Asp Thr Asn Lys Trp Lys
785 790 795 800
Asn Ile Pro Cys Ser Trp Val Gly Arg Ile Asn Ile Val Lys Met Ala
805 810 815
Ile Leu Pro Lys Val Ile Tyr Arg Phe Asn Ala Ile Pro Ile Lys Leu
820 825 830
Pro Met Thr Phe Phe Thr Glu Leu Glu Lys Thr Thr Leu Lys Phe Ile
835 840 845
Trp Asn Gln Lys Arg Ala Arg Ile Ala Lys Ser Ile Leu Ser Gln Lys
850 855 860
Asn Lys Ala Gly Gly Ile Thr Leu Pro Asp Phe Lys Leu Tyr Tyr Lys
865 870 875 880
Ala Thr Val Thr Lys Thr Ala Trp Tyr Trp Tyr Gln Asn Arg Asp Ile
885 890 895
Asp Gln Trp Asn Arg Thr Glu Pro Ser Glu Ile Met Pro His Ile Tyr
900 905 910
Asn Tyr Leu Ile Phe Asp Lys Pro Glu Lys Asn Lys Gln Trp Gly Lys
915 920 925
Asp Ser Leu Leu Asn Lys Trp Cys Trp Glu Asn Trp Leu Ala Ile Cys
930 935 940
Arg Lys Leu Lys Leu Asp Pro Phe Leu Thr Pro Tyr Thr Lys Ile Asn
945 950 955 960
Ser Arg Trp Ile Lys Asp Leu Asn Val Lys Pro Lys Thr Ile Lys Thr
965 970 975
Leu Glu Glu Asn Leu Gly Ile Thr Ile Gln Asp Ile Gly Val Gly Lys
980 985 990
Asp Phe Met Ser Lys Thr Pro Lys Ala Met Ala Thr Lys Asp Lys Ile
995 1000 1005
Asp Lys Trp Asp Leu Ile Lys Leu Lys Ser Phe Cys Thr Ala Lys
1010 1015 1020
Glu Thr Thr Ile Arg Val Asn Arg Gln Pro Thr Thr Trp Glu Lys
1025 1030 1035
Ile Phe Ala Thr Tyr Ser Ser Asp Lys Gly Leu Ile Ser Arg Ile
1040 1045 1050
Tyr Asn Glu Leu Lys Gln Ile Tyr Lys Lys Lys Thr Asn Asn Pro
1055 1060 1065
Ile Lys Lys Trp Ala Lys Asp Met Asn Arg His Phe Ser Lys Glu
1070 1075 1080
Asp Ile Tyr Ala Ala Lys Lys His Met Lys Lys Cys Ser Ser Ser
1085 1090 1095
Leu Ala Ile Arg Glu Met Gln Ile Lys Thr Thr Met Arg Tyr His
1100 1105 1110
Leu Thr Pro Val Arg Met Ala Ile Ile Lys Lys Ser Gly Asn Asn
1115 1120 1125
Arg Cys Trp Arg Gly Cys Gly Glu Ile Gly Thr Leu Val His Cys
1130 1135 1140
Trp Trp Asp Cys Lys Leu Val Gln Pro Leu Trp Lys Ser Val Trp
1145 1150 1155
Arg Phe Leu Arg Asp Leu Glu Leu Glu Ile Pro Phe Asp Pro Ala
1160 1165 1170
Ile Pro Leu Leu Gly Ile Tyr Pro Lys Asp Tyr Lys Ser Cys Cys
1175 1180 1185
Tyr Lys Asp Thr Cys Thr Arg Met Phe Ile Ala Ala Leu Phe Thr
1190 1195 1200
Ile Ala Lys Thr Trp Asn Gln Pro Asn Cys Pro Thr Met Ile Asp
1205 1210 1215
Trp Ile Lys Lys Met Trp His Ile Tyr Thr Met Glu Tyr Tyr Ala
1220 1225 1230
Ala Ile Lys Asn Asp Glu Phe Ile Ser Phe Val Gly Thr Trp Met
1235 1240 1245
Lys Leu Glu Thr Ile Ile Leu Ser Lys Leu Ser Gln Glu Gln Lys
1250 1255 1260
Thr Lys His Arg Ile Phe Ser Leu Ile Gly Gly Asn
1265 1270 1275
<210> 11
<211> 1281
<212> PRT
<213> Mus sp.
<400> 11
Met Pro Thr Leu Thr Thr Lys Ile Lys Gly Ser Asn Asn Tyr Phe Ser
1 5 10 15
Leu Ile Ser Leu Asn Ile Asn Gly Leu Asn Ser Pro Ile Lys Arg His
20 25 30
Arg Leu Thr Asp Trp Leu His Lys Gln Asp Pro Thr Phe Cys Cys Leu
35 40 45
Gln Glu Thr His Leu Arg Glu Lys Asp Arg His Tyr Leu Arg Val Lys
50 55 60
Gly Trp Lys Thr Ile Phe Gln Ala Asn Gly Leu Lys Lys Gln Ala Gly
65 70 75 80
Val Ala Ile Leu Ile Leu Asp Lys Ile Asp Phe Gln Pro Lys Val Ile
85 90 95
Lys Lys Asp Lys Glu Gly His Phe Ile Leu Ile Lys Gly Lys Ile Leu
100 105 110
Gln Glu Glu Leu Ser Ile Leu Asn Ile Tyr Ala Pro Asn Ala Arg Ala
115 120 125
Ala Thr Phe Ile Arg Asp Thr Leu Val Lys Leu Lys Ala Tyr Ile Ala
130 135 140
Pro His Thr Ile Ile Val Gly Asp Phe Asn Thr Pro Leu Ser Ser Lys
145 150 155 160
Asp Arg Ser Trp Lys Gln Lys Leu Asn Arg Asp Thr Val Lys Leu Thr
165 170 175
Glu Val Met Lys Gln Met Asp Leu Thr Asp Ile Tyr Arg Thr Phe Tyr
180 185 190
Pro Lys Thr Lys Gly Tyr Thr Phe Phe Ser Ala Pro His Gly Thr Phe
195 200 205
Ser Lys Ile Asp His Ile Ile Gly His Lys Thr Gly Leu Asn Arg Tyr
210 215 220
Lys Asn Ile Glu Ile Val Pro Cys Ile Leu Ser Asp His His Gly Leu
225 230 235 240
Arg Leu Ile Phe Asn Asn Asn Ile Asn Asn Gly Lys Pro Thr Phe Thr
245 250 255
Trp Lys Leu Asn Asn Thr Leu Leu Asn Asp Thr Leu Val Lys Glu Gly
260 265 270
Ile Lys Lys Glu Ile Lys Asp Phe Leu Glu Phe Asn Glu Asn Glu Ala
275 280 285
Thr Thr Tyr Pro Asn Leu Trp Asp Thr Met Lys Ala Phe Leu Arg Gly
290 295 300
Lys Leu Ile Ala Leu Ser Ala Ser Lys Lys Lys Arg Glu Thr Ala His
305 310 315 320
Thr Ser Ser Leu Thr Thr His Leu Lys Ala Leu Glu Lys Lys Glu Ala
325 330 335
Asn Ser Pro Lys Arg Ser Arg Arg Gln Glu Ile Ile Lys Leu Arg Gly
340 345 350
Glu Ile Asn Gln Val Glu Lys Arg Arg Thr Ile Gln Arg Ile Asn Gln
355 360 365
Thr Arg Ser Trp Phe Phe Glu Lys Ile Asn Lys Ile Asp Lys Pro Leu
370 375 380
Ala Arg Leu Thr Lys Gly His Arg Asp Lys Ile Leu Ile Asn Lys Ile
385 390 395 400
Arg Asn Glu Lys Gly Asp Ile Thr Thr Asp Pro Glu Glu Ile Gln Asn
405 410 415
Thr Ile Arg Ser Phe Tyr Lys Arg Leu Tyr Ser Thr Lys Leu Glu Asn
420 425 430
Leu Asp Glu Met Asp Lys Phe Leu Asp Arg Tyr Gln Val Pro Lys Leu
435 440 445
Asn Gln Asp Gln Val Asp His Leu Asn Ser Pro Ile Ser Pro Lys Glu
450 455 460
Ile Glu Ala Val Ile Asn Ser Leu Pro Thr Lys Lys Ser Pro Gly Pro
465 470 475 480
Asp Gly Phe Ser Ala Glu Phe Tyr Gln Thr Phe Lys Glu Asp Leu Ile
485 490 495
Pro Ile Leu His Lys Leu Phe His Lys Ile Glu Val Glu Gly Thr Leu
500 505 510
Pro Asn Ser Phe Tyr Glu Ala Thr Ile Thr Leu Ile Pro Lys Pro Gln
515 520 525
Lys Asp Pro Thr Lys Ile Glu Asn Phe Arg Pro Ile Ser Leu Met Asn
530 535 540
Ile Asp Ala Lys Ile Leu Asn Lys Ile Leu Ala Asn Arg Ile Gln Glu
545 550 555 560
His Ile Lys Ala Ile Ile His Pro Asp Gln Val Gly Phe Ile Pro Gly
565 570 575
Met Gln Gly Trp Phe Asn Ile Arg Lys Ser Ile Asn Val Ile His Tyr
580 585 590
Ile Asn Lys Leu Lys Asp Lys Asn His Met Ile Ile Ser Leu Asp Ala
595 600 605
Glu Lys Ala Phe Asp Lys Ile Gln His Pro Phe Met Ile Lys Val Leu
610 615 620
Glu Arg Ser Gly Ile Gln Gly Pro Tyr Leu Asn Met Ile Lys Ala Ile
625 630 635 640
Tyr Ser Lys Pro Val Ala Asn Ile Lys Val Asn Gly Glu Lys Leu Glu
645 650 655
Ala Ile Pro Leu Lys Ser Gly Thr Arg Gln Gly Cys Pro Leu Ser Pro
660 665 670
Tyr Leu Phe Asn Ile Val Leu Glu Val Leu Ala Arg Ala Ile Arg Gln
675 680 685
Gln Lys Glu Ile Lys Gly Ile Gln Ile Gly Lys Glu Glu Val Lys Ile
690 695 700
Ser Leu Phe Ala Asp Asp Met Ile Val Tyr Ile Ser Asp Pro Lys Asn
705 710 715 720
Ser Thr Arg Glu Leu Leu Asn Leu Ile Asn Ser Phe Gly Glu Val Ala
725 730 735
Gly Tyr Lys Ile Asn Ser Asn Lys Ser Met Ala Phe Leu Tyr Thr Lys
740 745 750
Asn Lys Gln Ala Glu Lys Glu Ile Trp Glu Thr Thr Pro Phe Ser Ile
755 760 765
Val Thr Asn Asn Ile Lys Tyr Leu Gly Val Thr Leu Thr Lys Glu Val
770 775 780
Lys Asp Leu Tyr Asp Lys Asn Phe Lys Ser Leu Lys Lys Glu Ile Lys
785 790 795 800
Glu Asp Leu Arg Arg Trp Lys Asp Leu Pro Cys Ser Trp Ile Gly Arg
805 810 815
Ile Asn Ile Val Lys Met Ala Ile Leu Pro Lys Ala Ile Tyr Arg Phe
820 825 830
Asn Ala Ile Pro Ile Lys Ile Pro Thr Gln Phe Phe Asn Glu Leu Glu
835 840 845
Gly Ala Ile Cys Lys Phe Val Trp Asn Asn Lys Lys Pro Arg Ile Ala
850 855 860
Lys Ser Leu Leu Lys Asp Lys Arg Thr Ser Gly Gly Ile Thr Met Pro
865 870 875 880
Asp Leu Lys Leu Tyr Tyr Arg Ala Ile Val Ile Lys Thr Ala Trp Tyr
885 890 895
Trp Tyr Arg Asp Arg Gln Val Asp Gln Trp Asn Arg Ile Glu Asp Pro
900 905 910
Glu Met Asn Pro His Thr Tyr Gly His Leu Ile Phe Asp Lys Gly Asp
915 920 925
Lys Thr Ile Gln Trp Lys Lys Asp Ser Ile Phe Asn Asn Trp Cys Trp
930 935 940
His Asn Trp Leu Leu Ser Cys Arg Arg Met Arg Ile Asp Pro Tyr Leu
945 950 955 960
Ser Pro Cys Thr Lys Val Lys Ser Lys Trp Ile Lys Glu Leu His Ile
965 970 975
Lys Pro Glu Thr Leu Lys Leu Ile Glu Glu Lys Val Gly Lys Ser Leu
980 985 990
Glu Asp Met Gly Thr Gly Glu Lys Phe Leu Asn Arg Thr Ala Met Ala
995 1000 1005
Cys Ala Val Arg Ser Arg Ile Asp Lys Trp Asp Leu Met Lys Leu
1010 1015 1020
Gln Ser Phe Cys Lys Ala Lys Asp Thr Val Asn Lys Thr Lys Arg
1025 1030 1035
Pro Pro Thr Asp Trp Glu Arg Ile Phe Thr Tyr Pro Lys Ser Asp
1040 1045 1050
Arg Gly Leu Ile Ser Asn Ile Tyr Lys Glu Leu Lys Lys Val Asp
1055 1060 1065
Phe Arg Lys Ser Asn Asn Pro Ile Lys Lys Trp Gly Ser Glu Leu
1070 1075 1080
Asn Lys Glu Phe Ser Pro Glu Glu Tyr Arg Met Ala Glu Lys His
1085 1090 1095
Leu Lys Lys Cys Ser Thr Ser Leu Ile Ile Arg Glu Met Gln Ile
1100 1105 1110
Lys Thr Thr Leu Arg Phe His Leu Thr Pro Val Arg Met Ala Lys
1115 1120 1125
Ile Lys Asn Ser Gly Asp Ser Arg Cys Trp Arg Gly Cys Gly Glu
1130 1135 1140
Arg Gly Thr Leu Leu His Cys Trp Trp Glu Cys Arg Leu Val Gln
1145 1150 1155
Pro Leu Trp Lys Ser Val Trp Arg Phe Leu Arg Lys Leu Asp Ile
1160 1165 1170
Val Leu Pro Glu Asp Pro Ala Ile Pro Leu Leu Gly Ile Tyr Pro
1175 1180 1185
Glu Asp Ala Pro Thr Gly Lys Lys Asp Thr Cys Ser Thr Met Phe
1190 1195 1200
Ile Ala Ala Leu Phe Ile Ile Ala Arg Ser Trp Lys Glu Pro Arg
1205 1210 1215
Cys Pro Ser Thr Glu Glu Trp Ile Gln Lys Met Trp Tyr Ile Tyr
1220 1225 1230
Thr Met Glu Tyr Tyr Ser Ala Ile Lys Lys Asn Glu Phe Met Lys
1235 1240 1245
Phe Leu Ala Lys Trp Met Asp Leu Glu Gly Ile Ile Leu Ser Glu
1250 1255 1260
Val Thr His Ser Gln Arg Asn Ser His Asn Met Tyr Ser Leu Ile
1265 1270 1275
Ser Gly Tyr
1280
<210> 12
<211> 599
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
ltrA seqeunce
<400> 12
Met Lys Pro Thr Met Ala Ile Leu Glu Arg Ile Ser Lys Asn Ser Gln
1 5 10 15
Glu Asn Ile Asp Glu Val Phe Thr Arg Leu Tyr Arg Tyr Leu Leu Arg
20 25 30
Pro Asp Ile Tyr Tyr Val Ala Tyr Gln Asn Leu Tyr Ser Asn Lys Gly
35 40 45
Ala Ser Thr Lys Gly Ile Leu Asp Asp Thr Ala Asp Gly Phe Ser Glu
50 55 60
Glu Lys Ile Lys Lys Ile Ile Gln Ser Leu Lys Asp Gly Thr Tyr Tyr
65 70 75 80
Pro Gln Pro Val Arg Arg Met Tyr Ile Ala Lys Lys Asn Ser Lys Lys
85 90 95
Met Arg Pro Leu Gly Ile Pro Thr Phe Thr Asp Lys Leu Ile Gln Glu
100 105 110
Ala Val Arg Ile Ile Leu Glu Ser Ile Tyr Glu Pro Val Phe Glu Asp
115 120 125
Val Ser His Gly Phe Arg Pro Gln Arg Ser Cys His Thr Ala Leu Lys
130 135 140
Thr Ile Lys Arg Glu Phe Gly Gly Ala Arg Trp Phe Val Glu Gly Asp
145 150 155 160
Ile Lys Gly Cys Phe Asp Asn Ile Asp His Val Thr Leu Ile Gly Leu
165 170 175
Ile Asn Leu Lys Ile Lys Asp Met Lys Met Ser Gln Leu Ile Tyr Lys
180 185 190
Phe Leu Lys Ala Gly Tyr Leu Glu Asn Trp Gln Tyr His Lys Thr Tyr
195 200 205
Ser Gly Thr Pro Gln Gly Gly Ile Leu Ser Pro Leu Leu Ala Asn Ile
210 215 220
Tyr Leu His Glu Leu Asp Lys Phe Val Leu Gln Leu Lys Met Lys Phe
225 230 235 240
Asp Arg Glu Ser Pro Glu Arg Ile Thr Pro Glu Tyr Arg Glu Leu His
245 250 255
Asn Glu Ile Lys Arg Ile Ser His Arg Leu Lys Lys Leu Glu Gly Glu
260 265 270
Glu Lys Ala Lys Val Leu Leu Glu Tyr Gln Glu Lys Arg Lys Arg Leu
275 280 285
Pro Thr Leu Pro Cys Thr Ser Gln Thr Asn Lys Val Leu Lys Tyr Val
290 295 300
Arg Tyr Ala Asp Asp Phe Ile Ile Ser Val Lys Gly Ser Lys Glu Asp
305 310 315 320
Cys Gln Trp Ile Lys Glu Gln Leu Lys Leu Phe Ile His Asn Lys Leu
325 330 335
Lys Met Glu Leu Ser Glu Glu Lys Thr Leu Ile Thr His Ser Ser Gln
340 345 350
Pro Ala Arg Phe Leu Gly Tyr Asp Ile Arg Val Arg Arg Ser Gly Thr
355 360 365
Ile Lys Arg Ser Gly Lys Val Lys Lys Arg Thr Leu Asn Gly Ser Val
370 375 380
Glu Leu Leu Ile Pro Leu Gln Asp Lys Ile Arg Gln Phe Ile Phe Asp
385 390 395 400
Lys Lys Ile Ala Ile Gln Lys Lys Asp Ser Ser Trp Phe Pro Val His
405 410 415
Arg Lys Tyr Leu Ile Arg Ser Thr Asp Leu Glu Ile Ile Thr Ile Tyr
420 425 430
Asn Ser Glu Leu Arg Gly Ile Cys Asn Tyr Tyr Gly Leu Ala Ser Asn
435 440 445
Phe Asn Gln Leu Asn Tyr Phe Ala Tyr Leu Met Glu Tyr Ser Cys Leu
450 455 460
Lys Thr Ile Ala Ser Lys His Lys Gly Thr Leu Ser Lys Thr Ile Ser
465 470 475 480
Met Phe Lys Asp Gly Ser Gly Ser Trp Gly Ile Pro Tyr Glu Ile Lys
485 490 495
Gln Gly Lys Gln Arg Arg Tyr Phe Ala Asn Phe Ser Glu Cys Lys Ser
500 505 510
Pro Tyr Gln Phe Thr Asp Glu Ile Ser Gln Ala Pro Val Leu Tyr Gly
515 520 525
Tyr Ala Arg Asn Thr Leu Glu Asn Arg Leu Lys Ala Lys Cys Cys Glu
530 535 540
Leu Cys Gly Thr Ser Asp Glu Asn Thr Ser Tyr Glu Ile His His Val
545 550 555 560
Asn Lys Val Lys Asn Leu Lys Gly Lys Glu Lys Trp Glu Met Ala Met
565 570 575
Ile Ala Lys Gln Arg Lys Thr Leu Val Val Cys Phe His Cys His Arg
580 585 590
His Val Ile His Lys His Lys
595
<210> 13
<211> 677
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 13
Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu
1 5 10 15
Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala
20 25 30
Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu
35 40 45
Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr
50 55 60
Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg
65 70 75 80
Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr
85 90 95
Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
100 105 110
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr
115 120 125
Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln
130 135 140
Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
145 150 155 160
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
165 170 175
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
180 185 190
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala
195 200 205
Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp
210 215 220
Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr
225 230 235 240
Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala
245 250 255
Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu
260 265 270
Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val
275 280 285
Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu
290 295 300
Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met
305 310 315 320
Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp
325 330 335
Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
340 345 350
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu
355 360 365
Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys
370 375 380
Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
385 390 395 400
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
405 410 415
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
420 425 430
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro
435 440 445
Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu
450 455 460
Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro
465 470 475 480
Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu
485 490 495
Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln
500 505 510
Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu
515 520 525
Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr
530 535 540
Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg
545 550 555 560
Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys
565 570 575
Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
580 585 590
Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly
595 600 605
Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu
610 615 620
Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
625 630 635 640
Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
645 650 655
Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
660 665 670
Glu Asn Ser Ser Pro
675
<210> 14
<211> 677
<212> PRT
<213> Murine leukemia virus
<400> 14
Thr Leu Asn Ile Glu Asp Glu His Arg Leu His Glu Thr Ser Lys Glu
1 5 10 15
Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala
20 25 30
Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu
35 40 45
Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr
50 55 60
Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg
65 70 75 80
Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr
85 90 95
Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
100 105 110
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr
115 120 125
Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln
130 135 140
Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
145 150 155 160
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
165 170 175
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
180 185 190
Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala
195 200 205
Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp
210 215 220
Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr
225 230 235 240
Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala
245 250 255
Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu
260 265 270
Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val
275 280 285
Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu
290 295 300
Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met
305 310 315 320
Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp
325 330 335
Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
340 345 350
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu
355 360 365
Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys
370 375 380
Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
385 390 395 400
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
405 410 415
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
420 425 430
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro
435 440 445
Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu
450 455 460
Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro
465 470 475 480
Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu
485 490 495
Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln
500 505 510
Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu
515 520 525
Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr
530 535 540
Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg
545 550 555 560
Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys
565 570 575
Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
580 585 590
Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly
595 600 605
Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu
610 615 620
Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
625 630 635 640
Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
645 650 655
Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
660 665 670
Glu Asn Ser Ser Pro
675
<210> 15
<211> 677
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
XMRV3VP35RT sequence
<400> 15
Thr Leu Asn Ile Glu Asn Lys Tyr Arg Leu His Glu Thr Ser Lys Glu
1 5 10 15
Pro Asp Val Pro Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala
20 25 30
Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu
35 40 45
Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr
50 55 60
Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg
65 70 75 80
Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr
85 90 95
Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
100 105 110
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr
115 120 125
Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln
130 135 140
Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
145 150 155 160
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
165 170 175
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
180 185 190
Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala
195 200 205
Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp
210 215 220
Asp Leu Leu Leu Ala Ala Thr Ser Glu Gln Asp Cys Gln Arg Gly Thr
225 230 235 240
Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala
245 250 255
Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu
260 265 270
Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val
275 280 285
Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu
290 295 300
Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met
305 310 315 320
Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp
325 330 335
Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
340 345 350
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu
355 360 365
Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys
370 375 380
Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
385 390 395 400
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
405 410 415
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
420 425 430
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro
435 440 445
Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Met Leu
450 455 460
Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro
465 470 475 480
Ala Thr Leu Leu Pro Leu Pro Glu Lys Glu Ala Pro His Asp Cys Leu
485 490 495
Glu Ile Leu Ala Glu Thr His Gly Thr Arg Pro Asp Leu Thr Asp Gln
500 505 510
Pro Ile Pro Asp Ala Asp Tyr Thr Trp Tyr Thr Asp Gly Ser Ser Phe
515 520 525
Leu Gln Glu Gly Gln Arg Arg Ala Gly Ala Ala Val Thr Thr Glu Thr
530 535 540
Glu Val Ile Trp Ala Arg Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg
545 550 555 560
Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys
565 570 575
Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
580 585 590
Val His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly
595 600 605
Arg Glu Ile Lys Asn Lys Asn Glu Ile Leu Ala Leu Leu Lys Ala Leu
610 615 620
Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
625 630 635 640
Gly Asn Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
645 650 655
Arg Glu Ala Ala Met Lys Ala Val Leu Glu Thr Ser Thr Leu Leu Ile
660 665 670
Glu Asp Ser Thr Pro
675
<210> 16
<211> 682
<212> PRT
<213> Gibbon ape leukemia virus
<400> 16
Val Leu Asn Leu Glu Glu Glu Tyr Arg Leu His Glu Lys Pro Val Pro
1 5 10 15
Ser Ser Ile Asp Pro Ser Trp Leu Gln Leu Phe Pro Thr Val Trp Ala
20 25 30
Glu Arg Ala Gly Met Gly Leu Ala Asn Gln Val Pro Pro Val Val Val
35 40 45
Glu Leu Arg Ser Gly Ala Ser Pro Val Ala Val Arg Gln Tyr Pro Met
50 55 60
Ser Lys Glu Ala Arg Glu Gly Ile Arg Pro His Ile Gln Lys Phe Leu
65 70 75 80
Asp Leu Gly Val Leu Val Pro Cys Arg Ser Pro Trp Asn Thr Pro Leu
85 90 95
Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp
100 105 110
Leu Arg Glu Ile Asn Lys Arg Val Gln Asp Ile His Pro Thr Val Pro
115 120 125
Asn Pro Tyr Asn Leu Leu Ser Ser Leu Pro Pro Ser Tyr Thr Trp Tyr
130 135 140
Ser Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro
145 150 155 160
Asn Ser Gln Pro Leu Phe Ala Phe Glu Trp Lys Asp Pro Glu Lys Gly
165 170 175
Asn Thr Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn
180 185 190
Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala Pro Phe
195 200 205
Arg Ala Leu Asn Pro Gln Val Val Leu Leu Gln Tyr Val Asp Asp Leu
210 215 220
Leu Val Ala Ala Pro Thr Tyr Glu Asp Cys Lys Lys Gly Thr Gln Lys
225 230 235 240
Leu Leu Gln Glu Leu Ser Lys Leu Gly Tyr Arg Val Ser Ala Lys Lys
245 250 255
Ala Gln Leu Cys Gln Arg Glu Val Thr Tyr Leu Gly Tyr Leu Leu Lys
260 265 270
Glu Gly Lys Arg Trp Leu Thr Pro Ala Arg Lys Ala Thr Val Met Lys
275 280 285
Ile Pro Val Pro Thr Thr Pro Arg Gln Val Arg Glu Phe Leu Gly Thr
290 295 300
Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Ser Leu Ala Ala
305 310 315 320
Pro Leu Tyr Pro Leu Thr Lys Glu Ser Ile Pro Phe Ile Trp Thr Glu
325 330 335
Glu His Gln Gln Ala Phe Asp His Ile Lys Lys Ala Leu Leu Ser Ala
340 345 350
Pro Ala Leu Ala Leu Pro Asp Leu Thr Lys Pro Phe Thr Leu Tyr Ile
355 360 365
Asp Glu Arg Ala Gly Val Ala Arg Gly Val Leu Thr Gln Thr Leu Gly
370 375 380
Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val
385 390 395 400
Ala Ser Gly Trp Pro Thr Cys Leu Lys Ala Val Ala Ala Val Ala Leu
405 410 415
Leu Leu Lys Asp Ala Asp Lys Leu Thr Leu Gly Gln Asn Val Thr Val
420 425 430
Ile Ala Ser His Ser Leu Glu Ser Ile Val Arg Gln Pro Pro Asp Arg
435 440 445
Trp Met Thr Asn Ala Arg Met Thr His Tyr Gln Ser Leu Leu Leu Asn
450 455 460
Glu Arg Val Ser Phe Ala Pro Pro Ala Val Leu Asn Pro Ala Thr Leu
465 470 475 480
Leu Pro Val Glu Ser Glu Ala Thr Pro Val His Arg Cys Ser Glu Ile
485 490 495
Leu Ala Glu Glu Thr Gly Thr Arg Arg Asp Leu Glu Asp Gln Pro Leu
500 505 510
Pro Gly Val Pro Thr Trp Tyr Thr Asp Gly Ser Ser Phe Ile Thr Glu
515 520 525
Gly Lys Arg Arg Ala Gly Ala Pro Ile Val Asp Gly Lys Arg Thr Val
530 535 540
Trp Ala Ser Ser Leu Pro Glu Gly Thr Ser Ala Gln Lys Ala Glu Leu
545 550 555 560
Val Ala Leu Thr Gln Ala Leu Arg Leu Ala Glu Gly Lys Asn Ile Asn
565 570 575
Ile Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly
580 585 590
Ala Ile Tyr Lys Gln Arg Gly Leu Leu Thr Ser Ala Gly Lys Asp Ile
595 600 605
Lys Asn Lys Glu Glu Ile Leu Ala Leu Leu Glu Ala Ile His Leu Pro
610 615 620
Arg Arg Val Ala Ile Ile His Cys Pro Gly His Gln Arg Gly Ser Asn
625 630 635 640
Pro Val Ala Thr Gly Asn Arg Arg Ala Asp Glu Ala Ala Lys Gln Ala
645 650 655
Ala Leu Ser Thr Arg Val Leu Ala Gly Thr Thr Lys Pro Gln Glu Pro
660 665 670
Ile Glu Pro Ala Gln Glu Lys Thr Arg Pro
675 680
<210> 17
<211> 761
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
sfvRT sequence
<400> 17
Met Asp Pro Leu Gln Leu Leu Gln Pro Leu Glu Ala Glu Ile Lys Gly
1 5 10 15
Thr Lys Leu Lys Ala His Trp Asp Ser Gly Ala Thr Ile Thr Cys Val
20 25 30
Pro Glu Ala Phe Leu Glu Asp Glu Arg Pro Ile Gln Thr Met Leu Ile
35 40 45
Lys Thr Ile His Gly Glu Lys Gln Gln Asp Val Tyr Tyr Leu Thr Phe
50 55 60
Lys Val Gln Gly Arg Lys Val Glu Ala Glu Val Leu Ala Ser Pro Tyr
65 70 75 80
Asp Tyr Ile Leu Leu Asn Pro Ser Asp Val Pro Trp Leu Met Lys Lys
85 90 95
Pro Leu Gln Leu Thr Val Leu Val Pro Leu His Glu Tyr Gln Glu Arg
100 105 110
Leu Leu Gln Gln Thr Ala Leu Pro Lys Glu Gln Lys Glu Leu Leu Gln
115 120 125
Lys Leu Phe Leu Lys Tyr Asp Ala Leu Trp Gln His Trp Glu Asn Gln
130 135 140
Val Gly His Arg Arg Ile Lys Pro His Asn Ile Ala Thr Gly Thr Leu
145 150 155 160
Ala Pro Arg Pro Gln Lys Gln Tyr Pro Ile Asn Pro Lys Ala Lys Pro
165 170 175
Ser Ile Gln Ile Val Ile Asp Asp Leu Leu Lys Gln Gly Val Leu Ile
180 185 190
Gln Gln Asn Ser Thr Met Asn Thr Pro Val Tyr Pro Val Pro Lys Pro
195 200 205
Asp Gly Lys Trp Arg Met Val Leu Asp Tyr Arg Glu Val Asn Lys Thr
210 215 220
Ile Pro Leu Ile Ala Ala Gln Asn Gln His Ser Ala Gly Ile Leu Ser
225 230 235 240
Ser Ile Tyr Arg Gly Lys Tyr Lys Thr Thr Leu Asp Leu Thr Asn Gly
245 250 255
Phe Trp Ala His Pro Ile Thr Pro Glu Ser Tyr Trp Leu Thr Ala Phe
260 265 270
Thr Trp Gln Gly Lys Gln Tyr Cys Trp Thr Arg Leu Pro Gln Gly Phe
275 280 285
Leu Asn Ser Pro Ala Leu Phe Thr Ala Asp Val Val Asp Leu Leu Lys
290 295 300
Glu Ile Pro Asn Val Gln Ala Tyr Val Asp Asp Ile Tyr Ile Ser His
305 310 315 320
Asp Asp Pro Gln Glu His Leu Glu Gln Leu Glu Lys Ile Phe Ser Ile
325 330 335
Leu Leu Asn Ala Gly Tyr Val Val Ser Leu Lys Lys Ser Glu Ile Ala
340 345 350
Gln Arg Glu Val Glu Phe Leu Gly Phe Asn Ile Thr Lys Glu Gly Arg
355 360 365
Gly Leu Thr Asp Thr Phe Lys Gln Lys Leu Leu Asn Ile Thr Pro Pro
370 375 380
Lys Asp Leu Lys Gln Leu Gln Ser Ile Leu Gly Leu Leu Asn Phe Ala
385 390 395 400
Arg Asn Phe Ile Pro Asn Tyr Ser Glu Leu Val Lys Pro Leu Tyr Thr
405 410 415
Ile Val Ala Asn Ala Asn Gly Lys Phe Ile Ser Trp Thr Glu Asp Asn
420 425 430
Ser Asn Gln Leu Gln His Ile Ile Ser Val Leu Asn Gln Ala Asp Asn
435 440 445
Leu Glu Glu Arg Asn Pro Glu Thr Arg Leu Ile Ile Lys Val Asn Ser
450 455 460
Ser Pro Ser Ala Gly Tyr Ile Arg Tyr Tyr Asn Glu Gly Ser Lys Arg
465 470 475 480
Pro Ile Met Tyr Val Asn Tyr Ile Phe Ser Lys Ala Glu Ala Lys Phe
485 490 495
Thr Gln Thr Glu Lys Leu Leu Thr Thr Met His Lys Gly Leu Ile Lys
500 505 510
Ala Met Asp Leu Ala Met Gly Gln Glu Ile Leu Val Tyr Ser Pro Ile
515 520 525
Val Ser Met Thr Lys Ile Gln Arg Thr Pro Leu Pro Glu Arg Lys Ala
530 535 540
Leu Pro Val Arg Trp Ile Thr Trp Met Thr Tyr Leu Glu Asp Pro Arg
545 550 555 560
Ile Gln Phe His Tyr Asp Lys Ser Leu Pro Glu Leu Gln Gln Ile Pro
565 570 575
Asn Val Thr Glu Asp Val Ile Ala Lys Thr Lys His Pro Ser Glu Phe
580 585 590
Ala Met Val Phe Tyr Thr Asp Gly Ser Ala Ile Lys His Pro Asp Val
595 600 605
Asn Lys Ser His Ser Ala Gly Met Gly Ile Ala Gln Val Gln Phe Ile
610 615 620
Pro Glu Tyr Lys Ile Val His Gln Trp Ser Ile Pro Leu Gly Asp His
625 630 635 640
Thr Ala Gln Leu Ala Glu Ile Ala Ala Val Glu Phe Ala Cys Lys Lys
645 650 655
Ala Leu Lys Ile Ser Gly Pro Val Leu Ile Val Thr Asp Ser Phe Tyr
660 665 670
Val Ala Glu Ser Ala Asn Lys Glu Leu Pro Tyr Trp Lys Ser Asn Gly
675 680 685
Phe Leu Asn Asn Lys Lys Lys Pro Leu Arg His Val Ser Lys Trp Lys
690 695 700
Ser Ile Ala Glu Cys Leu Gln Leu Lys Pro Asp Ile Ile Ile Met His
705 710 715 720
Glu Lys Gly His Gln Gln Pro Met Thr Thr Leu His Thr Glu Gly Asn
725 730 735
Asn Leu Ala Asp Lys Leu Ala Thr Gln Gly Ser Tyr Val Val His Cys
740 745 750
Asn Thr Thr Pro Ser Leu Asp Ala Glu
755 760
<210> 18
<211> 762
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
foamyRT sequence
<400> 18
Met Asn Pro Leu Gln Leu Leu Gln Pro Leu Pro Ala Glu Ile Lys Gly
1 5 10 15
Thr Lys Leu Leu Ala His Trp Asp Ser Gly Ala Thr Ile Thr Cys Ile
20 25 30
Pro Glu Ser Phe Leu Glu Asp Glu Gln Pro Ile Lys Lys Thr Leu Ile
35 40 45
Lys Thr Ile His Gly Glu Lys Gln Gln Asn Val Tyr Tyr Val Thr Phe
50 55 60
Lys Val Lys Gly Arg Lys Val Glu Ala Glu Val Ile Ala Ser Pro Tyr
65 70 75 80
Glu Tyr Ile Leu Leu Ser Pro Thr Asp Val Pro Trp Leu Thr Gln Gln
85 90 95
Pro Leu Gln Leu Thr Ile Leu Val Pro Leu Gln Glu Tyr Gln Glu Lys
100 105 110
Ile Leu Ser Lys Thr Ala Leu Pro Glu Asp Gln Lys Gln Gln Leu Lys
115 120 125
Thr Leu Phe Val Lys Tyr Asp Asn Leu Trp Gln His Trp Glu Asn Gln
130 135 140
Val Gly His Arg Lys Ile Arg Pro His Asn Ile Ala Thr Gly Asp Tyr
145 150 155 160
Pro Pro Arg Pro Gln Lys Gln Tyr Pro Ile Asn Pro Lys Ala Lys Pro
165 170 175
Ser Ile Gln Ile Val Ile Asp Asp Leu Leu Lys Gln Gly Val Leu Thr
180 185 190
Pro Gln Asn Ser Thr Met Asn Thr Pro Val Tyr Pro Val Pro Lys Pro
195 200 205
Asp Gly Arg Trp Arg Met Val Leu Asp Tyr Arg Glu Val Asn Lys Thr
210 215 220
Ile Pro Leu Thr Ala Ala Gln Asn Gln His Ser Ala Gly Ile Leu Ala
225 230 235 240
Thr Ile Val Arg Gln Lys Tyr Lys Thr Thr Leu Asp Leu Ala Asn Gly
245 250 255
Phe Trp Ala His Pro Ile Thr Pro Glu Ser Tyr Trp Leu Thr Ala Phe
260 265 270
Thr Trp Gln Gly Lys Gln Tyr Cys Trp Thr Arg Leu Pro Gln Gly Phe
275 280 285
Leu Asn Ser Pro Ala Leu Phe Thr Ala Asp Val Val Asp Leu Leu Lys
290 295 300
Glu Ile Pro Asn Val Gln Val Tyr Val Asp Asp Ile Tyr Leu Ser His
305 310 315 320
Asp Asp Pro Lys Glu His Val Gln Gln Leu Glu Lys Val Phe Gln Ile
325 330 335
Leu Leu Gln Ala Gly Tyr Val Val Ser Leu Lys Lys Ser Glu Ile Gly
340 345 350
Gln Lys Thr Val Glu Phe Leu Gly Phe Asn Ile Thr Lys Glu Gly Arg
355 360 365
Gly Leu Thr Asp Thr Phe Lys Thr Lys Leu Leu Asn Ile Thr Pro Pro
370 375 380
Lys Asp Leu Lys Gln Leu Gln Ser Ile Leu Gly Leu Leu Asn Phe Ala
385 390 395 400
Arg Asn Phe Ile Pro Asn Phe Ala Glu Leu Val Gln Pro Leu Tyr Asn
405 410 415
Leu Ile Ala Ser Ala Lys Gly Lys Tyr Ile Glu Trp Ser Glu Glu Asn
420 425 430
Thr Lys Gln Leu Asn Met Val Ile Glu Ala Leu Asn Thr Ala Ser Asn
435 440 445
Leu Glu Glu Arg Leu Pro Glu Gln Arg Leu Val Ile Lys Val Asn Thr
450 455 460
Ser Pro Ser Ala Gly Tyr Val Arg Tyr Tyr Asn Glu Thr Gly Lys Lys
465 470 475 480
Pro Ile Met Tyr Leu Asn Tyr Val Phe Ser Lys Ala Glu Leu Lys Phe
485 490 495
Ser Met Leu Glu Lys Leu Leu Thr Thr Met His Lys Ala Leu Ile Lys
500 505 510
Ala Met Asp Leu Ala Met Gly Gln Glu Ile Leu Val Tyr Ser Pro Ile
515 520 525
Val Ser Met Thr Lys Ile Gln Lys Thr Pro Leu Pro Glu Arg Lys Ala
530 535 540
Leu Pro Ile Arg Trp Ile Thr Trp Met Thr Tyr Leu Glu Asp Pro Arg
545 550 555 560
Ile Gln Phe His Tyr Asp Lys Thr Leu Pro Glu Leu Lys His Ile Pro
565 570 575
Asp Val Tyr Thr Ser Ser Gln Ser Pro Val Lys His Pro Ser Gln Tyr
580 585 590
Glu Gly Val Phe Tyr Thr Asp Gly Ser Ala Ile Lys Ser Pro Asp Pro
595 600 605
Thr Lys Ser Asn Asn Ala Gly Met Gly Ile Val His Ala Thr Tyr Lys
610 615 620
Pro Glu Tyr Gln Val Leu Asn Gln Trp Ser Ile Pro Leu Gly Asn His
625 630 635 640
Thr Ala Gln Met Ala Glu Ile Ala Ala Val Glu Phe Ala Cys Lys Lys
645 650 655
Ala Leu Lys Ile Pro Gly Pro Val Leu Val Ile Thr Asp Ser Phe Tyr
660 665 670
Val Ala Glu Ser Ala Asn Lys Glu Leu Pro Tyr Trp Lys Ser Asn Gly
675 680 685
Phe Val Asn Asn Lys Lys Lys Pro Leu Lys His Ile Ser Lys Trp Lys
690 695 700
Ser Ile Ala Glu Cys Leu Ser Met Lys Pro Asp Ile Thr Ile Gln His
705 710 715 720
Glu Lys Gly Ile Ser Leu Gln Ile Pro Val Phe Ile Leu Lys Gly Asn
725 730 735
Ala Leu Ala Asp Lys Leu Ala Thr Gln Gly Ser Tyr Val Val Asn Cys
740 745 750
Asn Thr Lys Lys Pro Asn Leu Asp Ala Glu
755 760
<210> 19
<211> 560
<212> PRT
<213> Human immunodeficiency virus
<400> 19
Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met
1 5 10 15
Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys
20 25 30
Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser
35 40 45
Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys
50 55 60
Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu
65 70 75 80
Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His
85 90 95
Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly
100 105 110
Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr
115 120 125
Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr
130 135 140
Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe
145 150 155 160
Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro
165 170 175
Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp
180 185 190
Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His
195 200 205
Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu
210 215 220
Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr
225 230 235 240
Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp
245 250 255
Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro
260 265 270
Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala
275 280 285
Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala
290 295 300
Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp
305 310 315 320
Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln
325 330 335
Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly
340 345 350
Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu
355 360 365
Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly
370 375 380
Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr
385 390 395 400
Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe
405 410 415
Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu
420 425 430
Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg
435 440 445
Glu Thr Lys Leu Gly Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln
450 455 460
Lys Val Val Thr Leu Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln
465 470 475 480
Ala Ile Tyr Leu Ala Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val
485 490 495
Thr Asp Ser Gln Tyr Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln
500 505 510
Ser Glu Ser Glu Leu Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys
515 520 525
Glu Lys Val Tyr Leu Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly
530 535 540
Asn Glu Gln Val Asp Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu
545 550 555 560
<210> 20
<211> 440
<212> PRT
<213> Human immunodeficiency virus
<400> 20
Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met
1 5 10 15
Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys
20 25 30
Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser
35 40 45
Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys
50 55 60
Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu
65 70 75 80
Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His
85 90 95
Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly
100 105 110
Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr
115 120 125
Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr
130 135 140
Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe
145 150 155 160
Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro
165 170 175
Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp
180 185 190
Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln His
195 200 205
Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu
210 215 220
Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr
225 230 235 240
Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp
245 250 255
Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro
260 265 270
Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala
275 280 285
Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala
290 295 300
Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp
305 310 315 320
Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln
325 330 335
Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly
340 345 350
Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu
355 360 365
Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly
370 375 380
Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr
385 390 395 400
Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe
405 410 415
Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu
420 425 430
Pro Ile Val Gly Ala Glu Thr Phe
435 440
<210> 21
<211> 572
<212> PRT
<213> Rous sarcoma virus
<400> 21
Thr Val Ala Leu His Leu Ala Ile Pro Leu Lys Trp Lys Pro Asp His
1 5 10 15
Thr Pro Val Trp Ile Asp Gln Trp Pro Leu Pro Glu Gly Lys Leu Val
20 25 30
Ala Leu Thr Gln Leu Val Glu Lys Glu Leu Gln Leu Gly His Ile Glu
35 40 45
Pro Ser Leu Ser Cys Trp Asn Thr Pro Val Phe Val Ile Arg Lys Ala
50 55 60
Ser Gly Ser Tyr Arg Leu Leu His Asp Leu Arg Ala Val Asn Ala Lys
65 70 75 80
Leu Val Pro Phe Gly Ala Val Gln Gln Gly Ala Pro Val Leu Ser Ala
85 90 95
Leu Pro Arg Gly Trp Pro Leu Met Val Leu Asp Leu Lys Asp Cys Phe
100 105 110
Phe Ser Ile Pro Leu Ala Glu Gln Asp Arg Glu Ala Phe Ala Phe Thr
115 120 125
Leu Pro Ser Val Asn Asn Gln Ala Pro Ala Arg Arg Phe Gln Trp Lys
130 135 140
Val Leu Pro Gln Gly Met Thr Cys Ser Pro Thr Ile Cys Gln Leu Val
145 150 155 160
Val Gly Gln Val Leu Glu Pro Leu Arg Leu Lys His Pro Ser Leu Cys
165 170 175
Met Leu His Tyr Met Asp Asp Leu Leu Leu Ala Ala Ser Ser His Asp
180 185 190
Gly Leu Glu Ala Ala Gly Glu Glu Val Ile Ser Thr Leu Glu Arg Ala
195 200 205
Gly Phe Thr Ile Ser Pro Asp Lys Val Gln Arg Glu Pro Gly Val Gln
210 215 220
Tyr Leu Gly Tyr Lys Leu Gly Ser Thr Tyr Val Ala Pro Val Gly Leu
225 230 235 240
Val Ala Glu Pro Arg Ile Ala Thr Leu Trp Asp Val Gln Lys Leu Val
245 250 255
Gly Ser Leu Gln Trp Leu Arg Pro Ala Leu Gly Ile Pro Pro Arg Leu
260 265 270
Met Gly Pro Phe Tyr Glu Gln Leu Arg Gly Ser Asp Pro Asn Glu Ala
275 280 285
Arg Glu Trp Asn Leu Asp Met Lys Met Ala Trp Arg Glu Ile Val Arg
290 295 300
Leu Ser Thr Thr Ala Ala Leu Glu Arg Trp Asp Pro Ala Leu Pro Leu
305 310 315 320
Glu Gly Ala Val Ala Arg Cys Glu Gln Gly Ala Ile Gly Val Leu Gly
325 330 335
Gln Gly Leu Ser Thr His Pro Arg Pro Cys Leu Trp Leu Phe Ser Thr
340 345 350
Gln Pro Thr Lys Ala Phe Thr Ala Trp Leu Glu Val Leu Thr Leu Leu
355 360 365
Ile Thr Lys Leu Arg Ala Ser Ala Val Arg Thr Phe Gly Lys Glu Val
370 375 380
Asp Ile Leu Leu Leu Pro Ala Cys Phe Arg Glu Asp Leu Pro Leu Pro
385 390 395 400
Glu Gly Ile Leu Leu Ala Leu Lys Gly Phe Ala Gly Lys Ile Arg Ser
405 410 415
Ser Asp Thr Pro Ser Ile Phe Asp Ile Ala Arg Pro Leu His Val Ser
420 425 430
Leu Lys Val Arg Val Thr Asp His Pro Val Pro Gly Pro Thr Val Phe
435 440 445
Thr Asp Ala Ser Ser Ser Thr His Lys Gly Val Val Val Trp Arg Glu
450 455 460
Gly Pro Arg Trp Glu Ile Lys Glu Ile Ala Asp Leu Gly Ala Ser Val
465 470 475 480
Gln Gln Leu Glu Ala Arg Ala Val Ala Met Ala Leu Leu Leu Trp Pro
485 490 495
Thr Thr Pro Thr Asn Val Val Thr Asp Ser Ala Phe Val Ala Lys Met
500 505 510
Leu Leu Lys Met Gly Gln Glu Gly Val Pro Ser Thr Ala Ala Ala Phe
515 520 525
Ile Leu Glu Asp Ala Leu Ser Gln Arg Ser Ala Met Ala Ala Val Leu
530 535 540
His Val Arg Ser His Ser Glu Val Pro Gly Phe Phe Thr Glu Gly Asn
545 550 555 560
Asp Val Ala Asp Ser Gln Ala Thr Phe Gln Ala Tyr
565 570
<210> 22
<211> 859
<212> PRT
<213> Rous sarcoma virus
<400> 22
Thr Val Ala Leu His Leu Ala Ile Pro Leu Lys Trp Lys Pro Asp His
1 5 10 15
Thr Pro Val Trp Ile Asp Gln Trp Pro Leu Pro Glu Gly Lys Leu Val
20 25 30
Ala Leu Thr Gln Leu Val Glu Lys Glu Leu Gln Leu Gly His Ile Glu
35 40 45
Pro Ser Leu Ser Cys Trp Asn Thr Pro Val Phe Val Ile Arg Lys Ala
50 55 60
Ser Gly Ser Tyr Arg Leu Leu His Asp Leu Arg Ala Val Asn Ala Lys
65 70 75 80
Leu Val Pro Phe Gly Ala Val Gln Gln Gly Ala Pro Val Leu Ser Ala
85 90 95
Leu Pro Arg Gly Trp Pro Leu Met Val Leu Asp Leu Lys Asp Cys Phe
100 105 110
Phe Ser Ile Pro Leu Ala Glu Gln Asp Arg Glu Ala Phe Ala Phe Thr
115 120 125
Leu Pro Ser Val Asn Asn Gln Ala Pro Ala Arg Arg Phe Gln Trp Lys
130 135 140
Val Leu Pro Gln Gly Met Thr Cys Ser Pro Thr Ile Cys Gln Leu Val
145 150 155 160
Val Gly Gln Val Leu Glu Pro Leu Arg Leu Lys His Pro Ser Leu Cys
165 170 175
Met Leu His Tyr Met Asp Asp Leu Leu Leu Ala Ala Ser Ser His Asp
180 185 190
Gly Leu Glu Ala Ala Gly Glu Glu Val Ile Ser Thr Leu Glu Arg Ala
195 200 205
Gly Phe Thr Ile Ser Pro Asp Lys Val Gln Arg Glu Pro Gly Val Gln
210 215 220
Tyr Leu Gly Tyr Lys Leu Gly Ser Thr Tyr Val Ala Pro Val Gly Leu
225 230 235 240
Val Ala Glu Pro Arg Ile Ala Thr Leu Trp Asp Val Gln Lys Leu Val
245 250 255
Gly Ser Leu Gln Trp Leu Arg Pro Ala Leu Gly Ile Pro Pro Arg Leu
260 265 270
Met Gly Pro Phe Tyr Glu Gln Leu Arg Gly Ser Asp Pro Asn Glu Ala
275 280 285
Arg Glu Trp Asn Leu Asp Met Lys Met Ala Trp Arg Glu Ile Val Arg
290 295 300
Leu Ser Thr Thr Ala Ala Leu Glu Arg Trp Asp Pro Ala Leu Pro Leu
305 310 315 320
Glu Gly Ala Val Ala Arg Cys Glu Gln Gly Ala Ile Gly Val Leu Gly
325 330 335
Gln Gly Leu Ser Thr His Pro Arg Pro Cys Leu Trp Leu Phe Ser Thr
340 345 350
Gln Pro Thr Lys Ala Phe Thr Ala Trp Leu Glu Val Leu Thr Leu Leu
355 360 365
Ile Thr Lys Leu Arg Ala Ser Ala Val Arg Thr Phe Gly Lys Glu Val
370 375 380
Asp Ile Leu Leu Leu Pro Ala Cys Phe Arg Glu Asp Leu Pro Leu Pro
385 390 395 400
Glu Gly Ile Leu Leu Ala Leu Lys Gly Phe Ala Gly Lys Ile Arg Ser
405 410 415
Ser Asp Thr Pro Ser Ile Phe Asp Ile Ala Arg Pro Leu His Val Ser
420 425 430
Leu Lys Val Arg Val Thr Asp His Pro Val Pro Gly Pro Thr Val Phe
435 440 445
Thr Asp Ala Ser Ser Ser Thr His Lys Gly Val Val Val Trp Arg Glu
450 455 460
Gly Pro Arg Trp Glu Ile Lys Glu Ile Ala Asp Leu Gly Ala Ser Val
465 470 475 480
Gln Gln Leu Glu Ala Arg Ala Val Ala Met Ala Leu Leu Leu Trp Pro
485 490 495
Thr Thr Pro Thr Asn Val Val Thr Asp Ser Ala Phe Val Ala Lys Met
500 505 510
Leu Leu Lys Met Gly Gln Glu Gly Val Pro Ser Thr Ala Ala Ala Phe
515 520 525
Ile Leu Glu Asp Ala Leu Ser Gln Arg Ser Ala Met Ala Ala Val Leu
530 535 540
His Val Arg Ser His Ser Glu Val Pro Gly Phe Phe Thr Glu Gly Asn
545 550 555 560
Asp Val Ala Asp Ser Gln Ala Thr Phe Gln Ala Tyr Pro Leu Arg Glu
565 570 575
Ala Lys Asp Leu His Thr Ala Leu His Ile Gly Pro Arg Ala Leu Ser
580 585 590
Lys Ala Cys Asn Ile Ser Met Gln Gln Ala Arg Glu Val Val Gln Thr
595 600 605
Cys Pro His Cys Asn Ser Ala Pro Ala Leu Glu Ala Gly Val Asn Pro
610 615 620
Arg Gly Leu Gly Pro Leu Gln Ile Trp Gln Thr Asp Phe Thr Leu Glu
625 630 635 640
Pro Arg Met Ala Pro Arg Ser Trp Leu Ala Val Thr Val Asp Thr Ala
645 650 655
Ser Ser Ala Ile Val Val Thr Gln His Gly Arg Val Thr Ser Val Ala
660 665 670
Val Gln His His Trp Ala Thr Ala Ile Ala Val Leu Gly Arg Pro Lys
675 680 685
Ala Ile Lys Thr Asp Asn Gly Ser Cys Phe Thr Ser Lys Ser Thr Arg
690 695 700
Glu Trp Leu Ala Arg Trp Gly Ile Ala His Thr Thr Gly Ile Pro Gly
705 710 715 720
Asn Ser Gln Gly Gln Ala Met Val Glu Arg Ala Asn Arg Leu Leu Lys
725 730 735
Asp Arg Ile Arg Val Leu Ala Glu Gly Asp Gly Phe Met Lys Arg Ile
740 745 750
Pro Thr Ser Lys Gln Gly Glu Leu Leu Ala Lys Ala Met Tyr Ala Leu
755 760 765
Asn His Phe Glu Arg Gly Glu Asn Thr Lys Thr Pro Ile Gln Lys His
770 775 780
Trp Arg Pro Thr Val Leu Thr Glu Gly Pro Pro Val Lys Ile Arg Ile
785 790 795 800
Glu Thr Gly Glu Trp Glu Lys Gly Trp Asn Val Leu Val Trp Gly Arg
805 810 815
Gly Tyr Ala Ala Val Lys Asn Arg Asp Thr Asp Lys Val Ile Trp Val
820 825 830
Pro Ser Arg Lys Val Lys Pro Asp Ile Thr Gln Lys Asp Glu Val Thr
835 840 845
Lys Lys Asp Glu Ala Ser Pro Leu Phe Ala Gly
850 855
<210> 23
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 23
Leu Glu Ile Arg Ala Ala Phe Leu Arg Gln Arg Asn Thr Ala Leu Arg
1 5 10 15
Thr Glu Val Ala Glu Leu Glu Gln Glu Val Gln Arg Leu Glu Asn Glu
20 25 30
Val Ser Gln Tyr Glu Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys
35 40 45
<210> 24
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Leu Glu Ile Glu Ala Ala Phe Leu Glu Arg Glu Asn Thr Ala Leu Glu
1 5 10 15
Thr Arg Val Ala Glu Leu Arg Gln Arg Val Gln Arg Leu Arg Asn Arg
20 25 30
Val Ser Gln Tyr Arg Thr Arg Tyr Gly Pro Leu Gly Gly Gly Lys
35 40 45
<210> 25
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 25
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 60
aatgggacac ag 72
<210> 26
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 26
gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgaa ggcgagggcg 120
atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgccggtgc 180
cctggcccac cctcgtgacc accctgacat acggcgtgca gtgcttcacc ctcgtgacca 240
ccctgaggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac atgcttcggc 300
atggcgaatg ggacacag 318
<210> 27
<211> 866
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 27
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly
20 25 30
Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile
35 40 45
Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr
50 55 60
Cys Ser Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys
65 70 75 80
Val Glu Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu
85 90 95
Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys
100 105 110
Ala Met Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile
115 120 125
Ala Ala Asn Ser Gly Ile Tyr Ser Gly Gly Ser Ser Gly Gly Ser Ser
130 135 140
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
145 150 155 160
Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr
165 170 175
Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr
180 185 190
Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly
195 200 205
Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser
210 215 220
Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
225 230 235 240
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val
245 250 255
Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro
260 265 270
Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys
275 280 285
Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu
290 295 300
Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys
305 310 315 320
Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe
325 330 335
Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr
340 345 350
Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn
355 360 365
Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp
370 375 380
Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser
385 390 395 400
Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly
405 410 415
Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys
420 425 430
Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu
435 440 445
Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr
450 455 460
Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
465 470 475 480
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr
485 490 495
Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr
500 505 510
Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro
515 520 525
Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr
530 535 540
Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val
545 550 555 560
Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro
565 570 575
Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly
580 585 590
Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val
595 600 605
Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg
610 615 620
Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe
625 630 635 640
Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu
645 650 655
Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly
660 665 670
Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr
675 680 685
Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala
690 695 700
Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu
705 710 715 720
Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln
725 730 735
Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser
740 745 750
Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg
755 760 765
Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu
770 775 780
Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile
785 790 795 800
Ile His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg Gly
805 810 815
Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr
820 825 830
Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly
835 840 845
Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg
850 855 860
Lys Val
865
<210> 28
<211> 157
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 28
gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat 120
cacccatgtg caccctgaca tacggcgtgc agtgctt 157
<210> 29
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat 120
cacccatgtg cgcgcacatg aggatcaccc atgtgcaccc tgacatacgg cgtgcagtgc 180
tt 182
<210> 30
<211> 166
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 30
gctgaagcac tgcacgccat gtttaagagc tatgctggaa acagcatagc aagtttaaat 60
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggcc aacatgagga 120
tcacccatgt ctgcagggcc accctgacat acggcgtgca gtgctt 166
<210> 31
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 31
gctgaagcac tgcacgccat gttttagagc taggccaaca tgaggatcac ccatgtctgc 60
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttggccaaca tgaggatcac 120
ccatgtctgc agggccaagt ggcaccgagt cggtgcaccc tgacatacgg cgtgcagtgc 180
tt 182
<210> 32
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 32
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 33
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<400> 33
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 34
<211> 984
<212> PRT
<213> Campylobacter jejuni
<400> 34
Met Ala Arg Ile Leu Ala Phe Asp Ile Gly Ile Ser Ser Ile Gly Trp
1 5 10 15
Ala Phe Ser Glu Asn Asp Glu Leu Lys Asp Cys Gly Val Arg Ile Phe
20 25 30
Thr Lys Val Glu Asn Pro Lys Thr Gly Glu Ser Leu Ala Leu Pro Arg
35 40 45
Arg Leu Ala Arg Ser Ala Arg Lys Arg Leu Ala Arg Arg Lys Ala Arg
50 55 60
Leu Asn His Leu Lys His Leu Ile Ala Asn Glu Phe Lys Leu Asn Tyr
65 70 75 80
Glu Asp Tyr Gln Ser Phe Asp Glu Ser Leu Ala Lys Ala Tyr Lys Gly
85 90 95
Ser Leu Ile Ser Pro Tyr Glu Leu Arg Phe Arg Ala Leu Asn Glu Leu
100 105 110
Leu Ser Lys Gln Asp Phe Ala Arg Val Ile Leu His Ile Ala Lys Arg
115 120 125
Arg Gly Tyr Asp Asp Ile Lys Asn Ser Asp Asp Lys Glu Lys Gly Ala
130 135 140
Ile Leu Lys Ala Ile Lys Gln Asn Glu Glu Lys Leu Ala Asn Tyr Gln
145 150 155 160
Ser Val Gly Glu Tyr Leu Tyr Lys Glu Tyr Phe Gln Lys Phe Lys Glu
165 170 175
Asn Ser Lys Glu Phe Thr Asn Val Arg Asn Lys Lys Glu Ser Tyr Glu
180 185 190
Arg Cys Ile Ala Gln Ser Phe Leu Lys Asp Glu Leu Lys Leu Ile Phe
195 200 205
Lys Lys Gln Arg Glu Phe Gly Phe Ser Phe Ser Lys Lys Phe Glu Glu
210 215 220
Glu Val Leu Ser Val Ala Phe Tyr Lys Arg Ala Leu Lys Asp Phe Ser
225 230 235 240
His Leu Val Gly Asn Cys Ser Phe Phe Thr Asp Glu Lys Arg Ala Pro
245 250 255
Lys Asn Ser Pro Leu Ala Phe Met Phe Val Ala Leu Thr Arg Ile Ile
260 265 270
Asn Leu Leu Asn Asn Leu Lys Asn Thr Glu Gly Ile Leu Tyr Thr Lys
275 280 285
Asp Asp Leu Asn Ala Leu Leu Asn Glu Val Leu Lys Asn Gly Thr Leu
290 295 300
Thr Tyr Lys Gln Thr Lys Lys Leu Leu Gly Leu Ser Asp Asp Tyr Glu
305 310 315 320
Phe Lys Gly Glu Lys Gly Thr Tyr Phe Ile Glu Phe Lys Lys Tyr Lys
325 330 335
Glu Phe Ile Lys Ala Leu Gly Glu His Asn Leu Ser Gln Asp Asp Leu
340 345 350
Asn Glu Ile Ala Lys Asp Ile Thr Leu Ile Lys Asp Glu Ile Lys Leu
355 360 365
Lys Lys Ala Leu Ala Lys Tyr Asp Leu Asn Gln Asn Gln Ile Asp Ser
370 375 380
Leu Ser Lys Leu Glu Phe Lys Asp His Leu Asn Ile Ser Phe Lys Ala
385 390 395 400
Leu Lys Leu Val Thr Pro Leu Met Leu Glu Gly Lys Lys Tyr Asp Glu
405 410 415
Ala Cys Asn Glu Leu Asn Leu Lys Val Ala Ile Asn Glu Asp Lys Lys
420 425 430
Asp Phe Leu Pro Ala Phe Asn Glu Thr Tyr Tyr Lys Asp Glu Val Thr
435 440 445
Asn Pro Val Val Leu Arg Ala Ile Lys Glu Tyr Arg Lys Val Leu Asn
450 455 460
Ala Leu Leu Lys Lys Tyr Gly Lys Val His Lys Ile Asn Ile Glu Leu
465 470 475 480
Ala Arg Glu Val Gly Lys Asn His Ser Gln Arg Ala Lys Ile Glu Lys
485 490 495
Glu Gln Asn Glu Asn Tyr Lys Ala Lys Lys Asp Ala Glu Leu Glu Cys
500 505 510
Glu Lys Leu Gly Leu Lys Ile Asn Ser Lys Asn Ile Leu Lys Leu Arg
515 520 525
Leu Phe Lys Glu Gln Lys Glu Phe Cys Ala Tyr Ser Gly Glu Lys Ile
530 535 540
Lys Ile Ser Asp Leu Gln Asp Glu Lys Met Leu Glu Ile Asp His Ile
545 550 555 560
Tyr Pro Tyr Ser Arg Ser Phe Asp Asp Ser Tyr Met Asn Lys Val Leu
565 570 575
Val Phe Thr Lys Gln Asn Gln Glu Lys Leu Asn Gln Thr Pro Phe Glu
580 585 590
Ala Phe Gly Asn Asp Ser Ala Lys Trp Gln Lys Ile Glu Val Leu Ala
595 600 605
Lys Asn Leu Pro Thr Lys Lys Gln Lys Arg Ile Leu Asp Lys Asn Tyr
610 615 620
Lys Asp Lys Glu Gln Lys Asn Phe Lys Asp Arg Asn Leu Asn Asp Thr
625 630 635 640
Arg Tyr Ile Ala Arg Leu Val Leu Asn Tyr Thr Lys Asp Tyr Leu Asp
645 650 655
Phe Leu Pro Leu Ser Asp Asp Glu Asn Thr Lys Leu Asn Asp Thr Gln
660 665 670
Lys Gly Ser Lys Val His Val Glu Ala Lys Ser Gly Met Leu Thr Ser
675 680 685
Ala Leu Arg His Thr Trp Gly Phe Ser Ala Lys Asp Arg Asn Asn His
690 695 700
Leu His His Ala Ile Asp Ala Val Ile Ile Ala Tyr Ala Asn Asn Ser
705 710 715 720
Ile Val Lys Ala Phe Ser Asp Phe Lys Lys Glu Gln Glu Ser Asn Ser
725 730 735
Ala Glu Leu Tyr Ala Lys Lys Ile Ser Glu Leu Asp Tyr Lys Asn Lys
740 745 750
Arg Lys Phe Phe Glu Pro Phe Ser Gly Phe Arg Gln Lys Val Leu Asp
755 760 765
Lys Ile Asp Glu Ile Phe Val Ser Lys Pro Glu Arg Lys Lys Pro Ser
770 775 780
Gly Ala Leu His Glu Glu Thr Phe Arg Lys Glu Glu Glu Phe Tyr Gln
785 790 795 800
Ser Tyr Gly Gly Lys Glu Gly Val Leu Lys Ala Leu Glu Leu Gly Lys
805 810 815
Ile Arg Lys Val Asn Gly Lys Ile Val Lys Asn Gly Asp Met Phe Arg
820 825 830
Val Asp Ile Phe Lys His Lys Lys Thr Asn Lys Phe Tyr Ala Val Pro
835 840 845
Ile Tyr Thr Met Asp Phe Ala Leu Lys Val Leu Pro Asn Lys Ala Val
850 855 860
Ala Arg Ser Lys Lys Gly Glu Ile Lys Asp Trp Ile Leu Met Asp Glu
865 870 875 880
Asn Tyr Glu Phe Cys Phe Ser Leu Tyr Lys Asp Ser Leu Ile Leu Ile
885 890 895
Gln Thr Lys Asp Met Gln Glu Pro Glu Phe Val Tyr Tyr Asn Ala Phe
900 905 910
Thr Ser Ser Thr Val Ser Leu Ile Val Ser Lys His Asp Asn Lys Phe
915 920 925
Glu Thr Leu Ser Lys Asn Gln Lys Ile Leu Phe Lys Asn Ala Asn Glu
930 935 940
Lys Glu Val Ile Ala Lys Ser Ile Gly Ile Gln Asn Leu Lys Val Phe
945 950 955 960
Glu Lys Tyr Ile Val Ser Ala Leu Gly Glu Val Thr Lys Ala Glu Phe
965 970 975
Arg Gln Arg Glu Asp Phe Lys Lys
980
<210> 35
<211> 1087
<212> PRT
<213> Geobacilus stereothermophilus
<400> 35
Met Arg Tyr Lys Ile Gly Leu Asp Ile Gly Ile Thr Ser Val Gly Trp
1 5 10 15
Ala Val Met Asn Leu Asp Ile Pro Arg Ile Glu Asp Leu Gly Val Arg
20 25 30
Ile Phe Asp Arg Ala Glu Asn Pro Gln Thr Gly Glu Ser Leu Ala Leu
35 40 45
Pro Arg Arg Leu Ala Arg Ser Ala Arg Arg Arg Leu Arg Arg Arg Lys
50 55 60
His Arg Leu Glu Arg Ile Arg Arg Leu Val Ile Arg Glu Gly Ile Leu
65 70 75 80
Thr Lys Glu Glu Leu Asp Lys Leu Phe Glu Glu Lys His Glu Ile Asp
85 90 95
Val Trp Gln Leu Arg Val Glu Ala Leu Asp Arg Lys Leu Asn Asn Asp
100 105 110
Glu Leu Ala Arg Val Leu Leu His Leu Ala Lys Arg Arg Gly Phe Lys
115 120 125
Ser Asn Arg Lys Ser Glu Arg Ser Asn Lys Glu Asn Ser Thr Met Leu
130 135 140
Lys His Ile Glu Glu Asn Arg Ala Ile Leu Ser Ser Tyr Arg Thr Val
145 150 155 160
Gly Glu Met Ile Val Lys Asp Pro Lys Phe Ala Leu His Lys Arg Asn
165 170 175
Lys Gly Glu Asn Tyr Thr Asn Thr Ile Ala Arg Asp Asp Leu Glu Arg
180 185 190
Glu Ile Arg Leu Ile Phe Ser Lys Gln Arg Glu Phe Gly Asn Met Ser
195 200 205
Cys Thr Glu Glu Phe Glu Asn Glu Tyr Ile Thr Ile Trp Ala Ser Gln
210 215 220
Arg Pro Val Ala Ser Lys Asp Asp Ile Glu Lys Lys Val Gly Phe Cys
225 230 235 240
Thr Phe Glu Pro Lys Glu Lys Arg Ala Pro Lys Ala Thr Tyr Thr Phe
245 250 255
Gln Ser Phe Ile Ala Trp Glu His Ile Asn Lys Leu Arg Leu Ile Ser
260 265 270
Pro Ser Gly Ala Arg Gly Leu Thr Asp Glu Glu Arg Arg Leu Leu Tyr
275 280 285
Glu Gln Ala Phe Gln Lys Asn Lys Ile Thr Tyr His Asp Ile Arg Thr
290 295 300
Leu Leu His Leu Pro Asp Asp Thr Tyr Phe Lys Gly Ile Val Tyr Asp
305 310 315 320
Arg Gly Glu Ser Arg Lys Gln Asn Glu Asn Ile Arg Phe Leu Glu Leu
325 330 335
Asp Ala Tyr His Gln Ile Arg Lys Ala Val Asp Lys Val Tyr Gly Lys
340 345 350
Gly Lys Ser Ser Ser Phe Leu Pro Ile Asp Phe Asp Thr Phe Gly Tyr
355 360 365
Ala Leu Thr Leu Phe Lys Asp Asp Ala Asp Ile His Ser Tyr Leu Arg
370 375 380
Asn Glu Tyr Glu Gln Asn Gly Lys Arg Met Pro Asn Leu Ala Asn Lys
385 390 395 400
Val Tyr Asp Asn Glu Leu Ile Glu Glu Leu Leu Asn Leu Ser Phe Thr
405 410 415
Lys Phe Gly His Leu Ser Leu Lys Ala Leu Arg Ser Ile Leu Pro Tyr
420 425 430
Met Glu Gln Gly Glu Val Tyr Ser Ser Ala Cys Glu Arg Ala Gly Tyr
435 440 445
Thr Phe Thr Gly Pro Lys Lys Lys Gln Lys Thr Met Leu Leu Pro Asn
450 455 460
Ile Pro Pro Ile Ala Asn Pro Val Val Met Arg Ala Leu Thr Gln Ala
465 470 475 480
Arg Lys Val Val Asn Ala Ile Ile Lys Lys Tyr Gly Ser Pro Val Ser
485 490 495
Ile His Ile Glu Leu Ala Arg Asp Leu Ser Gln Thr Phe Asp Glu Arg
500 505 510
Arg Lys Thr Lys Lys Glu Gln Asp Glu Asn Arg Lys Lys Asn Glu Thr
515 520 525
Ala Ile Arg Gln Leu Met Glu Tyr Gly Leu Thr Leu Asn Pro Thr Gly
530 535 540
His Asp Ile Val Lys Phe Lys Leu Trp Ser Glu Gln Asn Gly Arg Cys
545 550 555 560
Ala Tyr Ser Leu Gln Pro Ile Glu Ile Glu Arg Leu Leu Glu Pro Gly
565 570 575
Tyr Val Glu Val Asp His Val Ile Pro Tyr Ser Arg Ser Leu Asp Asp
580 585 590
Ser Tyr Thr Asn Lys Val Leu Val Leu Thr Arg Glu Asn Arg Glu Lys
595 600 605
Gly Asn Arg Ile Pro Ala Glu Tyr Leu Gly Val Gly Thr Glu Arg Trp
610 615 620
Gln Gln Phe Glu Thr Phe Val Leu Thr Asn Lys Gln Phe Ser Lys Lys
625 630 635 640
Lys Arg Asp Arg Leu Leu Arg Leu His Tyr Asp Glu Asn Glu Glu Thr
645 650 655
Glu Phe Lys Asn Arg Asn Leu Asn Asp Thr Arg Tyr Ile Ser Arg Phe
660 665 670
Phe Ala Asn Phe Ile Arg Glu His Leu Lys Phe Ala Glu Ser Asp Asp
675 680 685
Lys Gln Lys Val Tyr Thr Val Asn Gly Arg Val Thr Ala His Leu Arg
690 695 700
Ser Arg Trp Glu Phe Asn Lys Asn Arg Glu Glu Ser Asp Leu His His
705 710 715 720
Ala Val Asp Ala Ala Ile Val Ala Cys Thr Thr Pro Ser Asp Ile Ala
725 730 735
Lys Val Thr Ala Phe Tyr Gln Arg Arg Glu Gln Asn Lys Glu Leu Ala
740 745 750
Lys Lys Thr Glu Pro His Phe Pro Gln Pro Trp Pro His Phe Ala Asp
755 760 765
Glu Leu Arg Ala Arg Leu Ser Lys His Pro Lys Glu Ser Ile Lys Ala
770 775 780
Leu Asn Leu Gly Asn Tyr Asp Asp Gln Lys Leu Glu Ser Leu Gln Pro
785 790 795 800
Val Phe Val Ser Arg Met Pro Lys Arg Ser Val Thr Gly Ala Ala His
805 810 815
Gln Glu Thr Leu Arg Arg Tyr Val Gly Ile Asp Glu Arg Ser Gly Lys
820 825 830
Ile Gln Thr Val Val Lys Thr Lys Leu Ser Glu Ile Lys Leu Asp Ala
835 840 845
Ser Gly His Phe Pro Met Tyr Gly Lys Glu Ser Asp Pro Arg Thr Tyr
850 855 860
Glu Ala Ile Arg Gln Arg Leu Leu Glu His Asn Asn Asp Pro Lys Lys
865 870 875 880
Ala Phe Gln Glu Pro Leu Tyr Lys Pro Lys Lys Asn Gly Glu Pro Gly
885 890 895
Pro Val Ile Arg Thr Val Lys Ile Ile Asp Thr Lys Asn Gln Val Ile
900 905 910
Pro Leu Asn Asp Gly Lys Thr Val Ala Tyr Asn Ser Asn Ile Val Arg
915 920 925
Val Asp Val Phe Glu Lys Asp Gly Lys Tyr Tyr Cys Val Pro Val Tyr
930 935 940
Thr Met Asp Ile Met Lys Gly Ile Leu Pro Asn Lys Ala Ile Glu Pro
945 950 955 960
Asn Lys Pro Tyr Ser Glu Trp Lys Glu Met Thr Glu Asp Tyr Thr Phe
965 970 975
Arg Phe Ser Leu Tyr Pro Asn Asp Leu Ile Arg Ile Glu Leu Pro Arg
980 985 990
Glu Lys Thr Val Lys Thr Ala Ala Gly Glu Glu Ile Asn Val Lys Asp
995 1000 1005
Val Phe Val Tyr Tyr Lys Thr Ile Asp Ser Ala Asn Gly Gly Leu
1010 1015 1020
Glu Leu Ile Ser His Asp His Arg Phe Ser Leu Arg Gly Val Gly
1025 1030 1035
Ser Arg Thr Leu Lys Arg Phe Glu Lys Tyr Gln Val Asp Val Leu
1040 1045 1050
Gly Asn Ile Tyr Lys Val Arg Gly Glu Lys Arg Val Gly Leu Ala
1055 1060 1065
Ser Ser Ala His Ser Lys Thr Gly Glu Thr Val Arg Pro Leu Gln
1070 1075 1080
Ser Thr Arg Asp
1085
<210> 36
<211> 1052
<212> PRT
<213> Haemophilus parainfluenzae
<400> 36
Met Glu Asn Lys Asn Leu His Tyr Ile Leu Gly Leu Asp Leu Gly Ile
1 5 10 15
Ala Ser Val Gly Trp Ala Val Val Glu Ile Asp Glu Lys Glu Asn Pro
20 25 30
Leu Arg Leu Ile Asp Val Gly Val Arg Thr Phe Glu Arg Ala Glu Thr
35 40 45
Gln Lys Gly Glu Ser Leu Ala Leu Ser Arg Arg Ser Ala Arg Ser Ala
50 55 60
Arg Arg Leu Thr Gln Arg Arg Val Ala Arg Leu Lys Lys Ala Lys Arg
65 70 75 80
Leu Leu Lys Ser Glu Asn Ile Leu Leu Ser Thr Asp Glu Arg Leu Pro
85 90 95
His Gln Val Trp Gln Leu Arg Val Glu Gly Leu Asp Arg Lys Leu Glu
100 105 110
Arg Gln Glu Trp Ala Ala Val Leu Leu His Leu Ile Lys His Arg Gly
115 120 125
Tyr Leu Ser Gln Arg Lys Asn Glu Ser Lys Ser Glu Asn Lys Glu Leu
130 135 140
Gly Ala Leu Leu Ser Gly Val Ala Ser Asn His Glu Leu Leu Gln Gln
145 150 155 160
Ala Thr Tyr Arg Thr Pro Ala Glu Leu Ala Val Lys Lys Phe Glu Val
165 170 175
Glu Glu Gly His Ile Arg Asn Gln Gln Gly Ala Tyr Thr His Thr Phe
180 185 190
Ser Arg Leu Asp Leu Leu Ala Glu Met Glu Leu Leu Phe Ser Arg Gln
195 200 205
Gln His Phe Gly Asn Pro Phe Ala Ser Glu Lys Leu Leu Glu Asn Leu
210 215 220
Thr Ala Leu Leu Met Trp Gln Lys Pro Ala Leu Ser Gly Glu Asp Ile
225 230 235 240
Leu Lys Met Leu Gly Lys Cys Thr Phe Glu Asp Glu Tyr Lys Ala Ala
245 250 255
Lys Asn Thr Tyr Thr Ala Glu Arg Phe Val Trp Ile Thr Lys Leu Asn
260 265 270
Asn Leu Arg Ile Gln Glu Asn Gly Leu Glu Arg Ala Leu Ser Asp Asn
275 280 285
Glu Arg Leu Met Leu Ile Glu Gln Pro Tyr Glu Lys Ala Lys Leu Thr
290 295 300
Tyr Ala Gln Val Arg Ser Ile Leu Asn Leu Ser Asp Asp Ala Ile Phe
305 310 315 320
Lys Gly Val Arg Tyr Ser Gly Glu Asp Lys Lys Ala Ile Glu Thr Lys
325 330 335
Thr Thr Leu Met Glu Met Lys Ala Tyr His Gln Ile Arg Lys Val Leu
340 345 350
Glu Gly Asn Asn Leu Lys Ala Glu Trp Val Ala Leu Lys Ala Asn Pro
355 360 365
Thr Leu Leu Asp Glu Ile Gly Thr Ala Phe Ser Leu Tyr Lys Thr Asp
370 375 380
Glu Asp Ile Ser Ala Tyr Leu Ala Gly Lys Leu Ser Gln Pro Val Leu
385 390 395 400
Asn Ala Leu Leu Glu Asn Leu Ser Phe Asp Lys Phe Ile Gln Leu Ser
405 410 415
Leu Lys Ala Leu Tyr Lys Leu Leu Pro Leu Met Gln Gln Gly Leu Arg
420 425 430
Tyr Asp Glu Ala Cys Arg Glu Ile Tyr Gly Asp His Tyr Gly Lys Lys
435 440 445
Thr Glu Glu Thr His His Phe Leu Pro Gln Ile Pro Ala Asp Glu Ile
450 455 460
Arg Asn Pro Val Val Leu Arg Thr Leu Thr Gln Ala Arg Lys Val Ile
465 470 475 480
Asn Gly Val Val Arg Leu Tyr Gly Ser Pro Ala Arg Ile His Ile Glu
485 490 495
Thr Gly Arg Glu Val Gly Lys Ser Tyr Lys Asp Arg His Glu Leu Lys
500 505 510
Lys Arg Gln Glu Glu Asn Arg Lys Gln Arg Glu Lys Thr Ile Ser Glu
515 520 525
Ile Lys Thr Leu Phe Pro Asn Phe Ser Gly Glu Pro Lys Gly Lys Asp
530 535 540
Ile Leu Lys Met Arg Leu Tyr Tyr Gln Gln Asn Ala Lys Cys Leu Tyr
545 550 555 560
Ser Gly Lys Pro Leu Glu Leu His Arg Leu Phe Glu Gln Lys Tyr Val
565 570 575
Glu Val Asp His Ala Leu Pro Leu Ser Arg Thr Trp Asp Asp Ser Phe
580 585 590
Asn Asn Lys Val Leu Val Leu Ala Asn Glu Asn Gln Asn Lys Gly Asn
595 600 605
Leu Thr Pro Phe Glu Trp Leu Asp Gly Lys Asn Asn Ser Glu Arg Trp
610 615 620
Arg Thr Phe Lys Ala Leu Val Glu Thr Ser Ala Phe Pro Tyr Ala Lys
625 630 635 640
Lys Gln Arg Ile Leu Ser Gln Lys Leu Asp Glu Lys Gly Phe Ile Glu
645 650 655
Arg Asn Leu Asn Asp Thr Arg Tyr Val Ala Arg Phe Leu Cys Asn Phe
660 665 670
Ile Ala Asp Asn Met His Leu Thr Gly Glu Gly Lys Arg Lys Val Phe
675 680 685
Ala Ser Asn Gly Gln Ile Thr Ala Leu Leu Arg Arg Arg Trp Gly Leu
690 695 700
Ala Lys Ser Arg Glu Asp Asn Asp Arg His His Ala Leu Asp Ala Val
705 710 715 720
Leu Val Ala Cys Ser Thr Val Ala Met Gln Gln Lys Ile Thr Arg Phe
725 730 735
Val Arg Phe Lys Ala Gly Asp Val Phe Thr Gly Glu Arg Ile Asp Arg
740 745 750
Glu Thr Gly Glu Ile Ile Pro Leu His Phe Pro Thr Pro Trp Gln Phe
755 760 765
Phe Lys Gln Glu Val Glu Ile Arg Ile Phe Ser Asp Asn Pro Lys Leu
770 775 780
Glu Leu Glu Asn Arg Leu Pro Asp Arg Pro Gln Ala Asn His Glu Phe
785 790 795 800
Val Gln Pro Leu Phe Val Ser Arg Met Pro Thr Arg Lys Met Thr Gly
805 810 815
Gln Gly His Met Glu Thr Val Lys Ser Ala Lys Arg Leu Asn Glu Gly
820 825 830
Ile Ser Met Ile Lys Met Pro Leu Thr Lys Leu Lys Leu Lys Asp Leu
835 840 845
Glu Leu Met Val Asn Arg Glu Arg Glu Lys Asp Leu Tyr Asp Ala Leu
850 855 860
Lys Thr Arg Leu Glu Ala Phe Asn Asp Asp Pro Ala Lys Ala Phe Ala
865 870 875 880
Glu Pro Phe Met Lys Lys Gly Gly Ala Ile Val Lys Ser Val Arg Val
885 890 895
Glu Gln Val Gln Lys Ser Gly Val Leu Val Arg Gln Gly Asn Gly Val
900 905 910
Ala Asp Asn Ala Ser Met Val Arg Val Asp Val Phe Thr Lys Asp Gly
915 920 925
Lys Tyr Phe Leu Val Pro Ile Tyr Thr Trp Gln Val Ala Lys Gly Ile
930 935 940
Leu Pro Asn Lys Ala Val Ile Gln Gly Lys Asp Glu Glu Asp Trp Glu
945 950 955 960
Asp Ile Asp Asp Ala Thr Phe Gln Phe Ser Leu His Pro Asn Asp Leu
965 970 975
Ile Ser Val Lys Thr Lys Lys Asp Glu Phe Leu Gly Tyr Phe Asn Gly
980 985 990
Leu Asn Arg His Thr Gly Gly Ile Asn Ile Arg Thr His Asp Leu Glu
995 1000 1005
Lys Ser Lys Gly Lys Gln Gly Ile Phe Glu Gly Ile Gly Val Lys
1010 1015 1020
Ile Ala Leu Ser Phe Glu Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1025 1030 1035
Asn Ile Arg Leu Cys Lys Pro Ser Lys Arg Gln Pro Val Arg
1040 1045 1050
<210> 37
<211> 1082
<212> PRT
<213> Neisseria meningitidis
<400> 37
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080
<210> 38
<211> 338
<212> PRT
<213> Homo sapiens
<400> 38
Met Gly Lys Lys Gln Asn Arg Lys Thr Gly Asn Ser Lys Thr Gln Ser
1 5 10 15
Ala Ser Pro Pro Pro Lys Glu Arg Ser Ser Ser Pro Ala Thr Glu Gln
20 25 30
Ser Trp Met Glu Asn Asp Phe Asp Glu Leu Arg Glu Glu Gly Phe Arg
35 40 45
Arg Ser Asn Tyr Ser Glu Leu Arg Glu Asp Ile Gln Thr Lys Gly Lys
50 55 60
Glu Val Glu Asn Phe Glu Lys Asn Leu Glu Glu Cys Ile Thr Arg Ile
65 70 75 80
Thr Asn Thr Glu Lys Cys Leu Lys Glu Leu Met Glu Leu Lys Thr Lys
85 90 95
Ala Arg Glu Leu Arg Glu Glu Cys Arg Ser Leu Arg Ser Arg Cys Asp
100 105 110
Gln Leu Glu Glu Arg Val Ser Ala Met Glu Asp Glu Met Asn Glu Met
115 120 125
Lys Arg Glu Gly Lys Phe Arg Glu Lys Arg Ile Lys Arg Asn Glu Gln
130 135 140
Ser Leu Gln Glu Ile Trp Asp Tyr Val Lys Arg Pro Asn Leu Arg Leu
145 150 155 160
Ile Gly Val Pro Glu Ser Asp Val Glu Asn Gly Thr Lys Leu Glu Asn
165 170 175
Thr Leu Gln Asp Ile Ile Gln Glu Asn Phe Pro Asn Leu Ala Arg Gln
180 185 190
Ala Asn Val Gln Ile Gln Glu Ile Gln Arg Thr Pro Gln Arg Tyr Ser
195 200 205
Ser Arg Arg Ala Thr Pro Arg His Ile Ile Val Arg Phe Thr Lys Val
210 215 220
Glu Met Lys Glu Lys Met Leu Arg Ala Ala Arg Glu Lys Gly Arg Val
225 230 235 240
Thr Leu Lys Gly Lys Pro Ile Arg Leu Thr Ala Asp Leu Ser Ala Glu
245 250 255
Thr Leu Gln Ala Arg Arg Glu Trp Gly Pro Ile Phe Asn Ile Leu Lys
260 265 270
Glu Lys Asn Phe Gln Pro Arg Ile Ser Tyr Pro Ala Lys Leu Ser Phe
275 280 285
Ile Ser Glu Gly Glu Ile Lys Tyr Phe Ile Asp Lys Gln Met Leu Arg
290 295 300
Asp Phe Val Thr Thr Arg Pro Ala Leu Lys Glu Leu Leu Lys Glu Ala
305 310 315 320
Leu Asn Met Glu Arg Asn Asn Arg Tyr Gln Pro Leu Gln Asn His Ala
325 330 335
Lys Met
<210> 39
<211> 357
<212> PRT
<213> Mus sp.
<400> 39
Met Ala Lys Gly Lys Arg Lys Asn Pro Thr Asn Arg Asn Gln Asp His
1 5 10 15
Ser Pro Ser Ser Glu Arg Ser Thr Pro Thr Pro Pro Ser Pro Gly His
20 25 30
Pro Asn Thr Thr Glu Asn Leu Asp Pro Asp Leu Lys Thr Phe Leu Met
35 40 45
Met Met Ile Glu Asp Ile Lys Lys Asp Phe His Lys Ser Leu Lys Asp
50 55 60
Leu Gln Glu Ser Thr Ala Lys Glu Leu Gln Ala Leu Lys Glu Lys Gln
65 70 75 80
Glu Asn Thr Ala Lys Gln Val Met Glu Met Asn Lys Thr Ile Leu Glu
85 90 95
Leu Lys Gly Glu Val Asp Thr Ile Lys Lys Thr Gln Ser Glu Ala Thr
100 105 110
Leu Glu Ile Glu Thr Leu Gly Lys Arg Ser Gly Thr Ile Asp Ala Ser
115 120 125
Ile Ser Asn Arg Ile Gln Glu Met Glu Glu Arg Ile Ser Gly Ala Glu
130 135 140
Asp Ser Ile Glu Asn Ile Asp Thr Thr Val Lys Glu Asn Thr Lys Cys
145 150 155 160
Lys Arg Ile Leu Thr Gln Asn Ile Gln Val Ile Gln Asp Thr Met Arg
165 170 175
Arg Pro Asn Leu Arg Ile Ile Gly Ile Asp Glu Asn Glu Asp Phe Gln
180 185 190
Leu Lys Gly Pro Ala Asn Ile Phe Asn Lys Ile Ile Glu Glu Asn Phe
195 200 205
Pro Asn Ile Lys Lys Glu Met Pro Met Ile Ile Gln Glu Ala Tyr Arg
210 215 220
Thr Pro Asn Arg Leu Asp Gln Lys Arg Asn Ser Ser Arg His Ile Ile
225 230 235 240
Ile Arg Thr Thr Asn Ala Leu Asn Lys Asp Arg Ile Leu Lys Ala Val
245 250 255
Arg Glu Lys Gly Gln Val Thr Tyr Lys Gly Arg Pro Ile Arg Ile Thr
260 265 270
Pro Asp Phe Ser Pro Glu Thr Met Lys Ala Arg Arg Ala Trp Thr Asp
275 280 285
Val Ile Gln Thr Leu Arg Glu His Lys Cys Gln Pro Arg Leu Leu Tyr
290 295 300
Pro Ala Lys Leu Ser Ile Thr Ile Asp Gly Glu Thr Lys Val Phe His
305 310 315 320
Asp Lys Thr Lys Phe Thr Gln Tyr Leu Ser Thr Asn Pro Ala Leu Gln
325 330 335
Arg Ile Ile Thr Glu Lys Lys Gln Tyr Lys Asp Gly Asn His Ala Leu
340 345 350
Glu Gln Pro Arg Lys
355
<210> 40
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 40
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 41
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 41
Met Thr Leu Asn Ile Glu Asp Glu His Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 42
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 42
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Leu Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 43
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 43
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ala Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 44
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 44
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Arg Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 45
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 45
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Lys Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 46
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Ala Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 47
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 47
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Tyr Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 48
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 49
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 49
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu Arg Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 50
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 50
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Glu Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 51
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 51
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asp Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 52
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 52
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Arg Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 53
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 53
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Ile Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 54
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 54
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Leu Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 55
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 55
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Lys Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 56
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 56
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Asn Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 57
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 57
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Leu Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 58
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 58
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Gly Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 59
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 59
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Ala Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 60
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 60
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Gly Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 61
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 61
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asn Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 62
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 62
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Asp Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 63
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 63
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Arg Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 64
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 64
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asn Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 65
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 65
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Ser Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 66
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 66
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile Gln Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 67
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 67
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly Gly Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 68
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 68
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 69
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 69
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 70
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 70
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Pro
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 71
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 71
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 72
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 72
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 73
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 73
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Pro
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 74
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 74
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Pro
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 75
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 75
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Leu Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Arg Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Ala Leu Phe Asn Glu Ala Leu Arg Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Gly Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Ala Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asn Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Asn Pro Asp Thr Ser Thr Leu Pro
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 76
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 76
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Arg Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 77
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 77
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Ala
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 78
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 78
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Met
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 79
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 79
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Arg Tyr Ala
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 80
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 80
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Arg Tyr Met
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 81
<211> 677
<212> PRT
<213> Murine leukemia virus
<400> 81
Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu
1 5 10 15
Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala
20 25 30
Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu
35 40 45
Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr
50 55 60
Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg
65 70 75 80
Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr
85 90 95
Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
100 105 110
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr
115 120 125
Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln
130 135 140
Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
145 150 155 160
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
165 170 175
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
180 185 190
Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala
195 200 205
Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp
210 215 220
Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr
225 230 235 240
Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala
245 250 255
Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu
260 265 270
Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val
275 280 285
Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu
290 295 300
Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met
305 310 315 320
Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp
325 330 335
Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
340 345 350
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu
355 360 365
Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys
370 375 380
Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
385 390 395 400
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
405 410 415
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
420 425 430
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro
435 440 445
Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu
450 455 460
Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro
465 470 475 480
Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu
485 490 495
Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln
500 505 510
Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu
515 520 525
Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr
530 535 540
Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg
545 550 555 560
Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys
565 570 575
Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
580 585 590
Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Ile Leu Thr Ser Glu Gly
595 600 605
Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu
610 615 620
Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
625 630 635 640
Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
645 650 655
Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
660 665 670
Glu Asn Ser Ser Pro
675
<210> 82
<211> 112
<212> PRT
<213> Human immunodeficiency virus 2
<400> 82
Met Thr Asp Pro Arg Glu Thr Val Pro Pro Gly Asn Ser Gly Glu Glu
1 5 10 15
Thr Ile Gly Glu Ala Phe Ala Trp Leu Asn Arg Thr Val Glu Ala Ile
20 25 30
Asn Arg Glu Ala Val Asn His Leu Pro Arg Glu Leu Ile Phe Gln Val
35 40 45
Trp Gln Arg Ser Trp Arg Tyr Trp His Asp Glu Gln Gly Met Ser Glu
50 55 60
Ser Tyr Thr Lys Tyr Arg Tyr Leu Cys Ile Ile Gln Lys Ala Val Tyr
65 70 75 80
Met His Val Arg Lys Gly Cys Thr Cys Leu Gly Arg Gly His Gly Pro
85 90 95
Gly Gly Trp Arg Pro Gly Pro Pro Pro Pro Pro Pro Pro Gly Leu Val
100 105 110
<210> 83
<211> 134
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 83
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro Met Thr Asp Pro Arg Glu Thr Val Pro Pro
20 25 30
Gly Asn Ser Gly Glu Glu Thr Ile Gly Glu Ala Phe Ala Trp Leu Asn
35 40 45
Arg Thr Val Glu Ala Ile Asn Arg Glu Ala Val Asn His Leu Pro Arg
50 55 60
Glu Leu Ile Phe Gln Val Trp Gln Arg Ser Trp Arg Tyr Trp His Asp
65 70 75 80
Glu Gln Gly Met Ser Glu Ser Tyr Thr Lys Tyr Arg Tyr Leu Cys Ile
85 90 95
Ile Gln Lys Ala Val Tyr Met His Val Arg Lys Gly Cys Thr Cys Leu
100 105 110
Gly Arg Gly His Gly Pro Gly Gly Trp Arg Pro Gly Pro Pro Pro Pro
115 120 125
Pro Pro Pro Gly Leu Val
130
<210> 84
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 84
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 85
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 85
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Cys Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 86
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 86
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Cys
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 87
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 87
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Cys Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 88
<211> 102
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Npu N Intein sequence
<400> 88
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val Asp Asn Leu Pro Asn
100
<210> 89
<211> 35
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Npu C Intein sequence
<400> 89
Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
20 25 30
Ala Ser Asn
35
<210> 90
<211> 1292
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 90
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
20 25 30
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
35 40 45
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
50 55 60
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
65 70 75 80
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
85 90 95
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
100 105 110
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
115 120 125
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
130 135 140
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
145 150 155 160
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
165 170 175
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
180 185 190
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
195 200 205
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
210 215 220
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
225 230 235 240
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
245 250 255
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
260 265 270
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
275 280 285
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
290 295 300
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
305 310 315 320
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
325 330 335
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
340 345 350
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
355 360 365
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
370 375 380
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
385 390 395 400
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
405 410 415
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
420 425 430
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
435 440 445
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
465 470 475 480
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
485 490 495
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
500 505 510
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
515 520 525
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
530 535 540
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
545 550 555 560
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
565 570 575
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
580 585 590
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
595 600 605
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
610 615 620
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
625 630 635 640
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
645 650 655
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
660 665 670
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
675 680 685
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
690 695 700
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
705 710 715 720
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
725 730 735
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
740 745 750
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
755 760 765
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
785 790 795 800
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
805 810 815
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
820 825 830
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
835 840 845
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe
850 855 860
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
865 870 875 880
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
885 890 895
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
900 905 910
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
915 920 925
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
930 935 940
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
945 950 955 960
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
965 970 975
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
980 985 990
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
995 1000 1005
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1010 1015 1020
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1025 1030 1035
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1040 1045 1050
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1055 1060 1065
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1070 1075 1080
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1085 1090 1095
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1100 1105 1110
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1115 1120 1125
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1130 1135 1140
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1145 1150 1155
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1160 1165 1170
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1175 1180 1185
Arg Ser Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr
1190 1195 1200
Gly Leu Leu Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys
1205 1210 1215
Thr Val Tyr Ser Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro
1220 1225 1230
Val Ala Gln Trp His Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr
1235 1240 1245
Cys Leu Glu Asp Gly Ser Leu Ile Arg Ala Thr Lys Asp His Lys
1250 1255 1260
Phe Met Thr Val Asp Gly Gln Met Leu Pro Ile Asp Glu Ile Phe
1265 1270 1275
Glu Arg Glu Leu Asp Leu Met Arg Val Asp Asn Leu Pro Asn
1280 1285 1290
<210> 91
<211> 953
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 91
Ile Lys Ile Ala Thr Arg Lys Tyr Leu Gly Lys Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Arg Asp His Asn Phe Ala Leu Lys Asn Gly Phe Ile
20 25 30
Ala Ser Asn Cys Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
35 40 45
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
50 55 60
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
65 70 75 80
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
85 90 95
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
100 105 110
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
115 120 125
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
130 135 140
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
145 150 155 160
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
165 170 175
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
180 185 190
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
195 200 205
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
210 215 220
Leu Ser Gln Leu Gly Gly Asp Gly Ser Glu Thr Pro Gly Thr Ser Glu
225 230 235 240
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Thr
245 250 255
Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro
260 265 270
Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp
275 280 285
Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile
290 295 300
Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro
305 310 315 320
Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu
325 330 335
Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro
340 345 350
Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln
355 360 365
Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val
370 375 380
Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp
385 390 395 400
Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His
405 410 415
Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
420 425 430
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys
435 440 445
Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala Asp
450 455 460
Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp
465 470 475 480
Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg
485 490 495
Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys
500 505 510
Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu
515 520 525
Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met
530 535 540
Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly
545 550 555 560
Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala
565 570 575
Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly
580 585 590
Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr
595 600 605
Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe
610 615 620
Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu
625 630 635 640
Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro
645 650 655
Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
660 665 670
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val
675 680 685
Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp
690 695 700
Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu
705 710 715 720
Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala
725 730 735
Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp
740 745 750
Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro
755 760 765
Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu
770 775 780
Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr Glu
785 790 795 800
Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala
805 810 815
Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys
820 825 830
Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile
835 840 845
His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys
850 855 860
Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe
865 870 875 880
Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly
885 890 895
His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg
900 905 910
Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile Glu
915 920 925
Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu
930 935 940
Phe Glu Pro Lys Lys Lys Arg Lys Val
945 950
<210> 92
<211> 2108
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 92
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
20 25 30
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
35 40 45
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
50 55 60
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
65 70 75 80
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
85 90 95
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
100 105 110
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
115 120 125
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
130 135 140
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
145 150 155 160
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
165 170 175
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
180 185 190
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
195 200 205
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
210 215 220
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
225 230 235 240
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
245 250 255
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
260 265 270
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
275 280 285
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
290 295 300
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
305 310 315 320
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
325 330 335
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
340 345 350
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
355 360 365
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
370 375 380
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
385 390 395 400
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
405 410 415
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
420 425 430
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
435 440 445
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
465 470 475 480
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
485 490 495
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
500 505 510
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
515 520 525
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
530 535 540
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
545 550 555 560
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
565 570 575
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
580 585 590
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
595 600 605
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
610 615 620
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
625 630 635 640
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
645 650 655
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
660 665 670
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
675 680 685
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
690 695 700
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
705 710 715 720
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
725 730 735
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
740 745 750
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
755 760 765
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
785 790 795 800
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
805 810 815
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
820 825 830
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
835 840 845
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe
850 855 860
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
865 870 875 880
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
885 890 895
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
900 905 910
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
915 920 925
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
930 935 940
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
945 950 955 960
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
965 970 975
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
980 985 990
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
995 1000 1005
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1010 1015 1020
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1025 1030 1035
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1040 1045 1050
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1055 1060 1065
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1070 1075 1080
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1085 1090 1095
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1100 1105 1110
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1115 1120 1125
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1130 1135 1140
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1145 1150 1155
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1160 1165 1170
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1175 1180 1185
Arg Ser Cys Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1190 1195 1200
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1220 1225 1230
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1235 1240 1245
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1250 1255 1260
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1265 1270 1275
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1280 1285 1290
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1295 1300 1305
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1310 1315 1320
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1325 1330 1335
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1340 1345 1350
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1355 1360 1365
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1370 1375 1380
Gly Gly Asp Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
1385 1390 1395
Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Thr Leu Asn
1400 1405 1410
Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp
1415 1420 1425
Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp
1430 1435 1440
Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu
1445 1450 1455
Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
1460 1465 1470
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile
1475 1480 1485
Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro
1490 1495 1500
Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp
1505 1510 1515
Tyr Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu
1520 1525 1530
Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly
1535 1540 1545
Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp
1550 1555 1560
Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe
1565 1570 1575
Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu
1580 1585 1590
Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu
1595 1600 1605
Phe Asn Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln
1610 1615 1620
His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu
1625 1630 1635
Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu
1640 1645 1650
Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys
1655 1660 1665
Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu
1670 1675 1680
Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val
1685 1690 1695
Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
1700 1705 1710
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala
1715 1720 1725
Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu
1730 1735 1740
Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys
1745 1750 1755
Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr
1760 1765 1770
Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys
1775 1780 1785
Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala
1790 1795 1800
Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro
1805 1810 1815
Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala
1820 1825 1830
Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His
1835 1840 1845
Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser
1850 1855 1860
Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp
1865 1870 1875
Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu
1880 1885 1890
Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile
1895 1900 1905
Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro
1910 1915 1920
Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu
1925 1930 1935
Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
1940 1945 1950
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala
1955 1960 1965
Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala
1970 1975 1980
Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe
1985 1990 1995
Ala Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp
2000 2005 2010
Leu Thr Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu
2015 2020 2025
Ala Leu Leu Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile
2030 2035 2040
His Cys Pro Gly His Gln Lys Gly His Ser Ala Glu Ala Arg Gly
2045 2050 2055
Asn Arg Met Ala Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu
2060 2065 2070
Thr Pro Asp Thr Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Ser
2075 2080 2085
Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys
2090 2095 2100
Lys Lys Arg Lys Val
2105
<210> 93
<211> 112
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 93
Met Ala Asp Pro Arg Glu Ile Ile Pro Pro Gly Asn Ser Gly Glu Glu
1 5 10 15
Thr Val Gly Glu Ala Phe Ala Trp Leu Glu Arg Thr Val Glu Ala Ile
20 25 30
Asn Arg Glu Ala Val Asn His Leu Pro Arg Glu Leu Ile Phe Gln Val
35 40 45
Trp Gln Arg Ser Trp Arg Tyr Trp His Asp Glu Gln Gly Met Ser Ser
50 55 60
Ser Tyr Thr Lys Tyr Arg Tyr Leu Cys Leu Met Gln Lys Ala Met Phe
65 70 75 80
Ile His Phe Thr Arg Gly Cys Thr Cys Leu Gly Gly Gly His Gly Pro
85 90 95
Gly Gly Trp Gly Pro Gly Pro Pro Pro Pro Pro Pro Pro Gly Leu Val
100 105 110
<210> 94
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 94
ggtcccatgg tgtaatggtt agcactctgg actttgaatc cagcgatccg agttcaaatc 60
tcggtgggac ct 72
<210> 95
<211> 698
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 95
Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys Glu
1 5 10 15
Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala
20 25 30
Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu
35 40 45
Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr
50 55 60
Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg
65 70 75 80
Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr
85 90 95
Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
100 105 110
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr
115 120 125
Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln
130 135 140
Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu
145 150 155 160
His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
165 170 175
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
180 185 190
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu Ala
195 200 205
Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp
210 215 220
Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr
225 230 235 240
Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala
245 250 255
Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu
260 265 270
Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val
275 280 285
Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu
290 295 300
Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met
305 310 315 320
Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp
325 330 335
Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
340 345 350
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu
355 360 365
Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys
370 375 380
Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp
385 390 395 400
Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
405 410 415
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
420 425 430
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro
435 440 445
Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu
450 455 460
Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro
465 470 475 480
Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu
485 490 495
Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln
500 505 510
Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu
515 520 525
Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr
530 535 540
Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg
545 550 555 560
Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys
565 570 575
Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
580 585 590
Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly
595 600 605
Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu
610 615 620
Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys
625 630 635 640
Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
645 650 655
Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
660 665 670
Glu Asn Ser Ser Pro Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly Ser
675 680 685
Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
690 695
<210> 96
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 96
tctgtatcta tattcatcat 20
<210> 97
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 97
accattaaag aaaatatcat 20
<210> 98
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 98
ggagaactgg agccttcaga 20
<210> 99
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 99
gaaggtggaa tcacactgag 20
<210> 100
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 100
cttgctcgtt gacctccact 20
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 101
gtttgcagag aaagacaata 20
<210> 102
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 102
aggacatctc caagtttgca 20
<210> 103
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 103
cacctgtggt atcactccaa 20
<210> 104
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 104
caataacttt gcaacagtga 20
<210> 105
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 105
gaaggagaaa tccagatcga 20
<210> 106
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 106
ggtgtcacac tgaagtcctt 20
<210> 107
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 107
aattctgcaa tcctcactct 20
<210> 108
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 108
aggcacctcc agcccagcag 20
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 109
gcagagtacc cacctctcca 20
<210> 110
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 110
tcttgtagaa gaaagtacca 20
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 111
aagaaagtac caaggaagtg 20
<210> 112
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 112
ttggtgactg ccacgcccaa 20
<210> 113
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 113
tctggctgtg gtggggactg 20
<210> 114
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 114
ctctttgtgt tcattgccct 20
<210> 115
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 115
ttgccaagtg ttccagccac 20
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 116
agtccctcaa gtccttccag 20
<210> 117
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 117
gaccctggaa aagctgatga 20
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 118
ggcggctgag gaagctgagg 20
<210> 119
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 119
ggcggcggct gaggaagctg 20
<210> 120
<211> 57
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Reference sequence
<400> 120
ctctgggcag tgtgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57
<210> 121
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 121
ctctgggcag tgcgagtgca aaaaagaagc aaaaggactt cagtgtgaca cctgcag 57
<210> 122
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 122
ctctgggcag tgtgagtgca aaaaagaagc aaaaggactt cagtgtgaca cctgcag 57
<210> 123
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 123
ctctgggcag tgcgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57
<210> 124
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 124
ctctgggcag tgcgagtgca aaaaagaagc aaaaaggact tcagtgtgac acctgcag 58
<210> 125
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 125
ctctgggcag tgcgagtgca aaaaaagaag caaaaggact tcagtgtgac acctgcag 58
<210> 126
<211> 57
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Reference sequence
<400> 126
ctctgggcag tgtgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57
<210> 127
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 127
ctctgggcag tgcgagtgca aaaaagaagc aaaaggactt cagtgtgaca cctgcag 57
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 128
ggtgtcacac tgaagtcctt 20
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 129
aattctgcaa tcctcactct 20
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 130
gaaggtggaa tcacactgag 20
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 131
aagaaagtac caaggaagtg 20
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 132
aggcacctcc agcccagcag 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 133
gcagagtacc cacctctcca 20
<210> 134
<211> 57
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Reference sequence
<400> 134
ctctgggcag tgtgagtgca aaaaagaagc caaaggactt cagtgtgaca cctgcag 57
<210> 135
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 135
ctctgggcag tgcgagtgca aaaaagaagc aaaag 35
<210> 136
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 136
ctctgggcag tgcgagtgca agaaagaagc aaaag 35
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 137
agtccctcaa gtccttccag 20
<210> 138
<211> 1386
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 138
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
20 25 30
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
35 40 45
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
50 55 60
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
65 70 75 80
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
85 90 95
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
100 105 110
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
115 120 125
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
130 135 140
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
145 150 155 160
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
165 170 175
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
180 185 190
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
195 200 205
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
210 215 220
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
225 230 235 240
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
245 250 255
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
260 265 270
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
275 280 285
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
290 295 300
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
305 310 315 320
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
325 330 335
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
340 345 350
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
355 360 365
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
370 375 380
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
385 390 395 400
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
405 410 415
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
420 425 430
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
435 440 445
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
450 455 460
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
465 470 475 480
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
485 490 495
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
500 505 510
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
515 520 525
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
530 535 540
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
545 550 555 560
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
565 570 575
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
580 585 590
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
595 600 605
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
610 615 620
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
625 630 635 640
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
645 650 655
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
660 665 670
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
675 680 685
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
690 695 700
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
705 710 715 720
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
725 730 735
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
740 745 750
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
755 760 765
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
770 775 780
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
785 790 795 800
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
805 810 815
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
820 825 830
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
835 840 845
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe
850 855 860
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
865 870 875 880
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
885 890 895
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
900 905 910
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
915 920 925
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
930 935 940
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
945 950 955 960
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
965 970 975
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
980 985 990
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
995 1000 1005
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1010 1015 1020
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1025 1030 1035
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1040 1045 1050
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1055 1060 1065
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1070 1075 1080
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1085 1090 1095
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1100 1105 1110
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1115 1120 1125
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1130 1135 1140
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1145 1150 1155
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1160 1165 1170
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1175 1180 1185
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1190 1195 1200
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1205 1210 1215
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1220 1225 1230
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1235 1240 1245
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1250 1255 1260
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1265 1270 1275
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1280 1285 1290
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1295 1300 1305
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1310 1315 1320
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1325 1330 1335
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1340 1345 1350
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1355 1360 1365
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1370 1375 1380
Gly Gly Asp
1385
<210> 139
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 139
gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgc 86
<210> 140
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 140
agcggctgtg cctgcggcgg cggctgagga agctgaggag gcggcggcgg cggcggcggc 60
ggtggcggct gttgctgttg ctgctgttgc tggaaggact tgagggattt ttt 113
<210> 141
<211> 133
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 141
agcggctgtg cctgcggcgg cggctgagga agctgaggag gcggcggcgg cggcggcggc 60
ggtggcggct gttgctgttg ctgctgttgc tggaaggact tgagggaccg ccgcaggcac 120
agccgctttt ttt 133
<210> 142
<211> 4570
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 142
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctctctgg ctaactaccg 600
gtgccaccat gaaacggaca gccgacggaa gcgagttcga gtcaccaaag aagaagcgga 660
aagtcgacaa gaagtacagc atcggcctgg acatcggcac caactctgtg ggctgggccg 720
tgatcaccga cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc 780
ggcacagcat caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg 840
aggccacccg gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct 900
gctatctgca agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca 960
gactggaaga gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg 1020
gcaacatcgt ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa 1080
agaaactggt ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc 1140
acatgatcaa gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg 1200
acgtggacaa gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc 1260
ccatcaacgc cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca 1320
gacggctgga aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggaa 1380
acctgattgc cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg 1440
aggatgccaa actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg 1500
cccagatcgg cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca 1560
tcctgctgag cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct 1620
ctatgatcaa gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc 1680
ggcagcagct gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg 1740
ccggctacat tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc 1800
tggaaaagat ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc 1860
ggaagcagcg gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc 1920
acgccattct gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga 1980
tcgagaagat cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca 2040
gcagattcgc ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg 2100
aagtggtgga caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata 2160
agaacctgcc caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg 2220
tgtataacga gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc 2280
tgagcggcga gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga 2340
ccgtgaagca gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa 2400
tctccggcgt ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa 2460
ttatcaagga caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg 2520
tgctgaccct gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg 2580
cccacctgtt cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg 2640
gcaggctgag ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc 2700
tggatttcct gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg 2760
acagcctgac ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc 2820
tgcacgagca cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga 2880
cagtgaaggt ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg 2940
tgatcgaaat ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga 3000
gaatgaagcg gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc 3060
ccgtggaaaa cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc 3120
gggatatgta cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacg 3180
ctatcgtgcc tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa 3240
gcgacaagaa ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga 3300
agaactactg gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc 3360
tgaccaaggc cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac 3420
agctggtgga aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga 3480
acactaagta cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt 3540
ccaagctggt gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca 3600
actaccacca cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa 3660
agtaccctaa gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga 3720
agatgatcgc caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca 3780
gcaacatcat gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc 3840
ggcctctgat cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt 3900
ttgccaccgt gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg 3960
tgcagacagg cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga 4020
tcgccagaaa gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg 4080
cctattctgt gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg 4140
tgaaagagct gctggggatc accatcatgg aaagaagctg cctgtcctac gagacagaga 4200
tcctgacagt ggagtatggc ctgctgccaa tcggcaagat cgtggagaag aggatcgagt 4260
gtaccgtgta ctctgtggat aacaatggca acatctatac acagcccgtg gcacagtggc 4320
acgatagggg agagcaggag gtgttcgagt attgcctgga ggacggcagc ctgatcaggg 4380
caaccaagga ccacaagttc atgacagtgg atggccagat gctgcccatc gacgagattt 4440
tcgagcggga gctggacctg atgagagtgg ataacctgcc taatccagct gcgaaaagag 4500
tgaaactcga ttaataagaa ttcaataaaa gatctttatt ttcattagat ctgtgtgttg 4560
gttttttgtg 4570
<210> 143
<211> 4483
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 143
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctggttta gtgaaccgtc 600
agatccgcta gagatccgcg gccgctaata cgactcacta tagggagagc cgccaccatg 660
atcaagattg ctacacggaa atacctggga aagcagaacg tgtacgacat cggcgtggag 720
cgggatcaca acttcgccct gaagaatggc tttatcgcca gcaattgttt cgagaagaat 780
cccatcgact ttctggaagc caagggctac aaagaagtga aaaaggacct gatcatcaag 840
ctgcctaagt actccctgtt cgagctggaa aacggccgga agagaatgct ggcctctgcc 900
ggcgaactgc agaagggaaa cgaactggcc ctgccctcca aatatgtgaa cttcctgtac 960
ctggccagcc actatgagaa gctgaagggc tcccccgagg ataatgagca gaaacagctg 1020
tttgtggaac agcacaagca ctacctggac gagatcatcg agcagatcag cgagttctcc 1080
aagagagtga tcctggccga cgctaatctg gacaaagtgc tgtccgccta caacaagcac 1140
cgggataagc ccatcagaga gcaggccgag aatatcatcc acctgtttac cctgaccaat 1200
ctgggagccc ctgccgcctt caagtacttt gacaccacca tcgaccggaa gaggtacacc 1260
agcaccaaag aggtgctgga cgccaccctg atccaccaga gcatcaccgg cctgtacgag 1320
acacggatcg acctgtctca gctgggaggt gacggcagcg agacaccagg aacaagcgag 1380
tcagcaacac cagagagcag tggcggcagc agcggcggca gcagcaccct aaatatagaa 1440
gatgagtatc ggctacatga gacctcaaaa gagccagatg tttctctagg gtccacatgg 1500
ctgtctgatt ttcctcaggc ctgggcggaa accgggggca tgggactggc agttcgccaa 1560
gctcctctga tcatactcct gaaagcaacc tctacccccg tgtccataaa acaatacccc 1620
atgcgccaag aagccagact ggggatcaag ccccacatac agagactgtt ggaccaggga 1680
atactggtac cctgccagtc cccctggaac acgcccctgc tacccgttaa gaaaccaggg 1740
actaatgatt ataggcctgt ccaggatctg agagaagtca acaagcgggt ggaagacatc 1800
caccccaccg tgcccaaccc ttacaacctc ttgagcgggc tcccaccgtc ccaccagtgg 1860
tacactgtgc ttgatttaaa ggatgccttt ttctgcctga gactccaccc caccagtcag 1920
cctctcttcg cctttgagtg gagagatcca gagatgggaa tctcaggaca attgacctgg 1980
accagactcc cacagggttt caaaaacagt cccgctctgt ttaatgaggc actgcggaga 2040
gacctagcag acttccggat ccagcaccca gacttgatcc tgctacagta cgtggatgac 2100
ttactgctgg ccgccacttc tgagctagac tgccaacaag gtactcgggc cctgttacaa 2160
accctaggga acctcgggta tcgggcctcg gccaagaaag cccaaatttg ccagaaacag 2220
gtcaagtatc tggggtatct tctaaaagag ggtcagagat ggctgactga ggccagaaaa 2280
gagactgtga tggggcagcc tactccgaag acccctcgac aactaaggga gttcctaggg 2340
aaggcaggct tctgtcgcct cttcatccct gggtttgcag aaatggcagc ccccctgtac 2400
cctctcacca aaccggggac tctgtttaat tggggcccag accaacaaaa ggcctatcaa 2460
gaaatcaagc aagctcttct aactgcccca gccctggggt tgccagattt gactaagccc 2520
tttgaactct ttgtcgacga gaagcagggc tacgccaaag gtgtcctaac gcaaaaactg 2580
ggaccttggc gtcggccggt ggcctacctg tccaaaaagc tagacccagt agcagctggg 2640
tggccccctt gcctacggat ggtagcagcc attgccgtac tgacaaagga tgcaggcaag 2700
ctaaccatgg gacagccact agtcattggc gccccccatg cagtagaggc actagtcaaa 2760
caaccccccg accgctggct ttccaacgcc cggatgactc actatcaggc cttgcttttg 2820
gacacggacc gggtccagtt cggaccggtg gtagccctga acccggctac gctgctccca 2880
ctgcctgagg aagggctgca acacaactgc cttgatatcc tggccgaagc ccacggaacc 2940
cgacccgacc taacggacca gccgctccca gacgccgacc acacctggta cacggccgga 3000
agcagtctct tacaagaggg acagcgtaag gcgggagctg cggtgaccac cgagaccgag 3060
gtaatctggg ctaaagccct gccagccggg acatccgctc agcgggctga actgatagca 3120
ctcacccagg ccctaaagat ggcagaaggt aagaagctaa atgtttatac tgatagccgt 3180
tatgcttttg ctactgccca tatccatgga gaaatataca gaaggcgtgg gtggctcaca 3240
tcagaaggca aagagatcaa aaataaagac gagatcttgg ccctactaaa agccctcttt 3300
ctgcccaaaa gacttagcat aatccattgt ccaggacatc aaaagggaca cagcgccgag 3360
gctagaggca accggatggc taaccaagcg gcccgaaagg cagccatcac agagaaccca 3420
gacacctcta ccctccccat agaaaattca tcaccctctg gcggctcaaa aagaaccgcc 3480
gacggcagcg aattcgagcc caagaagaag aggaaagtcg gaagcggagg atccggcgca 3540
acaaacttct ctctgctgaa acaagccgga gatgtcgaag agaatcctgg accgggaagc 3600
ggaatggccg atccacgaga aatcatccca cctggaaaca gtggagagga gacagttggt 3660
gaagccttcg catggctgga aagaacggtt gaggctatta atcgagaagc ggtcaatcac 3720
ttgccgcgcg aactcatctt tcaagtgtgg caacgatcct ggcggtattg gcacgacgaa 3780
caaggcatga gttctagtta tacaaaatac agatatctct gtctcatgca gaaagccatg 3840
tttatccact tcaccagagg ctgcacatgt ctcgggggcg gacacggacc aggtggatgg 3900
ggccctggac caccacctcc tccaccacct ggacttgttt aagaattcaa taaaagatct 3960
ttattttcat tagatctgtg tgttggtttt ttgtgaacca aaaaaaaaat tctgcaatcc 4020
tcactctgtc acactgaagt ccttttgctt cttttttgca ctcgcactgc ccagagtgag 4080
gattgcagaa tttgcaccga ctcggtgcca ctttttcaag ttgataacgg actagcctta 4140
tttaaacttg ctatgctgtt tccagcatag ctcttaaaca aggacttcag tgtgacaccg 4200
gtgtttcgtc ctttccacaa gatatataaa gccaagaaat cgaaatactt tcaagttacg 4260
gtaagcatat gatagtccat tttaaaacat aattttaaaa ctgcaaacta cccaagaaat 4320
tattactttc tacgtcacgt attttgtact aatatctttg tgtttacagt caaattaatt 4380
ctaattatct ctctaacagc cttgtatcgt atatgcaaat atgaaggaat catgggaaat 4440
aggccctctt cctgcccgac cttggtaccg gatccagtcg act 4483
<210> 144
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 144
caccctcgtg accaccctga 20
Claims (131)
- 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도가 낮고 유전자 편집용 DNA 중합효소를 포함하는 세포에서 유전자 편집 효율을 증가시키는 방법으로서, 상기 방법은:
기준선 dNTP 농도에 비해 세포에서 dNTP 농도 증가시키는 단계를 포함하는, 방법. - 제1항에 있어서, 상기 세포에서 dNTP 농도를 증가시키는 단계는 세포에서 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제를 억제하는 것을 포함하는, 방법.
- 제2항에 있어서, 상기 데옥시뉴클레오티드 트리포스페이트 트리포스포히드롤라제는 SAM 도메인 및 HD 도메인-함유 단백질 1(SAMHD1)을 포함하는, 방법.
- 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 Vpx 단백질과 접촉시키거나 세포에서 Vpx 단백질을 발현시키는 것을 포함하는, 방법.
- 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 BGLF4 단백질과 접촉시키거나 세포에서 BGLF4 단백질을 발현시키는 것을 포함하는, 방법.
- 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 인코딩하는 mRNA를 mRNA에 혼성화하는 마이크로RNA 또는 siRNA와 접촉시키거나, 세포에서 마이크로RNA 또는 siRNA를 발현시키는 것을 포함하는, 방법.
- 제3항에 있어서, SAMHD1을 억제하는 것은 SAMHD1을 소분자 SAMHD1 억제제와 접촉시키는 것을 포함하는, 방법.
- 제1항에 있어서, 세포에서 dNTP 농도를 증가시키는 것은 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것을 포함하고, 여기서 뉴클레오시드 또는 뉴클레오티드는 데옥시뉴클레오시드(dN), 데옥시뉴클레오시드 모노포스페이트(dNMP), 또는 뉴클레오시드 트리포스페이트(NTP)를 선택적으로 포함하는, 방법.
- 제8항에 있어서, 뉴클레오시드 또는 뉴클레오티드를 세포에 투여하는 것은 세포를 포함하는 대상체에게 뉴클레오시드 또는 뉴클레오티드를 투여하는 것을 포함하는, 방법.
- 제9항에 있어서, 상기 투여는 경구 또는 주사에 의한 것인, 방법.
- 제1항에 있어서, 상기 세포에서 dNTP 농도를 증가시키는 것은 dNTP 합성 효소를 세포에 전달하는 것을 포함하는, 방법.
- 제11항에 있어서, 상기 dNTP 합성 효소는 키나제를 포함하는, 방법.
- 제12항에 있어서, 상기 키나제는 뉴클레오시드 키나제, 데옥시뉴클레오시드 키나제, 데옥시뉴클레오시드 모노포스페이트 키나제, 또는 데옥시뉴클레오티드 디포스페이트 키나제를 포함하는, 방법.
- 제1항에 있어서, 상기 DNA 중합효소는 역전사효소를 포함하는, 방법.
- 제1항에 있어서, 상기 세포는 Cas9 프로그램가능한 뉴클레아제, 가이드 핵산, 또는 이의 조합을 추가로 포함하는, 방법.
- 제1항에 있어서, 낮은 dNTP 농도는 비분열 세포에서 발견되는 dNTP 농도를 포함하는, 방법.
- 제1항에 있어서, 낮은 dNTP 농도는 활성화된 말초 혈액 단핵 세포에서 발견되는 dNTP 농도 미만인, 방법.
- 제1항에 있어서, 낮은 dNTP 농도는 1 마이크로몰 미만의 dNTP 농도를 포함하는, 방법.
- 제1항에 있어서, 상기 dNTP 농도를 증가시키는 것은 dNTP 농도를 기준선 dNTP 측정에 비해 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100%, 또는 그 초과로 증가시키는 것을 포함하는, 방법.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 dNTP 농도는 데옥시아데노신 트리포스페이트(dATP) 농도, 데옥시시티딘 트리포스페이트(dCTP) 농도, 데옥시구아노신 트리포스페이트(dGTP) 농도, 또는 데옥시티미딘 트리포스페이트(dTTP) 농도, 또는 이의 임의의 조합을 포함하는, 방법.
- Cas 닉카제 및 역전사효소를 포함하는 조성물로서, 상기 Cas 닉카제 및 역전사효소의 적어도 일부는 별도의 폴리펩티드 사슬에 포함되고, 상기 Cas 닉카제 및 역전사효소는 Cas-역전사효소 이종이량체를 형성하는, 조성물.
- 제21항에 있어서, 상기 Cas-역전사효소 이종이량체는 Cas 닉카제에 융합된 제1 이종이량체 도메인 및 역전사효소에 융합된 제2 이종이량체 도메인을 포함하고, 여기서 제1 이종이량체 도메인은 제2 이종이량체 도메인에 결합하여 Cas-역전사효소 이종이량체를 형성하는, 조성물.
- 제22항에 있어서, 상기 제1 이종이량체 도메인은 류신 지퍼이고 제2 이종이량체 도메인은 류신 지퍼인, 조성물.
- 제21항 내지 제23항 중 어느 한 항에 있어서, 상기 역전사효소는 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80, 또는 이의 단편 중 임의의 하나에 적어도 80% 서열 동일성을 갖는 서열을 포함하는, 조성물.
- 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 역전사효소는 Cas 닉카제의 일부에 융합된 비-장(long) 말단 반복 역전사성 요소로부터의 도메인을 포함하는, 조성물.
- 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 역전사효소는 Cas 닉카제의 일부에 융합된 박테리아 그룹 II 인트론으로부터의 서열을 포함하는, 조성물.
- 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 역전사효소는 Cas 닉카제의 일부에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는, 조성물.
- Cas 닉카제, 역전사효소, 및 가이드 핵산을 포함하는 조성물로서, 여기서 제1 폴리펩티드는 Cas 닉카제를 포함하고 제2 폴리펩티드는 역전사효소를 포함하고 가이드 핵산은 Cas 닉카제 및 역전사효소에 결합하는, 조성물.
- 제21항 내지 제28항 중 어느 한 항에 있어서, 상기 역전사효소는 mcp 펩티드를 포함하는, 조성물.
- 제21항 내지 제29항 중 어느 한 항에 있어서, 상기 역전사효소는 루프 영역을 포함하는, 조성물.
- 제30항에 있어서, 상기 루프 영역은 2a 루프 또는 3a 루프인, 조성물.
- 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 가이드 핵산은 MS2 헤어핀을 포함하는, 조성물.
- Cas 닉카제에 융합된 서열번호: 3 - 서열번호: 22 또는 서열번호: 40 - 서열번호: 80 또는 이의 단편 중 임의의 하나에 대해 적어도 80% 서열 동일성을 가지는 서열을 갖는 역전사효소를 포함하는 조성물.
- Cas 닉카제에 융합된 비-장 말단 반복 역전사성 요소로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물.
- Cas 닉카제에 융합된 박테리아 그룹 II 인트론으로부터의 서열을 포함하는 역전사효소를 포함하는 조성물.
- Cas 닉카제에 융합된 레트로바이러스 gag-pol 폴리단백질로부터의 도메인을 포함하는 역전사효소를 포함하는 조성물.
- Cas 닉카제 및 역전사효소를 포함하는 조성물로서, 상기 Cas 닉카제 및 역전사효소는 별도의 폴리펩티드 사슬을 포함하고, Cas 닉카제 및 역전사효소는 이종이량체화되도록 조작되지 않은, 조성물.
- 제21항 내지 제37항 중 어느 한 항에 있어서, 상기 Cas 닉카제와 복합체를 형성하는 가이드 핵산을 포함하고, 여기서 복합체 형성시, Cas 닉카제는 표적 핵산의 표적 부위에 단일-가닥 파손을 도입할 수 있는, 조성물.
- 제21항 내지 제38항 중 어느 한 항에 있어서, 상기 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함하는, 조성물.
- 제21항 내지 제39항 중 어느 한 항에 있어서, 상기 Cas 닉카제 또는 역전사효소에 융합된 핵 국소화 신호를 포함하는, 조성물.
- 제21항 내지 제40항 중 어느 한 항에 있어서, 상기 역전사효소는 절삭된 역전사효소인, 조성물.
- 제21항 내지 제41항 중 어느 한 항에 있어서, 상기 역전사효소는 천연 역전사효소와 비교하여 증가된 연속성을 갖는, 조성물.
- 제21항 내지 제42항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 증가된 연속성을 갖는, 조성물.
- 제21항 내지 제43항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 표적 서열에서 더 긴 윈도우 길이를 편집하는, 조성물.
- 제21항 내지 제44항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 감소된 면역원성을 갖는, 조성물.
- 제21항 내지 제45항 중 어느 한 항에 있어서, 상기 역전사효소는 mlvRT와 비교하여 세포로의 개선된 전달을 갖는, 조성물.
- 제21항 내지 제46항 중 어느 한 항에 있어서, 상기 역전사효소는 단일 결합 이벤트에서 20개 이상, 40개 이상, 45개 이상, 50개 이상, 60개 이상, 81개 이상, 100개 이상, 500개 이상, 또는 1000개 이상의 뉴클레오티드를 중합하는, 조성물.
- 가이드 핵산으로서,
표적 핵산의 제1 영역에 역상보적인 스페이서,
Cas 닉카제에 결합하도록 구성된 스캐폴드,
표적 핵산 내로 삽입되는 서열을 인코딩하는 역전사효소 주형, 및
표적 핵산의 제2 영역에 역상보적인 제1 가닥 프라이머 결합 부위를 포함하는, 가이드 핵산. - 제48항에 있어서, 상기 역전사효소 주형의 영역의 서열을 포함하는 제2 가닥 프라이머를 추가로 포함하는, 가이드 핵산.
- 제48항 또는 제49항에 있어서, 상기 표적 핵산의 제1 영역은 표적 핵산의 제1 가닥 상에 있고 표적 핵산의 제2 영역은 표적 핵산의 제2 가닥 상에 있는, 가이드 핵산.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 표적 핵산의 제1 영역의 전부 또는 일부는 표적 핵산의 제2 영역의 전부 또는 일부에 역상보적인, 가이드 핵산.
- 제48항 내지 제51항 중 어느 한 항에 있어서, 상기 가이드 핵산의 3' 말단에 절단가능한 서열을 추가로 포함하는, 가이드 핵산.
- 제52항에 있어서, 상기 절단가능한 서열은 리보자임 절단가능한 서열인, 가이드 핵산.
- 제52항에 있어서, 상기 절단가능한 서열은 tRNA 절단가능한 서열인, 가이드 핵산.
- 제48항 내지 제54항 중 어느 한 항에 있어서, 상기 제1 가닥 프라이머 결합 부위는 표적 핵산의 제2 영역에 혼성화하도록 구성되고, 역전사효소 주형은 표적 핵산의 제2 영역의 3' 말단으로부터 역전사를 위한 주형으로 작용하도록 구성되는, 가이드 핵산.
- 제48항 내지 제55항 중 어느 한 항에 있어서, 상기 제2 가닥 프라이머는 역전사효소 주형에 대해 역상보적인 주형으로부터 전사를 위한 프라이머로서 작용하도록 구성되는, 가이드 핵산.
- 제48항 내지 제56항 중 어느 한 항에 있어서, 제1 합성된 가닥은 제2 가닥 프라이머로부터 제2 가닥의 합성을 위한 주형으로서 작용하는, 가이드 핵산.
- 제48항 내지 제57항 중 어느 한 항에 있어서, 벨크로 결합 부위에 혼성화하는 벨크로 영역을 추가로 포함하는, 가이드 핵산.
- 제58항에 있어서, 상기 벨크로 결합 부위는 벨크로 영역에 대해 100% 역상보적이고; 여기서 벨크로 결합 부위는 벨크로 영역에 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 역상보적이고/이거나; 여기서 벨크로 결합 부위는 벨크로 영역에 대해 55% 이하, 60% 이하, 65% 이하, 70% 이하, 75% 이하, 80% 이하, 85% 이하, 90% 이하, 91% 이하, 92% 이하, 93% 이하, 94% 이하, 95% 이하, 96% 이하, 97% 이하, 98% 이하, 99% 이하 역상보적인, 가이드 핵산.
- 제58항 또는 제59항에 있어서, 상기 역전사효소 주형 영역은 벨크로 결합 부위를 포함하는, 가이드 핵산.
- 제58항 또는 제59항에 있어서, 상기 벨크로 결합 부위는 제1 가닥 프라이머 결합 부위의 3'인, 가이드 핵산.
- 제48항 내지 제61항 중 어느 한 항에 있어서, 상기 벨크로 영역은 역전사효소 주형의 3'인, 가이드 핵산.
- 제48항 내지 제62항 중 어느 한 항에 있어서, 상기 벨크로 영역은 스캐폴드의 5'인, 가이드 핵산.
- 제48항 내지 제63항 중 어느 한 항에 있어서, 상기 표적 핵산은 CFTR 핵산, USH2A 핵산, ABCA4 핵산, ATP7B 핵산, 또는 HTT 핵산을 포함하는, 가이드 핵산.
- 제48항 내지 제64항 중 어느 한 항에 있어서, 상기 스페이서는 서열번호: 96-119 중 임의의 하나에 적어도 85% 동일한 핵산 서열을 포함하는, 가이드 핵산.
- 제28항 내지 제32항 또는 제37항 내지 제65항 중 어느 한 항의 가이드를 포함하는 제1 가이드 핵산 및 제2 가이드 핵산을 포함하는 조성물.
- 제66항에 있어서, 상기 제2 가이드 핵산은 제28항, 제32항 또는 제37항 또는 제48항 내지 제65항 중 어느 한 항의 가이드 핵산을 포함하는, 조성물.
- 제67항에 있어서, 상기 제2 가이드 핵산의 역전사효소 주형은 제1 가이드 핵산의 역전사효소 주형의 적어도 일부에 상보적인 (또는 적어도 부분적으로 상보적인), 조성물.
- 제66항 내지 제68항 중 어느 한 항에 있어서, 상기 제1 가이드 핵산은 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산은 제2 Cas 닉카제에 결합하는, 조성물.
- 제66항 내지 제68항 중 어느 한 항에 있어서, 상기 제1 가이드 핵산의 제1 스페이서는 제1 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스페이서는 제2 Cas 닉카제에 결합하고, 제1 가이드 핵산의 제1 스캐폴드는 제2 Cas 닉카제에 결합하고, 제2 가이드 핵산의 제2 스캐폴드는 제1 Cas 닉카제에 결합하는, 조성물.
- 제66항 내지 제68항 또는 제70항 중 어느 한 항에 있어서, 상기 제1 가이드 핵산은 제1 링커를 포함하고 제2 가이드 핵산은 제2 링커를 포함하고, 상기 제1 링커는 제2 링커에 혼성화하는, 조성물.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물 또는 제38항 내지 제45항 중 어느 한 항의 가이드 핵산을 발현하는 세포에 Orf1p를 전달하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물을 인코딩하거나, 또는 제48항 내지 제65항 중 어느 한 항의 가이드 핵산을 포함하는 하나 이상의 핵산.
- 제73항의 핵산을 포함하는 바이러스 벡터.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물, 제48항 내지 제65항 중 어느 한 항의 가이드 핵산, 제73항의 핵산, 또는 제74항의 바이러스 벡터를 포함하는 세포.
- 제72항 또는 제75항에 있어서, 세포는 원핵 세포인, 방법 또는 세포.
- 제72항 또는 제75항에 있어서, 세포는 진핵 세포인, 방법 또는 세포.
- 세포에서 Vpx 단백질을 발현시키는 것을 포함하는 게놈 편집 효율을 증가시키는 방법.
- 제78항에 있어서, 세포는 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항의 조성물 또는 제48항 내지 제65항 중 어느 한 항의 가이드 핵산을 발현하는, 방법.
- 세포에서 dNTP 농도를 증가시킴에 의해 게놈 편집 효율을 증가시키는 방법으로서, 예를 들어 세포에서 SAMHD1을 억제하는 것을 포함하는 게놈 편집 효율을 증가시키는 방법.
- 제80항에 있어서, 세포는 Cas9 프로그램가능한 뉴클레아제, 역전사효소, 및 가이드 핵산을 발현하는, 방법.
- 제80항 또는 제81항에 있어서, SAMHD1을 억제하는 것은 세포에서 Vpx 단백질을 발현시키는 것을 포함하는, 방법.
- 제80항 또는 제81항에 있어서, SAMHD1을 억제하는 것은 세포에서 SAMHD1에 대한 마이크로RNA를 발현시키는 것을 포함하거나, 세포를 소분자 SAMHD1 억제제로 처리하는 것을 포함하는, 방법.
- 인테인 촉매작용을 가능하게 하거나 개선하는 하나 이상의 점 돌연변이 또는 삽입 돌연변이를 포함하는 Cas9 프로그램가능한 뉴클레아제를 포함하는 조성물.
- 제84항에 있어서, Cas9 프로그램가능한 뉴클레아제는 Cas9 프로그램가능한 뉴클레아제의 C-말단 절반에 위치된 점 돌연변이 또는 삽입 돌연변이를 포함하거나, 또는 점 돌연변이 또는 삽입 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 아미노산 위치 574 후의 임의의 곳에 위치되는, 조성물.
- 제85항에 있어서, 점 돌연변이는 시스테인 점 돌연변이, 세린 점 돌연변이, 트레오닌 점 돌연변이, 또는 알라닌 점 돌연변이를 포함하거나; 또는 삽입 돌연변이는 시스테인 삽입 돌연변이, 세린 삽입 돌연변이, 트레오닌 삽입 돌연변이, 또는 알라닌 삽입 돌연변이를 포함하는, 조성물.
- 제85항에 있어서, 점 돌연변이는 시스테인 점 돌연변이를 포함하거나, 또는 삽입 돌연변이는 시스테인 삽입 돌연변이를 포함하는, 조성물.
- 제84항 내지 제87항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 Cas9 닉카제인, 조성물.
- 제84항 내지 제88항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 S. 피오게네스 Cas9인, 조성물.
- 제89항에 있어서, 점 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212에 위치되거나, 또는 삽입 돌연변이는 S. 피오게네스 Cas9의 D1079, D1125, D1130, G1133, A1140, I1168, S1173, D1180, G1186, L1203, 또는 R1212의 바로 상류에 위치되는, 조성물.
- 제84항 내지 제90항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 서열번호: 85 - 서열번호: 87 또는 서열번호: 90 - 서열번호: 92 중 임의의 하나의 서열을 포함하는, 조성물.
- 제84항 내지 제91항 중 어느 한 항에 있어서, Cas9 프로그램가능한 뉴클레아제는 2개 이상의 분절로 발현되는, 조성물.
- 제92항에 있어서, 2개 이상의 분절 중 제1 분절은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분 및 제1 인테인을 포함하고, 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분 및 제2 인테인을 포함하는, 조성물.
- 제93항에 있어서, 시스테인 점 돌연변이는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 위치되는, 조성물.
- 제93항 또는 제94항에 있어서, 제1 인테인은 Cas9 프로그램가능한 뉴클레아제의 N-말단 부분의 C-말단에 융합되고, 제2 인테인은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 N-말단에 융합되는, 조성물.
- 제93항 내지 제95항 중 어느 한 항에 있어서, 제1 분절은 서열번호: 90의 서열을 포함하고, 제2 분절은 서열번호: 91의 서열을 포함하는, 조성물.
- 제93항 내지 제96항 중 어느 한 항에 있어서, 2개 이상의 분절 중 제2 분절은 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분에 융합된 역전사효소를 포함하는, 조성물.
- 제97항에 있어서, 역전사효소는 Cas9 프로그램가능한 뉴클레아제의 C-말단 부분의 C-말단에 융합된 N-말단을 포함하는, 조성물.
- 제97항 또는 제98항에 있어서, 역전사효소는 mlvRT 또는 이의 변이체를 포함하는, 조성물.
- 낮은 dNTP 농도에서 그 촉매적 효율을 증가시키도록 변형된(예를 들어, dNTP에 대한 그 Km을 감소시키도록 변형된) 몰로니 백혈병 바이러스 역전사효소(mlvRT)로 게놈 편집을 수행하는 것을 포함하는, 게놈 편집 효율을 최적화하는 방법.
- 역전사효소의 위치 221 또는 223에서 점 돌연변이를 포함하는, 몰로니 백혈병 바이러스 역전사효소(mlvRT) 또는 이의 변이체로 게놈 편집을 수행하는 것을 포함하는, 제한적 dNTP 상태에서 게놈 편집 효율을 최적화하는 방법.
- 제100항 또는 제101항에 있어서, mlvRT 또는 이의 변이체는 위치 221에서 점 돌연변이를 포함하는, 방법.
- 제102항에 있어서, 위치 221에서 점 돌연변이는 Q221R을 포함하는, 방법.
- 제100항 또는 제101항에 있어서, mlvRT 또는 이의 변이체는 위치 223에서 점 돌연변이를 포함하는, 방법.
- 제104항에 있어서, 위치 223에서 점 돌연변이는 V223A를 포함하는, 방법.
- 제104항에 있어서, 위치 223에서 점 돌연변이는 V223M을 포함하는, 방법.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 위치 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204, 또는 D524에서 점 돌연변이를 포함하는, 방법.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204R, 또는 D524A를 포함하는 점 돌연변이를 포함하는, 조성물.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 아미노산 위치 Q84, L139, Q221, V223, T664, 또는 L671에서 점 돌연변이를 포함하는, 조성물.
- 제21항 내지 제47항 또는 제66항 내지 제71항 중 어느 한 항에 있어서, 역전사효소는 S67R, Q84A, L139P, Q221R, V223A, V223M, T664N, L671P, 또는 D524A를 포함하는 점 돌연변이를 포함하는, 조성물.
- 제21항 내지 제47항 중 어느 한 항에 있어서, Cas 닉카제 및 RT는 폴리뉴클레오티드에 의해 인코딩되는, 조성물.
- 제111항의 폴리뉴클레오티드를 포함하는 AAV.
- 제112항에 있어서, Cas 닉카제 및 RT의 적어도 일부는 별도의 AAV에 포괄되는, AAV.
- 아데노-연관된 바이러스(AAV)로서, Cas 닉카제의 적어도 일부를 인코딩하는 제1 폴리뉴클레오티드를 포함하는 제1 AAV, 및 역전사효소를 인코딩하는 제2 폴리뉴클레오티드를 포함하는 제2 AAV를 포함하는, AAV.
- 제112항 내지 제114항 중 어느 한 항에 있어서, AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV-DJ, AAV-DJ/8, AAV-Rh10, AAV-Rh74, AAV-레트로, AAV-PHP.B, AAV8-PHP.eB, 또는 AAV-PHP.S, 또는 이의 조합을 포함하는, AAV.
- 제114항 또는 제115항에 있어서, Cas 닉카제 및 역전사효소는 서로 이종이량체를 형성하는, AAV.
- 제114항 내지 제116항 중 어느 한 항에 있어서, 제1 또는 제2 폴리뉴클레오티드는 Cas 닉카제 및 역전사효소에 결합하여 복합체를 형성하는 가이드 핵산을 추가로 인코딩하고, 여기서 복합체의 Cas 닉카제는 표적 핵산 내 표적 부위에서 단일-가닥 파손을 도입하는, AAV.
- 제114항 내지 제117항 중 어느 한 항에 있어서, Cas 닉카제는 S. 피오게네스 Cas9 닉카제와 같은 Cas9 닉카제를 포함하고, 역전사효소는 mlvRT 또는 이의 변이체를 포함하고, 여기서 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204 또는 D524에서 점 돌연변이를 포함하는, AAV.
- 제118항에 있어서, 점 돌연변이는 P51L, S67R, Q84A, L139P, Q221R, V223A, V223M, T197A, D653N, T664N, L671P, L435G, H204A, 또는 D524A를 포함하는, AAV.
- 제114항 내지 제119항 중 어느 한 항에 있어서, Cas9 닉카제는 S. 피오게네스 Cas9 닉카제를 포함하고, 역전사효소는 mlvRT 또는 이의 변이체를 포함하고, 여기서 역전사효소는 P51, S67, Q84, L139, Q221, V223, T197, D653, T664, L671, L435, H204 또는 D524의 바로 상류에 삽입 돌연변이를 포함하는, AAV.
- 제114항 내지 제120항 중 어느 한 항의 제1 또는 제2 AAV를 포함하는 조성물을 대상체 또는 세포에 투여하는 것을 포함하는, 게놈 편집 방법.
- 제112항 내지 제120항 중 어느 한 항의 AAV를 포함하는 조성물을 대상체 또는 세포에 투여하는 것을 포함하는, 게놈 편집 방법.
- 제121항 또는 제122항에 있어서, 대상체 또는 세포에서 게놈 편집을 측정하는 것을 추가로 포함하는, 방법.
- 데옥시뉴클레오시드 트리포스페이트(dNTP) 농도가 낮은 세포에서 유전자 편집 효율을 증가시키는 방법으로서,
낮은 dNTP 농도에서 효율적인 촉매작용을 위해 변형된 유전자 편집 효소와 세포를 접촉시키거나, 세포에서 유전자 편집 효소를 발현시키는 것을 포함하는, 방법. - 제124항에 있어서, 유전자 편집 효소는 위치 Q84, L139, Q221, V223, T664 또는 L671에 점 돌연변이를 도입함에 의해 변형된 역전사효소를 포함하는, 방법.
- 개선된 역전사효소(RT)를 스크리닝 또는 식별하는 방법으로서,
세포에서, SAMHD1을 과발현하거나 또는 돌연변이체 SAMHD1의 잔기의 인산화를 방지하도록 돌연변이된 돌연변이체 SAMHD1을 발현시키는 단계;
세포에서 RT 활성을 식별하는 단계; 및
RT 활성에 기반하여, RT를 개선된 RT로 식별하는 단계를 포함하는, 방법. - 스페이서, 원하는 편집을 포함하는 역전사효소 주형, 및 프라이머 결합 부위를 포함하는 RNA 또는 폴리뉴클레오티드를 포함하는 시스템으로서, 여기서 프라이머 결합 부위는 스페이서에 의해 표적화되거나 결합된 핵산 또는 스페이서에 의해 표적화되거나 결합된 핵산에 역상보적인 핵산의 영역의 임의의 부분을 포함하지 않는 핵산에 결합하는, 시스템.
- 시스템으로서,
표적 핵산의 제1 영역에 역상보적인 스페이서;
Cas 뉴클레아제에 결합하도록 구성된 스캐폴드;
표적 핵산 안에 삽입되는 서열을 인코딩하는 역전사효소 주형;
제1 영역의 임의의 부분을 포함하지 않고, 제1 영역의 역 상보체의 임의의 부분을 포함하지 않는 표적 핵산의 영역에 결합하는 제1 가닥 프라이머 결합 부위; 및
제2 가이드 핵산 상의 GPS 결합 부위에 혼성화하는 GPS 영역:
을 포함하는 제1 가이드 핵산을 포함하는 시스템. - 제128항에 있어서, GPS 결합 부위를 포함하는 제2 가이드 핵산을 추가로 포함하는, 시스템.
- 제129항에 있어서, 제2 가이드 핵산은 표적 핵산의 다른 영역에 역상보적인 제2 스페이서를 포함하는, 시스템.
- 제129항 또는 제130항에 있어서, 제2 가이드 핵산은 프라이머 결합 부위를 게놈 플랩과 매우 근접하게 가져오는, 시스템.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062992032P | 2020-03-19 | 2020-03-19 | |
US62/992,032 | 2020-03-19 | ||
US202063055829P | 2020-07-23 | 2020-07-23 | |
US63/055,829 | 2020-07-23 | ||
US202163153161P | 2021-02-24 | 2021-02-24 | |
US63/153,161 | 2021-02-24 | ||
PCT/US2021/023041 WO2021188840A1 (en) | 2020-03-19 | 2021-03-18 | Methods and compositions for directed genome editing |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230003467A true KR20230003467A (ko) | 2023-01-06 |
Family
ID=77747638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227035994A KR20230003467A (ko) | 2020-03-19 | 2021-03-18 | 지시된 게놈 편집을 위한 방법 및 조성물 |
Country Status (8)
Country | Link |
---|---|
US (4) | US11193123B2 (ko) |
EP (1) | EP4121522A1 (ko) |
JP (1) | JP2023518395A (ko) |
KR (1) | KR20230003467A (ko) |
CN (1) | CN115667505A (ko) |
AU (1) | AU2021236683A1 (ko) |
MX (1) | MX2022011562A (ko) |
WO (1) | WO2021188840A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019051097A1 (en) | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
CN115667505A (zh) | 2020-03-19 | 2023-01-31 | 因特利亚治疗公司 | 用于定向基因组编辑的方法和组合物 |
KR20230019843A (ko) * | 2020-05-08 | 2023-02-09 | 더 브로드 인스티튜트, 인코퍼레이티드 | 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물 |
WO2022087235A1 (en) | 2020-10-21 | 2022-04-28 | Massachusetts Institute Of Technology | Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste) |
CA3231677A1 (en) * | 2021-09-08 | 2023-03-16 | Flagship Pioneering Innovations Vi, Llc | Methods and compositions for modulating a genome |
WO2023060256A1 (en) * | 2021-10-08 | 2023-04-13 | The General Hospital Corporation | Improved crispr prime editors |
CA3235826A1 (en) * | 2021-10-21 | 2023-04-27 | Wei Hsi Yeh | Genome editing compositions and methods for treatment of usher syndrome type 3 |
WO2023086834A1 (en) * | 2021-11-12 | 2023-05-19 | Replace Therapeutics, Inc. | Direct replacement genome editing |
US11866728B2 (en) | 2022-01-21 | 2024-01-09 | Renagade Therapeutics Management Inc. | Engineered retrons and methods of use |
WO2023245108A2 (en) | 2022-06-16 | 2023-12-21 | Intellia Therapeutics, Inc. | Compositions and methods for reducing mhc class i in a cell |
CN115029374B (zh) * | 2022-06-24 | 2023-12-26 | 安徽省农业科学院水稻研究所 | 一种用于骨干载体的pegRNA表达框及相应骨干载体和应用 |
WO2024020346A2 (en) | 2022-07-18 | 2024-01-25 | Renagade Therapeutics Management Inc. | Gene editing components, systems, and methods of use |
WO2024042489A1 (en) | 2022-08-25 | 2024-02-29 | LifeEDIT Therapeutics, Inc. | Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing |
WO2024095245A2 (en) | 2022-11-04 | 2024-05-10 | LifeEDIT Therapeutics, Inc. | Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69923274T2 (de) * | 1998-10-12 | 2006-03-30 | Roche Diagnostics Gmbh | Deoxynukleotidtriphosphatkinase aus Insektenzellen zur Synthese von Nukleosidmonophosphaten |
GB0806562D0 (en) * | 2008-04-10 | 2008-05-14 | Fermentas Uab | Production of nucleic acid |
US8603797B2 (en) | 2010-03-17 | 2013-12-10 | Cornell University | Methods and compositions for targeted mutagenesis in bacteria |
FR2973040B1 (fr) * | 2011-03-23 | 2016-04-15 | Centre Nat De La Rech Scient (C N R S) | Methode de criblage de composes antiretroviraux et vaccin |
US9161995B2 (en) | 2011-07-25 | 2015-10-20 | Sangamo Biosciences, Inc. | Methods and compositions for alteration of a cystic fibrosis transmembrane conductance regulator (CFTR) gene |
PE20150336A1 (es) | 2012-05-25 | 2015-03-25 | Univ California | Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn |
ES2901396T3 (es) * | 2013-03-14 | 2022-03-22 | Caribou Biosciences Inc | Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico |
WO2014186686A2 (en) | 2013-05-17 | 2014-11-20 | Two Blades Foundation | Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases |
WO2015021426A1 (en) | 2013-08-09 | 2015-02-12 | Sage Labs, Inc. | A crispr/cas system-based novel fusion protein and its application in genome editing |
US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
US20150166984A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting alpha-antitrypsin point mutations |
US9963687B2 (en) | 2014-08-27 | 2018-05-08 | New England Biolabs, Inc. | Fusion polymerase and method for using the same |
WO2016036754A1 (en) | 2014-09-02 | 2016-03-10 | The Regents Of The University Of California | Methods and compositions for rna-directed target dna modification |
KR102630014B1 (ko) * | 2014-10-01 | 2024-01-25 | 더 제너럴 하스피탈 코포레이션 | 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 |
EP3294879A4 (en) | 2015-05-14 | 2019-02-20 | University of Southern California | OPTIMIZED GENETIZATION WITH A RECOMBINANT ENDONUCLEASE SYSTEM |
EP3334823B1 (en) | 2015-06-05 | 2024-05-22 | The Regents of The University of California | Method and kit for generating crispr/cas guide rnas |
MX2017016425A (es) * | 2015-06-17 | 2018-12-11 | Univ Columbia | Terapia con desoxinucleosidos para enfermedades generadas por grupos de nucleotidos desequilibrados, inclusive sindromes de agotamiento del adn mitocondrial. |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
IL258821B (en) | 2015-10-23 | 2022-07-01 | Harvard College | Nucleobase editors and their uses |
EP3163302A1 (en) * | 2015-11-02 | 2017-05-03 | Johann Wolfgang Goethe-Universität Frankfurt am Main | Samhd1 modulation for treating resistance to cancer therapy |
WO2017106616A1 (en) | 2015-12-17 | 2017-06-22 | The Regents Of The University Of Colorado, A Body Corporate | Varicella zoster virus encoding regulatable cas9 nuclease |
WO2017151719A1 (en) | 2016-03-01 | 2017-09-08 | University Of Florida Research Foundation, Incorporated | Molecular cell diary system |
EP3426353A4 (en) * | 2016-03-09 | 2020-05-06 | The University of Massachusetts | USE OF MODIFIED HIV-1 TO GENERATE FULLY HUMAN ANTIBODIES |
US20200263190A1 (en) | 2016-04-19 | 2020-08-20 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
SG11201900907YA (en) | 2016-08-03 | 2019-02-27 | Harvard College | Adenosine nucleobase editors and uses thereof |
EP3510151A4 (en) * | 2016-09-09 | 2020-04-15 | The Board of Trustees of the Leland Stanford Junior University | HIGH-THROUGHPUT PRECISION GENE EDITING |
CN110249046A (zh) * | 2016-12-05 | 2019-09-17 | 朱诺治疗学股份有限公司 | 用于过继细胞疗法的工程化细胞的产生 |
WO2018165629A1 (en) | 2017-03-10 | 2018-09-13 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
CA3057192A1 (en) | 2017-03-23 | 2018-09-27 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable dna binding proteins |
WO2019051097A1 (en) | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
US11352611B2 (en) * | 2017-10-03 | 2022-06-07 | Board Of Regents, The University Of Texas System | Non-LTR-retroelement reverse transcriptase and uses thereof |
EP3820995A1 (en) * | 2018-07-10 | 2021-05-19 | Alia Therapeutics S.R.L. | Vesicles for traceless delivery of guide rna molecules and/or guide rna molecule/rna-guided nuclease complex(es) and a production method thereof |
WO2020047124A1 (en) * | 2018-08-28 | 2020-03-05 | Flagship Pioneering, Inc. | Methods and compositions for modulating a genome |
US20210301274A1 (en) * | 2018-09-07 | 2021-09-30 | Beam Therapeutics Inc. | Compositions and Methods for Delivering a Nucleobase Editing System |
WO2020191153A2 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
CN115667505A (zh) | 2020-03-19 | 2023-01-31 | 因特利亚治疗公司 | 用于定向基因组编辑的方法和组合物 |
-
2021
- 2021-03-18 CN CN202180035786.9A patent/CN115667505A/zh active Pending
- 2021-03-18 MX MX2022011562A patent/MX2022011562A/es unknown
- 2021-03-18 KR KR1020227035994A patent/KR20230003467A/ko unknown
- 2021-03-18 AU AU2021236683A patent/AU2021236683A1/en active Pending
- 2021-03-18 JP JP2022555909A patent/JP2023518395A/ja active Pending
- 2021-03-18 EP EP21771405.4A patent/EP4121522A1/en active Pending
- 2021-03-18 WO PCT/US2021/023041 patent/WO2021188840A1/en unknown
- 2021-03-19 US US17/206,522 patent/US11193123B2/en active Active
- 2021-03-19 US US17/206,526 patent/US11352623B2/en active Active
- 2021-10-20 US US17/506,419 patent/US20220090064A1/en active Pending
-
2022
- 2022-05-03 US US17/735,929 patent/US20230076357A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2021236683A1 (en) | 2022-11-17 |
CN115667505A (zh) | 2023-01-31 |
MX2022011562A (es) | 2022-12-13 |
US20210292753A1 (en) | 2021-09-23 |
JP2023518395A (ja) | 2023-05-01 |
US20230076357A1 (en) | 2023-03-09 |
US20210292769A1 (en) | 2021-09-23 |
US20220090064A1 (en) | 2022-03-24 |
EP4121522A1 (en) | 2023-01-25 |
WO2021188840A1 (en) | 2021-09-23 |
US11193123B2 (en) | 2021-12-07 |
US11352623B2 (en) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230003467A (ko) | 지시된 게놈 편집을 위한 방법 및 조성물 | |
US20240035049A1 (en) | Methods and compositions for modulating a genome | |
JP6954890B2 (ja) | ヌクレアーゼ媒介ゲノム遺伝子操作のための送達方法及び組成物 | |
US20240076698A1 (en) | Methods and compositions for modulating a genome | |
US20230242899A1 (en) | Methods and compositions for modulating a genome | |
TW202028461A (zh) | 核酸構築體及使用方法 | |
CN113631708A (zh) | 编辑rna的方法和组合物 | |
EP3443088A1 (en) | Grna fusion molecules, gene editing systems, and methods of use thereof | |
EP3116997A1 (en) | Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10) | |
CN113939591A (zh) | 编辑rna的方法和组合物 | |
TW202027799A (zh) | 用於表現因子ix的組成物及方法 | |
CN114207130A (zh) | 用于从白蛋白基因座进行转基因表达的组合物和方法 | |
CN112639108A (zh) | 治疗非综合征性感觉神经性听力损失的方法 | |
JP2024515936A (ja) | Cas酵素を用いたマルチプレックス編集 | |
WO2020006708A1 (en) | Compositions and methods for enhancement of homology-directed repair mediated precise gene editing by programming dna repair with a single rna-guided endonuclease | |
US20240082429A1 (en) | Pah-modulating compositions and methods | |
JP2023542705A (ja) | 核酸塩基編集のためのジンクフィンガー融合タンパク質 | |
CA3234834A1 (en) | Improved crispr prime editors |