KR20210126042A - 유전자 편집에서 비의도적 돌연변이의 억제 - Google Patents

유전자 편집에서 비의도적 돌연변이의 억제 Download PDF

Info

Publication number
KR20210126042A
KR20210126042A KR1020217028085A KR20217028085A KR20210126042A KR 20210126042 A KR20210126042 A KR 20210126042A KR 1020217028085 A KR1020217028085 A KR 1020217028085A KR 20217028085 A KR20217028085 A KR 20217028085A KR 20210126042 A KR20210126042 A KR 20210126042A
Authority
KR
South Korea
Prior art keywords
leu
lys
arg
ser
ala
Prior art date
Application number
KR1020217028085A
Other languages
English (en)
Inventor
지아 천
베이 양
리 양
싱쉬 황
싱쉬 황
리제 왕
Original Assignee
상하이테크 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 상하이테크 유니버시티 filed Critical 상하이테크 유니버시티
Publication of KR20210126042A publication Critical patent/KR20210126042A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/503Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses
    • C12N9/506Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses derived from RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21111Aqualysin 1 (3.4.21.111)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/22Cysteine endopeptidases (3.4.22)
    • C12Y304/22044Nuclear-inclusion-a endopeptidase (3.4.22.44)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

오프-표적 돌연변이가 감소되거나 또는 전무한 염기 편집을 수행하는데 유용한 융합 단백질 및 관련 분자를 제공한다. 융합 단백질은 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 핵염기 디아미나제 억제성 도메인을 포함하는 제2 단편, 및 제1 단편 및 제2 단편 사이의 프로테아제 절단 부위를 포함할 수 있다. 또한 안정성이 개선된 프라임 편집 가이드 RNA를 포함하는 개선된 프라임 편집 시스템이 제공된다.

Description

유전자 편집에서 비의도적 돌연변이의 억제
게놈 편집은 조작된 뉴클레아제 (분자 가위)를 사용하여 살아있는 유기체의 게놈에 DNA를 삽입, 결실 또는 치환시키는 유전자 조작의 한 유형이다. 세포 및 살아있는 유기체의 게놈을 유전자 조작하기 위해 게놈 편집 도구를 이용하는 것은 생명 과학 연구, 생명공학/농업 기술 개발 및 가장 중요하게는 약학/임상 혁신에서 광범위한 적용분야를 갖는다. 예를 들어, 게놈 편집은 유전자 질환의 근간이 되고 살아있는 유기체에서 이들 질환의 완전한 치유를 이끄는 드라이버 돌연변이를 교정하는데 사용될 수 있다. 게놈 편집은 또한 작물의 게놈을 조작하고, 작물의 수율을 증가시키고, 환경 오염 또는 병원체 감염에 대해 작물 내성을 부여하는데 사용될 수 있다. 또한, 정확한 게놈 편집을 통한 미생물 게놈 형질전환은 재생가능한 생물-에너지의 개발에서 매우 중요하다.
CRISPR/Cas (군집된 규칙적으로 산재된 짧은 회문식 반복부 (Clustered regularly interspaced short palindromic repeats)/CRISPR-연관 단백질) 시스템은 이의 유례없는 편집 효율, 편이성 및 살아있는 유기체에서 잠재적 적용성에 대한 이의 개념 때문에 가장 강력한 게놈 편집 도구였다. 가이드 RNA (gRNA)에 의해 유도되어, Cas 뉴클레아제는 다양한 세포 (세포주 및 살아있는 유기체 유래 세포 둘 모두) 내 표적화된 게놈 부위에서 DNA 이중 가닥 파손 (DSB)을 생성시킬 수 있다. 그 다음으로 이들 DSB는 바람직한 게놈 편집을 수행하는데 이용될 수 있는 내생성 DNA 복구 시스템을 통해서 복구된다.
일반적으로, 2종의 주요 DNA 복구 경로는 DSB, 비-상동성 말단 결합 (NHEJ) 및 상동성-지정 복구 (HDR)를 통해 활성화될 수 있다. NHEJ는 DSB 주변 게놈 DNA 영역에 무작위 삽입/결실 (indel)을 도입시킬 수 있어서, 오픈 리딩 프레임 (ORF) 이동 및 궁극적으로 유전자 불활성화를 야기시킬 수 있다. 대조적으로, HDR이 촉발될 때, 표적 부위에서 게놈 DNA 서열은 유전자 돌연변이의 교정을 일으킬 수 있는, 상동성 재조합 기전을 통해서 외생성 도너 DNA 주형의 서열로 치환될 수 있다. 그러나, HDR-매개 유전자 교정의 실제 효율이 낮은데 (정상적으로 < 5%) 상동성 재조합의 발생은 세포 유형-특이적이고 세포 주기-의존적이고 NHEJ가 HDR에 비해서 더 빈번하게 촉발되기 때문이다. 그러므로 HDR의 상대적으로 낮은 효율은 정밀 유전자 요법 (질환-구동 유전자 교정) 분야에서 CRISRP/Cas 게놈 편집 도구의 번역을 제한한다.
CRISPR/Cas 시스템을 APOBEC (apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like) AID (activation-induced cytidine deaminase) 패밀리와 통합시키는 염기 편집자 (BE)는 CRISPR/Cas-매개 유전자 교정의 효율을 상당히 증강시킨 것이 최근에 개발되었다. Cas9 닉카제 (nCas9) 또는 촉매적 데드 Cpf1 (dCas12a로도 공지된 dCpf1)과의 융합을 통해서, APOBEC/AID 패밀리 구성원의 시토신 (C) 탈아미노화 활성은 게놈 내 표적 염기로 고의적으로 유도시킬 수 있고 이들 염기에서 C에서 티민 (T)으로의 치환을 촉매할 수 있다.
그러나, APOBEC/AID 패밀리 구성원은 단일 가닥 DNA (ssDNA) 영역 내 C에서 T로의 염기 치환 돌연변이를 유도시킬 수 있으므로, 현행 염기 편집 시스템의 특이성이 손상되어서, 예를 들어, 치료 목적으로 인간 질환에서 일어나는 T에서 C로의 돌연변이를 복원시키기 위해 BE를 사용하는 적용성을 제한한다. 그런 이유로, 다른 ssDNA 영역에서 C에서 T 돌연변이를 초래하지 않지만, 표적 영역 내 시토신을 특이적으로 편집할 수 있는 신규 BE의 생성이 바람직하다. 이러한 신규 BE는 다양한 살아있는 유기체에서 보다 특이적인 염기 편집을 수행할 수 있게 할 것이다. 중요한 것은, 이러한 BE의 높은 특이성이 특히 질환-관련 T에서 C 돌연변이의 복원을 포함한 유전자 요법에서, 잠재적 임상 해석을 촉진하게 될 것이다.
일부 구현예에서, 본 개시는 현재 염기 편집자에 일반적인 오프-표적 돌연변이의 감소 또는 없음을 야기시키는 게놈 편집에 유용한 염기 편집자를 제공한다. 일정 구현예에서, 핵염기 디아미나제 억제제는 게놈 편집에 관여되는 핵염기 디아미나제에 절단가능하게 융합된다. 핵염기 디아미나제 억제제의 존재 하에서, 핵염기 디아미나제는 뉴클레오티드 분자와 반응할 수 없다 (덜 반응할 수 있다). 표적 편집 위치에서, 핵염기 디아미나제 억제제는 절단되어 이후에 바람직하게 편집을 수행할 수 있는 완전하게 활성인 핵염기 디아미나제를 방출할 수 있다.
따라서, 일 구현예에서, 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 핵염기 디아미나제 억제제를 포함하는 제2 단편, 및 제1 단편 및 제2 단편 사이의 프로테아제 절단 부위를 포함하는 융합 단백질을 제공한다.
일부 구현예에서, 핵염기 디아미나제는 아데노신 디아미나제이다. 일부 구현예에서, 아데노신 디아미나제는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)로 이루어진 군으로부터 선택된다.
일부 구현예에서, 핵염기 디아미나제는 시티딘 디아미나제이다. 일부 구현예에서, 시티딘 디아미나제는 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)로 이루어진 군으로부터 선택된다. 일부 구현예에서, 시티딘 디아미나제는 인간 또는 마우스 시티딘 디아미나제이다. 일부 구현예에서, 촉매 도메인은 마우스 A3 시티딘 디아미나제 도메인 1 (CDA1) 또는 인간 A3B 시티딘 디아미나제 도메인 2 (CDA2)이다.
일부 구현예에서, 핵염기 디아미나제 억제제는 핵염기 디아미나제의 억제성 도메인이다. 일부 구현예에서, 핵염기 디아미나제 억제제는 시티딘 디아미나제의 억제성 도메인이다. 일부 구현예에서, 핵염기 디아미나제 억제제는 아데노신 디아미나제의 억제성 도메인이다. 일부 구현예에서, 핵염기 디아미나제 억제제는 SEQ ID NO: 1-2 및 표 1 및 2 (SEQ ID NO: 48-135)로부터 선택되는 아미노산 서열, 또는 SEQ ID NO: 1-2 및 표 1 및 2로부터 선택되는 임의의 아미노산 서열과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 구현예에서, 핵염기 디아미나제 억제제는 SEQ ID NO:1의 아미노산 서열, SEQ ID NO:1의 아미노산 잔기 AA76-AA149 또는 SEQ ID NO:2의 아미노산 서열을 포함한다.
일부 구현예에서, 제1 단편은 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 더 포함한다. 일부 구현예에서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, xSpCas9, SpCas9-NG, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택된다.
일부 구현예에서, 프로테아제 절단 부위는 TuMV 프로테아제, PPV 프로테아제, PVY 프로테아제, ZIKV 프로테아제 및 WNV 프로테아제로 이루어진 군으로부터 선택되는 프로테아제의 프로테아제 절단 부위이다.
일부 구현예에서, 프로테아제 절단 부위는 자가-절단 부위이다. 일부 구현예에서, 프로테아제 절단 부위는 TEV 프로테아제 절단 부위이다. 일부 구현예에서, 융합 단백질은 TEV 프로테아제 또는 이의 단편을 포함하는 제3 단편을 더 포함한다. 일부 구현예에서, 제3 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편을 포함한다.
다른 구현예에서, 또한, 시티딘 디아미나제 또는 이의 촉매 도메인, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 제1 TEV 프로테아제 단편을 포함하는 제1 단편, 시티딘 디아미나제 억제제, 및 TEV 제1 단편 및 제2 단편 사이의 프로테아제 절단 부위를 포함하는 제2 단편을 포함하는 융합 단백질로서, 제1 TEV 프로테아제 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 것인, 융합 단백질이 제공된다.
일부 구현예에서, 융합 단백질은 우라실 글리코실라제 억제제 (UGI)를 더 포함한다. 일부 구현예에서, 시티딘 디아미나제 억제제, TEV 프로테아제 절단 부위, 시티딘 디아미나제 또는 이의 촉매 도메인, Cas 단백질, 및 제1 TEV 프로테아제 단편은 N-말단에서 C-말단으로 배열된다. 일부 구현예에서, 제1 TEV 프로테아제 단편은 TEV 프로테아제의 N-말단 도메인 (SEQ ID NO:3) 또는 C-말단 도메인 (SEQ ID NO:4)이다. 일부 구현예에서, TEV 프로테아제 절단 부위는 SEQ ID NO:5의 아미노산 잔기를 갖는다.
일 구현예에서, 세포 내 표적 부위에서 게놈 편집을 수행하기 위한 방법이 더 제공되고, 방법은 세포로 (a) 본 개시의 융합 단백질, (b) 표적 부위를 표적화하는 가이드 RNA 또는 표적 부위를 표적화하는 crRNA로서, 태그 서열을 더 포함하는 것인 가이드 RNA 또는 crRNA, 및 (c) 태그 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편을 도입시키는 단계를 포함한다.
일부 구현예에서, 하나 이상의 분자는 그 분자를 코딩하는 폴리뉴클레오티드에 의해 세포로 도입된다. 일부 구현예에서, 제1 TEV 프로테아제 단편 및 제2 TEV 프로테아제 단편은, 상호작용할 때, TEV 프로테아제 절단 부위를 절단시킬 수 있다. 일부 구현예에서, 제2 TEV 프로테아제 단편은 RNA 인식 펩티드에 융합된다.
일부 구현예에서, 태그 서열은 MS2 서열 (SEQ ID NO:16)을 포함한다. 일부 구현예에서, RNA 인식 펩티드는 MS2 외피 단백질 (MCP, SEQ ID NO:22)을 포함한다. 일부 구현예에서, 태그 서열은 PP7 서열 (SEQ ID NO:18)을 포함하고 RNA 인식 펩티드는 PP7 외피 단백질 (PCP, SEQ ID NO: 23)을 포함하거나, 또는 태그 서열은 boxB 서열 (SEQ ID NO:20)을 포함하고 RNA 인식 펩티드는 boxB 외피 단백질 (N22p, SEQ ID NO:24)을 포함한다.
또한 일 구현예에서, (a) 본 개시의 융합 단백질, 및 (b) RNA 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편을 포함하는, 유전자 편집을 수행하기 위한 키트 또는 패키지가 제공된다.
또 다른 구현예는 제1 시티딘 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 및 제2 시티딘 디아미나제의 억제성 도메인을 포함하는 제2 단편을 포함하는 융합 단백질을 제공하고, 제1 시티딘 디아미나제는 제2 시티딘 디아미나제와 동일하거나 또는 상이하다.
다른 구현예에서, 핵염기 디아미나제 또는 이의 촉매 도메인, 핵염기 디아미나제 억제제, 제1 RNA 인식 펩티드, 및 핵염기 디아미나제 또는 이의 촉매 도메인 및 핵염기 디아미나제 억제제 사이에 TEV 프로테아제 절단 부위를 포함하는 제1 단편을 포함하는 융합 단백질이 제공된다.
일부 구현예에서, 융합 단백질은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편, 및 제2 RNA 인식 펩티드를 포함하는 제2 단편을 더 포함한다. 일부 구현예에서, 융합 단백질은 제1 단편 및 제2 단편 사이에 자가-절단 부위를 더 포함한다.
일부 구현예에서, 융합 단백질은 제2 TEV 프로테아제 단편을 포함하는 제3 단편을 더 포함하고, 제1 TEV 프로테아제 단편은 제2 TEV 프로테아제 단편의 존재 하에서 TEV 프로테아제 부위를 절단할 수 있다. 일부 구현예에서, 융합 단백질은 제2 단편 및 제3 단편 사이의 제2 자가-절단 부위를 더 포함하고, 제2 자가-절단 부위의 절단 시에, 융합 단백질은 임의의 RNA 인식 펩티드에 융합되지 않은 제2 TEV 프로테아제 단편을 방출한다.
일 구현예에서, 또한 제1 PAM 부위에 근접한 표적 핵산 서열에 상보성인 서열을 갖는 제1 스페이서를 포함하는 표적 단일 가이드 RNA, 제2 PAM 부위에 근접한 제2 핵산 서열에 상보성인 서열을 갖는 제2 스페이서를 포함하는 헬퍼 단일 가이드 RNA, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제를 포함하는 이중 가이드 RNA 시스템이 제공되고, 제2 PAM 부위는 제1 PAM 부위로부터 34 내지 91 염기이다. 일부 구현예에서, 제2 스페이서는 8-15 염기 길이이다. 일부 구현예에서, 제2 스페이서는 9-12 염기 길이이다.
일 구현예에서, 5'에서 3' 방향으로, 제1 스템 루프 부분, 제2 스템 루프 부분, 제3 스템 루프 부분, 및 제4 스템 루프 부분을 포함하는 스캐폴드를 포함하는 가이드 RNA를 제공하고, 제3 스템 루프는 그 안에 5 염기쌍을 포함한다. 다른 구현예에서, 본 개시는 위치 45 및 55의 염기 사이에 염기쌍을 도입시켜서 SEQ ID NO:31로부터 유래된 스캐폴드를 포함하는 가이드 RNA를 제공한다. 일부 구현예에서, 스캐폴드는 SEQ ID NO:32-43으로 이루어진 군으로부터 선택되는 서열을 포함한다. 일부 구현예에서, 가이드 RNA는 적어도 100, 또는 120 뉴클레오티드 길이이다.
다른 구현예는 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법을 제공하고, 방법은 세포로, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 코딩하는 제1 구성체가 밀봉된 제1 바이러스 입자, 및 RNA 인식 펩티드에 융합된 역전사효소를 코딩하는 제2 구성체가 밀봉된 제2 바이러스 입자를 도입시키는 단계를 포함한다.
일부 구현예에서, 제2 구성체는 RNA 인식 펩티드가 결합되는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩한다. 일부 구현예에서, Cas 단백질은 SpCas9-NG (SEQ ID NO:46) 또는 xSpCas9 (SEQ ID NO:47)이다.
본 개시의 융합 단백질을 코딩하는 폴리뉴클레오티드, 폴리뉴클레오티드를 함유하는 구성체, 폴리뉴클레오티드 또는 구성체를 함유하는 세포, 및 임의의 상기를 포함하는 조성물이 제한없이 또한 제공된다.
도 1A-C: Sa-SITE31 ssDNA 영역 내 현행 BE에 의해 야기된 비의도적 염기 치환. 1A: Sa-sgSITE31 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE31의 공-발현을 예시하는 개략도. 1B: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 1C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgSITE31 표적 부위에서의 비의도적 염기 치환의 위치를 나타낸다.
도 2A-C: Sa-SITE42 ssDNA 영역내 현형 BE에 의해 초래된 비의도적 염기 치환. 2A: Sa-sgSITE42 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE42의 공-발현을 예시하는 개략도. 2B: Sa-sgSITE42를 발현하는 플라스미드 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 2C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgSITE42 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다.
도 3A-C: Sa-F1 ssDNA 영역 내 현재 BE에 의해 초래된 비의도적 염기 치환. 3A: Sa-sgF1 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgF1의 공-발현을 예시하는 개략도. 3B: Sa-sgF1을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드 또는 빈 벡터의 공-형질감염을 예시하는 개략도. 3C: BE3 및 hA3A-BE3에 의해 초래된 비의도적 염기 치환. 점선 박스는 Sa-sgF1 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다.
도 4A-C: mA3CDA2는 TET1 영역 내 C에서 T 염기 편집 활성을 억제한다. 4A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 4B: sgTET1을 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 4C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 5A-C: mA3CDA2는 RNF2 영역 내 C에서 T 염기 편집 활성을 억제한다. 5A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 5B: sgRNF2를 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 5C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 6A-C: mA3CDA2는 SITE3 영역 내 C에서 T 염기 편집 활성을 억제한다. 6A: mA3, rA1 및 hA3A 내 CDA 도메인의 영역을 예시하는 개략도. 6B: sgSITE3을 발현하는 플라스미드와 mA3-BE3을 발현하는 플라스미드, mA3CDA1-BE3을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, BE3을 발현하는 플라스미드, mA3CDA2-BE3을 발현하는 플라스미드, mA3CDA2-2A-BE3을 발현하는 플라스미드, hA3A-BE3을 발현하는 플라스미드, mA3CDA2-hA3A-BE3을 발현하는 플라스미드 또는 mA3CDA2-2A-hA3A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 6C: mA3CDA2는 mA3CDA1-BE3, BE3 및 hA3A-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 7A-C: hA3BCDA1은 TET1 영역에서 C에서 T 염기 편집 활성을 억제한다. 7A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 7B: sgTET1을 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 7C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 8A-C: hA3BCDA1은 RNF2 영역 내 C에서 T 염기 편집 활성을 억제한다. 8A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 8B: sgRNF2를 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 8C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 9A-C: hA3BCDA1은 SITE3 영역 내 C에서 T 염기 편집 활성을 억제한다. 9A: hA3B 내 CDA 도메인의 영역을 예시하는 개략도. 9B: sgSITE3을 발현하는 플라스미드와 hA3B-BE3을 발현하는 플라스미드, hA3BCDA2-BE3을 발현하는 플라스미드 또는 hA3B-2A-BE3을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 9C: hA3BCDA1은 hA3BCDA2-BE3의 C에서 T 편집 활성을 억제한다. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 10A-C: FANCF 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 10A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 10B: sgFANCF를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 10C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgFANCF 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 11A-C: SITE2 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 11A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 11B: sgSITE2를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196를 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 11C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgSITE2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 12A-C: SITE4 영역 내 염기 편집 효율의 조사에 의한 mA3의 분할 부위 맵핑. 12A: mA3을 분할시키는데 사용된 부위 (AA196/AA197, AA207/AA208, AA215/AA216, AA229/AA230, AA237/AA238) 및 mA3 내 2개 CDA 도메인의 영역을 예시하는 개략도. 12B: sgSITE4를 발현하는 플라스미드와 mA3rev-BE3-196을 발현하는 플라스미드, mA3rev-2A-BE3-196을 발현하는 플라스미드, mA3rev-BE3을 발현하는 플라스미드, mA3rev-2A-BE3을 발현하는 플라스미드, mA3rev-BE3-215를 발현하는 플라스미드, mA3rev-2A-BE3-215를 발현하는 플라스미드, mA3rev-BE3-229를 발현하는 플라스미드, mA3rev-2A-BE3-229를 발현하는 플라스미드, mA3rev-BE3-237을 발현하는 플라스미드 또는 mA3rev-2A-BE3-237을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 12C: AA196/AA197 내지 AA237/AA238을 포괄하는 부위 분할은 일반적으로 C에서 T 편집 효율을 유지시킨다. 점선 박스는 sgSITE4 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 13A-B: FANCF 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 13A: sgFANCF를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 13B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgFANCF 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 14A-B: SITE2 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 14A: sgSITE2를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 14B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgSITE2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 15A-B: SITE4 영역 내 염기-편집 억제 효과를 함유하는 mA3의 최소 영역 맵핑. 15A: sgSITE4를 발현하는 플라스미드와 mA3rev-BE3-237을 발현하는 플라스미드, mA3rev-BE3-237-Del-255를 발현하는 플라스미드, mA3rev-BE3-237-Del-285를 발현하는 플라스미드 또는 mA3rev-BE3-237-Del-333을 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 15B: mA3의 AA334 내지 AA429를 포괄하는 영역은 염기-편집 억제 효과를 함유한다. 점선 박스는 sgSITE4 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 16A-B: BEsafe 및 BE3 또는 hA3A-BE3의 작업 과정을 예시하는 개략도. 16A: BEsafe는 온-표적 부위에서 C에서 T 염기 편집을 유도하고 미관련 ssDNA 영역 내에서 돌연변이 초래를 피한다. 16B: BE3 또는 hA3A-BE3은 온-표적 부위에서 C에서 T 염기 편집을 유도하지만 미관련 ssDNA 영역 내에서 C에서 T 돌연변이를 초래한다.
도 17A-D: 미관련 Sa-SITE31 ssDNA 영역 내 및 TET1 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 17A: Sa-sgSITE31 온-표적 부위에서 ssDNA의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE31의 공-발현을 예시하는 개략도. 17B: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgTET1을 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgTET1 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgTET1 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 17C: 미관련 Sa-SITE31 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgSITE31 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 17D: TET1 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율 비교. 점선 박스는 sgTET1 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 18A-D: 미관련 Sa-SITE32 ssDNA 영역 내 및 RNF2 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 18A: Sa-sgSITE32 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgSITE32의 공-발현을 예시하는 개략도. 18B: Sa-sgSITE32를 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgRNF2를 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgRNF2 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgRNF2 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 18C: 미관련 Sa-SITE32 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgSITE32 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 18D: RNF2 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율의 비교. 점선 박스는 sgRNF2 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 19A-D: 미관련 Sa-F1 ssDNA 영역 내 및 SITE3 온-표적 부위에서 hA3A-BE3 및 BEsafe의 비교. 19A: Sa-sgF1 온-표적 부위에서 ssDNA 영역의 형성을 촉발시키기 위한 SaD10A 닉카제 및 Sa-sgF1의 공-발현을 예시하는 개략도. 19B: Sa-sgF1을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와, hA3A-BE3을 발현하는 플라스미드 및 sgSITE3을 발현하는 플라스미드, BEsafe를 발현하는 플라스미드 및 MS2-sgSITE3 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc를 발현하는 플라스미드 및 MS2-sgSITE3 및 BEsafe를 발현하는 플라스미드의 공-형질감염을 예시하는 개략도. 19C: 미관련 Sa-F1 ssDNA 영역 내 hA3A-BE3 및 BEsafe에 의해 촉발된 비의도적 C에서 T 돌연변이 빈도의 비교. 점선 박스는 Sa-sgF1 표적 부위에서 비의도적 염기 치환의 위치를 나타낸다. 19D: SITE3 부위에서 hA3A-BE3 및 BEsafe의 염기 편집 효율의 비교. 점선 박스는 sgSITE3 표적 부위에서 C에서 T 염기 편집의 위치를 나타낸다.
도 20a-f: 시티딘 디아미나제 억제제의 확인. 20a: 개략도는 단일- 또는 이중- CDA 도메인을 갖는 APOBEC 패밀리 구성원 (좌측) 및 이중-도메인 APOBEC의 1 또는 2개 CDA로 구축된 쌍형성 염기 편집자 (우측)를 예시한다. 20b: 하나의 대표적인 게놈 유전자좌에서 표시된 BE에 의해 유도된 편집 빈도. 20c: 단일-CDA-함유 BE에 의해 유도된 것을 100%로 설정한, 정규화 편집 빈도의 통계 분석. (b)에 도시된 26개 편집가능 시토신 부위에서 3회 독립 실험으로부터 n = 78. 20d: 개략도는 mA3CDA1-nSpCas9-BE의 N-말단과 상이한 시티딘 디아미나제 억제제 (CDI)의 접합을 예시한다. 20e: 하나의 대표적인 게놈 유전자좌에서 표시된 BE에 의해 유도된 편집 빈도. 20f: CDI 없는 BE에 의해 유도된 것을 100%로 설정한, 정규화 편집 빈도의 통계 분석. (e)에 도시된 19개 편집가능한 시토신 부위에서 3회 독립 실험으로부터 n = 57. (b), (e) 평균 ± s.d. 는 3회 독립 실험에 의한다. NT, 비-형질감염 대조군. (c), (f) P 값, 단측 스튜던트 t-검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 21a-f: mA3CDI의 접합은 sgRNA-독립적 OTss 부위에서 비의도적 염기 편집을 감소시켰다. 21a: 개략도는 BE3은 C에서 T 돌연변이를 유도하지만, CDI-접합된 iBE1은 sgRNA-독립적 OTss 부위에서 휴지 상태로 남아 있는다는 것을 예시한다. 21b: nSaCas9-생성된 SSB에 의해 촉발된 ssDNA 영역 내 BE3 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 21c: BE3에 의해 유도된 것을 100%로 설정한, (b)에 도시된 4개 ssDNA 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 12. 21d: 개략도는 CDI의 sgRNA-매개 절단이 온-표적 부위에서 iBE의 편집 활성을 복원시킨다는 것을 예시한다. 21e: 온-표적 부위에서 BE3 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 21f: BE3에 의해 유도된 것을 100%로 설정한, (e)에 도시된 4개 온-표적 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 12. (c), (f) 평균 ± s.d.는 3회 독립 실험에 의하였다. (d), (g) P 값, 단측 스튜던트 t 검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 22a-e: neSpCas9는 OTsg 부위에서 iBE1의 비의도적 편집을 감소시켰다. 22a: 개략도는 iBE2가 아닌 iBE1이 sgRNA와 부분적으로 상보성인 OTsg 부위에서 C에서 T 편집을 유도시킨다는 것을 예시한다. 22b: 표시된 OTsg 부위에서 표적화-특이성-개선된 iBE 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 22c: iBE1에 의해 유도된 것을 100%로 설정한, (b)에서 사용된 2개 sgRNA에 대한 OTsg 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 6. 22d: 온-표적 부위에서 표적화-특이성-개선된 iBE 및 iBE1에 의해 유도된 C에서 T 편집 빈도의 비교. 22e: iBE1에 의해 유도된 것을 100%로 설정한, (d)에 도시된 6개 온-표적 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 18. (b), (d) 평균 ± s.d.는 3회 독립 실험에 의하였다. (c), (e) P 값, 단측 스튜던트 t 검정. 중앙 및 사분위수 범위 (IQR)가 도시된다.
도 23a-e: hA3A-BE3 및 iBE2에 의해 유도된 염기 편집의 비교. 23a: 대표적인 OTss, OTsg, 및 온-표적 부위에서 hA3A-BE3 및 iBE2에 의해 유도된 C에서 T 편집 빈도의 비교. 23b-c: hA3A-BE3에 의해 유도된 것을 100%로 설정한, (a)에서 사용된 3개 sgRNA에 대한 OTss, OTsg (b) 및 온-표적 (c) 부위에서 정규화 누적 편집 빈도의 통계 분석. 3회 독립 실험으로부터 n = 9. 23d: hA3A-BE3에 의해 유도된 것을 1로 설정한, (a)에서 사용된 3개 sgRNA에 대한 OTss 및 OTsg 부위에서 총 편집 빈도에 대한 온-표적화 빈도의 정규화 비율의 통계 분석. 3회 독립 실험으로부터 n = 9. 23e: 개략도는 iBE2가 OTss 또는 OTsg 부위가 아닌 온-표적 부위에서 특이적 염기 편집을 유도하는 반면, hA3A-BE3은 온-표적 부위 및 OTss와 OTsg 부위 둘 모두에서 염기 편집을 유도한다는 것을 예시한다. (a) 평균 ± s.d.는 3회 독립 실험에 의하였다. (b-d) P 값, 단측 스튜던트 t 검정. 중앙 및 IQR이 도시된다.
도 24A-B. 개략도는 isplitBE 및 정규 염기 편집자의 작업 과정을 예시한다. 24A: isplitBE는 오직 온-표적 부위에서 C에서 T 염기 편집을 유도하고 sgRNA의 스페이서 영역에 대해 서열 유사성을 갖는 오프-표적 부위 (OTsg)에서 또는 미관련 오프-표적 ssDNA 영역 (OTss) 내에서 돌연변이의 초래를 피한다. 24B: BE3 또는 hA3A-BE3은 온-표적 부위에서 C에서 T 염기 편집을 유도하지만 OTss 및 OTsg 영역 내 C에서 T 돌연변이를 초래한다.
도 25. 온-표적 부위에서 시티딘 디아미나제 억제제 (mA3CDA2)를 제거하기 위한 상이한 전략을 예시하는 개략도.
도 26A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 EMX1-ON, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 C에서 T 편집. 26A: Sa-sgSITE31을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시하는 개략도. 26B: EMX1-ON, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온-부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서는 편집을 유도하지 않았다.
도 27A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 C에서 T 편집. 27A: 개략도는 Sa-sgVEGFA-7을 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시한다. 27B: FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집을 유도하지 않았다.
도 28A-B. nCas9 (D10A), APOBEC 시티딘 디아미나제, 시티딘 디아미나제 억제제 (CDI), 우라실 DNA 글리코실라제 억제제 (UGI) 및 TEV 프로테아제의 상이한 조합에 의해 유도된 V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위에서 C에서 T 편집. 28A: Sa-sgSITE42를 발현하는 플라스미드 및 SaD10A 닉카제를 발현하는 플라스미드와 표시된 다양한 염기 편집자를 발현하는 플라스미드의 10개 쌍의 공-형질감염을 예시하는 개략도. 28B: V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위에서 편집 효율의 비교. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집을 유도하지 않았다.
도 29A-C. 염기 편집 효율에 대한 헬퍼 sgRNA (hsgRNA) 및 sgRNA 사이 거리의 효과. 29A: DNTET1, EMX1 및 FANCF 부위에서 hsgRNA 및 sgRNA 사이 거리를 예시하는 개략도. 29B: 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도. 29C: hsgRNA 및 sgRNA 사이 거리의 효과 요약. 최고 염기 편집 효율에 대한 거리 범위는 hsgRNA의 PAM에서 sgRNA의 PAM 까지 -91 내지 -34 bp이다.
도 30A-C. 염기 편집 효율에 대한 hsgRNA 스페이서 길이의 효과. 30A: DNEMX1, FANCF 및 V1A 부위에서 상이한 스페이서 길이를 갖는 sgRNA 및 hsgRNA의 공-형질감염을 예시하는 개략도. 30B: hsgRNA 및 sgRNA의 표적 부위에서 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도. 30C: hsgRNA 스페이서 길이 효과의 통계 분석. 10-bp 스페이서를 갖는 hsgRNA의 사용은 hsgRNA 표적 부위에서 편집 효율을 상당히 감소시키지만 sgRNA 표적 부위에서의 편집 효율은 유지시킨다.
도 31. isplitBE-rA1 및 BE3의 편집 효율의 비교. 상이한 표적 부위에서 표시된 염기 편집자에 의해 유도된 편집 빈도.
도 32A-C. isplitBE-rA1 및 BE3에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 비교. 32A: 야생형 293FT 세포 및 APOBEC3 녹아웃 293FT 세포 (293FT-A3KO)에서 mRNA 발현 수준. 32B: 염기 편집자에 의해 유도된 게놈-와이드 C에서 T 돌연변이를 결정하는 절차를 예시하는 개략도. 32C: 온-표적 편집 효율 (좌측) 및 Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-rA1에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 수.
도 33A-C. isplitBE-mA3, BE3 및 hA3A-BE3-Y130F (Y130F)에 의해 유도된 전사체-와이드 C에서 U 돌연변이의 비교. 33A: Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 전사체-와이드 C에서 U 돌연변이의 수. 33B: Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 RNA C에서 U 편집 빈도. 33C: BE3 복제물 1 및 isplitBE-mA3 복제물 1에 의해 유도된 RNA C에서 U 편집의 분포.
도 34A-D. 인간 PCSK9 유전자 내 isplitBE-mA3에 의해 유도된 중지 코돈. 34A: sgRNA 및 hsgRNA와 isplitBE-mA3 및 nCas9의 공-형질감염을 예시하는 개략도. 34B-34D: 표시된 부위에서 isplitBE-mA3에 의해 유도된 편집 효율.
도 35A-B. 아데닌 염기 편집자 (ABE)의 편집 효율에 대한 mA3CDA2의 억제 효과. 35A: sgRNA, 및 mA3CDA2와 융합되거나 또는 그렇지 않은 ABE의 공-형질감염을 예시하는 개략도. 35B: RNF2 및 FANCF 부위에서 표시된 ABE에 의해 유도된 편집 효율.
도 36A-G. 프라임 편집 가이드 RNA (pegRNA)의 조작에 의해 증강된 프라임 편집. 36A: 증강된 pegRNA (epegRNA)의 스템 안정성을 증가시키기 위한 RNA 염기쌍의 변화를 예시하는 개략도. 36B: sgRNA를 닉킹하는, PE2와, pegRNA 또는 epegRNA-GC의 공-형질감염을 예시하는 개략도. 36C-36D: pegRNA 및 epegRNA-GC로 유도된 프라임 편집 효율의 비교. 36E: 증강된 pegRNA (epegRNA)의 스템 안정성을 증강시키기 위한 RNA 염기쌍의 변화를 예시하는 개략도. 36F: sgRNA를 닉킹하는, PE2와, pegRNA 또는 epegRNA-CG의 공-형질감염을 예시하는 개략도. 36G: pegRNA 및 epegRNA-CG로 유도된 프라임 편집 효율의 비교.
도 37A-B. 상이한 Cas9 단백질을 함유하는 PE의 사용에 의한 프라임 편집 시스템. 37A: sgRNA를 닉킹하는, pegRNA와 PE2-NG 또는 xPE2의 공-형질감염을 예시하는 개략도. 37B: PE2-NG 및 xPE2에 의해 유도된 프라임 편집 효율.
도 38A-C. 분할 프라임 편집 (분할-PE) 시스템. 38A: PE 및 분할-PE 시스템의 작업 과정을 예시하는 개략도. 38B: PE 및 분할-PE 시스템의 공-형질감염을 예시하는 개략도. 38C: EMX1 부위에서 PE 및 분할-PE 시스템에 의해 유도된 편집 효율.
도 39A-C. mA3CDA2 코어 영역과 다른 시티딘 디아미나제 도메인의 정렬.
도 40A-D. hA3BCDA1과 다른 시티딘 디아미나제 도메인의 정렬.
정의
용어 "하나" 또는 "한" 독립체는 하나 이상의 그 독립체를 의미한다는 것을 유의하며, 예를 들어, "한 항체"는 하나 이상의 항체를 나타낸다는 것을 이해한다. 이와 같이, 용어 "하나" (또는 "한"), "하나 이상", 및 "적어도 하나"는 본 명세서에서 상호교환적으로 사용될 수 있다.
본 명세서에서 사용되는 용어 "폴리펩티드"는 단수의 "폴리펩티드"를 비롯하여, 다수의 "폴리펩티드"를 포괄하고자 하고, 아미드 결합 (펩티드 결합으로도 알려짐)에 의해 선형으로 연결된 단량체 (아미노산)로 구축된 분자를 의미한다. 용어 "폴리펩티드"는 둘 이상의 아미노산의 임의 사슬 또는 사슬들을 의미하고, 산물의 특별한 길이를 의미하지 않는다. 따라서, 둘 이상의 아미노산의 사슬 또는 사슬들을 지칭하기 위해 사용되는, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질", "아미노산 사슬" 또는 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되고, 용어 "폴리펩티드"는 임의의 이들 용어 대신에, 또는 상호교환적으로 사용될 수 있다. 용어 "폴리펩티드"는 또한 제한없이 글리코실화, 아세틸화, 인산화, 아미드화, 기지의 보호/차단 기에 의한 유도체화, 단백질가수분해 절단, 또는 비천연 발생 아미노산에 의한 변형을 포함한, 폴리펩티드의 발현후 변형 산물을 의미하고자 한다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래될 수 있거나 또는 재조합 기술에 의해 생산될 수 있지만, 반드시 지정된 핵산 서열로부터 번역되는 것은 아니다. 이것은 화학 합성을 포함한, 임의 방식으로 생성될 수 있다.
"상동성" 또는 "동일성" 또는 "유사성"은 2개 펩티드 간 또는 2개 핵산 분자 간 서열 유사성을 의미한다. 상동성은 비교의 목적을 위해 정렬할 수 있는 각 서열 내 위치를 비교하여 결정할 수 있다. 비교된 서열 내 위치가 동일한 염기 또는 아미노산에 의해 점유될 때, 그 분자는 그 위치에서 상동성이다. 서열 간 상동성의 정도는 서열이 공유하는 일치하거나 또는 상동성인 위치의 수의 함수이다. "미관련" 또는 "비-상동성" 서열은 40% 미만의 동일성을 공유하지만, 바람직하게 본 개시의 서열 중 하나와 25% 미만의 동일성이다.
폴리뉴클레오티드 또는 폴리뉴클레오티드 영역 (또는 폴리펩티드 또는 폴리펩티드 영역)은, 정렬했을 때, 염기 (또는 아미노산)의 백분율이 2개 서열을 비교했을 때 동일하다는 것을 의미하는, 다른 서열에 대한 "서열 동일성"의 일정 백분율 (예를 들어, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%)을 갖는다. 이러한 정렬 및 상동성 또는 서열 동일성 백분율은 당분야에 공지된 소프트웨어 프로그램, 예를 들어, [Ausubel et al. eds. (2007) Current Protocols in Molecular Biology]에 기술된 것을 사용해 결정될 수 있다. 바람직하게, 디폴트 매개변수가 정렬에 사용된다. 다른 정렬 프로그램은 디폴트 매개변수를 사용하는, BLAST이다.
용어 "동등한 핵산 또는 폴리뉴클레오티드"는 핵산 또는 이의 상보체의 뉴클레오티드 서열과 일정 정도의 상동성, 또는 서열 동일성을 갖는 뉴클레오티드 서열을 갖는 핵산을 의미한다. 이중 가닥 핵산의 상동성은 일정 정도의 상동성을 갖는 뉴클레오티드 서열 또는 이의 상보체를 갖는 핵산을 포함하고자 한다. 일 양태에서, 핵산의 상동성은 핵산 또는 이의 상보체와 혼성화할 수 있다. 유사하게, "동등한 폴리펩티드"는 기준 폴리펩티드의 아미노산 잔기와 일정 정도의 상동성, 또는 서열 동일성을 갖는 폴리펩티드를 의미한다. 일부 양태에서, 서열 동일성은 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99%이다. 일부 양태에서, 동등한 폴리펩티드 또는 폴리뉴클레오티드는 기준 폴리펩티드 또는 폴리뉴클레오티드와 비교하여 1, 2, 3, 4, 또는 5 첨가, 결실, 치환, 및 그들 조합을 갖는다. 일부 양태에서, 동등한 서열은 기준 서열의 활성 (예를 들어, 에피토프-결합) 또는 구조 (예를 들어, 염-브릿지)를 보유한다.
폴리뉴클레오티드에 적용시 용어 "코딩한다"는 이의 천연 상태에서 또는 당업자에게 충분히 공지된 방법으로 조작했을 때, 폴리펩티드에 대한 mRNA 및/또는 이의 단편을 생산하도록 전사 및/또는 번역될 수 있다면, 폴리펩티드를 "코딩한다"고 할 수 있는 폴리뉴클레오티드를 의미한다. 안티센스 가닥은 이러한 핵산의 상보체이고, 코딩 서열은 그로부터 추론될 수 있다.
무작위 삽입 및 결실을 감소시키기 위한 핵염기 디아미나제 억제제의 사용
실험예 및 도 1-3에 도시된 바와 같이, 현재 통상적으로 사용되는 염기 편집자 BE3 및 hA3A-BE3은 오프-표적 단일 가닥 DNA 영역 내에서 C에서 T 돌연변이를 유도시켰다.
그러나, 놀랍게도, mA3-BE3 내에서 마우스 APOBEC3 (mA3)의 사용 (도 4B, 5B, 6B)이 일반적으로 시험된 표적 부위에서 C에서 T 편집을 유도하지 않았다는 것을 발견하였다 (도 4C, 5C, 6C). mA3은 2개 시티딘 디아미나제 (CDA) 도메인, CDA1 및 CDA2를 갖는다 (도 4A, 5A, 6A). CDA2 도메인이 전체-길이 mA3으로부터 제거되었을 때, 최종 염기 편집자 mA3CDA1-BE3 (도 4B, 5B, 6B)은 실질적 C에서 T 편집을 유도하였다 (도 4C, 5C, 6C). 이들 결과는 mA3-CDA2 도메인이 염기 편집의 억제제인 것을 의미한다.
또한 놀랍게도, mA3-CDA2 도메인은 mA3-CDA1의 염기 편집 활성을 억제할 수 있을 뿐만 아니라, 또한 다른 핵염기 디아미나제를 억제할 수 있다. 예를 들어, mA3-CDA2가 3종의 활성 BE, mA3CDA1-BE3, BE3 및 hA3A-BE3의 각각의 N-말단에 융합되었을 때, 융합 단백질 mA3rev-BE3, mA3-CDA2-BE3 및 mA3-CDA2-hA3A-BE3 (도 4B, 5B, 6B)은 염기 편집 효율을 분명하게 감소시켰다 (도 4C, 5C, 6C).
게다가, 융합 단백질로부터 mA3-CDA2의 절단이 염기 편집 효율을 복원하였고 (도 4C, 5C, 6C), mA3-CDA2의 억제가 BE와 이의 공유 연결과 연관된다는 것을 시사한다.
mA3과 유사하게, 인간 APOBEC3B (hA3B)은 또한 2개 시티딘 디아미나제 (CDA) 도메인, CDA1 및 CDA2 (도 7A, 8A, 9A)를 갖는다. hA3B-BE3 내 전체-길이 hA3B의 도입 (도 7B, 8B, 9B)은 오직 3개의 시험된 표적 부위에서 비교적 낮은 수준의 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 그러나, hA3B-CDA1 도메인을 결실시켜서 생성된, hA3B-CDA2-BE3 (도 7B, 8B, 9B)은 더 높은 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 이들 결과는 hA3B-CDA1이 염기 편집의 다른 억제제이고 hA3B-CDA1의 억제는 BE와 이의 공유 연결과 연관된다는 것을 의미한다.
mA3-CDA2 및 hA3B-CDA1의 서열을 사용하여, 본 발명자는 단백질 데이터베이스에서 추가의 핵염기 디아미나제 억제제/도메인을 확인할 수 있었다. 표 1은 mA3-CDA2 코어 서열에 상동성인 상당한 서열을 갖는 44개 단백질/도메인을 표시하고 (도 39), 표 2는 hA3B-CDA1에 상동성인 유의한 서열을 갖는 43 단백질/도메인을 표시한다 (도 40). 모든 이들 단백질 및 도메인을 비롯하여, 그들 변이체 및 동등물은 핵염기 디아미나제 억제 활성을 갖는다고 여겨진다.
융합 단백질
이들 놀랍고 기대되는 발견을 기반으로, 융합 단백질은 개선된 염기 편집 특이성 및 효율을 갖는 염기 편집자를 생성시키는데 사용될 수 있는 것이 디자인된다. 일 구현예에서, 본 개시는 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 핵염기 디아미나제 억제제를 포함하는 제2 단편, 및 제1 단편 및 제2 단편 사이에 프로테아제 절단 부위를 포함하는 융합 단백질을 제공한다.
이러한 융합 단백질을 도입시킨 염기 편집자는 편집 능력이 감소되었거나 또는 심지어 전무하고, 따라서 감소된 오프-표적 돌연변이를 생성시키게 되거나 또는 전혀 생성시키지 않을 것이다. 프로테아제 절단 부위의 절단 및 표적 부위에서 융합 단백질로부터 핵염기 디아미나제 억제제의 방출 시에 표적 부위에 있는 염기 편집자는 표적 부위를 효율적으로 편집할 수 있을 것이다.
본 명세서에서 사용되는 용어 "핵염기 디아미나제"는 핵염기 예컨대 시티딘, 데옥시시티딘, 아데노신 및 데옥시아데노신의 가수분해 탈아미노화를 촉매하는 효소 그룹을 지칭한다. 핵염기 디아미나제의 비제한적인 예는 시티딘 디아미나제 및 아데노신 디아미나제를 포함한다.
"시티딘 디아미나제"는 각각 시티딘 및 데옥시시티딘의 우리딘 및 데옥시우리딘으로의 비가역적 가수분해 탈아미노화를 촉매하는 효소를 지칭한다. 시티딘 디아미나제는 세포 피리미딘 풀을 유지시킨다. 시티딘 디아미나제의 패밀리는 APOBEC ("아포지질단백질 B mRNA 편집 효소, 촉매적 폴리펩티드-유사")이다. 이러한 패밀리의 구성원은 C에서 U 편집 효소이다. 일부 APOBEC 패밀리 구성원은 2개 도메인을 갖는데, APOBEC 유사 단백질의 한 도메인은 촉매 도메인인 한편, 나머지 도메인은 슈도촉매 도메인이다. 보다 특히, 촉매 도메인은 아연 의존적 시티딘 디아미나제 도메인이고 시티딘 탈아미노화에 중요하다. APOBEC-1에 의한 RNA 편집은 동종이량체화를 필요로 하고 이러한 복합체는 RNA 결합 단백질과 상호작용하여 에디토솜 (editosome)을 형성한다.
APOBEC 단백질의 비제한적인 예는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화-유도 (시티딘) 디아미나제 (AID)를 포함한다.
APOBEC 단백질의 다양한 돌연변이체는 또한 염기 편집자에 상이한 편집 특징을 일으키는 것으로도 알려져 있다. 예를 들어, 인간 APOBEC3A 경우, 일정 돌연변이체 (예를 들어, W98Y, Y130F, Y132D, W104A, D131Y 및 P134Y)는 심지어 편집 효율 또는 편집창의 관점에서 야생형 인간 APOBEC3A를 능가한다. 따라서, 용어 APOBEC 및 이의 패밀리 구성원의 각각은 또한 상응하는 야생형 APOBEC 단백질 또는 촉매 도메인과 일정 수준 (예를 들어, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%)의 서열 동일성을 가지고 시티딘 탈아미노화 활성을 보유하는 변이체 및 돌연변이체를 포괄한다. 변이체 및 돌연변이체는 아미노산 첨가, 결실, 및/또는 치환을 갖게 유도될 수 있다. 일부 구현예에서, 이러한 치환은 보존성 치환이다.
아데노신 아미노히드롤라제, 또는 ADA라고도 알려진, "아데노신 디아미나제"는 푸린 물질대사에 관여하는 효소 (EC 3.5.4.4)이다. 이것은 음식물로부터 아데노신의 분해 및 조직 내 핵산의 턴오버에 필요하다.
아데노신 디아미나제의 비제한적인 예는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)을 포함한다.
핵염기 디아미나제의 일부는 단일, 촉매 도메인을 갖지만, 다른 것들은 또한 본 발명자가 최근에 발견한, 다른 도메인, 예컨대 억제성 도메인을 갖는다. 그러므로, 일부 구현예에서, 제1 단편은 오직 촉매 도메인, 예컨대 mA3-CDA1 및 hA3B-CDA2를 포함한다. 일부 구현예에서, 제1 단편은 적어도 촉매 도메인의 촉매 코어를 포함한다. 예를 들어, 실험예에서 입증되는 바와 같이, mA3-CDA1이 잔기 196/197에서 절단되었을 때, CDA1 도메인은 여전히 실질적 편집 표율을 유지하였다 (도 10C, 11C, 12C).
본 개시는 상응하는 핵염기 디아미나제의 억제성 도메인인, 2개 핵염기 디아미나제 억제제, mA3-CDA2 및 hA3B-CDA1을 시험하였다. 추가적인 핵염기 디아미나제 억제제 및 억제성 도메인은 또한 단백질 데이터베이스에서 확인하였다 (표 1 및 2 참조). 그들의 생물학적 동등물 (예를 들어, 적어도 약 80%, 85%, 90%, 95%, 97%, 98%, 99%, 99.5% 서열 동일성을 갖거나, 또는 1, 2, 또는 3 아미노산 첨가/결실/치환을 갖고, 핵염기 디아미나제 억제제 활성을 가짐)은 또한 보존성 아미노산 치환같이, 당분야에 공지된 방법으로 제조될 수 있다. "핵염기 디아미나제 억제제"는 따라서, 핵염기 디아미나제의 디아미나제 활성을 억제하는 단백질 또는 단백질 도메인을 의미한다. 일부 구현예에서, 제2 단편은 적어도 억제성 단백질/도메인의 억제성 코어를 포함한다. 예를 들어, 실험예에서 입증되는 바와 같이, mA3-CDA2가 잔기 334-429를 보유했을 때, CDA2가 여전히 염기 편집의 억제 효과를 가졌다 (도 13B, 14B, 15B).
일부 구현예에서, 융합 단백질은 임의로 제1 단편 내에, 핵염기 디아미나제 또는 이의 촉매 도메인 옆에, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 더 포함한다.
용어 "Cas 단백질" 또는 "군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질"은 스트렙토코커스 피오게네스 (Streptococcus pyogenes)를 비롯한, 다른 박테리아에서 CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) 적응 면역 시스템과 연관된 RNA-가이드된 DNA 엔도뉴클레아제 효소를 지칭한다. Cas 단백질은 Cas9 단백질, Cas12a (Cpf1) 단백질, Cas12b (이전에 C2c1로 공지) 단백질, Cas13 단백질, 및 다른 조작된 대응물을 포함한다. Cas 단백질의 예는 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, RanCas13b 및 하기 표 A에 제공된 것들을 포함한다.
Figure pct00001
제1 단편 및 제2 단편 사이의 프로테아제 절단 부위는 임의의 프로테아제에 대한 임의의 기지 프로테아제 절단 부위 (펩티드)일 수 있다. 프로테아제의 비제한적인 예는 TEV 프로테아제, TuMV 프로테아제, PPV 프로테아제, PVY 프로테아제, ZIKV 프로테아제 및 WNV 프로테아제를 포함한다. 예시적인 프로테아제 및 그들 상응하는 절단 부위의 단백질 서열은 표 B에 제공된다.
Figure pct00002
Figure pct00003
일부 구현예에서, 프로테아제 절단 부위는 자가-절단 펩티드, 예컨대 2A 펩티드이다. "2A 펩티드"는 진핵생물 세포에서 번역 동안 폴리펩티드의 "절단"을 매개하는 18-22 아미노산-길이 바이러스 올리고펩티드이다. 명칭 "2A"는 바이러스 게놈의 특별한 영역을 지칭하고 상이한 바이러스 2A는 일반적으로 그들이 유래된 바이러스 뒤에 명명된다. 최초로 발견된 2A는 F2A (구제역 바이러스)였고, 그 이후에 E2A (말 비염 A 바이러스), P2A (돼지 테스코바이러스-1 2A), 및 T2A (토세아 아시그나 바이러스 2A)가 또한 동정되었다. 2A 펩티드의 몇몇 비제한적인 예는 SEQ ID NO:26-28로 제공된다.
일부 구현예에서, 프로테아제 절단 부위는 TEV 프로테아제에 대한 절단 부위 (예를 들어, SEQ ID NO:5)이다. 일부 구현예에서, 융합 단백질은 TEV 프로테아제 또는 이의 단편을 포함하는 제3 단편을 더 포함한다. 일부 구현예에서, 활성이 아닌 융합 단백질 내 TEV 프로테아제 단편은 그 자체로 TEV 절단 부위를 절단할 수 없다. 그러나, TEV 프로테아제의 나머지 부분의 존재 하에서, 이러한 단편은 절단을 실행할 수 있을 것이다. 하기에 더욱 기술하는 바와 같이, 이러한 배열은 염기 편집 능력의 추가적인 제어 및 탄성을 제공한다. TEV 단편은 TEV N-말단 도메인 (예를 들어, SEQ ID NO:3) 또는 TEV C-말단 도메인 (예를 들어, SEQ ID NO:4)일 수 있다.
단편의 다양한 배열을 만들 수 있다. 비제한적인 예는 N-말단 측면에서 C-말단 측면으로, 다음을 포함한다:
(1) 제1 단편 (예를 들어, 촉매 도메인) - 프로테아제 절단 부위 - 제2 단편 (예를 들어, 억제성 도메인);
(2) 제1 단편 (예를 들어, 촉매 도메인 및 Cas 단백질) - 프로테아제 절단 부위 - 제2 단편 (예를 들어, 억제성 도메인);
(3) 제1 단편 (예를 들어, 촉매 도메인, Cas 단백질 및 TEV N-말단 도메인) - 프로테아제 절단 부위 (예를 들어, TEV 절단 부위) - 제2 단편 (예를 들어, 억제성 도메인);
(4) 제2 단편 (예를 들어, 억제성 도메인) - 프로테아제 절단 부위 (예를 들어, TEV 절단 부위) - 제1 단편 (예를 들어, 촉매 도메인, Cas 단백질 및 TEV N-말단 도메인); 및
(5) 제2 단편 (예를 들어, 억제성 도메인) - 프로테아제 절단 부위 (예를 들어, TEV 절단 부위) - 제1 단편 (예를 들어, Cas 단백질, 촉매 도메인, 및 TEV C-말단 도메인).
일부 구현예에서, 제1 핵염기 디아미나제 (예를 들어, 시티딘 디아미나제) 또는 이의 촉매 도메인을 포함하는 제1 단편, 및 제2 핵염기 디아미나제의 억제성 도메인을 포함하는 제2 단편을 포함하는 융합 단백질을 제공하고, 제1 핵염기 디아미나제는 제2 핵염기 디아미나제와 상이하다. 일부 구현예에서, 제1 및 제2 핵염기 디아미나제의 각각은 인간 및 마우스 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)의 군으로부터 독립적으로 선택된다.
융합 단백질은 다른 단편, 예컨대 우라실 DNA 글리코실라제 억제제 (UGI) 및 핵 국재화 서열 (NLS)을 포함할 수 있다.
바실러스 서브틸리스 (Bacillus subtilis ) 박테리오파지 PBS1로부터 제조될 수 있는 "우라실 글리코실라제 억제제" (UGI)는 이. 콜라이 (E. coli) 우라실-DNA 글리코실라제 (UDG)를 비롯한 다른 종 유래 UDG를 억제하는 소형 단백질 (9.5 KDa)이다. UDG의 억제는 1:1 UDG:UGI 화학양론의 가역적 단백질 결합에 의해 일어난다. UGI는 UDG-DNA 복합체를 해리시킬 수 있다. UGI의 비제한적인 예는 바실러스 파지 AR9 (YP_009283008.1)에서 발견된다. 일부 구현예에서, UGI는 SEQ ID NO:25의 아미노산 서열을 포함하거나 또는 SEQ ID NO:25와 적어도 적어도 70%, 75%, 80%, 85%, 90% 또는 95% 서열 동일성을 갖고 우라실 글리코실라제 억제 활성을 유지한다.
융합 단백질은, 일부 구현예에서, 하나 이상의 핵 국재화 서열 (NLS)을 포함할 수 있다.
"핵 국재화 신호 또는 서열" (NLS)은 핵 수송을 통해 세포 핵으로 이입을 위한 단백질을 태그하는 아미노산 잔기이다. 전형적으로, 이러한 신호는 단백질 표면 상에 노출된 양으로 하전된 리신 또는 아르기닌의 하나 이상의 짧은 서열로 이루어진다. 상이한 핵 국재화 단백질은 동일한 NLS를 공유할 수 있다. NLS는 핵 외부의 단백질을 표적화하는, 핵 이출 신호 (NES)의 반대 기능을 갖는다. NLS의 비제한적인 예는 내부 SV40 핵 국재화 서열 (iNLS)이다.
일부 구현예에서, 펩티드 링커는 임의로 융합 단백질 내 단편 각각 사이에 제공된다. 일부 구현예에서, 펩티드 링커는 1 내지 100 아미노산 잔기 (또는 제한없이, 3-20, 4-15)를 갖는다. 일부 구현예에서, 펩티드 링커의 아미노산 잔기의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 90%는 알라닌, 글리신, 시스테인, 및 세린으로 이루어진 군으로부터 선택되는 아미노산 잔기이다.
본 개시의 임의의 융합 단백질의 경우에, 이의 생물학적 동등물이 또한 제공된다. 일부 구현예에서, 생물학적 동등물은 기준 융합 단백질과 적어도 약 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 서열 동일성을 갖는다. 바람직하게, 생물학적 동등물은 기준 융합 단백질의 바람직한 활성을 유지하였다. 일부 구현예에서, 생물학적 동등물은 1, 2, 3, 4, 5, 또는 그 이상의 아미노산 첨가, 결실, 치환, 이의 조합을 포함하여 유래된다. 일부 구현예에서, 치환은 보존성 아미노산 치환이다.
"보존성 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 치환되는 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 패밀리는 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 비하전 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 포함하여, 당분야에 정의되어 있다. 따라서, 면역글로불린 폴리펩티드 내 불필수 아미노산 잔기는 바람직하게 동일 측쇄 패밀리로부터의 다른 아미노산 잔기로 치환된다. 다른 구현예에서, 아미노산의 스트링은 측쇄 패밀리 구성원의 조성 및/또는 순서가 상이한 구조적으로 유사한 스트링으로 치환될 수 있다.
보존성 아미노산 치환의 비제한적인 예는 하기 표에 제공되고, 여기서 0 이상의 유사성 점수는 2개 아미노산 간 보존성 치환을 의미한다.
Figure pct00004
Figure pct00005
융합 단백질의 온-표적 활성화
본 개시는 또한 핵염기 디아미나제 또는 이의 촉매 도메인 및 억제제 둘 모두를 포함하는, 본 개시의 융합 단백질이 이의 활성이 바람직한 경우에 활성화되는 조성물 및 방법을 제공한다. 기술은 도 16에 예시되어 있다.
예시적인 구성에서, 융합 단백질 (A)은 (a) 핵염기 디아미나제 (예를 들어, 시티딘 디아미나제) 또는 이의 촉매 도메인과, 임의로 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 제1 TEV 프로테아제 단편을 포함하는 제1 단편, (b) 핵염기 디아미나제 억제제를 포함하는 제2 단편, 및 (c) 제1 단편 및 제2 단편 사이의 TEV 프로테아제 절단 부위를 포함한다. 일부 구현예에서, 제1 TEV 프로테아제 단편은 단독으로 TEV 프로테아제 절단 부위를 절단시킬 수 없다.
융합 단백질이 세포 내에서 유전자 편집을 수행하기 위하여, 시험관내 또는 생체내에서 사용될 때, 2종의 추가 분자가 도입될 수 있다. 일례에서, 하나의 분자 (B)는 RNA 인식 펩티드에 의해 인식될 수 있는 태그 서열을 더 도입시킨 단일 가이드 RNA (sgRNA)이다. 대안적으로, sgRNA는 표적 부위를 표적화하는 crRNA 및 CRISPR RNA (crRNA) 단독으로, 또는 트랜스-활성화 (trans-activating) CRISPR RNA (tracrRNA)와 조합하여, 교체될 수 있다. 태그 서열 및 상응하는 RNA 인식 펩티드의 예는 MS2/MS2 외피 단백질 (MCP), PP7/PP7 외피 단백질 (PCP), 및 boxB/boxB 외피 단백질 (N22p)을 포함하고, 이의 서열을 표 B에 제공된다. 분자 (B)는 RNA 분자를 코딩하는 DNA 서열로서 제공될 수 있다.
다른 추가 분자 (C)는, 일부 구현예에서, RNA 인식 펩티드 (예를 들어, MCP, PCP, N22p)에 커플링된 제2 TEV 프로테아제 단편을 포함한다. 제1 TEV 단편 및 제2 TEV 단편은, 일부 구현예에서, 함께 존재할 때, TEV 프로테아제 부위를 절단할 수 있다.
이러한 동시-존재는 태그 서열-RNA 인식 단백질 상호작용에 의해 분자 (B)에 대한 분자 (C) 결합을 통해 촉발시킬 수 있다. 한편, 융합 단백질 (A) 및 분자 (B)는 유전자 편집을 위한 표적 게놈 유전자좌에 둘 모두가 존재할 것이다. 그러므로, 분자 (B)는 융합 단백질 (A)로부터의 TEV 프로테아제 단편 및 분자 (C) 둘 모두를 함께 있게 하여, TEV 프로테아제를 활성화시키게 되어, 융합 단백질로부터 핵염기 디아미나제 억제제의 제거 및 염기 편집자의 활성화를 초래한다. 이러한 활성화는 오프-표적 단일 가닥 DNA 영역이 아닌, 오직 표적 게놈 부위에서만 일어난다는 것을 쉽게 이해할 수 있다. 이와 같이, 염기 편집은 (도 17-19에서 입증된 바와 같이) sgRNA가 결합하지 않는 단일 가닥 DNA 영역에서 일어나지 않는다.
"가이드 RNA"는 상보성 표적 DNA 서열에 결합하는 비-코딩 짧은 RNA 서열이다. 가이드 RNA는 먼저 Cas 효소에 결합하고 gRNA 서열은 DNA 상의 특이적 위치와의 쌍형성을 통해 복합체를 가이드하며, 여기서 Cas는 표적 DNA 가닥을 절단하여 이의 엔도뉴클레아제 활성을 수행한다. "단일 가이드 RNA"는 종종 단순하게 "가이드 RNA"라고도 하며, 단일 구성체로서 crRNA 및 tracrRNA 둘 모두로 이루어진 합성 또는 발현 단일 가이드 RNA (sgRNA)를 지칭한다. tracrRNA 부분은 Cas 엔도뉴클레아제 활성을 담당하고 crRNA 부분은 표적 특이적 DNA 영역에 결합한다. 그러므로, 트랜스 활성화 RNA (tracrRNA, 또는 스캐폴드 영역) 및 crRNA는 2개의 핵심 성분이고 sgRNA의 형성을 일으키는 테트라루프에 의해 연결된다.
가이드 RNA의 스캐폴드는 그 자체로 스템-루프 구조를 가지며 엔도뉴클레아제 효소에 부착된다. 전형적인 스캐폴드는 도 36A (위)에 예시된 바와 같은 구조를 갖는데, 이 구조는 5'에서 3' 말단으로, (a) 반복 영역, (b) 테트라루프, (c) 반복 영역에 적어도 부분적으로 상보성인 안티-반복부, (d) 스템 루프 1, (e) 링커, (f) 스템 루프 2, 및 (g) 스템 루프 3을 포함한다. 스캐폴드 서열은 일반적으로 보존되지만, 스템 루프 1 및 스템 루프 3의 루프는 상이한 서열을 가질 수 있다. 보다 중요하게, 테트라루프 및 스템 루프 2의 루프는 훨씬 더 긴 서열로 전체적으로 치환될 수 있다. 서열 예컨대 RNA 태그 (예를 들어, MS2, PP7, boxB)가 여기에 삽입될 수 있어서, 상응하는 인식 펩티드에 의해 인식될 수 있다. 스캐폴드 서열의 예는 하기에 표시된다.
Figure pct00006
이들 예의 스캐폴드 서열을 참조하여, 위치 1-12의 단편 (예를 들어, GUUUUAGAGCUA, SEQ ID NO:197; GUUUGAGAGCUA, SEQ ID NO:198)은 위치 17-30 (예를 들어, UAGCAAGUUAAAAU, SEQ ID NO:199)을 포함하는, 안티-반복부를 갖는 약 8-12 염기쌍을 형성하는, 반복 영역을 나타낸다. 그들 사이의 GAAA 루프 (SEQ ID NO:200)는 테트라루프이다. SEQ ID NO:17에 표시된 바와 같이, 이러한 전체 루프는 MS2 서열로 치환될 수 있다. 스템 루프 1은 대체로 위치 31-39를 포함하고 소형 루프 (예를 들어, 제한없이, UA, AU, AA, 또는 UU)를 포함한다. 스템 루프 1은 일반적으로 스템 내에 3-4 염기쌍을 갖는다. 위치 48-61 (예를 들어, AACUUGAAAAAGUG, SEQ ID NO:201)을 포함하는, 스템 루프 2는 일반적으로 스템 내에 4 염기쌍, 및 전체로 치환될 수 있는 GAAA (SEQ ID NO:200) 루프를 포함한다. 나머지, 위치 62-76 (예를 들어, GCACCGAGUCGGUGC, SEQ ID NO:202; GCACCGAUUCGGUGC; SEQ ID NO:203)은 일반적으로 스템 내에 4 염기쌍을 포함하는, 스템 루프 3을 구성한다. 소형 루프 (여기 예에서 U 및 G)는 임의의 뉴클레오티드일 수 있다.
따라서, 스캐폴드의 서열은 다음과 같이 표시될 수 있다:
Figure pct00007
여기서 N은 임의 염기를 나타내고, X1 및 X2는 2-50 염기 길이의 임의 뉴클레오티드 서열을 표시한다. 용어 "가이드 RNA" 및 "단일 가이드 RNA"는 RNA 내 하나 이상의 루프에 삽입되는, 추가 서열, 예컨대 MS2, PP7 및 boxB를 포함하는 것을 포괄한다.
핵염기 디아미나제, 촉매 도메인, 핵염기 디아미나제 억제제, 및 Cas 단백질의 다양한 구현예 및 예가 본 개시에서 제공된다. 예를 들어, 핵염기 디아미나제는 시티딘 디아미나제 및 아데노신 디아미나제일 수 있다. 시티딘 디아미나제의 비제한적인 예는 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4, 및 활성화-유도 (시티딘) 디아미나제를 포함한다.
아데노신 디아미나제의 비제한적인 예는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)을 포함한다.
Cas 단백질의 예는 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, RHA FnCas9, 및 KKH SaCas9 및 표 A에 제공된 것을 포함한다.
융합 단백질은 다른 단편, 예컨대 우라실 DNA 글리코실라제 억제제 (UGI) 및 핵 국재화 서열 (NLS)을 포함할 수 있고, 이의 각각은 본 명세서에서 논의된다.
본 개시에 기술된 염기 편집자 및 염기 편집 방법은 다양한 진핵생물의 게놈에서 높은-특이성 및 높은-효율 염기 편집을 수행하기 위해 적용될 수 있다.
본 개시는 조성물 및 방법을 제공한다. 이러한 조성물은 융합 단백질의 유효량, 및 허용가능한 담체를 포함한다. 일부 구현예에서, 조성물은 표적 DNA에 대해 바람직한 상보성을 갖는 가이드 RNA를 더 포함한다. 이러한 조성물은 샘플에서 염기 편집을 위해 사용될 수 있다.
융합 단백질 및 조성물은 염기 편집을 위해 사용될 수 있다. 일 구현예에서, 표적 폴리뉴클레오티드를 편집하기 위한 방법에 제공되고, 방법은 표적 폴리뉴클레오티드에, 본 개시의 융합 단백질 및 표적 폴리뉴클레오티드에 대해 적어도 부분적인 서열 상보성을 갖는 가이드 RNA를 접촉시키는 단계를 포함하고, 여기서 편집은 표적 폴리뉴클레오티드 내 시토신 (C)의 탈아미노화를 포함한다.
일 구현예에서, 샘플에서 핵산 서열 상의 시토신을 편집하는 방법을 제공한다. 일부 구현예에서, 방법은 샘플을 본 개시의 융합 단백질, 또는 융합 단백질을 코딩하는 폴리뉴클레오티드를 접촉시키는 단계를 포함한다. 일부 구현예에서, 적합한 가이드 RNA가 더 첨가된다. 가이드 RNA의 디자인은 당업자가 쉽게 이용가능하다.
융합 단백질 (및 가이드 RNA) 및 표적 폴리뉴클레오티드 간 접촉은 생체 내, 특히 세포 배양일 수 있다. 접촉이 생체외, 또는 생체내일 때, 융합 단백질은 임상적/치료적 유의성을 나타낼 수 있다. 생체내 접촉은 살아있는 대상체, 예컨대 제한없이, 인간, 동물, 효모, 식물, 박테리아, 바이러스에 대한 투여일 수 있다.
유도 및 분할 염기 편집자의 구성
구성체의 다양한 구성을 시험하여 유도 및 분할 염기 편집자 (isplitBE) 디자인 (도 24)을 구현하였다. 시험된 구성 (도 25) 중에서, 실시예 3의 쌍 9는 우수한 편집 효율 및 최소화된 오프-표적 편집 (상당히 개선된 특이성)을 나타내었다. 쌍 9는 헬퍼 sgRNA (hsgRNA)가 주요 표적 부위에 근접한 부위를 표적화하는데 사용되는, 이중 sgRNA 시스템을 적용한다. 이러한 이중 표적화는 특이성을 개선시킨다 (도 32-33).
쌍 9의 구성 (도 25-28)에서, 핵염기 디아미나제 억제제는 오직 sgRNA 둘 모두가 표적 서열에 결합할 때만 방출되어서, 핵염기 디아미나제가 오프-표적 부위에서 편집되지 않는다는 것을 보장한다. 구성 쌍 9는 예를 들어, 2개의 별도 구성체로부터 생산될 수 있는, 6개의 상이한 분자를 포함한다 (도 26A 및 34A).
제1 분자는 일반 비히클, AAV에 패키징을 위해 적합한 크기를 갖는, 단지 Cas 단백질을 포함할 수 있다. 제2 분자는 특히, 핵염기 디아미나제 (예를 들어, APOBEC), 핵염기 디아미나제 억제제 (예를 들어, mA3-CDA2), 및 RNA 인식 펩티드 (예를 들어, MCP)를 포함한다. 프로테아제 절단 부위 (예를 들어, TEV 부위)는 핵염기 디아미나제 및 핵염기 디아미나제 억제제 사이에 삽입되고, 적절한 시기/위치에서 핵염기 디아미나제 억제제의 제거를 가능하게 한다. 임의로, 제2 분자는 UGI를 더 포함한다.
제3 분자는 상이한 RNA 인식 펩티드 (예를 들어, N22p)에 융합된 프로테아제 (예를 들어, TEVc)의 불활성화 부분 간 융합체이다. 제4 분자는 제1 부분과 조합하여, 제2 분자로부터 핵염기 디아미나제 억제제를 제거시키기 위한 프로테아제 활성을 수행할 수 있는, 독립형 TEVn이다.
제5 분자는 제2 분자 내 RNA 인식 펩티드에 의해 인식가능한 RNA 인식 부위 (예를 들어, MS2)를 함유하는 헬퍼 sgRNA이다. 제6 분자는 제3 분자 내 RNA 인식 펩티드에 의해 인식가능한 RNA 인식 부위 (예를 들어, boxB)를 함유하는 정규 sgRNA이다.
게놈 (또는 RNA) 내 올바른 표적 부위에서, hsgRNA 및 sgRNA 둘 모두가 결합될 것이고, 각각은 Cas 단백질을 결합 부위로 동원시킨다. hsgRNA는 또한 MS2-MCP 결합에 의해서 제2 분자를 동원할 것이고, sgRNA는 boxB-N22p 결합에 의해서 제3 분자에 결합할 것이다. 그러므로, 제3 분자의 TEVc는 TEV 부위와 접촉된다. 독립형 TEVn이 전체 세포에서 존재하므로, 이것이 또한 여기에 존재할 수 있고, TEVc가 활성이고 분자 2의 핵염기 디아미나제로부터 핵염기 디아미나제 억제제를 절단하여서, 핵염기 디아미나제를 활성화시키는 것을 보장한다.
hsgRNA 결합 부위 및 정규 sgRNA 결합 부위 간 최적 거리는 34-91 bp (PAM에서 PAM)이고, hsgRNA가 상류에 있는 것을 더욱 발견하였다.
게다가, hsgRNA 및 정규 sgRNA 둘 모두의 적절한 결합이 정규 sgRNA에 대한 표적 부위 내 의도된 편집에 필요하지만, hsgRNA에 대한 표적 부위 내 편집이 바람직하지는 않다. hsgRNA (스페이서는 표적 상보성 영역임)의 스페이서 길이가 8-15 염기일 때, 이러한 hsgRNA는 결합 특이성을 보장하지만, hsgRNA 표적 부위에서의 편집을 상당히 감소시키는 이중 인식을 제공하기에 여전히 충분하다는 것을 본 명세서에서 발견하였다.
그러므로, 본 개시의 일 구현예에 따라서, 핵염기 디아미나제 또는 이의 촉매 도메인, 핵염기 디아미나제 억제제, 제1 RNA 인식 펩티드, 및 핵염기 디아미나제 또는 이의 촉매 도메인 및 핵염기 디아미나제 억제제 사이의 TEV 프로테아제 절단 부위를 포함하는 제1 단편을 포함하는 융합 단백질을 제공한다.
일부 구현예에서, 융합 단백질은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편, 및 제2 RNA 인식 펩티드를 포함하는 제2 단편을 더 포함한다. 일부 구현예에서, 융합 단백질은 제1 단편 및 제2 단편 사이에 자가-절단 부위를 더 포함한다.
일부 구현예에서, 융합 단백질은 제2 TEV 프로테아제 단편을 포함하는 제3 단편을 더 포함하고, 여기서 제1 TEV 프로테아제 단편은 제2 TEV 프로테아제 단편의 존재 하에서 TEV 프로테아제 부위를 절단할 수 있다. 일부 구현예에서, 융합 단백질은 제2 단편 및 제3 단편 사이에 제2 자가-절단 부위를 더 포함하고, 제2 자가-절단 부위의 절단 시에, 융합 단백질은 임의의 RNA 인식 펩티드에 융합되지 않은 제2 TEV 프로테아제 단편을 방출한다.
또한, 일 구현예에서, 제1 PAM 부위에 근접한 표적 핵산 서열에 상보성인 서열을 갖는 제1 스페이서를 포함하는 표적 단일 가이드 RNA, 제2 PAM 부위에 근접한 제2 핵산 서열에 상보성인 서열을 갖는 제2 스페이서를 포함하는 헬퍼 단일 가이드 RNA, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제를 포함하는, 이중 가이드 RNA 시스템을 제공한다.
일부 구현예에서, 제2 PAM 부위는 제2 PAM 부위로부터 150 염기 이내, 또는 대안적으로 140, 130, 120, 110, 100, 95, 94, 93, 92, 91, 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 75 또는 70 염기 이내에 위치된다. 일부 구현예에서, 제2 PAM 부위는 제1 PAM으로부터 적어도 10 염기, 또는 대안적으로 적어도 15, 20, 25, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45, 50, 55, 또는 60 염기이다. 일부 구현예에서, 제2 PAM 부위는 제1 PAM 부위로부터 상류에 있다. 일부 구현예에서, 제2 PAM 부위는 제1 PAM 부위로부터 하류에 있다. 일부 구현예에서, 거리는 제한없이, 20-100, 25-95, 30-95, 34-95, 34-91, 34-90, 35-90, 40-90, 40-84, 45-85, 또는 50-80 염기이다.
일부 구현예에서, 제2 (헬퍼) 스페이서는 8-15 염기 길이이다. 일부 구현예에서, 제2 스페이서는 8-14, 8-13, 8-12, 8-11, 8-10, 9-15, 9-14, 9-13, 9-12, 9-11, 9-10, 10-15, 10-14, 10-13, 10-12, 10-11, 11-15, 11-14, 11-13, 11-12, 12-15, 12-14, 12-13, 또는 13-15 염기 길이이다. 대조적으로, 제1 스페이서는 적어도 16, 17, 18, 또는 19 염기 길이이다.
다양한 "분할" 염기 편집 시스템이 또한 본 명세서에 기술되어 있는데, 이것은 Cas 단백질 및 핵염기 디아미나제가 별도 전달 비히클 (예를 들어, AAV)에 패키징될 수 있게 허용한다.
일부 구현예에서, 임상적 이득을 가질 수 있는, PCSK9 유전자 내에 초기 중지 코돈을 생성시키기 위해서 효율적인 편집을 매개할 수 있는 정규 sgRNA 및 hsgRNA의 쌍이 제공된다. 여기서의 발견들을 기반으로, sgRNA 및 hsgRNA에 적합한 표적 부위는 비-중지 코돈을 중지 코돈으로 전환시키기 위해 선택되었다. C에서 T/U 편집을 예로 하여, 비-중지 코돈은 CAG, CAA 또는 CGA일 수 있다.
이러한 표적 부위의 예는 표 4에 예시된다. 표 4의 서열은 표적의 위치를 보여주는데 사용된다는 것을 쉽게 이해한다. 그러나, 실제 sgRNA 및 hsgRNA는 전체 서열에 결합할 필요는 없다. 사실, 예를 들어, hsgRNA 경우에, 8-15 뉴클레오티드의 결합은 상기에 설명된 바와 같이 당연히 충분할 수 있다. 따라서, hsgRNA 상의 스페이서 서열은 임의의 표 4에 표시된 하위-서열에 상보성일 수 있거나, 또는 심지어 임의의 그들과 중복될 수 있다. 제한없이, 18-24 뉴클레오티드의 바람직한 스페이서 길이를 갖는, sgRNA에 대해서도 역시 동일하게 진실이다.
일 구현예에서, 인간 PCSK9 핵산 서열을 편집하기 위한 헬퍼 가이드 RNA/가이드 RNA의 쌍이 제공되고, 여기서 가이드 RNA는 비-중지 코돈을 중지 코돈으로 전환시키도록 염기 편집을 할 수 있도록 PCSK9 핵산 상의 제1 부위를 특이적으로 표적화하고, 헬퍼 가이드 RNA는 제1 부위로부터 20 내지 100 염기인 PCSK9 핵산 상의 제2 부위를 특이적으로 표적화한다. 일부 구현예에서, 제2 부위는 제1 부위로부터 멀리 약 20-100, 25-95, 30-95, 34-95, 34-91, 34-90, 35-90, 40-90, 40-84, 45-85, 또는 50-80 염기에 존재한다.
일부 구현예에서, hsgRNA는 8-15 염기 길이인 스페이서를 갖는다. 일부 구현예에서, 스페이서는 8-14, 8-13, 8-12, 8-11, 8-10, 9-15, 9-14, 9-13, 9-12, 9-11, 9-10, 10-15, 10-14, 10-13, 10-12, 10-11, 11-15, 11-14, 11-13, 11-12, 12-15, 12-14, 12-13, 또는 13-15 염기 길이이다. 일부 구현예에서, sgRNA는 적어도 16, 17, 18, 또는 19 염기 길이인 스페이서를 갖는다.
sgRNA/hsgRNA에 대한 스페이서 서열을 쉽게 디자인할 수 있다. 예를 들어, 표 4에 표시된 각각의 표적 부위 경우에, 스페이서는 바람직한 길이의 상보성 (즉, SEQ ID NO:166-180 또는 181-195 중 어느 하나의 하위-서열에 상보성) 서열일 수 있다. 결합 부위의 쌍의 특별한 예는 제한없이, SEQ ID NO:166 및 181; SEQ ID NO:167 및 182; SEQ ID NO:168 및 183; SEQ ID NO:169 및 184; SEQ ID NO:170 및 185; SEQ ID NO:171 및 186; SEQ ID NO:172 및 187; SEQ ID NO:173 및 188; SEQ ID NO:174 및 189; SEQ ID NO:175 및 190; SEQ ID NO:176 및 191; SEQ ID NO:177 및 192; SEQ ID NO:178 및 193; SEQ ID NO:179 및 194; 및 SEQ ID NO:180 및 195를 포함한다.
예시적인 sgRNA/hsgRNA 서열을 또한 디자인하였고 시험되었다. 표 3을 참조한다. 게다가, 헬퍼 가이드 RNA 및 가이드 RNA를 코딩하는 폴리뉴클레오티드 서열이 또한 제공된다.
sgRNA/hsgRNA 서열의 이러한 쌍을 사용하여, 세포 내 PSCK9 유전자를 불활성화시키는 방법을 수행할 수 있다. 일부 구현예에서, 방법은 세포를 본 개시의 헬퍼 가이드 RNA 및 가이드 RNA의 쌍, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제를 접촉시키는 단계를 수반한다. 이들 구성요소의 각각은 본 개시에서 더욱 기술되었다.
증강된 프라임 편집
일부 구현예에서, 개선된 프라임 편집 시스템이 또한 제공된다. 특히, 본 명세서에 제공된 일정 프라임 편집 가이드 RNA (pegRNA) 분자는 개선된 안정성을 갖는다. 이들 pegRNA는 통상의 가이드 RNA와 비교하여, 하나의 추가적 염기쌍을 갖는 스캐폴드를 함유한다 (도 36A 및 36E 참조). 주형에서 표준 스캐폴드 (SEQ ID NO:31)를 사용하여, 개선된 스캐폴드는 SEQ ID NO:32-43 중 어느 하나의 서열을 가질 수 있다.
상기 논의된 바와 같이, 전형적인 가이드 RNA 스캐폴드는 5'에서 3' 말단으로, (a) 반복 영역, (b) 테트라루프, (c) 반복 영역에 적어도 부분적으로 상보성인 안티-반복부, (d) 스템 루프 1, (e) 링커, (f) 스템 루프 2, 및 (g) 스템 루프 3을 포함하는 구조를 갖는다. 달리 말해서, 스캐폴드는 4 스템 루프를 포함한다. "스템 루프 2"로도 지칭되는, 제3 스템 루프 (5'에서 3'으로 계산)는 통상의 디자인에서 4 염기쌍을 포함한다. 새로운 디자인에서, 이러한 스템 루프는 5 염기쌍을 갖는다.
일 구현예에서, 5'에서 3' 방향으로, 제1 스템 루프 부분, 제2 스템 루프 부분, 제3 스템 루프 부분, 및 제4 스템 루프 부분을 포함하는, 스캐폴드를 포함하는 가이드 RNA를 제공하고, 여기서 제3 스템 루프는 그 안에 5 염기쌍을 포함한다.
스캐폴드의 서열은 다음과 같이 표시될 수 있다:
Figure pct00008
여기서 N은 임의 염기를 나타내고, X1 및 X2는 2-50 염기 (또는 2-40, 3-40, 4-40, 4-30, 2-30, 4-20 염기)의 길이의 임의의 뉴클레오티드 서열을 표시한다. 따라서, 일부 구현예에서, 염기쌍은 SEQ ID NO:31 내 위치에 따라서, 위치 45 및 55 사이의 하나를 포함한다. 일부 구현예에서, 스캐폴드는 SEQ ID NO:31에 대해 적어도 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖고 제3 스템 루프 내에 제공된 염기쌍을 포함한다.
그러므로, 일 구현예에서, 위치 45 및 위치 55의 염기 사이에 염기쌍을 도입시키고, 임의로, 스템 루프 구조 또는 스캐폴드/가이드 RNA 기능성을 유지하는 한, 1, 2, 3, 4, 또는 5 염기 첨가, 결실, 치환, 또는 이의 조합을 허용하여, SEQ ID NO:31로부터 유래된 스캐폴드를 포함하는 가이드 RNA를 제공한다. 일부 구현예에서, 스캐폴드는 SEQ ID NO:32-43으로 이루어진 군으로부터 선택되는 서열을 포함한다. 일부 구현예에서, 가이드 RNA는 적어도 100 뉴클레오티드, 또는 105, 110, 115, 120, 125, 130, 140 또는 150 뉴클레오티드 길이이다. 일부 구현예에서, 가이드 RNA는 스페이서 (예를 들어, 8-25 뉴클레오티드), 역전사효소 주형, 및/또는 프라이머-결합 부위를 더 포함한다.
일부 구현예에서, 또한, 개선된 프라임 편집자 단백질이 제공된다. 일 구현예에서, 프라임 편집자는 프라임 편집자의 성능을 최적화하기 위해서 시험된 링커를 통해서 연결된 Cas 단백질 및 역전사효소를 포함한다. 일 구현예에서, 프라임 편집자는 SEQ ID NO:44의 아미노산 잔기를 포함한다. 일 구현예에서, 프라임 편집자는 SEQ ID NO:45의 아미노산 잔기를 포함한다. 이들 프라임 편집자 둘 모두를 시험하였고 우수한 편집 효율 및 특이성을 나타내는 것을 확인하였다.
Cas 단백질 및 역전사효소가 별도 전달 비히클 (예를 들어, AAV)로 패키징되도록 허용하는, 다양한 "분할" 프라임 편집 시스템이 또한 여기서 기술된다.
분할 프라임 편집 시스템을 사용하여, 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법이 또한 제공된다. 일부 구현예에서, 방법은 세포로 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 코딩하는 제1 구성체가 밀봉된 제1 바이러스 입자, 및 RNA 인식 펩티드에 융합된 역전사효소를 코딩하는 제2 구성체가 밀봉된 제2 바이러스 입자를 도입시키는 단계를 수반한다. 일부 구현예에서, 제2 구성체는 RNA 인식 펩티드가 결합되는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩한다.
일부 구현예에서, 제2 구성체는 RNA 인식 펩티드가 결합하는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩한다. 일부 구현예에서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택된다. 일부 구현예에서, Cas 단백질은 SpCas9-NG 또는 xSpCas9이다.
역전사효소의 비제한적인 예는 인간 면역결핍 바이러스 (HIV) 역전사효소, 몰로니 쥐 백혈병 바이러스 (MMLV) 역전사효소 및 조류 골수아세포종 바이러스 (AMV) 역전사효소를 포함한다.
실시예
실시예 1. 오프-표적 편집 활성이 감소된 융합 염기 편집자
실시예에서 언급된 단일-가이드 RNA (sgRNA) 및 염기 편집자 (BE)는 특별히 지적하지 않으면, SpCas9에 대한 것이고, 예를 들어, SaCas9에 대한 sgRNA (Sa-sgRNA)이다. 현행 염기 편집 시스템이 ssDNA 영역 내에서 C에서 T 돌연변이를 유도할 수 있는지 여부를 시험하기 위해서, ssDNA 영역을 생성시키기 위해 말단 후퇴를 촉발시킬 수 있는, DNA 단일 가닥 파손 (SSD)을 만들기 위해서 SaD10A 닉카제 및 Sa-sgRNA를 사용하였다 (도 1A, 2A 및 3A). SaD10A, Sa-sgRNA (Sa-sgSITE31, Sa-sgSITE42 및 Sa-sgF1)와 2개의 공개된 BE, 즉, BE3 및 hA3A-BE3 또는 빈 벡터를 공-형질감염시켰고 (도 1B, 2B 및 3B) SaD10A에 의해 촉발된 ssDNA 영역 주변에서 돌연변이유발을 결정하였다. 3개의 시험된 부위 (Sa-SITE31, Sa-SITE42 및 Sa-F1)에서, BE3 또는 hA3A-BE3의 발현은 C에서 T 돌연변이를 유발시켰지만, 빈 벡터의 발현은 그렇지 않았다 (도 1C, 2C 및 3C). 이들 결과는 촉매적 활성 시티딘 디아미나제를 함유하는 현행 염기 편집자가 실제로 미관련 ssDNA 영역에서 비의도적 돌연변이를 초래한다는 것을 의미한다 (도 1, 2 및 3).
미관련 부위, 예를 들어, ssDNA 영역에서 시티딘 디아미나제의 활성을 억제하기 위해서, 염기 편집자를 염기 편집 억제제와 융합시키는 것을 제안하였다. 마우스 APOBEC3 (mA3)은 2개 시티딘 디아미나제 (CDA) 도메인 (CDA1 및 CDA2, 도 4A, 5A, 6A)을 포함하고 mA3-BE3에서 전체-길이 mA3의 사용 (도 4B, 5B, 6B)은 3개의 시험된 표적 부위에서 C에서 T 편집을 유도시키지 않았다 (도 4C, 5C, 6C). 그러나, mA3CDA2를 mA3-BE3으로부터 결실시켜 생성시킨, mA3CDA1-BE3 (도 4B, 5B, 6B)은 실질적 C에서 T 편집을 유도하였다 (도 4C, 5C, 6C). 이들 결과는 mA3CDA2가 염기 편집의 천연 억제제라는 것을 시사한다. 따라서, 우리는 mA3CDA2를 3개의 활성 BE, 즉, mA3CDA1-BE3, BE3 및 hA3A-BE3의 N-말단에 첨가하여서, mA3rev-BE3, mA3CDA2-BE3 및 mA3CDA2-hA3A-BE3을 생성시켰다 (도 4B, 5B, 6B). 우리가 기대한 바와 같이, N-말단에 mA3CDA2의 첨가는 분명하게 염기 편집 효율을 감소시켰다 (도 4C, 5C, 6C).
다음으로, 우리는 mA3CDA2의 절단이 염기 편집 효율을 복원시킬 수 있는지 여부를 고려하였다. 2A 자가-절단 펩티드는 mA3CDA2 및 mA3rev-BE3, mA3CDA2-BE3 및 mA3CDA2-hA3A-BE3 내 BE의 나머지 부분 사이에 삽입시켜서 mA3rev-2A-BE3, mA3CDA2-2A-BE3 및 mA3CDA2-2A-hA3A-BE3을 생성시켰다 (도 4B, 5B, 6B). 상응하여, 염기 편집 효율이 mA3rev-2A-BE3, mA3CDA2-2A-BE3 and mA3CDA2-2A-hA3A-BE3에서 복원되었고 (도 4C, 5C, 6C), mA3CDA2의 억제가 BE에 대한 이의 공유 연결에 의존적이라는 것을 의미한다. 우리는 또한 mA3CDA2 코어 서열과 유사한 도메인에 대해서 단백질 데이터베이스를 검색하였고 적어도 44 단백질이 유사한 도메인을 갖는다는 것을 발견하였다 (표 1).
인간 APOBEC3B (hA3B)는 또한 2개 시티딘 디아미나제 (CDA) 도메인 (CDA1 및 CDA2, 도 7A, 8A, 9A)을 포함하고, hA3B-BE3 내 전체-길이 hA3B의 사용 (도 7B, 8B, 9B)은 오직 3개의 시험된 표적 부위에서 상대적으로 낮은 수준의 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 그러나, hA3BCDA1을 hA3B-BE3으로부터 결실시켜 생성된 hA3BCDA2-BE3 (도 7B, 8B, 9B)은 더 높은 C에서 T 편집을 유도하였다 (도 7C, 8C, 9C). 또한, 2A 자가-절단 펩티드는 hA3BCDA1 및 hA3BCDA2 사이에 삽입되어서 hA3B-2A-BE3을 생성시켰고 (도 7B, 8B, 9B), 이것은 hA3B-BE3에 비해서 더 높은 C에서 T 편집 효율을 유도시켰다 (도 7C, 8C, 9C). 이들 결과는 hA3BCDA1이 염기 편집의 다른 억제제이고 hA3BCDA1의 억제는 BE에 대한 이의 공유 연결에 의존한다는 것을 시사한다. 우리는 또한 hA3BCDA1에 유사한 도메인에 대해서 단백질 데이터베이스를 검색하여 유사한 도메인을 갖는 적어도 43개 단백질을 발견하였다 (표 2).
다음으로, 우리는 신규 BE를 개발하기 위해 mA3을 사용하는 것을 계획하였다. 2개 BE, mA3rev-BE3 및 mA3rev-2A-BE3은 mA3을 아미노산 (AA)207 및 AA208 사이에서 분할하여 만들었고, mA3CDA2가 최고 편집 효율을 유지할 수 있는 분할 지점을 결정하였다 (도 10A, 11A, 12A). mA3CDA1이 아미노산 (AA)154에서 종결되고 mA3CDA2가 AA238로부터 출발하므로, 우리는 mA3CDA2를 AA196/AA197, AA215/AA216, AA229/AA230 및 AA237/AA238에서 분할시켜서 mA3rev-BE3-196, mA3rev-2A-BE3-196, mA3rev-BE3-215, mA3rev-2A-BE3-215, mA3rev-BE3-229, mA3rev-2A-BE3-229, mA3rev-BE3-237, 및 mA3rev-2A-BE3-237을 생성시켰다 (도 10B, 11B, 12B). AA207/AA208 및 AA215/AA216에서 mA3의 분할이 최고 편집 효율을 유지하지만, 결과는 또한 AA196/AA197 내지 AA237/AA238을 포괄하는 분할 부위가 일반적으로 실질적 편집 효율을 유지시키는 것으로 확인되었다 (도 10C, 11C, 12C).
더 나아가서, 우리는 염기 편집 억제 효과를 갖는 mA3의 최소 영역을 결정하고자 노력하였다. 우리는 mA3rev-BE-237 내 mA3CDA2의 다양한 N-말단 부분을 결실시켜서 mA3rev-BE-27-Del-255, mA3rev-BE-237-Del-285 및 mA3rev-BE-237-Del-333을 개발하였고, 이것은 각각 염기 편집 억제제로서 mA3의 AA256-AA429, AA286-AA429 및 AA334-AA429 부분을 함유한다 (도 13A, 14A, 15A). mA3의 AA238-AA429 부분을 함유하는, mA3rev-BE-237과 비교하여, mA3rev-BE-237-Del-255, mA3rev-BE-237-Del-285 및 mA3rev-BE-237-Del-333은 유사한 편집 효율을 보였다 (도 13B, 14B, 15B). 이들 결과는 mA3의 AA334-AA429 부분은 여전히 염기 편집의 억제 효과를 갖는다는 것을 의미한다.
미관련 ssDNA 영역 내에서 C에서 T 돌연변이를 초래하지 않는 염기 편집자를 개발하기 위해서, 우리는 2A 자가-절단 부위를 mA3rev-2A-BE3 내 TEV 프로테아제의 절단부위로 치환시킨 다음에 TEV 프로테아제의 N-말단 부분 (TEVn) [Gray et al., 2010, Cell, doi: 10.1016/j.cell.2010.07.014]을 다른 TEV 절단 부위를 갖는 mA3rev-2A-BE3의 C-말단에 융합시켰다. 새롭게 개발된 BE는 BEsafe로 명명된다. 또한, 우리는 하나의 MS2 루프를 sgRNA에 넣어서 MS2-sgRNA [Ma et al., 2016, Nature Biotechnology, doi: 10.1038/nbt.3526]를 생성시킨 다음에 TEV 프로테아제의 C-말단 부분 (TEVc)을 MS2 루프에 결합할 수 있는 MS2 외피 단백질 (MCP)과 융합시켰다 (도 16A). BEsafe, MS2-sgRNA 및 MCP-TEVc가 공-발현되었을 때, BEsafe에 융합된 TEVn 및 MS2-sgRNA에 의해 동원될 수 있는 MCP-TEVc의 TEVc가 회합될 것이고 온-표적 부위에서 프로테아제 활성을 복원시킬 것이다. TEV 부위에서 후속 절단은 mA3CDA2 및 TEVn을 BEsafe의 N-말단 및 C-말단으로부터 제거시킬 것이고 최종 mA3CDA1-BE3은 온-표적 부위에서 효율적인 염기 편집을 유도시킬 수 있다 (도 16A). 대조적으로, BEsafe는 미관련 ssDNA 영역에서 C에서 T 돌연변이를 유도시키지 않을 것인데, mA3CDA1의 시티딘 디아미나제 활성이 mA3CDA2에 의해 억제되기 때문이다 (도 16B).
다음으로 우리는 온-표적 부위 및 미관련 ssDNA 영역에서 BEsafe 및 hA3A-BE3의 성능을 비교하였다 (도 17, 18, 19). 우리는 Sa-sgRNA 표적 부위에서 ssDNA 형성을 촉발시킬 수 있는, Sa-sgRNA 및 SaD10A를 발현하는 플라스미드 (도 17A, 18A, 19A)와, hA3A-BE3 발현 플라스미드 및 sgRNA 발현 플라스미드, BEsafe 발현 플라스미드 및 MS2-sgRNA 및 MCP-TEVc를 발현하는 플라스미드, 또는 MCP-TEVc 발현 플라스미드 및 MS2-sgRNA 및 BEsafe를 발현하는 플라스미드 (도 17B, 18B, 19B)를 공-형질감염시켰다. 우리는 미관련 ssDNA 영역 (SpCas9의 것에 직교성인, Sa-sgRNA 온-표적 부위) 내에서 C에서 T 돌연변이 빈도 (도 17C, 18C, 19C), 및 hA3A-BE3 및 BEsafe의 sgRNA 온-표적 부위에서 염기 편집 효율을 조사하였고, 그 둘 모두는 SpCas9-유래이다 (도 17D, 18D, 19D). 우리는 BEsafe가 미관련 ssDNA 영역 (Sa-sgRNA 온-표적 부위)에서 임의의 C에서 T 돌연변이를 초래하지 않았지만 hA3A-BE3은 분명한 돌연변이를 초래하였다는 것을 확인하였다 (도 17C, 18C, 19C). sgRNA 온-표적 부위에서, BEsafe는 hA3A-BE3과 비슷한 염기 편집을 유도하였지만, 하나의 단일 플라스미드로부터 MS2-sgRNA 및 BEsafe 둘 모두의 발현은 하나의 플라스미드로부터 오직 BEsafe의 발현에 비해 더 높은 염기 편집 효율을 산출하였다 (도 17D, 18D, 19D).
본 발명에서 기술된 염기 편집자 및 염기 편집 방법은 다양한 진핵생물의 게놈에서 높은-특이성 및 높은-효율의 염기 편집을 수행하는데 적용될 수 있다.
최초로, 염기 편집 시스템은 미관련 ssDNA 영역 내에서 C에서 T 돌연변이의 초래를 피하고 온-표적 부위에서 효율적인 염기 편집을 유도하도록 확립시켰다. BEsafe 염기 편집 시스템 및 본 발명에 개시된 수반 방법은 현행 BE의 시티딘 디아미나제가 미관련 ssDNA 영역 내에서 비의도적 돌연변이를 초래할 수 있으므로 현재 존재하는 BE에 의해 구현할 수 없는 고도로 특이적인 염기 편집을 수행하는데 이용될 수 있다. 중요하게, 이러한 BEsafe 염기 편집 시스템의 높은 특이성 및 효율은 특히 질환-관련 돌연변이의 복원을 포함하는 유전자 요법에서, 잠재적인 임상적 해석을 촉진할 것이다.
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
실시예 2. 억제제-접합된 염기 편집자의 추가 평가
이 실시예는 sgRNA-독립적 방식으로 염기 편집자 (BE)의 APOBEC 모이어티가 오프-표적 단일 가닥 DNA (OTss) 부위에서 돌연변이를 직접적으로 유도하였다는 것을 입증하기 위한 효율적인 방법을 개발하였다. 2개 시티딘 디아미나제 (CDA) 도메인을 갖는 일련의 APOBEC 단백질을 시험하여서, 우리는 일정 이중-도메인 APOBEC의 촉매적-불활성 CDA 도메인이 시티딘 디아미나제 억제제 (CDI)로서 기능한다는 것을 확인하였다. 이러한 발견 및 분할-TEV 프로테아제의 개념을 이용하여, CDI의 sgRNA-가이드된 절단에 의해 유도된 염기 편집자 (iBE)는 nSpCas9-BE 및 TEV 절단 부위를 갖는 CDI를 연결시켜서 개발하였다. sgRNA-독립적 OTss 부위에서, iBE1은 공유적으로 연결된 CDI 덕분에 휴지 상태로 남아있었다. 반면에, 온-표적 부위에서, iBE1은 CDI의 sgRNA-가이드된 TEV 절단에 의해 활성화되어, 효율적인 염기 편집을 일으켰다. '증강된 특이성' SpCas9 닉카제를 사용하여, iBE2는 비의도적 OTsg 돌연변이를 감소시키도록 더욱 개발되었다. 이의 최소 오프-표적 효과 및 미손상 온-표적 편집 효율에 기인하여, iBE의 편집 특이성은 이전에 보고된 BE의 것에 비해서 유의하게 더 높았다. 따라서, 본 실시예에 기술된 iBE 시스템은 현행 염기 편집 시스템의 특이성에 대한 새로운 조절층을 제공하고 오프-표적 돌연변이에 대한 이의 적용을 보장한다.
방법
세포 배양 및 형질감염
ATCC로부터의 HEK293FT 세포는 DMEM (10566, Gibco/Thermo Fisher Scientific) + 10% FBS (16000-044, Gibco/Thermo Fisher Scientific)에서 유지시켰고 마이코플라즈마 오염을 배제시키기 위해 정기적으로 시험하였다.
게놈 DNA에서 염기 편집을 위해서, HEK293FT 세포는 24-웰 플레이트 중에 웰 당 1.1×105의 밀도로 파종되었고, 5.35 ㎕ LIPOFECTAMINE LTX (Life, Invitrogen), 2.14 ㎕ LIPOFECTAMINE plus (Life, Invitrogen), 1 ㎍ pCMV-BE3 (또는 hA3B-BE3, hA3BCDA2-nSpCas9-BE, hA3D-BE3, hA3DCDA2-nSpCas9-BE, hA3F-BE3, hA3FCDA2-nSpCas9-BE, hA3G-BE3, hA3GCDA2-nSpCas9-BE, mA3-BE3, mA3CDA1-nSpCas9-BE, mA3CDA2-mA3CDA1-nSpCas9-BE, hA3FCDA1-mA3CDA1-nSpCas9-BE, hA3BCDA1-mA3CDA1-nSpCas9-BE, mA3CDA2-rA1-nSpCas9-BE, hA3FCDA1-rA1-nSpCas9-BE, hA3BCDA1-rA1-nSpCas9-BE, hA3A-BE3, mA3CDA2-hA3A-nSpCas9-BE, hA3FCDA1-hA3A-nSpCas9-BE, hA3BCDA1-hA3A-nSpCas9-BE, mA3CDA2F1-mA3CDA1-nSpCas9-BE, mA3CDA2F2-mA3CDA1-nSpCas9-BE, mA3CDA2F3-mA3CDA1-nSpCas9-BE, mA3CDAI-T2A-mA3CDA1-nSpCas9-BE, EGFP-mA3CDA1-nSpCas9-BE, EGFP-T2A-mA3CDA1-nSpCas9-BE, mA3CDAI-T2A-rA1-nSpCas9-BE, EGFP-rA1-nSpCas9-BE, EGFP-T2A-rA1-nSpCas9-BE, mA3CDAI-T2A-hA3A-nSpCas9-BE, EGFP-hA3A-nSpCas9-BE, EGFP-T2A-hA3A-nSpCas9-BE, pCMV-dSpCas9, iBE1, iBE2, mA3CDAI-TS-mA3CDA1-nSpCas9HF1-BE-NTEV 또는 mA3CDAI-TS-mA3CDA1-nHypaSpCas9-BE-NTEV) 발현 벡터, 0.5 ㎍ Sa-sg-SaD10A 발현 벡터와 함께 또는 없이, 0.64 ㎍ sgRNA 발현 벡터를 함유하는, 250 ㎕ 무-혈청 Opti-MEM을 형질감염시켰다. 24시간 후에, 푸로마이신 (ant-pr-1, InvivoGen)을 4 ㎍/mL의 최종 농도로 배지에 첨가하였다. 다른 48시간 후에, 게놈 DNA는 후속 시퀀싱 분석을 위해서 QuickExtract™ DNA 추출 용액 (QE09050, Epicentre)을 사용해 세포로부터 추출하였다.
DNA 라이브러리 제조 및 시퀀싱
표적 게놈 서열은 조사되는 sgRNA 표적 부위가 측접된 프라이머 세트를 사용하여 고-충실도 DNA 중합효소 PrimeSTAR HS (Clonetech)를 통해 PCR 증폭되었다. 색인된 DNA 라이브러리는 약간의 변형으로 TruSeq ChIP 샘플 제조 키트 (Illumina)를 사용하여 제조되었다. 간략하게, 게놈 DNA 영역으로부터 증폭된 PCR 산물은 Covaris S220에 의해 단편화시켰다. 다음으로 단편화된 DNA는 TruSeq ChIP 샘플 제조 키트 (Illumina)를 사용하여 PCR 증폭되었다. Qubit 고-감도 DNA 키트 (Invitrogen)를 사용해 정량한 후, 상이한 태그를 갖는 PCR 산물은 Illumina Hiseq X10 (2Х150) 또는 NextSeq 500 (2Х150)을 사용하여, 중국, 상하이 소재의 CAS-MPG Partner Institute for Computational Biology Omics Core에서 심층 시퀀싱을 위해 함께 풀링되었다. 미가공 판독치 품질은 FastQC를 통해 평가하였다. 쌍형성 말단 시퀀싱을 위해서, 오직 R1 판독만을 사용하였다. 30 미만의 Phred 품질 점수를 갖는 양쪽 말단 상의 판독 서열 및 어댑터 서열을 정리하였다. 다음으로 정리된 판독치는 표적 서열에 대해서 BWA-MEM 알고리즘 (BWA v0.7.17)을 사용해 맵핑하였다. samtools (v1.9)을 사용해 파일업 후에, 염기 치환을 더욱 계산하였다.
염기 치환 계산
염기 치환은 적어도 1000회 독립 판독으로 맵핑된 조사된 sgRNA 표적 부위의 각 위치에서 선택되었고, 분명한 염기 치환은 오직 표적화된 염기 편집 부위에서만 관찰되었다. 염기 치환 빈도는 전체 판독으로 염기 치환 판독을 나누어 계산되었다. 각각의 sgRNA 경우에, indel 상에서 C에서 T 염기 치환의 비율은 모든 편집 부위에서 C에서 T 염기 치환의 총합을 sgRNA 표적 부위 주변 (표적 부위에 대한 상류 8 뉴클레오티드 내지 PAM 부위에 대한 하류 19 뉴클레오티드) 50-bp 영역의 idel 빈도를 나누어서 계산하였다.
결과
천연 시티딘 디아미나제 또는 CRISPR-Cas9에 의해 시험관내 진화된 아데노신 디아미나제를 융합시킨 시토신 또는 아데닌 염기 편집자 (CBE/BE 또는 ABE)는 표적화된 C에서 T 또는 아데닌에서 구아닌 (A에서 G) 전환을 높은 효율로 유도시키도록 개발되었다. BE는 게놈 DNA로 그들 결합을 유도하기 위해 촉매적 데드 Cas9 (dCas9) 단백질 또는 Cas9 닉카제 (nCas9)이므로, 비의도적 염기 치환이 sgRNA에 부분적으로 상보성인 OTsg 부위에서 유도될 것으로 예상되었다. 이러한 시나리오에서, BE에서 고-충실도 Cas9의 사용이 이들 OTsg 돌연변이를 감소시킬 수 있다. 한편, 유리 APOBEC가 단일 가닥 DNA (ssDNA) 영역 내에서 예상치 못한 C에서 T 돌연변이를 유도시킬 수 있으므로, BE의 APOBEC 모이어티는 OTss 부위에서 예상치 못한 돌연변이를 직접적으로 촉발시킬 수 있다. 달리 말해서, BE에 의해 유도된 오프-표적 돌연변이는 또한 sgRNA의 가이드와 독립적으로 OTss 부위에서 일어날 수 있지만; OTss 돌연변이는 검출에 대한 정량적 및 재현가능한 방식의 결여로 인해 밝힐 수 없었다.
이 실시예는 에스. 아우레우스 (S. aureus) 및 에스. 피오게네스 (S. pyogenes) Cas9 오솔로그의 공-발현 (co-expressing S . aureus and S . pyogenes Cas9 orthologs) (CESSCO)을 통해서 BE-유도된 OTss 돌연변이를 정량적으로 평가하기 위한 효율적인 방법을 수립한다. CESSCO에서, nSaCas9/Sa-sgRNA 쌍의 발현은 특이적 게놈 유전자좌에서 DNA 단일-가닥 파손 (SSB)을 생성시켰고 프로그램가능한 방식으로 게놈 ssDNA 영역의 형성을 야기시켰다. 동시에, sgRNA (sgRNA는 이하 Sp-sgRNA를 의미함)의 부재 하에서 공-발현된 BE3은 sgRNA-독립적 C에서 T 염기 치환이 nSaCas9/Sa-sgRNA-유도된 SSB 주변에서 생성된 ssDNA 영역 내에서 BE3 단독에 의해 유도될 수 있는지 여부를 조사하는데 사용될 수 있었다. nSaCas9/Sa-sgRNA에 의해 표적화된 게놈 영역의 심층-시퀀싱 후에, OTss 부위에서 C에서 T 돌연변이는 sgRNA의 부재 하에서 dSpCas9가 아니라 래트 APOBEC1 (rA1)-함유 BE3에 의해 유도되었다는 것을 분명하게 확인하여서, OTss 돌연변이는 sgRNA-독립적 방식으로 BE의 APOBEC 모이어티에 의해 초래된다는 것을 확인하였다.
다음으로 이 실시예는 고도로-특이적인 BE 구성에 적합한 APOBEC 패밀리의 구성원을 이용하여 OTss 돌연변이를 감소시키고자 하였다. 대부분의 일반적으로 사용되는 BE는 이중-도메인 APOBEC이 아닌, BE3 내 rA1같은, 단일 도메인 APOBE을 사용해 구성되었다. 일반적으로, 2개 CDA 도메인을 갖는 APOBEC에서, 하나는 촉매적으로 활성인 한편, 나머지 하나는 촉매적으로 불활성이어서, 시티딘 탈아미노화 활성에 대해 조절적 역할을 하고 따라서 OTss 효과를 감소시킨 고도로-특이적인 BE를 구성하는데 적합할 수 있다. 이러한 가능성을 시도하기 위해서, 우리는 5개 이중-도메인 APOBEC (도 20a), 즉, 인간 APOBEC3B (hA3B), 인간 APOBEC3D (hA3D), 인간 APOBEC3F (hA3F), 인간 APOBEC3G (hA3G) 및 마우스 APOBEC3 (mA3)의 2개 CDA 도메인 또는 하나의 촉매적으로 활성인 CDA 도메인을 갖는, 10개 쌍형성 BE를 구성하였고, 이의 C에서 T 편집 효율을 비교하였다.
도 20b,c에서 밝혀준 바와 같이, 2개 CDA 도메인을 함유하는 일정 APOBEC (hA3B, hA3F 및 mA3)으로 구축된 BE는 오직 활성 CDA 도메인만을 갖는 그들의 쌍형성 BE에 비해서 유의하게 더 낮은 편집 효율을 유도하였다. 이러한 결과는 이들 이중-도메인 APOBEC, 즉, hA3B, hA3F 및 mA3으로부터의 촉매적 불활성 CDA 도메인이 그들의 상응하는 활성 CDA 도메인에 대해 억제 기능을 나타낸다는 것을 보여준다.
억제 기능이 일반적인지 여부를 조사하기 위해서, 우리는 mA3, hA3F 또는 hA3B의 촉매적으로 불활성인 CDA 도메인을 개별적으로 mA3CDA1-nSpCas9-BE (도 20d) 및 2개의 다른 일반적으로 사용되는 BE, 즉, BE3 및 hA3A-BE3의 N-말단에 공유적으로 연결시켰다. 모든 이들 촉매적으로 불활성인 CDA 도메인은 모든 시험된 BE에 대해서 광범위한 억제 효과를 보였고, 특히, mA3의 CDA2 (mA3CDA2)는 가장 강력한 억제 효과를 보였다 (도 20e,f). 상세한 맵핑 분석은 mA3CDA2의 잔기 282-355는 전체-길이 mA3CDA2의 것과 유사한 억제 효과를 보였다는 것을 더욱 밝혀주었다. 종합적으로, 이들 결과는 일정한 이중-도메인 APOBEC의 촉매적-불활성 도메인이 실제로 시티딘 디아미나제 활성에 대해 일반적인 억제 효과를 보인다는 것을 보여주었고, 따라서 우리는 그들을 시티딘 디아미나제 억제제 (CDI)라고 정의하였다.
다음으로, 우리는 이의 공유적으로 연결된 BE로부터 mA3CDI (mA3CDA2)의 절단이 그들 염기 편집 능력을 복원할 수 있는지 여부를 시험하고자 하였다. 우리는 자가-절단 펩티드 (T2A)를 사용하여 조사를 위해 mA3CDI 및 mA3CDA1-nSpCas9-BE를 연결하였다. mA3CDI의 자가-절단 이후에, mA3CDI-T2A-mA3CDA1-nSpCas9-BE의 편집 효율은 비-절단성-mA3CDI 융합된 BE의 것에 비해 ∼10배 더 높게, EGFP-mA3CDA1-nSpCas9-BE 또는 EGFP-T2A-mA3CDA1-nSpCas9-BE와 유사한 수준까지 회복되었다. BE3 및 hA3A-BE3으로부터 mA3CDI의 자가-절단은 또한 상이한 정도지만, 그들 편집 효율을 증강시켰다.
이들 결과는 낮은 OTss 돌연변이로 정밀한 염기 편집을 위한 iBE 시스템을 개발하기 위한 핵심 개념 증명으로서 제공되었다. iBE1은 3개 핵심 모듈, 즉, mA3CDI, mA3CDA1-nSpCas9-BE 및 TEV 프로테아제의 N-말단 절반 (NTEV)을 연결하기 위해서 TEV 프로테아제 절단 부위 (TS)를 사용하여 구축하였다 (도 21a). 이론상, CDI의 공유 연결로 인해서, iBE1은 이것이 이의 APOBEC 모이어티에 의해 OTss 부위에 결합될 때 휴지 상태로 남아있는다 (도 21a). 특히, NTEV 그 자체는 불활성이지만 오직 C-말단 절반 (CTEV)이 동원될 때에만 기능성 TEV 프로테아제를 형성한다. 따라서, iBE1은 CDI가 기능성 TEV 프로테아제의 sgRNA-유도된 조립에 의해 절단되는 온-표적 부위에서 효율적인 염기 편집을 수행하기 위해 이의 CRISPR-Cas 모이어티에 의해 가이드될 수 있다 (도 21d).
세포에서 발현시킨 후에, iBE1은 예상한 대로 sgRNA-독립적 OTss 영역에서 휴지 상태로 남아있었고 (도 21b), BE3과 비교하여 C에서 T 돌연변이의 훨씬 더 낮은 (∼20%) 수준을 유도하였다 (도 21c). 온-표적 부위에서, RNA 결합 단백질 (MCP)-융합된 CTEV는 MS2-융합된 sgRNA에 의해 동원될 수 있어서 (도 21d), iBE1로부터 mA3CDI의 제거를 야기시키고 그러므로 효율적인 염기 편집을 할 수 있다. 다수의 게놈 유전자좌 전반에서 BE3 및 iBE1에 의해 유도된 온-표적 편집 효율의 비교 (도 21e)는 BE3과 유사한 수준으로 iBE1이 온-표적 염기 편집을 유도하였다는 것을 입증하였다 (도 21f, BE3의 ∼80%). 함께, 이 실시예는 우리가 CDI의 조작을 통해서, OTss 돌연변이가 억제된, 온-표적 부위에서의 효율적인 염기 편집을 촉매하는, iBE 시스템을 개발하였다는 것을 보여준다.
Cas9가 sgRNA에 상보성인 부분 서열을 갖는 OTsg 부위에서 비의도적 편집을 유도하는 것으로 알려져 있으므로, 우리는 또한 iBE1 내 비변형된 nSpCas9를 개선된 표적화 특이성을 갖는 이의 조작된 형태로 교체하여서 OTsg 돌연변이를 더욱 감소시키는 것을 목표로 하였다 (도 22a). 우리는 nSpCas9의 3개의 조작된 형태, 즉 neSpCas9, nSpCas9HF1 및 nHypaSpCas9를 시험하였고, 이들 표적화-특이성-개선된 Cas9 단백질들의 사용이 OTsg 돌연변이를 상당히 감소시켰다는 것을 확인하였다 (도 22b,c). 한편, neSpCas9의 사용은 온-표적 편집 효율을 손상시키지 않았지만, 다른 둘의 사용은 온-표적 편집 효율을 감소시켰다 (도 22d,e). 이러한 시나리오에서, 우리는 iBE2를 구축하기 위해서 nSpCas9를 neSpCas9로 교체하였다.
초기에 개발된 BE 처럼, BE3의 편집 효율은 일정 조건 하에서 제한되고, 개선된 편집 효율을 갖는 추가의 BE, 예를 들어, AncBE4max 또는 hA3A-BE3이 이후에 개발되었다. hA3A-BE3은 다양한 상황에서 고도로 활성인 BE이고, 따라서 우리는 편집 효율 및 특이성 관점에서 iBE2의 성능을 hA3A-BE3의 성능과 비교하였다 (도 23a). iBE2의 평균 온-표적 편집 빈도가 hA3A-BE3의 ∼50%였지만 (도 23a,c), OTss 및 OTsg 부위에서 iBE2에 의해 유도된 C에서 T 돌연변이는 배경 수준에 가까웠으나, hA3A-BE3은 이들 오프-표적 부위에서 실질적 돌연변이를 유도하였다 (도 23a,b). 취합하면, iBE2의 평균 편집 특이성은 hA3A-BE3의 것에 비해 ∼40배 더 높았다 (도 23d).
이 실시예에서, 우리는 먼저 sgRNA-독립적 OTss 돌연변이를 정량적으로 평가하기 위한 효율적인 방법 (CESSCO)을 개발하였고 정규 APOBEC-nCas9 골격을 갖는 BE가 실제로 sgRNA-독립적 방식으로 OTss 돌연변이를 유도시켰다는 것을 확인하였다 (도 21a, 21b, 23a, 23b). 우리의 발견과 일관되게, 최근의 전체 게놈 시퀀싱 연구가 또한 BE3가 아마도 역시 sgRNA-독립적 방식으로, 마우스 및 쌀 식물에서 실질적 오프-표적 돌연변이를 유도하였다는 것을 보여주었다. 중요하게, 우리는 CDI의 공유 연결에 기인하여 OTss 부위에서 휴지 상태로 남아있지만, 온-표적 부위에서 CDI의 sgRNA-매개 절단을 통해 활성화될 수 있는, iBE를 개발하기 위해서 CDI에 대한 우리의 발견을 이용하였다 (도 21a,d). iBE는 sgRNA-독립적 ssDNA 영역에서 유의하게 낮은 수준의 비의도적 돌연변이를 유도하였지만, 온-표적 편집을 효율적으로 수행하였다 (도 21b,c,e,f).
nSpCas9를 특이성-개선된 enSpCas9로 교체하여서, 고도의-특이적 iBE2를 개발하여 OTsg 부위에서 비의도적 편집을 더욱 감소시켰다 (도 22 및 23e). iBE 시스템은 상이한 Cas 모이어티를 갖는 BE 및 개선된 성능을 갖는 조작된 BE와 상용성이고, 구축된 BE의 특징, 예컨대 편집창을 변화시키지 않는다. 또한, APOBEC 패밀리 내에 충분한 구성원이 존재하므로, 다른 CDI가 향후 확인될 수 있고, CDI-접합된 iBE 시스템의 레파토리를 더욱 풍성하게 할 것이다. 편집 정밀도 및 효율 둘 모두가 염기 편집자에 필수적이므로, 특히, 그들의 치료적 적용성에서, 여기서 개발된 iBE 시스템은 현행 염기 편집 시스템의 특이성에 대한 새로운 조절층을 가져올 것이고 오프-표적 돌연변이에 대한 이의 적용을 보장한다.
실시예 3. 유도 및 분할 염기 편집자의 상이한 구성의 시험
이 실시예는 유도 및 분할 염기 편집자 (isplitBE) 시스템을 구현하기 위해서 분자의 다수의 상이한 구성을 시험하였다.
isplitBE의 작업 과정은 도 24B에 도시된 바와 같은 통상의 BE와 비교하여, 도 24A에 예시된다. 예시된 isplitBE 시스템에서, nCas9-D10A 구성은 AAV 비히클에 패키징된다. 전형적인 AAV 비히클은 4.7 kb 용량을 가지고, nCas9 구성체는 약 4.7 kb 길이이다. 다른 AVV 비히클은 (a) MCP, UGI, APOBEC, TEV 인식 부위 (TEV 부위), 및 mA3CDA2를 포함하는 융합 단백질; (b) TEVc 및 N22p를 갖는 융합 단백질; (c) 독립형 TEVn, (d) MS2 태그를 갖는 헬퍼 sgRNA (hsgRNA), 및 (e) boxB 태그를 갖는 다른 sgRNA를 코딩하기 위한 핵산 (약 4.4 kb의 총 길이)을 패키징할 수 있다.
표적 부위 (ON, 좌측 아래 분점)에서, hsgRNA 및 sgRNA의 각각은 표적 DNA 상의 2개의 인접한 부위에 결합하고, MCP- 및 N22p-함유 융합 단백질은 각각 hsgRNA 및 sgRNA의 MS2 태그 및 boxB 태그에 결합한다. TEVc (유리 TEVn 존재 하에) 및 TEV 부위의 근접성에 기인하여, TEVc/TEVn은 TEV 부위를 절단하여, mA3CDA2를 APOBEC로부터 제거한다. 부착된 mA3CDA2 없이, APOBEC은 바람직한 편집을 고도로 효율적으로 수행할 수 있다.
비-특이적 결합 부위일 수 있는, 오프-표적 부위 (OTss, 아래 중간 분점) 또는 가이드 RNA 중 하나에만 결합하는 부위에서, TEVc/TEVn 복합체는 TEV 부위-함유 융합 단백질로 동원되지 않고, 따라서, APOBEC은 활성화될 수 없다. 대조적으로, 통상의 BE 시스템 (도 24B)에서, APOBEC은 이미 활성이 있고 단일 가닥 뉴클레오티드 서열로 동원될 때마다 C에서 T 편집을 초래할 수 있다.
도 25에 예시된 바와 같은 10개 상이한 구성 (쌍 1-10)을 제조하였고 시험하였다. 예를 들어, 도 26A에 도시된 바와 같이, 쌍 1은 2개 구성체를 포함하였는데, 이 중 제1 구성체는 UGI 및 NLS와 함께, nCas9-D10A (spD10A)에 융합된 rA1을 함유하고, 이중 두번째는 EMX1을 표적화하는 sgRNA를 함유하였다. 쌍 2는 쌍 1과 유사하지만 rA1이 hA3A로 교체되었다. 쌍 3도 역시 유사하고 대신 돌연변이체 hA3A (Y130F)를 사용하였다.
쌍 4에서, rA1 및 nCas9 단백질을 상이한 구성체 상에 위치시켰다. rA1은 헬퍼 sgRNA 상의 MS2 태그를 인식하는 MCP 단백질에 더욱 융합시켰다. 쌍 5에서, mA3CDA2는 TEV 인식 부위 (검은색 실선 박스)를 통해, rA1에 더욱 융합되었다. 쌍 6에서, TEV 단백질은 자가-절단 부위 2A를 통해서, rA1-mA3CDA2 융합체에 더욱 융합되었다. 2A의 절단은 TEV를 융합 단백질로부터 방출시켰다.
쌍 7은 sgRNA 상의 boxB 태그를 인식하게 되는, N22p 단백질에 TEV를 융합시킴으로써 쌍 6과 상이하다. 쌍 8에서, TEV 단백질은 2A 자가 절단 부위에 의해 이격된, TEVn 및 TEVc로 나누었다. 쌍 9에서, 오직 TEVc가 N22p에 융합되었지만 TEVn은 임의의 RNA 태그-결합 단백질이 없었다. 쌍 10에서, 헬퍼 sgRNA는 근처 부위보다는 GFP를 표적화하였다.
도 26A의 구성체는 표적 부위 EMX1-ON에서 C에서 T 편집을 위해 디자인되었고, Sa-SITE31-OTss 및 EMX1-OTsg 부위에서 오프-표적 편집 역시 조사된다. 시험 결과는 도 26B에 도시된다. isplitBE-rA1 (쌍 9)은 온 (ON) 부위에서 실질적 편집을 유도하였지만 OTss 또는 OTsg 부위에서 편집은 없었다.
유사하게, 모든 이들 구성은 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위 (도 27A의 개략도 참조)에서 시험되었다. 도 27B는 FANCF-ON, Sa-VEGFA-7-OTss 및 FANCF-OTsg 부위에서 상이한 염기 편집자에 대한 편집 효율의 비교를 보여준다. 다시, isplitBE-rA1 (쌍 9)은 OTss 또는 OTsg 부위에서의 편집은 없었지만, 온 (ON) 부위에서 실질적 편집을 유도하였다.
V1B-ON, Sa-SITE42-OTss 및 V1B-OTsg 부위 (도 28A의 개략도 참조)에서 추가 시험을 수행하였다. 다시, 도 28B에 도시된 바와 같이, isplitBE-rA1 (쌍 9)은 OTss 또는 OTsg 부위에서 편집은 없었지만, 온 (ON) 부위에서 실질적 편집을 유도하였다.
실시예 4. isplitBE 시스템의 매개변수의 조율
시험된 10개 구성 중에서, 쌍 9는 편집 특이성 관점에서 최고 성능을 나타냈다. 쌍 9는 2개 sgRNA, 헬퍼 sgRNA (hsgRNA) 및 정규 sgRNA를 적용한다. sgRNA의 이중 사용은 특이성을 더욱 증강시키는데 양쪽 표적 부위가 서로 근접하여 위치되는 것이 요구되기 때문이다.
이 실시예의 제1 어세이에서, 2개 표적 부위 간 최적 거리가 평가되었다. DNTET1, EMX1 및 FANCF 부위에서 hsgRNA 및 sgRNA 간 거리를 예시하는 개략도는 도 29A에 제시된다. 도 29B는 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도를 보여준다. 도 29C의 요약은 hsgRNA 및 sgRNA 간 거리의 효과를 보여준다. 요약을 기반으로, 최고 염기 편집 효율에 대한 거리의 최적 범위는 hsgRNA의 PAM에서 sgRNA의 PAM까지 -91 내지 -34 bp이다.
제2 어세이는 염기 편집 효율 및 정밀성에 대한 hsgRNA 스페이서 길이의 효과를 시험하였다. 도 30A는 DNEMX1, FANCF 및 V1A 부위에서 상이한 스페이서 길이를 갖는 sgRNA 및 hsgRNA의 공-형질감염을 예시하는 개략도를 제시한다. 도 30B는 hsgRNA 및 sgRNA의 표적 부위에서 표시된 sgRNA 및 hsgRNA에 의해 유도된 염기 편집 빈도를 보여준다. 도 30C의 통계 분석은 hsgRNA 스페이서 길이의 효과를 보여준다. 도시된 바와 같이, 10-nt 스페이서를 갖는 hsgRNA의 사용이 hsgRNA 표적 부위에서 편집 효율을 상당히 감소시켰지만 sgRNA 표적 부위에서 편집 효율은 유지시켰다. 따라서, 헬퍼 sgRNA 서열 중 9-15의 스페이서는 hsgRNA 표적 부위에서 편집을 최소화하면서, sgRNA 표적 부위에서 효율적인 편집을 보장하는 양호한 범위일 수 있다.
실시예 5. 게놈- 및 전사체-와이드 평가
isplitBE 시스템의 전체 효율은 통상의 BE3과 비교하였다. 결과는 도 31에 도시된다 (상이한 표적 부위에서 표시된 염기 편집자에 의해 유도된 편집 빈도). isplitBE가 상당히 개선된 특이성을 갖는 경우에도 효율성의 분명한 희생은 없었다.
정상 세포는 그들의 내생성 APOBEC3 활성에 기인하여 배경 수준의 C에서 T 돌연변이를 갖는다. 오프-표적 C에서 T 돌연변이의 보다 정확한 측정을 얻기 위해서, APOBEC3 녹아웃 293FT 세포주 (293FT-A3KO)가 사용되었다. 도 32A는 야생형 293FT 세포 및 APOBEC3 녹아웃 293FT 세포에서 mRNA 발현 수준을 보여준다. 도 32B는 염기 편집자에 의해 유도된 게놈-와이드 C에서 T 돌연변이를 결정하기 위한 절차를 예시하는 개략도를 제시하고, 시험 결과는 도 32C에 제시된다 (Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-rA1에 의해 유도된 게놈-와이드 C에서 T 돌연변이의 수 및 온-표적 편집 효율 (좌)). BE3 및 Y130F 둘 모두는 상당히 높은 오프-표적 편집을 가졌지만, isplitBE-rA1의 오프-표적 편집 비율은 배경치에 가깝다 (Cas9 단독).
다음으로 이 실시예는 isplitBE-mA3, BE3 및 hA3A-BE3-Y130F (Y130F)에 의해 유도된 전사체-와이드 C에서 U 돌연변이를 비교하였다. Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 전사체-와이드 C에서 T(U) 돌연변이의 수는 도 33A에 도시된다. 도 33B는 Cas9, BE3, hA3A-BE3-Y130F (Y130F) 및 isplitBE-mA3에 의해 유도된 RNA C에서 U 편집 빈도를 도시한다. 도 33C는 BE3 복제물 1 및 isplitBE-mA3 복제물 1에 의해 유도된 RNA C에서 U 편집의 분포를 도시한다. 다시, isplitBE는 BE3에 비해서 훨씬 낮은 C에서 U 편집을 유도하였다.
실시예 6. PCSK9 녹아웃
프로단백질 컨버타제 서브틸리신/켁신 9형 (Proprotein convertase subtilisin/kexin type 9) (PCSK9)은 인간 염색체 1 상의 PCSK9 유전자에 의해 코딩되는 효소이다. 이것은 다른 단백질을 활성화시키는 프로단백질 컨버타제 단백질 패밀리의 9번째 구성원이다. PCSK9는 처음 합성될때 불활성이고, 펩티드 사슬의 절단부가 그들 활성을 차단하므로, 프로단백질 컨버타제는 그 절단부를 제거하여 효소를 활성화시킨다. PCSK9 유전자는 관상 동맥 질환의 높은 위험성와 연관있는 27 유전자좌 중 하나를 함유한다.
PCSK9는 많은 조직 및 세포 유형에서 편재하여 발현된다. PCSK9는 전형적으로 세포외 유체 내에서, 입자 당 3,000 내지 6,000 지방 분자 (콜레스테롤 포함)를 수송하는, 저-밀도 지단백질 입자 (LDL)에 대한 수용체에 결합한다. 간 및 다른 세포 막 상의 LDL 수용체 (LDLR)에 결합하여 세포외 유체로부터 세포로 LDL-입자의 섭취를 개시하여서, LDL 입자 농도를 감소시킨다. PCSK9가 차단되면, 더 많은 LDLR이 재활용되고 세포외 유체로부터 LDL-입자를 제거하도록 세포의 표면에 존재한다. 그러므로, PCSK9의 차단은 혈액 LDL-입자 농도를 하락시킬 수 있다.
이 실시예는 본 기술을 사용하는 염기 편집을 통해 중지 코돈을 도입시켜서 PCSK9를 불활성화시키는 접근법을 시험하였다. 사용된 sgRNA/hsgRNA의 서열은 표 3에 표시되고, PCSK9 상의 표적 부위는 표 4에 표시된다.
염기 편집에 의해 생성된 중지 코돈의 수를 인간 PCSK9 유전자에 대해 측정하였다. 도 34A는 sgRNA 및 hsgRNA와 isplitBE-mA3 및 nCas9의 공-형질감염을 예시하는 개략도를 제시한다. 표시된 부위에서 isplitBE-mA3에 의해 유도된 편집 효율은 도 34B-D에 도시된다. 이들 결과는 방법의 높은 효율 및 특이성을 입증한다.
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
실시예 7. 아데닌 염기 편집자에서 isplitBE 디자인의 적용가능성
이 실시예는 다른 유형의 염기 편집자에서 유도 및 분할 염기 편집자 (isplitBE) 디자인의 적용가능성을 확인한다. 사용된 억제제는 mA3CDA2였고 편집자는 아데닌 염기 편집자 (ABE)였다.
sgRNA 및 mA3CDA2와 융합된 ABE (또는 대조군으로서가 아님)의 공-형질감염을 예시하는 개략도는 도 35A에 도시된다. RNF2 및 FANCF 부위에서 표시된 ABE에 의해 유도된 편집 효율은 도 35B에 도시된다. ABE에 부착된 mA3CDA2를 사용하여, 편집 효율은 ABE 단독과 비교하여 감소되었다. mA3CDA2가 2A에 의해 절단되었을 때, ABE의 편집 효율은 복원되어, ABE에 대한 isplitBE 접근법이 검증되었다.
실시예 8. 증강된 프라임 편집
통상의 염기 편집자는 염기 전환, 삽입 또는 결실이 아닌, 염기 전이에 제한된다. 최근에, Cas9 닉카제를 역전사효소 (RTase)와 접합시킴으로써 프라이머 편집자 (PE)를 적용하는, 프라이머 편집 시스템이 제안되었다. PE 시스템은 모든 유형의 염기 치환, 소형 indel, 및 그들 조합을 포함하여, 거의 모든 의도하는 변화를 갖는 게놈을 작성할 수 있다. 그러나, PE 시스템의 전체 효율 및 특이성은 여전히 제한적이다.
제1 어세이에서, 이 실시예는 프라이머 편집 가이드 RNA (pegRNA)에 대한 새로운 디자인을 시험하였다. 통상적으로, 각각의 가이드 RNA는 스캐폴드를 포함한다. 통상적으로 사용되는 스캐폴드 서열은 하기이다:
Figure pct00019
다른 예는 하기이다:
Figure pct00020
보다 포괄적인 공통 서열은 하기이다:
Figure pct00021
여기서 N은 임의 염기를 나타내고, X1 및 X2는 2-50 염기 길이의 임의의 뉴클레오티드 서열을 표시한다.
스캐폴드는 이의 내부 상보성 서열로 인해 2차 구조 (도 36A에 예시, SEQ ID NO:30)를 형성할 것으로 예상된다. 염기 편집자에서 사용되는 전형적인 sgRNA는 약 20 nt 길이고 표적 부위에 결합하는 스페이서를 포함하여, 약 96 nt 길이이다. pegRNA에서, 역전사 주형 및 프라이머-결합 부위는 스캐폴드의 3' 말단에서 더 첨가된다. 놀랍게도, 오리지날 스캐폴드는 pegRNA 상황에서 충분히 안정하지 않다는 것을 본 발명에서 발견하였다.
그러므로, 위치 48 (예를 들어, A in SEQ ID NO:30) 및 61 (예를 들어, G in SEQ ID NO:30) 사이에 신규 쌍형성을 형성하는, 신규 스캐폴드를 제조하였다. 도 36A 및 36E에 도시된 예에서, 신규 스캐폴드는 G 및 C 또는 대신 C 및 G를 갖는다 (SEQ ID NO:36, 37). 이러한 추가 예의 돌연변이체 스캐폴드는 하기 표 5에 표시된다.
Figure pct00022
Figure pct00023
통상의 pegRNA 및 새롭게 디자인된, 증강된 pegRNA (epegRNA)를 시험하기 위한 구성체는 PE2의 경우에 도 36B 및 36F에 도시되어 있고, 시험 결과는 도 36C-36D 및 36G에 도시된다. 프라임 편집 효율의 비교는 pegRNA 및 epegRNA로 유도하였다. epegRNA는 상당히 개선된 스템 안정성을 가지고, 보드 전반에서 pegRNA에 비해 훨씬 더 높은 편집 효율을 나타냈다.
유사하게, 도 37A의 개략도에 따라서, pegRNA, 닉킹 sgRNA와 PE2-NG (SEQ ID NO:132) 또는 xPE2 (SEQ ID NO:133)의 공-형질감염을 수행하여 TGATG 결실에 대한 편집 효율을 시험하였다. 결과는 도 37B에 도시된다. PE2-NG는 완화된 NG PAM을 인식할 수 있는 조작된 Cas9를 갖는다 (참조: 예를 들어, Nishimasu et al., Science 361, 1259-62 (2018)). xPE2는 완화된 NG, GAA 및 GAT PAM을 인식할 수 있는 조작된 Cas9를 갖는다 (참조: 예를 들어, Hu et al., Nature 556, 57-63 (2018)). PE2-NG (SEQ ID NO:44), xPE2 (SEQ ID NO:45), SpCas9-NG (SEQ ID NO:46), 및 xSpCas9 (SEQ ID NO:47)의 서열은 하기 표 6에 표시된다.
Figure pct00024
Figure pct00025
Figure pct00026
완전한 프라임 편집자는 AAV 비히클이 수용할 수 있는 것에 비해 훨씬 더 큰 구성체 (약 11 kb)를 요구한다. 따라서, 분할 PE 시스템을 디자인하였고 시험하였다. 오리지널 PE 시스템은 도 38A의 좌측 패널에 예시되어 있고, 새롭게 디자인된 분할 PE 시스템은 우측 패널에 예시되어 있으며, 여기서 닉카제 및 RTase는 상이한 AAV 입자에 패키징된다. RTase는 RNA 결합 단백질 MCP에 융합되고, pegRNA는 결합 부위 MS2를 포함한다. 세포 내로 흡수될 때, RTase는 MS2-MCP 결합을 통해서, pegRNA에 의해 동원될 수 있고, 닉카제와 접촉될 수 있다.
예시적인 공-형질감염 시스템은 도 38B에 예시되어 있고, EMX1 부위에서, 시험 결과는 도 38C에 도시되어 있다.
* * *
본 개시는 본 개시의 개별 양태의 단일 예시로서 의도되는 기술된 특별한 구현예에 의해 범주가 제한되지 않고, 기능적으로 동등한 임의의 조성물 또는 방법은 본 개시의 범주 내에 있다. 다양한 변형 및 변동이 본 개시의 정신 또는 범주를 벗어나지 않고 본 개시의 방법 및 조성물에 대해서 만들어질 수 있다는 것은 당업자에게 자명할 것이다. 따라서, 본 개시는 그들이 첨부된 청구항 및 그들 동등물의 범주 내에 있는 제공된 본 개시의 변형 및 변동을 포괄하고자 한다.
본 명세서에서 언급된 모든 공개물 및 특허 출원은 각각의 개별 공개물 또는 특허 출원이 특별히 개별적으로 참조로 편입시킨다고 표시한 바와 동일한 정도로 참조로 본 명세서에 편입된다.
SEQUENCE LISTING <110> ShanghaiTech University <120> INHIBITION OF UNINTENDED MUTATIONS IN GENE EDITING <130> 49BD-292057-WO2 <150> PCT/CN2019/074577 <151> 2019-02-02 <160> 203 <170> PatentIn version 3.5 <210> 1 <211> 223 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 1 Met Ser Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro 1 5 10 15 Glu Thr Arg Phe Trp Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu 20 25 30 Glu Glu Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys 35 40 45 Tyr Tyr His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe 50 55 60 Asn Gly Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys 65 70 75 80 Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu 85 90 95 Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn 100 105 110 Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile 115 120 125 Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe 130 135 140 Gln Lys Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val 145 150 155 160 Met Asp Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro 165 170 175 Lys Arg Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg 180 185 190 Thr Gln Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp 195 200 205 Leu Val Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser 210 215 220 <210> 2 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 2 Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr 1 5 10 15 Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr 20 25 30 Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu 35 40 45 Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr Phe Lys Pro Gln 50 55 60 Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 65 70 75 80 Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro 85 90 95 Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ser Glu His Pro 100 105 110 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu 115 120 125 Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg 130 135 140 Val Lys Ile Met Asp Tyr Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe 145 150 155 160 Val Tyr Asn Glu Gly Gln 165 <210> 3 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 3 Met Gly Glu Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser 1 5 10 15 Ser Thr Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser 20 25 30 Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu 35 40 45 Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val 50 55 60 Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly 65 70 75 80 Arg Asp Met Ile Ile Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro 85 90 95 Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu 100 105 110 Val Thr Thr Asn Phe Gln Thr 115 <210> 4 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 4 Met Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro 1 5 10 15 Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly 20 25 30 Gln Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly 35 40 45 Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser 50 55 60 Val Pro Lys Asn Phe Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln 65 70 75 80 Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly 85 90 95 His Lys Val Phe Met Val Lys Pro Glu Glu Pro Phe Gln Pro Val Lys 100 105 110 Glu Ala Thr Gln 115 <210> 5 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 5 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 6 <211> 246 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 6 Met Ala Ser Ser Asn Ser Met Phe Arg Gly Leu Arg Asp Tyr Asn Pro 1 5 10 15 Ile Ser Asn Asn Ile Cys His Leu Thr Asn Val Ser Asp Gly Ala Ser 20 25 30 Asn Ser Leu Tyr Gly Val Gly Phe Gly Pro Leu Ile Leu Thr Asn Arg 35 40 45 His Leu Phe Glu Arg Asn Asn Gly Glu Leu Val Ile Lys Ser Arg His 50 55 60 Gly Glu Phe Val Ile Lys Asn Thr Thr Gln Leu His Leu Leu Pro Ile 65 70 75 80 Pro Asp Arg Asp Leu Leu Leu Ile Arg Leu Pro Lys Asp Val Pro Pro 85 90 95 Phe Pro Gln Lys Leu Gly Phe Arg Gln Pro Glu Lys Gly Glu Arg Ile 100 105 110 Cys Met Val Gly Ser Asn Phe Gln Thr Lys Ser Ile Thr Ser Ile Val 115 120 125 Ser Glu Thr Ser Thr Ile Met Pro Val Glu Asn Ser Gln Phe Trp Lys 130 135 140 His Trp Ile Ser Thr Lys Asp Gly Gln Cys Gly Ser Pro Met Val Ser 145 150 155 160 Thr Lys Asp Gly Lys Ile Leu Gly Leu His Ser Leu Ala Asn Phe Gln 165 170 175 Asn Ser Ile Asn Tyr Phe Ala Ala Phe Pro Asp Asp Phe Ala Glu Lys 180 185 190 Tyr Leu His Thr Ile Glu Ala His Glu Trp Val Lys His Trp Lys Tyr 195 200 205 Asn Thr Ser Ala Ile Ser Trp Gly Ser Leu Asn Ile Gln Ala Ser Gln 210 215 220 Pro Ser Gly Leu Phe Lys Val Ser Lys Leu Ile Ser Asp Leu Asp Ser 225 230 235 240 Thr Ala Val Tyr Ala Gln 245 <210> 7 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 7 Gly Gly Cys Ser His Gln Ser 1 5 <210> 8 <211> 246 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 8 Met Ala Ser Ser Lys Ser Leu Phe Arg Gly Leu Arg Asp Tyr Asn Pro 1 5 10 15 Ile Ala Ser Ser Ile Cys Gln Leu Asn Asn Ser Ser Gly Ala Arg Gln 20 25 30 Ser Glu Met Phe Gly Leu Gly Phe Gly Gly Leu Ile Val Thr Asn Gln 35 40 45 His Leu Phe Lys Arg Asn Asp Gly Glu Leu Thr Ile Arg Ser His His 50 55 60 Gly Glu Phe Val Val Lys Asp Thr Lys Thr Leu Lys Leu Leu Pro Cys 65 70 75 80 Lys Gly Arg Asp Ile Val Ile Ile Arg Leu Pro Lys Asp Phe Pro Pro 85 90 95 Phe Pro Arg Arg Leu Gln Phe Arg Thr Pro Thr Thr Glu Asp Arg Val 100 105 110 Cys Leu Ile Gly Ser Asn Phe Gln Thr Lys Ser Ile Ser Ser Thr Met 115 120 125 Ser Glu Thr Ser Ala Thr Tyr Pro Val Asp Asn Ser His Phe Trp Lys 130 135 140 His Trp Ile Ser Thr Lys Asp Gly His Cys Gly Leu Pro Ile Val Ser 145 150 155 160 Thr Arg Asp Gly Ser Ile Leu Gly Leu His Ser Leu Ala Asn Ser Thr 165 170 175 Asn Thr Gln Asn Phe Tyr Ala Ala Phe Pro Asp Asn Phe Glu Thr Thr 180 185 190 Tyr Leu Ser Asn Gln Asp Asn Asp Asn Trp Ile Lys Gln Trp Arg Tyr 195 200 205 Asn Pro Asp Glu Val Cys Trp Gly Ser Leu Gln Leu Lys Arg Asp Ile 210 215 220 Pro Gln Ser Pro Phe Thr Ile Cys Lys Leu Leu Thr Asp Leu Asp Gly 225 230 235 240 Glu Phe Val Tyr Thr Gln 245 <210> 9 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 9 Gln Val Val Val His Gln Ser Lys 1 5 <210> 10 <211> 247 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 10 Met Ala Ser Ala Lys Ser Leu Met Arg Gly Leu Arg Asp Phe Asn Pro 1 5 10 15 Ile Ala Gln Thr Val Cys Arg Leu Lys Val Ser Val Glu Tyr Gly Ala 20 25 30 Ser Glu Met Tyr Gly Phe Gly Phe Gly Ala Tyr Ile Val Ala Asn His 35 40 45 His Leu Phe Arg Ser Tyr Asn Gly Ser Met Glu Val Gln Ser Met His 50 55 60 Gly Thr Phe Arg Val Lys Asn Leu His Ser Leu Ser Val Leu Pro Ile 65 70 75 80 Lys Gly Arg Asp Ile Ile Leu Ile Lys Met Pro Lys Asp Phe Pro Val 85 90 95 Phe Pro Gln Lys Leu His Phe Arg Ala Pro Thr Gln Asn Glu Arg Ile 100 105 110 Cys Leu Val Gly Thr Asn Phe Gln Glu Lys Tyr Ala Ser Ser Ile Ile 115 120 125 Thr Glu Thr Ser Thr Thr Tyr Asn Ile Pro Gly Ser Thr Phe Trp Lys 130 135 140 His Trp Ile Glu Thr Asp Asn Gly His Cys Gly Leu Pro Val Val Ser 145 150 155 160 Thr Ala Asp Gly Cys Ile Val Gly Ile His Ser Leu Ala Asn Asn Ala 165 170 175 His Thr Thr Asn Tyr Tyr Ser Ala Phe Asp Glu Asp Phe Glu Ser Lys 180 185 190 Tyr Leu Arg Thr Asn Glu His Asn Glu Trp Val Lys Ser Trp Val Tyr 195 200 205 Asn Pro Asp Thr Val Leu Trp Gly Pro Leu Lys Leu Lys Asp Ser Thr 210 215 220 Pro Lys Gly Leu Phe Lys Thr Thr Lys Leu Val Gln Asp Leu Ile Asp 225 230 235 240 His Asp Val Val Val Glu Gln 245 <210> 11 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 11 Tyr Asp Val Arg His Gln Ser Arg 1 5 <210> 12 <211> 239 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 12 Met Ala Ser Asp Met Tyr Ile Glu Arg Ala Gly Asp Ile Thr Trp Glu 1 5 10 15 Lys Asp Ala Glu Val Thr Gly Asn Ser Pro Arg Leu Asp Val Ala Leu 20 25 30 Asp Glu Ser Gly Asp Phe Ser Leu Val Glu Glu Asp Gly Pro Pro Met 35 40 45 Arg Glu Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ala Leu Trp 50 55 60 Asp Val Pro Ala Pro Lys Glu Val Lys Lys Gly Glu Thr Thr Asp Gly 65 70 75 80 Val Tyr Arg Val Met Thr Arg Arg Leu Leu Gly Ser Thr Gln Val Gly 85 90 95 Val Gly Val Met Gln Glu Gly Val Phe His Thr Met Trp His Val Thr 100 105 110 Lys Gly Ala Ala Leu Arg Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp 115 120 125 Gly Asp Val Lys Gln Asp Leu Val Ser Tyr Cys Gly Pro Trp Lys Leu 130 135 140 Asp Ala Ala Trp Asp Gly Leu Ser Glu Val Gln Leu Leu Ala Val Pro 145 150 155 160 Pro Gly Glu Arg Ala Arg Asn Ile Gln Thr Leu Pro Gly Ile Phe Lys 165 170 175 Thr Lys Asp Gly Asp Ile Gly Ala Val Ala Leu Asp Tyr Pro Ala Gly 180 185 190 Thr Ser Gly Ser Pro Ile Leu Asp Lys Cys Gly Arg Val Ile Gly Leu 195 200 205 Tyr Gly Asn Gly Val Val Ile Lys Asn Gly Ser Tyr Val Ser Ala Ile 210 215 220 Thr Gln Gly Lys Arg Glu Glu Glu Thr Pro Val Glu Cys Phe Glu 225 230 235 <210> 13 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 13 Lys Glu Arg Lys Arg Arg Gly Ala 1 5 <210> 14 <211> 243 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 14 Met Ala Ser Ser Thr Asp Met Trp Ile Glu Arg Thr Ala Asp Ile Ser 1 5 10 15 Trp Glu Ser Asp Ala Glu Ile Thr Gly Ser Ser Glu Arg Val Asp Val 20 25 30 Arg Leu Asp Asp Asp Gly Asn Phe Gln Leu Met Asn Asp Pro Gly Ala 35 40 45 Pro Trp Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Val Leu Trp 50 55 60 Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys Gly Asp Thr Thr Thr Gly 65 70 75 80 Val Tyr Arg Ile Met Thr Arg Gly Leu Leu Gly Ser Tyr Gln Ala Gly 85 90 95 Ala Gly Val Met Val Glu Gly Val Phe His Thr Leu Trp His Thr Thr 100 105 110 Lys Gly Ala Ala Leu Met Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp 115 120 125 Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr Gly Gly Pro Trp Lys Leu 130 135 140 Gln His Lys Trp Asn Gly Gln Asp Glu Val Gln Met Ile Val Val Glu 145 150 155 160 Pro Gly Lys Asn Val Lys Asn Val Gln Thr Lys Pro Gly Val Phe Lys 165 170 175 Thr Pro Glu Gly Glu Ile Gly Ala Val Thr Leu Asp Phe Pro Thr Gly 180 185 190 Thr Ser Gly Ser Pro Ile Val Asp Lys Asn Gly Asp Val Ile Gly Leu 195 200 205 Tyr Gly Asn Gly Val Ile Met Pro Asn Gly Ser Tyr Ile Ser Ala Ile 210 215 220 Val Gln Gly Glu Arg Met Asp Glu Pro Ile Pro Ala Gly Phe Glu Pro 225 230 235 240 Glu Met Leu <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 15 Lys Gln Lys Lys Arg Gly Gly Lys 1 5 <210> 16 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 acaugaggau cacccaugu 19 <210> 17 <211> 136 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 guuugagagc uaggccaaca ugaggaucac ccaugucugc agggccuagc aaguucaaau 60 aaggcuaguc cguuaucaac uuggccaaca ugaggaucac ccaugucugc agggccaagu 120 ggcaccgagu cggugc 136 <210> 18 <211> 25 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 ggagcagacg auauggcguc gcucc 25 <210> 19 <211> 122 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 guuugagagc uaccggagca gacgauaugg cgucgcuccg guagcaaguu caaauaaggc 60 uaguccguua ucaacuugga gcagacgaua uggcgucgcu ccaaguggca ccgagucggu 120 gc 122 <210> 20 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 gcccugaaga agggc 15 <210> 21 <211> 106 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 guuugagagc uagggcccug aagaagggcc cuagcaaguu caaauaaggc uaguccguua 60 ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu cggugc 106 <210> 22 <211> 117 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 22 Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr 1 5 10 15 Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile Ala Glu 20 25 30 Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser 35 40 45 Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu 50 55 60 Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile 65 70 75 80 Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met 85 90 95 Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala 100 105 110 Asn Ser Gly Ile Tyr 115 <210> 23 <211> 123 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 23 Met Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr 1 5 10 15 Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys 20 25 30 Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln 35 40 45 Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala 50 55 60 Asp Val Val Asp Ser Gly Leu Pro Lys Val Arg Tyr Thr Gln Val Trp 65 70 75 80 Ser His Asp Val Thr Ile Val Ala Asn Ser Thr Glu Ala Ser Arg Lys 85 90 95 Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala Thr Ser Gln Val Glu 100 105 110 Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg 115 120 <210> 24 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 24 Met Gly Asn Ala Arg Thr Arg Arg Arg Glu Arg Arg Ala Glu Lys Gln 1 5 10 15 Ala Gln Trp Lys Ala Ala Asn 20 <210> 25 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 25 Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val 1 5 10 15 Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile 20 25 30 Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu 35 40 45 Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr 50 55 60 Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile 65 70 75 80 Lys Met Leu <210> 26 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 26 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 27 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 27 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 28 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 28 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 29 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 30 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucaac uugaaaaagu 60 ggcaccgauu cggugc 76 <210> 31 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or u <220> <221> misc_feature <222> (23)..(23) <223> n is a, c, g, or u <220> <221> misc_feature <222> (33)..(34) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(50) <223> n is a, c, g, or u <220> <221> misc_feature <222> (63)..(63) <223> n is a, c, g, or u <400> 31 guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucaacuun aaguggcacc 60 ganucggugc 70 <210> 32 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or u <220> <221> misc_feature <222> (23)..(23) <223> n is a, c, g, or u <220> <221> misc_feature <222> (33)..(34) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(50) <223> n is a, c, g, or u <220> <221> misc_feature <222> (63)..(63) <223> n is a, c, g, or u <400> 32 guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucgacuun aagucgcacc 60 ganucggugc 70 <210> 33 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or u <220> <221> misc_feature <222> (23)..(23) <223> n is a, c, g, or u <220> <221> misc_feature <222> (33)..(34) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(50) <223> n is a, c, g, or u <220> <221> misc_feature <222> (63)..(63) <223> n is a, c, g, or u <400> 33 guuunagagc uanuagcaag uunaaauaag gcnnguccgu uauccacuun aaguggcacc 60 ganucggugc 70 <210> 34 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or u <220> <221> misc_feature <222> (23)..(23) <223> n is a, c, g, or u <220> <221> misc_feature <222> (33)..(34) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(50) <223> n is a, c, g, or u <220> <221> misc_feature <222> (63)..(63) <223> n is a, c, g, or u <400> 34 guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucaacuun aaguugcacc 60 ganucggugc 70 <210> 35 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (13)..(13) <223> n is a, c, g, or u <220> <221> misc_feature <222> (23)..(23) <223> n is a, c, g, or u <220> <221> misc_feature <222> (33)..(34) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(50) <223> n is a, c, g, or u <220> <221> misc_feature <222> (63)..(63) <223> n is a, c, g, or u <400> 35 guuunagagc uanuagcaag uunaaauaag gcnnguccgu uaucuacuun aaguagcacc 60 ganucggugc 70 <210> 36 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucgac uugaaaaagu 60 cgcaccgauu cggugc 76 <210> 37 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuauccac uugaaaaagu 60 ggcaccgauu cggugc 76 <210> 38 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucaac uugaaaaagu 60 ugcaccgauu cggugc 76 <210> 39 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 guuuuagagc uagaaauagc aaguuaaaau aaggcauguc cguuaucuac uugaaaaagu 60 agcaccgauu cggugc 76 <210> 40 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucgac uugaaaaagu 60 cgcaccgagu cggugc 76 <210> 41 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuauccac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 42 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ugcaccgagu cggugc 76 <210> 43 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucuac uugaaaaagu 60 agcaccgagu cggugc 76 <210> 44 <211> 2080 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 44 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg 1205 1210 1215 Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Arg Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val Tyr Arg Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Thr Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr 1370 1375 1380 Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser 1385 1390 1395 Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu 1400 1405 1410 His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp 1415 1420 1425 Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly 1430 1435 1440 Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr 1445 1450 1455 Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala 1460 1465 1470 Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly 1475 1480 1485 Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro 1490 1495 1500 Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu 1505 1510 1515 Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro 1520 1525 1530 Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp 1535 1540 1545 Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 1550 1555 1560 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 1565 1570 1575 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln 1580 1585 1590 Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 1595 1600 1605 Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu 1610 1615 1620 Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp 1625 1630 1635 Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu 1640 1645 1650 Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln 1655 1660 1665 Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu 1670 1675 1680 Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys 1685 1690 1695 Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys 1700 1705 1710 Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr 1715 1720 1725 Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln 1730 1735 1740 Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro 1745 1750 1755 Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val 1760 1765 1770 Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu 1775 1780 1785 Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 1790 1795 1800 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 1805 1810 1815 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln 1820 1825 1830 Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 1835 1840 1845 Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr 1850 1855 1860 Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val 1865 1870 1875 Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly 1880 1885 1890 Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr 1895 1900 1905 Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr 1910 1915 1920 Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys 1925 1930 1935 Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys 1940 1945 1950 Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala 1955 1960 1965 Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val 1970 1975 1980 Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly 1985 1990 1995 Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu 2000 2005 2010 Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe 2015 2020 2025 Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 2030 2035 2040 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 2045 2050 2055 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu 2060 2065 2070 Leu Ile Glu Asn Ser Ser Pro 2075 2080 <210> 45 <211> 2080 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 45 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Thr Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Leu Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ile Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Lys 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Asp Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Ile Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Val Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Thr Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr 1370 1375 1380 Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser 1385 1390 1395 Ser Gly Gly Ser Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu 1400 1405 1410 His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp 1415 1420 1425 Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly 1430 1435 1440 Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr 1445 1450 1455 Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala 1460 1465 1470 Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly 1475 1480 1485 Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro 1490 1495 1500 Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu 1505 1510 1515 Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro 1520 1525 1530 Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp 1535 1540 1545 Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu 1550 1555 1560 His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 1565 1570 1575 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln 1580 1585 1590 Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 1595 1600 1605 Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu 1610 1615 1620 Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp 1625 1630 1635 Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu 1640 1645 1650 Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln 1655 1660 1665 Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu 1670 1675 1680 Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys 1685 1690 1695 Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys 1700 1705 1710 Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr 1715 1720 1725 Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln 1730 1735 1740 Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro 1745 1750 1755 Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val 1760 1765 1770 Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu 1775 1780 1785 Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp 1790 1795 1800 Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 1805 1810 1815 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln 1820 1825 1830 Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 1835 1840 1845 Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr 1850 1855 1860 Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val 1865 1870 1875 Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly 1880 1885 1890 Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr 1895 1900 1905 Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr 1910 1915 1920 Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys 1925 1930 1935 Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys 1940 1945 1950 Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala 1955 1960 1965 Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val 1970 1975 1980 Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly 1985 1990 1995 Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu 2000 2005 2010 Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe 2015 2020 2025 Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys 2030 2035 2040 Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 2045 2050 2055 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu 2060 2065 2070 Leu Ile Glu Asn Ser Ser Pro 2075 2080 <210> 46 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 46 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg 1205 1210 1215 Phe Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Arg Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val Tyr Arg Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 47 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 47 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Thr Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Leu Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ile Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Lys 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Asp Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Ile Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Val Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 48 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 48 Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp 35 40 45 Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys 65 70 <210> 49 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 49 Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp 35 40 45 Arg Pro Asp Leu Ile Pro His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys 65 70 <210> 50 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 50 Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Arg Leu Ala Ala Phe Lys Arg Asp 35 40 45 Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys 65 70 <210> 51 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 51 Ser Glu Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asn Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Lys Asp 35 40 45 Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys 65 70 <210> 52 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 52 Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Val Thr Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Arg Asp 35 40 45 His Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Lys Arg Pro Phe Gln Lys Gly Leu Cys 65 70 <210> 53 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 53 Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Glu Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Met Arg Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Gln Lys Asp 35 40 45 Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Arg Arg Ile Phe Gln Lys Gly Leu Cys 65 70 <210> 54 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 54 Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Glu Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Met Arg Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Gln Lys Asp 35 40 45 Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Arg Arg Ile Phe Gln Lys Gly Leu Cys 65 70 <210> 55 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 55 Ser Lys Lys Gly Lys Gln His Ala Glu Ile Leu Phe Leu Asp Lys Ile 1 5 10 15 Arg Ser Met Glu Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Glu Thr Phe Lys Lys Asp 35 40 45 Arg Pro Asp Leu Ile Leu His Ile Tyr Thr Ser Arg Leu Tyr Phe His 50 55 60 Trp Lys Arg Ala Phe Gln Glu Gly Leu Cys 65 70 <210> 56 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 56 Ser Lys Lys Gly Lys Pro His Ala Glu Ile Leu Phe Leu Asp Lys Met 1 5 10 15 Trp Ser Met Glu Glu Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr 20 25 30 Trp Ser Pro Cys Pro Asn Cys Ala Arg Gln Leu Ala Ala Phe Lys Lys 35 40 45 Asp His Pro Gly Leu Ile Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe 50 55 60 Tyr Trp Arg Arg Lys Phe Gln Lys Gly Leu Cys 65 70 75 <210> 57 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 57 Lys Lys Gly Glu Gln His Val Glu Ile Leu Phe Leu Glu Lys Met Arg 1 5 10 15 Ser Met Glu Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Asn Cys Ala Arg Gln Leu Ala Ala Phe Lys Lys Asp His 35 40 45 Pro Asp Leu Ile Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe Tyr Trp 50 55 60 Arg Lys Lys Phe Gln Lys Gly Leu Cys 65 70 <210> 58 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 58 Ser Lys Lys Gly Arg Gln His Ala Glu Ile Leu Phe Leu Glu Lys Val 1 5 10 15 Arg Ser Met Gln Leu Ser Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp 20 25 30 Ser Pro Cys Pro Asn Cys Ala Trp Gln Leu Ala Ala Phe Lys Met Asp 35 40 45 His Pro Asp Leu Ile Leu Arg Ile Tyr Ala Ser Arg Leu Tyr Phe His 50 55 60 Trp Arg Arg Ala Phe Gln Lys Gly Leu Cys 65 70 <210> 59 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 59 Asn Lys Lys Gly Lys His Ala Glu Ile Leu Phe Ile Asp Glu Met Arg 1 5 10 15 Ser Leu Glu Leu Gly Gln Val Gln Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Asn Cys Ala Gln Glu Leu Ala Ala Phe Lys Ser Asp His 35 40 45 Pro Asp Leu Val Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp 50 55 60 Arg Arg Lys Tyr Gln Glu Gly Leu Cys 65 70 <210> 60 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 60 Asn Lys Lys Gly Lys His Ala Glu Ile Leu Phe Ile Asp Glu Met Arg 1 5 10 15 Ser Leu Glu Leu Gly Gln Ala Arg Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Asn Cys Ala Gln Lys Leu Ala Ala Phe Lys Lys Asp His 35 40 45 Pro Asp Leu Val Leu Arg Val Tyr Thr Ser Arg Leu Tyr Phe His Trp 50 55 60 Arg Arg Lys Tyr Gln Glu Gly Leu Cys 65 70 <210> 61 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 61 Asn Lys Lys Asp Lys His Ala Glu Ile Leu Phe Ile Asp Lys Met Arg 1 5 10 15 Ser Leu Glu Leu Cys Gln Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Asn Cys Ala Gln Glu Leu Ala Ala Phe Lys Lys Asp His 35 40 45 Pro Asp Leu Val Leu Arg Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp 50 55 60 Arg Arg Lys Tyr Gln Glu Gly Leu Cys 65 70 <210> 62 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 62 Asn Lys Lys Gly Lys His Ala Glu Ile Leu Phe Ile Asp Glu Met Arg 1 5 10 15 Ser Leu Lys Leu Ser Gln Glu Arg Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Asn Cys Ala Gln Glu Leu Ala Ala Phe Lys Arg Asp His 35 40 45 Pro Gly Leu Val Leu Arg Ile Tyr Ala Ser Arg Leu Tyr Phe His Trp 50 55 60 Arg Arg Lys Tyr Gln Glu Gly Leu Cys 65 70 <210> 63 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 63 Asn Lys Arg Ala Lys His Ala Glu Ile Leu Leu Ile Asp Met Met Arg 1 5 10 15 Ser Met Glu Leu Gly Gln Val Gln Ile Thr Cys Tyr Ile Thr Trp Ser 20 25 30 Pro Cys Pro Thr Cys Ala Gln Glu Leu Ala Ala Phe Lys Gln Asp His 35 40 45 Pro Asp Leu Val Leu Arg Ile Tyr Ala Ser Arg Leu Tyr Phe His Trp 50 55 60 Lys Arg Lys Phe Gln Lys Gly Leu 65 70 <210> 64 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 64 Asn Lys Lys Gly Arg His Ala Glu Ile Cys Leu Ile Asp Glu Met Arg 1 5 10 15 Ser Leu Gly Leu Gly Lys Ala Gln Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Arg Lys Cys Ala Gln Glu Leu Ala Thr Phe Lys Lys Asp His 35 40 45 Pro Asp Leu Val Leu Arg Val Tyr Ala Ser Arg Leu Tyr Phe His Trp 50 55 60 Ser Arg Lys Tyr Gln Gln Gly Leu Cys 65 70 <210> 65 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 65 Asn Lys Lys Gly His His Ala Glu Ile Arg Phe Ile Glu Arg Ile Arg 1 5 10 15 Ser Met Gly Leu Asp Pro Ser Gln Asp Tyr Gln Ile Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Leu Asp Cys Ala Phe Lys Leu Ala Lys Leu Lys 35 40 45 Lys Asp Phe Pro Arg Leu Thr Leu Arg Ile Phe Thr Ser Arg Leu Tyr 50 55 60 Phe His Trp Ile Arg Lys Phe Gln Lys Gly Leu 65 70 75 <210> 66 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 66 Asn Lys Lys Gly Lys His Ala Glu Ala Arg Phe Val Asp Lys Met Arg 1 5 10 15 Ser Met Gln Leu Asp His Ala Leu Ile Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Leu Asp Cys Ser Gln Lys Leu Ala Ala Leu Lys Arg Asp His 35 40 45 Pro Gly Leu Thr Leu Arg Ile Phe Thr Ser Arg Leu Tyr Phe His Trp 50 55 60 Val Lys Lys Phe Gln Glu Gly Leu 65 70 <210> 67 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 67 Ser Pro Gln Lys Gly His His Ala Glu Ser Arg Phe Ile Lys Arg Ile 1 5 10 15 Ser Ser Met Asp Leu Asp Arg Ser Arg Ser Tyr Gln Ile Thr Cys Phe 20 25 30 Leu Thr Trp Ser Pro Cys Pro Ser Cys Ala Gln Glu Leu Ala Ser Phe 35 40 45 Lys Arg Ala His Pro His Leu Arg Phe Gln Ile Phe Val Ser Arg Leu 50 55 60 Tyr Phe His Trp Lys Arg Ser Tyr Gln Ala Gly Leu 65 70 75 <210> 68 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 68 Lys Lys Gly Tyr His Ala Glu Ser Arg Phe Ile Lys Arg Ile Cys Ser 1 5 10 15 Met Asp Leu Gly Gln Asp Gln Ser Tyr Gln Val Thr Cys Phe Leu Thr 20 25 30 Trp Ser Pro Cys Pro His Cys Ala Gln Glu Leu Val Ser Phe Lys Arg 35 40 45 Ala His Pro His Leu Arg Leu Gln Ile Phe Thr Ala Arg Leu Phe Phe 50 55 60 His Trp Lys Arg Ser Tyr Gln Glu Gly Leu 65 70 <210> 69 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 69 Lys Lys Gly Gln His Ala Glu Ile Arg Phe Ile Glu Arg Ile His Ser 1 5 10 15 Met Ala Leu Asp Gln Ala Arg Ser Tyr Gln Ile Thr Cys Phe Leu Thr 20 25 30 Trp Ser Pro Cys Pro Phe Cys Ala Gln Glu Leu Ala Ser Phe Lys Ser 35 40 45 Thr His Pro Arg Val His Leu Gln Ile Phe Val Ser Arg Leu Tyr Phe 50 55 60 His Trp Lys Arg Ser Tyr Gln Glu Gly Leu 65 70 <210> 70 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 70 Asn Lys Lys Gly His His Ala Glu Ile Arg Phe Ile Lys Lys Ile Arg 1 5 10 15 Ser Leu Asp Leu Asp Gln Ser Gln Asn Tyr Glu Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Pro Asp Cys Ala Gln Glu Leu Val Ala Leu Thr 35 40 45 Arg Ser His Pro His Val Arg Leu Arg Leu Phe Thr Ser Arg Leu Tyr 50 55 60 Phe His Trp Phe Trp Ser Phe Gln Glu Gly Leu 65 70 75 <210> 71 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 71 Asn Arg His Ala Glu Ile Cys Phe Ile Asp Glu Ile Glu Ser Met Gly 1 5 10 15 Leu Asp Lys Thr Gln Cys Tyr Glu Val Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Ser Cys Ala Gln Lys Leu Ala Ala Phe Thr Lys Ala Gln 35 40 45 Val His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr Tyr His Trp 50 55 60 Arg Ser Ser Tyr Gln Lys Gly Leu 65 70 <210> 72 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 72 Asn Arg His Ala Glu Ile Cys Phe Ile Asp Glu Ile Glu Ser Met Gly 1 5 10 15 Leu Asp Lys Thr Gln Cys Tyr Glu Val Thr Cys Tyr Leu Thr Trp Ser 20 25 30 Pro Cys Pro Ser Cys Ala Gln Lys Leu Val Ala Phe Ala Lys Ala Gln 35 40 45 Asp His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr Tyr His Trp 50 55 60 Arg Arg Arg Tyr Lys Glu Gly Leu 65 70 <210> 73 <211> 70 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 73 His Val Glu Ile Cys Phe Ile Asp Lys Ile Ala Ser Met Glu Leu Asp 1 5 10 15 Lys Thr Gln Cys Tyr Asp Val Thr Cys Tyr Leu Thr Trp Ser Pro Cys 20 25 30 Pro Ser Cys Ala Gln Lys Leu Ala Ala Phe Ala Lys Ala Gln Asp His 35 40 45 Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr Tyr His Trp Arg Arg 50 55 60 Ser Tyr Gln Lys Gly Leu 65 70 <210> 74 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 74 Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys 1 5 10 15 Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe Ile 35 40 45 Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu 65 70 75 <210> 75 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 75 Glu Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile 1 5 10 15 Lys Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr 20 25 30 Leu Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe 35 40 45 Ile Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu 50 55 60 Tyr Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu 65 70 75 <210> 76 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 76 Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys 1 5 10 15 Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Lys Leu Val Asp Phe Ile 35 40 45 Gln Ala His Asp His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Tyr His Trp Cys Lys Pro Gln Gln Glu Gly Leu 65 70 75 <210> 77 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 77 Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys 1 5 10 15 Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Pro Ser Cys Ala Trp Glu Leu Val Asp Phe Ile 35 40 45 Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Tyr His Trp Cys Arg His Gln Gln Glu Gly Leu 65 70 75 <210> 78 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 78 Asn Lys Lys Lys Asp His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys 1 5 10 15 Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val Asp Phe Ile 35 40 45 Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu 65 70 75 <210> 79 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 79 Asn Lys Lys Lys Glu His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys 1 5 10 15 Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Lys Leu Val Asp Phe Ile 35 40 45 Lys Ala His His His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu 65 70 75 <210> 80 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 80 Asn Lys Lys Lys His His Ala Glu Ile His Phe Ile Asn Lys Ile Lys 1 5 10 15 Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Pro Ser Cys Ala Arg Glu Leu Val Asp Phe Ile 35 40 45 Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Tyr His Trp Arg Pro His Tyr Gln Glu Gly Leu 65 70 75 <210> 81 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 81 Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn 1 5 10 15 Ser Leu Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile 20 25 30 Thr Trp Ser Pro Cys Pro Asn Cys Ala Asn Glu Leu Val Asn Phe Ile 35 40 45 Thr Arg Asn Asn His Leu Lys Leu Glu Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Phe His Trp Ile Lys Pro Phe Lys Met Gly Leu 65 70 75 <210> 82 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 82 Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn 1 5 10 15 Ser Leu Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile 20 25 30 Thr Trp Ser Pro Cys Pro Asn Cys Ala Ser Glu Leu Val Asp Phe Ile 35 40 45 Thr Arg Asn Asp His Leu Asp Leu Gln Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Phe His Trp Ile Lys Pro Phe Lys Arg Gly Leu 65 70 75 <210> 83 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 83 Asn Lys Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn 1 5 10 15 Ser Leu Asn Leu Asp Arg Arg Gln Ser Tyr Lys Ile Ile Cys Tyr Ile 20 25 30 Thr Trp Ser Pro Cys Pro Arg Cys Ala Ser Glu Leu Val Asp Phe Ile 35 40 45 Thr Gly Asn Asp His Leu Asn Leu Gln Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Phe His Trp Lys Lys Pro Phe Gln Arg Gly Leu 65 70 75 <210> 84 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 84 Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn 1 5 10 15 Ser Leu Asn Leu Asp Gln Asn Gln Cys Tyr Arg Ile Ile Cys Tyr Val 20 25 30 Thr Trp Ser Pro Cys His Asn Cys Ala Lys Glu Leu Val Asp Phe Ile 35 40 45 Ser Asn Arg His His Leu Ser Leu Gln Leu Phe Ala Ser Arg Leu Tyr 50 55 60 Phe His Trp Val Arg Cys Tyr Gln Arg Gly Leu 65 70 75 <210> 85 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 85 Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Lys 1 5 10 15 Ser Leu Gly Leu Asp Arg Val Gln Ser Tyr Glu Ile Thr Cys Tyr Ile 20 25 30 Thr Trp Ser Pro Cys Pro Thr Cys Ala Leu Glu Leu Val Ala Phe Thr 35 40 45 Arg Asp Tyr Pro Arg Leu Ser Leu Gln Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Phe His Trp Arg Arg Arg Ser Ile Gln Gly Leu 65 70 75 <210> 86 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 86 Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn 1 5 10 15 Ser Leu Gly Leu Asp Gln Asp Gln Ser Tyr Glu Ile Thr Cys Tyr Val 20 25 30 Thr Trp Ser Pro Cys Ala Thr Cys Ala Cys Lys Leu Ile Lys Phe Thr 35 40 45 Arg Lys Phe Pro Asn Leu Ser Leu Arg Ile Phe Val Ser Arg Leu Tyr 50 55 60 Tyr His Trp Phe Arg Gln Asn Gln Gln Gly Leu 65 70 75 <210> 87 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 87 Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Ser Ile Arg Ala 1 5 10 15 Leu Gln Leu Asp Gln Ser Gln Arg Phe Glu Ile Thr Cys Tyr Leu Thr 20 25 30 Trp Ser Pro Cys Pro Thr Cys Ala Lys Glu Leu Ala Met Phe Val Gln 35 40 45 Asp His Pro His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe 50 55 60 His Trp Arg Trp Lys Tyr Gln Glu Gly Leu 65 70 <210> 88 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 88 Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Asn Ile Lys Ala 1 5 10 15 Leu Arg Leu Asp Thr Ser Gln Arg Phe Glu Ile Thr Cys Tyr Val Thr 20 25 30 Trp Ser Pro Cys Pro Thr Cys Ala Lys Glu Leu Val Ala Phe Val Arg 35 40 45 Asp His Arg His Ile Ser Leu Arg Leu Phe Ala Ser Arg Leu Tyr Phe 50 55 60 His Trp Leu Arg Glu Asn Lys Lys Gly Leu 65 70 <210> 89 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 89 Asn Lys Lys Lys Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Arg 1 5 10 15 Ser Leu Gln Arg Asp Ser Ser Gln Thr Phe Glu Ile Thr Cys Tyr Val 20 25 30 Thr Trp Ser Pro Cys Phe Thr Cys Ala Glu Glu Leu Val Ala Phe Val 35 40 45 Arg Asp His Pro His Val Arg Leu Arg Leu Phe Ala Ser Arg Leu Tyr 50 55 60 Phe His Trp Leu Arg Lys Tyr Gln Glu Gly Leu 65 70 75 <210> 90 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 90 Asn Lys Lys Lys Arg His Ala Glu Ile Cys Phe Ile Asp Lys Ile Lys 1 5 10 15 Ser Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile Ile Cys Tyr Ile 20 25 30 Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu Val Ala Phe Val 35 40 45 Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu 65 70 75 <210> 91 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 91 Asn Lys Lys Lys Arg His Ala Glu Ile Cys Phe Ile Asp Lys Ile Lys 1 5 10 15 Ser Leu Thr Arg Asp Thr Ser Gln Arg Phe Glu Ile Ile Cys Tyr Ile 20 25 30 Thr Trp Ser Pro Cys Pro Phe Cys Ala Glu Glu Leu Val Ala Phe Val 35 40 45 Lys Asp Asn Pro His Leu Ser Leu Arg Ile Phe Ala Ser Arg Leu Tyr 50 55 60 Val His Trp Arg Trp Lys Tyr Gln Gln Gly Leu 65 70 75 <210> 92 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 92 Asn Lys Lys His Arg His Ala Glu Val Arg Phe Ile Ala Lys Ile Arg 1 5 10 15 Ser Met Ser Leu Asp Leu Asp Gln Lys His Gln Leu Thr Cys Tyr Leu 20 25 30 Thr Trp Ser Pro Cys Pro Ser Cys Ala Gln Glu Leu Val Thr Phe Met 35 40 45 Ala Glu Ser Arg His Leu Asn Leu Gln Val Phe Val Ser Arg Leu Tyr 50 55 60 Phe His Trp Gln Arg Asp Phe Gln Gln Gly Leu 65 70 75 <210> 93 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 93 Gly Arg Ser Tyr Asn Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly 1 5 10 15 Arg Ser Asn Leu Leu Trp Asn Thr Gly Val Phe Arg Gly Gln Met Tyr 20 25 30 Ser Gln Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu 65 70 75 80 Ala Glu Tyr Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 94 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 94 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly 1 5 10 15 His Ser Asn Leu Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr 20 25 30 Ser Gln Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 95 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 95 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly 1 5 10 15 His Ser Asn Leu Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr 20 25 30 Ser Gln Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Ser Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Lys Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 96 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 96 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser 1 5 10 15 Arg Pro Pro Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Phe Glu 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu <210> 97 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 97 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser 1 5 10 15 Arg Pro Arg Leu Asp Thr Lys Ile Phe Arg Gly Gln Val Tyr Phe Glu 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 98 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 98 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser 1 5 10 15 Arg Pro Arg Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln 20 25 30 Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 99 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 99 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser 1 5 10 15 Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Cys Phe Glu 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 100 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 100 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser 1 5 10 15 Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Cys Phe Glu 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 101 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 101 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser 1 5 10 15 Met Pro Thr Trp Gly Ala Lys Ile Phe Arg Gly Gln Val Tyr Phe Glu 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 102 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 102 Arg Asn Thr Val Trp Leu Cys Tyr Lys Val Lys Thr Arg Gly Pro Ser 1 5 10 15 Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Tyr Phe Gln 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Val Lys Val Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Thr Asp Tyr 100 <210> 103 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 103 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser 1 5 10 15 Met Pro Thr Trp Asp Thr Lys Ile Phe Arg Gly Gln Val Tyr Ser Lys 20 25 30 Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 104 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 104 Arg Asn Thr Val Trp Leu Cys Tyr Glu Val Lys Thr Arg Gly Pro Ser 1 5 10 15 Met Pro Thr Trp Gly Thr Lys Ile Phe Arg Gly Gln Val Tyr Phe Gln 20 25 30 Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys Gly Asn 35 40 45 Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser Trp 50 55 60 Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu Ala Glu 65 70 75 80 His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr 85 90 95 Trp Gly Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu 100 105 <210> 105 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 105 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Ser Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 110 <210> 106 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 106 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 110 <210> 107 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 107 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 110 <210> 108 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 108 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Val Lys Val Ile Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 110 <210> 109 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 109 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Ile Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Phe Thr Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 110 <210> 110 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 110 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Thr Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Gly Arg Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 110 <210> 111 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 111 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Glu Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu 65 70 75 80 Thr Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Arg Asp Trp Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 112 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 112 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Ser Glu Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu 65 70 75 80 Thr Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Arg Asp Trp Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 113 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 113 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr 20 25 30 Ser Lys Pro Glu His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala His Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Glu Phe Leu 65 70 75 80 Ala Glu Tyr Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 114 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 114 Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro 1 5 10 15 Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Phe 20 25 30 Gln Pro Glu Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly 35 40 45 Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val Ser 50 55 60 Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Ala Val Phe Leu Ala 65 70 75 80 Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr 85 90 95 Tyr Trp Glu Lys Asp Trp Gln Arg Ala Leu Cys Arg Leu 100 105 <210> 115 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (103)..(103) <223> Xaa can be any naturally occurring amino acid <400> 115 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Tyr 1 5 10 15 Pro Ser Lys Leu Leu Trp Asp Thr Gly Val Phe Gln Gly Gln Val Tyr 20 25 30 Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Glu Lys Asp Xaa Arg Arg Ala Leu Arg Arg Leu 100 105 110 <210> 116 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 116 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Glu Asp 1 5 10 15 Pro Ser Lys Leu Leu Trp Asp Thr Gly Val Phe Gln Gly Gln Val Tyr 20 25 30 Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Arg Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Gly Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu 100 105 110 <210> 117 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 117 Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Pro Gly Gln Val Arg 20 25 30 Pro Lys Phe Gln Ser Asn Arg Arg Tyr Glu Val Tyr Phe Gln Pro Gln 35 40 45 Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 50 55 60 Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Arg 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly 100 105 110 Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu 115 120 <210> 118 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 118 Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Pro Gly Gln Pro Gln 20 25 30 Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 35 40 45 Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 50 55 60 Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Arg 65 70 75 80 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly 85 90 95 Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu 100 105 <210> 119 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 119 Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Pro Gly Gln Val Arg 20 25 30 Pro Lys Phe Gln Ser Asn Arg Arg Gln Lys Val Tyr Phe Gln Pro Gln 35 40 45 Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 50 55 60 Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Arg 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly 100 105 110 Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu 115 120 <210> 120 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 120 Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Gln Gly Gln Val Arg 20 25 30 Pro Lys Phe Gln Ser Asn Arg Arg Tyr Glu Val Tyr Phe Gln Pro Gln 35 40 45 Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 50 55 60 Pro Ala Tyr Lys His Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Pro 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Gly 100 105 110 Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu 115 120 <210> 121 <211> 131 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 121 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Arg 20 25 30 Pro Lys Leu Gln Ser Asn Arg Arg Tyr Glu Leu Ser Asn Trp Glu Cys 35 40 45 Arg Lys Arg Val Tyr Phe Gln Pro Gln Tyr His Ala Glu Met Tyr Phe 50 55 60 Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln 65 70 75 80 Ile Thr Trp Phe Ala Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys 85 90 95 Val Thr Glu Phe Leu Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser 100 105 110 Val Ala Arg Leu Tyr Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu 115 120 125 Arg Arg Leu 130 <210> 122 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 122 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Phe Gln Pro Gln Tyr His Ala Glu Met Tyr Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln Ile Thr Trp Phe Ala 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Arg Arg Leu 100 105 110 <210> 123 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 123 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Asp Gln Val Tyr 20 25 30 Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Thr Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Arg Arg Leu 100 105 110 <210> 124 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 124 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Asn Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Arg Arg Leu 100 105 110 <210> 125 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 125 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Phe Gln Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Arg Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Val Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Lys Asp Trp Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 126 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 126 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly 1 5 10 15 Ser Ser Asn Leu Leu Trp Asn Thr Gly Val Phe Arg Gly Pro Val Pro 20 25 30 Pro Lys Leu Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Phe Glu 35 40 45 Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu 50 55 60 Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp 100 105 110 Arg Glu Trp Arg Arg Val Leu Arg Arg Leu 115 120 <210> 127 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 127 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly 1 5 10 15 Cys Ser Asn Leu Ile Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu 20 25 30 Pro Lys Leu Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Phe Glu 35 40 45 Asn His Ala Glu Met Cys Phe Phe Ser Trp Phe Cys Gly Asn Arg Leu 50 55 60 Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Gln Asp 100 105 110 Arg Glu Trp Arg Arg Val Leu Arg Arg Leu 115 120 <210> 128 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 128 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly 1 5 10 15 Cys Ser Asn Leu Ile Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu 20 25 30 Pro Lys Leu Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Phe Glu 35 40 45 Asn His Ala Glu Met Cys Phe Phe Ser Trp Phe Cys Gly Asn Arg Leu 50 55 60 Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Gln Asp 100 105 110 Arg Glu Trp Arg Arg Val Leu Arg Arg Leu 115 120 <210> 129 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 129 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly 1 5 10 15 Arg Ser Asn Leu Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu 20 25 30 Pro Lys Arg Gln Ser Asn His Arg Gln Glu Val Tyr Phe Arg Phe Glu 35 40 45 Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu 50 55 60 Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Leu Pro Cys Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp 100 105 110 Arg Asp Trp Arg Trp Val Leu Leu Arg Leu 115 120 <210> 130 <211> 122 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 130 Gly Arg Ser Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Lys Gly Val Phe Arg Gly Gln Val Leu 20 25 30 Pro Lys Phe Gln Ser Asn His Arg Gln Glu Val Tyr Phe Gln Leu Glu 35 40 45 Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu 50 55 60 Pro Ala Asn Arg Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro 65 70 75 80 Cys Leu Pro Cys Val Ala Lys Val Thr Glu Phe Leu Ala Glu His Pro 85 90 95 Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Gly 100 105 110 Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu 115 120 <210> 131 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 131 Gly Lys Lys Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp 1 5 10 15 Thr Ser Lys Leu Pro Trp Asn Thr Gly Val Phe Arg Gly Gln Val Asn 20 25 30 Phe Asn Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Arg 35 40 45 Gly Lys Leu Leu Pro Ala Cys Lys Arg Ser Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Leu Tyr Cys Val Ala Lys Val Ala Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Val Ser Thr Ala Arg Leu Tyr 85 90 95 Cys Tyr Trp Lys Lys Asp Trp Arg Arg Ala Leu Arg Lys Leu 100 105 110 <210> 132 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 132 Gly Lys Lys Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Lys Asp 1 5 10 15 Thr Ser Lys Leu Pro Trp Asn Thr Gly Val Phe Arg Gly Gln Val Asn 20 25 30 Phe Asn Pro Glu His His Ala Glu Met Tyr Phe Leu Ser Trp Phe Arg 35 40 45 Gly Lys Leu Leu Pro Ala Cys Lys Arg Ser Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Asn Pro Cys Leu Tyr Cys Val Ala Lys Val Ala Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Val Ser Thr Ala Arg Leu Tyr 85 90 95 Cys Tyr Trp Lys Lys Asp Trp Arg Arg Ala Leu Arg Lys Leu 100 105 110 <210> 133 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 133 Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Met Lys Asp 1 5 10 15 His Ser Lys Leu Pro Trp Tyr Thr Gly Val Phe Arg Gly Gln Val Tyr 20 25 30 Phe Glu Pro Gln Asn His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Glu Cys Cys Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Ala Lys Val Thr Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Arg Gly Arg Asp Trp Arg Arg Ala Leu Arg Arg Leu 100 105 110 <210> 134 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 134 Gly Arg Arg Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Ser Lys Asp 1 5 10 15 Pro Ser Lys Leu Pro Trp Asp Thr Gly Ile Phe Arg Gly Gln Val Tyr 20 25 30 Phe Glu Pro Gln Tyr His Ala Glu Met Cys Phe Leu Ser Trp Tyr Cys 35 40 45 Gly Asn Gln Leu Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val 50 55 60 Ser Trp Thr Pro Cys Pro Asp Cys Val Gly Lys Val Ala Glu Phe Leu 65 70 75 80 Ala Glu His Pro Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr 85 90 95 Tyr Tyr Trp Glu Thr Asp Tyr Arg Arg Ala Leu Cys Arg Leu 100 105 110 <210> 135 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 135 Arg Asn Tyr Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Lys Asp Pro 1 5 10 15 Ser Lys Leu Ala Trp Asp Thr Gly Val Phe Arg Gly Gln Val Leu Pro 20 25 30 Lys Leu Gln Ser Asn His Arg Arg Glu Val Tyr Phe Glu Pro Gln Tyr 35 40 45 His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Ser 50 55 60 Ala Tyr Glu Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys 65 70 75 80 Pro Asp Cys Val Ala Met Leu Ala Glu Phe Leu Ala Glu His Pro Asn 85 90 95 Val Thr Leu Thr Val Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg 100 105 110 Asp Tyr Arg Gly Ala Leu Arg Arg Leu 115 120 <210> 136 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 136 gagguugccu ggcaccuacg guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 137 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 137 gagacccacc ucucgcaguc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 138 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 138 gccccauguc gacuacaucg guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 139 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 139 auggucaccg acuucgagaa guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 140 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 140 accuuggcuu uguuccuccc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 141 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 141 ggcuuuguuc cucccaggcc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 142 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 142 guggugcugc ugccccuggc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 143 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 143 ugcugcugcc ccuggcgggu guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 144 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 144 acccaccucc ucaccuuucc guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 145 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 145 agcgacugca gcaccugcuu guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 146 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 146 aacgcuuuug ggggugaggg guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 147 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 147 ccacacagcu ccaccagcug guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 148 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 148 cacugggagg uggaggaccu guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 149 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 149 cccacaagcc gccugugcug guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 150 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 150 aggucuggaa ugcaaaguca guuugagagc uaggccaaca ugaggaucac ccaugucugc 60 agggccuagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu 120 cggugc 126 <210> 151 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 151 cucucgcagu cagagcgcac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 152 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 152 caggcccagg cugcccgccg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 153 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 153 ucuuugccca gagcaucccg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 154 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 154 cacagacagg uaagcacggc guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 155 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 155 aagccagcug guccagccug guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 156 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 156 gguccagccu guggggccac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 157 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 157 cgccugccag cgccuggcga guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 158 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 158 ugccagcgcc uggcgagggc guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 159 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 159 aagaccagcc ggugacccug guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 160 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 160 aucacaggcu gcugcccacg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 161 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 161 cuaccccagg ccaacugcag guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 162 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 162 caacagggcc acguccucac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 163 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 163 aggucagccc aaccagugcg guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 164 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 164 ccaaccagug cgugggccac guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 165 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 165 ccccucagga gcaggugaag guuugagagc uagggcccug aagaagggcc cuagcaaguu 60 caaauaaggc uaguccguua ucaacuuggg cccugaagaa gggcccaagu ggcaccgagu 120 cggugc 126 <210> 166 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 166 gaggttgcct ggcacctacg tgg 23 <210> 167 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 167 gagacccacc tctcgcagtc aga 23 <210> 168 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 168 gccccatgtc gactacatcg agg 23 <210> 169 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 169 atggtcaccg acttcgagaa tgt 23 <210> 170 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 170 accttggctt tgttcctccc agg 23 <210> 171 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 171 ggctttgttc ctcccaggcc tgg 23 <210> 172 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 172 gtggtgctgc tgcccctggc ggg 23 <210> 173 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 173 tgctgctgcc cctggcgggt ggg 23 <210> 174 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 174 acccacctcc tcacctttcc agg 23 <210> 175 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 175 agcgactgca gcacctgctt tgt 23 <210> 176 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 176 aacgcttttg ggggtgaggg tgt 23 <210> 177 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 177 ccacacagct ccaccagctg agg 23 <210> 178 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 178 cactgggagg tggaggacct tgg 23 <210> 179 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 179 cccacaagcc gcctgtgctg agg 23 <210> 180 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 180 aggtctggaa tgcaaagtca agg 23 <210> 181 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 181 ctctcgcagt cagagcgcac tgc 23 <210> 182 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 182 caggcccagg ctgcccgccg ggg 23 <210> 183 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 183 tctttgccca gagcatcccg tgg 23 <210> 184 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 184 cacagacagg taagcacggc cgt 23 <210> 185 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 185 aagccagctg gtccagcctg tgg 23 <210> 186 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 186 ggtccagcct gtggggccac tgg 23 <210> 187 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 187 cgcctgccag cgcctggcga ggg 23 <210> 188 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 188 tgccagcgcc tggcgagggc tgg 23 <210> 189 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 189 aagaccagcc ggtgaccctg ggg 23 <210> 190 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 190 atcacaggct gctgcccacg tgg 23 <210> 191 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 191 ctaccccagg ccaactgcag cgt 23 <210> 192 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 192 caacagggcc acgtcctcac agg 23 <210> 193 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 193 aggtcagccc aaccagtgcg tgg 23 <210> 194 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 194 ccaaccagtg cgtgggccac agg 23 <210> 195 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 195 cccctcagga gcaggtgaag agg 23 <210> 196 <211> 76 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 196 guuugagagc uagaaauagc aaguucaaau aaggcuaguc cguuaucaac uugaaaaagu 60 ggcaccgagu cggugc 76 <210> 197 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 197 guuuuagagc ua 12 <210> 198 <211> 12 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 198 guuugagagc ua 12 <210> 199 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 199 uagcaaguua aaau 14 <210> 200 <211> 4 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 200 gaaa 4 <210> 201 <211> 14 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 201 aacuugaaaa agug 14 <210> 202 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 202 gcaccgaguc ggugc 15 <210> 203 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 203 gcaccgauuc ggugc 15

Claims (64)

  1. 융합 단백질로서,
    핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편,
    핵염기 디아미나제 억제제를 포함하는 제2 단편, 및
    제1 단편 및 제2 단편 사이의 프로테아제 절단 부위
    를 포함하는 것인 융합 단백질.
  2. 제1항에 있어서, 핵염기 디아미나제는 아데노신 디아미나제인 융합 단백질.
  3. 제2항에 있어서, 아데노신 디아미나제는 tRNA-특이적 아데노신 디아미나제 (TadA), 아데노신 디아미나제 tRNA 특이적 1 (ADAT1), 아데노신 디아미나제 tRNA 특이적 2 (ADAT2), 아데노신 디아미나제 tRNA 특이적 3 (ADAT3), 아데노신 디아미나제 RNA 특이적 B1 (ADARB1), 아데노신 디아미나제 RNA 특이적 B2 (ADARB2), 아데노신 모노포스페이트 디아미나제 1 (AMPD1), 아데노신 모노포스페이트 디아미나제 2 (AMPD2), 아데노신 모노포스페이트 디아미나제 3 (AMPD3), 아데노신 디아미나제 (ADA), 아데노신 디아미나제 2 (ADA2), 아데노신 디아미나제 유사 (ADAL), 아데노신 디아미나제 도메인 함유 1 (ADAD1), 아데노신 디아미나제 도메인 함유 2 (ADAD2), 아데노신 디아미나제 RNA 특이적 (ADAR) 및 아데노신 디아미나제 RNA 특이적 B1 (ADARB1)으로 이루어진 군으로부터 선택되는 것인 융합 단백질.
  4. 제1항에 있어서, 핵염기 디아미나제는 시티딘 디아미나제인 융합 단백질.
  5. 제4항에 있어서, 시티딘 디아미나제는 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)로 이루어진 군으로부터 선택되는 것인 융합 단백질.
  6. 제4항에 있어서, 시티딘 디아미나제는 인간 또는 마우스 시티딘 디아미나제인 융합 단백질.
  7. 제6항에 있어서, 촉매 도메인은 마우스 A3 시티딘 디아미나제 도메인 1 (CDA1) 또는 인간 A3B 시티딘 디아미나제 도메인 2 (CDA2)인 융합 단백질.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 핵염기 디아미나제 억제제는 핵염기 디아미나제의 억제성 도메인인 융합 단백질.
  9. 제8항에 있어서, 핵염기 디아미나제 억제제는 시티딘 디아미나제의 억제성 도메인인 융합 단백질.
  10. 제9항에 있어서, 핵염기 디아미나제 억제제는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 아미노산 서열, 또는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 임의의 아미노산 서열과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
  11. 제9항에 있어서, 핵염기 디아미나제 억제제는 SEQ ID NO:1의 아미노산 서열, SEQ ID NO:1의 아미노산 잔기 AA128-AA223 또는 SEQ ID NO:2의 아미노산 서열을 포함하는 것인 융합 단백질.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 제1 단편은 군집된 규칙적으로 산재된 짧은 회문식 반복부 (clustered regularly interspaced short palindromic repeats)(CRISPR)-연관 (Cas) 단백질을 더 포함하는 것인 융합 단백질.
  13. 제12항에 있어서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택되는 것인 융합 단백질.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 TuMV 프로테아제, PPV 프로테아제, PVY 프로테아제, ZIKV 프로테아제 및 WNV 프로테아제로 이루어진 군으로부터 선택되는 프로테아제의 프로테아제 절단 부위인 융합 단백질.
  15. 제1항 내지 제13항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 자가-절단 부위인 융합 단백질.
  16. 제1항 내지 제13항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 TEV 프로테아제 절단 부위인 융합 단백질.
  17. 제16항에 있어서, TEV 프로테아제 또는 이의 단편을 포함하는 제3 단편을 더 포함하는 것인 융합 단백질.
  18. 제17항에 있어서, 제3 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편을 포함하는 것인 융합 단백질.
  19. 융합 단백질로서,
    핵염기 디아미나제 또는 이의 촉매 도메인, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 제1 TEV 프로테아제 단편을 포함하는 제1 단편,
    핵염기 디아미나제 억제제를 포함하는 제2 단편, 및
    제1 단편 및 제2 단편 사이의 TEV 프로테아제 절단 부위
    를 포함하고,
    제1 TEV 프로테아제 단편은 단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 것인, 융합 단백질.
  20. 제19항에 있어서, 우라실 글리코실라제 억제제 (UGI)를 더 포함하는 것인 융합 단백질.
  21. 제19항에 있어서, 핵염기 디아미나제 억제제, TEV 프로테아제 절단 부위, 핵염기 디아미나제 또는 이의 촉매 도메인, Cas 단백질, 및 제1 TEV 프로테아제 단편은 N-말단에서 C-말단으로 배열되는 것인 융합 단백질.
  22. 제19항에 있어서, 제1 TEV 프로테아제 단편은 TEV 프로테아제의 N-말단 도메인 (SEQ ID NO:3) 또는 C-말단 도메인 (SEQ ID NO:4)인 융합 단백질.
  23. 제22항에 있어서, TEV 프로테아제 절단 부위는 SEQ ID NO:5의 아미노산 서열을 갖는 것인 융합 단백질.
  24. 제19항에 있어서, 핵염기 디아미나제는 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)로 이루어진 군으로부터 선택되는 것인 융합 단백질.
  25. 제19항에 있어서, 핵염기 디아미나제 억제제는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 아미노산 서열, 또는 SEQ ID NO: 1-2 및 48-135로부터 선택되는 임의의 아미노산 서열과 적어도 85% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 융합 단백질.
  26. 제19항에 있어서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택되는 것인 융합 단백질.
  27. 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법으로서, 세포로
    (a) 제19항 내지 제26항 중 어느 한 항의 융합 단백질,
    (b) 태그 서열을 더 포함하는, 표적 부위를 표적화하는 가이드 RNA 또는 표적 부위를 표적화하는 crRNA 및 tracrRNA, 및
    (c) 태그 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편
    을 도입시키는 단계를 포함하는 것인 수행 방법.
  28. 제27항에 있어서, 하나 이상의 분자는 분자를 코딩하는 폴리뉴클레오티드에 의해 세포로 도입되는 것인 수행 방법.
  29. 제27항에 있어서, 제1 TEV 프로테아제 단편 및 제2 TEV 프로테아제 단편은, 상호작용할 때, TEV 프로테아제 절단 부위를 절단할 수 있는 것인 수행 방법.
  30. 제27항에 있어서, 제2 TEV 프로테아제 단편은 RNA 인식 펩티드에 융합되는 것인 수행 방법.
  31. 제27항 내지 제30항 중 어느 한 항에 있어서, 태그 서열은 MS2 서열 (SEQ ID NO:16)을 포함하는 것인 수행 방법.
  32. 제31항에 있어서, RNA 인식 펩티드는 MS2 외피 단백질 (MCP, SEQ ID NO:22)을 포함하는 것인 수행 방법.
  33. 제27항 내지 제30항 중 어느 한 항에 있어서, 태그 서열은 PP7 서열 (SEQ ID NO:18)을 포함하고 RNA 인식 펩티드는 PP7 외피 단백질 (PCP, SEQ ID NO: 23)을 포함하거나, 또는 태그 서열은 boxB 서열 (SEQ ID NO:20)을 포함하고 RNA 인식 펩티드는 boxB 외피 단백질 (N22p, SEQ ID NO: 24)을 포함하는 것인 수행 방법.
  34. 제27항에 있어서, 세포는 살아있는 유기체 내에 존재하는 것인 수행 방법.
  35. 제34항에 있어서, 세포는 인간 환자 내의 인간 세포인 수행 방법.
  36. 유전자 편집을 수행하기 위한 키트 또는 패키지로서,
    (a) 제19항 내지 제26항 중 어느 한 항의 융합 단백질, 및
    (b) RNA 서열에 결합할 수 있는 RNA 인식 펩티드에 커플링된 제2 TEV 프로테아제 단편
    을 포함하는 것인 키트 또는 패키지.
  37. 융합 단백질로서,
    제1 핵염기 디아미나제 또는 이의 촉매 도메인을 포함하는 제1 단편, 및
    제2 핵염기 디아미나제의 억제성 도메인을 포함하는 제2 단편을 포함하고,
    제1 핵염기 디아미나제는 제2 핵염기 디아미나제와 동일하거나 또는 상이한 것인 융합 단백질.
  38. 제37항에 있어서, 제1 및 제2 핵염기 디아미나제는 각각이 인간 및 마우스 APOBEC3B (A3B), APOBEC3C (A3C), APOBEC3D (A3D), APOBEC3F (A3F), APOBEC3G (A3G), APOBEC3H (A3H), APOBEC1 (A1), APOBEC3 (A3), APOBEC2 (A2), APOBEC4 (A4) 및 AICDA (AID)의 군으로부터 독립적으로 선택되는 것인 융합 단백질.
  39. 융합 단백질로서,
    핵염기 디아미나제 또는 이의 촉매 도메인,
    핵염기 디아미나제 억제제,
    제1 RNA 인식 펩티드, 및
    핵염기 디아미나제 또는 이의 촉매 도메인 및 핵염기 디아미나제 억제제 사이의 TEV 프로테아제 절단 부위
    를 포함하는 제1 단편을 포함하는 것인 융합 단백질.
  40. 제39항에 있어서,
    단독으로 TEV 프로테아제 절단 부위를 절단할 수 없는 TEV 프로테아제 단편, 및
    제2 RNA 인식 펩티드
    를 포함하는 제2 단편을 더 포함하는 것인 융합 단백질.
  41. 제40항에 있어서, 제1 단편 및 제2 단편 사이에 자가-절단 부위를 더 포함하는 것인 융합 단백질.
  42. 제41항에 있어서, 제2 TEV 프로테아제 단편을 포함하는 제3 단편을 더 포함하고, 제1 TEV 프로테아제 단편은 제2 TEV 프로테아제 단편의 존재 하에서 TEV 프로테아제 부위를 절단할 수 있는 것인 융합 단백질.
  43. 제42항에 있어서, 제2 단편 및 제3 단편 사이에 제2 자가-절단 부위를 더 포함하고, 제2 자가-절단 부위의 절단 시에, 융합 단백질은 임의의 RNA 인식 펩티드에 융합되지 않은 제2 TEV 프로테아제 단편을 방출시키는 것인 융합 단백질.
  44. 이중 가이드 RNA 시스템으로서,
    제1 PAM 부위에 근접한 표적 핵산 서열에 상보성인 서열을 갖는 제1 스페이서를 포함하는 표적 단일 가이드 RNA,
    제2 PAM 부위에 근접한 제2 핵산 서열에 상보성인 서열을 갖는 제2 스페이서를 포함하는 헬퍼 단일 가이드 RNA,
    군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및
    핵염기 디아미나제를 포함하고,
    제2 PAM 부위는 제1 PAM 부위로부터 34 내지 91 염기인 이중 가이드 RNA 시스템.
  45. 제44항에 있어서, 제2 스페이서는 7-23 염기 길이인 이중 가이드 RNA 시스템.
  46. 제44항에 있어서, 제2 스페이서는 8-15 염기 길이인 이중 가이드 RNA 시스템.
  47. 제44항에 있어서, 제2 스페이서는 9-12 염기 길이인 이중 가이드 RNA 시스템.
  48. 가이드 RNA로서, 5'에서 3' 방향으로,
    제1 스템 루프 부분,
    제2 스템 루프 부분,
    제3 스템 루프 부분, 및
    제4 스템 루프 부분을 포함하는 스캐폴드를 포함하고,
    제3 스템 루프는 그 안에 5 염기쌍을 포함하는 것인 가이드 RNA.
  49. 제48항에 있어서, 염기쌍은 SEQ ID NO:31 내 위치에 따라서, 위치 45 및 55 사이의 하나를 포함하는 것인 가이드 RNA.
  50. 제48항 또는 제49항에 있어서, 스캐폴드는 SEQ ID NO:32-43으로 이루어진 군으로부터 선택되는 서열을 포함하는 것인 가이드 RNA.
  51. 제48항에 있어서, 표적 서열을 인식하기 위한 스페이서, 역전사효소 주형, 또는 프라이머-결합 부위 중 하나 이상을 더 포함하는 것인 가이드 RNA.
  52. 세포 내 표적 부위에서 유전자 편집을 수행하기 위한 방법으로서, 세포로
    군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질을 코딩하는 제1 구성체가 밀봉된 제1 바이러스 입자, 및
    RNA 인식 펩티드에 융합된 역전사효소를 코딩하는 제2 구성체가 밀봉된 제2 바이러스 입자
    를 도입시키는 단계를 포함하는 것인 수행 방법.
  53. 제52항에 있어서, 제2 구성체는 RNA 인식 펩티드가 결합하는 RNA 인식 부위를 포함하는 가이드 RNA를 더 코딩하는 것인 수행 방법.
  54. 제52항에 있어서, Cas 단백질은 SpCas9, FnCas9, St1Cas9, St3Cas9, NmCas9, SaCas9, AsCpf1, LbCpf1, FnCpf1, VQR SpCas9, EQR SpCas9, VRER SpCas9, SpCas9-NG, xSpCas9, RHA FnCas9, KKH SaCas9, NmeCas9, StCas9, CjCas9, AsCpf1, FnCpf1, SsCpf1, PcCpf1, BpCpf1, CmtCpf1, LiCpf1, PmCpf1, Pb3310Cpf1, Pb4417Cpf1, BsCpf1, EeCpf1, BhCas12b, AkCas12b, EbCas12b, LsCas12b, RfCas13d, LwaCas13a, PspCas13b, PguCas13b, 및 RanCas13b로 이루어진 군으로부터 선택되는 것인 수행 방법.
  55. 제52항에 있어서, 역전사효소는 인간 면역결핍 바이러스 (HIV) 역전사효소, 몰로니 쥐 백혈병 바이러스 (MMLV) 역전사효소 및 조류 골수아세포종 바이러스 (AMV) 역전사효소로 이루어진 군으로부터 선택되는 것인 수행 방법.
  56. 인간 PCSK9 핵산 서열을 편집하기 위한 헬퍼 가이드 RNA/가이드 RNA의 쌍으로서, 가이드 RNA는 PCSK9 핵산 상의 제1 부위를 특이적으로 표적화하여 비-중지 코돈을 중지 코돈으로 전환시키는 염기 편집을 할 수 있고, 헬퍼 가이드 RNA는 제1 부위로부터 20 내지 100 염기인 PCSK9 핵산 상의 제2 부위를 특이적으로 표적화하는 것인 쌍.
  57. 제56항에 있어서, 비-중지 코돈은 CAG, CAA, 또는 CGA인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
  58. 제56항 또는 제57항에 있어서, 헬퍼 가이드 RNA는 7-23 뉴클레오티드 길이인 서열에 특이적으로 결합하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
  59. 제56항 또는 제57항에 있어서, 헬퍼 가이드 RNA는 8-15 뉴클레오티드 길이인 서열에 특이적으로 결합하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
  60. 제58항 또는 제59항에 있어서, 헬퍼 가이드 RNA는 제1 부위 내 서열에 특이적으로 결합하고, 가이드 RNA는 제2 부위 내 서열에 특이적으로 결합하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
  61. 제60항에 있어서, 제2 부위는 SEQ ID NO:166-180 중 어느 하나의 서열을 포함하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
  62. 제60항에 있어서, 제2 부위 및 제1 부위는 각각이
    SEQ ID NO:166 및 181;
    SEQ ID NO:167 및 182;
    SEQ ID NO:168 및 183;
    SEQ ID NO:169 및 184;
    SEQ ID NO:170 및 185;
    SEQ ID NO:171 및 186;
    SEQ ID NO:172 및 187;
    SEQ ID NO:173 및 188;
    SEQ ID NO:174 및 189;
    SEQ ID NO:175 및 190;
    SEQ ID NO:176 및 191;
    SEQ ID NO:177 및 192;
    SEQ ID NO:178 및 193;
    SEQ ID NO:179 및 194; 또는
    SEQ ID NO:180 및 195의 서열을 포함하는 것인 헬퍼 가이드 RNA/가이드 RNA의 쌍.
  63. 제56항 내지 제62항 중 어느 한 항의 헬퍼 가이드 RNA 및 가이드 RNA를 코딩하는 하나 이상의 폴리뉴클레오티드 서열.
  64. 세포 내 PSCK9 유전자를 불활성화시키는 방법으로서, 세포를 제56항 내지 제62항 중 어느 한 항의 헬퍼 가이드 RNA 및 가이드 RNA의 쌍, 군집된 규칙적으로 산재된 짧은 회문식 반복부 (CRISPR)-연관 (Cas) 단백질, 및 핵염기 디아미나제와 접촉시키는 단계를 포함하는 것인 불활성화 방법.
KR1020217028085A 2019-02-02 2020-02-03 유전자 편집에서 비의도적 돌연변이의 억제 KR20210126042A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019074577 2019-02-02
CNPCT/CN2019/074577 2019-02-02
PCT/CN2020/074218 WO2020156575A1 (en) 2019-02-02 2020-02-03 Inhibition of unintended mutations in gene editing

Publications (1)

Publication Number Publication Date
KR20210126042A true KR20210126042A (ko) 2021-10-19

Family

ID=71841894

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217028085A KR20210126042A (ko) 2019-02-02 2020-02-03 유전자 편집에서 비의도적 돌연변이의 억제

Country Status (11)

Country Link
US (3) US11384353B2 (ko)
EP (1) EP3918083A4 (ko)
JP (1) JP2022526695A (ko)
KR (1) KR20210126042A (ko)
CN (4) CN116286802A (ko)
AU (2) AU2020214090B2 (ko)
BR (1) BR112021015092A2 (ko)
CA (1) CA3128283A1 (ko)
IL (1) IL285194A (ko)
SG (1) SG11202108303SA (ko)
WO (1) WO2020156575A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4244369A1 (en) * 2020-11-12 2023-09-20 Shanghaitech University Genomic editing of improved efficiency and accuracy
CN112575014B (zh) * 2020-12-11 2022-04-01 安徽省农业科学院水稻研究所 一种碱基编辑器SpCas9-LjCDAL1及其构建和应用
BR112023019773A2 (pt) * 2021-04-02 2024-03-12 Univ Shanghai Technology Método para promover a produção de gama-globina em uma célula humana, polinucleotídeos codificando uma proteína associada a um crispr (cas), uma nucleobase desaminase, um rna de guia único (sgrna) e um rna de guia único auxiliar (hsgrna), e, proteína de fusão
US20220372497A1 (en) * 2021-05-18 2022-11-24 Shanghaitech University Base Editing Tool And Use Thereof
WO2023088440A1 (en) * 2021-11-18 2023-05-25 Correctsequence Therapeutics Regeneration of surface antigen-negative cells
WO2023153811A1 (ko) * 2022-02-08 2023-08-17 주식회사 툴젠 프라임 에디팅 시스템을 이용한 게놈 편집의 과정에서 발생 가능한 오프 타겟을 예측하는 방법
WO2024012435A1 (en) 2022-07-11 2024-01-18 CorrectSequence Therapeutics Co., Ltd Gene editing systems and methods for treating hereditary angioedema
WO2024042489A1 (en) 2022-08-25 2024-02-29 LifeEDIT Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024088401A1 (en) * 2022-10-28 2024-05-02 CorrectSequence Therapeutics Co., Ltd Gene editing systems and methods for reducing immunogenicity and graft versus host response
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use
CN117092084B (zh) * 2023-10-20 2024-01-12 浙江迪福润丝生物科技有限公司 Wnv蛋白酶抑制剂的筛选方法和抑制效果评价方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6445314A (en) 1987-04-16 1989-02-17 Res Corp Technologies Inc Antitumoral
US8288094B2 (en) 2008-04-09 2012-10-16 Institut Pasteur APOBEC3 mediated DNA editing
US20150166984A1 (en) * 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
CN105886498A (zh) * 2015-05-13 2016-08-24 沈志荣 CRISPR-Cas9特异性敲除人PCSK9基因的方法以及用于特异性靶向PCSK9基因的sgRNA
IL258821B (en) * 2015-10-23 2022-07-01 Harvard College Nucleobase editors and their uses
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
US11192929B2 (en) * 2016-12-08 2021-12-07 Regents Of The University Of Minnesota Site-specific DNA base editing using modified APOBEC enzymes
CN108342387B (zh) 2017-01-24 2021-09-24 谭旭 Pcsk9抑制剂类降血脂药的递送系统和生物制剂
WO2018208998A1 (en) * 2017-05-10 2018-11-15 The Regents Of The University Of California Directed editing of cellular rna via nuclear delivery of crispr/cas9
EP3630198A4 (en) * 2017-05-25 2021-04-21 The General Hospital Corporation USE OF CLIVED DESAMINASES TO LIMIT UNWANTED OUT-OF-TARGET DESAMINATION FROM BASE EDITING
CN109136272A (zh) 2017-06-15 2019-01-04 中山大学 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其在人生殖系中的应用
CN109021111B (zh) * 2018-02-23 2021-12-07 上海科技大学 一种基因碱基编辑器

Also Published As

Publication number Publication date
EP3918083A1 (en) 2021-12-08
US20220064626A1 (en) 2022-03-03
IL285194A (en) 2021-09-30
CN116656676A (zh) 2023-08-29
AU2020214090A1 (en) 2021-09-16
SG11202108303SA (en) 2021-08-30
AU2022287550A1 (en) 2023-02-02
AU2020214090B2 (en) 2022-09-15
EP3918083A4 (en) 2023-03-29
CA3128283A1 (en) 2020-08-06
US20240026342A1 (en) 2024-01-25
CN113661248A (zh) 2021-11-16
WO2020156575A1 (en) 2020-08-06
BR112021015092A2 (pt) 2022-10-11
CN113661248B (zh) 2022-09-16
US20230094769A1 (en) 2023-03-30
JP2022526695A (ja) 2022-05-26
CN116286802A (zh) 2023-06-23
US11840685B2 (en) 2023-12-12
US11384353B2 (en) 2022-07-12
CN116355966A (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
KR20210126042A (ko) 유전자 편집에서 비의도적 돌연변이의 억제
JP7074827B2 (ja) 遺伝子操作CRISPR-Cas9ヌクレアーゼ
US10633642B2 (en) Engineered CRISPR-Cas9 nucleases
US10526591B2 (en) Engineered CRISPR-Cas9 nucleases
EP2680877B1 (en) Coupling endonucleases with end-processing enzymes drive high efficiency gene disruption
AU2006272634B2 (en) Targeted integration and expression of exogenous nucleic acid sequences
AU2004263865A1 (en) Methods and compositions for targeted cleavage and recombination
KR20190090724A (ko) 아데노신 디아미나아제를 이용한 염기 교정 확인 방법
JP2022546594A (ja) 新規crispr dnaターゲティング酵素及びシステム
WO2024086845A2 (en) Engineered casphi2 nucleases