KR20240031238A - Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 - Google Patents

Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 Download PDF

Info

Publication number
KR20240031238A
KR20240031238A KR1020237044997A KR20237044997A KR20240031238A KR 20240031238 A KR20240031238 A KR 20240031238A KR 1020237044997 A KR1020237044997 A KR 1020237044997A KR 20237044997 A KR20237044997 A KR 20237044997A KR 20240031238 A KR20240031238 A KR 20240031238A
Authority
KR
South Korea
Prior art keywords
nucleotides
sequence
rna
gene editing
polypeptide
Prior art date
Application number
KR1020237044997A
Other languages
English (en)
Inventor
데이비드 에이. 스콧
노아 마이클 자키모
프라투샤 휸웰
후-카이 셰이
Original Assignee
아버 바이오테크놀로지스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아버 바이오테크놀로지스, 인크. filed Critical 아버 바이오테크놀로지스, 인크.
Publication of KR20240031238A publication Critical patent/KR20240031238A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

(a) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산; (b) 역전사효소(RT) 폴리펩타이드 또는 RT 폴리펩타이드를 암호화하는 제2 핵산; (c) 가이드 RNA(gRNA) 또는 gRNA를 암호화하는 제3 핵산으로서, gRNA는 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 관심 게놈 부위 내의 표적 서열에 특이적인 스페이서 서열을 포함하고, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 제3 핵산; 및 (d) 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산으로서, RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 제4 핵산을 포함하는 유전자 편집 시스템.

Description

CRISPR 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도
관련 출원에 대한 상호참조
본 출원은 35 U.S.C. § 119(e)하에 2021년 6월 1일자로 출원된 미국 특허 가출원 제63/195,621호, 2021년 8월 23일자로 출원된 미국 특허 가출원 제63/236,047호, 2021년 10월 28일자로 출원된 미국 특허 가출원 제63/272,937호 및 2022년 1월 14일자로 출원된 미국 특허 가출원 제63/299,695호에 대한 우선권을 주장하며, 이들 기초출원 각각의 내용은 전체가 참조에 의해 본 명세서에 원용된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출되고 여기에 전체가 참조에 의해 원용되어 있는 서열 목록을 포함한다. 2022년 5월 30일에 생성된 상기 ASCII 사본은 이름이 116928-0042-0001WO00_SEQ.txt이고, 크기가 385,353 바이트이다.
집합적으로 CRISPR-Cas 또는 CRISPR/Cas 시스템으로 알려진 일정한 간격으로 주기적으로 분포하는 짧은 회문 반복서열(Clustered Regularly Interspaced Short Palindromic Repeat: CRISPR) 및 CRISPR-관련(Cas) 유전자는 외부 유전적 요소로부터 특정 종을 방어하는 고세균 및 세균의 적응 면역계이다.
본 개시내용은 적어도 부분적으로 유형 V CRISPR 뉴클레이스 폴리펩타이드(예를 들어, Cas12i2 폴리펩타이드) 및 역전사효소뿐만 아니라 CRISPR 뉴클레이스 폴리펩타이드에 의한 관심 유전자 부위에서의 절단을 매개하는 가이드 RNA(gRNA) 및 관심 게놈 부위에 혼입될 목적하는 서열의 합성을 매개하는 역전사 공여체 RNA를 포함하는 유전자 편집 시스템의 개발에 기초하고 있다. 본 명세서에 보고된 바와 같이, 본 명세서에 개시된 유전자 편집 시스템은 높은 편집 효율과 정확성으로 다양한 게놈 부위에서 성공적인 유전자 편집을 달성하였다. 이론에 얽매이지 않고, 본 명세서에 개시된 유전자 편집 시스템은 다음과 같은 유리한 특징 중 적어도 하나를 보여준다:
1. Cas12i 폴리펩타이드에 특이적인 것과 같은 본 명세서에 기재된 편집 주형 RNA 중 다수는 트랜스-활성화 CRISPR RNA(trans-activating CRISPR RNA: tracrRNA) 구성요소를 필요로 하지 않으므로, 프라임 편집 가이드 RNA(prime editing guide RNA: pegRNA)보다 작다. 추가적으로, Cas12i 폴리펩타이드-역전사효소 융합체와 같은 본 명세서에 기재된 CRISPR 뉴클레이스-역전사효소 융합체 중 다수는 Cas9-역전사효소 융합체보다 작다. 이들 양태는 모두 전달 및 합성 비용의 측면에서 바람직하다.
2. 본 명세서에 기재된 편집 주형 RNA는 pegRNA의 프라이머 결합 부위(primer binding site: PBS)보다 더 긴 PBS를 갖도록 설계될 수 있다. 이 특징은 표적 핵산에 혼입시키는 편집 효율을 증가시킬 수 있다.
3. 본 명세서에 기재된 바와 같이 비-PAM 가닥(즉, PAM 모티프가 존재하는 가닥의 상보적 가닥; 본 명세서에서 표적 가닥으로도 기재됨)에만 결합하도록 설계된 편집 주형 RNA를 포함하는 유전자 편집 시스템은 프라임 편집 시스템에 비 해 더 넓은 창에 걸쳐 편집을 혼입시킬 수 있다. 특히, Cas12i 폴리펩타이드-역전사효소 시스템은 Cas12i 폴리펩타이드 및 RNA 가이드의 전체 인식 서열을 다시 작성할 수 있다. 따라서, 이러한 유전자 편집 시스템은 CRISPR 뉴클레이스-역전사효소 융합체 및 편집 주형 RNA에 의한 표적 핵산의 재표적화를 회피하는 데 더 효율적일 수 있다.
따라서, 유전자 편집 시스템, 약제학적 조성물 또는 이를 포함하는 키트, 유전자 편집 시스템을 사용하여 유전자 변형된 세포를 생산하는 방법 및 이에 따라 생성된 세포가 본 명세서에 제공된다.
일부 양태에서, 본 개시내용은 다음을 포함하는 유전자 편집 시스템을 특징으로 한다: (a) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산; (b) 역전사효소(reverse transcriptase: RT) 폴리펩타이드 또는 RT 폴리펩타이드를 암호화하는 제2 핵산; (c) 가이드 RNA(gRNA) 또는 gRNA를 암호화하는 제3 핵산으로서, gRNA는 유형 V CRISPR 뉴클레이스(CRISPR 뉴클레이스 결합 부위)에 의해 인식 가능한 하나 이상의 결합 부위 및 관심 게놈 부위 내 표적 서열에 특이적인 스페이서 서열을 포함하고, 표적 서열은 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM)에 인접해 있는, 상기 가이드 RNA(gRNA) 또는 gRNA를 암호화하는 제3 핵산; 및 (d) 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산으로서, RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템 내의 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12 폴리펩타이드이다. 일부 예에서, Cas12 폴리펩타이드는 Cas12i 폴리펩타이드, 예를 들어, Cas12i2 폴리펩타이드이다. 일부 경우에, Cas12i 폴리펩타이드는 서열번호 2와 적어도 95% 동일한 아미노산 서열을 포함하는 Cas12i2 폴리펩타이드이다.
일부 경우에, Cas12i2 폴리펩타이드는 서열번호 2의 D581, G624, F626, P868, I926, V1030, E1035 및/또는 S1046 위치에 하나 이상의 돌연변이를 포함한다. 예를 들어, 하나 이상의 돌연변이는 아미노산 치환이며, 이는 선택적으로 D581R, G624R, F626R, P868T, I926R, V1030G, E1035R, S1046G 또는 이들의 조합이다. 일례에서, Cas12i2 폴리펩타이드는 D581, D911, I926 및 V1030의 위치에 돌연변이(예를 들어, D581R, D911R, I926R 및 V1030G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, I926 및 V1030의 위치에 돌연변이(예를 들어, D581R, I926R 및 V1030G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, I926, V1030 및 S1046 위치에 돌연변이(예를 들어, D581R, I926R, V1030G 및 S1046G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, G624, F626, I926, V1030, E1035 및 S1046 위치에 돌연변이(예를 들어, D581R, G624R, F626R, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, G624, F626, P868, I926, V1030, E1035 및 S1046 위치에 돌연변이(예를 들어, D581R, G624R, F626R, P868T, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환)를 포함한다. 본 명세서에 개시된 임의의 유전자 편집 시스템에 사용하기 위한 예시적인 Cas12i2 폴리펩타이드는 서열번호 3 내지 7 중 어느 하나의 아미노산 서열을 포함할 수 있다. 일부 예에서, 예시적인 Cas12i2 폴리펩타이드는 서열번호 4의 아미노산 서열을 포함할 수 있다. 다른 예에서, 예시적인 Cas12i2 폴리펩타이드는 서열번호 7의 아미노산 서열을 포함할 수 있다.
다른 경우에, Cas12i 폴리펩타이드는 감소된 crRNA 처리 활성을 가지며, 선택적으로 Cas12i 폴리펩타이드는 서열번호 2의 H485 위치 및/또는 H486 위치에 돌연변이를 포함한다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산을 포함할 수 있다. 일부 경우에, 제1 핵산은 제1 벡터(예를 들어, 아데노-관련 바이러스 벡터 또는 AAV 벡터와 같은 바이러스 벡터)에 위치한다. 다른 경우에, 제1 핵산은 제1 메신저 RNA(mRNA)이다.
본 명세서에 개시된 임의의 유전자 편집 시스템에서, RT 폴리펩타이드는 몰로니 뮤린 백혈병 바이러스(Moloney Murine Leukemia Virus: MMLV)-RT, 마우스 유방 종양 바이러스(mouse mammary tumor virus: MMTV)-RT, 마라톤-RT 또는 RTx-RT(예를 들어, 서열번호 29의 아미노산 서열을 포함할 수 있는 MMLV RT)일 수 있다. 일부 경우에, 유전자 편집 시스템은 RT 폴리펩타이드를 포함한다. 대안적으로, 시스템은 RT 폴리펩타이드를 암호화하는 제2 핵산을 포함한다. 일부 경우에, 제2 핵산은 제2 벡터(예를 들어, 아데노-관련 바이러스 벡터 또는 AAV 벡터와 같은 바이러스 벡터)에 위치한다. 일례에서, 유전자 편집 시스템은 유형 V CRISPR 폴리펩타이드를 암호화하는 제1 핵산 및 RT 폴리펩타이드를 암호화하는 제2 핵산 모두를 포함하는 벡터(예를 들어, 바이러스 벡터)를 포함한다. 다른 예에서, RT를 암호화하는 제2 핵산은 제2 mRNA이다. 일례에서, 유전자 편집 시스템은 유형 V CRISPR 폴리펩타이드를 암호화하는 제1 mRNA 및 RT를 암호화하는 제2 mRNA를 모두 포함하는 단일 RNA 분자를 포함한다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드와 RT 폴리펩타이드를 포함하는 융합 폴리펩타이드 또는 융합 폴리펩타이드를 암호화하는 핵산(예를 들어, 바이러스 벡터와 같은 벡터)을 포함한다. 대안적으로, 유전자 편집 시스템은 2개의 개별 폴리펩타이드로서 유형 V CRISPR 뉴클레이스 폴리펩타이드 및 RT 폴리펩타이드를 포함한다.
본 명세서에 개시된 임의의 유전자 편집 시스템에서, 스페이서 서열은 20개 내지 30개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, 스페이서 서열은 20개의 뉴클레오타이드 길이이다.
일부 실시형태에서, PAM은 5'-TTN-3'의 모티프를 포함한다. 일부 경우에(예를 들어, Cas12i2 폴리펩타이드와 관련하여), PAM은 표적 서열에 대해 5'에 위치할 수 있다.
일부 실시형태에서, 하나 이상의 CRISPR 뉴클레이스 결합 부위는 직접 반복 서열(들)이다. 일부 경우에, 각각의 직접 반복 서열은 23개 내지 36개의 뉴클레오타이드 길이이다. 일례에서, 직접 반복 서열은 23개의 뉴클레오타이드 길이이다. 일부 예에서, 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나(예를 들어, 서열번호 17) 또는 이의 단편과 적어도 90% 동일하다. 특정 예에서, 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나(예를 들어, 서열번호 17) 또는 이의 단편이다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 gRNA를 포함한다. 대안적으로, 유전자 편집 시스템은 gRNA를 암호화하는 제3 핵산을 포함한다. 일부 예에서, 제3 핵산은 제3 벡터에 위치하며, 이는 선택적으로 바이러스 벡터이다. 일부 예에서, 유전자 편집 시스템은 gRNA를 암호화하는 제3 핵산 및 유형 V CRISPR 뉴클레이스 폴리펩타이드 및/또는 RT 폴리펩타이드를 암호화하는 제1 및/또는 제2 핵산을 포함하는 바이러스 벡터와 같은 벡터를 포함할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템의 RT 공여체 RNA의 PBS는 5개 내지 100개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, PBS는 10개 내지 60개의 뉴클레오타이드 길이이다. 특정 예에서, PBS는 10개 내지 30개의 뉴클레오타이드 길이이다. 일부 경우에, PBS는 표적 서열의 상보적 영역에 인접한 PBS-표적화 부위에 결합한다. PBS-표적화 부위는 표적 서열의 상보적 영역의 상류에 있다. 예를 들어, PBS-표적화 부위는 표적 서열의 상보적 영역의 상류에 있는 3개 내지 10개의 뉴클레오타이드(예를 들어, 4개 내지 10개의 뉴클레오타이드)일 수 있다. 대안적으로, PBS-표적화 부위는 표적 서열의 상보적 영역과 중첩될 수 있다. 다른 경우에, PBS-표적화 부위는 표적 서열에 인접하거나 또는 이와 중첩된다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템의 RT 공여체 RNA의 주형 서열은 5개 내지 100개의 뉴클레오타이드 길이일 수 있다. 예를 들어, 주형 서열은 30개 내지 50개의 뉴클레오타이드 길이일 수 있다. 일부 경우에, 주형 서열은 관심 게놈 부위와 상동일 수 있고, 관심 게놈 부위에 비해 하나 이상의 뉴클레오타이드 변이를 포함한다. 일부 예에서, 적어도 하나의 뉴클레오타이드 변이는 표적 서열 내에 위치한다. 대안적으로 또는 이에 더하여, 적어도 하나의 뉴클레오타이드 변이는 PAM에 위치한다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템은 RT 공여체 RNA를 포함한다. 대안적으로, 유전자 편집 시스템은 RT 공여체 RNA를 암호화하는 제4 핵산을 포함한다. 일부 예에서, 제4 핵산은 제4 벡터에 위치하며, 이는 선택적으로 제4 바이러스 벡터이다. 일부 경우에, 유전자 편집 시스템은 RT 공여체 RNA를 암호화하는 핵산 및 가이드 RNA, 유형 V CRISPR 뉴클레이스 폴리펩타이드 및 RT 폴리펩타이드를 암호화하는 하나 이상의 추가적인 핵산을 포함하는 바이러스 벡터와 같은 벡터를 포함한다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 gRNA 및 RT 공여체 RNA를 포함하는 단일 RNA 분자를 포함한다. 이러한 단일 RNA는 임의의 적합한 순서로 배열될 수 있는 CRISPR 뉴클레이스 결합 부위, 스페이서 서열, PBS 및 주형 서열을 포함한다. 일부 예에서, 단일 RNA 분자는 gRNA와 RT 공여체 RNA 사이에 링커를 추가로 포함한다. 이러한 링커는 헤어핀 구조를 포함할 수 있다. 일례에서, 단일 RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 주형 서열 및 PBS를 포함한다. 또 다른 예에서, 단일 RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 링커, 주형 서열 및 PBS를 포함한다. 또 다른 예에서, 단일 RNA 분자는, 5'에서 3'로, 주형 서열, PBS, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다. 또 다른 예에서, 단일 RNA 분자는, 5'에서 3'로, 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다.
일부 경우에, 본 명세서에 개시된 임의의 단일 RNA 분자는 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함할 수 있다. 5' 말단 보호 단편 및 3' 말단 보호 단편 각각은 2차 구조, 예를 들어, 헤어핀, 슈도노트(pseudoknot) 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 특정 예에서, 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다는 CRISPR 뉴클레이스 결합 부위 중 하나 이상을 포함할 수 있다. 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다는 임의의 인간 서열과 상동이 아닌(염기 페어링을 통해 임의의 인간 서열에 결합할 수 없음) 하나 이상의 분절을 추가로 포함할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 2개의 개별 RNA 분자로서 임의의 gRNA 및 임의의 RT 공여체 RNA를 포함한다. 일부 예에서, gRNA, RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함할 수 있다. 각각의 보호 단편은 2차 구조, 예를 들어, 헤어핀, 슈도노트 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함한다.
본 명세서에 개시된 임의의 유전자 편집 시스템은 하나 이상의 지질 나노입자(lipid nanoparticle: LNP)를 포함할 수 있으며, 이는 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 암호화 핵산, RT 폴리펩타이드 또는 암호화 핵산, 가이드 RNA 또는 암호화 핵산, RT 공여체 RNA 또는 암호화 핵산 또는 이들의 임의의 조합을 포괄한다. 대안적으로, 유전자 편집 시스템은 (i) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 암호화 핵산, RT 폴리펩타이드 또는 암호화 핵산, 가이드 RNA 또는 암호화 핵산, RT 공여체 RNA 또는 암호화 핵산으로부터 선택되는 최대 3개의 구성요소를 집합적으로 포함하는 하나 이상의 지질 나노입자(LNP); 및 (ii) 유전자 편집 시스템의 나머지 구성요소를 암호화하는 하나 이상의 벡터를 포함할 수 있다. 일부 경우에, 하나 이상의 벡터는 하나 이상의 바이러스 벡터, 예를 들어, 하나 이상의 아데노-관련 바이러스(AAV) 벡터일 수 있다.
일부 예에서, 본 명세서에 개시된 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드, RT 폴리펩타이드, gRNA 및 RT 공여체 RNA를 포함한다. 일부 경우에, 유형 V CRISPR 뉴클레이스 폴리펩타이드 및/또는 RT 폴리펩타이드는 gRNA 및/또는 RT 공여체 RNA와 복합체(예를 들어, 리보핵단백질(ribonucleoprotein: RNP) 복합체)를 형성한다.
일부 양태에서, 본 개시내용은 또한 본 명세서에 개시된 임의의 유전자 편집 시스템 및 약제학적으로 허용 가능한 담체를 포함하는 약제학적 조성물 및 유전자 편집 시스템의 구성요소를 포함하는 키트를 제공한다.
다른 양태에서, 본 개시내용은 또한 세포를 유전자 편집하는 방법을 특징으로 하며, 해당 방법은 숙주 세포를 유전자 편집하기 위해 숙주 세포를 본 명세서에 개시된 임의의 유전자 편집 시스템 또는 이를 포함하는 약제학적 조성물과 접촉시키는 단계를 포함한다. 일부 예에서, 숙주 세포는 시험관내에서 배양된다. 다른 예에서, 접촉시키는 단계는 유전자 편집 시스템을 숙주 세포를 포함하는 대상체에게 투여하는 것에 의해 수행된다.
또한, 본 개시내용의 범위 내에 본 명세서에 개시된 유전자 편집 시스템에 의해 생산될 수 있는 유전자 변형된 세포의 집단이 있다. 일부 예에서, 유전자 변형된 세포는 유전자 편집 시스템에 의해 편집될 수 없는 세포를 포함할 수 있으며, 예를 들어, PAM, 표적 서열 또는 둘 다에 하나 이상의 변형을 포함할 수 있다.
또 다른 양태에서, 본 개시내용은 (i) 유형 V CRISPR 뉴클레이스(CRISPR 뉴클레이스 결합 부위)에 의해 인식 가능한 하나 이상의 결합 부위; (ii) 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열로서, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 스페이서 서열; (iii) 프라이머 결합 부위(PBS); 및 (iv) 주형 서열을 포함하는 유전자 편집 RNA 분자를 특징으로 한다. 일부 실시형태에서, 유전자 편집 RNA 분자는 본 명세서에 개시된 것과 같은 하나 이상의 링커를 추가로 포함할 수 있다.
일부 예에서, RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 주형 서열 및 PBS를 포함한다. 다른 예에서, RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 링커, 주형 서열 및 PBS를 포함한다. 또 다른 예에서, RNA 분자는, 5'에서 3'로, 주형 서열, PBS, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다. 또 다른 예에서, RNA 분자는, 5'에서 3'로, 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다.
본 명세서에 개시된 임의의 유전자 편집 RNA 분자는 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함할 수 있다. 보호 단편 각각은 2차 구조, 예를 들어, 헤어핀, 슈도노트 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함한다.
또한, 본 개시내용은 (i) 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열을 포함하는 가이드 RNA로서, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 가이드 RNA; 및 (ii) 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산으로서, RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산을 포함하는 유전자 편집 RNA 분자(2개의 개별 RNA 분자) 세트를 특징으로 한다. 일부 예에서, gRNA, RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함한다. 각각의 보호 단편은 2차 구조, 예를 들어, 헤어핀, 슈도노트 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함한다.
또한, 본 명세서에 개시된 바와 같은 유전자 편집 RNA 분자 또는 유전자 편집 RNA 분자 세트를 암호화하는 DNA 분자 또는 DNA 분자 세트가 본 명세서에 제공된다. 일부 예에서, 제76항의 DNA 분자 또는 DNA 분자 세트는 벡터 또는 벡터 세트에 포함되며, 선택적으로 벡터 또는 벡터 세트는 바이러스 벡터이다.
또한, CRISPR 뉴클레이스 및 역전사효소를 포함하는 융합 폴리펩타이드가 본 명세서에 제공된다. 임의의 이러한 CRISPR 뉴클레이스-RT 융합 폴리펩타이드는 본 명세서에 개시된 유전자 편집 시스템에 사용될 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 유형 V CRISPR 뉴클레이스, 예를 들어, Cas12i 폴리펩타이드이다. 일부 예에서, Cas12i 폴리펩타이드는 Cas12i2 폴리펩타이드, 예를 들어, 본 명세서에 개시된 것이다. 특정 예에서, 융합 폴리펩타이드는 25 내지 26 및 219 내지 223의 아미노산 서열을 포함할 수 있다.
일부 실시형태에서, Cas12i 폴리펩타이드는 Cas12i4 폴리펩타이드이다. 일부 예에서, Cas12i4 폴리펩타이드는 MMLV RT와 같은 역전사효소와 융합될 수 있다. 이러한 융합 Cas12i4-RT 융합 폴리펩타이드는 서열번호 53의 아미노산 서열을 포함할 수 있다.
발현 벡터와 같은 벡터(예를 들어, 바이러스 벡터)를 포함하여 임의의 CRISPR 뉴클레이스-RT 융합 폴리펩타이드를 암호화하는 임의의 핵산도 본 개시내용의 범위 내에 있다.
본 발명의 하나 이상의 실시형태의 세부사항은 아래의 설명에서 제시된다. 본 발명의 다른 특징 또는 장점은 다음의 도면과 여러 실시형태의 상세한 설명, 그리고 첨부된 청구범위로부터 명백해질 것이다.
다음 도면은 본 명세서의 일부를 형성하고 본 개시내용의 소정의 양태를 추가로 입증하기 위해 포함되며, 이는 본 명세서에 제시된 특정 실시형태의 상세한 설명과 함께 도면을 참조함으로써 더 잘 이해될 수 있다.
도 1a 내지 도 1b 본 명세서에 개시된 예시적인 유전자 편집 시스템을 보여주는 개략도를 포함한다. 도 1a는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. PBS는 표적 핵산의 PAM-가닥(비표적 가닥으로도 알려져 있음)에 대한 실질적인 상보성을 포함한다. 도 1b는 역전사효소에 융합된 Cas9 닉케이스(nickase)(왼쪽) 및 역전사효소에 융합된 Cas12i 닉케이스(오른쪽)를 보여준다. RNA 가이드의 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 편집은 표적 핵산의 PAM 가닥에 혼입된다.
도 2 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 5' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. PBS는 표적 핵산의 PAM 가닥에 대한 상보성을 포함한다.
도 3 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드), 역전사효소 폴리펩타이드, RNA 가이드 및 RT 공여체 RNA를 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. 편집은 CRISPR 뉴클레이스에 의한 절단 후 게놈에 혼입된다.
도 4는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드), 역전사효소 폴리펩타이드, RNA 가이드 및 RNA 역전사 주형 서열을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. 편집은 CRISPR 뉴클레이스의 존재하에 게놈에 혼입된다.
도 5 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 표적 핵산에 대한 미스매치를 포함하는 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS를 포함한다. PBS는 표적 핵산의 비-PAM 가닥(표적 가닥 또는 TS로도 알려져 있음)에 대한 상보성을 포함한다.
도 6a 내지 도 6b 본 명세서에 개시된 예시적인 유전자 편집 시스템을 보여주는 개략도를 포함한다. 도 6a 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. RNA 가이드의 스페이서 서열 및 PBS가 표적 핵산에 결합되면, 역전사 주형 서열은 짝을 이루지 않은 뉴클레오타이드의 루프를 형성한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. PAM 가닥 및 비-PAM 가닥에서 변이형 Cas12i2 절단 부위는 삼각형으로 표시된다. RNA 가이드의 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 편집은 표적 핵산의 비-PAM 가닥에 혼입된다. 도 6b 편집, 역전사 주형 서열 및 PBS의 위치 지정을 보여주며, 여기서 역전사 주형 서열 및 PBS의 길이는 다양할 수 있다.
도 7 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 5' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다.
도 8a 내지 도 8c 예시적인 Cas12i2 RNA 가이드-RT 공여체 RNA 융합체를 보여주는 개략도를 포함한다. 도 8a는 실시예 1에서 테스트된 RT 공여체 RNA에 융합된 변이형 Cas12i2 RNA 가이드의 개략도이다. RNA 가이드의 스페이서는 5'-TTT-3' PAM에 인접한 비-PAM 가닥에 결합한다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. 스페이서 서열 및 PBS가 표적 핵산에 결합하면, 역전사 주형 서열은 짝을 이루지 않은 뉴클레오타이드의 루프를 형성한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. 이 개략도에서, PBS는 13개의 뉴클레오타이드 길이이고, 역전사 주형 서열은 34개의 뉴클레오타이드 길이이다. PBS는 비-PAM 가닥에 대한 상보성이 절단 부위(삼각형)에서 시작하도록 설계되었다. 도 8b은 실시예 1에서 테스트된 바와 같이 AAVS1_T7 게놈 부위를 표적으로 하는 예시적인 RNA 가이드-RT 공여체 RNA 융합체를 보여준다. 다양한 PBS 길이가 테스트되었다(13개, 30개 및 60개의 뉴클레오타이드). RNA 가이드-RT 공여체 RNA 융합체는 표적 서열에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 8c 실시예 1에 기술된 바와 같이 AAVS1_T7 게놈 부위(상부 패널), EMX1_T6 게놈 부위(중간 패널) 및 VEGFA_T5 게놈 부위(하부 패널)에 도입된 암호화된 편집(치환, 삽입 및 결실)을 보여준다. 도 8a의 서열은 위에서 아래로 서열번호 65 내지 67이다. 도 8b의 서열은 위에서 아래로 서열번호 74 내지 80 및 87 내지 89이다. 도 8c의 서열은 위에서 아래로 서열번호 248 내지 259이다.
도 9a 내지 도 9j 본 명세서에 개시된 예시적인 유전자 편집 시스템으로부터 발생하는 유전자 편집 효율을 보여주는 다이어그램을 포함한다. 도 9a는 AAVS1_T6 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드(read)의 백분율을 보여준다. 도 9b 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 AAVS1_T6 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, AAVS1_T6 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9c는 AAVS1_T7 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9d는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 AAVS1_T7 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, AAVS1_T7 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9e는 EMX1_T6 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 도입된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9f 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 EMX1_T6 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 도입된 indel 및 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, EMX1_T6 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9g는 VEGFA_T2 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9h는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 VEGFA_T2 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, VEGFA_T2 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9i는 VEGFA_T5 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9j는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 VEGFA_T5 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, VEGFA_T5 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다.
도 10은 역전사효소에 융합된 Cas12i 폴리펩타이드(예를 들어, Cas12i2 닉케이스)를 보여주는 개략도이다. RNA 가이드의 5' 말단 또는 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 암호화된 편집은 표적 핵산의 PAM 가닥에 혼입된다. RNA 가이드-RT 공여체 RNA의 말단은 엑소뉴클레이스 또는 엔도뉴클레이스 활성을 방지하기 위해 보호될 수 있다. PBS 길이는 약 3개 내지 100개의 뉴클레오타이드로 다양할 수 있으며, PAM 가닥에 대한 실질적인 상보성을 포함할 수 있다. 헤어핀과 같이 구조화된 RNA는 스페이서와 역전사 주형 서열 사이에 도입될 수 있다.
도 11은 제2 직접 반복(DR)-스페이서 서열에 추가로 융합된 RNA 가이드-RT 공여체 RNA를 보여주는 개략도이다. 추가적인 DR-스페이서는 엑소뉴클레이스 활성을 저해한다.
도 12a 내지 도 12b 편집 주형 RNA(유전자 편집 RNA)의 예시적인 설계를 보여주는 개략도를 포함한다. 도 12a 3' 말단 보호를 추가로 포함하는 편집 주형 RNA(5'- 뉴클레이스 결합 서열 - DNA-결합 서열 - 역전사 주형 - PBS -3')를 도시하는 개략도이다. 3' 말단 보호는 화학적 말단 보호(도면의 상단 부분) 또는 헤어핀(도면의 하단 부분)일 수 있다. 헤어핀은 직접 반복 서열과 같은 뉴클레이스 결합 서열일 수 있다. 도 12b는 5' 말단 보호가 있거나 없는 편집 주형 RNA(5'-역전사 주형 - PBS 뉴클레이스 결합 서열 - DNA-결합 서열-3')를 도시하는 개략도이다. 5' 말단 보호는 도면의 하단 부분에 나타낸 바와 같은 헤어핀(예를 들어, 직접 반복 서열과 같은 뉴클레이스 결합 서열)일 수 있다.
도 13a 내지 도 13d 본 명세서에 개시된 예시적인 유전자 편집 시스템으로부터 발생하는 유전자 편집 효율을 보여주는 다이어그램을 포함한다. 도 13a는 AAVS1_T7 게놈 부위(서열번호 30)에서 서열번호 112의 RNA 가이드 또는 서열번호 123 내지 137의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13b는 EMX1_T6 게놈 부위(서열번호 34)에서 서열번호 114의 RNA 가이드 또는 서열번호 138 내지 152의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13c는 VEGFA_T2(서열번호 36)에서 서열번호 116의 RNA 가이드 또는 서열번호 153 내지 167의 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13d는 VEGFA_T5 게놈 부위(서열번호 38)에서 서열번호 118의 RNA 가이드 또는 서열번호 168 내지 182의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다.
도 14a 내지 도 14c는 RNA 가이드 또는 편집 주형 RNA를 사용하여 Cas12i2의 절단 패턴을 확인하는 데 사용되는 검정의 단계를 도시하는 개략도를 포함한다. 도 14a 표적 서열 및 바코드를 포함하는 올리고 구성을 보여준다. 도 14b는 5' 및 3' 오버행을 평활 말단화(blunt)시키기 위한 절단 산물의 처리 또는 5' 오버행을 필인(fill in)시키기 위한 말단 복구를 보여준다. 도 14c는 절단 산물의 증폭을 보여준다.
도 15a 내지 도 15e 본 명세서에 개시된 예시적인 유전자 편집 시스템을 사용하는 유전자 편집을 보여주는 다이어그램을 포함한다. 도 15a는 AAVS1_T2 게놈 부위의 PAM 가닥 및 비-PAM 가닥에서 서열번호 2의 Cas12i2에 의해 유도된 시험관내 절단 부위(삼각형)를 도시하는 개략도이다. 도 15b는 필인 처리 후 5' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 도 15c는 필인 처리 후 3' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 도 15d 평활 말단화(blunting) 처리 후 5' 절단 산물로부터 얻은 리드 길이의 히스토그램이다. 도 15e 평활 말단화 처리 후 3' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 각각의 리드 길이 히스토그램은 도 15b 내지 도 15e의 x-축에 도시된 바와 같이 표적 서열에 매핑된다.
도 16a 내지 도 16b EMX1_T6 게놈 부위(도 16a) 및 VEGFA_T5 게놈 부위(도 16b)의 PAM 가닥 또는 비-PAM 가닥에서 서열번호 2의 Cas12i2 또는 서열번호 4의 변이형 Cas12i2에 의해 유도된 시험관내 절단 부위(삼각형)를 보여준다. 기준 막대(오른쪽)는 시퀀싱 리드 수로 측정된 경우 절단 빈도를 나타낸다.
도 17a 내지 도 17b 예시적인 게놈 크기에서의 유전자 편집 결과를 보여주는 다이어그램을 포함한다. 도 17a AAVS1_T7 게놈 부위(서열번호 30), EMX1_T6 게놈 부위(서열번호 34) 또는 VEGFA_T5 게놈 부위(서열번호 38)에 4개의 뉴클레오타이드 삽입을 도입하는 편집 주형 RNA에 의한 활성을 보여준다. 편집 주형 RNA는 34개의 뉴클레오타이드 역전사 주형 서열 및 3개, 8개, 13개, 30개 또는 60개의 뉴클레오타이드 PBS로 구성된다. 암호화된 편집 대 총 편집의 비는 y-축에 도시되어 있다. 도 17b AAVS1_T7 게놈 부위(서열번호 30), EMX1_T6 게놈 부위(서열번호 34) 또는 VEGFA_T5 게놈 부위(서열번호 38)에 4개의 뉴클레오타이드 삽입을 도입하는 데 있어서 편집 주형 RNA에 의한 활성을 보여준다. 편집 주형 RNA는 13개의 뉴클레오타이드 PBS 및 14개, 24개, 34개, 44개 또는 54개의 뉴클레오타이드 역전사 주형 서열로 구성된다. 암호화된 편집 대 총 편집의 비는 y-축에 도시되어 있다. 도 17a의 서열은, 위에서 아래로, 서열번호 90 내지 92이다. 도 17b의 서열은, 위에서 아래로, 서열번호 90 내지 92이다.
도 18은 U2OS 세포의 AAVS1_T7 게놈 부위(서열번호 32) 및 EMX1_T6 게놈 부위(서열번호 34)에 혼입된 암호화된 편집을 보여준다.
도 19a 내지 도 19b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 사용하는 유전자 편집 절차를 예시하는 개략도를 포함한다. 도 19a 역전사효소 및 pegRNA에 융합된 Cas9를 포함하는 Cas9 프라임 편집기를 도시하는 개략도이다. Cas9에 의한 PAM 가닥의 절단 후 표적 DNA에 프라이머가 생성된다. 프라이머와 pegRNA의 혼성화는 역전사가 개시되게 한다. 도 19b 역전사효소 및 편집 주형 RNA에 융합된 유형 V CRISPR 뉴클레이스를 도시하는 개략도이다. 유형 V CRISPR 뉴클레이스에 의한 비-PAM 가닥의 절단 후 표적 DNA에 프라이머가 생성된다. 프라이머와 편집 주형 RNA의 혼성화는 역전사가 개시되게 한다.
도 20a 내지 도 20c 나타낸 바와 같이 Cas12i2-RT 융합 폴리펩타이드를 갖는 다양한 게놈 부위에서의 편지을 보여주는 다이어그램을 포함한다. 도 20a는 AAVS1 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다. 도 20b는 EMX1 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다. 도 20c는 VEGFA 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 21은 변이형 Cas12i2(서열번호 4) 또는 변이형 Cas12i2-RT 융합체(서열번호 219)와 RNA 가이드 또는 편집 주형 RNA에 의해 도입된 indel 편집 또는 암호화된 편집을 포함하는 NGS 리드 %를 보여주는 플롯이다. RNA 가이드 및 편집 주형 RNA는 변형되지 않았거나, 또는 말단 포스포로티오에이트 백본 연결 및/또는 2'O-메틸 뉴클레오타이드로 구성되었다.
도 22는 AAVS1 게놈 부위에서 변이형 Cas12i4-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 23은 AAVS1, EMX1 또는 VEGFA 게놈 부위에서 변이형 Cas12i2 또는 변이형 Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
본 개시내용은 유형 V 뉴클레이스 또는 이를 암호화하는 핵산, RNA 가이드 또는 이를 암호화하는 핵산, 역전사효소 또는 이를 암호화하는 핵산 및 RT 공여체 RNA 또는 이를 암호화하는 핵산을 포함하는 유전자 편집 시스템에 관한 것이다. 또한, 본 명세서에 개시된 임의의 유전자 편집 시스템, 본 명세서에 개시된 임의의 유전자 편집 시스템을 사용하여 세포를 유전자 편집하는 방법, 이에 따라 생산된 유전적으로 조작된 세포 및 유전자 편집 시스템과 관련된 유전자 편집 RNA 분자 또는 RNA 분자 세트뿐만 아니라 이를 생산하기 위한 DNA 분자(들)를 포함하는 약제학적 조성물 및 키트가 본 명세서에 제공된다.
정의
본 개시내용은 특정 실시형태 및 소정의 도면을 참조하여 설명될 것이지만, 본 개시내용은 이에 제한되지 않고 청구범위에 의해서만 제한된다. 이하에 제시된 용어는 일반적으로 달리 명시되지 않는 한 일반적인 의미로 이해되어야 한다.
본 명세서에서 사용되는 용어 "활성"은 생물학적 활성을 지칭한다. 일부 실시형태에서, 활성은 효과기 활성을 지칭한다. 일부 실시형태에서, 활성은 효소적 활성, 예를 들어, 효과기의 촉매 능력을 포함한다. 예를 들어, 활성은 뉴클레이스 활성을 포함할 수 있다. 또 다른 예에서, 활성은 RNA로부터 DNA를 생성하거나 또는 표적 서열에 편집을 도입시키는 효소의 능력을 지칭한다.
본 명세서에서 사용되는 용어 "~에 인접해 있는"은 또 다른 뉴클레오타이드 또는 아미노산 서열에 매우 근접한 뉴클레오타이드 또는 아미노산 서열을 지칭한다. 일부 실시형태에서, 뉴클레오타이드가 두 서열을 분리하지 않는(즉, 바로 인접해 있는) 경우, 뉴클레오타이드 서열은 또 다른 뉴클레오타이드 서열에 인접해 있다. 일부 실시형태에서, 소수의 뉴클레오타이드(예를 들어, 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드)가 두 서열을 분리하는 경우, 뉴클레오타이드 서열은 또 다른 뉴클레오타이드 서열과 인접해 있다. 일부 실시형태에서, 제1 서열은, 두 서열이 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개 또는 15개의 뉴클레오타이드만큼 분리되어 있는 경우, 제2 서열에 인접해 있다. 일부 실시형태에서, 제1 서열은, 두 서열이 최대 2개의 뉴클레오타이드, 최대 5개의 뉴클레오타이드, 최대 8개의 뉴클레오타이드, 최대 10개의 뉴클레오타이드, 최대 12개의 뉴클레오타이드 또는 최대 15개의 뉴클레오타이드만큼 분리되어 있는 경우, 제2 서열에 인접해 있다. 일부 실시형태에서, 제1 서열은, 두 서열이 2개 내지 5개의 뉴클레오타이드, 4개 내지 6개의 뉴클레오타이드, 4개 내지 8개의 뉴클레오타이드, 4개 내지 10개의 뉴클레오타이드, 6개 내지 8개의 뉴클레오타이드, 6개 내지 10개의 뉴클레오타이드, 6개 내지 12개의 뉴클레오타이드, 8개 내지 10개의 뉴클레오타이드, 8개 내지 12개의 뉴클레오타이드, 10개 내지 12개의 뉴클레오타이드, 10개 내지 15개의 뉴클레오타이드 또는 12개 내지 15개의 뉴클레오타이드만큼 분리되어 있는 경우, 제2 서열에 인접해 있다.
본 명세서에서 사용되는 용어 "CRISPR 뉴클레이스"는 핵산에 결합하고 단일-가닥 절단 또는 이중-가닥 절단을 도입할 수 있는 RNA-가이드된 효과기를 지칭한다. 일부 실시형태에서, CRISPR 뉴클레이스는 유형 II CRISPR 뉴클레이스 또는 유형 V CRISPR 뉴클레이스이다. 일부 실시형태에서, CRISPR 뉴클레이스는 문헌[Makarova et al. "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?" CRISPRJ. 1(5):325-36 (2018)]에 기술되어 있는 바와 같은 효과기이다.
본 명세서에서 사용되는 용어 "유형 II" 및 "유형 II 뉴클레이스"는 RuvC 도메인 및 HNH 도메인을 포함하는 뉴클레이스를 지칭한다. 유형 II 뉴클레이스는 유형 II-A 뉴클레이스, 유형 II-B 뉴클레이스 또는 유형 II-C 뉴클레이스일 수 있다. 일부 실시형태에서, 유형 II 뉴클레이스는 tracrRNA를 필요로 한다. 일부 실시형태에서, 유형 II 뉴클레이스는 Cas9 폴리펩타이드이다. Cas9 폴리펩타이드는 이중-가닥 DNA 표적을 절단할 수 있거나 또는 닉케이스일 수 있다.
본 명세서에서 사용되는 용어 "유형 V" 및 "유형 V 뉴클레이스"는 RuvC 도메인을 갖는 RNA-가이드된 CRISPR 뉴클레이스를 지칭한다. 일부 실시형태에서, 유형 V 뉴클레이스는 tracrRNA를 필요로 하지 않는다. 일부 실시형태에서, 유형 V 뉴클레이스는 tracrRNA를 필요로 한다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12 폴리펩타이드, 예컨대, Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) 폴리펩타이드이다.
본 명세서에서 사용되는 용어 "Cas12i 폴리펩타이드"(본 명세서에서 Cas12i로도 지칭됨)는 RNA 가이드에 의해 특정된 표적 핵산 상의 표적 서열에 결합하는 폴리펩타이드를 지칭하되, 폴리펩타이드는 야생형 Cas12i 폴리펩타이드와 적어도 일부 아미노산 서열 상동성을 갖는다. 일부 실시형태에서, Cas12i 폴리펩타이드는 본 명세서에 언급된 특허 대상과 목적에 대해 참조에 의해 원용되어 있는 미국 특허 제10,808,245호의 서열번호 1 내지 5 및 11 내지 18 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 포함한다. 일부 실시형태에서, Cas12i 폴리펩타이드는 본 출원의 서열번호 8, 2, 11 및 9 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 포함한다. 일부 실시형태에서, 본 개시내용의 Cas12i 폴리펩타이드는 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO/2021/202800에 기술되어 있는 바와 같은 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, Cas12i 폴리펩타이드 표적 핵산(예를 들어, 닉(nick) 또는 이중 가닥 절단)을 절단한다.
두 핵산 또는 두 아미노산 서열의 "동일성 퍼센트"(일명 서열 동일성)는 문헌[Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993]에서와 같이 수정된 문헌[Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990]의 알고리즘을 사용하여 결정된다. 이러한 알고리즘은 문헌[Altschul, et al. J. Mol. Biol. 215:403-10, 1990]의 NBLAST 및 XBLAST 프로그램(버전 2.0)에 통합되어 있다. BLAST 뉴클레오타이드 검색은 본 발명의 핵산 분자와 상동인 뉴클레오타이드 서열을 얻기 위해 NBLAST 프로그램, 점수=100, 단어 길이=12를 사용하여 수행될 수 있다. BLAST 단백질 검색은 본 발명의 단백질 분자와 상동인 아미노산 서열을 얻기 위해 XBLAST 프로그램, 점수=50, 단어 길이=3을 사용하여 수행될 수 있다. 두 서열 사이에 갭이 존재하는 경우, 문헌[Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997]에 기술되어 있는 바와 같은 Gapped BLAST가 이용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 각각의 프로그램(예를 들어, XBLAST 및 NBLAST)에 대한 기본 매개변수가 사용될 수 있다.
본 명세서에서 사용되는 용어 "복합체"는 2개 이상의 분자의 그룹을 지칭한다. 일부 실시형태에서, 복합체는 서로 상호작용(예를 들어, 결합, 접촉, 부착)하는 폴리펩타이드 및 핵산 분자를 포함한다. 일부 실시형태에서, 용어 "복합체"는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)와 역전사효소 폴리펩타이드의 회합을 지칭하는 데 사용된다. 예를 들어, CRISPR 뉴클레이스(예를 들어, 본 명세서에 개시된 바와 같은 Cas12i2 폴리펩타이드)와 역전사효소 폴리펩타이드의 복합체는, 예를 들어, 이량체화 도메인(예를 들어, 류신 지퍼)을 통한 두 폴리펩타이드의 이종이량체, 항체, 나노바디 또는 압타머일 수 있다. 일부 실시형태에서, 용어 "복합체"는 RNA 가이드와 RT 공여체 RNA의 회합을 지칭하는 데 사용된다. 일부 실시형태에서, 용어 "복합체"는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스), 역전사효소 폴리펩타이드, RNA 가이드 및 RT 공여체 RNA의 회합을 지칭하는 데 사용된다. 일부 실시형태에서, 용어 "복합체"는 역전사효소 폴리펩타이드와 RT 공여체 RNA의 회합을 지칭하는 데 사용된다.
본 명세서에서 사용되는 용어 "뉴클레이스에 의해 인식 가능한 결합 부위" 또는 "뉴클레이스 결합 서열"은 CRISPR 뉴클레이스에 결합할 수 있는 서열을 지칭한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 RNA 서열이다. 일부 실시형태에서, 뉴클레이스 결합 서열은 직접 반복 서열이다. 일부 실시형태에서, 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스 또는 유형 V CRISPR 뉴클레이스(예를 들어, 유형 II CRISPR 뉴클레이스에 의해 인식 가능한 결합 부위 또는 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 결합 부위)에 결합할 수 있다.
본 명세서에서 사용되는 용어 "결실"은 참조 서열에 대해 핵산 서열에서의 뉴클레오타이드 또는 뉴클레오타이드들의 손실을 지칭한다. 결실을 포함하는 서열을 만드는 방법에는 특별한 과정이 암시되어 있지 않다. 예를 들어, 결실을 포함하는 서열은 개별 뉴클레오타이드로부터 직접 합성될 수 있다. 다른 실시형태에서, 결실은 참조 서열을 제공한 다음 변경함으로써 이루어진다. 핵산 서열은 유기체의 게놈에 있을 수 있다. 핵산 서열은 세포에 있을 수 있다. 핵산 서열은 DNA 서열일 수 있다. 결실은 프레임시프트 돌연변이 또는 비프레임시프트 돌연변이일 수 있다. 본 명세서에 기재된 결실은 최대 수 킬로베이스의 결실을 지칭한다.
본 명세서에서 사용되는 용어 "편집"은 관심 게놈 부위와 같은 표적 핵산의 뉴클레오타이드 서열에 도입된 하나 이상의 변형을 지칭한다. 편집은 서열 본 명세서에 정의된 바와 같은 표적 내에서 발생할 수 있다. 대안적으로, 편집은 표적 서열 외부(예를 들어, 표적 서열에 인접한 곳)에서 발생할 수 있다. 편집은 하나 이상의 치환, 하나 이상의 삽입, 하나 이상의 결실 또는 이들의 조합일 수 있다.
본 명세서에서 사용되는 용어 "융합" 및 "융합된"은 적어도 2개의 뉴클레오타이드 또는 단백질 분자의 연결을 지칭한다. 예를 들어, "융합" 및 "융합된"은 자연에서 별개의 유전자(예를 들어, 유형 V 뉴클레이스 및 역전사효소 폴리펩타이드)에 의해 암호화되는 적어도 2개의 폴리펩타이드 도메인의 연결을 지칭할 수 있다. 융합은 N-말단 융합, C-말단 융합 또는 분자내 융합일 수 있다. 일부 양태에서, 도메인은 단일 폴리펩타이드를 생산하기 위해 전사되고 번역된다. 또한, 본 명세서에서 사용되는 용어 "융합" 및 "융합된"은 2개의 RNA 분자(예를 들어, RNA 가이드 및 RT 공여체 RNA)와 같은 2개의 핵산 분자의 연결을 지칭하는 데 사용된다. 융합은 5' 융합, 3' 융합 또는 분자내 융합일 수 있다.
본 명세서에서 사용되는 용어 "삽입"은 참조 서열에 대해 핵산 서열에서의 뉴클레오타이드 또는 뉴클레오타이드들의 획득을 지칭한다. 삽입을 포함하는 서열을 만드는 방법에는 특별한 과정이 암시되어 있지 않다. 예를 들어, 삽입을 포함하는 서열은 개별 뉴클레오타이드로부터 직접 합성될 수 있다. 다른 실시형태에서, 삽입은 참조 서열을 제공한 다음 변경함으로써 이루어진다. 핵산 서열은 유기체의 게놈에 있을 수 있다. 핵산 서열은 세포에 있을 수 있다. 핵산 서열은 DNA 서열일 수 있다. 삽입은 프레임시프트 돌연변이 또는 비프레임시프트 돌연변이일 수 있다. 본 명세서에 기재된 삽입은 최대 수 킬로베이스의 삽입을 지칭한다.
본 명세서에서 사용되는 용어 "프로토스페이서 인접 모티프" 또는 "PAM 서열"은 표적 서열에 인접한 DNA 서열을 지칭한다. 일부 실시형태에서, PAM 서열은 효소 활성을 위해 필요하다. 이중-가닥 DNA 분자에서, PAM 모티프를 포함하는 가닥은 "PAM-가닥"이라고 하고, 상보적 가닥은 "비-PAM 가닥"이라고 한다. RNA 가이드는 본 명세서에 개시된 표적 서열과 상보적인 비-PAM 가닥 부위에 결합하고, 본 명세서에 기재된 바와 같은 PAM 서열은 PAM-가닥에 존재한다.
본 명세서에서 사용되는 용어 "PAM 가닥"은 PAM 모티프를 포함하는 표적 핵산(이중-가닥) 가닥을 지칭한다. 일부 실시형태에서, PAM 가닥은 코딩(예를 들어, 센스) 가닥이다. 다른 실시형태에서, PAM 가닥은 논코딩(예를 들어, 안티센스 가닥)이다. 용어 "비-PAM 가닥"은 PAM 가닥의 상보적 가닥을 지칭한다. gRNA는 염기-페어링을 통해 비-PAM 가닥과 결합하기 때문에, 비-PAM 가닥은 표적 가닥으로도 알려져 있는 반면, PAM 가닥은 비표적 가닥으로도 알려져 있다.
본 명세서에서 사용되는 용어 "표적 서열"은 PAM 모티프에 인접한(PAM 가닥 상의) DNA 단편을 지칭한다. 표적 서열의 상보적 영역은 비-PAM 가닥에 있다. 표적 서열은 PAM 모티프에 바로 인접할 수 있다. 대안적으로, 표적 서열 및 PAM은 작은 서열 분절(예를 들어, 최대 5개의 뉴클레오타이드, 예를 들어, 최대 4개, 3개, 2개 또는 1개의 뉴클레오타이드)만큼 별도로 존재할 수 있다. 표적 서열은 PAM 모티프를 인식하는 CRISPR 뉴클레이스에 따라 PAM 모티프의 3' 말단 또는 PAM 모티프의 5' 말단에 위치할 수 있으며, 이는 당업계에 공지되어 있다. 예를 들어, 표적 서열은 Cas12i 폴리펩타이드(예를 들어, 본 명세서에 개시된 것들과 같은 Cas12i2 폴리펩타이드)의 경우 PAM 모티프의 3' 말단에 위치한다.
본 명세서에서 사용되는 용어 "RNA 가이드" 또는 "RNA 가이드 서열"은 본 명세서에 기재된 CRISPR 뉴클레이스의 관심 게놈 부위로의 표적화를 용이하게 하는 RNA 분자 또는 변형된 RNA 분자를 지칭한다. 예를 들어, RNA 가이드는 PAM 가닥이 표적 서열과 상보적인, 예를 들어, 특정 핵산 서열과 상보적이도록 설계된 비-PAM 가닥의 부위를 인식(이에 결합)하는 분자일 수 있다. RNA 가이드는 스페이서 및 뉴클레이스 결합 서열(예를 들어, 직접 반복(DR) 서열)을 포함한다. 용어 CRISPR RNA(crRNA), pre-crRNA 및 성숙 crRNA도 본 명세서에서 RNA 가이드를 지칭하는 데 사용된다. RNA 가이드의 5' 말단 또는 3' 말단은 본 명세서에 개시된 바와 같은 RT 공여체 RNA에 융합될 수 있다. 일부 경우에, RNA 가이드는, 예를 들어, 표적 서열의 상보적 서열에 결합하는 RNA 가이드에 포함된 DNA-결합 서열에 하나 이상의 데옥시리보뉴클레오타이드를 포함하는 변형된 RNA 분자일 수 있다. 일부 예에서, DNA-결합 서열은 DNA 서열 또는 DNA/RNA 하이브리드 서열을 포함할 수 있다.
본 명세서에서 사용되는 용어 "스페이서" 및 "스페이서 서열"(일명 DNA-결합 서열)은 표적 서열(DNA 서열)의 RNA 등가물인 RNA 가이드의 일부이다. 스페이서는 표적 서열(PAM 가닥 내)과 상보적인 부위에서 염기-페어링을 통해 비-PAM 가닥에 결합할 수 있는 서열을 포함한다. 이러한 스페이서는 표적 서열에 특이적인 것으로도 알려져 있다. 일부 경우에, 스페이서는 RNA-DNA 서열 차이를 제외하고 표적 서열과 적어도 75%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%) 동일할 수 있다. 일부 경우에, 스페이서는 RNA-DNA 서열 차이를 제외하고 표적 서열과 100% 동일할 수 있다.
본 명세서에서 사용되는 용어 "상보적"은 제1 및 제2 폴리뉴클레오타이드가 염기-페어링을 통해 이중-가닥 복합체를 형성하여 제1 폴리뉴클레오타이드와 복합체를 형성하는 효과기 폴리펩타이드(예를 들어, Cas12i2 폴리펩타이드, Cas12i2-역전사효소 융합 폴리펩타이드 또는 이들의 변이체)가 제2 폴리뉴클레오타이드에 작용(예를 들어, 절단)할 수 있도록 제2 폴리뉴클레오타이드(예를 들어, 표적 서열의 상보적 서열)에 대해 소정의 수준의 상보성을 갖는 제1 폴리뉴클레오타이드(예를 들어, RNA 가이드의 스페이서 서열)를 지칭한다. 일부 실시형태에서, 제1 폴리뉴클레오타이드는 제2 폴리뉴클레오타이드와 실질적으로 상보적일 수 있으며, 즉, 제2 폴리뉴클레오타이드와 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 상보성을 가질 수 있다. 일부 실시형태에서, 제1 폴리뉴클레오타이드는 제2 폴리뉴클레오타이드와 완전히 상보적이며, 즉, 제2 폴리뉴클레오타이드와 100%의 상보성을 갖는다.
본 명세서에서 사용되는 용어 "역전사효소" 및 "RT"는 전형적으로 RNA- 및 DNA-의존적 DNA 중합 활성 및 RNA-DNA 하이브리드에서 RNA의 절단을 촉매하는 RNase H 활성을 포함하는 3가지 효소적 활성을 갖는 다기능성 효소를 지칭한다. 역전사효소는 RNA 주형으로부터 DNA를 생성할 수 있다.
본 명세서에서 사용되는 용어 "역전사 공여체 RNA" 및 "RT 공여체 RNA"는 역전사 주형 서열(주형 서열) 및 프라이머 결합 부위(PBS)를 포함하는 RNA 분자를 지칭한다. RT 공여체 RNA는 RNA 가이드의 5' 말단 또는 3' 말단에서 RNA 가이드에 융합될 수 있다.
본 명세서에서 사용되는 용어 "PBS-표적화 부위"는 PBS가 결합하는 영역을 지칭한다. PBS-표적화 부위는 표적 서열과 상보적인 비-PAM 가닥의 영역(예를 들어, 상류)에 인접할 수 있다. 예를 들어, PBS-표적화 부위는 표적 서열과 상보적인 영역의 상류에 있는 3개 내지 10개의 뉴클레오타이드(예를 들어, 3개의 뉴클레오타이드 또는 4개의 뉴클레오타이드)일 수 있다. 일부 경우에, PBS-표적화 부위는 표적 서열과 상보적인 비-PAM 가닥의 영역에 바로 인접할 수 있다. 다른 예에서, PBS-표적화 부위는 표적 서열과 상보적인 비-PAM 가닥의 영역과 중첩될 수 있다. 대안적으로, PBS-표적화 부위는 PAM 가닥 상의 표적 서열에 인접하거나, 이의 상류에 있거나 또는 이와 중첩될 수 있다.
본 명세서에서 사용되는 용어 "역전사 주형 서열" 또는 "주형 서열"은 역전사효소에 의한 DNA 합성을 위한 주형의 역할을 하는 RNA 분자 또는 RT 공여체 RNA의 단편을 지칭한다. 일부 실시형태에서, 역전사 주형 서열은 유전자 편집이 필요한 게놈 부위에 혼입될 편집을 포함한다. 일부 경우에, RT 공여체 RNA의 역전사 주형 서열에 의해 매개되는 편집은 PAM 서열, 표적 서열 또는 둘 다를 방해하거나 또는 제거한다.
본 명세서에서 사용되는 용어 "편집 주형 RNA" 또는 "유전자 편집 RNA"(상호교환적으로 사용됨)는 RNA 가이드(스페이서 및 본 명세서에 개시된 것들과 같은 CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위 포함) 및 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함)를 포함하는 RNA 분자 또는 RNA 분자 세트를 지칭한다. 유전자 편집 RNA는 CRISPR 뉴클레이스에 의해 관심 게놈 부위 내의 표적 서열에서 절단을 매개하고, 유전자 편집 RNA의 주형 서열을 기반으로 CRISPR 뉴클레이스 절단에 의해 생성된 자유 DNA 가닥의 자유 3' 말단에서 DNA 단편을 합성할 수 있다. 일부 실시형태에서, 편집 주형 RNA 또는 유전자 편집 RNA는 RT 공여체 RNA에 연결된(예를 들어, 융합된) RNA 가이드를 포함하는 단일 RNA 분자이다. 일부 실시형태에서, 편집 주형 RNA는, 5'에서 3'로, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위, 스페이서 서열, PBS 및 RT 공여체 RNA를 포함한다. 일부 실시형태에서, 편집 주형 RNA 또는 유전자 편집 RNA는, 5'에서 3'로, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위, 스페이서, 주형 서열 및 PBS를 포함한다. 일부 실시형태에서, 편집 주형 RNA 또는 유전자 편집 RNA는, 5'에서 3'로, 주형 서열, PBS, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위 및 스페이서 서열을 포함한다. 일부 실시형태에서, 편집 주형 RNA는 링커를 추가로 포함한다. 예를 들어, 일부 실시형태에서, 편집 주형 RNA는 CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위와 PBS 사이 또는 스페이서 서열과 RT 공여체 RNA 사이에 링커를 포함한다.
본 명세서에서 사용되는 용어 "치환"은 참조 서열에 대해 뉴클레오타이드 또는 뉴클레오타이드들의 다른 뉴클레오타이드 또는 뉴클레오타이드들로의 대체를 지칭한다. 치환을 포함하는 서열을 만드는 방법에는 특별한 과정이 암시되어 있지 않다. 예를 들어, 치환을 포함하는 서열은 개별 뉴클레오타이드로부터 직접 합성될 수 있다. 다른 실시형태에서, 치환은 참조 서열을 제공한 다음 변경함으로써 이루어진다. 핵산 서열은 유기체의 게놈에 있을 수 있다. 핵산 서열은 세포에 있을 수 있다. 핵산 서열은 DNA 서열일 수 있다. 본 명세서에 기재된 치환은 최대 수 킬로베이스의 치환을 지칭한다.
본 명세서에서 사용되는 용어 "상류" 및 "하류"는 단일 핵산(예를 들어, DNA) 서열 내의 상대적 위치를 지칭한다. "상류" 및 "하류"는 각각 RNA 전사가 일어나는 5'에서 3' 방향과 관련된다. 첫 번째 서열의 3' 말단이 두 번째 서열의 5' 말단 앞에서 발생할 때, 첫 번째 서열은 두 번째 서열의 상류이다. 첫 번째 서열의 5' 말단이 두 번째 서열의 3' 말단 뒤에서 발생할 때, 첫 번째 서열은 두 번째 서열의 하류이다. 일부 실시형태에서, 용어 "상류" 및 하류"는 비-PAM 가닥과 관련하여 사용된다. 예를 들어, 일부 실시형태에서, PBS는 표적 서열의 상류에 있는 비-PAM 가닥 서열과 상보적이다. 이와 같이, 일부 실시형태에서, PBS는 스페이서 서열이 결합하는 서열의 상류 서열에 결합하고, 스페이서 서열은 PBS가 결합하는 서열의 하류에 결합한다.
I. 유전자 편집 시스템
프라임 편집은 표적 서열에 치환, 작은 삽입 또는 작은 결실을 도입하기 위해 개발되었다. 프라임 편집 접근법은 역전사효소에 융합된 Cas9 닉케이스 및 프라임 편집 가이드 RNA(pegRNA)에 의존한다. pegRNA는 표적 유전자좌의 비-PAM 가닥(PAM 서열의 반대편 가닥)에 결합할 수 있는 스페이서 서열, 표적 유전자좌의 PAM 가닥(PAM 서열을 포함하는 가닥)에 결합할 수 있는 프라이머 결합 부위(PBS) 및 편집을 포함하는 역전사 주형 서열을 포함한다. pegRNA의 스페이서 서열 비-PAM 가닥의 표적 서열에 결합하고, 닉케이스 Cas9는 PAM 가닥에 닉을 형성한다. 이는 PBS에 혼성화할 수 있는 표적 유전자좌의 PAM 가닥에 3' 플랩(flap)을 노출시킨다. 그런 다음, 역전사효소는 역전사 주형을 카피하여 3' 플랩을 연장시킨다. 예를 들어, 도 19a를 참조한다. DNA 복구 메커니즘을 통해, 편집은 표적 유전자좌에 혼입된다.
일부 양태에서, 편집 표적 핵산을 (예를 들어, 관심 게놈 부위에서) 편집할 수 있는, 예를 들어, 게놈 부위에 삽입, 결실, 치환 또는 이들의 조합을 도입할 수 있는 유전자 편집 시스템이 본 명세서에 제공된다. 편집은 표적 핵산의 가닥 중 하나에서 발생할 수 있다. 본 명세서에 개시된 유전자 편집 시스템은 적어도 하나의 단백질 구성요소 또는 이를 암호화하는 뉴클레오타이드 서열, 및 적어도 하나의 RNA 구성요소 또는 이를 암호화하는 뉴클레오타이드 서열을 포함한다. 단백질 구성요소는 RNA 구성요소에 의해 가이드되어 목적하는 부위에서 표적 핵산을 절단하는 활성 및 RNA 구성요소의 일부를 주형으로 사용하여 절단으로 인해 생성된 DNA 가닥의 자유 3' 말단에서 시작하여 새로운 DNA 서열을 합성하는 활성을 갖는다. 그런 다음, 새로 합성된 DNA 단편은, 예를 들어, 숙주 세포의 DNA 복구 메커니즘을 통해 표적 핵산에 혼입되어 표적 핵산의 유전적 편집을 유도할 수 있다.
본 명세서에 개시된 유전자 편집 시스템의 단백질 구성요소는 CRISPR 뉴클레이스(예를 들어, 변이형 Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소(RT) 폴리펩타이드를 포함할 수 있다. 일부 예에서, CRISPR 뉴클레이스 및 RT 폴리펩타이드는 2개의 별도의 폴리펩타이드이다. 다른 예에서, CRISPR 뉴클레이스 및 RT 폴리펩타이드는 융합 폴리펩타이드의 일부이다.
본 명세서에 개시된 유전자 편집 시스템의 RNA 구성요소는 설계된 바와 같이 표적 핵산의 특정 부위에서 CRISPR 뉴클레이스 절단을 매개하는 가이드 RNA(gRNA)(본 명세서에서 RNA 가이드 또는 CRISPR RNA(crRNA)로도 기재됨) 및 RT 폴리펩타이드에 의한 역전사를 매개하고 역전사를 위한 주형 서열을 제공하는 역전사 공여체 RNA(RT 공여체 RNA)를 포함할 수 있다. 일부 예에서, gRNA 및 RT 공여체 RNA는 2개의 개별 RNA 분자이다. 다른 예에서, gRNA 및 RT 공여체 RNA는 단일 RNA 분자의 일부이다.
본 명세서에 나타낸 바와 같이 그리고 이론에 얽매이지 않고, 본 명세서에 기재된 유전자 편집 시스템은 해당 분야에 비해 여러 가지 장점을 제공한다. 예를 들어, Cas12i CRISPR 뉴클레이스와 같은 유형 V CRISPR 뉴클레이스로는 RNA-주형 편집은 입증되지 않았다. Cas9개의 뉴클레이스보다 작은 유형 V 뉴클레이스가 풍부하다. 예를 들어, Cas12i2는 1,054개의 아미노산 길이인 반면, S. 피오게네스(S. pyogenes) Cas9(SpCas9)는 1,368개의 아미노산 길이이고, S. 써모필루스(S. thermophilus) Cas9(StCas9)는 1,128개의 아미노산 길이이고, FnCpf1은 1,300개의 아미노산 길이이고, AsCpf1은 1,307개의 아미노산 길이이고, LbCpf1은 1,246개의 아미노산 길이이다. 추가적으로, 유형 V 뉴클레이스는 트랜스-활성화 CRISPR RNA(tracrRNA)가 필요하지 않은 RNA 가이드를 이용하므로 Cas9 RNA 가이드보다 작다. Cas12i 폴리펩타이드와 RNA 가이드 크기가 작을수록 전달에 유리하다. 추가적으로, 표적 가닥(비-PAM 가닥)과 같은 표적 유전자좌의 단일 가닥에 결합하는 단일 편집 주형 RNA를 이용하는 임의의 CRISPR 뉴클레이스로는 RNA-주형 편집이 입증되지 않았다. 본 명세서에 나타낸 바와 같이, Cas12i 폴리펩타이드를 포함하는 유전자 편집 시스템도 SpCas9 폴리펩타이드를 포함하는 유전자 편집 시스템에 비해 감소된 표적외 활성을 보여준다. 전체가 참조에 의해 원용되어 있는 PCT/US2021/025257을 참조한다.
A. CRISPR 뉴클레이스
본 명세서에 개시된 임의의 유전자 편집 시스템은 CRISPR 뉴클레이스를 포함할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 본 명세서의 다른 곳에 기재된 바와 같은 뉴클레이스 결합 서열에 결합할 수 있고/있거나 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스는 표적 서열에서 DNA를 절단한다. 일부 실시형태에서, CRISPR 뉴클레이스는 표적 서열을 특이적으로 인식하고/하거나 이에 결합하는 본 명세서의 다른 곳에 기재된 DNA-결합 서열을 통해 표적 서열에 동원된다. 일부 실시형태에서, CRISPR 뉴클레이스는 표적 서열에서 DNA의 가닥 중 하나 또는 둘 다를 절단한다. 일부 실시형태에서, 하나 초과의 CRISPR 뉴클레이스가 표적 서열에 동원되고, 하나 이상의 CRISPR 뉴클레이스는 표적 서열에서 또는 그 근처에서 DNA의 가닥 중 하나 또는 둘 다를 절단한다. 이러한 실시형태에서, CRISPR 뉴클레이스는 뉴클레이스 활성을 보유하거나 또는 가질 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 감소된 또는 제한된 뉴클레이스 활성을 보유할 수 있다. 일부 실시형태에서, 본 명세서의 다른 곳에 기재된 바와 같은 CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 본 명세서의 다른 곳에 기재된 바와 같은 편집 주형 RNA의 적어도 하나의 뉴클레이스 결합 서열에 결합할 수 있으며 이에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합체는 편집 주형 RNA의 적어도 하나의 DNA-결합 서열을 통해 표적 서열에 결합할 수 있으며 이에 결합한다. 이러한 실시형태에서, CRISPR 뉴클레이스는 뉴클레이스 결합 서열과 편집 주형 RNA의 DNA-결합 서열에 결합함으로써 표적 서열에 동원되거나 또는 이에 근접하게 된다. 추가의 이러한 실시형태에서, 역전사효소는 본 명세서의 다른 곳에 기재된 바와 같은 역전사 주형 서열을 DNA로 전사할 수 있으며 이를 전사한다.
일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 역전사 주형 서열을 표적 핵산의 비-PAM 가닥으로 전사한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 역전사 주형 서열을 표적 핵산의 PAM 가닥으로 전사한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 PBS에서 시작하여 5'에서 3'(예를 들어, PBS의 5' 또는 3' 말단)로 전사한다. 일부 실시형태에서, 표적 핵산의 비-PAM 가닥의 자유 3' 말단에 PBS를 혼성화한 후, CRISPR 뉴클레이스-역전사효소 융합체는 비-PAM 가닥의 3' 말단으로부터 역전사 주형 서열을 전사한다. 일부 실시형태에서, 표적 핵산의 PAM 가닥의 자유 3' 말단에 PBS를 혼성화한 후, CRISPR 뉴클레이스-역전사효소 융합체는 PAM 가닥의 3' 말단으로부터 역전사 주형 서열을 전사한다.
일부 실시형태에서, CRISPR 뉴클레이스는 RNA-가이드된 CRISPR 뉴클레이스이다. 일부 실시형태에서, CRISPR 뉴클레이스는 DNA-표적화 뉴클레이스이다.
일부 실시형태에서, CRISPR 뉴클레이스는 Cas9(예를 들어, Cas9 및 nCas9), Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i 및 Cas12j/ CasPhi)이다. Cas 효소의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas8a, Cas8b, Cas8c, Cas9(Csn1 또는 Csx12로도 알려져 있음), Cas10, Cas10d, Cas12a/Cpfl, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, Cas12j/CasΦ, Cpf1, Csy1, Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csxl7, Csxl4, Csx10, Csxl6, CsaX, Csx3, Csx1, Csx1S, Csx11, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, 유형 II CRISPR 뉴클레이스, 유형 V CRISPR 뉴클레이스, 유형 VI CRISPR 뉴클레이스, CARF, DinG, 이들의 상동체 또는 이들의 변형 또는 조작된 버전을 포함한다. 다른 CRISPR 뉴클레이스도 본 개시내용의 범위 내에 있지만, 본 개시내용에 구체적으로 나열되지는 않을 수도 있다. 예를 들어, 문헌[Makarova et al. "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?" CRISPRJ. 1(5):325-36 (2018)]을 참조한다.
일부 실시형태에서, CRISPR 뉴클레이스는 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO2021055874, WO2020206036, WO2020191102, WO2020186213, WO2020028555, WO2020033601, WO2019126762, WO2019126774, WO2019071048, WO2019018423, WO2019005866, WO2018191388, WO2018170333, WO2018035388, WO2018035387, WO2017219027, WO2017189308, WO2017184768, WO2017106657, WO2016205749, WO2017070605, WO2016205764, WO2016205711, WO2016028682, WO2015089473, WO2014093595, WO2015089427, WO2014204725, WO2015070083, WO2014093655, WO2014093694, WO2014093712, WO2014093635, WO2021133829, WO2021007177, WO2020197934, WO2020181102, WO2020181101, WO2020041456, WO2020023529, WO2020005980, WO2019104058, WO2019089820, WO2019089808, WO2019089804, WO2019089796, WO2019036185, WO2018226855, WO2018213351, WO2018089664, WO2018064371, WO2018064352, WO2017106569, WO2017048969, WO2016196655, WO2016106239, WO2016036754, WO2015103153, WO2015089277, WO2014150624, WO2013176772, WO2021119563, WO2021118626, WO2020247883, WO2020247882, WO2020223634, WO2020142754, WO2020086475, WO2020028729, WO2019241452, WO2019173248, WO2018236548, WO2018183403, WO2017027423, WO2018106727, WO2018071672, WO2017096328, WO2017070598, WO2016201155, WO2014150624, WO2013098244, WO2021113522, WO2021050534, WO2021046442, WO2021041569, WO2021007563, WO2020252378, WO2020180699, WO2020018142, WO2019222555, WO2019178428, WO2019178427 또는 WO2019006471에 개시되어 있는 뉴클레이스이다.
일부 실시형태에서, 본 발명의 조성물은 유형 V CRISPR 뉴클레이스(예를 들어, 유형 V 뉴클레이스)를 포함한다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12 CRISPR 뉴클레이스이다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) CRISPR 뉴클레이스이다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) CRISPR 뉴클레이스의 변이체(예를 들어, 기능적 변이체)이다. 일부 실시형태에서, 유형 V 뉴클레이스는 야생형 유형 V 뉴클레이스 서열(예를 들어, Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi)의 야생형 아미노산 서열)과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, 본 발명의 유형 V 뉴클레이스는 Cas12i CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas12i CRISPR 뉴클레이스는 서열번호 1과 같은 뉴클레오타이드 서열을 포함하는 Cas12i2 CRISPR 뉴클레이스이거나 또는 서열번호 2와 같은 아미노산 서열을 포함하는 폴리펩타이드에 의해 암호화된다. 일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 야생형 CRISPR 뉴클레이스의 변이체이되, 야생형은 서열번호 1과 같은 뉴클레오타이드 서열을 포함하거나 또는 서열번호 2와 같은 아미노산 서열을 포함하는 폴리펩타이드에 의해 암호화된다. 표 1을 참조한다.
일부 실시형태에서, 본 발명의 유형 II 뉴클레이스는 Cas9 CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas9 CRISPR 뉴클레이스는 서열번호 120과 같은 아미노산 서열을 포함하는 SpCas9 CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas9 CRISPR 뉴클레이스는 닉케이스, 예를 들어, 서열번호 121과 같은 아미노산 서열을 포함하는 nSpCas9이다. 일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 상이한 종의 Cas9 CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas9 CRISPR 뉴클레이스는 서열번호 122와 같은 아미노산 서열을 포함하는 SaCas9 CRISPR 뉴클레이스이다. 표 1을 참조한다.
본 명세서에 기재된 CRISPR 뉴클레이스를 암호화하는 핵산 서열은 참조 핵산 서열, 예를 들어, 서열번호 1과 실질적으로 동일할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 참조 핵산 서열, 예를 들어, 야생형 폴리펩타이드를 암호화하는 핵산 서열, 예를 들어, 서열번호 1과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.5%의 서열 동일성을 갖는 서열을 포함하는 핵산에 의해 암호화된다. 이러한 두 핵산 사이의 동일성 퍼센트는 최적으로 정렬된 두 핵산 서열을 검사하거나 또는 표준 매개변수를 사용하는 소프트웨어 프로그램 또는 알고리즘(예를 들어, BLAST, ALIGN, CLUSTAL)을 사용하여 수동으로 결정될 수 있다. 두 핵산 서열이 실질적으로 동일하다는 한 가지 지표는 핵산 분자가 엄격한 조건하에서(예를 들어, 중간 내지 높은 엄격성의 범위 내에서) 다른 것의 상보적 서열에 혼성화된다는 것이다.
일부 실시형태에서, CRISPR 뉴클레이스는 참조 핵산 서열, 예를 들어, CRISPR 뉴클레이스를 암호화하는 핵산 서열, 예를 들어, 서열번호 1과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 이상의 서열 동일성을 갖지만 100%의 서열 동일성을 갖는 것은 아닌 핵산 서열에 의해 암호화된다.
일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 서열번호 2와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 서열번호 2와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%를 초과하지만 100%는 아닌 동일성을 갖는 서열을 포함한다.
일부 실시형태에서, 본 발명은 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 2의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 심지어 적어도 99% 그러나 100%는 아닌 서열 동일성을 갖는 CRISPR 뉴클레이스를 설명한다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, CRISPR 뉴클레이스는 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO/2021/202800에 기술되어 이는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas12i2 폴리펩타이드는 WO/2021/202800의 표 2에 나열되어 있는 아미노산 치환 중 하나 이상을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 3의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 4의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 5의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 495의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 496의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 참조에 의해 원용되어 있는 WO/2021/202800의 서열번호 3 내지 146 및 495 내지 512 중 어느 하나와 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다.
일부 실시형태에서, CRISPR 뉴클레이스는 Cas12i 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 Cas12i1 폴리펩타이드이다. 일부 실시형태에서, Cas12i1 폴리펩타이드는 변이형 Cas12i1 폴리펩타이드이다. 일부 실시형태에서, 본 발명의 변이형 Cas12i1 폴리펩타이드는 서열번호 8과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 변이형 Cas12i1 폴리펩타이드는 서열번호 8과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 Casi1 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 8의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하는 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas12i1 폴리펩타이드를 암호화하는 핵산은 서열번호 8과 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas12i1 폴리펩타이드는 서열번호 8과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas12i1 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 8 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, Cas12i 폴리펩타이드는 Cas12i3 폴리펩타이드이다. 일부 실시형태에서, 본 발명의 Cas12i3 폴리펩타이드는 서열번호 11과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 Cas12i3 폴리펩타이드는 서열번호 11과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, Cas12i3 폴리펩타이드는 변이형 Cas12i3 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas12i3 폴리펩타이드는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 11의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas12i3 폴리펩타이드를 암호화하는 핵산은 서열번호 11과 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas12i3 폴리펩타이드는 서열번호 11과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas12i3 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 11 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, Cas12i 폴리펩타이드는 Cas12i4 폴리펩타이드이다. 일부 실시형태에서, 본 발명의 Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, Cas12i4 폴리펩타이드는 변이형 Cas12i4 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas12i4 폴리펩타이드는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 9 또는 서열번호 10의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas12i4 폴리펩타이드를 암호화하는 핵산은 서열번호 9 또는 서열번호 10과 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas12i4 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 9 또는 서열번호 10 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스는 유형 II CRISPR 뉴클레이스, 예를 들어, Cas9개의 뉴클레이스이다. 일부 실시형태에서, Cas9개의 뉴클레이스는 S. 피오게네스 또는 S. 아우레우스(S. aureus)로부터의 Cas9 또는 이의 변이체이다. 예를 들어, 전체가 참조에 의해 원용되어 있는 U.S. 20190136248을 참조한다. 일부 실시형태에서, Cas9 폴리펩타이드는 닉케이스이다.
일부 실시형태에서, 본 발명의 Cas9 폴리펩타이드는 서열번호 120 내지 122 중 어느 하나와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 Cas9 폴리펩타이드는 서열번호 120 내지 122 중 어느 하나와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, Cas9 폴리펩타이드는 변이형 Cas9 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas9 폴리펩타이드는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 120 내지 122 중 어느 하나의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas9 폴리펩타이드를 암호화하는 핵산은 서열번호 120 내지 122 중 어느 하나와 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas9 폴리펩타이드는 서열번호 120 내지 122 중 어느 하나와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas9 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 120 또는 서열번호 121 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스 또는 유형 II 뉴클레이스)는 야생형 폴리펩타이드의 하나 이상(예를 들어, 여러 개)의 아미노산에 변경을 포함하되, 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개, 100개, 101개, 102개, 103개, 104개, 105개, 106개, 107개, 108개, 109개, 110개, 111개, 112개, 113개, 114개, 115개, 116개, 117개, 118개, 119개, 120개, 121개, 122개, 123개, 124개, 125개, 126개, 127개, 128개, 129개, 130개, 131개, 132개, 133개, 134개, 135개, 136개, 137개, 138개, 139개, 140개, 141개, 142개, 143개, 144개, 145개, 146개, 147개, 148개, 149개, 150개, 151개, 152개, 153개, 154개, 155개, 156개, 157개, 158개, 159개, 160개, 161개, 162개, 162개, 164개, 164개, 165개, 166개, 167개, 168개, 169개, 170개, 171개, 172개, 173개, 174개, 175개, 176개, 177개, 178개, 179개, 180개, 181개, 182개, 183개, 184개, 185개, 186개, 187개, 188개, 189개, 190개, 191개, 193개, 194개, 195개, 196개, 197개, 198개, 199개, 200개 이상이 변경된다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 crRNA 처리 활성을 포함한다. 일부 실시형태에서, 유형 V 뉴클레이스(예를 들어, Cas12i 폴리펩타이드)는 crRNA 처리 활성이 결여되어 있는 변이체이다. 예를 들어, 유형 V 뉴클레이스가 변이형 Cas12i2 폴리펩타이드인 일부 실시형태에서, 변이형 Cas12i2 폴리펩타이드는 H485 또는 H486 치환을 포함한다. 일부 실시형태에서, 서열번호 2 내지 7 중 어느 하나와 적어도 90%의 동일성(예를 들어, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%)을 갖는 변이형 Cas12i2 폴리펩타이드는 H485 또는 H486 돌연변이를 추가로 포함한다. 일부 실시형태에서, H485 또는 H486 돌연변이를 포함하는 변이형 Cas12i2 폴리펩타이드는 감소된 crRNA 처리 활성을 포함하거나 또는 crRNA 처리 활성이 결여되어 있다.
일부 실시형태에서, 본 명세서에 기재된 CRISPR 뉴클레이스를 암호화하는 뉴클레오타이드 서열은 특정 숙주 세포 또는 유기체에서 사용하기 위해 코돈-최적화될 수 있다. 예를 들어, 핵산은 마우스, 래트, 토끼, 개, 가축 또는 비인간 영장류를 포함하는 임의의 비인간 진핵생물에 대해 코돈-최적화될 수 있다. 코돈 사용 표는, 예를 들어, www.kazusa.orjp/codon/에서 입수 가능한 "코돈 사용 데이터베이스"에서 쉽게 이용할 수 있으며, 이러한 표는 다양한 방식으로 적합화될 수 있다. 전체가 참조에 의해 본 명세서에 원용되어 있는 문헌[Nakamura et al. Nucl. Acids Res. 28:292 (2000)]을 참조한다. Gene Forge(Aptagen; 펜실베니아주 자코부스 소재)와 같은 특정 숙주 세포에서의 발현을 위해 특정 서열을 최적화하는 코돈을 위한 컴퓨터 알고리즘도 이용 가능하다.
본 명세서에 기재된 변화는 하나 이상의 아미노산 변화일 수 있지만, CRISPR 뉴클레이스에 대한 변화는 또한 아미노- 및/또는 카복실-말단 연장으로서 폴리펩타이드의 융합과 같은 구조적 또는 실질적인 특성일 수 있다. 예를 들어, CRISPR 뉴클레이스는 추가적인 펩타이드, 예를 들어, 하나 이상의 펩타이드를 포함할 수 있다. 추가적인 펩타이드의 예는 폴리히스티딘 태그(His-태그), Myc 및 FLAG와 같은 표지를 위한 에피토프 펩타이드를 포함할 수 있다. 일부 실시형태에서, 본 명세서에 기재된 CRISPR 뉴클레이스는 형광 단백질(예를 들어, 녹색 형광 단백질(green fluorescent protein: GFP) 또는 황색 형광 단백질(yellow fluorescent protein: YFP))과 같은 검출 가능한 모이어티에 융합될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 핵 국재화 신호(nuclear localization signal: NLS)를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 핵외 수송 신호(nuclear export signal: NES)를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 NLS 및 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 NES를 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스는 적어도 RuvC 도메인을 포함하지만, 전체 CRISPR 뉴클레이스보다 적다. 일부 실시형태에서, CRISPR 뉴클레이스는 야생형 CRISPR 뉴클레이스에 대해 절단된 CRISPR 뉴클레이스이다. 일부 실시형태에서, 절단된 CRISPR 뉴클레이스는 RuvC 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 전체 CRISPR 뉴클레이스의 적어도 하나의 기능적 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 2개의 RuvC 도메인 또는 적어도 2개의 RuvC 모티프를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 3개의 RuvC 도메인 또는 적어도 3개의 RuvC 모티프를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 하나의 촉매 활성이 없는(catalytically dead) RuvC 도메인 및 적어도 하나의 촉매적으로 활성인 RuvC 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 하나 이상의 유형 V 또는 유형 II 뉴클레이스로부터의 2개의 RuvC 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 RuvC 도메인 및 이량체화 도메인을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 폴리머레이스에 융합된다. 일부 실시형태에서, 이전 실시형태 중 어느 하나에 기재된 바와 같은 CRISPR 뉴클레이스는 역전사효소 폴리펩타이드에 융합된다. 일부 실시형태에서, CRISPR 뉴클레이스는 N-말단 역전사효소 폴리펩타이드를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 C-말단 역전사효소 폴리펩타이드를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 CRISPR 뉴클레이스 내의 분자내 위치에 역전사효소 폴리펩타이드를 포함한다(예를 들어, 역전사효소는 CRISPR 뉴클레이스의 루프 내에 있음).
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 역전사효소 폴리펩타이드와 (예를 들어, 정전기적 상호작용을 통해) 상호작용한다. 일부 실시형태에서, CRISPR 뉴클레이스는 이량체화 도메인을 포함한다. 본 명세서에서 사용되는 용어 "이량체화 도메인"은 별도의 양립 가능한 폴리펩타이드 도메인(예를 들어, 제2 양립 가능한 이량체화 도메인)에 특이적으로 결합할 수 있는 폴리펩타이드 도메인을 지칭한다. 일부 실시형태에서, 이량체는 제1 이량체화 도메인과 제2 양립 가능한 이량체화 도메인 사이의 비공유 결합에 의해 형성된다. 일부 실시형태에서, 이량체화 도메인은 류신 지퍼, 나노바디 또는 항체이다. 일부 실시형태에서, 이량체화 도메인은 역전사효소 폴리펩타이드를 동원한다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소 폴리펩타이드는 이중 코일 펩타이드(coiled-coil) 이종이량체를 통해 상호작용한다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 라이게이스(ligase), 인테그레이스(integrase) 및/또는 리콤비네이스(recombinase)와 상호작용한다. 일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 라이게이스, 인테그레이스 및/또는 리콤비네이스에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 CRISPR 뉴클레이스의 N-말단 또는 C-말단에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 CRISPR 뉴클레이스에 내부적으로 융합된다. 일부 실시형태에서, 인테그레이스는 세린 인테그레이스이다. 일부 실시형태에서, 인테그레이스는 Bxb1, TP901 또는 PhiBT1 인테그레이스이다. 일부 실시형태에서, 리콤비네이스는 세린 리콤비네이스 또는 타이로신 리콤비네이스이다. 일부 실시형태에서, 리콤비네이스는 CRE 리콤비네이스이다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스와 상호작용하거나 또는 이에 융합된 CRISPR 뉴클레이스는 추가로 역전사효소와 상호작용하거나 또는 이에 융합된다.
B. 역전사효소
다양한 실시형태에서, 본 명세서에 개시된 조성물은 CRISPR 뉴클레이스에 대한 융합체로서 제공될 수 있는 폴리머레이스(예를 들어, DNA-의존적 DNA 폴리머레이스 또는 RNA-의존적 DNA 폴리머레이스) 또는 이들의 변이체를 포함한다. 폴리머레이스는 야생형 폴리머레이스, 기능적 단편, 변이체, 절단된 변이체 등일 수 있다. 폴리머레이스는 진핵생물, 원핵생물, 고세균 또는 바이러스 유기체로부터의 야생형 폴리머레이스를 포함할 수 있고/있거나 폴리머레이스는 유전 공학, 돌연변이 유발, 유도 진화-기반 과정에 의해 변형될 수 있다.
본 명세서에 개시된 바와 같은 것들(예를 들어, 표 7 및 표 17에 나타낸 것들)과 같은 임의의 CRISPR 뉴클레이스-RT 융합 폴리펩타이드, 이들의 암호화 핵산, 이를 포함하는 벡터, 이를 제조하는 방법도 본 개시내용의 범위 내에 있다.
일부 실시형태에서, 폴리머레이스는 역전사효소이다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 임의의 자연 발생적 유기체 또는 바이러스로부터 얻거나 또는 상업적 또는 비상업적 공급원으로부터 얻은 임의의 야생형 역전사효소이다. 역전사효소 폴리펩타이드도 변이형 역전사효소 폴리펩타이드일 수 있다.
역전사효소 폴리펩타이드는 다수의 다양한 공급원으로부터 얻을 수 있다. 예를 들어, 유전자는 레트로바이러스에 감염된 진핵생물 세포로부터 또는 전체 레트로바이러스 게놈의 일부 또는 전체를 포함하는 플라스미드로부터 얻을 수 있다. 또한, 역전사효소 유전자를 포함하는 RNA는 레트로바이러스로부터 얻을 수 있다. 일부 실시형태에서, 역전사효소는 개별 성분으로 발현되거나 또는 그렇지 않으면 이로 제공되며, 즉, 이는 CRISPR 뉴클레이스(예를 들어, Cas12i) 폴리펩타이드와의 융합체 단백질이 아니다.
당업자는 라우스 육종 바이러스(Rous Sarcoma Virus: RSV) 역전사효소, 조류 골수아세포 백혈증 바이러스(Avian Myeloblastosis Virus: AMV) 역전사효소, 조류 적아세포증 바이러스(Avian Erythroblastosis Virus: AEV) 헬퍼 바이러스 MCAV 역전사효소, 조류 골수세포증 바이러스 MC29 헬퍼 바이러스 MCAV 역전사효소, 조류 세망내피증 바이러스(Reticuloendotheliosis Virus: REV-T) 헬퍼 바이러스 REV-A 역전사효소, 조류 육종 바이러스 UR2 헬퍼 바이러스 UR2AV 역전사효소, 조류 육종 바이러스 Y73 헬퍼 바이러스 YAV 역전사효소, 라우스 관련 바이러스(Rous Associated Virus: RAV) 역전사효소 및 골수아세포 백혈증 관련 바이러스(Myeloblastosis Associated Virus: MAV) 역전사효소를 포함하지만 이에 제한되지 않는 몰로니 뮤린 백혈병 바이러스(Moloney Murine Leukemia Virus: MMLV) 역전사효소, 인간 면역결핍 바이러스(Human Immunodeficiency Virus: HIV) 역전사효소 및 조류 육종-백혈증 바이러스(avian Sarcoma-Leukosis Virus: ASLV) 역전사효소를 포함하지만 이에 제한되지 않는 역전사효소가 당업계에 공지되어 있으며 본 명세서에 기재된 조성물에 적합하게 사용될 수 있음을 인식할 것이다.
일부 실시형태에서, 역전사효소는 에우박테리움 렉탈레(Eubacterium rectale)로부터의 MMLV-RT, MarathonRT, 또는 RTX 역전사효소, 또는 MMLV-RT, MarathonRT 또는 RTX 역전사효소의 변이체이다. 일부 실시형태에서, 역전사효소는 표 2에 나타낸 서열, 이들의 변이체 또는 이들의 오쏘로그이다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스에 융합된다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 N-말단 CRISPR 뉴클레이스를 포함한다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 C-말단 CRISPR 뉴클레이스를 포함한다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 역전사효소 폴리펩타이드(예를 들어, CRISPR 뉴클레이스) 내의 분자내 위치에 있고 역전사효소 폴리펩타이드의 루프 내에 있는 CRISPR 뉴클레이스를 포함한다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 이량체화 도메인을 포함한다. 일부 실시형태에서, 이량체화 도메인은 류신 지퍼, 나노바디 또는 항체이다. 일부 실시형태에서, 이량체화 도메인은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 동원한다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 "오류 유발성(error-prone)" 역전사효소 변이체이다. 당업계에 공지되어 있고/있거나 이용 가능한 오류 유발성 역전사효소가 사용될 수 있다. 역전사효소는 자연적으로 임의의 교정 기능을 갖지 않는다는 것을 알 것이며; 따라서, 역전사효소의 오류율은 일반적으로 교정 활성을 포함하는 DNA 폴리머레이스보다 높다. 일부 실시형태에서, 역전사효소는 합성된 약 15,000개의 뉴클레오타이드에서 오류율이 1 미만인 경우 "오류 유발성"인 것으로 간주된다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 RNase H 도메인에 돌연변이 또는 돌연변이들을 갖는다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 RNase H 도메인을 포함하지 않는다(예를 들어, RNase H 도메인은 역전사효소 폴리펩타이드로부터 제거되었음). 일부 실시형태에서, RNase H 도메인은 역전사효소 폴리펩타이드에서 절단된다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 RNA-의존적 DNA 폴리머레이스 도메인에 돌연변이 또는 돌연변이들을 갖는다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 내열성 특성이 변경된 변이체이다. 고온을 견디는 역전사효소의 능력은 cDNA 합성의 중요한 양태이다. 반응 온도가 상승하면 강력한 2차 구조 및/또는 높은 GC 함량을 갖는 RNA를 변성시키는 데 도움이 되어 역전사효소가 서열을 판독할 수 있게 한다. 결과적으로, 더 높은 온도에서 역전사를 수행하면 전장 cDNA 합성 및 더 높은 수율이 가능해진다. 야생형 M-MLV 역전사효소는 전형적으로 37℃ 내지 48℃ 범위의 최적 온도를 갖지만; 49℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃ 이상을 포함하여 48℃보다 더 높은 온도에서 역전사 활성을 허용하는 돌연변이가 도입될 수 있다.
본 명세서에서 사용되는 변이형 역전사효소 폴리펩타이드는 임의의 야생형 역전사효소, 돌연변이 역전사효소, 또는 역전사효소의 단편 또는 본 명세서에 개시 또는 상정되거나 또는 당업계에 공지된 다른 역전사효소 변이체를 포함하는 임의의 참조 역전사효소 폴리펩타이드와 적어도 약 20% 동일, 적어도 약 25% 동일, 적어도 약 30% 동일, 적어도 약 35% 동일, 적어도 약 40% 동일, 적어도 약 45% 동일, 적어도 약 50% 동일, 적어도 약 55% 동일, 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 96% 동일, 적어도 약 97% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일하거나 또는 적어도 약 99.9% 동일할 수 있다. 일부 실시형태에서, 역전사효소 변이체는 참조 역전사효소와 비교하여 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 21개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개 또는 최대 100개, 또는 최대 200개, 또는 최대 300개, 또는 최대 400개 또는 최대 500개 이상의 아미노산 변화를 가질 수 있다. 일부 실시형태에서, 역전사효소 변이체는 참조 역전사효소의 단편을 포함하며, 단편은 참조 역전사효소의 상응하는 단편과 적어도 약 20% 동일, 적어도 약 25% 동일, 적어도 약 30% 동일, 적어도 약 35% 동일, 적어도 약 40% 동일, 적어도 약 45% 동일, 적어도 약 50% 동일, 적어도 약 55% 동일, 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 96% 동일, 적어도 약 97% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일하거나 또는 적어도 약 99.9% 동일하다.
오류 유발성 역전사효소, 내열성 역전사효소 및 진행성이 증가된 역전사효소를 비롯한 변이형 역전사효소는 돌연변이 유발 또는 진화적 절차를 비롯한 다양한 일상적인 전략에 의해 조작될 수 있다. 일부 경우에, 변이체는 단일 돌연변이를 도입함으로써 생산될 수 있다. 다른 경우에, 변이체는 하나 초과의 돌연변이가 필요할 수 있다. 하나 초과의 돌연변이를 포함하는 돌연변이의 경우, 특정 돌연변이에 의해 발생하는 다른 돌연변이와 분리하여 부위-지정 돌연변이 유발에 의해 확인된 돌연변이를 야생형 유전자에 도입함으로써 주어진 돌연변이의 효과가 평가될 수 있다. 그런 다음, 이렇게 생성된 단일 돌연변이의 스크리닝 검정은 해당 돌연변이만의 효과를 결정할 수 있을 것이다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 역전사효소의 연장률 및/또는 효율을 개선하기 위해 도메인을 포함하거나 또는 이에 융합된다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus)로부터의 Sso7d 폴리펩타이드와 같은 Sso7d 폴리펩타이드에 융합된다. 예를 들어, 문헌[Wang et al., Nucleic Acids Res. 32(3): 1197-207 (2004)]을 참조한다.
일부 실시형태에서, 본 명세서의 다른 곳에 기재된 바와 같은 CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 편집 주형 RNA의 적어도 하나의 뉴클레이스 결합 서열에 결합할 수 있으며 이에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 편집 주형 RNA의 적어도 하나의 DNA-결합 서열을 통해 표적 서열에 결합할 수 있으며 이에 결합한다. 이러한 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 편집 주형 RNA의 뉴클레이스 결합 서열과 DNA-결합 서열을 통한 CRISPR 뉴클레이스의 결합을 통해 표적 서열에 동원되거나 또는 이에 근접하게 된다.
일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 5' 말단에서 시작하여 표적 핵산의 비-PAM 가닥으로 전사한다. 일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 3' 말단에서 시작하여 표적 핵산의 비-PAM 가닥으로 전사한다. 일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 5' 말단에서 시작하여 표적 핵산의 PAM 가닥으로 전사한다. 일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 3' 말단에서 시작하여 표적 핵산의 PAM 가닥으로 전사한다. 일부 실시형태에서, PBS의 표적 핵산의 비-PAM 가닥으로의 결합 후, 역전사효소는 역전사 주형 서열을 비-PAM 가닥의 자유 3' 말단에서 전사한다. 일부 실시형태에서, PBS의 표적 핵산의 PAM 가닥으로의 혼성화 후, 역전사효소는 역전사 주형 서열을 PAM 가닥의 자유 3' 말단에서 전사한다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 역전사효소는 라이게이스, 인테그레이스 및/또는 리콤비네이스와 상호작용한다. 일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 역전사효소는 라이게이스, 인테그레이스 및/또는 리콤비네이스에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 역전사효소의 N-말단 또는 C-말단에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 역전사효소에 내부적으로 융합된다. 일부 실시형태에서, 인테그레이스는 세린 인테그레이스이다. 일부 실시형태에서, 인테그레이스는 Bxb1, TP901 또는 PhiBT1 인테그레이스이다. 일부 실시형태에서, 리콤비네이스는 세린 리콤비네이스 또는 타이로신 리콤비네이스이다. 일부 실시형태에서, 리콤비네이스는 CRE 리콤비네이스이다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스와 상호작용하거나 또는 이에 융합된 역전사효소는 추가로 CRISPR 뉴클레이스와 상호작용하거나 또는 이에 융합된다.
C. 유전자 편집 RNA 분자
본 명세서에 개시된 임의의 유전자 편집 시스템은 RNA 가이드 및 RNA 역전사효소(RT) 공여체(RT 공여체 RNA)를 포함하는 편집 주형 RNA(들)(유전자 편집 RNA)를 포함할 수 있다. 편집 주형 RNA(들)는 목적하는 게놈 부위와 같은 표적 핵산의 서열을 편집하는 데 도움을 준다. 일부 실시형태에서, 편집 주형 RNA는 RNA 가이드(예를 들어, 뉴클레이스 결합 서열 및 DNA-결합 서열 포함)와 RT 공여체 RNA 모두를 포함하는 단일 RNA 분자일 수 있다. 다른 실시형태에서, 편집 주형 RNA는 RNA 가이드 및 RT 공여체 RNA를 개별 RNA 분자로서 포함한다.
일부 실시형태에서, 편집 주형 RNA 또는 이의 임의의 부분은 벡터에 암호화된다. 일부 실시형태에서, 벡터는 Pol II 프로모터 또는 Pol III 프로모터를 포함한다.
i. RNA 가이드
본 명세서에 개시된 임의의 유전자 편집 시스템에서, 편집 주형 RNA는 유전자 편집 시스템에도 포함된 CRISPR 뉴클레이스를 통해 표적 핵산의 절단을 매개하는 RNA 가이드를 포함한다. RNA 가이드(또는 gRNA)는 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함한다. 뉴클레이스 결합 서열은 결합을 위해 CRISPR 뉴클레이스에 의해 인식될 수 있는 하나 이상의 결합 부위를 포함할 수 있다. 일부 경우에, gRNA는 뉴클레이스 결합 서열과 스페이서 서열을 모두 포함하는 단일 RNA 분자이다. 대안적으로, gRNA는 뉴클레이스 결합 서열 및 스페이서를 2개의 개별 RNA 분자로서 포함할 수 있다.
일부 실시형태에서, RNA 가이드는 RNA 가이드의 5' 말단, RNA 가이드의 3' 말단 또는 RNA 가이드 내의 분자내 위치에 RNA 연장부를 포함한다. 다양한 실시형태에서, RNA 연장부는 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 21개의 뉴클레오타이드, 적어도 22개의 뉴클레오타이드, 적어도 23개의 뉴클레오타이드, 적어도 24개의 뉴클레오타이드, 적어도 25개의 뉴클레오타이드, 적어도 26개의 뉴클레오타이드, 적어도 27개의 뉴클레오타이드, 적어도 28개의 뉴클레오타이드, 적어도 29개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 31개의 뉴클레오타이드, 적어도 32개의 뉴클레오타이드, 적어도 33개의 뉴클레오타이드, 적어도 34개의 뉴클레오타이드, 적어도 35개의 뉴클레오타이드, 적어도 36개의 뉴클레오타이드, 적어도 37개의 뉴클레오타이드, 적어도 38개의 뉴클레오타이드, 적어도 39개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 41개의 뉴클레오타이드, 적어도 42개의 뉴클레오타이드, 적어도 43개의 뉴클레오타이드, 적어도 44개의 뉴클레오타이드, 적어도 45개의 뉴클레오타이드, 적어도 46개의 뉴클레오타이드, 적어도 47개의 뉴클레오타이드, 적어도 48개의 뉴클레오타이드, 적어도 49개의 뉴클레오타이드 또는 적어도 50개의 뉴클레오타이드 길이이다. 일부 실시형태에서, RNA 연장부는 역전사 공여체 RNA("RT 공여체 RNA")이다(예를 들어, RNA 가이드는 RT 공여체 RNA에 융합됨). 일부 실시형태에서, RT 공여체 RNA는 본 명세서에 기재된 바와 같은 프라이머 결합 부위(PBS) 및 역전사 주형 서열을 포함한다.
뉴클레이스 결합 서열
일부 실시형태에서, 본 명세서에 기재된 바와 같은 조성물은 뉴클레이스 결합 서열을 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 CRISPR 뉴클레이스 결합 서열이다(예를 들어, 뉴클레이스 결합 서열은 유형 V 뉴클레이스 또는 유형 II 뉴클레이스에 결합할 수 있음). 일부 실시형태에서, 뉴클레이스 결합 서열은 추가의 핵산 결합 서열(예를 들어, DNA 결합 서열)이다.
일부 실시형태에서, 뉴클레이스 결합 서열은 RNA 가이드를 포함한다. RNA 가이드는 특이적 결합 친화도로 본 명세서에 기재된 CRISPR 뉴클레이스(예를 들어, 유형 V 뉴클레이스 또는 유형 II 뉴클레이스) 중 어느 하나에 결합할 수 있다. 일부 실시형태에서, RNA 가이드는 표적 서열에 대한 특이적 결합 친화도를 추가로 포함한다. 일부 실시형태에서, 본 명세서에 기재된 조성물은 2개 이상(예를 들어, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 이상)의 RNA 가이드를 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 벡터에 암호화된다. 일부 실시형태에서, 벡터는 Pol II 프로모터 또는 Pol III 프로모터를 포함한다.
일부 실시형태에서, 뉴클레이스 결합 서열은 직접 반복 서열을 포함한다. 소정의 실시형태에서, 뉴클레이스 결합 서열은 DNA-결합 서열(예를 들어, DNA-표적화 서열 또는 스페이서)에 연결된 직접 반복 서열을 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 직접 반복 서열 및 DNA-결합 서열 또는 직접 반복- DNA-결합 서열 -직접 반복 서열을 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 절단된 직접 반복 서열 및 처리된 또는 성숙 crRNA의 전형적인 DNA-결합 서열을 포함한다.
일부 실시형태에서, 뉴클레이스 결합 서열(예를 들어, 직접 반복 서열)은 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) 폴리펩타이드에 결합할 수 있다. 일부 실시형태에서, 직접 반복 서열은 Cas9 폴리펩타이드에 결합할 수 있다.
뉴클레이스 결합 서열이 공개적으로 이용 가능한 CRISPR 뉴클레이스에 대한 직접 반복인 실시형태에서, 이러한 직접 반복 서열은 당업계에 공지되어 있다. 일부 실시형태에서, CRISPR 뉴클레이스에 결합할 수 있는 직접 반복 서열은 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO2021055874, WO2020206036, WO2020191102, WO2020186213, WO2020028555, WO2020033601, WO2019126762, WO2019126774, WO2019071048, WO2019018423, WO2019005866, WO2018191388, WO2018170333, WO2018035388, WO2018035387, WO2017219027, WO2017189308, WO2017184768, WO2017106657, WO2016205749, WO2017070605, WO2016205764, WO2016205711, WO2016028682, WO2015089473, WO2014093595, WO2015089427, WO2014204725, WO2015070083, WO2014093655, WO2014093694, WO2014093712, WO2014093635, WO2021133829, WO2021007177, WO2020197934, WO2020181102, WO2020181101, WO2020041456, WO2020023529, WO2020005980, WO2019104058, WO2019089820, WO2019089808, WO2019089804, WO2019089796, WO2019036185, WO2018226855, WO2018213351, WO2018089664, WO2018064371, WO2018064352, WO2017106569, WO2017048969, WO2016196655, WO2016106239, WO2016036754, WO2015103153, WO2015089277, WO2014150624, WO2013176772, WO2021119563, WO2021118626, WO2020247883, WO2020247882, WO2020223634, WO2020142754, WO2020086475, WO2020028729, WO2019241452, WO2019173248, WO2018236548, WO2018183403, WO2017027423, WO2018106727, WO2018071672, WO2017096328, WO2017070598, WO2016201155, WO2014150624, WO2013098244, WO2021113522, WO2021050534, WO2021046442, WO2021041569, WO2021007563, WO2020252378, WO2020180699, WO2020018142, WO2019222555, WO2019178428, WO2019178427 또는 WO2019006471에 개시되어 있는 임의의 것들이다.
CRISPR 뉴클레이스가 Cas12i 폴리펩타이드인 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 90%의 동일성을 포함한다. CRISPR 뉴클레이스가 Cas12i 폴리펩타이드인 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 95%의 동일성을 포함한다. CRISPR 뉴클레이스가 Cas12i 폴리펩타이드인 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나를 포함한다. 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나의 일부를 포함한다.
다른 유형 V CRISPR 뉴클레이스와 같은 다른 CRISPR 뉴클레이스에 대한 뉴클레이스 결합 서열은 당업계에 공지되어 있고/있거나 아래 표 4 내지 표 6에 제공되어 있다.
DNA-결합 서열
RNA 가이드는 또한 DNA-결합 서열을 포함할 수 있다. 일부 실시형태에서, DNA-결합 서열은 DNA-표적화 서열(예를 들어, 스페이서)이다. 스페이서는 약 7개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, 스페이서는 약 7개의 뉴클레오타이드 내지 약 80개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드 또는 약 7개의 뉴클레오타이드 내지 약 19개의 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, 스페이서는 약 7개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 45개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 60개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 70개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 80개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 90개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 45개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 60개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 70개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 80개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 90개의 뉴클레오타이드 또는 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이를 가질 수 있다.
일부 실시형태에서, RNA 가이드의 스페이서는 일반적으로 7개 내지 50개의 뉴클레오타이드 또는 15개 내지 35개의 뉴클레오타이드(예를 들어, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개 또는 50개의 뉴클레오타이드) 길이를 갖고 특정 표적 서열과 상보적이도록 설계될 수 있다. 일부 실시형태에서, RNA 가이드는 18개 내지 22개의 뉴클레오타이드 길이를 갖도록 설계될 수 있다.
일부 실시형태에서, DNA-결합 서열은 본 명세서에 기재된 바와 같은 표적 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.5%의 서열 동일성을 가지며, 염기-페어링을 통해 표적 서열의 상보적 영역에 결합할 수 있다.
일부 실시형태에서, DNA-결합 서열은 RNA 염기만을 포함한다. 일부 실시형태에서, DNA-결합 서열은 DNA 염기를 포함한다(예를 들어, 스페이서는 적어도 하나의 티민을 포함함). 일부 실시형태에서, DNA-결합 서열은 RNA 염기 및 DNA 염기를 포함한다(예를 들어, DNA-결합 서열은 적어도 하나의 티민 및 적어도 하나의 우라실을 포함함).
일부 경우에, 본 명세서에 개시된 RNA 가이드는 링커 서열, 5' 말단 및/또는 3' 말단 보호 단편(본 명세서의 개시내용 참조) 또는 이들의 조합을 추가로 포함할 수 있다.
본 명세서에 개시된 임의의 RNA 가이드의 스페이서는 표적 서열에 특이적일 수 있으며, 즉, 염기-페어링을 통해 표적 서열의 상보적 영역에 결합할 수 있다. 일부 경우에, 표적 서열은, 예를 들어, 유전자 편집이 필요한 관심 게놈 부위 내에 있을 수 있다.
일부 실시형태에서, 표적 서열은 PAM 서열에 인접해 있다. PAM 서열은 당업계에 공지되어 있다. 일부 실시형태에서, CRISPR 뉴클레이스에 의해 인식될 수 있는 PAM 서열은 각각의 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적을 위해 원용되어 있는 WO2021055874, WO2020206036, WO2020191102, WO2020186213, WO2020028555, WO2020033601, WO2019126762, WO2019126774, WO2019071048, WO2019018423, WO2019005866, WO2018191388, WO2018170333, WO2018035388, WO2018035387, WO2017219027, WO2017189308, WO2017184768, WO2017106657, WO2016205749, WO2017070605, WO2016205764, WO2016205711, WO2016028682, WO2015089473, WO2014093595, WO2015089427, WO2014204725, WO2015070083, WO2014093655, WO2014093694, WO2014093712, WO2014093635, WO2021133829, WO2021007177, WO2020197934, WO2020181102, WO2020181101, WO2020041456, WO2020023529, WO2020005980, WO2019104058, WO2019089820, WO2019089808, WO2019089804, WO2019089796, WO2019036185, WO2018226855, WO2018213351, WO2018089664, WO2018064371, WO2018064352, WO2017106569, WO2017048969, WO2016196655, WO2016106239, WO2016036754, WO2015103153, WO2015089277, WO2014150624, WO2013176772, WO2021119563, WO2021118626, WO2020247883, WO2020247882, WO2020223634, WO2020142754, WO2020086475, WO2020028729, WO2019241452, WO2019173248, WO2018236548, WO2018183403, WO2017027423, WO2018106727, WO2018071672, WO2017096328, WO2017070598, WO2016201155, WO2014150624, WO2013098244, WO2021113522, WO2021050534, WO2021046442, WO2021041569, WO2021007563, WO2020252378, WO2020180699, WO2020018142, WO2019222555, WO2019178428, WO2019178427 또는 WO2019006471에 개시되어 있다.
유전자 편집 시스템이 Cas12i 폴리펩타이드를 포함하는 경우, PAM 서열은 5'-NTTN-3'(또는 5'-TTN-3')를 포함하되, N은 임의의 뉴클레오타이드(예를 들어, A, G, T 또는 C)이다. PAM 서열은 표적 서열의 상류에 있다. 다른 CRISPR 뉴클레이스와 회합된 PAM 서열은 서열 5'-TTY-3' 또는 5'-TTB-3'을 포함할 수 있되, Y는 C 또는 T이고, B는 G, T 또는 C이다. PAM 서열은 표적 서열에 바로 인접할 수 있거나, 예를 들어, 표적 서열의 소수(예를 들어, 1개, 2개, 3개, 4개 또는 5개)의 뉴클레오타이드 내에 있을 수 있다.
아래 표 4 내지 표 6은 당업계에 공지된 예시적인 유형 V CRISPR 뉴클레이스 및 이의 상응하는 뉴클레이스 결합 서열 및 PAM 서열을 제공한다. 이러한 서열을 통해 당업자는 또 다른 유형 V CRISPR 뉴클레이스를 사용하여 본 명세서에 기재된 바와 같은 편집 주형 RNA를 설계할 수 있다.
관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 문헌[Zetsche et al., Cell 163:759-771 (2015)]을 참조한다.
아래 표 6은 당업계에 공지된 추가적인 유형 V CRISPR 뉴클레이스에 대한 정보를 제공한다.
ii. RNA 역전사효소 공여체 또는 RT 공여체 RNA
본 명세서에 개시된 임의의 유전자 편집 시스템의 편집 주형 RNA는 또한 RNA 역전사효소(RT) 공여체(RT 공여체 RNA)를 포함할 수 있다. RT 공여체 RNA는 (i) 프라이머 결합 부위(PBS) 및 (ii) 역전사 주형 서열을 포함할 수 있다. 일부 경우에, RT 공여체 RNA는 (iii) 뉴클레오타이드 링커 서열, (iv) 5' 말단 및/또는 3' 말단 보호 단편(본 명세서의 개시내용 참조) 또는 이들의 조합을 추가로 포함할 수 있다. 일부 실시형태에서, 편집 주형 RNA는 하나 이상의 RT 공여체 RNA를 포함한다. 일부 실시형태에서, 편집 주형 RNA는 하나 이상의 PBS, 하나 이상의 역전사 주형 서열 및/또는 하나 이상의 뉴클레오타이드 링커 서열을 포함한다. 일부 실시형태에서, 제1 편집 주형 RNA는 하나 이상의 PBS를 포함하고, 제2 편집 주형 RNA는 하나 이상의 역전사 주형 서열을 포함한다.
일부 실시형태에서, RT 공여체 RNA는 압타머를 포함한다. 일부 실시형태에서, 압타머는 역전사효소 폴리펩타이드를 동원한다.
프라이머 결합 부위(PBS)
일부 실시형태에서, 본 명세서에 개시된 바와 같은 RT 공여체 RNA의 PBS는 염기-페어링을 통해 DNA 가닥에 결합할 수 있는 RNA 서열이다. DNA 가닥은 CRISPR 뉴클레이스에 의해 닉을 형성할 수 있거나 또는 절단될 수 있다. 일부 실시형태에서, PBS는 염기-페어링을 통해 DNA 가닥(PBS-표적화 부위)에 결합할 수 있는 RNA 서열을 포함한다. DNA 가닥은 자유 3' 자유 말단을 가질 수 있거나 또는 3' 자유 말단은 동일한 유전자 편집 시스템에 포함된 CRISPR 뉴클레이스에 의한 절단을 통해 생성될 수 있다. 일부 예에서, PBS-표적화 부위는 PAM 서열과 동일한 DNA 가닥(PAM 가닥)에 위치할 수 있다. 일부 예에서, PBS-표적화 부위는 PAM 가닥의 상보적 가닥(비-PAM 가닥)에 위치할 수 있다.
일부 실시형태에서, PBS는 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이(예를 들어, 약 3개의 뉴클레오타이드, 5개의 뉴클레오타이드, 8개의 뉴클레오타이드, 10개의 뉴클레오타이드, 13개의 뉴클레오타이드, 15개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드, 100개의 뉴클레오타이드, 110개의 뉴클레오타이드, 120개의 뉴클레오타이드, 130개의 뉴클레오타이드, 140개의 뉴클레오타이드, 150개의 뉴클레오타이드, 160개의 뉴클레오타이드, 170개의 뉴클레오타이드, 180개의 뉴클레오타이드, 190개의 뉴클레오타이드, 200개의 뉴클레오타이드 또는 그 사이의 임의의 길이)이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이(예를 들어, 약 3개의 뉴클레오타이드, 5개의 뉴클레오타이드, 8개의 뉴클레오타이드, 10개의 뉴클레오타이드, 13개의 뉴클레오타이드, 15개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드 또는 100개의 뉴클레오타이드 또는 그 사이의 임의의 길이)이다.
일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 15개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 11개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 12개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 13개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 14개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 30개의 뉴클레오타이드 길이이다.
Cas12i 폴리펩타이드(예를 들어, 본 명세서에 개시된 것과 같은 Cas12i2 폴리펩타이드)를 포함하는 유전자 편집 시스템에서, RT 공여체 RNA의 PBS는 비-PAM 가닥의 영역(PBS-표적화 부위)에 결합할 수 있다. 일부 경우에, PBS-표적화 부위는 표적 서열의 상보적 영역의 상류에 위치할 수 있다. 예를 들어, PBS-표적화 부위는 상보적 영역의 상류에 있는 최대 20개의 뉴클레오타이드, 예를 들어, 최대 15개의 뉴클레오타이드, 최대 10개의 뉴클레오타이드 또는 최대 5개의 뉴클레오타이드일 수 있다. 특정 예에서, PBS-표적화 부위는 상보적 영역의 상류에 있는 약 3개의 뉴클레오타이드 내지 약 10개의 뉴클레오타이드일 수 있다. 특정 예에서, PBS-표적화 부위는 상보적 영역의 상류에 있는 1개의 뉴클레오타이드, 1개 내지 2개의 뉴클레오타이드, 1개 내지 3개의 뉴클레오타이드, 1개 내지 4개의 뉴클레오타이드, 1개 내지 5개의 뉴클레오타이드, 1개 내지 6개의 뉴클레오타이드, 1개 내지 7개의 뉴클레오타이드, 1개 내지 8개의 뉴클레오타이드, 1개 내지 9개의 뉴클레오타이드, 1개 내지 10개의 뉴클레오타이드, 2개 내지 3개의 뉴클레오타이드, 2개 내지 4개의 뉴클레오타이드, 2개 내지 5개의 뉴클레오타이드, 2개 내지 6개의 뉴클레오타이드, 2개 내지 7개의 뉴클레오타이드, 2개 내지 8개의 뉴클레오타이드, 2개 내지 9개의 뉴클레오타이드, 2개 내지 10개의 뉴클레오타이드, 3개 내지 4개의 뉴클레오타이드, 3개 내지 5개의 뉴클레오타이드, 3개 내지 6개의 뉴클레오타이드, 3개 내지 7개의 뉴클레오타이드, 3개 내지 8개의 뉴클레오타이드, 3개 내지 9개의 뉴클레오타이드, 3개 내지 10개의 뉴클레오타이드, 4개 내지 5개의 뉴클레오타이드, 4개 내지 6개의 뉴클레오타이드, 4개 내지 7개의 뉴클레오타이드, 4개 내지 8개의 뉴클레오타이드, 4개 내지 9개의 뉴클레오타이드, 4개 내지 10개의 뉴클레오타이드, 5개 내지 6개의 뉴클레오타이드, 5개 내지 7개의 뉴클레오타이드, 5개 내지 8개의 뉴클레오타이드, 5개 내지 9개의 뉴클레오타이드, 5개 내지 10개의 뉴클레오타이드, 6개 내지 7개의 뉴클레오타이드, 6개 내지 8개의 뉴클레오타이드, 6개 내지 9개의 뉴클레오타이드, 6개 내지 10개의 뉴클레오타이드, 7개 내지 8개의 뉴클레오타이드, 7개 내지 9개의 뉴클레오타이드, 7개 내지 10개의 뉴클레오타이드, 8개 내지 9개의 뉴클레오타이드, 8개 내지 10개의 뉴클레오타이드, 9개 내지 10개의 뉴클레오타이드 또는 10개의 뉴클레오타이드일 수 있다. 다른 경우에, PBS-표적화 부위는 상보적 영역과 중첩될 수 있다. 자유 3' 말단이 표적 서열 및 상보적 영역 내 또는 그 근처의 유전자 편집 시스템에서 Cas12i 폴리펩타이드에 의해 생성될 때, 상보적 영역의 상류 또는 이와 중첩되는 부위에서 비-PAM 가닥에 대한 PBS 결합은 비-PAM 가닥에서 생성된 자유 3' 말단에서 시작하여 유전자 편집 시스템에서 RT 폴리펩타이드에 의해 DNA 합성을 효율적으로 촉진할 수 있다. 예시적인 예시는 도 12a 도 12b에 제공되어 있다.
역전사 주형 서열
역전사 주형 서열(주형 서열)은 본 명세서에 개시된 유전자 편집 시스템에서 RT 폴리펩타이드에 의해 매개되는 역전사를 위한 주형 역할을 한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 하나의 암호화된 편집을 갖는 서열을 포함한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 하나의 암호화된 편집을 갖는 이의 상보적 영역에 대한 서열 상동성을 포함한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드, 100개의 뉴클레오타이드, 110개의 뉴클레오타이드 또는 120개의 뉴클레오타이드 길이 또는 그 사이의 임의의 길이이다.
일부 실시형태에서, 역전사 주형 서열은 약 25개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 26개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 27개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 28개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 29개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 30개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 31개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 32개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 33개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 34개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 35개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 36개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 37개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 38개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 39개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 40개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 41개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 42개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 43개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 44개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 45개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 46개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 47개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 48개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 49개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 50개의 뉴클레오타이드이다.
일부 실시형태에서, 역전사 주형 서열은 표적 서열에 대해 적어도 하나의 암호화된 편집을 포함한다. 다른 실시형태에서, 역전사 주형 서열은 표적 서열의 상보적 영역에 대해 적어도 하나의 암호화된 편집을 포함한다. 일부 실시형태에서, 적어도 하나의 암호화된 편집은 적어도 하나의 치환, 삽입 및/또는 결실을 포함한다. 일부 실시형태에서, 표적 서열의 편집은 표적 서열의 서열에 대한 치환, 삽입 및/또는 결실을 포함한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 하나의 LoxP 부위를 포함한다.
일부 실시형태에서, 편집은 G에서 T로의 치환, G에서 A로의 치환, G에서 C로의 치환, T에서 G로의 치환, T에서 A로의 치환, T에서 C로의 치환, C에서 G로의 치환, C에서 T로의 치환, C에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환 또는 A에서 C로의 치환과 같은 단일 또는 다중-뉴클레오타이드 치환일 수 있다. 일부 실시형태에서, 서열의 변화는 G:C 염기쌍을 T:A 염기쌍으로, G:C 염기쌍을 A:T 염기쌍으로, G:C 염기쌍을 C:G 염기쌍으로, T:A 염기쌍을 G:C 염기쌍으로, T:A 염기쌍을 A:T 염기쌍으로, T:A 염기쌍을 C:G 염기쌍으로, C:G 염기쌍을 G:C 염기쌍으로, C:G 염기쌍을 T:A 염기쌍으로, C:G 염기쌍을 A:T 염기쌍으로, A:T 염기쌍을 T:A 염기쌍으로, A:T 염기쌍을 G:C 염기쌍으로 또는 A:T 염기쌍을 C:G 염기쌍으로 전환할 수 있다.
일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 치환은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, 치환은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환은 최대 약 10,000개의 염기(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 치환은 1개의 염기, 약 10개의 염기, 약 20개의 염기, 약 30개의 염기, 약 40개의 염기, 약 50개의 염기, 약 60개의 염기, 약 70개의 염기, 약 80개의 염기, 약 90개의 염기, 약 100개의 염기, 약 200개의 염기, 약 300개의 염기, 약 400개의 염기, 약 500개의 염기, 약 600개의 염기, 약 700개의 염기, 약 800개의 염기, 약 900개의 염기, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 편집은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이인 단일 또는 다중-뉴클레오타이드 삽입을 포함한다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 삽입은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 삽입은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 삽입은 최대 약 10,000개의 염기(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 삽입은 1개의 염기, 약 10개의 염기, 약 20개의 염기, 약 30개의 염기, 약 40개의 염기, 약 50개의 염기, 약 60개의 염기, 약 70개의 염기, 약 80개의 염기, 약 90개의 염기, 약 100개의 염기, 약 200개의 염기, 약 300개의 염기, 약 400개의 염기, 약 500개의 염기, 약 600개의 염기, 약 700개의 염기, 약 800개의 염기, 약 900개의 염기, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 편집은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이인 단일 또는 다중-뉴클레오타이드 결실을 포함한다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 결실은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 결실은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 결실은 최대 약 10,000개의 염기(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 결실은 1개의 염기, 약 10개의 염기, 약 20개의 염기, 약 30개의 염기, 약 40개의 염기, 약 50개의 염기, 약 60개의 염기, 약 70개의 염기, 약 80개의 염기, 약 90개의 염기, 약 100개의 염기, 약 200개의 염기, 약 300개의 염기, 약 400개의 염기, 약 500개의 염기, 약 600개의 염기, 약 700개의 염기, 약 800개의 염기, 약 900개의 염기, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 역전사 주형 서열은 약 5개의 뉴클레오타이드 내지 약 10,000개의 뉴클레오타이드 길이, 예를 들어, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 또는 약 1킬로베이스(kb), 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이인 적어도 하나의 암호화된 편집을 포함한다.
역전사 주형 서열은 본 명세서에 기재된 유전자 편집 시스템의 역전사효소에 의해 DNA로 전사될 수 있다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, 비-PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, 비-PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 5'이다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 3'이다. 일부 실시형태에서, 역전사 주형 서열은 PBS로부터 3' 연장을 통해 PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은 PBS로부터 3' 연장을 통해 비-PAM 가닥의 DNA로 전사된다.
iii. 추가적인 요소
일부 실시형태에서, 편집 주형 RNA는 하나 이상의 추가적인 요소를 포함할 수 있다. 예를 들어, 편집 주형 RNA 또는 gRNA 및/또는 이의 RT 공여체 RNA는 RNA 분자의 한쪽 말단 또는 양쪽 말단에 하나 이상의 보호 단편을 포함할 수 있다. 대안적으로 또는 이에 더하여, 편집 주형 RNA 또는 gRNA 및/또는 이의 RT 공여체 RNA는 RNA 분자 내부(예를 들어, 편집 주형 RNA의 서열 중 하나 이상 사이, 예를 들어, PBS와 역전사 주형 서열, 예를 들어, 링커 사이)에 추가적인 요소를 포함할 수 있다. 일부 실시형태에서, 편집 주형 RNA는, 예를 들어, RNA 가이드(뉴클레이스 결합 서열 또는 DNA-결합 서열) 또는 RT 공여체 RNA(PBS 또는 역전사 주형 서열)와 같은 편집 주형 RNA의 하나 이상의 서열 사이에 추가적인 요소를 포함한다.
일부 실시형태에서, 편집 주형 RNA는 추가적인 요소, 예를 들어, 하나 이상의 말단에 직접 반복 서열을 포함한다. 일부 실시형태에서, 직접 반복 서열은 CRISPR 뉴클레이스(예를 들어, 유형 V 뉴클레이스, 예컨대, 변이형 Cas12i2 폴리펩타이드, 또는 변이형 Cas12i2-역전사효소 융합 폴리펩타이드 또는 Cas12i4-역전사효소 융합 폴리펩타이드)를 동원할 수 있다.
일부 실시형태에서, 추가적인 요소 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이일 수 있다.
일부 예에서, 편집 주형 RNA는 선택적 뉴클레오타이드 링커를 포함할 수 있다. 이러한 선택적 뉴클레오타이드 링커 서열은 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이일 수 있다. 일부 실시형태에서, 선택적 뉴클레오타이드 링커는 임의의 뉴클레이스 결합 서열, DNA-결합 서열, PBS 및/또는 역전사 주형 서열 사이에 있다.
일부 예에서, 편집 주형 RNA 또는 gRNA 및/또는 이의 RT 공여체 RNA의 5' 말단 및/또는 3' 말단은 엑소뉴클레이스 활성에 대한 RNA 분자의 저항성을 향상시킬 수 있는 보호 단편을 포함할 수 있다. 예를 들어, 도 11을 참조한다. 일부 경우에, 말단 보호 단편은 헤어핀, 슈도노트 또는 삼중 구조와 같은 2차 구조를 형성할 수 있는 뉴클레오타이드 서열을 포함할 수 있다. 다른 경우에, 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA의 서열을 포함할 수 있다. 일부 실시형태에서, 변형은 지카-유사(Zika-like) 슈도노트, 뮤린 백혈병 바이러스 슈도노트(MLV-PK) 서열, 레드 클로버 괴사 모자이크 바이러스(red clover necrotic mosaic virus: RCNMV) 서열, 스위트 클로버 괴사 모자이크 바이러스(sweet clover necrotic mosaic virus: SCNMV) 서열, 카네이션 링스팟 바이러스(carnation ringspot virus: CRSV) 서열, preQ 서열 또는 RNA 박테리오파지 MS2 서열이다. 특정 예에서, 말단 보호 단편은 하나 이상의 CRISPR 뉴클레이스 결합 부위(예를 들어, Cas12i2 폴리펩타이드와 같은 Cas12i 폴리펩타이드에 대한 결합 부위) 및 선택적으로 임의의 인간 서열과 상동성을 공유하지 않는 하나 이상의 분절(예를 들어, 스페이서)을 포함할 수 있다. 일부 경우에, 하나 이상의 분절은 인간 게놈의 임의의 서열과 85% 이하로 동일한 서열에 결합한다. 도 10, 도 11, 도 12a 도 12b를 참조한다. 이러한 말단 보호 단편은 표적외 유전자 편집을 유도하지 않고 엑소리보뉴클레이스 활성을 저해하기 위해 동일한 유전자 편집 시스템에 포함된 CRISPR 뉴클레이스를 동원할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 적어도 하나의 편집 주형 RNA(예를 들어, 유전자 편집 RNA) 또는 이를 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 예에서, 적어도 하나의 편집 주형 RNA는 CRISPR 뉴클레이스(예를 들어, 유형 V CRISPR 뉴클레이스)에 결합할 수 있다. 일부 예에서, 적어도 하나의 편집 주형 RNA는 핵산(예를 들어, DNA 또는 표적 핵산)에 추가로 결합할 수 있다. 일부 예에서, 적어도 하나의 편집 주형 RNA는 뉴클레이스 결합 서열(예를 들어, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위) 및 DNA-결합 서열(예를 들어, 스페이서)을 포함한다. 일부 경우에, 적어도 하나의 편집 주형 RNA는 gRNA(뉴클레이스 결합 서열 및 스페이서 포함) 및 RT 공여체 RNA를 포함한다. 일부 실시형태에서, 편집 주형 RNA는 RT 공여체 RNA에 연결된 RNA 가이드를 포함한다. 예를 들어, 도 19b를 참조한다.
iv. 핵산의 변형
본 명세서에 개시된 바와 같은 유전자 편집 시스템의 임의의 RNA 구성요소, 예를 들어, 편집 주형 RNA, RNA 가이드, RT 공여체 RNA는 하나 이상의 변형을 포함할 수 있다.
예시적인 변형은 당, 핵염기, 뉴클레오사이드간 연결(예를 들어, 연결 포스페이트/포스포다이에스터 연결/포스포다이에스터 백본) 및 이들의 임의의 조합에 대한 임의의 변형을 포함할 수 있다. 본 명세서에 제공된 예시적인 변형 중 일부는 아래에 자세히 설명되어 있다.
RNA 가이드 또는 조성물의 구성요소를 암호화하는 임의의 핵산 서열은 당, 핵염기 또는 뉴클레오사이드간 연결(예를 들어, 연결 포스페이트/포스포다이에스터 연결/포스포다이에스터 백본)과 같은 임의의 유용한 변형을 포함할 수 있다. 피리미딘 핵염기의 하나 이상의 원자는 선택적으로 치환된 아미노, 선택적으로 치환된 티올, 선택적으로 치환된 알킬(예를 들어, 메틸 또는 에틸) 또는 할로(예를 들어, 클로로 또는 플루오로)로 대체되거나 또는 치환될 수 있다. 소정의 실시형태에서, 변형(예를 들어, 하나 이상의 변형)은 당 및 뉴클레오사이드간 연결 각각에 존재한다. 변형은 리보핵산(RNA)의 데옥시리보핵산(DNA), 트레오스 핵산(threose nucleic acid: TNA), 글리콜 핵산(glycol nucleic acid: GNA), 펩타이드 핵산(peptide nucleic acid: PNA), 잠금 핵산(locked nucleic acid: LNA) 또는 이의 하이브리드로의 변형일 수 있다. 추가적인 변형은 본 명세서에 기재되어 있다.
일부 실시형태에서, 변형은 화학적 또는 세포 유도성 변형을 포함할 수 있다. 예를 들어, 세포내 RNA 변형의 일부 비제한적인 예는 문헌[Lewis and Pan in "RNA modifications and structures cooperate to guide RNA-protein interactions" from Nat Reviews Mol Cell Biol, 2017, 18:202-210]에 기술되어 있다.
다양한 당 변형, 뉴클레오타이드 변형 및/또는 뉴클레오사이드간 연결(예를 들어, 백본 구조)이 서열의 다양한 위치에 존재할 수 있다. 당업자는 뉴클레오타이드 유사체 또는 다른 변형(들)이 서열의 기능이 실질적으로 감소되지 않는 서열의 임의의 위치(들)에 위치할 수 있다는 것을 이해할 것이다. 서열은 (전체 뉴클레오타이드 함량과 관련하여 또는 하나 이상의 유형의 뉴클레오타이드, 즉, A, G, U 또는 C 중 임의의 하나 이상과 관련하여) 약 1% 내지 약 100% 또는 임의의 그 사이에 있는 백분율(예를 들어, 1% 내지 20%, 1% 내지 25%, 1% 내지 50%, 1% 내지 60%, 1% 내지 70%, 1% 내지 80%, 1% 내지 90%, 1% 내지 95%, 10% 내지 20%, 10% 내지 25%, 10% 내지 50%, 10% 내지 60%, 10% 내지 70%, 10% 내지 80%, 10% 내지 90%, 10% 내지 95%, 10% 내지 100%, 20% 내지 25%, 20% 내지 50%, 20% 내지 60%, 20% 내지 70%, 20% 내지 80%, 20% 내지 90%, 20% 내지 95%, 20% 내지 100%, 50% 내지 60%, 50% 내지 70%, 50% 내지 80%, 50% 내지 90%, 50% 내지 95%, 50% 내지 100%, 70% 내지 80%, 70% 내지 90%, 70% 내지 95%, 70% 내지 100%, 80% 내지 90%, 80% 내지 95%, 80% 내지 100%, 90% 내지 95%, 90% 내지 100% 및 95% 내지 100%)만큼 변형된 뉴클레오타이드를 포함할 수 있다.
일부 실시형태에서, 서열의 하나 이상의 리보뉴클레오타이드에서 당 변형(예를 들어, 2' 위치 또는 4' 위치에) 또는 당의 대체는 백본 변형뿐만 아니라 포스포다이에스터 연결의 변형 또는 대체를 포함할 수 있다. 서열의 특정 예는 변형된 백본을 포함하거나 또는 포스포다이에스터 연결의 변형 또는 대체를 포함하는 뉴클레오사이드간 변형과 같은 천연 뉴클레오사이드간 연결이 없는 서열을 포함하지만 이에 제한되지 않는다. 변형된 백본을 갖는 서열은 특히 백본에 인 원자가 없는 서열을 포함한다. 본 출원의 목적을 위해 그리고 때때로 당업계에서 언급되는 바와 같이, 뉴클레오사이드간 백본에 인 원자를 갖지 않는 변형된 RNA도 올리고뉴클레오사이드로 간주될 수 있다. 특정 실시형태에서, 서열은 뉴클레오사이드간 백본에 인 원자를 갖는 리보뉴클레오타이드를 포함할 것이다.
변형된 서열 백본은, 예를 들어, 포스포로티오에이트, 카이랄 포스포로티오에이트, 포스포로다이티오에이트, 포스포트라이에스터, 아미노알킬포스포트라이에스터, 메틸 및 다른 알킬 포스포네이트, 예컨대, 3'-알킬렌 포스포네이트 및 카이랄 포스포네이트, 포스피네이트, 포스포라미데이트, 예컨대, 3'-아미노 포스포라미데이트 및 아미노알킬포스포라미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트라이에스터 및 정상적인 3'-5' 연결을 갖는 보라노포스페이트, 이들의 2'-5' 연결된 유사체 및 뉴클레오사이드 단위의 인접한 쌍이 3'-5'에서 5'-3' 또는 2'-5'에서 5'-2'로 연결된 역전된 반전된 극성(inverted polarity)을 갖는 것들을 포함할 수 있다. 다양한 염, 혼합염 및 유리산 형태도 포함된다. 일부 실시형태에서, 서열은 음으로 또는 양으로 하전될 수 있다.
서열에 혼입될 수 있는 변형된 뉴클레오타이드는 뉴클레오사이드간 연결(예를 들어, 포스페이트 백본)에서 변형될 수 있다. 본 명세서에서, 폴리뉴클레오타이드 백본의 맥락에서, 어구 "포스페이트" 및 "포스포다이에스터"는 상호교환적으로 사용된다. 백본 포스페이트기는 하나 이상의 산소 원자를 다른 치환기로 대체함으로써 변형될 수 있다. 또한, 변형된 뉴클레오사이드 및 뉴클레오타이드는 본 명세서에 기재된 바와 같이 변형되지 않은 포스페이트 모이어티를 또 다른 뉴클레오사이드간 연결로 대체하는 것을 포함할 수 있다. 변형된 포스페이트기의 예는 포스포로티오에이트, 포스포로셀레네이트, 보라노포스페이트, 보라노포스페이트 에스터, 하이드로겐 포스포네이트, 포스포라미데이트, 포스포로다이아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트라이에스터를 포함하지만 이에 제한되지 않는다. 포스포로다이티오에이트는 비연결 산소가 모두 황으로 대체되어 있다. 포스페이트 링커는 또한 연결 산소를 질소(브리지된 포스포라미데이트), 황(브리지된 포스포로티오에이트) 및 탄소(브리지된 메틸렌-포스포네이트)로 대체하여 변형될 수 있다.
α-티오 치환된 포스페이트 모이어티는 비천연 포스포로티오에이트 백본 연결을 통해 RNA 및 DNA 중합체에 안정성을 부여하기 위해 제공된다. 포스포로티오에이트 DNA 및 RNA는 뉴클레이스 저항성이 증가하고 이후에 세포 환경에서 반감기가 길어진다.
특정 실시형태에서, 변형된 뉴클레오사이드는 알파-티오-뉴클레오사이드(예를 들어, 5'-O-(1-티오포스페이트)-아데노신, 5'-O-(1-티오포스페이트)-사이티딘(a-티오-사이티딘), 5'-O-(1-티오포스페이트)-구아노신, 5'-O-(1-티오포스페이트)-우리딘 또는 5'-O-(1-티오포스페이트)-슈도우리딘)을 포함한다.
인 원자를 포함하지 않는 뉴클레오사이드간 연결을 포함하여 본 발명에 따라 사용될 수 있는 다른 뉴클레오사이드간 연결이 본 명세서에 기재되어 있다.
일부 실시형태에서, 서열은 하나 이상의 세포독성 뉴클레오사이드를 포함할 수 있다. 예를 들어, 세포독성 뉴클레오사이드는 이작용성 변형과 같이 서열에 혼입될 수 있다. 세포독성 뉴클레오사이드는 아데노신 아라비노사이드, 5-아자사이티딘, 4'-티오-아라사이티딘, 사이클로펜텐일사이토신, 클라드리빈, 클로파라빈, 시타라빈, 사이토신 아라비노사이드, 1-(2-C-사이아노-2-데옥시-베타-D-아라비노-펜토퓨라노실)-사이토신, 데시타빈, 5-플루오로우라실, 플루다라빈, 플록스우리딘, 젬시타빈, 테가푸르와 우라실의 조합, 테가푸르((RS)-5-플루오로-1-(테트라하이드로퓨란-2-일)피리미딘-2,4(1H,3H)-다이온), 트록사시타빈, 테자시타빈, 2'-데옥시-2'-메틸리덴사이티딘(DMDC) 및 6-머캅토퓨린을 포함할 수 있지만 이에 제한되지 않는다. 추가적인 예는 플루다라빈 포스페이트, N4-베헤노일-1-베타-D-아라비노퓨라노실사이토신, N4-옥타데실-1-베타-D-아라비노퓨라노실사이토신, N4-팔미토일-1-(2-C-사이아노-2-데옥시-베타-D-아라비노-펜토퓨라노실) 사이토신 및 P-4055(시타라빈 5'-엘라이드산 에스터)를 포함한다.
일부 실시형태에서, 서열은 하나 이상의 전사 후 변형(예를 들어, 캐핑, 절단, 폴리아데닐화, 스플라이싱, 폴리-A 서열, 메틸화, 아실화, 인산화, 라이신 및 아르기닌 잔기의 메틸화, 티올기 및 타이로신 잔기의 아세틸화 및 나이트로실화 등)을 포함한다. 하나 이상의 전사 후 변형은 RNA에서 확인된 임의의 100개 이상의 다양한 뉴클레오사이드 변형과 같은 임의의 전사 후 변형일 수 있다(Rozenski, J, Crain, P, and McCloskey, J. (1999). The RNA Modification Database: 1999 update. Nucl Acids Res 27: 196-197). 일부 실시형태에서, 첫 번째 단리된 핵산은 메신저 RNA(mRNA)를 포함한다. 일부 실시형태에서, mRNA는 피리딘-4-온 리보뉴클레오사이드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카복시메틸-우리딘, 1-카복시메틸-슈도우리딘, 5-프로핀일-우리딘, 1-프로핀일-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 다이하이드로우리딘, 다이하이드로슈도우리딘, 2-티오-다이하이드로우리딘, 2-티오-다이하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘 및 4-메톡시-2-티오-슈도우리딘으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다. 일부 실시형태에서, mRNA는 5-아자-사이티딘, 슈도아이소사이티딘, 3-메틸-사이티딘, N4-아세틸사이티딘, 5-폼일사이티딘, N4-메틸사이티딘, 5-하이드록시메틸사이티딘, 1-메틸-슈도아이소사이티딘, 피롤로-사이티딘, 피롤로-슈도아이소사이티딘, 2-티오-사이티딘, 2-티오-5-메틸-사이티딘, 4-티오-슈도아이소사이티딘, 4-티오-1-메틸-슈도아이소사이티딘, 4-티오-1-메틸-1-데아자-슈도아이소사이티딘, 1-메틸-1-데아자-슈도아이소사이티딘, 제불라린, 5-아자-제불라린, 5-메틸-제불라린, 5-아자-2-티오-제불라린, 2-티오-제불라린, 2-메톡시-사이티딘, 2-메톡시-5-메틸-사이티딘, 4-메톡시-슈도아이소사이티딘 및 4-메톡시-1-메틸-슈도아이소사이티딘으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다. 일부 실시형태에서, mRNA는 2-아미노퓨린, 2, 6-다이아미노퓨린, 7-데아자-아데닌, 7-데아자-8-아자-아데닌, 7-데아자-2-아미노퓨린, 7-데아자-8-아자-2-아미노퓨린, 7-데아자-2,6-다이아미노퓨린, 7-데아자-8-아자-2,6-다이아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-아이소펜텐일아데노신, N6-(시스-하이드록시아이소펜텐일)아데노신, 2-메틸티오-N6-(시스-하이드록시아이소펜텐일) 아데노신, N6-글리신일카바모일아데노신, N6-트레오닐카바모일아데노신, 2-메틸티오-N6-트레오닐 카바모일아데노신, N6,N6-다이메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌 및 2-메톡시-아데닌으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다. 일부 실시형태에서, mRNA는 이노신, 1-메틸-이노신, 와이오신, 와이뷰토신, 7-데아자-구아노신, 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-다이메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신 및 N2,N2-다이메틸-6-티오-구아노신으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다.
서열은 분자의 전체 길이에 따라 균일하게 변형될 수 있거나 또는 변형되지 않을 수 있다. 예를 들어, 하나 이상 또는 모든 유형의 뉴클레오타이드(예를 들어, 자연 발생적 뉴클레오타이드, 퓨린 또는 피리미딘, 또는 A, G, U, C, I, pU 중 임의의 하나 이상 또는 모두)는 서열 또는 이의 주어진 미리 결정된 서열 영역에서 균일하게 변형될 수 있거나 또는 변형되지 않을 수 있다. 일부 실시형태에서, 서열은 슈도우리딘을 포함한다. 일부 실시형태에서, 서열은 서열을 바이러스 RNA에 비해 내인성으로 특성화하는 면역계에 도움이 될 수 있는 이노신을 포함한다. 이노신의 혼입은 또한 개선된 RNA 안정성/감소된 분해를 매개할 수 있다. 예를 들어, 전체가 참조에 의해 원용되어 있는 문헌[Yu, Z. et al. (2015) RNA editing by ADAR1 marks dsRNA as "self". Cell Res. 25, 1283-1284]을 참조한다.
일부 실시형태에서, 편집 주형 RNA와 같은 본 명세서에 기재된 임의의 RNA 서열은 말단 변형(예를 들어, 5' 말단 변형 또는 3' 말단 변형)을 포함할 수 있다. 일부 실시형태에서, 말단 변형은 화학적 변형이다. 일부 실시형태에서, 말단 변형은 구조적 변형이다. 본 개시내용을 참조한다.
본 명세서에 개시된 유전자 편집 시스템이 CRISPR 뉴클레이스 및/또는 RT 폴리펩타이드를 암호화하는 핵산을 포함하는 경우, 이러한 핵산 분자는 적용 가능한 경우 본 명세서에 개시된 임의의 변형을 포함할 수 있다.
D. 예시적인 유전자 편집 시스템
본 명세서에 기재된 예시적인 유전자 편집 시스템은 단지 예시를 위한 것이다.
일부 실시형태에서, 예시적인 유전자 편집 시스템은 도 1a 도 1b에 도시되어 있다. 이러한 예시적인 설계에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함), 본 명세서에 개시된 임의의 추가적인 요소 또는 이들의 조합을 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 일부 경우에, PBS는 약 3개 내지 약 24개의 뉴클레오타이드(예를 들어, 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개 또는 24개의 뉴클레오타이드) 길이이다. 대안적으로 또는 이에 더하여, PBS는 PAM 가닥에 위치할 수 있는 상응하는 PBS-표적화 부위와 적어도 약 75%의 상보성을 가질 수 있다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드(예를 들어, 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개의 뉴클레오타이드) 길이이다. 일부 실시형태에서, 링커는 RNA 가이드의 DNA-결합 서열(스페이서)과 역전사 주형 서열 사이에 존재한다. 일부 예에서, 링커는 하나 이상의 헤어핀을 포함한다. 예를 들어, 헤어핀은 PBS와 DNA-결합 서열 사이의 어닐링을 감소시킬 수 있다.
일부 경우에, 예시적인 유전자 편집 시스템의 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 N-말단 또는 C-말단 융합 파트너를 포함할 수 있다. 일부 실시형태에서, N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함한다.
다른 실시형태에서, 본 명세서에 개시된 바와 같은 예시적인 유전자 편집 시스템은 도 2에 도시되어 있다. 이러한 예시적인 설계에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함), 추가적인 요소 중 하나 이상 또는 이들의 조합을 포함할 수 있는 5' 융합 파트너를 포함할 수 있다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드(예를 들어, 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개의 뉴클레오타이드) 길이이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 24개의 뉴클레오타이드(예를 들어, 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개 또는 24개의 뉴클레오타이드) 길이이다. 대안적으로 또는 이에 더하여, PBS는 PAM 가닥에 위치할 수 있는 상응하는 PBS-표적화 부위와 적어도 약 75%의 상보성을 갖는다. 일부 실시형태에서, 링커는 RNA 가이드의 DNA-결합 서열과 PBS 사이에 존재한다. 일부 예에서, 링커는 하나 이상의 헤어핀을 포함한다. 예를 들어, 헤어핀은 PBS와 DNA-결합 서열 사이의 어닐링을 감소시킬 수 있다.
일부 경우에, 예시적인 유전자 편집 시스템의 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 N-말단 또는 C-말단 융합 파트너를 포함할 수 있다. 일부 실시형태에서, N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함한다.
도 1a, 도 1b 도 2에 도시되어 있는 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 PAM-가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 도 1a, 도 1b 도 2의 이러한 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 절단 동안, PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 사용하여 연장되고, 상보적 게놈 가닥과의 염기-페어링으로 가닥을 다시 교환하여 편집을 혼입시킬 수 있다.
또 다른 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 3에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템은 2개의 RNA 분자: 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함하는 RNA 가이드 및 RT 공여체 RNA를 포함한다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함할 수 있다. 일부 예에서, 역전사 주형 서열은 편집을 암호화하지 않는다. 다른 예에서, RT 공여체 RNA는 PBS 및 편집을 암호화하는 역전사 주형 서열을 포함한다. 일부 실시형태에서, 역전사 주형 서열 또는 이의 일부는 염기 페어링을 통해 표적 핵산에 결합할 수 있다.
일부 경우에, PBS는 최대 약 100개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이이다. 일부 실시형태에서, RT 공여체 RNA의 역전사 주형 서열은 5' 말단에 압타머를 포함한다. 일부 실시형태에서, 압타머는 역전사효소 폴리펩타이드를 동원한다. 일부 실시형태에서, RT 공여체 RNA의 PBS는 편집 주형 RNA의 임의의 다른 부분(예를 들어, 뉴클레이스 결합 서열 및/또는 DNA-결합 서열)에 상보적이지 않다.
도 3에 도시된 예시적인 유전자 편집 시스템은 1개 또는 2개의 단백질 구성요소를 포함할 수 있다. 예를 들어, 예시적인 유전자 편집 시스템은 역전사효소 폴리펩타이드를 포함할 수 있는 N-말단 또는 C-말단 융합 파트너를 갖는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소 폴리펩타이드를 2개의 개별 폴리펩타이드로서 포함할 수 있다.
도 3에 도시된 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 PAM 가닥 또는 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 이러한 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)가 표적 핵산으로부터 방출된 후, PAM 가닥 또는 비-PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 사용하여 연장되고, 상보적 게놈 가닥과의 혼성화로 가닥이 다시 교환되어 RT 공여체 RNA로부터 편집을 혼입시킬 수 있다. 예시적인 유전자 편집 시스템은 표적 핵산의 PAM 원위 영역을 편집하는 데 사용될 수 있다.
또 다른 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 4에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템은 2개의 RNA 분자: RNA 가이드 및 RT 공여체 RNA를 2개의 개별 RNA 분자로 포함할 수 있다. 예시적인 유전자 편집 시스템은 본 명세서에 개시된 바와 같은 1개 또는 2개의 단백질 구성요소를 포함할 수 있다. 예를 들어, 예시적인 유전자 편집 시스템은 역전사효소 폴리펩타이드를 포함할 수 있는 N-말단 또는 C-말단 융합 파트너를 갖는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 대안적으로, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소 폴리펩타이드는 서로 융합되지 않는다(2개의 별도의 폴리펩타이드임).
도 4에 도시된 예시적인 유전자 편집 시스템은 PAM 가닥 또는 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 예시적인 유전자 편집 시스템을 사용하면, PAM 가닥 또는 비-PAM 가닥의 자유 3' 말단은 동일한 유전자 편집 시스템에서 RT 공여체 RNA의 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 사용하여 연장되고, 상보적 게놈 가닥과의 혼성화로 가닥이 다시 교환되어 RT 공여체 RNA로부터 편집을 혼입시킬 수 있다.
일부 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 5에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(역전사 주형 서열 및 PBS 포함)를 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 일부 경우에, PBS는 표적 서열의 상보적 영역의 상류에 있는 비-PAM 가닥의 부위에 결합한다.
일부 예에서, PBS는 약 3개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드(예를 들어, 약 3개, 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개의 뉴클레오타이드) 길이이다. 일부 실시형태에서, DNA-결합 서열(스페이서)은 약 20개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DNA-결합 서열은 PAM 서열로부터 약 10개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드가 혼입된 적어도 하나의 편집을 포함한다.
일부 예에서, 예시적인 유전자 편집 시스템은 5' 융합 또는 3' 융합 파트너를 포함하는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 5' 융합 또는 3' 융합 파트너는 역전사효소 폴리펩타이드를 포함할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 crRNA 처리 활성이 결여되어 있다.
도 5에 도시된 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 이러한 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 절단 동안, 비-PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, DNA-결합 서열을 주형으로 사용하여 연장될 수 있다. 비-PAM 가닥의 RT 연장은 상보적 게놈 가닥과의 염기-페어링으로 다시 교환되어 RT 공여체 RNA로부터 편집을 혼입시킨다.
일부 실시형태에서, 예시적인 유전자 편집 시스템은 도 6a 도 6b에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(역전사 주형 서열 및 PBS 포함)를 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 일부 실시형태에서, PBS는 PAM 가닥의 표적 서열의 상보적 영역의 상류에 있는 비-PAM 가닥의 영역에 상보적이다. 일부 예에서, 헤어핀은 RNA 가이드의 DNA-결합 서열과 역전사 주형 서열 사이에 존재한다. 일부 실시형태에서, 헤어핀은 역전사 주형 서열 내에 존재한다. 일부 실시형태에서, 주형 서열 내 편집은 편집이 혼입되는 표적 핵산에 헤어핀을 생성할 수 있다.
일부 예에서, 예시적인 유전자 편집 시스템은 N-말단 또는 C-말단 융합 파트너를 포함하는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함할 수 있다.
일부 실시형태에서, 예시적인 유전자 편집 시스템은 도 7에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함)를 포함할 수 있는 5' 융합 파트너를 포함할 수 있다. 일부 실시형태에서, PBS는 약 5개 내지 약 20개의 뉴클레오타이드(예를 들어, 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드) 길이이다. 대안적으로 또는 이에 더하여, PBS는 비-PAM 가닥의 영역(상응하는 PBS-표적화 부위)과 적어도 약 75%의 상보성을 갖는다. 일부 경우에, 링커는 RNA 가이드의 뉴클레이스 결합 서열과 RT 공여체 RNA의 PBS 사이에 존재한다. 대안적으로 또는 이에 더하여, 헤어핀은 RNA 가이드의 DNA-결합 서열과 RT 공여체 RNA의 역전사 주형 서열 사이에 존재할 수 있다. 일부 실시형태에서, 헤어핀은 역전사 주형 서열 내에 존재한다. 일부 실시형태에서, 주형 서열 내의 편집은 편집이 혼입되는 표적 핵산에서 헤어핀을 생성할 수 있다.
일부 경우에, 예시적인 유전자 편집 시스템의 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 역전사효소 폴리펩타이드를 포함할 수 있는 N-말단 또는 C-말단 융합 파트너를 포함할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 crRNA 처리 활성이 결여되어 있다(예를 들어, 본 명세서에 개시된 것).
도 6a, 도 6b 또는 도 7에 도시된 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 절단 동안, 비-PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 연장될 수 있다. 비-PAM 가닥의 RT 연장은 상보적 게놈 가닥과의 염기쌍으로 다시 교환되어 RT 공여체 RNA로부터 적어도 하나의 편집을 혼입시킨다.
본 명세서에 개시된 예시적인 유전자 편집 시스템, 예를 들어, 도 6a, 도 6b 도 7에 도시된 것들은 PAM 가닥의 표적 서열과 상보적인 비-PAM 가닥의 영역 내에 적어도 하나의 PAM-근위 편집을 혼입시키는 데 사용될 수 있다. 일부 예에서, 예시적인 유전자 편집 시스템은 PAM 서열 및/또는 PAM 서열의 상류에 있는 서열을 (예를 들어, PAM 서열 및/또는 상류 서열과 상보적인 영역에 변이를 도입함으로써) 변형시키는 데 사용될 수 있다. 이러한 예시적인 유전자 편집 시스템은 동일한 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 생성된 변형된 유전적 유전자좌의 재표적화를 방지하는 데 사용될 수 있다.
일부 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 10에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함)를 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 대안적으로, RNA 가이드는 RT 공여체 RNA(역전사 주형 서열 및 PBS 포함)를 포함할 수 있는 5' 융합 파트너를 포함할 수 있다. PBS의 길이는 가변적일 수 있다. 예를 들어, PBS 길이는 약 3개의 뉴클레오타이드 내지 약 16개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, PBS는 표적 핵산(예를 들어, 관심 게놈 부위)의, 예를 들어, 표적 서열과 중첩되는 PAM 가닥 상의 영역에 결합할 수 있다. 일부 예에서, 헤어핀은 RNA 가이드의 DNA-결합 서열과 RT 공여체 RNA의 역전사 주형 서열 사이에 존재한다. RNA 가이드-역전사 주형 서열의 한쪽 또는 양쪽 말단은 엑소뉴클레이스 또는 엔도뉴클레이스 활성을 방지하기 위해 보호 단편, 예를 들어, 본 명세서에 개시된 것들을 포함할 수 있다.
예시적인 유전자 편집 시스템은 N-말단 또는 C-말단 융합 파트너를 포함할 수 있는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 일부 예에서, N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함한다. 일부 예에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 crRNA 처리 활성이 결여되어 있다. 일부 예에서, CRISPR 뉴클레이스는 닉케이스이다. 일부 예에서, 편집은 도 10에 도시된 예시적인 유전자 편집 시스템을 사용하여 표적 핵산의 PAM 가닥으로 혼입된다.
RNA 가이드의 3' 말단 서열에 융합된 RT 공여체 RNA 서열 또는 RNA 가이드의 5' 말단 서열에 융합된 RT 공여체 RNA 서열을 포함하는 도 1 내지 도 7, 도 8a 내지 도 8c 10에 도시된 예시적인 편집 주형 RNA는 대신 RNA 가이드 서열의 내부 위치에 융합된 RT 공여체 RNA 서열을 포함할 수 있거나 또는 그 반대일 수 있다. 예를 들어, RT 공여체 RNA는 RNA 가이드, sgRNA 또는 RNA 가이드-tracrRNA(예를 들어, sgRNA)의 내부 위치에 융합될 수 있다.
(예를 들어, RT 공여체 RNA를 사용한 5' 연장 또는 3' 연장을 통해) 연장된 RNA 가이드 말단은 편집 혼입의 효율과 함께 역전사 주형 서열 농도를 감소시키는 엑소뉴클레이스 및/또는 엔도뉴클레이스 활성에 취약할 수 있다. 일부 실시형태에서, RNA 가이드-RT 공여체 RNA 융합체는 엑소뉴클레이스 활성을 저해하거나 또는 방지하기 위해 첨가된 2차 구조를 추가로 포함한다. 일부 실시형태에서, 첨가된 2차 구조는 삼중 구조, 슈도노트, xrRNA, 원형 RNA, tRNA 또는 절단형 tRNA이다. 일부 실시형태에서, 첨가된 2차 구조는 지카-유사 슈도노트, 뮤린 백혈병 바이러스 슈도노트(MLV-PK) 서열, 레드 클로버 괴사 모자이크 바이러스(RCNMV) 서열, 스위트 클로버 괴사 모자이크 바이러스(SCNMV) 서열, 카네이션 링스팟 바이러스(CRSV) 서열, preQ 서열 또는 RNA 박테리오파지 MS2 서열이다. 일부 실시형태에서, 첨가된 2차 구조는 염기-적층 또는 3'-말단 염기 페어링을 통해 이루어진다. 다른 실시형태에서, 첨가된 2차 구조는 뉴클레이스 결합 서열 또는 뉴클레이스 결합 서열 및 DNA-결합 서열이다. 도 10, 도 11, 도 12a 도 12b를 참조한다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 비포유동물 표적에 대해 지시된다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 비인간 표적에 대해 지시된다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 인간 게놈에서 발견되지 않는다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 인간 게놈의 임의의 서열과 85% 이상 동일하다. 실시예 2를 참조한다.
이론에 얽매이지 않고, 뉴클레이스 결합 서열 및 DNA-결합 서열의 첨가는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스-역전사효소 융합체를 동원할 수 있다. 단백질-RNA 상호작용을 통해, 결합된 CRISPR 뉴클레이스는 내인성 엑소뉴클레이스 및 엔도뉴클레이스에 대한 저항성을 제공할 수 있다. 일부 실시형태에서, 추가적인 뉴클레이스 결합 서열 및 DNA-결합 서열은 RNA-처리 활성이 결여되어 있는 CRISPR 뉴클레이스를 동원한다. 일부 실시형태에서, 2차 구조는 압타머(예를 들어, RNA 압타머)이며, 조성물은 압타머와 상호작용하는 단백질을 추가로 포함한다. 일부 실시형태에서, 압타머 및 압타머-상호작용 단백질을 포함하는 조성물은 내인성 엑소뉴클레이스 및/또는 엔도뉴클레이스 활성을 저해한다.
본 명세서에 개시된 바와 같은 추가적인 예시적인 유전자 편집 시스템은 단지 예시의 목적으로만 아래에 제공된다.
일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 적어도 하나의 RNA 가이드(또는 본 명세서에서 상호교환적으로 사용되는 가이드 RNA) 및 적어도 하나의 RT 공여체 RNA를 포함한다. 일부 예에서, 적어도 하나의 RNA 가이드는 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함한다. RNA 가이드는 CRISPR 뉴클레이스(예를 들어, 유형 V CRISPR 뉴클레이스)에 결합할 수 있다. 일부 예에서, 적어도 하나의 RNA 가이드는 추가로, 예를 들어, 스페이서 영역을 통해 표적 핵산에 결합할 수 있다. 일부 예에서, RT 공여체 RNA는 적어도 하나의 프라이머 결합 부위(PBS) 및 적어도 하나의 역전사 주형 서열을 포함한다. PBS는 센스 가닥 또는 안티센스 가닥일 수 있는 표적 핵산의 한 가닥에 결합할 수 있다. PBS가 결합하는 영역은 본 명세서에서 PBS-표적화 부위로 기술된다. 적어도 하나의 역전사 주형 서열은 표적 핵산의 상응하는 서열에 대해 적어도 하나의 뉴클레오타이드 변이(암호화된 편집)을 갖는 서열을 포함할 수 있다. 일부 경우에, 적어도 하나의 암호화된 편집은 삽입, 치환 및/또는 결실이다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 적어도 하나의 RNA 가이드, 적어도 하나의 RT 공여체 RNA 및 적어도 하나의 다른 서열을 포함한다. 일부 실시형태에서, 적어도 하나의 RNA 가이드는 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다. 일부 실시형태에서, RNA 가이드는 CRISPR 뉴클레이스(예를 들어, 유형 V CRISPR 뉴클레이스)에 결합할 수 있다. 일부 실시형태에서, 적어도 하나의 RNA 가이드는 추가로 표적 핵산에 결합할 수 있다. 일부 실시형태에서, 적어도 하나의 RT 공여체 RNA의 PBS는 표적 핵산의 비-PAM 가닥에 결합할 수 있다. 일부 실시형태에서, 적어도 하나의 RT 공여체 RNA의 PBS는 표적 핵산의 PAM 가닥에 결합할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA 중 적어도 하나를 포함할 수 있으며, RNA 가이드 및 RT 공여체 RNA를 포함할 수 있다. 일부 예에서, CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA 중 적어도 하나가 별도의 조성물로 제공된다. 일부 실시형태에서, CRISPR 뉴클레이스, 역전사효소, RNA 가이드 및 RT 공여체 RNA 중 적어도 하나가 별도의 조성물로 제공된다. 일부 실시형태에서, 적어도 하나의 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA 중 하나 이상이 별도의 조성물로 제공된다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소를 포함하는 조성물이 편집 주형 RNA를 포함하는 조성물과 별도로 제공된다. 일부 실시형태에서, 적어도 하나의 CRISPR 뉴클레이스, 역전사효소, RNA 가이드 및 RT 공여체 RNA 중 하나 이상이 별도의 조성물로 제공된다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소를 포함하는 조성물이 RNA 가이드 및 RT 공여체 RNA를 포함하는 조성물과 별도로 제공된다.
일부 실시형태에서, 본 명세서에 제공된 유전자 편집 시스템은 유전자 편집이 필요한 게놈 부위일 수 있는 표적 핵산에 결합할 수 있다. 일부 실시형태에서, 편집 주형 RNA와 같은 조성물의 하나 이상의 구성요소는 표적 핵산에 결합한다. 일부 실시형태에서, RNA 가이드 및 RT 공여체 RNA와 같은 조성물의 하나 이상의 구성요소는 표적 핵산에 결합한다. 일부 실시형태에서, 표적 핵산은 DNA이다. 일부 실시형태에서, 본 발명의 조성물은 표적 핵산을 변형시키거나 또는 변형시킬 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소와 같은 조성물의 구성요소 중 하나 이상은 표적 핵산을 변형시킨다. 일부 실시형태에서, 본 발명의 조성물은 치환, 삽입 또는 결실을 표적 핵산에 도입한다. 일부 실시형태에서, 본 발명의 조성물은 치환, 삽입 또는 결실을 표적 핵산의 비-PAM 가닥에 도입할 수 있다. 일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 치환, 삽입 또는 결실을 표적 핵산의 PAM 가닥에 도입할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 단백질 구성요소를 암호화하는 하나 이상의 핵산(예를 들어, 벡터 예컨대, 바이러스 벡터)을 포함할 수 있다. 일부 예에서, 유전자 편집 시스템은 CRISPR 뉴클레이스와 RT 폴리펩타이드 모두를 암호화하는 하나의 벡터를 포함할 수 있다. 대안적으로 또는 이에 더하여, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 유전자 편집 RNA, 가이드 RNA 또는 둘 다의 RNA 구성요소를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 RNA 구성요소를 암호화하는 하나 이상의 핵산(벡터)을 포함할 수 있다. 예를 들어, 유전자 편집 시스템은 유전자 편집 RNA와 RNA 가이드 모두를 코딩하는 하나의 벡터(예를 들어, AAV 벡터와 같은 바이러스 벡터)를 포함할 수 있다.
일부 예에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소와 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 포함할 수 있다. 다른 예에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소와 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 암호화하는 하나 이상의 핵산을 포함할 수 있다. 또 다른 예에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소를 암호화하는 하나 이상의 핵산과 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 포함할 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소를 암호화하는 하나 이상의 핵산과 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 암호화하는 하나 이상의 핵산을 포함할 수 있다. 일부 경우에, 유전자 편집 시스템은 유전자 편집 시스템의 여러 구성요소를 암호화하는 하나의 벡터를 포함할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 유전자 편집 시스템의 단백질 및/또는 RNA 구성요소 또는 이들의 암호화 핵산 중 하나 이상을 포함하는 하나 이상의 지질 나노입자(LNP)를 포함한다. 다른 실시형태에서, 유전자 편집 시스템은 구성요소의 일부를 포함하는 하나 이상의 LNP 및 나머지 구성요소를 암호화하는 하나 이상의 벡터를 포함할 수 있다.
II. 유전자 편집 시스템 구성요소의 제조
단백질 구성요소, RNA 구성요소 또는 이들의 암호화 핵산은 본 명세서에 개시된 방법 중 통상적인 방법에 의해 제조될 수 있다.
일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스), 역전사효소 또는 CRISPR 뉴클레이스-역전사효소 융합체는 (a) 단백질을 생산할 수 있는 세균 세포 또는 포유동물 세포와 같은 숙주 세포를 배양하고, 이렇게 생산된 단백질을 단리하고, 선택적으로 단백질을 정제함으로써 제조될 수 있다. 이렇게 제조된 CRISPR 뉴클레이스, 역전사효소 또는 융합체 단백질은 편집 주형 RNA와 복합체를 형성할 수 있다.
CRISPR 뉴클레이스 및 역전사효소는 또한 (b) 공지된 유전 공학 기법, 구체적으로, 세균으로부터 본 발명의 CRISPR 뉴클레이스 및 역전사효소를 암호화하는 유전자를 단리하고, 재조합 발현 벡터를 구축한 다음, 숙주 세포에서 편집 주형 RNA와 복합체를 형성하는 재조합 단백질의 발현을 위해 편집 주형 RNA를 발현하는 적절한 숙주 세포에 벡터를 전달함으로써 제조될 수 있다. 대안적으로, CRISPR 뉴클레이스 및 역전사효소는 (c) 시험관내에서 전사-번역 시스템과 커플링된 다음, 편집 주형 RNA와 복합체를 형성함으로써 제조될 수 있다. 본 발명의 CRISPR 뉴클레이스 및 역전사효소의 제조에 사용될 수 있는 세균은 본 발명의 CRISPR 뉴클레이스 및 역전사효소를 생산할 수 있는 한 특별히 제한되지 않는다. 세균의 일부 비제한적인 예는 본 명세서에 기재된 대장균 세포를 포함한다.
달리 명시하지 않는 한, 본 명세서에 제공된 모든 조성물, 복합체 및 폴리펩타이드는 해당 조성물 또는 복합체 또는 폴리펩타이드의 활성 수준을 기준으로 제조되었으며, 불순물, 예를 들어, 상업적으로 이용 가능한 공급원에 존재할 수 있는 잔류 용매 또는 부산물은 배제되어 있다. 효소적 성분의 중량은 총 활성 단백질을 기준으로 한다. 모든 백분율 및 비는 달리 명시하지 않는 한 중량 기준으로 계산된다. 모든 백분율 및 비는 달리 명시하지 않는 한 전체 조성물을 기준으로 계산된다. 예시된 조성물에서, 효소 수준은 전체 조성물의 중량을 기준으로 순수한 효소로 표시되며, 달리 명시하지 않는 한 성분은 전체 조성물의 중량을 기준으로 표시된다.
A. 벡터
본 개시내용은 본 명세서에 기재된 CRISPR 뉴클레이스, 역전사효소 또는 이들의 융합 폴리펩타이드를 발현하기 위한 하나 이상의 벡터를 제공하거나 또는 본 명세서에 기재된 구성요소를 암호화하는 핵산이 벡터에 혼입될 수 있다. 일부 실시형태에서, 본 명세서에 개시된 벡터는 CRISPR 뉴클레이스, 역전사효소 또는 융합 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함한다. 본 개시내용은 또한 편집 주형 RNA 또는 이의 임의의 부분, 예를 들어, RNA 가이드 또는 RT 공여체 RNA를 암호화하는 하나 이상의 벡터를 제공한다. 일부 실시형태에서, 벡터는 Pol II 프로모터 또는 Pol III 프로모터를 포함한다.
천연 또는 합성 폴리뉴클레오타이드의 발현은 전형적으로 관심 유전자를 암호화하는 폴리뉴클레오타이드, 예를 들어, CRISPR 뉴클레이스, 역전사효소 또는 융합 폴리펩타이드 및/또는 편집 주형 RNA를 암호화하는 뉴클레오타이드 서열을 프로모터에 작동 가능하게 연결시키고, 작제물을 발현 벡터에 혼입시킴으로써 달성된다. 발현 벡터는 본 발명의 CRISPR 뉴클레이스 및 역전사효소 및/또는 편집 주형 RNA를 암호화하는 폴리뉴클레오타이드를 포함하며 진핵생물 세포 내에서의 복제 및 통합에 적합할 수 있는 한 특별히 제한되지 않는다.
전형적인 발현 벡터는 목적하는 폴리뉴클레오타이드의 발현에 유용한 전사 및 번역 종결자, 개시 서열 및 프로모터를 포함한다. 예를 들어, RNA 폴리머레이스에 대한 인식 서열을 운반하는 플라스미드 벡터(pSP64, pBluescript 등)가 사용될 수 있다. 렌티바이러스와 같은 레트로바이러스로부터 유래된 것들을 포함하는 벡터는 이식유전자의 장기적이고 안정적인 통합 및 이의 딸 세포에서의 증식을 허용하므로 장기간 유전자 전달을 달성하는 데 적합한 도구이다. 벡터의 예는 발현 벡터, 복제 벡터, 프로브 생성 벡터 및 시퀀싱 벡터를 포함한다. 발현 벡터는 바이러스 벡터의 형태로 세포에 제공될 수 있다.
바이러스 벡터 기술은 당업계에 잘 알려져 있으며, 다양한 바이러스학 및 분자생물학 매뉴얼에 기술되어 있다. 벡터로서 유용한 바이러스는 파지 바이러스, 레트로바이러스, 아데노바이러스, 아데노-관련 바이러스, 헤르페스 바이러스 및 렌티바이러스를 포함하지만 이에 제한되지 않는다. 일반적으로, 적합한 벡터는 적어도 하나의 유기체에서 기능적인 복제 기점, 프로모터 서열, 편리한 제한 엔도뉴클레이스 부위 및 하나 이상의 선별 마커를 포함한다.
벡터의 종류는 특별히 제한되지 않으며, 숙주 세포에서 발현될 수 있는 벡터가 적절하게 선택될 수 있다. 보다 구체적으로는, 숙주 세포의 종류에 따라, 폴리뉴클레오타이드로부터 폴리펩타이드(들)의 발현을 보장하기 위한 프로모터 서열이 적절하게 선택되고, 발현 벡터의 제조를 위해 이 프로모터 서열 및 폴리뉴클레오타이드가 임의의 다양한 플라스미드 등에 삽입된다.
추가적인 프로모터 요소, 예를 들어, 강화 서열은 전사 개시의 빈도를 조절한다. 전형적으로, 이들은 시작 부위의 상류의 30bp 내지 110bp 영역에 위치하지만, 최근에는 다수의 프로모터가 시작 부위의 하류에도 기능적 요소를 포함하는 것으로 나타났다. 프로모터에 따라, 개별 요소는 전사를 활성화시키기 위해 협력적으로 또는 독립적으로 기능할 수 있는 것으로 보인다.
또한, 본 개시내용은 구성적 프로모터의 사용으로 제한되어서는 안 된다. 유도성 프로모터도 본 개시내용의 일부로서 상정된다. 유도성 프로모터의 사용은 발현이 요구될 때 작동 가능하게 연결된 폴리뉴클레오타이드 서열의 발현을 켜거나 또는 발현이 요구되지 않을 때 발현을 끌 수 있는 분자 스위치를 제공한다. 유도성 프로모터의 예는 메탈로티오닌 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터 및 테트라사이클린 프로모터를 포함하지만 이에 제한되지 않는다.
도입될 발현 벡터는 또한 바이러스 벡터를 통해 형질감염 또는 감염시키려는 세포 집단으로부터 발현 세포의 확인 및 선택을 용이하게 하기 위해 선별 마커 유전자 또는 리포터 유전자 또는 둘 다를 포함할 수 있다. 다른 양태에서, 선별 마커는 별도의 DNA 조각에 운반되어 공동 형질감염 절차에 사용될 수 있다. 선별 마커 및 리포터 유전자는 모두 숙주 세포에서 발현 가능하도록 적절한 전사 제어 서열과 측접할 수 있다. 이러한 마커의 예는 진핵생물 세포 배양의 경우 다이하이드로폴레이트 리덕테이스 유전자 및 네오마이신 저항성 유전자; 및 대장균 및 다른 세균 배양의 경우 테트라사이클린 저항성 유전자 및 암피실린 저항성 유전자를 포함한다. 이러한 선별 마커를 사용함으로써, 본 발명의 폴리펩타이드(들)를 암호화하는 폴리뉴클레오타이드가 숙주 세포에 전달되어 반드시 발현되는지 여부를 확인할 수 있다.
재조합 발현 벡터의 제조 방법은 특별히 제한되지 않으며, 이의 예는 플라스미드, 파지 또는 코스미드를 사용하는 방법을 포함한다.
B. 발현 방법
본 개시내용은 CRISPR 뉴클레이스 및 역전사효소를 번역하는 단계 및 본 명세서에 기재된 편집 주형 RNA를 발현하는 단계를 포함하는 단백질 발현 방법을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 숙주 세포는 CRISPR 뉴클레이스 및 역전사효소 및/또는 편집 주형 RNA를 발현시키는 데 사용된다. 숙주 세포는 특별히 제한되지 않으며, 바람직하게는 다양한 공지된 세포가 사용된다. 숙주 세포의 특정 예는 대장균과 같은 세균, 효모(출아 효모인 사카로마이세스 세레비시아에(Saccharomyces cerevisiae) 및 분열 효모인 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)), 선충류(카에노랍디티스 엘레간스(Caenorhabditis elegans)), 제노푸스 라에비스(Xenopus laevis) 난모세포 및 동물 세포(예를 들어, CHO 세포, COS 세포 및 HEK293 세포)를 포함한다. 위에 기재된 발현 벡터를 숙주 세포에 전달하는 방법, 즉, 형질전환 방법은 특별히 제한되지 않으며, 전기천공법, 칼슘 포스페이트 방법, 리포솜 방법 및 DEAE 덱스트란 방법과 같은 공지된 방법이 사용될 수 있다.
숙주가 발현 벡터로 형질전환된 후, 숙주 세포는 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA의 생산을 위해 배양(cultured), 재배(cultivated) 또는 육종(bred)될 수 있다. CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA의 발현 후, 숙주 세포가 수집되고, CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA가 배양물 등으로부터 통상적인 방법(예를 들어, 여과, 원심분리, 세포 파괴, 겔 여과 크로마토그래피, 이온 교환 크로마토그래피 등)에 따라 정제될 수 있다.
일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소 발현을 위한 방법은 폴리펩타이드(들)의 적어도 5개의 아미노산, 적어도 10개의 아미노산, 적어도 15개의 아미노산, 적어도 20개의 아미노산, 적어도 50개의 아미노산, 적어도 100개의 아미노산, 적어도 150개의 아미노산, 적어도 200개의 아미노산, 적어도 250개의 아미노산, 적어도 300개의 아미노산, 적어도 400개의 아미노산, 적어도 500개의 아미노산, 적어도 600개의 아미노산, 적어도 700개의 아미노산, 적어도 800개의 아미노산, 적어도 900개의 아미노산 또는 적어도 1000개의 아미노산의 번역을 포함한다. 일부 실시형태에서, 단백질 발현을 위한 방법은 CRISPR 뉴클레이스 및 역전사효소의 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 150개의 아미노산, 약 200개의 아미노산, 약 250개의 아미노산, 약 300개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 약 600개의 아미노산, 약 700개의 아미노산, 약 800개의 아미노산, 약 900개의 아미노산, 약 1000개의 아미노산 이상의 번역을 포함한다.
숙주 세포에서 성숙 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA의 생산 수준을 결정하기 위해 다양한 방법이 사용될 수 있다. 이러한 방법은, 예를 들어, 본 명세서의 다른 곳에 기재된 바와 같은 단백질 또는 표지 태그에 특이적인 다중클론 또는 단일클론 항체를 이용하는 방법을 포함하지만 이에 제한되지 않는다. 예시적인 방법은 효소결합 면역흡착 검정(ELISA), 방사면역검정(MA), 형광 면역검정(FIA) 및 형광 활성화 세포 분류(FACS)를 포함하지만 이에 제한되지 않는다. 이들 및 다른 검정은 당업계에 잘 알려져 있다(예를 들어, 문헌[Maddox et al., J. Exp. Med. 158:1211 [1983]] 참조).
본 개시내용은 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 암호화하는 폴리리보뉴클레오타이드를 숙주 세포에 제공하는 단계(여기서, 폴리리보뉴클레오타이드는 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 암호화함), 세포에서 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 발현시키는 단계 및 세포로부터 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 얻는 단계를 포함하는, 세포에서의 CRISPR 뉴클레이스 및 역전사효소 및/또는 편집 주형 RNA의 생체내 발현 방법을 제공한다.
III. 유전자 편집 방법
임의의 유전자 편집 시스템은 관심 유전자 부위, 예를 들어, 유전적 편집이 필요한 유전자 부위일 수 있는 표적 핵산을 유전적으로 변형(편집)시키기 위해, 예를 들어, 유전적 돌연변이를 고정시키기 위해, 보호 돌연변이를 도입하기 위해, 유전자 발현을 조절하기 위한 변형을 도입하기 위해 사용될 수 있다.
본 명세서에 개시된 유전자 편집 시스템 및 조성물 편집을 다양한 표적 서열에 편집하고 도입하는 데 적용 가능하다. 일부 실시형태에서, 표적 서열은 DNA 유전자좌와 같은 DNA 분자이다(본 명세서에서 표적 서열 또는 표적 적중(on-target) 서열로도 지칭됨). 일부 실시형태에서, 표적 서열은 RNA 유전자좌 또는 mRNA와 같은 RNA이다. 일부 실시형태에서, 표적 서열은 단일-가닥(예를 들어, 단일-가닥 DNA)이다. 일부 실시형태에서, 표적 서열은 이중-가닥(예를 들어, 이중-가닥 DNA)이다. 일부 실시형태에서, 표적 서열은 단일-가닥 및 이중-가닥 영역을 모두 포함한다. 일부 실시형태에서, 표적 서열은 선형이다. 일부 실시형태에서, 표적 서열은 원형이다. 일부 실시형태에서, 표적 서열은 메틸화된 뉴클레오타이드, 손상된 뉴클레오타이드 또는 뉴클레오타이드 유사체와 같은 하나 이상의 변형된 뉴클레오타이드를 포함한다. 일부 실시형태에서, 표적 서열은 변형되지 않는다. 일부 실시형태에서, 단일-가닥 표적 서열은 PAM 서열이 필요하지 않다.
표적 서열은 약 100bp, 200bp, 500bp, 1000bp, 2000bp, 5000bp, 10kb, 20kb, 50kb, 100kb, 200kb, 500kb, 1Mb 이상 중 적어도 어느 하나와 같은 임의의 길이일 수 있다. 표적 서열은 또한 임의의 서열을 포함할 수 있다. 일부 실시형태에서, 표적 서열은 적어도 약 40%, 45%, 50%, 55%, 60%, 65% 이상의 GC 함량 중 어느 하나를 갖는 것과 같이 GC가 풍부하다. 일부 실시형태에서, 표적 서열은 적어도 약 70%, 80% 이상의 GC 함량을 갖는다. 일부 실시형태에서, 표적 서열은 GC가 풍부하지 않은 표적 서열에 있는 GC가 풍부한 단편이다. 일부 실시형태에서, 표적 서열은 GC가 풍부하지 않다. 일부 실시형태에서, 표적 서열은 하나 이상의 2차 구조 또는 더 높은 차수의 구조를 갖는다. 일부 실시형태에서, 표적 서열은 리보핵단백질에 의해 표적 서열에 접근할 수 없도록 하기 위해 염색질에서와 같은 응축된 상태가 아니다.
일부 실시형태에서, 표적 핵산은 세포의 게놈 부위이다. 일부 경우에, 유전적 편집이 일어나는 표적 핵산은 단백질-코딩 영역에 있을 수 있다. 대안적으로, 표적 핵산은 프로모터, 인핸서, 5' 또는 3' 비번역 영역과 같은 조절 영역에 있을 수 있다. 다른 경우에, 표적 핵산은 트랜스포존, miRNA, tRNA, 리보솜 RNA, 리보자임 또는 lincRNA와 같은 논코딩 유전자에 있을 수 있다.
A. 유전적 편집을 위한 예시적인 유전자
본 명세서에 개시된 임의의 유전자 편집 시스템은 표적 관심 유전자, 예를 들어, 질환(예를 들어, 유전자 질환)과 관련된 유전자를 편집하는 데 사용될 수 있다. 일부 실시형태에서, 표적 유전자는 대상체에서 면역반응에 관여하는 유전자일 수 있다. 예를 들어, 표적 유전자는 면역관문 유전자일 수 있다.
예시적인 표적 유전자는 BCL11A 인트론 적혈구 인핸서, CD3, 베타-2 마이크로글로불린(B2M), T 세포 수용체 알파 불변영역(T Cell Receptor Alpha Constant: TRAC), 예정 세포사 1(PDCD1), T-세포 수용체 알파, T-세포 수용체 베타, B-세포 림프종/백혈병 11A(BCL11A), 세포독성 T-림프구 항원 4(CTLA-4), 케모카인(C-C 모티프) 수용체 5(유전자/유사유전자)(CCR5), CXCR4 유전자, CD160 분자(CD160), 아데노신 A2a 수용체(ADORA), CD276, B7-H3, B7-H4, BTLA, 나이코틴아마이드 아데닌 다이뉴클레오타이드 포스페이트 NADPH 옥시데이스 아이소형 2(NOX2), T 세포 활성화의 V-도메인 Ig 억제인자(VISTA), 시알산-결합 면역글로불린-유형 렉틴 7(SIGLEC7), 시알산-결합 면역글로불린-유형 렉틴 9(SIGLEC9), SIGLEC10, T 세포 활성화 저해인자 1을 포함하는 V-세트 도메인(VTCN1), B 및 T 림프구 감쇠기(BTLA), 인돌아민 2,3-다이옥시게네이스(IDO), 인돌아민 2,3-다이옥시게네이스 1(IDO1), 살해-세포 면역글로불린-유사 수용체(KIR), 살해 세포 면역글로불린-유사 수용체, 3개 도메인, 긴 세포질 꼬리, 1(KIR3DL1), 림프구-활성화 유전자 3(LAG3), T-세포 면역글로불린 도메인 및 뮤신 도메인 3(TIM3), A형 간염 바이러스 세포 수용체 2(HAVCR2), 자연 살해 세포 수용체 2B4(CD244), 하이포잔틴 포스포리보실트랜스퍼레이스 1(HPRT), Ig 및 ITIM 도메인을 갖는 T-세포 면역수용체(TIGIT), CD96 분자(CD96), 세포독성 및 조절 T-세포 분자(CRTAM), 백혈구 관련 면역글로불린 유사 수용체 1(LAIR1), 아데노-관련 바이러스 통합 부위 1(AAVS1), AAVS 2, AAVS3, AAVS4, AAVS5, AAVS6, AAVS7, AAVS8, 형질전환 성장 인자 베타 수용체 II(TGFBRII), 형질전환 성장 인자 베타 수용체 I(TGFBR1), SMAD 패밀리 구성원 2(SMAD2), SMAD 패밀리 구성원 3(SMAD3), SMAD 패밀리 구성원 4(SMAD4), SKI 전암 유전자(SKI), SKI-유사 전암 유전자(SKIL), egl-9 패밀리 저산소증-유도 인자 1(EGLN1), egl-9 패밀리 저산소증-유도 인자 2(EGLN2), egl-9 패밀리 저산소증-유도 인자 3(EGLN3), 단백질 포스파테이스 1 조절 서브유닛 12C(PPP1R12C), TGFB 유도 인자 호메오박스 1(TGIF1), 종양 괴사 인자 수용체 슈퍼패밀리 구성원, 종양 괴사 인자 수용체 슈퍼패밀리 구성원 10b(TNFRSF10B), 종양 괴사 인자 수용체 슈퍼패밀리 구성원 10a(TNFRSF10A), BY55, B7H5, 카스페이스 8(CASP8), 카스페이스 10(CASP10), 카스페이스 3(CASP3), 카스페이스 6(CASP6), 카스페이스 7(CASP7), 사멸 도메인을 통해 회합된 Fas(FADD), Fas 세포 표면 사멸 수용체(FAS), 인터류킨 10 수용체 서브유닛 알파(IL10RA), 인터류킨 10 수용체 서브유닛 베타(IL10RB), 헴 옥시게네이스 2(HMOX2), 인터류킨 6 수용체(IL6R), 인터류킨 6 신호 전달인자(IL6ST), c-src 타이로신 카이네이스(CSK), 글리코스핑고지질 마이크로도메인 1을 갖는 인단백질 막 앵커(PAG1), 구아닐레이트 사이클레이스 1, 가용성, 베타 3(GUCY1B3), 신호전달 역치 조절 막횡단 어댑터 1(SIT1), 포크헤드 박스 P3(FOXP3), PR 도메인 1(PRDM1), 염기성 류신 지퍼 전사 인자, ATF-유사(BATF), 구아닐레이트 사이클레이스 1, 가용성, 알파 2(GUCY1A2), 구아닐레이트 사이클레이스 1, 가용성, 알파 3(GUCY1A3), 구아닐레이트 사이클레이스 1, 가용성, 베타 2(GUCY1B2), 단백질의 프롤릴 하이드록실레이스 도메인(PHD1, PHD2, PHD3) 패밀리, CD27, CD28, CD40, CD122, CD137, OX40, GITR 및 ICOS를 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, 변형된 유전자는 예정사 리간드 1(PD-L1), 클래스 II 주요 조직적합성 복합체 전사촉진인자(CIITA), 시트라말릴-CoA 라이에이스(CLYBL), 트랜스티레틴(TTR), 락테이트 데하이드로게네이스-A(LDHA), 하이드록시산 옥시데이스-1(hydroxyacid oxidase 1: HAO1), 알라닌-글리옥실레이트 및 세린-피루베이트 아미노트랜스퍼레이스(AGXT), 글리옥실레이트 리덕테이스/하이드록시피루베이트 리덕테이스(GRHPR), 4-하이드록시-2-옥소글루타레이트 알돌레이스(HOGA), 폴리피리미딘 관 결합 단백질 1(PTBP1), 스타트민 2(STMN2) 또는 액틴 베타(ACTB)이다.
본 개시내용은 또한 본 명세서에 개시된 바와 같은 유전자 편집 시스템을 사용하여 본 명세서에 개시된 바와 같은 임의의 표적 유전자를 유전자 편집하는 방법을 제공한다.
B. 편집
일부 양태에서, 본 명세서에 기재된 유전자 편집 시스템을 사용하여 적어도 하나의 편집을 표적 핵산(예를 들어, 본 명세서에 개시된 임의의 표적 유전자와 같은 관심 게놈 부위)에 도입하는 방법이 본 명세서에 제공된다. 일부 실시형태에서, 편집은 표적 핵산에 대한 치환, 삽입, 결실 또는 이들의 조합을 포함할 수 있다. 일부 예에서, 편집은 G에서 T로의 치환, G에서 A로의 치환, G에서 C로의 치환, T에서 G로의 치환, T에서 A로의 치환, T에서 C로의 치환, C에서 G로의 치환, C에서 T로의 치환, C에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환 또는 A에서 C로의 치환과 같은 단일 뉴클레오타이드 치환일 수 있다. 일부 예에서, 편집은 G:C 염기쌍을 T:A 염기쌍으로, G:C 염기쌍을 A:T 염기쌍으로, G:C 염기쌍을 C:G 염기쌍으로, T:A 염기쌍을 G:C 염기쌍으로, T:A 염기쌍을 A:T 염기쌍으로, T:A 염기쌍을 C:G 염기쌍으로, C:G 염기쌍을 G:C 염기쌍으로, C:G 염기쌍을 T:A 염기쌍으로, C:G 염기쌍을 A:T 염기쌍으로, A:T 염기쌍을 T:A 염기쌍으로, A:T 염기쌍을 G:C 염기쌍으로 또는 A:T 염기쌍을 C:G 염기쌍으로 전환할 수 있다.
일부 실시형태에서, 적어도 하나의 편집을 표적 핵산에 도입하기 위한 방법이 기술되되, 편집은 적어도 하나의 치환, 적어도 하나의 삽입 및/또는 적어도 하나의 결실이다. 일부 실시형태에서, 편집은 적어도 하나의 치환, 삽입 또는 결실을 포함한다. 일부 실시형태에서, 치환, 삽입 또는 결실은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환, 삽입 또는 결실은 i1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환, 삽입 또는 결실은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환, 삽입 또는 결실은 최대 약 10,000개의 염기쌍(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 치환, 삽입 또는 결실은 1개의 염기쌍, 약 10개의 염기쌍, 약 20개의 염기쌍, 약 30개의 염기쌍, 약 40개의 염기쌍, 약 50개의 염기쌍, 약 60개의 염기쌍, 약 70개의 염기쌍, 약 80개의 염기쌍, 약 90개의 염기쌍, 약 100개의 염기쌍, 약 200개의 염기쌍, 약 300개의 염기쌍, 약 400개의 염기쌍, 약 500개의 염기쌍, 약 600개의 염기쌍, 약 700개의 염기쌍, 약 800개의 염기쌍, 약 900개의 염기쌍, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 삽입은 헤어핀이거나 또는 이를 포함한다. 예를 들어, 역전사효소는 표적 핵산에 혼입될 수 있는 헤어핀을 전사할 수 있다. 다른 실시형태에서, 역전사 주형 서열은 헤어핀 구조를 포함하고, 역전사효소는 헤어핀에서 역전사 주형 서열의 전사를 중단시킨다.
일부 실시형태에서, 편집은 유형 II PAM 서열(예를 들어, SpCas9의 경우 5'-NGG-3') 또는 유형 V PAM 서열(예를 들어, Cas12i 폴리펩타이드의 경우 5'-NTTN-3')의 약 500개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열에 인접하여, 예를 들어, PAM 서열의 상류 또는 하류에 있는 약 500개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 400개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 400개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 300개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 300개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 200개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 100개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 100개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 50개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 50개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 30개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 30개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 20개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 20개의 뉴클레오타이드 내에서 발생한다.
일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 300개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 290개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 280개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 270개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 260개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 250개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 240개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 230개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2020개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 210개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 190개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 180개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 170개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 160개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 150개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 140개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 130개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 120개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 110개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 90개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 80개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 70개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 60개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 40개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 9개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 8개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 7개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 6개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 4개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 3개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 1개의 뉴클레오타이드 내에서 시작된다.
일부 실시형태에서, 편집은 PAM 서열에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 1개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 2개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 3개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 4개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 6개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 7개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 8개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 9개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 11개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 12개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 13개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 14개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 15개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 16개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 17개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 18개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 19개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 20개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 21개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 22개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 23개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 24개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 26개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 27개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 28개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 29개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 30개의 뉴클레오타이드 내에서 시작된다.
일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 300개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 290개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 280개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 270개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 260개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 250개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 240개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 230개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2020개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 210개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 190개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 180개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 170개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 160개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 150개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 140개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 130개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 120개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 110개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 90개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 80개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 70개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 60개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 40개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 9개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 8개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 7개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 6개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 4개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 3개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 1개의 뉴클레오타이드 내에서 끝난다.
일부 실시형태에서, 편집은 PAM 서열에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 1개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 2개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 3개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 4개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 5개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 6개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 7개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 8개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 9개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 10개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 11개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 12개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 13개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 14개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 15개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 16개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 17개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 18개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 19개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 20개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 21개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 22개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 23개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 24개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 25개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 26개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 27개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 28개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 29개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 30개의 뉴클레오타이드 내에서 끝난다.
C. 비-PAM 가닥 편집
일부 실시형태에서, 본 명세서에 개시된 바와 같은 적합한 유전자 편집 시스템, 예를 들어, 도 5, 도 6a, 도 6b, 도 7, 도 8a, 도 12a 또는 도 12b에 도시된 것들을 사용하여 적어도 하나의 편집을 표적 핵산의 비-PAM 가닥에 도입하는 방법이 본 명세서에 제공된다. 적어도 하나의 편집은 유전자 편집 시스템에 포함된 역전사 주형 서열을 사용하여 처음에 비-PAM 가닥에 도입될 수 있다. 세포 DNA 복구 기구를 통해, 적어도 하나의 편집이 결국 표적 핵산의 양쪽 가닥에 도입될 것이다. 유전자 편집 시스템은 (a) CRISPR 뉴클레이스 결합 서열, (b) DNA-결합 서열 및 (c) RT 공여체 RNA를 포함하는 비-PAM 가닥을 표적으로 하는 편집 주형 RNA를 포함할 수 있다. 일부 실시형태에서, RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다.
일부 실시형태에서, RT 공여체 RNA의 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 비-PAM 가닥에 도입하기 위한 방법 및 유전자 편집 시스템 또는 조성물이 기술된다. 일부 실시형태에서, 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 비-PAM 가닥에 도입하기 위한 방법 및 조성물이 기술된다.
일부 실시형태에서, RT 공여체 RNA(예를 들어, 편집 주형 RNA의 RT 공여체 RNA)의 PBS는 비-PAM 가닥(PBS-표적화 부위)의 영역에 결합한다. 역전사 주형 서열은 비-PAM 가닥에 혼입될 편집을 포함한다. 일부 예에서, 역전사 주형은 PAM-가닥과의 서열 유사성을 포함한다. 일부 예에서, 역전사 주형은 PAM 가닥의 서열에 대한 편집을 포함한다. 일부 실시형태에서, 비-PAM 가닥은 염기-페어링을 통해 RT 공여체 RNA의 PBS에 결합하고, 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)는 카피 역전사 주형 서열을 카피한다. 상보적 게놈 가닥과의 염기-페어링으로 다시 가닥을 교환한 후, 편집이 표적 핵산에 혼입된다.
일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성요소: CRISPR 뉴클레이스 결합 서열, DNA-결합 서열, 역전사 주형 서열 및 PBS를 포함한다(예를 들어, 도 5, 도 6a, 도 6b, 도 8a 도 12a 참조). 일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서) 또는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다(도 7 도 12b).
일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열의 5' 연장부이다(도 5, 도 6a, 도 6b, 도 8a 도 12a). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열과 PBS에 인접해 있다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 PBS의 3' 연장부이다(도 7 도 12b). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 V CRISPR 뉴클레이스(예를 들어, Cas12i1, Cas12i2, Cas12i3 또는 Cas12i4 폴리펩타이드와 같은 Cas12i 폴리펩타이드)에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 직접 반복 서열(예를 들어, Cas9 직접 반복 서열 또는 Cas12i 직접 반복 서열)이다.
일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열과 PBS에 인접해 있다. 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다(도 5, 도 6a, 도 6b, 도 7, 도 8a, 도 12a 도 12b). 일부 실시형태에서, DNA-결합 서열은 RNA 서열, DNA 서열 또는 RNA/DNA 하이브리드 서열을 포함할 수 있다. 일부 실시형태에서, DNA-결합 서열은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, DNA-결합 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다.
일부 실시형태에서, PBS는 역전사 주형 서열에 인접해 있다. 일부 실시형태에서, PBS는 역전사 주형 서열의 3' 연장부이다(도 5, 도 6a, 도 6b, 도 7, 도 8a, 도 12a 도 12b). 일부 실시형태에서, PBS는 역전사 주형 서열과 CRISPR 뉴클레이스 결합 서열에 인접해 있다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DNA-결합 서열 및 PBS는 표적 핵산의 동일한 가닥(예를 들어, 비-PAM 가닥)에 결합한다.
일부 실시형태에서, 역전사 주형 서열은 PBS와 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 5' 연장부이다(도 5, 도 6a, 도 6b, 도 8a 도 12a). 일부 실시형태에서, 역전사 주형 서열은 DNA-표적화 서열의 3' 연장부이다(도 5, 도 6a, 도 6b, 도 8a 도 12a). 일부 실시형태에서, 역전사 주형 서열은 PBS의 5' 연장부이다(도 7 도 12b). 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는 DNA-결합 서열과 PBS가 표적 핵산에 결합될 때 짝을 이루지 않은 뉴클레오타이드의 루프를 포함한다. 도 6a, 도 6b, 도 8a 도 12a를 참조한다. 일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는 PBS에 인접한 루프를 포함한다. 도 7 도 12b를 참조한다. 일부 실시형태에서, 루프는 역전사 주형 서열을 포함하며 PBS가 뒤따른다. 일부 실시형태에서, PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. 일부 실시형태에서, 루프의 서열은 PAM 가닥과의 서열 유사성을 포함한다. 일부 실시형태에서, 루프는 PAM 가닥의 서열에 대한 편집을 포함한다. 일부 실시형태에서, 편집은 치환, 삽입 또는 결실이다. 일부 실시형태에서, 루프는 헤어핀을 포함한다.
D. PAM 가닥 편집
일부 실시형태에서, 도 1a, 도 1b, 도 2, 도 3, 도 4 또는 도 10에 도시된 것들과 같은 본 명세서에 개시된 적합한 유전자 편집 시스템을 사용하여 적어도 하나의 편집을 표적 핵산(예를 들어, 관심 게놈 부위)의 PAM 가닥에 도입하기 위한 방법이 본 명세서에 제공된다. 이러한 방법은 (a) CRISPR 뉴클레이스 결합 서열, (b) DNA-결합 서열, 및 (c) 및 RT 공여체 RNA를 포함할 수 있는 PAM 가닥을 표적으로 하는 편집 주형 RNA의 사용을 포함할 수 있다(도 1a, 도 1b, 도 2 도 10). 일부 예에서, PAM 가닥을 표적으로 하는 조성물은 RNA 가이드 및 RT 공여체 RNA를 포함한다(도 3 도 4). 일부 예에서, RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다.
일부 실시형태에서, 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 PAM 가닥에 도입하기 위한 방법 및 조성물이 기술된다. 일부 실시형태에서, 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 PAM 가닥에 도입하기 위한 방법 및 조성물이 기술된다.
일부 경우에, RT 공여체 RNA(예를 들어, 편집 주형 RNA의 RT 공여체 RNA)의 PBS는 PAM 가닥에 결합한다. RT 공여체 RNA의 역전사 주형 서열은 PAM 가닥에 혼입될 편집을 포함한다. 일부 예에서, 역전사 주형은 비-PAM 가닥과의 서열 유사성을 포함한다. 일부 실시형태에서, 역전사 주형은 비-PAM 가닥의 서열에 대한 편집을 포함한다. 일부 실시형태에서, PAM 가닥은 염기-페어링을 통해 RT 공여체 RNA의 PBS에 결합할 수 있고, 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)는 역전사 주형 서열을 카피한다. 상보적 게놈 가닥과의 염기-페어링으로 다시 가닥을 교환한 후, 편집이 표적 핵산에 혼입된다.
일부 실시형태에서, PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성 요소: CRISPR 뉴클레이스 결합 서열, DNA-결합 서열, 역전사 주형 서열 및 PBS를 포함한다(도 1a, 도 1b 도 10). 일부 실시형태에서, PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열 또는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다(도 2).
일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다(도 1a, 도 1b, 도 2 도 10). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열과 PBS에 인접해 있다(도 2). 일부 실시형태에서 DNA-결합 서열은 PBS의 3' 연장부이다(도 2). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 V CRISPR 뉴클레이스(예를 들어, Cas12i1, Cas12i2, Cas12i3 또는 Cas12i4 폴리펩타이드와 같은 Cas12i 폴리펩타이드)에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 직접 반복 서열(예를 들어, Cas9 직접 반복 서열 또는 Cas12i 직접 반복 서열)이다.
일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열에 인접해 있다. 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다(도 1a, 도 1b, 도 2 도 10). 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열과 역전사 주형 서열에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 DNA-결합 서열의 3' 연장부이다(도 10). 일부 실시형태에서, DNA-결합 서열은 RNA 서열, DNA 서열 또는 RNA/DNA 하이브리드 서열이다. 일부 실시형태에서, DNA-결합 서열은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, DNA-결합 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, DNA-결합 서열은 스페이서 서열이다.
일부 실시형태에서, PBS는 역전사 주형 서열에 인접해 있다. 일부 실시형태에서, PBS는 역전사 주형 서열의 3' 연장부이다(도 1a, 도 2, 도 1b 도 10). 일부 실시형태에서, PBS는 CRISPR 뉴클레이스 결합 서열에 인접해 있다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 PBS의 3' 연장부이다(도 2). 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DNA-결합 서열 및 PBS는 표적 핵산의 상이한 가닥에 결합한다(예를 들어, DNA-결합 서열은 표적 가닥에 결합하고, PBS는 PAM 가닥에 결합함).
일부 실시형태에서, 역전사 주형 서열은 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 DNA-결합 서열의 3' 연장부이다(도 1a, 도 1b 도 10). 일부 실시형태에서, 역전사 주형 서열은 PBS에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 5' 연장부이다(도 1a, 도 1b, 도 2). 일부 실시형태에서, PBS는 역전사 주형 서열의 3' 연장부이다(도 10). 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
E. 세포 내 유전자 편집
일부 양태에서, 본 명세서에 또한 개시된 바와 같은 적합한 유전자 편집 시스템을 사용하여 세포에서 관심 게놈 부위(예를 들어, 본 명세서에 개시된 바와 같은 표적 유전자)를 편집하는 방법이 본 명세서에 제공된다. 이 방법을 수행하기 위해, 유전자 편집 시스템은 세포 집단에 전달되거나 또는 도입될 수 있다. 일부 경우에, 목적하는 유전자 편집을 포함하는 세포는 수집되고, 선택적으로 배양되고, 시험관내에서 확장될 수 있다.
본 명세서에 기재된 세포는 다양한 세포일 수 있다. 일부 실시형태에서, 세포는 단리된 세포이다. 일부 실시형태에서, 세포는 세포 배양물 또는 두 가지 이상의 세포 유형의 공동 배양물에 있다. 일부 실시형태에서, 세포는 생체외에 있다. 일부 실시형태에서, 세포는 살아있는 유기체로부터 얻어지고, 세포 배양물에서 유지된다. 일부 실시형태에서, 세포는 단일-세포 유기체이다.
일부 실시형태에서, 세포는 원핵생물 세포이다. 일부 실시형태에서, 세포는 세균 세포이거나 또는 세균 세포로부터 유래된다. 일부 실시형태에서, 세포는 고세균 세포이거나 또는 고세균 세포로부터 유래된다.
일부 실시형태에서, 세포는 진핵생물 세포이다. 일부 실시형태에서, 세포는 식물 세포이거나 또는 식물 세포로부터 유래된다. 일부 실시형태에서, 세포는 진균 세포이거나 또는 진균 세포로부터 유래된다. 일부 실시형태에서, 세포는 동물 세포이거나 또는 동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 무척추동물 세포이거나 또는 무척추동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 척추동물 세포이거나 또는 척추동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 포유동물 세포이거나 또는 포유동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 인간 세포이다. 일부 실시형태에서, 세포는 제브라 피쉬 세포이다. 일부 실시형태에서, 세포는 영장류 세포이다. 일부 실시형태에서, 세포는 설치류 세포이다. 일부 실시형태에서, 세포는 합성적으로 만들어지며, 때로는 인공 세포라고도 불린다.
일부 실시형태에서, 세포는 세포주로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 공지되어 있다. 세포주의 예는 293T, MF7, K562, HeLa, CHO 및 이들의 형질전환 변이체를 포함하지만 이에 제한되지 않는다. 세포주는 당업자에게 공지된 다양한 공급원으로부터 입수 가능하다(예를 들어, 아메리칸 타입 컬처 컬렉션(American Type Culture Collection: ATCC)(버니지아주 머내서스 소재) 참조). 일부 실시형태에서, 세포는 불멸이거나 또는 불멸화된 세포이다. 일부 실시형태에서, 세포는 전능성(totipotent) 줄기 세포(예를 들어, 전능성(omnipotent)), 만능성(pluripotent) 줄기 세포, 다능성(multipotent) 줄기 세포, 협능성(oligopotent) 줄기 세포 또는 단능성(unipotent) 줄기 세포와 같은 줄기 세포이다. 일부 실시형태에서, 세포는 유도 만능성 줄기 세포(induced pluripotent stem cell: iPSC)이거나 또는 iPSC로부터 유래된다. 일부 실시형태에서, 세포는 중간엽 줄기 세포이다. 일부 실시형태에서, 세포는 배아 줄기 세포이다. 일부 실시형태에서, 세포는 조혈 줄기 세포이다. 일부 실시형태에서, 세포는 분화된 세포이다. 예를 들어, 일부 실시형태에서, 분화된 세포는 근육 세포(예를 들어, 근세포(myocyte)), 지방 세포(예를 들어, 지방세포(adipocyte)), 골세포(예를 들어, 골아세포(osteoblast), 골세포(osteocyte), 파골세포(osteoclast)), 혈액 세포(예를 들어, 단핵구, 림프구, 호중구, 호산구, 호염기구, 마크로파지, 적혈구 또는 혈소판), 신경 세포(예를 들어, 뉴런), 상피 세포, 면역세포(예를 들어, 림프구, 호중구, 단핵구 또는 마크로파지), 간 세포(liver cell 또는 hepatocyte), 섬유아세포 또는 성세포(sex cell)이다. 일부 실시형태에서, 세포는 최종적으로 분화된 세포이다. 예를 들어, 일부 실시형태에서, 최종적으로 분화된 세포는 신경 세포, 지방세포, 심근세포, 골격근 세포, 표피 세포 또는 장 세포이다. 일부 실시형태에서, 세포는 신경교세포이다. 일부 실시형태에서, 세포는 알파 세포, 베타 세포, 델타 세포 또는 장크롬친화성 세포를 포함하는 췌장 섬 세포이다. 일부 실시형태에서, 세포는 면역세포이다. 일부 실시형태에서, 면역세포는 T 세포이다. 일부 실시형태에서, 면역세포는 B 세포이다. 일부 실시형태에서, 면역세포는 자연 살해(Natural Killer: NK) 세포이다. 일부 실시형태에서, 면역세포는 종양 침윤 림프구(Tumor Infiltrating Lymphocyte: TIL)이다. 일부 실시형태에서, 세포는 포유동물 세포, 예를 들어, 인간 세포 또는 영장류 세포 또는 뮤린 세포이다. 일부 실시형태에서, 뮤린 세포는 야생형 마우스, 면역 반응 억제 마우스 또는 질환-특이적 마우스 모델로부터 유래된다. 일부 실시형태에서, 세포는 살아있는 조직, 기관 또는 유기체 내의 세포이다.
일부 실시형태에서, 세포는 1차 세포이다. 예를 들어, 1차 세포의 배양은 0회, 1회, 2회, 4회, 5회, 10회, 15회 이상 계대될 수 있다. 일부 실시형태에서, 1차 세포는 임의의 공지된 방법에 의해 개체로부터 수거된다. 예를 들어, 백혈구는 성분채집술, 백혈구성분채집술, 밀도 구배 분리 등에 의해 수거될 수 있다. 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등과 같은 조직으로부터의 세포는 생검에 의해 수거될 수 있다. 수거된 세포의 분산 또는 현탁을 위해 적절한 용액이 사용될 수 있다. 이러한 용액은 저농도의 허용 가능한 완충액과 함께 송아지 태아 혈청 또는 기타 자연 발생적 인자가 편리하게 보충된 일반적으로 균형 잡힌 염 용액(예를 들어, 일반 식염수, 인산 완충 식염수(PBS), 행크의 균형 잡힌 염 용액 등)일 수 있다. 완충액은 HEPES, 포스페이트 완충액, 락테이트 완충액 등을 포함할 수 있다. 세포는 즉시 사용될 수 있거나 또는 보관될 수 있다(예를 들어, 동결에 의해). 동결된 세포는 해동될 수 있고, 재사용할 수 있다. 세포는 DMSO, 혈청, 배지 완충액(예를 들어, 10% DMSO, 50% 혈청, 40% 완충 배지) 및/또는 동결 온도에서 세포를 보존하는 데 사용되는 몇몇 다른 이러한 일반적인 용액에서 동결될 수 있다.
본 명세서에 개시된 유전자 편집 시스템이 복수의 세포에 도입되는 실시형태에서, 세포의 적어도 약 0.5%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 1%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 2%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 3%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 4%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 5%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 10%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 20%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 30%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 40%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 50%가 목적하는 편집을 포함한다.
예를 들어, 본 명세서에 또한 개시된 임의의 유전자 편집 시스템을 사용하여 본 명세서에 개시된 방법에 의해 생산된 목적하는 유전적 편집을 보유한 세포도 본 개시내용의 범위 내에 있다. 일부 경우에, 본 명세서에 기재된 바와 같은 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA에 의해 변형된 세포는 생체분자를 제조하기 위한 발현 시스템으로서 유용할 수 있다. 예를 들어, 변형된 세포는 단백질(예를 들어, 사이토카인, 항체, 항체-기반 분자), 펩타이드, 지질, 탄수화물, 핵산, 아미노산 및 바이타민과 같은 생체분자를 생산하는 데 유용할 수 있다. 다른 실시형태에서, 변형된 세포는 렌티바이러스, 아데노바이러스, 아데노-관련 바이러스 및 종양 용해성 바이러스 벡터와 같은 바이러스 벡터의 생산에 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 세포독성 연구에 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 질환 모델로서 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 백신 생산에 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 치료에 유용할 수 있다. 예를 들어, 일부 실시형태에서, 변형된 세포는 수혈 및 이식과 같은 세포 요법에 유용할 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA에 의해 변형된 세포는 변형된 게놈 서열을 포함하는 신규한 세포주를 확립하는 데 유용할 수 있다. 일부 실시형태에서, 본 개시내용의 변형된 세포는 변형된 줄기 세포의 결실을 포함하는 하나 이상의 세포 계통으로 분화되는 변형된 줄기 세포(예를 들어, 변형된 전능성/전능성 줄기 세포, 변형된 만능성 줄기 세포, 변형된 다능성 줄기 세포, 변형된 협능성 줄기 세포 또는 변형된 단능성 줄기 세포)이다. 본 개시내용은 본 개시내용의 변형된 세포를 포함하거나 또는 이로부터 생성된 유기체(예컨대, 동물, 식물 또는 균류)를 추가로 제공한다.
F. 세포로의 유전자 편집 시스템의 전달
일부 실시형태에서, 임의의 유전자 편집 시스템 또는 이의 구성요소는, 예를 들어, 담체 및/또는 중합체성 담체, 예를 들어, 리포솜 또는 지질 나노입자와 같은 담체를 포함하여 제형화될 수 있고, 공지된 방법에 의해 세포(예를 들어, 원핵생물, 진핵생물, 식물, 포유동물 등)에 전달될 수 있다. 이러한 방법은 형질감염(예를 들어, 지질-매개성, 양이온성 중합체, 칼슘 포스페이트, 덴드리머); 전기천공법 또는 막 파괴의 다른 방법(예를 들어, 뉴클레오펙션(nucleofection)), 바이러스 전달(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, AAV), 미세주입, 미세입자 투사("유전자 총(gene gun)"), 퓨진(fugene), 직접 초음파 로딩(direct sonic loading), 세포 압착, 광학 형질감염, 원형질체 융합, 임페일펙션(impalefection), 마그네토펙션(magnetofection), 엑소솜-매개성 전달, 지질 나노입자-매개성 전달 및 이들의 임의의 조합을 포함하지만 이에 제한되지 않는다.
일부 실시형태에서, 방법은 하나 이상의 핵산(예를 들어, CRISPR 뉴클레이스, 역전사효소, 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA) 등을 암호화하는 핵산), 이의 하나 이상의 전사체 및/또는 미리 형성된 리보핵단백질을 세포에 전달하는 단계를 포함한다. 예시적인 세포내 전달 방법은 바이러스 또는 바이러스-유사 작용제; 칼슘 포스페이트, 덴드리머, 리포솜 또는 양이온성 중합체(예를 들어, DEAE-덱스트란 또는 폴리에틸렌이민)를 사용하는 것과 같은 화학-기반 형질감염 방법; 미세주입, 전기천공법, 세포 압착, 초음파 천공, 광학 형질감염, 임페일펙션, 원형질체 융합, 세균 접합, 플라스미드 또는 트랜스포존의 전달과 같은 비화학적 방법; 유전자 총, 마그네토펙션 또는 자성 보조 형질감염, 입자 충격을 사용하는 것과 같은 입자-기반 방법; 및 뉴클레오펙션과 같은 하이브리드 방법을 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, 본 출원은 이러한 방법에 의해 생산된 세포 및 이러한 세포를 포함하거나 또는 이로부터 생산된 유기체(예컨대, 동물, 식물 또는 균류)를 추가로 제공한다. 일부 실시형태에서, 본 발명의 조성물은 DNA 복구 또는 DNA 복구 기구에 영향을 미치는 작용제(예를 들어, 화합물, 분자 또는 생체분자)와 함께 추가로 전달된다. 일부 실시형태에서, 본 발명의 조성물은 세포 주기에 영향을 미치는 작용제(예를 들어, 화합물, 분자 또는 생체분자)와 함께 추가로 전달된다.
일부 실시형태에서, CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스와 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)를 포함하는 제1 조성물이 세포에 전달된다. 일부 실시형태에서, RNA 가이드 또는 RNA 가이드 및 RT 공여체 RNA(예를 들어, 편집 주형 RNA)를 포함하는 제2 조성물이 세포에 전달된다. 일부 실시형태에서, 제1 조성물은 제2 조성물이 세포와 접촉되기 전에 세포와 접촉된다. 일부 실시형태에서, 제1 조성물은 제2 조성물이 세포와 접촉되는 것과 동시에 세포와 접촉된다. 일부 실시형태에서, 제1 조성물은 제2 조성물이 세포와 접촉된 후 세포와 접촉된다. 일부 실시형태에서, 제1 조성물은 제1 전달 방법에 의해 전달되고, 제2 조성물은 제2 전달 방법에 의해 전달된다. 일부 실시형태에서, 제1 전달 방법은 제2 전달 방법과 동일하다. 예를 들어, 일부 실시형태에서, 제1 조성물과 제2 조성물은 바이러스 전달을 통해 전달된다. 일부 실시형태에서, 제1 전달 방법은 제2 전달 방법과 상이하다. 예를 들어, 일부 실시형태에서, 제1 조성물은 바이러스 전달에 의해 전달되고, 제2 조성물은 지질 나노입자-매개성 전달에 의해 전달되고, 제2 조성물은 바이러스 전달에 의해 전달되거나 또는 제1 조성물은 지질 나노입자-매개성 전달에 의해 전달되고, 제2 조성물은 바이러스 전달에 의해 전달된다.
IV. 치료적 응용
본 명세서에 개시된 바와 같은 이러한 유전자 편집 시스템을 사용하여 생성된 임의의 유전자 편집 시스템 또는 변형된 세포는 유전자 편집 시스템에 의해 도입되거나 또는 변형된 세포에 의해 운반되는 유전자 편집으로부터 이익을 얻을 수 있는 질환을 치료하는 데 사용될 수 있다. 예를 들어, 질환은 유전자 질환일 수 있으며, 유전자 편집은 유전자 질환과 관련된 유전자 돌연변이를 고친다. 대안적으로, 질환은 유전자의 비정상적인 발현과 관련이 있을 수 있으며, 유전자 편집은 이러한 비정상적인 발현을 구제한다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템을 치료를 필요로 하는 대상체(예를 들어, 인간 환자)에게 투여하는 단계를 포함하는, 질환을 치료하는 방법이 본 명세서에 제공된다. 유전자 편집 시스템은 유전자 편집이 필요한 특정 조직 또는 특정 유형의 세포에 전달될 수 있다. 유전자 편집 시스템은 구성요소 중 하나 이상을 포함하는 LNP, 구성요소 중 하나 이상을 암호화하는 하나 이상의 벡터(예를 들어, 바이러스 벡터) 또는 이들의 조합을 포함할 수 있다. 유전자 편집 시스템의 구성요소는 하나 이상의 약제학적으로 허용 가능한 담체를 추가로 포함할 수 있는 약제학적 조성물을 형성하도록 제형화될 수 있다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템을 사용하여 생산된 변형된 세포는 치료를 필요로 하는 대상체(예를 들어, 인간 환자)에게 투여될 수 있다. 변형된 세포는 본 명세서에 기재된 치환, 삽입 및/또는 결실을 포함할 수 있다. 일부 예에서, 변형된 세포는 CRISPR 뉴클레이스, 역전사효소 폴리펩타이드 및 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)에 의해 변형된 세포주를 포함할 수 있다. 일부 경우에, 변형된 세포는 다양한 유형의 유전자 편집을 갖는 세포를 포함하는 이종 집단일 수 있다. 대안적으로, 변형된 세포는 하나의 특정 유전자 편집을 포함하는 실질적으로 균질한 세포 집단(예를 들어, 전체 집단 중 적어도 80%의 세포)을 포함할 수 있다. 일부 예에서, 세포는 적합한 배지에 현탁될 수 있다.
일부 실시형태에서, 유전자 편집 시스템 또는 이의 구성요소 또는 변형된 세포를 포함하는 조성물이 본 명세서에 제공된다. 이러한 조성물은 약제학적 조성물일 수 있다. 유용한 약제학적 조성물은 경구, 직장, 질, 비경구, 국소, 폐, 비강내, 병변내, 협측, 안구, 정맥내, 기관내 또는 또 다른 투여 경로에 적합한 제형으로 제조, 패키징 또는 판매될 수 있다. 본 개시내용의 약제학적 조성물은 단일 단위 용량 또는 복수의 단일 단위 용량으로 대량으로 제조, 패키징 또는 판매될 수 있다. 본 명세서에서 사용되는 "단위 용량"은 미리 결정된 수의 세포를 포함하는 약제학적 조성물의 개별적인 양이다. 세포의 수는 일반적으로 대상체에게 투여될 세포의 투여량과 동일하거나 또는, 예를 들어, 이러한 투여량의 1/2 또는 1/3과 같은 투여량의 편리한 분율(fraction)과 동일하다.
비경구 투여에 적합한 약제학적 조성물의 제형은 멸균수 또는 멸균 등장성 식염수와 같은 약제학적으로 허용 가능한 담체와 조합된 활성제(예를 들어, 유전자 편집 시스템 또는 이의 구성요소 또는 변형된 세포)를 포함할 수 있다. 이러한 제형은 볼루스 투여 또는 연속 투여에 적합한 형태로 제조, 패키징 또는 판매될 수 있다. 일부 주사용 제형은 보존제를 포함하는 앰풀 또는 다회 투여 용기와 같은 단위 투여 형태로 제조, 패키징 또는 판매될 수 있다. 비경구 투여를 위한 일부 제형은 현탁액, 용액, 유성 또는 수성 비히클 중 에멀션, 페이스트 및 이식형 지속 방출 또는 생분해성 제형을 포함하지만 이에 제한되지 않는다. 일부 제형은 현탁제, 안정화제 또는 분산제를 포함하지만 이에 제한되지 않는 하나 이상의 추가적인 성분을 추가로 포함할 수 있다.
약제학적 조성물은 멸균 주사용 수성 또는 유성 현탁액 또는 용액의 형태일 수 있다. 이러한 현탁액 또는 용액은 공지된 기술에 따라 제형화될 수 있고, 세포 이외에 본 명세서에 기재된 분산제, 습윤제 또는 현탁제와 같은 추가적인 성분을 포함할 수 있다. 이러한 멸균 주사용 제형은 물 또는 식염수와 같은 무독성의 비경구적으로 허용 가능한 희석제 또는 용매를 사용하여 제조될 수 있다. 다른 허용 가능한 희석제 및 용매는 링거 용액, 등장성 소듐 클로라이드 용액 및 합성 모노- 또는 다이-글리세리드와 같은 고정유를 포함하지만 이에 제한되지 않는다. 유용한 기타 비경구적으로 투여 가능한 제형은 패키징된 형태로, 리포솜 제제로 또는 생분해성 중합체 시스템의 구성요소로서 세포를 포함할 수 있는 것들을 포함한다. 지속 방출 또는 이식을 위한 일부 조성물은 에멀션, 이온 교환 수지, 난용성 중합체 또는 난용성 염과 같은 약제학적으로 허용 가능한 중합체성 또는 소수성 물질을 포함할 수 있다.
V. 키트 및 이의 용도
본 개시내용은 또한, 예를 들어, 본 명세서에 기재된 방법을 수행하기 위해 사용될 수 있는 키트 또는 시스템을 제공한다. 일부 실시형태에서, 키트 또는 시스템은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소를 포함한다. 일부 실시형태에서, 키트 또는 시스템은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소를 암호화하는 폴리뉴클레오타이드를 포함하고, 선택적으로 폴리뉴클레오타이드는, 예를 들어, 본 명세서에 기재된 바와 같은 벡터 내에 포함된다. 일부 실시형태에서, 키트 또는 시스템은 유형 V 뉴클레이스-역전사효소 융합 폴리펩타이드(예를 들어, Cas12i2-RT 융합체 또는 Cas12i4-RT 융합체와 같은 Cas12i-역전사효소 융합 폴리펩타이드)를 포함한다. 키트 또는 시스템은 또한 본 명세서에 기재된 바와 같은 역전사효소 및 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)를 포함할 수 있다. 본 발명의 키트 또는 시스템의 RNA 가이드 및/또는 RT 공여체 RNA는 관심 서열을 표적화하도록 설계될 수 있다. CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스), 역전사효소 및 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)는 키트 또는 시스템 내의 동일한 바이알 또는 다른 용기에 패키징될 수 있거나 또는 사용하기 전에 내용물이 혼합될 수 있는 별도의 바이알 또는 다른 용기에 패키징될 수 있다. 키트 또는 시스템은 선택적으로 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)와 함께 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소의 사용을 위한 완충액 및/또는 지침을 추가적으로 포함할 수 있다.
일부 실시형태에서, 키트는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스 및 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)를 포함하는 제1 조성물을 포함한다. 일부 실시형태에서, 키트는 RNA 가이드 또는 RNA 가이드 및 RT 공여체 RNA(예를 들어, 편집 주형 RNA)를 포함하는 제2 조성물을 포함한다. 일부 실시형태에서, 제1 조성물 및 제2 조성물은 동일한 바이알 내에 패키징된다. 일부 실시형태에서, 제1 조성물 및 제2 조성물은 상이한 바이알 내에 패키징된다.
일부 실시형태에서, 키트는 연구 목적으로 유용할 수 있다. 예를 들어, 일부 실시형태에서, 키트는 유전자 기능을 연구하는 데 유용할 수 있다.
본 명세서에 인용된 모든 참조문헌 및 간행물은 참조에 의해 본 명세서에 원용된다.
추가적인 실시형태
본 개시내용의 범위 내에 있는 추가적인 실시형태도 아래에 제공된다.
실시형태 1: 다음을 포함하는 조성물:
(a) 선택적으로 Cas12 폴리펩타이드인, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산;
(b) 유형 V 뉴클레이스 결합 서열(예를 들어, 직접 반복 서열) 및 DNA-결합 서열(예를 들어, 스페이서 서열)을 포함하는, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산;
(c) 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산; 및
(d) 프라이머 결합을 포함하는 역전사 공여체 RNA(RT 공여체 RNA).
실시형태 1에서, 유형 V CRISPR 뉴클레이스는 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) 폴리펩타이드일 수 있다. 일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12i 폴리펩타이드이며, 선택적으로 Cas12i1 폴리펩타이드 또는 변이형 Cas12i1 폴리펩타이드, Cas12i2 폴리펩타이드 또는 변이형 Cas12i2 폴리펩타이드, Cas12i3 폴리펩타이드 또는 변이형 Cas12i3 폴리펩타이드 또는 Cas12i4 폴리펩타이드 또는 변이형 Cas12i4 폴리펩타이드를 포함한다.
실시형태 2: 실시형태 1의 조성물은 다음 중 하나일 수 있는 Cas12i 폴리펩타이드를 포함할 수 있다:
(a) Cas12i1 폴리펩타이드는 서열번호 8과 적어도 80%의 동일성; 선택적으로 서열번호 8과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 80%의 동일성; 선택적으로 서열번호 2 내지 7 중 어느 하나와 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11과 적어도 80%의 동일성; 선택적으로 서열번호 11과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9와 적어도 80%의 동일성 또는 서열번호 10과 적어도 80%의 동일성; 선택적으로 서열번호 9와 적어도 95%의 동일성 또는 서열번호 10과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함한다.
특정 예에서, 실시형태 2의 조성물은 다음 중 하나를 포함한다:
(a) Cas12i1 폴리펩타이드는 서열번호 8에 제시된 아미노산 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나에 제시된 아미노산 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11에 제시된 아미노산 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10에 제시된 아미노산 서열을 포함한다.
본 명세서에 개시된 실시형태 2의 임의의 조성물은 감소된 crRNA 처리 활성을 갖거나 또는 crRNA 처리 활성이 결여되어 있는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함할 수 있다. 예를 들어, 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12i2 폴리펩타이드이되, Cas12i2 폴리펩타이드는 H485 또는 H486 위치에 치환을 포함한다. 일부 경우에, Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 80%의 동일성을 포함하되, Cas12i2 폴리펩타이드는 H485 또는 H486 위치에 치환을 포함한다. 일부 예에서, Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 95%의 동일성을 포함하되, Cas12i2 폴리펩타이드는 H485 또는 H486 위치에 치환을 포함한다.
본 명세서에 개시된 실시형태 2의 임의의 조성물은 에피토프 펩타이드, 핵 국재화 신호 및 핵외 수송 신호 중 적어도 하나를 포함하는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함할 수 있다.
일부 예에서, 실시형태 2의 조성물은 다음 중 하나를 포함한다:
(a) Cas12i1 폴리펩타이드는 서열번호 8과 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 12 내지 14 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 15 내지 17 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11과 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 18 내지 20 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 21 내지 24 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다.
일부 예에서, 실시형태 2의 조성물 다음 중 하나를 포함한다:
(a) Cas12i1 폴리펩타이드는 서열번호 8과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 12 내지 14 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 15 내지 17 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 18 내지 20 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 21 내지 24 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다.
실시형태 3: 본 명세서에 개시된 실시형태 1 또는 실시형태 2의 임의의 조성물의 스페이서 서열은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 예에서, 스페이서 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다. 일부 예에서, 스페이서 서열은 표적 핵산의 표적 가닥(예를 들어, 표적 서열의 상보적 서열)에 실질적으로 상보적이다. 일부 예에서, 표적 서열은 비표적 가닥의 프로토스페이서 인접 모티프(PAM) 서열에 인접해 있다.
실시형태 4: 실시형태 1, 2 또는 3의 임의의 조성물은 Cas12i 폴리펩타이드인 유형 V 뉴클레이스를 포함할 수 있고, PAM 서열은 5'-NTTN-3'으로 제시된 서열을 포함하되, N은 임의의 뉴클레오타이드이다.
실시형태 5: 임의의 이전 실시형태의 임의의 조성물에서, 역전사효소 폴리펩타이드는 MMLV-RT, MMTV-RT, 마라톤-RT 또는 RTX 역전사효소를 포함한다.
실시형태 6: 임의의 실시형태 1 내지 5의 임의의 조성물에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드에 융합된다. 일부 예에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드의 N-말단에 융합된다. 다른 예에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드의 C-말단에 융합된다. 또 다른 예에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드의 루프 내에 삽입된다.
실시형태 7: 임의의 실시형태 1 내지 5의 임의의 조성물에서, 역전사효소 폴리펩타이드 및 유형 V CRISPR 뉴클레이스 폴리펩타이드는 류신 지퍼, 나노바디, 항체 또는 이중 코일 도메인을 통해 복합체를 형성한다.
실시형태 8: 임의의 실시형태 1 내지 7의 임의의 조성물에서, RT 공여체 RNA는 RNA 가이드에 융합될 수 있다. 일부 예에서, RT 공여체 RNA는 RNA 가이드의 5' 말단에 융합될 수 있다. 다른 예에서, RT 공여체 RNA는 RNA 가이드의 3' 말단에 융합될 수 있다. 일부 경우에, RNA 가이드의 스페이서 서열은 RT 공여체 RNA의 역전사 주형 서열에 인접해 있다. 대안적으로, RNA 가이드의 스페이서 서열은 RT 공여체 RNA의 PBS에 인접해 있다. 다른 경우에, RNA 가이드의 직접 반복 서열은 RT RNA 공여체의 역전사 주형 서열에 인접해 있다. 대안적으로, RNA 가이드의 직접 반복 서열은 RT 공여체 RNA의 PBS에 인접해 있다.
일부 예에서, RT 공여체 RNA-RNA 가이드 융합체 폴리뉴클레오타이드는 링커를 추가로 포함할 수 있다. 일부 경우에, 링커는 직접 반복 서열과 PBS 사이에 있다. 다른 경우에, 링커는 스페이서 서열과 역전사 주형 서열 사이에 있다. 링커는 약 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, 링커는 헤어핀을 포함한다.
실시형태 9: 실시형태 1 내지 8 중 어느 하나의 임의의 조성물에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이일 수 있다. 예를 들어, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다. 일부 경우에, PBS는 비표적 가닥(PAM 가닥)의 자유 3' 말단과 혼성화(염기-페어링을 통해 결합)한다. 다른 경우에, PBS는 표적 가닥(비-PAM 가닥)의 자유 3' 말단과 혼성화한다.
실시형태 10: 실시형태 1 내지 9 중 어느 하나의 임의의 조성물에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 예를 들어, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
실시형태 11: 실시형태 1 내지 10 중 어느 하나의 임의의 조성물에서, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥(이중-가닥)에 대한 실질적인 상보성을 갖는다. 예를 들어, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥과 적어도 약 75%의 상보성을 포함한다. 다른 예에서, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥과 적어도 약 85%의 상보성을 포함한다. 다른 예에서, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥과 적어도 약 95%의 상보성을 포함한다.
실시형태 12: 실시형태 1 내지 11 중 어느 하나의 임의의 조성물에서, 역전사 주형 서열은 압타머를 포함한다. 일부 경우에, 압타머는 역전사효소 폴리펩타이드를 동원한다.
실시형태 13: 실시형태 1 내지 11 중 어느 하나의 임의의 조성물에서, 역전사 주형은, 예를 들어, 5' 말단 또는 3' 말단에 변형을 포함한다. 일부 예에서, 변형은 화학적 변형이다. 다른 예에서, 변형은 2차 구조를 포함하는 핵산 서열이다. 특정 예에서, 변형은 헤어핀, 슈도노트, 삼중 구조, 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 특정 예에서, 변형은 뉴클레이스 결합 서열(예를 들어, 하나 이상의 직접 반복 서열) 또는 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함한다.
실시형태 1 내지 13 중 어느 하나의 임의의 조성물은 표적 가닥 또는 비표적 가닥에 편집을 도입할 수 있다. 일부 예에서, 편집은 치환, 삽입 또는 결실이다. 일부 경우에, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환이다. 일부 경우에, 편집은 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환이다. 일부 경우에, 편집은 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환이다. 다른 경우에, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입, 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입이다. 일부 예에서, 삽입은 헤어핀을 포함한다. 또 다른 경우에, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실이다. 예를 들어, 편집은 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실이다.
일부 예에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 내에서 발생한다. 일례에서, 편집은 PAM 서열의 약 100개의 뉴클레오타이드 내에서 발생한다. 또 다른 예에서, 편집은 PAM 서열의 약 50개의 뉴클레오타이드 내에서 발생한다. 또 다른 예에서, 편집은 PAM 서열의 약 30개의 뉴클레오타이드 내에서 발생한다. 또 다른 예에서, 편집은 PAM 서열의 약 20개의 뉴클레오타이드 내에서 발생한다.
일부 예에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
다른 예에서, 편집은 PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다. 일부 예에서, 편집은 유형 V CRISPR 뉴클레이스 폴리펩타이드에 의한 재표적화를 방지(예를 들어, 표적 서열에 대한 유형 V CRISPR 뉴클레이스의 결합을 방지)한다.
실시형태 14: 실시형태 1 내지 13의 임의의 조성물에서, 표적 서열은 세포에 존재한다.
실시형태 15: 실시형태 1 내지 14의 임의의 조성물은 세포로의 전달을 위해 제형화될 수 있다. 일부 예에서, 세포는 포유동물 세포, 예를 들어, 인간 세포이다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 단일 전달 비히클로 제형화된다.
다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 2개 이상의 전달 비히클로 제형화된다.
또 다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 단일 전달 비히클로 제형화된다.
일부 예에서, RNA 가이드 및 RT 공여체 RNA는 단일 전달 비히클로 제형화된다. 일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 제1 전달 비히클로 제형화되고, RNA 가이드 및 RT 공여체 RNA는 제2 전달 비히클로 제형화된다.
실시형태 16: 실시형태 1 내지 15 중 어느 하나의 임의의 조성물에서, 적용 가능한 경우, 유형 V CRISPR 뉴클레이스 폴리펩타이드, 역전사효소 폴리펩타이드, RNA 가이드 및/또는 RT 공여체 RNA는 하나 이상의 벡터, 예를 들어, 하나 이상의 발현 벡터에서 암호화된다.
실시형태 17: 임의의 실시형태 1 내지 16의 조성물의 유형 V CRISPR 뉴클레이스 폴리펩타이드, 역전사효소 폴리펩타이드, RNA 가이드 및/또는 RT 공여체 RNA를 암호화하는 서열을 포함하는 벡터.
실시형태 18: 실시형태 1 내지 16 중 어느 하나의 조성물 또는 실시형태 17의 벡터를 포함하는 세포. 일부 예에서, 세포는 포유동물 세포, 예를 들어, 인간 세포이다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 19: 실시형태 17의 벡터를 발현시키는 방법.
실시형태 20: 실시형태 1 내지 17 중 어느 하나의 조성물을 생산하는 방법.
실시형태 21: 실시형태 1 내지 16 중 어느 하나의 조성물을 전달하는 방법.
일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 단일 전달 비히클로 전달된다.
다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 2개 이상의 전달 비히클로 전달된다.
또 다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 단일 전달 비히클로 전달된다.
일부 경우에, RNA 가이드 및 RT 공여체 RNA는 단일 전달 비히클로 전달된다.
특정 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 제1 전달 비히클로 전달되고, RNA 가이드 및 RT 공여체 RNA는 제2 전달 비히클로 전달된다.
실시형태 22: 실시형태 1 내지 16 중 어느 하나의 조성물을 표적 핵산에 결합시키는 방법. 일부 예에서, 표적 핵산은 세포, 예를 들어, 인간 세포와 같은 포유동물 세포에 존재한다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 23: 표적 핵산을 실시형태 1 내지 16 중 어느 하나의 조성물과 접촉시키는 단계를 포함하는, 편집을 표적 핵산에 도입하는 방법. 일부 예에서, 조성물은 편집을 표적 핵산의 표적 가닥 또는 비표적 가닥에 도입한다. 일부 경우에, 편집은 치환, 삽입 또는 결실이다.
특정 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환이다. 다른 특정 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입이다. 일부 경우에, 삽입은 헤어핀을 포함한다. 또 다른 특정 예에서, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실이다.
일부 경우에, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 내에서 발생하고, 예를 들어, PAM 서열의 약 100개의 뉴클레오타이드 내에서 발생하고, PAM 서열의 약 50개의 뉴클레오타이드 내에서 발생하고, PAM 서열의 약 30개의 뉴클레오타이드 내에서 발생하거나 또는 PAM 서열의 약 20개의 뉴클레오타이드 내에서 발생한다.
일부 경우에, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 상류에 있는 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
대안적으로, 편집은 PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다.
실시형태 24: 편집 주형 RNA는,
(a) CRISPR 뉴클레이스 결합 서열;
(b) 표적 가닥 및 비표적 가닥을 포함하는 표적 핵산의 표적 가닥(예를 들어, 표적 서열의 상보적 서열)과 상보적인 DNA-결합 서열로서, 표적 서열은 비표적 가닥의 프로토스페이서 인접 모티프(PAM) 서열에 인접해 있는, 상기 DNA-결합 서열; 및
(c) 프라이머 결합 부위(PBS) 및 역전사 주형 서열을 포함하는 역전사 공여체 RNA(RT 공여체 RNA)로서, PBS는 표적 서열에 인접한 서열과 실질적으로 상보적이고, 역전사 주형 서열은 표적 핵산에 대해 적어도 하나의 암호화된 편집을 포함하는, 상기 역전사 공여체 RNA
를 포함하되, DNA-결합 서열과 PBS는 표적 핵산의 동일한 가닥에 결합한다.
실시형태 25: 실시형태 24의 편집 주형 RNA에서, DNA-결합 서열과 PBS는 표적 핵산의 표적 가닥(비-PAM 가닥)에 결합한다.
실시형태 26: 실시형태 24의 편집 주형 RNA에서, 적어도 하나의 암호화된 편집은 표적 핵산의 비표적 가닥(PAM 가닥)에 대한 것이다.
실시형태 27: 실시형태 24 내지 26 중 어느 하나의 편집 주형 RNA는 표적 핵산에 결합될 때 짝을 이루지 않은 뉴클레오타이드의 영역을 포함한다. 예를 들어, 짝을 이루지 않은 뉴클레오타이드의 영역은 DNA-결합 서열에 인접해 있다. 대안적으로 또는 이에 더하여, 짝을 이루지 않은 뉴클레오타이드의 영역은 PBS에 인접해 있다. 일부 경우에, 짝을 이루지 않은 뉴클레오타이드의 영역은 역전사 주형 서열을 포함한다.
실시형태 28: 실시형태 24 내지 27 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열, PBS 및 역전사 주형 서열은 RNA 서열이다.
실시형태 29: 실시형태 24 내지 28 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스에 결합한다.
실시형태 30: 실시형태 24 내지 28 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 유형 V CRISPR 뉴클레이스에 결합한다. 일부 예에서, CRISPR 뉴클레이스 결합 서열은 Cas12i 폴리펩타이드 또는 변이형 Cas12i 폴리펩타이드에 결합한다. 일부 경우에, CRISPR 뉴클레이스 결합 서열은 서열번호 2 내지 11 중 어느 하나와 적어도 80%의 동일성을 갖는 폴리펩타이드에 결합한다. 일례에서, CRISPR 뉴클레이스 결합 서열은 서열번호 2 내지 11 중 어느 하나와 적어도 95%의 동일성을 갖는 폴리펩타이드에 결합한다. 또 다른 예에서, CRISPR 뉴클레이스 결합 서열은 서열번호 2 내지 11 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드에 결합한다.
실시형태 31: 실시형태 24 내지 30 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 감소된 crRNA 처리 활성을 갖고 있거나 또는 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스에 결합한다.
실시형태 32: 실시형태 24 내지 31 중 어느 하나의 임의의 편집 주형 RNA에서, 적용 가능한 경우, CRISPR 뉴클레이스 결합 서열은 직접 반복 서열이다. 일부 예에서, CRISPR 뉴클레이스 결합 서열은 Cas9 직접 반복 서열이다. 다른 예에서, CRISPR 뉴클레이스 결합 서열은 Cas12i 직접 반복 서열이다. 일부 경우에, CRISPR 뉴클레이스 결합 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다. 예를 들어, CRISPR 뉴클레이스 결합 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다. 일례에서, CRISPR 뉴클레이스 결합 서열은 서열번호 12 내지 24 중 어느 하나에 제시된 뉴클레오타이드 서열을 포함한다.
실시형태 33: 실시형태 24 내지 32 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열에 인접해 있다. 예를 들어, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다.
실시형태 34: 실시형태 24 내지 33 중 어느 하나의 임의의 편집 주형 RNA에서, DNA-결합 서열은 RNA 서열, DNA 서열 또는 RNA/DNA 하이브리드 서열이다.
실시형태 35, 실시형태 24 내지 34 중 어느 하나의 임의의 편집 주형 RNA에서, DNA-결합 서열(예를 들어, 스페이서 서열)은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 예에서, DNA-결합 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다.
실시형태 36, 실시형태 24 내지 35 중 어느 하나의 임의의 편집 주형 RNA에서, DNA-결합 서열은 PBS에 인접해 있다. 일부 예에서, PBS는 DNA-결합 서열의 3' 연장부이다.
실시형태 37: 실시형태 24 내지 36 중 어느 하나의 임의의 편집 주형 RNA에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이이다. 예를 들어, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다.
실시형태 38: 실시형태 24 내지 37 중 어느 하나의 임의의 편집 주형 RNA에서, PBS는 역전사 주형 서열에 인접해 있다. 일부 예에서, 역전사 주형 서열은 PBS의 3' 연장부이다.
실시형태 39: 실시형태 24 내지 38 중 어느 하나의 임의의 편집 주형 RNA에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 일부 예에서, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
실시형태 40: 실시형태 24 내지 39 중 어느 하나의 임의의 편집 주형 RNA는, 5'에서 3'로, 뉴클레이스 결합 서열, DNA-결합 서열, 역전사 주형 및 PBS를 포함할 수 있다.
실시형태 41: 실시형태 24 내지 39 중 어느 하나의 임의의 편집 주형 RNA는, 5'에서 3'로, 역전사 주형, PBS, 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함할 수 있다.
실시형태 42: 실시형태 24 내지 41 중 어느 하나의 임의의 편집 주형 RNA에서, PBS의 3' 말단은 변형을 포함한다.
실시형태 43: 실시형태 24 내지 42 중 어느 하나의 임의의 편집 주형 RNA에서, 역전사 주형의 5' 말단은 변형을 포함한다.
실시형태 44: 실시형태 42 또는 43의 편집 주형 RNA에서, 변형은 화학적 변형이다.
실시형태 45: 실시형태 42 또는 43의 편집 주형 RNA에서, 변형은 2차 구조를 포함하는 핵산 서열이다. 예를 들어, 변형은 헤어핀, 슈도노트, 삼중 구조, xrRNA, tRNA 또는 절단형 tRNA이다.
실시형태 46: 실시형태 42 또는 43의 편집 주형 RNA에서, 변형은 뉴클레이스 결합 서열 또는 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다.
실시형태 47: 실시형태 24 내지 47 중 어느 하나의 임의의 편집 주형 RNA는 치환, 삽입 또는 결실일 수 있는 편집을 유발할 수 있다. 일부 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환이다. 다른 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입이다. 일부 경우에, 삽입은 헤어핀을 포함한다. 또 다른 예에서, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실이다.
일부 예에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 이내, 예를 들어, PAM 서열의 약 100개의 뉴클레오타이드 이내, PAM 서열의 약 50개의 뉴클레오타이드 이내, PAM 서열의 약 30개의 뉴클레오타이드 이내 또는 PAM 서열의 약 20개의 뉴클레오타이드 이내에 있다.
일부 예에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
다른 예에서, 편집은 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 일례에서, 편집은 PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 또 다른 예에서, 편집은 PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다. 대안적으로 또는 이에 더하여, 편집은 유형 V CRISPR 뉴클레이스 폴리펩타이드에 의한 재표적화를 방지한다(예를 들어, 표적 서열에 대한 유형 V CRISPR 뉴클레이스의 결합을 방지함).
실시형태 48: 실시형태 24 내지 47 중 어느 하나의 편집 주형 RNA는 세포, 예를 들어, 인간 세포와 같은 포유동물 세포에 존재한다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 49: 실시형태 24 내지 47 중 어느 하나의 편집 주형 RNA는 세포 예를 들어, 인간 세포와 같은 포유동물 세포로의 전달을 위해 제형화된다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다. 일부 예에서, 편집 주형 RNA는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다. 다른 예에서, 편집 주형 RNA는 CRISPR 뉴클레이스 폴리펩타이드 또는 CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다.
실시형태 50: 실시형태 24 내지 49 중 어느 하나의 편집 주형 RNA는, 적용 가능한 경우, 벡터에 암호화된다.
실시형태 51: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 암호화하는 서열을 포함하는 벡터.
실시형태 52: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 포함하는 복합체. 일부 예에서, 복합체는 CRISPR 뉴클레이스를 포함한다. 다른 예에서, 복합체는 표적 서열 또는 표적 핵산을 포함한다. 또 다른 예에서, 복합체는 CRISPR 뉴클레이스 및 표적 서열 또는 표적 핵산을 포함한다.
일부 예에서, CRISPR 뉴클레이스는 닉케이스이다. 다른 예에서, CRISPR 뉴클레이스는 DNA 이중체의 두 가닥을 모두 절단한다. 또 다른 예에서, CRISPR 뉴클레이스는 평활 절단(blunt cutting) 뉴클레이스이다. 대안적으로, CRISPR 뉴클레이스는 점착 절단(staggered cutting) 뉴클레이스이다.
실시형태 53: 실시형태 24 내지 52 중 어느 하나의 편집 주형 RNA, 벡터 또는 복합체를 포함하는 세포. 일부 경우에, 세포는 인간 세포와 같은 포유동물 세포이다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 54: 실시형태 31의 벡터를 발현시키는 방법.
실시형태 55: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 생산하는 방법.
실시형태 56: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 절단하는 방법. 일부 경우에, 편집 주형 RNA는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다. 다른 예에서, 편집 주형 RNA는 CRISPR 뉴클레이스 폴리펩타이드 또는 CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다.
실시형태 57: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 CRISPR 뉴클레이스와 결합시키는 방법.
실시형태 58: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 표적 서열 또는 표적 핵산과 결합시키는 방법.
실시형태 59: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 CRISPR 뉴클레이스 및 표적 서열 또는 표적 핵산과 결합시키는 방법.
실시형태 60: 표적 핵산을 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA 및 CRISPR 뉴클레이스와 접촉시키는 단계를 포함하는, 표적 핵산에 편집을 도입시키는 방법. 일부 경우에, CRISPR 뉴클레이스는 유형 II CRISPR 뉴클레이스이다. 다른 경우에, CRISPR은 유형 V CRISPR 뉴클레이스이다. 예를 들어, CRISPR 뉴클레이스는 Cas12i 폴리펩타이드 또는 변이형 Cas12i 폴리펩타이드이다. 특정 예에서, CRISPR 뉴클레이스는 임의의 서열번호 2 내지 11과 적어도 80%의 동일성, 예를 들어, 임의의 서열번호 2 내지 11과 적어도 95%의 동일성을 갖는 폴리펩타이드이다. 일례에서, CRISPR 뉴클레이스는 임의의 서열번호 2 내지 11의 아미노산 서열을 포함하는 폴리펩타이드이다.
일부 예에서, CRISPR 뉴클레이스는 감소된 crRNA 처리 활성을 포함하거나 또는 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스이다.
일부 예에서, CRISPR 뉴클레이스는 닉케이스이다. 대안적으로, CRISPR 뉴클레이스는 DNA 이중체의 두 가닥을 모두 절단한다. 일부 경우에, CRISPR 뉴클레이스는 평활 절단 뉴클레이스이다. 대안적으로, CRISPR 뉴클레이스는 점착 절단 뉴클레이스이다.
실시형태 61: 실시형태 60의 방법에서, 편집 주형 RNA는 편집을 표적 핵산의 표적 가닥에 도입한다. 일부 예에서, 편집은 치환, 삽입 또는 결실이다. 예를 들어, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환일 수 있다. 대안적으로, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입일 수 있다. 일부 경우에, 삽입은 헤어핀을 포함한다. 다른 예에서, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실일 수 있다.
일부 예에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 이내, 예를 들어, PAM 서열의 약 100개의 뉴클레오타이드 이내, PAM 서열의 약 50개의 뉴클레오타이드 이내, PAM 서열의 약 30개의 뉴클레오타이드 이내 또는 PAM 서열의 약 20개의 뉴클레오타이드 이내에 있다.
일부 예에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
다른 예에서, 편집은 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 일례에서, 편집은 PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 또 다른 예에서, 편집은 PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다. 대안적으로 또는 이에 더하여, 편집은 유형 V CRISPR 뉴클레이스 폴리펩타이드에 의한 재표적화를 방지한다(예를 들어, 표적 서열에 대한 유형 V CRISPR 뉴클레이스의 결합을 방지함).
일부 예에서, 표적 핵산은 세포, 예를 들어, 인간 세포와 같은 포유동물 세포에 존재한다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
일반적인 기법
본 개시내용의 실시는 달리 명시하지 않는 한 당해 분야의 기술 내에 있는 분자생물학(재조합 기법 포함), 미생물학, 세포 생물학, 생화학 및 면역학의 통상적인 기법을 사용할 것이다. 이러한 기법은 문헌[Molecular Cloning: A Laboratory Manual, second edition (Sambrook, et al., 1989) Cold Spring Harbor Press; Oligonucleotide Synthesis (M. J. Gait, ed. 1984); Methods in Molecular Biology, Humana Press; Cell Biology: A Laboratory Notebook (J. E. Cellis, ed., 1989) Academic Press; Animal Cell Culture (R. I. Freshney, ed. 1987); Introduction to Cell and Tissue Culture (J. P. Mather and P. E. Roberts, 1998) Plenum Press; Cell and Tissue Culture: Laboratory Procedures (A. Doyle, J. B. Griffiths, and D. G. Newell, eds. 1993-8) J. Wiley and Sons; Methods in Enzymology (Academic Press, Inc.); Handbook of Experimental Immunology (D. M. Weir and C. C. Blackwell, eds.): Gene Transfer Vectors for Mammalian Cells (J. M. Miller and M. P. Calos, eds., 1987); Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds. 1987); PCR: The Polymerase Chain Reaction, (Mullis, et al., eds. 1994); Current Protocols in Immunology (J. E. Coligan et al., eds., 1991); Short Protocols in Molecular Biology (Wiley and Sons, 1999); Immunobiology (C. A. Janeway and P. Travers, 1997); Antibodies (P. Finch, 1997); Antibodies: a practice approach (D. Catty., ed., IRL Press, 1988-1989); Monoclonal antibodies: a practical approach (P. Shepherd and C. Dean, eds., Oxford University Press, 2000); Using antibodies: a laboratory manual (E. Harlow and D. Lane (Cold Spring Harbor Laboratory Press, 1999); The Antibodies (M. Zanetti and J. D. Capra, eds. Harwood Academic Publishers, 1995); DNA Cloning: A practical Approach, Volumes I and II (D.N. Glover ed. 1985); Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds.(1985); Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984); Animal Cell Culture (R.I. Freshney, ed. (1986); Immobilized Cells and Enzymes (lRL Press, (1986); 및 B. Perbal, A practical Guide To Molecular Cloning (1984); F.M. Ausubel et al. (eds.)]과 같은 문헌에 자세히 설명되어 있다.
추가 설명 없이도, 당업자는 위의 설명에 기초하여 본 발명을 최대한 활용할 수 있다고 여겨진다. 따라서, 다음의 특정 실시형태는 단지 예시적인 것으로 해석되어야 하며, 어떤 식으로든 개시내용의 나머지 부분을 제한하지 않는 것으로 해석되어야 한다. 본 명세서에 인용된 모든 간행물은 본 명세서에 언급된 목적 또는 특허 대상에 참조에 의해 원용된다.
실시예
다음 실시예는 본 발명의 일부 실시형태를 추가로 설명하기 위해 제공되지만 본 발명의 범위를 제한하려는 의도는 아니며; 당업자에게 공지된 다른 절차, 방법론 또는 기법이 대안적으로 사용될 수 있다는 것이 이들의 예시적인 특성에 의해 이해될 것이다.
실시예 1 - 포유동물 세포에서 표적 가닥의 RNA-주형 편집
본 실시예는 포유동물 유전자의 표적 가닥 편집(예를 들어, 선택된 포유동물 유전자의 비-PAM 가닥에 결합하는 편집 주형 RNA를 사용)을 설명한다.
변이형 Cas12i2(서열번호 4)와 서열번호 29의 돌연변이 MMLV 역전사효소의 융합체를 pcda3.1 백본(Invitrogen)에 클로닝하였다. 변이형 Cas12i2에 대한 N-말단 및 C-말단 RT 융합체의 구성은 표 7에 나타나 있다. 변이형 Cas12i2와의 RT 융합체의 발현을 위한 플라스미드의 작업 용액을 물에서 제조하였다(변이형 Cas12i2-RT 융합체 작업 용액).
표 8에 나타나 있고 도 8a에 도시된 바와 같은 다양한 RNA 가이드-RT 공여체 RNA 융합체 구성을 테스트하였다. 역전사 주형 서열 및 PBS를 RNA 가이드의 3' 말단에 융합시켰다. 치환, 삽입, 결실 또는 헤어핀을 AAVS1_T7 표적 또는 VEGFA_T5 표적에 도입하도록 역전사 주형 서열을 설계하였다. RNA 가이드-RT 공여체 RNA 융합체의 서열은 표 9에 나타나 있으며, 부분적으로 도 8b에 도시되어 있다. 표 9 및 도 8b에서, "S"는 치환을 지칭하고, "I"는 삽입을 지칭하고, "D"는 결실을 지칭하고, "H"는 헤어핀을 지칭하며, PBS 길이는 괄호 안에 있다. 대조군으로 사용된 RNA 가이드의 서열만이 표 10에 나타나 있다. RNA 가이드-RT 공여체 RNA 융합체 또는 RNA 가이드를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙(maxi-prep)하였다. 각각의 RNA 가이드를 발현하는 플라스미드/RT 공여체 RNA 플라스미드(또는 RNA 가이드)의 작업 용액을 물(편집 주형 RNA 작업 용액)에서 제조하였다.
형질감염 대략 16시간 전에, DMEM/10%FBS+Pen/Strep 중 25,000개의 HEK293T 세포를 w96-웰 플레이트의 각 웰에 플레이팅하였다. 형질감염 당일, 세포는 70% 내지 90% 컨플루언트 상태였다. 형질감염될 각 웰에 Lipofectamine™ 2000(Themo Fisher)과 Opti-MEM™ 배지(Thermo Fisher)의 혼합물을 준비한 다음, 실온에서 5분 내지 20분 동안 인큐베이션하였다(용액 1). 인큐베이션 후, Lipofectamine™:OptiMEM™ 혼합물을 변이형 Cas12i2-RT 융합체 작업 용액, RNA 작업 용액 및 OptiMEM™ 배지를 포함하는 별도의 혼합물에 첨가하였다(용액 2). 용액 1과 용액 2의 혼합물을 위아래로 피펫팅하여 혼합한 다음, 실온에서 25분 동안 인큐베이션하였다. 인큐베이션 후, 용액 1과 용액 2의 혼합물을 세포가 담긴 96 웰 플레이트의 각 웰에 적가하였다. 형질감염 72시간 후, 각 웰의 중앙에 TrypLE™(ThermoFisher)를 첨가하여 세포를 트립신 처리하고, 대략 5분 동안 인큐베이션하였다. 그런 다음, 성장 배지를 각 웰에 첨가하고, 혼합하여 세포를 재현탁시켰다. 그런 다음, 세포를 400g에서 10분 동안 원심분리하고, 상청액을 버렸다. QuickExtract™ 완충액(Lucigen)을 원래 세포 현탁액 부피의 1/5 양으로 첨가하였다. 세포를 65℃에서 15분, 68℃에서 15분 및 98℃에서 10분 동안 인큐베이션하였다.
2라운드의 PCR에 의해 차세대 시퀀싱을 위한 샘플을 준비하였다. 1라운드(PCR1)를 사용하여 표적에 따라 특정 게놈 영역을 증폭시켰다. PCR1 산물을 칼럼 정제에 의해 정제하였다. 2라운드 PCR(PCR2)을 수행하여 Illumina 어댑터 및 인덱스를 추가하였다. 그런 다음, 반응물을 풀링하고, 칼럼 정제에 의해 정제하였다. 시퀀싱 실행은 150 주기의 NextSeq v2.5 중간 또는 고출력 키트로 수행하였다.
도 9a 도 9b는 AAVS1_T6에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9c 도 9d는 AAVS1_T7에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9e 도 9f는 EMX1_T6에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9g도 9h는 VEGFA_T2에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9i 도 9j VEGFA_T5에서 변이형 Cas12i2에 의한 활성을 보여준다. NGS 리드의 백분율은 y-축에 표시되고, 총 편집은 밝은 회색 막대로 표시되고, 암호화된 편집은 어두운 회색 막대로 표시된다. 데이터는 2개의 생체 복제물의 평균이며, 이들 각각은 3개의 기술적 복제물을 갖고 있다. 도 9a, 도 9c, 도 9e, 도 9g 도 9i에 도시된 바와 같이, 변이형 Cas12i2 및 변이형 Cas12i2-RT 융합체는 AAVS1_T6, AAVS1_T7, EMX1_T6, VEGFA_T2 또는 VEGFA_T5를 표적으로 하는 RNA 가이드의 존재하에 활성 뉴클레이스였다.
도 9b, 도 9d, 도 9f, 도 9h 도 9j에 도시된 바와 같이, RNA 가이드-RT 공여체 RNA 융합체 서열의 존재하에 변이형 Cas12i2-RT 융합체는 암호화된 치환, 삽입 및 결실을 AAVS1_T6, AAVS1_T7, EMX1_T6, VEGFA_T2 또는 VEGFA_T5에 도입시킬 수 있다. 13개, 30개 및 60개의 뉴클레오타이드의 PBS 길이에서 활성이 관찰되었다. C-말단 MMLV RT 융합체에 의한 편집은 변이형 Cas12i2와 N-말단 MMLV RT 융합체에 의한 편집을 초과하였다. 변이형 Cas12i2를 사용한 편집은 약 1% 내지 5% 범위이다.
본 실시예는 편집 주형 RNA 및 Cas12i2-RT 융합체를 사용하여 특정 편집이 선택된 포유동물 게놈 부위에 혼입되었음을 보여준다.
실시예 2 - 말단 보호된 편집 주형 RNA를 사용한 포유동물 세포에서의 표적 가닥의 편집
본 실시예는 포유동물 유전자의 표적 가닥 편집(예를 들어, 선택된 포유동물 유전자의 비-PAM 가닥에 결합하는 편집 주형 RNA 사용)을 설명한다.
서열번호 4의 변이형 Cas12i2와 서열번호 25의 변이형 Cas12i2-RT 융합체를 각각 pcda3.1 백본(Invitrogen)에 클로닝하였다. 변이형 Cas12i2와의 RT 융합체의 발현을 위한 플라스미드의 작업 용액을 물에서 제조하였다(변이형 Cas12i2-RT 융합체 작업 용액).
표 11에 나타나 있고 도 12a 도 12b에 도시된 바와 같은 다양한 RNA 가이드-RT 공여체 RNA 융합체 구성을 테스트하였다. 역전사 주형 서열과 PBS를 RNA 가이드의 5' 말단 또는 3' 말단에 융합시켰다. 추가적인 DR-스페이서 서열을 5' 또는 3' 말단에 추가하였다. 말단 보호를 위해 사용된 스페이서 서열은 인간을 표적으로 하지 않았다(즉, 인간 게놈의 임의의 서열을 표적으로 하지 않았다). RNA 가이드-RT 공여체 RNA 융합체의 서열은 표 12에 나타나 있고; RT 공여체에 암호화된 목적하는 편집은 소문자로 표시된다. 대조군으로 사용된 RNA 가이드만의 서열은 표 13에 나타나 있다. RNA 가이드-RT 공여체 RNA 융합체 또는 RNA 가이드를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙하였다. RNA 가이드/RT 공여체 RNA 플라스미드(또는 RNA 가이드)를 발현하는 각 플라스미드의 작업 용액을 물에서 제조하였다(편집 주형 RNA 작업 용액).
형질감염 대략 16시간 전에, DMEM/10%FBS+Pen/Strep 중 25,000개의 HEK293T 세포를 w96-웰 플레이트의 각 웰에 플레이팅하였다. 형질감염 당일, 세포는 70% 내지 90% 컨플루언트하였다. 형질감염될 각 웰에 Lipofectamine™ 2000(Themo Fisher)과 Opti-MEM™ 배지(Thermo Fisher)의 혼합물을 준비한 다음, 실온에서 5분 내지 20분 동안 인큐베이션하였다(용액 1). 인큐베이션 후, Lipofectamine™:OptiMEM™ 혼합물을 변이형 Cas12i2-RT 융합체 작업 용액, RNA 작업 용액 및 OptiMEM™ 배지를 포함하는 별도의 혼합물에 첨가하였다(용액 2). 용액 1과 용액 2의 혼합물을 위아래로 피펫팅하여 혼합한 다음, 실온에서 25분 동안 인큐베이션하였다. 인큐베이션 후, 용액 1과 용액 2의 혼합물을 세포가 담긴 96 웰 플레이트의 각 웰에 적가하였다. 형질감염 72시간 후, 각 웰의 중앙에 TrypLE™(ThermoFisher)를 첨가하여 세포를 트립신 처리하고, 대략 5분 동안 인큐베이션하였다. 그런 다음, 성장 배지를 각 웰에 첨가하고, 혼합하여 세포를 재현탁시켰다. 그런 다음, 세포를 400g에서 10분 동안 원심분리하고, 상청액을 버렸다. QuickExtract™ 완충액(Lucigen)을 원래 세포 현탁액 부피의 1/5 양으로 첨가하였다. 세포를 65℃에서 15분, 68℃에서 15분 및 98℃에서 10분 동안 인큐베이션하였다.
2라운드의 PCR에 의해 차세대 시퀀싱을 위한 샘플을 준비하였다. 1라운드(PCR1)를 사용하여 표적에 따라 특정 게놈 영역을 증폭시켰다. PCR1 산물을 칼럼 정제에 의해 정제하였다. 2라운드 PCR(PCR2)을 수행하여 Illumina 어댑터 및 인덱스를 추가하였다. 그런 다음, 반응물을 풀링하고, 칼럼 정제에 의해 정제하였다. 시퀀싱 실행은 150 주기의 NextSeq v2.5(Illumina) 중간 또는 고출력 키트로 수행하였다.
도 13a는 AAVS1_T7에 대한 활성을 보여주고, 도 13b는 EMX1_T6에 대한 활성을 보여주고, 도 13c VEGFA_T2에 대한 활성을 보여주고, 도 13d VEGFA_T5에 대한 활성을 보여준다. NGS 리드의 백분율은 y-축에 표시된다. 데이터는 3개의 기술적 복제물의 평균이다.
도 13a, 도 13b, 도 13c 도 13d에 도시된 바와 같이, 서열번호 4의 변이형 Cas12i2 및 서열번호 25의 변이형 Cas12i2-RT 융합체는 AAVS1_T7, EMX1_T6, VEGFA_T2 또는 VEGFA_T5를 표적으로 하는 RNA 가이드의 존재하에 활성 뉴클레이스였다(gRNA 샘플 참조). 목적하는 편집은 RT(서열번호 25의 변이형 Cas12i2-RT 융합체)의 존재하에서만 관찰되었다. Indel과 암호화된 편집은 서열번호 25의 변이형 Cas12i2-RT 융합체를 사용한 테스트된 편집 주형 RNA 각각에 대해 관찰되었다. 말단 보호된 5' 연장 편집 주형 RNA(말단 보호 - 역전사 주형 서열 - PBS - 뉴클레이스 결합 서열 - DNA-결합 서열)는 말단 보호가 없는 5' 연장 편집 주형 RNA(역전사 주형 서열 - PBS - 뉴클레이스 결합 서열 - DNA-결합 서열)와 비교하여 목적하는 편집을 갖는 더 높은 수의 리드를 보여주었다.
본 실시예는 편집 주형 RNA와 Cas12i2-RT 융합체의 여러 구성을 사용하여 특정 편집이 선택된 포유동물 게놈 부위에 혼입되었음을 보여준다.
실시예 3 - Cas12i2에 대한 시험관내 절단 패턴의 결정
본 실시예에서, RNA 가이드를 사용하여 변이형 Cas12i2의 시험관내 절단 패턴을 결정하였다. 이중 가닥 DNA 표적에서 Cas12i2에 의해 생성된 절단 부위의 결정은 편집 주형 RNA의 PBS 구성요소의 설계를 가능하게 한다.
절단 패턴을 결정하기 위한 검정의 개략도가 도 14a 내지 도 14c에 도시되어 있다. 절단 부위 분석을 위해 표적 서열을 포함하는 올리고를 먼저 설계하였다. 올리고는 표적의 양쪽 말단에 12개의 뉴클레오타이드 측접 서열을 갖는 표적 서열, 내부 바코드 및 표적화 증폭을 허용하는 프라이밍 부위로 구성되었다(도 14a). 도 14b에 도시된 바와 같이, 모든 절단 산물은 두 부분으로 나누었으며, 절반은 5' 및 3' 오버행을 평활 말단화시키는 녹두 뉴클레이스(mung bean nuclease: MBN)로 처리하고(평활 말단화 처리), 나머지 절반의 반응물은 말단 복구시키고(NEBNext DNA 라이브러리 프렙의 일부, New England Biolabs), 5' 오버행은 필인시켰다(필인 처리). 그런 다음, 두 부분 모두에 NGS 라이브러리 준비 및 반-표적화 증폭을 적용하였다. 유형 V CRISPR 뉴클레이스는 회색 화살표로 표시된 바와 같이 5' 오버행이 있는 점착 절단을 생성하는 것으로 나타났다. 이러한 절단 부위는 임의의 5' 오버행을 채우기 위한 필인 처리로 포착되었다. 따라서, 이러한 산물의 5' 및 3' 시퀀싱은 표적 가닥 및 비표적 가닥의 절단 부위를 나타낸다. Cpf1에 대한 최근 연구에서는 특히 필인 방법으로 포착되지 않은 비표적 가닥에서 추가적인 절단 부위가 나타났다. 이러한 절단 부위를 포착하기 위해, 평활 말단화 방법을 사용하면 모든 5' 및 3' 오버행이 평활 말단화된다. 결과적으로, 평활 말단화 방법에서 5' 절단 산물은 비표적 가닥의 임의의 추가적인 절단 부위를 나타내고, 3' 절단 산물은 표적 가닥의 추가적인 절단 부위를 나타낸다. NEBNext 어댑터 결찰 후 반-표적 증폭은 5' 및 3' 절단 산물의 특정 증폭을 가능하게 하였으며; 증폭된 산물을 풀링하고 NGS로 분석하였다(도 14c).
IR800 및 IR700 표지된 정방향 및 역방향 프라이머를 각각 사용하는 PCR 증폭에 의해 DNA 기질을 생성하여 IR800 표지된 표적 가닥 및 IR700 표지된 비표적 가닥을 갖는 dsDNA 표적을 생성하였다. PCR 산물을 CleanNGS SPRI 비드를 1.8x의 비드 대 PCR 산물의 비로 사용하여 세척하였다. 정제된 Cas12i2를 crRNA와 함께 사전 인큐베이션하여 NEBuffer 3(10mM Tris-HCl(pH 7.9), 150mM NaCl, 10mM MgCl2, 1mM DTT)에서 37℃에서 10분 동안 RNP를 형성시켰다. NEBuffer 3에 연속 희석된 RNP와 혼합된 dsDNA 기질을 포함하는 시험관내 절단 반응을 37℃에서 1시간 동안 수행하였다. EDTA로 반응을 중지시켰다. 반응물을 RNase 칵테일(37℃에서 15분)로 처리한 후, 프로테이네이스 K 처리(37℃에서 15분)하였다. 반응물을 15% TBE-Urea 겔을 사용하여 변성 겔 전기영동으로 분석하고, Odyssey CLx(LI-COR) 영상 장치에서 이미지화하였다. DNA 기질 및 RNA 가이드 서열은 표 14에 나타나 있으며; 표적 서열은 굵게 표시되어 있다.
절단 위치를 결정하기 위한 시험관내 절단 단편 분석을 위해, 반응 산물을 SPRI 비드와 아이소프로필 알코올(IPA SPRI)을 사용하여 정제하였다. 정제된 반응물을 두 부분으로 나누었다. 절반은 녹두 뉴클레이스(New England Biolabs)로 30℃에서 30분 동안 처리하여 5' 및 3' 오버행을 모두 제거하여 평활 말단을 생성한 후 IPA SPRI로 정제하였다. 그런 다음, 제조업체의 지침에 따라 NEBNext Ultra-II DNA 라이브러리 프렙 키트(New England Biolabs)를 사용하여 시퀀싱하기 위해 녹두 뉴클레이스 처리된 반쪽과 처리되지 않은 반쪽 모두를 준비하였다. 반-표적 증폭을 사용하여 각 샘플에 대해 5' 및 3' 절단 산물을 별도로 증폭하였다. 시퀀싱 전에 모든 앰플리콘을 풀링하고 겔을 추출하였다. 각 샘플에 대해, 녹두 뉴클레이스 및 비녹두 뉴클레이스 처리된 샘플의 5' 및 3' 절단 산물에 대해 얻은 리드 길이를 히스토그램으로 플로팅하고 표적 서열에 매핑하였다.
전체 절단 패턴을 얻기 위해, 4개의 히스토그램 모두로부터 얻은 데이터를 취하여 도 15a 내지 도 15e 도 16에 도시된 바와 같이 R-루프 다이어그램에 시각화하였다. 도 15b 내지 도 15e는 AAVS1_T2에 대한 5' 및 3' 절단 산물의 반-표적 증폭으로부터 얻은 리드 길이의 히스토그램을 보여준다. 도 15b 도 15d는 각각 필인 및 평활 말단화 처리에 대한 5' 절단 산물의 리드 길이 히스토그램을 보여준다. 도 15c 도 15e 각각 필인 및 평활 말단화 처리에 대한 3' 절단 산물의 리드 길이 히스토그램을 보여준다. 각각의 리드 길이 히스토그램을 x-축에 표시된 표적 서열에 매핑하였다. PAM 서열(5'-NTTT-3')도 표시되어 있다. 히스토그램으로부터 얻은 절단 부위는 도 15a의 R-루프 다이어그램에서 삼각형으로 표시된다. 도 16은 Cas12i2(서열번호 2) 또는 변이형 Cas12i2(서열번호 4)를 포함하는 RNP에 대한 AAVS1_T2 및 EMX1_T6의 절단 부위를 비교한 것이다. 기준 막대(오른쪽)는 시퀀싱 리드의 수로 측정된 경우 절단 빈도를 나타낸다.
모든 표적에 대해, 표적 가닥 및 비표적 가닥 모두에서 다양한 빈도의 다중 절단 부위가 관찰되었다. 비표적 가닥에서, 스페이서 영역(즉, RNA 가이드 결합 영역) 내뿐만 아니라 스페이서 영역의 외부에서 검출된 여러 절단 부위에서 광범위한 절단 프로파일이 관찰되었다. 이는 Cas12i2 결합 시, 이중-가닥 DNA가 스페이서 영역(즉, RNA 가이드 결합 영역)으로부터 여러 염기쌍을 풀고 단일 가닥 DNA로 존재하여 절단을 위해 Cas12i2에 접근할 수 있음을 나타낸다. 표적 가닥의 절단 부위는 스페이서 영역의 외부(즉, RNA 가이드 결합 영역의 외부)에서 일관되게 관찰되었다. AAVS1_T2의 경우, 표적 가닥 절단 부위는 PAM 서열의 22개 내지 24개의 뉴클레오타이드 위치에서 관찰되었다. VEGFA_T5 및 EMX1_T6의 경우, 표적 가닥 절단 부위는 PAM 서열의 22개 내지 23개의 뉴클레오타이드 위치에서 관찰되었다. 따라서, 이는 표적 가닥을 표적으로 하도록 설계된 편집 주형 RNA가 PAM 서열의 22개 내지 24개의 뉴클레오타이드에서 시작하는 PBS를 포함해야 함을 보여준다.
실시예 4 - 다양한 PBS 및 역전사 주형 서열 길이를 갖는 편집 주형 RNA를 사용한 포유동물 세포에서의 표적 가닥의 편집
본 실시예는 3개 내지 60개의 뉴클레오타이드의 PBS 길이 및 14개 내지 54개의 뉴클레오타이드의 역전사 주형 서열 길이를 갖는 편집 주형 RNA를 사용한 포유동물 유전자의 표적 가닥 편집을 설명한다.
서열번호 25의 변이형 Cas12i2-RT 융합체를 포함하는 플라스미드의 작업 용액을 물에서 제조하였다(변이형 Cas12i2-RT 융합체 작업 용액). 편집 주형 RNA 서열은 표 15에 나타나 있다. 첫 번째 조건의 세트에서, 역전사 주형 서열은 34개의 뉴클레오타이드 길이였고, PBS는 3개, 8개, 13개, 30개 또는 60개의 뉴클레오타이드 길이였다. 두 번째 조건의 세트에서, PBS는 13개의 뉴클레오타이드 길이였고, 역전사 주형 서열은 14개, 24개, 34개, 44개 또는 54개의 뉴클레오타이드 길이였다. 각각의 편집 주형 RNA를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙하였다. 각각의 편집 주형 RNA를 발현하는 플라스미드의 작업 용액을 물에서 제조하였다(편집 주형 RNA 작업 용액).
세포를 실시예 2에 기술된 바와 같이 형질감염시키고 분석하였다. 도 17a는 AAVS1_T7의 경우 서열번호 25의 Cas12i2-RT와 서열번호 183 내지 187의 편집 주형 RNA, EMX1_T6의 경우 서열번호 25의 Cas12i2-RT와 서열번호 193 내지 197의 편집 주형 RNA 및 VEGFA_T5의 경우 서열번호 25의 Cas12i2-RT와 서열번호 203 내지 207의 편집 주형 RNA의 활성을 보여준다. 도 17b는 AAVS1_T7의 경우 서열번호 25의 Cas12i2-RT와 서열번호 188 내지 192의 편집 주형 RNA, EMX1_T6의 경우 서열번호 25의 Cas12i2-RT와 서열번호 198 내지 202의 편집 주형 RNA 및 VEGFA_T5의 경우 서열번호 25의 Cas12i2-RT와 서열번호 208 내지 212의 편집 주형 RNA의 활성을 보여준다. 암호화된 편집 대 총 indel의 비는 도 17a 도 17b의 y-축에 나타나 있다.
도 17a에 도시된 바와 같이, 테스트된 각각의 PBS 길이로 인해 암호화된 편집이 선택된 표적 부위로 혼입되었다. 13개, 30개 및 60개의 뉴클레오타이드의 PBS 길이를 사용하면 암호화된 편집 대 총 indel의 비가 가장 높아졌다. 도 17b에 도시된 바와 같이, 24개, 34개, 44개 및 54개의 뉴클레오타이드의 테스트된 역전사 주형 서열 길이로 인해 암호화된 편집이 존재하게 되었다. EMX1_T6의 경우, 암호화된 편집은 13개의 뉴클레오타이드 길이의 PBS 및 34개 또는 44개의 뉴클레오타이드 길이의 역전사 주형 서열을 갖는 편집 주형 RNA를 사용한 총 편집의 약 30%를 차지하였다. 따라서, 본 실시예는 다양한 PBS 및 역전사 주형 서열 길이를 갖는 편집 주형 RNA가 포유동물 세포에서 암호화된 편집을 표적 서열에 도입시킴을 보여준다.
실시예 5 - U2OS 세포에서의 표적 가닥의 RNA-주형 편집
본 실시예는 U2OS 세포에서의 포유동물 유전자의 표적 가닥 편집을 설명한다.
서열번호 25의 변이형 Cas12i2-RT 융합체를 포함하는 플라스미드의 작업 용액을 물에서 제조하였다. 각각의 편집 주형 RNA를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고 맥시 프렙하였다. 각각의 편집 주형 RNA를 포함하는 플라스미드의 작업 용액을 물에서 제조하였다. 편집 주형 RNA 서열은 표 16에 나타나 있다. 추가적인 DR-스페이서 서열을 3' 말단에 추가하였으며, 추가적인 스페이서 서열은 인간을 표적으로 하지 않았다(즉, 이는 인간 게놈의 임의의 서열을 표적으로 하지 않았다). RT 공여체에 암호화된 목적하는 편집은 표 16에 소문자로 표시되어 있다.
U2OS 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 McCoy's-5A 배지(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 세포를 트립신 처리하고, 재현탁시키고, TrypLE™ Express(Thermo Fisher)를 사용하여 계수하였다. 800ng의 Cas12i2-RT 융합체 플라스미드와 200ng의 각각의 편집 주형 RNA 플라스미드의 혼합물을 사용하여 제조업체의 사전 설정된 DN-100 프로그램에 따라 SF 세포주 뉴클레오펙터 키트(Lonza)를 사용하여 400,000개 세포의 집단을 뉴클레오펙션시켰다. 그런 다음, 세포를 재현탁시키고, 미리 예열된 성장 배지가 담긴 96-웰 플레이트(40,000개 세포/웰)에 다시 플레이팅하였다. 뉴클레오펙션된 세포를 72시간 동안 배양하고 수거하였다.
실시예 2에 기술된 바와 같이 NGS로 편집을 분석하였다. 도 18에 도시된 바와 같이, 각각의 역전사 주형 서열에 의해 암호화된 편집은 NGS 리드의 약 5% 내지 8%에서 확인되었다. 암호화된 편집은 AAVS1_T7의 경우 총 indel의 대략 20%, EMX1_T6의 경우 총 indel의 대략 10%를 차지하였다. 따라서, 본 실시예 및 이전 실시예는 암호화된 편집이 여러 세포주의 유전자에 도입될 수 있음을 보여준다.
실시예 6 - Cas12i2-RT 융합체를 사용한 표적 가닥의 RNA-주형 편집
본 실시예는 MMLV RT(서열번호 29), RNase H 도메인(서열번호 224)이 결여되어 있는 서열번호 29의 MMLV RT의 변이체 또는 마라톤 RT(서열번호 232)에 융합된 Cas12i2 변이체를 사용한 포유동물 유전자의 표적 가닥 편집을 설명한다.
표 14의 Cas12i2-RT 융합체 서열을 pcDNA3.1 백본(Invitrogen)에 클로닝하였다. C-말단 RT 융합체는 Cas12i2의 N-말단에 있는 His 태그와 Cas12i2의 C-말단에 있는 이분형 뉴클레오플라스민 NLS(npNLS)로 구성되었다. npNLS 바로 뒤에는 GS-XTEN-GS 링커가 있었다. RT의 C-말단에는 이분형 SV40 NLS 태그가 있었다. N-말단 RT 융합체는 N-말단에 있는 이분형 SV40 NLS 태그와 RT의 C-말단에 있는 GS-XTEN-GS 링커에 이어서 Cas12i2로 구성되었다. Cas12i2의 C-말단에는 이분형 뉴클레오플라스민 NLS(bpNLS)가 있었다. Cas12i2-RT 플라스미드의 작업 용액을 물에서 제조하였다.
표적 및 상응하는 편집 주형 RNA 서열은 표 18에 나타나 있다. RT 주형은 40개의 뉴클레오타이드 길이였고, PBS는 13개의 뉴클레오타이드 길이였다. 암호화된 편집은 PAM 서열을 제거하기 위한 4개의 뉴클레오타이드 치환뿐만 아니라 단일 염기 치환이었다. 편집 주형 RNA를 추가적인 직접 반복 서열과 비표적화 스페이서 서열로 추가로 말단 보호시켰다. 편집 주형 RNA를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙하고, 각각의 편집 주형 RNA 플라스미드의 작업 용액을 물에서 제조하였다.
HEK293T 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, D10 배지: 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 DMEM(Thermo Fisher) + GlutaMAX™(Thermo Fisher) 및 피루베이트(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 형질도입 전에, HEK293T 세포를 조직 배양 처리된 96-웰 플레이트에 웰당 25,000개의 세포로 플레이팅하였다. 15시간 내지 18시간 후, 세포를 형질감염시켰다. 각각의 Cas12i2-RT 융합체 플라스미드와 편집 주형 RNA 플라스미드를 Opti-MEM™ 배지(Thermo Fisher)에 희석한 다음, Opti-MEM™에 희석된 Lipofectamine™ 2000(Themo Fisher)과 혼합하였다. Lipofectamine™ 2000 용액을 웰에 적가하고, 형질감염된 세포를 72시간 동안 배양한 후 수거하였다.
2라운드의 PCR에 의해 차세대 시퀀싱을 위한 샘플을 준비하였다. 1라운드(PCR1)를 사용하여 표적에 따라 특정 게놈 영역을 증폭시켰다. PCR1 산물을 칼럼 정제에 의해 정제하였다. 2라운드 PCR(PCR2)을 수행하여 Illumina 어댑터 및 인덱스를 추가하였다. 그런 다음, 반응물을 풀링하고, 칼럼 정제에 의해 정제하였다. 시퀀싱 실행은 150 주기의 NextSeq v2.5 중간 또는 고출력 키트로 수행하였다.
도 20a, 도 20b 도 20c는 각각 AAVS1_T7, EMX1_T6 및 VEGFA_T5에 대한 표 19의 Cas12i2-RT 융합체에 의한 활성을 보여준다. Indel 편집(표적 서열 내 또는 이에 인접하여 삽입 또는 결실을 포함하는 총 NGS 리드의 백분율) 및 정밀 편집(편집 주형 RNA에 의해 암호화된 편집을 포함하는 총 NGS 리드의 백분율)이 y-축에 표시되어 있다. Indel 편집은 흰색 막대로 표시되고, 암호화된 편집은 회색 막대로 표시된다. 표시된 데이터는 2개의 생체 복제물의 평균이다. 도 20a, 도 20b 도 20c에 도시된 바와 같이, Cas12i2-RT 융합체는 편집 주형 RNA의 존재하에 활성 뉴클레이스였다. 또한, Cas12i2-RT 융합체 각각은 편집 주형 RNA에 의해 암호화된 편집을 표적 서열에 도입하였다. 서열번호 220의 Cas12i2-RT 융합체로 편집된 3개의 표적 각각에 대해, NGS 리드의 대략 15%가 편집 주형 RNA에 의해 암호화된 편집으로 구성되었다. 따라서, MMLV의 RNase H 도메인의 결실은 포유동물 게놈에 indel 및 정확한 편집을 도입하는 Cas12i2-RT 융합체의 능력에 유의미한 영향을 미치는 것으로 보이지 않는다. 또한, 마라톤 RT를 포함하는 Cas12i2-RT 융합체는 암호화된 편집을 표적 서열에 도입할 수 있었다(도 20a, 도 20b 도 20c).
따라서, 본 실시예는 암호화된 편집이 여러 RT 서열 및 Cas12i2-RT 융합체를 사용하여 포유동물 유전자의 표적 가닥에 혼입될 수 있음을 보여준다.
실시예 7 - 화학적으로 변형된 편집 주형 RNA를 사용한 RNA-주형 편집
본 실시예는 서열번호 219의 플라스미드-암호화된 Cas12i2-RT 융합체 및 말단 포스포로티오에이트 백본 연결 및/또는 2'O-메틸 뉴클레오타이드를 포함하는 편집 주형 RNA를 사용한 포유동물 유전자인 VEGFA의 표적 가닥 편집을 설명한다. 표적 서열은 TTAAACTCTCCATGGACCAG(서열번호 38)였다.
서열번호 4의 변이형 Cas12i2 및 서열번호 219의 Cas12i2-RT 융합체를 pcDNA3.1 백본(Invitrogen)에 개별적으로 클로닝하였다. RNA 가이드 및 편집 주형 RNA 서열을 IDT에 의해 합성하였다. HEK293T 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, D10 배지: 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 DMEM(Thermo Fisher) + GlutaMAX™(Thermo Fisher) 및 피루베이트(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 형질도입 전에, HEK293T 세포를 조직 배양 처리된 96-웰 플레이트에 D10 중 웰당 25,000개의 세포로 플레이팅하였다. 15시간 내지 18시간 후, 세포를 TransIT-X2®(Mirus Bio)로 형질감염시켰다. 그런 다음, DNA + 형질감염 시약 용액을 세포의 웰에 적가하였다. 100ng의 Cas12i2 또는 Cas12i2-RT 플라스미드 DNA와 9몰의 합성된 RNA 가이드(IDT)의 혼합물을 Opti-MEM™ 배지(Thermo Fisher)에 희석한 다음, 제조업체의 지침에 따라 Opti-Opti-MEM™에 희석된 Lipofectamine™ 2000과 혼합하였다. 형질감염된 세포를 72시간 동안 배양한 후 수거하였다.
편집을 이전 실시예에 기술된 바와 같이 NGS로 분석하였다. 도 21에 도시된 바와 같이, VEGFA-T5 표적 부위에서 암호화된 편집을 각각의 편집 주형 RNA 및 서열번호 219의 Cas12i2-RT 융합체로 검출하였다. 대조군(gRNA 및 편집 주형 RNA + Cas12i2) 샘플에서 암호화된 편집은 검출되지 않았다. 변형되지 않은 편집 주형 RNA와 비교하여 변형된 편집 주형 RNA을 사용하여 더 높은 비율의 NGS 리드에서 암호화된 편집이 검출되었다. PS-2'-O-Me 변형을 사용하면 암호화된 편집을 포함하는 NGS 리드의 백분율이 가장 높아졌다.
따라서, 본 실시예는 관심 게놈 부위가 화학적으로 변형된 편집 주형 RNA 및 Cas12i2-RT 융합체에 의해 편집될 수 있음을 보여준다.
실시예 8 - Cas12i4-RT 융합체를 사용한 RNA-주형 편집
본 실시예는 MMLV RT(서열번호 29)에 융합된 Cas12i4 변이체를 사용한 AAVS1의 표적 가닥 편집을 설명한다.
표 20의 Cas12i4-RT 융합체 서열을 pcDNA3.1 백본(Invitrogen)에 클로닝하였다. C-말단 RT 융합체는 Cas12i4의 N-말단에 있는 His 태그와 Cas12i4의 C-말단에 있는 뉴클레오플라스민 NLS로 구성되었다. NLS의 바로 뒤에는 Flex XTEN 링커가 있었다. RT의 C-말단에는 이분형 SV40 NLS 태그가 있었다. N-말단 RT 융합체는 N-말단에 있는 이분형 SV40 NLS 태그와 RT의 C-말단에 있는 Flex XTEN 링커에 이어서 Cas12i4로 구성되었다. Cas12i4의 C-말단에는 뉴클레오플라스민 NLS가 있었다. Cas12i4-RT 플라스미드의 작업 용액을 물에서 제조하였다.
표적, RNA 가이드 및 편집 주형 RNA 서열은 표 21에 나타나 있다. RT 주형은 46개의 뉴클레오타이드 길이였고, PBS는 13개의 뉴클레오타이드 길이였다. 암호화된 편집은 PAM 서열을 제거하기 위한 4개의 뉴클레오타이드 치환뿐만 아니라 단일 염기 치환이었다. 편집 주형 RNA 및 RNA 가이드를 U6 프로모터가 있는 플라스미드 백본에 개별적으로 클로닝하고, 맥시 프렙하고, 각각의 RNA 가이드 또는 편집 주형 RNA 플라스미드의 작업 용액을 물에서 제조하였다.
HEK293T 세포를 실시예 6에 기술된 바와 같이 형질감염시키고 수거하였다. 이전 실시예에 기술된 바와 같이 NGS를 수행하였다. 도 22에 도시된 바와 같이, AAVS1_T7 표적 부위에서 암호화된 편집을 편집 주형 RNA, 및 Cas12i4-RT 융합체 중 하나로 검출하였다. 대조군(gRNA 및 편집 주형 RNA + Cas12i4) 샘플에서 암호화된 편집은 검출되지 않았다. 변이형 Cas12i4에 대한 MMLV의 N-말단 융합체와 비교하여 변이형 Cas12i4에 대한 MMLV의 C-말단 융합체를 사용하여 더 높은 비율의 NGS 리드에서 암호화된 편집이 검출되었다.
따라서, 본 실시예는 관심 게놈 부위가 편집 주형 RNA 및 Cas12i4-RT 융합체에 의해 편집될 수 있음을 보여준다.
실시예 9 - Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA를 사용한 RNA-주형 편집
본 실시예는 Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA를 사용한 포유동물 유전자의 표적 가닥 편집을 설명한다.
서열번호 219의 Cas12i2-RT 융합체를 pcDNA3.1 백본(Invitrogen)에 클로닝하였다. Cas12i2-RT 플라스미드의 작업 용액을 물에서 제조하였다. 표 22의 RNA 가이드 및 RT 공여체 RNA를 U6 프로모터가 있는 플라스미드 백본에 개별적으로 클로닝하고, 맥시 프렙하고, 각각의 RNA 가이드 또는 RT 공여체 RNA 플라스미드의 작업 용액을 물에서 제조하였다. RT 공여체 RNA는, 5'에서 3'의 순서로, 다음의 구성요소: 직접 반복 - 비표적화 스페이서 - RT 주형 - PBS - 직접 반복 - 비표적화 스페이서로 구성되었다. 직접 반복 및 RT 주형과 PBS에 측접하는 스페이서 서열은 말단 보호 역할을 하였다.
HEK293T 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, D10 배지: 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 DMEM(Thermo Fisher) + GlutaMAX™(Thermo Fisher) 및 피루베이트(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 형질도입 전에, HEK293T 세포를 조직 배양 처리된 96-웰 플레이트에 웰당 25,000개의 세포로 플레이팅하였다. 15시간 내지 18시간 후, 세포를 형질감염시켰다. 각각의 Cas12i2-RT 융합체 플라스미드, RNA 가이드 플라스미드 및 RT 공여체 RNA 플라스미드를 Opti-Opti-MEM™ 배지(Thermo Fisher)로 희석한 다음, Opti-Opti-MEM™에 희석된 Lipofectamine™ 2000(Themo Fisher)과 혼합하였다. Lipofectamine™ 2000 용액을 웰에 적가하고, 형질감염된 세포를 72시간 동안 배양하여 수거하였다.
이전 실시예에 기술된 바와 같이 NGS를 추가로 수행하였다. 도 23에 도시된 바와 같이, Cas12i2-RT 융합체, 각각의 RNA 가이드 및 각각의 RT 공여체 RNA를 사용한 형질감염 후 각각의 표적 부위에서 암호화된 편집이 검출되었다. 대조군(Cas12i2) 샘플에서 암호화된 편집은 검출되지 않았다. 따라서, 본 실시예는 선택된 게놈 부위가 Cas12i2-RT 융합체와 2개의 RNA 구성요소, RNA 가이드와 RT 공여체 RNA에 의해 편집될 수 있음을 보여준다. 암호화된 편집을 관심 게놈 부위에 혼입시키기 위해 RNA 가이드와 RT 공여체 RNA를 융합시킬 필요는 없다.
기타 실시형태
본 명세서에 개시된 모든 특징은 임의의 조합으로 결합될 수 있다. 본 명세서에 개시된 각 특징은 동일하거나, 동등하거나 또는 유사한 목적을 제공하는 대체 특징으로 대체될 수 있다. 따라서, 달리 명시적으로 언급되지 않는 한, 개시된 각 특징은 등가 또는 유사한 특징의 일반적인 시리즈의 예일 뿐이다.
상기 설명으로부터, 당업자는 본 발명의 본질적인 특징을 쉽게 확인할 수 있으며, 이의 사상과 범위를 벗어나지 않고 본 발명을 다양한 용도와 조건에 적합화시키기 위해 다양한 변경 및 수정을 가할 수 있다. 따라서, 다른 실시형태도 청구범위 내에 있다.
등가물
여러 가지 본 발명의 실시형태가 본 명세서에 기술되고 예시되었지만, 당업자라면 기능을 수행하고/하거나 본 명세서에 기재된 결과 및/또는 하나 이상의 이점을 얻기 위한 다양한 다른 수단 및/또는 구조를 쉽게 구상할 수 있을 것이며, 이러한 변형 및/또는 수정 각각은 본 명세서에 기재된 본 발명의 실시형태의 범위 내에 있는 것으로 간주된다.
보다 일반적으로, 당업자라면 본 명세서에 기술된 모든 매개변수, 치수, 물질 및 구성이 예시적임을 의미하며 실제 매개변수, 치수, 물질 및/또는 구성은 본 발명의 교시가 사용되는 특정 응용 분야 또는 응용 분야들에 따라 달라질 것이라는 점을 쉽게 이해할 수 있을 것이다. 당업자는 단지 일상적인 실험을 사용하여 본 명세서에 기술된 특정 발명의 실시형태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 따라서, 전술한 실시형태는 단지 예로서 제시된 것이며, 첨부된 청구범위 및 그 등가물의 범위 내에서, 본 발명의 실시형태는 구체적으로 설명되고 청구된 것과 다르게 실시될 수 있다는 것이 이해되어야 한다. 본 개시내용의 독창적인 실시형태는 본 명세서에 기술된 각각의 개별적인 특징, 시스템, 물품, 물질, 키트 및/또는 방법에 관한 것이다. 또한, 이러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법이 상호 모순되지 않는 경우, 두 개 이상의 이러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법의 조합은 본 개시내용의 범위 내에 포함된다.
본 명세서에 정의되고 사용되는 모든 정의는 사전적 정의, 참조에 의해 원용되어 있는 문서의 정의 및/또는 정의된 용어의 일반적인 의미를 제어하는 것으로 이해되어야 한다.
본 명세서에 개시된 모든 참고문헌, 특허 및 특허 출원은 각각 인용된 특허 대상과 관련하여 참조에 의해 인용되며, 일부 경우에는 문서 전체를 포괄할 수 있다.
본 명세서 및 청구범위에 사용되는 "단수형"은 달리 명확하게 나타내지 않는 한 "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본 명세서 및 청구범위에 사용되는 어구 "및/또는"은 결합된 요소 중 "둘 중 하나 또는 둘 다", 즉, 일부 경우에는 결합적으로 존재하고 다른 경우에는 분리적으로 존재하는 요소를 의미하는 것으로 이해되어야 한다. "및/또는"으로 나열된 여러 요소는 동일한 방식, 즉, 이렇게 결합된 요소 중 "하나 이상"으로 해석되어야 한다. "및/또는" 절에 의해 구체적으로 식별되는 요소 외에 구체적으로 식별되는 요소와 관련이 있는지 여부에 관계없이, 다른 요소가 선택적으로 존재할 수 있다. 따라서, 비제한적인 예로서, "포함하는"과 같은 개방형 언어와 함께 사용될 때 "A 및/또는 B"에 대한 언급은 일 실시형태에서는 A만(선택적으로 B 이외의 요소를 포함); 또 다른 실시형태에서는 B만(선택적으로 A 이외의 요소를 포함); 또 다른 실시형태에서는 A와 B 모두(선택적으로 다른 요소를 포함); 등을 지칭할 수 있다.
본 명세서 및 청구범위에 사용되는 바와 같이, "또는"은 위에서 정의된 바와 같이 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로 해석되어야 하며, 즉, 요소의 수 또는 목록 중 적어도 하나뿐만 아니라 하나 초과를 포함하고 선택적으로 추가적인 미등록 항목을 포함하는 것으로 해석되어야 한다. "~ 중 하나만" 또는 "~중 정확히 하나" 또는 청구범위에서 사용되는 경우 "~로 이루어진"과 같이 반대로 명확하게 표시된 용어만이 숫자 또는 요소의 목록 중 정확히 하나의 요소를 포함하는 것을 의미할 것이다. 일반적으로, 본 명세서에서 사용되는 용어 "또는"은 "둘 중 하나", "~ 중 하나", "~ 중 하나만" 또는 "~ 중 정확히 하나"와 같은 배타적인 용어가 앞에 올 경우 배타적인 대안(즉, "둘 중 하나 또는 둘 다 아닌")을 나타내는 것으로만 해석되어야 한다. 청구범위에서 사용되는 경우 "~로 본질적으로 이루어지는"은 특허법 분야에서 사용되는 바와 같은 일반적인 의미를 가질 것이다.
본 명세서 및 청구범위에 사용되는 바와 같이, 하나 이상의 요소의 목록과 관련하여 어구 "적어도 하나"는 요소의 목록의 요소 중 임의의 중 하나 이상으로부터 선택된 적어도 하나의 요소를 의미하는 것으로 이해되어야 하지만, 요소의 목록 내에 구체적으로 나열된 각각의 모든 요소 중 적어도 하나를 반드시 포함할 필요는 없으며 요소의 목록에 있는 요소의 임의의 조합을 제외하지 않는다. 이 정의는 또한 구체적으로 식별된 요소와 관련이 있는지 여부에 관계없이 "적어도 하나"라는 어구가 참조하는 요소의 목록 내에서 특별히 식별된 요소 이외의 요소가 선택적으로 존재할 수 있음을 허용한다. 따라서, 비제한적인 예로서, "A와 B 중 적어도 하나"(또는 동등하게는 "A 또는 B 중 적어도 하나" 또는 동등하게는 "A 및/또는 B 중 적어도 하나")는 일 실시형태에서는 B가 존재하지 않는 선택적으로 하나 초과를 포함하는 적어도 하나의 A(그리고 선택적으로 B 이외의 요소를 포함함); 또 다른 실시형태에서는 A가 존재하지 않는 선택적으로 하나 초과를 포함하는 적어도 하나의 B(그리고 선택적으로 A 이외의 요소를 포함함); 또 다른 실시형태에서는 선택적으로 하나 초과를 포함하는 적어도 하나의 A 및 선택적으로 하나 초과를 포함하는 적어도 하나의 B(그리고 선택적으로 다른 요소를 포함함); 등을 지칭할 수 있다.
또한, 명확하게 반대로 나타내지 않는 한, 하나 초과의 단계 또는 행위를 포함하는 본 명세서에 청구된 임의의 방법에서, 방법의 단계 또는 행위의 순서가 반드시 방법의 단계 또는 행위가 언급되는 순서로 제한되는 것은 아니라는 점을 이해하여야 한다.
SEQUENCE LISTING <110> Arbor Biotechnologies, Inc. <120> GENE EDITING SYSTEMS COMPRISING A CRISPR NUCLEASE AND USES THEREOF <130> 116928-0042-0001WO00 <140> PCT/US2022/031821 <141> 2022-06-01 <150> US 63/299,695 <151> 2022-01-14 <150> US 63/272,937 <151> 2021-10-28 <150> US 63/236,047 <151> 2021-08-23 <150> US 63/195,621 <151> 2021-06-01 <160> 259 <170> PatentIn version 3.5 <210> 1 <211> 3162 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60 ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120 caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180 cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240 agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300 ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360 tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420 gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480 agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540 agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600 ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660 accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720 gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780 attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840 gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900 accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960 ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020 gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080 aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140 attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200 ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260 aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320 aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380 cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440 cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500 gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560 ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620 accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680 atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740 gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800 aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860 aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920 aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980 gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040 aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100 ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160 aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220 tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280 aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340 agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400 ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460 acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520 aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580 aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640 tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700 tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760 ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820 agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880 agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940 gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000 accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060 gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120 gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162 <210> 2 <211> 1054 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 2 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <210> 3 <211> 1054 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 3 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <210> 4 <211> 1054 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 4 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <210> 5 <211> 1054 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 5 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <210> 6 <211> 1054 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 6 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 610 615 620 Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <210> 7 <211> 1054 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 7 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 610 615 620 Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <210> 8 <211> 1093 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 8 Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr 1 5 10 15 Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn 20 25 30 Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp 35 40 45 Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala 50 55 60 Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe 65 70 75 80 Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn 85 90 95 Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln 100 105 110 Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp 115 120 125 Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu 130 135 140 Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys 145 150 155 160 Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met 165 170 175 Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr 180 185 190 Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val 195 200 205 Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr 210 215 220 Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile 225 230 235 240 Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu 245 250 255 Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg 260 265 270 Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe 275 280 285 Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met 290 295 300 Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys 305 310 315 320 Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu 325 330 335 Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr 340 345 350 Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile 355 360 365 Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His 370 375 380 Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu 385 390 395 400 Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr 405 410 415 Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu 420 425 430 Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile 435 440 445 Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln 450 455 460 Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn 465 470 475 480 Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys 485 490 495 His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile 500 505 510 Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His 515 520 525 Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala 530 535 540 Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys 545 550 555 560 Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu 565 570 575 Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln 580 585 590 Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr 595 600 605 Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe 610 615 620 Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr 625 630 635 640 Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr 645 650 655 Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn 660 665 670 Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser 675 680 685 Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys 690 695 700 Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu 705 710 715 720 Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln 725 730 735 Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser 740 745 750 Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile 755 760 765 Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu 770 775 780 Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser 785 790 795 800 Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr 805 810 815 Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val 820 825 830 Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu 835 840 845 Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val 850 855 860 Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu 865 870 875 880 Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile 885 890 895 Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu 900 905 910 Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val 915 920 925 Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr 930 935 940 Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg 945 950 955 960 Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg 965 970 975 Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr 980 985 990 Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly 995 1000 1005 Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys 1010 1015 1020 Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu 1025 1030 1035 Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys 1040 1045 1050 Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe 1055 1060 1065 Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu 1070 1075 1080 Val Asp Ile Gln Lys Asp Phe Lys Lys Lys 1085 1090 <210> 9 <211> 1074 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 9 Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <210> 10 <211> 1074 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 10 Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <210> 11 <211> 1098 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 11 Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu 1 5 10 15 Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu 20 25 30 Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly 35 40 45 Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro 50 55 60 His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val 65 70 75 80 Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser 85 90 95 Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser 100 105 110 His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg 115 120 125 Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln 130 135 140 Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu 145 150 155 160 Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu 165 170 175 Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu 180 185 190 Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe 195 200 205 Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala 210 215 220 Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly 225 230 235 240 Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp 245 250 255 Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln 260 265 270 Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp 275 280 285 Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr 290 295 300 Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser 305 310 315 320 Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln 325 330 335 Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys 340 345 350 Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn 355 360 365 Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu 370 375 380 Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn 385 390 395 400 Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly 405 410 415 Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr 420 425 430 Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn 435 440 445 Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His 450 455 460 Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys 465 470 475 480 Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile 485 490 495 Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro 500 505 510 Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met 515 520 525 His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala 530 535 540 Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys 545 550 555 560 Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln 565 570 575 Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu 580 585 590 Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr 595 600 605 Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu 610 615 620 Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile 625 630 635 640 Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu 645 650 655 Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln 660 665 670 Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val 675 680 685 Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser 690 695 700 Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His 705 710 715 720 Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe 725 730 735 Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln 740 745 750 Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg 755 760 765 Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln 770 775 780 Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met 785 790 795 800 Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe 805 810 815 Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu 820 825 830 Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu 835 840 845 Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala 850 855 860 Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile 865 870 875 880 Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys 885 890 895 Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys 900 905 910 Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro 915 920 925 Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser 930 935 940 Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp 945 950 955 960 Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys 965 970 975 Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met 980 985 990 Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val 995 1000 1005 Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile 1010 1015 1020 Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu 1025 1030 1035 Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp 1040 1045 1050 Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe 1055 1060 1065 Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu 1070 1075 1080 Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met 1085 1090 1095 <210> 12 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 guuggaauga cuaauuuuug ugcccaccgu uggcac 36 <210> 13 <211> 24 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 aauuuuugug cccaucguug gcac 24 <210> 14 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 auuuuugugc ccaucguugg cac 23 <210> 15 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 guugcaaaac ccaagaaauc cgucuuucau ugacgg 36 <210> 16 <211> 34 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 gcaacaccua agaaauccgu cuuucauuga cggg 34 <210> 17 <211> 23 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 agaaauccgu cuuucauuga cgg 23 <210> 18 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 cuagcaauga ccuaauagug uguccuuagu ugacau 36 <210> 19 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 ccuacaauac cuaagaaauc cguccuaagu ugacgg 36 <210> 20 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 auaguguguc cuuaguugac au 22 <210> 21 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 guuggaauga cuaauuuuug ugcccaccgu uggcac 36 <210> 22 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 cccacaauac cugagaaauc cguccuacgu ugacgg 36 <210> 23 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 ucucaacgau agucagacau guguccucag ugacac 36 <210> 24 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 agacaugugu ccucagugac ac 22 <210> 25 <211> 1798 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 25 Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1055 1060 1065 Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr 1070 1075 1080 Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser 1085 1090 1095 Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His 1100 1105 1110 Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu 1115 1120 1125 Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu 1130 1135 1140 Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser 1145 1150 1155 Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg 1160 1165 1170 Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile 1175 1180 1185 Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val 1190 1195 1200 Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg 1205 1210 1215 Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn 1220 1225 1230 Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr 1235 1240 1245 Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His 1250 1255 1260 Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 1265 1270 1275 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 1280 1285 1290 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp 1295 1300 1305 Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 1310 1315 1320 Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys 1325 1330 1335 Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly 1340 1345 1350 Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val 1355 1360 1365 Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr 1370 1375 1380 Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr 1385 1390 1395 Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg 1400 1405 1410 Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro 1415 1420 1425 Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln 1430 1435 1440 Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala 1445 1450 1455 Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp 1460 1465 1470 Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly 1475 1480 1485 Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro 1490 1495 1500 Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 1505 1510 1515 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 1520 1525 1530 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln 1535 1540 1545 Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 1550 1555 1560 Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val 1565 1570 1575 Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu 1580 1585 1590 Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg 1595 1600 1605 Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp 1610 1615 1620 Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala 1625 1630 1635 Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala 1640 1645 1650 Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu 1655 1660 1665 Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr 1670 1675 1680 Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu 1685 1690 1695 Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile 1700 1705 1710 Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu 1715 1720 1725 Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly 1730 1735 1740 His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 1745 1750 1755 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 1760 1765 1770 Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu 1775 1780 1785 Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1790 1795 <210> 26 <211> 1798 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 26 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr 20 25 30 Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe 35 40 45 Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln 50 55 60 Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile 65 70 75 80 Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His 85 90 95 Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 100 105 110 Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr 115 120 125 Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile 130 135 140 His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro 145 150 155 160 Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 165 170 175 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg 180 185 190 Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro 195 200 205 Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 210 215 220 Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 225 230 235 240 Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 245 250 255 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg 260 265 270 Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu 275 280 285 Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys 290 295 300 Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg 305 310 315 320 Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe 325 330 335 Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 340 345 350 Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln 355 360 365 Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro 370 375 380 Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu 385 390 395 400 Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 405 410 415 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val 420 425 430 Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly 435 440 445 Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 450 455 460 Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 465 470 475 480 Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 485 490 495 Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His 500 505 510 Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu 515 520 525 Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly 530 535 540 Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr 545 550 555 560 Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser 565 570 575 Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 580 585 590 Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala 595 600 605 Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr 610 615 620 Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu 625 630 635 640 Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 645 650 655 His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp 660 665 670 Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr 675 680 685 Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser 690 695 700 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 705 710 715 720 Ser Gly Gly Ser Ser Gly Gly Ser Met Ser Ser Ala Ile Lys Ser Tyr 725 730 735 Lys Ser Val Leu Arg Pro Asn Glu Arg Lys Asn Gln Leu Leu Lys Ser 740 745 750 Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala Phe Phe Phe Lys Met Leu 755 760 765 Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu Ile Val Arg Phe Ser Thr 770 775 780 Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala Leu Trp Cys Ala Val Asn 785 790 795 800 Trp Phe Arg Pro Val Ser Gln Asp Ser Leu Thr His Thr Ile Ala Ser 805 810 815 Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr Tyr Gly Gly Thr Ala Ser 820 825 830 Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser Ile Gly Glu Ser Tyr Tyr 835 840 845 Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp Leu Cys Arg Glu Leu Gly 850 855 860 Val Glu Val Ser Asp Leu Thr His Asp Leu Glu Ile Leu Cys Arg Glu 865 870 875 880 Lys Cys Leu Ala Val Ala Thr Glu Ser Asn Gln Asn Asn Ser Ile Ile 885 890 895 Ser Val Leu Phe Gly Thr Gly Glu Lys Glu Asp Arg Ser Val Lys Leu 900 905 910 Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile Ser Asn Leu Lys Glu Ile 915 920 925 Pro Lys Asn Val Ala Pro Ile Gln Glu Ile Ile Leu Asn Val Ala Lys 930 935 940 Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr Ala Gly Asn Leu Gly Ala 945 950 955 960 Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys Asp Gly Gln Lys Glu Phe 965 970 975 Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys Lys Val Ile Arg Gly Lys 980 985 990 Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu Glu Leu Arg Ser Tyr Val 995 1000 1005 Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp Ala Trp Gly Glu Met 1010 1015 1020 Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys Ser Thr Arg Asn 1025 1030 1035 Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys Glu Ile Gln 1040 1045 1050 Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp Phe Phe 1055 1060 1065 Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys Val 1070 1075 1080 His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 1085 1090 1095 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys 1100 1105 1110 Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 1115 1120 1125 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp 1130 1135 1140 Ile Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys 1145 1150 1155 Ser Gln Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr 1160 1165 1170 Trp Thr Asn Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp 1175 1180 1185 Arg Pro Asn Ser Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu 1190 1195 1200 Arg His Pro Asp Gly Arg Trp Lys Lys Ala His Ile Pro Phe Tyr 1205 1210 1215 Asp Thr Arg Phe Phe Gln Glu Ile Tyr Ala Ala Gly Asn Ser Pro 1220 1225 1230 Val Asp Thr Cys Gln Phe Arg Thr Pro Arg Phe Gly Tyr His Leu 1235 1240 1245 Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg Val Asn Lys Lys His 1250 1255 1260 Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg Leu Ala Ile Gln 1265 1270 1275 Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr Glu Ile Ser 1280 1285 1290 Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val Lys Phe 1295 1300 1305 Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg Phe 1310 1315 1320 Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 1325 1330 1335 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys 1340 1345 1350 Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 1355 1360 1365 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala 1370 1375 1380 Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val 1385 1390 1395 Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val 1400 1405 1410 Thr Val Glu Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln 1415 1420 1425 Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg 1430 1435 1440 Asp Ile Val Arg Gly Lys Ser Leu Val Glu Leu Gln Gln Ile Arg 1445 1450 1455 Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp Cys Gly Val Thr Arg 1460 1465 1470 Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu Thr Val Lys Ala Val 1475 1480 1485 Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr Ala Leu Asn Ala Ser 1490 1495 1500 Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys Glu Phe Asp Pro 1505 1510 1515 Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile Arg Thr Arg 1520 1525 1530 Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu Ile Gln 1535 1540 1545 Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly Asp 1550 1555 1560 Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 1565 1570 1575 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln 1580 1585 1590 Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 1595 1600 1605 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys 1610 1615 1620 Ala Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly 1625 1630 1635 Asp Trp Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn 1640 1645 1650 Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu 1655 1660 1665 Ser His Tyr Glu Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp 1670 1675 1680 Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys Trp Val Leu Gln Asn 1685 1690 1695 Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu Ala Val Val Tyr Ile 1700 1705 1710 Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala Thr His Lys Val Ala 1715 1720 1725 Thr Gly Ala Val Ser Ile Val Phe Asp Gln Lys Gln Val Trp Val 1730 1735 1740 Cys Asn Ala Asp His Val Ala Ala Ala Asn Ile Ala Leu Thr Gly 1745 1750 1755 Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu Glu Asn Pro Asp Gly 1760 1765 1770 Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys Arg Pro Ala Ala Thr 1775 1780 1785 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1790 1795 <210> 27 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <210> 28 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> modified with phosphorothioate <220> <221> misc_feature <222> (40)..(43) <223> modified with phosphorothioate <400> 28 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <210> 29 <211> 678 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 29 Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 gtagcctctc ccgctctggt 20 <210> 31 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(3) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (40)..(42) <223> modified with 2'-O-methylation <400> 31 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 gggaagtggt tggtcagcat 20 <210> 33 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> modified with phosphorothioate <220> <221> misc_feature <222> (1)..(3) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (40)..(42) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (40)..(43) <223> modified with phosphorothioate <400> 33 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 gagccagtgt tgctagtcaa 20 <210> 35 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 aatcctccac cagtcatggt 20 <210> 37 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> modified with phosphorothioate <220> <221> misc_feature <222> (87)..(90) <223> modified with phosphorothioate <400> 37 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 ttaaactctc catggaccag 20 <210> 39 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(3) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (87)..(89) <223> modified with 2'-O-methylation <400> 39 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 40 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugauuua ggcucccucu 120 gucuggauca guccucc 137 <210> 41 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugau 107 <210> 42 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugcacccc cauaaggggg 60 gacauucuuu guagccucuc cccgaguggu ucagggccca gcuaggg 107 <210> 43 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cuccccgagu gguucagggc ccagcuaggg 90 <210> 44 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cucccagcgg cucugguuca gggcccagcu aggg 94 <210> 45 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cucccugguu cagggcccag cuaggg 86 <210> 46 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> modified with phosphorothioate <220> <221> misc_feature <222> (1)..(3) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (87)..(89) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (87)..(90) <223> modified with phosphorothioate <400> 46 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 47 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 48 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> modified with phosphorothioate <220> <221> misc_feature <222> (104)..(107) <223> modified with phosphorothioate <400> 48 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 49 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(3) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (104)..(106) <223> modified with 2'-O-methylation <400> 49 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 50 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (1)..(4) <223> modified with phosphorothioate <220> <221> misc_feature <222> (1)..(3) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (104)..(106) <223> modified with 2'-O-methylation <220> <221> misc_feature <222> (104)..(107) <223> modified with phosphorothioate <400> 50 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 51 <211> 1074 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 51 Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <210> 52 <211> 1832 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 52 Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ala 1 5 10 15 Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys 20 25 30 Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg 35 40 45 Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu 50 55 60 Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val Cys Ala 65 70 75 80 Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys Asp Gly 85 90 95 Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys 100 105 110 Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp 115 120 125 Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg 130 135 140 Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met Leu Phe 145 150 155 160 Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala 165 170 175 Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys 180 185 190 Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn Glu Asn 195 200 205 Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala 210 215 220 Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly 225 230 235 240 Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met Val Ser 245 250 255 Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val Leu Lys 260 265 270 Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln 275 280 285 Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val Tyr Ser 290 295 300 Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg 305 310 315 320 Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys 325 330 335 Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn 340 345 350 Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile 355 360 365 Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu 370 375 380 Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile Gln 385 390 395 400 Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro Ile Arg 405 410 415 Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser Ala Glu 420 425 430 Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys Ile Ser 435 440 445 Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp Ala Phe 450 455 460 Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys Arg His 465 470 475 480 Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg Ala Glu 485 490 495 Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe Tyr Asn 500 505 510 Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val Ala Glu 515 520 525 Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp 530 535 540 Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys 545 550 555 560 Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr 565 570 575 Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu 580 585 590 Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg 595 600 605 Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn 610 615 620 Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro Gly 625 630 635 640 Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr Ile Lys 645 650 655 Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser Thr Thr 660 665 670 Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg Phe Lys 675 680 685 Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile Arg Gln 690 695 700 Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile Pro Glu 705 710 715 720 Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val Phe Asn 725 730 735 Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala Lys Lys 740 745 750 Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser Lys Asp 755 760 765 Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp Ala Ser 770 775 780 Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn 785 790 795 800 Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val 805 810 815 Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg 820 825 830 Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu 835 840 845 Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val 850 855 860 Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp Cys 865 870 875 880 Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe His Gly 885 890 895 Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln Asp Pro 900 905 910 Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala Arg Phe 915 920 925 Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg Asn Phe 930 935 940 Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr Lys Gln 945 950 955 960 Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His Ala Glu 965 970 975 Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys Ile Leu 980 985 990 Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly Gly Arg 995 1000 1005 Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro Ile 1010 1015 1020 Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu Val 1025 1030 1035 Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser Lys 1040 1045 1050 Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys Ala 1055 1060 1065 Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr Ser 1070 1075 1080 Gln Leu Pro Gln Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly 1085 1090 1095 Gln Ala Lys Lys Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1115 1120 1125 Ser Gly Gly Ser Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu 1130 1135 1140 Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly 1145 1150 1155 Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly 1160 1165 1170 Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu 1175 1180 1185 Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser 1190 1195 1200 Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu 1205 1210 1215 Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro 1220 1225 1230 Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 1235 1240 1245 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 1250 1255 1260 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser 1265 1270 1275 His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 1280 1285 1290 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp 1295 1300 1305 Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg 1310 1315 1320 Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala 1325 1330 1335 Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu 1340 1345 1350 Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser 1355 1360 1365 Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu 1370 1375 1380 Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys 1385 1390 1395 Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln 1400 1405 1410 Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro 1415 1420 1425 Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala 1430 1435 1440 Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala 1445 1450 1455 Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly 1460 1465 1470 Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 1475 1480 1485 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 1490 1495 1500 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr 1505 1510 1515 Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 1520 1525 1530 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met 1535 1540 1545 Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr 1550 1555 1560 Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala 1565 1570 1575 Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met 1580 1585 1590 Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe 1595 1600 1605 Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro 1610 1615 1620 Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala 1625 1630 1635 His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala 1640 1645 1650 Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly 1655 1660 1665 Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile 1670 1675 1680 Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu 1685 1690 1695 Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys 1700 1705 1710 Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 1715 1720 1725 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 1730 1735 1740 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys 1745 1750 1755 Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 1760 1765 1770 His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala 1775 1780 1785 Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr 1790 1795 1800 Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala 1805 1810 1815 Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1820 1825 1830 <210> 53 <211> 1818 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 53 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr 20 25 30 Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe 35 40 45 Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln 50 55 60 Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile 65 70 75 80 Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His 85 90 95 Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 100 105 110 Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr 115 120 125 Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile 130 135 140 His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro 145 150 155 160 Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 165 170 175 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg 180 185 190 Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro 195 200 205 Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 210 215 220 Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 225 230 235 240 Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 245 250 255 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg 260 265 270 Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu 275 280 285 Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys 290 295 300 Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg 305 310 315 320 Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe 325 330 335 Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 340 345 350 Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln 355 360 365 Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro 370 375 380 Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu 385 390 395 400 Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 405 410 415 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val 420 425 430 Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly 435 440 445 Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 450 455 460 Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 465 470 475 480 Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 485 490 495 Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His 500 505 510 Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu 515 520 525 Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly 530 535 540 Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr 545 550 555 560 Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser 565 570 575 Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 580 585 590 Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala 595 600 605 Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr 610 615 620 Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu 625 630 635 640 Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 645 650 655 His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp 660 665 670 Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr 675 680 685 Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser 690 695 700 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 705 710 715 720 Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Ser Ile Ser Arg Pro Tyr 725 730 735 Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys Lys Glu Met Leu Asp Lys 740 745 750 Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg Val Phe Ala Asp Leu Ala 755 760 765 Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu Met Ala Lys Ser Leu Glu 770 775 780 Pro Glu Ser Asp Ser Glu Leu Val Cys Ala Ile Gly Trp Phe Arg Leu 785 790 795 800 Val Asp Lys Thr Ile Trp Ser Lys Asp Gly Ile Lys Gln Glu Asn Leu 805 810 815 Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys Glu Ala Ser Glu Val Val 820 825 830 Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp Lys Tyr Val Trp Ile Asp 835 840 845 Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg Glu Leu Gly Thr Arg Asn 850 855 860 Leu Ser Glu Asp Phe Glu Cys Met Leu Phe Glu Gln Tyr Ile Arg Leu 865 870 875 880 Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala Ile Ser Asn Met Phe Gly 885 890 895 Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys Arg Met Tyr Ala Thr Arg 900 905 910 Met Lys Asp Trp Leu Glu Ala Asn Glu Asn Ile Thr Trp Glu Gln Tyr 915 920 925 Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala Lys Asn Leu Glu Gln Val 930 935 940 Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly Ala Asp Pro Phe Phe Lys 945 950 955 960 Tyr Ser Phe Ser Lys Glu Gly Met Val Ser Lys Lys Glu His Ala Gln 965 970 975 Gln Leu Asp Lys Phe Lys Thr Val Leu Lys Asn Lys Ala Arg Asp Leu 980 985 990 Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln Tyr Leu Glu Ala Glu Ile 995 1000 1005 Gly Ile Pro Val Asp Ala Asn Val Tyr Ser Gln Met Phe Ser Asn 1010 1015 1020 Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg Asn Met Ser Phe 1025 1030 1035 Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys Asp Leu Asn 1040 1045 1050 Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn Gly Phe 1055 1060 1065 Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile Thr 1070 1075 1080 Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu 1085 1090 1095 Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile 1100 1105 1110 Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 1115 1120 1125 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val 1130 1135 1140 Ser Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu 1145 1150 1155 Glu Lys Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn 1160 1165 1170 Arg Tyr Trp Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met 1175 1180 1185 Pro Ala Asp Lys Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe 1190 1195 1200 Lys Met Trp Leu Arg Ala Glu Leu His Tyr Asp Gly Lys Lys Ala 1205 1210 1215 Lys Ala His Leu Pro Phe Tyr Asn Ala Arg Phe Phe Glu Glu Val 1220 1225 1230 Tyr Cys Tyr His Pro Ser Val Ala Glu Ile Thr Pro Phe Lys Thr 1235 1240 1245 Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp Ile Pro Asp Tyr Val 1250 1255 1260 Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys Ala Thr Lys Arg 1265 1270 1275 Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr Thr Arg Val 1280 1285 1290 Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu Asn Asp 1295 1300 1305 Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg Pro 1310 1315 1320 Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn 1325 1330 1335 Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro 1340 1345 1350 Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 1355 1360 1365 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn 1370 1375 1380 Ser Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser 1385 1390 1395 Glu Arg Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg 1400 1405 1410 Lys Leu Ile Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly 1415 1420 1425 Gln Asp Tyr Ile Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly 1430 1435 1440 Glu Thr Leu Tyr Val Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val 1445 1450 1455 Ser Lys His Arg Lys Ala Lys Lys Pro Val Glu Gly Ile Leu Asp 1460 1465 1470 Glu Ile Glu Ala Trp Thr Ser Lys Asp Lys Asp Ser Cys Ser Leu 1475 1480 1485 Met Arg Leu Ser Ser Leu Ser Asp Ala Ser Met Gln Gly Ile Ala 1490 1495 1500 Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn Lys Asn Gly Cys 1505 1510 1515 Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val Leu Tyr Ala 1520 1525 1530 Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg Ser Glu 1535 1540 1545 Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu Leu 1550 1555 1560 Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val 1565 1570 1575 Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp 1580 1585 1590 Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 1595 1600 1605 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His 1610 1615 1620 Gln Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met 1625 1630 1635 Arg Ala Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp 1640 1645 1650 His Val Arg Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr 1655 1660 1665 Gly Leu Tyr Tyr Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr 1670 1675 1680 Gly Leu Glu Glu His Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys 1685 1690 1695 Phe Tyr Asp Phe Arg Lys Ile Leu Glu Asp Lys Asn Leu Thr Ser 1700 1705 1710 Val Ile Ile Pro Lys Arg Gly Gly Arg Ile Tyr Met Ala Thr Asn 1715 1720 1725 Pro Val Thr Ser Asp Ser Thr Pro Ile Thr Tyr Ala Gly Lys Thr 1730 1735 1740 Tyr Asn Arg Cys Asn Ala Asp Glu Val Ala Ala Ala Asn Ile Val 1745 1750 1755 Ile Ser Val Leu Ala Pro Arg Ser Lys Lys Asn Arg Glu Gln Asp 1760 1765 1770 Asp Ile Pro Leu Ile Thr Lys Lys Ala Glu Ser Lys Ser Pro Pro 1775 1780 1785 Lys Asp Arg Lys Arg Ser Lys Thr Ser Gln Leu Pro Gln Lys Lys 1790 1795 1800 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1805 1810 1815 <210> 54 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgaga 137 <210> 55 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguu 107 <210> 56 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60 cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107 <210> 57 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <210> 58 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugagcgg ucagcaugga uuauagccga aggc 94 <210> 59 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggcaug gauuauagcc gaaggc 86 <210> 60 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 agacaugugu ccucagugac acgggaagug guuggucagc au 42 <210> 61 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 agacaugugu ccucagugac acgggaagug guuggucagc auugauucca gcuacucugg 60 gaagugguug cagugcaugg auuauagccg aaggc 95 <210> 62 <211> 149 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120 ucauugacgg gacgcuacua uagcugcac 149 <210> 63 <211> 149 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120 ucauugacgg gacgcuacua uagcugcac 149 <210> 64 <211> 149 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120 ucauugacgg gacgcuacua uagcugcac 149 <210> 65 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 gattccagct actttgggaa gtggttggtc agcatggatt atagccgaag gccccag 57 <210> 66 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 ctaaggtcga tgaaaccctt caccaaccag tcgtacctaa tatcggcttc cggggtc 57 <210> 67 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggucag cauggauuau agccgaaggc 90 <210> 68 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugcgagu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggac 137 <210> 69 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugcgagu caagggcagc augcugggcc cgucccacua caggcca 107 <210> 70 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 agaaauccgu cuuucauuga cgggagccag uguugcuagu caagcacccc cauaaggggg 60 uuccuucuuu gagccagugu ugcgagucaa gggcagcaug cugggcc 107 <210> 71 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugcgagu caagggcagc augcugggcc 90 <210> 72 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugagcgc uagucaaggg cagcaugcug ggcc 94 <210> 73 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugucaag ggcagcaugc ugggcc 86 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 gggaagtggt tggtcagcat 20 <210> 75 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggucag cauggauuau agccgaaggc 90 <210> 76 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <210> 77 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugagcgg ucagcaugga uuauagccga aggc 94 <210> 78 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggcaug gauuauagcc gaaggc 86 <210> 79 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60 cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107 <210> 80 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <210> 81 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugcccc caggaugcgu 120 ggagggaggg gucugug 137 <210> 82 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugc 107 <210> 83 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 agaaauccgu cuuucauuga cggaauccuc caccagucau ggugcacccc cauaaggggg 60 agauaccuuu aauccuccac cacgaguggu gacaacccca agcagcc 107 <210> 84 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccacgagu ggugacaacc ccaagcagcc 90 <210> 85 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccaagcgg ucauggugac aaccccaagc agcc 94 <210> 86 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccauggug acaaccccaa gcagcc 86 <210> 87 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <210> 88 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 ugggaagugg uuggucagca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <210> 89 <211> 29 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 89 ggcuauaauc caugcaagug accaaccac 29 <210> 90 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 90 gggaagtggt tgcagtgcat 20 <210> 91 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 91 gagccagtgt tggatctcaa 20 <210> 92 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 92 ttaaactctc caacctccag 20 <210> 93 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 93 uaauuucuac uguuguagau 20 <210> 94 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 94 agaaaugcau gguucucaug c 21 <210> 95 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 95 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagaga 137 <210> 96 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 96 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 97 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 97 agaaauccgu cuuucauuga cgguuaaacu cuccauggac caggcacccc cauaaggggg 60 aaaagacuuu uuaaacucuc cacgagccag gcucauccag cuuccca 107 <210> 98 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 98 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60 cuccacgagc caggcucauc cagcuuccca 90 <210> 99 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 99 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60 cuccaagcgu ggaccaggcu cauccagcuu ccca 94 <210> 100 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 100 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60 cuccaccagg cucauccagc uuccca 86 <210> 101 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 101 aaaauuaccu aguaauuagg u 21 <210> 102 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 102 ggauuucuac uuuuguagau 20 <210> 103 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 103 aaauuucuac uuuuguagau 20 <210> 104 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 104 cgcgcccacg cggggcgcga c 21 <210> 105 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 105 uaauuucuac ucuuguagau 20 <210> 106 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 106 gaauuucuac uauuguagau 20 <210> 107 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 107 gaaucucuac ucuuuguaga u 21 <210> 108 <211> 19 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 108 uaauuucuac uuuguagau 19 <210> 109 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 109 aaauuucuac uguuuguaga u 21 <210> 110 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 110 agaaauccgu cuuucauuga cggguagccu cucccgcucu ggu 43 <210> 111 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 111 gaauuucuac uuuuguagau 20 <210> 112 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 112 agaaauccgu cuuucauuga cgggggaagu gguuggucag cau 43 <210> 113 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 113 uaauuucuac uaaguguaga u 21 <210> 114 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 114 agaaauccgu cuuucauuga cgggagccag uguugcuagu caa 43 <210> 115 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 115 uaauuucuac uauuguagau 20 <210> 116 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 116 agaaauccgu cuuucauuga cggaauccuc caccagucau ggu 43 <210> 117 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 117 uaauuucuac uucgguagau 20 <210> 118 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 118 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <210> 119 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 119 uaauuucuac uauuguagau 20 <210> 120 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 120 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 121 <211> 1368 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 121 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 122 <211> 1053 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 122 Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <210> 123 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 123 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc 90 <210> 124 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 124 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107 <210> 125 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 125 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgaga 137 <210> 126 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 126 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <210> 127 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 127 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <210> 128 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 128 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <210> 129 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 129 cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcaga aauccgucuu 60 ucauugacgg gggaaguggu uggucagcau 90 <210> 130 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 130 cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60 uguuagaaau ccgucuuuca uugacggggg aagugguugg ucagcau 107 <210> 131 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 131 cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60 uguucuagca guuccacucc ugggcagccc gagaagaaau ccgucuuuca uugacggggg 120 aagugguugg ucagcau 137 <210> 132 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 132 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggggaagu 120 gguuggucag cau 133 <210> 133 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 133 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120 ucauugacgg gggaaguggu uggucagcau 150 <210> 134 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 134 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgagaaga aauccgucuu ucauugacgg gggaaguggu uggucagcau 180 <210> 135 <211> 139 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 135 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60 ggaagugguu gcagugcaug gauuauagcc gaaggcagaa auccgucuuu cauugacggg 120 ggaagugguu ggucagcau 139 <210> 136 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 136 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60 ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guuagaaauc 120 cgucuuucau ugacggggga agugguuggu cagcau 156 <210> 137 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 137 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60 ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guucuagcag 120 uuccacuccu gggcagcccg agaagaaauc cgucuuucau ugacggggga agugguuggu 180 cagcau 186 <210> 138 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 138 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc 90 <210> 139 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 139 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107 <210> 140 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 140 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggac 137 <210> 141 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 141 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <210> 142 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 142 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <210> 143 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 143 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <210> 144 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 144 uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggccaga aauccgucuu 60 ucauugacgg gagccagugu ugcuagucaa 90 <210> 145 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 145 uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60 gccaagaaau ccgucuuuca uugacgggag ccaguguugc uagucaa 107 <210> 146 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 146 uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60 gccaauguga ccgucagucu ccuuccugaa ggacagaaau ccgucuuuca uugacgggag 120 ccaguguugc uagucaa 137 <210> 147 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 147 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggagccag 120 uguugcuagu caa 133 <210> 148 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 148 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120 ucauugacgg gagccagugu ugcuagucaa 150 <210> 149 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 149 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gagccagugu ugcuagucaa 180 <210> 150 <211> 139 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 150 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60 agccaguguu ggaucucaag ggcagcaugc ugggccagaa auccgucuuu cauugacggg 120 agccaguguu gcuagucaa 139 <210> 151 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 151 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60 agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaagaaauc 120 cgucuuucau ugacgggagc caguguugcu agucaa 156 <210> 152 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 152 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60 agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaaugugac 120 cgucagucuc cuuccugaag gacagaaauc cgucuuucau ugacgggagc caguguugcu 180 agucaa 186 <210> 153 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 153 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc 90 <210> 154 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 154 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugc 107 <210> 155 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 155 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120 ggagggaggg gucugug 137 <210> 156 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 156 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <210> 157 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 157 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <210> 158 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 158 agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120 ggagggaggg gucugugaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <210> 159 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 159 agauaccuau aauccuccac cacaguuggu gacaacccca agcagccaga aauccgucuu 60 ucauugacgg aauccuccac cagucauggu 90 <210> 160 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 160 agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60 gugcagaaau ccgucuuuca uugacggaau ccuccaccag ucauggu 107 <210> 161 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 161 agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60 gugcccccag gaugcgugga gggagggguc ugugagaaau ccgucuuuca uugacggaau 120 ccuccaccag ucauggu 137 <210> 162 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 162 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cggaauccuc 120 caccagucau ggu 133 <210> 163 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 163 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120 ucauugacgg aauccuccac cagucauggu 150 <210> 164 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 164 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120 ggagggaggg gucugugaga aauccgucuu ucauugacgg aauccuccac cagucauggu 180 <210> 165 <211> 139 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 165 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60 auccuccacc acaguuggug acaaccccaa gcagccagaa auccgucuuu cauugacgga 120 auccuccacc agucauggu 139 <210> 166 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 166 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60 auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcagaaauc 120 cgucuuucau ugacggaauc cuccaccagu cauggu 156 <210> 167 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 167 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60 auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcccccagg 120 augcguggag ggaggggucu gugagaaauc cgucuuucau ugacggaauc cuccaccagu 180 cauggu 186 <210> 168 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 168 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 169 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 169 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 170 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 170 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagaga 137 <210> 171 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 171 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <210> 172 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 172 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <210> 173 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 173 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <210> 174 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 174 aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaga aauccgucuu 60 ucauugacgg uuaaacucuc cauggaccag 90 <210> 175 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 175 aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60 agaaagaaau ccgucuuuca uugacgguua aacucuccau ggaccag 107 <210> 176 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 176 aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60 agaagggggg gcacucagga cucucuccaa gagaagaaau ccgucuuuca uugacgguua 120 aacucuccau ggaccag 137 <210> 177 <211> 133 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 177 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgguuaaacu 120 cuccauggac cag 133 <210> 178 <211> 150 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 178 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120 ucauugacgg uuaaacucuc cauggaccag 150 <210> 179 <211> 180 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 179 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagagaaga aauccgucuu ucauugacgg uuaaacucuc cauggaccag 180 <210> 180 <211> 139 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 180 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60 uaaacucucc aaccuccagg cucauccagc uucccaagaa auccgucuuu cauugacggu 120 uaaacucucc auggaccag 139 <210> 181 <211> 156 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 181 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60 uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaagaaauc 120 cgucuuucau ugacgguuaa acucuccaug gaccag 156 <210> 182 <211> 186 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 182 agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60 uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaggggggg 120 cacucaggac ucucuccaag agaagaaauc cgucuuucau ugacgguuaa acucuccaug 180 gaccag 186 <210> 183 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 183 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau 80 <210> 184 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 184 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccg 85 <210> 185 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 185 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc 90 <210> 186 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 186 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107 <210> 187 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 187 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgaga 137 <210> 188 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 188 agaaauccgu cuuucauuga cgggggaagu gguuggucag cauugcagug cauggauuau 60 agccgaaggc 70 <210> 189 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 189 agaaauccgu cuuucauuga cgggggaagu gguuggucag caugggaagu gguugcagug 60 cauggauuau agccgaaggc 80 <210> 190 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 190 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc 90 <210> 191 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 191 agaaauccgu cuuucauuga cgggggaagu gguuggucag caugugauga uuccagcuac 60 uuugggaagu gguugcagug cauggauuau agccgaaggc 100 <210> 192 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 192 agaaauccgu cuuucauuga cgggggaagu gguuggucag caugguggga aaggugauga 60 uuccagcuac uuugggaagu gguugcagug cauggauuau agccgaaggc 110 <210> 193 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 193 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc 80 <210> 194 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 194 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcu 85 <210> 195 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 195 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc 90 <210> 196 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 196 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107 <210> 197 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 197 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggac 137 <210> 198 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 198 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauggaucu caagggcagc 60 augcugggcc 70 <210> 199 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 199 agaaauccgu cuuucauuga cgggagccag uguugcuagu caagagccag uguuggaucu 60 caagggcagc augcugggcc 80 <210> 200 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 200 agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc 90 <210> 201 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 201 agaaauccgu cuuucauuga cgggagccag uguugcuagu caaauccaaa gcuuuccuuc 60 uuugagccag uguuggaucu caagggcagc augcugggcc 100 <210> 202 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 202 agaaauccgu cuuucauuga cgggagccag uguugcuagu caaugaaguc gccauccaaa 60 gcuuuccuuc uuugagccag uguuggaucu caagggcagc augcugggcc 110 <210> 203 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 203 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc 80 <210> 204 <211> 85 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 204 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcu 85 <210> 205 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 205 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 206 <211> 107 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 206 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <210> 207 <211> 137 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 207 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagaga 137 <210> 208 <211> 70 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 208 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagcaaccuc caggcucauc 60 cagcuuccca 70 <210> 209 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 209 agaaauccgu cuuucauuga cgguuaaacu cuccauggac caguuaaacu cuccaaccuc 60 caggcucauc cagcuuccca 80 <210> 210 <211> 90 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 210 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <210> 211 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 211 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagagguaac accaaaagac 60 uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 100 <210> 212 <211> 110 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 212 agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagccccauu accagguaac 60 accaaaagac uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 110 <210> 213 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 213 tccatgtctc gttatacgct gtggttcgcc aacaacacta gtactactga taaattaccc 60 cccaagtccc tcacctctcc aaagctgccc atactactac actagtttga cagctagctc 120 agtcctaggt ataatgctag c 141 <210> 214 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 214 tccatgtctc gttatacgct gtggttcgcc aacatatagt tcactactag catgctgccc 60 ttgactagca acactggctc aaagaaggaa agactactta tagttcttga cagctagctc 120 agtcctaggt ataatgctag c 141 <210> 215 <211> 143 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 215 tccatgtctc gttatacgct gtggttcgcc aacgcaggaa cgacactact agctggatga 60 gcctggtcca tggagagttt aaaaagtctt ttggactact ggaacgactt gacagctagc 120 tcagtcctag gtataatgct agc 143 <210> 216 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 216 agaaatccgt ctttcattga cggggagagg tgagggactt ggg 43 <210> 217 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 217 agaaatccgt ctttcattga cgggagccag tgttgctagt caa 43 <210> 218 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 218 agaaatccgt ctttcattga cggttaaact ctccatggac cag 43 <210> 219 <211> 1812 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 219 Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 1 5 10 15 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 20 25 30 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 35 40 45 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 50 55 60 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 65 70 75 80 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 85 90 95 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 100 105 110 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 115 120 125 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 130 135 140 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 145 150 155 160 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 165 170 175 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 180 185 190 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 195 200 205 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 210 215 220 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 225 230 235 240 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 245 250 255 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 260 265 270 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 275 280 285 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 290 295 300 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 305 310 315 320 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 325 330 335 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 340 345 350 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 355 360 365 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 370 375 380 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 385 390 395 400 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 405 410 415 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 420 425 430 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 435 440 445 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 450 455 460 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 465 470 475 480 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 485 490 495 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 500 505 510 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 515 520 525 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 530 535 540 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 545 550 555 560 Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 565 570 575 Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 580 585 590 Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 595 600 605 Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 610 615 620 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys Phe 625 630 635 640 Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 645 650 655 Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 660 665 670 Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 675 680 685 Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 690 695 700 Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 705 710 715 720 Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 725 730 735 Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 740 745 750 Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 755 760 765 Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 770 775 780 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 785 790 795 800 Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 805 810 815 Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 820 825 830 Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 835 840 845 Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 850 855 860 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 865 870 875 880 Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 885 890 895 Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 900 905 910 Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 915 920 925 Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 930 935 940 Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 945 950 955 960 Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 965 970 975 Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 980 985 990 Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe 995 1000 1005 Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp 1010 1015 1020 Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala 1025 1030 1035 Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp 1040 1045 1050 Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser 1055 1060 1065 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1070 1075 1080 Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1085 1090 1095 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu 1115 1120 1125 Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser 1130 1135 1140 Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala 1145 1150 1155 Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr 1160 1165 1170 Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu 1175 1180 1185 Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu 1190 1195 1200 Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 1205 1210 1215 Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu 1220 1225 1230 Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro 1235 1240 1245 Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr 1250 1255 1260 Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro 1265 1270 1275 Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met 1280 1285 1290 Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 1295 1300 1305 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 1310 1315 1320 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr 1325 1330 1335 Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 1340 1345 1350 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr 1355 1360 1365 Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys 1370 1375 1380 Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu 1385 1390 1395 Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro 1400 1405 1410 Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu 1415 1420 1425 Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu 1430 1435 1440 Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 1445 1450 1455 Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu 1460 1465 1470 Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu 1475 1480 1485 Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro 1490 1495 1500 Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val 1505 1510 1515 Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 1520 1525 1530 Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 1535 1540 1545 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 1550 1555 1560 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala 1565 1570 1575 Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 1580 1585 1590 Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln 1595 1600 1605 His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro 1610 1615 1620 Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr 1625 1630 1635 Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly 1640 1645 1650 Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu 1655 1660 1665 Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr 1670 1675 1680 Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr 1685 1690 1695 Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile 1700 1705 1710 Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys 1715 1720 1725 Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro 1730 1735 1740 Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly His 1745 1750 1755 Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg 1760 1765 1770 Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 1775 1780 1785 Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu Phe 1790 1795 1800 Glu Ser Pro Lys Lys Lys Arg Lys Val 1805 1810 <210> 220 <211> 1620 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 220 Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 1 5 10 15 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 20 25 30 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 35 40 45 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 50 55 60 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 65 70 75 80 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 85 90 95 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 100 105 110 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 115 120 125 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 130 135 140 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 145 150 155 160 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 165 170 175 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 180 185 190 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 195 200 205 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 210 215 220 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 225 230 235 240 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 245 250 255 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 260 265 270 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 275 280 285 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 290 295 300 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 305 310 315 320 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 325 330 335 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 340 345 350 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 355 360 365 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 370 375 380 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 385 390 395 400 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 405 410 415 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 420 425 430 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 435 440 445 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 450 455 460 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 465 470 475 480 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 485 490 495 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 500 505 510 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 515 520 525 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 530 535 540 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 545 550 555 560 Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 565 570 575 Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 580 585 590 Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 595 600 605 Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 610 615 620 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg 625 630 635 640 Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 645 650 655 Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 660 665 670 Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 675 680 685 Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 690 695 700 Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 705 710 715 720 Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 725 730 735 Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 740 745 750 Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 755 760 765 Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 770 775 780 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 785 790 795 800 Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 805 810 815 Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 820 825 830 Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 835 840 845 Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 850 855 860 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 865 870 875 880 Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 885 890 895 Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 900 905 910 Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 915 920 925 Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 930 935 940 Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 945 950 955 960 Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 965 970 975 Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 980 985 990 Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe 995 1000 1005 Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp 1010 1015 1020 Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala 1025 1030 1035 Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp 1040 1045 1050 Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser 1055 1060 1065 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1070 1075 1080 Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1085 1090 1095 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu 1115 1120 1125 Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser 1130 1135 1140 Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala 1145 1150 1155 Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr 1160 1165 1170 Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu 1175 1180 1185 Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu 1190 1195 1200 Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 1205 1210 1215 Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu 1220 1225 1230 Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro 1235 1240 1245 Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr 1250 1255 1260 Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro 1265 1270 1275 Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met 1280 1285 1290 Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 1295 1300 1305 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 1310 1315 1320 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr 1325 1330 1335 Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 1340 1345 1350 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr 1355 1360 1365 Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys 1370 1375 1380 Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu 1385 1390 1395 Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro 1400 1405 1410 Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu 1415 1420 1425 Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu 1430 1435 1440 Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 1445 1450 1455 Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu 1460 1465 1470 Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu 1475 1480 1485 Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro 1490 1495 1500 Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val 1505 1510 1515 Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 1520 1525 1530 Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 1535 1540 1545 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 1550 1555 1560 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala 1565 1570 1575 Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 1580 1585 1590 Leu Asn Pro Ala Thr Leu Leu Pro Met Lys Arg Thr Ala Asp Gly 1595 1600 1605 Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1610 1615 1620 <210> 221 <211> 1562 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 221 Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 1 5 10 15 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 20 25 30 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 35 40 45 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 50 55 60 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 65 70 75 80 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 85 90 95 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 100 105 110 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 115 120 125 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 130 135 140 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 145 150 155 160 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 165 170 175 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 180 185 190 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 195 200 205 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 210 215 220 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 225 230 235 240 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 245 250 255 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 260 265 270 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 275 280 285 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 290 295 300 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 305 310 315 320 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 325 330 335 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 340 345 350 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 355 360 365 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 370 375 380 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 385 390 395 400 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 405 410 415 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 420 425 430 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 435 440 445 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 450 455 460 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 465 470 475 480 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 485 490 495 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 500 505 510 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 515 520 525 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 530 535 540 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 545 550 555 560 Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 565 570 575 Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 580 585 590 Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 595 600 605 Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 610 615 620 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg 625 630 635 640 Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 645 650 655 Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 660 665 670 Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 675 680 685 Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 690 695 700 Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 705 710 715 720 Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 725 730 735 Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 740 745 750 Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 755 760 765 Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 770 775 780 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 785 790 795 800 Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 805 810 815 Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 820 825 830 Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 835 840 845 Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 850 855 860 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 865 870 875 880 Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 885 890 895 Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 900 905 910 Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 915 920 925 Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 930 935 940 Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 945 950 955 960 Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 965 970 975 Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 980 985 990 Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe 995 1000 1005 Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp 1010 1015 1020 Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala 1025 1030 1035 Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp 1040 1045 1050 Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser 1055 1060 1065 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1070 1075 1080 Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1085 1090 1095 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Gly Ser Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser 1115 1120 1125 Ser Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys 1130 1135 1140 Gly Ala Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu 1145 1150 1155 His Leu Ala Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr 1160 1165 1170 Arg Lys Tyr Lys Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys 1175 1180 1185 Pro Asp Gly Gly Val Arg Asn Leu Gly Val Pro Thr Val Thr Asp 1190 1195 1200 Arg Phe Ile Gln Gln Ala Ile Ala Gln Val Leu Thr Pro Ile Tyr 1205 1210 1215 Glu Glu Gln Phe His Asp His Ser Tyr Gly Phe Arg Pro Asn Arg 1220 1225 1230 Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn Ile Met Asn Asp 1235 1240 1245 Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys Phe Phe Asp 1250 1255 1260 Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg Thr Ile 1265 1270 1275 Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val Ser 1280 1285 1290 Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 1295 1300 1305 Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu 1310 1315 1320 Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val 1325 1330 1335 Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 1340 1345 1350 Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys 1355 1360 1365 Leu Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro 1370 1375 1380 Ser Gly Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg 1385 1390 1395 Ala His Gln Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys 1400 1405 1410 Phe Lys Lys Arg Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val 1415 1420 1425 Ser Asn Ser Tyr Lys Val Glu Lys Leu Asn Gln Leu Ile Arg Gly 1430 1435 1440 Trp Ile Asn Tyr Phe Lys Ile Gly Ser Met Lys Thr Leu Cys Lys 1445 1450 1455 Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu Arg Met Cys Ile Trp 1460 1465 1470 Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys Asn Leu Val Lys 1475 1480 1485 Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala Tyr Thr Gly 1490 1495 1500 Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn Val Ala 1505 1510 1515 Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met Leu 1520 1525 1530 Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Met Lys Arg Thr Ala 1535 1540 1545 Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <210> 222 <211> 1548 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 222 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser 20 25 30 Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala 35 40 45 Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala 50 55 60 Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys 65 70 75 80 Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val 85 90 95 Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala 100 105 110 Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His 115 120 125 Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr 130 135 140 Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp 145 150 155 160 Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu 165 170 175 Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys 180 185 190 Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile 195 200 205 Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile 210 215 220 Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe 225 230 235 240 Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 245 250 255 Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu 260 265 270 Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly 275 280 285 Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln 290 295 300 Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg 305 310 315 320 Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys 325 330 335 Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys 340 345 350 Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg 355 360 365 Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn 370 375 380 Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg 385 390 395 400 Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly 405 410 415 Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu 420 425 430 Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly 435 440 445 Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu 450 455 460 Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser 465 470 475 480 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 485 490 495 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 500 505 510 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 515 520 525 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 530 535 540 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 545 550 555 560 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 565 570 575 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 580 585 590 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 595 600 605 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 610 615 620 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 625 630 635 640 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 645 650 655 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 660 665 670 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 675 680 685 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 690 695 700 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 705 710 715 720 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 725 730 735 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 740 745 750 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 755 760 765 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 770 775 780 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 785 790 795 800 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 805 810 815 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 820 825 830 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 835 840 845 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 850 855 860 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 865 870 875 880 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 885 890 895 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 900 905 910 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 915 920 925 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 930 935 940 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 945 950 955 960 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 965 970 975 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 980 985 990 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 995 1000 1005 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile 1010 1015 1020 Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 1025 1030 1035 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg 1040 1045 1050 Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln 1055 1060 1065 Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser 1070 1075 1080 His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His 1085 1090 1095 Lys Glu Leu Gly Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile 1100 1105 1110 Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser 1115 1120 1125 Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys 1130 1135 1140 Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys 1145 1150 1155 Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala 1160 1165 1170 Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr 1175 1180 1185 Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu 1190 1195 1200 Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp 1205 1210 1215 Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu 1220 1225 1230 Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 1235 1240 1245 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg 1250 1255 1260 Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 1265 1270 1275 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala 1280 1285 1290 Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile 1295 1300 1305 Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys 1310 1315 1320 Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe 1325 1330 1335 Asn Lys Ile Arg Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe 1340 1345 1350 Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His 1355 1360 1365 Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro 1370 1375 1380 Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn 1385 1390 1395 Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly 1400 1405 1410 Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu 1415 1420 1425 Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys 1430 1435 1440 Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu 1445 1450 1455 Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala 1460 1465 1470 Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln 1475 1480 1485 Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn 1490 1495 1500 Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu 1505 1510 1515 Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys 1520 1525 1530 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1535 1540 1545 <210> 223 <211> 1548 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 223 Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser 20 25 30 Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala 35 40 45 Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala 50 55 60 Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys 65 70 75 80 Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val 85 90 95 Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala 100 105 110 Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His 115 120 125 Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr 130 135 140 Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp 145 150 155 160 Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu 165 170 175 Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys 180 185 190 Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile 195 200 205 Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile 210 215 220 Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe 225 230 235 240 Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 245 250 255 Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu 260 265 270 Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly 275 280 285 Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln 290 295 300 Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg 305 310 315 320 Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys 325 330 335 Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys 340 345 350 Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg 355 360 365 Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn 370 375 380 Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg 385 390 395 400 Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly 405 410 415 Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu 420 425 430 Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly 435 440 445 Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu 450 455 460 Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser 465 470 475 480 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 485 490 495 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 500 505 510 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 515 520 525 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 530 535 540 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 545 550 555 560 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 565 570 575 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 580 585 590 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 595 600 605 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 610 615 620 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 625 630 635 640 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 645 650 655 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 660 665 670 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 675 680 685 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 690 695 700 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 705 710 715 720 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 725 730 735 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 740 745 750 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 755 760 765 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 770 775 780 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 785 790 795 800 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 805 810 815 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 820 825 830 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 835 840 845 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 850 855 860 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 865 870 875 880 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 885 890 895 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 900 905 910 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 915 920 925 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 930 935 940 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 945 950 955 960 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 965 970 975 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 980 985 990 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 995 1000 1005 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile 1010 1015 1020 Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 1025 1030 1035 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg 1040 1045 1050 Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln 1055 1060 1065 Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser 1070 1075 1080 His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His 1085 1090 1095 Lys Glu Leu Arg Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile 1100 1105 1110 Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser 1115 1120 1125 Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys 1130 1135 1140 Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys 1145 1150 1155 Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala 1160 1165 1170 Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr 1175 1180 1185 Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu 1190 1195 1200 Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp 1205 1210 1215 Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu 1220 1225 1230 Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 1235 1240 1245 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg 1250 1255 1260 Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 1265 1270 1275 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala 1280 1285 1290 Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile 1295 1300 1305 Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys 1310 1315 1320 Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe 1325 1330 1335 Asn Lys Ile Arg Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe 1340 1345 1350 Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His 1355 1360 1365 Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro 1370 1375 1380 Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn 1385 1390 1395 Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly 1400 1405 1410 Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu 1415 1420 1425 Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys 1430 1435 1440 Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu 1445 1450 1455 Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala 1460 1465 1470 Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln 1475 1480 1485 Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn 1490 1495 1500 Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp Glu 1505 1510 1515 Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser Lys 1520 1525 1530 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1535 1540 1545 <210> 224 <211> 486 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 224 Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro 485 <210> 225 <400> 225 000 <210> 226 <400> 226 000 <210> 227 <400> 227 000 <210> 228 <400> 228 000 <210> 229 <400> 229 000 <210> 230 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 230 Met Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly 1 5 10 15 Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala 20 25 30 Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala 35 40 45 Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile 50 55 60 Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 65 70 75 80 Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val 85 90 95 Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn 100 105 110 Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp 115 120 125 Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro 130 135 140 Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln 145 150 155 160 Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu 165 170 175 Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His 180 185 190 Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala 195 200 205 Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr 210 215 220 Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys 225 230 235 240 Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg 245 250 255 Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro 260 265 270 Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Thr Ala Gly Phe Cys 275 280 285 Arg Leu Trp Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro 290 295 300 Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 305 310 315 320 Ala Tyr Gln Glu Ile Leu Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly 325 330 335 Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln 340 345 350 Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg 355 360 365 Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp 370 375 380 Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp 385 390 395 400 Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His 405 410 415 Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn 420 425 430 Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val 435 440 445 Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu 450 455 460 Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala 465 470 475 480 His Gly Thr Arg Pro Asp Leu 485 <210> 231 <211> 231 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 231 Met Leu Gln Leu Gly His Leu Glu Glu Ser Asn Ser Pro Trp Asn Thr 1 5 10 15 Pro Val Phe Val Ile Lys Lys Lys Ser Gly Lys Trp Arg Leu Leu Gln 20 25 30 Asp Leu Arg Ala Val Asn Ala Thr Met His Asp Met Gly Ala Leu Gln 35 40 45 Pro Gly Leu Pro Ser Pro Val Ala Val Pro Lys Gly Trp Glu Ile Ile 50 55 60 Ile Ile Asp Leu Gln Asp Cys Phe Phe Asn Ile Lys Leu His Pro Glu 65 70 75 80 Asp Cys Lys Arg Phe Ala Phe Ser Val Pro Ser Pro Asn Phe Lys Arg 85 90 95 Pro Tyr Gln Arg Phe Gln Trp Lys Val Leu Pro Gln Gly Met Lys Asn 100 105 110 Ser Pro Thr Leu Cys Gln Lys Phe Val Asp Lys Ala Ile Leu Thr Val 115 120 125 Arg Asp Lys Tyr Gln Asp Ser Tyr Ile Val His Tyr Met Asp Asp Ile 130 135 140 Leu Leu Ala His Pro Ser Arg Ser Ile Val Asp Glu Ile Leu Thr Ser 145 150 155 160 Met Ile Gln Ala Leu Asn Lys His Gly Leu Val Val Ser Thr Glu Lys 165 170 175 Ile Gln Lys Tyr Asp Asn Leu Lys Tyr Leu Gly Thr His Ile Gln Gly 180 185 190 Asp Ser Val Ser Tyr Gln Lys Leu Gln Ile Arg Thr Asp Lys Leu Arg 195 200 205 Thr Leu Asn Asp Phe Gln Lys Leu Leu Gly Asn Ile Asn Trp Ile Arg 210 215 220 Pro Phe Leu Lys Leu Thr Thr 225 230 <210> 232 <211> 427 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 232 Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu 1 5 10 15 Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val 20 25 30 Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly 35 40 45 Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro 50 55 60 Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu 65 70 75 80 Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln 85 90 95 Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly 100 105 110 Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn 115 120 125 Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys 130 135 140 Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg 145 150 155 160 Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val 165 170 175 Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 180 185 190 Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn 195 200 205 Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr 210 215 220 Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg 225 230 235 240 Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys 245 250 255 Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr 260 265 270 Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala 275 280 285 Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu 290 295 300 Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys 305 310 315 320 Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser 325 330 335 Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu 340 345 350 Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys 355 360 365 Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala 370 375 380 Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn 385 390 395 400 Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met 405 410 415 Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 420 425 <210> 233 <211> 774 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 233 Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 1 5 10 15 Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr 50 55 60 Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 85 90 95 Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val 165 170 175 Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 370 375 380 Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile 515 520 525 Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe 530 535 540 Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 755 760 765 Leu Lys Pro Lys Gly Thr 770 <210> 234 <211> 774 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 234 Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 1 5 10 15 Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr 50 55 60 Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 85 90 95 Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val 165 170 175 Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asp Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 370 375 380 Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile 515 520 525 Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe 530 535 540 Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 755 760 765 Leu Lys Pro Lys Gly Thr 770 <210> 235 <211> 774 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 235 Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 1 5 10 15 Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Ser Thr Val Val Thr 50 55 60 Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Ser Val 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 85 90 95 Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Leu Asp Ile Gly Thr 130 135 140 Pro Cys His Glu Gly Glu Val Phe Ala Glu Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Glu Gly Thr Arg Val Ile Thr Trp Arg Asn Val 165 170 175 Asp Leu Pro Tyr Val Asp Val Leu Ser Thr Glu Arg Glu Met Ile Gln 180 185 190 Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Lys Leu Gly Ile Asn Phe Thr Leu Gly Arg Glu Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Val Asn Leu Pro Ile 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Met Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 370 375 380 Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Ile Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile 515 520 525 Glu Glu Lys Tyr Gly Phe Lys Leu Ile Tyr Ser Asp Thr Asp Gly Phe 530 535 540 Phe Ala Thr Ile Pro Gly Ala Glu Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Tyr Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Trp Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 755 760 765 Leu Lys Pro Lys Gly Thr 770 <210> 236 <211> 683 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 236 Met Asp His Leu Leu Leu Lys Thr Gln Thr Gln Thr Glu Gln Val Met 1 5 10 15 Asn Val Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg Leu Tyr Phe 20 25 30 Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp Thr Gly Ala 35 40 45 Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu His Trp Val 50 55 60 Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly Ser Ser Ile 65 70 75 80 Thr Ile Ser Lys Val Cys Lys Asp Ile Asp Leu Ile Ile Ala Gly Glu 85 90 95 Ile Phe Arg Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly Ile Asp Phe 100 105 110 Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe Ile Gln Phe 115 120 125 Thr Asp Arg Val Ile Phe Thr Lys Asn Lys Ser Tyr Pro Val His Ile 130 135 140 Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly Phe Leu Glu 145 150 155 160 Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro Val Asn Ile 165 170 175 Ser Thr Asn Lys Ile Glu Asn Pro Leu Glu Glu Ile Ala Ile Leu Ser 180 185 190 Glu Gly Arg Arg Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg 195 200 205 Met Gln Lys Ile Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro 210 215 220 Leu Asp Pro Asn Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu 225 230 235 240 Ser Asp Pro Ser Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro 245 250 255 Met Asp Arg Glu Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu 260 265 270 Lys Val Ile Lys Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu 275 280 285 Val Asn Asn Glu Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val 290 295 300 Asn Tyr Lys Ala Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu 305 310 315 320 Pro Asn Lys Asp Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe 325 330 335 Ser Ser Phe Asp Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln 340 345 350 Glu Ser Arg Pro Leu Thr Ala Phe Thr Cys Pro Gln Gly His Tyr Glu 355 360 365 Trp Asn Val Val Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln 370 375 380 Arg His Met Asp Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val 385 390 395 400 Tyr Val Asp Asp Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu 405 410 415 Leu His Val Ala Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile 420 425 430 Leu Ser Lys Lys Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu 435 440 445 Gly Leu Glu Ile Asp Glu Gly Thr His Lys Pro Gln Gly His Ile Leu 450 455 460 Glu His Ile Asn Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu 465 470 475 480 Gln Arg Phe Leu Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys 485 490 495 Leu Ala Gln Ile Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val 500 505 510 Pro Trp Arg Trp Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys 515 520 525 Lys Asn Leu Gln Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu 530 535 540 Lys Leu Ile Ile Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met 545 550 555 560 Leu Lys Ala Ile Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys 565 570 575 Arg Tyr Ala Ser Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser 580 585 590 Asn Asp Lys Glu Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser 595 600 605 Ile Tyr Leu Thr Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His 610 615 620 Phe Lys Ser Phe Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly 625 630 635 640 Arg Asn Ile Arg Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val 645 650 655 Glu His Ile Lys Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg 660 665 670 Glu Phe Asn Lys Val Asn Ser Ser Gly Gly Ser 675 680 <210> 237 <211> 329 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 237 Met Gly Ile His Gly Val Pro Ala Ala Met Lys Ser Ala Glu Tyr Leu 1 5 10 15 Asn Thr Phe Arg Leu Arg Asn Leu Gly Leu Pro Val Met Asn Asn Leu 20 25 30 His Asp Met Ser Lys Ala Thr Arg Ile Ser Val Glu Thr Leu Arg Leu 35 40 45 Leu Ile Tyr Thr Ala Asp Phe Arg Tyr Arg Ile Tyr Thr Val Glu Lys 50 55 60 Lys Gly Pro Glu Lys Arg Met Arg Thr Ile Tyr Gln Pro Ser Arg Glu 65 70 75 80 Leu Lys Ala Leu Gln Gly Trp Val Leu Arg Asn Ile Leu Asp Lys Leu 85 90 95 Ser Ser Ser Pro Phe Ser Ile Gly Phe Glu Lys His Gln Ser Ile Leu 100 105 110 Asn Asn Ala Thr Pro His Ile Gly Ala Asn Phe Ile Leu Asn Ile Asp 115 120 125 Leu Glu Asp Phe Phe Pro Ser Leu Thr Ala Asn Lys Val Phe Gly Val 130 135 140 Phe His Ser Leu Gly Tyr Asn Arg Leu Ile Ser Ser Val Leu Thr Lys 145 150 155 160 Ile Cys Cys Tyr Lys Asn Leu Leu Pro Gln Gly Ala Pro Ser Ser Pro 165 170 175 Lys Leu Ala Asn Leu Ile Cys Ser Lys Leu Asp Tyr Arg Ile Gln Gly 180 185 190 Tyr Ala Gly Ser Arg Gly Leu Ile Tyr Thr Arg Tyr Ala Asp Asp Leu 195 200 205 Thr Leu Ser Ala Gln Ser Met Lys Lys Val Val Lys Ala Arg Asp Phe 210 215 220 Leu Phe Ser Ile Ile Pro Ser Glu Gly Leu Val Ile Asn Ser Lys Lys 225 230 235 240 Thr Cys Ile Ser Gly Pro Arg Ser Gln Arg Lys Val Thr Gly Leu Val 245 250 255 Ile Ser Gln Glu Lys Val Gly Ile Gly Arg Glu Lys Tyr Lys Glu Ile 260 265 270 Arg Ala Lys Ile His His Ile Phe Cys Gly Lys Ser Ser Glu Ile Glu 275 280 285 His Val Arg Gly Trp Leu Ser Phe Ile Leu Ser Val Asp Ser Lys Ser 290 295 300 His Arg Arg Leu Ile Thr Tyr Ile Ser Lys Leu Glu Lys Lys Tyr Gly 305 310 315 320 Lys Asn Pro Leu Asn Lys Ala Lys Thr 325 <210> 238 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 238 Met Glu Lys Glu Gly Gln Leu Glu Glu Ala Pro Pro Thr Asn Pro Tyr 1 5 10 15 Asn Thr Pro Thr Phe Ala Ile Lys Lys Lys Asp Lys Asn Lys Trp Arg 20 25 30 Met Leu Ile Asp Phe Arg Glu Leu Asn Lys Val Thr Gln Asp Phe Thr 35 40 45 Glu Ile Gln Leu Gly Ile Pro His Pro Ala Gly Leu Ala Lys Lys Arg 50 55 60 Arg Ile Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Ile Pro Leu 65 70 75 80 His Glu Asp Phe Arg Pro Tyr Thr Ala Phe Thr Leu Pro Ser Val Asn 85 90 95 Asn Ala Glu Pro Gly Lys Arg Tyr Ile Tyr Lys Val Leu Pro Gln Gly 100 105 110 Trp Lys Gly Ser Pro Ala Ile Phe Gln His Thr Met Arg Gln Val Leu 115 120 125 Glu Pro Phe Arg Lys Ala Asn Lys Asp Val Ile Ile Ile Gln Tyr Met 130 135 140 Asp Asp Ile Leu Ile Ala Ser Asp Arg Thr Asp Leu Glu His Asp Arg 145 150 155 160 Val Val Leu Gln Leu Lys Glu Leu Leu Asn Gly Leu Gly Phe Ser Thr 165 170 175 Pro Asp Glu Lys Phe Gln Lys Asp Pro Pro Ile His Trp Met Gly Tyr 180 185 190 Glu Leu Trp Pro Thr Lys Trp Lys Leu Gln Lys Ile Gln Leu Pro Gln 195 200 205 Lys Glu Ile Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Val Leu 210 215 220 Asn Trp Ala Ala Gln Leu Tyr Pro Gly Ile Lys 225 230 235 <210> 239 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 239 Met Glu Glu Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu Asn Pro Tyr 1 5 10 15 Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg 20 25 30 Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp 35 40 45 Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys 50 55 60 Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu 65 70 75 80 Asp Glu Ser Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn 85 90 95 Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly 100 105 110 Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu 115 120 125 Glu Pro Phe Arg Ile Lys Asn Pro Glu Ile Val Ile Tyr Gln Tyr Met 130 135 140 Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr 145 150 155 160 Lys Ile Glu Glu Leu Arg Ala His Leu Leu Ser Trp Gly Phe Thr Thr 165 170 175 Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr 180 185 190 Glu Leu His Pro Asp Arg Trp Thr Val Gln Pro Ile Asp Leu Pro Glu 195 200 205 Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu 210 215 220 Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys 225 230 235 <210> 240 <211> 441 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 240 Met Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly 1 5 10 15 Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile 20 25 30 Lys Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile 35 40 45 Ser Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile 50 55 60 Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu 65 70 75 80 Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro 85 90 95 His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val 100 105 110 Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr 115 120 125 Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg 130 135 140 Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile 145 150 155 160 Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn 165 170 175 Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser 180 185 190 Asp Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln 195 200 205 His Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys 210 215 220 Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp 225 230 235 240 Thr Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn 245 250 255 Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr 260 265 270 Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys 275 280 285 Ala Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu 290 295 300 Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr 305 310 315 320 Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly 325 330 335 Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr 340 345 350 Gly Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln 355 360 365 Leu Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp 370 375 380 Gly Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu 385 390 395 400 Thr Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu 405 410 415 Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys 420 425 430 Glu Pro Ile Val Gly Ala Glu Thr Phe 435 440 <210> 241 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 241 aauagcggcc cuaagaaauc cgucuuucau ugacgg 36 <210> 242 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 242 auuggaacug gcgagaaauc cgucuuucau ugacgg 36 <210> 243 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 243 ccagcaacac cuaagaaauc cgucuuucau ugacgg 36 <210> 244 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 244 cggcgcucga auaggaaauc cgucuuucau ugacgg 36 <210> 245 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 245 guggcaacac cuaagaaauc cgucuuucau ugacgg 36 <210> 246 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 246 guugcaacac cuaagaaauc cgucuuucau ugacgg 36 <210> 247 <211> 36 <212> RNA <213> Artificial Sequence <220> <223> Synthetic <400> 247 guugcaaugc cuaagaaauc cgucuuucau ugacgg 36 <210> 248 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 248 gggaagtggt tggtcagcat 20 <210> 249 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 249 gggaagtggt tgcgaggcat 20 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 250 gggaagtggt tgagcggtca 20 <210> 251 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 251 gggaagtggt tggcat 16 <210> 252 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 252 gagccagtgt tgctagtcaa 20 <210> 253 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 253 gagccagtgt tgcgagtcaa 20 <210> 254 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 254 gagccagtgt tgagcgctag 20 <210> 255 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 255 gagccagtgt tgtcaa 16 <210> 256 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 256 ttaaactctc catggaccag 20 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 257 ttaaactctc cacgagccag 20 <210> 258 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 258 ttaaactctc caagcgtgga 20 <210> 259 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 259 ttaaactctc caccag 16

Claims (88)

  1. 유전자 편집 시스템으로서,
    (a) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산;
    (b) 역전사효소(reverse transcriptase: RT) 폴리펩타이드 또는 상기 RT 폴리펩타이드를 암호화하는 제2 핵산;
    (c) 가이드 RNA(gRNA) 또는 상기 gRNA를 암호화하는 제3 핵산으로서, 상기 gRNA는 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 관심 게놈 부위 내의 표적 서열에 특이적인 스페이서 서열, 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM)에 인접한 표적 서열을 포함하는, 상기 가이드 RNA(gRNA) 또는 상기 gRNA를 암호화하는 제3 핵산; 및
    (d) 역전사 공여체 RNA(RT 공여체 RNA) 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산으로서, 상기 RT 공여체 RNA는 프라이머 결합 부위(primer binding site: PBS) 및 주형 서열을 포함하는, 상기 역전사 공여체 RNA(RT 공여체 RNA) 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산
    을 포함하는, 유전자 편집 시스템.
  2. 제1항에 있어서, 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12 폴리펩타이드인, 유전자 편집 시스템.
  3. 제2항에 있어서, 상기 Cas12 폴리펩타이드는 Cas12i 폴리펩타이드이고, 선택적으로 Cas12i2 폴리펩타이드인, 유전자 편집 시스템.
  4. 제3항에 있어서, 상기 Cas12i 폴리펩타이드는 서열번호 2와 적어도 95% 동일한 아미노산 서열을 포함하는 Cas12i2 폴리펩타이드인, 유전자 편집 시스템.
  5. 제4항에 있어서, 상기 Cas12i2 폴리펩타이드는 서열번호 2의 D581, G624, F626, P868, I926, V1030, E1035 및/또는 S1046 위치에 하나 이상의 돌연변이를 포함하는, 유전자 편집 시스템.
  6. 제5항에 있어서, 상기 하나 이상의 돌연변이는 선택적으로 D581R, G624R, F626R, P868T, I926R, V1030G, E1035R, S1046G 또는 이들의 조합인 아미노산 치환인, 유전자 편집 시스템.
  7. 제5항에 있어서, 상기 Cas12i2 폴리펩타이드는,
    (i) 선택적으로 D581R, D911R, I926R 및 V1030G의 아미노산 치환인 D581, D911, I926 및 V1030 위치에서의 돌연변이;
    (ii) 선택적으로 D581R, I926R 및 V1030G의 아미노산 치환인 D581, I926 및 V1030 위치에서의 돌연변이;
    (iii) 선택적으로 D581R, I926R, V1030G 및 S1046G의 아미노산 치환인 D581, I926, V1030 및 S1046 위치에서의 돌연변이;
    (iv) 선택적으로 D581R, G624R, F626R, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환인 D581, G624, F626, I926, V1030, E1035 및 S1046 위치에서의 돌연변이; 또는
    (v) 선택적으로 D581R, G624R, F626R, P868T, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환인 D581, G624, F626, P868, I926, V1030, E1035 및 S1046 위치에서의 돌연변이
    를 포함하는, 유전자 편집 시스템.
  8. 제7항에 있어서, 상기 Cas12i2 폴리펩타이드는 서열번호 3 내지 7 중 어느 하나, 선택적으로 서열번호 4 또는 서열번호 7의 아미노산 서열을 포함하는, 유전자 편집 시스템.
  9. 제4항 또는 제5항에 있어서, 상기 Cas12i 폴리펩타이드는 감소된 crRNA 처리 활성을 갖되, 선택적으로 상기 Cas12i 폴리펩타이드는 서열번호 2의 H485 위치 및/또는 H486 위치에 돌연변이를 포함하는, 유전자 편집 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함하는, 유전자 편집 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산을 포함하는, 유전자 편집 시스템.
  12. 제11항에 있어서, 상기 제1 핵산은, 선택적으로 제1 바이러스 벡터인 제1 벡터에 위치하는, 유전자 편집 시스템.
  13. 제11항에 있어서, 상기 제1 핵산은 제1 메신저 RNA(mRNA)인, 유전자 편집 시스템.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 RT 폴리펩타이드는 몰로니 뮤린 백혈병 바이러스(Moloney Murine Leukemia Virus: MMLV)-RT, 마우스 유방 종양 바이러스(mouse mammary tumor virus: MMTV)-RT, 마라톤-RT 또는 RTx-RT인, 유전자 편집 시스템.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 시스템은 RT 폴리펩타이드를 포함하는, 유전자 편집 시스템.
  16. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 시스템은 RT 폴리펩타이드를 암호화하는 제2 핵산을 포함하는, 유전자 편집 시스템.
  17. 제16항에 있어서, 상기 제2 핵산은, 선택적으로 제2 바이러스 벡터인 제2 벡터에 위치하는, 유전자 편집 시스템.
  18. 제17항에 있어서, 상기 제2 벡터는 상기 제1 벡터와 동일한, 유전자 편집 시스템.
  19. 제16항에 있어서, 상기 제2 핵산은 제2 mRNA인, 유전자 편집 시스템.
  20. 제17항에 있어서, 상기 제1 mRNA 및 상기 제2 mRNA는 단일 RNA 분자에 위치하는, 유전자 편집 시스템.
  21. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 유전자 편집 시스템은 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드와 상기 RT 폴리펩타이드를 포함하는 융합 폴리펩타이드를 포함하는, 유전자 편집 시스템.
  22. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드와 상기 RT 폴리펩타이드는 별도의 폴리펩타이드인, 유전자 편집 시스템.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 스페이서 서열은 20개 내지 30개의 뉴클레오타이드 길이, 선택적으로 20개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
  24. 제3항 내지 제23항 중 어느 한 항에 있어서, 상기 PAM은, 선택적으로 상기 표적 서열의 5'에 위치하는 5'-TTN-3'의 모티프를 포함하는, 유전자 편집 시스템.
  25. 제3항 내지 제24항 중 어느 한 항에 있어서, 상기 하나 이상의 CRISPR 뉴클레이스 결합 부위는 직접 반복 서열(들)인, 유전자 편집 시스템.
  26. 제25항에 있어서, 각각의 직접 반복 서열은 23개 내지 36개의 뉴클레오타이드 길이, 선택적으로 23개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
  27. 제26항에 있어서, 상기 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나 또는 이의 단편과 적어도 90% 동일한, 유전자 편집 시스템.
  28. 제27항에 있어서, 상기 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나 또는 이의 단편이고; 선택적으로 상기 직접 반복 서열은 서열번호 17인, 유전자 편집 시스템.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 시스템은 상기 gRNA를 포함하는, 유전자 편집 시스템.
  30. 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 시스템은 상기 gRNA를 암호화하는 상기 제3 핵산을 포함하는, 유전자 편집 시스템.
  31. 제30항에 있어서, 상기 제3 핵산은, 선택적으로 바이러스 벡터인 제3 벡터에 위치하는, 유전자 편집 시스템.
  32. 제31항에 있어서, 상기 제3 벡터는 상기 제1 벡터 및/또는 상기 제2 벡터와 동일한, 유전자 편집 시스템.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 PBS는 5개 내지 100개의 뉴클레오타이드 길이, 선택적으로 10개 내지 60개의 뉴클레오타이드 길이, 바람직하게는 10개 내지 30개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
  34. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 PBS는 상기 표적 서열의 상보적 영역에 인접한 PBS-표적화 부위에 결합하고, 상기 PBS-표적화 부위는 상기 표적 서열의 상보적 영역의 상류에 있는, 유전자 편집 시스템.
  35. 제34항에 있어서, 상기 PBS-표적화 부위는 상기 표적 서열의 상보적 영역의 상류에 있는 3개 내지 10개의 뉴클레오타이드인, 유전자 편집 시스템.
  36. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 PBS-표적화 부위는 상기 표적 서열의 상보적 영역과 중첩되는, 유전자 편집 시스템.
  37. 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 PBS-표적화 부위는 상기 표적 서열에 인접하거나 또는 이와 중첩되는, 유전자 편집 시스템.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 주형 서열은 5개 내지 100개의 뉴클레오타이드 길이, 선택적으로 30개 내지 50개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
  39. 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 주형 서열은 상기 관심 게놈 부위와 상동성이고, 상기 관심 게놈 부위에 대해 하나 이상의 뉴클레오타이드 변이를 포함하는, 유전자 편집 시스템.
  40. 제39항에 있어서, 상기 적어도 하나의 뉴클레오타이드 변이는 상기 표적 서열 내에 위치하는, 유전자 편집 시스템.
  41. 제39항 또는 제40항에 있어서, 상기 적어도 하나의 뉴클레오타이드 변이는 PAM에 위치하는, 유전자 편집 시스템.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 시스템은 상기 RT 공여체 RNA를 포함하는, 유전자 편집 시스템.
  43. 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 시스템은 상기 RT 공여체 RNA를 암호화하는 상기 제4 핵산을 포함하는, 유전자 편집 시스템.
  44. 제43항에 있어서, 상기 제4 핵산은, 선택적으로 제4 바이러스 벡터인 제4 벡터에 위치하는, 유전자 편집 시스템.
  45. 제44항에 있어서, 상기 4 벡터는 상기 제1 벡터, 상기 제2 벡터 및/또는 상기 제3 벡터와 동일한, 유전자 편집 시스템.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 gRNA 및 상기 RT 공여체 RNA는, 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 PBS 및 상기 주형 서열을 포함하는 단일 RNA 분자에 위치하는, 유전자 편집 시스템.
  47. 제46항에 있어서, 상기 단일 RNA 분자는 상기 gRNA와 상기 RT 공여체 RNA 사이에 링커를 추가로 포함하는, 유전자 편집 시스템.
  48. 제47항에 있어서, 상기 링커는 헤어핀을 포함하는, 유전자 편집 시스템.
  49. 제46항 내지 제48항 중 어느 한 항에 있어서, 상기 단일 RNA 분자는, 5'에서 3'로,
    (i) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 주형 서열 및 상기 PBS;
    (ii) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 링커, 상기 주형 서열 및 상기 PBS;
    (iii) 상기 주형 서열, 상기 PBS, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열; 또는
    (iv) 상기 주형 서열, 상기 PBS, 상기 링커, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열
    을 포함하는, 유전자 편집 시스템.
  50. 제46항 내지 제49항 중 어느 한 항에 있어서, 상기 단일 RNA 분자는 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함하며, 상기 5' 말단 보호 단편 및 상기 3' 말단 보호 단편 각각은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 형성하는, 유전자 편집 시스템.
  51. 제50항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 시스템.
  52. 제50항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 시스템.
  53. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 gRNA 및 상기 RT 공여체 RNA는 2개의 개별 RNA 분자인, 유전자 편집 시스템.
  54. 제53항에 있어서, 상기 gRNA, RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함하는, 유전자 편집 시스템.
  55. 제54항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 형성하거나 또는 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 시스템.
  56. 제54항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 시스템.
  57. 제1항 내지 제56항 중 어느 한 항에 있어서, 상기 시스템은 요소 (a), (b), (c), (d) 또는 이들의 임의의 조합을 포함하는 하나 이상의 지질 나노입자(LNP)를 포함하는, 유전자 편집 시스템.
  58. 제1항 내지 제57항 중 어느 한 항에 있어서, 상기 시스템은 (i) (a) 내지 (d) 중 최대 3개의 요소를 집합적으로 포함하는 하나 이상의 지질 나노입자(LNP) 및 (ii) 하나 이상의 벡터를 포함하는, 유전자 편집 시스템.
  59. 제58항에 있어서, 상기 하나 이상의 벡터는, 선택적으로 아데노-관련 바이러스(AAV) 벡터인 하나 이상의 바이러스 벡터인, 유전자 편집 시스템.
  60. 제1항 내지 제56항 중 어느 한 항에 있어서, 상기 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드, RT 폴리펩타이드, gRNA 및 RT 공여체 RNA를 포함하는, 유전자 편집 시스템.
  61. 제60항에 있어서, 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드 및/또는 상기 RT 폴리펩타이드는 상기 gRNA 및/또는 상기 RT 공여체 RNA와 복합체를 형성하는, 유전자 편집 시스템.
  62. 제1항 내지 제61항 중 어느 하나의 시스템을 포함하는 약제학적 조성물.
  63. 제1항 내지 제61항 중 어느 하나에 제시된 시스템의 (a) 내지 (d)의 요소를 포함하는 키트.
  64. 세포를 유전자 편집하는 방법으로서, 숙주 세포와 제1항 내지 제61항 중 어느 하나의 유전자 편집 시스템 또는 제62항의 약제학적 조성물을 접촉시켜 상기 숙주 세포를 유전자 편집하는 접촉 단계를 포함하는, 방법.
  65. 제64항에 있어서, 상기 숙주 세포는 시험관내에서 배양된, 방법.
  66. 제65항에 있어서, 상기 접촉 단계는 상기 유전자 편집 시스템을 상기 숙주 세포를 포함하는 대상체에게 투여함으로써 수행되는, 방법.
  67. 제1항 내지 제61항 중 어느 하나의 유전자 편집 시스템에 의해 생산되는 유전자 변형된 세포의 집단.
  68. 제67항에 있어서, 상기 유전자 편집 시스템에 의해 편집될 수 없는 유전자 변형된 세포를 포함하는, 유전자 변형된 세포의 집단.
  69. 제68항에 있어서, 상기 유전자 변형된 세포는 상기 PAM, 상기 표적 서열 또는 둘 다에 하나 이상의 변형을 포함하는, 유전자 변형된 세포의 집단.
  70. 유전자 편집 RNA 분자로서,
    (i) 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위);
    (ii) 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열로서, 상기 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 스페이서 서열;
    (iii) 프라이머 결합 부위(PBS); 및
    (iv) 주형 서열
    을 포함하는, 유전자 편집 RNA 분자.
  71. 제70항에 있어서, 하나 이상의 링커를 추가로 포함하는, 유전자 편집 RNA 분자.
  72. 제70항 또는 제71항에 있어서, 상기 RNA 분자는, 5'에서 3'로,
    (i) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 주형 서열 및 상기 PBS;
    (ii) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 링커, 상기 주형 서열 및 상기 PBS;
    (iii) 상기 주형 서열, 상기 PBS, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열; 또는
    (iv) 상기 주형 서열, 상기 PBS, 상기 링커, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열
    을 포함하는, 유전자 편집 RNA 분자.
  73. 제70항 내지 제72항 중 어느 한 항에 있어서, 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함하는, 유전자 편집 RNA 분자.
  74. 제73항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 형성하거나 또는 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 RNA 분자.
  75. 제73항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 RNA 분자.
  76. 유전자 편집 RNA 분자 세트로서,
    (i) 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열을 포함하는 가이드 RNA로서, 상기 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 가이드 RNA; 및
    (ii) 역전사 공여체 RNA(RT 공여체 RNA) 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산으로서, 상기 RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 RT 공여체 RNA 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산
    을 포함하는, 유전자 편집 RNA 분자 세트.
  77. 제76항에 있어서, 상기 gRNA, 상기 RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함하는, 유전자 편집 RNA 분자 세트.
  78. 제77항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 포함하거나 또는 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 RNA 분자 세트.
  79. 제77항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 RNA 분자 세트.
  80. 제70항 내지 제79항 중 어느 한 항에 있어서,
    (i) 상기 유형 V CRISPR 뉴클레이스 결합 부위는 제25항 내지 제28항 중 어느 한 항에 제시되어 있고;
    (ii) 상기 스페이서 서열은 제23항 또는 제24항에 제시되어 있고;
    (iii) 상기 PBS는 제33항 내지 제37항 중 어느 한 항에 제시되어 있고; 그리고/또는
    (iv) 상기 주형 서열은 제38항 내지 제41항 중 어느 한 항에 제시되어 있는, 유전자 편집 RNA 분자 또는 유전자 편집 RNA 분자 세트.
  81. DNA 분자 또는 DNA 분자 세트로서, 제70항 내지 제80항 중 어느 한 항에 제시된 유전자 편집 RNA 분자 또는 유전자 편집 RNA 분자 세트를 암호화하는, DNA 분자 또는 DNA 분자 세트.
  82. 제81항에 있어서, 벡터 또는 벡터 세트에 포함되어 있으며, 선택적으로 상기 벡터 또는 벡터 세트는 바이러스 벡터인, DNA 분자 또는 DNA 분자 세트.
  83. CRISPR 뉴클레이스 및 역전사효소를 포함하는 융합 폴리펩타이드.
  84. 제83항에 있어서, 상기 CRISPR 뉴클레이스는 유형 V CRISPR 뉴클레이스이고, 선택적으로 Cas12i 폴리펩타이드인, 융합 폴리펩타이드.
  85. 제84항에 있어서, 상기 Cas12i 폴리펩타이드는 선택적으로 제4항 내지 제9항 중 어느 한 항에 제시되어 있는 Cas12i2 폴리펩타이드인, 융합 폴리펩타이드.
  86. 제85항에 있어서, 서열번호 25 내지 26 및 219 내지 223 중 어느 하나의 아미노산 서열을 포함하는, 융합 폴리펩타이드.
  87. 제83항 내지 제86항 중 어느 한 항의 융합 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산.
  88. 제87항에 있어서, 벡터, 선택적으로 발현 벡터인, 핵산.
KR1020237044997A 2021-06-01 2022-06-01 Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 KR20240031238A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202163195621P 2021-06-01 2021-06-01
US63/195,621 2021-06-01
US202163236047P 2021-08-23 2021-08-23
US63/236,047 2021-08-23
US202163272937P 2021-10-28 2021-10-28
US63/272,937 2021-10-28
US202263299695P 2022-01-14 2022-01-14
US63/299,695 2022-01-14
PCT/US2022/031821 WO2022256440A2 (en) 2021-06-01 2022-06-01 Gene editing systems comprising a crispr nuclease and uses thereof

Publications (1)

Publication Number Publication Date
KR20240031238A true KR20240031238A (ko) 2024-03-07

Family

ID=82492907

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237044997A KR20240031238A (ko) 2021-06-01 2022-06-01 Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도

Country Status (10)

Country Link
US (2) US20230023791A1 (ko)
EP (1) EP4347818A2 (ko)
JP (1) JP2024520528A (ko)
KR (1) KR20240031238A (ko)
AU (1) AU2022284804A1 (ko)
BR (1) BR112023024985A2 (ko)
CA (1) CA3222023A1 (ko)
IL (1) IL308806A (ko)
TW (1) TW202313971A (ko)
WO (1) WO2022256440A2 (ko)

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
PT2898075E (pt) 2012-12-12 2016-06-16 Harvard College Manipulação e otimização de sistemas, métodos e composições de enzima melhorados para manipulação de sequências
PT2896697E (pt) 2012-12-12 2015-12-31 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
CN105658796B (zh) 2012-12-12 2021-10-26 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
US9834791B2 (en) 2013-11-07 2017-12-05 Editas Medicine, Inc. CRISPR-related methods and compositions with governing gRNAS
US9994831B2 (en) 2013-12-12 2018-06-12 The Regents Of The University Of California Methods and compositions for modifying a single stranded target nucleic acid
CN105899657A (zh) 2013-12-12 2016-08-24 布罗德研究所有限公司 用于改变基因产物表达的crispr-cas系统和方法、结构信息以及诱导型模块化cas酶
WO2015089473A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
WO2015103153A1 (en) 2013-12-31 2015-07-09 The Regents Of The University Of California Cas9 crystals and methods of use thereof
WO2016028682A1 (en) 2014-08-17 2016-02-25 The Broad Institute Inc. Genome editing using cas9 nickases
WO2016036754A1 (en) 2014-09-02 2016-03-10 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification
WO2016106239A1 (en) 2014-12-23 2016-06-30 The Regents Of The University Of California Methods and compositions for nucleic acid integration
WO2016186946A1 (en) 2015-05-15 2016-11-24 Pioneer Hi-Bred International, Inc. Rapid characterization of cas endonuclease systems, pam sequences and guide rna elements
EP3303634B1 (en) 2015-06-03 2023-08-30 The Regents of The University of California Cas9 variants and methods of use thereof
US20160362667A1 (en) 2015-06-10 2016-12-15 Caribou Biosciences, Inc. CRISPR-Cas Compositions and Methods
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
AU2016279062A1 (en) 2015-06-18 2019-03-28 Omar O. Abudayyeh Novel CRISPR enzymes and systems
EP3666895A1 (en) 2015-06-18 2020-06-17 The Broad Institute, Inc. Novel crispr enzymes and systems
US9580727B1 (en) 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
US11008555B2 (en) 2015-09-17 2021-05-18 The Regents Of The University Of California Variant Cas9 polypeptides comprising internal insertions
KR20180133374A (ko) 2015-10-22 2018-12-14 더 브로드 인스티튜트, 인코퍼레이티드 타입 vi-b crispr 효소 및 시스템
ES2699848T3 (es) 2015-10-23 2019-02-13 Caribou Biosciences Inc Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos
US9771600B2 (en) 2015-12-04 2017-09-26 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
EP3390624A4 (en) 2015-12-18 2019-07-10 The Regents of The University of California MODIFIED POLYPEPTIDES AND METHOD OF USE THEREOF
WO2017106657A1 (en) 2015-12-18 2017-06-22 The Broad Institute Inc. Novel crispr enzymes and systems
KR102670601B1 (ko) 2016-04-19 2024-05-29 더 브로드 인스티튜트, 인코퍼레이티드 신규한 crispr 효소 및 시스템
AU2017257274B2 (en) 2016-04-19 2023-07-13 Massachusetts Institute Of Technology Novel CRISPR enzymes and systems
JP7267013B2 (ja) 2016-06-17 2023-05-01 ザ・ブロード・インスティテュート・インコーポレイテッド Vi型crisprオルソログ及び系
CN110114461A (zh) 2016-08-17 2019-08-09 博德研究所 新型crispr酶和系统
WO2018035387A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
KR20230169449A (ko) 2016-09-30 2023-12-15 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
AU2017335890B2 (en) 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
EP3526326A4 (en) 2016-10-12 2020-07-29 The Regents of The University of Colorado, A Body Corporate NEW MODIFIED AND CHEMERICAL NUCLEASES
WO2018089664A1 (en) 2016-11-11 2018-05-17 The Regents Of The University Of California Variant rna-guided polypeptides and methods of use
US9816093B1 (en) 2016-12-06 2017-11-14 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
CA3056236A1 (en) 2017-03-15 2018-09-20 The Broad Institute, Inc. Novel cas13b orthologues crispr enzymes and systems
PT3526324T (pt) 2017-03-28 2021-10-20 Locanabio Inc Proteína associada a crispr (cas)
WO2018191388A1 (en) 2017-04-12 2018-10-18 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
US11692184B2 (en) 2017-05-16 2023-07-04 The Regents Of The University Of California Thermostable RNA-guided endonucleases and methods of use thereof
WO2018226855A1 (en) 2017-06-06 2018-12-13 The General Hospital Corporation Engineered crispr-cas9 nucleases
RU2022103603A (ru) 2017-06-23 2022-03-11 Инскрипта, Инк. Направляемые нуклеиновыми кислотами нуклеазы
EP3645728A4 (en) 2017-06-26 2021-03-24 The Broad Institute, Inc. NEW CRISPR TYPE VI ORTHOLOGISTS AND RELATED SYSTEMS
US11168322B2 (en) 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US20200231975A1 (en) 2017-07-17 2020-07-23 The Broad Institute, Inc. Novel type vi crispr orthologs and systems
US20200115688A1 (en) 2017-08-15 2020-04-16 The Regents Of The University Of California Compositions and methods for enhancing genome editing
EP3692145A4 (en) 2017-10-04 2021-11-24 The Broad Institute, Inc. NUCLEIC ACID TARGETED EDITING SYSTEMS, METHODS AND COMPOSITIONS
US20200255858A1 (en) 2017-11-01 2020-08-13 Jillian F. Banfield Casy compositions and methods of use
EP3704239A4 (en) 2017-11-01 2021-08-18 The Regents of The University of California CASZ COMPOSITIONS AND METHOD OF USE
JP2021501611A (ja) 2017-11-01 2021-01-21 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Cas12c組成物及び使用方法
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
US10253365B1 (en) 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
WO2019126762A2 (en) 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12a systems, methods, and compositions for targeted rna base editing
US20200392473A1 (en) 2017-12-22 2020-12-17 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2019173248A1 (en) 2018-03-07 2019-09-12 Caribou Biosciences, Inc. Engineered nucleic acid-targeting nucleic acids
DE202019005567U1 (de) * 2018-03-14 2021-02-16 Arbor Biotechnologies, Inc. Neue CRISPR-DNA-Targeting-Enzyme und -Systeme
WO2019178428A1 (en) 2018-03-14 2019-09-19 Arbor Biotechnologies, Inc. Novel crispr dna and rna targeting enzymes and systems
US20210198664A1 (en) 2018-05-16 2021-07-01 Arbor Biotechnologies, Inc. Novel crispr-associated systems and components
WO2019241452A1 (en) 2018-06-13 2019-12-19 Caribou Biosciences, Inc. Engineered cascade components and cascade complexes
EP3814488A4 (en) 2018-06-26 2022-06-22 The Regents of The University of California RNA-GUIDED EFFECTIVE PROTEINS AND METHODS OF USE THEREOF
WO2020018142A1 (en) 2018-07-16 2020-01-23 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
US20210284981A1 (en) 2018-07-24 2021-09-16 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
SG11202102068TA (en) 2018-07-31 2021-03-30 Broad Inst Inc Novel crispr enzymes and systems
EP3830301B1 (en) 2018-08-01 2024-05-22 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
WO2020033601A1 (en) 2018-08-07 2020-02-13 The Broad Institute, Inc. Novel cas12b enzymes and systems
WO2020041456A1 (en) 2018-08-22 2020-02-27 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
EP3870697A4 (en) 2018-10-22 2022-11-09 Inscripta, Inc. MODIFIED ENZYMES
WO2020142754A2 (en) 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US20220049273A1 (en) 2019-03-01 2022-02-17 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
CN114040971A (zh) 2019-03-07 2022-02-11 加利福尼亚大学董事会 CRISPR-Cas效应子多肽及其使用方法
EP4219700A1 (en) 2019-03-07 2023-08-02 The Regents of the University of California Crispr-cas effector polypeptides and methods of use thereof
US20220154222A1 (en) 2019-03-14 2022-05-19 The Broad Institute, Inc. Novel nucleic acid modifiers
US20220177863A1 (en) 2019-03-18 2022-06-09 The Broad Institute, Inc. Type vii crispr proteins and systems
DE112020001342T5 (de) * 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
US20220153779A1 (en) 2019-03-22 2022-05-19 The Regents Of The University Of California Compositions and methods for modification of target molecules
WO2020206036A1 (en) 2019-04-01 2020-10-08 The Broad Institute, Inc. Novel nucleic acid modifier
MX2021013302A (es) 2019-05-01 2022-01-31 Mammoth Biosciences Inc Nucleasas programables y metodos de uso.
WO2020247883A2 (en) 2019-06-07 2020-12-10 Scribe Therapeutics Inc. Deep mutational evolution of biomolecules
CN114375334A (zh) 2019-06-07 2022-04-19 斯克里贝治疗公司 工程化CasX系统
CA3142019A1 (en) 2019-06-14 2020-12-17 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
US20220315914A1 (en) 2019-07-08 2022-10-06 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
JP2022540153A (ja) 2019-07-11 2022-09-14 アーバー バイオテクノロジーズ, インコーポレイテッド 新規crispr dnaターゲティング酵素及びシステム
US20230016656A1 (en) 2019-08-27 2023-01-19 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
CA3153005A1 (en) 2019-09-05 2021-03-11 Arbor Biotechnologies, Inc. Novel crispr dna targeting enzymes and systems
CN114340657A (zh) 2019-09-09 2022-04-12 阿伯生物技术公司 新型crispr dna靶向酶及系统
US20230025039A1 (en) 2019-09-20 2023-01-26 The Broad Institute, Inc. Novel type vi crispr enzymes and systems
JP2023505600A (ja) * 2019-11-05 2023-02-09 ペアーワイズ プランツ サービシズ, インコーポレイテッド 対立遺伝子のrnaにコードされたdnaの置換のための組成物および方法
WO2021113522A1 (en) 2019-12-04 2021-06-10 Arbor Biotechnologies, Inc. Compositions comprising a nuclease and uses thereof
EP4069837A4 (en) 2019-12-10 2024-03-13 Inscripta, Inc. NEW MAD NUCLEASES
US10704033B1 (en) 2019-12-13 2020-07-07 Inscripta, Inc. Nucleic acid-guided nucleases
WO2021133829A1 (en) 2019-12-23 2021-07-01 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
US20230332119A1 (en) * 2020-03-31 2023-10-19 Arbor Biotechnologies, Inc. Compositions comprising a cas12i2 variant polypeptide and uses thereof

Also Published As

Publication number Publication date
EP4347818A2 (en) 2024-04-10
AU2022284804A1 (en) 2023-12-07
AU2022284804A9 (en) 2023-12-14
BR112023024985A2 (pt) 2024-02-20
CA3222023A1 (en) 2022-12-08
US20240102007A1 (en) 2024-03-28
IL308806A (en) 2024-01-01
TW202313971A (zh) 2023-04-01
WO2022256440A3 (en) 2023-02-09
JP2024520528A (ja) 2024-05-24
WO2022256440A2 (en) 2022-12-08
US20230023791A1 (en) 2023-01-26

Similar Documents

Publication Publication Date Title
CN115698278A (zh) 包含Cas12i2变体多肽的组合物及其用途
JP2021517815A (ja) Cas9塩基エディターを使用するリンパ球造血系操作
US20240093228A1 (en) Compositions comprising a nuclease and uses thereof
US20230287456A1 (en) Compositions comprising a cas12i polypeptide and uses thereof
US20230203539A1 (en) Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
JP2023549084A (ja) Pdcd1を標的とするrnaガイドを含む組成物及びその使用
US20240102007A1 (en) Gene editing systems comprising a crispr nuclease and uses thereof
CN116507629A (zh) Rna支架
CN117813379A (zh) 包括crispr核酸酶的基因编辑系统和其用途
US20230193243A1 (en) Compositions comprising a cas12i2 polypeptide and uses thereof
US20230059141A1 (en) Gene editing systems comprising a nuclease and uses thereof
US20230399639A1 (en) Compositions comprising an rna guide targeting b2m and uses thereof
JP2023549080A (ja) Bcl11aを標的とするrnaガイドを含む組成物及びその使用
JP2023548588A (ja) Tracを標的とするrnaガイドを含む組成物及びその使用
WO2024118747A1 (en) Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof
JP2024520691A (ja) ヒドロキシ酸オキシダーゼ1(hao1)を標的とするrnaガイドを含む遺伝子編集システム及びそれらの使用
TW202334421A (zh) 包含靶向ciita之rna引導之組合物及其用途
CN118019846A (zh) 包含crispr核酸酶的组合物及其用途
JP2023539569A (ja) ヌクレアーゼを含む組成物及びその使用
TW202321447A (zh) 包含crispr核酸酶之組成物及其用途
WO2023019243A1 (en) Compositions comprising a variant cas12i3 polypeptide and uses thereof
WO2023086938A2 (en) Type v nucleases
CN117136233A (zh) 包含变体Cas12i4多肽的组合物及其用途
CN117813382A (zh) 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途