KR102004076B1 - 3-성분 crispr/cas 복합체 시스템 및 그 용도 - Google Patents
3-성분 crispr/cas 복합체 시스템 및 그 용도 Download PDFInfo
- Publication number
- KR102004076B1 KR102004076B1 KR1020177029329A KR20177029329A KR102004076B1 KR 102004076 B1 KR102004076 B1 KR 102004076B1 KR 1020177029329 A KR1020177029329 A KR 1020177029329A KR 20177029329 A KR20177029329 A KR 20177029329A KR 102004076 B1 KR102004076 B1 KR 102004076B1
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- puf
- nucleotides
- polynucleotide
- protein
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Abstract
본원에 기재된 본 발명은 타겟 DNA의 특정 위치에 삼중 복합체를 조립하기 위한 조성물들과 시약들을 제공한다. 본 발명은 또한 예를 들어, 특정 좌위를 표지하고, 타겟 유전자를 발현하거나 또는 유전자 조절 네트워크를 생성하기 위하여, 상기 복합체를 사용하는 방법들을 제공한다.
Description
본 발명은 3-성분 CRISPR/CAS 복합체 시스템 및 그 용도에 관한 것이다.
<관련 출원의 상호 참조>
본 출원은 2015년 3월 13일에 출원된 미국 가출원 62/132,644호 및 2015년 9월 21일에 출원된 미국 가출원 62/221,249호를 우선권 주장의 기초로 한다. 상기 두 미국 가출원은 전체가 본 출원에 참고로 포함된다.
CRISPR(CRISPR)/Cas9 시스템에 있어서, Cas9 단백질 및 단일 가이드 RNA(single 가이드 RNA; sgRNA, 이하 sgRNA)는 sgRNA 상에 타겟-매칭(target-matching) 서열에 의해 특이성이 제공되는 충분한 2-성분 DNA 엔도뉴클레아제를 구성하며, 엔도뉴클레아제 활성은 상기 Cas9 단백질상에 존재한다.
뉴클레아제 영역에 돌연변이를 갖고 있는 뉴클레아제-결손 또는 뉴클레아제-결핍 Cas9 단백질(예, dCas9)은 sgRNA와 복합체를 형성할 때 DNA 결합 활성을 유지한다. dCas9 단백질은 sgRNA에 의해 매치된 부위에 단백질 융합을 통하여 이펙터 영역 또는 단백질 태그를 묶어서(tether) 위치시킴으로써 RNA-가이드된 DNA 결합 효소를 구성하게 된다. dCas9는 전사활성화 영역(예, VP64) 또는 리프레서 영역에 융합될 수 있고, sgRNA에 의해 안내되어 타겟 유전자들을 각각 활성화 또는 억제시킨다. dCas9는 또한 형광 단백질들과 융합하여 염색체 영역의 생세포(live-cell) 형광 표지를 수행할 수 있다. 그러나, 이러한 시스템들에서는 sgRNA:Cas9 짝짓기만 존재하기 때문에 오직 하나의 Cas9-이펙터 융합만이 가능하게 된다. 또한, 다수의 단백질 태그들이나 또는 이펙터 융합이 필요한 경우에는, dCas9 단백질과의 직접 융합에 의한 이펙터 또는 단백질 태그의 다량체화(multimerization)가 단백질 크기로 인해 이들 융합체들을 코딩하는 대형 DNA의 전달상의 어려움 또는 이러한 대형 DNA를 핵으로 번역 및 전좌(translocating)함에 있어서의 어려움과 같은 제약 요소들로 인해 기술적 제한이 있다.
본 발명의 목적은 3-성분 CRISPR/CAS 복합체 시스템 및 그 용도를 제공하는 것이다.
이하 기재된 본 발명은 Cas9 단백질(예, 야생형(wt) Cas9, Cas9 틈내기 효소(nickase), 또는 dCas9 단백질), 대상(subject) 폴리뉴클레오티드로서 변형된 sgRNA(예, "sgRNA-PBS") 및 이펙터 영역들 또는 단백질 태그들("PUF 영역-융합(들)]")과의 하나 또는 그 이상의 PUF 영역(들)의 융합 단백질들을 포함하는 3-성분 이펙터 또는 단백질 태그의 다중성(multiplexity) 및 중합을 가능하게 한다. sgRNA-PBS는 상기 sgRNA 스템 루프들의 하부 또는 상기 타겟-매칭 부위의 상부에 다수의 짧은 PUF(예, 8-mer) 인식 서열들을 삽입함으로써 유도될 수 있다. 각 UF 영역-이펙터 융합의 PUF 영역들은 상기 대상 폴리뉴클레오티드 상의 상기 8-mer 인식 서열을 인식하도록 프로그램될 수 있으며, 따라서 상기 PUF 영역들에 융합된 하나 또는 그 이상의 이펙터 영역들을 상기 타겟-매칭 sgRNA에 의해 인식되는 타겟 DNA의 특정 부위들로 가져올 수 있다.
상기 본 발명의 3-성분 CRISPR/카스 복합체들/시스템들은 서로 다른 3-성분 CRISPR/카스 복합체들/시스템들은 동시에 세포 또는 동물에 전달될 수 있고 각각은 직교성(orthogonality)을 가지며(즉, 다른 3-성분 CRISPR/카스 복합체들/시스템들 및 이들의 타겟 부위들로부터의 간섭없이) 한정된 타겟 부위들에서 작동될 수 있으므로 다중성의 측면에서 잇점이 있다. PUF 영역들은 어떠한 8-mer RNA 인식 서열들도 인식하도록 쉽게 프로그램될 수 있으므로, 이 시스템은 상기 RNA 인식 서열이 단지 8-mer이고 (또한 상기 RNA 인식 서열이 더 길어지면 잠재적으로 더욱 커짐)일 때 상기 다중성을 48(65536)의 이론적 최대치로 확장된다.
상기 본 발명의 3-성분 CRISPR/카스 복합체들/시스템들은 또한 상기 선형 8-mer 서열의 단순성으로 인하여 Cas9:sgRNA의 DNA 결합 활성을 방해하지 않으면서도 광범위한 중합을 허용할 수 있어 중합성의 측면에서 잇점이 있다. 이러한 특징으로 인하여 PUF-융합들의 복수 개의 분자들을 상기 변형된 sgRNA 상에 조립할 수 있으며, 이펙터 또는 단백질 태그들의 국소 농도를 허용하게 된다. 이러한 특징은 형광 영상 또는 전사 조절과 같은 적용 시 특히 유용하며, 여기서 근접 상승작용은 최대 효과적 조절 또는 신호 대 잡음비(signal-to-noise ratio)를 허용한다.
본 발명의 또 다른 잇점은 화학양론적 착체 형성에 있다. 서로 상이한 8-mer 서열들은 상기 sgRNA-PBS 컨스트럭트로 질서있게 삽입될 수 있으며 이로 인해 상기 sgRNA-PBS 상에 상기 PUF-융합들의 정의된 화학양론 및 순서로 복합체를 형성하게 된다.
따라서, 본 발명의 하나의 양태는 (1)타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열; (2)Cas9-결합 서열 및 (3)하나 또는 그 이상의 카피의 PUF 영역-결합 서열(PBS)로서, 상기 하나 또는 그 이상의 카피의 PBS는 각각 같거나 다른 PUF 영역에 결합하는 것;을 포함하는폴리뉴클레오티드에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 Cas9-결합 서열에 결합함으로써 상기 폴리뉴클레오티드와 복합체를 형성할 수 있다.
본 발명에서, "Cas9 단백질"는 야생형 Cas9 단백질, 엔도뉴클레아제 활성(RuvC 및 HNH)을 위한 두 촉매 부위 중 하나가 결손되거나(defective) 활성이 결여된 Cas9 틈내기 효소및 엔도뉴클레아제 활성을 위한 두 촉매 부위가 모두 활성이 결손되거나 활성이 결여된 dCas9 단백질을 포함한다. 특정 구현예에 있어서, 상기 Cas9 단백질은 야생형(wt) Cas9이다. 특정 구현예에 있어서, 상기 Cas9 단백질은 뉴클레아제 활성이 결여 되거나 또는 뉴클레아제가 결핍되어 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 틈내기 효소(예, 이를테면, 상기 틈내기 효소는 화농성 연쇄상구균(S. Pyogenes)의 Cas9의 D10A에 해당하는 위치에 돌연변이를 가지는 Cas9 틈내기 효소; 또는 S. pyogenes의 Cas9의 H840A 에 해당하는 위치에 돌연변이를 가지는 Cas9 틈내기 효소)일 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질 은 dCas9(예, 화농성 연쇄상구균 (S. Pyogenes)의 Cas9의 D10A 및 H840A에 해당하는 위치에 돌연변이를 가지는 dCas9)일 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 야생형(wt) Cas9이 아닐 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 틈내기 효소가 아닐 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 dCas9가 아닐 수 있다.
특정 구현예에 있어서, "변형된 Cas9 단백질"은 dCas9 또는 Cas9 틈내기 효소와 같은 야생형(wt) Cas9 단백질이 아닌 Cas9을 의미할 수 있다.
특정 구현예에 있어서, 상기 dCas9 단백질은 뉴클레아제-결핍될 수 있으나 상기 폴리뉴클레오티드와 복합체를 형성할 경우에는 DNA-결합능을 보유할 수 있다.
특정 구현예에 있어서, 상기 DNA-타겟팅 서열은 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 상기 폴리뉴클레오티드와 복합체를 형성할 경우 상기 타겟 폴리뉴클레오티드 서열과 염기 쌍을 이룰 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 전사 조절 요소를 포함하거나 이에 인접한 것일 수 있다. 예를 들면, 상기 전사 조절 요소는 코어 프로모터, 근거리 프로모터 요소, 인핸서, 사일렌서, 인슐레이터 및 좌위(loci) 조절 부위 중에서 하나 또는 그 이상을 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 텔로미어 서열, 동원체(centromere) 또는 반복성 게놈 서열을 포함하거나 이에 인접한 것일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 게놈 마커 서열(또는 관심 게놈 좌위)을 포함하거나 이에 인접한 것일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥인 5'-CCN-3'(여기서, N은 임의의 DNA 뉴클레오티드)의 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)의 바로 옆 3'인 것일 수 있다.
특정 구현예에 있어서, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 약 12-22 뉴클레오티드(nucleotides, nts), 약 14-20 뉴클레오티드, 약 16-20 뉴클레오티드, 약 18-20 뉴클레오티드, 또는 약 12, 14, 16, 18, 또는 20 뉴클레오티드(바람직하기로는, 상기 상보적 부위는 12-22 뉴클레오티드의 연속 스트레치를 바람직하기로는 상기 DNA-결합 서열의 3' 말단에 포함하고)인 것일 수 있다. 예를 들면, 상기 DNA-결합 서열은 타겟 폴리뉴클레오티드 서열에 50, 60, 70, 80, 90 또는 95-100% 상보적인 것일 수 있다.
특정 구현예에 있어서, 상기 DNA-결합 서열은 5’말단 뉴클레오티드 G를 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 DNA-타겟팅 서열을 상기 Cas9-결합 서열에 연결하는 링커 서열을 추가로 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 Cas9-결합 서열은 머리핀 구조를 형성하는 것일 수 있다.
특정 구현예에 있어서, 상기 Cas9-결합 열은 약 37-47 뉴클레오티드 또는 약 42 뉴클레오티드인 것일 수 있다.
특정 구현예에 있어서, 상기 Cas9 틈내기 효소 단백질은 야생형 Cas9의 하나의 엔도뉴클레아제 촉매 부위(RuvC 및 HNH)에서의 점 돌연변이로 인해 엔도뉴클레아제 활성이 결여된 것일 수 있다. 상기 점 돌연변이는 D10A 또는 H840A일 수 있다.
특정 구현예에 있어서, 상기 dCas9 단백질은 야생형 Cas9의 두 엔도뉴클레아제 촉매 부위(RuvC 및 HNH) 모두에서의 점 돌연변이로 인해 엔도뉴클레아제 활성이 결여된 것일 수 있다. 상기 점 돌연변이는 D10A 및 H840A일 수 있다.
특정 구현예에 있어서, 상기 PBS의 상기 하나 또는 그 이상의 카피는 각각 약 8 뉴클레오티드인 것일 수 있다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드는 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 46, 47, 48, 49 또는 50 카피, 또는 1-50, 2-45, 3-40, 5-35, 5-10, 10-20 카피와 같거나 다른 PBS를 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 PUF 영역 PUF(3-2)에 의해 결합될 수 있는 상기 5'-UGUAUGUA-3' 서열의 PBS를 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 PUF 영역 PUF(6-2/7-2)에 의해 결합될 수 있는 상기 5'-UUGAUAUA-3' 서열의 PBS를 포함하는 것일 수 있다.
본 발명의 다른 하나의 양태는 상기 대상 폴리뉴클레오티드의 어느 하나를 코딩하는 벡터를 제공한다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드의 전사는 항시성(constitutive) 프로모터 또는 유도성(inducible) 프로모터의 조절 하에 있는 것일 수 있다.
특정 구현예에 있어서, 상기 벡터는 포유류(사람; 비인간 영장류; 비인간 포유류; 마우스, 쥐, 햄스터, 기니아 피그와 같은 설치류; 돼지, 양, 염소, 말, 낙타, 소와 같은 가축 포유류; 또는 고양이나 개와 같은 애완용 포유류); 새, 어류, 곤충, 벌레, 효모, 또는 박테리아 세포에서 활성을 갖는 것일 수 있다.
관련 양태에서, 본 발명은 상기 대상 벡터들 중 어느 하나를 다수 개 제공하며, 여기서 상기 벡터들 중 2 개의 벡터는 이들 각각의 DNA-타겟팅 서열, Cas9-결합 서열의 코딩된 폴리뉴클레오티드 및/또는 상기 PBS의 카피 수, 동일성(identity), 또는 상대적 순서(relative order)에 있어서 다른 것일 수 있다.
본 발명의 또 다른 하나의 양태는 상기 대상 폴리뉴클레오티드 및 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 포함하는 복합체를 제공한다.
특정 구현예에 있어서, 상기 복합체는 상기 하나 또는 그 이상의 PBS에 결합된 하나 또는 그 이상의 PUF 영역을 추가로 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 PUF 영역의 각각은 이펙터 영역에 융합되어 있는 것일 수 있다.
특정 구현예에 있어서, 상기 이펙터 영역은 독립적으로 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것일 수 있다.
특정 구현예에 있어서, 상기 복합체는 최소한 두 개 이상의 상기 PUF 영역이다른 이펙터 영역에 융합된 것일 수 있다.
특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질), 상기 PUF 영역 및/또는 상기 이펙터 영역은 핵 위치화 서열(nuclear localization sequence, NLS)을 추가로 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 복합체는 상기 DNA-타겟팅 서열을 통하여 상기 타겟 폴리뉴클레오티드 서열에 결합된 것일 수 있다.
본 발명의 또 다른 하나의 양태는 상기 대상 벡터의 어느 하나 또는 다수의 상기 대상 벡터를 포함하는 숙주 세포를 제공한다.
특정 구현예에 있어서, 상기 숙주 세포는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)를 코딩하는 제 2벡터를 추가로 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 제 2벡터는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합된 이펙터 영역을 추가로 코딩하는 것일 수 있다.
특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 발현은 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있는 것일 수 있다.
특정 구현예에 있어서, 상기 숙주 세포는 상기 각각 이펙터 영역에 융합된 상기 하나 또는 그 이상의 PUF 영역을 코딩하는 제 3 벡터를 추가로 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 하나 또는 그 이상의 PUF 영역의 발현은 독립적으로 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있을 수 있다.
특정 구현예에 있어서, 상기 이펙터 영역은 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT)일 수 있다.
특정 구현예에 있어서, 상기 제 2벡터가 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하거나 및/또는 상기 제 3벡터가 상기 PUF 영역 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하는 것일 수 있다.
특정 구현예에 있어서, 상기 제 2벡터가 상기 벡터와 동일하거나 및/또는 상기 제 3벡터가 상기 벡터 또는 상기 제 2벡터와 동일한 것일 수 있다.
특정 구현예에 있어서, 상기 숙주 세포는 살아 있는 동물에 있는 것일 수 있다.
특정 구현예에 있어서, 상기 숙주 세포는 배양된 세포일 수 있다.
본 발명의 또 다른 하나의 양태는 본 발명의 복합체를 상기 타겟 폴리뉴클레오티드 서열에서 조립하는 방법을 제공하며, 상기 방법은 하기를 상기 타겟 폴리뉴클레오티드 서열에 접촉시키거나 또는 그 부근에 위치시키는 것인 방법이다: (1)상기 대상 폴리뉴클레오티드 중 어느 하나, 또는 상기 대상 벡터 중 어느 하나, 또는 상기 대상 다수의 벡터; (2)상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 대상 제 2벡터의 어느 하나; 및 (3)각각 이펙터 영역에 융합된 하나 또는 그 이상의 상기 PUF 영역 또는 상기 대상 제 3벡터의 어느 하나.
특정 구현예에 있어서, 상기 복합체는 세포 내에서 조립되고, 상기 타겟 폴리뉴클레오티드 서열은 상기 세포의 게놈 DNA의 일부이고, 여기서 상기 대상 벡터, 상기 대상 제 2벡터및 상기 대상 제 3벡터가 상기 세포로 도입되는 것일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 헤테로크로마틴이 풍부한 좌위 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 검출 가능한 마커(예, 형광 단백질)일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 타겟 유전자의 전사 조절 요소 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 전사 모듈레이터(예, 활성제, 억제제)일 수 있다.
특정 구현예에 있어서, 상기 타겟 유전자의 전사는 세포 운명(cell fate) 결정, 세포 분화, 대사 흐름(metabolic flux), 또는 생물학적 또는 생화학적으로 결정가능한 결과물에 영향을 준다.
본 발명의 또 다른 하나의 양태는 세포 내에서 다수의 타겟 유전자의 전사를 모듈레이팅하는 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)용 코딩 서열 및 하나 또는 그 이상의 PUF 영역용 코딩 서열을 상기 세포로 도입하는 것을 포함하고, 여기서 상기 타겟 유전자의 각각은 (1)상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 dCas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및 PUF 영역으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2)상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 전사를 모듈레이트 하는 것,을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 dCas9 단백질일 수 있다.
특정 구현예에 있어서, 최소한 하나 이상의 타겟 유전자의 전사를 증진/진작하면서 최소한 하나 이상의 다른 타겟 유전자의 전사가 저해될 수 있다.
관련 양태에 있어서, 본 발명은 또한 세포 내에서 다수의 타겟 유전자의 후성적(epigenetic) 모듈레이션(예, 전사 활성과 직접적으로 연관되지 않은 크로마틴의 후성적 상태의 모듈레이팅) 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, 야생형(wt) Cas9 단백질 또는 Cas9 틈내기 효소용 코딩 서열 및 하나 또는 그 이상의 PUF 영역 융합용 코딩 서열을 상기 세포로 도입하는 것을 포함하며, 여기서 상기 타겟 유전자의 각각은 (1)상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 야생형(wt)/틈내기 효소 Cas9 단백질 및 PUF 영역 융합으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2)상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 후성적 모듈레이션을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다. 상기 방법은 예를 들어 Cas9가 폐쇄된 크로마틴 부위(예, 이들 부위에 절단 및 게놈 편집(editing)을 증가시킴)에 접근 및 결합함과 동시에 후성적 상태(예, 크로마틴의 개방(opening up))를 변경하는 데 유용할 수 있다.
본 발명의 또 다른 하나의 양태는 (1)대상 폴리뉴클레오티드 또는 대상 벡터; (2)상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 코딩하는 대상 제 2벡터 및 (3)각각 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역을 코딩하는 대상 제 3벡터를 포함하는 것인, 키트를 제공한다.
특정 구현예에 있어서, 상기 키트는 상기 벡터들의 세포 도입을 용이하게 하기 위하여 형질전환, 형질감염, 또는 감염 시약들을 포함할 수 있다.
이하 실시예 부분에 기재되었거나 또는 본 발명의 일 양태 하에서만 기재된 것을 포함하여, 본 발명에 기재된 모든 구현예들은 특별히 부인되거나 달리 부적절한 것이 아니라면 임의의 하나 이상의 다른 구현예와 결합될 수 있는 것으로 이해하여야 한다.
도 1A-1D는 PUF 영역-결합 서열들(PBS)의 sgRNA 3’말단으로 삽입이 dCas9/단일 가이드 RNA 기능에 실질적으로 영향을 미치지 않았고, 상기 대상 3-성분 CRISPR/Cas 복합체/시스템을 사용하여 활성제의 독립적인 모집(recruitment) 및 다량체화(multimerization)를 달성할 수 있음을 보여주고 있다. 도 1A는 세-하이브리드 시스템으로 분할함으로써 통상적 두-하이브리드 dCas9 융합 디자인을 향상시키는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 개략도를 보여 주고 있으며, 여기서 sgRNA-PBS는 dCas9/sgRNA의 상기 DNA 결합 활성을 PUF 융합에 의해 상기 이펙터 기능과 연결시킨다. 가운데 패널은 대표적인 PUF 영역의 구조를 나타내며, 상기 C에서 N 방향으로의 8 회 반복 및 이에 상응하는 5'에서 3'방향으로의 상기 8-mer 타겟 RNA과의 상호작용을 보여주고 있다. PUF RNA 인식 코드 표는 예시적인 두(di)-잔기 및 인식된 대상 RNA 염기를 나타내고 있다. 하단 패널에는 4 가지 PUF 아형(isotype) 및 pumilio 결합 부위(PBS) 및 이들의 서열들을 단순히 기재하기 위해 채택한 표기 표를 보여주고 있다. 도 1B에서, 상단 패널은 상기 sgRNA의 3' 말단에 다양한 수의 PBS를 삽입 후 dCas9-VP64가 tdTomato 전이유전자에 결합 및 활성화시키는 능력을 시험하기 위한 실험의 대략적 개요도로서, 예를 들면, 상기 dCas9::VP64 작체물의 TetO::tdTomato 전이유전자 활성화능력에 대한(0, 5, 15, 25, 또는 47 PBS를 가지는) sgRNA-PBS의 효과를 시험하기 위한 실험적 셋팅을 나타낸다. 하단 패널은 플롯 아래의 범례(legend)에 표시된 다른 작체물로 형질 감염된 세포의, 형광활성세포분류(FACS)에 의해 측정된, tdTomato 형광(상기 dCas9-VP64/sgCtl-0×PBSa Control 대비)에서의 평균 배수 변화(fold change; ±S.E.M.)를 보여주는 컬럼 플롯이다. 상기 범례는 다음의 세 가지 매개 변수에 사용되는 sgRNA를 기재하고 있다: sgRNA 매치는 상기 sgRNA가 인식하는 DNA 타겟을 의미하고; #PBS 및 PBS 유형은 각각 상기 sgRNA의 말단에 부가된 PBS의 수와 유형을 나타낸다. 도 1C에서, 상단 패널은 서로 다른 수의 부가된 PBS를 가지는 상기 대상 활성제에 의해 TetO::tdTomato 전이유전자의 활성화를 시험하는 실험을 기재한 개요도이다. 하단 패널은 플롯 아래의 범례(legend)에 표시된 다른 작체물로 형질 감염된 세포의 tdTomato 형광(상기 Control dCas9/PUFb-VP64/sgCtl-0×PBSb 대비)의 배수 변화(±S.E.M.)를 보여주는 컬럼 플롯을 나타낸다. 상기 범례는 음영처리 박스로 표시된, sgRNA에 의해 인식된, 상기 DNA 타겟 뿐 아니라 상기 사용된 PUF 아형(PUF-VP64) 및 상기 사용된 sgRNA-PBS를 PBS의 수와 유형으로 기재한다. 도 1D에서, 상단 패널은 TetO::tdTomato 전이유전자를 활성화함에 있어서 상기 대상 활성제 아형의 독립성을 시험하기 위한 실험을 설명하는 개요도이다. 하단 패널은 플롯 아래의 범례(legend)에 표시된 다른 작체물로 형질 감염된 세포의 tdTomato 형광(상기 PUF/PBS 아형 x 를 위한 dCas9/PUFx-VP64/sgCtl-5×PBSx 대비)의 평균 배수 변화(±S.E.M.)를 보여주는 컬럼 플롯이다. 상기 범례는 음영처리 박스로 표시된 상기 사용된 PUF 아형(PUF-VP64), 상기 PBS 아형(5×PBS; "-"은 PBS 없는 sgRNA를 표시한다) 및 DNA 타겟을 표시한다(sgRNA 매치). 모든 플롯은 3 번 반복측정한 결과를 나타낸다.
도 2A 및 도 2B는 VP64 및 P65-HSF1를 포함하는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 조립과 관련된 것이다. 도 2A는 PBS32과 PBS6272를 모두 포함하는 sgRNA에 의한 모집(recruitment)을 통하여 PUF(3-2)::VP64 및 PUF(6-2/7-2)::P65-HSF1의 조립을 시험하는 실험의 개요도이다. 상기 활성은 tdTomato 형광 리포터 활성으로 측정하였다. 도 2B는 상기 활성제 단백질들을 4×[PBS32-PBS6272] 헤테로다이머 부위들을 가지는 비타겟팅(sgControl) Tet를 타겟팅하는(sgTetO) sgRNAs로 형질감염한 결과로 나타나는 상대적 평균 tdTomato 형광을 보여주고 있다.
도 2C는 5×PBSa를 가지는 Control sgRNA 및 PBSa를 0, 1, 5, 15, 또는 25 카피 가지는 TetO를 타겟팅하는 sgRNA와 더불어, 활성화 영역으로서 VP64 사용(PUFa::VP64; 적색 컬럼들) 대비 p65HSF1사용(PUFa::p65HSF1; 청색 컬럼들)에 대한 상기 대상 3-성분 시스템 활성제의 비교 결과를 보여주고 있다. 컬럼들은 Control sgRNA(sgCtl)를 이용한 실험들과 관련하여 tdTomato 형광의 평균 배수 변화(S.E.M.; n=3 포함)를 보여주고 있다. 상기 범례는 음영처리된 박스들에 의해 표시되는 DNA매치뿐 아니라 상기 sgRNA-PBS 상의 PBSa(#PBSa)의 수를 표시한다.
도 3A-3D는 상기 대상 시스템이 강력한 내인성 유전자 활성화를 달성하기 위해 활성제의 다량체화를 허용함을 보여주고 있다. 도 3A에서, 상단 패널은 OCT4 유전자의 활성화에 사용되는 sgRNA-PBS의 상대적 매치 위치들(1~4로 표지된 스트로크(strokes))을 보여주는 유전자 모델이다. 하단 패널은 dCas9/PUFa-p65HSF1 3-성분 시스템 활성제 모듈, 또는 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9-p65HSF1 활성제를 사용한 SOX2 발현의 활성화를 위한 qRT-PCR에 의해 측정된(Ctl 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. dCas9/PUFa-p65HSF1 3-성분 시스템 활성제 모듈, 또는 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9-p65HSF1 활성제를 사용한 OCT4 발현의 활성을 qRT-PCR에 의해 측정된(Control 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례의 음영처리된 박스들은 Control(Ctl) 서열을 가지는 단일 sgRNA-5×PBSa의 사용을 나타내고, 상기 유전자 모델에서 번호매겨진 스트로크들에 해당하는 상기 개별적 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 상기 4 OCT4를 타겟팅하는 sgRNA-5×PBSa를 나타낸다. 도 3B에서, 상단 패널은 SOX2 유전자의 활성화에 사용되는 sgRNA-PBS의 상대적 매치 위치들(1~4로 표지된 스트로크)를 보여주는 유전자 모델이다. 하단 패널은 SOX2를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9/PUFa-p65HSF1 활성제 또는 dCas9-p65HSF1 활성제를 사용한 SOX2 발현의 활성화를 위한 qRT-PCR에 의해 측정된(Ctl 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례에서 상기 음영처리된 박스들은 단일 Control(Ctl) 서열을 가지는 sgRNA-5×PBSa, 상기 유전자 모델에서 번호가 매겨진 스트로크에 해당하는 상기 개별적 SOX2를 타겟팅하는 sgRNA-5×PBSa, 또는 4 SOX2를 타겟팅하는sgRNA-5×PBSa의 용도를 나타낸다. 도 3C는 1, 5, 15, 또는 25 개의 PBSa 카피를 가지는 OCT4를 타겟팅하는 sgRNA-PBSa의 상기 표시된 단일 또는 칵테일 sgRNA-PBSa를 가지는 OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 도 3D는 1, 5, 15, 또는 25 개의 PBSa 카피를 가지는 SOX2를 타겟팅하는 sgRNA-PBSa의 상기 표시된 단일 또는 칵테일 sgRNA-PBSa를 가지는 SOX2 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다.
도 4A 및 4B는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 두 개의 서로 다른 타겟 리포터 유전자의 동시 활성화 및 리프레션을 허용함을 보여주고 있다. 도 4A는 TetO::tdTomato 전이유전자를 dCas9/sgTetO-PBS32/PUF(3-2)::VP64와 동시에 활성화하고 SV40::EGFP 전이유전자를 dCas9/sgSV40-PBS6272/KRAB::PUF(6-2/7-2와 동시에 리프레스하는 실험을 보여주는 개요도이다. 도 4B는 상기 표에 표시된 작체물들로 형질감염된 샘플들의 상대적 평균 EGFP 및 tdTomato 형광을 보여주는 컬럼 차트이다.
도 4C 및 4D는 추가적으로 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 서로 다른 유전자들을 동시에 활성화 및 리프레스 할 수 있음을 보여주고 있다. 도 4C에서, 좌측 패널은 TetO::tdTomato 및 SV40::EGFP를 PUFc-p65HSF1 및 KRAB-PUFa에 의해 각각 동시에 활성화 및 리프레션을 수행하는 실험을 보여주는 개략도이다. 우측 패널에서, 상부 컬럼 플롯은 tdTomato 형광의 평균 배수 변화(S.E.M.)를 나타내고; 하부 컬럼 플롯은 가운데 범례에 표시된 작체물들로 형질감염된 세포들의 EGFP 형광의 평균 배수 변화(S.E.M.)를 나타낸다. 상기 가운데 범례는 상기 sgRNA-PBSc 및 sgRNA-PBSa의 Ctl, TetO 또는 SV40P1에 대한 DNA를 흑색으로 음영처리된 박스로 나타내고, PUFc-p65HSF1 및 KRAB-PUFa의 형질감염이 포함되는 부분을 음영처리하여 나타내고 있다. 도 4D에서, 좌측 패널은 OCT4 및 SOX2를 각각 PUFb-p65HSF1 및 BFPKRAB-PUFa에 의해 동시에 활성화 및 리프레션을 수행하는 실험을 보여주는 개략도이다. 우측 패널에서, 상부 컬럼 플롯은 OCT4 유전자 발현의 평균 배수 변화(95% C.I.)를 나타내고; 하부 컬럼 플롯은 가운데 범례에 표시된 작체물들로 형질감염된 세포들의 SOX2 유전자 발현의 평균 배수 변화(95% C.I.)를 나타낸다. 상기 가운데 범례는 상기 sgRNA-5×PBSb 및 sgRNA-5×PBSa의 Control(Ctl), OCT4 프로모터들(OCT4pp) 또는 SOX2 프로모터들(SOX2pp)에 대한 DNA 매치를 흑색 음영처리 박스들로 나타내고 있다. 상기(PUFb-p65HSF1 + BFPKRAB-PUFa) 줄은 노란색으로 강조된 박스들을 가지는 샘플들에서 상기 활성제-리프레서 모델들을 포함하는 부분을 나타낸다. 이들 실험들은 OCT4 및 SOX2 모두를 위한 4 sgRNA-5×PBS의 칵테일들을 사용하였다.
도 5A-5C는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 타겟 유전자의 발현을 활성화하기 위하여 인핸서에 있는 CREB-결합 단백질의 히스톤 아세틸트랜스퍼라제(HAT) 영역을 모집(recruit)하는 데 사용될 수 있음을 보여주고 있다. 도 5A는 OCT4의 타겟 근거리 프로모터(proximal promoter, PP), 근거리 인핸서(proximal enhancer, PE) 또는 원거리 인핸서(distal enhancer, DE)에 dCas9-CBPHAT 직접 융합 또는 3-성분 모듈 dCas9/CBPHAT-PUFa 또는 dCas9/PUFa-CBPHAT을 사용하여 인핸서를 활성화하는 실험의 개요도이다. 이들 각 부위의 각각을 타겟팅하는 상기 4 가이드는 매치의 위치를 표시하는 적색 스트로크 위의 번호로 표시되어 있다. 도 5B는 dCas9-CBPHAT, dCas9/CBPHAT-PUFa 또는 dCas9/PUFa-CBPHAT 및 PP, PE 또는 원거리 인핸서 DE의 각각을 타겟팅하는 4 sgRNA-5×PBSa의 칵테일을 발현하는 플라스미드로 형질감염된 세포들의(해당 sgCtl 타겟팅 실험에 관련한) OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 도 5C는 dCas9/CBPHAT-PUFa 및 sgRNAs를 타겟팅하는 OCT4의 PP, PE및 DE의 단일 또는 칵테일로 형질감염 후(해당 sgCtl 실험에 관련한) OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례는 상기 부위 각각을 타겟팅하는 개별적 가이드들 또는 가이드의 칵테일을 포함하는 부분을 음영처리한 박스로 나타낸다.
도 6A-6G는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 형광 단백질의 다량체화 및 텔로미어 및 동원체의 동시 표지(labeling)(스케일 바: 5μm)을 허용함을 보여주고 있다. 도 6A는 dCas9/sgTelomere-PBS32/Clover::PUF(3-2)(또는 PUFa)을 녹색 형광을 가지는 텔로미어 반복을 표지하는 데 사용됨을 보여주는 개요도이다. 도 6B는 텔로미어를 Clover-PUFa 및 좌에서 우로, PBSa 번호의 증가순으로(0, 5, 15, 25) 마련된 sgTelomere로 표지된 텔로미어를 보여주고 있다. 도 6C는 dCas9/Clover-PUFa/sgTelomere-25×PBSa에 의한 텔로미어의 표지를 안티-TRF2 면역염색을 통하여 확인하는 것을 보여주고 있다. 도 6D는 dCas9/PUFa::Clover 및 0,5,15 또는 25 PBSa 부위를 가지는 텔로미어를 타겟팅하는 sgRNA로 형질감염된 HEK293T 세포들에서 형광 초점(fluorescent foci)의 수를 정량하는 것을 보여주고 있다.(n=20; Mann-Whitney statistics: ***=p<0.0005, ****=p<0.0001). 도 6E는 상기 sgRNA을 타겟팅하는 텔로미어 상에서 5,15, 또는 25×PBSa을 가지는 상기 대상 3-성분 시스템에 의해 전체 핵 신호에 대한 병소(foci)에서의 전체 신호의 비율로서 신호 대 잡음비를 정량화하는 것을 보여주고 있다.(n=20; Mann-Whitney statistics: ****=p<0.0001). 도 6F는 Clover-PUFc/sg 동원체-20×PBSc에 의해 동원체의 표지를 항-CREST로 확인하는 것을 보여주고 있다. 도 6G는 Clover-PUFc/sg동원체-20×PBSc 및 mRuby2-PUFa/sgTelomere-25×PBSa를 각각 사용하여 동원체 및 텔로미어를 공동 표지(co-labeling)하는 것을 보여주는 대표적 공초점 형광 현미경 이미지이다.
도 7은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 7 sgRNA-15×PBS32을 타겟팅하는 MUC4 좌를 가지는 비-반복 부위를 표지하는 것을 허용함을 보여주는 MUC4 표지의 대표적 공초점 형광 현미경 이미지이다.
도 8A-8C는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 몇몇 특성을 강조하는 카툰식 설명으로 도시하고 있다. 도 8A는 다중화에 대해 보여주고 있다: 서로 다른 PBS 아형을 가지는 sgRNA는 동족(cognate) PUF 아형에 의해 묶여진 상기 이펙터들을 모집(recruit)할 수 있으며, 이로 인해 서로 다른 이펙터 기능을 위치화시키기 위한 dCas9 또는 분리된 염색체 좌에서 단백질 태그들의 다중화를 제공한다. 도 8B는 다량체화(multimerization)에 대해 도시하고 있다: PBS의 짧고 선형적 특징으로 인하여 sgRNA는 많은 PBS 카피를 가지게 되며, 따라서 타겟 좌에서 PUF-융합의 많은 분자들의 모집(recruitment)을 허용한다. 도 8C는 복합체 형성에 대해 도시하고 있다: 서로 다른 조합, 순서 및 개수의 PBS를 구비한 sgRNA는 원하는 화학양론 및 배열을 갖는 단백질 복합체들을 직접 조립하는 발판(scaffold)의 역할을 할 수 있다.
도 2A 및 도 2B는 VP64 및 P65-HSF1를 포함하는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 조립과 관련된 것이다. 도 2A는 PBS32과 PBS6272를 모두 포함하는 sgRNA에 의한 모집(recruitment)을 통하여 PUF(3-2)::VP64 및 PUF(6-2/7-2)::P65-HSF1의 조립을 시험하는 실험의 개요도이다. 상기 활성은 tdTomato 형광 리포터 활성으로 측정하였다. 도 2B는 상기 활성제 단백질들을 4×[PBS32-PBS6272] 헤테로다이머 부위들을 가지는 비타겟팅(sgControl) Tet를 타겟팅하는(sgTetO) sgRNAs로 형질감염한 결과로 나타나는 상대적 평균 tdTomato 형광을 보여주고 있다.
도 2C는 5×PBSa를 가지는 Control sgRNA 및 PBSa를 0, 1, 5, 15, 또는 25 카피 가지는 TetO를 타겟팅하는 sgRNA와 더불어, 활성화 영역으로서 VP64 사용(PUFa::VP64; 적색 컬럼들) 대비 p65HSF1사용(PUFa::p65HSF1; 청색 컬럼들)에 대한 상기 대상 3-성분 시스템 활성제의 비교 결과를 보여주고 있다. 컬럼들은 Control sgRNA(sgCtl)를 이용한 실험들과 관련하여 tdTomato 형광의 평균 배수 변화(S.E.M.; n=3 포함)를 보여주고 있다. 상기 범례는 음영처리된 박스들에 의해 표시되는 DNA매치뿐 아니라 상기 sgRNA-PBS 상의 PBSa(#PBSa)의 수를 표시한다.
도 3A-3D는 상기 대상 시스템이 강력한 내인성 유전자 활성화를 달성하기 위해 활성제의 다량체화를 허용함을 보여주고 있다. 도 3A에서, 상단 패널은 OCT4 유전자의 활성화에 사용되는 sgRNA-PBS의 상대적 매치 위치들(1~4로 표지된 스트로크(strokes))을 보여주는 유전자 모델이다. 하단 패널은 dCas9/PUFa-p65HSF1 3-성분 시스템 활성제 모듈, 또는 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9-p65HSF1 활성제를 사용한 SOX2 발현의 활성화를 위한 qRT-PCR에 의해 측정된(Ctl 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. dCas9/PUFa-p65HSF1 3-성분 시스템 활성제 모듈, 또는 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9-p65HSF1 활성제를 사용한 OCT4 발현의 활성을 qRT-PCR에 의해 측정된(Control 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례의 음영처리된 박스들은 Control(Ctl) 서열을 가지는 단일 sgRNA-5×PBSa의 사용을 나타내고, 상기 유전자 모델에서 번호매겨진 스트로크들에 해당하는 상기 개별적 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 상기 4 OCT4를 타겟팅하는 sgRNA-5×PBSa를 나타낸다. 도 3B에서, 상단 패널은 SOX2 유전자의 활성화에 사용되는 sgRNA-PBS의 상대적 매치 위치들(1~4로 표지된 스트로크)를 보여주는 유전자 모델이다. 하단 패널은 SOX2를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9/PUFa-p65HSF1 활성제 또는 dCas9-p65HSF1 활성제를 사용한 SOX2 발현의 활성화를 위한 qRT-PCR에 의해 측정된(Ctl 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례에서 상기 음영처리된 박스들은 단일 Control(Ctl) 서열을 가지는 sgRNA-5×PBSa, 상기 유전자 모델에서 번호가 매겨진 스트로크에 해당하는 상기 개별적 SOX2를 타겟팅하는 sgRNA-5×PBSa, 또는 4 SOX2를 타겟팅하는sgRNA-5×PBSa의 용도를 나타낸다. 도 3C는 1, 5, 15, 또는 25 개의 PBSa 카피를 가지는 OCT4를 타겟팅하는 sgRNA-PBSa의 상기 표시된 단일 또는 칵테일 sgRNA-PBSa를 가지는 OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 도 3D는 1, 5, 15, 또는 25 개의 PBSa 카피를 가지는 SOX2를 타겟팅하는 sgRNA-PBSa의 상기 표시된 단일 또는 칵테일 sgRNA-PBSa를 가지는 SOX2 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다.
도 4A 및 4B는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 두 개의 서로 다른 타겟 리포터 유전자의 동시 활성화 및 리프레션을 허용함을 보여주고 있다. 도 4A는 TetO::tdTomato 전이유전자를 dCas9/sgTetO-PBS32/PUF(3-2)::VP64와 동시에 활성화하고 SV40::EGFP 전이유전자를 dCas9/sgSV40-PBS6272/KRAB::PUF(6-2/7-2와 동시에 리프레스하는 실험을 보여주는 개요도이다. 도 4B는 상기 표에 표시된 작체물들로 형질감염된 샘플들의 상대적 평균 EGFP 및 tdTomato 형광을 보여주는 컬럼 차트이다.
도 4C 및 4D는 추가적으로 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 서로 다른 유전자들을 동시에 활성화 및 리프레스 할 수 있음을 보여주고 있다. 도 4C에서, 좌측 패널은 TetO::tdTomato 및 SV40::EGFP를 PUFc-p65HSF1 및 KRAB-PUFa에 의해 각각 동시에 활성화 및 리프레션을 수행하는 실험을 보여주는 개략도이다. 우측 패널에서, 상부 컬럼 플롯은 tdTomato 형광의 평균 배수 변화(S.E.M.)를 나타내고; 하부 컬럼 플롯은 가운데 범례에 표시된 작체물들로 형질감염된 세포들의 EGFP 형광의 평균 배수 변화(S.E.M.)를 나타낸다. 상기 가운데 범례는 상기 sgRNA-PBSc 및 sgRNA-PBSa의 Ctl, TetO 또는 SV40P1에 대한 DNA를 흑색으로 음영처리된 박스로 나타내고, PUFc-p65HSF1 및 KRAB-PUFa의 형질감염이 포함되는 부분을 음영처리하여 나타내고 있다. 도 4D에서, 좌측 패널은 OCT4 및 SOX2를 각각 PUFb-p65HSF1 및 BFPKRAB-PUFa에 의해 동시에 활성화 및 리프레션을 수행하는 실험을 보여주는 개략도이다. 우측 패널에서, 상부 컬럼 플롯은 OCT4 유전자 발현의 평균 배수 변화(95% C.I.)를 나타내고; 하부 컬럼 플롯은 가운데 범례에 표시된 작체물들로 형질감염된 세포들의 SOX2 유전자 발현의 평균 배수 변화(95% C.I.)를 나타낸다. 상기 가운데 범례는 상기 sgRNA-5×PBSb 및 sgRNA-5×PBSa의 Control(Ctl), OCT4 프로모터들(OCT4pp) 또는 SOX2 프로모터들(SOX2pp)에 대한 DNA 매치를 흑색 음영처리 박스들로 나타내고 있다. 상기(PUFb-p65HSF1 + BFPKRAB-PUFa) 줄은 노란색으로 강조된 박스들을 가지는 샘플들에서 상기 활성제-리프레서 모델들을 포함하는 부분을 나타낸다. 이들 실험들은 OCT4 및 SOX2 모두를 위한 4 sgRNA-5×PBS의 칵테일들을 사용하였다.
도 5A-5C는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 타겟 유전자의 발현을 활성화하기 위하여 인핸서에 있는 CREB-결합 단백질의 히스톤 아세틸트랜스퍼라제(HAT) 영역을 모집(recruit)하는 데 사용될 수 있음을 보여주고 있다. 도 5A는 OCT4의 타겟 근거리 프로모터(proximal promoter, PP), 근거리 인핸서(proximal enhancer, PE) 또는 원거리 인핸서(distal enhancer, DE)에 dCas9-CBPHAT 직접 융합 또는 3-성분 모듈 dCas9/CBPHAT-PUFa 또는 dCas9/PUFa-CBPHAT을 사용하여 인핸서를 활성화하는 실험의 개요도이다. 이들 각 부위의 각각을 타겟팅하는 상기 4 가이드는 매치의 위치를 표시하는 적색 스트로크 위의 번호로 표시되어 있다. 도 5B는 dCas9-CBPHAT, dCas9/CBPHAT-PUFa 또는 dCas9/PUFa-CBPHAT 및 PP, PE 또는 원거리 인핸서 DE의 각각을 타겟팅하는 4 sgRNA-5×PBSa의 칵테일을 발현하는 플라스미드로 형질감염된 세포들의(해당 sgCtl 타겟팅 실험에 관련한) OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 도 5C는 dCas9/CBPHAT-PUFa 및 sgRNAs를 타겟팅하는 OCT4의 PP, PE및 DE의 단일 또는 칵테일로 형질감염 후(해당 sgCtl 실험에 관련한) OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례는 상기 부위 각각을 타겟팅하는 개별적 가이드들 또는 가이드의 칵테일을 포함하는 부분을 음영처리한 박스로 나타낸다.
도 6A-6G는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 형광 단백질의 다량체화 및 텔로미어 및 동원체의 동시 표지(labeling)(스케일 바: 5μm)을 허용함을 보여주고 있다. 도 6A는 dCas9/sgTelomere-PBS32/Clover::PUF(3-2)(또는 PUFa)을 녹색 형광을 가지는 텔로미어 반복을 표지하는 데 사용됨을 보여주는 개요도이다. 도 6B는 텔로미어를 Clover-PUFa 및 좌에서 우로, PBSa 번호의 증가순으로(0, 5, 15, 25) 마련된 sgTelomere로 표지된 텔로미어를 보여주고 있다. 도 6C는 dCas9/Clover-PUFa/sgTelomere-25×PBSa에 의한 텔로미어의 표지를 안티-TRF2 면역염색을 통하여 확인하는 것을 보여주고 있다. 도 6D는 dCas9/PUFa::Clover 및 0,5,15 또는 25 PBSa 부위를 가지는 텔로미어를 타겟팅하는 sgRNA로 형질감염된 HEK293T 세포들에서 형광 초점(fluorescent foci)의 수를 정량하는 것을 보여주고 있다.(n=20; Mann-Whitney statistics: ***=p<0.0005, ****=p<0.0001). 도 6E는 상기 sgRNA을 타겟팅하는 텔로미어 상에서 5,15, 또는 25×PBSa을 가지는 상기 대상 3-성분 시스템에 의해 전체 핵 신호에 대한 병소(foci)에서의 전체 신호의 비율로서 신호 대 잡음비를 정량화하는 것을 보여주고 있다.(n=20; Mann-Whitney statistics: ****=p<0.0001). 도 6F는 Clover-PUFc/sg 동원체-20×PBSc에 의해 동원체의 표지를 항-CREST로 확인하는 것을 보여주고 있다. 도 6G는 Clover-PUFc/sg동원체-20×PBSc 및 mRuby2-PUFa/sgTelomere-25×PBSa를 각각 사용하여 동원체 및 텔로미어를 공동 표지(co-labeling)하는 것을 보여주는 대표적 공초점 형광 현미경 이미지이다.
도 7은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 7 sgRNA-15×PBS32을 타겟팅하는 MUC4 좌를 가지는 비-반복 부위를 표지하는 것을 허용함을 보여주는 MUC4 표지의 대표적 공초점 형광 현미경 이미지이다.
도 8A-8C는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 몇몇 특성을 강조하는 카툰식 설명으로 도시하고 있다. 도 8A는 다중화에 대해 보여주고 있다: 서로 다른 PBS 아형을 가지는 sgRNA는 동족(cognate) PUF 아형에 의해 묶여진 상기 이펙터들을 모집(recruit)할 수 있으며, 이로 인해 서로 다른 이펙터 기능을 위치화시키기 위한 dCas9 또는 분리된 염색체 좌에서 단백질 태그들의 다중화를 제공한다. 도 8B는 다량체화(multimerization)에 대해 도시하고 있다: PBS의 짧고 선형적 특징으로 인하여 sgRNA는 많은 PBS 카피를 가지게 되며, 따라서 타겟 좌에서 PUF-융합의 많은 분자들의 모집(recruitment)을 허용한다. 도 8C는 복합체 형성에 대해 도시하고 있다: 서로 다른 조합, 순서 및 개수의 PBS를 구비한 sgRNA는 원하는 화학양론 및 배열을 갖는 단백질 복합체들을 직접 조립하는 발판(scaffold)의 역할을 할 수 있다.
1. 개요
이하 기재된 본 발명은 타겟 폴리뉴클레오티드 서열(예, 상기 DNA-타겟팅 서열)에의 결합; 감소되거나 결핍된 뉴클레아제 활성(예, Cas9-결합 서열)을 가지는 야생형(wt) Cas9 단백질 또는 변형된 Cas9 단백질(예, Cas9 틈내기 효소 또는 dCas9)에의 결합; 및 각각 기능적 또는 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역에의 결합;을 위한 3 기능적 서열을 포함하는 폴리뉴클레오티드를 제공한다. 본 발명의 상기 폴리뉴클레오티드는, 상기 야생형(wt) 또는 변형된 Cas9 단백질 및 상기 하나 또는 그 이상의 PUF 영역 융합 단백질들과 함께, 특정 타겟 DNA 서열에서 하나 또는 그 이상의 생물학적 효과를 가져오게 하는 상기 특정 타겟 DNA 서열에서 3-성분 복합체(상기 대상 3-성분 CRISPR/Cas 복합체/시스템)를 형성할 수도 있다.
본 발명은 또한 폴리뉴클레오티드, 상기 폴리뉴클레오티드에 의해 형성된 복합체, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)및 최소한 하나 이상의 PUF 영역 융합 단백질을 코딩하는 벡터를 제공한다. 본 발명은 또한 상기 벡터 또는 상기 폴리뉴클레오티드를 포함하는 숙주 세포들을 추가로 제공한다.
상기 대상 3-성분 CRISPR/Cas 복합체/시스템은 타겟 DNA 서열에서 넉-인(knock-in)의 효율을 증가시키는 증강된 상동 재조합, 복수의 좌위에서 동시적 전사 활성화 및/또는 리프레션; 형광 이미징 또는 기타 탐지가능한 신호에 의한 좌위에서의 특정 서열의 탐색; 및 세포운명(cell fate) 결정에 대한 영향, 세포 분화, 대사 흐름, 또는 생물학적 또는 생화학적으로 결정가능한 결과물 등을 포함하는 다양한 생물학적 기능을 가져올 수 있으나, 이에 국한되는 것은 아니다.
본 발명은 본 발명의 방법들을 수행하는 데 필요한 키트들 및 시약들을 추가적으로 제공한다.
따라서, 일 양태에서, 본 발명은 (1)타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열;(2)Cas9-결합 서열; 및 (3)하나 또는 그 이상의 카피의 PUF 영역-결합 서열(PBS)로서, 상기 하나 또는 그 이상의 카피의 PBS는 각각 같거나 다른 PUF 영역에 결합하는 것;을 포함하는폴리뉴클레오티드에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)는 상기 Cas9-결합 서열에 결합함으로써 상기 폴리뉴클레오티드와 복합체를 형성할 수 있는, 폴리뉴클레오티드를 제공한다. 특정 구현예에 있어서, 상기 dCas9 단백질은 감소된 뉴클레아제 활성을 가지거나 또는 뉴클레아제 활성(예, 뉴클레아제-결핍)이 결여되어 있으나, 상기 대상 폴리뉴클레오티드와 복합체를 이룰 경우에는 DNA-결합능을 유지한다. 특정 구현예에 있어서,(1)-(3)은 5' 에서 3'의 순서로 배열된다. 또 다른 구현예에 있어서, 하나 또는 그 이상의 상기 PBS는 5' 에서 상기 DNA-타겟팅 서열 및/또는 5' 에서 상기 Cas9-결합 서열일 수 있다.
상기 타겟 폴리뉴클레오티드 서열은 임의의 DNA 서열일 수 있다. 특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 전사 조절 요소를 포함하거나 이에 인접한 것일 수 있다. 특정 구현예에 있어서, 상기 전사 조절 요소는 코어 프로모터, 근위 프로모터 요소, 인핸서, 사일렌서, 인슐레이터 및 좌위 조절 부위 중에서 하나 또는 그 이상을 포함하는 것일 수 있다. 또 다른 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 동원체 서열, 텔로미어 서열, 또는 반복성 게놈 서열을 포함하거나 이에 인접한 것일 수 있다. 상기 텔로미어 서열은 TTAGGG 반복을 5-15 kb 트랙을 가지는 것을 특징으로 한다. 또 다른 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 게놈 마커 서열(또는 관심 게놈 좌위)을 포함하거나 이에 인접한 것일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥의 프로토스페이서 인접 모티프(PAM) 서열에 바로 옆 3'인 것일 수 있다. 예를 들어, 특정 구현예에 있어서, 상기 상보적 가닥의 상기 PAM 서열은 5'-CCN-3'일 수 있고, 여기서 N은 임의의 DNA 뉴클레오티드일 수 있다.
또 다른 구현예에 있어서, 상기 상보적 가닥의 상기 PAM 서열은 사용하게 되는 상기 특정 Cas9 단백질들 또는 상동체들 또는 오솔로그들(orthologs)과 매치될 수 있다.
당업계에 공지된 바와 같이, Cas9이 DNA에 성공적으로 결합하기 위해서 상기 게놈 DNA에 있는 상기 타겟 서열은 상기 가이드 RNA 서열과 상보적이어야 하며, 올바른 프로토스페이서 인접 모티프 또는 PAM 서열이 바로 옆에 연결되어야 한다. 상기 PAM 서열은 DNA 타겟 서열에 존재하지만 상기 가으드 RNA에는 존재하지 않는다. 상기 PAM서열에 이어지는 상기 올바른 타겟 서열을 가지는 임의의 DNA서열은 Cas9에 결합되게 된다.
상기 PAM 서열은 상기 Cas9가 유래된 박테리아의 종에 따라 차이가 있다. 가장 널리 사용되는 Type II CRISPR 시스템은 화농성 연쇄상구균 (S. Pyogenes)으로부터 유래된 것이고, 상기 PAM 서열은 상기 가이드 RNA 인식 서열(또는 상기 상보적 가닥 상의 5'-CCN-3')의 바로 옆 3'에 위치한 5'-NGG-3’이다. 다른 박테리아 종의 기타 Type II CRISPR 시스템들의 상기 PAM 서열들은 하기 표 1에 열거되어 있다.
화농연쇄상구균(SP) | NGG |
Neisseria meningitidis(NM) | NNNNGATT |
Streptococcus thermophilus(ST) | NNAGAA |
Treponema denticola(TD) | NAAAAC |
특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 상기 폴리뉴클레오티드와 복합체를 형성하는 경우, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 염기 쌍을 이룬다.
상기 DNA-타겟팅 서열은 상기 표적 폴리 뉴클레오티드 서열에 100 % 상보적이거나 또는 그렇지 않을 수 있음을 주목해야 한다. 특정 구현예에 있어서, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 약 12-22 뉴클레오티드(nucleotides, nts), 약 14-20 뉴클레오티드, 약 16-20 뉴클레오티드, 약 18-20 뉴클레오티드, 또는 약 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 뉴클레오티드에 걸쳐 상보적일 수 있다. 특정 구현예에 있어서, 상기 상보적 부위는 약 12-22 뉴클레오티드 연속 스트레치를, 바람직하기로는 상기 DNA-타겟팅 서열의 3' 말단에 포함할 수 있다. 특정 구현예에 있어서, 상기 DNA-타겟팅 서열의 5' 말단은 상기 타겟 폴리뉴클레오티드 서열과 최대 8 뉴클레오티드 미스매치를 가질 수 있다. 특정 구현예에 있어서, 상기 DNA-결합 서열은 상기 타겟 폴리뉴클레오티드 서열에 약 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100% 상보적인 것일 수 있다.
관련 구현예에 있어서, 상기 DNA-타겟팅 서열의 3' 말단에는 상기 상보적 타겟 폴리뉴클레오티드 서열과 대비하여 최대 15-뉴클레오티드 매치를 초과할 수 없으며, 복합체에 있는 상기 Cas9 단백질은 야생형(wt) Cas9 단백질로서, 이 상황에서는, 타겟 DNA에 결합하나 절단하지 않는다.
특정 구현예에 있어서, 상기 DNA-결합 서열은 5' 말단에 뉴클레오티드 G를 가질 수 있다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 DNA-타겟팅 서열을 상기 Cas9-결합 서열에 연결하는 링커 서열을 추가로 포함할 수 있다.
특정 구현예에 있어서, 상기 Cas9-결합 서열은 머리핀 구조를 형성할 수 있다. 특정 구현예에 있어서, 상기 Cas9-결합 서열은 길이가 약 30-100 뉴클레오티드, 약 35-50 뉴클레오티드, 약 37-47 뉴클레오티드, 또는 약 42 뉴클레오티드일 수 있다.
일 구현예에 있어서, Cas9-결합 서열은 GTTTTAGAGCTAGAAATAGCAAGTTAA AATAAGGCTA 일 수 있다. 다른 구현예에 있어서, Cas9-결합 서열은 GTTTAAGAGCTATGC TG GAAACAGCATAGCAAGTTTAAATAAGGCTA 일 수 있다.
상기 변형된 Cas9 단백질(틈내기 효소 또는 dCas9)은 엔도뉴클레아제의 어느 하나 또는 두 촉매 부위 모두에서 뉴클레아제 활성이 감소되거나 또는 뉴클레아제 활성이 결여될 수 있다. 특정 구현예에 있어서, 상기 dCas9 단백질은 야생형 Cas9의 두 엔도뉴클레아제 촉매 부위(RuvC 및 HNH) 모두에서 점 돌연변이로 인하여 엔도뉴클레아제 활성이 결여될 수 있다. 예를 들어, 상기 점 돌연변이들은 각각 화농성 연쇄상구균(S. Pyogenes)의 Cas9 또는 화농성 연쇄상구균(S. Pyogenes)을 제외한 종(species)의 대상 잔기에 있는 D10A 및 H840A 일 수 있다. 특정 구현예에 있어서, 상기 변형된 Cas9 단백질은 야생형(wt) Cas9의 두 부위 모두에서가 아닌 어느 한 부위에서 엔도뉴클레아제 촉매활성이 결여될 수 있으며 dsDNA 타겟(Cas9 틈내기 효소)에서 틈(nick)을 만들 수 있다.
특정 구현예에 있어서, 하나 또는 그 이상의 상기 PBS의 각각은 약 8 뉴클레오티드를 가질 수 있다. 일 구현예에 있어서, PBS는 상기 PUF 영역 PUF(3-2)에 의해 결합될 수 있는 5'-UGUAUGUA-3' 서열을 가질 수 있다. 다른 구현예에 있어서, PBS 는 상기 PUF 영역 PUF(6-2/7-2)에 의해 결합될 수 있는 5'-UUGAUAUA-3'를 가질 수 있다. 추가적 PBS 및 대상 PUF 영역들은 하기에 기재되어 있다.
본 발명의 상기 폴리뉴클레오티드는 1 개 이상의 PBS 카피를 가질 수 있다. 특정 구현예에 있어서, 상기 폴리뉴클레오티드는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 카피의 PBS와 같은, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 46, 47, 48, 49, 또는 50 카피의 PBS를 가질 수 있다. 특정 구현예에 있어서, 상기 PBS의 카피 수의 범위는 L 에서 H이며, 상기에서 L은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 또는 40 중 어느 하나이며, H는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 90, 또는 100 중 어느 하나이며, 여기서 H는 L보다 커야 한다. 각 PBS는 같거나 다를 수 있다.
특정 구현예에 있어서, 상기 폴리뉴클레오티드는 약 5-15 카피의 PBS, 또는 약 5-14 카피, 약 5-13 카피, 약 5-12 카피, 약 5-11 카피, 약 5-10 카피, 또는 약 5-9 카피의 PBS를 가질 수 있다.
특정 구현예에 있어서, PBS/PUF의 결합을 극대화하기 위하여 상기 sgRNA-PBS의 양 및/또는 형질감염되거나 발현된 상기 PUF 융합들의 양을 조절할 수 있다. 예를 들면, 이는 더욱 강력한 프로모터 또는 Dox-유도성 프로모터와 같은 유도성 프로모터를 사용하여 PUF-활성제의 발현을 증가시킴으로써 성취할 수 있다.
특정 구현예에 있어서, PBS 부위들 및/또는 스페이서 서열 간의 간격은 시스템 효율을 향상시키기 위해 최적화할 수 있다. 예를 들어, 간격 최적화는 특정 PUF 융합에 종속되고, 개개 단백질들 및 기능 발휘를 위하여 충분히 근접 위치할 필요가 있는 PUF 융합들로 작용하는 PUF 융합들 사이에서도 차이가 있을 수 있다(예, 단백질 복합체들).
본 발명의 또 다른 양태는 상기 대상 폴리뉴클레오티드의 어느 하나를 코딩하는 벡터를 제공한다. 특정 구현예에 있어서, 상기 폴리뉴클레오티드의 전사는 항시성 프로모터, 또는 유도성 프로모터 조절 하에 있을 수 있다. 특정 구현예에 있어서, 상기 벡터는 포유류(사람; 비인간 영장류; 비인간 포유류; 마우스, 쥐, 햄스터, 기니아 피그와 같은 설치류; 돼지, 양, 염소, 말, 낙타, 소와 같은 가축 포유류; 또는 고양이나 개와 같은 애완용 포유류); 새, 어류, 곤충, 벌레, 효모, 또는 박테리아 세포에서 활성을 갖는 것일 수 있다.
특정 구현예에 있어서, 상기 벡터는 플라스미드, 바이러스 벡터(예, 아데노바이러스, 레트로바이러스, 또는 렌티바이러스 벡터, 또는 AAV 벡터) 또는 트랜스포존(piggyBac transposon)일 수 있다. 상기 벡터는 일시적으로 숙주 세포에 형질감염되거나 또는 감염시약이나 전위(transposition)에 의해 숙주 게놈에 통합될 수 있다.
본 발명의 관련 양태는 본 발명의 벡터의 다수 또는 라입브러리를 제공하며, 여기서 상기 벡터들 중 2 개의 벡터는 이들 각각의 DNA-타겟팅 서열, Cas9-결합 서열, 및/또는 상기 PBS의 카피 수, 동일성(서열, 결합 특이성 등), 또는 상대적 순서에 있어서의 코딩된 폴리뉴클레오티드에 있어서 다른 것일 수 있다.
본 발명의 또 다른 양태는 본 발명의 상기 폴리뉴클레오티드의 어느 하나를 포함하는 복합체 및 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 제공한다. 특정 구현예에 있어서, 상기 복합체는 상기 야생형(wt) Cas9 단백질을 포함하지 않을 수 있다. 특정 구현예에 있어서, 상기 복합체는 상기 야생형(wt) Cas9을 포함할 수 있다.
특정 구현예에 있어서, 상기 복합체는 상기 하나 또는 그 이상의 PBS에 결합된 하나 또는 그 이상의 PUF 영역을 추가로 포함하는 것일 수 있다. 특정 구현예에 있어서, 상기 PUF 영역의 각각은 이펙터 영역에 융합되어 있는 것일 수 있다. 각 이펙터 영역은 독립적으로(그러나 이에 국한되지는 않으며): 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것일 수 있다. 특정 구현예에 있어서, 최소한 두 개 이상의 상기 PUF 영역이 다른 이펙터 영역에 융합된 것일 수 있다.
특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질), 상기 PUF 영역 및/또는 상기 이펙터 영역은 핵 위치화 서열(nuclear localization sequence, NLS)을 추가로 포함하는 것일 수 있다.
특정 구현예에 있어서, 상기 복합체는 상기 폴리뉴클레오티드의 DNA-타겟팅 서열을 통하여 상기 타겟 폴리뉴클레오티드 서열에 결합된 것일 수 있다.
본 발명의 또 다른 양태는 어느 하나의 상기 대상 벡터 또는 다수의 벡터를 포함하는 숙주 세포를 제공한다.
특정 구현예에 있어서, 상기 숙주 세포세포는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)를 코딩하는 제 2벡터를 추가로 포함하는 것일 수 있다. 특정 구현예에 있어서, 상기 제 2벡터는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합된 이펙터 영역을 추가로 코딩하는 것일 수 있다. 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 발현은 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있을 수 있다.
특정 구현예에 있어서, 상기 숙주 세포는 상기 각각 이펙터 영역에 융합된 상기 하나 또는 그 이상의 PUF 영역을 코딩하는 제 3 벡터를 추가로 포함하는 것일 수 있다. 상기 하나 또는 그 이상의 PUF 영역의 발현은 독립적으로 항시성 프로모터 또는 유도성 프로모터의 조절 하에 하에 있을 수 있다.
상기 이펙터 영역은 많은 기능 또는 생물학적 효과 중 어느 하나를 가질 수 있다. 단순히 표현하자면, 상기 이펙터 영역은 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT) 등 상동 재조합에 관여하는 단백질일 수 있다.
특정 구현예에 있어서, 상기 제 2벡터는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 이펙터 영역에 융합된 핵 위치화 서열(NLS)을 추가로 코딩하거나 및/또는 상기 제 3벡터가 상기 PUF 영역 또는 상기 PUF 영역 또는 상기 이펙터 영역에 융합된 핵 위치화 신호(NLS)를 추가로 코딩하는 것일 수 있다.
특정 구현예에 있어서, 서로 다른 벡터들에 의해 코딩되는 서열들은 동일 벡터 상에 있을 수 있다. 예를 들면, 특정 구현예에 있어서, 상기 제 2벡터가 상기 벡터와 동일하거나 및/또는 상기 제 3벡터가 상기 벡터 또는 상기 제 2벡터와 동일한 것일 수 있다.
상기 숙주 세포는 살아 있는 동물에 있는 것이거나 또는 배양된 세포인 것일 수 있다.
특정 구현예에 있어서, 상기 숙주 세포는 상기 대상 3-성분 시스템(예, dCas9, PUF 융합들)을 하나 또는 그 이상 항시성 또는 유도성으로 발현하는 것일 수 있다.
본 발명의 또 다른 양태는 어느 한 항의 복합체를 상기 타겟 폴리뉴클레오티드 서열에서 본 발명의 복합체를 조립하는 방법을 제공하며, 상기 방법은 하기를 상기 타겟 폴리뉴클레오티드 서열에 접촉시키거나 또는 그 부근에 위치시키는 것인 방법: (1) 상기 대상 폴리뉴클레오티드의 어느 하나, 또는 상기 대상 벡터의 어느 하나, 또는 다수의 벡터들; (2) 상기 Cas9 단백질 (예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 코딩하는 상기 제 2벡터의 어느 하나; 및 (3) 각각 이펙터 영역에 융합된 하나 또는 그 이상의 상기 PUF 영역, 또는 상기 PUF 영역 융합들을 코딩하는 제 3벡터의 어느 하나.
특정 구현예에 있어서, 상기 복합체는 세포 내에서 조립되고, 상기 타겟 폴리뉴클레오티드 서열은 상기 세포의 게놈 DNA의 일부이고, 여기서 상기 대상 벡터, 제 2벡터 및 제 3벡터는 상기 세포로 도입되는 것일 수 있다.
특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 헤테로크로마틴이 풍부한 좌위 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 검출 가능한 마커(예, 형광 단백질)인 것일 수 있다. 또 다른 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 타겟 유전자의 전사 조절 요소 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 전사 모듈레이터(예, 활성제, 억제제)인 것일 수 있다. 상기 타겟 유전자의 전사는, 예를 들면, 세포 운명 결정, 세포 분화, 대사 흐름, 또는 생물학적 또는 생화학적으로 결정 가능한 결과물인 것일 수 있다.
본 발명의 관련 양태는 세포에서 다수의 타겟 유전자의 전사 또는 후성적(epigenetic) 상태를 모듈레이트하는 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, Cas9 단백질용 코딩 서열 및 하나 또는 그 이상의 PUF 영역용 코딩 서열을 상기 세포로 도입하는 것을 포함하며, 여기서 상기 타겟 유전자의 각각은 (1)상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 dCas9 단백질 및 PUF 영역 융합으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2)상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 전사를 모듈레이트 하는 것을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다.
관련 양태에 있어서, 본 발명은 또한 세포 내에서 다수의 타겟 유전자의 후성적(epigenetic) 모듈레이션(예, 전사 활성과 직접적으로 연관되지 않은 크로마틴의 후성적 상태의 모듈레이팅) 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, 야생형(wt) Cas9 단백질 또는 Cas9 틈내기 효소용 코딩 서열 및 하나 또는 그 이상의 PUF 영역용 코딩 서열을 상기 세포로 도입하는 것을 포함하며, 여기서 상기 타겟 유전자의 각각은 (1) 상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 Cas9 단백질 또는 Cas9 틈내기 효소및 PUF 영역 융합으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2) 상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 후성적 모듈레이션을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다. 상기 방법은 예를 들어 Cas9가 폐쇄된 크로마틴 부위 (예, 이들 부위에 절단 및 게놈 편집(editing)을 증가시킴)에 접근성 및 결합의 안정성을 얻음과 동시에 후성적 상태(예, 크로마틴의 개방(opening up))를 변경하는 데 유용할 수 있다.
특정 구현예에 있어서, 최소한 하나 이상의 타겟 유전자의 전사를 저해하면서 최소한 하나 이상의 다른 타겟 유전자의 전사를 증진/진작할 수 있다.
본 발명은 (1) 대상 폴리뉴클레오티드 또는 이를 코딩하는 벡터; (2) 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 코딩하는 제 2벡터; 및 (3) 각각 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역을 코딩하는 제 3벡터를 포함하는 키트를 추가로 제공한다. 상기 키트는 상기 벡터들의 세포 도입을 용이하게 하기 위하여 형질전환, 형질감염, 또는 감염 시약들을 추가로 포함할 수 있다.
상기 본 발명에 대한 일반적 기재에 더불어, 본 발명의 다양한 특징들을 이하에 기재한다. 비록 본 발명의 별도의 문맥이나 다른 양태 하의 별도의 구현예에서 기재되어 있을지라도 본 발명의 특징들은 단일 구현예에 조합되어 제공될 수 있음을 이해하여야 한다. 반대로, 단일 구현예의 문맥에 기재되어 있는 본 발명의 다양한 특징들도 또한 별도로 제공되거나 임의의 적합한 하위 조합(subcombination)으로 제공될 수 있다. 본 발명에 관한 실시예의 모든 조합은 구체적으로는 본 발명에 포함되며, 마치 모든 조합이 개별적으로 및 명시적으로 공개된 것처럼 이하에 개시된다. 또한, 다양한 실시예의 모든 하위 조합 및 그 구성 요소는 마치 각 그리고 모든 하위 조합이 개별적으로 및 명시적으로 공개된 것처럼 본 발명에 의해 구체적으로 포함되고 본원에 개시된다.
2. 본 발명의 폴리뉴클레오티드
본 발명의 폴리뉴클레오티드는 3 개의 세그먼트를 포함한다: i) 타겟 서열에 상보적인 뉴클레오티드 서열을 포함하는 제 1 세그먼트; ii) Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질, 감소된 뉴클레아제 활성 또는 결여된 뉴클레아제 활성을 가진다)와 상호작용하는 제 2 세그먼트(예, 상기 Cas9-결합 서열); 및 iii) 하나 또는 그 이상의 카피의 PUF 영역-결합 서열(PBS).
특정 구현예에 있어서, 상기 타겟 서열은 RNA일 수 있다. 특정 구현예에 있어서, 상기 타겟 서열은 DNA일 수 있다. 이하 본 발명의 기재에서, 상기 타겟 서열이 DNA(예, 게놈 DNA)일 경우 상기 제 1 세그먼트는 일반적으로 "DNA-타겟팅 서열"을 의미한다. 관련 구현예에 있어서, 상기 타겟 서열이 RNA일 경우에는 불필요한 반복을 피하기 위해, "DNA-타겟팅 서열"이 "RNA-타겟팅 서열"로 대체된 경우를 제외하고, 하기에 기재한 사항이 일반적으로 적용된다. 즉, 상기 제 1 세그먼트는 상기 타겟 폴리뉴클레오티드 서열(DNA 또는 RNA)에 상보적인 뉴클레오티드 서열을 포함할 수 있다.
특정 구현예에 있어서, 상기 3 개의 세그먼트 i) 내지 iii)는 5'에서 3' 방향으로 배열될 수 있다.
특정 구현예에 있어서, 본 발명의 상기 폴리뉴클레오티드는 "단일-가이드 RNA" 또는 "sgRNA"를 포함하는 단일 RNA 분자(단일 RNA 폴리뉴클레오티드)일 수 있다. 또 다른 구현예에서, 본 발명의 상기 폴리뉴클레오티드는 2 개의 RNA 분자(예, 상기 Cas9-결합 서열에서 하이브리드화를 통해 결합됨, 이하 참조)를 포함할 수 있다. 따라서, 상기 대상 폴리뉴클레오티드는, 두 분자의 폴리뉴클레오티드 및 단분자 폴리뉴클레오티드(예, sgRNAs)를 모두 의미하는 것을 포함할 수 있다.
a. DNA-타겟팅 서열
상기 DNA-타겟팅 서열은 상기 CRISPR/Cas 복합체/시스템의 crRNA 또는 가이드 RNA 또는 gRNA와 기능적으로 유사하거나 동일하다. 그러나, 본 발명의 문맥상, 상기 DNA-타겟팅 서열은 어떤 특정 crRNA 또는 gRNA에서 유래되는 것이 아니라 상기 타겟 폴리뉴클레오티드 서열의 서열을 토대로 임의로 디자인할 수 있다.
상기 DNA-타겟팅 서열은 타겟 DNA(또는 상기 타겟 DNA의 상보적 가닥)내의 특정 서열과 상보적인 뉴클레오티드 서열을 포함한다. 다시 말하면, 상기 DNA-타겟팅 서열은 서열-특이적 방법으로 하이브리드화(즉, 염기 짝짓기)에 의해 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열과 상호작용한다. 이와 같이, 상기 DNA-타겟팅 서열의 뉴클레오티드 서열은 변할 수 있으며, 이는 상기 대상 폴리뉴클레오티드와 상기 타겟 DNA가 상호작용하는 상기 타겟 DNA 내의 위치를 결정한다. 상기 DNA-타겟팅 서열은 상기 타겟 DNA 내의 임의의 원하는 서열에 하이브리드되도록 변형되거나 디자인(예, 유전공학) 될 수 있다. 특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥인 5'-CCN-3'(여기서, N은 임의의 DNA 뉴클레오티드)의 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)의 바로 옆 3'인 것일 수 있다. 즉, 본 구현예에서 상기 상기 타겟 폴리뉴클레오티드 서열의 상보적 가닥은 5'-CCN-3'(여기서, N은 임의의 DNA 뉴클레오티드)인 PAM 서열의 바로 옆 5'인 것일 수 있다. 관련 구현예에서, 상기 상보적 가닥의 PAM 서열은 야생형(wt) 또는 dCas9와 매치된다. 화농성 연쇄상구균(S. Pyogenes) 외의 기타 종의 PAM 서열은 상기를 참조하기 바란다.
상기 DNA-타겟팅 서열은 약 12 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 DNA-타겟팅 서열은 약 12 뉴클레오티드 내지 약 80 뉴클레오티드, 약 12 뉴클레오티드 내지 약 50 뉴클레오티드, 약 12 뉴클레오티드 내지 약 40 뉴클레오티드, 약 12 뉴클레오티드 내지 약 30 뉴클레오티드, 약 12 뉴클레오티드 내지 약 25 뉴클레오티드, 약 12 뉴클레오티드 내지 약 20 뉴클레오티드, 또는 약 12 뉴클레오티드 내지 약 19 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 DNA-타겟팅 서열은 약 19 뉴클레오티드 내지 약 20 뉴클레오티드, 약 19 뉴클레오티드 내지 약 25 뉴클레오티드, 약 19 뉴클레오티드 내지 약 30 뉴클레오티드, 약 19 뉴클레오티드 내지 약 35 뉴클레오티드, 약 19 뉴클레오티드 내지 약 40 뉴클레오티드, 약 19 뉴클레오티드 내지 약 45 뉴클레오티드, 약 19 뉴클레오티드 내지 약 50 뉴클레오티드, 약 19 뉴클레오티드 내지 약 60 뉴클레오티드, 약 19 뉴클레오티드 내지 약 70 뉴클레오티드, 약 19 뉴클레오티드 내지 약 80 뉴클레오티드, 약 19 뉴클레오티드 내지 약 90 뉴클레오티드, 약 19 뉴클레오티드 내지 약 100 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 20 뉴클레오티드 내지 약 35 뉴클레오티드, 약 20 뉴클레오티드 내지 약 40 뉴클레오티드, 약 20 뉴클레오티드 내지 약 45 뉴클레오티드, 약 20 뉴클레오티드 내지 약 50 뉴클레오티드, 약 20 뉴클레오티드 내지 약 60 뉴클레오티드, 약 20 뉴클레오티드 내지 약 70 뉴클레오티드, 약 20 뉴클레오티드 내지 약 80 뉴클레오티드, 약 20 뉴클레오티드 내지 약 90 뉴클레오티드, 약 20 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다.
상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열의 뉴클레오티드 서열은 최소한 약 12 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 최소한 약 12 뉴클레오티드, 최소한 약 15 뉴클레오티드, 최소한 약 18 뉴클레오티드, 최소한 약 19 뉴클레오티드, 최소한 약 20 뉴클레오티드, 최소한 약 25 뉴클레오티드, 최소한 약 30 뉴클레오티드, 최소한 약 35 뉴클레오티드 또는 최소한 약 40 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 약 12 뉴클레오티드 내지 약 80 뉴클레오티드, 약 12 뉴클레오티드 내지 약 50 뉴클레오티드, 약 12 뉴클레오티드 내지 약 45 뉴클레오티드, 약 12 뉴클레오티드 내지 약 40 뉴클레오티드, 약 12 뉴클레오티드 내지 약 35 뉴클레오티드, 약 12 뉴클레오티드 내지 약 30 뉴클레오티드, 약 12 뉴클레오티드 내지 약 25 뉴클레오티드, 약 12 뉴클레오티드 내지 약 20 뉴클레오티드, 약 12 뉴클레오티드 내지 약 19 뉴클레오티드, 약 19 뉴클레오티드 내지 약 20 뉴클레오티드, 약 19 뉴클레오티드 내지 약 25 뉴클레오티드, 약 19 뉴클레오티드 내지 약 30 뉴클레오티드, 약 19 뉴클레오티드 내지 약 35 뉴클레오티드, 약 19 뉴클레오티드 내지 약 40 뉴클레오티드, 약 19 뉴클레오티드 내지 약 45 뉴클레오티드, 약 19 뉴클레오티드 내지 약 50 뉴클레오티드, 약 19 뉴클레오티드 내지 약 60 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 20 뉴클레오티드 내지 약 35 뉴클레오티드, 약 20 뉴클레오티드 내지 약 40 뉴클레오티드, 약 20 뉴클레오티드 내지 약 45 뉴클레오티드, 약 20 뉴클레오티드 내지 약 50 뉴클레오티드, 약 20 뉴클레오티드 내지 약 60 뉴클레오티드의 길이를 가질 수 있다. 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열의 뉴클레오티드 서열은 최소한 약 12 뉴클레오티드의 길이를 가질 수 있다.
일부 경우에 있어서, 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 길이가 20 뉴클레오티드일 수 있다. 일부 경우에 있어서, 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 길이가 19 뉴클레오티드일 수 있다.
상기 DNA-타겟팅 서열 및 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 최소한 50%(예, 최소한 55%, 최소한 60%, 최소한 65%, 최소한 70%, 최소한 75%, 최소한 80%, 최소한 85%, 최소한 90%, 최소한 95%, 최소한 97%, 최소한 98%, 최소한 99%, 또는 100%)일 수 있다. 일부 경우에 있어서, 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 상기 타겟 폴리뉴클레오티드 서열의 7 또는 8 개의 연속적인 가장 5'쪽 뉴클레오티드에 대하여 100%일 수 있다. 일부 경우에 있어서, 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 20개의 연속적인 뉴클레오티드에 대하여 최소한 60%일 수 있다. 일부 경우에 있어서, 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 상기 타겟 폴리뉴클레오티드 서열(즉, 상기 DNA-타겟팅 서열의 7, 8, 9, 10, 11, 12, 13, 또는 14 개의 연속적인 가장 3'쪽 뉴클레오티드)의 7, 8, 9, 10, 11, 12, 13, 또는 14 개의 연속적인 가장 5'인 뉴클레오티드에 대하여 100%일 수 있고, 나머지 부분에 대하여 0%까지 낮을 수도 있다. 이러한 경우, 상기 DNA-타겟팅 서열은 그 길이가 각각 7, 8, 9, 10, 11, 12, 13, 또는 14 개의 뉴클레오티드일 수 있다.
b. Cas9-결합 서열
상기 대상 폴리뉴클레오티드의 단백질-결합 세그먼트 또는 단백질-결합 서열은 야생형(wt) Cas9 또는 감소된 엔도뉴클레아제 활성이나 엔도뉴클레아제 활성이 결여된 변형된 dCas9 단백질(예, 틈내기 효소 또는 dCas9)에 결합한다. 단순히 말하면, 야생형(wt) 및/또는 변형된 Cas9 단백질에 결합할 수도 있는 상기 대상 폴리뉴클레오티드의 단백질-결합 서열은 이하 단순히 "Cas9-결합 서열"로 지칭될 수 있다. 그러나, 상기 본 발명의 Cas9-결합 서열이 dCas9에 결합할 때, 야생형(wt) Cas9 또는 Cas9 틈내기 효소에 결합하는 것을 방지하지 못함을 이해하여야 한다. 특정 구현예에 있어서, 상기 본 발명의 Cas9-결합 서열은 야생형(wt) Cas9 및/또는 Cas9 틈내기 효소 뿐 아니라 dCas9에도 결합할 수 있다.
상기 Cas9-결합 서열은 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)과 상호작용하거나 또는 결합하며, 이들은 함께 상기 DNA-타겟팅 서열에 의해 인식되는 상기 타겟 폴리뉴클레오티드 서열에 결합할 수 있다. 상기 Cas9-결합 서열은 이중 가닥의 RNA 듀플렉스(dsRNA duplex)를 형성하기 위하여 서로 하이브리드하는 뉴클레오티드의 2 개의 상보성 스트레치를 포함한다. 이들 2 개의 상보성 스트레치는 링커 또는 링커 뉴클레오티드(예, 단일-분자 폴리뉴클레오티드의 경우)로 알려진 뉴클레오티드들에 개입함으로써 공유결합될 수 있고, 상기 Cas9-결합 서열의 2중 가닥 RNA 듀플렉스(dsRNA 듀플렉스 또는 "Cas9-결합 머리핀")를 형성하도록 하이브리드됨으로써, 줄기-고리(stem-loop) 구조를 가지게 된다. 또는, 일부 구현예에서, 상기 2 개의 상보성 스트레치는 공유결합되지 않을 수 있으나, 그 대신 상보성 서열들(예, 본 발명의 두-분자 폴리뉴클레오티드의 경우) 사이의 하이브리드화에 의해 결합될 수 있다.
상기 Cas9-결합 서열은 약 10 뉴클레오티드 내지 약 100 뉴클레오티드, 예, 약 10 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 Cas9-결합 서열은 약 15 뉴클레오티드뉴클레오티드 내지 약 80 뉴클레오티드, 약 15 뉴클레오티드 내지 약 50 뉴클레오티드, 약 15 뉴클레오티드 내지 약 40 뉴클레오티드, 약 15 뉴클레오티드 내지 약 30 뉴클레오티드, 약 37 뉴클레오티드 내지 약 47 뉴클레오티드(예, 42 뉴클레오티드), 또는 약 15 뉴클레오티드 내지 약 25 뉴클레오티드의 길이를 가질 수 있다.
상기 Cas9-결합 서열의 dsRNA 듀플렉스는 약 6 bp 내지 약 50 bp의 길이를 가질 수 있다. 예를 들면, 상기 Cas9-결합 서열의 dsRNA 듀플렉스는 약 6 bp 내지 약 40 bp, 약 6 bp 내지 약 30 bp, 약 6 bp 내지 약 25 bp, 약 6 bp 내지 약 20 bp, 약 6 bp 내지 약 15 bp, 약 8 bp 내지 약 40 bp, 약 8 bp 내지 약 30 bp, 약 8 bp 내지 약 25 bp, 약 8 bp 내지 약 20 bp 또는 약 8 bp 내지 약 15 bp의 길이를 가질 수 있다. 예를 들면, 상기 Cas9-결합 서열의 dsRNA 듀플렉스는 약 8 bp 내지 약 10 bp, 약 10 bp 내지 약 15 bp, 약 15 bp 내지 약 18 bp, 약 18 bp 내지 약 20 bp, 약 20 bp 내지 약 25 bp, 약 25 bp 내지 약 30 bp, 약 30 bp 내지 약 35 bp, 약 35 bp 내지 약 40 bp, 또는 약 40 bp 내지 약 50 bp의 길이를 가질 수 있다. 일부 구현예에 있어서, 상기 Cas9-결합 서열의 dsRNA 듀플렉스는 36 bp의 길이를 가질 수 있다. 상기 Cas9-결합 서열의 dsRNA 듀플렉스를 형성하기 위하여 하이브리드하는 뉴클레오티드 서열들 사이의 상보성 %는 최소한 약 60%일 수 있다. 예를 들면, 상기 Cas9-결합 서열의 dsRNA 듀플렉스를 형성하기 위하여 하이브리드하는 뉴클레오티드 서열들 사이의 상보성 %는 최소한 약 65%, 최소한 약 70%, 최소한 약 75%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 95%, 최소한 약 98%, 또는 최소한 약 99%일 수 있다. 일부 구현예에 있어서, 상기 Cas9-결합 서열의 dsRNA 듀플렉스를 형성하기 위하여 하이브리드하는 뉴클레오티드 서열들 사이의 상보성 %는 100%일 수 있다.
상기 링커는 약 3 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 링커는 약 3 뉴클레오티드 내지 약 90 뉴클레오티드, 약 3 뉴클레오티드 내지 약 80 뉴클레오티드, 약 3 뉴클레오티드 내지 약 70 뉴클레오티드, 약 3 뉴클레오티드 내지 약 60 뉴클레오티드, 약 3 뉴클레오티드 내지 약 50 뉴클레오티드, 약 3 뉴클레오티드 내지 약 40 뉴클레오티드, 약 3 뉴클레오티드 내지 약 30 뉴클레오티드, 약 3 뉴클레오티드 내지 약 20 뉴클레오티드 또는 약 3 뉴클레오티드 내지 약 10 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 링커는 약 3 뉴클레오티드 내지 약 5 뉴클레오티드, 약 5 뉴클레오티드 내지 약 10 뉴클레오티드, 약 10 뉴클레오티드 내지 약 15 뉴클레오티드, 약 15 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 25 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 35 뉴클레오티드, 약 35 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 일부 구현예에 있어서, 상기 링커는 4 뉴클레오티드일 수 있다.
적합한 Cas9-결합 서열(즉, Cas9 핸들(handle))에 포함될 수 있는 뉴클레오티드 서열의 비제한적 예는 WO2013/176772(예를 들어, WO2013/176772의 도 8 및 9 참조 요망)의 서열 번호 563-682에 기재되어 있으며, 본 발명에 참고문헌으로서 결합된다.
일부 구현예에 있어서, 적합한 Cas9-결합 서열은 상기 나열된 서열 중 어느 하나와 1, 2, 3, 4, 또는 5 뉴클레오티드 차이가 있는 뉴클레오티드 서열을 포함할 수 있다.
c. PUF 영역-결합 서열(PBS)
상기 대상 폴리뉴클레오티드는 하나 또는 그 이상의 탠덤(tandem) 서열을 가지며, 이들 각각은 특정 PUF 영역에 의해 구체적으로 인식되고 결합될 수 있다(이하 기재). PUF 영역은 PUF 영역의 각 개별적 PUF 모티프(모티프) 및 이들이 인식하는 단일 RNA 뉴클레오티드 사이의 뉴클레오티드-특이적 상호 작용을 바탕으로 하여 실질적으로 어떤 PBS 에도 결합될 수 있도록 설계될 수 있으므로, 상기 PBS 서열들은 이들의 상응하는 PUF 영역에 결합하는 임의의 디자인된 서열일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 8-mer를 가질 수 있다. 다른 구현예에 있어서, 본 발명의 PBS는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 그 이상의 RNA 뉴클레오티드를 가질 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUAUA-3'를 가지며 야생형(wt) human Pumilio 1 PUF 영역에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUGUA-3'를 가지며 상기 PUF 영역 PUF(3-2)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUGAUAUA-3'를 가지며 상기 PUF 영역 PUF(6-2/7-2)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGGAUAUA-3'를 가지며 상기 PUF 영역 PUF(6-2)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUUAUAUA-3'를 가지며 상기 PUF 영역 PUF(7-2)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUGUGUG-3'를 가지며 상기 PUF 영역 PUF531에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUAUG-3'를 가지며 상기 PUF 영역 PUF(1-1)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUUAUAUA-3' 또는 5'-UAUAUAUA-3'를 가지며 상기 PUF 영역 PUF(7-1)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUUUA-3'를 가지며 상기 PUF 영역 PUF(3-1)에 결합하는 것일 수 있다.
특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUUAUUUA-3'를 가지며 상기 PUF 영역 PUF(7-2/3-1)에 결합하는 것일 수 있다.
출원인은 특정 PBS에 결합할 수 있는 65,536 8-mer PBS 및 이들에 상응하는 PUF 영역 서열들을 제작하였다(하기 참조). 출원인은 또한 주어진 8-mer PBS에 결합하는 65,536 개의 개별적 PUF 영역 서열 중 어느 하나를 검색할(retrieve) 수 있는 파이썬 스크립트(python script)를 제작하였다. 예를 들면, 상기 8-mer UUGAUGUA에 대한 것으로서, 하나의 가능한 PUF 영역 서열은 하기와 같을 수 있다:
GRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGCRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
특정 구현예에 있어서, 하나 또는 그 이상의 스페이서 부위(들)는 2 개의 인접한 PBS 서열을 분리시킨다. 상기 스페이서 부위는 약 3 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 스페이서는 약 3 뉴클레오티드 내지 약 90 뉴클레오티드, 약 3 뉴클레오티드 내지 약 80 뉴클레오티드, 약 3 뉴클레오티드 내지 약 70 뉴클레오티드, 약 3 뉴클레오티드 내지 약 60 뉴클레오티드, 약 3 뉴클레오티드 내지 약 50 뉴클레오티드, 약 3 뉴클레오티드 내지 약 40 뉴클레오티드, 약 3 뉴클레오티드 내지 약 30 뉴클레오티드, 약 3 뉴클레오티드 내지 약 20 뉴클레오티드 또는 약 3 뉴클레오티드 내지 약 10 뉴클레오티드를 가질 수 있다. 예를 들면, 상기 스페이서는 약 3 뉴클레오티드 내지 약 5 뉴클레오티드, 약 5 뉴클레오티드 내지 약 10 뉴클레오티드, 약 10 뉴클레오티드 내지 약 15 뉴클레오티드, 약 15 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 25 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 35 뉴클레오티드, 약 35 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 일부 구현예에서, 상기 스페이서는 4 뉴클레오티드의 길이를 가질 수 있다.
d. 선택성 기타 서열들
안정성 조절 서열(예, 전사 종결자 세그먼트(transcriptional terminator segment))는 RNA(예, 대상 폴리뉴클레오티드)의 안정성에 영향을 미친다. 적합한 안정성 조절 서열의 한 예로서 전사 종결자 세그먼트(즉, 전사 종결 서열)을 들 수 있다. 대상 폴리뉴클레오티드의 전사 종결자 세그먼트는 약 10 뉴클레오티드 내지 약 100 뉴클레오티드, 예를 들면, 약 10 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 총 길이를 가질 수 있다. 예를 들면, 상기 전사 종결자 세그먼트는 약 15 뉴클레오티드 내지 약 80 뉴클레오티드, 약 15 뉴클레오티드 내지 약 50 뉴클레오티드, 약 15 뉴클레오티드 내지 약 40 뉴클레오티드, 약 15 뉴클레오티드 내지 약 30 뉴클레오티드, 또는 약 15 뉴클레오티드 내지 약 25 뉴클레오티드의 길이를 가질 수 있다.
일부 구현예에 있어서, 상기 전사 종결 서열은 진핵세포에서 기능을 갖는 것일 수 있다. 일부 구현예에 있어서, 상기 전사 종결 서열은 원핵세포에서 기능을 갖는 것일 수 있다.
안정성 조절 서열(예, 전사 종결 세그먼트, 또는증가된 안정성을 제공하기 위한 상기 DNA-타겟팅 RNA의 임의의 세그먼트)에 포함될 수 있는 뉴클레오타이드 서열의 비제한적인 예는 WO2013/176772(본원의 참조로 포함됨)의 서열 번호 683-696에 기재된 서열들(예, WO2013/176772의 서열 번호 795, Rho-독립적인 전사 종결 사이트)을 포함할 수 있다.
상기 안정성 조절 서열은 상기 Cas9-결합 서열 뒤, 예를 들면, 상기 Cas9-결합 서열 및 상기 제 1 PBS 사이, 2 개의 인접한 PBS 사이, 또는 최종 PBS 뒤에 위치할 수 있다.
일부 구현예에 있어서, 본 발명의 상기 폴리뉴클레오티드 또는 이의 일부(예, 상기 DNA-타겟팅 서열, 상기 Cas9-결합 서열 및/또는 the 하나 또는 그 이상의 상기 PBS), 또는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)를 코딩하는 폴리뉴클레오티드, 또는 상기 PUF 영역 융합들(이하 기재)을 코딩하는 폴리뉴클레오티드는 추가적인 바람직한 특징을 제공하는 변형 또는 서열(예, 변형되거나 조절된 안정성; 세포 내(subcellular) 타겟팅; 추적(예, 형광 표지; 단백질 또는 단백질 복합체를 위한 결합 사이트; 등)을 포함할 수 있다.
비제한적 예로는 다음을 들 수 있다: 5' cap(예, 7-메틸구아닐레이트 cap(m7G)); 3' 폴리아데닐레이티드 꼬리(즉, 3' 폴리(A) 꼬리); 리보스위치(riboswitch) 서열 또는 압타머 서열(예, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위한 서열); 종결자 서열; dsRNA 듀플렉스를 형성하는 서열(즉, 머리핀)); RNA를 세포 내(subcellular) 위치(예, 핵, 미토콘드리아, 엽록체 등)로 타겟하는 변형 또는 서열; 추적(예, 형광 분자에 대한 직접 결합(conjugation), 형광 검출을 도모하기 위한 부분(moiety)에 대한 결합(conjugation), 형광 검출을 허용하는 서열 등)을 제공하는 변형 또는 서열; 단백질(예, 전사 활성제, 전사 리프레서, DNA 메틸트란스퍼라제, DNA 디메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 디아세틸라제 등)을 포함하는 DNA에 작용하는 단백질; 증가, 감소되거나 및/또는 조절가능한 안정성을 제공하는 변형 또는 서열; 및 이들의 조합.
3. 상기 Cas9 단백질(야생형(wt), 틈내기 효소, 또는 dCas9)
본 발명의 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)는: 상기 대상 폴리뉴클레오티드의 Cas9-결합 서열과 상호작용하는 RNA-결합 부분 및 ii) 상기 Cas9 단백질의 아이덴티티에 따라, 야생형(wt), 감소된 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성, 또는 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성 결여를 나타내는 활성 부분을 포함한다.
상기 폴리뉴클레오티드의 Cas9-결합 서열과 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 서열 상보성을 토대로, 특정 타겟 폴리뉴클레오티드 서열에 결합하는 복합체를 형성할 수 있다. 상기 대상 폴리뉴클레오티드의 NA-타겟팅 서열은 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 대한 이의 상보성을 통하여 상기 복합체에 대한 타겟 특이성을 제공한다. 상기 타겟 폴리뉴클레오티드 서열이, PBS-결합 PUF 영역에 융합된 후성적(epigenetic) 변형을 모듈레이트하는 전사 조절자 또는 이펙터와 함께, 타겟 유전자의 전사 조절 요소 또는 후성적 변형 사이트 및 상기 복합체에 또는 인접하여 있을 경우에는, 상기 타겟 유전자의 전사 또는 후성적 모듈레이션을 선택적으로 모듈레이트할 수 있다.
특정 구현예에 있어서, 상기 변형된 Cas9 단백질은 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성이 감소되거나 결여될 수 있다. 예를 들면, 본 발명의 방법에 사용하기에 적합한 변형된 Cas9는 Cas9 틈내기 효소일 수 있거나, 또는 야생형 Cas9 폴리펩타이드(예, WO2013/176772의 도 3 및 서열 번호 8에 도시된 아미노산 서열을 포함하는 야생형 Cas9 폴리펩타이드(이하 참조로 결합됨))의 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성을 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 약 1% 미만, 또는 약 0.1% 미만을 나타낼 수 있다. 일부 구현예에 있어서, 상기 dCas9는 실질적으로 검출가능한 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성을 가지지 않을 수 있다. 일부 구현예에 있어서, dCas9가 감소된 촉매 활성(예, Cas9 단백질이 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986및/또는 A987 돌연변이(예, D10A, G12A, G17A, E762A, H840A, N854A, N863A, H982A, H983A, A984A및/또는 D986A))을 가질 경우, 상기 폴리펩타이드가 대상 폴리뉴클레오티드의 DNA-타겟팅 서열에 의해 타겟 폴리뉴클레오티드 서열에 여전히 가이드 되기 때문에, 상기 폴리펩타이드가 대상 폴리뉴클레오티드의 Cas9-결합 서열과 상호작용하는 능력을 유지하는 한 상기 폴리펩타이드는 사이트-특이적 방법으로 여전히 타겟 DNA에 결합할 수 있다
일부 경우에 있어서, 적합한 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은, WO2013/176772(참조로 인용됨)의 도 3 및 서열 번호 8에 도시된 바와 같이,(화농연쇄상구균(Streptococcus pyogenes)의) Cas9/Csnl 아미노산 서열의 7-166 또는 731-1003 아미노산과 최소한 약 75%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 95%, 최소한 약 99% 또는 100%의 아미노산 동일성을 가지는 아미노산 서열; 또는 WO2013/176772(참조로 인용됨)의 서열 번호 1-256 및 795-1346의 아미노산 서열들 중 어느 하나에 해당하는 부분들, 바람직하기로는 화농연쇄상구균(S. pyogenes), 수막염균(N. meningitidis), 유산균(S. thermophilus) 및 티 덴티콜라(T. denticola)(Esvelt et al., Nature Methods, 10(11): 1116-1121, 2013, 참조로 인용) 참조)의 직교성(orthogonal) Cas9 서열의 아미노산 서열들 중 어느 하나에 해당하는 것을 포함할 수 있다.
일부 경우에 있어서, 상기 Cas9 틈내기 효소는 상기 타겟 DNA의 상보적 가닥을 절단할 수 있으나 상기 타겟 DNA의 비상보적 가닥을 절단하는 능력은 감소될 수 있다. 예를 들면, 상기 Cas9 틈내기 효소는 상기 RuvC 영역의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다. 비제한적 예에 있어서, 일부 경우에 있어서, 상기 Cas9 틈내기 효소는 WO2013/176772의 도 3에 도시된 아미노산 서열의 D10A(아스파르트산염(aspartate)의 알라닌으로의) 돌연변이거나 또는 WO2013/176772의 서열 번호 1-256 및 795-1346(참조로 인용된 모든 이들 서열들)에 기재된 아미노산 서열들 중 어느 하나의 해당 돌연변이일 수 있다.
일부 경우에 있어서, 상기 Cas9 틈내기 효소는 상기 타겟 DNA의 비상보적 가닥을 절단할 수 있으나 상기 타겟 DNA의 상보적 가닥을 절단하는 능력은 감소될 수 있다. 예를 들면, 상기 Cas9 틈내기 효소는 상기 HNH 영역(RuvC/HNH/RuvC 영역 모티프들)의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다. 비제한적 예에 있어서, 일부 경우에 있어서, 상기 Cas9 틈내기 효소는 H840A(WO2013/176772의 서열 번호 8의 아미노산 위치 840에서 히스티딘의 알라닌으로의 돌연변이, 참조로 인용) 또는 WO2013/176772의 서열 번호 1-256 및 795-1346(참조로 인용된 모든 이들 서열들)에 기재된 아미노산 서열들 중 어느 하나의 해당 돌연변이일 수 있다.
일부 경우에 있어서, 상기 dCas9는 상기 타겟 DNA의 상보적 가닥 및 비상보적 가닥을 모두 절단할 수 있는 능력을 가질 수 있다. 비제한적 예에 있어서, 일부 경우에 있어서, 상기 dCas9는 WO2013/176772의 도 3에 도시된 아미노산 서열의 D10A 및 H840A 돌연변이나 또는 WO2013/176772의 서열 번호 1-256 및 795-1346(참조로 인용된 모든 이들 서열들)을 모두 하버(harbor)할 수 있다.
기타 잔기들은 동일한 효과를 달성하기 위하여 돌연변이될 수 있다(즉, 하나 또는 다른 하나의 뉴클레아제 부분들을 비활성시킴). 비제한적 예에 있어서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986 및/또는 A987(또는 서열 번호 1-256 및 795-1346에 기재된 단백질 중 어느 하나의 해당 돌연변이가 변경(즉, 치환)될 수 있다(Cas9 아미노산 잔기들의 보존에 관련한 추가 정보는 WO2013/176772의 도 3, 5, 11A 및 표 1(참조로 인용된 모든 서열들) 참조 요망). 또한, 알라닌 이외의 다른 돌연변이가 적합할 수도 있다.
일부 경우에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 선택적으로 i) a Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질); 및 b) PUF 영역(하기 기재)에 융합된 파트너와 같거나 다를 수 있는 공유결합된 비상동 폴리펩타이드("융합 파트너"로도 칭함)를 포함하는 융합 폴리펩타이드일 수 있다.
4. PUF 영역(및 선택적 Cas9) 융합 단백질들
PUF 단백질들(Drosophila Pumilio 및 C. elegans fern-3 결합 인자를 따라 명명됨)은 mRNA 안정성 및 번역의 중개 과정에 관련된 것으로 알려져 있다. 이들 단백질은 PUF 영역으로 알려진 유일한 RNA-결합 영역을 가진다. 인간 Pumilio 1 단백질(PUM으로도 알려짐)의 것과 같은 RNA-결합 PUF 영역은 단일 염기를 인식하는 각 반복(repeat)(즉, PUF 반복 R1 내지 R8은 각각 N8 내지 N1을 인식함)과 역평행 방법으로 연속된 염기들과 결합하는 8 반복(각 반복은 PUF 모티프 또는 PUF 반복)을 포함한다. 예를 들면, PUM은 8 개의 탠덤 반복으로 구성되며, 각 반복은 알파 나선들로 구성된 꽉 채워진 영역으로 접혀지는 34 개 아미노산으로 구성된다.
각 PUF 반복은 RNA 인식 서열 내의 하나의 개별 염기의 에지(edge)를 특이적으로 인식하기 위하여 각 반복의 중앙으로부터 2 개의 보존된 아미노산을 사용하고 인접 염기들 사이에서 적층하기 위해 제 3 아미노산(Tyr, His 또는 Arg)을 사용하여, PUF 영역 및 8-mer RNA 사이에 매우 특이적 결합을 야기시킨다. 예를 들면, 염기 U를 인식하는 코드는 아미노산 서열 "NYxx"인 반면, "(C/S)RxxQ"는 A를 인식하고 "SNxxE"는 G를 인식한다. 이들 아미노산은 인간 Pumilio 1 단백질 모티프의 위치 12, 13 및 16에 해당한다. 각 PUF α-α-α반복에 있는 위치 12 및 16의 아미노산 측쇄의 2 개의 인식 아미노산은 해당 염기의 Watson-Crick 에지를 인식하고 상기 반복의 특이성을 대체로 결정한다.
따라서, 상기 PUF 영역의 서열 특이성은 상기 RNA 인식 서열 내의 염기 인식에 관여하는 상기 보존된 아미노산(예, 부위 특이적 돌연변이)을 변경함으로써 정밀하게 변화될 수 있다. 각 반복에 있는 2 개의 아미노산을 변경함으로써, PUF 영역은 거의 모든 임의의 8 뉴클레오티드 RNA 서열과 결합할 수 있다. 이러한 독특한 결합 모드는 본 발명에서 사용될 수 있는 PUF 및 이의 유도체를, 임의의 이펙터 영역을 대상 폴리뉴클레오티드 상의 특정 PBS에 가져올 수 있는 PUF 영역-융합의 일부로서, 프로그램할 수 있는 RNA-결합 영역으로 만들 수 있다.
본 발명에서, "PUF 영역"는 프로토타입(prototype) 인간 Pumilio 1 PUF 영역과 같은 자연적 또는 기존의 PUF 영역을 기초로 하거나 /이로부터 유도된 PUF 동족체(homologue) 영역뿐만 아니라 야생형 또는 자연에 존재하는 PUF 영역을 의미한다. 본 발명의 PUF 영역은 RNA 서열(예, an 8-mer RNA 서열)에 특이적으로 결합하며, 여기서 상기 PUF 영역 및 상기 RNA 서열 사이의 전체적 결합 특이성은 상기 PUF 영역 및 해당 단일 RNA 뉴클레오티드 내의 각 PUF 모티프/PUF 반복 사이의 서열 특이 결합에 의해 정의된다.
특정 구현예에 있어서, 상기 PUF 영역은 8 개의 PUF를 포함하거나 이들로 필수적으로 구성되며, 각각은 하나의 RNA 뉴클레오티드(예, A, U, G, 또는 C)를 특이적으로 인식하여 결합한다.
출원인은 특이 PBS에 결합할 수 있는 65,536 8-mer PBS 및 이들의 PUF 영역 서열들(각각 약 350 개의 아미노산 길이)를 제작하였다. 출원인은 또한 주어진 8-mer PBS에 결합하는 65,536 개의 개별적 PUF 영역 서열 중 어느 하나를 검색할(retrieve) 수 있는 파이썬 스크립트(python script)를 제작하였다.
특정 구현예에 있어서, 상기 PUF 영역은 대략 8 개의 PUF 모티프/반복을 가질 수 있다. 예를 들면, 상기 PUF 영역은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,16, 또는 그 이상의 PUF 반복/모티프를 포함하거나 이들로 필수적으로 구성되며, 상기 PUF 영역이 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 그 이상의 뉴클레오티드의 RNA에 결합하는 한, 이들의 각각은 하나의 RNA 뉴클레오티드(예, A, U, G, 또는 C)를 특이적으로 인식하여 결합한다. PUF 모티프의 수를 증가 또는 감소시킴으로써, 인식된 RNA의 길이를 상응하게 증가 또는 감소시킬 수 있다. 각 PUF 모티프는 하나의 RNA 염기를 인식하므로, 상기 영역의 하나의 모티프를 감소시킴으로써 하나의 염기에 의해 인식된 RNA의 길이를 감소시키며, 상기 영역의 하나의 모티프를 증가시킴으로써 하나의 염기에 의해 인식된 RNA의 길이를 증가시킨다. 임의의 숫자의 모티프가 존재할 수 있다. 따라서, 이러한 구현예에 있어서, 상기 본 발명의 PUF 영역-융합들의 특이성은 PUF 영역의 길이의 변경에 따라 변화될 수 있다. 특정 구현예에 있어서, 상기 추가적 PUF 모티프들은 오리지널 PUF 모티프 2 개 사이에 삽입된다; 예, 첫 번째 이전, 첫 번째와 두 번째 사이, 두 번째와 세 번째 사이, 세 번째와 네 번째 사이, 네 번째와 다섯 번째 사이, 다섯 번째와 여섯 번째 사이, 여섯 번째와 일곱 번째 사이, 일곱 번째와 여덟 번째 사이, 또는 8 번째 이후. 특정 구현예에 있어서, 1, 2, 3, 4, 5, 6, 7, 8, 또는 그 이상의 PUF 모티프가 임의의 삽입 지점들 사이에 삽입될 수 있다. 예를 들면, 특정 구현예에 있어서, 1, 2, 3, 4, 5, 6, 7, 8, 또는 그 이상의 PUF 모티프가 상기 다섯 번째 및 여섯 번째 오리지널 PUF 모티프 사이에 삽입될 수 있다. Filipovska et al.(Nature Chemical Biology doi: 10.1038/NChemBio.577, published online: 15 may 2011)는 상기 다섯 번째 및 여섯 번째 오리지널 PUF 모티프 사이에 삽입된 8 개의 추가 PUF 모티프를 포함하는, 16개의 PUF 모티프를 가지는 조작된 PUF 영역을 보고한 바 있다.
특정 구현예에 있어서, 상기 PUF 영역은 상이한 단백질들의 상이한 PUF 영역들로부터의 PUF 모티프를 포함할 수 있다. 예를 들면, 본 발명의 PUF 영역은 상기 인간 Pumilio 1 단백질의 PUF 모티프들 및 PuDp 또는 FBF과 같은 하나 또는 그 이상의 다른 PUF 단백질로부터의 하나 또는 그 이상의 다른 PUF 모티프로 제작될 수 있다. PUF 영역의 RNA 결합 포켓들은 자연적인 오목 곡률을 가진다. 상이한 PUF 단백질은 상이한 곡률을 가질 수 있으므로, PUF 영역의 상이한 PUF 모티프들은 상기 PUF 영역의 곡률을 변화시키는 데 사용될 수 있다. 평평한 곡률은 더 많은 RNA 염기들을 인식가능하게 하므로, 곡률을 변화시키는 것은 상기 PUF 영역의 특이성 및/또는 결합 친화력을 변화시키는 또 다른 방법이 될 수 있다.
또한 상기 대상 PUF 영역들의 기능적 변이체들 및 이의 융합체들 역시 본 발명의 범위에 포함된다. 본 발명에서 사용된 용어 "기능적 변이체(기능적 변이체)"는 모(parent) PUF 영역의 생물학적 활성을 유지하며 모(parent) PUF 영역과 실질적으로 또는 상당한 서열 동일성 또는 유사성을 가지는 PUF 영역(예; 결합력에 있어서 타겟 RNA를 인식하는 능력이 모(parent) PUF 영역과 유사하거나, 동일하거나, 또는 더 높거나 및/또는 모(parent) PUF 영역과 실질적으로 동일하거나 동등한 결합 특이성을 가진 PUF 영역)으로서 모(parent) PUF 영역의 변이체인 PUF 영역을 의미한다. 상기 기능적 변이체 PUF 영역은, 예를 들면, 모(parent) PUF 영역과 아미노산 서열에 있어서 최소한 약 30%, 50%, 75%, 80%, 90%, 98% 또는 그 이상 동일할 수 있다. 상기 기능적 변이체 PUF 영역은, 예를 들면, 최소한 하나의 아미노산 치환을 가지는 모(parent) PUF 영역의 아미노산 서열, 예를 들면, PUF 영역의 발판(scaffold)에서의 보존된 아미노산 치환(즉, 상기 RNA와 상호작용을 하지 않는 아미노산들)을 포함한다. 또는 추가적으로, 상기 기능적 변이체는 최소한 하나의 비보존적 아미노산 치환을 가지는 모(parent) PUF 영역과 아미노산 서열을 포함할 수 있다. 이 경우, 상기 비보존적 아미노산 치환은 상기 기능적 변이체의 생물학적 활성을 방해하거나 저해하지 않는 것이 바람직하다. 상기 비보존적 아미노산 치환은 상기 기능적 변이체의 생물학적 활성이 모(parent) PUF 영역과 대비하여 증가되거나 또는 상기 PUF 영역의 안정성을 원하는 수준까지 변화시킬 수 있도록 상기 기능적 변이체의 생물학적 활성을 증진시킬 수 있다(예, 발판에서의 아미노산의 치환에 기인함). 상기 PUF 영역은 구체화된 아미노산 서열이나 또는 이하 기재된 서열들(예, 상기 기능적 변이체의 생물학적 활성을 중대하게 변화시키지 않는 다른 아미노산들)을 필수적으로 하여 구성될 수 있다.
특정 구현예에 있어서, 상기 PUF 영역은 Pumilio homology 영역(PU-HUD)일 수 있다. 특정 구현예에 있어서, 상기 PU-HUD은 인간 Pumilio 1 영역일 수 있다. 상기 인간 PUM의 서열은 당업계에 공지되어 있으며 하기와 같이 재생될 수 있다:
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
상기 야생형(wt) 인간 PUM은 코어 8-뉴클레오티드 서열 5'-UGUAUAUA-3'를 포함하는 나노스 반응 요소(Nanos Response Element(NRE)) RNA에 특이적으로 결합한다.
특정 구현예에 있어서, 본 발명의 상기 PUF 영역은 Pum-HD 영역을 가지는 임의의 PUF 단백질 패밀리 구성원일 수 있다. PUF 단백질 패밀리 구성원의 비제한적 예는 C. elegans의 FBF, 초파리(Drosophila)의 Ds pum 및 애기장대(Arabidopsis) 및 쌀과 같은 식물의 PUF 단백질들일 수 있다. 상기 애기장대(Arabidopsis), 쌀 및 기타 식물 및 비식물 종 PUM-HD의 계통수(phylogenetic tree)는 Tam et al.("The Puf family of RNA-binding proteins in plants: phylogeny, structural modeling, activity and subcellular localization.” BMC Plant Biol. 10:44, 2010, 그 전체 내용은 본원에서 참조로 결합됨)에 제공되어 있다.
PUF 패밀리 구성원들은 효모로부터 인간에 이르기까지 고도로 보존되어 있으며, 상기 패밀리의 모든 구성원들은 예측가능한 코드에 의하여 서열 특이적 방법으로 RNA에 결합한다. 상기 영역의 접수 번호는 Prosite 데이터 베이스(Swiss Institute of Bioinformatics) 상의 PS50302 이며 상기 패밀리의 구성원들 중 일부의 서열 정렬은 WO 2011-160052 A2의 도 5 및 6((사람, 생쥐, 쥐 Pumilio 1의 ClustalW 멀티플 서열 정렬(hpum1, Mpum1, Ratpum1) 및 인간 및 생쥐 Pumilio 2(hpum2, Mpum2))에 각각 도시되어 있다.
초파리(Drosophila) Pumilio(PumDr)은 다른 포유류 Pumilio 1 동족체들과 그 길이에 있어서 매우 달라서 단지 C-말단 PUF HUD 영역만이 WO 2011-160052 A2의 도 6에 인간 PUM1 및 PUM2와 서열 정렬되어 있다. 인간 및 파리 Pum 단백질의 N-말단 부분은 상동성이 낮음(40% 유사성)을 보여주며 크기 및 단백질 서열에 있어서 상당히 차이가 있음을 보여 준다. 상기 C-말단은 Pum RNA-결합 영역에 대하여 고도로 보존된 단백질 서열 및 구조를 가지며, 매우 높은 상동성 및 진화적 보존률(PUM1에 대하여 78% 동일성 및 86% 유사성 및 PUM2에 대하여 79% 동일성 및 88% 유사성)을 보이고 있다. 세 단백질 모두에 있어서, PUM-HD는 20 아미노산으로 이루어진 N-말단 보존 부분, 각각 36개 아미노산으로 이루어진 8개의 Pum 반복 및 C-말단 보존 부위로 구성되어 있다. 인간 Pumilio 단백질에 있어서, 상기 C-말단 보존 부분은 44 개 아미노산의 길이로 되어 있는 반면, 초파리(Drosophila) 단백질은 C-말단 보존 부위에 85 개의 추가적 아미노산 삽입체를 포함한다. 상기 뉴클레오티드 및 아미노산 서열은 접수 번호 F315592(PUM1) 및 AF315591(PUM2)(Spassov & Jurecic, “Cloning and comparative sequence analysis of PUM1 and PUM2 genes, human members of the Pumilio family of RNA-binding proteins,” Gene, 299:195-204, October 2002,(발표 및 서열들) 각각은 본원에 참조로 결합됨)로 DDBJ/EMBL/GENBANK®데이터 베이스에서 찾을 수 있다.
추가로, 모든 정렬된 서열들, 즉 WO 2011/160052A2의 서열번호 55-60,은 본원에 참조로 결합된다.
일부 구현예에 있어서, 본 발명의 상기 PUF 영역은 8 개의 36 mers로 구성될 수 있으며, 이 중 33 개의 아미노산은 보존되어 있으며 34 번째, 35 번째 및 36 번째 아미노산들은 변할 수 있으며 이로 인해 RNA 서열 상의 특정 염기에 대한 특이성을 부여할 수 있다. 특정 구현예에 있어서, 상기 RNA 결합 영역은 그 길이가 약 300(예, 310, 309, 308, 307, 306, 305, 304, 303, 302, 301, 300, 299, 298, 297, 296, 295, 294, 293, 292, 291, 290 등) 아미노산일 수 있다. 일부 구현예에 있어서, 본 발명의 상기 PUF 영역은 약 8 뉴클레오티드(예, 8-16 연속적 RNA 염기)의 특정 RNA 서열에 결합되도록 디자인되어 있을 수 있다. 특정 구현예에 있어서, 상기 8 뉴클레오티드 서열의 5 번째 뉴클레오티드는 U 또는 C이며 나머지 7 뉴클레오티드는 변할 수 있다.
일부 구현예에 있어서, 상기 PUF 영역은 야생형(wt) PUF 영역으로부터 변형되지 않은 변형되지 않은(즉, 야생형) RNA 결합 PUF 영역에 의해 결합된 RNA 서열과 상이한 RNA 서열에 결합되도록 변형될 수 있다. 상기 RNA 서열은 약 8mer(예, an 8mer, 9 mer, 10mer, 11mer, 12mer, 13mer, 14mer, 15mer, 16mer 등). 타겟 RNA 서열에 대한 특이성을 변화시키기 위하여 상기 RNA 결합 영역의 아미노산 서열로 변형을 유도하는 능력은 상기 RNA 결합 영역(예, PUF 단백질들)의 상이한 아미노산 측쇄들을 가지는 염기들의 공지된 상호작용을 바탕으로 한다. 상기 PUF 영역의 RNA 인식 코드는 하기에 도시되어 있으며 일반적으로 하기와 같이 기재될 수 있다:
SNxxE와 같은 SerXXXGlu는 G(구아닌);
CysArgXXGln 또는 SerArgXXGln와 같은 CysXXXGln(즉,(C/S)RxxQ)는 A(아데닌);
NYxxQ와 같은 AsnXXXGln는 U(우라실), 및
SerTyrXXArg와 같은 SnXXXArg는 C(사이토신).
상기에서 X는 임의의 아미노산이고, Sn은 Gly, Ala, Ser, Thr, 또는 Cys와 같은 작거나 친핵성 잔기를 나타낸다.
상기 가이드라인을 토대로, 최소한 하나의 PUF 영역은 임의의 제시된 8-mer 서열에 기초하여 구성될 수 있다. 구체적으로 5'-N1N2N3N4N5N6N7N8-3'의 8-mer RNA 서열에 결합하는 PUF 영역은 하기 서열 포뮬라를 가질 수 있으며, 여기서 R1 내지 R8 각각은 임의의 N1 내지 N8의 위치에서의 리보뉴클레오티드(즉, A, U, C, 또는 G)의 구체적 아이덴티티에 따라 하기 표에 나열된 PUF 모티프 펩타이드 서열을 나타낸다. R1은 N8에 결합하며 R2는 N7에 결합하는 등이다.
GlyArgSerArgLeuLeuGluAspPheArgAsnAsnArgTyrProAsnLeuGlnLeuArgGluIleAlaGlyHisIleMetGluPheSerGlnAsp[R1]ThrProAlaGluArgGlnLeuValPheAsnGluIleLeuGlnAlaAlaTyrGlnLeuMetValAsp[R2]SerLeuGluGlnLysLeuAlaLeuAlaGluArgIleArgGlyHisValLeuSerLeuAlaLeuGln[R3]ProSerAspGlnGlnAsnGluMetValArgGluLeuAspGlyHisValLeuLysCysValLysAsp[R4]GlnProGlnSerLeuGlnPheIleIleAspAlaPheLysGlyGlnValPheAlaLeuSerThrHis[R5]LeuProAspGlnThrLeuProIleLeuGluGluLeuHisGlnHisThrGluGlnLeuValGlnAsp[R6]ArgProGluAspLysSerLysIleValAlaGluIleArgGlyAsnValLeuValLeuSerGlnHis[R7]SerArgThrGluArgAlaValLeuIleAspGluValCysThrMetAsnAspGlyProHisSerAlaLeuTyrThrMetMetLysAsp[R8]GluProGlyGlnArgLysIleValMetHisLysIleArgProHisIleAlaThrLeuArgLysTyrThrTyrGlyLysHisIleLeuAlaLysLeuGluLysTyrTyrMetLysAsnGlyValAspLeuGly
N8 뉴클레오티드 | R1 펩타이드 서열 |
A |
GlnHisGly CysArg PheIle Gln LeuLysLeuGluArgAla |
GlnHisGly SerArg PheIle Gln LeuLysLeuGluArgAla | |
C |
GlnHisGly Ser ArgPheIle Arg LeuLysLeuGluArgAla |
GlnHisGly Gly ArgPheIle Arg LeuLysLeuGluArgAla | |
GlnHisGly Ala ArgPheIle Arg LeuLysLeuGluArgAla | |
GlnHisGly Thr ArgPheIle Arg LeuLysLeuGluArgAla | |
GlnHisGly Cys ArgPheIle Arg LeuLysLeuGluArgAla | |
G | GlnHisGly Ser ArgPheIle Glu LeuLysLeuGluArgAla |
U | GlnHisGly Asn ArgPheIle Gln LeuLysLeuGluArgAla |
N7 뉴클레오티드 | R2 펩타이드서열 |
A |
ValPheGly CysArg ValIle Gln LysPhePheGluPheGly |
ValPheGly SerArg ValIle Gln LysPhePheGluPheGly | |
ValPheGly Cys TyrValIle Gln LysPhePheGluPheGly | |
ValPheGly Ser TyrValIle Gln LysPhePheGluPheGly | |
C |
ValPheGly Ser TyrValIle Arg LysPhePheGluPheGly |
ValPheGly Gly TyrValIle Arg LysPhePheGluPheGly | |
ValPheGly Ala TyrValIle Arg LysPhePheGluPheGly | |
ValPheGly Thr TyrValIle Arg LysPhePheGluPheGly | |
ValPheGly Cys TyrValIle Arg LysPhePheGluPheGly | |
G | ValPheGly Ser TyrValIle Glu LysPhePheGluPheGly |
U | ValPheGly AsnTyrValIle Gln LysPhePheGluPheGly |
N6 뉴클레오티드 | R3 펩타이드 서열 |
A |
MetTyrGly CysArg ValIle Gln LysAlaLeuGluPheIle |
MetTyrGly SerArg ValIle Gln LysAlaLeuGluPheIle | |
C |
MetTyrGly Ser ArgValIle Arg LysAlaLeuGluPheIle |
MetTyrGly Gly ArgValIle Arg LysAlaLeuGluPheIle | |
MetTyrGly Ala ArgValIle Arg LysAlaLeuGluPheIle | |
MetTyrGly Thr ArgValIle Arg LysAlaLeuGluPheIle | |
MetTyrGly Cys ArgValIle Arg LysAlaLeuGluPheIle | |
G | MetTyrGly Ser ArgValIle Glu LysAlaLeuGluPheIle |
U | MetTyrGly Asn ArgValIle Gln LysAlaLeuGluPheIle |
N5 뉴클레오티드 | R4 펩타이드 서열 |
A |
GlnAsnGly CysArg ValVal Gln LysCysIleGluCysVal |
GlnAsnGly SerArg ValVal Gln LysCysIleGluCysVal | |
GlnAsnGly Cys HisValVal Gln LysCysIleGluCysVal | |
GlnAsnGly Ser HisValVal Gln LysCysIleGluCysVal | |
C |
GlnAsnGly Ser HisValVal Arg LysCysIleGluCysVal |
GlnAsnGly Gly HisValVal Arg LysCysIleGluCysVal | |
GlnAsnGly Ala HisValVal Arg LysCysIleGluCysVal | |
GlnAsnGly Thr HisValVal Arg LysCysIleGluCysVal | |
GlnAsnGly Cys HisValVal Arg LysCysIleGluCysVal | |
G | GlnAsnGly Ser HisValVal Glu LysCysIleGluCysVal |
U | GlnAsnGly Asn HisValVal Gln LysCysIleGluCysVal |
N4 뉴클레오티드 | R5 펩타이드 서열 |
A |
ProTyrGly CysArg ValIle Gln ArgIleLeuGluHisCys |
ProTyrGly SerArg ValIle Gln ArgIleLeuGluHisCys | |
C |
ProTyrGly Ser ArgValIle Arg ArgIleLeuGluHisCys |
ProTyrGly Gly ArgValIle Arg ArgIleLeuGluHisCys | |
ProTyrGly Ala ArgValIle Arg ArgIleLeuGluHisCys | |
ProTyrGly Thr ArgValIle Arg ArgIleLeuGluHisCys | |
ProTyrGly Cys ArgValIle Arg ArgIleLeuGluHisCys | |
G | ProTyrGly Ser ArgValIle Glu ArgIleLeuGluHisCys |
U | ProTyrGly Asn ArgValIle Gln ArgIleLeuGluHisCys |
N3 뉴클레오티드 | R6 펩타이드 서열 |
A |
GlnTyrGly CysArg ValIle Gln HisValLeuGluHisGly |
GlnTyrGly SerArg ValIle Gln HisValLeuGluHisGly | |
GlnTyrGly Cys TyrValIle Gln HisValLeuGluHisGly | |
GlnTyrGly Ser TyrValIle Gln HisValLeuGluHisGly | |
C |
GlnTyrGly Ser TyrValIle Arg HisValLeuGluHisGly |
GlnTyrGly Gly TyrValIle Arg HisValLeuGluHisGly | |
GlnTyrGly Ala TyrValIle Arg HisValLeuGluHisGly | |
GlnTyrGly Thr TyrValIle Arg HisValLeuGluHisGly | |
GlnTyrGly Cys TyrValIle Arg HisValLeuGluHisGly | |
G | GlnTyrGly Ser TyrValIle Glu HisValLeuGluHisGly |
U | GlnTyrGly Asn TyrValIle Gln HisValLeuGluHisGly |
N2 뉴클레오티드 | R7 펩타이드 서열 |
A |
LysPheAla CysArg ValVal Gln LysCysValThrHisAla |
LysPheAla SerArg ValVal Gln LysCysValThrHisAla | |
LysPheAla Cys AsnValVal Gln LysCysValThrHisAla | |
LysPheAla Ser AsnValVal Gln LysCysValThrHisAla | |
C |
LysPheAla Ser AsnValVal Arg LysCysValThrHisAla |
LysPheAla Gly AsnValVal Arg LysCysValThrHisAla | |
LysPheAla Ala AsnValVal Arg LysCysValThrHisAla | |
LysPheAla Thr AsnValVal Arg LysCysValThrHisAla | |
LysPheAla Cys AsnValVal Arg LysCysValThrHisAla | |
G | LysPheAla Ser AsnValVal Glu LysCysValThrHisAla |
U | LysPheAla Asn AsnValVal Gln LysCysValThrHisAla |
N1 뉴클레오티드 | R8 펩타이드 서열 |
A |
GlnTyrAla CysArg ValVal Gln LysMetIleAspValAla |
GlnTyrAla SerArg ValVal Gln LysMetIleAspValAla | |
GlnTyrAla Cys TyrValVal Gln LysMetIleAspValAla | |
GlnTyrAla Ser TyrValVal Gln LysMetIleAspValAla | |
C |
GlnTyrAla Ser TyrValVal Arg LysMetIleAspValAla |
GlnTyrAla Gly TyrValVal Arg LysMetIleAspValAla | |
GlnTyrAla Ala TyrValVal Arg LysMetIleAspValAla | |
GlnTyrAla Thr TyrValVal Arg LysMetIleAspValAla | |
GlnTyrAla Cys TyrValVal Arg LysMetIleAspValAla | |
G | GlnTyrAla Ser TyrValVal Glu LysMetIleAspValAla |
U | GlnTyrAla Asn TyrValVal Gln LysMetIleAspValAla |
변형된 RNA 결합 특이성을 가지는 상기 RNA 인식 코드를 토대로 제작된 몇몇 구현예로서의 PUF 영역들이 하기에 제시되어 있으며, 이들 각각은 본 발명의 PUF 영역-융합체를 제작하는 데 사용될 수 있다.
PUF(3-2)
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
PUF(3-2)는 상기 PUF 반복 3에 2 개의 점 돌연변이(C935S/Q939E)를 가지며 NRE(A6G; 5'-UGUAUGUA-3')의 위치 6에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
PUF(6-2/7-2)
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
PUF(6-2/7-2)는 반복 6 및 7에서 각각 더블 점 돌연변이들(N1043S/Q1047E 및 S1079N/E1083Q)을 가지며 상기 NRE(GU/UG; 5'-UUGAUAUA-3')의 위치 2 및 3에서 2 개의 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
관련 PUF(6-2)는 반복 6에서 점 돌연변이(N1043S/Q1047E)을 가지며 상기 NRE(5'-UGGAUAUA-3')의 위치 3에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
또 다른 관련 PUF(7-2)는 반복 7에서 점 돌연변이(S1079N/E1083Q)을 가지며 상기 NRE(5'-UUUAUAUA-3')의 위치 2에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
PUF
531
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
상기 PUF 영역 PUF531은 야생형 PUF 반복 1, 3 및 5에서 돌연변이들(Q867E/Q939E/C935S/Q1011E/C1007S)를 가지며 상기 서열 5'-UGUGUGUG-3'를 인식한다. 상기 PUF531은 야생형 PUF RNA에 비하여 매우 높은 친화력으로 그의 신규 타겟 서열을 인식할 수 있다.
다른 변형된 PUF 영역 PUF(1-1)는 PUF 반복 1 에서 하나의 점 돌연변이(Q867E)를 가지며 상기 NRE(A8G; 5'-UGUAUAUG-3')의 위치 8에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
또 다른 변형된 PUF 영역 PUF(7-1)는 PUF 반복 7 에서 하나의 점 돌연변이(E1083Q)를 가지며 상기 NRE(G2U; 5'-UUUAUAUA-3'; 또는 G2A; 5'- UAUAUAUA-3')의 위치 2에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
또 다른 변형된 PUF 영역 PUF(3-1)는 PUF 반복 3 에서 하나의 점 돌연변이(C935N)를 가지며 상기 NRE(A6U; 5'-UGUAUUUA-3')의 위치 6에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
또 다른 변형된 PUF 영역 PUF(7-2/3-1)는 PUF 반복 7 및 3에서 점 돌연변이들(C935N/S1079N/E1083Q)을 가지며 상기 NRE(5'-UGUAUUUA-3')의 위치 2 및 6에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.
특정 변형된 PUF 영역들의 서열들은 하기에 표시된 바와 같다.
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Asn Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Asn Arg Val Ile Gln
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
Met Lys Asp Gln Tyr Ala Cys Tyr Val Val Gln Lys Met Ile Asp Val
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
Leu Glu Lys Tyr Tyr
본 발명에 따르면, 비상동 폴리펩타이드("융합 파트너"로도 칭함)는 상기 대상 폴리뉴클레오티드 상의 PBS 중 최소한 하나에 결합하는 본 발명의 상기 PUF 영역에 융합될 수 있다. 또한, 원할 경우에는, 같거나 다른 융합 파트너 역시 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 선택적으로 융합될 수 있다. 따라서, 이하에 기재된 바와 같이, 특히 부정되지 않는 한, 상기 융합 파트너들 중 하나는 PUF 영역에 융합되게 되어 있으며 또한 선택적으로 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합될 수 있다. 상기 PUF 영역에 융합된 상기 융합 파트너는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합된 선택적 융합 파트너와 같거나 다를 수 있다(이하 기재).
상기 융합 파트너는 활성을 나타낼 수 있다(예, 효소 활성). 적합한 융합 파트너들은, 이에 국한되는 것은 아니지만, 메틸트랜스퍼라제 활성, 디메틸라제 활성, 아세틸트랜스퍼라제 활성, 디아세틸라제 활성, 키나제 활성, 포스포타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴 활성, 아데닐레이션 활성, 디아데닐레이션 활성, SUMO화(SUMOylating) 활성, 탈SUMO화(deSUMOylating) 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화(myristoylation) 활성, 또는 탈미리스토일화(demyristoylation) 활성을 제공하며, 이들 중 임의의 하나는 DNA를 직접 변형하는 데(예, DNA 메틸화) 또는 DNA-관련 폴리펩타이드(예, 히스톤 또는 DNA 결합 단백질)를 변형하는 곳으로 유도될 수 있다.
단백질 이름 | 기능 |
전사 활성제 | |
GAL4 | 전사 활성화 |
VP16 | 전사 활성화 |
VP64 | 전사 활성화 |
p65 하부 영역(NFkB) | 전사 활성화 |
전사 리프레서 | |
KRAB | 전사 리프레션 |
Mad mSIN3 상호작용 영역(SID) | 전사 리프레션 |
ERF 리프레서 영역(ERD) | 전사 리프레션 |
히스톤 라이신 메틸트랜스퍼라제(KMT) | |
KMT1 패밀리: SUV39H1,SUV39H2, G9A, ESET/SETDB1, 및 동족체들(Clr4, Su(var)3-9) | 헤테로크로마틴 형성/ 전사 리프레션 |
KMT2 패밀리: hSET1A, hSET1B, MLL 1 내지 5, ASH1, 및 동족체들(Trx, Trr, Ash1) | 전사 활성화 |
KMT3 패밀리: SYMD2, NSD1 | 전사 활성화 |
KMT4: DOT1L 및 동족체들 | 전사 활성화 |
KMT5 패밀리: Pr-SET7/8, SUV4-20H1, 및 동족체들(PR-set7, Suv4-20, Set9) | DNA 손상 반응, 전사 리프레션 |
KMT6: EZH2 | 폴리콤 사일렌싱(polycomb silencing) |
KMT8: RIZ1 | 전사 리프레션 |
히스톤 라이신 디메틸트랜스퍼라제(KDM) | |
KDM1: LSD1/BHC110 및 동족체들 (SpLsd1/Swm1/Saf110, Su(var)3-3) |
전사 활성화 및 전사 리프레션, 헤테로크로마틴 형성 |
KDM3 패밀리: JHDM2a/b | 안드로겐 수용체 유전자 활성화, 정자형성(spermatogenesis) |
KDM4 패밀리: JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, 및 동족체들(Rph1) |
전사 확장, 전사 리프레션, 헤테로크로마틴형성, 게놈 무결성(integrity) |
KDM5 패밀리: JARID1A/RBP2, JARID1B/PLU-1, JARID1C/SMCX, JARID1D/SMCY 및 동족체들(Lid, Jhn2, Jmj2) | 전사 리프레션 |
KDM6 패밀리: UTX, JMJD3 | 전사 활성화 |
단백질 명칭 | 기능 |
히스톤 라이신 아세틸트랜스퍼라제(KAT) | |
KAT2 패밀리; hGCN5, PCAF 및 동족체들(dGCN5/PCAF, Gcn5) | 전사 활성화, DNA 복구 |
KAT3 패밀리;CBP, p300 및 동족체들(dCBP/NEJ) | 전사 활성화, DNA 복구 |
KAT4: TAF1 및 동족체들(dTAF1) | 전사 활성화 |
KAT5: TIP60/PLIP 및 동족체들 | 전사 활성화, DNA 복구 |
KAT6: MOZ/MYST3, MORF/MYST4 및 동족체들(Mst2, Sas3, CG1894) | 전사 활성화 및 확장, DNA 복제 |
KAT7: HBO1/MYST2 및 동족체들 | 전사, DNA 복제 |
KAT8: HMOF/MYST1 및 동족체들(dMOF, CG1894, Sas2, Mst2) | 크로마틴 경계, 복용량 보정, DNA 복구 |
KAT13 패밀리: SRC1, ACTR, P160, CLOCK 및 동족체들 | 전사 활성화 |
히스톤 라이신 디아세틸라제 | |
Class I: HDAC1, HDAC2, HDAC3, HDAC8(및 동족체들(Rpd3, Hos1, Cir6) | 전사 리프레션, 헤테로크로마틴 형성 |
Class IIa: HDAC4, HDAC5, HDAC7,HDAC9 및 동족체들(Hda1, Cir3 등) | 전사 리프레션, 헤테로크로마틴 형성 |
Class III: SIRT1, SIRT2 및 동족체들(Sir2, Hst1, Hst2, Hst3, Hst4) | 전사 리프레션, 헤테로크로마틴 형성 |
Class IV: HDAC11 | 전사 리프레션 |
DNA 메틸라제(아데노신 또는 사이토신 변형) | |
Dam(E. coli) | 제한 시스템(restriction system) |
Dcm(E. coli) | 제한 시스템 |
M. SssI(Spiroplasma sp) | 제한 시스템 |
DNMT1 | 전사 리프레션, 임프린팅, 헤테로크로마틴 형성 |
DNMT3a/DNMT3b. METI, DRM3(식물) 및 동족체들 | 전사 리프레션, 임프린팅, 헤테로크로마틴 형성 |
크로모메틸라제, 예: ZMET2, CMT1, CMT2(식물) | 전사 리프레션, 임프린팅, 헤테로크로마틴 형성 |
DNA 디메틸라제 | |
AID/Apobec 디아미나제 패밀리: AID | 전사 활성화, 게놈 무결성(integrity) |
TET 디옥시게나제 패밀리: TET1 | 전사 활성화, 게놈 무결성 |
DEMETER 글리코실라제 패밀리: DME, DML1, DML2, ROS1 | 전사 활성화, 게놈 무결성 |
단백질 명칭 | 기능 |
경계 요소(Boundary elements) | |
CTCF | 크로마틴 절연, 헤테로크로마틴 스프레딩 억제(chromatin spreading suppression) |
주변 모집 요소(Periphery recruitment elements) | |
Lamin A | 전사 리프레션 |
Lamin B | 전사 리프레션 |
단백질 도킹 요소들(Protein Docking Elements) | |
FKBP/FRB(S. pombe) | 라파마이신 의존형 모집(rapamycin dependent recruitment) |
Pil1/Aby1(E. coli) | ABA 의존형 모집(ABA dependent recruitment) |
추가적 융합 파트너는 GFP, Superfolder GFP, EGFP, BFP, EBFP, EBFP2, Azurite, mKalama1, CFP, ECFP, Cerulean, CyPet, mTurquoise2, YFP, Citrine, Venus, Ypet, BFPms1, roGFP 와 같은 다양한 형광 단백질, 폴리펩타이드, 변이체, 또는 기능적 영역들 및 UnaG, dsRed, eqFP611, Dronpa, TagRFPs, KFP, EosFP, Dendra, IrisFP 등과 같은 빌리루빈-유도가능한 형광 단백질들을 포함할 수 있다.
추가적으로 적합한 융합 파트너들은 주변 모집(periphery recruitment)을 제공하는 경계 요소들(예, CTCF), 단백질 및 단편들 및 단백질 도킹 요소들(예, FKBP/FRB, Pill/Abyl 등)을 포함하나, 이에 제한되지는 않는다.
추가적으로 전사의 증가 또는 감소를 성취하기 위한 융합 파트너의 비제한적인 예는 하기에 기재되어 있으며, 전사 활성 인자 및 전사 억제 인자 영역들(예, Kruppel 관련 박스(KRAB 또는 SKD); Mad mSIN3 상호작용 영역(SID); ERF 리프레서 영역(ERD) 등)을 포함한다.
일부 구현예에 있어서, 상기 비상동 서열은 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 C-말단에 융합될 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 N-말단에 융합될 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 내부의 일부분(N-말단이나 C-말단이 아닌 부분)에 융합될 수 있다.
일부 구현예에 있어서, PUF 영역 융합은 PUF 영역을 세포 내부의 위치화(즉, 상기 비상동 서열은 세포 내부의 위치화 서열; 예, 핵을 타겟팅하기 위한 핵 위치화 신호(PPKKKRKV와 같은 NLS); 미토콘드리아를 타겟팅하기 위한 미토콘드리아 위치화 신호; 엽록체를 타겟팅하기 위한 엽록체 위치화 신호; ER 유지 신호 등)를 위해 제공되는 비상동 서열과 융합함으로써 발생할 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 추적 및/또는 정제를 용이하게 하기 위한 태그(즉, 상기 상동 서열은 검출가능한 표지임)(예, 형광 단백질, 예, 녹색 형광 단백질(GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예, 6×His 태그; 혈구응집소(HA) 태그; FLAG 태그; Myc 태그 등)을 제공할 수 있다. 일부 구현예에 있어서, 안정성을 증가 또는 감소시키기 위해 상기 비상동 서열(즉, 상기 비상동 서열은 안정성 조절 펩타이드임; 온도 민감성 또는 약물 조절가능한 degron 서열, 이하 참조)을 제공할 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 상기 타겟 DNA로부터 전사를 증가 또는 감소시키기 위해 제공할 수 있다(즉, 상기 비상동 서열은 전사 모듈레이션 서열, 예, 전사 인자/ 활성제 또는 이들의 단편, 전사 인자를 모집(recruit)하는 단백질 또는 이의 단편/ 활성제, 전사 억제 인자 또는 이의 단편, 전사 억제 인자를 모집하는 단백질 또는 이의 단편, 소 분자 / 약물반응 전사 조절자 등). 일부 구현예에 있어서, 상기 비상동 서열은 결합 영역(즉, 상기 비상동 서열은 단백질 결합 서열, 예, 다른 관심 단백질(예, DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제 인자, 모집(recruiting) 단백질 등)에 결합하는 키메라 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 능력을 제공할 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 다른 관심 단백질(예, DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제 인자, 모집(recruiting) 단백질 등)에 결합하는 키메라 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 능력을 제공하는 결합 영역을 제공할 수 있다.
증가 또는 감소된 안정성을 제공하기 위한 적합한 융합 파트너는 degron 서열을 포함하나, 이에 국한되는 것은 아니다. 당업자에게 있어서 Degrons은 단백질의 일부로서 그 안정성을 조절하는 아미노산 서열로서 쉽게 이해된다. 예를 들면, degron 서열을 포함하는 단백질의 안정성은 최소한 부분적으로 상기 degron 서열에 의해 조절된다. 일부 경우에 있어서, 적합한 degron은 실험적 조절(즉, 상기 degron 이 약물 유도나 온도 유도가 가능하지 않음 등)과 독립적으로 단백질 안정성에 영향을 미칠 수 있도록 항시성을 가질 수 있다. 일부 경우에 있어서, 상기 degron은 원하는 조건에 따라 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 켜지거나("on", 즉, 안정한) 또는 꺼지도록("off", 즉, 불안정하고 ,분해되는) 조절가능한 안정성을 가지는 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 제공할 수 있다. 예를 들면, 상기 degron이 온도 민감형인 경우, 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 임계 온도(예, 42°C, 41°C, 40°C, 39°C, 38°C, 37°C, 36°C, 35°C, 34°C, 33°C, 32°C, 31°C, 30°C 등) 이하의 온도에서는 기능적(즉, "on", 안정한)일 수 있으나, 상기 임계 온도 이상에서는 비기능적(즉, "off", 분해되는)일 수 있다. 또 다른 예로서, 상기 degron이 약물 유도성 degron일 경우, 약물의 존재여부는 "off"(즉, 불안정) 상태에서 "on"(즉, 안정한) 상태 또는 그 반대로 해당 단백질을 스위치할 수 있다 일 구현예로서, 상기 약물 유도가능 degron는 상기 FKBP12 단백질에서 유래될 수 있다. 상기 degron의 안정성은 degron에 결합하는 소 분자의 존재 유무에 따라 조절된다.
적합한 degrons의 예로는 Shield-1, DHFR, auxins 및/또는 온도에 의해 조절되는 degrons을 포함하나 이들에 국한되는 것은 아니다. 적합한 degrons의 비제한적 예는 당업계에 공지되어 있다(예, Dohmen et al., Science, 263(5151): 1273-1276, 1994: "Heat-inducible degron: a method for constructing temperature-sensitive mutants"; Schoeber et al., Am. J. Physiol. Renal. Physiol., 296(l):F204-211, 2009: "Conditional fast expression and function of multimeric TRPV5 channels using Shield-1"; Chu et al., Bioorg. Med. Chem. Lett., 18(22): 5941-4, 2008: "Recent progress with FKBP-derived destabilizing domains"; Kanemaki, Pflugers Arch., 2012: "Frontiers of protein expression control with conditional degrons"; Yang et al., Mol. Cell., 48(4):487-8, 2012: "Titivated for destruction: the methyl degron"; Barbour et al., Biosci. Rep., 33(1), 2013: "Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase"; and Greussing et al., J. Vis. Exp.,(69), 2012: "Monitoring of ubiquitin-proteasome activity in living cells using a Degron(dgn)-destabilized green fluorescent protein(GFP)-based reporter protein"; 상기 모두는 인용참증으로서 본원에 포함됨).
구현예로서의 degron 서열들은 그 특성이 잘 알려져 있으며 세포 및 동물에서 모두 시험된 바 있다. 따라서, Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 degron 서열과 융합하면 "조율가능한(tunable)" 및 "유도가능한(inducible)" PUF 영역 또는 Cas9(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 생산할 수 있다.
본 발명에 기재된 융합 파트너 중 임의의 하나를 임의의 원하는 조합으로 사용할 수 있다. 비제한적 예로서는, 각 PUF 영역은 같거나 다른 융합 파트너들에 독립적으로 융합될 수 있고 이들은 상기 대상 폴리뉴클레오티드의 PBS의 시리즈에 임의의 순서로 결합할 수도 있다. 예를 들면, 하나의 PUF 영역은 검출을 위하여 YFP 서열에, 제 2의 PUF 영역은 안정성을 위하여 degron 서열에, 그리고 제 3 PUF 영역은 상기 타겟 DNA의 전사를 증가시키고자 전사 활성 인자 서열에 각각 융합될 수 있다. PUF 영역 융합의 이들 유형 중 임의의 하나는 상기 대상 폴리뉴클레오티드 상에 하나 이상의 결합 사이트 또는 PBS를 가질 수 있다. 상기 PUF 영역 융합에 사용될 수 있는 융합 파트너의 수는 대체로 제한되지 않는다(예, 최소한 2, 5, 10, 20, 30, 40, 50 또는 그 이상).
일부 구현예에 있어서, 임의의 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합 단백질은 하나 또는 그 이상의(예, 둘 또는 그 이상, 셋 또는 그 이상, 넷 또는 그 이상, 또는 다섯 또는 그 이상) 비상동 서열 또는 융합 파트너를 포함할 수 있다.
일부 구현예에 있어서, 임의의 상기 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 PUF 영역 융합은 코돈-최적화 될 수 있다. 이런 유형의 최적화는 당업계에 알려져 있으며 의도된 숙주 유기체의 동일 단백질을 코딩하는 한편 코돈 선호도를 모방하기 위하여 외래 유래 DNA의 돌연변이를 수반한다. 따라서, 상기 코돈들은 변경되지만 코딩된 단백질은 변경되지 않은 채 남게 된다. 예를 들면, 상기 의도된 타겟 세포가 인간 세포라면, 인간 코돈-최적화된 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합은 더욱 적합한 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합이 될 것이다. 다른 비제한적 예로서, 상기 의도된 타겟 세포가 생쥐의 세포라면, 생쥐 코돈-최적화된 PUF 영역 융합 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 적합한 PUF 영역 융합 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 될 것이다. 코돈 최적화가 요구되지는 않지만 이는 수용가능하고 또한 특정 경우에는 선호될 수도 있다.
상기 대상 PUF 영역은 임의의 하나는, 예를 들면, Addgene(Kit # 1000000051)에 제공되는 Golden Gate Assembly 키트(Abil et al., Journal of Biological Engineering 8:7, 2014 참조)를 이용하여 만들 수 있다.
5. 전사 모듈레이션
본 발명의 상기 PUF 영역 및/또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합 단백질은 상기 대상 폴리뉴클레오티드의 상기 DNA-타겟팅 서열에 의해 상기 타겟 DNA에 있는 특정 위치(즉, 타겟 폴리뉴클레오티드 서열)에 타겟팅되어 RNA 폴리머라제가(선택적으로 전사 활성 인자 기능을 저해하는) 프로모터에 결합하는 것을 차단하거나 및/또는 국소적 크로마틴 상태를 변형하는(예, 융합 서열이 상기 타겟 DNA를 변형하거나 또는 상기 타겟 DNA와 관련된 폴리펩타이드를 변형하는 데 사용되는 경우) 것과 같이 좌위-특이적 조절을 하게 된다.
일부 경우에 있어서, 상기 변경들은 일시적 일 수 있다(예, 전사 리프레션 또는 활성화). 일부 경우에 있어서, 상기 변경들은 유전되는 것일 수 있다(예, 후성적 변형들은 상기 타겟 DNA 또는 상기 타겟 DNA와 관련된 단백질들(예, 뉴클레오솜 히스톤)에 만들어진다
대상 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합 단백질을 이용하는 방법의 생물학적 효과들은 임의의 편리한 방법(예, 유전자 발현 분석법: 크로마틴-기초 분석법들, 예, Chromatin immunoPrecipitation(ChiP), Chromatin in vivo Assay(CiA) 등; 등)으로 검출될 수 있다.
일부 경우에 있어서, 대상 방법은 둘 또는 그 이상의 상이한 DNA-타겟팅 서열을 사용할 수 있다. 예를 들면, 2 개의 상이한 DNA-타겟팅 서열을(2 개의 상이한 DNA-타겟팅 서열이 동일 타겟 핵산에서 2 개의 상이한 DNA-타겟팅 서열을 타겟하는) 단일 숙주 세포에서 사용할 수 있다. 따라서, 예를 들면, 대상 전사 모듈레이션 방법은 추가로 상기 숙주 세포에 제 2 DNA-타겟팅 서열, 또는 상기 제 2 DNA-타겟팅 서열을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 도입하는 것을 포함할 수 있다. 일부 경우에 있어서, 동일한 타겟 핵산 내에서 2 개의 상이한 타겟팅 서열을 타겟팅하는 2 개의 상이한 DNA-타겟팅 서열을 사용하면 상기 타겟 핵산의 전사에서 증가된 모듈레이션(예, 감소 또는 증가)을 제공하게 된다.
또 다른 예로서, 2 개의 상이한 타겟팅 서열은 2 개의 상이한 DNA-타겟팅 서열이 2 개의 상이한 타겟 핵산을 타겟하는 단일 숙주 세포에서 사용할 수 있다.
따라서, 특정 구현예에 있어서, 본 발명의 전사 모듈레이션 방법은 숙주 세포에서 타겟 핵산의 선택적 모듈레이션(예, 감소 또는 증가)을 제공할 수 있다. 예를 들면, 타겟 핵산 전사의 "선택적" 감소는 상기 타겟 핵산의 전사를 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 타겟 핵산의 전사 수준과 비교하여, 최소한 약 10%, 최소한 약 20%, 최소한 약 30%, 최소한 약 40%, 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 90%, 또는 90% 이상 감소될 수 있다. 타겟 핵산의 전사의 선택적 감소는 상기 타겟 핵산의 전사를 감소시키지만 비타겟 핵산의 전사를 실질적으로 감소시키지는 않는다(예; 비타겟 핵산의 전사가 감소된다 하더라도 상기 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 비타겟 핵산의 전사 수준과 비교하여 10% 미만이 감소됨).
반면에, "선택적" 타겟 DNA의 증가된 전사는, 상기 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 타겟 DNA의 전사 수준과 비교하여, 상기 타겟 DNA의 전사를 최소한 약 1.1 배(예, 최소한 약 1.2 배, 최소한 약 1.3 배, 최소한 약 1.4 배, 최소한 약 1.5 배, 최소한 약 1.6 배, 최소한 약 1.7 배, 최소한 약 1.8 배, 최소한 약 1.9 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 3.5 배, 최소한 약 4 배, 최소한 약 4.5 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 12 배, 최소한 약 15 배, 또는 최소한 약 20-배) 증가시킬 수 있다. 타겟 DNA의 전사의 선택적 증가는 상기 타겟 DNA의 전사를 증가시키지만 비타겟 DNA의 전사를 실질적으로 증가시키지는 않는다(예; 비타겟 핵산의 전사가 증가된다 하더라도 상기 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 비타겟 DNA의 전사 수준과 비교하여 약 5 배 미만(약 4 배 미만, 약 3 배 미만, 약 2 배 미만, 약 1.8 배 미만, 약 1.6 배 미만, 약 1.4 배 미만, 약 1.2 배 미만, 또는 약 1.1 배 미만)이 감소됨).
비제한적 예로서, 증가된 전사는 dCas9을 상기 비상동 서열네 융합시키거나 및/또는 상기 비상동 서열을 상기 대상 폴리뉴클레오티드의 PBS에 결합하는 상기 PUF 영역들 중 하나에 융합시킴으로써 성취할 수 있다. 적합한 융합 파트너는 상기 타겟 DNA 또는 상기 타겟 DNA와 관련된 폴리펩타이드(예, 히스톤 또는 기타 DNA-결합 단백질)에 직접 작용함으로써 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩타이드를 포함하나, 이에 국한되는 것은 아니다. 적합한 융합 파트너는 메틸트랜스퍼라제 활성, 디메틸라제 활성, 아세틸트랜스퍼라제 활성, 디아세틸라제 활성, 키나제 활성, 포스포타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴 활성, 아데닐레이션 활성, 디아데닐레이션 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩타이드를 포함하나, 이에 국한되는 것은 아니다.
추가로 적합한 융합 파트너는 상기 타겟 핵산의 증가된 전사를 직접 제공하는 폴리펩타이드(예, 전사 활성 인자 또는 이의 단편, 전사 활성 인자를 모집(recruit)하는 단백질 또는 이의 단편, 소 분자/약물-반응적 전사 조절 인자 등)를 포함하나, 이에 국한되는 것은 아니다. "PUF 영역(및 선택적 dCas9) 융합 단백질" 섹션 참조 요망.
원핵동물에서 전사를 증가시키기 위하여 dCas9 융합 단백질 및/또는 PUF 영역-융합 단백질을 사용하는 대상 방법의 비제한적 예로는 박테리아 1-하이브리드(B1H) 또는 2-하이브리드(B2H) 시스템의 변형을 포함한다. 상기 B1H 시스템에서는, DNA 결합 영역(BD)은 박테리아 전사 활성화 영역(AD, 예, E. coli RNA 폴리머라제(RNAPα)의 alpha 서브유닛)에 융합된다. 따라서, 대상 dCas9 또는 PUF 영역은 AD를 포함하는 비상동 서열에 융합될 수 있다. 상기 대상 dCas9 또는 PUF 영역 융합 단백질이(상기 DNA-타겟팅 서열에 의해 그 곳으로 타겟된) 프로모터의 상류 지역에 도달하면, 상기 dCas9 또는 PUF 영역 융합 단백질의 AD(예, RNAPα)는 상기 RNAP holo효소를 모집(recruit)하여 전사의 활성화에 이르게 된다. 상기 B2H 시스템 에서는, 상기 BD가 상기 AD에 직접 융합되지 않고 대신 이들의 상호작용이 단백질-단백질 상호작용(예, GAL11P-GAL4 상호작용)에 의해 매개된다. 이러한 대상 방법들에서 이러한 시스템을 변형하기 위해서, dCas9 또는 PUF 영역을 단백질-단백질 상호작용(예, 효모 GAL11P 및/또는 GAL4 단백질)을 제공하는 제 1 단백질 서열에 융합될 수 있으며, RNAPα는 상기 단백질-단백질 상호작용(예, GAL11P이 dCas9 또는 PUF 영역에 융합되어 있으면 GAL4, GAL4 이 dCas9 또는 PUF 영역에 융합되어 있으면 GAL11P 등)을 완성하는 제 2 단백질 서열에 융합될 수 있다. 상기 GAL11P 및 GAL4 사이의 결합력은 결합 및 전사율의 효율을 증가시킨다.
진핵동물에서 전사를 증가시키기 위하여 dCas9 및/또는 PUF 영역-융합 단백질을 사용하는 대상 방법의 비제한적 예로는 dCas9 및/또는 PUF 영역을 활성화 영역(예, GAL4, 헤르페스 바이러스(herpesvirus) 활성 단백질 VP16 또는 VP64, 인간 핵 인자 NF-κΒ p65 서브유닛 등)에 융합하는 것을 포함한다. 상기 시스템을 유도성으로 하기 위해, 상기 dCas9 / PUF 영역 융합 단백질의 발현은 유도성 프로모터(예, Tet-ON, Tet-OFF 등)에 의해 조절될 수 있다. 상기 DNA-타겟팅 서열은 공지된 반응 요소들(예, 프로모터들, 인핸서들 등), 공지된 상류 활성화 서열들(UAS), 상기 타겟 DNA의 발현을 조절할 수 있을 것으로 예상되는 미공지 또는 공지의 기능의 서열들 등을 타겟하도록 디자인할 수 있다.
일부 구현예에 있어서, 동일한 타겟 DNA 또는 상이한 타겟 DNA 상에 있는 상이한 위치에서의 전사를 동시에 모듈레이트하기 위해 복수 개의 대상 폴리뉴클레오티드가 동일 세포에서 동시에 사용될 수 있다. 일부 구현예에 있어서, 2 개 또는 그 이상의 대상 폴리뉴클레오티드는 동일한 유전자 또는 전사체 또는 좌위를 타겟할 수 있다. 일부 구현예에 있어서, 2 개 또는 그 이상의 대상 폴리뉴클레오티드는 상이한 관련 없는 좌위를 타겟할 수 있다. 일부 구현예에 있어서, 2 개 또는 그 이상의 대상 폴리뉴클레오티드는 상이한 관련된 좌위를 타겟할 수 있다.
상기 대상 폴리뉴클레오티드들은 작고 강하기 때문에, 이들은 동일 발현 벡터에 동시에 존재할 수 있고 또한 원할 경우 동일 전사 조절 하에 있을 수도 있다. 일부 구현예에 있어서, 2 개 또는 그 이상(예, 3 또는 그 이상, 4 또는 그 이상, 5 또는 그 이상, 10 또는 그 이상, 15 또는 그 이상, 20 또는 그 이상, 25 또는 그 이상, 30 또는 그 이상, 35 또는 그 이상, 40 또는 그 이상, 45 또는 그 이상, 또는 50 또는그 이상)의 대상 폴리뉴클레오티드는 동일하거나 상이한 벡터들로부터 타겟 세포에서 동시에 발현될 수 있다. 상기 발현된 대상 폴리뉴클레오티드는 S화농연쇄상구균(S. pyogenes), 유산균(S. thermophilus), 리스테리아균(L. innocua) 및 수막염균(N. meningitidis)과 같은 상이한 박테리아의 직교형 dCas9 단백질들에 의해 다르게 인식될 수 있다.
복수의 대상 폴리뉴클레오티드를 발현하기 위하여, Csy4 엔도리보뉴클레아제에 의해 매개되는 인공 RNA 처리 시스템을 사용할 수 있다. 복수 개의 대상 폴리뉴클레오티드는 전구체 전사체(precursor transcript)(예, U6 프로모터에서 발현) 상에 탠덤 배열로 연쇄될 수 있고 Csy4-특이적 RNA 서열에 의해 분리될 수 있다. 공발현된(co-expressed) Csy4 단백질은 상기 전구체 전사체를 복수의 대상 폴리뉴클레오티드로 절단한다. RNA 처리 시스템의 사용상 잇점은 다음과 같다: 첫째, 복수의 프로모터 또는 벡터를 사용할 필요가 없고; 둘째, 모든 대상 폴리뉴클레오티드들이 전구체 전사체로부터 처리되므로, 이들의 농도는 유사한 야생형(wt) Cas9 / Cas9 틈내기 효소 / dCas9-결합을 위해 정규화된다.
Csy4 는 박테리아 Pseudomonas aeruginosa로부터 유래된 작은 엔도리보뉴클레아제(RNase) 단백질이다. Csy4 는 최소한 17-bp RNA 머리핀을 특이적으로 인식하며 RNA 절단을 신속하게(1분 이내) 그리고 고효율적(>99.9)으로 처리한다. 대부분의 RNases와 달리, 상기 절단된 RNA 단편은 안정한 채로 유지되며 기능적으로 활성을 가진다. 상기 Csy4-기초의 RNA 절단은 인공 RNA 처리 시스템으로 용도가 변경될 수 있다. 이러한 시스템에서, 상기 17-bp RNA 머리핀은 단일 프로모터의 전구체 전사체로 전사되는 복수의 RNA 단편들 사이에 삽입된다. Csy4의 공발현은 개개 RNA 단편들을 제조하는 데 효과적이다.
6. 숙주 세포들
본 발명의 전사를 모듈레이트하는 방법은 유사분열 또는 유사분열 후 세포에서 생체 내(in vivo) 및/또는 생체 외(ex vivo) 및/또는 실험실 내(in vitro) 방법으로 전사 모듈레이션을 유도하는 방법을 사용할 수 있다. 상기 대상 폴리뉴클레오티드는 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 하이브리드 함으로써 특이성을 제공하므로, 유사분열 및/또는 유사분열 후 세포는 다양한 숙주 세포 중 임의의 하나 일 수 있고, 여기서 적합한 숙주 세포는 박테리아 세포; 고세균 세포(archaeal cell); 단세포 진핵 유기체; 식물세포; 조류 세포(예; 보트리오코쿠스 브라우니(Botryococcus braunii), 녹조류(Chlamydomonas reinhardtii), 미세조류(Nannochloropsis gaditana), 클로렐라- 피레노이도사(Chlorella pyrenoidosa), 쌍발이 모자반(Sargassum patens), 갈조류(C. agardh) 등; 진균 세포; 동물 세포; 무척추 동물 세포(예, 곤충, 자포동물(cnidarian), 극피동물, 선충(nematode) 등); 진핵세포 기생충(예, 말라리아 기생충, 예, 열대말라리아열원충(Plasmodium falciparum); 기생충(helminth); 등); 척추동물 세포(예, 어류, 양서류, 파충류, 조류, 포유류); 포유류 세포(예, 설치류 세포, 인간 세포, 비인간 영장류 세포 등)을 포함하나, 이에 국한되는 것은 아니다. 적합한 숙주세포는 자연발생적 세포들; 유전적으로 변형된 세포들(예, 실험실에서 유전적으로 변형된 세포들, 예, "사람 손으로"); 및 실험실에서 임의의 방법으로 조작된 세포들을 포함할 수 있다. 일부 경우에 있어서, 숙주 세포는 단리 또는 배양된 것일 수 있다.
임의의 유형의 세포가 관심의 대상이 될 수도 있다(예, 줄기 세포, 예; 배아줄기세포, 유도만능줄기세포, 생식세포; 체세포, 예; 섬유아세포, 조혈세포, 신경세포, 근육세포, 뼈세포, 간세포, 췌장세포; 임의의 시기의 실험실 내 또는 생체 내 배아의 배아 세포, 예, 1-세포, 2-세포, 4-세포, 8-세포,등 제브라 피시 배아; 등). 세포들은 확립된 세포주(established cell lines) 또는 1차 배양된 세포들(primary cells)일 수 있으며, 여기서 "1차 배양된 세포(primary cell)", "1차 세포주(primary cell line)" 및 "1차 배양물(primary cultures)"은 대상으로부터 유래된 것으로서 제한된 계대 수의 기간 동안 실험실 내에서 배양이 허용되는 세포 및 세포 배양물을 의미한다(즉, 배양액의 분리물(splittings, of the culture)). 예를 들면, 1차 배양물은 0 회, 1 회, 2 회, 4 회, 5 회, 10 회 계대 배양한 배양물을 포함하나 위기 시기(crisis stage)를 충분한 횟수로 경험한 것을 의미하지는 않는다. 1차 세포주는 실험실 내에서 10 회 미만의 계대 배양을 거친 세포를 의미한다. 타겟 세포는 많은 구현예에서 단세포 유기체이거나 배양으로 성장한 세포를 의미한다.
상기 세포가 1차 세포라면, 이들 세포는 임의의 편리한 방법으로 개체로부터 수득된 것일 수 있다. 예를 들면, 백혈구 세포는 분리반출법(apheresis), 백혈구 분리반출법(leukocytapheresis), 밀도기울기분리(density gradient separation) 등에 의해 수득될 수 있으며, 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등의 조직으로부터 수득한 세포는 부검을 통하여 가장 간편하게 수득할 수 있다. 적합한 용액은 수득된 세포의 분산 및 현탁에 사용될 수 있다. 이러한 용액은 일반적으로 저농도(예, 5-25 mM)의 수용가능한 완충액과 같이 소태아 혈청 또는 기타 자연발생적 인자들을 간편하게 공급한 균형된 염 용액(예; 생리 식염수, 인산염 완충 식염수, HBSS(Hank's Balanced Salt Solution) 등일 수 있다. 간편한 완충액은 HEPES, 인산염 완충액, 젖산 완충액 등을 포함한다. 이들 세포는 즉시 사용하거나 또는 저장, 장기간 냉동 후, 해동 및 재사용 할 수 있다. 이러한 경우에, 이들 세포는 10% 디메틸 설폭사이드(DMSO), 50% 혈청, 40% 완충 배지, 또는 기타 상기 냉동 온도에서 세포 보존을 위해 당업계에서 통상 사용하거나 냉동된 배양 세포들을 해동하기 위하여 당업계에서 사용하는 용액들에 냉동될 수 있다.
7. 핵산의 숙주 세포로의 도입
대상 폴리뉴클레오티드, 이를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 또는 상기 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 다양한 공지의 방법들 중 임의의 방법을 사용하여 숙주 세포로 도입할 수 있다.
핵산을 숙주 세포로 도입하는 방법들은 당업계에 공지되어 있으며, 핵산(예, 벡터 또는 발현 작체물)을 줄기 세포 또는 간세포(progenitor cell)에 도입하기 위해 임의의 공지된 방법을 사용할 수 있다. 적합한 방법들로서, 바이러스 또는 박테리오파지 감염, 형질감염, 컨쥬게이션, 원형질체 융합, 리포펙션(lipofection), 전기천공, 칼슘 인산염 침전, 폴리에틸렌이민(polyethyleneimine;PEI)-매개 형질감염, DEAE-dextran 매개 형질감염, 리포좀-매개 형질감염, 입자총(particle gun) 기술, 칼슘 인산염 침전, 직접 마이크로 주사(direct micro injection), 나노입자-매개 핵산 전달(참조, 예, Panyam et al., Adv. Drug Deliv. Rev., pii: S0169-409X(12)00283-9.doi:10.1016 / j.addr.2012.09.023) 등을 포함한다.
따라서, 본 발명은 또한 대상 폴리뉴클레오티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공한다. 일부 경우에 있어서, 대상 핵산은 또한 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열을 포함할 수 있다.
일부 구현예에 있어서, 대상 방법은 대상 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 숙주 세포(또는 숙주 세포군)에 도입하는 것을 포함한다. 일부 구현예에 있어서, 타겟 DNA를 포함하는 숙주 세포는 실험실에서 수행한다. 대상 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 적합한 핵산은 발현 벡터를 포함하며, 여기서 상기 발현 벡터는 재조합 발현 벡터일 수 있다.
일부 구현예에 있어서, 상기 재조합 발현 벡터는 바이러스 작체물(예, 재조합 아데노-관련 바이러스 작체물(참조, 예, 미국 특허 제 7,078,387호), 재조합 아데노 바이러스 작체물, 재조합 렌티바이러스 작체물, 재조합 레트로 바이러스 작체물 등)일 수 있다.
적합한 발현 벡터는 바이러스 벡터들(예; 백신 바이러스를 기초로 한 바이러스 벡터들; 폴리오 바이러스; 아데노 바이러스(참조, 예, Li et al., Invest Opthalmol. Vis. Sci., 35:2543-2549, 1994; Borras et al., Gene Ther., 6:515-524, 1999; Li and Davidson, Proc. Natl. Acad. Sci. USA, 92:7700-7704, 1995; Sakamoto et al., Hum. Gene Ther., 5:1088-1097, 1999; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984 및 WO 95/00655); adeno-associated virus(참조, 예, Ali et al., Hum. Gene Ther., 9:81-86, 1998, Flannery et al., Proc. Natl. Acad. Sci. USA, 94:6916-6921, 1997; Bennett et al., Invest Opthalmol Vis Sci 38:2857-2863, 1997; Jomary et al., Gene Ther., 4:683-690, 1997, Rolling et al., Gene Ther., 10:641-648, 1999; Ali et al., Hum. Mol. Genet., 5:591-594, 1996; Srivastava in WO 93/09239, Samulski et al., J. Vir., 63:3822-3828, 1989; Mendelson et al., Virol., 166: 154-165, 1988; and Flotte et al., Proc. Natl. Acad. Sci. USA, 90: 10613-10617, 1993); SV40; herpes simplex virus; human immunodeficiency virus 참조, 예, Miyoshi et al., Proc. Natl. Acad. Sci. USA, 94: 10319-23, 1997; Takahashi et al., J. Virol., 73:7812-7816, 1999); 레트로 바이러스 벡터(예, 생쥐 백혈병 바이러스(murine leukemia virus), 비장괴사 바이러스(spleen necrosis virus) 및 라우스 육종 바이러스(Rous Sarcoma Virus), 하비 육종 바이러스(Harvey Sarcoma Virus), 조류 백혈병 바이러스(avian leukosis virus), 렌티 바이러스, HIV 바이러스, 골수증식성 육종 바이러스(myeloproliferative sarcoma virus) 및 유방암 바이러스(mammary tumor virus); 등을 포함하나, 이에 국한되는 것은 아니다.
수많은 적합한 발현 벡터들이 당업계에 알려져 있으며 이 중 많은 벡터들이 상업적으로 이용 가능하다. 하기 벡터들을 그 예로 제공한다: 진핵 숙주 세포용; pXTl, pSG5(Stratagene), pSVK3, pBPV, pMSG및 pSVLSV40(Pharmacia). 그러나, 기타 다른 벡터들도 상기 숙주 세포와 호환이 가능한한(compatible) 사용 가능하다.
활용되는 숙주/벡터 시스템에 따라서, 항시성 및 유도성 프로모터들, 전사 인핸서 요소들, 전사 종결자 등을 포함한 많은 적합한 전사 및 번역 조절 요소들을 발현 벡터에서 사용할 수도 있다 (참조, 예, Bitter et al., Methods in Enzymology, 153:516-544, 1987).
일부 구현예에 있어서, 대상 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열은 조절 요소에 작동가능하게 연결된다(프로모터와 같은 전사 조절 요소). 상기 전사 조절 요소는 진핵세포(예; 포유류 세포) 또는 원핵세포(예; 박테리아 또는 고균세포(archaeal cell))에서 기능적일 수 있다. 일부 구현예에 있어서, 대상 폴리뉴클레오티드및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열은, 원핵세포 및 진핵세포 모두에서, 상기 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 상기 뉴클레오티드 서열의 발현을 허용하는 복수 개의 조절 요소들에 작동가능하게 연결될 수 있다.
프로모터는 항시성 활성 프로모터(즉, 항시적으로 활성화/"on" 상태에 있는 프로모터)이거나, 유도성 프로모터(즉, 활성화/"on" 상태 또는 비활성화/"off" 상태가 외부 자극에 의해 조절되는 프로모터, 예; 특정 온도, 화합물, 또는 단백질의 존재 여부)이거나, 공간적으로 제한된 프로모터(즉, 전사 조절 요소, 인핸서 등, 예; 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이거나, 일시적으로 제한된 프로모터(즉, 배아 발달의 특정 시기 또는 생물학적 과정의 특정 시기(예; 생쥐의 모낭 주기(hair follicle cycle)동안 "on" 또는 "off" 상태에 있는 프로모터)일 수 있다.
적합한 프로모터들은 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로 불릴 수 있거나, 또는 원핵 또는 진핵 유기체들로부터 유래될 수도 있다. 적합한 프로모터들은 임의의 RNA 폴리머라제(예, pol I, pol II, pol III)에 의해 발현을 이끌어 내는 데 사용될 수 있다. 예시적 프로모터로는 SV40 조기 프로모터(SV40 early promoter), 생쥐 유방암 종양 바이러스(mouse mammary tumor virus) long terminal repeat(LTR) promoter; 아데노 바이러스 주요 후기 프로모터(adenovirus major late promoter; Ad MLP); 단순포진 바이러스 프로모터(herpes simplex virus(HSV) promoter), CMV 즉시 조기 프로모터 부위(CMV immediate early promoter region(CMVIE))와 같은 거대세포 바이러스 프로모터(cytomegalovirus(CMV) promoter), 라우스 육종 바이러스 프로모터(rous sarcoma virus(RSV) promoter), 인간 U6 소핵 프로모터(human U6 small nuclear promoter(U6))(Miyagishi et al., Nature Biotech., 20:497-500, 2002), 증강된 U6 프모모터 (예, Xia et al., Nucleic Acids Res., 31(17):e100, 2003), 인간 HI 프로모터 (HI) 등을 들 수 있으나, 이에 국한되는 것은 아니다.
유도성 프로모터의 예로는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-beta-D-티오갈락토피라노시드(IPTG)-조절된 프로모터, 젖산 유도성 프로모터, 열 충격(heat shock) 프로모터, 테트라사이클린-조절된 프로모터(예, Tet-ON, Tet-OFF 등), 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 들 수 있으나, 이에 국한되는 것은 아니다. 유도성 프로모터는 따라서 이에 한정되지는 않으나 독시사클린; T7 RNA 폴리머라제와 같은 RNA 폴리머라제; 에스트로겐 수용체; 에스트로겐 수용체 융합(fusion)을 포함하나, 이에 한정되지 않는 분자에 의해 조절될 수 있다.
일부 구현예에 있어서, 상기 프로모터는 다세포 유기체에서 상기 프로모터가 특정 세포들의 서브 세트(subset)에서 활성을 가지도록(즉, "ON") 공간적으로 제한된 프로모터(즉, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)일 수 있다. 공간적으로 제한된 프로모터는 인핸서, 전사 조절 요소, 조절 서열 등으로 불리울 수도 있다. 임의의 편리한 공간적으로 제한된 프로모터를 사용할 수 있으며 상기 적합한 프로모터의 선택(예, 뇌 특이적 프로모터, 신경세포의 서브세트에서 발현을 이끌어 내는 프로모터, 생식세포주에서 발현을 이끌어 내는 프로모터, 폐에서 발현을 이끌어 내는 프로모터, 근육에서 발현을 이끌어 내는 프로모터, 췌장의 췌도에서 발현을 이끌어 내는 프로모터 등)은 유기체에 따라 다르다. 예를 들면, 다양한 공간적으로 제한된 프로모터들이 식물, 파리, 벌레, 포유류, 생쥐 등에서 알려져 있다. 따라서, 공간적으로 제한된 프로모터는 유기체의 종류에 따라 매우 다양한 상이한 조직 및 세포 유형에서 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 PUF 영역 융합체를 코딩하는 핵산의 발현을 조절하는 데 사용될 수 있다. 일부 공간적으로 제한된 프로모터들 또한 일시적으로 제한된 프로모터(즉, 배아 발달의 특정 시기 또는 생물학적 과정의 특정 시기(예; 생쥐의 모낭 주기(hair follicle cycle)동안 "on" 또는 "off" 상태에 있을 수 있다.
설명의 목적상, 공간적으로 제한된 프로모터들의 예로서 신경세포-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포(cardiomyocyte)-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함할 수 있으나, 이에 국한되는 것은 아니다. 신경세포-특이적 공간적으로 제한된 프로모터들의 예로서 신경세포-특이적 에놀라아제(NSE) 프로모터(참조, 예, EMBL HSEN02, X51956); 방향족 아미노산 디카르복실라제(AADC) 프로모터; 신경미세섬유(neurofilament) 프로모터(참조, 예, GenBank HUMNFL, L04147); 시냅신(synapsin) 프로모터(참조, 예, GenBank HUMSYNIB, M55301); thy-1 promoter(참조, 예, Chen et al., Cell, 51:7-19, 1987; and Llewellyn et al., Nat. Med., 16(10): 1161-1166, 2010); 세라토닌 수용체 프로모터(참조, 예, GenBank S62283); 티로신 히드록실라제 프로모터(TH)(참조, 예, Oh et al., Gene Ther., 16:437, 2009; Sasaoka et al., Mol. Brain Res., 16:274, 1992; Boundy et al., Neurosci., 18:9989, 1998; and Kaneda et al., Neuron, 6:583-594, 1991); GnRH 프로모터(참조, 예, Radovick et al., Proc. Natl. Acad. Sci. USA, 88:3402-3406, 1991); L7 프로모터(참조, 예, Oberdick et al., Science, 248:223-226, 1990); DNMT 프로모터(참조, 예, Bartge et al., Proc. Natl. Acad. Sci. USA, 85:3648-3652, 1988); 엔케팔린(enkephalin) 프로모터(see, 예, Comb et al., EMBO J., 17:3793-3805, 1988); 수초 염기성 단백질(myelin basic protein; MBP) 프로모터; Ca2+-칼모듈린 의존성 단백질 키나제 II-alpha(CamKIIa) 프로모터(참조, 예, Mayford et al., Proc. Natl. Acad. Sci. USA, 93: 13250, 1996; and Casanova et al., Genesis, 31:37, 2001); CMV 인핸서 / 혈소판 유래 성장인자-β 프로모터(참조, 예, Liu et al., Gene Therapy, 11:52-60, 2004); 등을 포함할 수 있으나, 이에 국한되는 것은 아니다.
지방세포-특이적 공간적으로 제한된 프로모터들의 예로서 P2 유전자 프로모터/인핸서, 예, 인간 P2 유전자의 -5.4 kb 에서 +21 bp 부위(참조, 예, Tozzo et al., Endocrinol. 138: 1604, 1997; Ross et al., Proc. Natl. Acad. Sci. USA, 87:9590, 1990; and Pavjani et al., Nat. Med., 11 :797, 2005); 글루코스 트랜스포터-4(GLUT4) 프로모터(참조, 예, Knight et al., Proc. Natl. Acad. Sci. USA, 100: 14725, 2003); 지방산 트란스로카제(FAT/CD36) 프로모터(참조, 예, Kuriki et al., Biol. Pharm. Bull., 25: 1476, 2002; and Sato et al., Biol. Chem. 277: 15703, 2002); 스테아로일-CoA 불포화효소-1(SCD1) 프로모터(Tabor et al., Biol. Chem. 274:20603, 1999); 렙틴(leptin) 프로모터(참조, 예, Mason et al., Endocrinol. 139: 1013, 1998; and Chen et al., Biochem. Biophys. Res. Comm., 262: 187, 1999); 아디포넥틴(adiponectin) 프로모터(참조, 예, Kita et al., Biochem. Biophys. Res. Comm., 331 :484, 2005; and Chakrabarti, Endocrinol. 151:2408, 2010); 아디스핀(adipsin) 프로모터(참조, 예, Piatt et al., Proc. Natl. Acad. Sci. USA, 86:7490, 1989); 레지스틴(resistin) 프로모터(참조, 예, Seo et al., Molec. Endocrinol., 17: 1522, 2003); 등을 포함할 수 있으나, 이에 국한되는 것은 아니다.
심근세포(cardiomyocyte)-특이적 공간적으로 제한된 프로모터들의 예로서 하기 유전자들로부터 유래된 조절 서열들(미오신(myosin) 경쇄-2, 미오신(myosin) 중쇄, AE3, 심장 트로포닌 C(cardiac troponin C), 심장 액틴(cardiac actin) 등. Franz et al., Cardiovasc. Res., 35:560-566, 1997; Robbins et al., Ann. N.Y. Acad. Sci., 752:492-505, 1995; Linn et al., Circ. Res., 76:584-591, 1995; Parmacek et al., Mol. Cell. Biol., 14:1870-1885, 1994; Hunter et al., Hypertension, 22:608-617, 1993; and Sartorelli et al., Proc. Natl. Acad. Sci., 89:4047-4051, 1992))을 포함할 수 있으나, 이에 국한되는 것은 아니다.
평활근-특이적 공간적으로 제한된 프로모터들의 예로서 SM22a promoter(참조, 예, Akyurek et al., Mol. Med., 6:983, 2000; 및 미국특허 제 7,169,874호); 스무셀린(smoothelin) 프로모터(참조, 예, WO 2001/018048); 평활근 액틴(actin) 프로모터; 등을 포함할 수 있으나, 이에 국한되는 것은 아니다. 예를 들면, 2 개의 CArG 요소들이 놓여 있는 SM22a 프로모터의 0.4 kb 부위는 혈관 평활근 세포-특이적 발현을 매개함을 보여 주었다(참조, 예, Kim et al., Mol. Cell. Biol., 17:2266-2278, 1997; Li et al., J. Cell Biol., 132:849-859, 1996; and Moessler et al., Development, 122:2415-2425, 1996).
광수용체-특이적 공간적으로 제한된 프로모터들의 예로서 로돕신(rhodopsin) 프로모터; 로돕신(rhodopsin) 키나제 프로모터(Young et al., Ophthalmol . Vis . Sci., 44:4076, 2003); 베타 포스포디에스테라제(βphosphodiesterase) 유전자 프로모터(Nicoud et al., Gene Med., 9: 1015, 2007); 망막색소 변색증(retinitis pigmentosa) 유전자 프로모터(Nicoud et al., 2007, 상기 기재); 광수용체 간 레티노이드(interphotoreceptor retinoid)-결합 단백질(IRBP) 유전자 인핸서(Nicoud et al.(2007) 상기 기재); IRBP 유전자 promoter(Yokoyama et al., Exp. Eye Res., 55:225, 1992); 등을 포함할 수 있으나, 이에 국한되는 것은 아니다.
8. 라이브러리
본 발명은 또한 상기 대상 폴리뉴클레오티드서열들의 다수 또는 라이브러리 또는 이를 코딩하는 벡터들의 다수 또는 라이브러리를 제공한다. 후자는 상기 대상 폴리뉴클레오티드를 코딩하는 뉴클레오티드들을 포함하는 재조합 발현 벡터들의 라이브러리를 포함할 수 있다.
대상 라이브러리는 약 10 내지 약 1012 개별 멤버(individual member)를 포함할 수 있으며, 예를 들면, 대상 라이브러리는 약 10 내지 약 102 개별 멤버, 약 102 내지 약 103 개별 멤버, 약 103 내지 약 105 개별 멤버, 약 105 내지 약 107 개별 멤버, 약 107 내지 약 109 개별 멤버, 약 109 내지 약 1012 개별 멤버를 포함할 수 있다.
특정 구현예에 있어서, 상기 벡터들 중 2 개는 이들의 각 DNA-타겟팅 서열의 코딩된 폴리뉴클레오티드들, Cas9-결합 서열들 및/또는 카피 수, 동질성(identity)(예, 서열, 또는 결합 특이성), 또는 PBS의 관련 순서에 있어서 차이가 있을 수 있다.
예를 들면, 특정 구현예에 있어서, 대상 라이브러리의 "개별 멤버(individual member)"는 상기 대상 폴리뉴클레오티드의 DNA-타겟팅 서열의 뉴클레오티드 서열에서의 라이브러리의 다른 멤버들과 다를 수 있다. 따라서, 대상 라이브러리의 각 개별 멤버는 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 Cas9-결합 서열의 뉴클레오티드 서열을 포함할 수 있고, 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 PBS의 뉴클레오티드 서열을 포함할 수 있으나, 상기 대상 폴리뉴클레오티드의 DNA-타겟팅 서열의 뉴클레오티드 서열에서의 라이브러리의 다른 멤버들과는 다를 수 있다. 이런 식으로, 상기 라이브러리는 동일한 타겟 유전자 또는 상이한 타겟 유전자 상에 있는 상이한 타겟 폴리뉴클레오티드 서열들에 결합하는 멤버들을 포함할 수 있다.
관련 구현예에 있어서, 상기 라이브러리의 멤버들은 상이한 DNA-타겟팅 서열들이 상이한 PBS와 관련되며, 상이한 타겟 DNA 들이 독립적으로 조절될 수 있다는 점 [예; 일부 타겟 유전자들은 전사적으로 활성화되고(또한 제 1 형광색에 의해 선택적으로 표지됨) 다른 타겟 유전자들은 전사적으로 리프레스되며(또한 제 2 형광색에 의해 선택적으로 표지됨]에서 차이가 있을 수 있다.
특정 구현예에 있어서, 대상 라이브러리의 개별 멤버는 상기 대상 폴리뉴클레오티드의 Cas9-결합 서열의 뉴클레오티드 서열에서 상기 라이브러리의 다른 멤버들과 차이가 있을 수 있다. 따라서, 예를 들면, 대상 라이브러리의 개별 멤버는 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 DNA-타겟팅 서열의 뉴클레오티드 서열을 포함할 수 있고; 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 PBS의 뉴클레오티드 서열을 포함할 수 있으나, 상기 대상 폴리뉴클레오티드의 Cas9-결합 서열의 뉴클레오티드 서열에서 상기 라이브러리의 다른 멤버들과 차이가 있을 수 있다. 이런 식으로, 상기 라이브러리는 다른 종(species)으로부터의 상이한 직교형(orthogonal) Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 결합하는 멤버들을 포함하여 동일 숙주 세포에서 별도로 유사하게(parallelly) 조절가능한 시스템을 허용할 수 있다.
기타 특정 구현예에 있어서, 대상 라이브러리의 개별 멤버는 상기 대상 폴리뉴클레오티드의 PBS의 뉴클레오티드 서열에서 상기 라이브러리의 기타 멤버들과 다를 수 있다. 따라서, 예를 들면, 대상 라이브러리의 개별 멤버는 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 DNA-타겟팅 서열의 뉴클레오티드 서열을 포함할 수 있고; 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 Cas9-결합 서열의 뉴클레오티드 서열을 포함할 수 있으나, 상기 대상 폴리뉴클레오티드의 PBS의 뉴클레오티드 서열에서 라이브러리의 기타 멤버들과는 다를 수 있다.
9. 사용 구현예
본 발명에 따른 전사를 모듈레이팅하는 방법은 연구, 진단, 산업, 및 치료를 포함한 다양한 응용 분야에서 사용될 수 있다.
연구 분야의 응용은 예를 들면 발달, 대사, 하류의 유전자의 발현 등 타겟 핵산의 전사를 감소 또는 증가시키는 효과를 결정하는 것을 포함할 수 있다.
고속(high through-put) 게놈 분석은 상기 Cas9-결합 서열 및 PBS는(일부 경우에 있어서) 일정하게 유지되는 반면 오직 상기 대상 폴리뉴클레오티드만 변경할 필요가 있는 대상 전사 모듈레이션 방법을 사용하여 수행할 수 있다. 게놈 분석에 사용되는 다수의 핵산을 포함하는 라이브러리(예, 대상 라이브러리)는 대상 폴리뉴클레오티드를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함할 수 있으며, 여기서 각 핵산은 상이한 DNA-타겟팅 서열, 통상의 Cas9-결합 서열 및 통상의 PBS를 포함할 수 있다. 한 개의 칩은 본 발명의 독특한 폴리뉴클레오티드를 5 × 104 이상 포함할 수 있다.
응용은 대규모 표현형 결정(phenotyping), 유전자-기능-매핑(gene-to-function mapping) 및 메타 게놈 분석을 포함할 수 있다.
이하 본 발명에 개시된 대상 방법들은 대사 공학(metabolic engineering) 분야에서 사용될 수도 있다. 전사 수준은 이하 개시된 바와 같이 적절한 DNA-타겟팅RNA를 디자인함으로써 효율적 및 예측가능하게 조절될 수 있으므로, 대사 경로들(예, 생화학적 경로들)은 세밀하게 조절될 수 있으며, 관심 대사 경로 내에서 특정 효소들의 수준을 조절(예, 증가 또는 감소된 전사)함으로써 조율될 수 있다.
관심 대사 경로들은 화학물질(정밀화학, 연료, 항생제, 독소, 작용제(agonists), 길항제(antagonists) 등) 및/또는 약물 생산에 사용되는 것을 포함할 수 있다. 관심 생화학적 경로들은 (1)메발론산염 경로(예, HMG-CoA 리덕타제 경로)(아세틸-CoA를 테르페노이드/이소프레노이드를 포함하는 광범위한 생분자들의 생합성에 사용되는 디메틸알릴 피로포스페이트(DMAPP) 및 이소펜테닐 피로포스페이트(IPP)로 전환시킴, (2)비메발론산염 경로(즉, "2-C-메틸-D-에리쓰리톨 4-포스페이트/l-디옥시-D-자일루로오스 5-포스페이트 경로" 또는 "MEP/DOXP 경로" 또는 "DXP 경로")(또한 피루빈산 및 글리세르알데하이드 3-포스페이트를 상기 메발론산염 경로에 대한 대체 경로로서 DMAPP 및 IPP로 전환함으로써 DMAPP 및 IPP를 생산함), (3)폴리케티드(polyketide) 합성 경로(다양한 폴리케티드 합성 효소를 사용하여 다양한 폴리케티드를 생산함. 폴리케티드는 자연에 존재하는 화학요법(예; 테트라사이클린 및 마크로라이드)에 사용되는 소분자들을 포함하며 산업상 중요한 폴리케티드는 라파마이신(면역억제제), 에리쓰로마이신(항생제), 로바스타틴(항콜레스테롤 약물) 및 에포틸론 B(항암제),(4) 지방산 합성 경로, (5) DAHP(3-디옥시-D-아라비노-헵툴로소나테 7-포스페이트) 합성 경로, (6) 잠재적 바이오 연료 생산 경로들 (단쇄 알코올 및 알칸, 지방산 메틸 에스터 및 지방 알코올, 이스프레노이드 등) 등을 포함하나, 이에 국한되는 것은 아니다.
본 발명에 개시된 방법들은 또한 통합된 조절 네트워크를 디자인하는데 사용될 수 있다 (즉, 케스케이드 또는 케스케이드들). 예를 들면, 대상 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체는 다른 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체의 조절(즉, 모듈레이트, 예; 증가 또는 감소)에 사용될 수 있다. 예를 들면, 제 1 대상 폴리뉴클레오티드는 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 제 1 PUF 영역 융합(예, 메틸트랜스퍼라제 활성, 디메틸라제 활성, 아세틸트랜스퍼라제 활성, 디아세틸라제 활성 등)와 다른 기능을 가지는 PUF 영역 융합체의 모듈레이션을 타겟하는데 디자인될 수 있다. 또한, 상이한 Cas9 단백질들(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)(예, 다른 종으로부터 유래된 것)은 상이한 Cas9 handle(즉, Cas9-결합 서열)을 필요로 할 수 있고, 상기 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 제 1 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)와 다른 종으로부터 유래될 수 있다. 따라서, 일부 경우에 있어서, 상기 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 제 1 대상 폴리뉴클레오티드와 상호작용하지 않도록 선택될 수 있다. 다른 경우에 있어서, 상기 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 제 1 대상 폴리뉴클레오티드와 상호작용하도록 선택될 수 있다. 이러한 몇몇 경우에 있어서, 상기 두(또는 그 이상의) Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체들은 경쟁하거나(예, 상기 폴리펩타이드가 상반된 활성을 가지는 경우) 또는 상승시킬 수 있다(예, 상기 폴리펩타이드들이 유사하거나 상승적 활성을 가지는 경우). 마찬가지로, 상기에서 언급된 바와 같이, 네트워크 상의 상기 복합체들 중 임의의 하나(즉, 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체)는 다른 폴리뉴클레오티드/ Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체)를 조절할 수 있도록 디자인 될 수 있다. 대상 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체는 임의의 원하는 DNA 서열에 타겟될 수 있으므로, 본 발명에 기재된 방법들은 임의의 원하는 타겟의 발현을 조절 및 조율하는데 사용될 수 있다. 아주 단순한 복합체로부터 매우 복잡한 복합체에 이르기까지 디자인될 수 있는 상기 통합된 네크워크(즉, 상호작용의 케스케이드들)은 그 제한이 없다.
둘 또는 그 이상의 성분들(예, 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체)이 각각 다른 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합 복합체의 조절 하에 있는 네트워크에 있어서, 상기 네트워크의 하나의 성분의 발현 수준은 상기 네트워크의 다른 성분의 발현 수준에 영향(예, 상기 발현을 증가 또는 감소시킴)을 미칠 수 있다. 상기 메카니즘을 통하여, 하나의 성분의 발현은 동일 네트워크 상의 다른 성분의 발현에 영향을 미칠 수 있고, 상기 네트워크는 다른 성분들의 발현을 감소시키는 성분들 뿐 아니라 다른 성분들의 발현을 증가시키는 성분들이 혼합되어 있을 수 있다. 당업자라면 쉽게 이해할 수 있는 바와 같이, 하나의 성분의 발현 수준이 하나 또는 그 이상의 다른 성분(들)에 영향을 미칠 수 있음을 보여 주는 상기 구현예들은 제한적 의도가 아니라 설명을 목적으로 제시된 것이다. 조작을 위하여 (즉, 실험조절 하, 예, 온도 조절 하; 약물 조절 하, 즉, 약물 유도성 조절; 경미한 조절 등) 하나 또는 그 이상의 성분이 변형된 경우, 추가적 계층의 복잡성이 네트워크에 선택적으로 도입될 수도 있다.
하나의 비제한적 예로서, 제 1 대상 폴리뉴클레오티드는 타겟 치료적/대사성 유전자를 조절하는 제 2 대상 폴리뉴클레오티드의 프로모터에 결합될 수 있다. 이러한 경우, 상기 제 1 대상 폴리뉴클레오티드의 조건적 발현은 간접적으로 치료적/대사성 유전자를 활성화하게 된다. 이러한 유형의 RNA 케스케이드들(예를 들면, 리프레서를 활성제로 쉽게 전환하는 데 유용함)은 타겟 유전자의 발현의 논리(logics)나 역학(dynamics)를 조절하는 데 사용될 수 있다.
대상 전사 모듈레이션 방법은 또한 약물 발굴 및 타겟 검증에 사용될 수도 있다.
10. 키트
본 발명은 또한 대상 방법을 수행하는 키트를 제공한다. 대상 키트는 a) 본 발명의 폴리뉴클레오티드 또는 이를 코딩하는 뉴클레오티드 서열을 포함하는 핵산(예, 벡터); 선택적으로, b) 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 이를(이를 코딩하는 발현가능한 mRNA를 포함하는) 코딩하는 벡터; 및 선택적으로, c) 각각이 상이한 PUF 영역 융합체들 중 같거나 다른 이펙터 영역에 융합된 PUF 영역 또는 이를(이를 코딩하는 발현가능한 mRNA를 포함하는) 코딩하는 벡터를 포함하는 하나 또는 그 이상의 대상 PUF 영역 융합체를 포함할 수 있다.
특정 구현예에 있어서, 하나 또는 그 이상의 a) 내지 c)는 동일 벡터에 의해 코딩될 수 있다.
특정 구현예에 있어서, 상기 키트는 또한 형질전환, 형질감염, 또는 감염용 시약들과 같이 a) 내지 c) 중 어느 하나를 숙주 세포로 도입하는 것을 용이하게 하는 하나 또는 그 이상의 완충액 또는 시약을 포함할 수 있다.
예를 들면, 대상 키트는 하나 또는 그 이상의 추가 시약을 포함할 수 있으며, 이들 하나 또는 그 이상의 시약들은 완충액; 세척 완충액; 조절 시약; 조절 발현 벡터 또는 RNA 폴리뉴클레오티드; 야생형(wt) 또는 dCas9 또는 DNA로부터의 PUF 영역 융합체의 실험실 내 생산용 시약; 등에서 선택될 수 있다.
대상 키트의 성분들은 별도의 용기들; 또는 단일 용기에 혼합될 수 있다.
상기 언급된 성분들 외에도, 대상 키트는 상기 대상 방법들을 구현할 키트의 성분들을 이용하는 지침들을 추가로 포함할 수 있다. 상기 대상 방법들을 구현할 키트의 성분들을 이용하는 지침들은 일반적으로 적합한 기록 매체에 기록된다. 예를 들면, 상기 지침들은 종이나 플라스틱 등의 기재 상에 프린트 될 수 있다. 이와 같이, 상기 지침들은 상기 키트의 용기 또는 이의 성분들(즉, 패키징 또는 서브 패키징) 등을 표지 시 패키지 삽입으로서 키트에 마련될 수 있다. 다른 구현예에 있어서, 상기 지침들은 컴퓨터 기록 가능한 저장 매체(예; CD-ROM, 디스켓, 플래시 드라이브 등)에 전자 저장 데이터 파일로 마련될 수 있다. 또 다른 구현예에 있어서, 실제 지침들은 키트에 마련되는 대신에 원격 소스로부터 지침을 얻는 수단(예; 인터넷 사용)이 제공될 수 있다. 본 구현예의 예로서는 상기 지침들을 볼 수 있거나 및/또는 이로부터 다운로드 받을 수 있는 웹 주소를 포함하는 키트가 있다. 상기 지침과 마찬가지로, 상기 지침을 얻기 위한 이 수단은 적합한 기재 상에 기록될 수 있다.
실시예 1: 47 카피의 조작된 Pumilio 결합 사이트를 삽입함으로 sgRNA 발판(Scaffold)의 기능이 유지됨
본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 dCas9/sgRNA 의 기능에 실질적 영향을 미치지 않으면서 sgRNA의 3' 말단에 최소한 47 카피의 조작된 8-mer Pumilio 동족체 영역-결합 서열들(PBSs)을 가질 수 있음을 보여주고 있다.
특히, 상기 sgRNA의 3' 말단에 PBS의 첨부가 sgRNA의 기능에 영향을 미치는지 여부를 시험하기 위하여, PUF(3-2)(또한 간단히 PUFa로도 칭함)[PBS32 또는 PBSa: 5'-UGUAUgUA-3'], PUF(6-2/7-2)(또한 간단히 PUFb로도 칭함)[PBS6272 또는 PBSb: 5'-UugAUAUA-3']를 위한 8-mer Pumilio 동족체 영역-결합 서열(PBS)을 0 카피, 5 카피, 15 카피, 25 카피 및 47 카피 가지는 일련의 변형된 Tet-타겟팅(sgTetO) 또는 비-타겟팅 대조군(sgControl) sgRNA를 제작하였다 (도 1A 참조). 이들 작체물의 HEK293T/TetO::tdTomato 세포주에서의 tdTomato 발현을 활성화시키는 상기 dCas9-VP64 전사 활성제를 지시하는 능력을 시험하였다.
세포들을 상이한 sgRNA 발판(scaffold)을 가지는 dCas9-VP64로 형질감염하였고 형질감염 2일 후에 형질-활성화된 세포 분리(cell sorting; FACS)를 분석하였다(도 1B). 모든 상기 대조군 비-타겟팅 sgRNA는 tdTomato 발현을 활성화하지 않았다. 한편, 상이한 수의 PBS를 가지는 상기 Tet-타겟팅 sgRNA는 tdTomato 발현을 활성화시키고자 dCas9-VP64를 지시할 수 있었고, 최소한 47 카피의 8-mer 사이트의 삽입은 dCas9-VP64를 이의 타겟으로 지시하는 데 있어서 sgRNA의 활성에 실질적으로 영향을 미치지 않는다(도 1C).
PUFa-VP64/PBSa 및 PUFb-VP64/PBSb 모두를 위한 시험 조건 하에서, 상기 sgRNA에 첨부된 5-10 카피의 PBS는 상기 타겟 전이유전자를 가장 잘 활성화시킬 수 있었다.
한편, 실질적인 전이유전자의 활성화가 있긴 하였지만, 15, 20 및 47 카피의 PBS는 다소 낮은 결과를 보였다(도 1C).
실시예
2
동족(cognate) 8-mer 결합 사이트를 가지는 조작된
Pumilio의
특이성으로 인하여 대상 3-성분
CRISPR
/
Cas
복합체들/시스템들은 상호 직교
성(Orthogonal)임
본 실시예는 상이하게 프로그램된 PUF 영역들 및 동족(cognate) 8-mer 모티프를 가지는 이들의 해당 sgRNA 사이의 특이성이 상기 대상 3-성분 CRISPR/Cas 복합체/시스템 각각 사이에 독립성 또는 직교성(orthogonality)을 제공하는 것을 보여주고 있다.
5'-UGUAUgUA-3'결합 사이트를 가지는 sgRNA(sgRNA-PBS32) 및 5'-UugAUAUA-3'결합 사이트를 가지는 sgRNA-PBS6272와 상호작용하는 PUF(3-2)::VP64 및 PUF(6-2/7-2)::VP64 융합체들을 각각 제작한 후 dCas9과 함께 tdTomato 발현을 켜는 이들의 활성을 시험하였다. 추가로, 2개의 추가 쌍 [PBSw(5'-UGUAUAUA-3')을 인식하는 PUFw-VP64 및 PBSc(5'-UugAUgUA-3')을 인식하는 PUFc-VP64]을 또한 제작하여 이들이 dCas9과 함께 동일한 TetO::tdTomato 발현을 활성화하는 능력을 시험하였다(도 1D).
도 1D에 도시된 바와 같이, PUF::VP64는 동족(cognate) 결합 사이트를 가지는 sgRNA가 제공되었을 경우에만 tdTomato 발현을 활성화 할 수 있다. 이러한 결과는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 PUF 영역들 및 이들의 상기 sgRNA-PBS 상의 8-mer 결합 사이트들의 쌍 짓기(pairing)을 토대로 이펙터 기능의 독립성 또는 직교성을 제공함을 보여주고 있다. 인상적으로, 비록 PBSa 및 PBSw 결합 사이트들이 한 개의 뉴클레오티드만 차이가 있지만, 이들의 유전자 활성화는 타겟-특이적 상태를 유지한다는 사실은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 높은 특이성을 보여주고 있다.
실시예
3
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템은
타겟
좌위에서의
단백질 복합체의 조립을 가능케 함
본 실시예는 2 개 또는 그 이상의 상이한 단백질 성분을 가지는 단백질 복합체들을 sgRNA 상에 조립할 수 있고, 상기 대상 시스템을 이용하여 정의된 좌위에서 작동할 수 있음을 보여주고 있다.
구체적으로, p65-HSF1는 최근에 유력한 활성제 영역으로 알려졌다. 서로 옆에 위치한 PBS32 및 PBS6272를 모두 가지는 sgRNA 및 2 개의 상이한 사이트를 차지하는 PUF(3-2)::VP64 및 PUF(6-2/7-2)::p65-HSF1 융합체를 제작하였다(도 2A). PUF(3-2)::VP64 및 PUF(6-2/7-2)::p65-HSF1 모두의 형질감염은 단일 활성제만 사용해서 형질감염 시 얻게 되는 형광 강도의 합과 비슷한 강도의 tdTomato 형광을 유도하였다. 상기 결과는 PUF(3-2) 및 PUF(6-2/7-2) 모두에 대한 결합 사이트를 가지는 sgRNA가 두 유형의 융합 단백질 모두를 타겟된 게놈 좌위(locus)에 조립함을 나타낸다.
최근 한 논문은 VP64 및 p65HSF1 모두를 전사활성화 영역으로 시험한 결과 p65HSF1가 더욱 강력한 활성제임을 밝힌 바 있다. 이들 두 전사활성화 영역을 직접 비교하기 위하여, p65HSF1 PUF 융합체(PUFa-p65HSF1) 및 VP64 PUF 융합체(PUFa-VP64)로 상이한 수의 PBSa를 가진 sgRNA를 사용하여 TetO::tdTomato 전이 유전자를 활성화시켰다(도 2C). PUFa-p65HSF1는 PUFa-VP64와 비교하여 3 배 더 강력한 활성화능을 제공하였다. 단지 하나의 PBSa(이전 PUFa-VP64 모듈에서는 관찰되지 않음)를 사용 시에도 관찰되었다. 따라서, p65HSF1는 VP64보다 더 강력한 전사활성화 영역임이 확인되었다.
실시예
4
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템은 활성제를 가지는 dCas9 직접
융합체보다
보다 효율적으로 내인성 유전자를
활성화시킴
발명자들은 이전에 단일 sgRNA를 사용했을 때는 활성화를 이루지 못했지만 각 유전자마다 3-4 개의 sgRNA를 포함한 칵테일로 dCas9-VP160 직접 융합체를 사용하여 OCT4 및 SOX2의 강력한 내인성 유전자의 활성화를 성취한 바 있다(자료 미도시).
본 실시예는 상기 대상 시스템에서 상기 sgRNA-PBS 상에 복수의 PBS를 통하여 활성제 영역들을 모집(recruitment)하는 것은 전사활성화를 증가시켜 더 적은 수의 sgRNA를 사용하여 내인성 유전자의 활성화를 성취하게 함을 입증한다.
구체적으로, HEK293T에 있는 내인성 유전자들인 OCT4 및 SOX2의 활성화를 직접 dCas9-p65HSF1 활성제를 가지는 상기 대상 시스템으로 각 유전자마다 4 개의 sgRNA-PBS의 칵테일이나 개별 sgRNA-PBS를 이용하여 비교하였다(도 3A 및 3B). OCT4 및 SOX2 모두의 활성화 실험에서의 단일 가이드 실험에서뿐 아니라 혼합된 sgRNA-PBS에서 직접 융합과 비교하여 상기 대상 3-성분 CRISPR/Cas 복합체/시스템을 사용 시 더 높은 활성화를 가짐이 관찰되었다 (도 3A 및 3B). OCT4 및 SOX2에 대한 직접 융합의 단일 가이드 타겟팅은 활성화가 적거나 없음이 관찰된 반면 상기 해당 3-성분 시스템 실험에서는 강력한 활성화가 관찰되어, 상기 대상 3-성분 CRISPR/Cas 복합체/시스템 활성제가 상기 직접 융합보다 더 뛰어난 활성을 가짐을 보여 주었다.
OCT4 및 SOX2 활성화를 위한 상기 sgRNA 상의 PBSa 사이트의 최적의 수를 결정하기 위하여 1, 5, 15 또는 25 카피의 PBSa를 가지는 OCT4 또는 SOX2 근거리 프로모터를 타겟팅하는 sgRNA-PBS를 제작하였다. OCT4 및 SOX2 두 실험 모두에서, sgRNA-5×PBSa 칵테일 실험 및 단일 sgRNA-5×PBSa 실험에서 5×PBSa을 사용 시 가장 높은 활성이 관찰됨으로써, 상기 TetO::tdTomato 리포터 실험에서 발견된 것을 재현하였다 (도 3D 및 3E).
실시예
5
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템은
타겟
유전자의 동시 활성화 및
리프레션을
가능케함
본 실시예는 상이한 이펙터 기능을 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 각각에 할당할 수 있음을 보여 준다.
상기 KRAB::PUF(6-2/7-2) 리프레션 융합 및 상기 sgRNA 타겟팅 SV40 프로모터를 우선 제작하였다. 상기 TetO 프로모터의 조절 하에 있는 tdTomato 리포터와 SV40 프로모터의 조절 하에 있는 EGFP 리포터 (HEK293T/TetO::tdTomato/SV40::EGFP)를 가지는 HEK293T 리포터 세포주를 사용하여, 동시적 (1)dCas9/sgTetO-PBS32/PUF(3-2)::VP64의 TetO 프로모터에의 결합을 통한 tdTomato의 활성화 및 (2)Cas9/sgSV40-PBS6272/KRAB::PUF(6-2/7-2)의 SV40 프로모터에의 결합을 통한 EGFP 발현의 리프레션을 시험하였다 (도 4A). dCas9, sgTetO-5×PBS32 및 PUF(3-2)::VP64로 구성된 상기 3-성분 CRISPR/카스활성제의 발현은 tdTomato 형광(도 4B; 샘플 2)을 활성화시킨 반면, dCas9 와 sgSV40-5×PBS6272로 구성된 상기 3-성분 CRISPR/카스활성제의 발현은 EGFP 형광을 감소시켰다 (도4B; sample 4). 활성제 및 리프레서 복합체들 모두의 공동 발현은 상기 tdTomato의 활성화 및 상기 EGFP 전이유전자의 리프레션을 동시에 유도하여 (도4B, 샘플 6), 상이한 이펙터 기능들을 가지는 상기 대상 3-성분 CRISPR/Cas 복합체들이 동일 세포 내에서 작동하여 이들의 타겟에서 상이한 결과물을 생산할 수 있음을 보여 주고 있다.
다양한 이펙터를 모집함(recruiting)에 있어서 상기 대상 시스템의 다용성(versatility)을 추가로 확인하기 위하여, PUFc-p65HSF1 활성제 융합체 및 KRAB-PUFa 리프레서 융합체를 제작하였다. 리포터 세포주 HEK293T/TetO::tdTomato/SV40::EGFP에 있어서, SV40::EGFP 발현은 dCas9/KRAB-PUFa /sgSV40-PBSa에 의해 상당히 리프레스 될 수 있는 반면에, 상기 TetO::tdTomato 리포터 유전자는 dCas9/PUFc-p65HSF1/sgTetO-PBSc에 의해 효율적으로 활성화시킬 수 있다 (도 4C). 두 시스템이 모두 적용되었을 경우에는, TetO::tdTomato의 활성화 및 SV40::EGFP 발현의 리프레션이 동시에 성취되었다(도 4C). 비-타겟팅(sgCtl) sgRNA가 사용되거나 상기 PUF 융합체들이 생략된 경우에는, 각 리포터들의 형광 수준은 영향을 받지 않았으므로, 리포터들에 대한 효과가 구체적이며 타겟에서의 동족(cognate) dCas9/sgRNA-PBS에 의해 모집되는 이펙터들의 작용에 기인한다는 것을 보여 준다.
그 후, 복수의 내인성 유전자들의 발현이 상기 전략에 의해 독립적으로 조절될 수 있는지를 시험하였다. 상기 대상 3-성분 모듈들은 sgRNA-PBSb 및 sgRNA-PBSa의 타겟팅 서열을 변경함으로써 내인성 타겟 유전자들로 인도됨으로써 PUFb-p65HSF1는 상기 OCT4 프로모터로 모집되었고 BFPKRAB-PUFa는 상기 SOX2 프로모터로 모집되었다. 리포터 유전자 실험에서와 유사한 방법으로, 이펙터-매개된 OCT4의 독립적 활성화 및 SOX2의 리프레션이 동시적으로 성취되었다(도 4D).
실시예
6
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템에 의한 히스톤
아세틸트랜스퍼라제
(HAT) 영역의
모집(Recruitment)는
인핸서의
활성화를
성취케함
인공 전사 인자 시스템들은 유전자를 활성화하거나 리프레스하기 위하여 후성적 변형자들(epigenetic modifiers)을 모집하는 데 사용될 수 있다. 최근 실험에서는 인핸서를 활성화시키기 위하여 히스톤 아세틸트랜스퍼라제(HAT)를 사용하였다. 후성적 편집 효율을 증가시키기 위하여 상기 대상 3-성분 시스템이 HAT 영역의 복수의 분자를 모집할 수 있음을 입증하고자 OCT4를 모델 유전자로 사용하였는데, 이는 상기 유전자의 인핸서 및 프로모터가 잘 정의되어 있으며 인핸서 용도의 선택이 배아 줄기세포의 상태에 상응하는 생물학적 중요성을 가지고 있기 때문이다.
본 실험에서, 근거리(proximal) 프로모터(PP), 근거리 인핸서(PE) 및 원거리 인핸서(DE)를 각각 4 개의 상이한 sgRNA-PBS로 타겟하였다(도 5A). CREB-결합 단백질(CBP)로부터의 HAT 및 dCas9(dCas9::CBPHAT)의 C-말단 사이의 직접 융합체를 제작하였고 N-말단 융합 모듈 CBPHAT::PUFa 및 C-말단 융합 모듈 PUFa::CBPHAT를 또한 제작하였다. 이후, PP, PE 및 DE에의 결합을 통한 OCT4 발현을 활성화시키는 데 있어서 이들의 활성을 시험하였다.
도 5B에 도시된 바와 같이, dCas9::CBPHAT와 CBPHAT::PUFa는 근거리 프로모터(PP)에서 유사한 활성을 가지고 있다. 흥미롭게도, 5×PBSa를 가지는 sgRNA와 커플된 경우에는, 상기 대상 3-성분 모듈은 N-말단 융합 CBPHAT::PUFa를 가지는 인핸서 PE 및 DE를 모두 통해서 OCT4 유전자를 활성화시키는 더 높은 효율을 가지므로 최고의 활성화를 이룰 수 있다. 그 다음으로, 단일 sgRNA-5×PBSa에 의해 sgRNA-5×PBSa를 사용하여 PP, PE 및 DE에 인도되는 CBPHAT::PUFa의 활성을 분석하였다 (도 5C). 비록 4 sgRNA-5×PBSa의 칵테일을 사용할 때와 유사한 배수(fold)의 변경을 가지긴 하지만, 단일 sgRNA-5×PBSa은 이들 요소의 타겟팅을 통하여 OCT4 유전자의 발현을 활성화시킬 수 있었다 (도 5C).
실시예
7
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템은 텔로미어의 형광 태그를 가능케 함
전사 조절 이외에도, dCas9-이펙터의 다른 중요한 응용은 생세포 이미징의 게놈 좌위(loci)를 표지하는 것이다. 본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 텔로미어의 표지(labeling)와 같은 염색체 좌위의 형광 태그에 사용될 수 있음을 보여주고 있다.
본 발명자들은 PUFa 영역에 융합된 형광 단백질을 모집하기 위하여 0, 5, 15, 또는 25 카피의 PBSa를 가지는 텔로미어(sgTelomere)를 타겟하기 위하여 디자인된 sgRNA를 첨부하였다(도 6A). dCas9 및 Clover::PUFa를 가지는 sgTelomere-5×PBSa, 15×PBSa 및 25×PBSa의 발현은 텔로미어 표지와 일치되는 녹색 형광 초점을 만든 반면, PBSa 사이트를 가지지 않는 sgRNA는 아무런 초점도 만들지 않았다(도 6B). 대상 3-성분 시스템에 인도되는 형광 신호가 정말로 텔로미어에 위치하고 있는지 확인하기 위하여 텔로미어 반복 결합 인자 TRF2 에 대한 항체로 공동 표지하는 실험을 수행하였다. 상기 3-성분 시스템 텔로미어 신호들은 대체로 TRF 표지와 중복되어(도 6C), Clover-PUFa를 모집하는 PBSa 사이트가 첨부된 sgRNA에 의해서 텔로미어를 고도의 특이성으로 표지함을 나타낸다.
흥미롭게도, 텔로미어 표지의 강도는 상기 텔로미어-sgRNAs에 첨부된 PBS의 카피 수의 증가와 더불어 증가되었다(도 6B). 초점 수 및 신호 대 잡음의 계량(핵의 초점/총 GFP에서의 %GFP)은 5, 15 내지 25× PBSa의 sgRNA를 이용하는 실험에서 점진적 증가를 보였고(도 6D 및 6E), 이는 상기 대상 3-성분 시스템이 다량체화 특성이 타겟 좌위에서의 강도를 표지하는 역가를 허용함을 나타낸다.
실시예
8
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템은 텔로미어 및 동원체(Centromeres)의 동시 형광 태그를
가능케함
본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 동일 세포에서 다중화(multiplexing) 특성을 이용하여 하나 이상(예; 둘)의 게놈 좌위를 동시에 표지할 수 있음을 보여주고 있다.
상기 대상 3-성분 시스템이 두 게놈 좌위를 동시에 표지하는 능력을 추가로 입증하기 위해, PUFc(sgCentromere-20×PBSc)용 첨부된 결합 사이트를 가지는 동원체를 타겟하기 위한 sgRNA를 디자인하였다. 상기 대상 3-성분 시스템 및 항-CREST 항생제를 이용한 면역 염색에 의해 동원체를 표지하는 것을 관찰 및 확인하였다 (도 6F). Clover-PUFb/sgCentromere-20×PBSc, Ruby-PUFa/sgTelomere-25×PBSa 및 dCas9가 HEK293T 세포에 공동 도입된 경우, 동일 세포의 동원체 및 텔로미어를 독립적으로 표지하는 것을 관찰하였고(도 6G), 그 결과 상기 대상 3-성분 시스템이 복수의 게놈 좌위를 독립적으로 표지하는 데 사용될 수 있음이 입증되었다.
실시예
9
상기 대상 3-성분
CRISPR
/
Cas
복합체/시스템은 비-반복 염색체 좌위의 형광 태그를 가능케 함
dCas9::GFP를 사용하여 비-반복적 DNA를 표지하는 이전 연구 보고에 따르면, 이들 비-반복적 부위를 표지하기에 충분한 신호를 집중하기 위하여 >32 타겟팅이 요구된다. 본 실시예에서는 PUF-형광 단백질 융합을 위한 복수의 결합 사이트를 포함시킴으로써 형광 신호들을 타겟 사이트에 집중시킬 수 있으며 그로 인해 비-반복적 DNA를 검출하는 데 필요한 타겟팅 사이트의 양을 감소시킴을 확인하였다.
본 실시예에서는 MUC4 좌위에서의 비-반복적 부위를 시험하였다. MUC4 표지를 연상시키는 표지 패턴 15×PBS32, Clover::PUF(3-2) 및 dCas9 각각을 포함하는 7 개의 sgRNA을 성공적으로 검출하였다(도 7). 본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템을 정의된 게놈 좌위에서 단백질을 "중합(polymerize)"하는 데 사용될 수 있으며, 이는 이미징 분야에서 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 적용을 가능케 하고 상당히 확대시킬 수 있음을 보여주고 있다.
상기 실시예들은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 다중화(도 8A), 복합체 형성(도 8C) 및 전사 조절 인자들, 후성적 변형자들 및 형광 단백질을 포함한 단백질의 중합(도 8B)의 수행 능력이 있음과 상기 시스템이 이들을 정의된 게놈 좌위로 독립적으로 유도할 수 있음을 보여주고 있다. 상기 시스템은 복수의 좌위에서 복잡한 분자 거동의 제작과 정의된 화학양론을 가지는 단백질의 연구 및 재구성을 가능케 한다. 대상 3-성분 CRISPR/Cas 복합체/시스템의 중합 특성은 효소 활성 또는 다른 단백질의 정의된 게놈 좌위로 집중하도록 하여, 염색체 이미징과 같은 응용을 위해 효소 활성을 증가시키거나 신호 농축(signal enrichment)을 집중하게 한다.
더욱 구체적으로, 상기 대상 3-성분 시스템의 주요 잇점은 다음을 포함한다. (A) 다중화: 상기 대상 3-성분 시스템의 상이한 모듈은 동시에 세포로 전달될 수 있으며, 각 모듈은 독립성(즉, 다른 모듈 및 이들의 타겟 사이트들과 간섭없이)을 가지는 이들의 정의된 타겟 사이트에서 작동될 수 있다. PUF 영역들은 임의의 8-mer RNA 모티프를 인식하도록 쉽게 프로그램될 수 있기 때문에, 따라서 독립적 모듈의 잠재적 수는 이론상 최대치인 48(65536)까지 확장된다. PUF 배열을 다른 것 안에 삽입함으로써, 상기 인식 사이트는 416(42.9 억)의 서열 공간을 가지는 16-mer RNA 모티프로 프로그램될 수 있다. (B) 다량체화: 선형 8-mer PBS 모티프의 단순성은 sgRNA 전사 또는 Cas9/sgRNA DNA 결합 활성을 방해함 없이 sgRNA-PBS 상에 PUF 융합체의 광범위한 다량체화를 가능케한다. 이 특성은 PUF 융합체의 복수 분자들이 상기 sgRNA 상에 조립되게 함으로써 이펙터들 또는 단백질 태그들의 국소화된 농도를 허용한다. 이 특성은 형광 이미징 또는 전사 조절에 특히 유익하다. 텔로미어와 같은 반복 서열을 표지하는 상기 실험에서 보여준 바와 같이, 더 많은 PBS를 포함하는 sgRNA-PBS는 텔로미어 초점(telomeric foci)에서 신호를 증가시킨다. 이 특성은 통상 30 sgRNAs 이상의 타일링(tiling)을 필요로 하는 비-반복 서열의 표지를 용이하게 할 수도 있다. 직접적 dCas9-HAT 융합과 비교하여 상기 대상 시스템을 이용한 HAT-매개 인핸서 활성화가 더 높은 효율을 가짐이 관찰되었다. 다량체화는 수퍼-인핸서 또는 각인된 좌위(imprinted loci)와 같은 거대 후성적 영역들의 리프로그래밍에 유용한 인공 후성적 인자들(artificial epigenetic factors)에 의해 지휘되는 후성적 변형의 스프레딩을 용이하게 할 수 있을 것으로 생각된다. (C) 화학양론적으로 정의된 복합체 형성: 본 발명에서 직접 시험하지는 않았지만, 상기 sgRNA-PBS는 화학양론적으로 정의된 단백질 복합체들의 PUF-지향 조립용 RNA 발판(scaffold)으로 작용할 수 있을 것으로 생각된다. 구체적으로, 다양한 특이성을 가지는 다양한 수의 PBS 카피는 상기 sgRNA-PBS의 정의된 순서를 따를 뿐 아니라 정의된 화학양론을 가지는 다중 단백질(multiprotein) 복합체 형성을 가능케하는 상기 sgRNA에 첨부될 수 있을 것으로 생각된다.
상기 실시예에서 사용되는 물질 및 방법들은 하기에 기재되어 있다.
클로닝
(Cloning)
벡터 목록과 이들의 Addgene 엔트리 링크는 하기 표에 제시되어 있다. 클로닝 전략 및 서열에 대한 자세한 설명은 하기에 기재되어 있다.
N-말단 NLS을 가지는 UFa[PUF(3-2)] 및 PUFb[PUF(6-2/7-2)]는 이들 코딩 서열들을 포함하는 작체물들로부터 SgrAI 및 PacI 사이트를 포함하는 프라이머들을 사용하여 증폭 후, 이들을 이용하여 pAC164:pmax-dCas9Master_VP64를 SgrAI-dCas9-FseI로 대체하여 pAC1355:pmax-NLSPUFa_VP64 및 pAC1356:pmax-NLSPUFb_VP64을 제작하였다. NLSPUFb의 반복 4까지의 5' 단편 및 반복 5부터 NLSPUFa의 말단까지의 단편의 융합 PCR을 통하여 pAC1357:pmax-NLSPUFw_VP64를 제작하였다. NLSPUFa의 5' 단편을 NLSPUb의 3' 단편과 융합 PCR을 통하여 pAC1358:pmax-NLSPUFc_VP64를 제작하였다.
FseI PacI 사이트를 가지는 MS2-P65-HSF1_GFP(Addgene: 61423)로부터 p65HSF1 활성제 ORF를 증폭 후 pAC164의 VP64 단편을 대체하여 pAC1410:pmax-dCas9_p65HSF1을 제작하고, pAC1355 및 pAC1358 의 VP64 단편을 대체하여 pAC1393: pmax-NLSPUFa_p65HSF1 및 pAC1411:pmax-NLSPUFc_p65HSF1을 각각 제작하였다.
Clover 및 mRuby2를 SgrAI 및 FseI 클로닝 사이트를 포함하는 pcDNA3-Clover(Addgene #40259) 및 pcDNA3-mRuby2(Addgene #40260)로부터 각각 증폭 후, 상기 pAC1356~1358 및 pAC149:pCR8-dCas9VP160(Addgene #48221)로부터 절단된 벡터로부터 증폭된 다양한 FseI-PUF-PacI와 결찰하여(ligated) Clover_PUFa 및 Clover_PUFc, mRuby2_PUFa의 ORF를 포함하는 게이트웨이 기증자 벡터들(gateway donor vectors)인 pAC1402, pAC1403 및 pAC1404를 각각 제작하였다. 이들 ORF는 이후 LR Clonase(Invitrogen)를 이용하여 pAC1119:PB3-neo(-)-pmaxDEST(+)와 재조합하여 발현 벡터들인 pAC1360(Clover_PUFa), pAC1381(Clover_PUFc) 및 pAC1362(mRuby2_PUFa)을 제작하였다.
NLSKRAB 리프레서 영역을 AgeI-ClaI 사이트를 포함하는 프라이머들을 사용하여 SOX2 TALE 리프레서(KRAB 1-75)(Addgene #42945)로부터 증폭한 후, AclI PacI를 포함하는 프라이머들과 벡터로서 SgrAI-PacI로 절단된 pAC1360와 결찰하여 pAC1412: PB3-neo(-)-pmax-NLSKRAB_NLSPUFa를 제작하였다.
상기 FseI-p65HSF1-PacI 단편을 pAC1393로부터 수득 후 벡터로서 SgrAI-PacI로 절단된 pAC1356 및 pAC1360로부터 수득한 SgrAI-NLSPUMb와 결찰하여 pAC1413: PB3-neo(-)-pmax-NLSPUFb_p65HSF1을 제작하였다. 상기 BFPKRAB 단편을 pHR-SFFV-dCas9-BFP-KRAB(Addgene #46911)로부터 증폭 후 이를 이용하여 pAC1360로부터 수득한 Clover 단편을 대체하여 pAC1414: PB3-neo(-)-pmax-BFPKRAB_NLSPUFa을 제작하였다. 이후, NheI-CAGGS-NLSPUFb_p65HSF1-NheI 단편을 pAC1413로부터 증폭 후 NheI로 절단한 pAC1414에 삽입하여 BFPKRAB-NLSPUFa 및 NLSPUFb-p65HSF1(pAC1414: PB3-NLSPUFb_p65HSF1(-)neo(-)-BFPKRAB2_NLSPUFa)용 2중 발현벡터를 제작하였다.
개선된 링커 서열들과 N-말단(SgrAI,ClaI) 및 C-말단(FseI-PacI) 삽입을 위한 클로닝 사이트들 뿐 아니라 PUF의 N-말단에 3 개의 여분의 NLS 및 PUF의 C-말단에 1개의 추가 NLS를 가지는 4개의 게이트웨이 기증 벡터들(pAC1404~1408)을 제작하였다. HAT 서열을 생쥐 cDNA와 FseI - PacI 사이트를 포함하는 프라이머들을 사용하여 증폭 후 pAC164에 삽입하여 pAC1364: pmax-dCas9Master_CBPHAT를 제작하였고 pAC1405에 삽입하여 pAC1415: pCR8-4×NLSPUFa_2×NLS_CBPHAT를 제작하였다. HAT 서열을 SgrAI-AclI 사이트를 포함하는 다른 프라이머 쌍으로 증폭 후 pAC1405의 SgrAI-ClaI 사이트로 클론하여 pAC1416: pCR8-CBPHAT_4×NLSPUFa_2×NLS을 제작하였다. pAC1415 및 pAC1416를 pAC90:pmax-DEST(Addgene #48222)로 재조합 후 발현벡터들인 pAC1417: pmax-4×NLSPUFa_2×NLS_CBPHAT 및 pAC1418: pmax-CBPHAT_4×NLSPUFa_2×NLS를 각각 제작하였다. FseI-mCherry-PacI 단편을 mCherry 서열을 포함하는 플라스미드로부터 증폭 후 PB3-neo(-)-pmax의 SgrAI-dCas9-FseI로 결찰하여 pAC1419: PB3-neo(-)-pmax-dCas9Master_mCherry을 제작하였다.
sgRNA-PBS용 발현 벡터들은 다음과 같이 제작하였다: 첫째, 가이드 서열의 올리고 클로닝용 BbsI를 포함하는 sgF+E를 토대로 한 sgRNA 발판(scaffold) 및 PBS 삽입용 3' BsaI(종결자의 인접 상류(right upstream of the terminator)) sgRNA 발판(scaffold)을 gBlock(IDT)로서 구입 후 pX330(Addgene #42230)로 클로닝하여 AflIII-NotI 부위를 대체하여 벡터 pAC1394: pX-sgFE-BsaI(AGAT)를 제작하였다. 이후, 5×PBSa 사이트들을 코딩하는 올리고들(여기서, 한 쪽은 5'-AGAT-3' 돌출부가 플랭크되고(flanked) 다른 한 쪽은 5'-ATCT-3'가 위치한 ggc-스페이서에 의해 각각 분리됨)을 T4PNK로 처리 후, 어닐링하고 BsaI로 절단된 pAC1394에 결찰하였다(호환가능한(compatible) 돌출부 제작 목적). 클론들을 상이한 수의 PBS를 위한 1 카피 (5×PBS), 2 카피 (10×PBS) 등 올리고 삽입용을 스크린하였다. 1×PBS 및 2×PBS 벡터용으로, 하나의 PBS 사이트를 포함하는 올리고를 사용하여 제작하였다. 각 타겟용 가이드 서열을 상기 기재한 BbsI 사이트를 통하여 상기 sgRNA-PBS 발현 벡터들에 클론하였다. GFP 발현 마커를 포함하는 sgRNA 발현 벡터들용으로, 상기 pX 벡터들로부터 상기 sgRNA-PBS 발현 카세트를 이동시켜 AscI 사이트를 통하여 PB-GFP 벡터에 제작하였다. 상이한 sgRNA 발현 작체물들은 표에 제시되어 있다.
실험용 세포 배양액
HEK293T 세포를 10% 소태아혈청 (fetal bovine serum; FBS, Lonza), 4% 글루타막스(Glutamax; Gibco), 1% 피루빈산나트륨(Gibco) 및 페니실린-스트렙토마이신 (Gibco)을 함유하는 둘베코수정이글 배지(Dulbecco's Modified Eagle's medium; DMEM, Sigma)에서 배양하였다. 배양은 37℃ 및 5% CO2 조건에서 수행하였다. 활성화 실험을 위해, 200ng의 dCas9 작체물, 100ng의 변형된 sgRNA 및 100ng의 PUF-융합체를 포함하는 Attractene 형질감염 시약(Qiagen)을 사용하여 형질감염 하루 전에 세포를 12-웰 플레이트에 웰당 100,000 세포로 분주하였다. 형질감염 후, 세포를 48시간 배양 후 RNA 추출 또는 형광 활성 세포 분류(fluorescent-activated cell sorting; FACS)에 의해 수득하였다. 2중 활성-리프레션 실험에서, 형질감염은 변동없이 유지되었으나, 세포를 12-웰 플레이트에 웰당 150,000 세포로 분주한 후 72시간 동안 배양 후 FACS로 수득하였다. OCT4 및 SOX2 2중 활성-리프레션 실험에서, 세포를 RNA 추출 이전에 BFP(활성제-리프레서 모듈용 PUFb-p65HSF1/BFPKRAB-PUFa), mCherry(dCas9mCherry 용) 및 GFP(EGFP를 공동 발현하는 벡터 상 sgRNA-PBS)로 3중 분리하였다. 이미징 실험에서, 세포는 50ng의 dCas9 작체물, 500ng의 변형된 sgRNA 및 50ng의 PUF-형광 융합체를 포함하는 Attractene 형질감염 시약을 사용하여 형질감염 하루 전에 22×22×1 현미경 커버글라스를 포함하는 6-웰 플레이트에 웰당 300,000 세포로 분주하였다. 형질감염 후, 세포를 48시간 배양 후 면역 염색하였다.
정량적 RT-PCR 분석
세포를 트립신 처리하여 수득한 후, 둘베코 인산완충식염수(Dulbecco's phosphate-buffered saline; dPBS)로 세척하고, 125g에서 5분간 원심분리 후, RNeasy Plus Mini 키트(Qiagen)을 사용하여 RNA를 추출하였다. 1μg RNA와 Applied Biosystems High Capacity RNA-to-cDNA 키트를 사용하여 cDNA 라이브러리를 제작하였다. GAPDH(Hs03929097, VIC)를 내인성 대조군(endogenous control)으로 하고 OCT4(Hs00999632, FAM) 및 SOX2(Hs01053049, FAM)를 타겟으로 하여 TaqMan Gene expression assays(Applied Biosystems)를 디자인하였다. UNG(Applied Biosystems)를 포함하는 TaqMan Universal Master Mix II와 각 반응 당 2μl의 1:10 희석된 cDNA를 사용하여 정량적 PCR(qPCR)을 수행하였다. 활성은 Applied Biosystems ViiA7 instrument를 사용하여 분석하였다. 유전자 발현 수준은 "delta delta Ct" 알고리즘을 사용하여 계산 후 대조군 샘플로 정규화하였다.
형광 활성 세포 분류(Fluorescent-Activated Cell Sorting; FACS)
세포를 트립신화한 후 2% 파라포름알데히드로 10분간 고정하였다. 이후, 세포를 125g에서 5분간 원심분리 후, dPBS에 재현탁하였다. CellQuest Pro software(BD Bioscience)를 사용하여 FACScalibur 유세포 분석기 상에서 샘플을 분석하였다. 각 분석마다 수 천개의 이벤트를 수집하였다.
면역 염색 및 현미경 관찰
세포를 커버글라스에 부착된 채로 2% 파라포름알데히드에 고정시킨 후, dPBS 상에서 0.1% Triton X-100로 세척 후, dPBS 상에서 0.4% Triton X-100로 4℃에서 5분간 처리하여 투과성을 부여 후, 5% 블롯팅-급 블로킹 완충액(BIO-RAD)에서 30분간 블로킹하고, 블로킹 완충액 상에서 1차 항체와 함께 4℃에서 밤새도록 배양 후, dPBS로 3회 세척 후, 암실에서 각각 Alexa Fluor로 콘주게이트된 2차 항체로 3시간 배양 후, 재세척 후 DAPI로 염색하였다. 이미징 전에 상기 커버글라스를 글리세롤을 포함한 슬라이드 위에 올려 놓았다. 항-TRF2 1차 항체(Novus 생물학제제: NB110-57130)의 1:100 희석액 및 Alexa Fluor 594로 콘주게이트된 항-토끼 IgG 2차 항체(Invitrogen, A11037)의 1:500 희석액을 사용하여 텔로미어를 면역 염색하였다. CREST 항체(항체 통합: 15-235-0001)의 1:100 희석액과 Alexa Fluor 594로 콘주게이트된 항-인간 IgG 2차 항체(Invitrogen, A11014)의 1:500 희석액을 사용하여 동원체(centromeres)를 검출하였다.
상기 실시예들에서 사용된 작체물들 중 일부의 서열들 및 이들의 관련 서열들을 하기에 제시하였다.
>NLSPUFa_VP64 Key: NLS PUFa VP64
MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID
상기 서열에서, NLS 서열은 잔기 6-12이고, PUFa는 잔기 15-363이고 VP64는 잔기 371-421이다.
>NLSPUFb_VP64 Key: NLS PUFb VP64
MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID
상기 서열에서, NLS 서열은 잔기 6-12이고, PUFb는 잔기 15-363이고 VP64는 잔기 371-421이다.
>NLSPUFw_VP64 Key: NLS PUFw VP64
MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID
상기 서열에서, NLS 서열은 잔기 6-12이고, PUFw는 잔기 15-363이고 VP64는 잔기 371-421이다.
>NLSPUFc_VP64 Key: NLS PUFc VP64
MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID
상기 서열에서, NLS 서열은 잔기 6-12이고, PUFc는 잔기 15-363이고 VP64는 잔기 371-421이다.
>Clover_NLSPUFa Key: Clover NLS PUFa
MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
상기 서열에서, NLS 서열은 잔기 264-270이고, PUFa는 잔기 273-621이고 Clover는 잔기 1-251이다.
>Clover_NLSPUFc Key: Clover NLS PUFc
MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
상기 서열에서, NLS 서열은 잔기 264-270이고, PUFc는 잔기 273-621이고 Clover는 잔기 1-251이다.
>mRuby2_NLSPUFa Key: 6×His-mRuby2 NLS PUFa
MVRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGNPYMGTQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPKGIPDFFKQSFPEGFTWERVTRYEDGGVVTVMQDTSLEDGCLVYHVQVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTHMALKVDGGGHLSCSFVTTYRSKKTVGNIKMPGIHAVDHRLERLEESDNEMFVVQREHAVAKFAGLGGGMDELYKGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
상기 서열에서, NLS 서열은 잔기 284-290이고, PUFa는 잔기 293-641이고 6×His-mRuby2는 잔기 6-11의 6×His 태그를 포함하여 잔기 1-271이다.
>NLSPUFa_p65HSF1 Key: PUFa NLS p65HSF1
MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGGGGSGGGGSGGGGSGPKKKRKVAAAGSPSGQISNQALALAPSSAPVLAQTMVPSSAMVPLAQPPAPAPVLTPGPPQSLSAPVPKSTQAGEGTLSEALLHLQFDADEDLGALLGNSTDPGVFTDLASVDNSEFQQLLNQGVSMSHSTAEPMLMEYPEAITRLVTGSQRPPDPAPTPLGTSGLPNGLSGDEDFSSIADMDFSALLSQISSSGQGGGGSGFSVDTSALLDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVSID
상기 서열에서, NLS 서열은 잔기 6-12이고, PUFa는 잔기 15-363이고, p65는 잔기 427-575이고 HSF1는 잔기 584-707이다.
>NLSKRAB_NLSPUFa Key: NLSKRAB PUFa
MGSPKKKRKVEASMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVSRGSIVGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
상기 서열에서, 상기 2 개의 NLS 서열은 잔기 4-10 및 잔기 99-105이고, PUFa는 잔기 108-456이고 KRAB는 잔기 11-92이다.
>BFPKRAB_NLSPUFa Key: HA-2×NLS-BFPKRAB NLS PUFa
MAYPYDVPDYASLGSGSPKKKRKVEDPKKKRKVDGIGSGSNGSSGSSELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANIKTTYRSKKPAKNLKMPGVYYVDYRLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLNGGGGGMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPGGSGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
상기 서열에서, NLS 서열은 잔기 370-376이고, PUFa는 잔기 379-727이고 HA-2×NLS-BFPKRAB는 잔기 3-11의 HA를 포함하여 잔기 1-355이다.
>dCas9Master_mCherry HATag NLS dCas9 mCherry
YLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEASGGGGSGGGGSGGGGSGPAMVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKID
상기 서열에서, 상기 2 개의 NLS 서열은 잔기 30-36 및 잔기 1408-1414이고, dCas9는 잔기 40-1406이고, mCherry는 잔기 1436-1671이고 HA 태그는 잔기 20-28이다.
>CBPHAT_4×NLS_PUFa_2×NLS Key: CBPHAT NLS PUFa
PDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGDPKKKRKVDPKKKRKVGGRGGGGSGGGGSGGGGSGPA
상기 서열에서, 6 개의 7-잔기 NLS 서열은 잔기 773, 781, 789, 826, 1185 및 1193에서 시작되고, PUFa는 잔기 835-1183이고 CBPHAT는 잔기 2-764이다.
> 4×NLS_PUFa_2×NLS_CBPHAT Key: NLS PUFa CBPHAT
PDPLLSCDLMDGRDAFLTLARDKHWEFSSLRRSKWSTLCMLVELHTQGQDRFVYTCNECKHHVETRWHCTVCEDYDLCINCYNTKSHTHKMVKWGLGLDDEGSSQGEPQSKSPQESRRLSIQRCIQSLVHACQCRNANCSLPSCQKMKRVVQHTKGCKRKTNGGCPVCKQLIALCCYHAKHCQENKCPVPFCLNI
상기 서열에서, 6 개의 7-잔기 NLS 서열은 잔기 10, 18, 26, 63, 422 및 430에서 시작되고, PUFa는 잔기 72-420이고 CBPHAT는 잔기 458-1220이다.
명칭 및 기술 | DNA 서열 |
sgRNA-PBS 발현 카세트 | |
PBS 서열 없이 Ns로서 타겟 서열을 포함하는 발현 카세트 U6::sgRNA-0×PBS |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccAGATCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 1 카피의 PBS32(UGUAUGUA)을 포함하는 발현 카세트 U6::sgRNA-1×PBS32 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTGTATGTAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
명칭 및 기술 | DNA 서열 |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 5 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::sgRNA-5×PBS32 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 15 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::sgRNA-15×PBS32 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 25 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::sgRNA-25×PBS32 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 1 카피의 PBS6272(UUGAUAUA)을 포함하는 발현 카세트 U6::sgRNA-1×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatgccTtgATATAgccagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 2 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-2×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
명칭 및 기재 | DNA 서열 |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 5 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-5×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 10 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-10×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 15 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-15×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 20 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-20×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
명칭 및 기술 | DNA 서열 |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 25 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-25×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 47 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-47×PBS6272 |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATACCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 2 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-2×PBS6272-10Spacer |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 6 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-6×PBS6272-10Spacer |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
명칭 및 기술 | DNA 서열 |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 15 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-15×PBS6272-10Spacer |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 20 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-20×PBS6272-10Spacer |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 5'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 5 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::5×PBS32-sgRNA |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCgCAATTGggtctccAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATCTCACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 2 카피의 PBS32(UGUAUGUA)-PBS6272(UUGAUAUA) 클러스터를 포함하는 발현 카세트 U6::sgRNA-2×[PBS32-PBS6272] |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
명칭 및 기재 | DNA 서열 |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 8 카피의 PBS32(UGUAUGUA)-PBS6272(UUGAUAUA) 클러스터를 포함하는 발현 카세트 U6::sgRNA-8×[PBS32-PBS6272] |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 4 카피의 PBS32(UGUAUGUA)-PBS6272(UUGAUAUA) 클러스터를 포함하는 발현 카세트 U6::sgRNA-4×[PBS32-PBS6272] |
gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc |
sgRNA 타겟 서열 (U6 전사 효율을 증가시키고자 때때로 추가적으로 G가 추가됨) | |
조절 서열 | GTTCTCTTGCTGAAAGCTCGA |
TetO 프로모터 | GCTTTTCTCTATCACTGATA |
SV40P1 | GCATACTTCTGCCTGCTGGGGAGCCTG |
SV40P2 | GAAAGTCCCCAGGCTCCCCAGC |
SV40P3 | GCATCTCAATTAGTCAGCAACC |
텔로미어 | GTTAGGGTTAGGGTTAGGGTTA |
동원체 | GTTGAGGCCTTCGTTGGAAAC |
MUC4-비반복-1 | GAAGAGTGGAGGCCGTGCGCGG |
MUC4-비반복-2 | GCAAGCAAGGGAAGCGACAAGG |
MUC4-비반복-3 | GATGTTTCAGGACTAGGCTGA |
MUC4-비반복-4 | GAGCTGGGCCAGGAGAGGAGA |
MUC4-비반복-5 | GAGGGGTCTGTGGAGAGTTT |
MUC4-비반복-6 | GGCTTGGTGTATTCAGAATG |
MUC4-비반복-7 | GTAGAGATGCCGCCCCGCCC |
OCT4-PP-1 | GGCCCCGCCCCCTGGATGGG |
OCT4-PP-2 | GGGGGGAGAAACTGAGGCGA |
OCT4-PP-3 | GGTGGTGGCAATGGTGTCTG |
OCT4-PP-4 | GACACAACTGGCGCCCCTCC |
OCT4-PE-1 | GGCCCCTACTTCCCCTTCAA |
OCT4-PE-2 | GAGTGATAAGACACCCGCTT |
OCT4-PE-3 | GCCTGGGAGGGACTGGGGGA |
OCT4-PE-4 | GGACAATCCCGGTCCCCAGA |
OCT4-DE-1 | GGTCTGCCGGAAGGTCTACA |
OCT4-DE-2 | GGCAGGTAGATTATGGGGCC |
OCT4-DE-3 | GAAGACGGCCTCTCAGAGGA |
명칭 및 기술 | DNA 서열 |
OCT4-DE-4 | GTATTTCTGGCCTGGGCAAG |
SOX2-PP-1 | GCATGTGACGGGGGCTGTCA |
SOX2-PP-2 | GCTGCCGGGTTTTGCATGAA |
SOX2-PP-3 | GCCGGCCGCGCGGGGGAGGC |
SOX2-PP-4 | GGCAGGCGAGGAGGGGGAGG |
SV40-P1 | GCATACTTCTGCCTGCTGGGGAGCCTG |
명칭 | 펩타이드 서열 |
화농성 연쇄상구균 (S. Pyogenes) NLS-dCas9-NLS | SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS |
화농성 연쇄상구균 (S. Pyogenes) NLS-Cas9WT-NLS | SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS |
명칭 | 펩타이드 서열 |
화농성 연쇄상구균 (S. Pyogenes) NLS-Cas9 틈내기 효소(D10A)-NLS | SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS |
화농성 연쇄상구균 (S. Pyogenes) NLS-Cas9틈내기 효소(H840A)-NLS | SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS |
명칭 | 펩타이드 서열 |
Ruby::PUF(3-2) | MVRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGNPYMGTQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPKGIPDFFKQSFPEGFTWERVTRYEDGGVVTVMQDTSLEDGCLVYHVQVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTHMALKVDGGGHLSCSFVTTYRSKKTVGNIKMPGIHAVDHRLERLEESDNEMFVVQREHAVAKFAGLGGGMDELYKGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG |
Ruby::PUF(6-2/7-2) | MVRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGNPYMGTQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPKGIPDFFKQSFPEGFTWERVTRYEDGGVVTVMQDTSLEDGCLVYHVQVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTHMALKVDGGGHLSCSFVTTYRSKKTVGNIKMPGIHAVDHRLERLEESDNEMFVVQREHAVAKFAGLGGGMDELYKGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG |
Clover::PUF(3-2) | MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG |
Clover::PUF(6-2/7-2) | MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG |
PUF(3-2)::VP64 | MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID |
명칭 | 펩타이드 서열 |
PUF(6-2/7-2)::VP64 | MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID |
PUF(6-2/7-2)::p65_HSF1 | MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGGGGSGGGGSGGGGSGPKKKRKVAAAGSPSGQISNQALALAPSSAPVLAQTMVPSSAMVPLAQPPAPAPVLTPGPPQSLSAPVPKSTQAGEGTLSEALLHLQFDADEDLGALLGNSTDPGVFTDLASVDNSEFQQLLNQGVSMSHSTAEPMLMEYPEAITRLVTGSQRPPDPAPTPLGTSGLPNGLSGDEDFSSIADMDFSALLSQISSSGQGGGGSGFSVDTSALLDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVSID |
KRAB::PUF(6-2/7-2) | MGSPKKKRKVEASMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVSRGSIVGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG |
벡터들 및 이들의 Addgene 접수 번호
pAC 번호 | 기술적 명칭 | 기술 |
pAC164 | pmax-dCas9Master_VP64 | 발현 벡터 pmax(Clontech)의 CAGGS 프로모터에 의해 구동되는 dCas9-VP64 |
pAC1119 | PB3-neo(-)-pmaxDEST(+) | 새로운 선택가능한 마커 및 pmax 카세트(Clontech)를 포함하는 PB 게이트웨이 목적지 벡터(gateway destination vector) |
pAC1355 | pmax-NLSPUFa_VP64 | 일시적 발현 벡터 pmax의 NLSPUFa_VP64 |
pAC1356 | pmax-NLSPUFb_VP64 | 발현 벡터 pmax의 NLSPUFb_VP64 |
pAC1357 | pmax-NLSPUFw_VP64 | 발현 벡터 pmax의 NLSPUFw_VP64 |
pAC1358 | pmax-NLSPUFc_VP64 | 발현 벡터 pmax의 NLSPUFc_VP64 |
pAC1360 | PB3-neo(-)-pmax-Clover_NLSPUFa | pAC1119의 Clover_NLSPUFa |
pAC1362 | PB3-neo(-)-pmax-mRuby2_NLSPUFa | pAC1119의 mRuby2_NLSPUFa |
pAC1364 | pmax-dCas9Master_mCBPHAT | pmax 발현 벡터의 dCas9Master_mCBPHAT |
pAC1371 | pX-sgRNA-5xPBSa | sgRNA-5xPBSa 발현용 클로닝 벡터 |
pAC1372 | pX-sgRNA-15xPBSa | sgRNA-15xPBSa 발현용 클로닝 벡터 |
pAC1373 | pX-sgRNA-25xPBSa | sgRNA-25xPBSa 발현용 클로닝 벡터 |
pAC1374 | pX-sgRNA-5xPBSb | sgRNA-5xPBSb 발현용 클로닝 벡터 |
pAC 번호 | 기술적 명칭 | 기술 | |
pAC1375 | pX-sgRNA-15xPBSb | sgRNA-15xPBSb 발현용 클로닝 벡터 | |
pAC1376 | pX-sgRNA-25xPBSb | sgRNA-25xPBSb 발현용 클로닝 벡터 | |
pAC1379 | pX-sgRNA-5xPBSw | sgRNA-5xPBSw 발현용 클로닝 벡터 | |
pAC1380 | pX-sgRNA-5xPBSc | sgRNA-5xPBSc 발현용 클로닝 벡터 | |
pAC1381 | PB3-neo(-)-pmax-Clover_NLSPUFc | pAC1119의 Clover_NLSPUFc | |
pAC1393 | pmax-NLSPUFa_p65HSF1 | pmax 발현 벡터의 NLSPUFa_p65HSF1 | |
pAC1394 | pX-sgRNA-0xPBS | PBS가 없는 sgRNA 발현용 클로닝 벡터로서 PBS 삽입용 BsaI 절단용 여분의 서열을 포함함 | |
pAC1399 | pX-sgRNA-20xPBSc | sgRNA-20xPBSc 발현용 클로닝 벡터 | |
pAC1402 | pCR8-Clover_NLSPUFa | pCR8 게이트웨이 공여(donor) 벡터의 Clover_NLSPUFa | |
pAC1403 | pCR8-Clover_NLSPUFc | pCR8 게이트웨이 공여 벡터의 Clover_NLSPUFc | |
pAC1404 | pCR8-mRuby2_NLSPUFa | pCR8 게이트웨이 공여 벡터의 mRuby2_NLSPUFa | |
pAC1405 | pCR8-4xNLS_PUFa_2xNLS | N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFa pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양 | |
pAC1406 | pCR8-4xNLS_PUFb_2xNLS | N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFb pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양 | |
pAC1407 | pCR8-4xNLS_PUFw_2xNLS | N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFbw pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양 |
|
pAC1408 | pCR8-4xNLS_PUFc_2xNLS | N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFbwc pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양 |
|
pAC1410 | pmax-dCas9Master_p65HSF1 | pmax 발현 벡터의 dCas9Master_p65HSF1 | |
pAC1411 | pmax-NLSPUFc_p65HSF1 | pmax 발현 벡터의 NLSPUFc_p65HSF1 | |
pAC1412 | PB3-neo(-)-pmax-NLSKRAB_NLSPUFa | pAC1119의 NLSKRAB_NLSPUFa | |
pAC1413 | PB3-neo(-)-pmax-NLSPUFb_p65HSF1 | pAC1119의 NLSPUFb_p65HSF1 | |
pAC1414 | PB3-NLSPUFb_p65HSF1-neo(-)-BFPKRAB_NLSPUFa | NLSPUFb_p65HSF1 및 BFPKRAB_NLSPUFa 2중 발현용 벡터 |
pAC 번호 | 기술적 명칭 | 기술 |
BFPKRAB_NLSPUFa | ||
pAC1415 | pCR8-4xNLS_PUFa_2xNLS_mCBPHAT | pCR8 게이트웨이 공여 벡터의 4xNLS_PUFa_2xNLS_mCBPHAT |
pAC1416 | pCR8-mCBPHAT_4xNLS_PUFa_2xNLS | pCR8 게이트웨이 공여 벡터의 mCBPHAT_4xNLS_PUFa_2xNLS |
pAC1417 | pmax-4xNLS_PUFa_2xNLS_mCBPHAT | pmax 발현 벡터의 4xNLS_PUFa_2xNLS_mCBPHAT |
pAC1418 | pmax-mCBPHAT_4xNLS_PUFa_2xNLS | pmax 발현 벡터의 mCBPHAT_4xNLS_PUFa_2xNLS |
pAC1419 | PB3-neo(-)-pmax-dCas9Master_mCherry | pmax 발현 벡터의 dCas9Master_mCherry |
pAC1420 | pX-sgRNA-1xPBSa | sgRNA-1xPBSa 발현용 벡터 |
pAC1421 | pX-sgRNA-2xPBSa | sgRNA-2xPBSa 발현용 벡터 |
pAC1422 | pX-sgRNA-1xPBSb | sgRNA-1xPBSb 발현용 벡터 |
pAC1423 | pX-sgRNA-2xPBSb | sgRNA-2xPBSb 발현용 벡터 |
pAC1424 | pX-sgRNA-10xPBSb | sgRNA-10xPBSb 발현용 벡터 |
pAC1425 | pX-sgRNA-20xPBSb | sgRNA-20xPBSb 발현용 벡터 |
pAC1426 | pX-sgRNA-47xPBSb | sgRNA-47xPBSb 발현용 벡터 |
pAC1427 | pX-sgRNA-10xPBSw | sgRNA-10xPBSw 발현용 벡터 |
pAC1428 | pX-sgRNA-15xPBSw | sgRNA-15xPBSw 발현용 벡터 |
pAC1429 | pX-sgRNA-10xPBSc | sgRNA-10xPBSc 발현용 벡터 |
pAC1430 | pX-sgRNA-15xPBSc | sgRNA-15xPBSc 발현용 벡터 |
pAC1431 | PB3-LGFPL(-)-sgSOX2PP1-5xPBSa | loxP 트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP1-5xPBSa 발현용 벡터 |
pAC1432 | PB3-LGFPL(-)-sgSOX2PP2-5xPBSa(-) | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP2-5xPBSa 발현용 벡터 |
pAC1433 | PB3-LGFPL(-)-sgSOX2PP3-5xPBSa | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP3-5xPBSa발현용 벡터 |
pAC1434 | PB3-LGFPL(-)-sgSOX2PP4-5xPBSa | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP4-5xPBSa 발현용 벡터 |
pAC1435 | PB3-LGFPL(-)-sgOCT4PP1-5xPBSb | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP1-5xPBSb 발현용 벡터 |
pAC1436 | PB3-LGFPL(-)-sgOCT4PP4-5xPBSb | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP4-5xPBSb 발현용 벡터 |
pAC1437 | PB3-LGFPL(-)-sgOCT4PP3-5xPBSb | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP3-5xPBSb 발현용 벡터 |
pAC1438 |
PB3-LGFPL(-)-sgOCT4PP2-5xPBSb | loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP2-5xPBSb 발현용 벡터 |
PBS의 수 및 유형에 따른 sgRNA-PBS 발현 벡터들의 목록
#PBS\PBS 유형 | PUFa | PUFb | PUFw | PUFc |
1x | pAC1420 | pAC1422 | ||
2x | pAC1421 | pAC1423 | ||
5x | pAC1371 | pAC1374 | pAC1379 | pAC1380 |
10x | pAC1424 | pAC1427 | pAC1429 | |
15x | pAC1372 | pAC1375 | pAC1428 | pAC1430 |
20x | pAC1425 | pAC1399 | ||
25x | pAC1373 | pAC1376 | ||
47x | pAC1426 |
SEQUENCE LISTING
<110> THE JACKSON LABORATORY
<120> A THREE-COMPONENT CRISPR/CAS COMPLEX SYSTEM AND USES THEREOF
<130> 122854-00620
<140> PCT/US2016/021491
<141> 2016-03-09
<150> 62/221,249
<151> 2015-09-21
<150> 62/132,644
<151> 2015-03-13
<160> 173
<170> PatentIn version 3.5
<210> 1
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 1
gttttagagc tagaaatagc aagttaaaat aaggcta 37
<210> 2
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 2
gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggcta 47
<210> 3
<211> 349
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 3
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
340 345
<210> 4
<211> 349
<212> PRT
<213> Homo sapiens
<400> 4
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
340 345
<210> 5
<211> 349
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> VARIANT
<222> (36)..(36)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (40)..(40)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (72)..(72)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (73)..(73)
<223> /replace="Tyr"
<220>
<221> VARIANT
<222> (76)..(76)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (108)..(108)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (112)..(112)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (144)..(144)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (145)..(145)
<223> /replace="His"
<220>
<221> VARIANT
<222> (148)..(148)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (180)..(180)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (184)..(184)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (216)..(216)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (217)..(217)
<223> /replace="Tyr"
<220>
<221> VARIANT
<222> (220)..(220)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (252)..(252)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (253)..(253)
<223> /replace="Asn"
<220>
<221> VARIANT
<222> (256)..(256)
<223> /replace="Arg" or "Glu"
<220>
<221> VARIANT
<222> (295)..(295)
<223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn"
<220>
<221> VARIANT
<222> (296)..(296)
<223> /replace="Tyr"
<220>
<221> VARIANT
<222> (299)..(299)
<223> /replace="Arg" or "Glu"
<220>
<221> MISC_FEATURE
<222> (1)..(349)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<220>
<221> source
<223> /note="See specification as filed for detailed description of
substitutions and preferred embodiments"
<400> 5
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Cys
130 135 140
Arg Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Cys Arg Val Ile Gln His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Arg Val Val Gln
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Cys Arg Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
340 345
<210> 6
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 6
Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala
1 5 10
<210> 7
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 7
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala
1 5 10
<210> 8
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 8
Gln His Gly Ser Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala
1 5 10
<210> 9
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 9
Gln His Gly Gly Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala
1 5 10
<210> 10
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 10
Gln His Gly Ala Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala
1 5 10
<210> 11
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 11
Gln His Gly Thr Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala
1 5 10
<210> 12
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 12
Gln His Gly Cys Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala
1 5 10
<210> 13
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 13
Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala
1 5 10
<210> 14
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 14
Gln His Gly Asn Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala
1 5 10
<210> 15
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 15
Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu Phe Gly
1 5 10
<210> 16
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 16
Val Phe Gly Ser Arg Val Ile Gln Lys Phe Phe Glu Phe Gly
1 5 10
<210> 17
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 17
Val Phe Gly Cys Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
1 5 10
<210> 18
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 18
Val Phe Gly Ser Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
1 5 10
<210> 19
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 19
Val Phe Gly Ser Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly
1 5 10
<210> 20
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 20
Val Phe Gly Gly Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly
1 5 10
<210> 21
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 21
Val Phe Gly Ala Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly
1 5 10
<210> 22
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 22
Val Phe Gly Thr Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly
1 5 10
<210> 23
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 23
Val Phe Gly Cys Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly
1 5 10
<210> 24
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 24
Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu Phe Gly
1 5 10
<210> 25
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 25
Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
1 5 10
<210> 26
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 26
Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Phe Ile
1 5 10
<210> 27
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 27
Met Tyr Gly Ser Arg Val Ile Gln Lys Ala Leu Glu Phe Ile
1 5 10
<210> 28
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 28
Met Tyr Gly Ser Arg Val Ile Arg Lys Ala Leu Glu Phe Ile
1 5 10
<210> 29
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 29
Met Tyr Gly Gly Arg Val Ile Arg Lys Ala Leu Glu Phe Ile
1 5 10
<210> 30
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 30
Met Tyr Gly Ala Arg Val Ile Arg Lys Ala Leu Glu Phe Ile
1 5 10
<210> 31
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 31
Met Tyr Gly Thr Arg Val Ile Arg Lys Ala Leu Glu Phe Ile
1 5 10
<210> 32
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 32
Met Tyr Gly Cys Arg Val Ile Arg Lys Ala Leu Glu Phe Ile
1 5 10
<210> 33
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 33
Met Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe Ile
1 5 10
<210> 34
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 34
Met Tyr Gly Asn Arg Val Ile Gln Lys Ala Leu Glu Phe Ile
1 5 10
<210> 35
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 35
Gln Asn Gly Cys Arg Val Val Gln Lys Cys Ile Glu Cys Val
1 5 10
<210> 36
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 36
Gln Asn Gly Ser Arg Val Val Gln Lys Cys Ile Glu Cys Val
1 5 10
<210> 37
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 37
Gln Asn Gly Cys His Val Val Gln Lys Cys Ile Glu Cys Val
1 5 10
<210> 38
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 38
Gln Asn Gly Ser His Val Val Gln Lys Cys Ile Glu Cys Val
1 5 10
<210> 39
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 39
Gln Asn Gly Ser His Val Val Arg Lys Cys Ile Glu Cys Val
1 5 10
<210> 40
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 40
Gln Asn Gly Gly His Val Val Arg Lys Cys Ile Glu Cys Val
1 5 10
<210> 41
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 41
Gln Asn Gly Ala His Val Val Arg Lys Cys Ile Glu Cys Val
1 5 10
<210> 42
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 42
Gln Asn Gly Thr His Val Val Arg Lys Cys Ile Glu Cys Val
1 5 10
<210> 43
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 43
Gln Asn Gly Cys His Val Val Arg Lys Cys Ile Glu Cys Val
1 5 10
<210> 44
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 44
Gln Asn Gly Ser His Val Val Glu Lys Cys Ile Glu Cys Val
1 5 10
<210> 45
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 45
Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val
1 5 10
<210> 46
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 46
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys
1 5 10
<210> 47
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 47
Pro Tyr Gly Ser Arg Val Ile Gln Arg Ile Leu Glu His Cys
1 5 10
<210> 48
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 48
Pro Tyr Gly Ser Arg Val Ile Arg Arg Ile Leu Glu His Cys
1 5 10
<210> 49
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 49
Pro Tyr Gly Gly Arg Val Ile Arg Arg Ile Leu Glu His Cys
1 5 10
<210> 50
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 50
Pro Tyr Gly Ala Arg Val Ile Arg Arg Ile Leu Glu His Cys
1 5 10
<210> 51
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 51
Pro Tyr Gly Thr Arg Val Ile Arg Arg Ile Leu Glu His Cys
1 5 10
<210> 52
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 52
Pro Tyr Gly Cys Arg Val Ile Arg Arg Ile Leu Glu His Cys
1 5 10
<210> 53
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 53
Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys
1 5 10
<210> 54
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 54
Pro Tyr Gly Asn Arg Val Ile Gln Arg Ile Leu Glu His Cys
1 5 10
<210> 55
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 55
Gln Tyr Gly Cys Arg Val Ile Gln His Val Leu Glu His Gly
1 5 10
<210> 56
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 56
Gln Tyr Gly Ser Arg Val Ile Gln His Val Leu Glu His Gly
1 5 10
<210> 57
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 57
Gln Tyr Gly Cys Tyr Val Ile Gln His Val Leu Glu His Gly
1 5 10
<210> 58
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 58
Gln Tyr Gly Ser Tyr Val Ile Gln His Val Leu Glu His Gly
1 5 10
<210> 59
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 59
Gln Tyr Gly Ser Tyr Val Ile Arg His Val Leu Glu His Gly
1 5 10
<210> 60
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 60
Gln Tyr Gly Gly Tyr Val Ile Arg His Val Leu Glu His Gly
1 5 10
<210> 61
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 61
Gln Tyr Gly Ala Tyr Val Ile Arg His Val Leu Glu His Gly
1 5 10
<210> 62
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 62
Gln Tyr Gly Thr Tyr Val Ile Arg His Val Leu Glu His Gly
1 5 10
<210> 63
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 63
Gln Tyr Gly Cys Tyr Val Ile Arg His Val Leu Glu His Gly
1 5 10
<210> 64
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 64
Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly
1 5 10
<210> 65
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 65
Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly
1 5 10
<210> 66
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 66
Lys Phe Ala Cys Arg Val Val Gln Lys Cys Val Thr His Ala
1 5 10
<210> 67
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 67
Lys Phe Ala Ser Arg Val Val Gln Lys Cys Val Thr His Ala
1 5 10
<210> 68
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 68
Lys Phe Ala Cys Asn Val Val Gln Lys Cys Val Thr His Ala
1 5 10
<210> 69
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 69
Lys Phe Ala Ser Asn Val Val Gln Lys Cys Val Thr His Ala
1 5 10
<210> 70
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 70
Lys Phe Ala Ser Asn Val Val Arg Lys Cys Val Thr His Ala
1 5 10
<210> 71
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 71
Lys Phe Ala Gly Asn Val Val Arg Lys Cys Val Thr His Ala
1 5 10
<210> 72
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 72
Lys Phe Ala Ala Asn Val Val Arg Lys Cys Val Thr His Ala
1 5 10
<210> 73
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 73
Lys Phe Ala Thr Asn Val Val Arg Lys Cys Val Thr His Ala
1 5 10
<210> 74
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 74
Lys Phe Ala Cys Asn Val Val Arg Lys Cys Val Thr His Ala
1 5 10
<210> 75
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 75
Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala
1 5 10
<210> 76
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 76
Lys Phe Ala Asn Asn Val Val Gln Lys Cys Val Thr His Ala
1 5 10
<210> 77
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 77
Gln Tyr Ala Cys Arg Val Val Gln Lys Met Ile Asp Val Ala
1 5 10
<210> 78
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 78
Gln Tyr Ala Ser Arg Val Val Gln Lys Met Ile Asp Val Ala
1 5 10
<210> 79
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 79
Gln Tyr Ala Cys Tyr Val Val Gln Lys Met Ile Asp Val Ala
1 5 10
<210> 80
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 80
Gln Tyr Ala Ser Tyr Val Val Gln Lys Met Ile Asp Val Ala
1 5 10
<210> 81
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 81
Gln Tyr Ala Ser Tyr Val Val Arg Lys Met Ile Asp Val Ala
1 5 10
<210> 82
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 82
Gln Tyr Ala Gly Tyr Val Val Arg Lys Met Ile Asp Val Ala
1 5 10
<210> 83
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 83
Gln Tyr Ala Ala Tyr Val Val Arg Lys Met Ile Asp Val Ala
1 5 10
<210> 84
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 84
Gln Tyr Ala Thr Tyr Val Val Arg Lys Met Ile Asp Val Ala
1 5 10
<210> 85
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 85
Gln Tyr Ala Cys Tyr Val Val Arg Lys Met Ile Asp Val Ala
1 5 10
<210> 86
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 86
Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val Ala
1 5 10
<210> 87
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 87
Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala
1 5 10
<210> 88
<211> 349
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 88
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
340 345
<210> 89
<211> 349
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 89
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
340 345
<210> 90
<211> 349
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 90
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
340 345
<210> 91
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 91
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr
340
<210> 92
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 92
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Asn Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr
340
<210> 93
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 93
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
1 5 10 15
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
20 25 30
Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
35 40 45
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
50 55 60
Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu
65 70 75 80
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
85 90 95
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Asn Arg Val Ile Gln
100 105 110
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
115 120 125
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
130 135 140
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
145 150 155 160
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
165 170 175
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
180 185 190
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
195 200 205
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
210 215 220
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
225 230 235 240
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln
245 250 255
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
260 265 270
Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
275 280 285
Met Lys Asp Gln Tyr Ala Cys Tyr Val Val Gln Lys Met Ile Asp Val
290 295 300
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
305 310 315 320
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
325 330 335
Leu Glu Lys Tyr Tyr
340
<210> 94
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 94
Pro Pro Lys Lys Lys Arg Lys Val
1 5
<210> 95
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
6xHis tag"
<400> 95
His His His His His His
1 5
<210> 96
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 96
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser
355 360 365
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
370 375 380
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
385 390 395 400
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
405 410 415
Asp Leu Asp Met Leu Tyr Ile Asp
420
<210> 97
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 97
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser
355 360 365
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
370 375 380
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
385 390 395 400
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
405 410 415
Asp Leu Asp Met Leu Tyr Ile Asp
420
<210> 98
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 98
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser
355 360 365
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
370 375 380
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
385 390 395 400
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
405 410 415
Asp Leu Asp Met Leu Tyr Ile Asp
420
<210> 99
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 99
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser
355 360 365
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
370 375 380
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
385 390 395 400
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
405 410 415
Asp Leu Asp Met Leu Tyr Ile Asp
420
<210> 100
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 100
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser
225 230 235 240
Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser
245 250 255
Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg
260 265 270
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
275 280 285
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
290 295 300
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
305 310 315 320
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
325 330 335
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
340 345 350
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
355 360 365
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
370 375 380
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
385 390 395 400
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
405 410 415
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
420 425 430
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
435 440 445
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
450 455 460
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
465 470 475 480
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
485 490 495
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
500 505 510
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
515 520 525
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
530 535 540
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
545 550 555 560
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
565 570 575
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
580 585 590
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
595 600 605
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
610 615 620
<210> 101
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 101
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser
225 230 235 240
Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser
245 250 255
Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg
260 265 270
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
275 280 285
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
290 295 300
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
305 310 315 320
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
325 330 335
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
340 345 350
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
355 360 365
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
370 375 380
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
385 390 395 400
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
405 410 415
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
420 425 430
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
435 440 445
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
450 455 460
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
465 470 475 480
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
485 490 495
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
500 505 510
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
515 520 525
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
530 535 540
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
545 550 555 560
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
565 570 575
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
580 585 590
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
595 600 605
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
610 615 620
<210> 102
<211> 641
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 102
Met Val Arg Gly Ser His His His His His His Gly Met Ala Ser Met
1 5 10 15
Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys
20 25 30
Asp Pro Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg
35 40 45
Met Lys Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys
50 55 60
Thr Gly Glu Gly Glu Gly Asn Pro Tyr Met Gly Thr Gln Thr Met Arg
65 70 75 80
Ile Lys Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu
85 90 95
Ala Thr Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys
100 105 110
Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp
115 120 125
Glu Arg Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln
130 135 140
Asp Thr Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg
145 150 155 160
Gly Val Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys
165 170 175
Gly Trp Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu
180 185 190
Arg Gly Tyr Thr His Met Ala Leu Lys Val Asp Gly Gly Gly His Leu
195 200 205
Ser Cys Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn
210 215 220
Ile Lys Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu
225 230 235 240
Glu Glu Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val
245 250 255
Ala Lys Phe Ala Gly Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys Gly
260 265 270
Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg
275 280 285
Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn
290 295 300
Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu
305 310 315 320
Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu
325 330 335
Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln
340 345 350
Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln
355 360 365
Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu
370 375 380
Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser
385 390 395 400
Arg Val Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn
405 410 415
Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp
420 425 430
Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro
435 440 445
Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala
450 455 460
Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu
465 470 475 480
His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln
485 490 495
His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln
500 505 510
His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala
515 520 525
Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser
530 535 540
Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala
545 550 555 560
Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala
565 570 575
Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys
580 585 590
Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys
595 600 605
Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His
610 615 620
Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu
625 630 635 640
Gly
<210> 103
<211> 709
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 103
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Gly
355 360 365
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Pro Lys
370 375 380
Lys Lys Arg Lys Val Ala Ala Ala Gly Ser Pro Ser Gly Gln Ile Ser
385 390 395 400
Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala Pro Val Leu Ala Gln
405 410 415
Thr Met Val Pro Ser Ser Ala Met Val Pro Leu Ala Gln Pro Pro Ala
420 425 430
Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln Ser Leu Ser Ala Pro
435 440 445
Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
450 455 460
Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu Gly Ala Leu Leu Gly
465 470 475 480
Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu Ala Ser Val Asp Asn
485 490 495
Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val Ser Met Ser His Ser
500 505 510
Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu
515 520 525
Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala Pro Thr Pro Leu Gly
530 535 540
Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp Glu Asp Phe Ser Ser
545 550 555 560
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Ser
565 570 575
Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val Asp Thr Ser Ala Leu
580 585 590
Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro Asp Met Ser Leu Pro
595 600 605
Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu Leu Leu Ser Pro Gln
610 615 620
Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser Ser Pro Asp Ser Gly
625 630 635 640
Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu Phe Leu Leu Asp Pro
645 650 655
Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro Val Leu Phe Glu Leu
660 665 670
Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly Phe Ala Glu Asp Pro
675 680 685
Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro Lys Ala Lys Asp Pro
690 695 700
Thr Val Ser Ile Asp
705
<210> 104
<211> 456
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 104
Met Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Met Asp Ala
1 5 10 15
Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val
20 25 30
Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln
35 40 45
Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val
50 55 60
Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu
65 70 75 80
Lys Gly Glu Glu Pro Trp Leu Val Ser Arg Gly Ser Ile Val Gly Ile
85 90 95
Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu
100 105 110
Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu
115 120 125
Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg
130 135 140
Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu
145 150 155 160
Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val
165 170 175
Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu
180 185 190
Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu
195 200 205
Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe
210 215 220
Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His
225 230 235 240
Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys
245 250 255
Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala
260 265 270
Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg
275 280 285
Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro
290 295 300
Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln
305 310 315 320
Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu
325 330 335
Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu
340 345 350
Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His
355 360 365
Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met
370 375 380
Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr
385 390 395 400
Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln
405 410 415
Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg
420 425 430
Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr
435 440 445
Met Lys Asn Gly Val Asp Leu Gly
450 455
<210> 105
<211> 727
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 105
Met Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly
1 5 10 15
Ser Pro Lys Lys Lys Arg Lys Val Glu Asp Pro Lys Lys Lys Arg Lys
20 25 30
Val Asp Gly Ile Gly Ser Gly Ser Asn Gly Ser Ser Gly Ser Ser Glu
35 40 45
Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val
50 55 60
Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr
65 70 75 80
Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu
85 90 95
Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys
100 105 110
Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser
115 120 125
Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly
130 135 140
Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu
145 150 155 160
Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro
165 170 175
Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu
180 185 190
Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys
195 200 205
Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg
210 215 220
Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val
225 230 235 240
Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val
245 250 255
Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys
260 265 270
Leu Gly His Lys Leu Asn Gly Gly Gly Gly Gly Met Asp Ala Lys Ser
275 280 285
Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val
290 295 300
Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile
305 310 315 320
Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu
325 330 335
Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly
340 345 350
Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu
355 360 365
Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu Leu
370 375 380
Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile
385 390 395 400
Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg Phe
405 410 415
Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu Val
420 425 430
Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val Phe
435 440 445
Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln
450 455 460
Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu Ala
465 470 475 480
Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe Ile
485 490 495
Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His Val
500 505 510
Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys Cys
515 520 525
Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe
530 535 540
Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg Val
545 550 555 560
Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro Ile
565 570 575
Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln Tyr
580 585 590
Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu Asp
595 600 605
Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu Ser
610 615 620
Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala
625 630 635 640
Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met Asn
645 650 655
Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala
660 665 670
Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln Arg
675 680 685
Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg Lys
690 695 700
Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met
705 710 715 720
Lys Asn Gly Val Asp Leu Gly
725
<210> 106
<211> 1673
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 106
Met Ile Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
1 5 10 15
Gly Ser Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys
20 25 30
Lys Arg Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
35 40 45
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
50 55 60
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
65 70 75 80
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
85 90 95
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
100 105 110
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
115 120 125
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
130 135 140
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
145 150 155 160
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
165 170 175
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
180 185 190
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
195 200 205
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
210 215 220
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
225 230 235 240
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
245 250 255
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
260 265 270
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
275 280 285
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
290 295 300
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
305 310 315 320
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
325 330 335
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
340 345 350
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
355 360 365
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
370 375 380
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
385 390 395 400
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
405 410 415
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
420 425 430
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
435 440 445
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
450 455 460
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
465 470 475 480
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
485 490 495
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
500 505 510
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
515 520 525
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
530 535 540
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
545 550 555 560
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
565 570 575
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
580 585 590
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
595 600 605
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
610 615 620
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
625 630 635 640
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
645 650 655
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
660 665 670
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
675 680 685
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
690 695 700
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
705 710 715 720
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
725 730 735
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
740 745 750
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
755 760 765
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
770 775 780
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
785 790 795 800
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
805 810 815
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
820 825 830
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
835 840 845
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
850 855 860
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val
865 870 875 880
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
885 890 895
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
900 905 910
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
915 920 925
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
930 935 940
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
945 950 955 960
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
965 970 975
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
980 985 990
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
995 1000 1005
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1010 1015 1020
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1025 1030 1035
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1040 1045 1050
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1055 1060 1065
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1070 1075 1080
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1085 1090 1095
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1100 1105 1110
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1115 1120 1125
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1130 1135 1140
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1145 1150 1155
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1160 1165 1170
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1175 1180 1185
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1190 1195 1200
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1205 1210 1215
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1220 1225 1230
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1235 1240 1245
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1250 1255 1260
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1265 1270 1275
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1280 1285 1290
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1295 1300 1305
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1310 1315 1320
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1325 1330 1335
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1340 1345 1350
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1355 1360 1365
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1370 1375 1380
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1385 1390 1395
Asp Leu Ser Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys
1400 1405 1410
Val Glu Ala Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1415 1420 1425
Gly Gly Gly Ser Gly Pro Ala Met Val Ser Lys Gly Glu Glu Asp
1430 1435 1440
Asn Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val His Met
1445 1450 1455
Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly
1460 1465 1470
Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val
1475 1480 1485
Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro
1490 1495 1500
Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp
1505 1510 1515
Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp
1520 1525 1530
Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr
1535 1540 1545
Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
1550 1555 1560
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys
1565 1570 1575
Lys Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu
1580 1585 1590
Asp Gly Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys
1595 1600 1605
Asp Gly Gly His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala
1610 1615 1620
Lys Lys Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys
1625 1630 1635
Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr Ile Val Glu Gln
1640 1645 1650
Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly Gly Met Asp Glu
1655 1660 1665
Leu Tyr Lys Ile Asp
1670
<210> 107
<211> 1220
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 107
Met Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala Leu Met Pro Thr Leu
1 5 10 15
Glu Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu Pro Phe Arg Gln Pro
20 25 30
Val Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys
35 40 45
Asn Pro Met Asp Leu Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln
50 55 60
Tyr Gln Glu Pro Trp Gln Tyr Val Asp Asp Val Trp Leu Met Phe Asn
65 70 75 80
Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Phe Cys
85 90 95
Ser Lys Leu Ala Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln
100 105 110
Ser Leu Gly Tyr Cys Cys Gly Arg Lys Tyr Glu Phe Ser Pro Gln Thr
115 120 125
Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp Ala Ala
130 135 140
Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys Cys Phe Thr
145 150 155 160
Glu Ile Gln Gly Glu Asn Val Thr Leu Gly Asp Asp Pro Ser Gln Pro
165 170 175
Gln Thr Thr Ile Ser Lys Asp Gln Phe Glu Lys Lys Lys Asn Asp Thr
180 185 190
Leu Asp Pro Glu Pro Phe Val Asp Cys Lys Glu Cys Gly Arg Lys Met
195 200 205
His Gln Ile Cys Val Leu His Tyr Asp Ile Ile Trp Pro Ser Gly Phe
210 215 220
Val Cys Asp Asn Cys Leu Lys Lys Thr Gly Arg Pro Arg Lys Glu Asn
225 230 235 240
Lys Phe Ser Ala Lys Arg Leu Gln Thr Thr Arg Leu Gly Asn His Leu
245 250 255
Glu Asp Arg Val Asn Lys Phe Leu Arg Arg Gln Asn His Pro Glu Ala
260 265 270
Gly Glu Val Phe Val Arg Val Val Ala Ser Ser Asp Lys Thr Val Glu
275 280 285
Val Lys Pro Gly Met Lys Ser Arg Phe Val Asp Ser Gly Glu Met Ser
290 295 300
Glu Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile
305 310 315 320
Asp Gly Val Asp Val Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly
325 330 335
Ser Asp Cys Pro Pro Pro Asn Thr Arg Arg Val Tyr Ile Ser Tyr Leu
340 345 350
Asp Ser Ile His Phe Phe Arg Pro Arg Cys Leu Arg Thr Ala Val Tyr
355 360 365
His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr
370 375 380
Val Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr
385 390 395 400
Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg
405 410 415
Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala Phe Ala Glu Arg
420 425 430
Ile Ile Asn Asp Tyr Lys Asp Ile Phe Lys Gln Ala Asn Glu Asp Arg
435 440 445
Leu Thr Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro
450 455 460
Asn Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu
465 470 475 480
Arg Lys Lys Glu Glu Ser Thr Ala Ala Ser Glu Thr Pro Glu Gly Ser
485 490 495
Gln Gly Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Asn
500 505 510
Lys Asn Lys Ser Ser Ile Ser Arg Ala Asn Lys Lys Lys Pro Ser Met
515 520 525
Pro Asn Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu
530 535 540
Lys His Lys Glu Val Phe Phe Val Ile His Leu His Ala Gly Pro Val
545 550 555 560
Ile Ser Thr Gln Pro Pro Ile Val Asp Pro Asp Pro Leu Leu Ser Cys
565 570 575
Asp Leu Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys
580 585 590
His Trp Glu Phe Ser Ser Leu Arg Arg Ser Lys Trp Ser Thr Leu Cys
595 600 605
Met Leu Val Glu Leu His Thr Gln Gly Gln Asp Arg Phe Val Tyr Thr
610 615 620
Cys Asn Glu Cys Lys His His Val Glu Thr Arg Trp His Cys Thr Val
625 630 635 640
Cys Glu Asp Tyr Asp Leu Cys Ile Asn Cys Tyr Asn Thr Lys Ser His
645 650 655
Thr His Lys Met Val Lys Trp Gly Leu Gly Leu Asp Asp Glu Gly Ser
660 665 670
Ser Gln Gly Glu Pro Gln Ser Lys Ser Pro Gln Glu Ser Arg Arg Leu
675 680 685
Ser Ile Gln Arg Cys Ile Gln Ser Leu Val His Ala Cys Gln Cys Arg
690 695 700
Asn Ala Asn Cys Ser Leu Pro Ser Cys Gln Lys Met Lys Arg Val Val
705 710 715 720
Gln His Thr Lys Gly Cys Lys Arg Lys Thr Asn Gly Gly Cys Pro Val
725 730 735
Cys Lys Gln Leu Ile Ala Leu Cys Cys Tyr His Ala Lys His Cys Gln
740 745 750
Glu Asn Lys Cys Pro Val Pro Phe Cys Leu Asn Ile Asn Asp Gly Gly
755 760 765
Gly Gly Ser Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys
770 775 780
Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Thr Gly Ser
785 790 795 800
Arg Asn Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
805 810 815
Gly Ser Gly Arg Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val
820 825 830
Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr
835 840 845
Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser
850 855 860
Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala
865 870 875 880
Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala
885 890 895
Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe
900 905 910
Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile
915 920 925
Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val
930 935 940
Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met
945 950 955 960
Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn
965 970 975
Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser
980 985 990
Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser
995 1000 1005
Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His
1010 1015 1020
Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln
1025 1030 1035
His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile
1040 1045 1050
Gln His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile
1055 1060 1065
Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys
1070 1075 1080
Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg
1085 1090 1095
Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp
1100 1105 1110
Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala
1115 1120 1125
Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln
1130 1135 1140
Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu
1145 1150 1155
Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys
1160 1165 1170
Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Asp Pro Lys Lys Lys
1175 1180 1185
Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val Gly Gly Arg Gly
1190 1195 1200
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1205 1210 1215
Pro Ala
1220
<210> 108
<211> 1220
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 108
Met Ile Asp Gly Gly Gly Gly Ser Asp Pro Lys Lys Lys Arg Lys Val
1 5 10 15
Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ser Thr Gly Ser Arg Asn Asp Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Arg Ala Gly Ile Leu Pro Pro Lys
50 55 60
Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe
65 70 75 80
Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His
85 90 95
Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu
100 105 110
Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu
115 120 125
Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr
130 135 140
Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala
145 150 155 160
Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met
165 170 175
Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp
180 185 190
Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys
195 200 205
Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys
210 215 220
Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln
225 230 235 240
Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg
245 250 255
Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu
260 265 270
Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr
275 280 285
Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys
290 295 300
Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys
305 310 315 320
Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg Thr
325 330 335
Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro
340 345 350
His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val
355 360 365
Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val
370 375 380
Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr
385 390 395 400
Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly
405 410 415
Val Asp Leu Gly Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys
420 425 430
Lys Arg Lys Val Gly Gly Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly
435 440 445
Ser Gly Gly Gly Gly Ser Gly Pro Ala Ile Phe Lys Pro Glu Glu Leu
450 455 460
Arg Gln Ala Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln Asp Pro
465 470 475 480
Glu Ser Leu Pro Phe Arg Gln Pro Val Asp Pro Gln Leu Leu Gly Ile
485 490 495
Pro Asp Tyr Phe Asp Ile Val Lys Asn Pro Met Asp Leu Ser Thr Ile
500 505 510
Lys Arg Lys Leu Asp Thr Gly Gln Tyr Gln Glu Pro Trp Gln Tyr Val
515 520 525
Asp Asp Val Trp Leu Met Phe Asn Asn Ala Trp Leu Tyr Asn Arg Lys
530 535 540
Thr Ser Arg Val Tyr Lys Phe Cys Ser Lys Leu Ala Glu Val Phe Glu
545 550 555 560
Gln Glu Ile Asp Pro Val Met Gln Ser Leu Gly Tyr Cys Cys Gly Arg
565 570 575
Lys Tyr Glu Phe Ser Pro Gln Thr Leu Cys Cys Tyr Gly Lys Gln Leu
580 585 590
Cys Thr Ile Pro Arg Asp Ala Ala Tyr Tyr Ser Tyr Gln Asn Arg Tyr
595 600 605
His Phe Cys Glu Lys Cys Phe Thr Glu Ile Gln Gly Glu Asn Val Thr
610 615 620
Leu Gly Asp Asp Pro Ser Gln Pro Gln Thr Thr Ile Ser Lys Asp Gln
625 630 635 640
Phe Glu Lys Lys Lys Asn Asp Thr Leu Asp Pro Glu Pro Phe Val Asp
645 650 655
Cys Lys Glu Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His Tyr
660 665 670
Asp Ile Ile Trp Pro Ser Gly Phe Val Cys Asp Asn Cys Leu Lys Lys
675 680 685
Thr Gly Arg Pro Arg Lys Glu Asn Lys Phe Ser Ala Lys Arg Leu Gln
690 695 700
Thr Thr Arg Leu Gly Asn His Leu Glu Asp Arg Val Asn Lys Phe Leu
705 710 715 720
Arg Arg Gln Asn His Pro Glu Ala Gly Glu Val Phe Val Arg Val Val
725 730 735
Ala Ser Ser Asp Lys Thr Val Glu Val Lys Pro Gly Met Lys Ser Arg
740 745 750
Phe Val Asp Ser Gly Glu Met Ser Glu Ser Phe Pro Tyr Arg Thr Lys
755 760 765
Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly Val Asp Val Cys Phe Phe
770 775 780
Gly Met His Val Gln Glu Tyr Gly Ser Asp Cys Pro Pro Pro Asn Thr
785 790 795 800
Arg Arg Val Tyr Ile Ser Tyr Leu Asp Ser Ile His Phe Phe Arg Pro
805 810 815
Arg Cys Leu Arg Thr Ala Val Tyr His Glu Ile Leu Ile Gly Tyr Leu
820 825 830
Glu Tyr Val Lys Lys Leu Gly Tyr Val Thr Gly His Ile Trp Ala Cys
835 840 845
Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His Cys His Pro Pro Asp
850 855 860
Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met
865 870 875 880
Leu Asp Lys Ala Phe Ala Glu Arg Ile Ile Asn Asp Tyr Lys Asp Ile
885 890 895
Phe Lys Gln Ala Asn Glu Asp Arg Leu Thr Ser Ala Lys Glu Leu Pro
900 905 910
Tyr Phe Glu Gly Asp Phe Trp Pro Asn Val Leu Glu Glu Ser Ile Lys
915 920 925
Glu Leu Glu Gln Glu Glu Glu Glu Arg Lys Lys Glu Glu Ser Thr Ala
930 935 940
Ala Ser Glu Thr Pro Glu Gly Ser Gln Gly Asp Ser Lys Asn Ala Lys
945 950 955 960
Lys Lys Asn Asn Lys Lys Thr Asn Lys Asn Lys Ser Ser Ile Ser Arg
965 970 975
Ala Asn Lys Lys Lys Pro Ser Met Pro Asn Val Ser Asn Asp Leu Ser
980 985 990
Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys Glu Val Phe Phe Val
995 1000 1005
Ile His Leu His Ala Gly Pro Val Ile Ser Thr Gln Pro Pro Ile
1010 1015 1020
Val Asp Pro Asp Pro Leu Leu Ser Cys Asp Leu Met Asp Gly Arg
1025 1030 1035
Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His Trp Glu Phe Ser
1040 1045 1050
Ser Leu Arg Arg Ser Lys Trp Ser Thr Leu Cys Met Leu Val Glu
1055 1060 1065
Leu His Thr Gln Gly Gln Asp Arg Phe Val Tyr Thr Cys Asn Glu
1070 1075 1080
Cys Lys His His Val Glu Thr Arg Trp His Cys Thr Val Cys Glu
1085 1090 1095
Asp Tyr Asp Leu Cys Ile Asn Cys Tyr Asn Thr Lys Ser His Thr
1100 1105 1110
His Lys Met Val Lys Trp Gly Leu Gly Leu Asp Asp Glu Gly Ser
1115 1120 1125
Ser Gln Gly Glu Pro Gln Ser Lys Ser Pro Gln Glu Ser Arg Arg
1130 1135 1140
Leu Ser Ile Gln Arg Cys Ile Gln Ser Leu Val His Ala Cys Gln
1145 1150 1155
Cys Arg Asn Ala Asn Cys Ser Leu Pro Ser Cys Gln Lys Met Lys
1160 1165 1170
Arg Val Val Gln His Thr Lys Gly Cys Lys Arg Lys Thr Asn Gly
1175 1180 1185
Gly Cys Pro Val Cys Lys Gln Leu Ile Ala Leu Cys Cys Tyr His
1190 1195 1200
Ala Lys His Cys Gln Glu Asn Lys Cys Pro Val Pro Phe Cys Leu
1205 1210 1215
Asn Ile
1220
<210> 109
<211> 454
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 109
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atcttttttt gttttagagc tagaaatagc aagttaaaat aaggctagtc 420
cgtagcgcgt gcgccaattc tgcagacaaa tggc 454
<210> 110
<211> 472
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 110
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atgcctgtat gtagccagat ctttttttgt tttagagcta gaaatagcaa 420
gttaaaataa ggctagtccg tagcgcgtgc gccaattctg cagacaaatg gc 472
<210> 111
<211> 510
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 111
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag attgtatgta gcctgtatgt agcctgtatg tagcctgtat gtagcctgta 420
tgtaagatct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgta 480
gcgcgtgcgc caattctgca gacaaatggc 510
<210> 112
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 112
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag attgtatgta gcctgtatgt agcctgtatg tagcctgtat gtagcctgta 420
tgtaagattg tatgtagctg tatgtagcct gtatgtagcc tgtatgtagc ctgtatgtaa 480
gattgtatgt agcctgtatg tagcctgtat gtagcctgta tgtagcctgt atgtaagatc 540
tttttttgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt agcgcgtgcg 600
ccaattctgc agacaaatgg c 621
<210> 113
<211> 734
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 113
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag attgtatgta gcctgtatgt agcctgtatg tagcctgtat gtagcctgta 420
tgtaagattg tatgtagcct gtatgtagcc tgtatgtagc ctgtatgtag cctgtatgta 480
agattgtatg tagcctgtat gtagcctgta tgtagcctgt atgtagcctg tatgtaagat 540
tgtatgtagc ctgtatgtag cctgtatgta gcctgtatgt agcctgtatg taagattgta 600
tgtagcctgt atgtagcctg tatgtagcct gtatgtagcc tgtatgtaag atcttttttt 660
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgtagcgcgt gcgccaattc 720
tgcagacaaa tggc 734
<210> 114
<211> 472
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 114
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atgccttgat atagccagat ctttttttgt tttagagcta gaaatagcaa 420
gttaaaataa ggctagtccg tagcgcgtgc gccaattctg cagacaaatg gc 472
<210> 115
<211> 477
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 115
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat aagatctttt tttgttttag agctagaaat 420
agcaagttaa aataaggcta gtccgtagcg cgtgcgccaa ttctgcagac aaatggc 477
<210> 116
<211> 510
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 116
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420
tataagatct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgta 480
gcgcgtgcgc caattctgca gacaaatggc 510
<210> 117
<211> 566
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 117
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420
tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480
agatcttttt ttgttttaga gctagaaata gcaagttaaa ataaggctag tccgtagcgc 540
gtgcgccaat tctgcagaca aatggc 566
<210> 118
<211> 622
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 118
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420
tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480
agatttgata tagccttgat atagccttga tatagccttg atatagcctt gatataagat 540
ctttttttgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg tagcgcgtgc 600
gccaattctg cagacaaatg gc 622
<210> 119
<211> 678
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 119
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420
tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480
agatttgata tagccttgat atagccttga tatagccttg atatagcctt gatataagat 540
ttgatatagc cttgatatag ccttgatata gccttgatat agccttgata taagatcttt 600
ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtagc gcgtgcgcca 660
attctgcaga caaatggc 678
<210> 120
<211> 734
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 120
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420
tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480
agatttgata tagccttgat atagccttga tatagccttg atatagcctt gatataagat 540
ttgatatagc cttgatatag ccttgatata gccttgatat agccttgata taagatttga 600
tatagccttg atatagcctt gatatagcct tgatatagcc ttgatataag atcttttttt 660
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgtagcgcgt gcgccaattc 720
tgcagacaaa tggc 734
<210> 121
<211> 979
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 121
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420
tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480
agatttgata taccttgata tagccttgat atagccttga tatagccttg atataagatt 540
tgatatagcc ttgatatagc cttgatatag ccttgatata gccttgatat agccttgata 600
tagccttgat ataagatttg atatagcctt gatatagcct tgatatagcc ttgatatagc 660
cttgatataa gatttgatat agccttgata tagccttgat atagccttga tatagccttg 720
atataagatt tgatatagcc ttgatatagc cttgatatag ccttgatata gccttgatat 780
aagatttgat atagccttga tatagccttg atatagcctt gatatagcct tgatataaga 840
tttgatatag ccttgatata gccttgatat agccttgata tagccttgat ataagatctt 900
tttttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgtag cgcgtgcgcc 960
aattctgcag acaaatggc 979
<210> 122
<211> 490
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 122
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atgccttgat atagccagat gccttgatat agccagatct ttttttgttt 420
tagagctaga aatagcaagt taaaataagg ctagtccgta gcgcgtgcgc caattctgca 480
gacaaatggc 490
<210> 123
<211> 562
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 123
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 420
ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 480
ctttttttgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg tagcgcgtgc 540
gccaattctg cagacaaatg gc 562
<210> 124
<211> 724
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 124
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 420
ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 480
gccttgatat agccagatgc cttgatatag ccagatgcct tgatatagcc agatgccttg 540
atatagccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 600
ccagatgcct tgatatagcc agatgccttg atatagccag atcttttttt gttttagagc 660
tagaaatagc aagttaaaat aaggctagtc cgtagcgcgt gcgccaattc tgcagacaaa 720
tggc 724
<210> 125
<211> 813
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 125
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 420
ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 480
gccttgatat agccagatgc cttgatatag ccagatgcct tgatatagcc agatgccttg 540
atatagccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 600
ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 660
gccttgatat agccagatgc cttgatatag ccagatcctt gatatagcca gatgccttga 720
tatagccaga tctttttttg ttttagagct agaaatagca agttaaaata aggctagtcc 780
gtagcgcgtg cgccaattct gcagacaaat ggc 813
<210> 126
<211> 515
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (330)..(349)
<223> a, c, t, g, unknown or other
<400> 126
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccg caattgggtc tccagattgt atgtagcctg tatgtagcct gtatgtagcc 300
tgtatgtagc ctgtatgtaa gatctcaccn nnnnnnnnnn nnnnnnnnng tttaagagct 360
atgctggaaa cagcatagca agtttaaata aggctagtcc gttatcaact tgaaaaagtg 420
gcaccgagtc ggtgcttttt tgttttagag ctagaaatag caagttaaaa taaggctagt 480
ccgtagcgcg tgcgccaatt ctgcagacaa atggc 515
<210> 127
<211> 510
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 127
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag attgtatgta gtctattgat atagtcttgt ctatgtatgt agtctattga 420
tataagatct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgta 480
gcgcgtgcgc caattctgca gacaaatggc 510
<210> 128
<211> 678
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 128
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag attgtatgta gtctattgat atagtcttgt ctatgtatgt agtctattga 420
tataagattg tatgtagtct attgatatag tcttgtctat gtatgtagtc tattgatata 480
agattgtatg tagtctattg atatagtctt gtctatgtat gtagtctatt gatataagat 540
tgtatgtagt ctattgatat agtcttgtct atgtatgtag tctattgata taagatcttt 600
ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtagc gcgtgcgcca 660
attctgcaga caaatggc 678
<210> 129
<211> 566
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (250)..(269)
<223> a, c, t, g, unknown or other
<400> 129
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300
agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360
gggtctccag attgtatgta gtctattgat atagtcttgt ctatgtatgt agtctattga 420
tataagattg tatgtagtct attgatatag tcttgtctat gtatgtagtc tattgatata 480
agatcttttt ttgttttaga gctagaaata gcaagttaaa ataaggctag tccgtagcgc 540
gtgcgccaat tctgcagaca aatggc 566
<210> 130
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 130
gttctcttgc tgaaagctcg a 21
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 131
gcttttctct atcactgata 20
<210> 132
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 132
gcatacttct gcctgctggg gagcctg 27
<210> 133
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 133
gaaagtcccc aggctcccca gc 22
<210> 134
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 134
gcatctcaat tagtcagcaa cc 22
<210> 135
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 135
gttagggtta gggttagggt ta 22
<210> 136
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 136
gttgaggcct tcgttggaaa c 21
<210> 137
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 137
gaagagtgga ggccgtgcgc gg 22
<210> 138
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 138
gcaagcaagg gaagcgacaa gg 22
<210> 139
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 139
gatgtttcag gactaggctg a 21
<210> 140
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 140
gagctgggcc aggagaggag a 21
<210> 141
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 141
gaggggtctg tggagagttt 20
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 142
ggcttggtgt attcagaatg 20
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 143
gtagagatgc cgccccgccc 20
<210> 144
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 144
ggccccgccc cctggatggg 20
<210> 145
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 145
ggggggagaa actgaggcga 20
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 146
ggtggtggca atggtgtctg 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 147
gacacaactg gcgcccctcc 20
<210> 148
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 148
ggcccctact tccccttcaa 20
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 149
gagtgataag acacccgctt 20
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 150
gcctgggagg gactggggga 20
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 151
ggacaatccc ggtccccaga 20
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 152
ggtctgccgg aaggtctaca 20
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 153
ggcaggtaga ttatggggcc 20
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 154
gaagacggcc tctcagagga 20
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 155
gtatttctgg cctgggcaag 20
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 156
gcatgtgacg ggggctgtca 20
<210> 157
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 157
gctgccgggt tttgcatgaa 20
<210> 158
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 158
gccggccgcg cgggggaggc 20
<210> 159
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 159
ggcaggcgag gagggggagg 20
<210> 160
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 160
gcatacttct gcctgctggg gagcctg 27
<210> 161
<211> 1399
<212> PRT
<213> Streptococcus pyogenes
<400> 161
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
20 25 30
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
35 40 45
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
50 55 60
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
65 70 75 80
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
85 90 95
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
100 105 110
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
115 120 125
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
130 135 140
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
145 150 155 160
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
165 170 175
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
180 185 190
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
195 200 205
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
210 215 220
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
225 230 235 240
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
245 250 255
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
260 265 270
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
275 280 285
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
290 295 300
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
305 310 315 320
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
325 330 335
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
340 345 350
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
355 360 365
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
370 375 380
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
385 390 395 400
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
405 410 415
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
420 425 430
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
435 440 445
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
450 455 460
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
465 470 475 480
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
485 490 495
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
500 505 510
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
515 520 525
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
530 535 540
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
545 550 555 560
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
565 570 575
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
580 585 590
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
595 600 605
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
610 615 620
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
625 630 635 640
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
645 650 655
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
660 665 670
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
675 680 685
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
690 695 700
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
705 710 715 720
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
725 730 735
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
740 745 750
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
755 760 765
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
770 775 780
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
785 790 795 800
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
805 810 815
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
820 825 830
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
835 840 845
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln
850 855 860
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
865 870 875 880
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
885 890 895
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
900 905 910
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
915 920 925
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
930 935 940
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
945 950 955 960
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
965 970 975
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
980 985 990
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
995 1000 1005
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1010 1015 1020
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1025 1030 1035
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1040 1045 1050
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1055 1060 1065
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1070 1075 1080
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1085 1090 1095
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1100 1105 1110
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1115 1120 1125
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1130 1135 1140
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1145 1150 1155
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1160 1165 1170
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1175 1180 1185
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1190 1195 1200
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1205 1210 1215
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1220 1225 1230
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1235 1240 1245
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1250 1255 1260
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1265 1270 1275
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1280 1285 1290
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1295 1300 1305
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1310 1315 1320
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1325 1330 1335
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1340 1345 1350
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1370 1375 1380
Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala
1385 1390 1395
Ser
<210> 162
<211> 1399
<212> PRT
<213> Streptococcus pyogenes
<400> 162
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly
20 25 30
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
35 40 45
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
50 55 60
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
65 70 75 80
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
85 90 95
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
100 105 110
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
115 120 125
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
130 135 140
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
145 150 155 160
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
165 170 175
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
180 185 190
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
195 200 205
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
210 215 220
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
225 230 235 240
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
245 250 255
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
260 265 270
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
275 280 285
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
290 295 300
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
305 310 315 320
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
325 330 335
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
340 345 350
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
355 360 365
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
370 375 380
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
385 390 395 400
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
405 410 415
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
420 425 430
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
435 440 445
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
450 455 460
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
465 470 475 480
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
485 490 495
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
500 505 510
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
515 520 525
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
530 535 540
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
545 550 555 560
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
565 570 575
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
580 585 590
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
595 600 605
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
610 615 620
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
625 630 635 640
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
645 650 655
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
660 665 670
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
675 680 685
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
690 695 700
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
705 710 715 720
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
725 730 735
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
740 745 750
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
755 760 765
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
770 775 780
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
785 790 795 800
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
805 810 815
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
820 825 830
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
835 840 845
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln
850 855 860
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
865 870 875 880
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
885 890 895
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
900 905 910
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
915 920 925
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
930 935 940
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
945 950 955 960
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
965 970 975
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
980 985 990
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
995 1000 1005
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1010 1015 1020
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1025 1030 1035
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1040 1045 1050
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1055 1060 1065
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1070 1075 1080
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1085 1090 1095
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1100 1105 1110
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1115 1120 1125
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1130 1135 1140
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1145 1150 1155
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1160 1165 1170
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1175 1180 1185
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1190 1195 1200
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1205 1210 1215
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1220 1225 1230
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1235 1240 1245
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1250 1255 1260
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1265 1270 1275
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1280 1285 1290
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1295 1300 1305
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1310 1315 1320
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1325 1330 1335
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1340 1345 1350
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1370 1375 1380
Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala
1385 1390 1395
Ser
<210> 163
<211> 1399
<212> PRT
<213> Streptococcus pyogenes
<400> 163
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
20 25 30
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
35 40 45
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
50 55 60
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
65 70 75 80
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
85 90 95
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
100 105 110
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
115 120 125
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
130 135 140
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
145 150 155 160
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
165 170 175
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
180 185 190
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
195 200 205
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
210 215 220
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
225 230 235 240
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
245 250 255
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
260 265 270
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
275 280 285
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
290 295 300
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
305 310 315 320
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
325 330 335
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
340 345 350
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
355 360 365
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
370 375 380
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
385 390 395 400
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
405 410 415
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
420 425 430
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
435 440 445
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
450 455 460
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
465 470 475 480
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
485 490 495
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
500 505 510
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
515 520 525
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
530 535 540
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
545 550 555 560
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
565 570 575
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
580 585 590
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
595 600 605
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
610 615 620
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
625 630 635 640
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
645 650 655
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
660 665 670
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
675 680 685
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
690 695 700
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
705 710 715 720
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
725 730 735
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
740 745 750
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
755 760 765
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
770 775 780
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
785 790 795 800
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
805 810 815
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
820 825 830
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
835 840 845
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln
850 855 860
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
865 870 875 880
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
885 890 895
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
900 905 910
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
915 920 925
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
930 935 940
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
945 950 955 960
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
965 970 975
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
980 985 990
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
995 1000 1005
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1010 1015 1020
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1025 1030 1035
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1040 1045 1050
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1055 1060 1065
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1070 1075 1080
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1085 1090 1095
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1100 1105 1110
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1115 1120 1125
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1130 1135 1140
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1145 1150 1155
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1160 1165 1170
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1175 1180 1185
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1190 1195 1200
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1205 1210 1215
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1220 1225 1230
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1235 1240 1245
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1250 1255 1260
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1265 1270 1275
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1280 1285 1290
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1295 1300 1305
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1310 1315 1320
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1325 1330 1335
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1340 1345 1350
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1370 1375 1380
Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala
1385 1390 1395
Ser
<210> 164
<211> 1399
<212> PRT
<213> Streptococcus pyogenes
<400> 164
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg
1 5 10 15
Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly
20 25 30
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
35 40 45
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
50 55 60
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
65 70 75 80
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
85 90 95
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
100 105 110
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
115 120 125
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
130 135 140
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
145 150 155 160
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
165 170 175
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
180 185 190
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
195 200 205
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
210 215 220
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
225 230 235 240
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
245 250 255
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
260 265 270
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
275 280 285
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
290 295 300
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
305 310 315 320
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
325 330 335
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
340 345 350
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
355 360 365
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
370 375 380
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
385 390 395 400
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
405 410 415
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
420 425 430
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
435 440 445
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
450 455 460
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
465 470 475 480
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
485 490 495
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
500 505 510
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
515 520 525
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
530 535 540
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
545 550 555 560
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
565 570 575
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
580 585 590
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
595 600 605
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
610 615 620
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
625 630 635 640
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
645 650 655
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
660 665 670
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
675 680 685
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
690 695 700
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
705 710 715 720
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
725 730 735
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
740 745 750
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
755 760 765
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
770 775 780
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
785 790 795 800
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
805 810 815
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
820 825 830
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
835 840 845
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln
850 855 860
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
865 870 875 880
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
885 890 895
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
900 905 910
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
915 920 925
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
930 935 940
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
945 950 955 960
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
965 970 975
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
980 985 990
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
995 1000 1005
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1010 1015 1020
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1025 1030 1035
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1040 1045 1050
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1055 1060 1065
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1070 1075 1080
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1085 1090 1095
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1100 1105 1110
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1115 1120 1125
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1130 1135 1140
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1145 1150 1155
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1160 1165 1170
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1175 1180 1185
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1190 1195 1200
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1205 1210 1215
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1220 1225 1230
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1235 1240 1245
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1250 1255 1260
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1265 1270 1275
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1280 1285 1290
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1295 1300 1305
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1310 1315 1320
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1325 1330 1335
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1340 1345 1350
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1370 1375 1380
Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala
1385 1390 1395
Ser
<210> 165
<211> 641
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 165
Met Val Arg Gly Ser His His His His His His Gly Met Ala Ser Met
1 5 10 15
Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys
20 25 30
Asp Pro Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg
35 40 45
Met Lys Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys
50 55 60
Thr Gly Glu Gly Glu Gly Asn Pro Tyr Met Gly Thr Gln Thr Met Arg
65 70 75 80
Ile Lys Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu
85 90 95
Ala Thr Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys
100 105 110
Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp
115 120 125
Glu Arg Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln
130 135 140
Asp Thr Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg
145 150 155 160
Gly Val Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys
165 170 175
Gly Trp Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu
180 185 190
Arg Gly Tyr Thr His Met Ala Leu Lys Val Asp Gly Gly Gly His Leu
195 200 205
Ser Cys Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn
210 215 220
Ile Lys Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu
225 230 235 240
Glu Glu Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val
245 250 255
Ala Lys Phe Ala Gly Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys Gly
260 265 270
Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg
275 280 285
Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn
290 295 300
Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu
305 310 315 320
Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu
325 330 335
Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln
340 345 350
Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln
355 360 365
Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu
370 375 380
Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser
385 390 395 400
Arg Val Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn
405 410 415
Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp
420 425 430
Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro
435 440 445
Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala
450 455 460
Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu
465 470 475 480
His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln
485 490 495
His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln
500 505 510
His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala
515 520 525
Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser
530 535 540
Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala
545 550 555 560
Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala
565 570 575
Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys
580 585 590
Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys
595 600 605
Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His
610 615 620
Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu
625 630 635 640
Gly
<210> 166
<211> 641
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 166
Met Val Arg Gly Ser His His His His His His Gly Met Ala Ser Met
1 5 10 15
Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys
20 25 30
Asp Pro Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg
35 40 45
Met Lys Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys
50 55 60
Thr Gly Glu Gly Glu Gly Asn Pro Tyr Met Gly Thr Gln Thr Met Arg
65 70 75 80
Ile Lys Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu
85 90 95
Ala Thr Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys
100 105 110
Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp
115 120 125
Glu Arg Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln
130 135 140
Asp Thr Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg
145 150 155 160
Gly Val Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys
165 170 175
Gly Trp Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu
180 185 190
Arg Gly Tyr Thr His Met Ala Leu Lys Val Asp Gly Gly Gly His Leu
195 200 205
Ser Cys Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn
210 215 220
Ile Lys Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu
225 230 235 240
Glu Glu Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val
245 250 255
Ala Lys Phe Ala Gly Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys Gly
260 265 270
Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg
275 280 285
Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn
290 295 300
Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu
305 310 315 320
Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu
325 330 335
Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln
340 345 350
Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln
355 360 365
Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu
370 375 380
Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys
385 390 395 400
Arg Val Ile Gln Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn
405 410 415
Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp
420 425 430
Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro
435 440 445
Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala
450 455 460
Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu
465 470 475 480
His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln
485 490 495
His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu
500 505 510
His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala
515 520 525
Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn
530 535 540
Asn Val Val Gln Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala
545 550 555 560
Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala
565 570 575
Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys
580 585 590
Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys
595 600 605
Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His
610 615 620
Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu
625 630 635 640
Gly
<210> 167
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 167
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser
225 230 235 240
Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser
245 250 255
Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg
260 265 270
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
275 280 285
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
290 295 300
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
305 310 315 320
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
325 330 335
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
340 345 350
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
355 360 365
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu
370 375 380
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
385 390 395 400
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
405 410 415
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
420 425 430
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
435 440 445
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
450 455 460
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
465 470 475 480
Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu
485 490 495
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
500 505 510
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu
515 520 525
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
530 535 540
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
545 550 555 560
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
565 570 575
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
580 585 590
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
595 600 605
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
610 615 620
<210> 168
<211> 621
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 168
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser
225 230 235 240
Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser
245 250 255
Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg
260 265 270
Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn
275 280 285
Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp
290 295 300
Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro
305 310 315 320
Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln
325 330 335
Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu
340 345 350
Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly
355 360 365
His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln
370 375 380
Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg
385 390 395 400
Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn
405 410 415
His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln
420 425 430
Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His
435 440 445
Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro
450 455 460
Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln
465 470 475 480
Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu
485 490 495
His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly
500 505 510
Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln
515 520 525
Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp
530 535 540
Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met
545 550 555 560
Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val
565 570 575
Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His
580 585 590
Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys
595 600 605
Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly
610 615 620
<210> 169
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 169
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser
355 360 365
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
370 375 380
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
385 390 395 400
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
405 410 415
Asp Leu Asp Met Leu Tyr Ile Asp
420
<210> 170
<211> 424
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 170
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser
355 360 365
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
370 375 380
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
385 390 395 400
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
405 410 415
Asp Leu Asp Met Leu Tyr Ile Asp
420
<210> 171
<211> 709
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 171
Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg
1 5 10 15
Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln
20 25 30
Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His
35 40 45
Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu
50 55 60
Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met
65 70 75 80
Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly
85 90 95
Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val
100 105 110
Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala
115 120 125
Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu
130 135 140
Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val
145 150 155 160
Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile
165 170 175
Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr
180 185 190
Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln
195 200 205
Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val
210 215 220
Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly
225 230 235 240
Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val
245 250 255
Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys
260 265 270
Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val
275 280 285
Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys
290 295 300
Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu
305 310 315 320
Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala
325 330 335
Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu
340 345 350
Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Gly
355 360 365
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Pro Lys
370 375 380
Lys Lys Arg Lys Val Ala Ala Ala Gly Ser Pro Ser Gly Gln Ile Ser
385 390 395 400
Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala Pro Val Leu Ala Gln
405 410 415
Thr Met Val Pro Ser Ser Ala Met Val Pro Leu Ala Gln Pro Pro Ala
420 425 430
Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln Ser Leu Ser Ala Pro
435 440 445
Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
450 455 460
Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu Gly Ala Leu Leu Gly
465 470 475 480
Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu Ala Ser Val Asp Asn
485 490 495
Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val Ser Met Ser His Ser
500 505 510
Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu
515 520 525
Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala Pro Thr Pro Leu Gly
530 535 540
Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp Glu Asp Phe Ser Ser
545 550 555 560
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Ser
565 570 575
Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val Asp Thr Ser Ala Leu
580 585 590
Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro Asp Met Ser Leu Pro
595 600 605
Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu Leu Leu Ser Pro Gln
610 615 620
Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser Ser Pro Asp Ser Gly
625 630 635 640
Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu Phe Leu Leu Asp Pro
645 650 655
Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro Val Leu Phe Glu Leu
660 665 670
Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly Phe Ala Glu Asp Pro
675 680 685
Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro Lys Ala Lys Asp Pro
690 695 700
Thr Val Ser Ile Asp
705
<210> 172
<211> 456
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 172
Met Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Met Asp Ala
1 5 10 15
Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val
20 25 30
Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln
35 40 45
Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val
50 55 60
Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu
65 70 75 80
Lys Gly Glu Glu Pro Trp Leu Val Ser Arg Gly Ser Ile Val Gly Ile
85 90 95
Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu
100 105 110
Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu
115 120 125
Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg
130 135 140
Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu
145 150 155 160
Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val
165 170 175
Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu
180 185 190
Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu
195 200 205
Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Phe
210 215 220
Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His
225 230 235 240
Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys
245 250 255
Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala
260 265 270
Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg
275 280 285
Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro
290 295 300
Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln
305 310 315 320
Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly Arg Pro Glu
325 330 335
Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu
340 345 350
Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys Val Thr His
355 360 365
Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met
370 375 380
Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr
385 390 395 400
Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln
405 410 415
Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg
420 425 430
Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr
435 440 445
Met Lys Asn Gly Val Asp Leu Gly
450 455
<210> 173
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 173
gccagatgcc 10
Claims (51)
- 폴리뉴클레오티드에 있어서,
(1) 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열;
(2) Cas9-결합 서열; 및
(3) PUF 영역-결합 서열(PBS)의 하나 또는 그 이상의 카피로서, 상기 PBS의 하나 또는 그 이상의 카피는 각각 같거나 다른 PUF 영역에 결합하는 것
을 포함하고,
Cas9 단백질은 상기 Cas9-결합 서열에 결합함으로써 상기 폴리뉴클레오티드와 복합체를 형성할 수 있는 것인, 폴리뉴클레오티드. - 제1항에 있어서, 상기 Cas9 단백질은 상기 폴리뉴클레오티드와 복합체를 형성하면 DNA-결합능을 보유하는 뉴클레아제-결핍 dCas9 단백질인 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 Cas9 단백질이 상기 폴리뉴클레오티드와 복합체를 형성할 경우 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 염기 쌍을 이루는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 전사 조절 요소를 포함하거나 이에 인접한 것인, 폴리뉴클레오티드.
- 제4항에 있어서, 상기 전사 조절 요소는 코어 프로모터, 근거리 프로모터 요소, 인핸서, 사일렌서, 인슐레이터 및 좌위 조절 부위 중에서 하나 또는 그 이상을 포함하는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 텔로미어 서열, 동원체 또는 반복성 게놈 서열을 포함하거나 이에 인접한 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 게놈 마커 서열(또는 관심 게놈 좌위)을 포함하거나 이에 인접한 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥인 5' -CCN-3'(여기서 N은 임의의 DNA 뉴클레오티드)의 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)의 바로 옆 3'인 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 12-22 뉴클레오티드(nucleotides, nts), 14-20 뉴클레오티드, 16-20 뉴클레오티드, 18-20 뉴클레오티드, 또는 12, 14, 16, 18, 또는 20 뉴클레오티드에 걸쳐 상보적인 것인, 폴리뉴클레오티드.
- 제9항에 있어서, 상기 DNA-타겟팅 서열은 타겟 폴리뉴클레오티드 서열에 50, 60, 70, 80, 90 또는 95-100% 상보적인 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 DNA-타겟팅 서열은 5’말단 뉴클레오티드 G를 갖는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 DNA-타겟팅 서열을 상기 Cas9-결합 서열에 연결하는 링커 서열을 추가로 포함하는, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 Cas9-결합 서열은 머리핀 구조를 형성하는 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 Cas9-결합 서열은 37-47 뉴클레오티드 또는 42 뉴클레오티드인 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 Cas9 단백질은 야생형 Cas9의 하나 또는 둘 모두의 엔도뉴클레아제 촉매 부위(RuvC 및 HNH)에서의 포인트 돌연변이(point mutation)로 인해 엔도뉴클레아제 활성이 결여된 Cas9 틈내기 효소 또는 dCas9 단백질인 것인, 폴리뉴클레오티드.
- 제15항에 있어서, 상기 포인트 돌연변이는 D10A 및 H840A인 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 PBS의 상기 하나 또는 그 이상의 카피는 각각 8 뉴클레오티드인 것인, 폴리뉴클레오티드.
- 제1항에 있어서, 같거나 다른 PBS의 10, 15, 20, 25, 30, 35, 40, 45, 46, 47, 48, 49 또는 50 카피, 또는 6-50, 6-45, 6-40, 6-35, 6-10, 10-20 카피를 포함하는, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 PUF 영역 PUF(3-2)에 의해 결합될 수 있는 5'-UGUAUGUA-3' 서열의 PBS를 포함하는, 폴리뉴클레오티드.
- 제1항에 있어서, 상기 PUF 영역 PUF(6-2/7-2)에 의해 결합될 수 있는 5'-UUGAUAUA-3' 서열의 PBS를 포함하는, 폴리뉴클레오티드.
- 제1항의 폴리뉴클레오티드를 코딩하는 벡터.
- 제21항에 있어서, 상기 폴리뉴클레오티드의 전사는 항시성 프로모터(constitutive promoter) 또는 유도성 프로모터(inducible promoter)의 조절 하에 있는 것인, 벡터.
- 제20항에 있어서, 상기 벡터는 포유류; 새, 어류, 곤충, 벌레, 효모 또는 박테리아의 세포에서 활성이 있는 것인, 벡터.
- 제21항에 있어서, 상기 벡터는 복수로 제공되고, 상기 벡터들 중 2 개의 벡터는 코딩된 폴리뉴클레오티드에서 이들 각각의 DNA-타겟팅 서열, Cas9-결합 서열 및/또는 상기 PBS의 카피 수, 동일성 또는 상대적 순서가 다른 것인, 벡터.
- 제1항의 폴리뉴클레오티드 및 Cas9 단백질을 포함하는 복합체.
- 제25항에 있어서, 상기 하나 또는 그 이상의 PBS에 결합된 하나 또는 그 이상의 PUF 영역을 추가로 포함하는, 복합체.
- 제26항에 있어서, 상기 PUF 영역의 각각은 이펙터 영역에 융합되어 있는 것인, 복합체.
- 제27항에 있어서, 상기 이펙터 영역은 독립적으로 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것인, 복합체.
- 제27항에 있어서, 최소한 두 개 이상의 상기 PUF 영역이 다른 이펙터 영역에 융합된 것인, 복합체.
- 제25항에 있어서, 상기 Cas9 단백질, 상기 PUF 영역 및/또는 상기 이펙터 영역은 핵 위치화 서열(nuclear localization sequence, NLS)을 추가로 포함하는 것인, 복합체.
- 제25항에 있어서, 상기 DNA-타겟팅 서열을 통하여 상기 타겟 폴리뉴클레오티드 서열에 결합된, 복합체.
- 제21항의 벡터를 포함하는 숙주 세포.
- 제32항에 있어서, 상기 Cas9 단백질을 코딩하는 제2 벡터를 추가로 포함하는, 숙주 세포.
- 제33항에 있어서, 상기 제2 벡터는 상기 Cas9 단백질에 융합된 이펙터 영역을 추가로 코딩하는 것인, 숙주 세포.
- 제33항에 있어서, 상기 Cas9 단백질의 발현은 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있는 것인, 숙주 세포.
- 제32항에 있어서, 각각 이펙터 영역에 융합된 상기 하나 또는 그 이상의 PUF 영역을 코딩하는 제3 벡터를 추가로 포함하는 것인, 숙주 세포.
- 제36항에 있어서, 상기 하나 또는 그 이상의 PUF 영역의 발현은 독립적으로 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있는 것인, 숙주 세포.
- 제34항 내지 제37항 중 어느 한 항에 있어서, 상기 이펙터 영역은 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것인, 숙주 세포.
- 제33항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 벡터는 상기 Cas9 단백질 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하거나, 및/또는 상기 제3 벡터가 상기 PUF 영역 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하는 것인, 숙주 세포.
- 제33항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 벡터는 상기 벡터와 동일하거나, 및/또는 상기 제3 벡터는 상기 벡터 또는 상기 제2 벡터와 동일한 것인, 숙주 세포.
- 제32항 내지 제37항 중 어느 한 항에 있어서, 살아 있는 동물에 있는, 숙주 세포.
- 제32항 내지 제37항 중 어느 한 항에 있어서, 배양된 세포인, 숙주 세포.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- (1) 제1항 내지 제20항 중 어느 한 항의 폴리뉴클레오티드 또는 제21항 내지 제23항 중 어느 한 항의 벡터;
(2) 상기 Cas9 단백질을 코딩하는 제2 벡터; 및
(3) 각각 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역을 코딩하는 제3 벡터
를 포함하는, 키트. - 제50항에 있어서, 상기 벡터들의 세포 도입을 용이하게 하기 위하여 형질전환, 형질감염, 또는 감염 시약들을 추가로 포함하는, 키트.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562132644P | 2015-03-13 | 2015-03-13 | |
US62/132,644 | 2015-03-13 | ||
US201562221249P | 2015-09-21 | 2015-09-21 | |
US62/221,249 | 2015-09-21 | ||
PCT/US2016/021491 WO2016148994A1 (en) | 2015-03-13 | 2016-03-09 | A three-component crispr/cas complex system and uses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170124601A KR20170124601A (ko) | 2017-11-10 |
KR102004076B1 true KR102004076B1 (ko) | 2019-07-25 |
Family
ID=55642857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177029329A KR102004076B1 (ko) | 2015-03-13 | 2016-03-09 | 3-성분 crispr/cas 복합체 시스템 및 그 용도 |
Country Status (12)
Country | Link |
---|---|
US (2) | US11434484B2 (ko) |
EP (2) | EP3858992A1 (ko) |
JP (3) | JP6588995B2 (ko) |
KR (1) | KR102004076B1 (ko) |
CN (1) | CN107922942B (ko) |
AU (2) | AU2016233648B2 (ko) |
CA (2) | CA3091771A1 (ko) |
ES (1) | ES2886901T3 (ko) |
HK (2) | HK1249545A1 (ko) |
IL (2) | IL254428B (ko) |
SG (2) | SG10202008443UA (ko) |
WO (1) | WO2016148994A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023224327A1 (ko) * | 2022-05-20 | 2023-11-23 | 한국생명공학연구원 | 오토라이신을 활용한 미세조류의 유전자 교정 효율을 증대시키기 위한 시스템 및 방법 |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6261500B2 (ja) | 2011-07-22 | 2018-01-17 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ヌクレアーゼ切断特異性の評価および改善 |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
US20190225955A1 (en) | 2015-10-23 | 2019-07-25 | President And Fellows Of Harvard College | Evolved cas9 proteins for gene editing |
KR102547316B1 (ko) | 2016-08-03 | 2023-06-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US11780895B2 (en) | 2016-09-13 | 2023-10-10 | The Jackson Laboratory | Targeted DNA demethylation and methylation |
KR20240007715A (ko) | 2016-10-14 | 2024-01-16 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵염기 에디터의 aav 전달 |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
US11268082B2 (en) | 2017-03-23 | 2022-03-08 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable DNA binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
WO2019014564A1 (en) | 2017-07-14 | 2019-01-17 | Editas Medicine, Inc. | SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES |
WO2019023680A1 (en) | 2017-07-28 | 2019-01-31 | President And Fellows Of Harvard College | METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE) |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
KR102013798B1 (ko) * | 2017-10-25 | 2019-08-23 | 성균관대학교산학협력단 | 노화 모델 제조 방법 및 이에 의해 제조된 세포 또는 동물 노화 모델 |
EP3755726A4 (en) * | 2018-02-23 | 2022-07-20 | Shanghaitech University | FUSION PROTEINS FOR BASIC EDITION |
WO2019183630A2 (en) * | 2018-03-23 | 2019-09-26 | The Trustees Of Columbia University In The City Of New York | Gene editing for autosomal dominant diseases |
EP3575401A1 (en) * | 2018-05-29 | 2019-12-04 | Ecole Polytechnique Federale De Lausanne (Epfl) | Methods of treating or preventing an aging-related disease |
CN109055375B (zh) * | 2018-07-26 | 2021-11-12 | 东南大学 | 一种crispr辅助反式增强子激活基因表达的方法及其应用 |
WO2020041172A1 (en) * | 2018-08-21 | 2020-02-27 | The Jackson Laboratory | Methods and compositions for recruiting dna repair proteins |
CA3130488A1 (en) | 2019-03-19 | 2020-09-24 | David R. Liu | Methods and compositions for editing nucleotide sequences |
CN114555826A (zh) * | 2019-08-16 | 2022-05-27 | 杰克逊实验室 | 非重复基因组基因座的活细胞成像 |
WO2021138560A2 (en) | 2020-01-02 | 2021-07-08 | The Trustees Of Columbia University In The City Of New York | Programmable and portable crispr-cas transcriptional activation in bacteria |
CN115485305A (zh) * | 2020-02-28 | 2022-12-16 | 杰克逊实验室 | 癌细胞中裂解基因的激活 |
GB2614813A (en) | 2020-05-08 | 2023-07-19 | Harvard College | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
EP4176058A1 (en) | 2020-08-07 | 2023-05-10 | The Jackson Laboratory | Targeted sequence insertion compositions and methods |
WO2022272294A1 (en) * | 2021-06-23 | 2022-12-29 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods for efficient retron recruitment to dna breaks |
CN113637658A (zh) * | 2021-08-19 | 2021-11-12 | 中国农业科学院棉花研究所 | 基于dCas9-oToV的基因转录系统及其应用 |
CN114058641B (zh) * | 2022-01-17 | 2022-04-01 | 苏州大学 | 一种载体系统和应用及通过其降解目的蛋白的方法 |
US20230340582A1 (en) * | 2022-04-07 | 2023-10-26 | Trustees Of Boston University | Compositions and methods relating to nucleic acid interaction reporters |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5585362A (en) | 1989-08-22 | 1996-12-17 | The Regents Of The University Of Michigan | Adenovirus vectors for gene therapy |
DE69233013T2 (de) | 1991-08-20 | 2004-03-04 | The Government Of The United States Of America As Represented By The Secretary Of National Institute Of Health, Office Of Technology Transfer | Adenovirus vermittelter gentransfer in den gastrointestinaltrakt |
US5252479A (en) | 1991-11-08 | 1993-10-12 | Research Corporation Technologies, Inc. | Safe vector for gene therapy |
FR2688514A1 (fr) | 1992-03-16 | 1993-09-17 | Centre Nat Rech Scient | Adenovirus recombinants defectifs exprimant des cytokines et medicaments antitumoraux les contenant. |
EP1024198A3 (en) | 1992-12-03 | 2002-05-29 | Genzyme Corporation | Pseudo-adenoviral vectors for the gene therapy of haemophiliae |
DE69434486T2 (de) | 1993-06-24 | 2006-07-06 | Advec Inc. | Adenovirus vektoren für gentherapie |
ES2256842T4 (es) | 1993-10-25 | 2007-02-01 | Canji, Inc. | Vector de adenovirus recombinante y metodos de uso. |
US7078387B1 (en) | 1998-12-28 | 2006-07-18 | Arch Development Corp. | Efficient and stable in vivo gene transfer to cardiomyocytes using recombinant adeno-associated virus vectors |
EP1083231A1 (en) | 1999-09-09 | 2001-03-14 | Introgene B.V. | Smooth muscle cell promoter and uses thereof |
US7169874B2 (en) | 2001-11-02 | 2007-01-30 | Bausch & Lomb Incorporated | High refractive index polymeric siloxysilane compositions |
EP2393484A1 (en) | 2009-02-06 | 2011-12-14 | Egalet Ltd. | Immediate release composition resistant to abuse by intake of alcohol |
WO2011160052A2 (en) * | 2010-06-18 | 2011-12-22 | The University Of North Carolina At Chapel Hill | Methods and compositions for sequence specific rna endonucleases |
US9580714B2 (en) * | 2010-11-24 | 2017-02-28 | The University Of Western Australia | Peptides for the specific binding of RNA targets |
PE20190844A1 (es) | 2012-05-25 | 2019-06-17 | Emmanuelle Charpentier | Modulacion de transcripcion con arn de direccion a adn generico |
BR112015000150A2 (pt) | 2012-07-06 | 2017-06-27 | Egalet Ltd | composições farmacêuticas dissuasoras de abuso de liberação controlada |
US11780895B2 (en) * | 2016-09-13 | 2023-10-10 | The Jackson Laboratory | Targeted DNA demethylation and methylation |
-
2016
- 2016-03-09 CA CA3091771A patent/CA3091771A1/en active Pending
- 2016-03-09 ES ES16713184T patent/ES2886901T3/es active Active
- 2016-03-09 WO PCT/US2016/021491 patent/WO2016148994A1/en active Application Filing
- 2016-03-09 AU AU2016233648A patent/AU2016233648B2/en active Active
- 2016-03-09 SG SG10202008443UA patent/SG10202008443UA/en unknown
- 2016-03-09 EP EP21157844.8A patent/EP3858992A1/en active Pending
- 2016-03-09 SG SG11201707393SA patent/SG11201707393SA/en unknown
- 2016-03-09 CN CN201680027107.2A patent/CN107922942B/zh active Active
- 2016-03-09 KR KR1020177029329A patent/KR102004076B1/ko active IP Right Grant
- 2016-03-09 JP JP2017566611A patent/JP6588995B2/ja active Active
- 2016-03-09 CA CA2979567A patent/CA2979567C/en active Active
- 2016-03-09 EP EP16713184.6A patent/EP3268472B1/en active Active
-
2017
- 2017-09-11 IL IL254428A patent/IL254428B/en active IP Right Grant
- 2017-09-13 US US15/702,944 patent/US11434484B2/en active Active
-
2018
- 2018-07-11 HK HK18108993.0A patent/HK1249545A1/zh unknown
- 2018-10-15 HK HK18113197.4A patent/HK1254126A1/zh unknown
-
2019
- 2019-06-26 JP JP2019118495A patent/JP6867440B2/ja active Active
-
2020
- 2020-01-14 AU AU2020200256A patent/AU2020200256B2/en active Active
- 2020-08-24 IL IL276894A patent/IL276894B2/en unknown
- 2020-11-19 JP JP2020192362A patent/JP2021036899A/ja active Pending
-
2022
- 2022-07-28 US US17/815,621 patent/US20230071712A1/en active Pending
Non-Patent Citations (1)
Title |
---|
Cell Research, Xibao Yanjiu 26(2):254-257 (2016. 1. 15.) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023224327A1 (ko) * | 2022-05-20 | 2023-11-23 | 한국생명공학연구원 | 오토라이신을 활용한 미세조류의 유전자 교정 효율을 증대시키기 위한 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP6588995B2 (ja) | 2019-10-09 |
CN107922942B (zh) | 2021-08-31 |
IL276894A (en) | 2020-10-29 |
CA2979567A1 (en) | 2016-09-22 |
KR20170124601A (ko) | 2017-11-10 |
IL276894B (en) | 2022-12-01 |
US11434484B2 (en) | 2022-09-06 |
WO2016148994A1 (en) | 2016-09-22 |
EP3268472A1 (en) | 2018-01-17 |
US20180094257A1 (en) | 2018-04-05 |
IL276894B2 (en) | 2023-04-01 |
EP3268472B1 (en) | 2021-05-05 |
AU2016233648B2 (en) | 2019-11-07 |
CA2979567C (en) | 2020-10-13 |
AU2020200256B2 (en) | 2022-03-31 |
HK1249545A1 (zh) | 2018-11-02 |
HK1254126A1 (zh) | 2019-07-12 |
AU2016233648A1 (en) | 2017-10-05 |
JP2019176877A (ja) | 2019-10-17 |
CA3091771A1 (en) | 2016-09-22 |
IL254428A0 (en) | 2017-11-30 |
JP2021036899A (ja) | 2021-03-11 |
IL254428B (en) | 2020-08-31 |
CN107922942A (zh) | 2018-04-17 |
SG10202008443UA (en) | 2020-10-29 |
WO2016148994A8 (en) | 2016-11-03 |
ES2886901T3 (es) | 2021-12-21 |
EP3858992A1 (en) | 2021-08-04 |
SG11201707393SA (en) | 2017-10-30 |
US20230071712A1 (en) | 2023-03-09 |
JP2018507713A (ja) | 2018-03-22 |
AU2020200256A1 (en) | 2020-02-06 |
JP6867440B2 (ja) | 2021-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102004076B1 (ko) | 3-성분 crispr/cas 복합체 시스템 및 그 용도 | |
US11560555B2 (en) | Engineered proteins | |
US20230227859A1 (en) | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription | |
JP2023168355A (ja) | 改良された相同組換えおよびその組成物のための方法 | |
JP2021506251A (ja) | 新規rnaプログラム可能エンドヌクレアーゼ系、ならびにゲノム編集および他の適用におけるその使用 | |
KR20220147710A (ko) | 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선 | |
CN109415729B (zh) | 具有降低毒性的基因编辑试剂 | |
CN112424348A (zh) | 新颖的rna-可编程的内切核酸酶系统及其用途 | |
JP2020534813A (ja) | 改良された相同組換えおよびその組成物のための方法 | |
Hag | Insertion of an inducible construct in the genome of human pluripotent stem cells by CRISPR-Cas9 mediated homology directed repair | |
WO2023147240A2 (en) | Variant type v crispr/cas effector polypeptides and methods of use thereof | |
CN117940560A (en) | Novel small RNA programmable endonuclease system with improved PAM specificity and uses thereof | |
Abil | Study and engineering of nucleic acid-binding repeat proteins |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |