KR102004076B1

KR102004076B1 - 3-성분 crispr/cas 복합체 시스템 및 그 용도

Info

Publication number: KR102004076B1
Application number: KR1020177029329A
Authority: KR
Inventors: 하오이 왕; 알버트 쳉; 나다니엘 질레트
Original assignee: 더 잭슨 래보라토리
Priority date: 2015-03-13
Filing date: 2016-03-09
Publication date: 2019-07-25
Also published as: JP6588995B2; CN107922942B; IL276894A; CA2979567A1; KR20170124601A; IL276894B; US11434484B2; WO2016148994A1; EP3268472A1; US20180094257A1; IL276894B2; EP3268472B1; AU2016233648B2; CA2979567C; AU2020200256B2; HK1249545A1; HK1254126A1; AU2016233648A1; JP2019176877A; CA3091771A1

Abstract

본원에 기재된 본 발명은 타겟 DNA의 특정 위치에 삼중 복합체를 조립하기 위한 조성물들과 시약들을 제공한다. 본 발명은 또한 예를 들어, 특정 좌위를 표지하고, 타겟 유전자를 발현하거나 또는 유전자 조절 네트워크를 생성하기 위하여, 상기 복합체를 사용하는 방법들을 제공한다.

Description

3-성분 CRISPR/CAS 복합체 시스템 및 그 용도

본 발명은 3-성분 CRISPR/CAS 복합체 시스템 및 그 용도에 관한 것이다.

<관련 출원의 상호 참조>

본 출원은 2015년 3월 13일에 출원된 미국 가출원 62/132,644호 및 2015년 9월 21일에 출원된 미국 가출원 62/221,249호를 우선권 주장의 기초로 한다. 상기 두 미국 가출원은 전체가 본 출원에 참고로 포함된다.

CRISPR(CRISPR)/Cas9 시스템에 있어서, Cas9 단백질 및 단일 가이드 RNA(single 가이드 RNA; sgRNA, 이하 sgRNA)는 sgRNA 상에 타겟-매칭(target-matching) 서열에 의해 특이성이 제공되는 충분한 2-성분 DNA 엔도뉴클레아제를 구성하며, 엔도뉴클레아제 활성은 상기 Cas9 단백질상에 존재한다.

뉴클레아제 영역에 돌연변이를 갖고 있는 뉴클레아제-결손 또는 뉴클레아제-결핍 Cas9 단백질(예, dCas9)은 sgRNA와 복합체를 형성할 때 DNA 결합 활성을 유지한다. dCas9 단백질은 sgRNA에 의해 매치된 부위에 단백질 융합을 통하여 이펙터 영역 또는 단백질 태그를 묶어서(tether) 위치시킴으로써 RNA-가이드된 DNA 결합 효소를 구성하게 된다. dCas9는 전사활성화 영역(예, VP64) 또는 리프레서 영역에 융합될 수 있고, sgRNA에 의해 안내되어 타겟 유전자들을 각각 활성화 또는 억제시킨다. dCas9는 또한 형광 단백질들과 융합하여 염색체 영역의 생세포(live-cell) 형광 표지를 수행할 수 있다. 그러나, 이러한 시스템들에서는 sgRNA:Cas9 짝짓기만 존재하기 때문에 오직 하나의 Cas9-이펙터 융합만이 가능하게 된다. 또한, 다수의 단백질 태그들이나 또는 이펙터 융합이 필요한 경우에는, dCas9 단백질과의 직접 융합에 의한 이펙터 또는 단백질 태그의 다량체화(multimerization)가 단백질 크기로 인해 이들 융합체들을 코딩하는 대형 DNA의 전달상의 어려움 또는 이러한 대형 DNA를 핵으로 번역 및 전좌(translocating)함에 있어서의 어려움과 같은 제약 요소들로 인해 기술적 제한이 있다.

본 발명의 목적은 3-성분 CRISPR/CAS 복합체 시스템 및 그 용도를 제공하는 것이다.

이하 기재된 본 발명은 Cas9 단백질(예, 야생형(wt) Cas9, Cas9 틈내기 효소(nickase), 또는 dCas9 단백질), 대상(subject) 폴리뉴클레오티드로서 변형된 sgRNA(예, "sgRNA-PBS") 및 이펙터 영역들 또는 단백질 태그들("PUF 영역-융합(들)]")과의 하나 또는 그 이상의 PUF 영역(들)의 융합 단백질들을 포함하는 3-성분 이펙터 또는 단백질 태그의 다중성(multiplexity) 및 중합을 가능하게 한다. sgRNA-PBS는 상기 sgRNA 스템 루프들의 하부 또는 상기 타겟-매칭 부위의 상부에 다수의 짧은 PUF(예, 8-mer) 인식 서열들을 삽입함으로써 유도될 수 있다. 각 UF 영역-이펙터 융합의 PUF 영역들은 상기 대상 폴리뉴클레오티드 상의 상기 8-mer 인식 서열을 인식하도록 프로그램될 수 있으며, 따라서 상기 PUF 영역들에 융합된 하나 또는 그 이상의 이펙터 영역들을 상기 타겟-매칭 sgRNA에 의해 인식되는 타겟 DNA의 특정 부위들로 가져올 수 있다.

상기 본 발명의 3-성분 CRISPR/카스 복합체들/시스템들은 서로 다른 3-성분 CRISPR/카스 복합체들/시스템들은 동시에 세포 또는 동물에 전달될 수 있고 각각은 직교성(orthogonality)을 가지며(즉, 다른 3-성분 CRISPR/카스 복합체들/시스템들 및 이들의 타겟 부위들로부터의 간섭없이) 한정된 타겟 부위들에서 작동될 수 있으므로 다중성의 측면에서 잇점이 있다. PUF 영역들은 어떠한 8-mer RNA 인식 서열들도 인식하도록 쉽게 프로그램될 수 있으므로, 이 시스템은 상기 RNA 인식 서열이 단지 8-mer이고 (또한 상기 RNA 인식 서열이 더 길어지면 잠재적으로 더욱 커짐)일 때 상기 다중성을 4⁸(65536)의 이론적 최대치로 확장된다.

상기 본 발명의 3-성분 CRISPR/카스 복합체들/시스템들은 또한 상기 선형 8-mer 서열의 단순성으로 인하여 Cas9:sgRNA의 DNA 결합 활성을 방해하지 않으면서도 광범위한 중합을 허용할 수 있어 중합성의 측면에서 잇점이 있다. 이러한 특징으로 인하여 PUF-융합들의 복수 개의 분자들을 상기 변형된 sgRNA 상에 조립할 수 있으며, 이펙터 또는 단백질 태그들의 국소 농도를 허용하게 된다. 이러한 특징은 형광 영상 또는 전사 조절과 같은 적용 시 특히 유용하며, 여기서 근접 상승작용은 최대 효과적 조절 또는 신호 대 잡음비(signal-to-noise ratio)를 허용한다.

본 발명의 또 다른 잇점은 화학양론적 착체 형성에 있다. 서로 상이한 8-mer 서열들은 상기 sgRNA-PBS 컨스트럭트로 질서있게 삽입될 수 있으며 이로 인해 상기 sgRNA-PBS 상에 상기 PUF-융합들의 정의된 화학양론 및 순서로 복합체를 형성하게 된다.

따라서, 본 발명의 하나의 양태는 (1)타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열; (2)Cas9-결합 서열 및 (3)하나 또는 그 이상의 카피의 PUF 영역-결합 서열(PBS)로서, 상기 하나 또는 그 이상의 카피의 PBS는 각각 같거나 다른 PUF 영역에 결합하는 것;을 포함하는폴리뉴클레오티드에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 Cas9-결합 서열에 결합함으로써 상기 폴리뉴클레오티드와 복합체를 형성할 수 있다.

본 발명에서, "Cas9 단백질"는 야생형 Cas9 단백질, 엔도뉴클레아제 활성(RuvC 및 HNH)을 위한 두 촉매 부위 중 하나가 결손되거나(defective) 활성이 결여된 Cas9 틈내기 효소및 엔도뉴클레아제 활성을 위한 두 촉매 부위가 모두 활성이 결손되거나 활성이 결여된 dCas9 단백질을 포함한다. 특정 구현예에 있어서, 상기 Cas9 단백질은 야생형(wt) Cas9이다. 특정 구현예에 있어서, 상기 Cas9 단백질은 뉴클레아제 활성이 결여 되거나 또는 뉴클레아제가 결핍되어 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 틈내기 효소(예, 이를테면, 상기 틈내기 효소는 화농성 연쇄상구균(S. Pyogenes)의 Cas9의 D10A에 해당하는 위치에 돌연변이를 가지는 Cas9 틈내기 효소; 또는 S. pyogenes의 Cas9의 H840A 에 해당하는 위치에 돌연변이를 가지는 Cas9 틈내기 효소)일 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질 은 dCas9(예, 화농성 연쇄상구균 (S. Pyogenes)의 Cas9의 D10A 및 H840A에 해당하는 위치에 돌연변이를 가지는 dCas9)일 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 야생형(wt) Cas9이 아닐 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 틈내기 효소가 아닐 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 dCas9가 아닐 수 있다.

특정 구현예에 있어서, "변형된 Cas9 단백질"은 dCas9 또는 Cas9 틈내기 효소와 같은 야생형(wt) Cas9 단백질이 아닌 Cas9을 의미할 수 있다.

특정 구현예에 있어서, 상기 dCas9 단백질은 뉴클레아제-결핍될 수 있으나 상기 폴리뉴클레오티드와 복합체를 형성할 경우에는 DNA-결합능을 보유할 수 있다.

특정 구현예에 있어서, 상기 DNA-타겟팅 서열은 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 상기 폴리뉴클레오티드와 복합체를 형성할 경우 상기 타겟 폴리뉴클레오티드 서열과 염기 쌍을 이룰 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 전사 조절 요소를 포함하거나 이에 인접한 것일 수 있다. 예를 들면, 상기 전사 조절 요소는 코어 프로모터, 근거리 프로모터 요소, 인핸서, 사일렌서, 인슐레이터 및 좌위(loci) 조절 부위 중에서 하나 또는 그 이상을 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 텔로미어 서열, 동원체(centromere) 또는 반복성 게놈 서열을 포함하거나 이에 인접한 것일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 게놈 마커 서열(또는 관심 게놈 좌위)을 포함하거나 이에 인접한 것일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥인 5'-CCN-3'(여기서, N은 임의의 DNA 뉴클레오티드)의 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)의 바로 옆 3'인 것일 수 있다.

특정 구현예에 있어서, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 약 12-22 뉴클레오티드(nucleotides, nts), 약 14-20 뉴클레오티드, 약 16-20 뉴클레오티드, 약 18-20 뉴클레오티드, 또는 약 12, 14, 16, 18, 또는 20 뉴클레오티드(바람직하기로는, 상기 상보적 부위는 12-22 뉴클레오티드의 연속 스트레치를 바람직하기로는 상기 DNA-결합 서열의 3' 말단에 포함하고)인 것일 수 있다. 예를 들면, 상기 DNA-결합 서열은 타겟 폴리뉴클레오티드 서열에 50, 60, 70, 80, 90 또는 95-100% 상보적인 것일 수 있다.

특정 구현예에 있어서, 상기 DNA-결합 서열은 5’말단 뉴클레오티드 G를 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 DNA-타겟팅 서열을 상기 Cas9-결합 서열에 연결하는 링커 서열을 추가로 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 Cas9-결합 서열은 머리핀 구조를 형성하는 것일 수 있다.

특정 구현예에 있어서, 상기 Cas9-결합 열은 약 37-47 뉴클레오티드 또는 약 42 뉴클레오티드인 것일 수 있다.

특정 구현예에 있어서, 상기 Cas9 틈내기 효소 단백질은 야생형 Cas9의 하나의 엔도뉴클레아제 촉매 부위(RuvC 및 HNH)에서의 점 돌연변이로 인해 엔도뉴클레아제 활성이 결여된 것일 수 있다. 상기 점 돌연변이는 D10A 또는 H840A일 수 있다.

특정 구현예에 있어서, 상기 dCas9 단백질은 야생형 Cas9의 두 엔도뉴클레아제 촉매 부위(RuvC 및 HNH) 모두에서의 점 돌연변이로 인해 엔도뉴클레아제 활성이 결여된 것일 수 있다. 상기 점 돌연변이는 D10A 및 H840A일 수 있다.

특정 구현예에 있어서, 상기 PBS의 상기 하나 또는 그 이상의 카피는 각각 약 8 뉴클레오티드인 것일 수 있다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드는 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 46, 47, 48, 49 또는 50 카피, 또는 1-50, 2-45, 3-40, 5-35, 5-10, 10-20 카피와 같거나 다른 PBS를 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 PUF 영역 PUF(3-2)에 의해 결합될 수 있는 상기 5'-UGUAUGUA-3' 서열의 PBS를 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 PUF 영역 PUF(6-2/7-2)에 의해 결합될 수 있는 상기 5'-UUGAUAUA-3' 서열의 PBS를 포함하는 것일 수 있다.

본 발명의 다른 하나의 양태는 상기 대상 폴리뉴클레오티드의 어느 하나를 코딩하는 벡터를 제공한다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드의 전사는 항시성(constitutive) 프로모터 또는 유도성(inducible) 프로모터의 조절 하에 있는 것일 수 있다.

특정 구현예에 있어서, 상기 벡터는 포유류(사람; 비인간 영장류; 비인간 포유류; 마우스, 쥐, 햄스터, 기니아 피그와 같은 설치류; 돼지, 양, 염소, 말, 낙타, 소와 같은 가축 포유류; 또는 고양이나 개와 같은 애완용 포유류); 새, 어류, 곤충, 벌레, 효모, 또는 박테리아 세포에서 활성을 갖는 것일 수 있다.

관련 양태에서, 본 발명은 상기 대상 벡터들 중 어느 하나를 다수 개 제공하며, 여기서 상기 벡터들 중 2 개의 벡터는 이들 각각의 DNA-타겟팅 서열, Cas9-결합 서열의 코딩된 폴리뉴클레오티드 및/또는 상기 PBS의 카피 수, 동일성(identity), 또는 상대적 순서(relative order)에 있어서 다른 것일 수 있다.

본 발명의 또 다른 하나의 양태는 상기 대상 폴리뉴클레오티드 및 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 포함하는 복합체를 제공한다.

특정 구현예에 있어서, 상기 복합체는 상기 하나 또는 그 이상의 PBS에 결합된 하나 또는 그 이상의 PUF 영역을 추가로 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 PUF 영역의 각각은 이펙터 영역에 융합되어 있는 것일 수 있다.

특정 구현예에 있어서, 상기 이펙터 영역은 독립적으로 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것일 수 있다.

특정 구현예에 있어서, 상기 복합체는 최소한 두 개 이상의 상기 PUF 영역이다른 이펙터 영역에 융합된 것일 수 있다.

특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질), 상기 PUF 영역 및/또는 상기 이펙터 영역은 핵 위치화 서열(nuclear localization sequence, NLS)을 추가로 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 복합체는 상기 DNA-타겟팅 서열을 통하여 상기 타겟 폴리뉴클레오티드 서열에 결합된 것일 수 있다.

본 발명의 또 다른 하나의 양태는 상기 대상 벡터의 어느 하나 또는 다수의 상기 대상 벡터를 포함하는 숙주 세포를 제공한다.

특정 구현예에 있어서, 상기 숙주 세포는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)를 코딩하는 제 2벡터를 추가로 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 제 2벡터는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합된 이펙터 영역을 추가로 코딩하는 것일 수 있다.

특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 발현은 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있는 것일 수 있다.

특정 구현예에 있어서, 상기 숙주 세포는 상기 각각 이펙터 영역에 융합된 상기 하나 또는 그 이상의 PUF 영역을 코딩하는 제 3 벡터를 추가로 포함하는 것일 수 있다.

특정 구현예에 있어서, 상기 하나 또는 그 이상의 PUF 영역의 발현은 독립적으로 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있을 수 있다.

특정 구현예에 있어서, 상기 이펙터 영역은 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT)일 수 있다.

특정 구현예에 있어서, 상기 제 2벡터가 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하거나 및/또는 상기 제 3벡터가 상기 PUF 영역 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하는 것일 수 있다.

특정 구현예에 있어서, 상기 제 2벡터가 상기 벡터와 동일하거나 및/또는 상기 제 3벡터가 상기 벡터 또는 상기 제 2벡터와 동일한 것일 수 있다.

특정 구현예에 있어서, 상기 숙주 세포는 살아 있는 동물에 있는 것일 수 있다.

특정 구현예에 있어서, 상기 숙주 세포는 배양된 세포일 수 있다.

본 발명의 또 다른 하나의 양태는 본 발명의 복합체를 상기 타겟 폴리뉴클레오티드 서열에서 조립하는 방법을 제공하며, 상기 방법은 하기를 상기 타겟 폴리뉴클레오티드 서열에 접촉시키거나 또는 그 부근에 위치시키는 것인 방법이다: (1)상기 대상 폴리뉴클레오티드 중 어느 하나, 또는 상기 대상 벡터 중 어느 하나, 또는 상기 대상 다수의 벡터; (2)상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 대상 제 2벡터의 어느 하나; 및 (3)각각 이펙터 영역에 융합된 하나 또는 그 이상의 상기 PUF 영역 또는 상기 대상 제 3벡터의 어느 하나.

특정 구현예에 있어서, 상기 복합체는 세포 내에서 조립되고, 상기 타겟 폴리뉴클레오티드 서열은 상기 세포의 게놈 DNA의 일부이고, 여기서 상기 대상 벡터, 상기 대상 제 2벡터및 상기 대상 제 3벡터가 상기 세포로 도입되는 것일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 헤테로크로마틴이 풍부한 좌위 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 검출 가능한 마커(예, 형광 단백질)일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 타겟 유전자의 전사 조절 요소 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 전사 모듈레이터(예, 활성제, 억제제)일 수 있다.

특정 구현예에 있어서, 상기 타겟 유전자의 전사는 세포 운명(cell fate) 결정, 세포 분화, 대사 흐름(metabolic flux), 또는 생물학적 또는 생화학적으로 결정가능한 결과물에 영향을 준다.

본 발명의 또 다른 하나의 양태는 세포 내에서 다수의 타겟 유전자의 전사를 모듈레이팅하는 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)용 코딩 서열 및 하나 또는 그 이상의 PUF 영역용 코딩 서열을 상기 세포로 도입하는 것을 포함하고, 여기서 상기 타겟 유전자의 각각은 (1)상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 dCas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및 PUF 영역으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2)상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 전사를 모듈레이트 하는 것,을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다. 특정 구현예에 있어서, 상기 Cas9 단백질은 dCas9 단백질일 수 있다.

특정 구현예에 있어서, 최소한 하나 이상의 타겟 유전자의 전사를 증진/진작하면서 최소한 하나 이상의 다른 타겟 유전자의 전사가 저해될 수 있다.

관련 양태에 있어서, 본 발명은 또한 세포 내에서 다수의 타겟 유전자의 후성적(epigenetic) 모듈레이션(예, 전사 활성과 직접적으로 연관되지 않은 크로마틴의 후성적 상태의 모듈레이팅) 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, 야생형(wt) Cas9 단백질 또는 Cas9 틈내기 효소용 코딩 서열 및 하나 또는 그 이상의 PUF 영역 융합용 코딩 서열을 상기 세포로 도입하는 것을 포함하며, 여기서 상기 타겟 유전자의 각각은 (1)상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 야생형(wt)/틈내기 효소 Cas9 단백질 및 PUF 영역 융합으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2)상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 후성적 모듈레이션을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다. 상기 방법은 예를 들어 Cas9가 폐쇄된 크로마틴 부위(예, 이들 부위에 절단 및 게놈 편집(editing)을 증가시킴)에 접근 및 결합함과 동시에 후성적 상태(예, 크로마틴의 개방(opening up))를 변경하는 데 유용할 수 있다.

본 발명의 또 다른 하나의 양태는 (1)대상 폴리뉴클레오티드 또는 대상 벡터; (2)상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 코딩하는 대상 제 2벡터 및 (3)각각 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역을 코딩하는 대상 제 3벡터를 포함하는 것인, 키트를 제공한다.

특정 구현예에 있어서, 상기 키트는 상기 벡터들의 세포 도입을 용이하게 하기 위하여 형질전환, 형질감염, 또는 감염 시약들을 포함할 수 있다.

이하 실시예 부분에 기재되었거나 또는 본 발명의 일 양태 하에서만 기재된 것을 포함하여, 본 발명에 기재된 모든 구현예들은 특별히 부인되거나 달리 부적절한 것이 아니라면 임의의 하나 이상의 다른 구현예와 결합될 수 있는 것으로 이해하여야 한다.

도 1A-1D는 PUF 영역-결합 서열들(PBS)의 sgRNA 3’말단으로 삽입이 dCas9/단일 가이드 RNA 기능에 실질적으로 영향을 미치지 않았고, 상기 대상 3-성분 CRISPR/Cas 복합체/시스템을 사용하여 활성제의 독립적인 모집(recruitment) 및 다량체화(multimerization)를 달성할 수 있음을 보여주고 있다. 도 1A는 세-하이브리드 시스템으로 분할함으로써 통상적 두-하이브리드 dCas9 융합 디자인을 향상시키는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 개략도를 보여 주고 있으며, 여기서 sgRNA-PBS는 dCas9/sgRNA의 상기 DNA 결합 활성을 PUF 융합에 의해 상기 이펙터 기능과 연결시킨다. 가운데 패널은 대표적인 PUF 영역의 구조를 나타내며, 상기 C에서 N 방향으로의 8 회 반복 및 이에 상응하는 5'에서 3'방향으로의 상기 8-mer 타겟 RNA과의 상호작용을 보여주고 있다. PUF RNA 인식 코드 표는 예시적인 두(di)-잔기 및 인식된 대상 RNA 염기를 나타내고 있다. 하단 패널에는 4 가지 PUF 아형(isotype) 및 pumilio 결합 부위(PBS) 및 이들의 서열들을 단순히 기재하기 위해 채택한 표기 표를 보여주고 있다. 도 1B에서, 상단 패널은 상기 sgRNA의 3' 말단에 다양한 수의 PBS를 삽입 후 dCas9-VP64가 tdTomato 전이유전자에 결합 및 활성화시키는 능력을 시험하기 위한 실험의 대략적 개요도로서, 예를 들면, 상기 dCas9::VP64 작체물의 TetO::tdTomato 전이유전자 활성화능력에 대한(0, 5, 15, 25, 또는 47 PBS를 가지는) sgRNA-PBS의 효과를 시험하기 위한 실험적 셋팅을 나타낸다. 하단 패널은 플롯 아래의 범례(legend)에 표시된 다른 작체물로 형질 감염된 세포의, 형광활성세포분류(FACS)에 의해 측정된, tdTomato 형광(상기 dCas9-VP64/sgCtl-0×PBSa Control 대비)에서의 평균 배수 변화(fold change; ±S.E.M.)를 보여주는 컬럼 플롯이다. 상기 범례는 다음의 세 가지 매개 변수에 사용되는 sgRNA를 기재하고 있다: sgRNA 매치는 상기 sgRNA가 인식하는 DNA 타겟을 의미하고; #PBS 및 PBS 유형은 각각 상기 sgRNA의 말단에 부가된 PBS의 수와 유형을 나타낸다. 도 1C에서, 상단 패널은 서로 다른 수의 부가된 PBS를 가지는 상기 대상 활성제에 의해 TetO::tdTomato 전이유전자의 활성화를 시험하는 실험을 기재한 개요도이다. 하단 패널은 플롯 아래의 범례(legend)에 표시된 다른 작체물로 형질 감염된 세포의 tdTomato 형광(상기 Control dCas9/PUFb-VP64/sgCtl-0×PBSb 대비)의 배수 변화(±S.E.M.)를 보여주는 컬럼 플롯을 나타낸다. 상기 범례는 음영처리 박스로 표시된, sgRNA에 의해 인식된, 상기 DNA 타겟 뿐 아니라 상기 사용된 PUF 아형(PUF-VP64) 및 상기 사용된 sgRNA-PBS를 PBS의 수와 유형으로 기재한다. 도 1D에서, 상단 패널은 TetO::tdTomato 전이유전자를 활성화함에 있어서 상기 대상 활성제 아형의 독립성을 시험하기 위한 실험을 설명하는 개요도이다. 하단 패널은 플롯 아래의 범례(legend)에 표시된 다른 작체물로 형질 감염된 세포의 tdTomato 형광(상기 PUF/PBS 아형 x 를 위한 dCas9/PUFx-VP64/sgCtl-5×PBSx 대비)의 평균 배수 변화(±S.E.M.)를 보여주는 컬럼 플롯이다. 상기 범례는 음영처리 박스로 표시된 상기 사용된 PUF 아형(PUF-VP64), 상기 PBS 아형(5×PBS; "-"은 PBS 없는 sgRNA를 표시한다) 및 DNA 타겟을 표시한다(sgRNA 매치). 모든 플롯은 3 번 반복측정한 결과를 나타낸다.
도 2A 및 도 2B는 VP64 및 P65-HSF1를 포함하는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 조립과 관련된 것이다. 도 2A는 PBS32과 PBS6272를 모두 포함하는 sgRNA에 의한 모집(recruitment)을 통하여 PUF(3-2)::VP64 및 PUF(6-2/7-2)::P65-HSF1의 조립을 시험하는 실험의 개요도이다. 상기 활성은 tdTomato 형광 리포터 활성으로 측정하였다. 도 2B는 상기 활성제 단백질들을 4×[PBS32-PBS6272] 헤테로다이머 부위들을 가지는 비타겟팅(sgControl) Tet를 타겟팅하는(sgTetO) sgRNAs로 형질감염한 결과로 나타나는 상대적 평균 tdTomato 형광을 보여주고 있다.
도 2C는 5×PBSa를 가지는 Control sgRNA 및 PBSa를 0, 1, 5, 15, 또는 25 카피 가지는 TetO를 타겟팅하는 sgRNA와 더불어, 활성화 영역으로서 VP64 사용(PUFa::VP64; 적색 컬럼들) 대비 p65HSF1사용(PUFa::p65HSF1; 청색 컬럼들)에 대한 상기 대상 3-성분 시스템 활성제의 비교 결과를 보여주고 있다. 컬럼들은 Control sgRNA(sgCtl)를 이용한 실험들과 관련하여 tdTomato 형광의 평균 배수 변화(S.E.M.; n=3 포함)를 보여주고 있다. 상기 범례는 음영처리된 박스들에 의해 표시되는 DNA매치뿐 아니라 상기 sgRNA-PBS 상의 PBSa(#PBSa)의 수를 표시한다.
도 3A-3D는 상기 대상 시스템이 강력한 내인성 유전자 활성화를 달성하기 위해 활성제의 다량체화를 허용함을 보여주고 있다. 도 3A에서, 상단 패널은 OCT4 유전자의 활성화에 사용되는 sgRNA-PBS의 상대적 매치 위치들(1~4로 표지된 스트로크(strokes))을 보여주는 유전자 모델이다. 하단 패널은 dCas9/PUFa-p65HSF1 3-성분 시스템 활성제 모듈, 또는 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9-p65HSF1 활성제를 사용한 SOX2 발현의 활성화를 위한 qRT-PCR에 의해 측정된(Ctl 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. dCas9/PUFa-p65HSF1 3-성분 시스템 활성제 모듈, 또는 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9-p65HSF1 활성제를 사용한 OCT4 발현의 활성을 qRT-PCR에 의해 측정된(Control 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례의 음영처리된 박스들은 Control(Ctl) 서열을 가지는 단일 sgRNA-5×PBSa의 사용을 나타내고, 상기 유전자 모델에서 번호매겨진 스트로크들에 해당하는 상기 개별적 OCT4를 타겟팅하는 sgRNA-5×PBSa 또는 상기 4 OCT4를 타겟팅하는 sgRNA-5×PBSa를 나타낸다. 도 3B에서, 상단 패널은 SOX2 유전자의 활성화에 사용되는 sgRNA-PBS의 상대적 매치 위치들(1~4로 표지된 스트로크)를 보여주는 유전자 모델이다. 하단 패널은 SOX2를 타겟팅하는 sgRNA-5×PBSa 또는 Control sgRNAs-5×PBSa의 표시된 칵테일을 가지는 dCas9/PUFa-p65HSF1 활성제 또는 dCas9-p65HSF1 활성제를 사용한 SOX2 발현의 활성화를 위한 qRT-PCR에 의해 측정된(Ctl 샘플과 비교한) 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례에서 상기 음영처리된 박스들은 단일 Control(Ctl) 서열을 가지는 sgRNA-5×PBSa, 상기 유전자 모델에서 번호가 매겨진 스트로크에 해당하는 상기 개별적 SOX2를 타겟팅하는 sgRNA-5×PBSa, 또는 4 SOX2를 타겟팅하는sgRNA-5×PBSa의 용도를 나타낸다. 도 3C는 1, 5, 15, 또는 25 개의 PBSa 카피를 가지는 OCT4를 타겟팅하는 sgRNA-PBSa의 상기 표시된 단일 또는 칵테일 sgRNA-PBSa를 가지는 OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 도 3D는 1, 5, 15, 또는 25 개의 PBSa 카피를 가지는 SOX2를 타겟팅하는 sgRNA-PBSa의 상기 표시된 단일 또는 칵테일 sgRNA-PBSa를 가지는 SOX2 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다.
도 4A 및 4B는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 두 개의 서로 다른 타겟 리포터 유전자의 동시 활성화 및 리프레션을 허용함을 보여주고 있다. 도 4A는 TetO::tdTomato 전이유전자를 dCas9/sgTetO-PBS32/PUF(3-2)::VP64와 동시에 활성화하고 SV40::EGFP 전이유전자를 dCas9/sgSV40-PBS6272/KRAB::PUF(6-2/7-2와 동시에 리프레스하는 실험을 보여주는 개요도이다. 도 4B는 상기 표에 표시된 작체물들로 형질감염된 샘플들의 상대적 평균 EGFP 및 tdTomato 형광을 보여주는 컬럼 차트이다.
도 4C 및 4D는 추가적으로 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 서로 다른 유전자들을 동시에 활성화 및 리프레스 할 수 있음을 보여주고 있다. 도 4C에서, 좌측 패널은 TetO::tdTomato 및 SV40::EGFP를 PUFc-p65HSF1 및 KRAB-PUFa에 의해 각각 동시에 활성화 및 리프레션을 수행하는 실험을 보여주는 개략도이다. 우측 패널에서, 상부 컬럼 플롯은 tdTomato 형광의 평균 배수 변화(S.E.M.)를 나타내고; 하부 컬럼 플롯은 가운데 범례에 표시된 작체물들로 형질감염된 세포들의 EGFP 형광의 평균 배수 변화(S.E.M.)를 나타낸다. 상기 가운데 범례는 상기 sgRNA-PBSc 및 sgRNA-PBSa의 Ctl, TetO 또는 SV40P1에 대한 DNA를 흑색으로 음영처리된 박스로 나타내고, PUFc-p65HSF1 및 KRAB-PUFa의 형질감염이 포함되는 부분을 음영처리하여 나타내고 있다. 도 4D에서, 좌측 패널은 OCT4 및 SOX2를 각각 PUFb-p65HSF1 및 BFPKRAB-PUFa에 의해 동시에 활성화 및 리프레션을 수행하는 실험을 보여주는 개략도이다. 우측 패널에서, 상부 컬럼 플롯은 OCT4 유전자 발현의 평균 배수 변화(95% C.I.)를 나타내고; 하부 컬럼 플롯은 가운데 범례에 표시된 작체물들로 형질감염된 세포들의 SOX2 유전자 발현의 평균 배수 변화(95% C.I.)를 나타낸다. 상기 가운데 범례는 상기 sgRNA-5×PBSb 및 sgRNA-5×PBSa의 Control(Ctl), OCT4 프로모터들(OCT4pp) 또는 SOX2 프로모터들(SOX2pp)에 대한 DNA 매치를 흑색 음영처리 박스들로 나타내고 있다. 상기(PUFb-p65HSF1 + BFPKRAB-PUFa) 줄은 노란색으로 강조된 박스들을 가지는 샘플들에서 상기 활성제-리프레서 모델들을 포함하는 부분을 나타낸다. 이들 실험들은 OCT4 및 SOX2 모두를 위한 4 sgRNA-5×PBS의 칵테일들을 사용하였다.
도 5A-5C는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 타겟 유전자의 발현을 활성화하기 위하여 인핸서에 있는 CREB-결합 단백질의 히스톤 아세틸트랜스퍼라제(HAT) 영역을 모집(recruit)하는 데 사용될 수 있음을 보여주고 있다. 도 5A는 OCT4의 타겟 근거리 프로모터(proximal promoter, PP), 근거리 인핸서(proximal enhancer, PE) 또는 원거리 인핸서(distal enhancer, DE)에 dCas9-CBPHAT 직접 융합 또는 3-성분 모듈 dCas9/CBPHAT-PUFa 또는 dCas9/PUFa-CBPHAT을 사용하여 인핸서를 활성화하는 실험의 개요도이다. 이들 각 부위의 각각을 타겟팅하는 상기 4 가이드는 매치의 위치를 표시하는 적색 스트로크 위의 번호로 표시되어 있다. 도 5B는 dCas9-CBPHAT, dCas9/CBPHAT-PUFa 또는 dCas9/PUFa-CBPHAT 및 PP, PE 또는 원거리 인핸서 DE의 각각을 타겟팅하는 4 sgRNA-5×PBSa의 칵테일을 발현하는 플라스미드로 형질감염된 세포들의(해당 sgCtl 타겟팅 실험에 관련한) OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 도 5C는 dCas9/CBPHAT-PUFa 및 sgRNAs를 타겟팅하는 OCT4의 PP, PE및 DE의 단일 또는 칵테일로 형질감염 후(해당 sgCtl 실험에 관련한) OCT4 발현의 평균 배수 변화(95% C.I.)를 보여주고 있다. 상기 범례는 상기 부위 각각을 타겟팅하는 개별적 가이드들 또는 가이드의 칵테일을 포함하는 부분을 음영처리한 박스로 나타낸다.
도 6A-6G는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 형광 단백질의 다량체화 및 텔로미어 및 동원체의 동시 표지(labeling)(스케일 바: 5μm)을 허용함을 보여주고 있다. 도 6A는 dCas9/sgTelomere-PBS32/Clover::PUF(3-2)(또는 PUFa)을 녹색 형광을 가지는 텔로미어 반복을 표지하는 데 사용됨을 보여주는 개요도이다. 도 6B는 텔로미어를 Clover-PUFa 및 좌에서 우로, PBSa 번호의 증가순으로(0, 5, 15, 25) 마련된 sgTelomere로 표지된 텔로미어를 보여주고 있다. 도 6C는 dCas9/Clover-PUFa/sgTelomere-25×PBSa에 의한 텔로미어의 표지를 안티-TRF2 면역염색을 통하여 확인하는 것을 보여주고 있다. 도 6D는 dCas9/PUFa::Clover 및 0,5,15 또는 25 PBSa 부위를 가지는 텔로미어를 타겟팅하는 sgRNA로 형질감염된 HEK293T 세포들에서 형광 초점(fluorescent foci)의 수를 정량하는 것을 보여주고 있다.(n=20; Mann-Whitney statistics: ***=p<0.0005, ****=p<0.0001). 도 6E는 상기 sgRNA을 타겟팅하는 텔로미어 상에서 5,15, 또는 25×PBSa을 가지는 상기 대상 3-성분 시스템에 의해 전체 핵 신호에 대한 병소(foci)에서의 전체 신호의 비율로서 신호 대 잡음비를 정량화하는 것을 보여주고 있다.(n=20; Mann-Whitney statistics: ****=p<0.0001). 도 6F는 Clover-PUFc/sg 동원체-20×PBSc에 의해 동원체의 표지를 항-CREST로 확인하는 것을 보여주고 있다. 도 6G는 Clover-PUFc/sg동원체-20×PBSc 및 mRuby2-PUFa/sgTelomere-25×PBSa를 각각 사용하여 동원체 및 텔로미어를 공동 표지(co-labeling)하는 것을 보여주는 대표적 공초점 형광 현미경 이미지이다.
도 7은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 7 sgRNA-15×PBS32을 타겟팅하는 MUC4 좌를 가지는 비-반복 부위를 표지하는 것을 허용함을 보여주는 MUC4 표지의 대표적 공초점 형광 현미경 이미지이다.
도 8A-8C는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 몇몇 특성을 강조하는 카툰식 설명으로 도시하고 있다. 도 8A는 다중화에 대해 보여주고 있다: 서로 다른 PBS 아형을 가지는 sgRNA는 동족(cognate) PUF 아형에 의해 묶여진 상기 이펙터들을 모집(recruit)할 수 있으며, 이로 인해 서로 다른 이펙터 기능을 위치화시키기 위한 dCas9 또는 분리된 염색체 좌에서 단백질 태그들의 다중화를 제공한다. 도 8B는 다량체화(multimerization)에 대해 도시하고 있다: PBS의 짧고 선형적 특징으로 인하여 sgRNA는 많은 PBS 카피를 가지게 되며, 따라서 타겟 좌에서 PUF-융합의 많은 분자들의 모집(recruitment)을 허용한다. 도 8C는 복합체 형성에 대해 도시하고 있다: 서로 다른 조합, 순서 및 개수의 PBS를 구비한 sgRNA는 원하는 화학양론 및 배열을 갖는 단백질 복합체들을 직접 조립하는 발판(scaffold)의 역할을 할 수 있다.

1. 개요

이하 기재된 본 발명은 타겟 폴리뉴클레오티드 서열(예, 상기 DNA-타겟팅 서열)에의 결합; 감소되거나 결핍된 뉴클레아제 활성(예, Cas9-결합 서열)을 가지는 야생형(wt) Cas9 단백질 또는 변형된 Cas9 단백질(예, Cas9 틈내기 효소 또는 dCas9)에의 결합; 및 각각 기능적 또는 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역에의 결합;을 위한 3 기능적 서열을 포함하는 폴리뉴클레오티드를 제공한다. 본 발명의 상기 폴리뉴클레오티드는, 상기 야생형(wt) 또는 변형된 Cas9 단백질 및 상기 하나 또는 그 이상의 PUF 영역 융합 단백질들과 함께, 특정 타겟 DNA 서열에서 하나 또는 그 이상의 생물학적 효과를 가져오게 하는 상기 특정 타겟 DNA 서열에서 3-성분 복합체(상기 대상 3-성분 CRISPR/Cas 복합체/시스템)를 형성할 수도 있다.

본 발명은 또한 폴리뉴클레오티드, 상기 폴리뉴클레오티드에 의해 형성된 복합체, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)및 최소한 하나 이상의 PUF 영역 융합 단백질을 코딩하는 벡터를 제공한다. 본 발명은 또한 상기 벡터 또는 상기 폴리뉴클레오티드를 포함하는 숙주 세포들을 추가로 제공한다.

상기 대상 3-성분 CRISPR/Cas 복합체/시스템은 타겟 DNA 서열에서 넉-인(knock-in)의 효율을 증가시키는 증강된 상동 재조합, 복수의 좌위에서 동시적 전사 활성화 및/또는 리프레션; 형광 이미징 또는 기타 탐지가능한 신호에 의한 좌위에서의 특정 서열의 탐색; 및 세포운명(cell fate) 결정에 대한 영향, 세포 분화, 대사 흐름, 또는 생물학적 또는 생화학적으로 결정가능한 결과물 등을 포함하는 다양한 생물학적 기능을 가져올 수 있으나, 이에 국한되는 것은 아니다.

본 발명은 본 발명의 방법들을 수행하는 데 필요한 키트들 및 시약들을 추가적으로 제공한다.

따라서, 일 양태에서, 본 발명은 (1)타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열;(2)Cas9-결합 서열; 및 (3)하나 또는 그 이상의 카피의 PUF 영역-결합 서열(PBS)로서, 상기 하나 또는 그 이상의 카피의 PBS는 각각 같거나 다른 PUF 영역에 결합하는 것;을 포함하는폴리뉴클레오티드에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)는 상기 Cas9-결합 서열에 결합함으로써 상기 폴리뉴클레오티드와 복합체를 형성할 수 있는, 폴리뉴클레오티드를 제공한다. 특정 구현예에 있어서, 상기 dCas9 단백질은 감소된 뉴클레아제 활성을 가지거나 또는 뉴클레아제 활성(예, 뉴클레아제-결핍)이 결여되어 있으나, 상기 대상 폴리뉴클레오티드와 복합체를 이룰 경우에는 DNA-결합능을 유지한다. 특정 구현예에 있어서,(1)-(3)은 5' 에서 3'의 순서로 배열된다. 또 다른 구현예에 있어서, 하나 또는 그 이상의 상기 PBS는 5' 에서 상기 DNA-타겟팅 서열 및/또는 5' 에서 상기 Cas9-결합 서열일 수 있다.

상기 타겟 폴리뉴클레오티드 서열은 임의의 DNA 서열일 수 있다. 특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 전사 조절 요소를 포함하거나 이에 인접한 것일 수 있다. 특정 구현예에 있어서, 상기 전사 조절 요소는 코어 프로모터, 근위 프로모터 요소, 인핸서, 사일렌서, 인슐레이터 및 좌위 조절 부위 중에서 하나 또는 그 이상을 포함하는 것일 수 있다. 또 다른 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 동원체 서열, 텔로미어 서열, 또는 반복성 게놈 서열을 포함하거나 이에 인접한 것일 수 있다. 상기 텔로미어 서열은 TTAGGG 반복을 5-15 kb 트랙을 가지는 것을 특징으로 한다. 또 다른 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 게놈 마커 서열(또는 관심 게놈 좌위)을 포함하거나 이에 인접한 것일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥의 프로토스페이서 인접 모티프(PAM) 서열에 바로 옆 3'인 것일 수 있다. 예를 들어, 특정 구현예에 있어서, 상기 상보적 가닥의 상기 PAM 서열은 5'-CCN-3'일 수 있고, 여기서 N은 임의의 DNA 뉴클레오티드일 수 있다.

또 다른 구현예에 있어서, 상기 상보적 가닥의 상기 PAM 서열은 사용하게 되는 상기 특정 Cas9 단백질들 또는 상동체들 또는 오솔로그들(orthologs)과 매치될 수 있다.

당업계에 공지된 바와 같이, Cas9이 DNA에 성공적으로 결합하기 위해서 상기 게놈 DNA에 있는 상기 타겟 서열은 상기 가이드 RNA 서열과 상보적이어야 하며, 올바른 프로토스페이서 인접 모티프 또는 PAM 서열이 바로 옆에 연결되어야 한다. 상기 PAM 서열은 DNA 타겟 서열에 존재하지만 상기 가으드 RNA에는 존재하지 않는다. 상기 PAM서열에 이어지는 상기 올바른 타겟 서열을 가지는 임의의 DNA서열은 Cas9에 결합되게 된다.

상기 PAM 서열은 상기 Cas9가 유래된 박테리아의 종에 따라 차이가 있다. 가장 널리 사용되는 Type II CRISPR 시스템은 화농성 연쇄상구균 (S. Pyogenes)으로부터 유래된 것이고, 상기 PAM 서열은 상기 가이드 RNA 인식 서열(또는 상기 상보적 가닥 상의 5'-CCN-3')의 바로 옆 3'에 위치한 5'-NGG-3’이다. 다른 박테리아 종의 기타 Type II CRISPR 시스템들의 상기 PAM 서열들은 하기 표 1에 열거되어 있다.

화농연쇄상구균(SP)	NGG
Neisseria meningitidis(NM)	NNNNGATT
Streptococcus thermophilus(ST)	NNAGAA
Treponema denticola(TD)	NAAAAC

특정 구현예에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 상기 폴리뉴클레오티드와 복합체를 형성하는 경우, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 염기 쌍을 이룬다.

상기 DNA-타겟팅 서열은 상기 표적 폴리 뉴클레오티드 서열에 100 % 상보적이거나 또는 그렇지 않을 수 있음을 주목해야 한다. 특정 구현예에 있어서, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 약 12-22 뉴클레오티드(nucleotides, nts), 약 14-20 뉴클레오티드, 약 16-20 뉴클레오티드, 약 18-20 뉴클레오티드, 또는 약 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 뉴클레오티드에 걸쳐 상보적일 수 있다. 특정 구현예에 있어서, 상기 상보적 부위는 약 12-22 뉴클레오티드 연속 스트레치를, 바람직하기로는 상기 DNA-타겟팅 서열의 3' 말단에 포함할 수 있다. 특정 구현예에 있어서, 상기 DNA-타겟팅 서열의 5' 말단은 상기 타겟 폴리뉴클레오티드 서열과 최대 8 뉴클레오티드 미스매치를 가질 수 있다. 특정 구현예에 있어서, 상기 DNA-결합 서열은 상기 타겟 폴리뉴클레오티드 서열에 약 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100% 상보적인 것일 수 있다.

관련 구현예에 있어서, 상기 DNA-타겟팅 서열의 3' 말단에는 상기 상보적 타겟 폴리뉴클레오티드 서열과 대비하여 최대 15-뉴클레오티드 매치를 초과할 수 없으며, 복합체에 있는 상기 Cas9 단백질은 야생형(wt) Cas9 단백질로서, 이 상황에서는, 타겟 DNA에 결합하나 절단하지 않는다.

특정 구현예에 있어서, 상기 DNA-결합 서열은 5' 말단에 뉴클레오티드 G를 가질 수 있다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드는 상기 DNA-타겟팅 서열을 상기 Cas9-결합 서열에 연결하는 링커 서열을 추가로 포함할 수 있다.

특정 구현예에 있어서, 상기 Cas9-결합 서열은 머리핀 구조를 형성할 수 있다. 특정 구현예에 있어서, 상기 Cas9-결합 서열은 길이가 약 30-100 뉴클레오티드, 약 35-50 뉴클레오티드, 약 37-47 뉴클레오티드, 또는 약 42 뉴클레오티드일 수 있다.

일 구현예에 있어서, Cas9-결합 서열은 GTTTTAGAGCTAGAAATAGCAAGTTAA AATAAGGCTA 일 수 있다. 다른 구현예에 있어서, Cas9-결합 서열은 GTTTAAGAGCTATGC TG GAAACAGCATAGCAAGTTTAAATAAGGCTA 일 수 있다.

상기 변형된 Cas9 단백질(틈내기 효소 또는 dCas9)은 엔도뉴클레아제의 어느 하나 또는 두 촉매 부위 모두에서 뉴클레아제 활성이 감소되거나 또는 뉴클레아제 활성이 결여될 수 있다. 특정 구현예에 있어서, 상기 dCas9 단백질은 야생형 Cas9의 두 엔도뉴클레아제 촉매 부위(RuvC 및 HNH) 모두에서 점 돌연변이로 인하여 엔도뉴클레아제 활성이 결여될 수 있다. 예를 들어, 상기 점 돌연변이들은 각각 화농성 연쇄상구균(S. Pyogenes)의 Cas9 또는 화농성 연쇄상구균(S. Pyogenes)을 제외한 종(species)의 대상 잔기에 있는 D10A 및 H840A 일 수 있다. 특정 구현예에 있어서, 상기 변형된 Cas9 단백질은 야생형(wt) Cas9의 두 부위 모두에서가 아닌 어느 한 부위에서 엔도뉴클레아제 촉매활성이 결여될 수 있으며 dsDNA 타겟(Cas9 틈내기 효소)에서 틈(nick)을 만들 수 있다.

특정 구현예에 있어서, 하나 또는 그 이상의 상기 PBS의 각각은 약 8 뉴클레오티드를 가질 수 있다. 일 구현예에 있어서, PBS는 상기 PUF 영역 PUF(3-2)에 의해 결합될 수 있는 5'-UGUAUGUA-3' 서열을 가질 수 있다. 다른 구현예에 있어서, PBS 는 상기 PUF 영역 PUF(6-2/7-2)에 의해 결합될 수 있는 5'-UUGAUAUA-3'를 가질 수 있다. 추가적 PBS 및 대상 PUF 영역들은 하기에 기재되어 있다.

본 발명의 상기 폴리뉴클레오티드는 1 개 이상의 PBS 카피를 가질 수 있다. 특정 구현예에 있어서, 상기 폴리뉴클레오티드는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15 카피의 PBS와 같은, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 46, 47, 48, 49, 또는 50 카피의 PBS를 가질 수 있다. 특정 구현예에 있어서, 상기 PBS의 카피 수의 범위는 L 에서 H이며, 상기에서 L은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 또는 40 중 어느 하나이며, H는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 90, 또는 100 중 어느 하나이며, 여기서 H는 L보다 커야 한다. 각 PBS는 같거나 다를 수 있다.

특정 구현예에 있어서, 상기 폴리뉴클레오티드는 약 5-15 카피의 PBS, 또는 약 5-14 카피, 약 5-13 카피, 약 5-12 카피, 약 5-11 카피, 약 5-10 카피, 또는 약 5-9 카피의 PBS를 가질 수 있다.

특정 구현예에 있어서, PBS/PUF의 결합을 극대화하기 위하여 상기 sgRNA-PBS의 양 및/또는 형질감염되거나 발현된 상기 PUF 융합들의 양을 조절할 수 있다. 예를 들면, 이는 더욱 강력한 프로모터 또는 Dox-유도성 프로모터와 같은 유도성 프로모터를 사용하여 PUF-활성제의 발현을 증가시킴으로써 성취할 수 있다.

특정 구현예에 있어서, PBS 부위들 및/또는 스페이서 서열 간의 간격은 시스템 효율을 향상시키기 위해 최적화할 수 있다. 예를 들어, 간격 최적화는 특정 PUF 융합에 종속되고, 개개 단백질들 및 기능 발휘를 위하여 충분히 근접 위치할 필요가 있는 PUF 융합들로 작용하는 PUF 융합들 사이에서도 차이가 있을 수 있다(예, 단백질 복합체들).

본 발명의 또 다른 양태는 상기 대상 폴리뉴클레오티드의 어느 하나를 코딩하는 벡터를 제공한다. 특정 구현예에 있어서, 상기 폴리뉴클레오티드의 전사는 항시성 프로모터, 또는 유도성 프로모터 조절 하에 있을 수 있다. 특정 구현예에 있어서, 상기 벡터는 포유류(사람; 비인간 영장류; 비인간 포유류; 마우스, 쥐, 햄스터, 기니아 피그와 같은 설치류; 돼지, 양, 염소, 말, 낙타, 소와 같은 가축 포유류; 또는 고양이나 개와 같은 애완용 포유류); 새, 어류, 곤충, 벌레, 효모, 또는 박테리아 세포에서 활성을 갖는 것일 수 있다.

특정 구현예에 있어서, 상기 벡터는 플라스미드, 바이러스 벡터(예, 아데노바이러스, 레트로바이러스, 또는 렌티바이러스 벡터, 또는 AAV 벡터) 또는 트랜스포존(piggyBac transposon)일 수 있다. 상기 벡터는 일시적으로 숙주 세포에 형질감염되거나 또는 감염시약이나 전위(transposition)에 의해 숙주 게놈에 통합될 수 있다.

본 발명의 관련 양태는 본 발명의 벡터의 다수 또는 라입브러리를 제공하며, 여기서 상기 벡터들 중 2 개의 벡터는 이들 각각의 DNA-타겟팅 서열, Cas9-결합 서열, 및/또는 상기 PBS의 카피 수, 동일성(서열, 결합 특이성 등), 또는 상대적 순서에 있어서의 코딩된 폴리뉴클레오티드에 있어서 다른 것일 수 있다.

본 발명의 또 다른 양태는 본 발명의 상기 폴리뉴클레오티드의 어느 하나를 포함하는 복합체 및 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 제공한다. 특정 구현예에 있어서, 상기 복합체는 상기 야생형(wt) Cas9 단백질을 포함하지 않을 수 있다. 특정 구현예에 있어서, 상기 복합체는 상기 야생형(wt) Cas9을 포함할 수 있다.

특정 구현예에 있어서, 상기 복합체는 상기 하나 또는 그 이상의 PBS에 결합된 하나 또는 그 이상의 PUF 영역을 추가로 포함하는 것일 수 있다. 특정 구현예에 있어서, 상기 PUF 영역의 각각은 이펙터 영역에 융합되어 있는 것일 수 있다. 각 이펙터 영역은 독립적으로(그러나 이에 국한되지는 않으며): 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것일 수 있다. 특정 구현예에 있어서, 최소한 두 개 이상의 상기 PUF 영역이 다른 이펙터 영역에 융합된 것일 수 있다.

특정 구현예에 있어서, 상기 복합체는 상기 폴리뉴클레오티드의 DNA-타겟팅 서열을 통하여 상기 타겟 폴리뉴클레오티드 서열에 결합된 것일 수 있다.

본 발명의 또 다른 양태는 어느 하나의 상기 대상 벡터 또는 다수의 벡터를 포함하는 숙주 세포를 제공한다.

특정 구현예에 있어서, 상기 숙주 세포세포는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)를 코딩하는 제 2벡터를 추가로 포함하는 것일 수 있다. 특정 구현예에 있어서, 상기 제 2벡터는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합된 이펙터 영역을 추가로 코딩하는 것일 수 있다. 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 발현은 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있을 수 있다.

특정 구현예에 있어서, 상기 숙주 세포는 상기 각각 이펙터 영역에 융합된 상기 하나 또는 그 이상의 PUF 영역을 코딩하는 제 3 벡터를 추가로 포함하는 것일 수 있다. 상기 하나 또는 그 이상의 PUF 영역의 발현은 독립적으로 항시성 프로모터 또는 유도성 프로모터의 조절 하에 하에 있을 수 있다.

상기 이펙터 영역은 많은 기능 또는 생물학적 효과 중 어느 하나를 가질 수 있다. 단순히 표현하자면, 상기 이펙터 영역은 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소, 또는 크로마틴 리모델링 단백질(HDAC/HAT) 등 상동 재조합에 관여하는 단백질일 수 있다.

특정 구현예에 있어서, 상기 제 2벡터는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 이펙터 영역에 융합된 핵 위치화 서열(NLS)을 추가로 코딩하거나 및/또는 상기 제 3벡터가 상기 PUF 영역 또는 상기 PUF 영역 또는 상기 이펙터 영역에 융합된 핵 위치화 신호(NLS)를 추가로 코딩하는 것일 수 있다.

특정 구현예에 있어서, 서로 다른 벡터들에 의해 코딩되는 서열들은 동일 벡터 상에 있을 수 있다. 예를 들면, 특정 구현예에 있어서, 상기 제 2벡터가 상기 벡터와 동일하거나 및/또는 상기 제 3벡터가 상기 벡터 또는 상기 제 2벡터와 동일한 것일 수 있다.

상기 숙주 세포는 살아 있는 동물에 있는 것이거나 또는 배양된 세포인 것일 수 있다.

특정 구현예에 있어서, 상기 숙주 세포는 상기 대상 3-성분 시스템(예, dCas9, PUF 융합들)을 하나 또는 그 이상 항시성 또는 유도성으로 발현하는 것일 수 있다.

본 발명의 또 다른 양태는 어느 한 항의 복합체를 상기 타겟 폴리뉴클레오티드 서열에서 본 발명의 복합체를 조립하는 방법을 제공하며, 상기 방법은 하기를 상기 타겟 폴리뉴클레오티드 서열에 접촉시키거나 또는 그 부근에 위치시키는 것인 방법: (1) 상기 대상 폴리뉴클레오티드의 어느 하나, 또는 상기 대상 벡터의 어느 하나, 또는 다수의 벡터들; (2) 상기 Cas9 단백질 (예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 코딩하는 상기 제 2벡터의 어느 하나; 및 (3) 각각 이펙터 영역에 융합된 하나 또는 그 이상의 상기 PUF 영역, 또는 상기 PUF 영역 융합들을 코딩하는 제 3벡터의 어느 하나.

특정 구현예에 있어서, 상기 복합체는 세포 내에서 조립되고, 상기 타겟 폴리뉴클레오티드 서열은 상기 세포의 게놈 DNA의 일부이고, 여기서 상기 대상 벡터, 제 2벡터 및 제 3벡터는 상기 세포로 도입되는 것일 수 있다.

특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 헤테로크로마틴이 풍부한 좌위 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 검출 가능한 마커(예, 형광 단백질)인 것일 수 있다. 또 다른 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 타겟 유전자의 전사 조절 요소 또는 그 부근에 위치하며, 여기서 상기 이펙터 영역은 전사 모듈레이터(예, 활성제, 억제제)인 것일 수 있다. 상기 타겟 유전자의 전사는, 예를 들면, 세포 운명 결정, 세포 분화, 대사 흐름, 또는 생물학적 또는 생화학적으로 결정 가능한 결과물인 것일 수 있다.

본 발명의 관련 양태는 세포에서 다수의 타겟 유전자의 전사 또는 후성적(epigenetic) 상태를 모듈레이트하는 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, Cas9 단백질용 코딩 서열 및 하나 또는 그 이상의 PUF 영역용 코딩 서열을 상기 세포로 도입하는 것을 포함하며, 여기서 상기 타겟 유전자의 각각은 (1)상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 dCas9 단백질 및 PUF 영역 융합으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2)상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 전사를 모듈레이트 하는 것을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다.

관련 양태에 있어서, 본 발명은 또한 세포 내에서 다수의 타겟 유전자의 후성적(epigenetic) 모듈레이션(예, 전사 활성과 직접적으로 연관되지 않은 크로마틴의 후성적 상태의 모듈레이팅) 방법을 제공하며, 상기 방법은 상기 대상 다수의 벡터, 야생형(wt) Cas9 단백질 또는 Cas9 틈내기 효소용 코딩 서열 및 하나 또는 그 이상의 PUF 영역용 코딩 서열을 상기 세포로 도입하는 것을 포함하며, 여기서 상기 타겟 유전자의 각각은 (1) 상기 다수의 벡터의 하나에 의해 코딩되는 폴리뉴클레오티드, 상기 Cas9 단백질 또는 Cas9 틈내기 효소및 PUF 영역 융합으로 구성된 삼중 복합체(tripartite complex)의 상기 타겟 폴리뉴클레오티드 서열에서의 조립 및 (2) 상기 타겟 폴리뉴클레오티드 서열을 포함하는 상기 타겟 유전자의 후성적 모듈레이션을 허용하는 타겟 폴리뉴클레오티드 서열을 포함하는 것일 수 있다. 상기 방법은 예를 들어 Cas9가 폐쇄된 크로마틴 부위 (예, 이들 부위에 절단 및 게놈 편집(editing)을 증가시킴)에 접근성 및 결합의 안정성을 얻음과 동시에 후성적 상태(예, 크로마틴의 개방(opening up))를 변경하는 데 유용할 수 있다.

특정 구현예에 있어서, 최소한 하나 이상의 타겟 유전자의 전사를 저해하면서 최소한 하나 이상의 다른 타겟 유전자의 전사를 증진/진작할 수 있다.

본 발명은 (1) 대상 폴리뉴클레오티드 또는 이를 코딩하는 벡터; (2) 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 코딩하는 제 2벡터; 및 (3) 각각 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역을 코딩하는 제 3벡터를 포함하는 키트를 추가로 제공한다. 상기 키트는 상기 벡터들의 세포 도입을 용이하게 하기 위하여 형질전환, 형질감염, 또는 감염 시약들을 추가로 포함할 수 있다.

상기 본 발명에 대한 일반적 기재에 더불어, 본 발명의 다양한 특징들을 이하에 기재한다. 비록 본 발명의 별도의 문맥이나 다른 양태 하의 별도의 구현예에서 기재되어 있을지라도 본 발명의 특징들은 단일 구현예에 조합되어 제공될 수 있음을 이해하여야 한다. 반대로, 단일 구현예의 문맥에 기재되어 있는 본 발명의 다양한 특징들도 또한 별도로 제공되거나 임의의 적합한 하위 조합(subcombination)으로 제공될 수 있다. 본 발명에 관한 실시예의 모든 조합은 구체적으로는 본 발명에 포함되며, 마치 모든 조합이 개별적으로 및 명시적으로 공개된 것처럼 이하에 개시된다. 또한, 다양한 실시예의 모든 하위 조합 및 그 구성 요소는 마치 각 그리고 모든 하위 조합이 개별적으로 및 명시적으로 공개된 것처럼 본 발명에 의해 구체적으로 포함되고 본원에 개시된다.

2. 본 발명의 폴리뉴클레오티드

본 발명의 폴리뉴클레오티드는 3 개의 세그먼트를 포함한다: i) 타겟 서열에 상보적인 뉴클레오티드 서열을 포함하는 제 1 세그먼트; ii) Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질, 감소된 뉴클레아제 활성 또는 결여된 뉴클레아제 활성을 가진다)와 상호작용하는 제 2 세그먼트(예, 상기 Cas9-결합 서열); 및 iii) 하나 또는 그 이상의 카피의 PUF 영역-결합 서열(PBS).

특정 구현예에 있어서, 상기 타겟 서열은 RNA일 수 있다. 특정 구현예에 있어서, 상기 타겟 서열은 DNA일 수 있다. 이하 본 발명의 기재에서, 상기 타겟 서열이 DNA(예, 게놈 DNA)일 경우 상기 제 1 세그먼트는 일반적으로 "DNA-타겟팅 서열"을 의미한다. 관련 구현예에 있어서, 상기 타겟 서열이 RNA일 경우에는 불필요한 반복을 피하기 위해, "DNA-타겟팅 서열"이 "RNA-타겟팅 서열"로 대체된 경우를 제외하고, 하기에 기재한 사항이 일반적으로 적용된다. 즉, 상기 제 1 세그먼트는 상기 타겟 폴리뉴클레오티드 서열(DNA 또는 RNA)에 상보적인 뉴클레오티드 서열을 포함할 수 있다.

특정 구현예에 있어서, 상기 3 개의 세그먼트 i) 내지 iii)는 5'에서 3' 방향으로 배열될 수 있다.

특정 구현예에 있어서, 본 발명의 상기 폴리뉴클레오티드는 "단일-가이드 RNA" 또는 "sgRNA"를 포함하는 단일 RNA 분자(단일 RNA 폴리뉴클레오티드)일 수 있다. 또 다른 구현예에서, 본 발명의 상기 폴리뉴클레오티드는 2 개의 RNA 분자(예, 상기 Cas9-결합 서열에서 하이브리드화를 통해 결합됨, 이하 참조)를 포함할 수 있다. 따라서, 상기 대상 폴리뉴클레오티드는, 두 분자의 폴리뉴클레오티드 및 단분자 폴리뉴클레오티드(예, sgRNAs)를 모두 의미하는 것을 포함할 수 있다.

a. DNA-타겟팅 서열

상기 DNA-타겟팅 서열은 상기 CRISPR/Cas 복합체/시스템의 crRNA 또는 가이드 RNA 또는 gRNA와 기능적으로 유사하거나 동일하다. 그러나, 본 발명의 문맥상, 상기 DNA-타겟팅 서열은 어떤 특정 crRNA 또는 gRNA에서 유래되는 것이 아니라 상기 타겟 폴리뉴클레오티드 서열의 서열을 토대로 임의로 디자인할 수 있다.

상기 DNA-타겟팅 서열은 타겟 DNA(또는 상기 타겟 DNA의 상보적 가닥)내의 특정 서열과 상보적인 뉴클레오티드 서열을 포함한다. 다시 말하면, 상기 DNA-타겟팅 서열은 서열-특이적 방법으로 하이브리드화(즉, 염기 짝짓기)에 의해 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열과 상호작용한다. 이와 같이, 상기 DNA-타겟팅 서열의 뉴클레오티드 서열은 변할 수 있으며, 이는 상기 대상 폴리뉴클레오티드와 상기 타겟 DNA가 상호작용하는 상기 타겟 DNA 내의 위치를 결정한다. 상기 DNA-타겟팅 서열은 상기 타겟 DNA 내의 임의의 원하는 서열에 하이브리드되도록 변형되거나 디자인(예, 유전공학) 될 수 있다. 특정 구현예에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥인 5'-CCN-3'(여기서, N은 임의의 DNA 뉴클레오티드)의 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)의 바로 옆 3'인 것일 수 있다. 즉, 본 구현예에서 상기 상기 타겟 폴리뉴클레오티드 서열의 상보적 가닥은 5'-CCN-3'(여기서, N은 임의의 DNA 뉴클레오티드)인 PAM 서열의 바로 옆 5'인 것일 수 있다. 관련 구현예에서, 상기 상보적 가닥의 PAM 서열은 야생형(wt) 또는 dCas9와 매치된다. 화농성 연쇄상구균(S. Pyogenes) 외의 기타 종의 PAM 서열은 상기를 참조하기 바란다.

상기 DNA-타겟팅 서열은 약 12 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 DNA-타겟팅 서열은 약 12 뉴클레오티드 내지 약 80 뉴클레오티드, 약 12 뉴클레오티드 내지 약 50 뉴클레오티드, 약 12 뉴클레오티드 내지 약 40 뉴클레오티드, 약 12 뉴클레오티드 내지 약 30 뉴클레오티드, 약 12 뉴클레오티드 내지 약 25 뉴클레오티드, 약 12 뉴클레오티드 내지 약 20 뉴클레오티드, 또는 약 12 뉴클레오티드 내지 약 19 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 DNA-타겟팅 서열은 약 19 뉴클레오티드 내지 약 20 뉴클레오티드, 약 19 뉴클레오티드 내지 약 25 뉴클레오티드, 약 19 뉴클레오티드 내지 약 30 뉴클레오티드, 약 19 뉴클레오티드 내지 약 35 뉴클레오티드, 약 19 뉴클레오티드 내지 약 40 뉴클레오티드, 약 19 뉴클레오티드 내지 약 45 뉴클레오티드, 약 19 뉴클레오티드 내지 약 50 뉴클레오티드, 약 19 뉴클레오티드 내지 약 60 뉴클레오티드, 약 19 뉴클레오티드 내지 약 70 뉴클레오티드, 약 19 뉴클레오티드 내지 약 80 뉴클레오티드, 약 19 뉴클레오티드 내지 약 90 뉴클레오티드, 약 19 뉴클레오티드 내지 약 100 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 20 뉴클레오티드 내지 약 35 뉴클레오티드, 약 20 뉴클레오티드 내지 약 40 뉴클레오티드, 약 20 뉴클레오티드 내지 약 45 뉴클레오티드, 약 20 뉴클레오티드 내지 약 50 뉴클레오티드, 약 20 뉴클레오티드 내지 약 60 뉴클레오티드, 약 20 뉴클레오티드 내지 약 70 뉴클레오티드, 약 20 뉴클레오티드 내지 약 80 뉴클레오티드, 약 20 뉴클레오티드 내지 약 90 뉴클레오티드, 약 20 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다.

상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열의 뉴클레오티드 서열은 최소한 약 12 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 최소한 약 12 뉴클레오티드, 최소한 약 15 뉴클레오티드, 최소한 약 18 뉴클레오티드, 최소한 약 19 뉴클레오티드, 최소한 약 20 뉴클레오티드, 최소한 약 25 뉴클레오티드, 최소한 약 30 뉴클레오티드, 최소한 약 35 뉴클레오티드 또는 최소한 약 40 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 약 12 뉴클레오티드 내지 약 80 뉴클레오티드, 약 12 뉴클레오티드 내지 약 50 뉴클레오티드, 약 12 뉴클레오티드 내지 약 45 뉴클레오티드, 약 12 뉴클레오티드 내지 약 40 뉴클레오티드, 약 12 뉴클레오티드 내지 약 35 뉴클레오티드, 약 12 뉴클레오티드 내지 약 30 뉴클레오티드, 약 12 뉴클레오티드 내지 약 25 뉴클레오티드, 약 12 뉴클레오티드 내지 약 20 뉴클레오티드, 약 12 뉴클레오티드 내지 약 19 뉴클레오티드, 약 19 뉴클레오티드 내지 약 20 뉴클레오티드, 약 19 뉴클레오티드 내지 약 25 뉴클레오티드, 약 19 뉴클레오티드 내지 약 30 뉴클레오티드, 약 19 뉴클레오티드 내지 약 35 뉴클레오티드, 약 19 뉴클레오티드 내지 약 40 뉴클레오티드, 약 19 뉴클레오티드 내지 약 45 뉴클레오티드, 약 19 뉴클레오티드 내지 약 50 뉴클레오티드, 약 19 뉴클레오티드 내지 약 60 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 20 뉴클레오티드 내지 약 35 뉴클레오티드, 약 20 뉴클레오티드 내지 약 40 뉴클레오티드, 약 20 뉴클레오티드 내지 약 45 뉴클레오티드, 약 20 뉴클레오티드 내지 약 50 뉴클레오티드, 약 20 뉴클레오티드 내지 약 60 뉴클레오티드의 길이를 가질 수 있다. 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열의 뉴클레오티드 서열은 최소한 약 12 뉴클레오티드의 길이를 가질 수 있다.

일부 경우에 있어서, 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 길이가 20 뉴클레오티드일 수 있다. 일부 경우에 있어서, 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열은 길이가 19 뉴클레오티드일 수 있다.

상기 DNA-타겟팅 서열 및 상기 타겟 DNA의 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 최소한 50%(예, 최소한 55%, 최소한 60%, 최소한 65%, 최소한 70%, 최소한 75%, 최소한 80%, 최소한 85%, 최소한 90%, 최소한 95%, 최소한 97%, 최소한 98%, 최소한 99%, 또는 100%)일 수 있다. 일부 경우에 있어서, 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 상기 타겟 폴리뉴클레오티드 서열의 7 또는 8 개의 연속적인 가장 5'쪽 뉴클레오티드에 대하여 100%일 수 있다. 일부 경우에 있어서, 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 20개의 연속적인 뉴클레오티드에 대하여 최소한 60%일 수 있다. 일부 경우에 있어서, 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 상보성 %는 상기 타겟 폴리뉴클레오티드 서열(즉, 상기 DNA-타겟팅 서열의 7, 8, 9, 10, 11, 12, 13, 또는 14 개의 연속적인 가장 3'쪽 뉴클레오티드)의 7, 8, 9, 10, 11, 12, 13, 또는 14 개의 연속적인 가장 5'인 뉴클레오티드에 대하여 100%일 수 있고, 나머지 부분에 대하여 0%까지 낮을 수도 있다. 이러한 경우, 상기 DNA-타겟팅 서열은 그 길이가 각각 7, 8, 9, 10, 11, 12, 13, 또는 14 개의 뉴클레오티드일 수 있다.

b. Cas9-결합 서열

상기 대상 폴리뉴클레오티드의 단백질-결합 세그먼트 또는 단백질-결합 서열은 야생형(wt) Cas9 또는 감소된 엔도뉴클레아제 활성이나 엔도뉴클레아제 활성이 결여된 변형된 dCas9 단백질(예, 틈내기 효소 또는 dCas9)에 결합한다. 단순히 말하면, 야생형(wt) 및/또는 변형된 Cas9 단백질에 결합할 수도 있는 상기 대상 폴리뉴클레오티드의 단백질-결합 서열은 이하 단순히 "Cas9-결합 서열"로 지칭될 수 있다. 그러나, 상기 본 발명의 Cas9-결합 서열이 dCas9에 결합할 때, 야생형(wt) Cas9 또는 Cas9 틈내기 효소에 결합하는 것을 방지하지 못함을 이해하여야 한다. 특정 구현예에 있어서, 상기 본 발명의 Cas9-결합 서열은 야생형(wt) Cas9 및/또는 Cas9 틈내기 효소 뿐 아니라 dCas9에도 결합할 수 있다.

상기 Cas9-결합 서열은 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)과 상호작용하거나 또는 결합하며, 이들은 함께 상기 DNA-타겟팅 서열에 의해 인식되는 상기 타겟 폴리뉴클레오티드 서열에 결합할 수 있다. 상기 Cas9-결합 서열은 이중 가닥의 RNA 듀플렉스(dsRNA duplex)를 형성하기 위하여 서로 하이브리드하는 뉴클레오티드의 2 개의 상보성 스트레치를 포함한다. 이들 2 개의 상보성 스트레치는 링커 또는 링커 뉴클레오티드(예, 단일-분자 폴리뉴클레오티드의 경우)로 알려진 뉴클레오티드들에 개입함으로써 공유결합될 수 있고, 상기 Cas9-결합 서열의 2중 가닥 RNA 듀플렉스(dsRNA 듀플렉스 또는 "Cas9-결합 머리핀")를 형성하도록 하이브리드됨으로써, 줄기-고리(stem-loop) 구조를 가지게 된다. 또는, 일부 구현예에서, 상기 2 개의 상보성 스트레치는 공유결합되지 않을 수 있으나, 그 대신 상보성 서열들(예, 본 발명의 두-분자 폴리뉴클레오티드의 경우) 사이의 하이브리드화에 의해 결합될 수 있다.

상기 Cas9-결합 서열은 약 10 뉴클레오티드 내지 약 100 뉴클레오티드, 예, 약 10 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 Cas9-결합 서열은 약 15 뉴클레오티드뉴클레오티드 내지 약 80 뉴클레오티드, 약 15 뉴클레오티드 내지 약 50 뉴클레오티드, 약 15 뉴클레오티드 내지 약 40 뉴클레오티드, 약 15 뉴클레오티드 내지 약 30 뉴클레오티드, 약 37 뉴클레오티드 내지 약 47 뉴클레오티드(예, 42 뉴클레오티드), 또는 약 15 뉴클레오티드 내지 약 25 뉴클레오티드의 길이를 가질 수 있다.

상기 Cas9-결합 서열의 dsRNA 듀플렉스는 약 6 bp 내지 약 50 bp의 길이를 가질 수 있다. 예를 들면, 상기 Cas9-결합 서열의 dsRNA 듀플렉스는 약 6 bp 내지 약 40 bp, 약 6 bp 내지 약 30 bp, 약 6 bp 내지 약 25 bp, 약 6 bp 내지 약 20 bp, 약 6 bp 내지 약 15 bp, 약 8 bp 내지 약 40 bp, 약 8 bp 내지 약 30 bp, 약 8 bp 내지 약 25 bp, 약 8 bp 내지 약 20 bp 또는 약 8 bp 내지 약 15 bp의 길이를 가질 수 있다. 예를 들면, 상기 Cas9-결합 서열의 dsRNA 듀플렉스는 약 8 bp 내지 약 10 bp, 약 10 bp 내지 약 15 bp, 약 15 bp 내지 약 18 bp, 약 18 bp 내지 약 20 bp, 약 20 bp 내지 약 25 bp, 약 25 bp 내지 약 30 bp, 약 30 bp 내지 약 35 bp, 약 35 bp 내지 약 40 bp, 또는 약 40 bp 내지 약 50 bp의 길이를 가질 수 있다. 일부 구현예에 있어서, 상기 Cas9-결합 서열의 dsRNA 듀플렉스는 36 bp의 길이를 가질 수 있다. 상기 Cas9-결합 서열의 dsRNA 듀플렉스를 형성하기 위하여 하이브리드하는 뉴클레오티드 서열들 사이의 상보성 %는 최소한 약 60%일 수 있다. 예를 들면, 상기 Cas9-결합 서열의 dsRNA 듀플렉스를 형성하기 위하여 하이브리드하는 뉴클레오티드 서열들 사이의 상보성 %는 최소한 약 65%, 최소한 약 70%, 최소한 약 75%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 95%, 최소한 약 98%, 또는 최소한 약 99%일 수 있다. 일부 구현예에 있어서, 상기 Cas9-결합 서열의 dsRNA 듀플렉스를 형성하기 위하여 하이브리드하는 뉴클레오티드 서열들 사이의 상보성 %는 100%일 수 있다.

상기 링커는 약 3 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 링커는 약 3 뉴클레오티드 내지 약 90 뉴클레오티드, 약 3 뉴클레오티드 내지 약 80 뉴클레오티드, 약 3 뉴클레오티드 내지 약 70 뉴클레오티드, 약 3 뉴클레오티드 내지 약 60 뉴클레오티드, 약 3 뉴클레오티드 내지 약 50 뉴클레오티드, 약 3 뉴클레오티드 내지 약 40 뉴클레오티드, 약 3 뉴클레오티드 내지 약 30 뉴클레오티드, 약 3 뉴클레오티드 내지 약 20 뉴클레오티드 또는 약 3 뉴클레오티드 내지 약 10 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 링커는 약 3 뉴클레오티드 내지 약 5 뉴클레오티드, 약 5 뉴클레오티드 내지 약 10 뉴클레오티드, 약 10 뉴클레오티드 내지 약 15 뉴클레오티드, 약 15 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 25 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 35 뉴클레오티드, 약 35 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 일부 구현예에 있어서, 상기 링커는 4 뉴클레오티드일 수 있다.

적합한 Cas9-결합 서열(즉, Cas9 핸들(handle))에 포함될 수 있는 뉴클레오티드 서열의 비제한적 예는 WO2013/176772(예를 들어, WO2013/176772의 도 8 및 9 참조 요망)의 서열 번호 563-682에 기재되어 있으며, 본 발명에 참고문헌으로서 결합된다.

일부 구현예에 있어서, 적합한 Cas9-결합 서열은 상기 나열된 서열 중 어느 하나와 1, 2, 3, 4, 또는 5 뉴클레오티드 차이가 있는 뉴클레오티드 서열을 포함할 수 있다.

c. PUF 영역-결합 서열(PBS)

상기 대상 폴리뉴클레오티드는 하나 또는 그 이상의 탠덤(tandem) 서열을 가지며, 이들 각각은 특정 PUF 영역에 의해 구체적으로 인식되고 결합될 수 있다(이하 기재). PUF 영역은 PUF 영역의 각 개별적 PUF 모티프(모티프) 및 이들이 인식하는 단일 RNA 뉴클레오티드 사이의 뉴클레오티드-특이적 상호 작용을 바탕으로 하여 실질적으로 어떤 PBS 에도 결합될 수 있도록 설계될 수 있으므로, 상기 PBS 서열들은 이들의 상응하는 PUF 영역에 결합하는 임의의 디자인된 서열일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 8-mer를 가질 수 있다. 다른 구현예에 있어서, 본 발명의 PBS는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 그 이상의 RNA 뉴클레오티드를 가질 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUAUA-3'를 가지며 야생형(wt) human Pumilio 1 PUF 영역에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUGUA-3'를 가지며 상기 PUF 영역 PUF(3-2)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUGAUAUA-3'를 가지며 상기 PUF 영역 PUF(6-2/7-2)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGGAUAUA-3'를 가지며 상기 PUF 영역 PUF(6-2)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUUAUAUA-3'를 가지며 상기 PUF 영역 PUF(7-2)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUGUGUG-3'를 가지며 상기 PUF 영역 PUF⁵³¹에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUAUG-3'를 가지며 상기 PUF 영역 PUF(1-1)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUUAUAUA-3' 또는 5'-UAUAUAUA-3'를 가지며 상기 PUF 영역 PUF(7-1)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UGUAUUUA-3'를 가지며 상기 PUF 영역 PUF(3-1)에 결합하는 것일 수 있다.

특정 구현예에 있어서, 본 발명의 PBS는 상기 서열 5'-UUUAUUUA-3'를 가지며 상기 PUF 영역 PUF(7-2/3-1)에 결합하는 것일 수 있다.

출원인은 특정 PBS에 결합할 수 있는 65,536 8-mer PBS 및 이들에 상응하는 PUF 영역 서열들을 제작하였다(하기 참조). 출원인은 또한 주어진 8-mer PBS에 결합하는 65,536 개의 개별적 PUF 영역 서열 중 어느 하나를 검색할(retrieve) 수 있는 파이썬 스크립트(python script)를 제작하였다. 예를 들면, 상기 8-mer UUGAUGUA에 대한 것으로서, 하나의 가능한 PUF 영역 서열은 하기와 같을 수 있다:

GRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGCRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

특정 구현예에 있어서, 하나 또는 그 이상의 스페이서 부위(들)는 2 개의 인접한 PBS 서열을 분리시킨다. 상기 스페이서 부위는 약 3 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 예를 들면, 상기 스페이서는 약 3 뉴클레오티드 내지 약 90 뉴클레오티드, 약 3 뉴클레오티드 내지 약 80 뉴클레오티드, 약 3 뉴클레오티드 내지 약 70 뉴클레오티드, 약 3 뉴클레오티드 내지 약 60 뉴클레오티드, 약 3 뉴클레오티드 내지 약 50 뉴클레오티드, 약 3 뉴클레오티드 내지 약 40 뉴클레오티드, 약 3 뉴클레오티드 내지 약 30 뉴클레오티드, 약 3 뉴클레오티드 내지 약 20 뉴클레오티드 또는 약 3 뉴클레오티드 내지 약 10 뉴클레오티드를 가질 수 있다. 예를 들면, 상기 스페이서는 약 3 뉴클레오티드 내지 약 5 뉴클레오티드, 약 5 뉴클레오티드 내지 약 10 뉴클레오티드, 약 10 뉴클레오티드 내지 약 15 뉴클레오티드, 약 15 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 25 뉴클레오티드, 약 25 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 35 뉴클레오티드, 약 35 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 길이를 가질 수 있다. 일부 구현예에서, 상기 스페이서는 4 뉴클레오티드의 길이를 가질 수 있다.

d. 선택성 기타 서열들

안정성 조절 서열(예, 전사 종결자 세그먼트(transcriptional terminator segment))는 RNA(예, 대상 폴리뉴클레오티드)의 안정성에 영향을 미친다. 적합한 안정성 조절 서열의 한 예로서 전사 종결자 세그먼트(즉, 전사 종결 서열)을 들 수 있다. 대상 폴리뉴클레오티드의 전사 종결자 세그먼트는 약 10 뉴클레오티드 내지 약 100 뉴클레오티드, 예를 들면, 약 10 뉴클레오티드 내지 약 20 뉴클레오티드, 약 20 뉴클레오티드 내지 약 30 뉴클레오티드, 약 30 뉴클레오티드 내지 약 40 뉴클레오티드, 약 40 뉴클레오티드 내지 약 50 뉴클레오티드, 약 50 뉴클레오티드 내지 약 60 뉴클레오티드, 약 60 뉴클레오티드 내지 약 70 뉴클레오티드, 약 70 뉴클레오티드 내지 약 80 뉴클레오티드, 약 80 뉴클레오티드 내지 약 90 뉴클레오티드, 또는 약 90 뉴클레오티드 내지 약 100 뉴클레오티드의 총 길이를 가질 수 있다. 예를 들면, 상기 전사 종결자 세그먼트는 약 15 뉴클레오티드 내지 약 80 뉴클레오티드, 약 15 뉴클레오티드 내지 약 50 뉴클레오티드, 약 15 뉴클레오티드 내지 약 40 뉴클레오티드, 약 15 뉴클레오티드 내지 약 30 뉴클레오티드, 또는 약 15 뉴클레오티드 내지 약 25 뉴클레오티드의 길이를 가질 수 있다.

일부 구현예에 있어서, 상기 전사 종결 서열은 진핵세포에서 기능을 갖는 것일 수 있다. 일부 구현예에 있어서, 상기 전사 종결 서열은 원핵세포에서 기능을 갖는 것일 수 있다.

안정성 조절 서열(예, 전사 종결 세그먼트, 또는증가된 안정성을 제공하기 위한 상기 DNA-타겟팅 RNA의 임의의 세그먼트)에 포함될 수 있는 뉴클레오타이드 서열의 비제한적인 예는 WO2013/176772(본원의 참조로 포함됨)의 서열 번호 683-696에 기재된 서열들(예, WO2013/176772의 서열 번호 795, Rho-독립적인 전사 종결 사이트)을 포함할 수 있다.

상기 안정성 조절 서열은 상기 Cas9-결합 서열 뒤, 예를 들면, 상기 Cas9-결합 서열 및 상기 제 1 PBS 사이, 2 개의 인접한 PBS 사이, 또는 최종 PBS 뒤에 위치할 수 있다.

일부 구현예에 있어서, 본 발명의 상기 폴리뉴클레오티드 또는 이의 일부(예, 상기 DNA-타겟팅 서열, 상기 Cas9-결합 서열 및/또는 the 하나 또는 그 이상의 상기 PBS), 또는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)를 코딩하는 폴리뉴클레오티드, 또는 상기 PUF 영역 융합들(이하 기재)을 코딩하는 폴리뉴클레오티드는 추가적인 바람직한 특징을 제공하는 변형 또는 서열(예, 변형되거나 조절된 안정성; 세포 내(subcellular) 타겟팅; 추적(예, 형광 표지; 단백질 또는 단백질 복합체를 위한 결합 사이트; 등)을 포함할 수 있다.

비제한적 예로는 다음을 들 수 있다: 5' cap(예, 7-메틸구아닐레이트 cap(m7G)); 3' 폴리아데닐레이티드 꼬리(즉, 3' 폴리(A) 꼬리); 리보스위치(riboswitch) 서열 또는 압타머 서열(예, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위한 서열); 종결자 서열; dsRNA 듀플렉스를 형성하는 서열(즉, 머리핀)); RNA를 세포 내(subcellular) 위치(예, 핵, 미토콘드리아, 엽록체 등)로 타겟하는 변형 또는 서열; 추적(예, 형광 분자에 대한 직접 결합(conjugation), 형광 검출을 도모하기 위한 부분(moiety)에 대한 결합(conjugation), 형광 검출을 허용하는 서열 등)을 제공하는 변형 또는 서열; 단백질(예, 전사 활성제, 전사 리프레서, DNA 메틸트란스퍼라제, DNA 디메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 디아세틸라제 등)을 포함하는 DNA에 작용하는 단백질; 증가, 감소되거나 및/또는 조절가능한 안정성을 제공하는 변형 또는 서열; 및 이들의 조합.

3. 상기 Cas9 단백질(야생형(wt), 틈내기 효소, 또는 dCas9)

본 발명의 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)는: 상기 대상 폴리뉴클레오티드의 Cas9-결합 서열과 상호작용하는 RNA-결합 부분 및 ii) 상기 Cas9 단백질의 아이덴티티에 따라, 야생형(wt), 감소된 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성, 또는 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성 결여를 나타내는 활성 부분을 포함한다.

상기 폴리뉴클레오티드의 Cas9-결합 서열과 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 DNA-타겟팅 서열 및 상기 타겟 폴리뉴클레오티드 서열 사이의 서열 상보성을 토대로, 특정 타겟 폴리뉴클레오티드 서열에 결합하는 복합체를 형성할 수 있다. 상기 대상 폴리뉴클레오티드의 NA-타겟팅 서열은 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 대한 이의 상보성을 통하여 상기 복합체에 대한 타겟 특이성을 제공한다. 상기 타겟 폴리뉴클레오티드 서열이, PBS-결합 PUF 영역에 융합된 후성적(epigenetic) 변형을 모듈레이트하는 전사 조절자 또는 이펙터와 함께, 타겟 유전자의 전사 조절 요소 또는 후성적 변형 사이트 및 상기 복합체에 또는 인접하여 있을 경우에는, 상기 타겟 유전자의 전사 또는 후성적 모듈레이션을 선택적으로 모듈레이트할 수 있다.

특정 구현예에 있어서, 상기 변형된 Cas9 단백질은 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성이 감소되거나 결여될 수 있다. 예를 들면, 본 발명의 방법에 사용하기에 적합한 변형된 Cas9는 Cas9 틈내기 효소일 수 있거나, 또는 야생형 Cas9 폴리펩타이드(예, WO2013/176772의 도 3 및 서열 번호 8에 도시된 아미노산 서열을 포함하는 야생형 Cas9 폴리펩타이드(이하 참조로 결합됨))의 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성을 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 약 1% 미만, 또는 약 0.1% 미만을 나타낼 수 있다. 일부 구현예에 있어서, 상기 dCas9는 실질적으로 검출가능한 엔도뉴클레아제(예, 엔도디옥시리보뉴클레아제) 활성을 가지지 않을 수 있다. 일부 구현예에 있어서, dCas9가 감소된 촉매 활성(예, Cas9 단백질이 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986및/또는 A987 돌연변이(예, D10A, G12A, G17A, E762A, H840A, N854A, N863A, H982A, H983A, A984A및/또는 D986A))을 가질 경우, 상기 폴리펩타이드가 대상 폴리뉴클레오티드의 DNA-타겟팅 서열에 의해 타겟 폴리뉴클레오티드 서열에 여전히 가이드 되기 때문에, 상기 폴리펩타이드가 대상 폴리뉴클레오티드의 Cas9-결합 서열과 상호작용하는 능력을 유지하는 한 상기 폴리펩타이드는 사이트-특이적 방법으로 여전히 타겟 DNA에 결합할 수 있다

일부 경우에 있어서, 적합한 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은, WO2013/176772(참조로 인용됨)의 도 3 및 서열 번호 8에 도시된 바와 같이,(화농연쇄상구균(Streptococcus pyogenes)의) Cas9/Csnl 아미노산 서열의 7-166 또는 731-1003 아미노산과 최소한 약 75%, 최소한 약 80%, 최소한 약 85%, 최소한 약 90%, 최소한 약 95%, 최소한 약 99% 또는 100%의 아미노산 동일성을 가지는 아미노산 서열; 또는 WO2013/176772(참조로 인용됨)의 서열 번호 1-256 및 795-1346의 아미노산 서열들 중 어느 하나에 해당하는 부분들, 바람직하기로는 화농연쇄상구균(S. pyogenes), 수막염균(N. meningitidis), 유산균(S. thermophilus) 및 티 덴티콜라(T. denticola)(Esvelt et al., Nature Methods, 10(11): 1116-1121, 2013, 참조로 인용) 참조)의 직교성(orthogonal) Cas9 서열의 아미노산 서열들 중 어느 하나에 해당하는 것을 포함할 수 있다.

일부 경우에 있어서, 상기 Cas9 틈내기 효소는 상기 타겟 DNA의 상보적 가닥을 절단할 수 있으나 상기 타겟 DNA의 비상보적 가닥을 절단하는 능력은 감소될 수 있다. 예를 들면, 상기 Cas9 틈내기 효소는 상기 RuvC 영역의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다. 비제한적 예에 있어서, 일부 경우에 있어서, 상기 Cas9 틈내기 효소는 WO2013/176772의 도 3에 도시된 아미노산 서열의 D10A(아스파르트산염(aspartate)의 알라닌으로의) 돌연변이거나 또는 WO2013/176772의 서열 번호 1-256 및 795-1346(참조로 인용된 모든 이들 서열들)에 기재된 아미노산 서열들 중 어느 하나의 해당 돌연변이일 수 있다.

일부 경우에 있어서, 상기 Cas9 틈내기 효소는 상기 타겟 DNA의 비상보적 가닥을 절단할 수 있으나 상기 타겟 DNA의 상보적 가닥을 절단하는 능력은 감소될 수 있다. 예를 들면, 상기 Cas9 틈내기 효소는 상기 HNH 영역(RuvC/HNH/RuvC 영역 모티프들)의 기능을 감소시키는 돌연변이(아미노산 치환)를 가질 수 있다. 비제한적 예에 있어서, 일부 경우에 있어서, 상기 Cas9 틈내기 효소는 H840A(WO2013/176772의 서열 번호 8의 아미노산 위치 840에서 히스티딘의 알라닌으로의 돌연변이, 참조로 인용) 또는 WO2013/176772의 서열 번호 1-256 및 795-1346(참조로 인용된 모든 이들 서열들)에 기재된 아미노산 서열들 중 어느 하나의 해당 돌연변이일 수 있다.

일부 경우에 있어서, 상기 dCas9는 상기 타겟 DNA의 상보적 가닥 및 비상보적 가닥을 모두 절단할 수 있는 능력을 가질 수 있다. 비제한적 예에 있어서, 일부 경우에 있어서, 상기 dCas9는 WO2013/176772의 도 3에 도시된 아미노산 서열의 D10A 및 H840A 돌연변이나 또는 WO2013/176772의 서열 번호 1-256 및 795-1346(참조로 인용된 모든 이들 서열들)을 모두 하버(harbor)할 수 있다.

기타 잔기들은 동일한 효과를 달성하기 위하여 돌연변이될 수 있다(즉, 하나 또는 다른 하나의 뉴클레아제 부분들을 비활성시킴). 비제한적 예에 있어서, 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986 및/또는 A987(또는 서열 번호 1-256 및 795-1346에 기재된 단백질 중 어느 하나의 해당 돌연변이가 변경(즉, 치환)될 수 있다(Cas9 아미노산 잔기들의 보존에 관련한 추가 정보는 WO2013/176772의 도 3, 5, 11A 및 표 1(참조로 인용된 모든 서열들) 참조 요망). 또한, 알라닌 이외의 다른 돌연변이가 적합할 수도 있다.

일부 경우에 있어서, 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 선택적으로 i) a Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질); 및 b) PUF 영역(하기 기재)에 융합된 파트너와 같거나 다를 수 있는 공유결합된 비상동 폴리펩타이드("융합 파트너"로도 칭함)를 포함하는 융합 폴리펩타이드일 수 있다.

4. PUF 영역(및 선택적 Cas9) 융합 단백질들

PUF 단백질들(Drosophila Pumilio 및 C. elegans fern-3 결합 인자를 따라 명명됨)은 mRNA 안정성 및 번역의 중개 과정에 관련된 것으로 알려져 있다. 이들 단백질은 PUF 영역으로 알려진 유일한 RNA-결합 영역을 가진다. 인간 Pumilio 1 단백질(PUM으로도 알려짐)의 것과 같은 RNA-결합 PUF 영역은 단일 염기를 인식하는 각 반복(repeat)(즉, PUF 반복 R1 내지 R8은 각각 N8 내지 N1을 인식함)과 역평행 방법으로 연속된 염기들과 결합하는 8 반복(각 반복은 PUF 모티프 또는 PUF 반복)을 포함한다. 예를 들면, PUM은 8 개의 탠덤 반복으로 구성되며, 각 반복은 알파 나선들로 구성된 꽉 채워진 영역으로 접혀지는 34 개 아미노산으로 구성된다.

각 PUF 반복은 RNA 인식 서열 내의 하나의 개별 염기의 에지(edge)를 특이적으로 인식하기 위하여 각 반복의 중앙으로부터 2 개의 보존된 아미노산을 사용하고 인접 염기들 사이에서 적층하기 위해 제 3 아미노산(Tyr, His 또는 Arg)을 사용하여, PUF 영역 및 8-mer RNA 사이에 매우 특이적 결합을 야기시킨다. 예를 들면, 염기 U를 인식하는 코드는 아미노산 서열 "NYxx"인 반면, "(C/S)RxxQ"는 A를 인식하고 "SNxxE"는 G를 인식한다. 이들 아미노산은 인간 Pumilio 1 단백질 모티프의 위치 12, 13 및 16에 해당한다. 각 PUF α-α-α반복에 있는 위치 12 및 16의 아미노산 측쇄의 2 개의 인식 아미노산은 해당 염기의 Watson-Crick 에지를 인식하고 상기 반복의 특이성을 대체로 결정한다.

따라서, 상기 PUF 영역의 서열 특이성은 상기 RNA 인식 서열 내의 염기 인식에 관여하는 상기 보존된 아미노산(예, 부위 특이적 돌연변이)을 변경함으로써 정밀하게 변화될 수 있다. 각 반복에 있는 2 개의 아미노산을 변경함으로써, PUF 영역은 거의 모든 임의의 8 뉴클레오티드 RNA 서열과 결합할 수 있다. 이러한 독특한 결합 모드는 본 발명에서 사용될 수 있는 PUF 및 이의 유도체를, 임의의 이펙터 영역을 대상 폴리뉴클레오티드 상의 특정 PBS에 가져올 수 있는 PUF 영역-융합의 일부로서, 프로그램할 수 있는 RNA-결합 영역으로 만들 수 있다.

본 발명에서, "PUF 영역"는 프로토타입(prototype) 인간 Pumilio 1 PUF 영역과 같은 자연적 또는 기존의 PUF 영역을 기초로 하거나 /이로부터 유도된 PUF 동족체(homologue) 영역뿐만 아니라 야생형 또는 자연에 존재하는 PUF 영역을 의미한다. 본 발명의 PUF 영역은 RNA 서열(예, an 8-mer RNA 서열)에 특이적으로 결합하며, 여기서 상기 PUF 영역 및 상기 RNA 서열 사이의 전체적 결합 특이성은 상기 PUF 영역 및 해당 단일 RNA 뉴클레오티드 내의 각 PUF 모티프/PUF 반복 사이의 서열 특이 결합에 의해 정의된다.

특정 구현예에 있어서, 상기 PUF 영역은 8 개의 PUF를 포함하거나 이들로 필수적으로 구성되며, 각각은 하나의 RNA 뉴클레오티드(예, A, U, G, 또는 C)를 특이적으로 인식하여 결합한다.

출원인은 특이 PBS에 결합할 수 있는 65,536 8-mer PBS 및 이들의 PUF 영역 서열들(각각 약 350 개의 아미노산 길이)를 제작하였다. 출원인은 또한 주어진 8-mer PBS에 결합하는 65,536 개의 개별적 PUF 영역 서열 중 어느 하나를 검색할(retrieve) 수 있는 파이썬 스크립트(python script)를 제작하였다.

특정 구현예에 있어서, 상기 PUF 영역은 대략 8 개의 PUF 모티프/반복을 가질 수 있다. 예를 들면, 상기 PUF 영역은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,16, 또는 그 이상의 PUF 반복/모티프를 포함하거나 이들로 필수적으로 구성되며, 상기 PUF 영역이 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 또는 그 이상의 뉴클레오티드의 RNA에 결합하는 한, 이들의 각각은 하나의 RNA 뉴클레오티드(예, A, U, G, 또는 C)를 특이적으로 인식하여 결합한다. PUF 모티프의 수를 증가 또는 감소시킴으로써, 인식된 RNA의 길이를 상응하게 증가 또는 감소시킬 수 있다. 각 PUF 모티프는 하나의 RNA 염기를 인식하므로, 상기 영역의 하나의 모티프를 감소시킴으로써 하나의 염기에 의해 인식된 RNA의 길이를 감소시키며, 상기 영역의 하나의 모티프를 증가시킴으로써 하나의 염기에 의해 인식된 RNA의 길이를 증가시킨다. 임의의 숫자의 모티프가 존재할 수 있다. 따라서, 이러한 구현예에 있어서, 상기 본 발명의 PUF 영역-융합들의 특이성은 PUF 영역의 길이의 변경에 따라 변화될 수 있다. 특정 구현예에 있어서, 상기 추가적 PUF 모티프들은 오리지널 PUF 모티프 2 개 사이에 삽입된다; 예, 첫 번째 이전, 첫 번째와 두 번째 사이, 두 번째와 세 번째 사이, 세 번째와 네 번째 사이, 네 번째와 다섯 번째 사이, 다섯 번째와 여섯 번째 사이, 여섯 번째와 일곱 번째 사이, 일곱 번째와 여덟 번째 사이, 또는 8 번째 이후. 특정 구현예에 있어서, 1, 2, 3, 4, 5, 6, 7, 8, 또는 그 이상의 PUF 모티프가 임의의 삽입 지점들 사이에 삽입될 수 있다. 예를 들면, 특정 구현예에 있어서, 1, 2, 3, 4, 5, 6, 7, 8, 또는 그 이상의 PUF 모티프가 상기 다섯 번째 및 여섯 번째 오리지널 PUF 모티프 사이에 삽입될 수 있다. Filipovska et al.(Nature Chemical Biology doi: 10.1038/NChemBio.577, published online: 15 may 2011)는 상기 다섯 번째 및 여섯 번째 오리지널 PUF 모티프 사이에 삽입된 8 개의 추가 PUF 모티프를 포함하는, 16개의 PUF 모티프를 가지는 조작된 PUF 영역을 보고한 바 있다.

특정 구현예에 있어서, 상기 PUF 영역은 상이한 단백질들의 상이한 PUF 영역들로부터의 PUF 모티프를 포함할 수 있다. 예를 들면, 본 발명의 PUF 영역은 상기 인간 Pumilio 1 단백질의 PUF 모티프들 및 PuDp 또는 FBF과 같은 하나 또는 그 이상의 다른 PUF 단백질로부터의 하나 또는 그 이상의 다른 PUF 모티프로 제작될 수 있다. PUF 영역의 RNA 결합 포켓들은 자연적인 오목 곡률을 가진다. 상이한 PUF 단백질은 상이한 곡률을 가질 수 있으므로, PUF 영역의 상이한 PUF 모티프들은 상기 PUF 영역의 곡률을 변화시키는 데 사용될 수 있다. 평평한 곡률은 더 많은 RNA 염기들을 인식가능하게 하므로, 곡률을 변화시키는 것은 상기 PUF 영역의 특이성 및/또는 결합 친화력을 변화시키는 또 다른 방법이 될 수 있다.

또한 상기 대상 PUF 영역들의 기능적 변이체들 및 이의 융합체들 역시 본 발명의 범위에 포함된다. 본 발명에서 사용된 용어 "기능적 변이체(기능적 변이체)"는 모(parent) PUF 영역의 생물학적 활성을 유지하며 모(parent) PUF 영역과 실질적으로 또는 상당한 서열 동일성 또는 유사성을 가지는 PUF 영역(예; 결합력에 있어서 타겟 RNA를 인식하는 능력이 모(parent) PUF 영역과 유사하거나, 동일하거나, 또는 더 높거나 및/또는 모(parent) PUF 영역과 실질적으로 동일하거나 동등한 결합 특이성을 가진 PUF 영역)으로서 모(parent) PUF 영역의 변이체인 PUF 영역을 의미한다. 상기 기능적 변이체 PUF 영역은, 예를 들면, 모(parent) PUF 영역과 아미노산 서열에 있어서 최소한 약 30%, 50%, 75%, 80%, 90%, 98% 또는 그 이상 동일할 수 있다. 상기 기능적 변이체 PUF 영역은, 예를 들면, 최소한 하나의 아미노산 치환을 가지는 모(parent) PUF 영역의 아미노산 서열, 예를 들면, PUF 영역의 발판(scaffold)에서의 보존된 아미노산 치환(즉, 상기 RNA와 상호작용을 하지 않는 아미노산들)을 포함한다. 또는 추가적으로, 상기 기능적 변이체는 최소한 하나의 비보존적 아미노산 치환을 가지는 모(parent) PUF 영역과 아미노산 서열을 포함할 수 있다. 이 경우, 상기 비보존적 아미노산 치환은 상기 기능적 변이체의 생물학적 활성을 방해하거나 저해하지 않는 것이 바람직하다. 상기 비보존적 아미노산 치환은 상기 기능적 변이체의 생물학적 활성이 모(parent) PUF 영역과 대비하여 증가되거나 또는 상기 PUF 영역의 안정성을 원하는 수준까지 변화시킬 수 있도록 상기 기능적 변이체의 생물학적 활성을 증진시킬 수 있다(예, 발판에서의 아미노산의 치환에 기인함). 상기 PUF 영역은 구체화된 아미노산 서열이나 또는 이하 기재된 서열들(예, 상기 기능적 변이체의 생물학적 활성을 중대하게 변화시키지 않는 다른 아미노산들)을 필수적으로 하여 구성될 수 있다.

특정 구현예에 있어서, 상기 PUF 영역은 Pumilio homology 영역(PU-HUD)일 수 있다. 특정 구현예에 있어서, 상기 PU-HUD은 인간 Pumilio 1 영역일 수 있다. 상기 인간 PUM의 서열은 당업계에 공지되어 있으며 하기와 같이 재생될 수 있다:

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly

상기 야생형(wt) 인간 PUM은 코어 8-뉴클레오티드 서열 5'-UGUAUAUA-3'를 포함하는 나노스 반응 요소(Nanos Response Element(NRE)) RNA에 특이적으로 결합한다.

특정 구현예에 있어서, 본 발명의 상기 PUF 영역은 Pum-HD 영역을 가지는 임의의 PUF 단백질 패밀리 구성원일 수 있다. PUF 단백질 패밀리 구성원의 비제한적 예는 C. elegans의 FBF, 초파리(Drosophila)의 Ds pum 및 애기장대(Arabidopsis) 및 쌀과 같은 식물의 PUF 단백질들일 수 있다. 상기 애기장대(Arabidopsis), 쌀 및 기타 식물 및 비식물 종 PUM-HD의 계통수(phylogenetic tree)는 Tam et al.("The Puf family of RNA-binding proteins in plants: phylogeny, structural modeling, activity and subcellular localization.” BMC Plant Biol. 10:44, 2010, 그 전체 내용은 본원에서 참조로 결합됨)에 제공되어 있다.

PUF 패밀리 구성원들은 효모로부터 인간에 이르기까지 고도로 보존되어 있으며, 상기 패밀리의 모든 구성원들은 예측가능한 코드에 의하여 서열 특이적 방법으로 RNA에 결합한다. 상기 영역의 접수 번호는 Prosite 데이터 베이스(Swiss Institute of Bioinformatics) 상의 PS50302 이며 상기 패밀리의 구성원들 중 일부의 서열 정렬은 WO 2011-160052 A2의 도 5 및 6((사람, 생쥐, 쥐 Pumilio 1의 ClustalW 멀티플 서열 정렬(hpum1, Mpum1, Ratpum1) 및 인간 및 생쥐 Pumilio 2(hpum2, Mpum2))에 각각 도시되어 있다.

초파리(Drosophila) Pumilio(PumDr)은 다른 포유류 Pumilio 1 동족체들과 그 길이에 있어서 매우 달라서 단지 C-말단 PUF HUD 영역만이 WO 2011-160052 A2의 도 6에 인간 PUM1 및 PUM2와 서열 정렬되어 있다. 인간 및 파리 Pum 단백질의 N-말단 부분은 상동성이 낮음(40% 유사성)을 보여주며 크기 및 단백질 서열에 있어서 상당히 차이가 있음을 보여 준다. 상기 C-말단은 Pum RNA-결합 영역에 대하여 고도로 보존된 단백질 서열 및 구조를 가지며, 매우 높은 상동성 및 진화적 보존률(PUM1에 대하여 78% 동일성 및 86% 유사성 및 PUM2에 대하여 79% 동일성 및 88% 유사성)을 보이고 있다. 세 단백질 모두에 있어서, PUM-HD는 20 아미노산으로 이루어진 N-말단 보존 부분, 각각 36개 아미노산으로 이루어진 8개의 Pum 반복 및 C-말단 보존 부위로 구성되어 있다. 인간 Pumilio 단백질에 있어서, 상기 C-말단 보존 부분은 44 개 아미노산의 길이로 되어 있는 반면, 초파리(Drosophila) 단백질은 C-말단 보존 부위에 85 개의 추가적 아미노산 삽입체를 포함한다. 상기 뉴클레오티드 및 아미노산 서열은 접수 번호 F315592(PUM1) 및 AF315591(PUM2)(Spassov & Jurecic, “Cloning and comparative sequence analysis of PUM1 and PUM2 genes, human members of the Pumilio family of RNA-binding proteins,” Gene, 299:195-204, October 2002,(발표 및 서열들) 각각은 본원에 참조로 결합됨)로 DDBJ/EMBL/GENBANK^®데이터 베이스에서 찾을 수 있다.

추가로, 모든 정렬된 서열들, 즉 WO 2011/160052A2의 서열번호 55-60,은 본원에 참조로 결합된다.

일부 구현예에 있어서, 본 발명의 상기 PUF 영역은 8 개의 36 mers로 구성될 수 있으며, 이 중 33 개의 아미노산은 보존되어 있으며 34 번째, 35 번째 및 36 번째 아미노산들은 변할 수 있으며 이로 인해 RNA 서열 상의 특정 염기에 대한 특이성을 부여할 수 있다. 특정 구현예에 있어서, 상기 RNA 결합 영역은 그 길이가 약 300(예, 310, 309, 308, 307, 306, 305, 304, 303, 302, 301, 300, 299, 298, 297, 296, 295, 294, 293, 292, 291, 290 등) 아미노산일 수 있다. 일부 구현예에 있어서, 본 발명의 상기 PUF 영역은 약 8 뉴클레오티드(예, 8-16 연속적 RNA 염기)의 특정 RNA 서열에 결합되도록 디자인되어 있을 수 있다. 특정 구현예에 있어서, 상기 8 뉴클레오티드 서열의 5 번째 뉴클레오티드는 U 또는 C이며 나머지 7 뉴클레오티드는 변할 수 있다.

일부 구현예에 있어서, 상기 PUF 영역은 야생형(wt) PUF 영역으로부터 변형되지 않은 변형되지 않은(즉, 야생형) RNA 결합 PUF 영역에 의해 결합된 RNA 서열과 상이한 RNA 서열에 결합되도록 변형될 수 있다. 상기 RNA 서열은 약 8mer(예, an 8mer, 9 mer, 10mer, 11mer, 12mer, 13mer, 14mer, 15mer, 16mer 등). 타겟 RNA 서열에 대한 특이성을 변화시키기 위하여 상기 RNA 결합 영역의 아미노산 서열로 변형을 유도하는 능력은 상기 RNA 결합 영역(예, PUF 단백질들)의 상이한 아미노산 측쇄들을 가지는 염기들의 공지된 상호작용을 바탕으로 한다. 상기 PUF 영역의 RNA 인식 코드는 하기에 도시되어 있으며 일반적으로 하기와 같이 기재될 수 있다:

SNxxE와 같은 SerXXXGlu는 G(구아닌);

CysArgXXGln 또는 SerArgXXGln와 같은 CysXXXGln(즉,(C/S)RxxQ)는 A(아데닌);

NYxxQ와 같은 AsnXXXGln는 U(우라실), 및

SerTyrXXArg와 같은 SnXXXArg는 C(사이토신).

상기에서 X는 임의의 아미노산이고, Sn은 Gly, Ala, Ser, Thr, 또는 Cys와 같은 작거나 친핵성 잔기를 나타낸다.

상기 가이드라인을 토대로, 최소한 하나의 PUF 영역은 임의의 제시된 8-mer 서열에 기초하여 구성될 수 있다. 구체적으로 5'-N₁N₂N₃N₄N₅N₆N₇N₈-3'의 8-mer RNA 서열에 결합하는 PUF 영역은 하기 서열 포뮬라를 가질 수 있으며, 여기서 R1 내지 R8 각각은 임의의 N₁ 내지 N₈의 위치에서의 리보뉴클레오티드(즉, A, U, C, 또는 G)의 구체적 아이덴티티에 따라 하기 표에 나열된 PUF 모티프 펩타이드 서열을 나타낸다. R1은 N₈에 결합하며 R2는 N₇에 결합하는 등이다.

GlyArgSerArgLeuLeuGluAspPheArgAsnAsnArgTyrProAsnLeuGlnLeuArgGluIleAlaGlyHisIleMetGluPheSerGlnAsp[R1]ThrProAlaGluArgGlnLeuValPheAsnGluIleLeuGlnAlaAlaTyrGlnLeuMetValAsp[R2]SerLeuGluGlnLysLeuAlaLeuAlaGluArgIleArgGlyHisValLeuSerLeuAlaLeuGln[R3]ProSerAspGlnGlnAsnGluMetValArgGluLeuAspGlyHisValLeuLysCysValLysAsp[R4]GlnProGlnSerLeuGlnPheIleIleAspAlaPheLysGlyGlnValPheAlaLeuSerThrHis[R5]LeuProAspGlnThrLeuProIleLeuGluGluLeuHisGlnHisThrGluGlnLeuValGlnAsp[R6]ArgProGluAspLysSerLysIleValAlaGluIleArgGlyAsnValLeuValLeuSerGlnHis[R7]SerArgThrGluArgAlaValLeuIleAspGluValCysThrMetAsnAspGlyProHisSerAlaLeuTyrThrMetMetLysAsp[R8]GluProGlyGlnArgLysIleValMetHisLysIleArgProHisIleAlaThrLeuArgLysTyrThrTyrGlyLysHisIleLeuAlaLysLeuGluLysTyrTyrMetLysAsnGlyValAspLeuGly

N8 뉴클레오티드	R1 펩타이드 서열
A	GlnHisGly CysArg PheIle Gln LeuLysLeuGluArgAla
A	GlnHisGly SerArg PheIle Gln LeuLysLeuGluArgAla
C	GlnHisGly Ser ArgPheIle Arg LeuLysLeuGluArgAla
	GlnHisGly Gly ArgPheIle Arg LeuLysLeuGluArgAla
	GlnHisGly Ala ArgPheIle Arg LeuLysLeuGluArgAla
	GlnHisGly Thr ArgPheIle Arg LeuLysLeuGluArgAla
	GlnHisGly Cys ArgPheIle Arg LeuLysLeuGluArgAla
G	GlnHisGly Ser ArgPheIle Glu LeuLysLeuGluArgAla
U	GlnHisGly Asn ArgPheIle Gln LeuLysLeuGluArgAla

N7 뉴클레오티드	R2 펩타이드서열
A	ValPheGly CysArg ValIle Gln LysPhePheGluPheGly
	ValPheGly SerArg ValIle Gln LysPhePheGluPheGly
	ValPheGly Cys TyrValIle Gln LysPhePheGluPheGly
	ValPheGly Ser TyrValIle Gln LysPhePheGluPheGly
C	ValPheGly Ser TyrValIle Arg LysPhePheGluPheGly
	ValPheGly Gly TyrValIle Arg LysPhePheGluPheGly
	ValPheGly Ala TyrValIle Arg LysPhePheGluPheGly
	ValPheGly Thr TyrValIle Arg LysPhePheGluPheGly
	ValPheGly Cys TyrValIle Arg LysPhePheGluPheGly
G	ValPheGly Ser TyrValIle Glu LysPhePheGluPheGly
U	ValPheGly AsnTyrValIle Gln LysPhePheGluPheGly

N6 뉴클레오티드	R3 펩타이드 서열
A	MetTyrGly CysArg ValIle Gln LysAlaLeuGluPheIle
A	MetTyrGly SerArg ValIle Gln LysAlaLeuGluPheIle
C	MetTyrGly Ser ArgValIle Arg LysAlaLeuGluPheIle
	MetTyrGly Gly ArgValIle Arg LysAlaLeuGluPheIle
	MetTyrGly Ala ArgValIle Arg LysAlaLeuGluPheIle
	MetTyrGly Thr ArgValIle Arg LysAlaLeuGluPheIle
	MetTyrGly Cys ArgValIle Arg LysAlaLeuGluPheIle
G	MetTyrGly Ser ArgValIle Glu LysAlaLeuGluPheIle
U	MetTyrGly Asn ArgValIle Gln LysAlaLeuGluPheIle

N5 뉴클레오티드	R4 펩타이드 서열
A	GlnAsnGly CysArg ValVal Gln LysCysIleGluCysVal
	GlnAsnGly SerArg ValVal Gln LysCysIleGluCysVal
	GlnAsnGly Cys HisValVal Gln LysCysIleGluCysVal
	GlnAsnGly Ser HisValVal Gln LysCysIleGluCysVal
C	GlnAsnGly Ser HisValVal Arg LysCysIleGluCysVal
	GlnAsnGly Gly HisValVal Arg LysCysIleGluCysVal
	GlnAsnGly Ala HisValVal Arg LysCysIleGluCysVal
	GlnAsnGly Thr HisValVal Arg LysCysIleGluCysVal
	GlnAsnGly Cys HisValVal Arg LysCysIleGluCysVal
G	GlnAsnGly Ser HisValVal Glu LysCysIleGluCysVal
U	GlnAsnGly Asn HisValVal Gln LysCysIleGluCysVal

N4 뉴클레오티드	R5 펩타이드 서열
A	ProTyrGly CysArg ValIle Gln ArgIleLeuGluHisCys
A	ProTyrGly SerArg ValIle Gln ArgIleLeuGluHisCys
C	ProTyrGly Ser ArgValIle Arg ArgIleLeuGluHisCys
	ProTyrGly Gly ArgValIle Arg ArgIleLeuGluHisCys
	ProTyrGly Ala ArgValIle Arg ArgIleLeuGluHisCys
	ProTyrGly Thr ArgValIle Arg ArgIleLeuGluHisCys
	ProTyrGly Cys ArgValIle Arg ArgIleLeuGluHisCys
G	ProTyrGly Ser ArgValIle Glu ArgIleLeuGluHisCys
U	ProTyrGly Asn ArgValIle Gln ArgIleLeuGluHisCys

N3 뉴클레오티드	R6 펩타이드 서열
A	GlnTyrGly CysArg ValIle Gln HisValLeuGluHisGly
	GlnTyrGly SerArg ValIle Gln HisValLeuGluHisGly
	GlnTyrGly Cys TyrValIle Gln HisValLeuGluHisGly
	GlnTyrGly Ser TyrValIle Gln HisValLeuGluHisGly
C	GlnTyrGly Ser TyrValIle Arg HisValLeuGluHisGly
	GlnTyrGly Gly TyrValIle Arg HisValLeuGluHisGly
	GlnTyrGly Ala TyrValIle Arg HisValLeuGluHisGly
	GlnTyrGly Thr TyrValIle Arg HisValLeuGluHisGly
	GlnTyrGly Cys TyrValIle Arg HisValLeuGluHisGly
G	GlnTyrGly Ser TyrValIle Glu HisValLeuGluHisGly
U	GlnTyrGly Asn TyrValIle Gln HisValLeuGluHisGly

N2 뉴클레오티드	R7 펩타이드 서열
A	LysPheAla CysArg ValVal Gln LysCysValThrHisAla
	LysPheAla SerArg ValVal Gln LysCysValThrHisAla
	LysPheAla Cys AsnValVal Gln LysCysValThrHisAla
	LysPheAla Ser AsnValVal Gln LysCysValThrHisAla
C	LysPheAla Ser AsnValVal Arg LysCysValThrHisAla
	LysPheAla Gly AsnValVal Arg LysCysValThrHisAla
	LysPheAla Ala AsnValVal Arg LysCysValThrHisAla
	LysPheAla Thr AsnValVal Arg LysCysValThrHisAla
	LysPheAla Cys AsnValVal Arg LysCysValThrHisAla
G	LysPheAla Ser AsnValVal Glu LysCysValThrHisAla
U	LysPheAla Asn AsnValVal Gln LysCysValThrHisAla

N1 뉴클레오티드	R8 펩타이드 서열
A	GlnTyrAla CysArg ValVal Gln LysMetIleAspValAla
	GlnTyrAla SerArg ValVal Gln LysMetIleAspValAla
	GlnTyrAla Cys TyrValVal Gln LysMetIleAspValAla
	GlnTyrAla Ser TyrValVal Gln LysMetIleAspValAla
C	GlnTyrAla Ser TyrValVal Arg LysMetIleAspValAla
	GlnTyrAla Gly TyrValVal Arg LysMetIleAspValAla
	GlnTyrAla Ala TyrValVal Arg LysMetIleAspValAla
	GlnTyrAla Thr TyrValVal Arg LysMetIleAspValAla
	GlnTyrAla Cys TyrValVal Arg LysMetIleAspValAla
G	GlnTyrAla Ser TyrValVal Glu LysMetIleAspValAla
U	GlnTyrAla Asn TyrValVal Gln LysMetIleAspValAla

변형된 RNA 결합 특이성을 가지는 상기 RNA 인식 코드를 토대로 제작된 몇몇 구현예로서의 PUF 영역들이 하기에 제시되어 있으며, 이들 각각은 본 발명의 PUF 영역-융합체를 제작하는 데 사용될 수 있다.

PUF(3-2)

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly

PUF(3-2)는 상기 PUF 반복 3에 2 개의 점 돌연변이(C935S/Q939E)를 가지며 NRE(A6G; 5'-UGUAUGUA-3')의 위치 6에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

PUF(6-2/7-2)

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly

PUF(6-2/7-2)는 반복 6 및 7에서 각각 더블 점 돌연변이들(N1043S/Q1047E 및 S1079N/E1083Q)을 가지며 상기 NRE(GU/UG; 5'-UUGAUAUA-3')의 위치 2 및 3에서 2 개의 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

관련 PUF(6-2)는 반복 6에서 점 돌연변이(N1043S/Q1047E)을 가지며 상기 NRE(5'-UGGAUAUA-3')의 위치 3에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

또 다른 관련 PUF(7-2)는 반복 7에서 점 돌연변이(S1079N/E1083Q)을 가지며 상기 NRE(5'-UUUAUAUA-3')의 위치 2에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

PUF ⁵³¹

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly

상기 PUF 영역 PUF531은 야생형 PUF 반복 1, 3 및 5에서 돌연변이들(Q867E/Q939E/C935S/Q1011E/C1007S)를 가지며 상기 서열 5'-UGUGUGUG-3'를 인식한다. 상기 PUF531은 야생형 PUF RNA에 비하여 매우 높은 친화력으로 그의 신규 타겟 서열을 인식할 수 있다.

다른 변형된 PUF 영역 PUF(1-1)는 PUF 반복 1 에서 하나의 점 돌연변이(Q867E)를 가지며 상기 NRE(A8G; 5'-UGUAUAUG-3')의 위치 8에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

또 다른 변형된 PUF 영역 PUF(7-1)는 PUF 반복 7 에서 하나의 점 돌연변이(E1083Q)를 가지며 상기 NRE(G2U; 5'-UUUAUAUA-3'; 또는 G2A; 5'- UAUAUAUA-3')의 위치 2에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

또 다른 변형된 PUF 영역 PUF(3-1)는 PUF 반복 3 에서 하나의 점 돌연변이(C935N)를 가지며 상기 NRE(A6U; 5'-UGUAUUUA-3')의 위치 6에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

또 다른 변형된 PUF 영역 PUF(7-2/3-1)는 PUF 반복 7 및 3에서 점 돌연변이들(C935N/S1079N/E1083Q)을 가지며 상기 NRE(5'-UGUAUUUA-3')의 위치 2 및 6에서 돌연변이를 가지는 동족(cognate) RNA를 인식한다.

특정 변형된 PUF 영역들의 서열들은 하기에 표시된 바와 같다.

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Asn Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr

Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn

Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp

Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro

Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln

Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu

Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly

His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Asn Arg Val Ile Gln

Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg

Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn

His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln

Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His

Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro

Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln

Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu

His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly

Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln

Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp

Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met

Met Lys Asp Gln Tyr Ala Cys Tyr Val Val Gln Lys Met Ile Asp Val

Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His

Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys

Leu Glu Lys Tyr Tyr

본 발명에 따르면, 비상동 폴리펩타이드("융합 파트너"로도 칭함)는 상기 대상 폴리뉴클레오티드 상의 PBS 중 최소한 하나에 결합하는 본 발명의 상기 PUF 영역에 융합될 수 있다. 또한, 원할 경우에는, 같거나 다른 융합 파트너 역시 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 선택적으로 융합될 수 있다. 따라서, 이하에 기재된 바와 같이, 특히 부정되지 않는 한, 상기 융합 파트너들 중 하나는 PUF 영역에 융합되게 되어 있으며 또한 선택적으로 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합될 수 있다. 상기 PUF 영역에 융합된 상기 융합 파트너는 상기 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 융합된 선택적 융합 파트너와 같거나 다를 수 있다(이하 기재).

상기 융합 파트너는 활성을 나타낼 수 있다(예, 효소 활성). 적합한 융합 파트너들은, 이에 국한되는 것은 아니지만, 메틸트랜스퍼라제 활성, 디메틸라제 활성, 아세틸트랜스퍼라제 활성, 디아세틸라제 활성, 키나제 활성, 포스포타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴 활성, 아데닐레이션 활성, 디아데닐레이션 활성, SUMO화(SUMOylating) 활성, 탈SUMO화(deSUMOylating) 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화(myristoylation) 활성, 또는 탈미리스토일화(demyristoylation) 활성을 제공하며, 이들 중 임의의 하나는 DNA를 직접 변형하는 데(예, DNA 메틸화) 또는 DNA-관련 폴리펩타이드(예, 히스톤 또는 DNA 결합 단백질)를 변형하는 곳으로 유도될 수 있다.

단백질 이름	기능
전사 활성제
GAL4	전사 활성화
VP16	전사 활성화
VP64	전사 활성화
p65 하부 영역(NFkB)	전사 활성화
전사 리프레서
KRAB	전사 리프레션
Mad mSIN3 상호작용 영역(SID)	전사 리프레션
ERF 리프레서 영역(ERD)	전사 리프레션
히스톤 라이신 메틸트랜스퍼라제(KMT)
KMT1 패밀리: SUV39H1,SUV39H2, G9A, ESET/SETDB1, 및 동족체들(Clr4, Su(var)3-9)	헤테로크로마틴 형성/ 전사 리프레션
KMT2 패밀리: hSET1A, hSET1B, MLL 1 내지 5, ASH1, 및 동족체들(Trx, Trr, Ash1)	전사 활성화
KMT3 패밀리: SYMD2, NSD1	전사 활성화
KMT4: DOT1L 및 동족체들	전사 활성화
KMT5 패밀리: Pr-SET7/8, SUV4-20H1, 및 동족체들(PR-set7, Suv4-20, Set9)	DNA 손상 반응, 전사 리프레션
KMT6: EZH2	폴리콤 사일렌싱(polycomb silencing)
KMT8: RIZ1	전사 리프레션
히스톤 라이신 디메틸트랜스퍼라제(KDM)
KDM1: LSD1/BHC110 및 동족체들 (SpLsd1/Swm1/Saf110, Su(var)3-3)	전사 활성화 및 전사 리프레션, 헤테로크로마틴 형성
KDM3 패밀리: JHDM2a/b	안드로겐 수용체 유전자 활성화, 정자형성(spermatogenesis)
KDM4 패밀리: JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, 및 동족체들(Rph1)	전사 확장, 전사 리프레션, 헤테로크로마틴형성, 게놈 무결성(integrity)
KDM5 패밀리: JARID1A/RBP2, JARID1B/PLU-1, JARID1C/SMCX, JARID1D/SMCY 및 동족체들(Lid, Jhn2, Jmj2)	전사 리프레션
KDM6 패밀리: UTX, JMJD3	전사 활성화

단백질 명칭	기능
히스톤 라이신 아세틸트랜스퍼라제(KAT)
KAT2 패밀리; hGCN5, PCAF 및 동족체들(dGCN5/PCAF, Gcn5)	전사 활성화, DNA 복구
KAT3 패밀리;CBP, p300 및 동족체들(dCBP/NEJ)	전사 활성화, DNA 복구
KAT4: TAF1 및 동족체들(dTAF1)	전사 활성화
KAT5: TIP60/PLIP 및 동족체들	전사 활성화, DNA 복구
KAT6: MOZ/MYST3, MORF/MYST4 및 동족체들(Mst2, Sas3, CG1894)	전사 활성화 및 확장, DNA 복제
KAT7: HBO1/MYST2 및 동족체들	전사, DNA 복제
KAT8: HMOF/MYST1 및 동족체들(dMOF, CG1894, Sas2, Mst2)	크로마틴 경계, 복용량 보정, DNA 복구
KAT13 패밀리: SRC1, ACTR, P160, CLOCK 및 동족체들	전사 활성화
히스톤 라이신 디아세틸라제
Class I: HDAC1, HDAC2, HDAC3, HDAC8(및 동족체들(Rpd3, Hos1, Cir6)	전사 리프레션, 헤테로크로마틴 형성
Class IIa: HDAC4, HDAC5, HDAC7,HDAC9 및 동족체들(Hda1, Cir3 등)	전사 리프레션, 헤테로크로마틴 형성
Class III: SIRT1, SIRT2 및 동족체들(Sir2, Hst1, Hst2, Hst3, Hst4)	전사 리프레션, 헤테로크로마틴 형성
Class IV: HDAC11	전사 리프레션
DNA 메틸라제(아데노신 또는 사이토신 변형)
Dam(E. coli)	제한 시스템(restriction system)
Dcm(E. coli)	제한 시스템
M. SssI(Spiroplasma sp)	제한 시스템
DNMT1	전사 리프레션, 임프린팅, 헤테로크로마틴 형성
DNMT3a/DNMT3b. METI, DRM3(식물) 및 동족체들	전사 리프레션, 임프린팅, 헤테로크로마틴 형성
크로모메틸라제, 예: ZMET2, CMT1, CMT2(식물)	전사 리프레션, 임프린팅, 헤테로크로마틴 형성
DNA 디메틸라제
AID/Apobec 디아미나제 패밀리: AID	전사 활성화, 게놈 무결성(integrity)
TET 디옥시게나제 패밀리: TET1	전사 활성화, 게놈 무결성
DEMETER 글리코실라제 패밀리: DME, DML1, DML2, ROS1	전사 활성화, 게놈 무결성

단백질 명칭	기능
경계 요소(Boundary elements)
CTCF	크로마틴 절연, 헤테로크로마틴 스프레딩 억제(chromatin spreading suppression)
주변 모집 요소(Periphery recruitment elements)
Lamin A	전사 리프레션
Lamin B	전사 리프레션
단백질 도킹 요소들(Protein Docking Elements)
FKBP/FRB(S. pombe)	라파마이신 의존형 모집(rapamycin dependent recruitment)
Pil1/Aby1(E. coli)	ABA 의존형 모집(ABA dependent recruitment)

추가적 융합 파트너는 GFP, Superfolder GFP, EGFP, BFP, EBFP, EBFP2, Azurite, mKalama1, CFP, ECFP, Cerulean, CyPet, mTurquoise2, YFP, Citrine, Venus, Ypet, BFPms1, roGFP 와 같은 다양한 형광 단백질, 폴리펩타이드, 변이체, 또는 기능적 영역들 및 UnaG, dsRed, eqFP611, Dronpa, TagRFPs, KFP, EosFP, Dendra, IrisFP 등과 같은 빌리루빈-유도가능한 형광 단백질들을 포함할 수 있다.

추가적으로 적합한 융합 파트너들은 주변 모집(periphery recruitment)을 제공하는 경계 요소들(예, CTCF), 단백질 및 단편들 및 단백질 도킹 요소들(예, FKBP/FRB, Pill/Abyl 등)을 포함하나, 이에 제한되지는 않는다.

추가적으로 전사의 증가 또는 감소를 성취하기 위한 융합 파트너의 비제한적인 예는 하기에 기재되어 있으며, 전사 활성 인자 및 전사 억제 인자 영역들(예, Kruppel 관련 박스(KRAB 또는 SKD); Mad mSIN3 상호작용 영역(SID); ERF 리프레서 영역(ERD) 등)을 포함한다.

일부 구현예에 있어서, 상기 비상동 서열은 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 C-말단에 융합될 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 N-말단에 융합될 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 내부의 일부분(N-말단이나 C-말단이 아닌 부분)에 융합될 수 있다.

일부 구현예에 있어서, PUF 영역 융합은 PUF 영역을 세포 내부의 위치화(즉, 상기 비상동 서열은 세포 내부의 위치화 서열; 예, 핵을 타겟팅하기 위한 핵 위치화 신호(PPKKKRKV와 같은 NLS); 미토콘드리아를 타겟팅하기 위한 미토콘드리아 위치화 신호; 엽록체를 타겟팅하기 위한 엽록체 위치화 신호; ER 유지 신호 등)를 위해 제공되는 비상동 서열과 융합함으로써 발생할 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 추적 및/또는 정제를 용이하게 하기 위한 태그(즉, 상기 상동 서열은 검출가능한 표지임)(예, 형광 단백질, 예, 녹색 형광 단백질(GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예, 6×His 태그; 혈구응집소(HA) 태그; FLAG 태그; Myc 태그 등)을 제공할 수 있다. 일부 구현예에 있어서, 안정성을 증가 또는 감소시키기 위해 상기 비상동 서열(즉, 상기 비상동 서열은 안정성 조절 펩타이드임; 온도 민감성 또는 약물 조절가능한 degron 서열, 이하 참조)을 제공할 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 상기 타겟 DNA로부터 전사를 증가 또는 감소시키기 위해 제공할 수 있다(즉, 상기 비상동 서열은 전사 모듈레이션 서열, 예, 전사 인자/ 활성제 또는 이들의 단편, 전사 인자를 모집(recruit)하는 단백질 또는 이의 단편/ 활성제, 전사 억제 인자 또는 이의 단편, 전사 억제 인자를 모집하는 단백질 또는 이의 단편, 소 분자 / 약물반응 전사 조절자 등). 일부 구현예에 있어서, 상기 비상동 서열은 결합 영역(즉, 상기 비상동 서열은 단백질 결합 서열, 예, 다른 관심 단백질(예, DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제 인자, 모집(recruiting) 단백질 등)에 결합하는 키메라 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 능력을 제공할 수 있다. 일부 구현예에 있어서, 상기 비상동 서열은 다른 관심 단백질(예, DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제 인자, 모집(recruiting) 단백질 등)에 결합하는 키메라 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)의 능력을 제공하는 결합 영역을 제공할 수 있다.

증가 또는 감소된 안정성을 제공하기 위한 적합한 융합 파트너는 degron 서열을 포함하나, 이에 국한되는 것은 아니다. 당업자에게 있어서 Degrons은 단백질의 일부로서 그 안정성을 조절하는 아미노산 서열로서 쉽게 이해된다. 예를 들면, degron 서열을 포함하는 단백질의 안정성은 최소한 부분적으로 상기 degron 서열에 의해 조절된다. 일부 경우에 있어서, 적합한 degron은 실험적 조절(즉, 상기 degron 이 약물 유도나 온도 유도가 가능하지 않음 등)과 독립적으로 단백질 안정성에 영향을 미칠 수 있도록 항시성을 가질 수 있다. 일부 경우에 있어서, 상기 degron은 원하는 조건에 따라 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 켜지거나("on", 즉, 안정한) 또는 꺼지도록("off", 즉, 불안정하고 ,분해되는) 조절가능한 안정성을 가지는 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 제공할 수 있다. 예를 들면, 상기 degron이 온도 민감형인 경우, 상기 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 임계 온도(예, 42°C, 41°C, 40°C, 39°C, 38°C, 37°C, 36°C, 35°C, 34°C, 33°C, 32°C, 31°C, 30°C 등) 이하의 온도에서는 기능적(즉, "on", 안정한)일 수 있으나, 상기 임계 온도 이상에서는 비기능적(즉, "off", 분해되는)일 수 있다. 또 다른 예로서, 상기 degron이 약물 유도성 degron일 경우, 약물의 존재여부는 "off"(즉, 불안정) 상태에서 "on"(즉, 안정한) 상태 또는 그 반대로 해당 단백질을 스위치할 수 있다 일 구현예로서, 상기 약물 유도가능 degron는 상기 FKBP12 단백질에서 유래될 수 있다. 상기 degron의 안정성은 degron에 결합하는 소 분자의 존재 유무에 따라 조절된다.

적합한 degrons의 예로는 Shield-1, DHFR, auxins 및/또는 온도에 의해 조절되는 degrons을 포함하나 이들에 국한되는 것은 아니다. 적합한 degrons의 비제한적 예는 당업계에 공지되어 있다(예, Dohmen et al., Science, 263(5151): 1273-1276, 1994: "Heat-inducible degron: a method for constructing temperature-sensitive mutants"; Schoeber et al., Am. J. Physiol. Renal. Physiol., 296(l):F204-211, 2009: "Conditional fast expression and function of multimeric TRPV5 channels using Shield-1"; Chu et al., Bioorg. Med. Chem. Lett., 18(22): 5941-4, 2008: "Recent progress with FKBP-derived destabilizing domains"; Kanemaki, Pflugers Arch., 2012: "Frontiers of protein expression control with conditional degrons"; Yang et al., Mol. Cell., 48(4):487-8, 2012: "Titivated for destruction: the methyl degron"; Barbour et al., Biosci. Rep., 33(1), 2013: "Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase"; and Greussing et al., J. Vis. Exp.,(69), 2012: "Monitoring of ubiquitin-proteasome activity in living cells using a Degron(dgn)-destabilized green fluorescent protein(GFP)-based reporter protein"; 상기 모두는 인용참증으로서 본원에 포함됨).

구현예로서의 degron 서열들은 그 특성이 잘 알려져 있으며 세포 및 동물에서 모두 시험된 바 있다. 따라서, Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 degron 서열과 융합하면 "조율가능한(tunable)" 및 "유도가능한(inducible)" PUF 영역 또는 Cas9(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)을 생산할 수 있다.

본 발명에 기재된 융합 파트너 중 임의의 하나를 임의의 원하는 조합으로 사용할 수 있다. 비제한적 예로서는, 각 PUF 영역은 같거나 다른 융합 파트너들에 독립적으로 융합될 수 있고 이들은 상기 대상 폴리뉴클레오티드의 PBS의 시리즈에 임의의 순서로 결합할 수도 있다. 예를 들면, 하나의 PUF 영역은 검출을 위하여 YFP 서열에, 제 2의 PUF 영역은 안정성을 위하여 degron 서열에, 그리고 제 3 PUF 영역은 상기 타겟 DNA의 전사를 증가시키고자 전사 활성 인자 서열에 각각 융합될 수 있다. PUF 영역 융합의 이들 유형 중 임의의 하나는 상기 대상 폴리뉴클레오티드 상에 하나 이상의 결합 사이트 또는 PBS를 가질 수 있다. 상기 PUF 영역 융합에 사용될 수 있는 융합 파트너의 수는 대체로 제한되지 않는다(예, 최소한 2, 5, 10, 20, 30, 40, 50 또는 그 이상).

일부 구현예에 있어서, 임의의 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합 단백질은 하나 또는 그 이상의(예, 둘 또는 그 이상, 셋 또는 그 이상, 넷 또는 그 이상, 또는 다섯 또는 그 이상) 비상동 서열 또는 융합 파트너를 포함할 수 있다.

일부 구현예에 있어서, 임의의 상기 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 PUF 영역 융합은 코돈-최적화 될 수 있다. 이런 유형의 최적화는 당업계에 알려져 있으며 의도된 숙주 유기체의 동일 단백질을 코딩하는 한편 코돈 선호도를 모방하기 위하여 외래 유래 DNA의 돌연변이를 수반한다. 따라서, 상기 코돈들은 변경되지만 코딩된 단백질은 변경되지 않은 채 남게 된다. 예를 들면, 상기 의도된 타겟 세포가 인간 세포라면, 인간 코돈-최적화된 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합은 더욱 적합한 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합이 될 것이다. 다른 비제한적 예로서, 상기 의도된 타겟 세포가 생쥐의 세포라면, 생쥐 코돈-최적화된 PUF 영역 융합 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 적합한 PUF 영역 융합 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)이 될 것이다. 코돈 최적화가 요구되지는 않지만 이는 수용가능하고 또한 특정 경우에는 선호될 수도 있다.

상기 대상 PUF 영역은 임의의 하나는, 예를 들면, Addgene(Kit # 1000000051)에 제공되는 Golden Gate Assembly 키트(Abil et al., Journal of Biological Engineering 8:7, 2014 참조)를 이용하여 만들 수 있다.

5. 전사 모듈레이션

본 발명의 상기 PUF 영역 및/또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합 단백질은 상기 대상 폴리뉴클레오티드의 상기 DNA-타겟팅 서열에 의해 상기 타겟 DNA에 있는 특정 위치(즉, 타겟 폴리뉴클레오티드 서열)에 타겟팅되어 RNA 폴리머라제가(선택적으로 전사 활성 인자 기능을 저해하는) 프로모터에 결합하는 것을 차단하거나 및/또는 국소적 크로마틴 상태를 변형하는(예, 융합 서열이 상기 타겟 DNA를 변형하거나 또는 상기 타겟 DNA와 관련된 폴리펩타이드를 변형하는 데 사용되는 경우) 것과 같이 좌위-특이적 조절을 하게 된다.

일부 경우에 있어서, 상기 변경들은 일시적 일 수 있다(예, 전사 리프레션 또는 활성화). 일부 경우에 있어서, 상기 변경들은 유전되는 것일 수 있다(예, 후성적 변형들은 상기 타겟 DNA 또는 상기 타겟 DNA와 관련된 단백질들(예, 뉴클레오솜 히스톤)에 만들어진다

대상 PUF 영역 또는 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 융합 단백질을 이용하는 방법의 생물학적 효과들은 임의의 편리한 방법(예, 유전자 발현 분석법: 크로마틴-기초 분석법들, 예, Chromatin immunoPrecipitation(ChiP), Chromatin in vivo Assay(CiA) 등; 등)으로 검출될 수 있다.

일부 경우에 있어서, 대상 방법은 둘 또는 그 이상의 상이한 DNA-타겟팅 서열을 사용할 수 있다. 예를 들면, 2 개의 상이한 DNA-타겟팅 서열을(2 개의 상이한 DNA-타겟팅 서열이 동일 타겟 핵산에서 2 개의 상이한 DNA-타겟팅 서열을 타겟하는) 단일 숙주 세포에서 사용할 수 있다. 따라서, 예를 들면, 대상 전사 모듈레이션 방법은 추가로 상기 숙주 세포에 제 2 DNA-타겟팅 서열, 또는 상기 제 2 DNA-타겟팅 서열을 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 도입하는 것을 포함할 수 있다. 일부 경우에 있어서, 동일한 타겟 핵산 내에서 2 개의 상이한 타겟팅 서열을 타겟팅하는 2 개의 상이한 DNA-타겟팅 서열을 사용하면 상기 타겟 핵산의 전사에서 증가된 모듈레이션(예, 감소 또는 증가)을 제공하게 된다.

또 다른 예로서, 2 개의 상이한 타겟팅 서열은 2 개의 상이한 DNA-타겟팅 서열이 2 개의 상이한 타겟 핵산을 타겟하는 단일 숙주 세포에서 사용할 수 있다.

따라서, 특정 구현예에 있어서, 본 발명의 전사 모듈레이션 방법은 숙주 세포에서 타겟 핵산의 선택적 모듈레이션(예, 감소 또는 증가)을 제공할 수 있다. 예를 들면, 타겟 핵산 전사의 "선택적" 감소는 상기 타겟 핵산의 전사를 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 타겟 핵산의 전사 수준과 비교하여, 최소한 약 10%, 최소한 약 20%, 최소한 약 30%, 최소한 약 40%, 최소한 약 50%, 최소한 약 60%, 최소한 약 70%, 최소한 약 80%, 최소한 약 90%, 또는 90% 이상 감소될 수 있다. 타겟 핵산의 전사의 선택적 감소는 상기 타겟 핵산의 전사를 감소시키지만 비타겟 핵산의 전사를 실질적으로 감소시키지는 않는다(예; 비타겟 핵산의 전사가 감소된다 하더라도 상기 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 비타겟 핵산의 전사 수준과 비교하여 10% 미만이 감소됨).

반면에, "선택적" 타겟 DNA의 증가된 전사는, 상기 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 타겟 DNA의 전사 수준과 비교하여, 상기 타겟 DNA의 전사를 최소한 약 1.1 배(예, 최소한 약 1.2 배, 최소한 약 1.3 배, 최소한 약 1.4 배, 최소한 약 1.5 배, 최소한 약 1.6 배, 최소한 약 1.7 배, 최소한 약 1.8 배, 최소한 약 1.9 배, 최소한 약 2 배, 최소한 약 2.5 배, 최소한 약 3 배, 최소한 약 3.5 배, 최소한 약 4 배, 최소한 약 4.5 배, 최소한 약 5 배, 최소한 약 6 배, 최소한 약 7 배, 최소한 약 8 배, 최소한 약 9 배, 최소한 약 10 배, 최소한 약 12 배, 최소한 약 15 배, 또는 최소한 약 20-배) 증가시킬 수 있다. 타겟 DNA의 전사의 선택적 증가는 상기 타겟 DNA의 전사를 증가시키지만 비타겟 DNA의 전사를 실질적으로 증가시키지는 않는다(예; 비타겟 핵산의 전사가 증가된다 하더라도 상기 DNA-타겟팅 서열 / 변형된 Cas9 폴리펩타이드 / PUF 영역-융합 복합체가 없는 경우의 상기 비타겟 DNA의 전사 수준과 비교하여 약 5 배 미만(약 4 배 미만, 약 3 배 미만, 약 2 배 미만, 약 1.8 배 미만, 약 1.6 배 미만, 약 1.4 배 미만, 약 1.2 배 미만, 또는 약 1.1 배 미만)이 감소됨).

비제한적 예로서, 증가된 전사는 dCas9을 상기 비상동 서열네 융합시키거나 및/또는 상기 비상동 서열을 상기 대상 폴리뉴클레오티드의 PBS에 결합하는 상기 PUF 영역들 중 하나에 융합시킴으로써 성취할 수 있다. 적합한 융합 파트너는 상기 타겟 DNA 또는 상기 타겟 DNA와 관련된 폴리펩타이드(예, 히스톤 또는 기타 DNA-결합 단백질)에 직접 작용함으로써 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩타이드를 포함하나, 이에 국한되는 것은 아니다. 적합한 융합 파트너는 메틸트랜스퍼라제 활성, 디메틸라제 활성, 아세틸트랜스퍼라제 활성, 디아세틸라제 활성, 키나제 활성, 포스포타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴 활성, 아데닐레이션 활성, 디아데닐레이션 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩타이드를 포함하나, 이에 국한되는 것은 아니다.

추가로 적합한 융합 파트너는 상기 타겟 핵산의 증가된 전사를 직접 제공하는 폴리펩타이드(예, 전사 활성 인자 또는 이의 단편, 전사 활성 인자를 모집(recruit)하는 단백질 또는 이의 단편, 소 분자/약물-반응적 전사 조절 인자 등)를 포함하나, 이에 국한되는 것은 아니다. "PUF 영역(및 선택적 dCas9) 융합 단백질" 섹션 참조 요망.

원핵동물에서 전사를 증가시키기 위하여 dCas9 융합 단백질 및/또는 PUF 영역-융합 단백질을 사용하는 대상 방법의 비제한적 예로는 박테리아 1-하이브리드(B1H) 또는 2-하이브리드(B2H) 시스템의 변형을 포함한다. 상기 B1H 시스템에서는, DNA 결합 영역(BD)은 박테리아 전사 활성화 영역(AD, 예, E. coli RNA 폴리머라제(RNAPα)의 alpha 서브유닛)에 융합된다. 따라서, 대상 dCas9 또는 PUF 영역은 AD를 포함하는 비상동 서열에 융합될 수 있다. 상기 대상 dCas9 또는 PUF 영역 융합 단백질이(상기 DNA-타겟팅 서열에 의해 그 곳으로 타겟된) 프로모터의 상류 지역에 도달하면, 상기 dCas9 또는 PUF 영역 융합 단백질의 AD(예, RNAPα)는 상기 RNAP holo효소를 모집(recruit)하여 전사의 활성화에 이르게 된다. 상기 B2H 시스템 에서는, 상기 BD가 상기 AD에 직접 융합되지 않고 대신 이들의 상호작용이 단백질-단백질 상호작용(예, GAL11P-GAL4 상호작용)에 의해 매개된다. 이러한 대상 방법들에서 이러한 시스템을 변형하기 위해서, dCas9 또는 PUF 영역을 단백질-단백질 상호작용(예, 효모 GAL11P 및/또는 GAL4 단백질)을 제공하는 제 1 단백질 서열에 융합될 수 있으며, RNAPα는 상기 단백질-단백질 상호작용(예, GAL11P이 dCas9 또는 PUF 영역에 융합되어 있으면 GAL4, GAL4 이 dCas9 또는 PUF 영역에 융합되어 있으면 GAL11P 등)을 완성하는 제 2 단백질 서열에 융합될 수 있다. 상기 GAL11P 및 GAL4 사이의 결합력은 결합 및 전사율의 효율을 증가시킨다.

진핵동물에서 전사를 증가시키기 위하여 dCas9 및/또는 PUF 영역-융합 단백질을 사용하는 대상 방법의 비제한적 예로는 dCas9 및/또는 PUF 영역을 활성화 영역(예, GAL4, 헤르페스 바이러스(herpesvirus) 활성 단백질 VP16 또는 VP64, 인간 핵 인자 NF-κΒ p65 서브유닛 등)에 융합하는 것을 포함한다. 상기 시스템을 유도성으로 하기 위해, 상기 dCas9 / PUF 영역 융합 단백질의 발현은 유도성 프로모터(예, Tet-ON, Tet-OFF 등)에 의해 조절될 수 있다. 상기 DNA-타겟팅 서열은 공지된 반응 요소들(예, 프로모터들, 인핸서들 등), 공지된 상류 활성화 서열들(UAS), 상기 타겟 DNA의 발현을 조절할 수 있을 것으로 예상되는 미공지 또는 공지의 기능의 서열들 등을 타겟하도록 디자인할 수 있다.

일부 구현예에 있어서, 동일한 타겟 DNA 또는 상이한 타겟 DNA 상에 있는 상이한 위치에서의 전사를 동시에 모듈레이트하기 위해 복수 개의 대상 폴리뉴클레오티드가 동일 세포에서 동시에 사용될 수 있다. 일부 구현예에 있어서, 2 개 또는 그 이상의 대상 폴리뉴클레오티드는 동일한 유전자 또는 전사체 또는 좌위를 타겟할 수 있다. 일부 구현예에 있어서, 2 개 또는 그 이상의 대상 폴리뉴클레오티드는 상이한 관련 없는 좌위를 타겟할 수 있다. 일부 구현예에 있어서, 2 개 또는 그 이상의 대상 폴리뉴클레오티드는 상이한 관련된 좌위를 타겟할 수 있다.

상기 대상 폴리뉴클레오티드들은 작고 강하기 때문에, 이들은 동일 발현 벡터에 동시에 존재할 수 있고 또한 원할 경우 동일 전사 조절 하에 있을 수도 있다. 일부 구현예에 있어서, 2 개 또는 그 이상(예, 3 또는 그 이상, 4 또는 그 이상, 5 또는 그 이상, 10 또는 그 이상, 15 또는 그 이상, 20 또는 그 이상, 25 또는 그 이상, 30 또는 그 이상, 35 또는 그 이상, 40 또는 그 이상, 45 또는 그 이상, 또는 50 또는그 이상)의 대상 폴리뉴클레오티드는 동일하거나 상이한 벡터들로부터 타겟 세포에서 동시에 발현될 수 있다. 상기 발현된 대상 폴리뉴클레오티드는 S화농연쇄상구균(S. pyogenes), 유산균(S. thermophilus), 리스테리아균(L. innocua) 및 수막염균(N. meningitidis)과 같은 상이한 박테리아의 직교형 dCas9 단백질들에 의해 다르게 인식될 수 있다.

복수의 대상 폴리뉴클레오티드를 발현하기 위하여, Csy4 엔도리보뉴클레아제에 의해 매개되는 인공 RNA 처리 시스템을 사용할 수 있다. 복수 개의 대상 폴리뉴클레오티드는 전구체 전사체(precursor transcript)(예, U6 프로모터에서 발현) 상에 탠덤 배열로 연쇄될 수 있고 Csy4-특이적 RNA 서열에 의해 분리될 수 있다. 공발현된(co-expressed) Csy4 단백질은 상기 전구체 전사체를 복수의 대상 폴리뉴클레오티드로 절단한다. RNA 처리 시스템의 사용상 잇점은 다음과 같다: 첫째, 복수의 프로모터 또는 벡터를 사용할 필요가 없고; 둘째, 모든 대상 폴리뉴클레오티드들이 전구체 전사체로부터 처리되므로, 이들의 농도는 유사한 야생형(wt) Cas9 / Cas9 틈내기 효소 / dCas9-결합을 위해 정규화된다.

Csy4 는 박테리아 Pseudomonas aeruginosa로부터 유래된 작은 엔도리보뉴클레아제(RNase) 단백질이다. Csy4 는 최소한 17-bp RNA 머리핀을 특이적으로 인식하며 RNA 절단을 신속하게(1분 이내) 그리고 고효율적(>99.9)으로 처리한다. 대부분의 RNases와 달리, 상기 절단된 RNA 단편은 안정한 채로 유지되며 기능적으로 활성을 가진다. 상기 Csy4-기초의 RNA 절단은 인공 RNA 처리 시스템으로 용도가 변경될 수 있다. 이러한 시스템에서, 상기 17-bp RNA 머리핀은 단일 프로모터의 전구체 전사체로 전사되는 복수의 RNA 단편들 사이에 삽입된다. Csy4의 공발현은 개개 RNA 단편들을 제조하는 데 효과적이다.

6. 숙주 세포들

본 발명의 전사를 모듈레이트하는 방법은 유사분열 또는 유사분열 후 세포에서 생체 내(in vivo) 및/또는 생체 외(ex vivo) 및/또는 실험실 내(in vitro) 방법으로 전사 모듈레이션을 유도하는 방법을 사용할 수 있다. 상기 대상 폴리뉴클레오티드는 타겟 DNA의 타겟 폴리뉴클레오티드 서열에 하이브리드 함으로써 특이성을 제공하므로, 유사분열 및/또는 유사분열 후 세포는 다양한 숙주 세포 중 임의의 하나 일 수 있고, 여기서 적합한 숙주 세포는 박테리아 세포; 고세균 세포(archaeal cell); 단세포 진핵 유기체; 식물세포; 조류 세포(예; 보트리오코쿠스 브라우니(Botryococcus braunii), 녹조류(Chlamydomonas reinhardtii), 미세조류(Nannochloropsis gaditana), 클로렐라- 피레노이도사(Chlorella pyrenoidosa), 쌍발이 모자반(Sargassum patens), 갈조류(C. agardh) 등; 진균 세포; 동물 세포; 무척추 동물 세포(예, 곤충, 자포동물(cnidarian), 극피동물, 선충(nematode) 등); 진핵세포 기생충(예, 말라리아 기생충, 예, 열대말라리아열원충(Plasmodium falciparum); 기생충(helminth); 등); 척추동물 세포(예, 어류, 양서류, 파충류, 조류, 포유류); 포유류 세포(예, 설치류 세포, 인간 세포, 비인간 영장류 세포 등)을 포함하나, 이에 국한되는 것은 아니다. 적합한 숙주세포는 자연발생적 세포들; 유전적으로 변형된 세포들(예, 실험실에서 유전적으로 변형된 세포들, 예, "사람 손으로"); 및 실험실에서 임의의 방법으로 조작된 세포들을 포함할 수 있다. 일부 경우에 있어서, 숙주 세포는 단리 또는 배양된 것일 수 있다.

임의의 유형의 세포가 관심의 대상이 될 수도 있다(예, 줄기 세포, 예; 배아줄기세포, 유도만능줄기세포, 생식세포; 체세포, 예; 섬유아세포, 조혈세포, 신경세포, 근육세포, 뼈세포, 간세포, 췌장세포; 임의의 시기의 실험실 내 또는 생체 내 배아의 배아 세포, 예, 1-세포, 2-세포, 4-세포, 8-세포,등 제브라 피시 배아; 등). 세포들은 확립된 세포주(established cell lines) 또는 1차 배양된 세포들(primary cells)일 수 있으며, 여기서 "1차 배양된 세포(primary cell)", "1차 세포주(primary cell line)" 및 "1차 배양물(primary cultures)"은 대상으로부터 유래된 것으로서 제한된 계대 수의 기간 동안 실험실 내에서 배양이 허용되는 세포 및 세포 배양물을 의미한다(즉, 배양액의 분리물(splittings, of the culture)). 예를 들면, 1차 배양물은 0 회, 1 회, 2 회, 4 회, 5 회, 10 회 계대 배양한 배양물을 포함하나 위기 시기(crisis stage)를 충분한 횟수로 경험한 것을 의미하지는 않는다. 1차 세포주는 실험실 내에서 10 회 미만의 계대 배양을 거친 세포를 의미한다. 타겟 세포는 많은 구현예에서 단세포 유기체이거나 배양으로 성장한 세포를 의미한다.

상기 세포가 1차 세포라면, 이들 세포는 임의의 편리한 방법으로 개체로부터 수득된 것일 수 있다. 예를 들면, 백혈구 세포는 분리반출법(apheresis), 백혈구 분리반출법(leukocytapheresis), 밀도기울기분리(density gradient separation) 등에 의해 수득될 수 있으며, 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등의 조직으로부터 수득한 세포는 부검을 통하여 가장 간편하게 수득할 수 있다. 적합한 용액은 수득된 세포의 분산 및 현탁에 사용될 수 있다. 이러한 용액은 일반적으로 저농도(예, 5-25 mM)의 수용가능한 완충액과 같이 소태아 혈청 또는 기타 자연발생적 인자들을 간편하게 공급한 균형된 염 용액(예; 생리 식염수, 인산염 완충 식염수, HBSS(Hank's Balanced Salt Solution) 등일 수 있다. 간편한 완충액은 HEPES, 인산염 완충액, 젖산 완충액 등을 포함한다. 이들 세포는 즉시 사용하거나 또는 저장, 장기간 냉동 후, 해동 및 재사용 할 수 있다. 이러한 경우에, 이들 세포는 10% 디메틸 설폭사이드(DMSO), 50% 혈청, 40% 완충 배지, 또는 기타 상기 냉동 온도에서 세포 보존을 위해 당업계에서 통상 사용하거나 냉동된 배양 세포들을 해동하기 위하여 당업계에서 사용하는 용액들에 냉동될 수 있다.

7. 핵산의 숙주 세포로의 도입

대상 폴리뉴클레오티드, 이를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 또는 상기 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 다양한 공지의 방법들 중 임의의 방법을 사용하여 숙주 세포로 도입할 수 있다.

핵산을 숙주 세포로 도입하는 방법들은 당업계에 공지되어 있으며, 핵산(예, 벡터 또는 발현 작체물)을 줄기 세포 또는 간세포(progenitor cell)에 도입하기 위해 임의의 공지된 방법을 사용할 수 있다. 적합한 방법들로서, 바이러스 또는 박테리오파지 감염, 형질감염, 컨쥬게이션, 원형질체 융합, 리포펙션(lipofection), 전기천공, 칼슘 인산염 침전, 폴리에틸렌이민(polyethyleneimine;PEI)-매개 형질감염, DEAE-dextran 매개 형질감염, 리포좀-매개 형질감염, 입자총(particle gun) 기술, 칼슘 인산염 침전, 직접 마이크로 주사(direct micro injection), 나노입자-매개 핵산 전달(참조, 예, Panyam et al., Adv. Drug Deliv. Rev., pii: S0169-409X(12)00283-9.doi:10.1016 / j.addr.2012.09.023) 등을 포함한다.

따라서, 본 발명은 또한 대상 폴리뉴클레오티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공한다. 일부 경우에 있어서, 대상 핵산은 또한 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열을 포함할 수 있다.

일부 구현예에 있어서, 대상 방법은 대상 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 숙주 세포(또는 숙주 세포군)에 도입하는 것을 포함한다. 일부 구현예에 있어서, 타겟 DNA를 포함하는 숙주 세포는 실험실에서 수행한다. 대상 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열을 포함하는 적합한 핵산은 발현 벡터를 포함하며, 여기서 상기 발현 벡터는 재조합 발현 벡터일 수 있다.

일부 구현예에 있어서, 상기 재조합 발현 벡터는 바이러스 작체물(예, 재조합 아데노-관련 바이러스 작체물(참조, 예, 미국 특허 제 7,078,387호), 재조합 아데노 바이러스 작체물, 재조합 렌티바이러스 작체물, 재조합 레트로 바이러스 작체물 등)일 수 있다.

적합한 발현 벡터는 바이러스 벡터들(예; 백신 바이러스를 기초로 한 바이러스 벡터들; 폴리오 바이러스; 아데노 바이러스(참조, 예, Li et al., Invest Opthalmol. Vis. Sci., 35:2543-2549, 1994; Borras et al., Gene Ther., 6:515-524, 1999; Li and Davidson, Proc. Natl. Acad. Sci. USA, 92:7700-7704, 1995; Sakamoto et al., Hum. Gene Ther., 5:1088-1097, 1999; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984 및 WO 95/00655); adeno-associated virus(참조, 예, Ali et al., Hum. Gene Ther., 9:81-86, 1998, Flannery et al., Proc. Natl. Acad. Sci. USA, 94:6916-6921, 1997; Bennett et al., Invest Opthalmol Vis Sci 38:2857-2863, 1997; Jomary et al., Gene Ther., 4:683-690, 1997, Rolling et al., Gene Ther., 10:641-648, 1999; Ali et al., Hum. Mol. Genet., 5:591-594, 1996; Srivastava in WO 93/09239, Samulski et al., J. Vir., 63:3822-3828, 1989; Mendelson et al., Virol., 166: 154-165, 1988; and Flotte et al., Proc. Natl. Acad. Sci. USA, 90: 10613-10617, 1993); SV40; herpes simplex virus; human immunodeficiency virus 참조, 예, Miyoshi et al., Proc. Natl. Acad. Sci. USA, 94: 10319-23, 1997; Takahashi et al., J. Virol., 73:7812-7816, 1999); 레트로 바이러스 벡터(예, 생쥐 백혈병 바이러스(murine leukemia virus), 비장괴사 바이러스(spleen necrosis virus) 및 라우스 육종 바이러스(Rous Sarcoma Virus), 하비 육종 바이러스(Harvey Sarcoma Virus), 조류 백혈병 바이러스(avian leukosis virus), 렌티 바이러스, HIV 바이러스, 골수증식성 육종 바이러스(myeloproliferative sarcoma virus) 및 유방암 바이러스(mammary tumor virus); 등을 포함하나, 이에 국한되는 것은 아니다.

수많은 적합한 발현 벡터들이 당업계에 알려져 있으며 이 중 많은 벡터들이 상업적으로 이용 가능하다. 하기 벡터들을 그 예로 제공한다: 진핵 숙주 세포용; pXTl, pSG5(Stratagene), pSVK3, pBPV, pMSG및 pSVLSV40(Pharmacia). 그러나, 기타 다른 벡터들도 상기 숙주 세포와 호환이 가능한한(compatible) 사용 가능하다.

활용되는 숙주/벡터 시스템에 따라서, 항시성 및 유도성 프로모터들, 전사 인핸서 요소들, 전사 종결자 등을 포함한 많은 적합한 전사 및 번역 조절 요소들을 발현 벡터에서 사용할 수도 있다 (참조, 예, Bitter et al., Methods in Enzymology, 153:516-544, 1987).

일부 구현예에 있어서, 대상 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열은 조절 요소에 작동가능하게 연결된다(프로모터와 같은 전사 조절 요소). 상기 전사 조절 요소는 진핵세포(예; 포유류 세포) 또는 원핵세포(예; 박테리아 또는 고균세포(archaeal cell))에서 기능적일 수 있다. 일부 구현예에 있어서, 대상 폴리뉴클레오티드및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 뉴클레오티드 서열은, 원핵세포 및 진핵세포 모두에서, 상기 폴리뉴클레오티드 및/또는 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 및/또는 대상 PUF 영역 융합체를 코딩하는 상기 뉴클레오티드 서열의 발현을 허용하는 복수 개의 조절 요소들에 작동가능하게 연결될 수 있다.

프로모터는 항시성 활성 프로모터(즉, 항시적으로 활성화/"on" 상태에 있는 프로모터)이거나, 유도성 프로모터(즉, 활성화/"on" 상태 또는 비활성화/"off" 상태가 외부 자극에 의해 조절되는 프로모터, 예; 특정 온도, 화합물, 또는 단백질의 존재 여부)이거나, 공간적으로 제한된 프로모터(즉, 전사 조절 요소, 인핸서 등, 예; 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이거나, 일시적으로 제한된 프로모터(즉, 배아 발달의 특정 시기 또는 생물학적 과정의 특정 시기(예; 생쥐의 모낭 주기(hair follicle cycle)동안 "on" 또는 "off" 상태에 있는 프로모터)일 수 있다.

적합한 프로모터들은 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로 불릴 수 있거나, 또는 원핵 또는 진핵 유기체들로부터 유래될 수도 있다. 적합한 프로모터들은 임의의 RNA 폴리머라제(예, pol I, pol II, pol III)에 의해 발현을 이끌어 내는 데 사용될 수 있다. 예시적 프로모터로는 SV40 조기 프로모터(SV40 early promoter), 생쥐 유방암 종양 바이러스(mouse mammary tumor virus) long terminal repeat(LTR) promoter; 아데노 바이러스 주요 후기 프로모터(adenovirus major late promoter; Ad MLP); 단순포진 바이러스 프로모터(herpes simplex virus(HSV) promoter), CMV 즉시 조기 프로모터 부위(CMV immediate early promoter region(CMVIE))와 같은 거대세포 바이러스 프로모터(cytomegalovirus(CMV) promoter), 라우스 육종 바이러스 프로모터(rous sarcoma virus(RSV) promoter), 인간 U6 소핵 프로모터(human U6 small nuclear promoter(U6))(Miyagishi et al., Nature Biotech., 20:497-500, 2002), 증강된 U6 프모모터 (예, Xia et al., Nucleic Acids Res., 31(17):e100, 2003), 인간 HI 프로모터 (HI) 등을 들 수 있으나, 이에 국한되는 것은 아니다.

유도성 프로모터의 예로는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-beta-D-티오갈락토피라노시드(IPTG)-조절된 프로모터, 젖산 유도성 프로모터, 열 충격(heat shock) 프로모터, 테트라사이클린-조절된 프로모터(예, Tet-ON, Tet-OFF 등), 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 들 수 있으나, 이에 국한되는 것은 아니다. 유도성 프로모터는 따라서 이에 한정되지는 않으나 독시사클린; T7 RNA 폴리머라제와 같은 RNA 폴리머라제; 에스트로겐 수용체; 에스트로겐 수용체 융합(fusion)을 포함하나, 이에 한정되지 않는 분자에 의해 조절될 수 있다.

일부 구현예에 있어서, 상기 프로모터는 다세포 유기체에서 상기 프로모터가 특정 세포들의 서브 세트(subset)에서 활성을 가지도록(즉, "ON") 공간적으로 제한된 프로모터(즉, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)일 수 있다. 공간적으로 제한된 프로모터는 인핸서, 전사 조절 요소, 조절 서열 등으로 불리울 수도 있다. 임의의 편리한 공간적으로 제한된 프로모터를 사용할 수 있으며 상기 적합한 프로모터의 선택(예, 뇌 특이적 프로모터, 신경세포의 서브세트에서 발현을 이끌어 내는 프로모터, 생식세포주에서 발현을 이끌어 내는 프로모터, 폐에서 발현을 이끌어 내는 프로모터, 근육에서 발현을 이끌어 내는 프로모터, 췌장의 췌도에서 발현을 이끌어 내는 프로모터 등)은 유기체에 따라 다르다. 예를 들면, 다양한 공간적으로 제한된 프로모터들이 식물, 파리, 벌레, 포유류, 생쥐 등에서 알려져 있다. 따라서, 공간적으로 제한된 프로모터는 유기체의 종류에 따라 매우 다양한 상이한 조직 및 세포 유형에서 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 PUF 영역 융합체를 코딩하는 핵산의 발현을 조절하는 데 사용될 수 있다. 일부 공간적으로 제한된 프로모터들 또한 일시적으로 제한된 프로모터(즉, 배아 발달의 특정 시기 또는 생물학적 과정의 특정 시기(예; 생쥐의 모낭 주기(hair follicle cycle)동안 "on" 또는 "off" 상태에 있을 수 있다.

설명의 목적상, 공간적으로 제한된 프로모터들의 예로서 신경세포-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포(cardiomyocyte)-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함할 수 있으나, 이에 국한되는 것은 아니다. 신경세포-특이적 공간적으로 제한된 프로모터들의 예로서 신경세포-특이적 에놀라아제(NSE) 프로모터(참조, 예, EMBL HSEN02, X51956); 방향족 아미노산 디카르복실라제(AADC) 프로모터; 신경미세섬유(neurofilament) 프로모터(참조, 예, GenBank HUMNFL, L04147); 시냅신(synapsin) 프로모터(참조, 예, GenBank HUMSYNIB, M55301); thy-1 promoter(참조, 예, Chen et al., Cell, 51:7-19, 1987; and Llewellyn et al., Nat. Med., 16(10): 1161-1166, 2010); 세라토닌 수용체 프로모터(참조, 예, GenBank S62283); 티로신 히드록실라제 프로모터(TH)(참조, 예, Oh et al., Gene Ther., 16:437, 2009; Sasaoka et al., Mol. Brain Res., 16:274, 1992; Boundy et al., Neurosci., 18:9989, 1998; and Kaneda et al., Neuron, 6:583-594, 1991); GnRH 프로모터(참조, 예, Radovick et al., Proc. Natl. Acad. Sci. USA, 88:3402-3406, 1991); L7 프로모터(참조, 예, Oberdick et al., Science, 248:223-226, 1990); DNMT 프로모터(참조, 예, Bartge et al., Proc. Natl. Acad. Sci. USA, 85:3648-3652, 1988); 엔케팔린(enkephalin) 프로모터(see, 예, Comb et al., EMBO J., 17:3793-3805, 1988); 수초 염기성 단백질(myelin basic protein; MBP) 프로모터; Ca²⁺-칼모듈린 의존성 단백질 키나제 II-alpha(CamKIIa) 프로모터(참조, 예, Mayford et al., Proc. Natl. Acad. Sci. USA, 93: 13250, 1996; and Casanova et al., Genesis, 31:37, 2001); CMV 인핸서 / 혈소판 유래 성장인자-β 프로모터(참조, 예, Liu et al., Gene Therapy, 11:52-60, 2004); 등을 포함할 수 있으나, 이에 국한되는 것은 아니다.

지방세포-특이적 공간적으로 제한된 프로모터들의 예로서 P2 유전자 프로모터/인핸서, 예, 인간 P2 유전자의 -5.4 kb 에서 +21 bp 부위(참조, 예, Tozzo et al., Endocrinol. 138: 1604, 1997; Ross et al., Proc. Natl. Acad. Sci. USA, 87:9590, 1990; and Pavjani et al., Nat. Med., 11 :797, 2005); 글루코스 트랜스포터-4(GLUT4) 프로모터(참조, 예, Knight et al., Proc. Natl. Acad. Sci. USA, 100: 14725, 2003); 지방산 트란스로카제(FAT/CD36) 프로모터(참조, 예, Kuriki et al., Biol. Pharm. Bull., 25: 1476, 2002; and Sato et al., Biol. Chem. 277: 15703, 2002); 스테아로일-CoA 불포화효소-1(SCD1) 프로모터(Tabor et al., Biol. Chem. 274:20603, 1999); 렙틴(leptin) 프로모터(참조, 예, Mason et al., Endocrinol. 139: 1013, 1998; and Chen et al., Biochem. Biophys. Res. Comm., 262: 187, 1999); 아디포넥틴(adiponectin) 프로모터(참조, 예, Kita et al., Biochem. Biophys. Res. Comm., 331 :484, 2005; and Chakrabarti, Endocrinol. 151:2408, 2010); 아디스핀(adipsin) 프로모터(참조, 예, Piatt et al., Proc. Natl. Acad. Sci. USA, 86:7490, 1989); 레지스틴(resistin) 프로모터(참조, 예, Seo et al., Molec. Endocrinol., 17: 1522, 2003); 등을 포함할 수 있으나, 이에 국한되는 것은 아니다.

심근세포(cardiomyocyte)-특이적 공간적으로 제한된 프로모터들의 예로서 하기 유전자들로부터 유래된 조절 서열들(미오신(myosin) 경쇄-2, 미오신(myosin) 중쇄, AE3, 심장 트로포닌 C(cardiac troponin C), 심장 액틴(cardiac actin) 등. Franz et al., Cardiovasc. Res., 35:560-566, 1997; Robbins et al., Ann. N.Y. Acad. Sci., 752:492-505, 1995; Linn et al., Circ. Res., 76:584-591, 1995; Parmacek et al., Mol. Cell. Biol., 14:1870-1885, 1994; Hunter et al., Hypertension, 22:608-617, 1993; and Sartorelli et al., Proc. Natl. Acad. Sci., 89:4047-4051, 1992))을 포함할 수 있으나, 이에 국한되는 것은 아니다.

평활근-특이적 공간적으로 제한된 프로모터들의 예로서 SM22a promoter(참조, 예, Akyurek et al., Mol. Med., 6:983, 2000; 및 미국특허 제 7,169,874호); 스무셀린(smoothelin) 프로모터(참조, 예, WO 2001/018048); 평활근 액틴(actin) 프로모터; 등을 포함할 수 있으나, 이에 국한되는 것은 아니다. 예를 들면, 2 개의 CArG 요소들이 놓여 있는 SM22a 프로모터의 0.4 kb 부위는 혈관 평활근 세포-특이적 발현을 매개함을 보여 주었다(참조, 예, Kim et al., Mol. Cell. Biol., 17:2266-2278, 1997; Li et al., J. Cell Biol., 132:849-859, 1996; and Moessler et al., Development, 122:2415-2425, 1996).

광수용체-특이적 공간적으로 제한된 프로모터들의 예로서 로돕신(rhodopsin) 프로모터; 로돕신(rhodopsin) 키나제 프로모터(Young et al., Ophthalmol . Vis . Sci., 44:4076, 2003); 베타 포스포디에스테라제(βphosphodiesterase) 유전자 프로모터(Nicoud et al., Gene Med., 9: 1015, 2007); 망막색소 변색증(retinitis pigmentosa) 유전자 프로모터(Nicoud et al., 2007, 상기 기재); 광수용체 간 레티노이드(interphotoreceptor retinoid)-결합 단백질(IRBP) 유전자 인핸서(Nicoud et al.(2007) 상기 기재); IRBP 유전자 promoter(Yokoyama et al., Exp. Eye Res., 55:225, 1992); 등을 포함할 수 있으나, 이에 국한되는 것은 아니다.

8. 라이브러리

본 발명은 또한 상기 대상 폴리뉴클레오티드서열들의 다수 또는 라이브러리 또는 이를 코딩하는 벡터들의 다수 또는 라이브러리를 제공한다. 후자는 상기 대상 폴리뉴클레오티드를 코딩하는 뉴클레오티드들을 포함하는 재조합 발현 벡터들의 라이브러리를 포함할 수 있다.

대상 라이브러리는 약 10 내지 약 10¹² 개별 멤버(individual member)를 포함할 수 있으며, 예를 들면, 대상 라이브러리는 약 10 내지 약 10² 개별 멤버, 약 10² 내지 약 10³ 개별 멤버, 약 10³ 내지 약 10⁵ 개별 멤버, 약 10⁵ 내지 약 10⁷ 개별 멤버, 약 10⁷ 내지 약 10⁹ 개별 멤버, 약 10⁹ 내지 약 10¹² 개별 멤버를 포함할 수 있다.

특정 구현예에 있어서, 상기 벡터들 중 2 개는 이들의 각 DNA-타겟팅 서열의 코딩된 폴리뉴클레오티드들, Cas9-결합 서열들 및/또는 카피 수, 동질성(identity)(예, 서열, 또는 결합 특이성), 또는 PBS의 관련 순서에 있어서 차이가 있을 수 있다.

예를 들면, 특정 구현예에 있어서, 대상 라이브러리의 "개별 멤버(individual member)"는 상기 대상 폴리뉴클레오티드의 DNA-타겟팅 서열의 뉴클레오티드 서열에서의 라이브러리의 다른 멤버들과 다를 수 있다. 따라서, 대상 라이브러리의 각 개별 멤버는 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 Cas9-결합 서열의 뉴클레오티드 서열을 포함할 수 있고, 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 PBS의 뉴클레오티드 서열을 포함할 수 있으나, 상기 대상 폴리뉴클레오티드의 DNA-타겟팅 서열의 뉴클레오티드 서열에서의 라이브러리의 다른 멤버들과는 다를 수 있다. 이런 식으로, 상기 라이브러리는 동일한 타겟 유전자 또는 상이한 타겟 유전자 상에 있는 상이한 타겟 폴리뉴클레오티드 서열들에 결합하는 멤버들을 포함할 수 있다.

관련 구현예에 있어서, 상기 라이브러리의 멤버들은 상이한 DNA-타겟팅 서열들이 상이한 PBS와 관련되며, 상이한 타겟 DNA 들이 독립적으로 조절될 수 있다는 점 [예; 일부 타겟 유전자들은 전사적으로 활성화되고(또한 제 1 형광색에 의해 선택적으로 표지됨) 다른 타겟 유전자들은 전사적으로 리프레스되며(또한 제 2 형광색에 의해 선택적으로 표지됨]에서 차이가 있을 수 있다.

특정 구현예에 있어서, 대상 라이브러리의 개별 멤버는 상기 대상 폴리뉴클레오티드의 Cas9-결합 서열의 뉴클레오티드 서열에서 상기 라이브러리의 다른 멤버들과 차이가 있을 수 있다. 따라서, 예를 들면, 대상 라이브러리의 개별 멤버는 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 DNA-타겟팅 서열의 뉴클레오티드 서열을 포함할 수 있고; 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 PBS의 뉴클레오티드 서열을 포함할 수 있으나, 상기 대상 폴리뉴클레오티드의 Cas9-결합 서열의 뉴클레오티드 서열에서 상기 라이브러리의 다른 멤버들과 차이가 있을 수 있다. 이런 식으로, 상기 라이브러리는 다른 종(species)으로부터의 상이한 직교형(orthogonal) Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)에 결합하는 멤버들을 포함하여 동일 숙주 세포에서 별도로 유사하게(parallelly) 조절가능한 시스템을 허용할 수 있다.

기타 특정 구현예에 있어서, 대상 라이브러리의 개별 멤버는 상기 대상 폴리뉴클레오티드의 PBS의 뉴클레오티드 서열에서 상기 라이브러리의 기타 멤버들과 다를 수 있다. 따라서, 예를 들면, 대상 라이브러리의 개별 멤버는 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 DNA-타겟팅 서열의 뉴클레오티드 서열을 포함할 수 있고; 상기 라이브러리의 모든 다른 멤버들과 동일하거나 또는 실질적으로 동일한 상기 Cas9-결합 서열의 뉴클레오티드 서열을 포함할 수 있으나, 상기 대상 폴리뉴클레오티드의 PBS의 뉴클레오티드 서열에서 라이브러리의 기타 멤버들과는 다를 수 있다.

9. 사용 구현예

본 발명에 따른 전사를 모듈레이팅하는 방법은 연구, 진단, 산업, 및 치료를 포함한 다양한 응용 분야에서 사용될 수 있다.

연구 분야의 응용은 예를 들면 발달, 대사, 하류의 유전자의 발현 등 타겟 핵산의 전사를 감소 또는 증가시키는 효과를 결정하는 것을 포함할 수 있다.

고속(high through-put) 게놈 분석은 상기 Cas9-결합 서열 및 PBS는(일부 경우에 있어서) 일정하게 유지되는 반면 오직 상기 대상 폴리뉴클레오티드만 변경할 필요가 있는 대상 전사 모듈레이션 방법을 사용하여 수행할 수 있다. 게놈 분석에 사용되는 다수의 핵산을 포함하는 라이브러리(예, 대상 라이브러리)는 대상 폴리뉴클레오티드를 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함할 수 있으며, 여기서 각 핵산은 상이한 DNA-타겟팅 서열, 통상의 Cas9-결합 서열 및 통상의 PBS를 포함할 수 있다. 한 개의 칩은 본 발명의 독특한 폴리뉴클레오티드를 5 × 10⁴이상 포함할 수 있다.

응용은 대규모 표현형 결정(phenotyping), 유전자-기능-매핑(gene-to-function mapping) 및 메타 게놈 분석을 포함할 수 있다.

이하 본 발명에 개시된 대상 방법들은 대사 공학(metabolic engineering) 분야에서 사용될 수도 있다. 전사 수준은 이하 개시된 바와 같이 적절한 DNA-타겟팅RNA를 디자인함으로써 효율적 및 예측가능하게 조절될 수 있으므로, 대사 경로들(예, 생화학적 경로들)은 세밀하게 조절될 수 있으며, 관심 대사 경로 내에서 특정 효소들의 수준을 조절(예, 증가 또는 감소된 전사)함으로써 조율될 수 있다.

관심 대사 경로들은 화학물질(정밀화학, 연료, 항생제, 독소, 작용제(agonists), 길항제(antagonists) 등) 및/또는 약물 생산에 사용되는 것을 포함할 수 있다. 관심 생화학적 경로들은 (1)메발론산염 경로(예, HMG-CoA 리덕타제 경로)(아세틸-CoA를 테르페노이드/이소프레노이드를 포함하는 광범위한 생분자들의 생합성에 사용되는 디메틸알릴 피로포스페이트(DMAPP) 및 이소펜테닐 피로포스페이트(IPP)로 전환시킴, (2)비메발론산염 경로(즉, "2-C-메틸-D-에리쓰리톨 4-포스페이트/l-디옥시-D-자일루로오스 5-포스페이트 경로" 또는 "MEP/DOXP 경로" 또는 "DXP 경로")(또한 피루빈산 및 글리세르알데하이드 3-포스페이트를 상기 메발론산염 경로에 대한 대체 경로로서 DMAPP 및 IPP로 전환함으로써 DMAPP 및 IPP를 생산함), (3)폴리케티드(polyketide) 합성 경로(다양한 폴리케티드 합성 효소를 사용하여 다양한 폴리케티드를 생산함. 폴리케티드는 자연에 존재하는 화학요법(예; 테트라사이클린 및 마크로라이드)에 사용되는 소분자들을 포함하며 산업상 중요한 폴리케티드는 라파마이신(면역억제제), 에리쓰로마이신(항생제), 로바스타틴(항콜레스테롤 약물) 및 에포틸론 B(항암제),(4) 지방산 합성 경로, (5) DAHP(3-디옥시-D-아라비노-헵툴로소나테 7-포스페이트) 합성 경로, (6) 잠재적 바이오 연료 생산 경로들 (단쇄 알코올 및 알칸, 지방산 메틸 에스터 및 지방 알코올, 이스프레노이드 등) 등을 포함하나, 이에 국한되는 것은 아니다.

본 발명에 개시된 방법들은 또한 통합된 조절 네트워크를 디자인하는데 사용될 수 있다 (즉, 케스케이드 또는 케스케이드들). 예를 들면, 대상 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체는 다른 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체의 조절(즉, 모듈레이트, 예; 증가 또는 감소)에 사용될 수 있다. 예를 들면, 제 1 대상 폴리뉴클레오티드는 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 제 1 PUF 영역 융합(예, 메틸트랜스퍼라제 활성, 디메틸라제 활성, 아세틸트랜스퍼라제 활성, 디아세틸라제 활성 등)와 다른 기능을 가지는 PUF 영역 융합체의 모듈레이션을 타겟하는데 디자인될 수 있다. 또한, 상이한 Cas9 단백질들(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)(예, 다른 종으로부터 유래된 것)은 상이한 Cas9 handle(즉, Cas9-결합 서열)을 필요로 할 수 있고, 상기 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 제 1 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)와 다른 종으로부터 유래될 수 있다. 따라서, 일부 경우에 있어서, 상기 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 제 1 대상 폴리뉴클레오티드와 상호작용하지 않도록 선택될 수 있다. 다른 경우에 있어서, 상기 제 2 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)은 상기 제 1 대상 폴리뉴클레오티드와 상호작용하도록 선택될 수 있다. 이러한 몇몇 경우에 있어서, 상기 두(또는 그 이상의) Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체들은 경쟁하거나(예, 상기 폴리펩타이드가 상반된 활성을 가지는 경우) 또는 상승시킬 수 있다(예, 상기 폴리펩타이드들이 유사하거나 상승적 활성을 가지는 경우). 마찬가지로, 상기에서 언급된 바와 같이, 네트워크 상의 상기 복합체들 중 임의의 하나(즉, 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체)는 다른 폴리뉴클레오티드/ Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체)를 조절할 수 있도록 디자인 될 수 있다. 대상 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체는 임의의 원하는 DNA 서열에 타겟될 수 있으므로, 본 발명에 기재된 방법들은 임의의 원하는 타겟의 발현을 조절 및 조율하는데 사용될 수 있다. 아주 단순한 복합체로부터 매우 복잡한 복합체에 이르기까지 디자인될 수 있는 상기 통합된 네크워크(즉, 상호작용의 케스케이드들)은 그 제한이 없다.

둘 또는 그 이상의 성분들(예, 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합체)이 각각 다른 폴리뉴클레오티드/Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질)/PUF 영역 융합 복합체의 조절 하에 있는 네트워크에 있어서, 상기 네트워크의 하나의 성분의 발현 수준은 상기 네트워크의 다른 성분의 발현 수준에 영향(예, 상기 발현을 증가 또는 감소시킴)을 미칠 수 있다. 상기 메카니즘을 통하여, 하나의 성분의 발현은 동일 네트워크 상의 다른 성분의 발현에 영향을 미칠 수 있고, 상기 네트워크는 다른 성분들의 발현을 감소시키는 성분들 뿐 아니라 다른 성분들의 발현을 증가시키는 성분들이 혼합되어 있을 수 있다. 당업자라면 쉽게 이해할 수 있는 바와 같이, 하나의 성분의 발현 수준이 하나 또는 그 이상의 다른 성분(들)에 영향을 미칠 수 있음을 보여 주는 상기 구현예들은 제한적 의도가 아니라 설명을 목적으로 제시된 것이다. 조작을 위하여 (즉, 실험조절 하, 예, 온도 조절 하; 약물 조절 하, 즉, 약물 유도성 조절; 경미한 조절 등) 하나 또는 그 이상의 성분이 변형된 경우, 추가적 계층의 복잡성이 네트워크에 선택적으로 도입될 수도 있다.

하나의 비제한적 예로서, 제 1 대상 폴리뉴클레오티드는 타겟 치료적/대사성 유전자를 조절하는 제 2 대상 폴리뉴클레오티드의 프로모터에 결합될 수 있다. 이러한 경우, 상기 제 1 대상 폴리뉴클레오티드의 조건적 발현은 간접적으로 치료적/대사성 유전자를 활성화하게 된다. 이러한 유형의 RNA 케스케이드들(예를 들면, 리프레서를 활성제로 쉽게 전환하는 데 유용함)은 타겟 유전자의 발현의 논리(logics)나 역학(dynamics)를 조절하는 데 사용될 수 있다.

대상 전사 모듈레이션 방법은 또한 약물 발굴 및 타겟 검증에 사용될 수도 있다.

10. 키트

본 발명은 또한 대상 방법을 수행하는 키트를 제공한다. 대상 키트는 a) 본 발명의 폴리뉴클레오티드 또는 이를 코딩하는 뉴클레오티드 서열을 포함하는 핵산(예, 벡터); 선택적으로, b) 대상 Cas9 단백질(예, 야생형(wt), 틈내기 효소, 또는 dCas9 단백질) 또는 이를(이를 코딩하는 발현가능한 mRNA를 포함하는) 코딩하는 벡터; 및 선택적으로, c) 각각이 상이한 PUF 영역 융합체들 중 같거나 다른 이펙터 영역에 융합된 PUF 영역 또는 이를(이를 코딩하는 발현가능한 mRNA를 포함하는) 코딩하는 벡터를 포함하는 하나 또는 그 이상의 대상 PUF 영역 융합체를 포함할 수 있다.

특정 구현예에 있어서, 하나 또는 그 이상의 a) 내지 c)는 동일 벡터에 의해 코딩될 수 있다.

특정 구현예에 있어서, 상기 키트는 또한 형질전환, 형질감염, 또는 감염용 시약들과 같이 a) 내지 c) 중 어느 하나를 숙주 세포로 도입하는 것을 용이하게 하는 하나 또는 그 이상의 완충액 또는 시약을 포함할 수 있다.

예를 들면, 대상 키트는 하나 또는 그 이상의 추가 시약을 포함할 수 있으며, 이들 하나 또는 그 이상의 시약들은 완충액; 세척 완충액; 조절 시약; 조절 발현 벡터 또는 RNA 폴리뉴클레오티드; 야생형(wt) 또는 dCas9 또는 DNA로부터의 PUF 영역 융합체의 실험실 내 생산용 시약; 등에서 선택될 수 있다.

대상 키트의 성분들은 별도의 용기들; 또는 단일 용기에 혼합될 수 있다.

상기 언급된 성분들 외에도, 대상 키트는 상기 대상 방법들을 구현할 키트의 성분들을 이용하는 지침들을 추가로 포함할 수 있다. 상기 대상 방법들을 구현할 키트의 성분들을 이용하는 지침들은 일반적으로 적합한 기록 매체에 기록된다. 예를 들면, 상기 지침들은 종이나 플라스틱 등의 기재 상에 프린트 될 수 있다. 이와 같이, 상기 지침들은 상기 키트의 용기 또는 이의 성분들(즉, 패키징 또는 서브 패키징) 등을 표지 시 패키지 삽입으로서 키트에 마련될 수 있다. 다른 구현예에 있어서, 상기 지침들은 컴퓨터 기록 가능한 저장 매체(예; CD-ROM, 디스켓, 플래시 드라이브 등)에 전자 저장 데이터 파일로 마련될 수 있다. 또 다른 구현예에 있어서, 실제 지침들은 키트에 마련되는 대신에 원격 소스로부터 지침을 얻는 수단(예; 인터넷 사용)이 제공될 수 있다. 본 구현예의 예로서는 상기 지침들을 볼 수 있거나 및/또는 이로부터 다운로드 받을 수 있는 웹 주소를 포함하는 키트가 있다. 상기 지침과 마찬가지로, 상기 지침을 얻기 위한 이 수단은 적합한 기재 상에 기록될 수 있다.

실시예 1: 47 카피의 조작된 Pumilio 결합 사이트를 삽입함으로 sgRNA 발판(Scaffold)의 기능이 유지됨

본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 dCas9/sgRNA 의 기능에 실질적 영향을 미치지 않으면서 sgRNA의 3' 말단에 최소한 47 카피의 조작된 8-mer Pumilio 동족체 영역-결합 서열들(PBSs)을 가질 수 있음을 보여주고 있다.

특히, 상기 sgRNA의 3' 말단에 PBS의 첨부가 sgRNA의 기능에 영향을 미치는지 여부를 시험하기 위하여, PUF(3-2)(또한 간단히 PUFa로도 칭함)[PBS32 또는 PBSa: 5'-UGUAUgUA-3'], PUF(6-2/7-2)(또한 간단히 PUFb로도 칭함)[PBS6272 또는 PBSb: 5'-UugAUAUA-3']를 위한 8-mer Pumilio 동족체 영역-결합 서열(PBS)을 0 카피, 5 카피, 15 카피, 25 카피 및 47 카피 가지는 일련의 변형된 Tet-타겟팅(sgTetO) 또는 비-타겟팅 대조군(sgControl) sgRNA를 제작하였다 (도 1A 참조). 이들 작체물의 HEK293T/TetO::tdTomato 세포주에서의 tdTomato 발현을 활성화시키는 상기 dCas9-VP64 전사 활성제를 지시하는 능력을 시험하였다.

세포들을 상이한 sgRNA 발판(scaffold)을 가지는 dCas9-VP64로 형질감염하였고 형질감염 2일 후에 형질-활성화된 세포 분리(cell sorting; FACS)를 분석하였다(도 1B). 모든 상기 대조군 비-타겟팅 sgRNA는 tdTomato 발현을 활성화하지 않았다. 한편, 상이한 수의 PBS를 가지는 상기 Tet-타겟팅 sgRNA는 tdTomato 발현을 활성화시키고자 dCas9-VP64를 지시할 수 있었고, 최소한 47 카피의 8-mer 사이트의 삽입은 dCas9-VP64를 이의 타겟으로 지시하는 데 있어서 sgRNA의 활성에 실질적으로 영향을 미치지 않는다(도 1C).

PUFa-VP64/PBSa 및 PUFb-VP64/PBSb 모두를 위한 시험 조건 하에서, 상기 sgRNA에 첨부된 5-10 카피의 PBS는 상기 타겟 전이유전자를 가장 잘 활성화시킬 수 있었다.

한편, 실질적인 전이유전자의 활성화가 있긴 하였지만, 15, 20 및 47 카피의 PBS는 다소 낮은 결과를 보였다(도 1C).

실시예 2 동족(cognate) 8-mer 결합 사이트를 가지는 조작된 Pumilio의 특이성으로 인하여 대상 3-성분 CRISPR / Cas 복합체들/시스템들은 상호 직교 성(Orthogonal)임

본 실시예는 상이하게 프로그램된 PUF 영역들 및 동족(cognate) 8-mer 모티프를 가지는 이들의 해당 sgRNA 사이의 특이성이 상기 대상 3-성분 CRISPR/Cas 복합체/시스템 각각 사이에 독립성 또는 직교성(orthogonality)을 제공하는 것을 보여주고 있다.

5'-UGUAUgUA-3'결합 사이트를 가지는 sgRNA(sgRNA-PBS32) 및 5'-UugAUAUA-3'결합 사이트를 가지는 sgRNA-PBS6272와 상호작용하는 PUF(3-2)::VP64 및 PUF(6-2/7-2)::VP64 융합체들을 각각 제작한 후 dCas9과 함께 tdTomato 발현을 켜는 이들의 활성을 시험하였다. 추가로, 2개의 추가 쌍 [PBSw(5'-UGUAUAUA-3')을 인식하는 PUFw-VP64 및 PBSc(5'-UugAUgUA-3')을 인식하는 PUFc-VP64]을 또한 제작하여 이들이 dCas9과 함께 동일한 TetO::tdTomato 발현을 활성화하는 능력을 시험하였다(도 1D).

도 1D에 도시된 바와 같이, PUF::VP64는 동족(cognate) 결합 사이트를 가지는 sgRNA가 제공되었을 경우에만 tdTomato 발현을 활성화 할 수 있다. 이러한 결과는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 PUF 영역들 및 이들의 상기 sgRNA-PBS 상의 8-mer 결합 사이트들의 쌍 짓기(pairing)을 토대로 이펙터 기능의 독립성 또는 직교성을 제공함을 보여주고 있다. 인상적으로, 비록 PBSa 및 PBSw 결합 사이트들이 한 개의 뉴클레오티드만 차이가 있지만, 이들의 유전자 활성화는 타겟-특이적 상태를 유지한다는 사실은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 높은 특이성을 보여주고 있다.

실시예 3 상기 대상 3-성분 CRISPR / Cas 복합체/시스템은 타겟 좌위에서의 단백질 복합체의 조립을 가능케 함

본 실시예는 2 개 또는 그 이상의 상이한 단백질 성분을 가지는 단백질 복합체들을 sgRNA 상에 조립할 수 있고, 상기 대상 시스템을 이용하여 정의된 좌위에서 작동할 수 있음을 보여주고 있다.

구체적으로, p65-HSF1는 최근에 유력한 활성제 영역으로 알려졌다. 서로 옆에 위치한 PBS32 및 PBS6272를 모두 가지는 sgRNA 및 2 개의 상이한 사이트를 차지하는 PUF(3-2)::VP64 및 PUF(6-2/7-2)::p65-HSF1 융합체를 제작하였다(도 2A). PUF(3-2)::VP64 및 PUF(6-2/7-2)::p65-HSF1 모두의 형질감염은 단일 활성제만 사용해서 형질감염 시 얻게 되는 형광 강도의 합과 비슷한 강도의 tdTomato 형광을 유도하였다. 상기 결과는 PUF(3-2) 및 PUF(6-2/7-2) 모두에 대한 결합 사이트를 가지는 sgRNA가 두 유형의 융합 단백질 모두를 타겟된 게놈 좌위(locus)에 조립함을 나타낸다.

최근 한 논문은 VP64 및 p65HSF1 모두를 전사활성화 영역으로 시험한 결과 p65HSF1가 더욱 강력한 활성제임을 밝힌 바 있다. 이들 두 전사활성화 영역을 직접 비교하기 위하여, p65HSF1 PUF 융합체(PUFa-p65HSF1) 및 VP64 PUF 융합체(PUFa-VP64)로 상이한 수의 PBSa를 가진 sgRNA를 사용하여 TetO::tdTomato 전이 유전자를 활성화시켰다(도 2C). PUFa-p65HSF1는 PUFa-VP64와 비교하여 3 배 더 강력한 활성화능을 제공하였다. 단지 하나의 PBSa(이전 PUFa-VP64 모듈에서는 관찰되지 않음)를 사용 시에도 관찰되었다. 따라서, p65HSF1는 VP64보다 더 강력한 전사활성화 영역임이 확인되었다.

실시예 4 상기 대상 3-성분 CRISPR / Cas 복합체/시스템은 활성제를 가지는 dCas9 직접 융합체보다 보다 효율적으로 내인성 유전자를 활성화시킴

발명자들은 이전에 단일 sgRNA를 사용했을 때는 활성화를 이루지 못했지만 각 유전자마다 3-4 개의 sgRNA를 포함한 칵테일로 dCas9-VP160 직접 융합체를 사용하여 OCT4 및 SOX2의 강력한 내인성 유전자의 활성화를 성취한 바 있다(자료 미도시).

본 실시예는 상기 대상 시스템에서 상기 sgRNA-PBS 상에 복수의 PBS를 통하여 활성제 영역들을 모집(recruitment)하는 것은 전사활성화를 증가시켜 더 적은 수의 sgRNA를 사용하여 내인성 유전자의 활성화를 성취하게 함을 입증한다.

구체적으로, HEK293T에 있는 내인성 유전자들인 OCT4 및 SOX2의 활성화를 직접 dCas9-p65HSF1 활성제를 가지는 상기 대상 시스템으로 각 유전자마다 4 개의 sgRNA-PBS의 칵테일이나 개별 sgRNA-PBS를 이용하여 비교하였다(도 3A 및 3B). OCT4 및 SOX2 모두의 활성화 실험에서의 단일 가이드 실험에서뿐 아니라 혼합된 sgRNA-PBS에서 직접 융합과 비교하여 상기 대상 3-성분 CRISPR/Cas 복합체/시스템을 사용 시 더 높은 활성화를 가짐이 관찰되었다 (도 3A 및 3B). OCT4 및 SOX2에 대한 직접 융합의 단일 가이드 타겟팅은 활성화가 적거나 없음이 관찰된 반면 상기 해당 3-성분 시스템 실험에서는 강력한 활성화가 관찰되어, 상기 대상 3-성분 CRISPR/Cas 복합체/시스템 활성제가 상기 직접 융합보다 더 뛰어난 활성을 가짐을 보여 주었다.

OCT4 및 SOX2 활성화를 위한 상기 sgRNA 상의 PBSa 사이트의 최적의 수를 결정하기 위하여 1, 5, 15 또는 25 카피의 PBSa를 가지는 OCT4 또는 SOX2 근거리 프로모터를 타겟팅하는 sgRNA-PBS를 제작하였다. OCT4 및 SOX2 두 실험 모두에서, sgRNA-5×PBSa 칵테일 실험 및 단일 sgRNA-5×PBSa 실험에서 5×PBSa을 사용 시 가장 높은 활성이 관찰됨으로써, 상기 TetO::tdTomato 리포터 실험에서 발견된 것을 재현하였다 (도 3D 및 3E).

실시예 5 상기 대상 3-성분 CRISPR / Cas 복합체/시스템은 타겟 유전자의 동시 활성화 및 리프레션을 가능케함

본 실시예는 상이한 이펙터 기능을 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 각각에 할당할 수 있음을 보여 준다.

상기 KRAB::PUF(6-2/7-2) 리프레션 융합 및 상기 sgRNA 타겟팅 SV40 프로모터를 우선 제작하였다. 상기 TetO 프로모터의 조절 하에 있는 tdTomato 리포터와 SV40 프로모터의 조절 하에 있는 EGFP 리포터 (HEK293T/TetO::tdTomato/SV40::EGFP)를 가지는 HEK293T 리포터 세포주를 사용하여, 동시적 (1)dCas9/sgTetO-PBS32/PUF(3-2)::VP64의 TetO 프로모터에의 결합을 통한 tdTomato의 활성화 및 (2)Cas9/sgSV40-PBS6272/KRAB::PUF(6-2/7-2)의 SV40 프로모터에의 결합을 통한 EGFP 발현의 리프레션을 시험하였다 (도 4A). dCas9, sgTetO-5×PBS32 및 PUF(3-2)::VP64로 구성된 상기 3-성분 CRISPR/카스활성제의 발현은 tdTomato 형광(도 4B; 샘플 2)을 활성화시킨 반면, dCas9 와 sgSV40-5×PBS6272로 구성된 상기 3-성분 CRISPR/카스활성제의 발현은 EGFP 형광을 감소시켰다 (도4B; sample 4). 활성제 및 리프레서 복합체들 모두의 공동 발현은 상기 tdTomato의 활성화 및 상기 EGFP 전이유전자의 리프레션을 동시에 유도하여 (도4B, 샘플 6), 상이한 이펙터 기능들을 가지는 상기 대상 3-성분 CRISPR/Cas 복합체들이 동일 세포 내에서 작동하여 이들의 타겟에서 상이한 결과물을 생산할 수 있음을 보여 주고 있다.

다양한 이펙터를 모집함(recruiting)에 있어서 상기 대상 시스템의 다용성(versatility)을 추가로 확인하기 위하여, PUFc-p65HSF1 활성제 융합체 및 KRAB-PUFa 리프레서 융합체를 제작하였다. 리포터 세포주 HEK293T/TetO::tdTomato/SV40::EGFP에 있어서, SV40::EGFP 발현은 dCas9/KRAB-PUFa /sgSV40-PBSa에 의해 상당히 리프레스 될 수 있는 반면에, 상기 TetO::tdTomato 리포터 유전자는 dCas9/PUFc-p65HSF1/sgTetO-PBSc에 의해 효율적으로 활성화시킬 수 있다 (도 4C). 두 시스템이 모두 적용되었을 경우에는, TetO::tdTomato의 활성화 및 SV40::EGFP 발현의 리프레션이 동시에 성취되었다(도 4C). 비-타겟팅(sgCtl) sgRNA가 사용되거나 상기 PUF 융합체들이 생략된 경우에는, 각 리포터들의 형광 수준은 영향을 받지 않았으므로, 리포터들에 대한 효과가 구체적이며 타겟에서의 동족(cognate) dCas9/sgRNA-PBS에 의해 모집되는 이펙터들의 작용에 기인한다는 것을 보여 준다.

그 후, 복수의 내인성 유전자들의 발현이 상기 전략에 의해 독립적으로 조절될 수 있는지를 시험하였다. 상기 대상 3-성분 모듈들은 sgRNA-PBSb 및 sgRNA-PBSa의 타겟팅 서열을 변경함으로써 내인성 타겟 유전자들로 인도됨으로써 PUFb-p65HSF1는 상기 OCT4 프로모터로 모집되었고 BFPKRAB-PUFa는 상기 SOX2 프로모터로 모집되었다. 리포터 유전자 실험에서와 유사한 방법으로, 이펙터-매개된 OCT4의 독립적 활성화 및 SOX2의 리프레션이 동시적으로 성취되었다(도 4D).

실시예 6 상기 대상 3-성분 CRISPR / Cas 복합체/시스템에 의한 히스톤 아세틸트랜스퍼라제 (HAT) 영역의 모집(Recruitment)는 인핸서의 활성화를 성취케함

인공 전사 인자 시스템들은 유전자를 활성화하거나 리프레스하기 위하여 후성적 변형자들(epigenetic modifiers)을 모집하는 데 사용될 수 있다. 최근 실험에서는 인핸서를 활성화시키기 위하여 히스톤 아세틸트랜스퍼라제(HAT)를 사용하였다. 후성적 편집 효율을 증가시키기 위하여 상기 대상 3-성분 시스템이 HAT 영역의 복수의 분자를 모집할 수 있음을 입증하고자 OCT4를 모델 유전자로 사용하였는데, 이는 상기 유전자의 인핸서 및 프로모터가 잘 정의되어 있으며 인핸서 용도의 선택이 배아 줄기세포의 상태에 상응하는 생물학적 중요성을 가지고 있기 때문이다.

본 실험에서, 근거리(proximal) 프로모터(PP), 근거리 인핸서(PE) 및 원거리 인핸서(DE)를 각각 4 개의 상이한 sgRNA-PBS로 타겟하였다(도 5A). CREB-결합 단백질(CBP)로부터의 HAT 및 dCas9(dCas9::CBPHAT)의 C-말단 사이의 직접 융합체를 제작하였고 N-말단 융합 모듈 CBPHAT::PUFa 및 C-말단 융합 모듈 PUFa::CBPHAT를 또한 제작하였다. 이후, PP, PE 및 DE에의 결합을 통한 OCT4 발현을 활성화시키는 데 있어서 이들의 활성을 시험하였다.

도 5B에 도시된 바와 같이, dCas9::CBPHAT와 CBPHAT::PUFa는 근거리 프로모터(PP)에서 유사한 활성을 가지고 있다. 흥미롭게도, 5×PBSa를 가지는 sgRNA와 커플된 경우에는, 상기 대상 3-성분 모듈은 N-말단 융합 CBPHAT::PUFa를 가지는 인핸서 PE 및 DE를 모두 통해서 OCT4 유전자를 활성화시키는 더 높은 효율을 가지므로 최고의 활성화를 이룰 수 있다. 그 다음으로, 단일 sgRNA-5×PBSa에 의해 sgRNA-5×PBSa를 사용하여 PP, PE 및 DE에 인도되는 CBPHAT::PUFa의 활성을 분석하였다 (도 5C). 비록 4 sgRNA-5×PBSa의 칵테일을 사용할 때와 유사한 배수(fold)의 변경을 가지긴 하지만, 단일 sgRNA-5×PBSa은 이들 요소의 타겟팅을 통하여 OCT4 유전자의 발현을 활성화시킬 수 있었다 (도 5C).

실시예 7 상기 대상 3-성분 CRISPR / Cas 복합체/시스템은 텔로미어의 형광 태그를 가능케 함

전사 조절 이외에도, dCas9-이펙터의 다른 중요한 응용은 생세포 이미징의 게놈 좌위(loci)를 표지하는 것이다. 본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 텔로미어의 표지(labeling)와 같은 염색체 좌위의 형광 태그에 사용될 수 있음을 보여주고 있다.

본 발명자들은 PUFa 영역에 융합된 형광 단백질을 모집하기 위하여 0, 5, 15, 또는 25 카피의 PBSa를 가지는 텔로미어(sgTelomere)를 타겟하기 위하여 디자인된 sgRNA를 첨부하였다(도 6A). dCas9 및 Clover::PUFa를 가지는 sgTelomere-5×PBSa, 15×PBSa 및 25×PBSa의 발현은 텔로미어 표지와 일치되는 녹색 형광 초점을 만든 반면, PBSa 사이트를 가지지 않는 sgRNA는 아무런 초점도 만들지 않았다(도 6B). 대상 3-성분 시스템에 인도되는 형광 신호가 정말로 텔로미어에 위치하고 있는지 확인하기 위하여 텔로미어 반복 결합 인자 TRF2 에 대한 항체로 공동 표지하는 실험을 수행하였다. 상기 3-성분 시스템 텔로미어 신호들은 대체로 TRF 표지와 중복되어(도 6C), Clover-PUFa를 모집하는 PBSa 사이트가 첨부된 sgRNA에 의해서 텔로미어를 고도의 특이성으로 표지함을 나타낸다.

흥미롭게도, 텔로미어 표지의 강도는 상기 텔로미어-sgRNAs에 첨부된 PBS의 카피 수의 증가와 더불어 증가되었다(도 6B). 초점 수 및 신호 대 잡음의 계량(핵의 초점/총 GFP에서의 %GFP)은 5, 15 내지 25× PBSa의 sgRNA를 이용하는 실험에서 점진적 증가를 보였고(도 6D 및 6E), 이는 상기 대상 3-성분 시스템이 다량체화 특성이 타겟 좌위에서의 강도를 표지하는 역가를 허용함을 나타낸다.

실시예 8 상기 대상 3-성분 CRISPR / Cas 복합체/시스템은 텔로미어 및 동원체(Centromeres)의 동시 형광 태그를 가능케함

본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 동일 세포에서 다중화(multiplexing) 특성을 이용하여 하나 이상(예; 둘)의 게놈 좌위를 동시에 표지할 수 있음을 보여주고 있다.

상기 대상 3-성분 시스템이 두 게놈 좌위를 동시에 표지하는 능력을 추가로 입증하기 위해, PUFc(sgCentromere-20×PBSc)용 첨부된 결합 사이트를 가지는 동원체를 타겟하기 위한 sgRNA를 디자인하였다. 상기 대상 3-성분 시스템 및 항-CREST 항생제를 이용한 면역 염색에 의해 동원체를 표지하는 것을 관찰 및 확인하였다 (도 6F). Clover-PUFb/sgCentromere-20×PBSc, Ruby-PUFa/sgTelomere-25×PBSa 및 dCas9가 HEK293T 세포에 공동 도입된 경우, 동일 세포의 동원체 및 텔로미어를 독립적으로 표지하는 것을 관찰하였고(도 6G), 그 결과 상기 대상 3-성분 시스템이 복수의 게놈 좌위를 독립적으로 표지하는 데 사용될 수 있음이 입증되었다.

실시예 9 상기 대상 3-성분 CRISPR / Cas 복합체/시스템은 비-반복 염색체 좌위의 형광 태그를 가능케 함

dCas9::GFP를 사용하여 비-반복적 DNA를 표지하는 이전 연구 보고에 따르면, 이들 비-반복적 부위를 표지하기에 충분한 신호를 집중하기 위하여 >32 타겟팅이 요구된다. 본 실시예에서는 PUF-형광 단백질 융합을 위한 복수의 결합 사이트를 포함시킴으로써 형광 신호들을 타겟 사이트에 집중시킬 수 있으며 그로 인해 비-반복적 DNA를 검출하는 데 필요한 타겟팅 사이트의 양을 감소시킴을 확인하였다.

본 실시예에서는 MUC4 좌위에서의 비-반복적 부위를 시험하였다. MUC4 표지를 연상시키는 표지 패턴 15×PBS32, Clover::PUF(3-2) 및 dCas9 각각을 포함하는 7 개의 sgRNA을 성공적으로 검출하였다(도 7). 본 실시예는 상기 대상 3-성분 CRISPR/Cas 복합체/시스템을 정의된 게놈 좌위에서 단백질을 "중합(polymerize)"하는 데 사용될 수 있으며, 이는 이미징 분야에서 상기 대상 3-성분 CRISPR/Cas 복합체/시스템의 적용을 가능케 하고 상당히 확대시킬 수 있음을 보여주고 있다.

상기 실시예들은 상기 대상 3-성분 CRISPR/Cas 복합체/시스템이 다중화(도 8A), 복합체 형성(도 8C) 및 전사 조절 인자들, 후성적 변형자들 및 형광 단백질을 포함한 단백질의 중합(도 8B)의 수행 능력이 있음과 상기 시스템이 이들을 정의된 게놈 좌위로 독립적으로 유도할 수 있음을 보여주고 있다. 상기 시스템은 복수의 좌위에서 복잡한 분자 거동의 제작과 정의된 화학양론을 가지는 단백질의 연구 및 재구성을 가능케 한다. 대상 3-성분 CRISPR/Cas 복합체/시스템의 중합 특성은 효소 활성 또는 다른 단백질의 정의된 게놈 좌위로 집중하도록 하여, 염색체 이미징과 같은 응용을 위해 효소 활성을 증가시키거나 신호 농축(signal enrichment)을 집중하게 한다.

더욱 구체적으로, 상기 대상 3-성분 시스템의 주요 잇점은 다음을 포함한다. (A) 다중화: 상기 대상 3-성분 시스템의 상이한 모듈은 동시에 세포로 전달될 수 있으며, 각 모듈은 독립성(즉, 다른 모듈 및 이들의 타겟 사이트들과 간섭없이)을 가지는 이들의 정의된 타겟 사이트에서 작동될 수 있다. PUF 영역들은 임의의 8-mer RNA 모티프를 인식하도록 쉽게 프로그램될 수 있기 때문에, 따라서 독립적 모듈의 잠재적 수는 이론상 최대치인 48(65536)까지 확장된다. PUF 배열을 다른 것 안에 삽입함으로써, 상기 인식 사이트는 416(42.9 억)의 서열 공간을 가지는 16-mer RNA 모티프로 프로그램될 수 있다. (B) 다량체화: 선형 8-mer PBS 모티프의 단순성은 sgRNA 전사 또는 Cas9/sgRNA DNA 결합 활성을 방해함 없이 sgRNA-PBS 상에 PUF 융합체의 광범위한 다량체화를 가능케한다. 이 특성은 PUF 융합체의 복수 분자들이 상기 sgRNA 상에 조립되게 함으로써 이펙터들 또는 단백질 태그들의 국소화된 농도를 허용한다. 이 특성은 형광 이미징 또는 전사 조절에 특히 유익하다. 텔로미어와 같은 반복 서열을 표지하는 상기 실험에서 보여준 바와 같이, 더 많은 PBS를 포함하는 sgRNA-PBS는 텔로미어 초점(telomeric foci)에서 신호를 증가시킨다. 이 특성은 통상 30 sgRNAs 이상의 타일링(tiling)을 필요로 하는 비-반복 서열의 표지를 용이하게 할 수도 있다. 직접적 dCas9-HAT 융합과 비교하여 상기 대상 시스템을 이용한 HAT-매개 인핸서 활성화가 더 높은 효율을 가짐이 관찰되었다. 다량체화는 수퍼-인핸서 또는 각인된 좌위(imprinted loci)와 같은 거대 후성적 영역들의 리프로그래밍에 유용한 인공 후성적 인자들(artificial epigenetic factors)에 의해 지휘되는 후성적 변형의 스프레딩을 용이하게 할 수 있을 것으로 생각된다. (C) 화학양론적으로 정의된 복합체 형성: 본 발명에서 직접 시험하지는 않았지만, 상기 sgRNA-PBS는 화학양론적으로 정의된 단백질 복합체들의 PUF-지향 조립용 RNA 발판(scaffold)으로 작용할 수 있을 것으로 생각된다. 구체적으로, 다양한 특이성을 가지는 다양한 수의 PBS 카피는 상기 sgRNA-PBS의 정의된 순서를 따를 뿐 아니라 정의된 화학양론을 가지는 다중 단백질(multiprotein) 복합체 형성을 가능케하는 상기 sgRNA에 첨부될 수 있을 것으로 생각된다.

상기 실시예에서 사용되는 물질 및 방법들은 하기에 기재되어 있다.

클로닝 (Cloning)

벡터 목록과 이들의 Addgene 엔트리 링크는 하기 표에 제시되어 있다. 클로닝 전략 및 서열에 대한 자세한 설명은 하기에 기재되어 있다.

N-말단 NLS을 가지는 UFa[PUF(3-2)] 및 PUFb[PUF(6-2/7-2)]는 이들 코딩 서열들을 포함하는 작체물들로부터 SgrAI 및 PacI 사이트를 포함하는 프라이머들을 사용하여 증폭 후, 이들을 이용하여 pAC164:pmax-dCas9Master_VP64를 SgrAI-dCas9-FseI로 대체하여 pAC1355:pmax-NLSPUFa_VP64 및 pAC1356:pmax-NLSPUFb_VP64을 제작하였다. NLSPUFb의 반복 4까지의 5' 단편 및 반복 5부터 NLSPUFa의 말단까지의 단편의 융합 PCR을 통하여 pAC1357:pmax-NLSPUFw_VP64를 제작하였다. NLSPUFa의 5' 단편을 NLSPUb의 3' 단편과 융합 PCR을 통하여 pAC1358:pmax-NLSPUFc_VP64를 제작하였다.

FseI PacI 사이트를 가지는 MS2-P65-HSF1_GFP(Addgene: 61423)로부터 p65HSF1 활성제 ORF를 증폭 후 pAC164의 VP64 단편을 대체하여 pAC1410:pmax-dCas9_p65HSF1을 제작하고, pAC1355 및 pAC1358 의 VP64 단편을 대체하여 pAC1393: pmax-NLSPUFa_p65HSF1 및 pAC1411:pmax-NLSPUFc_p65HSF1을 각각 제작하였다.

Clover 및 mRuby2를 SgrAI 및 FseI 클로닝 사이트를 포함하는 pcDNA3-Clover(Addgene #40259) 및 pcDNA3-mRuby2(Addgene #40260)로부터 각각 증폭 후, 상기 pAC1356~1358 및 pAC149:pCR8-dCas9VP160(Addgene #48221)로부터 절단된 벡터로부터 증폭된 다양한 FseI-PUF-PacI와 결찰하여(ligated) Clover_PUFa 및 Clover_PUFc, mRuby2_PUFa의 ORF를 포함하는 게이트웨이 기증자 벡터들(gateway donor vectors)인 pAC1402, pAC1403 및 pAC1404를 각각 제작하였다. 이들 ORF는 이후 LR Clonase(Invitrogen)를 이용하여 pAC1119:PB3-neo(-)-pmaxDEST(+)와 재조합하여 발현 벡터들인 pAC1360(Clover_PUFa), pAC1381(Clover_PUFc) 및 pAC1362(mRuby2_PUFa)을 제작하였다.

NLSKRAB 리프레서 영역을 AgeI-ClaI 사이트를 포함하는 프라이머들을 사용하여 SOX2 TALE 리프레서(KRAB 1-75)(Addgene #42945)로부터 증폭한 후, AclI PacI를 포함하는 프라이머들과 벡터로서 SgrAI-PacI로 절단된 pAC1360와 결찰하여 pAC1412: PB3-neo(-)-pmax-NLSKRAB_NLSPUFa를 제작하였다.

상기 FseI-p65HSF1-PacI 단편을 pAC1393로부터 수득 후 벡터로서 SgrAI-PacI로 절단된 pAC1356 및 pAC1360로부터 수득한 SgrAI-NLSPUMb와 결찰하여 pAC1413: PB3-neo(-)-pmax-NLSPUFb_p65HSF1을 제작하였다. 상기 BFPKRAB 단편을 pHR-SFFV-dCas9-BFP-KRAB(Addgene #46911)로부터 증폭 후 이를 이용하여 pAC1360로부터 수득한 Clover 단편을 대체하여 pAC1414: PB3-neo(-)-pmax-BFPKRAB_NLSPUFa을 제작하였다. 이후, NheI-CAGGS-NLSPUFb_p65HSF1-NheI 단편을 pAC1413로부터 증폭 후 NheI로 절단한 pAC1414에 삽입하여 BFPKRAB-NLSPUFa 및 NLSPUFb-p65HSF1(pAC1414: PB3-NLSPUFb_p65HSF1(-)neo(-)-BFPKRAB2_NLSPUFa)용 2중 발현벡터를 제작하였다.

개선된 링커 서열들과 N-말단(SgrAI,ClaI) 및 C-말단(FseI-PacI) 삽입을 위한 클로닝 사이트들 뿐 아니라 PUF의 N-말단에 3 개의 여분의 NLS 및 PUF의 C-말단에 1개의 추가 NLS를 가지는 4개의 게이트웨이 기증 벡터들(pAC1404~1408)을 제작하였다. HAT 서열을 생쥐 cDNA와 FseI - PacI 사이트를 포함하는 프라이머들을 사용하여 증폭 후 pAC164에 삽입하여 pAC1364: pmax-dCas9Master_CBPHAT를 제작하였고 pAC1405에 삽입하여 pAC1415: pCR8-4×NLSPUFa_2×NLS_CBPHAT를 제작하였다. HAT 서열을 SgrAI-AclI 사이트를 포함하는 다른 프라이머 쌍으로 증폭 후 pAC1405의 SgrAI-ClaI 사이트로 클론하여 pAC1416: pCR8-CBPHAT_4×NLSPUFa_2×NLS을 제작하였다. pAC1415 및 pAC1416를 pAC90:pmax-DEST(Addgene #48222)로 재조합 후 발현벡터들인 pAC1417: pmax-4×NLSPUFa_2×NLS_CBPHAT 및 pAC1418: pmax-CBPHAT_4×NLSPUFa_2×NLS를 각각 제작하였다. FseI-mCherry-PacI 단편을 mCherry 서열을 포함하는 플라스미드로부터 증폭 후 PB3-neo(-)-pmax의 SgrAI-dCas9-FseI로 결찰하여 pAC1419: PB3-neo(-)-pmax-dCas9Master_mCherry을 제작하였다.

sgRNA-PBS용 발현 벡터들은 다음과 같이 제작하였다: 첫째, 가이드 서열의 올리고 클로닝용 BbsI를 포함하는 sgF+E를 토대로 한 sgRNA 발판(scaffold) 및 PBS 삽입용 3' BsaI(종결자의 인접 상류(right upstream of the terminator)) sgRNA 발판(scaffold)을 gBlock(IDT)로서 구입 후 pX330(Addgene #42230)로 클로닝하여 AflIII-NotI 부위를 대체하여 벡터 pAC1394: pX-sgFE-BsaI(AGAT)를 제작하였다. 이후, 5×PBSa 사이트들을 코딩하는 올리고들(여기서, 한 쪽은 5'-AGAT-3' 돌출부가 플랭크되고(flanked) 다른 한 쪽은 5'-ATCT-3'가 위치한 ggc-스페이서에 의해 각각 분리됨)을 T4PNK로 처리 후, 어닐링하고 BsaI로 절단된 pAC1394에 결찰하였다(호환가능한(compatible) 돌출부 제작 목적). 클론들을 상이한 수의 PBS를 위한 1 카피 (5×PBS), 2 카피 (10×PBS) 등 올리고 삽입용을 스크린하였다. 1×PBS 및 2×PBS 벡터용으로, 하나의 PBS 사이트를 포함하는 올리고를 사용하여 제작하였다. 각 타겟용 가이드 서열을 상기 기재한 BbsI 사이트를 통하여 상기 sgRNA-PBS 발현 벡터들에 클론하였다. GFP 발현 마커를 포함하는 sgRNA 발현 벡터들용으로, 상기 pX 벡터들로부터 상기 sgRNA-PBS 발현 카세트를 이동시켜 AscI 사이트를 통하여 PB-GFP 벡터에 제작하였다. 상이한 sgRNA 발현 작체물들은 표에 제시되어 있다.

실험용 세포 배양액

HEK293T 세포를 10% 소태아혈청 (fetal bovine serum; FBS, Lonza), 4% 글루타막스(Glutamax; Gibco), 1% 피루빈산나트륨(Gibco) 및 페니실린-스트렙토마이신 (Gibco)을 함유하는 둘베코수정이글 배지(Dulbecco's Modified Eagle's medium; DMEM, Sigma)에서 배양하였다. 배양은 37℃ 및 5% CO₂조건에서 수행하였다. 활성화 실험을 위해, 200ng의 dCas9 작체물, 100ng의 변형된 sgRNA 및 100ng의 PUF-융합체를 포함하는 Attractene 형질감염 시약(Qiagen)을 사용하여 형질감염 하루 전에 세포를 12-웰 플레이트에 웰당 100,000 세포로 분주하였다. 형질감염 후, 세포를 48시간 배양 후 RNA 추출 또는 형광 활성 세포 분류(fluorescent-activated cell sorting; FACS)에 의해 수득하였다. 2중 활성-리프레션 실험에서, 형질감염은 변동없이 유지되었으나, 세포를 12-웰 플레이트에 웰당 150,000 세포로 분주한 후 72시간 동안 배양 후 FACS로 수득하였다. OCT4 및 SOX2 2중 활성-리프레션 실험에서, 세포를 RNA 추출 이전에 BFP(활성제-리프레서 모듈용 PUFb-p65HSF1/BFPKRAB-PUFa), mCherry(dCas9mCherry 용) 및 GFP(EGFP를 공동 발현하는 벡터 상 sgRNA-PBS)로 3중 분리하였다. 이미징 실험에서, 세포는 50ng의 dCas9 작체물, 500ng의 변형된 sgRNA 및 50ng의 PUF-형광 융합체를 포함하는 Attractene 형질감염 시약을 사용하여 형질감염 하루 전에 22×22×1 현미경 커버글라스를 포함하는 6-웰 플레이트에 웰당 300,000 세포로 분주하였다. 형질감염 후, 세포를 48시간 배양 후 면역 염색하였다.

정량적 RT-PCR 분석

세포를 트립신 처리하여 수득한 후, 둘베코 인산완충식염수(Dulbecco's phosphate-buffered saline; dPBS)로 세척하고, 125g에서 5분간 원심분리 후, RNeasy Plus Mini 키트(Qiagen)을 사용하여 RNA를 추출하였다. 1μg RNA와 Applied Biosystems High Capacity RNA-to-cDNA 키트를 사용하여 cDNA 라이브러리를 제작하였다. GAPDH(Hs03929097, VIC)를 내인성 대조군(endogenous control)으로 하고 OCT4(Hs00999632, FAM) 및 SOX2(Hs01053049, FAM)를 타겟으로 하여 TaqMan Gene expression assays(Applied Biosystems)를 디자인하였다. UNG(Applied Biosystems)를 포함하는 TaqMan Universal Master Mix II와 각 반응 당 2μl의 1:10 희석된 cDNA를 사용하여 정량적 PCR(qPCR)을 수행하였다. 활성은 Applied Biosystems ViiA7 instrument를 사용하여 분석하였다. 유전자 발현 수준은 "delta delta Ct" 알고리즘을 사용하여 계산 후 대조군 샘플로 정규화하였다.

형광 활성 세포 분류(Fluorescent-Activated Cell Sorting; FACS)

세포를 트립신화한 후 2% 파라포름알데히드로 10분간 고정하였다. 이후, 세포를 125g에서 5분간 원심분리 후, dPBS에 재현탁하였다. CellQuest Pro software(BD Bioscience)를 사용하여 FACScalibur 유세포 분석기 상에서 샘플을 분석하였다. 각 분석마다 수 천개의 이벤트를 수집하였다.

면역 염색 및 현미경 관찰

세포를 커버글라스에 부착된 채로 2% 파라포름알데히드에 고정시킨 후, dPBS 상에서 0.1% Triton X-100로 세척 후, dPBS 상에서 0.4% Triton X-100로 4℃에서 5분간 처리하여 투과성을 부여 후, 5% 블롯팅-급 블로킹 완충액(BIO-RAD)에서 30분간 블로킹하고, 블로킹 완충액 상에서 1차 항체와 함께 4℃에서 밤새도록 배양 후, dPBS로 3회 세척 후, 암실에서 각각 Alexa Fluor로 콘주게이트된 2차 항체로 3시간 배양 후, 재세척 후 DAPI로 염색하였다. 이미징 전에 상기 커버글라스를 글리세롤을 포함한 슬라이드 위에 올려 놓았다. 항-TRF2 1차 항체(Novus 생물학제제: NB110-57130)의 1:100 희석액 및 Alexa Fluor 594로 콘주게이트된 항-토끼 IgG 2차 항체(Invitrogen, A11037)의 1:500 희석액을 사용하여 텔로미어를 면역 염색하였다. CREST 항체(항체 통합: 15-235-0001)의 1:100 희석액과 Alexa Fluor 594로 콘주게이트된 항-인간 IgG 2차 항체(Invitrogen, A11014)의 1:500 희석액을 사용하여 동원체(centromeres)를 검출하였다.

상기 실시예들에서 사용된 작체물들 중 일부의 서열들 및 이들의 관련 서열들을 하기에 제시하였다.

>NLSPUFa_VP64 Key: NLS PUFa VP64

MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID

상기 서열에서, NLS 서열은 잔기 6-12이고, PUFa는 잔기 15-363이고 VP64는 잔기 371-421이다.

>NLSPUFb_VP64 Key: NLS PUFb VP64

MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID

상기 서열에서, NLS 서열은 잔기 6-12이고, PUFb는 잔기 15-363이고 VP64는 잔기 371-421이다.

>NLSPUFw_VP64 Key: NLS PUFw VP64

MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID

상기 서열에서, NLS 서열은 잔기 6-12이고, PUFw는 잔기 15-363이고 VP64는 잔기 371-421이다.

>NLSPUFc_VP64 Key: NLS PUFc VP64

MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID

상기 서열에서, NLS 서열은 잔기 6-12이고, PUFc는 잔기 15-363이고 VP64는 잔기 371-421이다.

>Clover_NLSPUFa Key: Clover NLS PUFa

MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

상기 서열에서, NLS 서열은 잔기 264-270이고, PUFa는 잔기 273-621이고 Clover는 잔기 1-251이다.

>Clover_NLSPUFc Key: Clover NLS PUFc

MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

상기 서열에서, NLS 서열은 잔기 264-270이고, PUFc는 잔기 273-621이고 Clover는 잔기 1-251이다.

>mRuby2_NLSPUFa Key: 6×His-mRuby2 NLS PUFa

MVRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGNPYMGTQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPKGIPDFFKQSFPEGFTWERVTRYEDGGVVTVMQDTSLEDGCLVYHVQVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTHMALKVDGGGHLSCSFVTTYRSKKTVGNIKMPGIHAVDHRLERLEESDNEMFVVQREHAVAKFAGLGGGMDELYKGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

상기 서열에서, NLS 서열은 잔기 284-290이고, PUFa는 잔기 293-641이고 6×His-mRuby2는 잔기 6-11의 6×His 태그를 포함하여 잔기 1-271이다.

>NLSPUFa_p65HSF1 Key: PUFa NLS p65HSF1

MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGGGGSGGGGSGGGGSGPKKKRKVAAAGSPSGQISNQALALAPSSAPVLAQTMVPSSAMVPLAQPPAPAPVLTPGPPQSLSAPVPKSTQAGEGTLSEALLHLQFDADEDLGALLGNSTDPGVFTDLASVDNSEFQQLLNQGVSMSHSTAEPMLMEYPEAITRLVTGSQRPPDPAPTPLGTSGLPNGLSGDEDFSSIADMDFSALLSQISSSGQGGGGSGFSVDTSALLDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVSID

상기 서열에서, NLS 서열은 잔기 6-12이고, PUFa는 잔기 15-363이고, p65는 잔기 427-575이고 HSF1는 잔기 584-707이다.

>NLSKRAB_NLSPUFa Key: NLSKRAB PUFa

MGSPKKKRKVEASMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVSRGSIVGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

상기 서열에서, 상기 2 개의 NLS 서열은 잔기 4-10 및 잔기 99-105이고, PUFa는 잔기 108-456이고 KRAB는 잔기 11-92이다.

>BFPKRAB_NLSPUFa Key: HA-2×NLS-BFPKRAB NLS PUFa

MAYPYDVPDYASLGSGSPKKKRKVEDPKKKRKVDGIGSGSNGSSGSSELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANIKTTYRSKKPAKNLKMPGVYYVDYRLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLNGGGGGMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPGGSGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

상기 서열에서, NLS 서열은 잔기 370-376이고, PUFa는 잔기 379-727이고 HA-2×NLS-BFPKRAB는 잔기 3-11의 HA를 포함하여 잔기 1-355이다.

>dCas9Master_mCherry HATag NLS dCas9 mCherry

YLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEASGGGGSGGGGSGGGGSGPAMVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFKWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQKKTMGWEASSERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVNIKLDITSHNEDYTIVEQYERAEGRHSTGGMDELYKID

상기 서열에서, 상기 2 개의 NLS 서열은 잔기 30-36 및 잔기 1408-1414이고, dCas9는 잔기 40-1406이고, mCherry는 잔기 1436-1671이고 HA 태그는 잔기 20-28이다.

>CBPHAT_4×NLS_PUFa_2×NLS Key: CBPHAT NLS PUFa

PDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGDPKKKRKVDPKKKRKVGGRGGGGSGGGGSGGGGSGPA

상기 서열에서, 6 개의 7-잔기 NLS 서열은 잔기 773, 781, 789, 826, 1185 및 1193에서 시작되고, PUFa는 잔기 835-1183이고 CBPHAT는 잔기 2-764이다.

> 4×NLS_PUFa_2×NLS_CBPHAT Key: NLS PUFa CBPHAT

PDPLLSCDLMDGRDAFLTLARDKHWEFSSLRRSKWSTLCMLVELHTQGQDRFVYTCNECKHHVETRWHCTVCEDYDLCINCYNTKSHTHKMVKWGLGLDDEGSSQGEPQSKSPQESRRLSIQRCIQSLVHACQCRNANCSLPSCQKMKRVVQHTKGCKRKTNGGCPVCKQLIALCCYHAKHCQENKCPVPFCLNI

상기 서열에서, 6 개의 7-잔기 NLS 서열은 잔기 10, 18, 26, 63, 422 및 430에서 시작되고, PUFa는 잔기 72-420이고 CBPHAT는 잔기 458-1220이다.

명칭 및 기술	DNA 서열
sgRNA-PBS 발현 카세트
PBS 서열 없이 Ns로서 타겟 서열을 포함하는 발현 카세트 U6::sgRNA-0×PBS	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccAGATCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 1 카피의 PBS32(UGUAUGUA)을 포함하는 발현 카세트 U6::sgRNA-1×PBS32	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTGTATGTAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc

명칭 및 기술	DNA 서열
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 5 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::sgRNA-5×PBS32	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 15 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::sgRNA-15×PBS32	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 25 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::sgRNA-25×PBS32	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 1 카피의 PBS6272(UUGAUAUA)을 포함하는 발현 카세트 U6::sgRNA-1×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatgccTtgATATAgccagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 2 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-2×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc

명칭 및 기재	DNA 서열
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 5 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-5×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 10 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-10×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 15 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-15×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 20 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-20×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc

명칭 및 기술	DNA 서열
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 25 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-25×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCC 스페이서 서열에 의해 분리된 47 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-47×PBS6272	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATACCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAAGATTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAGCCTTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 2 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-2×PBS6272-10Spacer	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 6 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-6×PBS6272-10Spacer	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc

명칭 및 기술	DNA 서열
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 15 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-15×PBS6272-10Spacer	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 20 카피의 PBS6272(UUGAUAUA)를 포함하는 발현 카세트 U6::sgRNA-20×PBS6272-10Spacer	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATGCCTTGATATAGCCAGATCCTTGATATAGCCAGATGCCTTGATATAGCCagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 5'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 5 카피의 PBS32(UGUAUGUA)를 포함하는 발현 카세트 U6::5×PBS32-sgRNA	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCgCAATTGggtctccAGATTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAGCCTGTATGTAAGATCTCACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 2 카피의 PBS32(UGUAUGUA)-PBS6272(UUGAUAUA) 클러스터를 포함하는 발현 카세트 U6::sgRNA-2×[PBS32-PBS6272]	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc

명칭 및 기재	DNA 서열
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 8 카피의 PBS32(UGUAUGUA)-PBS6272(UUGAUAUA) 클러스터를 포함하는 발현 카세트 U6::sgRNA-8×[PBS32-PBS6272]	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
Ns로서 타겟 서열과 sgRNA의 3'부위에 부착된 GCCAGATGCC 스페이서 서열에 의해 분리된 4 카피의 PBS32(UGUAUGUA)-PBS6272(UUGAUAUA) 클러스터를 포함하는 발현 카세트 U6::sgRNA-4×[PBS32-PBS6272]	gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNNgtttAagagctaTGCTGGAAACAGCAtagcaagttTaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAATTGggtctccagatTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAAGATTGTATGTAGTCTATTGATATAGTCTTGTCTATGTATGTAGTCTATTGATATAagatCTTTTTTTgttttagagctagaaatagcaagttaaaataaggctagtccgtagcgcgtgcgccaattctgcagacaaatggc
sgRNA 타겟 서열 (U6 전사 효율을 증가시키고자 때때로 추가적으로 G가 추가됨)
조절 서열	GTTCTCTTGCTGAAAGCTCGA
TetO 프로모터	GCTTTTCTCTATCACTGATA
SV40P1	GCATACTTCTGCCTGCTGGGGAGCCTG
SV40P2	GAAAGTCCCCAGGCTCCCCAGC
SV40P3	GCATCTCAATTAGTCAGCAACC
텔로미어	GTTAGGGTTAGGGTTAGGGTTA
동원체	GTTGAGGCCTTCGTTGGAAAC
MUC4-비반복-1	GAAGAGTGGAGGCCGTGCGCGG
MUC4-비반복-2	GCAAGCAAGGGAAGCGACAAGG
MUC4-비반복-3	GATGTTTCAGGACTAGGCTGA
MUC4-비반복-4	GAGCTGGGCCAGGAGAGGAGA
MUC4-비반복-5	GAGGGGTCTGTGGAGAGTTT
MUC4-비반복-6	GGCTTGGTGTATTCAGAATG
MUC4-비반복-7	GTAGAGATGCCGCCCCGCCC
OCT4-PP-1	GGCCCCGCCCCCTGGATGGG
OCT4-PP-2	GGGGGGAGAAACTGAGGCGA
OCT4-PP-3	GGTGGTGGCAATGGTGTCTG
OCT4-PP-4	GACACAACTGGCGCCCCTCC
OCT4-PE-1	GGCCCCTACTTCCCCTTCAA
OCT4-PE-2	GAGTGATAAGACACCCGCTT
OCT4-PE-3	GCCTGGGAGGGACTGGGGGA
OCT4-PE-4	GGACAATCCCGGTCCCCAGA
OCT4-DE-1	GGTCTGCCGGAAGGTCTACA
OCT4-DE-2	GGCAGGTAGATTATGGGGCC
OCT4-DE-3	GAAGACGGCCTCTCAGAGGA

명칭 및 기술	DNA 서열
OCT4-DE-4	GTATTTCTGGCCTGGGCAAG
SOX2-PP-1	GCATGTGACGGGGGCTGTCA
SOX2-PP-2	GCTGCCGGGTTTTGCATGAA
SOX2-PP-3	GCCGGCCGCGCGGGGGAGGC
SOX2-PP-4	GGCAGGCGAGGAGGGGGAGG
SV40-P1	GCATACTTCTGCCTGCTGGGGAGCCTG

명칭	펩타이드 서열
화농성 연쇄상구균 (S. Pyogenes) NLS-dCas9-NLS	SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS
화농성 연쇄상구균 (S. Pyogenes) NLS-Cas9WT-NLS	SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS

명칭	펩타이드 서열
화농성 연쇄상구균 (S. Pyogenes) NLS-Cas9 틈내기 효소(D10A)-NLS	SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS
화농성 연쇄상구균 (S. Pyogenes) NLS-Cas9틈내기 효소(H840A)-NLS	SEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSPKKKRKVEAS

명칭	펩타이드 서열
Ruby::PUF(3-2)	MVRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGNPYMGTQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPKGIPDFFKQSFPEGFTWERVTRYEDGGVVTVMQDTSLEDGCLVYHVQVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTHMALKVDGGGHLSCSFVTTYRSKKTVGNIKMPGIHAVDHRLERLEESDNEMFVVQREHAVAKFAGLGGGMDELYKGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
Ruby::PUF(6-2/7-2)	MVRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGNPYMGTQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPKGIPDFFKQSFPEGFTWERVTRYEDGGVVTVMQDTSLEDGCLVYHVQVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTHMALKVDGGGHLSCSFVTTYRSKKTVGNIKMPGIHAVDHRLERLEESDNEMFVVQREHAVAKFAGLGGGMDELYKGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
Clover::PUF(3-2)	MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
Clover::PUF(6-2/7-2)	MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTFGYGVACFSRYPDHMKQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSHQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYKSRGPYSIVSPKCGGGGSGPAGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG
PUF(3-2)::VP64	MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID

명칭	펩타이드 서열
PUF(6-2/7-2)::VP64	MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID
PUF(6-2/7-2)::p65_HSF1	MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGGGGSGGGGSGGGGSGPKKKRKVAAAGSPSGQISNQALALAPSSAPVLAQTMVPSSAMVPLAQPPAPAPVLTPGPPQSLSAPVPKSTQAGEGTLSEALLHLQFDADEDLGALLGNSTDPGVFTDLASVDNSEFQQLLNQGVSMSHSTAEPMLMEYPEAITRLVTGSQRPPDPAPTPLGTSGLPNGLSGDEDFSSIADMDFSALLSQISSSGQGGGGSGFSVDTSALLDLFSPSVTVPDMSLPDLDSSLASIQELLSPQEPPRPPEAENSSPDSGKQLVHYTAQPLFLLDPGSVDTGSNDLPVLFELGEGSYFSEGDGFAEDPTISLLTGSEPPKAKDPTVSID
KRAB::PUF(6-2/7-2)	MGSPKKKRKVEASMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVSRGSIVGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLG

벡터들 및 이들의 Addgene 접수 번호

pAC 번호	기술적 명칭	기술
pAC164	pmax-dCas9Master_VP64	발현 벡터 pmax(Clontech)의 CAGGS 프로모터에 의해 구동되는 dCas9-VP64
pAC1119	PB3-neo(-)-pmaxDEST(+)	새로운 선택가능한 마커 및 pmax 카세트(Clontech)를 포함하는 PB 게이트웨이 목적지 벡터(gateway destination vector)
pAC1355	pmax-NLSPUFa_VP64	일시적 발현 벡터 pmax의 NLSPUFa_VP64
pAC1356	pmax-NLSPUFb_VP64	발현 벡터 pmax의 NLSPUFb_VP64
pAC1357	pmax-NLSPUFw_VP64	발현 벡터 pmax의 NLSPUFw_VP64
pAC1358	pmax-NLSPUFc_VP64	발현 벡터 pmax의 NLSPUFc_VP64
pAC1360	PB3-neo(-)-pmax-Clover_NLSPUFa	pAC1119의 Clover_NLSPUFa
pAC1362	PB3-neo(-)-pmax-mRuby2_NLSPUFa	pAC1119의 mRuby2_NLSPUFa
pAC1364	pmax-dCas9Master_mCBPHAT	pmax 발현 벡터의 dCas9Master_mCBPHAT
pAC1371	pX-sgRNA-5xPBSa	sgRNA-5xPBSa 발현용 클로닝 벡터
pAC1372	pX-sgRNA-15xPBSa	sgRNA-15xPBSa 발현용 클로닝 벡터
pAC1373	pX-sgRNA-25xPBSa	sgRNA-25xPBSa 발현용 클로닝 벡터
pAC1374	pX-sgRNA-5xPBSb	sgRNA-5xPBSb 발현용 클로닝 벡터

pAC 번호	기술적 명칭	기술
pAC1375	pX-sgRNA-15xPBSb	sgRNA-15xPBSb 발현용 클로닝 벡터
pAC1376	pX-sgRNA-25xPBSb	sgRNA-25xPBSb 발현용 클로닝 벡터
pAC1379	pX-sgRNA-5xPBSw	sgRNA-5xPBSw 발현용 클로닝 벡터
pAC1380	pX-sgRNA-5xPBSc	sgRNA-5xPBSc 발현용 클로닝 벡터
pAC1381	PB3-neo(-)-pmax-Clover_NLSPUFc	pAC1119의 Clover_NLSPUFc
pAC1393	pmax-NLSPUFa_p65HSF1	pmax 발현 벡터의 NLSPUFa_p65HSF1
pAC1394	pX-sgRNA-0xPBS	PBS가 없는 sgRNA 발현용 클로닝 벡터로서 PBS 삽입용 BsaI 절단용 여분의 서열을 포함함
pAC1399	pX-sgRNA-20xPBSc	sgRNA-20xPBSc 발현용 클로닝 벡터
pAC1402	pCR8-Clover_NLSPUFa	pCR8 게이트웨이 공여(donor) 벡터의 Clover_NLSPUFa
pAC1403	pCR8-Clover_NLSPUFc	pCR8 게이트웨이 공여 벡터의 Clover_NLSPUFc
pAC1404	pCR8-mRuby2_NLSPUFa	pCR8 게이트웨이 공여 벡터의 mRuby2_NLSPUFa
pAC1405	pCR8-4xNLS_PUFa_2xNLS	N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFa pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양
pAC1406	pCR8-4xNLS_PUFb_2xNLS	N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFb pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양
pAC1407	pCR8-4xNLS_PUFw_2xNLS	N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFbw pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양
pAC1408		pCR8-4xNLS_PUFc_2xNLS	N-말단 영역(ClaI과 SgrAI 또는 AgeI) 및 C-말단 영역(FseI PacI) 삽입용 NLSPUFbwc pCR8 게이트웨이 공여 벡터로서 ClaI 절단용 벡터를 제조하기 위해 dcm 세포(예, NEB C3040)에서 배양
pAC1410		pmax-dCas9Master_p65HSF1	pmax 발현 벡터의 dCas9Master_p65HSF1
pAC1411		pmax-NLSPUFc_p65HSF1	pmax 발현 벡터의 NLSPUFc_p65HSF1
pAC1412		PB3-neo(-)-pmax-NLSKRAB_NLSPUFa	pAC1119의 NLSKRAB_NLSPUFa
pAC1413		PB3-neo(-)-pmax-NLSPUFb_p65HSF1	pAC1119의 NLSPUFb_p65HSF1
pAC1414		PB3-NLSPUFb_p65HSF1-neo(-)-BFPKRAB_NLSPUFa	NLSPUFb_p65HSF1 및 BFPKRAB_NLSPUFa 2중 발현용 벡터

pAC 번호	기술적 명칭	기술
	BFPKRAB＿NLSPUFa
pAC1415	pCR8-4xNLS_PUFa_2xNLS_mCBPHAT	pCR8 게이트웨이 공여 벡터의 4xNLS_PUFa_2xNLS_mCBPHAT
pAC1416	pCR8-mCBPHAT_4xNLS_PUFa_2xNLS	pCR8 게이트웨이 공여 벡터의 mCBPHAT_4xNLS_PUFa_2xNLS
pAC1417	pmax-4xNLS_PUFa_2xNLS_mCBPHAT	pmax 발현 벡터의 4xNLS_PUFa_2xNLS_mCBPHAT
pAC1418	pmax-mCBPHAT_4xNLS_PUFa_2xNLS	pmax 발현 벡터의 mCBPHAT_4xNLS_PUFa_2xNLS
pAC1419	PB3-neo(-)-pmax-dCas9Master_mCherry	pmax 발현 벡터의 dCas9Master_mCherry
pAC1420	pX-sgRNA-1xPBSa	sgRNA-1xPBSa 발현용 벡터
pAC1421	pX-sgRNA-2xPBSa	sgRNA-2xPBSa 발현용 벡터
pAC1422	pX-sgRNA-1xPBSb	sgRNA-1xPBSb 발현용 벡터
pAC1423	pX-sgRNA-2xPBSb	sgRNA-2xPBSb 발현용 벡터
pAC1424	pX-sgRNA-10xPBSb	sgRNA-10xPBSb 발현용 벡터
pAC1425	pX-sgRNA-20xPBSb	sgRNA-20xPBSb 발현용 벡터
pAC1426	pX-sgRNA-47xPBSb	sgRNA-47xPBSb 발현용 벡터
pAC1427	pX-sgRNA-10xPBSw	sgRNA-10xPBSw 발현용 벡터
pAC1428	pX-sgRNA-15xPBSw	sgRNA-15xPBSw 발현용 벡터
pAC1429	pX-sgRNA-10xPBSc	sgRNA-10xPBSc 발현용 벡터
pAC1430	pX-sgRNA-15xPBSc	sgRNA-15xPBSc 발현용 벡터
pAC1431	PB3-LGFPL(-)-sgSOX2PP1-5xPBSa	loxP 트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP1-5xPBSa 발현용 벡터
pAC1432	PB3-LGFPL(-)-sgSOX2PP2-5xPBSa(-)	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP2-5xPBSa 발현용 벡터
pAC1433	PB3-LGFPL(-)-sgSOX2PP3-5xPBSa	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP3-5xPBSa발현용 벡터
pAC1434	PB3-LGFPL(-)-sgSOX2PP4-5xPBSa	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgSOX2PP4-5xPBSa 발현용 벡터
pAC1435	PB3-LGFPL(-)-sgOCT4PP1-5xPBSb	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP1-5xPBSb 발현용 벡터
pAC1436	PB3-LGFPL(-)-sgOCT4PP4-5xPBSb	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP4-5xPBSb 발현용 벡터
pAC1437	PB3-LGFPL(-)-sgOCT4PP3-5xPBSb	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP3-5xPBSb 발현용 벡터
pAC1438	PB3-LGFPL(-)-sgOCT4PP2-5xPBSb	loxP 사이트들에 플랭크된(flanked) GFP 마커를 포함하는 sgOCT4PP2-5xPBSb 발현용 벡터

PBS의 수 및 유형에 따른 sgRNA-PBS 발현 벡터들의 목록

#PBS＼PBS 유형	PUFa	PUFb	PUFw	PUFc
1x	pAC1420	pAC1422
2x	pAC1421	pAC1423
5x	pAC1371	pAC1374	pAC1379	pAC1380
10x		pAC1424	pAC1427	pAC1429
15x	pAC1372	pAC1375	pAC1428	pAC1430
20x		pAC1425		pAC1399
25x	pAC1373	pAC1376
47x		pAC1426

SEQUENCE LISTING <110> THE JACKSON LABORATORY <120> A THREE-COMPONENT CRISPR/CAS COMPLEX SYSTEM AND USES THEREOF <130> 122854-00620 <140> PCT/US2016/021491 <141> 2016-03-09 <150> 62/221,249 <151> 2015-09-21 <150> 62/132,644 <151> 2015-03-13 <160> 173 <170> PatentIn version 3.5 <210> 1 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 1 gttttagagc tagaaatagc aagttaaaat aaggcta 37 <210> 2 <211> 47 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 2 gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggcta 47 <210> 3 <211> 349 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 3 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 340 345 <210> 4 <211> 349 <212> PRT <213> Homo sapiens <400> 4 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 340 345 <210> 5 <211> 349 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <220> <221> VARIANT <222> (36)..(36) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (40)..(40) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (72)..(72) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (73)..(73) <223> /replace="Tyr" <220> <221> VARIANT <222> (76)..(76) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (108)..(108) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (112)..(112) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (144)..(144) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (145)..(145) <223> /replace="His" <220> <221> VARIANT <222> (148)..(148) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (180)..(180) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (184)..(184) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (216)..(216) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (217)..(217) <223> /replace="Tyr" <220> <221> VARIANT <222> (220)..(220) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (252)..(252) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (253)..(253) <223> /replace="Asn" <220> <221> VARIANT <222> (256)..(256) <223> /replace="Arg" or "Glu" <220> <221> VARIANT <222> (295)..(295) <223> /replace="Ser" or "Gly" or "Ala" or "Thr" or "Asn" <220> <221> VARIANT <222> (296)..(296) <223> /replace="Tyr" <220> <221> VARIANT <222> (299)..(299) <223> /replace="Arg" or "Glu" <220> <221> MISC_FEATURE <222> (1)..(349) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <220> <221> source <223> /note="See specification as filed for detailed description of substitutions and preferred embodiments" <400> 5 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Cys 130 135 140 Arg Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Cys Arg Val Ile Gln His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Arg Val Val Gln 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Cys Arg Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 340 345 <210> 6 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 6 Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala 1 5 10 <210> 7 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 7 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala 1 5 10 <210> 8 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 8 Gln His Gly Ser Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala 1 5 10 <210> 9 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 9 Gln His Gly Gly Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala 1 5 10 <210> 10 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 10 Gln His Gly Ala Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala 1 5 10 <210> 11 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 11 Gln His Gly Thr Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala 1 5 10 <210> 12 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 12 Gln His Gly Cys Arg Phe Ile Arg Leu Lys Leu Glu Arg Ala 1 5 10 <210> 13 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 13 Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala 1 5 10 <210> 14 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 14 Gln His Gly Asn Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala 1 5 10 <210> 15 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 15 Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu Phe Gly 1 5 10 <210> 16 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 16 Val Phe Gly Ser Arg Val Ile Gln Lys Phe Phe Glu Phe Gly 1 5 10 <210> 17 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 17 Val Phe Gly Cys Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 1 5 10 <210> 18 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 18 Val Phe Gly Ser Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 1 5 10 <210> 19 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 19 Val Phe Gly Ser Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly 1 5 10 <210> 20 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 20 Val Phe Gly Gly Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly 1 5 10 <210> 21 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 21 Val Phe Gly Ala Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly 1 5 10 <210> 22 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 22 Val Phe Gly Thr Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly 1 5 10 <210> 23 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 23 Val Phe Gly Cys Tyr Val Ile Arg Lys Phe Phe Glu Phe Gly 1 5 10 <210> 24 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 24 Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu Phe Gly 1 5 10 <210> 25 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 25 Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 1 5 10 <210> 26 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 26 Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Phe Ile 1 5 10 <210> 27 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 27 Met Tyr Gly Ser Arg Val Ile Gln Lys Ala Leu Glu Phe Ile 1 5 10 <210> 28 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 28 Met Tyr Gly Ser Arg Val Ile Arg Lys Ala Leu Glu Phe Ile 1 5 10 <210> 29 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 29 Met Tyr Gly Gly Arg Val Ile Arg Lys Ala Leu Glu Phe Ile 1 5 10 <210> 30 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 30 Met Tyr Gly Ala Arg Val Ile Arg Lys Ala Leu Glu Phe Ile 1 5 10 <210> 31 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 31 Met Tyr Gly Thr Arg Val Ile Arg Lys Ala Leu Glu Phe Ile 1 5 10 <210> 32 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 32 Met Tyr Gly Cys Arg Val Ile Arg Lys Ala Leu Glu Phe Ile 1 5 10 <210> 33 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 33 Met Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe Ile 1 5 10 <210> 34 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 34 Met Tyr Gly Asn Arg Val Ile Gln Lys Ala Leu Glu Phe Ile 1 5 10 <210> 35 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 35 Gln Asn Gly Cys Arg Val Val Gln Lys Cys Ile Glu Cys Val 1 5 10 <210> 36 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 36 Gln Asn Gly Ser Arg Val Val Gln Lys Cys Ile Glu Cys Val 1 5 10 <210> 37 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 37 Gln Asn Gly Cys His Val Val Gln Lys Cys Ile Glu Cys Val 1 5 10 <210> 38 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 38 Gln Asn Gly Ser His Val Val Gln Lys Cys Ile Glu Cys Val 1 5 10 <210> 39 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 39 Gln Asn Gly Ser His Val Val Arg Lys Cys Ile Glu Cys Val 1 5 10 <210> 40 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 40 Gln Asn Gly Gly His Val Val Arg Lys Cys Ile Glu Cys Val 1 5 10 <210> 41 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 41 Gln Asn Gly Ala His Val Val Arg Lys Cys Ile Glu Cys Val 1 5 10 <210> 42 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 42 Gln Asn Gly Thr His Val Val Arg Lys Cys Ile Glu Cys Val 1 5 10 <210> 43 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 43 Gln Asn Gly Cys His Val Val Arg Lys Cys Ile Glu Cys Val 1 5 10 <210> 44 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 44 Gln Asn Gly Ser His Val Val Glu Lys Cys Ile Glu Cys Val 1 5 10 <210> 45 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 45 Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val 1 5 10 <210> 46 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 46 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys 1 5 10 <210> 47 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 47 Pro Tyr Gly Ser Arg Val Ile Gln Arg Ile Leu Glu His Cys 1 5 10 <210> 48 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 48 Pro Tyr Gly Ser Arg Val Ile Arg Arg Ile Leu Glu His Cys 1 5 10 <210> 49 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 49 Pro Tyr Gly Gly Arg Val Ile Arg Arg Ile Leu Glu His Cys 1 5 10 <210> 50 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 50 Pro Tyr Gly Ala Arg Val Ile Arg Arg Ile Leu Glu His Cys 1 5 10 <210> 51 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 51 Pro Tyr Gly Thr Arg Val Ile Arg Arg Ile Leu Glu His Cys 1 5 10 <210> 52 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 52 Pro Tyr Gly Cys Arg Val Ile Arg Arg Ile Leu Glu His Cys 1 5 10 <210> 53 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 53 Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys 1 5 10 <210> 54 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 54 Pro Tyr Gly Asn Arg Val Ile Gln Arg Ile Leu Glu His Cys 1 5 10 <210> 55 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 55 Gln Tyr Gly Cys Arg Val Ile Gln His Val Leu Glu His Gly 1 5 10 <210> 56 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 56 Gln Tyr Gly Ser Arg Val Ile Gln His Val Leu Glu His Gly 1 5 10 <210> 57 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 57 Gln Tyr Gly Cys Tyr Val Ile Gln His Val Leu Glu His Gly 1 5 10 <210> 58 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 58 Gln Tyr Gly Ser Tyr Val Ile Gln His Val Leu Glu His Gly 1 5 10 <210> 59 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 59 Gln Tyr Gly Ser Tyr Val Ile Arg His Val Leu Glu His Gly 1 5 10 <210> 60 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 60 Gln Tyr Gly Gly Tyr Val Ile Arg His Val Leu Glu His Gly 1 5 10 <210> 61 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 61 Gln Tyr Gly Ala Tyr Val Ile Arg His Val Leu Glu His Gly 1 5 10 <210> 62 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 62 Gln Tyr Gly Thr Tyr Val Ile Arg His Val Leu Glu His Gly 1 5 10 <210> 63 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 63 Gln Tyr Gly Cys Tyr Val Ile Arg His Val Leu Glu His Gly 1 5 10 <210> 64 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 64 Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly 1 5 10 <210> 65 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 65 Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly 1 5 10 <210> 66 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 66 Lys Phe Ala Cys Arg Val Val Gln Lys Cys Val Thr His Ala 1 5 10 <210> 67 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 67 Lys Phe Ala Ser Arg Val Val Gln Lys Cys Val Thr His Ala 1 5 10 <210> 68 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 68 Lys Phe Ala Cys Asn Val Val Gln Lys Cys Val Thr His Ala 1 5 10 <210> 69 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 69 Lys Phe Ala Ser Asn Val Val Gln Lys Cys Val Thr His Ala 1 5 10 <210> 70 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 70 Lys Phe Ala Ser Asn Val Val Arg Lys Cys Val Thr His Ala 1 5 10 <210> 71 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 71 Lys Phe Ala Gly Asn Val Val Arg Lys Cys Val Thr His Ala 1 5 10 <210> 72 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 72 Lys Phe Ala Ala Asn Val Val Arg Lys Cys Val Thr His Ala 1 5 10 <210> 73 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 73 Lys Phe Ala Thr Asn Val Val Arg Lys Cys Val Thr His Ala 1 5 10 <210> 74 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 74 Lys Phe Ala Cys Asn Val Val Arg Lys Cys Val Thr His Ala 1 5 10 <210> 75 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 75 Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala 1 5 10 <210> 76 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 76 Lys Phe Ala Asn Asn Val Val Gln Lys Cys Val Thr His Ala 1 5 10 <210> 77 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 77 Gln Tyr Ala Cys Arg Val Val Gln Lys Met Ile Asp Val Ala 1 5 10 <210> 78 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 78 Gln Tyr Ala Ser Arg Val Val Gln Lys Met Ile Asp Val Ala 1 5 10 <210> 79 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 79 Gln Tyr Ala Cys Tyr Val Val Gln Lys Met Ile Asp Val Ala 1 5 10 <210> 80 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 80 Gln Tyr Ala Ser Tyr Val Val Gln Lys Met Ile Asp Val Ala 1 5 10 <210> 81 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 81 Gln Tyr Ala Ser Tyr Val Val Arg Lys Met Ile Asp Val Ala 1 5 10 <210> 82 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 82 Gln Tyr Ala Gly Tyr Val Val Arg Lys Met Ile Asp Val Ala 1 5 10 <210> 83 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 83 Gln Tyr Ala Ala Tyr Val Val Arg Lys Met Ile Asp Val Ala 1 5 10 <210> 84 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 84 Gln Tyr Ala Thr Tyr Val Val Arg Lys Met Ile Asp Val Ala 1 5 10 <210> 85 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 85 Gln Tyr Ala Cys Tyr Val Val Arg Lys Met Ile Asp Val Ala 1 5 10 <210> 86 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 86 Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val Ala 1 5 10 <210> 87 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 87 Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala 1 5 10 <210> 88 <211> 349 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 88 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 340 345 <210> 89 <211> 349 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 89 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 340 345 <210> 90 <211> 349 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 90 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 340 345 <210> 91 <211> 341 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 91 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Ser Arg Phe Ile Glu Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Cys Arg Val Ile Gln Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr 340 <210> 92 <211> 341 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 92 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Asn Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Ser Arg Val Ile Glu Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Ser Tyr Val Val Glu Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr 340 <210> 93 <211> 341 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 93 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 1 5 10 15 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 20 25 30 Gln His Gly Cys Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 35 40 45 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 50 55 60 Leu Met Val Asp Val Phe Gly Ser Tyr Val Ile Glu Lys Phe Phe Glu 65 70 75 80 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 85 90 95 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Asn Arg Val Ile Gln 100 105 110 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 115 120 125 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 130 135 140 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 145 150 155 160 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 165 170 175 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 180 185 190 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 195 200 205 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 210 215 220 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 225 230 235 240 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Cys Asn Val Val Gln 245 250 255 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 260 265 270 Glu Cys Val Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 275 280 285 Met Lys Asp Gln Tyr Ala Cys Tyr Val Val Gln Lys Met Ile Asp Val 290 295 300 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 305 310 315 320 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 325 330 335 Leu Glu Lys Tyr Tyr 340 <210> 94 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 94 Pro Pro Lys Lys Lys Arg Lys Val 1 5 <210> 95 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 6xHis tag" <400> 95 His His His His His His 1 5 <210> 96 <211> 424 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 96 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser 355 360 365 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 370 375 380 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 385 390 395 400 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 405 410 415 Asp Leu Asp Met Leu Tyr Ile Asp 420 <210> 97 <211> 424 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 97 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser 355 360 365 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 370 375 380 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 385 390 395 400 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 405 410 415 Asp Leu Asp Met Leu Tyr Ile Asp 420 <210> 98 <211> 424 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 98 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser 355 360 365 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 370 375 380 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 385 390 395 400 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 405 410 415 Asp Leu Asp Met Leu Tyr Ile Asp 420 <210> 99 <211> 424 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 99 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser 355 360 365 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 370 375 380 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 385 390 395 400 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 405 410 415 Asp Leu Asp Met Leu Tyr Ile Asp 420 <210> 100 <211> 621 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 100 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser 225 230 235 240 Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser 245 250 255 Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg 260 265 270 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 275 280 285 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 290 295 300 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 305 310 315 320 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 325 330 335 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 340 345 350 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 355 360 365 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 370 375 380 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 385 390 395 400 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 405 410 415 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 420 425 430 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 435 440 445 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 450 455 460 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 465 470 475 480 Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu 485 490 495 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 500 505 510 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu 515 520 525 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 530 535 540 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 545 550 555 560 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 565 570 575 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 580 585 590 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 595 600 605 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 610 615 620 <210> 101 <211> 621 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 101 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser 225 230 235 240 Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser 245 250 255 Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg 260 265 270 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 275 280 285 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 290 295 300 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 305 310 315 320 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 325 330 335 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 340 345 350 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 355 360 365 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 370 375 380 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 385 390 395 400 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 405 410 415 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 420 425 430 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 435 440 445 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 450 455 460 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 465 470 475 480 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 485 490 495 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 500 505 510 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln 515 520 525 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 530 535 540 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 545 550 555 560 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 565 570 575 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 580 585 590 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 595 600 605 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 610 615 620 <210> 102 <211> 641 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 102 Met Val Arg Gly Ser His His His His His His Gly Met Ala Ser Met 1 5 10 15 Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys 20 25 30 Asp Pro Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg 35 40 45 Met Lys Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys 50 55 60 Thr Gly Glu Gly Glu Gly Asn Pro Tyr Met Gly Thr Gln Thr Met Arg 65 70 75 80 Ile Lys Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu 85 90 95 Ala Thr Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys 100 105 110 Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp 115 120 125 Glu Arg Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln 130 135 140 Asp Thr Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg 145 150 155 160 Gly Val Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys 165 170 175 Gly Trp Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu 180 185 190 Arg Gly Tyr Thr His Met Ala Leu Lys Val Asp Gly Gly Gly His Leu 195 200 205 Ser Cys Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn 210 215 220 Ile Lys Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu 225 230 235 240 Glu Glu Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val 245 250 255 Ala Lys Phe Ala Gly Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys Gly 260 265 270 Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg 275 280 285 Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn 290 295 300 Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu 305 310 315 320 Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu 325 330 335 Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln 340 345 350 Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln 355 360 365 Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu 370 375 380 Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser 385 390 395 400 Arg Val Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn 405 410 415 Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp 420 425 430 Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro 435 440 445 Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala 450 455 460 Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu 465 470 475 480 His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln 485 490 495 His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln 500 505 510 His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala 515 520 525 Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser 530 535 540 Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala 545 550 555 560 Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala 565 570 575 Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys 580 585 590 Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys 595 600 605 Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His 610 615 620 Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu 625 630 635 640 Gly <210> 103 <211> 709 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 103 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Gly 355 360 365 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Pro Lys 370 375 380 Lys Lys Arg Lys Val Ala Ala Ala Gly Ser Pro Ser Gly Gln Ile Ser 385 390 395 400 Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala Pro Val Leu Ala Gln 405 410 415 Thr Met Val Pro Ser Ser Ala Met Val Pro Leu Ala Gln Pro Pro Ala 420 425 430 Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln Ser Leu Ser Ala Pro 435 440 445 Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 450 455 460 Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu Gly Ala Leu Leu Gly 465 470 475 480 Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu Ala Ser Val Asp Asn 485 490 495 Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val Ser Met Ser His Ser 500 505 510 Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu 515 520 525 Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala Pro Thr Pro Leu Gly 530 535 540 Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp Glu Asp Phe Ser Ser 545 550 555 560 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Ser 565 570 575 Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val Asp Thr Ser Ala Leu 580 585 590 Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro Asp Met Ser Leu Pro 595 600 605 Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu Leu Leu Ser Pro Gln 610 615 620 Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser Ser Pro Asp Ser Gly 625 630 635 640 Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu Phe Leu Leu Asp Pro 645 650 655 Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro Val Leu Phe Glu Leu 660 665 670 Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly Phe Ala Glu Asp Pro 675 680 685 Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro Lys Ala Lys Asp Pro 690 695 700 Thr Val Ser Ile Asp 705 <210> 104 <211> 456 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 104 Met Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Met Asp Ala 1 5 10 15 Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val 20 25 30 Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln 35 40 45 Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val 50 55 60 Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu 65 70 75 80 Lys Gly Glu Glu Pro Trp Leu Val Ser Arg Gly Ser Ile Val Gly Ile 85 90 95 Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu 100 105 110 Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu 115 120 125 Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg 130 135 140 Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu 145 150 155 160 Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val 165 170 175 Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu 180 185 190 Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu 195 200 205 Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe 210 215 220 Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His 225 230 235 240 Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys 245 250 255 Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala 260 265 270 Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg 275 280 285 Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro 290 295 300 Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln 305 310 315 320 Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu 325 330 335 Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu 340 345 350 Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His 355 360 365 Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met 370 375 380 Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr 385 390 395 400 Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln 405 410 415 Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg 420 425 430 Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr 435 440 445 Met Lys Asn Gly Val Asp Leu Gly 450 455 <210> 105 <211> 727 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 105 Met Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Gly Ser Gly 1 5 10 15 Ser Pro Lys Lys Lys Arg Lys Val Glu Asp Pro Lys Lys Lys Arg Lys 20 25 30 Val Asp Gly Ile Gly Ser Gly Ser Asn Gly Ser Ser Gly Ser Ser Glu 35 40 45 Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val 50 55 60 Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr 65 70 75 80 Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu 85 90 95 Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys 100 105 110 Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser 115 120 125 Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly 130 135 140 Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu 145 150 155 160 Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro 165 170 175 Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu 180 185 190 Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys 195 200 205 Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg 210 215 220 Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val 225 230 235 240 Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val 245 250 255 Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys 260 265 270 Leu Gly His Lys Leu Asn Gly Gly Gly Gly Gly Met Asp Ala Lys Ser 275 280 285 Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val 290 295 300 Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile 305 310 315 320 Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu 325 330 335 Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly 340 345 350 Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu 355 360 365 Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu Leu 370 375 380 Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile 385 390 395 400 Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg Phe 405 410 415 Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu Val 420 425 430 Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val Phe 435 440 445 Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln 450 455 460 Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu Ala 465 470 475 480 Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe Ile 485 490 495 Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His Val 500 505 510 Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys Cys 515 520 525 Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe 530 535 540 Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg Val 545 550 555 560 Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro Ile 565 570 575 Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln Tyr 580 585 590 Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu Asp 595 600 605 Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu Ser 610 615 620 Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala 625 630 635 640 Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met Asn 645 650 655 Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala 660 665 670 Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln Arg 675 680 685 Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg Lys 690 695 700 Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met 705 710 715 720 Lys Asn Gly Val Asp Leu Gly 725 <210> 106 <211> 1673 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 106 Met Ile Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 1 5 10 15 Gly Ser Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys 20 25 30 Lys Arg Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala 35 40 45 Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys 50 55 60 Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser 65 70 75 80 Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr 85 90 95 Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg 100 105 110 Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met 115 120 125 Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu 130 135 140 Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile 145 150 155 160 Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu 165 170 175 Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile 180 185 190 Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile 195 200 205 Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile 210 215 220 Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn 225 230 235 240 Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys 245 250 255 Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys 260 265 270 Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro 275 280 285 Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu 290 295 300 Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile 305 310 315 320 Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp 325 330 335 Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys 340 345 350 Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln 355 360 365 Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys 370 375 380 Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr 385 390 395 400 Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro 405 410 415 Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn 420 425 430 Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile 435 440 445 Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln 450 455 460 Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys 465 470 475 480 Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly 485 490 495 Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr 500 505 510 Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser 515 520 525 Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys 530 535 540 Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn 545 550 555 560 Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala 565 570 575 Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys 580 585 590 Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys 595 600 605 Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg 610 615 620 Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys 625 630 635 640 Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp 645 650 655 Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu 660 665 670 Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln 675 680 685 Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu 690 695 700 Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe 705 710 715 720 Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His 725 730 735 Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser 740 745 750 Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser 755 760 765 Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu 770 775 780 Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu 785 790 795 800 Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg 805 810 815 Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln 820 825 830 Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys 835 840 845 Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln 850 855 860 Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val 865 870 875 880 Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr 885 890 895 Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu 900 905 910 Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys 915 920 925 Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly 930 935 940 Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val 945 950 955 960 Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg 965 970 975 Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys 980 985 990 Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe 995 1000 1005 Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His 1010 1015 1020 Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys 1025 1030 1035 Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val 1040 1045 1050 Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly 1055 1060 1065 Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe 1070 1075 1080 Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg 1085 1090 1095 Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp 1100 1105 1110 Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro 1115 1120 1125 Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe 1130 1135 1140 Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1145 1150 1155 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp 1160 1165 1170 Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu 1175 1180 1185 Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly 1190 1195 1200 Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp 1205 1210 1215 Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile 1220 1225 1230 Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg 1235 1240 1245 Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu 1250 1255 1260 Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser 1265 1270 1275 His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys 1280 1285 1290 Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile 1295 1300 1305 Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala 1310 1315 1320 Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys 1325 1330 1335 Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu 1340 1345 1350 Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr 1355 1360 1365 Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala 1370 1375 1380 Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1385 1390 1395 Asp Leu Ser Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys 1400 1405 1410 Val Glu Ala Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1415 1420 1425 Gly Gly Gly Ser Gly Pro Ala Met Val Ser Lys Gly Glu Glu Asp 1430 1435 1440 Asn Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys Val His Met 1445 1450 1455 Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu Gly 1460 1465 1470 Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys Val 1475 1480 1485 Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro 1490 1495 1500 Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp 1505 1510 1515 Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp 1520 1525 1530 Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr 1535 1540 1545 Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys 1550 1555 1560 Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys 1565 1570 1575 Lys Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu 1580 1585 1590 Asp Gly Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys 1595 1600 1605 Asp Gly Gly His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala 1610 1615 1620 Lys Lys Pro Val Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys 1625 1630 1635 Leu Asp Ile Thr Ser His Asn Glu Asp Tyr Thr Ile Val Glu Gln 1640 1645 1650 Tyr Glu Arg Ala Glu Gly Arg His Ser Thr Gly Gly Met Asp Glu 1655 1660 1665 Leu Tyr Lys Ile Asp 1670 <210> 107 <211> 1220 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 107 Met Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala Leu Met Pro Thr Leu 1 5 10 15 Glu Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu Pro Phe Arg Gln Pro 20 25 30 Val Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys 35 40 45 Asn Pro Met Asp Leu Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln 50 55 60 Tyr Gln Glu Pro Trp Gln Tyr Val Asp Asp Val Trp Leu Met Phe Asn 65 70 75 80 Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Phe Cys 85 90 95 Ser Lys Leu Ala Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln 100 105 110 Ser Leu Gly Tyr Cys Cys Gly Arg Lys Tyr Glu Phe Ser Pro Gln Thr 115 120 125 Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp Ala Ala 130 135 140 Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys Cys Phe Thr 145 150 155 160 Glu Ile Gln Gly Glu Asn Val Thr Leu Gly Asp Asp Pro Ser Gln Pro 165 170 175 Gln Thr Thr Ile Ser Lys Asp Gln Phe Glu Lys Lys Lys Asn Asp Thr 180 185 190 Leu Asp Pro Glu Pro Phe Val Asp Cys Lys Glu Cys Gly Arg Lys Met 195 200 205 His Gln Ile Cys Val Leu His Tyr Asp Ile Ile Trp Pro Ser Gly Phe 210 215 220 Val Cys Asp Asn Cys Leu Lys Lys Thr Gly Arg Pro Arg Lys Glu Asn 225 230 235 240 Lys Phe Ser Ala Lys Arg Leu Gln Thr Thr Arg Leu Gly Asn His Leu 245 250 255 Glu Asp Arg Val Asn Lys Phe Leu Arg Arg Gln Asn His Pro Glu Ala 260 265 270 Gly Glu Val Phe Val Arg Val Val Ala Ser Ser Asp Lys Thr Val Glu 275 280 285 Val Lys Pro Gly Met Lys Ser Arg Phe Val Asp Ser Gly Glu Met Ser 290 295 300 Glu Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile 305 310 315 320 Asp Gly Val Asp Val Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly 325 330 335 Ser Asp Cys Pro Pro Pro Asn Thr Arg Arg Val Tyr Ile Ser Tyr Leu 340 345 350 Asp Ser Ile His Phe Phe Arg Pro Arg Cys Leu Arg Thr Ala Val Tyr 355 360 365 His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr 370 375 380 Val Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr 385 390 395 400 Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg 405 410 415 Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala Phe Ala Glu Arg 420 425 430 Ile Ile Asn Asp Tyr Lys Asp Ile Phe Lys Gln Ala Asn Glu Asp Arg 435 440 445 Leu Thr Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro 450 455 460 Asn Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu 465 470 475 480 Arg Lys Lys Glu Glu Ser Thr Ala Ala Ser Glu Thr Pro Glu Gly Ser 485 490 495 Gln Gly Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Asn 500 505 510 Lys Asn Lys Ser Ser Ile Ser Arg Ala Asn Lys Lys Lys Pro Ser Met 515 520 525 Pro Asn Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu 530 535 540 Lys His Lys Glu Val Phe Phe Val Ile His Leu His Ala Gly Pro Val 545 550 555 560 Ile Ser Thr Gln Pro Pro Ile Val Asp Pro Asp Pro Leu Leu Ser Cys 565 570 575 Asp Leu Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys 580 585 590 His Trp Glu Phe Ser Ser Leu Arg Arg Ser Lys Trp Ser Thr Leu Cys 595 600 605 Met Leu Val Glu Leu His Thr Gln Gly Gln Asp Arg Phe Val Tyr Thr 610 615 620 Cys Asn Glu Cys Lys His His Val Glu Thr Arg Trp His Cys Thr Val 625 630 635 640 Cys Glu Asp Tyr Asp Leu Cys Ile Asn Cys Tyr Asn Thr Lys Ser His 645 650 655 Thr His Lys Met Val Lys Trp Gly Leu Gly Leu Asp Asp Glu Gly Ser 660 665 670 Ser Gln Gly Glu Pro Gln Ser Lys Ser Pro Gln Glu Ser Arg Arg Leu 675 680 685 Ser Ile Gln Arg Cys Ile Gln Ser Leu Val His Ala Cys Gln Cys Arg 690 695 700 Asn Ala Asn Cys Ser Leu Pro Ser Cys Gln Lys Met Lys Arg Val Val 705 710 715 720 Gln His Thr Lys Gly Cys Lys Arg Lys Thr Asn Gly Gly Cys Pro Val 725 730 735 Cys Lys Gln Leu Ile Ala Leu Cys Cys Tyr His Ala Lys His Cys Gln 740 745 750 Glu Asn Lys Cys Pro Val Pro Phe Cys Leu Asn Ile Asn Asp Gly Gly 755 760 765 Gly Gly Ser Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys 770 775 780 Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Thr Gly Ser 785 790 795 800 Arg Asn Asp Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly 805 810 815 Gly Ser Gly Arg Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val 820 825 830 Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr 835 840 845 Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser 850 855 860 Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala 865 870 875 880 Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala 885 890 895 Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe 900 905 910 Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile 915 920 925 Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val 930 935 940 Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met 945 950 955 960 Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn 965 970 975 Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser 980 985 990 Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser 995 1000 1005 Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His 1010 1015 1020 Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln 1025 1030 1035 His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile 1040 1045 1050 Gln His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile 1055 1060 1065 Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys 1070 1075 1080 Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg 1085 1090 1095 Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp 1100 1105 1110 Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala 1115 1120 1125 Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln 1130 1135 1140 Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu 1145 1150 1155 Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys 1160 1165 1170 Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Asp Pro Lys Lys Lys 1175 1180 1185 Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val Gly Gly Arg Gly 1190 1195 1200 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1205 1210 1215 Pro Ala 1220 <210> 108 <211> 1220 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 108 Met Ile Asp Gly Gly Gly Gly Ser Asp Pro Lys Lys Lys Arg Lys Val 1 5 10 15 Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ser Thr Gly Ser Arg Asn Asp Gly Gly Gly Gly Ser Gly Gly Gly 35 40 45 Gly Ser Gly Gly Gly Gly Ser Gly Arg Ala Gly Ile Leu Pro Pro Lys 50 55 60 Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe 65 70 75 80 Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His 85 90 95 Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu 100 105 110 Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu 115 120 125 Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr 130 135 140 Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala 145 150 155 160 Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met 165 170 175 Tyr Gly Ser Arg Val Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp 180 185 190 Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys 195 200 205 Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys 210 215 220 Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln 225 230 235 240 Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg 245 250 255 Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu 260 265 270 Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr 275 280 285 Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys 290 295 300 Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys 305 310 315 320 Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg Thr 325 330 335 Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro 340 345 350 His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val 355 360 365 Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val 370 375 380 Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr 385 390 395 400 Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly 405 410 415 Val Asp Leu Gly Asp Pro Lys Lys Lys Arg Lys Val Asp Pro Lys Lys 420 425 430 Lys Arg Lys Val Gly Gly Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly 435 440 445 Ser Gly Gly Gly Gly Ser Gly Pro Ala Ile Phe Lys Pro Glu Glu Leu 450 455 460 Arg Gln Ala Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln Asp Pro 465 470 475 480 Glu Ser Leu Pro Phe Arg Gln Pro Val Asp Pro Gln Leu Leu Gly Ile 485 490 495 Pro Asp Tyr Phe Asp Ile Val Lys Asn Pro Met Asp Leu Ser Thr Ile 500 505 510 Lys Arg Lys Leu Asp Thr Gly Gln Tyr Gln Glu Pro Trp Gln Tyr Val 515 520 525 Asp Asp Val Trp Leu Met Phe Asn Asn Ala Trp Leu Tyr Asn Arg Lys 530 535 540 Thr Ser Arg Val Tyr Lys Phe Cys Ser Lys Leu Ala Glu Val Phe Glu 545 550 555 560 Gln Glu Ile Asp Pro Val Met Gln Ser Leu Gly Tyr Cys Cys Gly Arg 565 570 575 Lys Tyr Glu Phe Ser Pro Gln Thr Leu Cys Cys Tyr Gly Lys Gln Leu 580 585 590 Cys Thr Ile Pro Arg Asp Ala Ala Tyr Tyr Ser Tyr Gln Asn Arg Tyr 595 600 605 His Phe Cys Glu Lys Cys Phe Thr Glu Ile Gln Gly Glu Asn Val Thr 610 615 620 Leu Gly Asp Asp Pro Ser Gln Pro Gln Thr Thr Ile Ser Lys Asp Gln 625 630 635 640 Phe Glu Lys Lys Lys Asn Asp Thr Leu Asp Pro Glu Pro Phe Val Asp 645 650 655 Cys Lys Glu Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His Tyr 660 665 670 Asp Ile Ile Trp Pro Ser Gly Phe Val Cys Asp Asn Cys Leu Lys Lys 675 680 685 Thr Gly Arg Pro Arg Lys Glu Asn Lys Phe Ser Ala Lys Arg Leu Gln 690 695 700 Thr Thr Arg Leu Gly Asn His Leu Glu Asp Arg Val Asn Lys Phe Leu 705 710 715 720 Arg Arg Gln Asn His Pro Glu Ala Gly Glu Val Phe Val Arg Val Val 725 730 735 Ala Ser Ser Asp Lys Thr Val Glu Val Lys Pro Gly Met Lys Ser Arg 740 745 750 Phe Val Asp Ser Gly Glu Met Ser Glu Ser Phe Pro Tyr Arg Thr Lys 755 760 765 Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly Val Asp Val Cys Phe Phe 770 775 780 Gly Met His Val Gln Glu Tyr Gly Ser Asp Cys Pro Pro Pro Asn Thr 785 790 795 800 Arg Arg Val Tyr Ile Ser Tyr Leu Asp Ser Ile His Phe Phe Arg Pro 805 810 815 Arg Cys Leu Arg Thr Ala Val Tyr His Glu Ile Leu Ile Gly Tyr Leu 820 825 830 Glu Tyr Val Lys Lys Leu Gly Tyr Val Thr Gly His Ile Trp Ala Cys 835 840 845 Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His Cys His Pro Pro Asp 850 855 860 Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met 865 870 875 880 Leu Asp Lys Ala Phe Ala Glu Arg Ile Ile Asn Asp Tyr Lys Asp Ile 885 890 895 Phe Lys Gln Ala Asn Glu Asp Arg Leu Thr Ser Ala Lys Glu Leu Pro 900 905 910 Tyr Phe Glu Gly Asp Phe Trp Pro Asn Val Leu Glu Glu Ser Ile Lys 915 920 925 Glu Leu Glu Gln Glu Glu Glu Glu Arg Lys Lys Glu Glu Ser Thr Ala 930 935 940 Ala Ser Glu Thr Pro Glu Gly Ser Gln Gly Asp Ser Lys Asn Ala Lys 945 950 955 960 Lys Lys Asn Asn Lys Lys Thr Asn Lys Asn Lys Ser Ser Ile Ser Arg 965 970 975 Ala Asn Lys Lys Lys Pro Ser Met Pro Asn Val Ser Asn Asp Leu Ser 980 985 990 Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys Glu Val Phe Phe Val 995 1000 1005 Ile His Leu His Ala Gly Pro Val Ile Ser Thr Gln Pro Pro Ile 1010 1015 1020 Val Asp Pro Asp Pro Leu Leu Ser Cys Asp Leu Met Asp Gly Arg 1025 1030 1035 Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His Trp Glu Phe Ser 1040 1045 1050 Ser Leu Arg Arg Ser Lys Trp Ser Thr Leu Cys Met Leu Val Glu 1055 1060 1065 Leu His Thr Gln Gly Gln Asp Arg Phe Val Tyr Thr Cys Asn Glu 1070 1075 1080 Cys Lys His His Val Glu Thr Arg Trp His Cys Thr Val Cys Glu 1085 1090 1095 Asp Tyr Asp Leu Cys Ile Asn Cys Tyr Asn Thr Lys Ser His Thr 1100 1105 1110 His Lys Met Val Lys Trp Gly Leu Gly Leu Asp Asp Glu Gly Ser 1115 1120 1125 Ser Gln Gly Glu Pro Gln Ser Lys Ser Pro Gln Glu Ser Arg Arg 1130 1135 1140 Leu Ser Ile Gln Arg Cys Ile Gln Ser Leu Val His Ala Cys Gln 1145 1150 1155 Cys Arg Asn Ala Asn Cys Ser Leu Pro Ser Cys Gln Lys Met Lys 1160 1165 1170 Arg Val Val Gln His Thr Lys Gly Cys Lys Arg Lys Thr Asn Gly 1175 1180 1185 Gly Cys Pro Val Cys Lys Gln Leu Ile Ala Leu Cys Cys Tyr His 1190 1195 1200 Ala Lys His Cys Gln Glu Asn Lys Cys Pro Val Pro Phe Cys Leu 1205 1210 1215 Asn Ile 1220 <210> 109 <211> 454 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 109 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atcttttttt gttttagagc tagaaatagc aagttaaaat aaggctagtc 420 cgtagcgcgt gcgccaattc tgcagacaaa tggc 454 <210> 110 <211> 472 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 110 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atgcctgtat gtagccagat ctttttttgt tttagagcta gaaatagcaa 420 gttaaaataa ggctagtccg tagcgcgtgc gccaattctg cagacaaatg gc 472 <210> 111 <211> 510 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 111 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag attgtatgta gcctgtatgt agcctgtatg tagcctgtat gtagcctgta 420 tgtaagatct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgta 480 gcgcgtgcgc caattctgca gacaaatggc 510 <210> 112 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 112 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag attgtatgta gcctgtatgt agcctgtatg tagcctgtat gtagcctgta 420 tgtaagattg tatgtagctg tatgtagcct gtatgtagcc tgtatgtagc ctgtatgtaa 480 gattgtatgt agcctgtatg tagcctgtat gtagcctgta tgtagcctgt atgtaagatc 540 tttttttgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt agcgcgtgcg 600 ccaattctgc agacaaatgg c 621 <210> 113 <211> 734 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 113 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag attgtatgta gcctgtatgt agcctgtatg tagcctgtat gtagcctgta 420 tgtaagattg tatgtagcct gtatgtagcc tgtatgtagc ctgtatgtag cctgtatgta 480 agattgtatg tagcctgtat gtagcctgta tgtagcctgt atgtagcctg tatgtaagat 540 tgtatgtagc ctgtatgtag cctgtatgta gcctgtatgt agcctgtatg taagattgta 600 tgtagcctgt atgtagcctg tatgtagcct gtatgtagcc tgtatgtaag atcttttttt 660 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgtagcgcgt gcgccaattc 720 tgcagacaaa tggc 734 <210> 114 <211> 472 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 114 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atgccttgat atagccagat ctttttttgt tttagagcta gaaatagcaa 420 gttaaaataa ggctagtccg tagcgcgtgc gccaattctg cagacaaatg gc 472 <210> 115 <211> 477 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 115 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat aagatctttt tttgttttag agctagaaat 420 agcaagttaa aataaggcta gtccgtagcg cgtgcgccaa ttctgcagac aaatggc 477 <210> 116 <211> 510 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 116 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420 tataagatct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgta 480 gcgcgtgcgc caattctgca gacaaatggc 510 <210> 117 <211> 566 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 117 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420 tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480 agatcttttt ttgttttaga gctagaaata gcaagttaaa ataaggctag tccgtagcgc 540 gtgcgccaat tctgcagaca aatggc 566 <210> 118 <211> 622 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 118 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420 tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480 agatttgata tagccttgat atagccttga tatagccttg atatagcctt gatataagat 540 ctttttttgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg tagcgcgtgc 600 gccaattctg cagacaaatg gc 622 <210> 119 <211> 678 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 119 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420 tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480 agatttgata tagccttgat atagccttga tatagccttg atatagcctt gatataagat 540 ttgatatagc cttgatatag ccttgatata gccttgatat agccttgata taagatcttt 600 ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtagc gcgtgcgcca 660 attctgcaga caaatggc 678 <210> 120 <211> 734 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 120 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420 tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480 agatttgata tagccttgat atagccttga tatagccttg atatagcctt gatataagat 540 ttgatatagc cttgatatag ccttgatata gccttgatat agccttgata taagatttga 600 tatagccttg atatagcctt gatatagcct tgatatagcc ttgatataag atcttttttt 660 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgtagcgcgt gcgccaattc 720 tgcagacaaa tggc 734 <210> 121 <211> 979 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 121 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atttgatata gccttgatat agccttgata tagccttgat atagccttga 420 tataagattt gatatagcct tgatatagcc ttgatatagc cttgatatag ccttgatata 480 agatttgata taccttgata tagccttgat atagccttga tatagccttg atataagatt 540 tgatatagcc ttgatatagc cttgatatag ccttgatata gccttgatat agccttgata 600 tagccttgat ataagatttg atatagcctt gatatagcct tgatatagcc ttgatatagc 660 cttgatataa gatttgatat agccttgata tagccttgat atagccttga tatagccttg 720 atataagatt tgatatagcc ttgatatagc cttgatatag ccttgatata gccttgatat 780 aagatttgat atagccttga tatagccttg atatagcctt gatatagcct tgatataaga 840 tttgatatag ccttgatata gccttgatat agccttgata tagccttgat ataagatctt 900 tttttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgtag cgcgtgcgcc 960 aattctgcag acaaatggc 979 <210> 122 <211> 490 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 122 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atgccttgat atagccagat gccttgatat agccagatct ttttttgttt 420 tagagctaga aatagcaagt taaaataagg ctagtccgta gcgcgtgcgc caattctgca 480 gacaaatggc 490 <210> 123 <211> 562 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 123 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 420 ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 480 ctttttttgt tttagagcta gaaatagcaa gttaaaataa ggctagtccg tagcgcgtgc 540 gccaattctg cagacaaatg gc 562 <210> 124 <211> 724 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 124 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 420 ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 480 gccttgatat agccagatgc cttgatatag ccagatgcct tgatatagcc agatgccttg 540 atatagccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 600 ccagatgcct tgatatagcc agatgccttg atatagccag atcttttttt gttttagagc 660 tagaaatagc aagttaaaat aaggctagtc cgtagcgcgt gcgccaattc tgcagacaaa 720 tggc 724 <210> 125 <211> 813 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 125 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 420 ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 480 gccttgatat agccagatgc cttgatatag ccagatgcct tgatatagcc agatgccttg 540 atatagccag atgccttgat atagccagat gccttgatat agccagatgc cttgatatag 600 ccagatgcct tgatatagcc agatgccttg atatagccag atgccttgat atagccagat 660 gccttgatat agccagatgc cttgatatag ccagatcctt gatatagcca gatgccttga 720 tatagccaga tctttttttg ttttagagct agaaatagca agttaaaata aggctagtcc 780 gtagcgcgtg cgccaattct gcagacaaat ggc 813 <210> 126 <211> 515 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (330)..(349) <223> a, c, t, g, unknown or other <400> 126 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccg caattgggtc tccagattgt atgtagcctg tatgtagcct gtatgtagcc 300 tgtatgtagc ctgtatgtaa gatctcaccn nnnnnnnnnn nnnnnnnnng tttaagagct 360 atgctggaaa cagcatagca agtttaaata aggctagtcc gttatcaact tgaaaaagtg 420 gcaccgagtc ggtgcttttt tgttttagag ctagaaatag caagttaaaa taaggctagt 480 ccgtagcgcg tgcgccaatt ctgcagacaa atggc 515 <210> 127 <211> 510 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 127 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag attgtatgta gtctattgat atagtcttgt ctatgtatgt agtctattga 420 tataagatct ttttttgttt tagagctaga aatagcaagt taaaataagg ctagtccgta 480 gcgcgtgcgc caattctgca gacaaatggc 510 <210> 128 <211> 678 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 128 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag attgtatgta gtctattgat atagtcttgt ctatgtatgt agtctattga 420 tataagattg tatgtagtct attgatatag tcttgtctat gtatgtagtc tattgatata 480 agattgtatg tagtctattg atatagtctt gtctatgtat gtagtctatt gatataagat 540 tgtatgtagt ctattgatat agtcttgtct atgtatgtag tctattgata taagatcttt 600 ttttgtttta gagctagaaa tagcaagtta aaataaggct agtccgtagc gcgtgcgcca 660 attctgcaga caaatggc 678 <210> 129 <211> 566 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (250)..(269) <223> a, c, t, g, unknown or other <400> 129 gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60 ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120 aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180 atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240 cgaaacaccn nnnnnnnnnn nnnnnnnnng tttaagagct atgctggaaa cagcatagca 300 agtttaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgccaatt 360 gggtctccag attgtatgta gtctattgat atagtcttgt ctatgtatgt agtctattga 420 tataagattg tatgtagtct attgatatag tcttgtctat gtatgtagtc tattgatata 480 agatcttttt ttgttttaga gctagaaata gcaagttaaa ataaggctag tccgtagcgc 540 gtgcgccaat tctgcagaca aatggc 566 <210> 130 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 130 gttctcttgc tgaaagctcg a 21 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 131 gcttttctct atcactgata 20 <210> 132 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 132 gcatacttct gcctgctggg gagcctg 27 <210> 133 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 133 gaaagtcccc aggctcccca gc 22 <210> 134 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 134 gcatctcaat tagtcagcaa cc 22 <210> 135 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 135 gttagggtta gggttagggt ta 22 <210> 136 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 136 gttgaggcct tcgttggaaa c 21 <210> 137 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 137 gaagagtgga ggccgtgcgc gg 22 <210> 138 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 138 gcaagcaagg gaagcgacaa gg 22 <210> 139 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 139 gatgtttcag gactaggctg a 21 <210> 140 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 140 gagctgggcc aggagaggag a 21 <210> 141 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 141 gaggggtctg tggagagttt 20 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 142 ggcttggtgt attcagaatg 20 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 143 gtagagatgc cgccccgccc 20 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 144 ggccccgccc cctggatggg 20 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 145 ggggggagaa actgaggcga 20 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 146 ggtggtggca atggtgtctg 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 147 gacacaactg gcgcccctcc 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 148 ggcccctact tccccttcaa 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 149 gagtgataag acacccgctt 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 150 gcctgggagg gactggggga 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 151 ggacaatccc ggtccccaga 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 152 ggtctgccgg aaggtctaca 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 153 ggcaggtaga ttatggggcc 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 154 gaagacggcc tctcagagga 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 155 gtatttctgg cctgggcaag 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 156 gcatgtgacg ggggctgtca 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 157 gctgccgggt tttgcatgaa 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 158 gccggccgcg cgggggaggc 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 159 ggcaggcgag gagggggagg 20 <210> 160 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 160 gcatacttct gcctgctggg gagcctg 27 <210> 161 <211> 1399 <212> PRT <213> Streptococcus pyogenes <400> 161 Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg 1 5 10 15 Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 20 25 30 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 35 40 45 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 50 55 60 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 65 70 75 80 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 85 90 95 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 100 105 110 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 115 120 125 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 130 135 140 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 145 150 155 160 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 165 170 175 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 180 185 190 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 195 200 205 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 210 215 220 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 225 230 235 240 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 245 250 255 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 260 265 270 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 275 280 285 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 290 295 300 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 305 310 315 320 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 325 330 335 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 340 345 350 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 355 360 365 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 370 375 380 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 385 390 395 400 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 405 410 415 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 420 425 430 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 435 440 445 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 450 455 460 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 465 470 475 480 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 485 490 495 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 500 505 510 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 515 520 525 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 530 535 540 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 545 550 555 560 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 565 570 575 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 580 585 590 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 595 600 605 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 610 615 620 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 625 630 635 640 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu 645 650 655 Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys 660 665 670 Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn 675 680 685 Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys 690 695 700 Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp 705 710 715 720 Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln 725 730 735 Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 740 745 750 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val 755 760 765 Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 770 775 780 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg 785 790 795 800 Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu 805 810 815 Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr 820 825 830 Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu 835 840 845 Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln 850 855 860 Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 865 870 875 880 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val 885 890 895 Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile 900 905 910 Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu 915 920 925 Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr 930 935 940 Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn 945 950 955 960 Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile 965 970 975 Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 980 985 990 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr 995 1000 1005 Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys 1010 1015 1020 Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val 1025 1030 1035 Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr 1040 1045 1050 Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr 1055 1060 1065 Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile 1070 1075 1080 Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg 1085 1090 1095 Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn 1100 1105 1110 Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu 1115 1120 1125 Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys 1130 1135 1140 Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr 1145 1150 1155 Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys 1160 1165 1170 Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1175 1180 1185 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu 1205 1210 1215 Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met 1220 1225 1230 Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu 1235 1240 1245 Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu 1250 1255 1260 Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe 1265 1270 1275 Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile 1280 1285 1290 Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp 1295 1300 1305 Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg 1310 1315 1320 Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu 1325 1330 1335 Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg 1340 1345 1350 Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile 1355 1360 1365 His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser 1370 1375 1380 Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala 1385 1390 1395 Ser <210> 162 <211> 1399 <212> PRT <213> Streptococcus pyogenes <400> 162 Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg 1 5 10 15 Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly 20 25 30 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 35 40 45 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 50 55 60 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 65 70 75 80 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 85 90 95 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 100 105 110 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 115 120 125 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 130 135 140 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 145 150 155 160 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 165 170 175 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 180 185 190 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 195 200 205 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 210 215 220 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 225 230 235 240 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 245 250 255 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 260 265 270 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 275 280 285 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 290 295 300 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 305 310 315 320 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 325 330 335 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 340 345 350 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 355 360 365 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 370 375 380 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 385 390 395 400 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 405 410 415 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 420 425 430 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 435 440 445 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 450 455 460 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 465 470 475 480 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 485 490 495 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 500 505 510 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 515 520 525 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 530 535 540 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 545 550 555 560 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 565 570 575 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 580 585 590 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 595 600 605 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 610 615 620 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 625 630 635 640 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu 645 650 655 Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys 660 665 670 Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn 675 680 685 Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys 690 695 700 Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp 705 710 715 720 Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln 725 730 735 Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 740 745 750 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val 755 760 765 Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 770 775 780 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg 785 790 795 800 Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu 805 810 815 Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr 820 825 830 Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu 835 840 845 Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln 850 855 860 Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 865 870 875 880 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val 885 890 895 Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile 900 905 910 Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu 915 920 925 Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr 930 935 940 Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn 945 950 955 960 Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile 965 970 975 Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 980 985 990 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr 995 1000 1005 Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys 1010 1015 1020 Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val 1025 1030 1035 Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr 1040 1045 1050 Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr 1055 1060 1065 Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile 1070 1075 1080 Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg 1085 1090 1095 Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn 1100 1105 1110 Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu 1115 1120 1125 Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys 1130 1135 1140 Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr 1145 1150 1155 Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys 1160 1165 1170 Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1175 1180 1185 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu 1205 1210 1215 Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met 1220 1225 1230 Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu 1235 1240 1245 Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu 1250 1255 1260 Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe 1265 1270 1275 Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile 1280 1285 1290 Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp 1295 1300 1305 Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg 1310 1315 1320 Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu 1325 1330 1335 Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg 1340 1345 1350 Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile 1355 1360 1365 His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser 1370 1375 1380 Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala 1385 1390 1395 Ser <210> 163 <211> 1399 <212> PRT <213> Streptococcus pyogenes <400> 163 Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg 1 5 10 15 Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly 20 25 30 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 35 40 45 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 50 55 60 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 65 70 75 80 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 85 90 95 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 100 105 110 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 115 120 125 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 130 135 140 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 145 150 155 160 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 165 170 175 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 180 185 190 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 195 200 205 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 210 215 220 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 225 230 235 240 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 245 250 255 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 260 265 270 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 275 280 285 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 290 295 300 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 305 310 315 320 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 325 330 335 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 340 345 350 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 355 360 365 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 370 375 380 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 385 390 395 400 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 405 410 415 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 420 425 430 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 435 440 445 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 450 455 460 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 465 470 475 480 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 485 490 495 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 500 505 510 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 515 520 525 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 530 535 540 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 545 550 555 560 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 565 570 575 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 580 585 590 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 595 600 605 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 610 615 620 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 625 630 635 640 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu 645 650 655 Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys 660 665 670 Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn 675 680 685 Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys 690 695 700 Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp 705 710 715 720 Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln 725 730 735 Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 740 745 750 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val 755 760 765 Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 770 775 780 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg 785 790 795 800 Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu 805 810 815 Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr 820 825 830 Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu 835 840 845 Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln 850 855 860 Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 865 870 875 880 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val 885 890 895 Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile 900 905 910 Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu 915 920 925 Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr 930 935 940 Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn 945 950 955 960 Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile 965 970 975 Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 980 985 990 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr 995 1000 1005 Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys 1010 1015 1020 Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val 1025 1030 1035 Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr 1040 1045 1050 Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr 1055 1060 1065 Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile 1070 1075 1080 Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg 1085 1090 1095 Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn 1100 1105 1110 Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu 1115 1120 1125 Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys 1130 1135 1140 Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr 1145 1150 1155 Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys 1160 1165 1170 Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1175 1180 1185 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu 1205 1210 1215 Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met 1220 1225 1230 Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu 1235 1240 1245 Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu 1250 1255 1260 Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe 1265 1270 1275 Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile 1280 1285 1290 Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp 1295 1300 1305 Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg 1310 1315 1320 Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu 1325 1330 1335 Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg 1340 1345 1350 Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile 1355 1360 1365 His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser 1370 1375 1380 Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala 1385 1390 1395 Ser <210> 164 <211> 1399 <212> PRT <213> Streptococcus pyogenes <400> 164 Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Pro Lys Lys Lys Arg 1 5 10 15 Lys Val Glu Ala Ser Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly 20 25 30 Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro 35 40 45 Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys 50 55 60 Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu 65 70 75 80 Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys 85 90 95 Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys 100 105 110 Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu 115 120 125 Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp 130 135 140 Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys 145 150 155 160 Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu 165 170 175 Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly 180 185 190 Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu 195 200 205 Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser 210 215 220 Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg 225 230 235 240 Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly 245 250 255 Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe 260 265 270 Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys 275 280 285 Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp 290 295 300 Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile 305 310 315 320 Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro 325 330 335 Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu 340 345 350 Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys 355 360 365 Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp 370 375 380 Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu 385 390 395 400 Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu 405 410 415 Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His 420 425 430 Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp 435 440 445 Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu 450 455 460 Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser 465 470 475 480 Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp 485 490 495 Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile 500 505 510 Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu 515 520 525 Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu 530 535 540 Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu 545 550 555 560 Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn 565 570 575 Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile 580 585 590 Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn 595 600 605 Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys 610 615 620 Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val 625 630 635 640 Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu 645 650 655 Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys 660 665 670 Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn 675 680 685 Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys 690 695 700 Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp 705 710 715 720 Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln 725 730 735 Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala 740 745 750 Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val 755 760 765 Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala 770 775 780 Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg 785 790 795 800 Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu 805 810 815 Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr 820 825 830 Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu 835 840 845 Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln 850 855 860 Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser 865 870 875 880 Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val 885 890 895 Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile 900 905 910 Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu 915 920 925 Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr 930 935 940 Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn 945 950 955 960 Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile 965 970 975 Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe 980 985 990 Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr 995 1000 1005 Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys 1010 1015 1020 Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val 1025 1030 1035 Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr 1040 1045 1050 Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr 1055 1060 1065 Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile 1070 1075 1080 Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg 1085 1090 1095 Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn 1100 1105 1110 Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu 1115 1120 1125 Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys 1130 1135 1140 Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr 1145 1150 1155 Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys 1160 1165 1170 Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1175 1180 1185 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu 1190 1195 1200 Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu 1205 1210 1215 Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met 1220 1225 1230 Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu 1235 1240 1245 Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu 1250 1255 1260 Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe 1265 1270 1275 Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile 1280 1285 1290 Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp 1295 1300 1305 Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg 1310 1315 1320 Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu 1325 1330 1335 Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg 1340 1345 1350 Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile 1355 1360 1365 His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser 1370 1375 1380 Gln Leu Gly Gly Asp Ser Pro Lys Lys Lys Arg Lys Val Glu Ala 1385 1390 1395 Ser <210> 165 <211> 641 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 165 Met Val Arg Gly Ser His His His His His His Gly Met Ala Ser Met 1 5 10 15 Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys 20 25 30 Asp Pro Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg 35 40 45 Met Lys Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys 50 55 60 Thr Gly Glu Gly Glu Gly Asn Pro Tyr Met Gly Thr Gln Thr Met Arg 65 70 75 80 Ile Lys Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu 85 90 95 Ala Thr Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys 100 105 110 Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp 115 120 125 Glu Arg Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln 130 135 140 Asp Thr Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg 145 150 155 160 Gly Val Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys 165 170 175 Gly Trp Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu 180 185 190 Arg Gly Tyr Thr His Met Ala Leu Lys Val Asp Gly Gly Gly His Leu 195 200 205 Ser Cys Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn 210 215 220 Ile Lys Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu 225 230 235 240 Glu Glu Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val 245 250 255 Ala Lys Phe Ala Gly Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys Gly 260 265 270 Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg 275 280 285 Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn 290 295 300 Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu 305 310 315 320 Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu 325 330 335 Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln 340 345 350 Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln 355 360 365 Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu 370 375 380 Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser 385 390 395 400 Arg Val Ile Glu Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn 405 410 415 Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp 420 425 430 Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro 435 440 445 Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala 450 455 460 Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu 465 470 475 480 His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln 485 490 495 His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln 500 505 510 His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala 515 520 525 Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser 530 535 540 Asn Val Val Glu Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala 545 550 555 560 Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala 565 570 575 Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys 580 585 590 Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys 595 600 605 Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His 610 615 620 Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu 625 630 635 640 Gly <210> 166 <211> 641 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 166 Met Val Arg Gly Ser His His His His His His Gly Met Ala Ser Met 1 5 10 15 Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp Asp Lys 20 25 30 Asp Pro Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg 35 40 45 Met Lys Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys 50 55 60 Thr Gly Glu Gly Glu Gly Asn Pro Tyr Met Gly Thr Gln Thr Met Arg 65 70 75 80 Ile Lys Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu 85 90 95 Ala Thr Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys 100 105 110 Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp 115 120 125 Glu Arg Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln 130 135 140 Asp Thr Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg 145 150 155 160 Gly Val Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys 165 170 175 Gly Trp Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu 180 185 190 Arg Gly Tyr Thr His Met Ala Leu Lys Val Asp Gly Gly Gly His Leu 195 200 205 Ser Cys Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn 210 215 220 Ile Lys Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu 225 230 235 240 Glu Glu Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val 245 250 255 Ala Lys Phe Ala Gly Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys Gly 260 265 270 Gly Gly Gly Ser Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg 275 280 285 Lys Val Ser Arg Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn 290 295 300 Arg Tyr Pro Asn Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu 305 310 315 320 Phe Ser Gln Asp Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu 325 330 335 Arg Ala Thr Pro Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln 340 345 350 Ala Ala Tyr Gln Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln 355 360 365 Lys Phe Phe Glu Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu 370 375 380 Arg Ile Arg Gly His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys 385 390 395 400 Arg Val Ile Gln Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn 405 410 415 Glu Met Val Arg Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp 420 425 430 Gln Asn Gly Asn His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro 435 440 445 Gln Ser Leu Gln Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala 450 455 460 Leu Ser Thr His Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu 465 470 475 480 His Cys Leu Pro Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln 485 490 495 His Thr Glu Gln Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu 500 505 510 His Val Leu Glu His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala 515 520 525 Glu Ile Arg Gly Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn 530 535 540 Asn Val Val Gln Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala 545 550 555 560 Val Leu Ile Asp Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala 565 570 575 Leu Tyr Thr Met Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys 580 585 590 Met Ile Asp Val Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys 595 600 605 Ile Arg Pro His Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His 610 615 620 Ile Leu Ala Lys Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu 625 630 635 640 Gly <210> 167 <211> 621 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 167 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser 225 230 235 240 Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser 245 250 255 Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg 260 265 270 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 275 280 285 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 290 295 300 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 305 310 315 320 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 325 330 335 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 340 345 350 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 355 360 365 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu 370 375 380 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 385 390 395 400 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 405 410 415 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 420 425 430 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 435 440 445 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 450 455 460 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 465 470 475 480 Leu Val Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu 485 490 495 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 500 505 510 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu 515 520 525 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 530 535 540 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 545 550 555 560 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 565 570 575 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 580 585 590 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 595 600 605 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 610 615 620 <210> 168 <211> 621 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 168 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Phe Gly Tyr Gly Val Ala Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser His Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Ser 225 230 235 240 Arg Gly Pro Tyr Ser Ile Val Ser Pro Lys Cys Gly Gly Gly Gly Ser 245 250 255 Gly Pro Ala Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg 260 265 270 Gly Arg Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn 275 280 285 Leu Gln Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp 290 295 300 Gln His Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro 305 310 315 320 Ala Glu Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln 325 330 335 Leu Met Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu 340 345 350 Phe Gly Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly 355 360 365 His Val Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln 370 375 380 Lys Ala Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg 385 390 395 400 Glu Leu Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn 405 410 415 His Val Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln 420 425 430 Phe Ile Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His 435 440 445 Pro Tyr Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro 450 455 460 Asp Gln Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln 465 470 475 480 Leu Val Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu 485 490 495 His Gly Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly 500 505 510 Asn Val Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln 515 520 525 Lys Cys Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp 530 535 540 Glu Val Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met 545 550 555 560 Met Lys Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val 565 570 575 Ala Glu Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His 580 585 590 Ile Ala Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys 595 600 605 Leu Glu Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly 610 615 620 <210> 169 <211> 424 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 169 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Ser Arg Val Ile Glu Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser 355 360 365 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 370 375 380 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 385 390 395 400 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 405 410 415 Asp Leu Asp Met Leu Tyr Ile Asp 420 <210> 170 <211> 424 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 170 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Ser 355 360 365 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 370 375 380 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 385 390 395 400 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 405 410 415 Asp Leu Asp Met Leu Tyr Ile Asp 420 <210> 171 <211> 709 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 171 Met Gly Ile Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg 1 5 10 15 Ser Arg Leu Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln 20 25 30 Leu Arg Glu Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His 35 40 45 Gly Ser Arg Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu 50 55 60 Arg Gln Leu Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met 65 70 75 80 Val Asp Val Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly 85 90 95 Ser Leu Glu Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val 100 105 110 Leu Ser Leu Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala 115 120 125 Leu Glu Phe Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu 130 135 140 Asp Gly His Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val 145 150 155 160 Val Gln Lys Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile 165 170 175 Ile Asp Ala Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr 180 185 190 Gly Cys Arg Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln 195 200 205 Thr Leu Pro Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val 210 215 220 Gln Asp Gln Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly 225 230 235 240 Arg Pro Glu Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val 245 250 255 Leu Val Leu Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys 260 265 270 Val Thr His Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val 275 280 285 Cys Thr Met Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys 290 295 300 Asp Gln Tyr Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu 305 310 315 320 Pro Gly Gln Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala 325 330 335 Thr Leu Arg Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu 340 345 350 Lys Tyr Tyr Met Lys Asn Gly Val Asp Leu Gly Gly Pro Ala Gly Gly 355 360 365 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Pro Lys 370 375 380 Lys Lys Arg Lys Val Ala Ala Ala Gly Ser Pro Ser Gly Gln Ile Ser 385 390 395 400 Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala Pro Val Leu Ala Gln 405 410 415 Thr Met Val Pro Ser Ser Ala Met Val Pro Leu Ala Gln Pro Pro Ala 420 425 430 Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln Ser Leu Ser Ala Pro 435 440 445 Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 450 455 460 Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu Gly Ala Leu Leu Gly 465 470 475 480 Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu Ala Ser Val Asp Asn 485 490 495 Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val Ser Met Ser His Ser 500 505 510 Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu 515 520 525 Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala Pro Thr Pro Leu Gly 530 535 540 Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp Glu Asp Phe Ser Ser 545 550 555 560 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Ser 565 570 575 Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val Asp Thr Ser Ala Leu 580 585 590 Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro Asp Met Ser Leu Pro 595 600 605 Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu Leu Leu Ser Pro Gln 610 615 620 Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser Ser Pro Asp Ser Gly 625 630 635 640 Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu Phe Leu Leu Asp Pro 645 650 655 Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro Val Leu Phe Glu Leu 660 665 670 Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly Phe Ala Glu Asp Pro 675 680 685 Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro Lys Ala Lys Asp Pro 690 695 700 Thr Val Ser Ile Asp 705 <210> 172 <211> 456 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 172 Met Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Met Asp Ala 1 5 10 15 Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val 20 25 30 Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln 35 40 45 Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val 50 55 60 Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu 65 70 75 80 Lys Gly Glu Glu Pro Trp Leu Val Ser Arg Gly Ser Ile Val Gly Ile 85 90 95 Leu Pro Pro Lys Lys Lys Arg Lys Val Ser Arg Gly Arg Ser Arg Leu 100 105 110 Leu Glu Asp Phe Arg Asn Asn Arg Tyr Pro Asn Leu Gln Leu Arg Glu 115 120 125 Ile Ala Gly His Ile Met Glu Phe Ser Gln Asp Gln His Gly Ser Arg 130 135 140 Phe Ile Gln Leu Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Leu 145 150 155 160 Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Val Asp Val 165 170 175 Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Glu 180 185 190 Gln Lys Leu Ala Leu Ala Glu Arg Ile Arg Gly His Val Leu Ser Leu 195 200 205 Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Phe 210 215 220 Ile Pro Ser Asp Gln Gln Asn Glu Met Val Arg Glu Leu Asp Gly His 225 230 235 240 Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys 245 250 255 Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala 260 265 270 Phe Lys Gly Gln Val Phe Ala Leu Ser Thr His Pro Tyr Gly Cys Arg 275 280 285 Val Ile Gln Arg Ile Leu Glu His Cys Leu Pro Asp Gln Thr Leu Pro 290 295 300 Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln 305 310 315 320 Tyr Gly Ser Tyr Val Ile Glu His Val Leu Glu His Gly Arg Pro Glu 325 330 335 Asp Lys Ser Lys Ile Val Ala Glu Ile Arg Gly Asn Val Leu Val Leu 340 345 350 Ser Gln His Lys Phe Ala Asn Asn Val Val Gln Lys Cys Val Thr His 355 360 365 Ala Ser Arg Thr Glu Arg Ala Val Leu Ile Asp Glu Val Cys Thr Met 370 375 380 Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr 385 390 395 400 Ala Asn Tyr Val Val Gln Lys Met Ile Asp Val Ala Glu Pro Gly Gln 405 410 415 Arg Lys Ile Val Met His Lys Ile Arg Pro His Ile Ala Thr Leu Arg 420 425 430 Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr 435 440 445 Met Lys Asn Gly Val Asp Leu Gly 450 455 <210> 173 <211> 10 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 173 gccagatgcc 10

Claims

폴리뉴클레오티드에 있어서,
(1) 타겟 폴리뉴클레오티드 서열에 상보적인 DNA-타겟팅 서열;
(2) Cas9-결합 서열; 및
(3) PUF 영역-결합 서열(PBS)의 하나 또는 그 이상의 카피로서, 상기 PBS의 하나 또는 그 이상의 카피는 각각 같거나 다른 PUF 영역에 결합하는 것
을 포함하고,
Cas9 단백질은 상기 Cas9-결합 서열에 결합함으로써 상기 폴리뉴클레오티드와 복합체를 형성할 수 있는 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 Cas9 단백질은 상기 폴리뉴클레오티드와 복합체를 형성하면 DNA-결합능을 보유하는 뉴클레아제-결핍 dCas9 단백질인 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 Cas9 단백질이 상기 폴리뉴클레오티드와 복합체를 형성할 경우 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 염기 쌍을 이루는 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 전사 조절 요소를 포함하거나 이에 인접한 것인, 폴리뉴클레오티드.
제4항에 있어서, 상기 전사 조절 요소는 코어 프로모터, 근거리 프로모터 요소, 인핸서, 사일렌서, 인슐레이터 및 좌위 조절 부위 중에서 하나 또는 그 이상을 포함하는 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 텔로미어 서열, 동원체 또는 반복성 게놈 서열을 포함하거나 이에 인접한 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 게놈 마커 서열(또는 관심 게놈 좌위)을 포함하거나 이에 인접한 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 타겟 폴리뉴클레오티드 서열은 상기 상보적 가닥인 5' -CCN-3'(여기서 N은 임의의 DNA 뉴클레오티드)의 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)의 바로 옆 3'인 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 DNA-타겟팅 서열은 상기 타겟 폴리뉴클레오티드 서열과 12-22 뉴클레오티드(nucleotides, nts), 14-20 뉴클레오티드, 16-20 뉴클레오티드, 18-20 뉴클레오티드, 또는 12, 14, 16, 18, 또는 20 뉴클레오티드에 걸쳐 상보적인 것인, 폴리뉴클레오티드.
제9항에 있어서, 상기 DNA-타겟팅 서열은 타겟 폴리뉴클레오티드 서열에 50, 60, 70, 80, 90 또는 95-100% 상보적인 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 DNA-타겟팅 서열은 5’말단 뉴클레오티드 G를 갖는 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 DNA-타겟팅 서열을 상기 Cas9-결합 서열에 연결하는 링커 서열을 추가로 포함하는, 폴리뉴클레오티드.
제1항에 있어서, 상기 Cas9-결합 서열은 머리핀 구조를 형성하는 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 Cas9-결합 서열은 37-47 뉴클레오티드 또는 42 뉴클레오티드인 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 Cas9 단백질은 야생형 Cas9의 하나 또는 둘 모두의 엔도뉴클레아제 촉매 부위(RuvC 및 HNH)에서의 포인트 돌연변이(point mutation)로 인해 엔도뉴클레아제 활성이 결여된 Cas9 틈내기 효소 또는 dCas9 단백질인 것인, 폴리뉴클레오티드.
제15항에 있어서, 상기 포인트 돌연변이는 D10A 및 H840A인 것인, 폴리뉴클레오티드.
제1항에 있어서, 상기 PBS의 상기 하나 또는 그 이상의 카피는 각각 8 뉴클레오티드인 것인, 폴리뉴클레오티드.
제1항에 있어서, 같거나 다른 PBS의 10, 15, 20, 25, 30, 35, 40, 45, 46, 47, 48, 49 또는 50 카피, 또는 6-50, 6-45, 6-40, 6-35, 6-10, 10-20 카피를 포함하는, 폴리뉴클레오티드.
제1항에 있어서, 상기 PUF 영역 PUF(3-2)에 의해 결합될 수 있는 5'-UGUAUGUA-3' 서열의 PBS를 포함하는, 폴리뉴클레오티드.
제1항에 있어서, 상기 PUF 영역 PUF(6-2/7-2)에 의해 결합될 수 있는 5'-UUGAUAUA-3' 서열의 PBS를 포함하는, 폴리뉴클레오티드.
제1항의 폴리뉴클레오티드를 코딩하는 벡터.
제21항에 있어서, 상기 폴리뉴클레오티드의 전사는 항시성 프로모터(constitutive promoter) 또는 유도성 프로모터(inducible promoter)의 조절 하에 있는 것인, 벡터.
제20항에 있어서, 상기 벡터는 포유류; 새, 어류, 곤충, 벌레, 효모 또는 박테리아의 세포에서 활성이 있는 것인, 벡터.
제21항에 있어서, 상기 벡터는 복수로 제공되고, 상기 벡터들 중 2 개의 벡터는 코딩된 폴리뉴클레오티드에서 이들 각각의 DNA-타겟팅 서열, Cas9-결합 서열 및/또는 상기 PBS의 카피 수, 동일성 또는 상대적 순서가 다른 것인, 벡터.
제1항의 폴리뉴클레오티드 및 Cas9 단백질을 포함하는 복합체.
제25항에 있어서, 상기 하나 또는 그 이상의 PBS에 결합된 하나 또는 그 이상의 PUF 영역을 추가로 포함하는, 복합체.
제26항에 있어서, 상기 PUF 영역의 각각은 이펙터 영역에 융합되어 있는 것인, 복합체.
제27항에 있어서, 상기 이펙터 영역은 독립적으로 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것인, 복합체.
제27항에 있어서, 최소한 두 개 이상의 상기 PUF 영역이 다른 이펙터 영역에 융합된 것인, 복합체.
제25항에 있어서, 상기 Cas9 단백질, 상기 PUF 영역 및/또는 상기 이펙터 영역은 핵 위치화 서열(nuclear localization sequence, NLS)을 추가로 포함하는 것인, 복합체.
제25항에 있어서, 상기 DNA-타겟팅 서열을 통하여 상기 타겟 폴리뉴클레오티드 서열에 결합된, 복합체.
제21항의 벡터를 포함하는 숙주 세포.
제32항에 있어서, 상기 Cas9 단백질을 코딩하는 제2 벡터를 추가로 포함하는, 숙주 세포.
제33항에 있어서, 상기 제2 벡터는 상기 Cas9 단백질에 융합된 이펙터 영역을 추가로 코딩하는 것인, 숙주 세포.
제33항에 있어서, 상기 Cas9 단백질의 발현은 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있는 것인, 숙주 세포.
제32항에 있어서, 각각 이펙터 영역에 융합된 상기 하나 또는 그 이상의 PUF 영역을 코딩하는 제3 벡터를 추가로 포함하는 것인, 숙주 세포.
제36항에 있어서, 상기 하나 또는 그 이상의 PUF 영역의 발현은 독립적으로 항시성 프로모터 또는 유도성 프로모터의 조절 하에 있는 것인, 숙주 세포.
제34항 내지 제37항 중 어느 한 항에 있어서, 상기 이펙터 영역은 전사 억제 인자, 전사 활성 인자, 형광 단백질, 효소 또는 크로마틴 리모델링 단백질(HDAC/HAT)인 것인, 숙주 세포.
제33항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 벡터는 상기 Cas9 단백질 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하거나, 및/또는 상기 제3 벡터가 상기 PUF 영역 또는 상기 이펙터 영역에 융합된 핵 위치화 신호를 추가로 코딩하는 것인, 숙주 세포.
제33항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 벡터는 상기 벡터와 동일하거나, 및/또는 상기 제3 벡터는 상기 벡터 또는 상기 제2 벡터와 동일한 것인, 숙주 세포.
제32항 내지 제37항 중 어느 한 항에 있어서, 살아 있는 동물에 있는, 숙주 세포.
제32항 내지 제37항 중 어느 한 항에 있어서, 배양된 세포인, 숙주 세포.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
(1) 제1항 내지 제20항 중 어느 한 항의 폴리뉴클레오티드 또는 제21항 내지 제23항 중 어느 한 항의 벡터;
(2) 상기 Cas9 단백질을 코딩하는 제2 벡터; 및
(3) 각각 이펙터 영역에 융합된 하나 또는 그 이상의 PUF 영역을 코딩하는 제3 벡터
를 포함하는, 키트.
제50항에 있어서, 상기 벡터들의 세포 도입을 용이하게 하기 위하여 형질전환, 형질감염, 또는 감염 시약들을 추가로 포함하는, 키트.