KR20060123382A

KR20060123382A - 징크 핑거 단백질을 이용한 원핵세포의 유전자 발현 조절

Info

Publication number: KR20060123382A
Application number: KR1020067012594A
Authority: KR
Inventors: 김진수; 박경순; 장영순
Original assignee: 주식회사 툴젠
Priority date: 2003-12-23
Filing date: 2004-12-23
Publication date: 2006-12-01
Also published as: WO2005061705A1; US20070042378A1

Abstract

키메릭 징크 핑거 단백질들, 및 원핵세포에서 유전자 발현을 조절하기 위해 징크 핑거 단백질들을 사용하는 방법들이 본 명세서에서 기술된다.

Description

징크 핑거 단백질을 이용한 원핵세포의 유전자 발현 조절 {REGULATION OF PROKARYOTIC GENE EXPRESSION WITH ZINC FINGER PROTEINS}

대부분의 유전자들은, 보통 프로모터(promoter) 또는 인핸서(enhancer) 영역 내에 있는 유전자 내 특정 DNA 부위에 결합하는 폴리펩타이드 전사 인자에 의해 전사 수준에서 조절된다. 상기 전사 인자들은 프로모터에서 RNA 폴리머레이즈에 의한 전사 개시를 활성화 또는 억제함으로써 표적 유전자의 발현을 조절한다. 활성화 인자(activator)든 억제 인자(repressor)든 많은 전사 인자들은 예컨대, DNA 결합, 이량체화(dimerization) 또는 전사 기구(transcriptional machinery)와의 상호작용과 같은 특정 기능을 갖는 구조적으로 독특한 도메인을 포함한다. 전사 인자 자체의 DNA 결합 부분은 DNA에 접촉하는 별도의 구조 도메인으로 구성될 수 있다. 징크 핑거 도메인(zinc finger domain), 호메오도메인(homeodomain) 및 헬릭스-턴-헬릭스(helix-turn-helix) 도메인을 포함하는 많은 DNA-결합 도메인의 3차 구조가 NMR 및 X-선 결정 데이터를 통해 밝혀져 왔다. 활성화 도메인, 억제 도메인과 같은 효과기 도메인들은 이종 전사 인자의 DNA 결합 도메인에 접합(transfer)되어야 그 기능을 유지한다(문헌 [Brent 및 Ptashne, Cell 43:729-36 (1985)] 및 [Dawson 등, Mol. Cell Biol. 15:6923-31 (1995)] 참조).

징크 핑거 도메인의 키메라인 인공 전사 인자를 제조할 수 있는데, 예를 들어 국제특허공개 제 WO 01/60970 호(Kim 등)에서는, 징크 핑거 도메인의 특이성을 결정하는 방법과 특정 표적 부위를 인식하는 인공 전사 인자를 제조하는 방법이 기재되어 있다.

박테리아에서는 유전자들이 오페론(operon)이라는 군을 이루는데, 이는 아미노산 생합성과 같은 조절기능을 수행하는데 필요한 단백질들을 코딩하는 유전자 집단이다. 원핵생물의 오페론으로부터 전사된 RNA는 다시스트론성(polycistronic)으로서, 하나의 전사체(transcript)에 다수의 단백질들이 코딩되어 있다. 박테리아에서 유전자 발현은 전사 개시 단계에서 조절될 수 있는데, 이는 RNA 폴리머레이즈가 인식하고 접촉하는 전사 개시 지점 부위 상류의 DNA 서열 요소에 의해 조절된다. RNA 폴리머레이즈는 다시 긍정적인 작용(활성화 인자) 및 부정적인 작용(억제 인자)을 모두 나타낼 수 있는 부속 단백질(accessory protein)과의 상호 작용에 의해 조절될 수 있다. 이러한 원핵생물 내의 전사의 조절 메카니즘은 진핵생물에서보다 덜 복잡하다고 알려져 있다.

요 약

본 발명은 원핵세포에서 유전자 발현을 조절하는 방법 및 조성물을 제공한다. 한 태양에 있어서, 본 발명은 원핵세포에서 유전자의 발현을 조절하는 방법을 특징으로 하는데, 본 발명에 따른 방법은, 폴리펩타이드 (예컨대, 인공의 키메릭 폴리펩타이드)를 코딩하는 핵산을 포함하는 원핵세포를 제공하는 단계로서, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 유전자 내 표적 DNA 부위에 결합하는 것을 특징으로 하는 단계; 및

상기 인공 폴리펩타이드가 생산되고, 표적 DNA 부위에 결합하고, 유전자를 조절하는 조건 하에서 상기 세포 내에서 폴리펩타이드를 코딩하는 핵산을 발현시키는 단계를 포함한다.

인공 폴리펩타이드는 2, 3, 4, 5, 6 혹은 그 이상의 징크 핑거 도메인들을 포함할 수 있다. 일 실시양태에서, 인공 폴리펩타이드는 3개의 징크 핑거 도메인을 포함하고, 다른 예에서 인공 폴리펩타이드는 4개의 징크 핑거 도메인을, 또 다른 실시양태에서는 5개 혹은 그 이상의 징크 핑거 도메인을 포함한다.

인공 폴리펩타이드의 징크 핑거 도메인 또는 도메인들은 자연형 징크 핑거 도메인 혹은 그의 변형체일 수 있다. 일 실시양태에서, 인공 폴리펩타이드의 각각의 징크 핑거 도메인은 자연형 징크 핑거 도메인과 동일하다. 다른 실시양태에서, 인공 폴리펩타이드는 자연형 징크 핑거 도메인과 동일한 제1 의 징크 핑거 도메인과 자연형 징크 핑거 도메인의 변형체인 제2 의 징크 핑거 도메인을 갖는다.

일 실시양태에서, 인공 폴리펩타이드는 두 개의 징크 핑거 도메인을 포함하며, 상기 두 개의 징크 핑거 도메인 각각은 동일한 자연형 단백질의 징크 핑거 도메인 또는 이의 변형체와 동일하다. 일 실시양태에서, 인공 폴리펩타이드는 두 개의 징크 핑거 도메인을 포함하며, 상기 두 개의 징크 핑거 도메인 각각은 상이한 자연형 단백질의 징크 핑거 도메인 또는 이의 변형체와 동일하다. 일 실시양태에서, 인공 폴리펩타이드는 두 개의 징크 핑거 도메인을 포함하며, 상기 두 개의 징 크 핑거 도메인 각각은 같은 자연형 단백질의 비-인접 징크 핑거 도메인과 동일하다.

인공 폴리펩타이드는 하기에서 서술하는 특징들을 하나 이상 포함할 수 있다:

인공 폴리펩타이드는 내생 유전자의 발현을 조절한다; 인공 폴리펩타이드는 외생 (예컨대, 이종의) 유전자의 발현을 조절한다; 인공 폴리펩타이드는 파지 유전자의 발현을 조절한다; 인공 폴리펩타이드는 프랜스포존(transposon) 유전자의 발현을 조절한다; 인공 폴리펩타이드는 DNA 부위에 대한 해리 상수(dissociation constant)가 50nM 미만이다; 인공 폴리펩타이드는 하나 이상의 징크 핑거 도메인을 포함하고, 상기 하나 이상의 징크 핑거 도메인의 위치 -1, +2, +3 및 +6에서 DNA 접촉 잔기가 다음의 군으로부터 선택된 아미노산 모티프에 상응해야 한다: RSHR, HSSR, ISNR, RDHT, QTHR, VSTR, QNTQ, CSNR, QSHV, VSNV, QSNK, QSSR, WSNR, DSAR, QTHQ, QSNR, 및 CSNR. 일 실시양태에서, DNA 비접촉 잔기들은 본 명세서에 기술된 DNA 비접촉 잔기들의 집합과 동일하다. 예를 들면, 징크 핑거 도메인은 하기 표 1의 징크 핑거 도메인을 포함할 수 있다.

인공 폴리펩타이드는 상기 표 1의 서열에서 1 내지 8의 아미노산의 치환(substitution), 결실(deletion), 삽입(insertion)으로 인해 달라진 서열을 포함할 수 있다. 치환은 DNA 접촉 잔기가 아닌 부위 예컨대, 금속-배위 시스테인과 위치 -1 사이에서 일어날 수 있다. 치환은 보존적 치환(conservative substitution)이 될 수 있다.

일 실시양태에서, 인공 폴리펩타이드는 상기 표 1에서 나타난 징크 핑거 도메인을 하나 이상 포함한다.

일 실시양태에서, 인공 폴리펩타이드는 하기 표 2의 징크 핑거 단백질 서열과 적어도 75%, 80%, 85%, 90%, 95%, 99%, 혹은 100% 동일한 아미노산 서열을 포함한다.

인공 폴리펩타이드는 에피토프 태그(tag), 예를 들면, V5 에피토프 태그 (예컨대, GKPIPNPLLGLDS(서열번호: 57)의 아미노산 서열을 갖는 태그)를 포함할 수 있다.

일 실시양태에서, 인공 폴리펩타이드는 원핵세포 유전자의 -35 혹은 -10 요소(element)의 50, 40, 30, 20 혹은 10의 핵산에 결합한다. 일 실시양태에서, 인공 폴리펩타이드는 전사 인자 결합부위 혹은 전사 인자 결합부위와 겹치는 부위에 결합한다.

인공 폴리펩타이드를 코딩하는 핵산의 발현은 예컨대, 조절가능한 프로모터에 인공 폴리펩타이드 코딩 서열을 작동가능하도록 연결하여 조절할 수 있다. 조절가능한 프로모터는 열 변화, 호르몬, 금속, 대사물, 항체 혹은 화학물 등에 반응하는 프로모터들을 포함한다. 일 실시양태에서, 인공 폴리펩타이드를 코딩하는 핵산의 발현은 IPTG로 조절가능하다 (예컨대, 인공 폴리펩타이드 코딩 서열을 lac 프로모터에 작동가능하도록 연결한다).

인공 폴리펩타이드는 하기 서술하는 다른 특징들을 포함할 수 있다.

일 실시양태에서, 인공 폴리펩타이드는 내생 유전자의 발현을 예컨대, 직, 간접적으로 조절한다. 일 실시양태에서, 인공 폴리펩타이드는 2, 3, 4 혹은 그 이상의 내생 유전자의 발현을 조절한다. 일 실시양태에서, 인공 폴리펩타이드는 다시스트론성 RNA의 전사를 조정하여 하나 이상의 내생 유전자의 발현을 조절한다.

본 발명의 방법은 더 나아가, 내생 유전자를 분석하는 것을 포함할 수 있다. 예를 들면, 인공 폴리펩타이드의 표적 DNA 부위를 포함하는 DNA가 분리될 수 있고 (예컨대, 인공 단백질을 DNA에 교차-연결하여 상기 인공 단백질을 면역 침강시키고, 단백질과 결합된 DNA를 분리함으로써), 표적 부위와 관련된 핵산들을 서열 분석할 수 있다. 표적 DNA와 관련된 유전자를 동정할 수 있다. 본 발명의 방법은 제2 세포에서 내생 유전자의 동족체(homolog)를 동정하고, 제2 세포에서 동족체의 발현을 조절하는 것을 포함한다. 상기 제2 세포는 원핵세포 혹은 진핵세포가 될 수 있다.

일 실시양태에서, 인공 폴리펩타이드는 이종 유전자의 발현을 조절한다. 일 실시양태에서, 인공 폴리펩타이드는 2, 3 혹은 그 이상의 이종 유전자들의 발현을 조절한다.

일 실시양태에서, 인공 폴리펩타이드는 전사 활성화 도메인을 포함한다. 일 실시양태에서, 인공 폴리펩타이드는 전사 억제 도메인을 포함한다.

일 실시양태에서, 유전자의 발현은 (예컨대, 인공 단백질 부재시 유전자 발현에 비해, 또는 기준값에 비해) 억제된다. 일 실시양태에서, 유전자의 발현은 (예컨대, 인공 단백질 부재시 유전자 발현에 비해, 또는 기준값에 비해) 활성화된다.

일 실시양태에서, 세포는 박테리아 세포 (예컨대, 대장균)이다. 세포는 그람-음성, 그람-양성 박테리아, 병원성 박테리아, 공생 박테리아(commensal bacteria)와 같은 비병원성 박테리아 등의 어떤 원핵세포라도 가능하며, 다음과 같은 종 중 하나의 세포로부터 선택될 수 있다: 마이코박테리움 종 {예: 마이코박테리움 튜버큘로시스(Mycobacterium tuberculosis), 마이코박테리움 레프래(Mycobacterium leprae)}, 락토바실러스 종(Lactobacillus spp.), 스트렙토코커스 종 {예: 스트렙토코커스 뉴모니아(Streptococcus pneumoniae), 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스태필로코커스 종 {예: 스태필로코커스 오레우스(Staphylococcus aureus), 바실러스 종 {예: 바실러스 서브틸리스(Bacillus subtilis), 바실러스 안스라시스(Bacillus anthracis)}, 캄필로박터 종(Campylobacter spp.), 수도모나스 종 {예: 수도모나스 에루기노사(Pseudomonas aeruginosa), 클로스트리듐 종 {예: 클로스트리듐 테타니(Clostridium tetani), 클로스트리듐 바툴리넘(Clostridium botulinum), 클로스트리듐 퍼프린젠스(Clostridium perfringens)}, 살모넬라 종 {예: 살모넬라 타이피(Salmonella typhi)}, 코리네박테리아 종 {예: 코리네박테리아 디프테리아(Corynebacteria diphtheriae)}, 에쉐리키아 종 {예: 대장균(Escherichia coli)}, 및 리스테리아 종 {예: 리스테리아 모노사이토젠스(Listeria monocytogenes)}, 스트렙토마이세스 종(Streptomyces spp.), 및 써모비피다 종(Thermobifida spp.).

복수개의 세포들도 제공될 수 있다.

조절(regulation)은, 대조 세포 (예컨대, 인공 폴리펩타이드를 발현하지 않는 세포)와 비교하였을 때 세포의 특성(trait)을 변경시킬 수 있다. 상기 특성은 예컨대, 관찰, 선별, 추정, 및/또는 측량가능한 어떠한 검출가능한 표현형도 가능하다. 열 저항성, 용매 저항성, 중금속 저항성, 삼투압 저항성, 극심한 pH에 대한 저항성, 화학적 저항성, 저온 저항성, 유전독성 물질 저항성, 방사선 저항성 등이 특성에 포함될 수 있다.

예를 들어, 특성은 환경적 조건 (예컨대, 중금속, 염분, 환경 독소, 생물 독소, 병원균, 기생충, 다른 환경적 극단상황 (예컨대, 건조, 고온, 저온) 등)에 대한 저항성이다. 이와 관련된 예에서, 특성은 스트레스에 대한 저항성 (예컨대, 열, 저온, 과도한 pH, 암모니아와 같은 화학물, 약물, 삼투압, 및 이온 방사선에 대한 저항성)이다. 또 다른 예에서, 특성은 약물에 대한 내성이다. 특성에서의 변화는 방향성, 예컨대 감수성(sensitivity)에 대한 방향성이거나 추가적인 저항성이 될 수 있다.

하나의 실시양태에서, 인공 폴리펩타이드는 디카복실라제 효소인 내생 유전자의 발현을 조절한다. 하나의 실시양태에서, 상기 디카복실라제 효소는 유비퀴논 생합성 경로의 디카복실라제 효소 예컨대, 대장균의 ubiX 유전자 산물이다.

다른 태양에 있어서, 본 발명은, 복수개 각각의 세포가 인공 폴리펩타이드를 코딩하는 핵산을 포함하고, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 상기 인공 폴리펩타이드가 상기 복수개의 세포들간에는 서로 다른, 복수개의 원핵세포들을 제공하는 단계; 및 대조 세포에 비하여 변경된 특성을 갖는 세포를 상기 복수개의 세포들로부터 동정하는 단계를 포함하는 방법을 특징으로 한다. 상기 대조 세포는 상기 인공 폴리펩타이드를 코딩하는 핵산을 포함하지 않는 세포가 될 수 있는데, 예컨대, 대조 세포는 상기 복수개의 세포가 만들어진 모 세포나 그의 변형 세포들이다.

특성은 예컨대, 관찰, 선별, 추정 및/또는 측량할 수 있는 등의 어떠한 검출가능한 표현형도 가능하다. 상기 인공 폴리펩타이드는 키메릭 폴리펩타이드일 수 있다. 본 발명에서 사용된 바와 같이, 키메릭 폴리펩타이드는 적어도 두 개의 상이한 결합 도메인 (예컨대, 두 징크 핑거 도메인)을 포함한다. 두 결합 도메인은 상이한 자연형 단백질로부터 유래될 수 있다. 상기 인공 폴리펩타이드는 본 명세서에 기재된 하나 이상의 특징들을 포함한다.

많은 실시양태에서, 세포는 리포터(reporter) 유전자를 포함하지 않는다. 다시 말해, 세포는 키메릭 폴리펩타이드의 발현에 의해 조절변경된 표적 유전자에 대한 사전 정보 없이도 스크리닝될 수 있다. 또한, 세포는 특성에 관련된 혹은 관련되지 않은 표지(marker)의 부가적인 지시자(indicator)로서 리포터 유전자를 포함할 수도 있다. 또한, 하나 이상의 표적 유전자가 스크리닝 이전에 알려져 있을 수 있다.

또 다른 예에서, 특성은 화합물 (예컨대, 자연적 혹은 인공적인 화합물)을 생산하는 것이다.

특성은 중금속, 염분, 환경 독성, 생물 독성, 병원균, 기생충, 혹은 건조, 고온, 저온 등의 극심한 환경 요인 등의 주변 조건에 대한 저항성이다. 이와 관련된 예로서, 고온, 저온, 극심한 pH, 암모니아와 같은 화학물, 삼투압, 이온 방사선과 같은 스트레스에 대한 저항성이 특성이 될 수 있다. 또 다른 예로, 특성은 약물에 대한 내성일 수 있다. 특성의 변화는 예컨대 감수성(sensitivity)에 대한 방향성 또는 다른 저항성일 수 있다.

하나의 실시양태에서, 특성은 유기용매에 대한 저항성이며, 동정(identifying)은 복수개의 세포를 유기용매에 노출시켜 세포 생존율을 측정하는 과정을 포함한다. 일 실시양태에서, 특성은 내열성이며, 측정은 세포를 열에 노출시키는 것을 포함한다.

다양한 실시양태에서, 동정은 일단의 조건들 하에서 세포의 생존율을 측정하는 것을 포함한다.

보통, 인공 폴리펩타이드의 하나 이상의 징크 핑거 도메인은 라이브러리의 핵산간에 다양하다. 핵산은 또한, 적어도 제3 의 DNA 결합 도메인 (예컨대, 제3 의 징크 핑거 도메인)을 발현할 수 있다.

복수개의 세포들은 적어도 10, 20, 30, 40 혹은 50의 상이한 세 염기쌍 DNA 부위를 인식하기에 충분한 수의 상이한 인공 폴리펩타이드를 코딩하는 핵산을 포함할 수 있다. 일 실시양태에 있어서, 복수개의 세포들은 오직 30, 20, 10 혹은 5 정도의 상이한 세 염기쌍 DNA 부위를 인식하기에 충분한 수의 인공 폴리펩타이드를 코딩하는 핵산을 포함한다.

본 발명의 방법은 동정된 세포로부터 인공 폴리펩타이드를 코딩하는 핵산을 분리하고/하거나, 동정된 세포로부터 인공 폴리펩타이드를 분리하는 것을 추가적으로 포함한다. 인공 폴리펩타이드를 코딩하는 핵산은 서열 분석될 수 있다.

일 실시양태에서, 본 발명의 방법은 다음의 사항을 추가적으로 포함한다: 세포로부터 상기 인공 폴리펩타이드를 코딩하는 핵산을 분리하고, 제2 복수개의 세포들 내로 상기 핵산을 도입하고, 상기 인공 폴리펩타이드가 생산되는 조건 하에서 상기 제2 복수개의 세포들을 배양하고, 대조 세포에 비하여 변경된 특성을 갖는 제2 복수개의 세포를 동정하는 단계.

인공 폴리펩타이드의 표적 DNA 부위의 서열은, 예컨대, 서열 데이터베이스의 컴퓨터 문자열(string) 혹은 프로필 검색에 의해, 혹은 인공 폴리펩타이드에 결합하는 시험관 내 핵산 선별 (예컨대, SELEX)에 의하여 결정될 수 있다.

본 발명의 방법은, 세포의 하나 이상의 유전자의 발현을 분석하는 것을 포함한다. 예를 들어, mRNA 프로파일링 (예컨대, 마이크로어레이(microarray) 분석을 이용하여), 2D 겔 전기영동, 단백질 리간드 (예컨대, 항체) 어레이 그리고/혹은 질량분석법 등이 있다. 또한, 단일 혹은 소수의 유전자나 단백질도 프로파일링할 수 있다. 일 실시양태에서, 프로필은 기준 프로필의 데이터베이스와 비교된다. 다른 실시양태에서, 동정된 키메릭 폴리펩타이드의 발현에 의해 발현이 변경되는 유전자의 조절 부위들을 비교하여 인공 폴리펩타이드의 발현에 의해 직, 간접적으로 영향을 받는 조절을 결정하는 후보 부위를 알아낸다.

인공 폴리펩타이드에 결합된 내생 유전자는 예컨대, 서열 분석을 통한 확인으로 분석될 수 있다. 내생 유전자의 발현은 제2 세포에서 조절될 수 있는데, ZFP-매개 조절 이외의 방법에 의해, 예컨대, 유전자를 넉아웃시키거나(knocking out), 또는 제2 세포에서 유전자를 과발현하여 조절가능하다.

복수개의 세포들은 자연형 징크 핑거 도메인 혹은 그의 변형체를 포함하는 인공 폴리펩타이드를 코딩하는 핵산을 포함할 수 있다. 자연형 징크 핑거 도메인은 어떠한 진핵세포의 징크 핑거 단백질의 도메인이라도 무관한데, 예를 들어 진균 (예: 효모), 식물, 혹은 동물 단백질 (예: 인간이나 쥐와 같은 포유동물의 단백질) 등이 모두 가능하다.

복수개의 세포는 한 개, 두 개, 세 개, 혹은 네 개의 징크 핑거 도메인을 포함하는 인공 폴리펩타이드를 코딩하는 핵산을 포함한다. 일 실시양태에서, 인공 폴리펩타이드는 적어도 세 개의 징크 핑거 도메인을 포함한다. 핵산에 의해 코딩되는 인공 폴리펩타이드는 본문에 기술된 다른 특징들을 포함할 수 있다.

일 실시양태에서, 복수개의 세포들은 대장균 세포이다.

본 발명의 방법은 변경된 특성들을 이용하기 위하여 동정된 세포들을 배양하는 것을 포함한다. 예를 들어, 만약 변경된 특성이 대사물의 생산 증가라면, 대사물을 생산하기 위해 세포들을 배양하는 것이 포함된다. 세포는 복수개의 세포들로부터 분리된 세포이거나, 인공 폴리펩타이드를 코딩하는 핵산이 재도입된 세포일 수 있다. 인공 폴리펩타이드의 발현은 조절할 수 있는데, 예를 들면, 특성을 정교하게 바꾸기 위한 유도성 프로모터를 사용하거나, 다른 조건적 프로모터 (예컨대, 세포 종류 특이성 프로모터)를 사용하여 조절할 수 있다. 인공 폴리펩타이드를 코딩하는 핵산을 포함하는 세포들은 유기체에 도입될 수 있다 (예: 생체외(ex vivo) 처리).

상기 방법들의 예시적 적용예는 다음과 같은 사항들을 포함한다: 병원성 미생물 등에서의 필수 유전자 동정, 특정 표현형질에 요구되는 유전자 동정, 후보 약제의 표적 동정, 신호 전달 경로에서 유전자 발견, 미생물 공정과 공업적 바이오 기술, 상업상 관심이 높은 대사물의 수율 상승, 성장 습성 모듈화 (예: 미생물의 성장 증가).

또 다른 태양에 있어서, 본 발명은 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 상기 인공 폴리펩타이드를 코딩하는 핵산이 발현되는 조건 하에서 상기 인공 폴리펩타이드가 유전자 내 표적 DNA 부위에 결합하여 상기 유전자의 발현을 조절하는, 상기 핵산을 포함하는 원핵세포를 특징으로 한다. 상기 세포는 대장균 세포일 수 있다.

하나의 실시양태에서, 인공 폴리펩타이드는 내생 유전자의 발현을 조절한다. 하나의 실시양태에서, 인공 폴리펩타이드는 이종 유전자의 발현을 조절한다.

인공 폴리펩타이드는 1, 2, 3, 4, 5, 6 혹은 그 이상의 징크 핑거 도메인을 포함할 수 있다. 일 실시양태에서, 인공 폴리펩타이드는 세 개의 징크 핑거 도메인을 포함한다. 일 실시양태에서, 인공 폴리펩타이드는 네 개의 징크 핑거 도메인을 포함한다.

인공 폴리펩타이드의 징크 핑거 도메인(들)은 자연형 징크 핑거 도메인과 그의 변형체일 수 있다. 자연형 징크 핑거 도메인은 어떠한 진핵세포의 징크 핑거 단백질의 도메인이라도 무관한데, 예를 들어 진균 (예: 효모), 식물, 혹은 동물 단백질 (예: 인간이나 쥐와 같은 포유동물의 단백질) 등이 모두 가능하다.

인공 폴리펩타이드는 본 명세서에 기재된 다른 특징들을 포함할 수 있다.

또 다른 태양에 있어서, 본 발명은 하기 단계들을 포함하는 방법에 의해 선택된 세포를 특징으로 한다: 복수개 각각의 세포가 인공 폴리펩타이드를 코딩하는 핵산을 포함하고, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 상기 인공 폴리펩타이드가 상기 복수개의 세포들간에는 서로 다른, 복수개의 원핵세포들을 제공하는 단계; 및

대조 세포에 비하여 변경된 특성을 갖는 세포를 상기 복수개의 세포들로부터 동정하는 단계.

특성은 예컨대, 관찰, 선별, 추정, 및/또는 측량할 수 있는 등의 어떠한 검출가능한 표현형도 가능하다. 상기 인공 폴리펩타이드는 키메릭 폴리펩타이드일 수 있다. 상기 인공 폴리펩타이드는 본 명세서에 기재된 하나 이상의 특징들을 포함한다.

한 태양에 있어서, 본 발명은 적어도 한 개의 징크 핑거 도메인을 포함하고, 상기 징크 핑거 도메인의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 RSHR, HSSR, ISNR, RDHT, QTHR, VSTR, QNTQ, 및 CSNR로부터 선택된 모티프에 상응하고, 상기 폴리펩타이드가 내생 원핵세포 유전자를 조절하고/조절하거나 원핵세포의 표현형을 변경하는 폴리펩타이드를 특징으로 한다.

상기 폴리펩타이드는 제2 및 제3 징크 핑거 도메인을 추가로 포함할 수 있고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 및 제3 도메인들의 DNA 접촉 잔기들이 각각 모티프 RSHR, HSSR, 및 ISNR에 상응한다.

상기 폴리펩타이드는 제2 및 제3 징크 핑거 도메인을 추가로 포함할 수 있고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 및 제3 도메인들의 DNA 접촉 잔기들이 각각 모티프 ISNR, RDHT, 및 QTHR에 상응한다.

상기 폴리펩타이드는 제4 징크 핑거 도메인을 추가로 포함할 수 있고, 위치 -1, +2, +3, 및 +6에서 상기 제4 도메인의 DNA 접촉 잔기들이 모티프 VSTR에 상응한다.

상기 폴리펩타이드는 제2 및 제3 징크 핑거 도메인을 추가로 포함할 수 있고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 및 제3 도메인들의 DNA 접촉 잔기들이 각각 모티프 QNTQ, CSNR, 및 ISNR에 상응한다.

한 태양에 있어서, 본 발명은 적어도 한 개의 징크 핑거 도메인을 포함하고, 상기 징크 핑거 도메인의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 QSHV, VSNV, QSNK, RDHT, QTHR, QSSR, WSNR, VSNV, RSHR, DSAR, QTHQ, RSHR, QSNR, 및 CSNR로부터 선택된 모티프에 상응하고, 상기 폴리펩타이드가 내생 원핵세포 유전자를 조절하고/하거나 원핵세포의 표현형을 변경하는 폴리펩타이드를 특징으로 한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 QSHV, VSNV, QSNK, 및 QSNK에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 RDHT, QSHV, QTHR, 및 QSSR에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 WSNR, QSHV, VSNV, 및 QSHV에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 QTHR, RSHR, QTHR, 및 QTHR에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 DSAR, RDHT, QSHV, 및 QTHR에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 QTHQ, RSHR, QTHR, 및 QTHR에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 QSHV, VSNV, QSNR, 및 CSNR에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 VSNV, QTHR, QSSR, 및 RDHT에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 RDHT, QSHV, QTHR, 및 QSNR에 상응한다.

일 실시양태에서, 폴리펩타이드는 제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 각 도메인의 위치 -1, +2, +3, 및 +6에서 상기 제1, 제2, 제3, 및 제4 도메인들의 DNA 접촉 잔기들이 각각 모티프 DSAR, RDHT, QSNK, 및 QTHR에 상응한다.

다른 태양에 있어서, 본 발명은 본 명세서에 기재된 인공 폴리펩타이드를 코딩하는, 분리된 핵산을 특징으로 한다.

다른 태양에 있어서, 본 발명은 본 명세서에 기재된 인공 폴리펩타이드를 코딩하는 박테리아의 핵산 발현 벡터를 특징으로 한다.

또 다른 태양에 있어서, 본 발명은 하기 단계들을 포함하는, 폴리펩타이드를 생산하는 방법을 특징으로 한다: 인공 폴리펩타이드를 코딩하는 핵산을 포함하고, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 상기 인공 폴리펩타이드가 유전자 내 표적 DNA 부위에 결합하는 원핵세포를 제공하는 단계; 상기 인공 폴리펩타이드를 포함하지 않는 유전자를 포함하는 동일 세포에 의해 생산되는 수준보다 높거나 낮은 수준으로 (예컨대, 적어도 2, 3, 5, 10, 또는 100배) 폴리펩타이드의 생산을 허용하는 조건 하에서 상기 세포를 배양하는 단계; 상기 세포에 의해 생산된 폴리펩타이드를 검출하는 단계; 및/또는 상기 세포 및/또는 세포를 둘러싼 배지로부터 폴리펩타이드를 정제하는 단계.

폴리펩타이드는 내생 혹은 이종의 폴리펩타이드일 수 있다. 세포에 의한 폴리펩타이드 생산은, 인공 폴리펩타이드에 의해 직, 간접적으로 조절될 수 있다. 본 발명의 방법은 세포를 대상에게 도입하는 것을 추가로 포함할 수 있다. 본 발명의 방법은 폴리펩타이드를 약학적으로 허용가능한 담체와 함께 조제하는 것을 추가로 포함할 수 있다.

또 다른 태양에 있어서, 본 발명은 다음을 포함하는, 변형된 원핵세포를 제조하는 방법을 특징으로 한다: 복수개의 핵산들을 포함하며, 상기 핵산은 각각 상이한 인공 폴리펩타이드를 코딩하고, 상기 인공 폴리펩타이드 각각은 적어도 두 개의 징크 핑거 도메인을 포함하는, 핵산 라이브러리를 제공하는 단계; 주어진 세포의 특성을 변경한 제1 및 제2 라이브러리 구성원을 동정하는 단계; 및 상기에서 동정된 제1 및 제2의 두 라이브러리 구성원에 의해 각각 코딩되는 제1 및 제2 폴리펩타이드를 발현할 수 있는 세포를 제조하는 단계. 본 발명은 또한 추가적인 구성원 (예컨대, 제3 구성원)으로 확장될 수 있다. 본 발명의 방법은 상기 제조된 세포의 소정의 특성을 측정하는 것을 추가로 포함할 수 있다. 본 발명의 방법은 본 명세서에 기재된 다른 특징들을 포함할 수 있다.

한 태양에 있어서, 본 발명은 다음의 사항을 포함하는, 세포 산물을 생산하는 방법을 포함한다: 인공 폴리펩타이드를 코딩하는 핵산을 포함하는 변형된 세포를 제공하는 단계; 상기 변형된 세포를 인공 폴리펩타이드가 생산되는 조건 하에서 배양하는 단계; 상기 배양된 세포로부터 만들어진 인공 폴리펩타이드 외의 산물을 회수하는 단계. 예를 들면, 인공 폴리펩타이드는 스트레스 내성 혹은 본 명세서에 기재된 다른 성질 (예컨대, 변경된 단백질 생산, 변경된 대사산물 생산 등)을 부여할 수 있다. 예를 들어, 인공 폴리펩타이드는 적어도 두 개의 징크 핑거 도메인을 포함한다. 하나 이상의 징크 핑거 도메인은 자연형일 수 있는데, 예를 들면, 하기 표 3의 자연형 도메인일 수 있다. 예시적 인공 폴리펩타이드는 본문에 기재된 하나 이상의 연속적인 모티프 (예컨대, 적어도 2, 3, 혹은 4 연속 모티프, 혹은 비연속적 양상을 포함하는, 적어도 세 개의 동일 패턴의 모티프)를 가진 폴리펩타이드를 포함한다.

예시적 산물은 대사물 또는 단백질 (예컨대, 내생 혹은 이종의 단백질)을 포함한다. 예를 들어, 변형된 세포는 대사물 제조에 참여하는 이종의 단백질을 코딩하는 제2의 핵산을 추가로 포함한다. 상기 변형된 세포는 20 내지 40℃의 온도에서, 또는 37℃ 이상에서 유지될 수 있다. 일 실시양태에서, 상기 변형된 세포는 인공 폴리펩타이드가 결핍된 실질적으로 동일한 세포의 성장을 억제하는 조건 하에서 유지된다.

다른 태양에 있어서, 본 발명은, 인공 폴리펩타이드를 발현하는 세포의 독성 물질 (예컨대, 세포의 분해물, 화학물질)에 대한 민감성을 상기 인공 폴리펩타이드를 발현하지 않는 동일 세포에 비해 변경시키는 인공 폴리펩타이드를 특징으로 한다. 민감성은 증가되거나 감소될 수 있다. 예시적 인공 폴리펩타이드는 하나 이상의 징크 핑거 도메인 (예컨대, 본 명세서에 기재된 모티프를 포함하는 징크 핑거 도메인)을 가진 폴리펩타이드를 포함한다.

본 명세서에 기재된 모든 방법들에 대해서, 키메릭 징크 핑거 단백질을 코딩하는 핵산 라이브러리가 사용될 수 있다. 용어 "라이브러리"는 유사하지만 동일하지는 않은 생체 분자들의 물리적 집합체를 의미한다. 상기 집합체는, 예를 들면, 한 용기(vessel) 안에 함께 모인 것, 혹은 물리적으로 (그룹이나 개개로) 분리되어 분리 용기 안에 또는 고형 지지대 위의 분획 구역에 모인 것이 될 수 있다. 라이브러리 개별 구성원의 복제물들이 집합체에 존재할 수 있다. 라이브러리는 적어도 10, 10², 10³, 10⁵, 10⁷ 혹은 10⁹의 상이한 구성원을 포함하거나, 10¹³, 10¹², 10¹⁰, 10⁹, 10⁷, 10⁵ 혹은 10³ 보다는 적은 상이한 구성원을 포함할 수 있다.

라이브러리의 첫 번째 예는 제1, 제2 및 제3 징크 핑거 도메인을 포함하는 폴리펩타이드를 각각 코딩하는 복수개의 핵산을 포함한다. 명세서에서 사용된 것처럼, '제1, 제2 및 제3'은 폴리펩타이드 내에서 순서와 상관없이 나타날 수 있는 세 개의 별도의 도메인을 의미한다: 예컨대, 각 도메인은 다른 도메인 혹은 양 도메인에 대해 N 말단 혹은 C 말단에 나타날 수 있다. 제1 징크 핑거 도메인은 복수개의 핵산간에 다양하다. 제2 징크 핑거 도메인은 복수개의 핵산간에 다양하다. 라이브러리에는 적어도 10개의 상이한 제1 징크 핑거 도메인이 나타난다. 한 구체예에서, 라이브러리 구성원의 0.5, 1, 2, 5, 10, 혹은 25 % 이상이 7, 5, 3, 2, 1, 0.5 혹은 0.05 nM 이하의 해리상수로 적어도 하나의 표적 위치에 결합한다. 제1 및 제2 징크 핑거 도메인은 상이한 자연형 단백질로부터 유래될 수 있고, 자연형 단백질에서의 그들의 상대적 위치와는 다르게 배치될 수 있다. 예를 들어, 제1 및 제2 징크 핑거 단백질은 폴리펩타이드에서 인접하나, 자연형 단백질에서는 하나 이상의 개재(intervening)된 징크 핑거 도메인에 의해 분리될 수도 있다.

라이브러리의 두 번째 예는 적어도 제1 및 제2 징크 핑거 도메인을 포함하는 폴리펩타이드를 각각 코딩하는 복수개의 핵산들을 포함한다. 각 폴리펩타이드의 제1 및 제2 징크 핑거 도메인은, (1) 상이한 자연형 단백질의 징크 핑거 도메인들과 동일하고 (보통 동일한 자연형 단백질에서 나타나지 않거나, 자연형 단백질에서의 도메인들의 상대적 위치와 다른 형태로 배치된다.), (2) 오직 넷, 셋, 둘 혹은 하나 정도의 아미노산 잔기만이 자연형 단백질과 다르거나, (3) 자연형 단백질로부터 유래된 비-인접 징크 핑거 도메인이다. 상기 동일한 징크 핑거 도메인이란 첫 번째 금속 배위된 잔기(보통, 시스틴)부터 마지막 금속 배위된 잔기(보통, 히스티딘)까지의 각 아미노산이 동일한 것을 지칭한다. 제1 징크 핑거 도메인은 복수개의 핵산간에 다양하고, 제2 징크 핑거 도메인은 복수개의 핵산간에 다양하다. 자연형 단백질은 어떤 진핵세포의 징크 핑거 단백질이라도 무관하다: 예를 들어, 진균 (예컨대, 효모), 식물, 혹은 동물 단백질 (예컨대, 인간이나 쥐의 단백질과 같은 포유동물의 단백질). 각 폴리펩타이드는 제3, 제4, 제5 및/또는 제6 징크 핑거 도메인을 추가로 포함할 수 있다. 각 징크 핑거 도메인은 포유동물 예컨대, 인간의 징크 핑거 도메인일 수 있다.

다른 종류의 라이브러리 역시 사용될 수 있는데, 예를 들어, 돌연변이된 징크 핑거 도메인들을 포함할 수 있다.

일 실시양태에서, 징크 핑거 단백질을 코딩하는 핵산 라이브러리나 그러한 단백질 자체의 라이브러리는 상이한 조절 도메인을 가진 구성원들을 포함할 수 있다. 예를 들어, 라이브러리는 적어도 10%의 활성화 도메인을 가진 구성원과 적어도 10%의 억제 도메인을 가진 구성원을 포함할 수 있다. 다른 예에서는, 적어도 10%가 활성화 혹은 억제 도메인을 가지며, 적어도 다른 10%가 조절성 도메인을 갖지 않는다. 또 다른 예에서는, 일부는 활성화 도메인을 포함하고; 다른 일부는 억제 도메인을 포함하며; 또 다른 일부는 조절성 도메인을 전혀 포함하지 않는다. 상기와 다른 비율, 예를 들면, 20, 25, 30, 40, 50 및 60 % 이상도 역시 사용될 수 있다.

"유전자(gene)"라는 용어는 특정 폴리펩타이드의 발현과 관련된 코딩 및 비코딩 DNA 서열을 지칭한다. 유전자는 예컨대, 엑손 서열, 인트론 서열, 프로모터, 인핸서 및 다른 조절성 서열들을 포함한다.

본 명세서에서 사용된 것과 같이, 용어 "해리 상수(dissociation constant)"는 하나의 9-염기쌍 표적 부위를 포함하는 28-염기쌍 이중 가닥 DNA의 결합에 대한 폴리펩타이드의 평형 해리 상수(K_d)를 말한다. 해리 상수는 20 mM Tris (pH 7.7), 120 mM 염화나트륨, 5 mM 염화마그네슘, 20 μM 황화아연, 10% 글리세롤, 0.1% 노니뎃(Nonidet) P-40, 5 mM DTT, 0.10 ㎎/㎖ BSA(bovine serum albumin), 및 실온의 조건에서 결합하는 정제된 단백질을 사용한 겔 이동 분석(gel shift analysis)에 의해 결정된다. 세부 사항은 하기 실시예 및 레바와 파보의 논문(Rebar 및 Pabo, Science 263:671-673 (1994))에 제공된다.

본 명세서에서 사용된 것과 같이, "스크린(screen)"이라는 용어는 주어진 성질을 갖는 하나 이상의 특정 구성원을 찾기 위해 라이브러리 구성원을 평가하는 과정을 의미한다. 직접적인 스크린에서는, 라이브러리 각각의 구성원이 평가된다. 예를 들어, 각 세포는 확장 중인 신경돌기(extending neurite)인지를 확인하기 위해 평가된다. 다른 종류의 스크린인 "선별(selection)"에서는 각 구성원이 직접적으로 평가되지 않는다. 그보다는 특정 성질을 갖는 구성원만이 존속가능한 조건 하에서 라이브러리의 구성원을 평가한다. 선별 과정은 생존 (예컨대, 약물 내성) 또는 표면에 결합 (예컨대, 기질에 부착)하는 것에 의해 매개될 수 있다. 이 같은 선별 과정은 "스크리닝"이라는 용어에 모두 포함된다.

용어 "염기 접촉 위치", "DNA 접촉 위치", 또는 "핵산 접촉 위치"는, ZIF268의 아미노산 알기닌 73, 아스파르트산 75, 글루탐산 76, 및 알기닌 79의 위치에 구조적으로 대응하는 징크 핑거 도메인의 네 개의 아미노산 위치를 의미한다.

Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser

1 5 10 15

Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys

20 25 30

Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His

35 40 45

Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys

50 55 60

Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His

65 70 75 80

Thr Lys Ile His Leu Arg Gln Lys Asp (서열번호: 58)

85

이 위치들은 또한 각각 위치 -1, 2, 3, 및 6으로 지칭되기도 한다. 질의 서열 내에서 염기 접촉 위치에 상응하는 위치를 동정하기 위하여, 질의 서열의 시스테인 및 히스티딘 잔기가 ZIF268의 핑거 3의 시스테인 및 히스티딘 잔기와 정렬되도록 질의 서열을 목적 징크 핑거 도메인에 정렬시킨다. 유럽 생물정보학 연구소(European Bioinformatics Institute)의 ClustalW WWW 서비스(http://www2.ebi.ac.uk/clustalw ; 문헌 [Thompson 등, Nucleic Acids Res. 22:4673-4680 (1994)] 참조)는 간편한 서열 정렬 방법을 제공한다.

"보존적 아미노산 치환(conservative amino acid substitution)"은 유사한 측쇄를 갖는 잔기의 상호 교환 가능성을 말한다. 예를 들면, 지방족 측쇄를 갖는 아미노산 그룹은 글라이신, 알라닌, 발린, 류신, 및 이소류신; 지방족-수산기 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌; 아마이드-함유 지닌 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 타이로신 및 트립토판; 염기성 측쇄를 갖는 아미노산 그룹은 라이신, 알기닌 및 히스티딘; 산성 측쇄를 갖는 아미노산 그룹은 아스파르트산 및 글루탐산; 그리고 황-함유 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 상황에 따라 동일 그룹 내의 아미노산들이 상호 교환될 수 있다. 몇몇 추가적인 보존적 아미노산 치환 그룹은 다음과 같다: 발린-류신-이소류신; 페닐알라닌-타이로신; 라이신-알기닌; 알라닌-발린; 아스파르트산-글루탐산; 및 아스파라진-글루타민.

용어 "이종 폴리펩타이드" 혹은 "인공 폴리펩타이드"는 비-자연형 서열 (예컨대, 혼성 폴리펩타이드)을 갖는 폴리펩타이드, 또는 자연형이지만 자연적으로는 발생하지 않는 환경에 존재하는 폴리펩타이드와 동일한 서열을 갖는 폴리펩타이드를 지칭한다. 예를 들어, 자연적으로는 서로 융합되지 않는 두 개의 자연형 폴리펩타이드의 융합은 한 폴리펩타이드가 다른 폴리펩타이드에 대하여 이종인 폴리펩타이드가 되는 결과가 된다.

용어 "혼성" 및 "키메라"는 (i) 적어도 두 개의 상이한 자연형 서열, 또는 동일한 자연형 서열의 비-인접 영역으로서, 혼성체 내에서 비-인접 영역이 인접하게 된 서열; (ⅱ) 적어도 하나의 인공 서열(즉, 자연형이 아닌 서열) 및 적어도 하나의 자연형 서열; 또는 (ⅲ) 두 개 이상의 (동일하거나 상이한) 인공 서열에서 유래된 아미노산 서열을 포함하는 비-자연형 폴리펩타이드를 말한다. 인공 서열의 예는 부위 특이적 돌연변이 또는 무작위 돌연변이에 의해 생성된 자연형 서열의 돌연변이체 및 새로이(de novo) 고안된 서열을 포함한다. "인공 서열"은 자연형 서열에는 존재하지 않는다. 본 명세서에서 "인공 서열 (예컨대, 단백질 또는 핵산)"을 기술할 때, 동일한 요소를 가졌지만 게놈이 서열 분석된 하기의 생물들에는 존재하지 않는 서열을 의미한다: 인간(Homo sapiens), 쥐(Mus musculus), 애기장대(Arabidopsis thaliana), 초파리(Drosophila melanogaster), 대장균(Escherichia coli), 효모(Saccharomyces cerevisiae), 및 벼(Oryza sativa). 상기 언급한 생물에 존재하지 않는 서열들은 이들 생물들의 세포 안에서 이종의 분자를 발현할 수 있다.

본 발명은 또한 인공 여부와 상관없이 "서열"을 포함하는데, 이 서열은 본 명세서에 기재된 방법, 예를 들어 상이한 징크 핑거 도메인을 코딩하는 핵산 서열을 연결하거나 표현형질적 스크리닝 방법에 의해 제조된 것이다. 본 발명은 또한 이러한 서열을 포함하는 세포들을 특징으로 한다.

본 명세서에서 사용된 용어 "엄격한 조건 하의 혼성화"는, 45℃에서 6×SSC(염화 나트륨/구연산 나트륨) 중에서 혼성화시키고, 이어서 65℃에서 0.2×SSC, 0.1% SDS로 2회 세척하는 혼성화 조건을 말한다.

용어 "결합 선호도(binding preference)"는 폴리펩타이드가 다른 결합 부위에 비해 특정 핵산 결합 부위를 선별하는 식별 성질을 지칭한다. 예를 들어, 두 개의 상이한 핵산 결합 부위에 대해 폴리펩타이드가 양적으로 제한될 때, 본 명세서에 기재된 생체 내 또는 생체 외 분석법에서 다른 부위에 비해 선호되는 부위에 더 많은 양의 폴리펩타이드가 결합할 것이다.

"대조 세포(reference cell)"는 목적하는 임의의 세포를 지칭한다. 예를 들어 대조 세포는 의 모 세포, 예컨대, 징크 핑거 단백질 발현 세포와 실질적으로 동일하지만 징크 핑거 단백질을 발현하지 않는 세포이다.

"형질전환된(tranformed)" 혹은 "형질감염된(transfected)" 세포는 이종의 핵산을 포함하는 세포를 지칭한다. 이러한 세포들은 예컨대, 형질전환하거나 형질감염하거나 예컨대, 바이러스 입자를 사용한 감염으로 핵산을 도입시킨 세포들이거나 이렇게 만들어진 세포의 자손 혹은 변형체일 수 있다.

다른 장점들 중에서도, 본 발명의 방법과 구성들의 많은 장점들은 특히 원핵세포에서 유전자의 발현을 조절하기 위한 신규하고 유용한 징크 핑거 단백질을 동정하고 사용하는 것에 관한 것이다. 모듈성의 징크 핑거 단백질을 사용하여 내생 유전자를 상향 혹은 하향 조절할 수 있다. 심지어 전사 조절성 도메인 (예컨대, 활성화 도메인이나 억제 도메인)이 없이도, 징크 핑거 단백질은 유전자 발현의 강력한 조절자일 수 있다. 변경된 유전자 발현으로 인해 변경된 특성을 갖는 세포들을 동정하기 위해, 상이한 DNA 결합 특이성을 가진 징크 핑거 단백질을 발현하는 복수개의 세포들을 스크리닝할 수 있다. 또한, 징크 핑거 단백질의 발현을 조절함으로써 원핵세포에서의 유전자 발현을 섬세하게 조절할 수 있다. DNA 결합 친화도에 따라 키메릭 폴리펩타이드는 효과 정도를 조절 (예컨대, 강한 활성과 억제를 완화시키는 것)할 수 있다. 이는 특정 표적 유전자를 반드시 완전히 불활성화하거나 높은 수준으로 과발현함으로써만 획득되는 것은 아닌 다양한 표현형질들을 유도할 수 있다.

본 명세서에 기재된 방법들은 유용한 키메릭 단백질을 동정하기 위해, 세포의 사전 정보 (예컨대, 게놈 서열)를 필요로 하지 않는다. 인공 키메릭 단백질이 세포 내의 경로를 분석하는 도구로 사용될 수 있다. 예를 들어, 선별된 클론에서 표현형질을 바꾸는 역할을 하는 표적 유전자들을 예컨대 본 명세서에 기재된 바와 같이 동정할 수 있다. 징크 핑거 단백질은 주요 조절성 단백질 (예컨대, 주된 조절 전사 인자)의 기능을 모방할 수도 있다. 예를 들어, 징크 핑거 단백질은 주요 조절 단백질과 같거나 겹치는 부위에 결합할 수도 있다. 유전자 발현 변화의 수위, 즉 ZFP-TF에 의해 생성되는 표현형질의 범위는 세포 내에서 징크 핑거 단백질의 발현 수위를 변화시킴으로써 정확하게 조절될 수 있는 것이다.

본 명세서에 언급된 모든 특허, 특허 출원, 및 참고문헌은 그 전체가 인용된다. 다음의 특허 출원 즉, 국제특허공개 제 WO 01/60970 호(Kim 등); 2001년 12월 7일에 출원된 미국 출원 제 60/338,441 호; 2001년 8월 17일에 출원된 미국출원 제 60/313,402 호; 2002년 4월 22일에 출원된 미국 출원 제 60/374,355 호; 2002년 4월 26일에 출원된 미국 출원 제 60/376,053 호; 2002년 8월 2일에 출원된 미국 출원 제 60/400,904 호; 2002년 8월 5일에 출원된 미국 출원 제 60/401,089 호; 및 2002년 8월 19일에 출원된 미국출원 제 10/223,765 호는 모든 목적에서 전체로서 명백히 인용된다. 하나 이상의 본 발명의 실시양태의 세부 내용은 첨부 도면 및 하기 기재에 나타나 있다. 본 명세서에 기재된 임의의 특징은 본 명세서에 역시 기재된 다른 혼용가능한 특징과 함께 사용될 수 있다. 본 발명의 다른 특징, 목적 및 이점은 이 기재 및 도면으로부터, 그리고 청구범위로부터 명백할 것이다.

도 1a, 1b 및 1c는 대장균에서 인공 징크 핑거 단백질의 발현에 의해 유도된 표현형질의 변화를 나타낸 것이다. 도 1a는 1.5% 헥산(hexane)이 있는 경우와 없는 경우 LB 플레이트에서의 세포 성장을 나타내었는데, 클론 H1, H2 및 H3은 징크 핑거 단백질을 발현하였으며, 대조군 세포(C; pZL1로 형질전환된 대장균 세포)는 징크 핑거 단백질을 발현하지 않았다. 도 1b는 LB 플레이트에서 열-충격(heat-shock) 처리되었거나 처리되지 않은 세포의 성장을 나타낸 것이다. 선별된 클론들(T1 내지 T10)은 징크 핑거 단백질을 발현하였고, 대조군 세포(C; pZL1로 형질전환된 대장균 세포)는 징크 핑거 단백질을 발현하지 않았다. 도 1c는 LB 플레이트에서 대조군 세포(C; pZL1로 형질전환된 대장균 세포), T9 징크 핑거 단백질을 발현하는 세포(T9), 및 돌연변이된(mutated) T9를 발현하는 세포(T9-M)의 성장을 나타낸 것이다. 돌연변이된 T9-M은 T9 단백질의 QTHR1 징크 핑거 도메인의 알기닌 잔기를 알라닌으로 치환하여 제조하였다. 세포들은 열-충격 처리되었거나 처리되지 않았다. 도 1a 및 1b에서 각 패널 위에 그려진 삼각형은 스폿팅된 세포를 10배씩 연속적으로 희석시킨 것(1:1에서 1:10,000까지, 좌에서 우로)을 표기한 것이다.

도 2a, 2b 및 2c는 징크 핑거 단백질에 의해 조절된 표적 유전자 동정을 나 타낸다.

도 2a(왼쪽 패널)는 LB플레이트에서 대조군 세포(C; pZL1로 형질전환된 대장균 세포), T9 징크 핑거 단백질을 발현하는 세포(T9), 및 UbiX 유전자(ubiX)가 망가진 세포의 성장을 나타내는데, 세포들은 열-충격 처리되었거나 처리되지 않았다. 각 패널 위에 그려진 삼각형은 스폿팅된 세포를 10배씩 연속적으로 희석시킨 것(1:1에서 1:10,000까지, 좌에서 우로)을 표기한 것이다. 도 2a(오른쪽 패널)는 열-충격 처리된 대조군 세포(C; pZL1로 형질전환된 대장균 세포), T9-발현 세포, 및 UbiX 유전자(ubiX)가 파괴된 세포의 퍼센트 생존율을 나타낸 그래프이다. 도 2b는 대조군과 T9 발현 세포에서의 UbiX 전사체의 상대적 양을 나타낸 그래프이다. 도 2c는 T9 ZFP가 UbiX 프로모터 내의 유력한 결합 부위와 작용하는 것을 나타낸 도식으로, 전사 개시 지점과 비교하여 결합 가능 부위의 위치를 나타내었다. 면역 침강에 의해 T9 ZFP가 상기 위치에 결합하는 것을 확인하였다.

본 발명은 부분적으로, 징크 핑거 단백질(ZFP)이 원핵생물에서 유전자의 발현을 조절할 수 있다는 발견에 기초하였다. 징크 핑거 단백질 (예컨대, 진핵세포의 징크 핑거 도메인을 포함하는 징크 핑거 단백질)은 원핵세포에서 내생 유전자의 발현을 조정할 수 있다.

징크 핑거 단백질의 라이브러리들을 원핵세포에서 발현시킴으로써 세포의 표현형질을 바꾼 징크 핑거 단백질을 동정할 수 있다. 더욱이, 이러한 단백질의 발현은 유전자 산물 (예컨대, 내생적으로 발현된 유전자 산물)의 동정을 가능하게 하고, 이의 조정이 세포의 표현형질을 바꾼다.

일 실시양태에서, 임의의 징크 핑거 도메인 키메라들을 포함하는 인공 폴리펩타이드를 코딩하는 핵산 라이브러리로 원핵세포 (예컨대, 대장균)를 형질전환시킨다. 라이브러리의 핵산들은 세포 내에서 발현된다. 상기 세포들을 목적 표현형질에 대하여 평가하고, 대조군과 비교해 표현형질이 변경된 세포들을 분리한다. 분리된 세포들의 핵산 라이브러리를 회수하며, 회수된 핵산에 의해 코딩되는 징크 핑거 단백질들은 추가적으로 분석하거나, 사용하거나, 또는 변형할 수 있다. 징크 핑거 단백질에 의해 결합된 표적 DNA 부위 역시 수거하여 분석할 수 있다. 일 실시양태에서, 표적 DNA 부위를 포함하는 유전자들을 동정함으로써, 목적 표현형질의 조정에 관여하는 유전자들을 밝혀낸다.

1, 2, 3, 4 혹은 그 이상의 징크 핑거 도메인을 포함하는 키메릭 징크 핑거 단백질은 원핵세포에서 유전자의 발현을 조절하는데 사용될 수 있다. 이러한 징크 핑거 단백질은 둘 혹은 그 이상의 자연형 징크 핑거 단백질을 포함할 수 있다.

또한, 징크 핑거 단백질들은 원핵세포에서 표적 DNA 부위를 인식하도록 고안될 수도 있다. 유용한 표적 부위는 표적 유전자의 조절 영역, 또는 표적 유전자의 조절 영역의 1 kb 또는 500 염기쌍 이내의 부위들을 포함한다. 예를 들어, 표적 부위는 TATA 박스 또는 유전자의 전사개시 부위로부터 1 kb 또는 500 염기쌍 이내에 존재할 수 있다. 징크 핑거 단백질을 고안하는 하나의 방법은, 표적 부위를 개별 징크 핑거 도메인에 의해 인식될 수 있는 3 또는 4 염기쌍 서열로 나누는 것이다. 그 후, 나뉜 서열에 상응하는 연속적인 징크 핑거 도메인을 갖는 단백질의 코딩 서열을 포함하는 핵산을 제조한다. 후보 단백질을 코딩하는 복수개의 상이한 핵산들을 제조하고, 숙주세포에서 발현시킨다. 표적 유전자의 발현을 조절할 수 있는 하나 이상의 후보들을 동정하기 위해 표적 유전자의 발현을 측정한다.

본 발명의 다른 태양에 있어서, 원핵세포의 표현형질적 특성을 변화시키는 키메릭 단백질을 동정하기 위하여, 상이한 인공의 키메릭 폴리펩타이드를 코딩하는 핵산 라이브러리를 스크리닝한다. 인공 폴리펩타이드는 특정 표적 유전자나 경로에 대한 사전 지식 없이 확인이 가능하다.

라이브러리 구축

하나 이상의 구조 도메인 (예컨대, 징크 핑거 도메인)의 키메라인 인공 폴리펩타이드를 각각 코딩하고 발현할 수 있는 핵산들을 포함하도록 핵산 라이브러리를 구축한다. 징크 핑거 도메인은 핵산 결합 도메인이며, 라이브러리가 상이한 결합 특이성을 갖는 단백질군을 코딩하도록 상기 도메인의 특이성이 다양화될 수 있다.

징크 핑거들. 징크 핑거는 대략 30개의 아미노산 잔기로 이루어진 작은 폴리펩타이드 도메인으로서, 그 중 4개의 아미노산 잔기가 시스테인 혹은 히스티딘으로 아연 이온과 배위결합을 할 수 있도록 적절히 배치되어있다(검토를 위해 예컨대, 문헌 [Klug 및 Rhodes, Trends Biochem. Sci. 12: 464-469 (1987)] ; [Evans 및 Hollenberg, Cell 52: 1-3 (1987)] ; [Payre 및 Vincent, FEBS Lett. 234: 245-250 (1988)] ; [Miller 등, EMBO J. 4:1609-1614 (1985)] ; [Berg, Proc. Natl. Acad. Sci. U.S.A. 85:99-102 (1988)] ; 및 [Rosenfeld 및 Margalit, J. Biomol. Struct. Dyn. 11: 557-570 (1993)] 참조). 따라서, 징크 핑거 도메인은 아연 이온과 배위결합하는 잔기의 종류에 따라, 예를 들어 Cys₂-His₂류, Cys₂-Cys₂ 류, Cys₂-CysHis 류 등으로 분류될 수 있다. Cys₂-His₂ 징크 핑거에서 아연과 배위결합하는 잔기는 보통 다음과 같이 배치되어 있다:

X_a-X-C-X_2-5-C-X₃-X_a-X₅-ψ-X₂-H-X_3-5-H (서열번호: 59)

여기에서 "ψ(프사이)"는 소수성 잔기이고(Wolfe 등, Annu. Rev. Biophys. Biomol. Struct. 3:183-212 (1999)), "X"는 임의의 아미노산을 나타내고, "X_a"는 페닐알라닌 혹은 타이로신을 나타내며, 아래 첨자는 아미노산의 개수를 가리키고, 하이픈으로 연결된 두 숫자의 아래 첨자는 개재하는 아미노산의 전형적인 범위를 가리킨다. 비록 역평행(anti-parallel) β-주름은 짧고 비이상적이고 존재하지 않을 수 있지만, 전형적으로, 개재하는 아미노산은 폴딩되어 α-나선에 대하여 충전되는 역평행 β-주름을 형성한다. 폴딩으로 인해, 아연과 배위결합하는 측쇄가 아연 이온과 배위결합하기에 적합한 사면체 구조를 갖도록 배치된다. 염기 접촉 잔기는 핑거의 N 말단 및 선행(preceding) 루프(loop) 영역 내에 있다.

편의를 위해, 징크 핑거 도메인의 주요 DNA 접촉 잔기는 다음 예에 의거하여, -1, 2, 3 및 6으로 번호를 매겼다.

여기에서, X_a는 전형적으로 페닐알라닌 혹은 타이로신을 나타내고, X_b는 전형적으로 소수성 잔기를 나타낸다. 상기 예에서 명기한대로, DNA 접촉 잔기는 시스테인(C), 세린(S), 아스파라진(N) 및 알기닌(R)이다. 상기 모티프는 CSNR로 축약하여 표기할 수 있다. 본 명세서에, 그러한 축약 표기는 특정 폴리펩타이드 서열, 전형적으로 상기 모티프와 일치하는 표 1 혹은 표 3에 기재된 서열을 포함하는 서열들뿐만 아니라 상기 모티프에 상응하는 도메인을 포함하는 한 부류(class)의 서열들을 의미한다. 표 1과 3에서 두 서열이 같은 모티프를 가질 때, 숫자는 서열을 지시하는데 사용될 수 있다.

징크 핑거 단백질은 통상적으로 직렬로 배치된 세 개 이상의 징크 핑거 도메인으로 구성된다. 예를 들면, 모티프가 연속적으로 나열된 징크핑거 도메인은 다른 폴딩된 도메인들과 산재되어 있지 않지만, 링커, 예컨대, 본 명세서에 기재된 신축 링커(flexible linker)를 도메인 사이에 포함할 수 있다. 본 명세서에 기재된 특정 징크 핑거 단백질 혹은 그의 어레이(array)를 포함하는 실시예를 위하여, 본 발명은 상응하는 징크 핑거 단백질 혹은 그의 어레이를 포함하는 다른 관련 실시예를 특징으로 하는데, 상기의 상응 징크 핑거 단백질 혹은 그의 어레이는 특이 징크 핑거 단백질 혹은 그의 어레이와 동일한 DNA 접촉 잔기를 갖는다. 상응하는 징크 핑거 단백질은 개시된 특정 징크 핑거 단백질과는 적어도 1, 2, 3, 4 혹은 5개의 아미노산이 다를 수 있는데, 예를 들면 DNA 접촉 잔기가 아닌 아미노산 부위가 다를 수 있다. 다른 관련 실시예들은 적어도 1, 2 혹은 3개의 징크 핑거를 가진 상응하는 단백질을 포함하며, 이 징크 핑거는 동일한 DNA 접촉 잔기를 예컨대, 동일한 순서로 가진다.

징크 핑거 도메인(또는 "ZFD")은 가장 흔한 진핵생물 DNA-결합 모티프 중 하나로서, 효모로부터 고등 식물 및 인간에 이르는 다양한 종에서 발견된다. 인간 게놈에만도 수 천가지 이상, 아마도 4,500가지 이상의 징크 핑거 도메인이 존재할 것으로 추측된다. 징크 핑거 도메인은 징크 핑거 단백질로부터 분리될 수 있다. 징크 핑거 단백질의 비제한적인 예로는, CF2-II; 크룹펠(Kruppel); WT1; 바소누클린(basonuclin); BCL-6/LAZ-3, 적혈구 크룹펠-유사 전사 인자; 전사 인자 Sp1, Sp2, Sp3 및 Sp4; 전사 억제제 YY1; EGR1/Krox24; EGR2/Krox20; EGR3/Pilot; EGR4/AT133; Evi-1; GLI1; GLI2; GLI3; HIV-EP1/ZNF40; HIV-EP2; KR1; ZfX; ZfY; 및 ZNF7 등이 있다.

하기에 서술될 전산법(computational mothods)은 서열 분석된 게놈 혹은 핵산 데이터베이스에서 코딩된 모든 징크 핑거 도메인을 동정하는데 사용될 수 있다. 이러한 징크 핑거 도메인은 모두 활용가능하며, 또한, 인공 징크 핑거 도메인을 예컨대, 전산법을 사용하여 고안할 수 있다(예를 들어, 문헌 [Dahiyat 및 Mayo, Science 278:827 (1997)] 참조).

적어도 일부의 징크 핑거 도메인이 DNA가 아닌 리간드, 예를 들어 RNA 또는 단백질에 결합한다는 사실도 주목할 만하다. 따라서, 징크 핑거 도메인/도메인들의 키메라 및 다른 종류의 도메인들은 DNA뿐만 아니라 다양한 표적 화합물들을 인식하는데 쓰일 수 있다.

국제특허공개 제 WO 01/60970 호, 2002년 4월 22일에 출원된 미국 특허 제 60/374,355 호, 및 2002년 8월 19일에 출원된 미국 특허 제 10/223,765 호에 인공 징크 핑거 단백질을 구축하는데 사용할 수 있는 예시적 징크 핑거 도메인들이 기재되어 있다. 또는 하기 표 3을 참조하라.

다른 다양한 구조 도메인들이 높은 친화력과 특이성으로 핵산과 결합한다고 알려져 있다. DNA 이중 가닥을 인식하는 구조 도메인을 검토하기 위해서는, 예를 들어 다음을 참조하라: [Pabo 및 Sauer, Annu. Rev. Biochem. 61:105395 (1992)] ; [Patikoglou 및 Burley, Annu. Rev. Biophys. Biomol. Struct. 26:289325 (1997)] ; 및 [Nelson, Curr Opin Genet Dev. 5:1809 (1995)].

징크 핑거 도메인의 동정. 징크 핑거 도메인을 동정하기 위해 다양한 방법들이 사용될 수 있다. 동정된 도메인을 코딩하는 핵산은 핵산 라이브러리를 구축하기 위해 사용될 수 있다. 또한, 상기 도메인을 코딩하는 핵산은 라이브러리에 의해 코딩되는 추가적인 도메인들을 제공하기 위하여 변형 (예컨대, 돌연변이화)될 수도 있다.

전산법. 추가적인 자연형 구조 도메인 (예컨대, 징크 핑거 도메인)을 동정하기 위해, 공지된 징크 핑거 도메인의 아미노산 서열을 공지된 서열들의 데이터베이스 (예컨대, 단백질 혹은 핵산 서열의 주해된(annotated) 데이터베이스)와 비교할 수 있다. 또 다른 실시예에서, 분석되지 않은 서열의 데이터베이스 (예: 주해되지 않은 게놈 서열, EST 서열, 혹은 전장(full-length) cDNA 서열); 분석된 서열의 데이터베이스 (예: Pfam, ProDom (Corpet 등, Nucleic Acids Res. 28:267269 (2000)), 및 SMART (Simple Modular Architecture Research Tool; Letunic 등, Nucleic Acids Res 30, 242244 (2002))가 징크 핑거 도메인 서열의 재료를 제공할 수 있다. 핵산 서열 데이터베이스는 질의 아미노산 서열과 비교할 목적으로 모든 6개의 리딩 프레임(reading frames)으로 번역될 수 있다. 후보 핵산 결합 도메인을 코딩하는 것으로 표시된 핵산 서열들은, 게놈 DNA나 세포 RNA와 같은 적절한 핵산 기원으로부터 증폭될 수 있다. 이러한 핵산 서열들은 발현 벡터로 클로닝될 수 있다. 컴퓨터-기반의 도메인 동정 과정은 고효율 플랫폼(platform)으로 도메인을 코딩하는 핵산을 생산할 수 있도록, 올리고 뉴클레오타이드 합성기 및 로봇 시스템과 연동될 수 있다. 또한, 후보 도메인을 코딩하는 클로닝된 핵산들은 숙주의 발현 벡터에 담겨져 발현 벡터로, 예컨대, 다른 도메인들(유사하거나 상이한 종류의 도메인들)과 함께 번역 융합 벡터로 간단히 옮겨질 수 있다. 이는 제한 효소 매개된 서브클로닝에 의해, 또는 부위특이적(site-specific)인 재조합효소(recombinase) 매개된 서브클로닝(미국 특허 제 5,888,732 호 참조)에 의해 수행된다. 고효율 플랫폼은 상이한 후보 키메라들을 코딩하는 핵산들을 포함하는 다수의 미량역가판을 제조하기 위해 사용될 수 있다.

개시 서열 혹은 프로필로부터 도메인을 동정하는 자세한 방법은 해당 업계에 잘 알려져 있다. 예를 들면, 프로사이트(Prosite; Hofmann 등, Nucleic Acids Res. 27:215219 (1999)), 화스타(FASTA), 블라스트(BLAST; Altschul 등, J. Mol. Biol. 215:40310 (1990)) 등을 참조하라. 질의 서열 혹은 질의 프로필과 동일한 아미노산 서열을 찾기 위해 간단한 문자열 검색이 이루어질 수 있는데, 예를 들면, 문서 파일을 스캔하기 위해 펄(Perl)을 사용한다. 이와 같이 동정된 서열들은 30%, 40%, 50%, 60%, 70%, 80%, 90%, 혹은 그 이상으로 최초 입력 서열과의 상동성을 가질 수 있다.

질의 도메인과 유사한 도메인은, 공개된 데이터베이스 예컨대, XBLAST 프로그램 버전 2.0 (Altschul 등, J. Mol. Biol. 215:40310 (1990))을 이용하여 동정할 수 있다. 예를 들어 블라스트 단백질 검색은 다음과 같은 XBLAST 변수들로 수행될 수 있다: 스코어 = 50, 단어 길이 = 3. 갭(gap)이 질의 혹은 검색된 서열에 도입될 수 있다(Altschul 등, Nucleic Acids Res. 25(17):33893402 (1997)). XBLAST의 불이행 변수와 Gapped BLAST 프로그램들은 미국 국립생물정보센터(National Center for Biotechnology Information; NCBI)(미국 국립보건원(National Institutes of Health), 베데스다(Bethesda), MD)에서 이용할 수 있다.

프로사이트 프로필 PS00028 및 PS50157은 징크 핑거 도메인을 동정하기 위해 사용될 수 있다. SWISSPROT의 공개된 80,000개의 단백질 서열들 중에서 상기 프로필들은 각각 3189개 및 2316개의 징크 핑거 도메인들을 발견했다. 프로필들은 다양한 기술들에 의해 관련 단백질의 다중서열정렬로부터 구축될 수 있다. 그리브스코프와 연구진들은(Gribskov 등, Meth. Enzymol. 183:146159 (1990)) 기호 비교표를 이용하여 잔기 빈도 분포가 부여된 다중서열정렬을 각 위치에 대한 중요도(weight)로 전환하였다. 예를 들면, 프로사이트의 데이터베이스 및 루에티의 연구(Luethy 등, Protein Sci. 3:1391465 (1994))를 참고하라.

목적하는 DNA 결합 도메인을 나타내는 은닉 마르코프 모델(Hidden Markov Models; HMM’s)은 예컨대, Pfam 데이터베이스(release 2.1)와 같은 데이터베이스로부터 획득되거나 생성될 수 있다. 추가적인 도메인들을 발견하기 위해, 예를 들면 불이행 함수를 사용하여 은닉 마르코프 모델로 데이터베이스를 검색할 수 있다 (Bateman 등, Nucleic Acids Research 30:276280 (2002)). 또한, 사용자는 변수를 최적화할 수 있다. 서열 데이터베이스를 필터링하기 위해 역치 수치가 선택될 수 있으며, 역치 이상의 수치를 보이는 서열들을 후보 도메인으로 시각화한다. Pfam 데이터베이스에 대한 설명은 소하머(Sonhammer 등, Proteins 28(3):405420 (1997))에서, 은닉 마르코프 모델에 대한 상세한 설명은 그리브스코프([Gribskov 등, Meth. Enzymol. 183:146159 (1990)] ; 및 [Gribskov 등, Proc. Natl. Acad. Sci. USA 84:43554358 (1987)]), 크로프(Krogh 등, J. Mol. Biol. 235:15011531 (1994)), 및 스툴츠(Stultz 등, Protein Sci. 2:305314 (1993))에서 확인할 수 있다.

은닉 마르코프 모델의 SMART 데이터베이스(문헌 [Schultz 등, Proc. Natl. Acad. Sci. USA 95:5857 (1998)] 및 [Schultz 등, Nucl. Acids Res 28:231 (2000)] 참조)는 HMMer2 검색 프로그램의 은닉 마르코프 모델로 프로파일되어 동정된 징크 핑거 도메인들의 목록(ZnF_C2H2; ZnF_C2C2; ZnF_C2HC; ZnF_C3H1; ZnF_C4; ZnF_CHCC; ZnF_GATA; 및 ZnF_NFX)을 제공한다(Durbin 등, Biological sequence analysis: probabilistic models of proteins and nucleic acids, Cambridge University Press (1998)).

혼성-기반법(Hybridization-based Methods). 다양한 형태의 징크 핑거 도메인을 코딩하는 핵산들의 집합은, 보존된 아미노- 및 카르복실- 말단 경계 서열을 코딩하는 서열을 프로파일링하기 위해 분석될 수 있다. 축퇴성 올리고 뉴클레오타이드가 상기 보존된 경계 서열들을 코딩하는 서열들을 혼성화하기 위해 고안될 수 있다. 또한, 이러한 축퇴성 올리고 뉴클레오타이드의 유효성을 측정하기 위하여, 공지의 게놈 서열에서 가능한 어닐링 부위의 빈도와 올리고 뉴클레오타이드의 구성을 비교할 수 있다. 필요하다면, 축퇴성 올리고 뉴클레오타이드를 최적화하기 위해 복수개의 고안이 사용될 수 있다.

예를 들면, 공지의 Cys₂His₂ 징크 핑거들을 대조하여, 천연 서열의 근접 핑거들 간에 있는 링커 영역에서 공통된 서열들을 발견하였다(Agata 등, Gene 213:5564 (1998)). 보존된 링커 영역을 코딩하는 핵산에 어닐링하는 축퇴성 올리고 뉴클레오타이드가 복수개의 징크 핑거 도메인을 증폭하기 위해 사용되었다. 증폭된 도메인 코딩 핵산은 징크 핑거의 키메릭 어레이를 코딩하는 핵산을 제조하기 위해 사용될 수 있다.

징크 핑거 도메인을 코딩하는 핵산들

라이브러리를 제조하는 데 사용되는 핵산은 다양한 방법들에 의해 획득될 수 있다. 라이브러리를 구성하는 일부 핵산들은 자연형 징크 핑거 도메인들을 코딩할 수 있다. 또한, 일부 구성 핵산들은 돌연변이나 다른 임의화 방법들을 통해 획득된 변형체들이다. 전형적으로 단일 도메인을 코딩하는 구성 핵산을 서로 연결하여 상이한 징크 핑거 도메인의 융합물을 코딩하는 핵산을 만들어낼 수 있다.

도메인의 천연 리포터 분리. 도메인 라이브러리는 효모 혹은 인간과 같은 진핵생물의 게놈 DNA나 cDNA로부터 도메인을 코딩하는 핵산 서열을 분리하여 구축할 수 있다. 이를 수행하기 위해 다양한 방법을 사용할 수 있다. 예를 들어, 도메인을 동정하기 위해 상기에서 기술한 바와 같이, 이용가능한 아미노산 서열의 컴퓨터 검색을 이용할 수 있다. 각 도메인을 코딩하는 핵산들을 분리하여 세포 내에서 발현하기에 적합한 벡터, 예를 들어, 프로모터, 활성화 도메인 및 선택적 마커를 포함하는 벡터에 도입할 수 있다. 다른 예에서, 보존적 모티프와 혼성화된 축퇴성 올리고 뉴클레오타이드를 사용하여 예컨대, PCR로 모티프를 포함한 관련 도메인을 증폭할 수 있다. 예를 들면, 크룹펠 유사 Cys₂His₂ 징크 핑거를 아가타의 방법으로 증폭할 수 있다(Agata 등, Gene 213:5564 (1998)). 상기 방법은 또한 자연형 징크 핑거 도메인 링커의 펩타이드 서열, 예를 들면, 다음과 같은 양식의 서열을 갖는다: Thr-Gly-(Glu/Gln)-(Lys/Arg)-Pro-(Tyr/Phe) (서열번호: 115). 더구나, 목적하는 도메인으로 한정된 집합을 스크리닝하는 것은, 선택되지 않은 게놈 혹은 cDNA 서열의 라이브러리를 스크리닝하는 것과는 달리, 라이브러리의 복잡성이 현저히 감소하고, 규모가 큰 라이브러리를 완전히 스크리닝하는 것의 본질적인 난점에서 기인하는 바람직한 유전자의 유실 가능성이 감소한다.

인간 게놈은 수많은 징크 핑거 도메인들을 포함하는데, 그들 다수가 분석, 동정되어 있지 않다. 징크 핑거 도메인을 갖는 단백질을 코딩하는 유전자는 수천 개 존재한다고 추정되고 있다(Pellegrino 및 Berg, Proc. Natl. Acad. Sci. USA 88:671675 (1991)). 이러한 인간 징크 핑거 도메인들은 다양한 도메인의 총체적인 집합을 나타내며, 그러한 도메인들로부터 새로운 DNA 결합 단백질들이 제조될 수 있다. 인간 징크 핑거 도메인들의 많은 예시들이 국제 특허 제 WO 01/60970 호, 2002년 4월 22일에 출원된 미국 출원 제 60/374,355 호, 2002년 8월 19일에 출원된 미국 출원 제 10/223,765 호에 기재되어 있다. 또한 하기 표 3을 보라.

만약 각각의 징크 핑거 도메인이 특정 3 내지 4개의 염기쌍 서열을 인식한다면, 모든 가능한 3 내지 4개 염기쌍 서열에 결합하는데 필요한 도메인의 총수는 오직 64(4³) 내지 256(4⁴)이다. 인간 게놈의 천연 레퍼토리가 상기의 모든 가능 인식 부위를 포괄하는 충분한 수의 특정 징크 핑거 도메인을 포함하는 것이 가능하다. 이 징크 핑거 도메인들은 인공 키메릭 DNA 결합 단백질들을 제조하는 데 유용한 재료가 된다. 핵산 라이브러리는 자연형 징크 핑거 도메인, 그의 인공 변형체, 및 이들의 조합들을 포함하는 단백질을 코딩하는 핵산을 포함할 수 있다.

돌연변이된(mutated) 도메인들. 한 구체예에서, 라이브러리는 자연형 서열의 인공 변형체인 구조 도메인을 적어도 하나 코딩하는 핵산을 포함한다. 일 실시양태에서, 상기 변형 도메인들은 축퇴성 양상의 라이브러리로부터 구축된다. 핵산 결합 도메인의 경우, 핵산 결합면의 근접 부위(close proximity) 혹은 그 주변 부위가 돌연변이(mutagenesis)의 표적이 될 수 있다. 예를 들어, 돌연변이된 시험 징크 핑거 도메인을 양상화된 축퇴성 라이브러리를 사용하여 임의의 변이 위치에서 가능한 아미노산의 하위집합으로 제한할 수 있다. 상기 축퇴성 코돈 집합은 각 위치에서 프로필을 코딩하는데 사용될 수 있다. 예를 들어, 코돈 집합이 오직 소수성 잔기, 지방족 잔기, 혹은 친수성 잔기만을 코딩하는 것이 가능하다. 라이브러리는 폴딩된 폴리펩타이드를 코딩하는 전장 클론을 선별하는 데 사용될 수 있다. 초 등(Cho 등, J. Mol. Biol. 297(2):30919 (2000))은 축퇴성 올리고 뉴클레오타이드를 사용해 축퇴성 라이브러리를 제조하는 방법과 전장 폴리펩타이드를 코딩하는 핵산 라이브러리 선별법을 제공한다. 이러한 핵산들은 손쉽게 발현 플라스미드에 도입할 수 있는데, 예를 들어, 제한 효소 절단 부위를 사용하여 간편하게 도입할 수 있다.

적절한 코돈 및 주어진 위치에서의 각 뉴클레오타이드의 상대적 비율은, 유전자 코드를 나타내는 표를 간단히 검사하거나 전산 알고리즘을 이용하여 결정할 수 있다. 예를 들어, 상기 초 등(Cho 등, 상기 문헌)의 문헌에는 원하는 단백질 서열의 프로필을 입력하여, 서열을 코딩하는 바람직한 올리고 뉴클레오타이드 디자인을 출력하는 컴퓨터 프로그램이 기재되어 있다. 몇 가지 사용가능한 징크 핑거 도메인들을 위해 다음을 참고하라: [Zhang 등, J. Biol. Chem. 275:3385033860 (2000)] ; [Rebar 및 Pabo, Science 263:671673 (1994)] ; [Segal, Proc. Natl. Acad. Sci. USA 96:2758 (1999)] ; [Gogus 등, Proc. Natl. Acad. Sci. USA. 93:21592164 (1996)] ; [Drier 등, J. Biol. Chem. 276: 2946629478 (2001)] ; [Liu 등, J. Biol. Chem. 276(14):1132311334 (2001)]; 및 [Hsu 등, Science 257:194650 (1992)].

일 실시예에서, 키메릭 단백질은 하나 이상의 징크 핑거 도메인을 포함할 수 있고, 상기 도메인은 상기 표 1 혹은 표 3의 징크 핑거 도메인 서열과 동일하거나, 70, 75, 80, 85, 90, 혹은 95%의 상동성을 갖는 아미노산을 적어도 18, 19, 20, 21, 22, 23, 24, 혹은 25개 포함할 수 있다.

키메릭 징크 핑거 단백질의 제조

다양한 키메릭 징크 핑거 단백질을 코딩하는 핵산 라이브러리는 예컨대, 실시예 1에 기재된 것과 같이 연속적인 라이게이션(ligation)에 의해 제조할 수 있다. 각각의 핵산이 적어도 3, 4 혹은 5개의 징크 핑거 도메인을 가진 단백질을 코딩하도록 라이브러리를 구축할 수 있다. 일부 구체예에서, 특히 규모가 큰 라이브러리에서 각각의 징크 핑거 코딩 단편이 징크 핑거 도메인 집합의 어느 하나를 임의적으로 코딩하도록 고안될 수 있다. 징크 핑거 도메인의 집합은, 예를 들어, 30, 40, 50 혹은 64 이상의 가능 3-염기쌍 하위부위를 포괄하는 특이성 범주의 도메인을 나타내도록 선별될 수 있다. 상기 집합은 적어도 대략 12, 15, 20, 25, 30, 40 혹은 50개의 상이한 징크 핑거 도메인을 포함할 수 있다. 이 도메인들의 일부 혹은 전부는 자연형 단백질로부터 분리된 도메인들일 수 있다. 또한, 주어진 3-염기쌍 하위부위에 대한 징크 핑거 도메인이 하나 이상으로는 거의 혹은 전혀 필요없을 수 있으므로 예컨대, 500, 200, 100, 심지어 64 이하의 적은 수의 구성 도메인을 사용하여 라이브러리를 제조하는 것이 가능하기도 하다.

한 예시적 라이브러리는 3개의 핑거를 갖고 이들 각각의 핑거 위치에 30개의 도메인들이 있을 수 있는 키메릭 징크 핑거 단백질 코딩 핵산을 포함한다. 완전하게 나타난(represented) 형태에서, 상기 라이브러리는 27,000개의 서열들(다시 말해, 30³의 결과)을 포함한다. 라이브러리는 연속적인 라이게이션에 의해 구축될 수 있는데, 라이게이션의 각 단계에 상기 30개의 가능한 도메인 모두를 코딩하는 핵산 풀(pool)의 핵산이 첨가된다.

일 실시양태에서, 라이브러리는 임의의 집합으로 저장될 수 있다. 다른 실시양태에서는, 각 구성원이 분리되고, 주소화된 위치에 저장되고 (예컨대, 어레이되고), 서열 분석될 수 있다. 제조된 4만에서 5만개의 라이브러리 구성원을 높은 처리량으로 서열 분석한 후, 범위를 완전히 포괄하기 위하여 유실된 키메라 조합들을 개별적으로 구성할 수 있다. 일단 미량역가판 등에 어레이되면, 각 구성원은 예컨대, 표현형질 스크리닝과 같은 추가적 분석을 위해 추후 회수될 수 있다. 예를 들면, 어레이된 구성원 각각의 동량을 합하여 세포내로 도입할 수 있다. 원하는 표현형질을 가진 세포를 선별하고, 특징을 분석한다. 다른 예에서는, 각 구성원을 개별적으로 세포 내로 도입하여, 예컨대, 핵산 마이크로어레이를 이용하여 내생 유전자의 전사가 변경되었는 지의 여부를 확인하는 등 세포의 특징을 분석한다(하기의 "키메릭 징크 핑거 단백질의 조절 특성 프로파일링"을 참조).

핵산 라이브러리의 세포 내로의 도입

라이브러리 핵산들은 다양한 방법들에 의해 세포 내로 도입될 수 있다. 일 실시예에서, 상기 라이브러리는 각각의 라이브러리 핵산의 다중 복제물들을 포함하는 무작위 풀로서 보관된다. 상기 풀의 분액이 세포 내로 형질전환된다. 또 다른 실시양태에서, 개별적 라이브러리 구성원들이 독립적으로 보관되고 (예컨대, 미세역가 플레이트의 개별적 웰들 내 혹은 어레이의 독립된 구획들 내) 개별적으로 세포 내에 도입된다.

또 다른 실시양태에서, 상기 라이브러리 구성원들은 전체로서 상기 라이브러리에 비하여 감소된 복잡성을 갖는 풀 내에서 보관된다. 예를 들면, 각각의 풀은 10⁵ 내지 10⁶개의 상이한 구성원들의 라이브러리로부터 10³개의 상이한 라이브러리 구성원들을 포함할 수 있다. 풀이 특정 효과를 야기하는 구성원을 갖는 것으로 확인될 때, 상기 풀은 표현형적 효과를 매개하는 개별적 라이브러리 구성원을 동정하기 위하여 분석(deconvolved)된다. 이러한 접근법은 변경된 세포의 회수가 어려울 때 예컨대, 세포사멸을 야기하는 키메릭 단백질들에 대한 스크리닝시에 유용하다.

라이브러리 핵산들은 다양한 방법들에 의해 세포 내로 도입될 수 있다. 예시적인 방법들로는 전기 천공법 (예컨대, 미국 특허 제 5,384,253 호 참조); 미세추진 충격 기술들 (예컨대, 미국 특허 제 5,550,318 호; 제 5,538,880 호; 및 제 5,610,042 호; 및 국제특허공개 제 94/09699 호 참조); 리포솜 매개 형질감염 (예컨대, 리포펙타민^™ (인비트로젠사) 또는 수퍼스크립트^™(퀴아젠 GmbH); 예컨대, [Nicolau 등, Methods Enzymol., 149:157176 (1987)] 참조); 칼슘 포스페이트 또는 DEAE 덱스트란 매개 형질전환 (예컨대, [Rippe 등, Mol. Cell Biol., 10:689695 (1990)] 참조); 직접 미세주입 또는 초음파파쇄 부하; 수용체 매개 형질감염 (예컨대, EP 273 085 참조); 및 아그로박테리움(Agrobacterium) 매개 형질전환 (예컨대, 미국 특허 제 5,563,055 호 및 제 5,591,616 호 참조)을 포함한다. 본 명세서에서 사용된 바와 같이, 용어 "형질전환"은 이종유래 핵산을 세포 내로 도입하는 임의의 방법을 포함한다.

또한, 생체 내 또는 생체 외에서 라이브러리 핵산을 세포에 전달하기 위하여 바이러스 입자를 사용할 수 있다. 일 실시양태에서, 바이러스 패키징이 생물체 내에서 세포에 라이브러리 핵산을 전달하기 위하여 사용된다. 또 다른 실시양태에서, 상기 라이브러리 핵산들이 생체 외에서 세포 내로 도입되고, 그 후에 상기 세포가 생물체 내로 전달된다.

라이브러리 핵산들의 도입 후에, 상기 라이브러리에 의해 코딩되는 키메릭 단백질들이 세포들에 의해 생산되도록 상기 라이브러리 핵산들은 발현된다. 상기 라이브러리 핵산의 불변 영역들은 발현을 가능케하기 위하여 필수적인 조절 및 지지 서열들을 제공할 수 있다. 이러한 서열들은 전사 프로모터들, 전사 종결자들, 세균성 복제 기원들, 상기 라이브러리 핵산의 존재를 나타내기 위한 혹은 라이브러리 핵산의 선별을 위한 마커들을 포함할 수 있다.

키메릭 단백질들을 코딩하는 핵산 라이브러리들의 스크리닝

스크리닝 시에, 세포들은 변경된 표현형질을 갖는 세포들을 동정하기 위하여 평가된다. 이러한 과정은 목적하는 표현형질에 따라 변형될 수 있다. 가능한 표현형질의 수가 방대함에 따라, 스크리닝에 대한 가능성 또한 매우 크다. 수많은 유전적 스크리닝과 선별이 특정 표현형질들을 나타내는 돌연변이들 또는 과발현된 자연 발생적인 유전자들을 동정하기 위해 수행되어 왔다. 이러한 방법들 중 어느 것이든지 키메릭 단백질들을 코딩하는 핵산 라이브러리의 유용한 구성원들을 동정하기 위하여 변형될 수 있다. 스크리닝은 라이브러리 핵산을 포함하는 각각의 세포를 평가하거나 선별 예컨대, 생존하거나 그렇지 않으면 특정 처리를 견뎌내는 세포 또는 생물체를 평가하는 것을 포함한다.

세포를 평가하기 위한 예시적인 방법들은 현미경 (예컨대, 광학, 공초점, 형광, 주사전자, 및 투과전자), 형광 기반 세포 분류, 분획원심분리, 분획결합, 면역분석, 효소분석, 성장분석, 및 생체 내 분석을 포함한다.

일부 스크리닝은 특정한 환경조건을 포함한다. 상기 조건에 민감하거나 내성을 가진 세포들이 동정된다.

일부 스크리닝은 세포의 특정 거동 (예컨대, 형태학적 변형)의 검출을 요구한다. 일 실시양태에서, 상기 세포들 또는 생물체들은 예컨대, 육안 검사에 의해 예컨대, 현미경 및 변경된 세포들을 자동적으로 검출하기 위한 임의의 컴퓨터 프로그램을 사용하여 직접적으로 평가될 수 있다. 또 다른 실시양태에서, 상기 세포들 또는 생물체들은 분석법 또는 목적하는 표현형질과 관련된 다른 지시자를 이용하여 평가될 수 있다.

일부 스크리닝들은 세포 성장과 관련된다. 대조 세포 (예컨대, 정상 세포)에 비하여 서로 다른 속도로 증식하는 세포들이 동정된다.

세포 신호 경로들에서의 변화들이 상기 경로의 활성 또는 불활성과 관련된 탐침들의 사용에 의해 또는 상기 경로의 활성 또는 불활성과 관련된 관찰가능한 지시들에 의해 검출될 수 있다.

일부 스크리닝들은 목적 화합물, 예컨대, 대사산물 또는 분비된 단백질의 생산과 관련된다. 예를 들면, 증가된 양의 화합물을 생산하는 세포들이 동정될 수 있다. 또 다른 실시예에서, 감소된 양의 화합물 예컨대, 바람직하지 못한 부산물을 생산하는 세포들이 동정될 수 있다. 목적 세포들이 반응 세포, 마이크로어레이, 화학적 검출 분석법 및 면역분석법의 사용을 포함하는 다양한 수단들에 의해 동정될 수 있다.

세포 산물들의 생산

본 발명은 세포 산물 예컨대, 단백질 또는 대사산물을 생산하는 세포의 능력을 변경시키는 인공 폴리펩타이드들 (예컨대, 키메릭 징크 핑거 단백질들)을 특징으로 한다. 세포 산물은 내생 또는 이종유래 분자일 수 있다. 예를 들면, 단백질들 예컨대, 특정 단백질들 (예컨대, 특정 내생 단백질들), 과발현된 단백질들 또는 이종유래 단백질들을 생산하는 세포들의 능력을 증가시키는 인공 폴리펩타이드들을 동정할 수 있다.

일 실시양태에서, 세포들은 리포터 단백질 예컨대, 효소적으로 또는 형광적으로 검출될 수 있는 단백질을 생산하는 이들의 능력에 대해 스크리닝된다. 일 실시예에서, 상기 리포터 단백질은 대조 세포에서 과발현되었을 때 불용성이다. 예를 들면, 세균 세포들은 봉입체들을 감소시키는 인공 폴리펩타이드들에 대해 스크리닝될 수 있다. 또 다른 실시예에서, 상기 리포터 단백질은 분비된다. 세포들은 예컨대, 보다 높은 분비성 처리량 또는 단백질 분해 공정에 대해서 스크리닝될 수 있다.

일 실시양태에서, 세포들은 두 개의 서로 다른 리포터 단백질들의 활성을 변경 (예컨대, 증가 혹은 감소)시키는 그들의 능력에 대해 스크리닝될 수 있다. 상기 리포터 단백질들은 예컨대, 활성, 국소화 (예컨대, 분비된/세포질/핵), 크기, 용해도, 등전점, 올리고머 상태, 번역-후 조절, 번역 조절, 및 전사 조절 (예컨대, 단백질을 코딩하는 유전자가 다른 조절서열에 의해 조절될 수 있다)에 의해 달라질 수 있다. 본 발명은 이러한 특성이 상이한 적어도 두 개의 서로 다른 리포터 유전자들을 변경시키는 인공 폴리펩타이드들 (예컨대, 징크 핑거 단백질들), 및 하나의 리포터 유전자 또는 상기 특성들 중의 하나에 의해 정의된 한 부류의 리포터 유전자들을 선택적으로 조절하는 징크 핑거 단백질들을 포함한다.

상기 표현형질 스크리닝 방법은 상기 인공 폴리펩타이드를 분리하는데 사용될 수 있기 때문에, 징크 핑거 단백질이 단백질 생산을 어떻게 매개하는지에 대해서는 선험적으로 알 필요가 없다. 증명될 수 있는, 가능한 기작들은 하기의 하나 이상의 변형을 포함한다: 번역 기구, 전사물 처리공정, 전사, 분비, 단백질 분해, 스트레스 저항성, 촉매활성 예컨대, 대사산물 생산. 일 실시예에서, 인공 폴리펩타이드는 대사경로에서 하나 이상의 효소들의 발현을 조절할 수 있고, 그로 인해 대사산물 또는 단백질과 같은 세포 산물의 생산을 향상시킬 수 있다.

반복 고안

일단 키메릭 DNA 결합 단백질이 동정되면, 세포의 표현형적 특성을 변경시키는 이의 활성은 다양한 전략들에 의해 추가로 향상될 수 있다. 예컨대, 6 내지 200개 또는 50 내지 2000개의 구성원들을 갖는 작은 라이브러리들, 또는 보다 큰 라이브러리들이 특정하게 동정된 키메릭 단백질의 특성들을 최적화하기 위하여 사용될 수 있다.

반복 고안의 첫 번째 예시적인 수단으로, 돌연변이화 기술들이 본래의 키메릭 DNA 결합 단백질을 변경시키기 위하여 사용된다. 상기 기술들은 그의 구성원들이 원래 단백질 예컨대, 제1 라이브러리로부터 동정된 단백질의 변이체들을 포함하는 구성원들을 포함하는 제2 라이브러리를 구축하는데 적용된다. 이러한 기술들의 예시들로는 오류-빈발 PCR(Leung 등, Technique 1:11-15 (1989)), 재조합, 무작위 절단을 이용한 DNA 셔플링([Stemmer, Nature 389-391 (1994)]; 및 [Coco 등, Nature Biotech. 19:354 (2001)]), 부위-지정 돌연변이화(Zollner 등, Nucl Acids Res 10:6487-6504 (1987)), 카세트 돌연변이화(Reidhaar-Olson, Methods Enzymol. 208:564-586 (1991)), 축퇴성 올리고 뉴클레오타이드들의 도입(Griffiths 등, EMBO J 13:3245 (1994)); 연속 라이게이션, 미리-조립되고 배열된 라이브러리로부터 특정 라이브러리 구성원들의 집단화, 재조합 (예컨대, 성적 PCR 및 DNA 셔플링^TM(Maxygen, Inc., CA)), 또는 이들 방법들의 조합이 포함된다.

일 실시양태에서, 라이브러리는 한 군(set)의 아미노산 위치들을 돌연변이시키도록 구축된다. 예를 들면, 키메릭 징크 핑거 단백질에 대하여, 상기 한 군의 아미노산 위치들은 DNA 접촉 잔기들 자체가 아니라, DNA 접촉 잔기들의 부근에 있는 위치들일 수 있다. 또 다른 실시양태에서, 키메릭 DNA 결합 단백질이 동정된 초기 라이브러리보다는 훨씬 더 제한된 정도지만, 상기 라이브러리는 키메릭 단백질 내 각각의 코딩된 도메인을 변경시킨다. 키메릭 징크 핑거 단백질에 대하여, 특정 도메인을 코딩하는 핵산들은 그의 인식 특이성이 원래 키메릭 단백질 내에 존재하는 도메인의 인식 특이성과 유사한 것으로 알려진 다른 징크 핑거 도메인들 중에서 달라질 수 있다.

일부 기술들은, 특정한 기능성을 갖는 것으로 알려진 적어도 두 개의 서로 다른 키메릭 DNA 결합 단백질들의 도메인들을 코딩하는 핵산들로부터, 새로운 키메릭 DNA 결합 단백질들을 제조하는 것을 포함한다. DNA 셔플링 및 표준 도메인 스와핑을 포함하는 이러한 기술들은 도메인들의 새로운 조합들을 만들어낸다. 미국 특허 제 6,291,242 호 참조. DNA 셔플링은 또한 단순히 도메인들을 교환하는 것에 더하여 점 돌연변이를 도입할 수 있다. 상기 셔플링 반응은 목적하는 표현형질을 유도하는 키메릭 단백질들을 코딩하는 핵산 서열들이 도입된다. 상기 핵산들은 셔플링된다. 제2 라이브러리가 상기 셔플링 산물들로부터 제조되고, 예컨대, 유사하거나 훨씬 더 엄격한 조건들 하에서 목적하는 표현형질을 유도하는 구성원들에 대해서 스크리닝된다. 만약 초기 라이브러리가 모든 가능한 도메인 조합들의 키메라들이 스크리닝될 정도로 포괄적이라면, 상기 동일한 초기 라이브러리로부터 분리된 도메인들의 DNA 셔플링은 소용이 없을 것이다. DNA 셔플링은 적용범위가 포괄적인 경우, 그리고 포괄적 스크리닝이 실용적이지 않은 경우에 유용할 것이다.

반복 고안의 제2의 예시적인 실시에 있어서, 목적하는 표현형질을 생산하는 키메릭 DNA 결합 단백질은 각각의 도메인을 변경시켜 바꿀 수 있다. 도메인들은 연속적으로 예컨대, 한번에 한 개씩 또는 한번에 한 개 이상 변경시킬 수 있다.

하기 실시예는 세 개의 징크 핑거 도메인: 핑거 Ⅰ, Ⅱ 및 Ⅲ을 포함하고 목적하는 표현형질을 생산하는 본래의 키메릭 단백질에 관한 것이다. 제2 라이브러리는 상기 제2 라이브러리의 핵산 구성원 각각이 초기에 동정된 단백질과 동일한 핑거 Ⅱ 및 핑거 Ⅲ을 코딩하도록 구축된다. 그러나, 상기 라이브러리는 핑거 Ⅰ이 원래 단백질의 핑거 Ⅰ과는 다른 핵산 구성원들을 포함한다. 상기 핵산 구성원의 차이는 코딩된 키메릭 단백질의 아미노산 서열을 변경시키는 뉴클레오타이드 하나일 수도 있고, 또는 그 보다 많을 수도 있다. 상기 제2 라이브러리는, 예컨대, 핑거 Ⅰ의 염기-접촉 잔기들이 바뀌도록 혹은 핑거 Ⅰ의 염기-접촉 잔기들은 유지되면서 다른 인접 잔기들이 바뀌도록 제조될 수 있다. 상기 제2 라이브러리는 또한 적어도 20개, 30개, 40개, 또는 60개의 서로 다른 삼뉴클레오타이드(trinucleotide) 부위들을 인식하기에 충분한 정도로 큰 징크 핑거 도메인 집합을 포함할 수 있다.

상기 제2 라이브러리는 세포 또는 생물체의 표현형질을 변경하는 구성원들을 동정하기 위해 스크리닝된다. 변경의 범위는 원래 단백질에 의해 생산된 것과 유사하거나 원래 단백질에 의해 생산된 것보다 클 수 있다.

동시에 또는 연속적으로, 핑거 Ⅱ를 변경한 제3 라이브러리가 제작될 수 있고, 핑거 Ⅲ을 변경한 제4 라이브러리가 제작될 수 있다. 만약 상기 키메릭 단백질 또는 이미 동정된 변형체들이 충분하다면, 모든 도메인들을 변경시켜 키메릭 단백질을 추가로 향상시킬 필요는 없을 것이다. 다른 경우에는, 각각의 도메인을 다시 최적화시키는 것이 바람직하다.

만약 다른 도메인들이 동시에 변경된다면, 또 다른 라이브러리를 형성하기 위하여 각각의 특정한 라이브러리로부터 향상된 변형체들을 서로 재결합시킬 수 있다. 이 라이브러리는 유사하게 스크리닝된다.

반복 고안의 제3의 예시적인 실시에 있어서, 상기 방법은 도메인 예컨대, 징크 핑거 도메인 또는 조절성 도메인을 부가, 치환, 또는 결실시키는 것을 포함한다. 부가적인 징크 핑거 도메인은 키메릭 단백질의 특이성을 증가시킬 수 있고, 그의 결합 친화력을 증가시킬 수도 있다. 일부 경우에, 증가된 결합 친화력은 키메릭 단백질이 생산하는 표현형질을 향상시킬 수 있다. 부가적인 조절성 도메인 예컨대, 제2 활성화 도메인 또는 부속 인자를 보강한 도메인 역시, 키메릭 단백질이 생산하는 표현형질을 향상시킬 수 있다. 결실은 결실된 도메인의 기여도 등에 따라 키메릭 단백질의 활성 특이성을 향상시키거나 확장시킨다.

반복 고안의 제4의 예시적인 실시에 있어서, 상기 방법은 원래 키메릭 단백질과 제2 키메릭 DNA 결합 단백질을 세포 내에서 동시-발현시키는 것을 포함한다. 상기 제2 키메릭 단백질은 또한 서로 다른 키메라들을 코딩하는 핵산 라이브러리를 스크리닝함으로써 동정될 수 있다. 일 실시양태에서, 상기 제2 키메릭 단백질은 원래 키메릭 단백질을 발현하는 세포에서 상기 라이브러리를 스크리닝함으로써 동정된다. 또 다른 실시양태에서, 상기 제2 키메릭 단백질은 독립적으로 동정된다.

키메릭 징크 핑거 단백질의 조절 특성 프로파일링

세포의 표현형질을 변경시키는 키메릭 폴리펩타이드는 그것이 직접적으로 혹은 간접적으로 조절하는 내생 유전자들을 동정하기 위하여 추가로 특징이 분석될 수 있다. 전형적으로, 상기 키메릭 폴리펩타이드는 세포 내에서 생산된다. 적당한 시기에 예컨대, 표현형질 변화가 일어나기 전, 후 또는 그 동안에 상기 세포는 세포 내 혹은 세포 주위의 배지 내에 전사물들 또는 단백질들의 농도를 결정하기 위해 분석된다. 예를 들면, mRNA는 상기 세포로부터 회수되어 핵산 마이크로어레이를 이용하여 분석될 수 있다.

핵산 마이크로어레이들은 다양한 방법들 예컨대, 광석판인쇄 방법들(미국특허 제 5,510,270 호 참조), 기계적 방법들 (예컨대, 미국 특허 제 5,384,261 호에 기술된 바와 같은 지정-유동 방법들), 및 핀-기반 방법들 (예컨대, 미국 특허 제 5,288,514 호 참조)에 의해 조립될 수 있다. 상기 어레이는 각각의 구획에 특이한 포획 탐침으로 합성되는데, 각각의 포획 탐침은 특정한 발현 유전자에 대한 핵산을 검출하기에 적당하다.

원핵세포 및 진핵세포의 RNAs를 분리하는 방법들은 공지되어 있다. 분리된 RNAs는 역-전사될 수 있고, 선택적으로는 예컨대, 미국 특허 제 4,683,202 호에 기술된 바와 같이 RT-PCR에 의해 증폭될 수 있다. 상기 핵산은 증폭 또는 역전사 동안에, 예컨대, 표지된 뉴클레오타이드의 도입에 의해 표지될 수 있다. 바람직한 표지의 예시로는 형광 표지류 예컨대, 적색-형광 염료 Cy5(Amersham) 또는 녹색-형광 염료 Cy3(Amersham)를 포함한다. 다르게는, 상기 핵산은 바이오틴으로 표지되어, 표지된 스트렙타비딘 예컨대, 스트렙타비딘-피코에리트린(Molecular Probes)과의 혼성화 후에 검출될 수 있다.

상기 표지된 핵산은 그 후에 상기 어레이와 접촉된다. 또한, 대조군 핵산 또는 기준 핵산이 동일한 어레이에 접촉될 수 있다. 상기 대조군 핵산 또는 기준 핵산은 시료 핵산과는 다른 표지 예컨대, 서로 다른 방출 최대값을 갖는 표지로 표지될 수 있다. 표지된 핵산들은 혼성화 조건 하에서 어레이에 접촉된다. 상기 어레이는 세척된 후, 상기 어레이의 각 구획에서의 형광을 검출하기 위해 영상화된다.

프로필들을 제조하고 평가하기 위한 일반적인 모식도는 상기 어레이의 각 구획에서의 혼성화를 검출하는 것을 포함한다. 각 구획에서의 혼성화 정도는 수치 값으로 나타내어지고, 예컨대, 벡터, 1차원 기질, 또는 1차원 어레이 내에 저장된다. 벡터 x는 상기 어레이의 각 구획에 대한 값을 갖는다. 예를 들면, 특정 구획에서 혼성화 정도에 대한 수치 값은 변수 x_a로 저장된다. 상기 수치 값은, 예컨대, 국소적 배경 수준들, 시료량, 및 상이한 변화들에 대해 조절될 수 있다. 핵산은 또한 기준 시료로부터 제조되어 동일하거나 다른 어레이에 혼성화된다. y는 x와 동일하게 구성된다. 시료 발현 프로필 및 기준 프로필은, 예컨대, 상기 두 벡터들의 함수인 수학 방정식을 이용하여 비교될 수 있다. 상기 비교는, 예컨대, 상기 두 프로필들의 유사성을 나타내는 수치인 스칼라 값으로서 평가될 수 있다. 각각의 또는 이들 모두는 상기 어레이에 의해 검출된 상이한 유전자들에 대한 중요도들을 합산하기 위하여 행렬에 의해 전환될 수 있다.

발현 데이터는 데이터베이스, 예를 들어 SQL 데이터베이스 (예: 오라클(Oracle) 또는 사이베이스 (Sybase) 데이터베이스 환경)와 같은 연관 데이터베이스에 저장될 수 있다. 데이터베이스는 여러 개의 표를 가질 수 있다. 예를 들어, 처리되지 않은(raw) 발현 데이터를, 각 세로행은 분석되는 유전자 (예: 구획 또는 어레이)에 해당하고, 각 가로열은 시료에 해당하는 하나의 표에 저장할 수 있다. 별도의 표는 식별자, 및 사용된 어레이의 배치(batch) 숫자, 날짜 및 다른 품질 관리 정보 등의 시료 정보를 저장할 수 있다.

유사하게 조절되는 유전자들은, 함께 조절되는 유전자들을 동정하기 위해 발현 데이터를 클러스터화(clustering)하여 동정할 수 있다. 이러한 클러스터는 키메라 징크 핑거 단백질에 의해 대등하게 조절되는 유전자 군임을 의미한다. 유전자는 위계적 클러스터화(hierarchical clustering) (예: 문헌 [Sokal 및 Michener Univ. Kans. Sci. Bull. 38:1409 (1958)] 참조), 베이시언 클러스터화(Bayesian clustering), 카파 평균 클러스터화(k-means clustering), 및 자체조직 지도(self-organizing maps) (문헌 [Tamayo 등, Proc. Natl. Acad. Sci. USA 96:2907 (1999)] 참조)를 사용하여 클러스터화할 수 있다.

시료 발현 프로필의 기준 발현 프로필 (예: 대조 세포)과의 유사성은, 예를 들어 시료 발현 수준의 로그를 프리딕터(predictor) 또는 기준 발현 값의 로그와 비교하고, 이 비교 결과를 프로필 내 예시값의 모든 유전자에 대한 중요도에 의해 조정함으로써 결정될 수 있다.

단백질들은 또한, 내부에 활성화된 키메릭 단백질들을 가진 세포 내에서 프로파일링될 수 있다. 단백질을 프로파일링하는 한 예시적 방법은 개별 단백질 종류를 분석하기 위한 2-D 겔 전기영동 및 질량 분석기를 포함한다. 2-D 겔 상의 각각의 점들은 단백질 분해된 후, 질량 분석기에서 분석된다. 이 방법은 단백질 구성 성분 및 많은 경우, 번역적 변경들을 확인할 수 있다.

단백질 및 핵산 프로파일링 방법들은 키메릭 단백질의 특성에 관한 정보뿐만 아니라, 세포 내부에서 작동하는 천연 기구들에 관한 정보를 제공한다. 예를 들면, 키메릭 단백질의 발현에 의해 상향 조절된 단백질들 또는 핵산들은 키메릭 단백질의 발현으로 인한 표현형적 변화의 천연적 효과기일 것이다.

또한, 다른 방법들이 인공 키메릭 단백질에 의해 직, 간접적으로 조절되는 표적 유전자 및 단백질들을 확인하는 데 이용될 수 있다. 일 실시예에서, 인공 키메릭 단백질의 표현형적 효과를 상쇄하는 (예컨대, 억제하는) 변경들이 분석된다. 이 변경들은 염색체 유전자에서의 돌연변이들 및 특정 유전자의 과발현 등과 같은 유전적 변경들 역시 포함한다.

특정 실시예에서, 세포 (예컨대, 병원성 박테리아 세포)에서 조건적으로 발현되었을 때 성장 장애 또는 치명성을 유발하는 키메릭 ZFP가 분리된다. 이러한 ZFP는 ZFP 코딩 핵산들을 포함하는 ZFP 라이브러리로 세포를 형질전환시키고 유도성 프로모터에 의해 조절되는 핵산을 발현시킴으로써 동정할 수 있다. 형질전환체들을 비-유도성 배지에서 배양한 후, 유도 및 비-유도성 플레이트 양쪽에 복제-도말(replica-plate)한다. 비-유도성 플레이트에서는 정상적으로 성장하나 유도성 플레이트에서는 성장 결함을 보이는 콜로니들은, "조건적 치사" 또는 "조건적 성장 결함" 콜로니들로 동정된다.

(a) cDNA 라이브러리를 사용한 표적 유전자들의 동정

cDNA 발현 라이브러리를 상기 기재된 "조건적 치사" 또는 "조건적 성장 결함" 균주들로 형질전환한다. 형질전환체들은 유도성 플레이트에 도말된다. 결함을 유발하는 ZFP의 존재 및 발현에도 불구하고 살아남은 콜로니들이 분리된다. 결함을 보완하는 cDNA의 핵산 서열들이 분석된다. 이 cDNA들이 결함을 매개하는 키메릭 ZFP에 의해 조절되는 직, 간접적인 표적 유전자의 전사물들일 수 있다.

(b) 제2 ZFP 라이브러리를 사용한 표적 유전자들의 동정

상기 최초 키메릭 단백질의 효과를 억제하는 제2 의 키메릭 단백질들을 동정한다. (상기 최초 키메릭 단백질의 존재 또는 부재중에) 제2 의 키메릭 단백질의 표적들을 동정한다.

예를 들면, ZFP 라이브러리를 "조건적 치사" 또는 "조건적 성장 결함" 콜로니들(결함을 유발하는 상기 최초 키메릭 ZFP를 포함하는 콜로니들)로 형질전환한다. 상기 형질전환체들을 유도성 플레이트들에 도말한다. 도입된 ZFP의 발현으로 살아남은 콜로니들은 "억제된 균주들"로 동정된다. 제2 ZFP의 표적 유전자들은 DNA 마이크로어레이 분석에 의해 분석될 수 있다. 비교 분석은 4 개의 균주들 사이에서 수행될 수 있다: 1) ZFP 없이; 2) 최초 ZFP만으로; 3) 제2 ZFP만으로; 및 4) 최초 및 제2 ZFP로. 예를 들면, 최초 및 제2 키메릭 ZFP들에 의해 상반되는 방향으로 조절되는 유전자들은 성장-결함 표현형질을 매개하는 표적에 대한 후보들이다. 이 방법들은 성장 결함 뿐 아니라 어떤 표현형질에도 적용가능하다.

(c) 발현 프로파일링 분석에 의해 확인된 공동-조절되는 유전자들

상기 키메릭 ZFP의 후보 표적은 발현 프로파일링에 의해 확인될 수 있다. 이어서, 후보 표적들이 키메릭 ZFP의 표현형질을 매개하는 지를 확인하기 위하여, 후보 표적이 개별적으로 과-발현되거나 저해 (예컨대, 유전적 결실)될 수 있다. 또한, 적어도 일부 경우들에 있어서는, 표현형질을 유발하기 위하여 한 후보 이상이 교란되어야 하기 때문에 상기 분석을 다중 후보 표적들에 적용할 수도 있다.

(d) 경시 분석(Time-Course Analysis)

키메릭 ZFP의 표적들은 세포가 키메릭 ZFP에 노출된 후의 시간에 따른 유전자 발현의 변화로 확인할 수 있다. 예를 들어, 키메릭 ZFP 코딩 유전자들은 유도성 프로모터에 부착될 수 있다. 예시적 유도성 프로모터는 독시사이클린(doxycycline)과 같은 소분자에 의해 조절된다. 키메릭 ZFP를 코딩하는 유전자는 세포 안으로 도입된다. 유도성 프로모터를 유도시키고, 다양한 시간대에 세포로부터 mRNA 샘플들을 획득한다.

표적 DNA 부위 확인

키메릭 DNA 결합 단백질에 대해서, 목적하는 표현형질을 만드는 키메릭 DNA 결합 단백질의 표적 부위를 결정하는 데 다양한 방법들이 사용될 수 있다. 이러한 방법들은 상기 표적 부위를 찾기 위하여 단독 또는 조합으로 사용될 수 있다.

일 실시양태에서, 키메릭 징크 핑거 단백질에 의해 인식되는 표적 부위를 확인하기 위하여 발현 프로필의 정보가 사용된다. 모든 또는 다수의 조절 영역들에서 공통되는 모티프를 찾기 위하여, 키메릭 징크 핑거 단백질에 의해 공동-조절되는 유전자의 조절 영역들이 비교된다.

또 다른 실시양태에서, 어떤 DNA 부위가 키메릭 징크 핑거 단백질에 의해 결합되는 지 결정하기 위해 생화학적 방법들이 사용된다. 예를 들어, 키메릭 징크 핑거 단백질이 결합하는 핵산을 분리하기 위하여 크로마틴 면역-침강 실험을 사용할 수 있다. 분리된 핵산은 PCR 증폭되고 서열 분석된다. 예를 들어, 문헌 (Gogus 등, Proc. Natl. Acad. Sci. USA. 93:2159-2164 (1996))을 참조하라. SELEX 법은 사용 가능한 또 다른 예시적 방법이다. 더 나아가, 표적 부위를 예측하기 위하여, 키메릭 징크 핑거 단백질에서 개별 징크 핑거 도메인의 결합 특이성에 대한 정보가 사용될 수 있다. 상기 예측은 입증되거나, 다른 결과들 (예컨대, 크로마틴 면역 침강법, 공동-조절되는 유전자들의 컴퓨터 가상실험(in silico analysis) 분석 및 SELEX)을 해석하는 지표가 될 수 있다.

또 다른 실시양태에서, 잠재적 표적 부위는 각각의 구성 징크 핑거의 결합 특이성에 대한 정보에 기초하여 추론된다. 예를 들어, CSNR, RSNR 및 QSNR 도메인들은 다음과 같은 저마다의 DNA 결합 특이성을 갖는다: GAC, GAG 및 GAA. 5'에서 3' 순으로 표적 부위 한 가닥(strand)을 획득하기 위하여, C-말단에서 N-말단 순으로 도메인을 고려하고 그들의 인식 특이성들을 연결시킴으로써 예측 표적 부위가 형성된다.

비록 대다수의 경우에 키메릭 징크 핑거 단백질들이 전사적 조절자들로서 기능하는 경향이 있긴 하지만, 일부 경우에는 키메릭 징크 핑거 단백질들이 RNA 또는 단백질 부위에 결합함으로써 그들의 표현형질에 대한 영향을 중재하는 것도 가능하다. 일부 자연-발생형 징크 핑거 단백질들은 사실상 고분자에 결합한다.

징크 핑거 단백질의 추가적 기능

하나, 둘, 셋, 넷 또는 그 이상의 징크 핑거 도메인들 외에도, 인공 폴리 펩타이드는 조절성 도메인 또는 여기 기재된 다른 특징들을 임의적으로 포함할 수 있다. 조절성 도메인들은 활성화 도메인 및 억제성 도메인들을 포함한다. 박테리아에서는 활성화 도메인 기능이, 야생형 RNA 폴리머레이즈 알파 구성단위 C-말단 도메인 또는 돌연변이 알파 구성단위 C-말단 도메인 (예컨대, 단백질 상호작용 도메인에 융합된 C-말단 도메인)을 소집하는(recruit) 단백질에 의해 모방될 수 있다. 박테리아의 활성화 도메인들은 박테리오파지의 T4Gp45-Gp55 복합체, CRP라고도 알려진 계층 II 대사물 활성화 단백질, 및 박테리오파지 Mu Mor 단백질(문헌 [Hochschild 및 Dove, Cell. 92: 597-600, 91998)]을 참조)을 포함한다. 박테리아의 억제성 도메인 또한, 많은 경우, RNA 폴리머레이즈 알파 서브유닛의 C-말단 도메인에 결합함으로써 작용한다(Hochschild 및 Dove, Cell. 92: 597-600 (1998)).

펩타이드 링커들. 징크 핑거 도메인들은 다양한 링커에 의해 연결될 수 있다. 링커의 유용성과 디자인은 공지되어 있다. 특히 유용한 링커는 핵산에 의해 코딩되는 펩타이드 링커이다. 따라서, 제1 DNA 결합 도메인, 펩타이드 링커 및 제2 DNA 결합 도메인을 코딩하는 합성 유전자를 제조할 수 있다. 이러한 디자인은 규모가 큰, 합성의, 복수-도메인 DNA 결합 단백질을 제조하기 위해 반복될 수 있다. 국제특허출원 제 WO 99/45132 호, 및 킴 및 파보(Kim 및 Pabo, Proc. Natl. Acad. Sci. USA 95:2812-7 (1998))는 징크 핑거 도메인들을 연결하는 데 적합한 펩타이드 링커의 디자인을 기술하고 있다.

무작위 코일, α-나선 또는 β-주름의 3차 구조를 형성하는 추가적인 펩타이드 링커를 사용할 수 있다. 유연성 있는 적합한 링커를 형성하는 폴리펩타이드가 공지되어 있다(예컨대, [Robinson 등, Proc. Natl. Acad. Sci. USA. 95:5929-34 (1998)] 참조). 유연성 있는 링커는 전형적으로 글리신을 포함하는데, 이는 글리신이 측쇄가 결여되어 있어서 회전 자유도가 있는 유일한 아미노산이기 때문이다. 친수성을 증가시키기 위하여 세린 또는 트레오닌을 링커에 삽입할 수 있다. 아울러, 결합 친화도를 증가시키기 위해 DNA의 인산 골격과 상호작용할 수 있는 아미노산이 사용될 수 있다. 이러한 아미노산들의 현명한 사용으로 친화도의 증가와 서열 특이성의 감소 사이의 균형을 잡을 수 있다. 만약, 링커가 엄격한 신장성을 요구한다면, 문헌 [Pantoliano 등, Biochem. 30:10117-10125 (1991)]에 기술된 나선형 링커와 같은 α-나선 링커를 사용할 수 있다. 또한 링커는 컴퓨터 모델링에 의해 디자인될 수 있다(미국 특허 제 4,946,778 호 참조). 분자 모델링을 위한 소프트웨어는 상업적으로 입수할 수 있다(예컨대, Molecular Simulation, Inc., San Diego, CA). 이러한 링커는, 단백질 공학 분야에서 실시되는 표준 돌연변이 유도 기술 및 적절한 생물리학적 테스트, 및 본 명세서에 기술된 기능적 분석법을 사용하여, 예를 들어, 항원성을 감소시키고/시키거나 안정성 증가 등을 위해 임의적으로 최적화된다.

징크 핑거 도메인을 활용한 구체예들을 위해, 징크 핑거 사이에서 자연적으로 발견되는 펩타이드를, 핑거들을 함께 연결하기 위한 링커로서 사용할 수 있다. 그러한 자연적으로 발견되는 링커로서 전형적인 것은 'Thr-Gly-(Glu-Gln)-(Lys-Arg)-Pro-(Tyr-Phe) (서열번호: 115)'이다.

이량체화 도메인. DNA 결합 도메인들을 연결하는 또 다른 방법은 이량체화 도메인, 특히 이종 이량체화 도메인(문헌 [Pomerantz 등, Biochemistry 37:965-970 (1998)] 참조)을 사용하는 것이다. 이러한 예에서는 DNA 결합 도메인이 별개의 폴리펩타이드 사슬로 존재한다. 예를 들어, 첫 번째 폴리펩타이드는 DNA 결합 도메인 A, 링커 및 도메인 B를 코딩하는 반면, 두 번째 폴리펩타이드는 도메인 C, 링커 및 도메인 D를 코딩한다. 당업자는 특성이 밝혀진 많은 이량체화 도메인들로부터 하나의 이량체화 도메인을 선별할 수 있다. 동종 이량체가 바람직하지 않다면 이종 이량체화를 선호하는 도메인이 사용될 수 있다. 특히 적용가능한 이량체화 도메인은 코일화된-코일 모티프, 예를 들어 이량체 평행 또는 역평행 코일화된 코일이다. 우선적으로 이종 이량체를 형성하는 코일화된 코일 서열을 또한 이용할 수 있다(Lumb 및 Kim, Biochemistry 34:8642-8648 (1995)). 이량체화 도메인의 또 다른 종류로 이량체화가 소분자에 의해 또는 신호전달 경로를 통해 유발되는 것이 있다. 예를 들어, FK506의 이량체 형태는 두 개의 FK506 결합 단백질(FKBP) 도메인들을 이량체화하는 데 사용될 수 있다. 이러한 이량체화 도메인은 추가적인 조절 단계를 제공하기 위해 이용될 수 있다.

징크 핑거 단백질의 발현

본 명세서에 기재된 방법은 분자생물학, 생화학, 전통적인 유전학, 및 재조합 유전학의 분야에서 사용되는 통상적인 기술들을 포함할 수 있다. 본 발명에서 사용된 일반적인 방법들을 나타낸 기본서는 샘브룩(Sambrook 등, Molecular Cloning, A Laboratory Manual 2nd ed. (1989)); 크라이글러(Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990)); 및 오스벨(Ausubel 등, eds., Current Protocols in Molecular Biology (1994))을 포함한다.

본 명세서에 기재된 다른 방법들 외에도, 합성 올리고 뉴클레오타이드를 합성 유전자를 구축하는 링커로 사용함으로써 징크 핑거 단백질들을 코딩하는 핵산을 제조할 수 있다. 다른 실시예에서, 합성 올리고 뉴클레오타이드 및/또는 프라이머들은 하나 이상의 징크 핑거 도메인 코딩 서열 (예컨대, RNA 또는 DNA 주형, 인공 또는 합성 서열)을 증폭하기 위하여 사용된다. 미국 특허 제 4,683,195 호 및 제 4,683,202 호; 문헌 [PCR Protocols: A Guide to Methods and Applications (Innis 등, eds, (1990))]를 참조하라. mRNA, cDNA, 및 게놈 DNA, cDNA, 또는 징크 핑거 단백질의 라이브러리들로부터 직접적으로 핵산 서열들을 증폭하기 위해 PCR과 같은 방법들이 사용될 수 있다. 여기에서 제공되는 서열들을 사용해 동족체들을 증폭시키기 위하여 축퇴성 올리고 뉴클레오타이드들이 고안될 수 있다. 엔도뉴클리에이즈(endonuclease) 부위들이 프라이머로 도입될 수 있다.

징크 핑거 단백질의 유전자 발현은 공지된 기술들 예컨대, 역전사 및 mRNA의 증폭, 총 RNA 또는 폴리 A⁺RNA의 분리, 노던 블롯팅, 점 블롯팅, 인 사이투 혼성법(in situ hybridization), RNase 보호, 핵산 어레이 기술 등과 같은 기술들에 의해 분석될 수 있다.

인공 징크 핑거 단백질을 코딩하는 폴리뉴클레오타이드는 복제 및/또는 발현을 위하여 원핵세포 또는 진핵세포로 형질전환되기 전에 벡터로 클로닝될 수 있다. 이 벡터들은 보통 원핵세포의 벡터들 예컨대, 플라스미드, 파지 또는 셔틀 벡터들이거나 진핵세포의 벡터들이다.

단백질 발현. 인공 징크 핑거 단백질을 코딩하는 폴리뉴클레오타이드의 재조합 발현 (예컨대, 높은 수준의 발현)을 획득하기 위하여, 관련 코딩 핵산을 발현 벡터에 서브클로닝할 수 있는데, 이때 발현 벡터는 전사를 이끌 강력한 프로모터, 전사/번역 종결자, 및 번역 개시를 위한 리보솜 결합 부위를 포함한다. 적절한 박테리아의 프로모터들이 공지, 기재되어 있는데, 예컨대, 샘브룩(Sambrook 등) 및 오스벨(Ausubel 등)(상기 문헌 참조)이 그 예이다. 발현을 위한 박테리아의 발현계는 예컨대, 대장균(E. coli), 바실러스 종(Bacillus sp.) 및 살모넬라(Palva 등, Gene 22:229-235 (1983); 및 Mosbach 등, Nature 302:543-545 (1983))에서 사용가능하다. 이러한 발현계를 위한 킷트들은 상업적으로 입수가능하다. 포유류 세포, 효모 (예컨대, 사카로마이세스 세레비지애(S. cerevisiae), S. 폼베(S. pombe), 피치아(Pichia), 및 한세눌라(Hansenula)) 및 곤충 세포들을 위한 진핵세포의 발현계는 공지되어 있고, 상업적으로 입수가능하다.

이종유래 핵산의 직접적인 발현을 이끄는 데 사용되는 프로모터의 선택은 특정 용도에 따라 결정된다. 프로모터와 이종유래 전사 개시 지점과의 거리는, 자연형에서의 프로모터와 전사 개시 지점과의 거리와 같은 정도가 바람직하다. 그러나, 공지된 바와 같이, 프로모터 기능이 상실되지 않는다면, 상기 거리에서 일부 변형이 이루어질 수도 있다.

키메릭 징크 핑거 단백질을 코딩하는 핵산 서열은, 인공 폴리펩타이드를 조절가능하게 발현시킬 수 있는 벡터 예컨대, 강 및 김(Kang 및 Kim, J Biol Chem 275:8742 (2000))에 기재된 바와 같은 유도성 발현 벡터로 클로닝될 수 있다. 상기 유도성 발현 벡터는 조절가능한 프로모터 또는 조절 서열을 포함할 수 있다. 인공 폴리펩타이드의 발현을 조절하는 유용한 프로모터 또는 서열은, 일정 조건들 하에 선택적으로 활성화되고 억제되는 것들이다. 조절가능한 프로모터들은 환경적인 변수 예컨대, 열적 변화, 호르몬, 금속, 대사물, 항체, 또는 화학 약품에 반응을 잘 일으키는 프로모터들을 포함한다. 프로모터 또는 서열을 조절할 수 있는 매개물들의 농도를 조절함으로써, 표적 원핵세포 유전자 (예컨대, 내생 유전자)의 발현이 농도 의존적인 방식으로 조절될 수 있다.

대장균에서의 사용에 적합한 조절가능 프로모터들은 lac, tac, trp, trc, 및 tet 작동부위 서열 또는 오페론의 전사 인자 결합 부위를 포함하는 프로모터, 알칼린 포스파테이즈 프로모터(alkaline phosphatase promoter ; pho), araBAD 프로모터와 같은 아라비노즈 프로모터(arabinose promoter), 람노즈 프로모터(rhamnose promoter), 프로모터들 자체, 또는 프로모터의 기능적 단편을 포함한다 (예를 들어, 문헌 [Elvin 등, Gene 37: 123-126 (1990)] ; [Tabor 및 Richardson, Proc. Natl. Acad. Sci. U. S. A. 1074-1078 (1998)] ; [Chang 등, Gene 44 : 121-125 (1986)] ; [Lutz 및 Bujard, March Nucl. Acids. Res. 25: 1203-1210 (1997)] ; [D. V. Goeddel 등, Proc. Nat. Acad. Sci. U.S.A., 76:106-110 (1979)] ; [J. D. Windass 등, Nucl. Acids. Res., 10:6639-57 (1982)] ; [R. Crowl 등, Gene, 38:31-38 (1985)] ; [Brosius, Gene 27: 161-172 (1984)] ; [Amanna 및 Brosius, Gene 40 : 183-190 (1985)] ; [Guzman 등, J. Bacteriol., 174: 7716-7728 (1992)] ; 및 [Haldimann 등, J. Bacteriol., 180: 1277-1286 (1998)] 참조). lac 프로모터와 같은 유도성 프로모터 시스템은 억제 분자 또는 유도 분자들에 의해 결합될 수 있다. lac 프로모터는 락토오스 또는 이소프로필-베타-D-티오갈락토사이드(isopropyl-beta-D-thiogalactoside; IPTG)와 같은 구조 유사 분자들에 의해 유도되며, 글루코오스에 의해 억제된다. 일부 유도성 프로모터들은, 예컨대, 억제 분자의 비활성과 같은 억제해소(derepression) 과정에 의해 유도된다.

조절가능한 프로모터 서열은 또한 간접적으로 조절될 수 있다. 간접적 조절을 위해 설계될 수 있는 프로모터의 예들은 다음과 같은 것들을 포함한다: 파지 람다 P_R ,-P_L, 파지 T7, SP6, 및 T5 프로모터들. 예를 들어, 조절성 서열은, 예컨대, 환경적인 변수와 같은 그의 발현이 조절되는 인자들에 의해 억제되거나 활성화된다. 이러한 프로모터의 한 예는 T7 프로모터이다. T7 RNA 폴리머레이즈의 발현은 lac 프로모터와 같은 환경적으로-반응하는 프로모터에 의해 조절될 수 있다. 예를 들면, 세포는 T7 RNA 폴리머레이즈를 코딩하는 서열 및 환경 변수에 의해 조절되는 조절성 서열(예컨대, lac 프로모터)을 포함하는 인공 핵산을 포함할 수 있다(Studier, F.W. 및 Moffatt, B.A., J Mol Biol. 189(1):113-30 (1986)). T7 RNA 폴리머레이즈의 활성은 또한, T7 라이소자임과 같은 RNA 폴리머레이즈의 천연 저해제의 존재에 의해 조절된다(Studier, F. W. J Mol Biol. 219(1):37-44 (1991)).

프로모터 외에도, 발현 벡터는 통상적으로 숙주 세포에서 발현에 필요한 모든 추가적인 요소들을 포함하는 전사 단위체 또는 발현 카세트를 포함한다. 따라서, 전형적인 발현 카세트는 코딩 핵산 서열에 작동가능하게 링크된 프로모터 및 숙주 세포 타입에서의 효과적인 발현에 적합한 신호들 예컨대, 전사체의 폴리아데닐레이션(polyadenylation), 리보솜 결합 부위, 및 번역 종결을 포함한다. 카세트의 추가적인 요소들 예컨대, 진핵세포에서의 발현을 위한 요소로는 인핸서를 포함할 수 있으며, 만약 게놈 DNA가 구조적 유전자로서 사용된다면, 기능적 스플라이스 도우너 및 수용체 부위를 가진 인트론을 포함할 수도 있다.

프로모터 서열 외에도, 발현 카세트는 효과적인 종결을 위해 구조적 유전자의 전사 종결 영역 하류를 또한 포함해야 한다. 종결 영역은 프로모터 서열과 동일한 유전자로부터 얻거나 또는 상이한 유전자로부터 얻을 수 있다.

유전적 정보를 세포 내로 수송하는데 사용되는 특정 발현 벡터가 특별히 중요하지는 않다. 진핵세포 또는 원핵세포들에서의 발현에 사용되는 통상적인 벡터들은 모두 사용가능하다. 표준적인 박테리아의 발현 벡터는 pBR322 기반 플라스미드와 같은 플라스미드, pSKF, pET23D, 및 MBP, GST, 및 LacZ와 같은 융합 발현 계를 포함한다. 통상적인 분리법을 제공하기 위하여 에피토프 태그들 또한 재조합 단백질에 첨가될 수 있다: 예컨대, c-myc-, 또는 헥사-히스티딘 태그(hexa-histidine tag).

발현 벡터들은 예를 들면, SV40 벡터, 파필로마(papilloma) 바이러스 벡터, 엡스타인-바(Epstein-Barr) 바이러스로부터 유래된 벡터와 같은 진핵 바이러스의 조절성 요소들을 포함할 수 있다. 다른 예시적 진핵 벡터들은 pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, 배큘로바이러스(baculovirus) pDSVE, 및, CMV 프로모터, SV40 초기 프로모터, SV40 후기 프로모터, 메탈로티오네인(metallothionein) 프로모터, 생쥐 유선 종양 바이러스 프로모터(murine mammary tumor virus promoter), 라우스 육종(Rous sarcoma) 바이러스 프로모터, 다각체단백질(polyhedrin) 프로모터, 또는 진핵세포에서의 발현에 효율성을 나타내는 다른 프로모터의 지시 하에 단백질의 발현을 허용하는 다른 모든 벡터들을 포함한다.

또한, 상기 진핵세포성 벡터들로부터의 단백질 발현은 유도성 프로모터를 사용하여 조절될 수 있다. 내부에 유도 인자에 대한 반응 요소들을 도입한 유도성 프로모터를 사용하여, 발현 수위를 테트라사이클린(tetracycline) 또는 엑디손(ecdysone)과 같은 유도 인자의 농도와 결부시킨다. 일반적으로, 높은 수위의 발현은 오직 유도 인자의 존재하에서만 유도성 프로모터로부터 획득된다; 기본적 발현 수준은 극히 적다. 목적 단백질의 발현이 진핵세포에 해로울 경우에, 유도성 발현 벡터들이 종종 선택된다.

일부 발현계는, 티미딘 카이네이즈(thymidine kinase) 및 디하이드로폴레이트 환원제(dihydrofolate reductase)와 같은 유전자 증폭을 제공하는 마커들을 갖는다. 다르게는, 유전자 증폭과는 관련되지 않는 높은 수율의 발현계들 역시 적합한데, 예를 들어, 다각체단백질 프로모터 또는 다른 강한 배큘로바이러스 프로모터의 지시 하에 있는 미토콘드리아의 호흡연쇄 단백질 코딩 서열 및 당분해 단백질 코딩 서열을 갖는 배큘로바이러스 벡터를 곤충 세포에서 사용하는 것이 가능하다.

전형적으로 발현 벡터에 포함된 요소들은, 대장균에서 작용하는 레플리콘(replicon), 재조합 플라스미드를 포함하는 박테리아의 선별을 위해 항생 물질에 대한 내성을 코딩하는 유전자, 및 진핵 서열의 삽입을 가능하게 하기 위한 플라스미드의 비필수 영역내 특별 제한 부위들을 포함한다. 원핵세포의 서열들은 진핵세포에서 DNA 복제를 방해하지 않도록 선택된다.

대량의 징크 핑거 단백질을 발현하는 박테리아, 포유류, 효모, 또는 곤충 세포의 세포주를 생산하기 위해 표준 형질감염법이 사용되고, 그 후 단백질은 표준 기술들을 이용하여 정제된다 (예를 들어, 문헌 [Colley 등, J. Biol. Chem. 264:17619-17622 (1989)]; 및 [Deutscher, ed., Guide to Protein Purification, in Methods in Enzymology, vol. 182 (1990)] 참조). 진핵세포 및 원핵세포의 형질전환은 표준 기술들에 따라 수행된다 (예를 들어, 문헌 [Morrison, J. Bact. 132:349-351 (1977)]; 및 [Wu 등, eds, Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (1983)] 참조).

외래의 뉴클레오타이드 서열을 숙주 세포에 도입하기 위하여 공지된 어떤 과정도 사용가능하다. 이것은 칼슘 인 형질감염, 세포융합기술(protoplast fusion), 전기 천공법, 리포솜, 미세주입법, 플라스마 벡터, 바이러스 벡터, 및 클로닝된 게놈 DNA， cDNA, 합성 DNA 또는 다른 외래의 유전 물질을 숙주 세포안으로 도입하기 위한 잘 알려진 임의의 다른 방법들의 사용을 포함한다 (예를 들어, 샘브룩(Sambrook 등, 상기 문헌 참조).

발현 벡터가 세포 내로 도입된 후에, 형질감염된 세포들은 발현하기 좋거나 또는 발현을 활성화시키는 조건 하에서 배양된다. 그 후, 세포 추출물, 세포막 구성물 또는 담체, 또는 배지로부터 단백질을 분리할 수 있다.

적합한 조절성 서열들을 가진 발현 벡터들은 또한 모델 생물 예컨대, 초파리, 선충, 제브라피쉬(zebrafish), 개구리 또는 생쥐에서 인공 징크 핑거를 코딩하는 이종유래 유전자를 발현시키는 데 사용될 수 있다 (예를 들어, 문헌 [Riddle 등, eds., C. elegans II. Plainview (NY): Cold Spring Harbor Laboratory Press; (1997)] 참조).

단백질 정제. 예컨대 징크 핑거 단백질은 상기 기재된 모든 적절한 발현계에 의해 생성된 물질들로부터 정제 가능하다.

징크 핑거 단백질들은, 암모늄 설페이트와 같은 물질을 이용한 선택적 침전; 컬럼 크로마토그래피, 친화성 정제법, 면역 정제법 및 그 외의 다른 방법들을 포함하는 표준 기술들에 의하여 상당한 순도로 정제될 수 있다 (예를 들어, 범위, [Protein Purification: Principles and Practice (1982)]; 미국 특허 제 4,673,641 호; [Ausubel 등, 상기 문헌]; 및 [Sambrook 등, 상기 문헌] 참조). 예를 들어, 징크 핑거 단백질들은, 예컨대 다른 단계와 조합하여 정제에 사용될 수 있는 친화성 태그를 포함할 수 있다.

재조합 단백질들은 형질전환된 박테리아에 의해 대규모로 발현되는데, 통상적으로 프로모터 유도 후에 발현된다: 그러나 발현은 지속적일 수 있다. IPTG에 의한 프로모터 유도는 유도성 프로모터 시스템의 한 예이다. 박테리아는 이 기술분야에서 표준적인 과정들에 따라 증식된다. 신선하거나 냉동된 박테리아 세포들이 단백질의 분리를 위해 사용된다. 박테리아에서 발현된 단백질들은 불용성의 집합체("봉입체")를 형성할 수 있다. 몇몇의 프로토콜들이 봉입체로부터 단백질을 정제하는 데 적합하다 (예를 들어, 문헌 [Sambrook 등, 상기 문헌]; 및 [Ausubel 등, 상기 문헌] 참조). 단백질이 용해가능하거나 주변 세포질로 배출되는 경우, 세포 용해물 또는 주변 세포질로부터 수득될 수 있다.

선택적 침전(Differential Precipitation). 염해(Salting-in) 또는 염석(salt-out)은 징크 핑거 단백질 또는 오염시키는 단백질을 선택적으로 침전하는데 사용될 수 있다. 예시적 염으로는 암모늄 설페이트가 있다. 암모늄 설페이트는 단백질의 용해도에 따라 단백질을 침전시킨다. 단백질이 소수성일수록 더 낮은 암모늄 설페이트 농도에서 침전된다. 전형적인 프로토콜은 포화 암모늄 설페이트를 최종 암모늄 설페이트 농도가 20-30% 사이가 되도록 단백질 용액에 첨가하는 것을 포함한다. 상기 농도는 더 많은 소수성 단백질들을 침전시킨다. 침전물은 목적 단백질이 침전되었는지 상등액에 있는지 결정하기 위해 분석된다. 상기 암모늄 설페이트는, 목적 단백질이 침전한다고 알려진 농도에 달하도록 상등액에 첨가된다. 그 후, 침전물은 완충액에서 용해되고, 필요하다면 투석(dialysis) 또는 정용여과(diafiltration)를 통해 여분의 염들이 제거된다.

컬럼 크로마토그래피. 징크 핑거 단백질은 크기, 최종 표면 전하, 소수성, 및 리간드에 대한 친화도를 기반으로 다른 단백질들로부터 분리될 수 있다. 또한, 단백질에 대해 제조된 항체들은 컬럼 매트릭스에 결합되어 단백질들을 면역 정제할 수 있다. 이 모든 기술들은 당업계에 잘 알려져 있다. 크로마토그래피 기술들은 모든 스케일로 수행가능하며, 다수의 상이한 제조업자들의 장비 (예컨대, Pharmacia Biotech)를 사용할 수 있다. 일반적으로, 문헌[Scopes, Protein Purification: Principles and Practice (1982)]를 참조.

이와 유사하게 일반적인 단백질 정제 과정들이, 인공 징크 핑거 단백질의 발현으로 생산이 변화된 (예컨대, 증가된) 단백질들을 생산세포로부터 회수하는 데 사용할 수 있다.

본 발명은 또한 조성물 예컨대, 본 명세서에 기재된 인공 폴리펩타이드, 또는 약학적으로 허용가능한 담체와 함께 조제된 인자와 같은 것을 코딩하는 핵산을 포함하는 약학적으로 허용가능한 조성물을 제공한다.

본 명세서에서 사용된, "약학적으로 허용되는 담체"는 임의의 또는 모든 용매, 분산 매체, 코팅, 항박테리아 및 항진균제, 등장성 및 흡수 지연제, 및 생리적으로 호환될 수 있는 유사물을 포함한다. 바람직하게는, 담체는 정맥내, 근육내, 피하, 비경구, 척추, 상피의 투약 (예를 들어, 주사 또는 주입에 의하여)에 적합한 것이다. 투약의 경로에 따라, 활성 물질은 그 물질을 불활성화할 수 있는 산 혹은 다른 자연적 환경의 작용으로부터 그 물질을 보호하기 위한 재료 내에 코팅될 수 있다.

"약학적으로 허용되는 염"은 원 물질의 바람직한 생물학적 활성을 유지하면서 어떠한 바람직하지 않은 독성 효과(문헌 [Berge, S.M., 등, J. Pharm. Sci. 66:1-19 (1977)] 참조)도 부여하지 않는 염을 지칭한다. 이러한 염의 예에는 산부가염(acid addition salt)과 염기부가염(base addition salt)을 포함한다. 산부가염은 염산, 질산, 인산, 황산, 브롬화수소산, 요드화수소산, 3가 인산 등으로부터 유도된 무독성 무기산 뿐 아니라 지방족 모노- 및 다이카복실산, 페닐로 치환된 알카노산, 하이드록시 알카노산, 방향족 산들, 지방족 및 방향족 설폰산 등과 같은 무독성 유기산으로부터 유래된 염을 포함한다. 염기부가염은 나트륨, 칼륨, 마그네슘, 칼슘 등의 알칼리 토금속에서 유도된 것 뿐 아니라 N,N'-다이벤질에틸렌다이아민, N-메틸글루카민, 클로로프로카인, 콜린, 다이에탄올아민, 에틸렌다이아민, 프로카인 등의 무독성 유기 아민으로부터 유도된 것을 포함한다.

상기 조성물은 다양한 형태가 될 수 있다. 이들은 예를 들어, 액체 용액 (예를 들어, 주사 또는 주입 가능한 용액), 분산제 또는 현탁제, 정제, 환제, 분말제, 및 리포솜과 같은 액체, 반고체 및 고체 제형을 포함한다.

많은 적용에서 투여의 경로/방법은 정맥 주사 또는 주입이지만, 조성물은 공지된 다양한 방법으로 투여될 수 있다. 예를 들어, 조성물은 30, 20, 10, 5, 3, 또는 1 ㎎/분 이하 속도의 정맥 주입으로, 1 내지 100 ㎎/㎡ 또는 7 내지 25 ㎎/㎡의 양이 투여될 수 있다. 투여의 경로 및/또는 방법은 목적하는 결과에 따라 달라질 수 있다. 이러한 제형의 준비를 위한 많은 방법들이 특허되거나 일반적으로 알려져 있다. 예를 들어, 문헌 [J.R. Robinson, ed.,Sustained and Controlled Release Drug Delivery Systems, Marcel Dekker, Inc., New York (1978)] 참조.

투여 처방계획은 최적의 바람직한 반응 (예를 들어, 치료 반응)을 제공하기 위하여 조정될 수 있다. 예를 들어, 한번의 정제가 투여될 수 있고, 여러 번으로 나누어 오랫동안 투여되거나, 투여량을 치료 상황에서의 필요성에 따라 일정 비율로 감소 또는 증가시킬 수 있다. 비경구용 조성을 투여 단위 형태로 조제하는 것은 투여의 용이성과 투여량의 일관성을 위하여 특히 이점이 있다. 본 명세서에 사용된 투여 단위 형태는 치료 대상자에게 단일 투여량으로서 적합한 물리적으로 분리된 단위로; 각 단위는 바람직한 치료효과를 만들기 위하여 계산된, 정량의 활성 혼합물과 필요한 약학적 담체를 포함한다. 투여 단위 형태 설계는 (a) 활성 화합물의 고유한 특성과 성취하고자 하는 특수한 치료효과, 및 (b) 개인별 민감성의 치료를 위해 이러한 활성 성분을 혼합하는 당 분야 고유의 제한점에 달려 있다.

치료 또는 예방적으로 효과적인 단백질 또는 핵산의 예시적인 비-제한 범위는 0.1-20 ㎎/㎏(체중)이며, 더 바람직한 양은 1-10 ㎎/㎏(체중)이다. 조성물은 정맥내 주입법에 의하여 30, 20, 10, 5, 또는 1 ㎎/분의 속도로 1 내지 100 ㎎/㎡ 또는 약 5 내지 30 ㎎/㎡의 투여량에 이르도록 투여될 수 있다. 투여량의 값은 완화되어야 하는 질환의 종류와 심각성에 따라 변화될 수 있다는 것을 유념할 필요가 있다. 임의의 특정 대상에 대하여 특이적 투여계획은 개인의 필요와 투여하는 사람 또는 조성물의 투여를 감독하는 사람의 전문적 판단에 따라 충분한 시간을 두고 조정되어야 하며, 본 명세서에서 설명하는 투여량의 범위는 단지 예이며, 청구된 조성물의 범위 및 실행을 제한하지는 않는다.

세포-기반 치료

세포-기반 치료법은 프로모터에 작동가능하도록 연결된 인공 징크 핑거 단백질을 코딩하는 핵산을 세포 안으로 도입하는 것을 포함한다. 인공 징크 핑거 단백질은 배양 세포에서 내생 유전자를 조절하거나 배양 세포에서 원하는 표현형질을 만들도록 선택될 수 있다. 또한, 핵산 재조합을 사용하여 세포들을 변형하고, 내생 유전자를 조절하는 인공 징크 핑거 단백질을 코딩하는 유전자를 주입하는 것이 가능하다. 상기 세포들은 대상자에게 투여될 수 있다.

생체내 투여는 일반적으로, 변형된 박테리아의 약학적으로 효과적인 양을 함유하는 약제학적 조성물을 투여하는 것을 포함할 수 있다. 상기 약학적으로 효과적인 양은 투여 방식 및 사용된 박테리아 균주에 따라 결정된다. 보통, 약학적으로 효과적인 양은 원하는 반응을 이끌어내는 데 충분한 박테리아의 양이다. 일 실시양태에서, 박테리아 세포의 일정수가 투여된다. 박테리아는 균주의 콜로니 형성 단위(colony forming units ; CFU)의 함수로서 투여될 수 있다. 예를 들어, 1×10³ 및 1×10¹¹ CFU의 박테리아가 1회 복용마다 투여될 수 있다.

일 실시양태에서, 박테리아는 경구로 투여될 수 있다. 예를 들어, 문헌 [Angelakopoulos H, 등, Infect Immun. 70(7):3592-601 (2002)]를 참조. 간단히, 박테리아는 배양되고 원심분리에 의해 펠렛화되어, 보통의 식염수로 두 번 세척된다. 투여를 위해, 박테리아는 보통의 식염수 또는 위산을 완충시킬 수 있는 용액 (예컨대, 수크로오스를 함유한 시트레이트 버퍼(pH 7.0); 바이카보네이트 버퍼 단독(pH 7.0)([Levine 등, J. Clin. Invest., 79:888-902 (1987)] ; 및 [Black 등, J. Infect. Dis., 155:1260-1265 (1987)]), 또는 아스코르빈산, 락토오스, 및 선택적으로 아스파탐을 함유한 바이카보네이트 버퍼(pH 7.0)(Levine 등, Lancet, II:467-470 (1988))를 사용하여 특정의 혼탁도로 재현탁된다. 다르게는, 상기 완충 용액은 박테리아의 섭취(ingest) 전에 섭취된다. 박테리아는 적절한 약학적으로 허용가능한 담체와의 조합으로 약학 조성물로 조제될 수 있다. 상기 적절한 담체는, 예를 들어 탈지 우유에서 발견되는 것과 같은 단백질, 수크로오스와 같은 당류 또는 폴리비닐피롤리돈을 포함한다. 통상적으로 상기 담체는 약 0.1-90% (w/v)의 농도로 사용되고, 더욱 바람직하게는 1-10% (w/v)의 농도로 사용될 수 있다. 박테리아는 단독으로, 또는 적절히 혼합하여 사용될 수 있을 뿐 아니라, 다른 약학적으로 활성화된 화합물과 조합하여 사용될 수 있다. 박테리아는 보조제와의 조합으로 투여될 수 있다. 박테리아는 정제, 캡슐, 분말제, 과립, 연고, 용액, 좌약, 및 주사와 같은 고체, 반고체, 또는 액체의 형태로 조제되어, 국소, 비강, 경구, 비경구, 또는 수술 투여의 통상적인 방법으로 사용될 수 있다. 생체내 투여로는 경구, 비점막, 기관지, 비경구, 피하, 정맥내, 동맥내, 근육내, 장기내, 종양내, 또는 수술이 될 수 있다. 투여는 세포가 표면 또는 내부에 심겨질 기질을 임의로 포함하는 이식형 용기 (예컨대, 생물 분해성이거나 반투성의 쉘, 캡슐, 튜브, 또는 박테리아의 운반을 위한 다른 장치)의 사용을 포함할 수 있다. 투여의 경로는 표적된 숙주 세포에 적절하도록 선택될 수 있다. 또한, 표적 세포는 대상자로부터 제거되거나 생체 외에서 다루어질 수 있고, 그 후 대상자에게 재투여될 수 있다. 생체내 투여를 위한 그 외의 예시적인 방법들은, 문헌 [Shen 등, Proc Natl Acad Sci USA 92(9):3987-3991 (1995)]; [Jensen 등, Immunol Rev 158: 147-157 (1997)]; [Szalay 등, Proc Natl Acad Sci USA 92(26):12389-12392 (1995)]; [Belyi 등, FEMS Immunol Med Microbiol 13(3): 211-213 (1996)]; [Frankel 등, J.Immunol 155(10):4775-4782 (1995)]; [Goossens 등, Int Immunol 7(5):797-805 (1995)]; [Schafer 등, J. Immunol 149(1):53-59 (1992)]; 및 [Linde 등, Vaccine 9(2):101-105 (1991)]에 기재되어 있다.

변경된 단백질 생산을 위한 표적

일 실시양태에서, 원핵세포에서 하나 이상의 특정 표적 단백질의 생산, 합성 또는 활성을 변경시키는 인공 징크 핑거 단백질을 동정하기 위해 핵산 라이브러리를 스크리닝한다. 상기 변경은 표적 단백질의 활성이나 양을 증가 또는 감소시킬 수 있다. 스크리닝되는 표현형질은 하나 이상의 표적 단백질의 변경된 생산 또는 활성과 관련된 것이거나 생산량 또는 활성 수위 그 자체가 될 수 있다. 예를 들면, 내생 표적 유전자의 조절가능한 서열 (예컨대, 프로모터)의 제어 하에, 리포터 유전자 (예컨대, 발광효소(luciferase), LacZ, 또는 GFP 코딩 유전자)의 발현을 활성화시키거나 억제시키는 인공 폴리펩타이드에 대해 핵산 라이브러리를 스크리닝하는 것이 가능하다.

본 명세서에 기재된 방법과 조성물들은 모든 표적 유전자 또는 목적 표현형질을 스크리닝하는 데에 적용할 수 있다. 예를 들면, 박테리아 세포는 주어진 효소의 활성에 대해 스크리닝될 수 있다. 증가되거나 감소된 효소 활성량을 갖는 세포들이 분리될 수 있다. 과발현될 수 있는 박테리아 효소는, 산화환원효소(oxidoreductases), 전이효소(transferases), 가수분해효소(hydrolases), 리아제(lyases), 이성화효소(isomerases), 및 합성효소(ligases)등을 포함할 수 있다. 징크 핑거 단백질의 발현은 복수개의 유전자들의 발현을 통합적으로 조절할 수 있는데, 이는 원핵생물의 유전자가 오페론으로 조직화되어 있기 때문이거나 복수개의 개별 부위들에 결합하는 장점 때문이다. 따라서, 본 발명의 방법은 복수개의 유전자의 발현에 복합적인 영향을 위해서 제공되어질 수 있다.

본 발명은 하기 실제적인 실시예를 통해 더욱 구체적으로 기술될 것이다. 그러나, 이들 실시예는 본 발명의 범위를 제한하려는 의도로 제공된 것이 아님에 유의하여야 한다.

실시예 1: ZFP 라이브러리의 구축

일 실시예에서, 징크 핑거 단백질(ZFP) 발현 라이브러리를 이용한 유전자 발현의 조절에 의해 대장균의 다양한 표현형질들을 변경하였다. 이 예시적 라이브러리에서 징크 핑거 단백질들은 3 또는 4 징크 핑거 도메인들로 이루어져 있고, 각각 9- 내지 12- 염기쌍의 DNA 서열을 인식한다. 표적 유전자에 대한 선험적인 정보없이 키메릭 징크 핑거 단백질을 동정하였다. 3-핑거 또는 4-핑거 징크 핑거 단백질들을 포함하는 단백질을 제조하기 위하여 25개의 상이한 징크 핑거 도메인을 모듈성 빌딩 블록(modular building block)으로 사용하였다. 대장균을 상기 ZFP 발현 플라스미드의 라이브러리로 형질전환하였다. 형질전환된 세포 각각에서 상이한 ZFP 폴리펩타이드를 발현시켜, 게놈 중 불특정 표적 유전자들의 조절에 대해 분석할 수 있다. 유전자 발현 양상의 이러한 변경은 표현형질의 변화를 일으킬 수 있다. 또한, 조절된 표적 유전자들은, 형질전환체에 도입된 징크 핑거 단백질을 확인한 후, 게놈 DNA 면역침강법과 표적 DNA 서열의 컴퓨터 가상실험 예측을 조합하여 동정할 수 있다.

(1) 대장균 균주 및 플라스미드

다양한 표현형질의 변화를 스크리닝하는 데 사용된 대장균은 DH5α이었다. 균주 DY330 (W3110 DlacU169 gal490 lcI857D (cro-bioA))은 상동 재조합에 의한 유전자 교란에 사용하였다(Yu 등, Proc Natl Acad Sci U S A. 97(11):5978-83 (2000)). 징크 핑거 단백질의 라이브러리를 구축하기 위한 모 벡터는 플라스미드 p3이었다. 대장균에서 징크 핑거 단백질의 발현에 사용된 플라스미드 벡터는 pZL1이었다.

(2) 플라스미드 p3의 구축

징크 핑거 단백질의 라이브러리를 구축하기 위해 본 발명에서는 플라스미드 p3을 모 벡터로 사용하였다. p3은 하기와 같이 pcDNA3 벡터(Invitrogen, San Diego CA)를 변형하여 제작하였다. 연결가능한 돌출말단(overhangs)을 갖는 합성 올리고 뉴클레오타이드 이중가닥을, HindⅢ 및 XhoI으로 절단한 pcDNA3 벡터에 연결하였다. 상기 이중가닥은 헤마글루티닌(hemagglutinin, HA) 태그와 핵 위치 신호(nuclear localization signal, NLS)를 코딩하는 핵산을 포함한다. 상기 이중가닥은 또한, BamHI, EcoRI, NotI 및 BglⅡ 절단부위들 및 정지 코돈을 포함한다. 이어서, 상기에서 생성된 벡터를 XmaI으로 절단하고 절단부위의 돌출말단을 메운 후, 양 말단을 재연결함으로써, 이 벡터의 SV40 복제기원 내 XmaI 절단부위를 제거하였다.

(3) pZL1의 구축

본 발명에서는 대장균에서 징크 핑거 단백질들의 조건적 발현을 위한 모 벡터로서 pZL1을 사용하였다. pZL1은 pBT-LGF2(Clontech)를 변형하여 V5 에피토프 및 다중 클로닝 부위(multiple cloning sites)를 갖도록 제조된 것이다. pZL1 플라스미드를 제조하기 위하여, 하기의 핵산 서열을 pBT-LGF2의 ClaI 및 NotI 절단부위에 삽입하였다.

ATC GAT AAG CTA ATT CTC ACT CAT TAG GCA CCC CAG GCT TTA CAC TTT ATG CTT CCG GCT CGT ATA ATG TGT GGA ATT GTG AGC GGA TAA CAA TTT CAC ACA GGA AAC AGC GTC CAT GGG TAA GCC TAT CCC TAA CCC TCT CCT CGG TCT CGA TTC TAC ACA AGC TAT GGG TGC TCC TCC AAA AAA GAA GAG AAA GGT AGC TGG ATC CAC TAG TAA CGG CCG CCA GTG TGC TGG AAT TCT GCA GAT ATC CAT CAC ACT GGC GGC CGC (서열번호: 117)

대장균에서 기능하는 ZFP 라이브러리를 제조하기 위하여, p3으로 구축된 라이브러리를 pZL1의 EcoRI 및 NotI 부위에 서브클로닝하였다.

(4) 라이브러리 구축

25개의 상이한 ZFD들을 코딩하는 핵산으로부터, 3개의 징크 핑거로 구성된(3-핑거 라이브러리) 또는 4개의 징크 핑거로 구성된 단백질 라이브러리(4-핑거 라이브러리)를 구축하였다. 3-핑거 또는 4-핑거 ZFP 라이브러리 구축을 위한 징크 핑거 도메인을 하기 표 4에 나타내었다.

표 4의 두 번째 컬럼의 윗첨자는 각각, 1) [Zhang 등, J. Biol. Chem. 275:33850-33860 (2000)]; 2) [Rebar 및 Pabo Science 263:671-673 (1994)] ; 3) [Gogus 등, Proc. Natl. Acad. Sci. USA. 93:2159-2164; 4 (1996)]; 및 [Liu 등, J. Biol. Chem. 276(14):11323-11334 (2001)]를 참조한 것이다. 첫 번째 컬럼의 징크 핑거 도메인 이름 뒤의 소문자 m은 근원 도메인의 돌연변이에 의해 획득된 도메인임을 가리킨다.

"단일 핑거(single fingered)" 벡터를 형성하기 위해, 각 ZFD를 코딩하는 핵산 단편들을 개별적으로 p3 벡터에 클로닝하였다. 각각의 "단일 핑거" 벡터 동량을 합하여 풀(pool)을 형성하였다. 풀의 한 분액을 AgeI 및 XhoI로 절단하여 절단된 단편을 획득하였다. 이 단편들을 30분 동안 포스파테이즈로 처리하였다. 한편, 단일 핑거를 코딩하는 부분을 획득하기 위하여 상기 풀의 또 다른 분액을 XmaI 및 XhoI로 절단하였다. 앞서 제조한 AgeI 및 XhoI로 절단된 풀의 절단된 핵산을, XmaI 및 XhoI로 절단한 벡터의 핵산 단편과 연결하였다. 이 연결로써 각각 2개의 징크 핑거 도메인을 코딩하는 벡터가 생성되었고, 이 벡터로 대장균을 형질전환하였다. 약 1.4×10⁴개의 개별 형질전환체가 획득되었으며, 이로써 2-핑거 라이브러리를 형성하였다. 2-핑거 라이브러리의 삽입 구역의 크기를 40개의 콜로니들의 PCR 분석에 의해 확인하였다. 정확한 크기의 삽입체는 라이브러리 구성원 중 95%로 존재하였다.

3-핑거 라이브러리를 제조하기 위하여, 단일 핑거를 코딩하는 DNA 단편을 2-핑거를 코딩하는 플라스미드에 삽입하였다. 2-핑거 라이브러리를 AgeI 및 XhoI로 절단하였다. 2개의 징크 핑거 도메인을 코딩하는 핵산을 보유한 절단된 플라스미드를, 단일 핑거를 코딩하는 핵산 조각들의 풀(상기에서 XmaI 및 XhoI로 절단하여 제조된 풀)과 연결하였다. 이 연결의 생성물로 대장균을 형질전환하여, 약 2.4×10⁵개의 개별 형질전환체를 획득하였다. 삽입 구역을 확인하여 라이브러리 구성원이 3개의 징크 핑거 도메인을 코딩하는 서열을 주로 포함하고 있음을 확인하였다.

4-핑거 라이브러리를 제조하기 위하여, 2-핑거를 코딩하는 DNA 단편들을 2-핑거를 코딩하는 플라스미드에 삽입하였다. 2개의 징크 핑거 도메인을 코딩하는 핵산 단편을 획득하기 위하여 2-핑거 라이브러리를 XmaI 및 XhoI로 절단하였다. 또한, 절단된 플라스미드의 풀을 획득하기 위하여 2-핑거 라이브러리를 AgeI 및 XhoI로 절단하였다. 4-핑거 단백질의 상이한 조합을 코딩하는 플라스미드 군을 제조하기 위하여, 2개의 징크 핑거 도메인을 코딩하는 핵산 서열을 함유한 절단된 플라스미드를 2개의 징크 핑거 도메인을 코딩하는 핵산 조각들과 연결하였다. 이 연결의 생성물로 대장균을 형질전환하여 약 7×10⁶개의 개별 형질전환체를 획득하였다.

대장균에서 기능하는 ZFP 라이브러리를 제조하기 위하여, 3-핑거 또는 4-핑거 ZFP 삽입체를 pZL1 벡터의 EcoRI 및 NotI 절단부위에 서브클로닝하였다.

실시예 2: 용매 내성 박테리아 세포

인공 키메릭 징크 핑거 단백질로 인해 유기용매에 대해 내성을 갖는 세포를 찾기 위하여, 인공 키메릭 징크 핑거 단백질들을 발현하는 박테리아 세포를 스크리닝하였다. 원핵세포에서의 발현을 위해 구성된 3-핑거 또는 4-핑거 ZFP 핵산 라이브러리로 대장균 균주 DH5α를 형질전환하였다. 형질전환체들을 크로람페니콜(34 ㎍/㎖)이 함유된 LB 배지에서 하룻밤 증식시켰다. 이를 ZFP 발현을 유도하기 위해 1mM IPTG 및 클로람페니콜을 함유한 신선한 LB 1 ㎖에 1:500으로 희석하였다. 30℃에서 3시간 배양 후, 헥산을 1.5%로 첨가하였고, 헥산과 대장균 배양액의 유액을 만들기 위해 즉시 볼텍스 처리해주었다. 이 혼합물을 37℃, 250 rpm 진동기에서 3시간 배양한 후, 클로람페니콜(34 ㎍/㎖)이 함유된 LB 플레이트에 도말하였다. 플라스미드를 증식한 콜로니의 풀로부터 정제하여, DH5α로 형질전환하였다. 형질전환체들을 상기와 같은 방법으로 헥산 처리하였다. 헥산 내성 선별을 2회 추가로 반복하였다. 세 번째 선별 후, 클로람페니콜(34 ㎍/㎖)을 함유한 LB 플레이트에서 증식가능했던 20개의 개별 콜로니들로부터 플라스미드를 회수하였다. 이 플라스미드들을 DH5α로 재차 형질전환하였다. 각 형질전환체들을 상기 기재된 바와 같이 헥산-내성에 대하여 재시험하였다. 헥산 내성을 유도하는 플라스미드들을 코딩된 징크 핑거 단백질을 분석하기 위해 서열 분석하였다.

3개의 상이한 징크 핑거 단백질들을, 대장균 세포에 헥산 내성을 부여하는 능력에 대해 검증하였다. 이 징크 핑거 단백질 각각의 아미노산 서열을 표 7에 나타내었다. 이 단백질들의 각 징크 핑거 도메인의 서열은 표 1의 2 내지 11번째 행(H1.1 내지 H3.4)에 나타내었다. 대장균에서 헥산 내성을 부여하는 단백질의 징크 핑거 모티프 서열 및 DNA 표적 서열은 표 6에 나타내었다. 헥산 내성은 징크 핑거 단백질--H1, H2 및 H3--중 하나를 발현하는 형질전환체의 생존율을 대조군 세포의 생존율과 비교하여 측정하였다. 대조군 세포는 빈 벡터(C1) 또는 ZFP-1을 포함한다. ZFP-1 구조체는 헥산 내성을 부여하지 않으며, 핑거 RDER-QSSR-DSKR를 포함하는 징크 핑거 단백질을 코딩한다. 헥산 내성-부여 징크 핑거 단백질을 발현하는 박테리아 세포들은 헥산 내성에서 200배의 증가를 보여주였다(표 5, 도 1a).

대장균에서 헥산 내성을 부여하는 단백질의 징크 핑거 모티프 서열 및 DNA 표적 서열은 하기 표 6에 나타내었다.

상기 표 6에서 발생수는 세 번째 헥산 내성 스크리닝 후 증식가능했던 9개의 콜로니에서 ZFP의 수를 의미한다.

하기 표 7에는 대장균 표현형질 스크리닝으로부터 분리된 ZFP-TF의 아미노산 서열을 나타내었다.

실시예 3: 내열성 박테리아 세포

세포에게 내열성을 부여하는 징크 핑거 단백질에 대하여 스크리닝하였다. 상이한 징크 핑거 단백질을 코딩하는 핵산 라이브러리로 대장균 세포를 형질전환하고, 클로람페니콜(34 ㎍/㎖)을 함유한 LB 배지에 하룻밤 배양하였다. 이를 ZFP 발현을 유도하기 위해 1 μM IPTG 및 클로람페니콜(34 ㎍/㎖)을 함유한 신선한 LB 1 ㎖에 1:500으로 희석하였다. 30℃에서 3시간 배양 후, 100 ㎕의 배양액을 마이크로-원심분리 튜브에 옮겨 55℃의 물중탕(water bath)에서 2시간 배양하였다. 이 배양액을 클로람페니콜(34 ㎍/㎖)이 함유된 LB 플레이트에 도말하였다. 증식한 콜로니의 풀로부터 플라스미드를 정제하여, DH5α로 형질전환하였다. 내열성에 대한 선별은 재형질전환체를 이용하여 반복하였다. 세 번째 선별 후, 클로람페니콜(34 ㎍/㎖)이 함유된 LB에서 증식할 수 있었던 30개의 개별 콜로니들로부터 플라스미드를 정제하였고, DH5α로 재차 형질전환하였다. 각각의 형질전환체를 상기와 같은 방법으로 내열성에 대해 분석하였다. ZFP 확인을 위해, 내열성을 유도할 수 있었던 플라스미드를 서열 분석하였다.

10개의 상이한 징크 핑거 단백질이 확인되었고, 내열성의 향상은 열 처리에 대한 ZFP 형질전환체의 생존율을 대조군 세포인 C1 또는 ZFP-2의 생존율과 비교하여 분석하였다. 이 징크 핑거 단백질 각각의 아미노산 서열은 표 9에 나타내었다. 이 단백질들의 각각의 징크 핑거 도메인 서열들은 표 1의 12 내지 51번째 행(T1.1 내지 T10.4)에 나타내었다. 핑거 모티프 서열들은 표 8에 나타내었다. C1 또는 ZFP-2는 각각 빈 벡터 또는 내열성에 대한 영향력이 없는 대조군 ZFP(QTHQ-RSHR-QTHR1)를 나타낸다. 야생형 세포의 99.99% 이상이 55℃에서 2시간 열 처리시 사망하였다. 반면, 특정 ZFP-TF로 형질전환된 세포의 약 6%가 상기의 극한 조건에서 생존하였고, 이는 내열성 표현형질에서 700배 -즉, 스트레스 조건하에서 생존한 ZFP-TF 발현 세포의 백분율(6.3%)를 동일 조건 하에서 생존한 C1의 백분율(0.0085%)로 나눔-의 증가를 보인 것이다(도 1b). 하기 표 8은 내열성을 부여하는 ZFPs 및 표적 DNA를 나타낸 것이며, 표 9는 이들 ZFP-TF의 아미노산 서열을 나타낸 것이다.

상기 T9 ZFP는 DNA 결합에 중요한 알기닌 잔기를 알라닌으로 부위-지정 돌연변이하여 더욱 분석하였다. 돌연변이된 T9 ZFP(T9-M)는 대장균에서 열 충격 저항을 유도하는 데 실패하였고(도 1c), 이는 T9 ZFP-TF의 내열성 유도능이 ZFP가 표적 DNA에 결합하는 것에 의한 것임을 나타낸다.

실시예 4: ZFP 표적 유전자의 검출

화학적 또는 UV 돌연변이와는 달리, ZFP 접근법의 장점은 ZFP의 예측 결합 서열을 바탕으로 향상된 표현형질과 관련된 표적 유전자를 확인하고 분석할 수 있다는 것이다.

대장균에서 내열성을 유도하는 T9 ZFP의 표적 유전자를 확인하기 위해, 크로마틴 면역-침강법(chromatin immuno-precipitation) 및 ZFP 결합 부위의 컴퓨터 가상실험 예측이 조합된 접근법을 도입하였다. 변형된 크로마틴 면역-침강법에 의해, T9 ZFP와 교차-결합된 대장균의 게놈 DNA 단편들을 면역-침강하였다(Weinmann 및 Farnham, Methods. 26(1):37-47 (2002)).

간략하게, 대장균 세포를 OD₆₀₀가 1.0∼1.5에 이를 때까지 클로람페니콜 및 1 mM IPTG를 함유한 100 ㎖ LB 배지에서 증식하였다. 포름알데하이드를 최종 농도가 1%가 되도록 배지에 직접 첨가하였다. 고정(fixation)은 실온에서 15분간 부드럽게 교반하고, 글리신을 최종 농도 0.125 M로 첨가함으로써 완료하였다. 세포들을 회수하여 인산염 완충액으로 2회 세척하였다. 세포를 완충액(150 mM NaCl, 50 mM HEPES/KOH pH 7.5, 1 mM EDTA, 10% 글리세롤, 0.1% NP40, 0.17 mM PMSF, 단백질 분해 억제 혼합물, 100 ㎎/㎖ 리소자임)에 재현탁하고, 초음파처리하였다. 그 후, 상기 용액을 원심분리하여, 상등액에 단백질 A 비즈 50 ㎖ 및 담체 DNA 50 ㎎를 첨가하여 4℃에서 1시간동안 예비정화(preclear)하였다. 예비정화된 게놈 DNA를 항-V5 단일클론항체(Invitrogen) 5 ㎕(1:100, vol/vol)와 함께 또는 항체 없이 배양하였고, 4℃에서 12 내지 16시간 회전시켰다. 면역-침강, 세척 및 면역 복합체의 용리는 앞서 기술된 것과 동일하게 2회 수행하였다(Weinmann 및 Farnham, Methods. 26(1):37-47 (2002)). 염화나트륨을 최종농도 200 mM로 첨가함으로써 교차-결합을 분리시키고, RNase A를 샘플당 10 ㎍첨가하고 65℃에서 5시간 배양함으로써 RNA를 제거하였다. 그 후, 샘플에 2.5 부피 에탄올을 첨가하여 20℃에서 하룻밤동안 침전시키고, 원심분리에 의해 펠렛화하였다. 펠렛을 10 mM EDTA, 30 mM Tris(pH 6.5) 및 60 ㎎/㎖ 프로테이나아제(proteinase) K의 용액에 재현탁하였다. 이를 50℃에서 30분간 배양하고 페놀-클로로폼-이소아밀알콜(25:24:1, vol/vol)로 추출한 후, 클로로폼으로 다시 추출하여 침전시켰다. 재현탁된 DNA는 T4 DNA 폴리머레이즈로 처리하여 무딘(blunt-ended) DNA 단편으로 만든 후, HincII로 절단한 pUC19 벡터(Invitrogen)로 클로닝하였다.

포름알데하이드 교차-결합의 분리 및 DNA 정제 후, 침전된 DNA 단편들을 벡터로 클로닝하고 서열 분석하여 각 클론의 인터제닉(intergenic) 구역에 T9 ZFP의 예측 결합 서열이 있는지 조사하였다. 서열화된 200개의 클론들 중, 6개의 클론이 인터제닉 구역에 T9 ZFP의 결합 서열, 즉, 5'-GAA GRA HGA NGG-3' (서열번호:153)과 완벽히 일치하거나, 단일-염기 부정합 결합 서열을 갖는 것을 확인하였다. T9 ZFP는 기능적 도메인과 융합되지 않았으므로 대장균에서 전사적 억제제로서 기능할 것이라 예측된다(문헌 [Kim 및 Pabo, J Biol Chem. 272(47):29795-800 (1997)] 및 [Kang 및 Kim, J Biol Chem. 275(12):8742-8 (2000)] 참조). 대장균에서 상기 T9 ZFP의 내열성 표현형질과의 기능적 연관성을 평가하기 위하여 T9 결합 서열을 갖는 6개의 오픈 리딩 프레임과 관련된 각각의 오픈 리딩 프레임을 넉아웃하였고, 열처리에 대한 세포들의 반응을 시험하였다. 균주 DY330(W3110 DlacU169 gal490 lcI857 D (cro-bioA))은 표적된 동종 재조합에 의한 유전자 교란에 사용되었다(Yu 등, Proc Natl Acad Sci U S A. 97(11):5978-83 (2000)). 표적 유전자의 40-염기쌍 인접 팔(flanking arms)을 사용하여 선형 cat (Cm^R(클로람페니콜 저항)) 카세트(cassette)를 PCR로 증폭하였다. 정제된 선형의 도우너 DNA를 전기 천공법으로 컴피턴트 세포에 도입하였고, 클로람페니콜 함유 LB 플레이트에서 성장하는 콜로니로부터 넉-아웃 돌연변이체를 골라냈다.

교란한 유전자 중 하나가 UbiX 유전자로, 이는 3-옥타프레닐-4-하이드록시벤조에이트 카르복시-라이에이즈(3-octaprenyl-4-hydroxybenzoate carboxy-lyase)를 코딩한다. UbiX 유전자 산물의 아미노산 서열을 하기 표 10에 나타내었다.

UbiX 유전자(ubiX)가 넉-아웃된 균주는 55℃, 2시간 열처리에 대해 열 충격 저항력을 나타냈다. 열처리가 ubiX 균주의 생존력에 미친 영향은 도 2a에 나타내었다. 열-충격된 ubiX 세포들의 배양에서 성장한 플레이트들은 열-충격 대조군 세포들의 배양에서 성장한 플레이트에서보다 훨씬 더 많은 콜로니들을 나타냈다.

정상(normal) 조건 하에서, ubiX 균주는 야생 균주에 비해 천천히 성장하고, 소규모의 콜로니들을 증식한다. 그러나 ubiX 균주는 열 충격의 치명적인 효과에 대해 매우 저항적이었다. ubiX 균주의 생존율을 야생형 및 T9 ZFP 발현 균주와 비교하였다. 생존은 스트레스 조건하에 살아남은 세포수를 보통 조건하에 살아남은 세포수로 나누어 계산한 값으로 비교하였다(도 2a, 오른쪽 패널). 열처리 후 ubiX 및 T9 균주의 생존율은 각각 0.42% 및 0.32%인 반면, 대조균 균주의 생존율은 0.005%이었다. T9 ZFP가 전사 단계에서 UbiX를 억제할 수 있는 지 확인하기 위하여, T9 ZFP로 형질전환된 대장균의 UbiX RNA 수위를 RT-PCR로 분석하였다. RNA는 당업자들의 지침에 따라 트리졸 LS(Trizol LS, Gibco BRL)로 추출하였다. UbiX 유전자 발현의 분석을 위하여, RNA로 UbiX-R 프라이머(5'-CTG GAA AGA ACC GGA AGA GAT GCT G-3') (서열번호: 155)를 사용한 상보성 DNA 합성을 수행하였다. 실시간(Real-time) RT PCR은 UbiX-F(5'-TGA AAC GAC TCA TTG TAG GCA TCA G-3') (서열번호: 156) 및 UbiX-R 프라이머 세트로 광 순환기(Light Cycler, Corbett Research)를 사용하여 수행하였다.

예측했던 대로, UbiX RNA의 수위는 T9 ZFP 발현보다 2배 이상 감소하였다(도 2b). UbiX 유전자는 전사 개시 코돈의 -90 염기쌍 상류 위치에 단일-염기가 부정합된 T9 ZFP 결합부위가 있었다. T9 ZFP가 UbiX 프로모터의 표적 서열에 생체내 결합하는 것은 면역-침강에 의해 입증되었다(도 2c). 컴퓨터 가상실험 결과와 면역-침강, 유전자 넉-아웃 돌연변이 및 T9 ZFP에 의한 전사 억제를 종합해보면, UbiX가 T9 ZFP에 의해 직접적으로 조절되며, UbiX의 온건한(moderate) 억제가 대장균에서 열-충격 저항력을 유도함을 알 수 있다.

UbiX는, 박테리아 및 미토콘드리아에서 호기성 호흡 연쇄의 필수적인 산화 환원 반응 구성 요소인 유비퀴논의 생합성에서 작용한다(문헌 [Gennis 및 Stewart, Escherichia coli and Salmonella: Cellular and Molecular Biology, 2nd ed., p.217-261] 및 [Neidhardt 등, eds. Am Soc. Microbiol.] 참조). 유비퀴논 결핍 균주인 ubiCA가 열에 대한 저항력을 보인다는 것이 보고된 바 있다(Soballe 및 Poole, Microbiol. 146:787-96 (2000)). ZFP에 의한 UbiX의 넉-다운 발현이, 넉-아웃 돌연변이에서와는 달리 성장 결함 없이 열 충격 저항을 유도할 수 있다는 것에 주목하는 것은 흥미롭다. 이 결과는 표적 유전자 발현의 극단적이지 않은(moderate) 조절이 미생물 공정에서 원하는 표현형질을 만들어 낼 수 있음을 제시한다. ZFP 라이브러리 기술은 유전자 발현을 여러 수위의 범위로 조절하는 데 사용될 수 있다.

본 발명에 관한 많은 실시 태양을 기술하였다. 그럼에도 불구하고, 본 발명의 진의 및 범위를 벗어나지 않는 다양한 변형이 가능함을 이해할 것이다. 따라서, 다른 실시 태양들도 후술하는 청구항의 범위에 포함된다.

SEQUENCE LISTING <110> TOOLGEN, INC. <120> REGULATION OF PROKARYOTIC GENE EXPRESSION WITH ZINC FINGER PROTEINS <130> 200606-0184 <150> US 60/532,362 <151> 2003-12-23 <160> 157 <170> KopatentIn version 1.71 <210> 1 <211> 23 <212> PRT <213> Homo sapiens <400> 1 Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu 1 5 10 15 Thr Arg His Gln Arg Ile His 20 <210> 2 <211> 23 <212> PRT <213> Homo sapiens <400> 2 Phe Lys Cys Pro Val Cys Gly Lys Ala Phe Arg His Ser Ser Ser Leu 1 5 10 15 Val Arg His Gln Arg Thr His 20 <210> 3 <211> 24 <212> PRT <213> Homo sapiens <400> 3 Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Ile Ser Ser Asn Leu 1 5 10 15 Gln Arg His Val Arg Asn Ile His 20 <210> 4 <211> 23 <212> PRT <213> Homo sapiens <400> 4 Tyr Thr Cys Ser Tyr Cys Gly Lys Ser Phe Thr Gln Ser Asn Thr Leu 1 5 10 15 Lys Gln His Thr Arg Ile His 20 <210> 5 <211> 23 <212> PRT <213> Homo sapiens <400> 5 Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu 1 5 10 15 Arg Arg His Gly Arg Thr His 20 <210> 6 <211> 24 <212> PRT <213> Homo sapiens <400> 6 Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Ile Ser Ser Asn Leu 1 5 10 15 Gln Arg His Val Arg Asn Ile His 20 <210> 7 <211> 23 <212> PRT <213> Homo sapiens <400> 7 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 8 <211> 23 <212> PRT <213> Homo sapiens <400> 8 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 9 <211> 23 <212> PRT <213> Homo sapiens <400> 9 Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu 1 5 10 15 Ile Arg His Gln Arg Ile His 20 <210> 10 <211> 23 <212> PRT <213> Homo sapiens <400> 10 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 11 <211> 23 <212> PRT <213> Homo sapiens <400> 11 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 12 <211> 23 <212> PRT <213> Homo sapiens <400> 12 Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Thr Lys His Lys Lys Ile His 20 <210> 13 <211> 23 <212> PRT <213> Homo sapiens <400> 13 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 14 <211> 23 <212> PRT <213> Homo sapiens <400> 14 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 15 <211> 23 <212> PRT <213> Homo sapiens <400> 15 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 16 <211> 23 <212> PRT <213> Homo sapiens <400> 16 Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 17 <211> 23 <212> PRT <213> Homo sapiens <400> 17 Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu 1 5 10 15 Thr Arg His Lys Arg Ile His 20 <210> 18 <211> 23 <212> PRT <213> Homo sapiens <400> 18 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 19 <211> 23 <212> PRT <213> Homo sapiens <400> 19 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 20 <211> 23 <212> PRT <213> Homo sapiens <400> 20 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 21 <211> 23 <212> PRT <213> Homo sapiens <400> 21 Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu 1 5 10 15 Thr Arg His Gln Arg Ile His 20 <210> 22 <211> 23 <212> PRT <213> Homo sapiens <400> 22 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 23 <211> 25 <212> PRT <213> Homo sapiens <400> 23 Phe Met Cys Thr Trp Ser Tyr Cys Gly Lys Arg Phe Thr Asp Arg Ser Ala Leu 1 5 10 15 Ala Arg His Lys Arg Thr His 20 25 <210> 24 <211> 23 <212> PRT <213> Homo sapiens <400> 24 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 25 <211> 23 <212> PRT <213> Homo sapiens <400> 25 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 26 <211> 23 <212> PRT <213> Homo sapiens <400> 26 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 27 <211> 23 <212> PRT <213> Homo sapiens <400> 27 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Gln His Arg Arg Ile His 20 <210> 28 <211> 23 <212> PRT <213> Homo sapiens <400> 28 Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu 1 5 10 15 Thr Arg His Gln Arg Ile His 20 <210> 29 <211> 23 <212> PRT <213> Homo sapiens <400> 29 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 30 <211> 23 <212> PRT <213> Homo sapiens <400> 30 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 31 <211> 23 <212> PRT <213> Homo sapiens <400> 31 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 32 <211> 23 <212> PRT <213> Homo sapiens <400> 32 Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 33 <211> 23 <212> PRT <213> Homo sapiens <400> 33 Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu 1 5 10 15 Arg Arg His Gly Arg Thr His 20 <210> 34 <211> 23 <212> PRT <213> Homo sapiens <400> 34 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 35 <211> 23 <212> PRT <213> Homo sapiens <400> 35 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 36 <211> 23 <212> PRT <213> Homo sapiens <400> 36 Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 37 <211> 23 <212> PRT <213> Homo sapiens <400> 37 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 38 <211> 23 <212> PRT <213> Homo sapiens <400> 38 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 39 <211> 23 <212> PRT <213> Homo sapiens <400> 39 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 40 <211> 23 <212> PRT <213> Homo sapiens <400> 40 Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 41 <211> 23 <212> PRT <213> Homo sapiens <400> 41 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 42 <211> 23 <212> PRT <213> Homo sapiens <400> 42 Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Thr Lys His Lys Lys Ile His 20 <210> 43 <211> 23 <212> PRT <213> Homo sapiens <400> 43 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 44 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 44 Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu 1 5 10 15 Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Lys Cys Pro 20 25 30 Val Cys Gly Lys Ala Phe Arg His Ser Ser Ser Leu Val Arg His Gln 35 40 45 Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Lys Tyr Cys Asp Arg 50 55 60 Ser Phe Ser Ile Ser Ser Asn Leu Gln Arg His Val Arg Asn Ile His 65 70 75 80 <210> 45 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 45 Tyr Thr Cys Ser Tyr Cys Gly Lys Ser Phe Thr Gln Ser Asn Thr Leu 1 5 10 15 Lys Gln His Thr Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys 20 25 30 Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly 35 40 45 Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Lys Tyr Cys Asp Arg 50 55 60 Ser Phe Ser Ile Ser Ser Asn Leu Gln Arg His Val Arg Asn Ile His 65 70 75 80 <210> 46 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 46 Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Ile Ser Ser Asn Leu 1 5 10 15 Gln Arg His Val Arg Asn Ile His Thr Gly Glu Lys Pro Phe Gln Cys 20 25 30 Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His 35 40 45 Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly 50 55 60 Lys Ser Phe Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser 85 90 95 Val Ser Ser Thr Leu Ile Arg His Gln Arg Ile His 100 105 <210> 47 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 47 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp 20 25 30 His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg 35 40 45 Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys 50 55 60 Ala Phe Thr Gln Ser Ser Asn Leu Thr Lys His Lys Lys Ile His Thr 65 70 75 80 Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Thr Gln 85 90 95 Ser Ser Asn Leu Thr Lys His Lys Lys Ile His 100 105 <210> 48 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 48 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp 20 25 30 His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu Asn Val His Lys 35 40 45 Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys 50 55 60 Ser Phe Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His Thr 65 70 75 80 Gly Glu Lys Pro Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln 85 90 95 Ser Ser Ser Leu Ile Arg His Gln Arg Thr His 100 105 <210> 49 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 49 Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu 1 5 10 15 Thr Arg His Lys Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Asp 20 25 30 His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu Asn Val His Lys 35 40 45 Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys 50 55 60 Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr 65 70 75 80 Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln 85 90 95 Ser Ser His Leu Asn Val His Lys Arg Thr His 100 105 <210> 50 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 50 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met 20 25 30 Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln 35 40 45 Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys 50 55 60 Ser Phe Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His Thr 65 70 75 80 Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln 85 90 95 Ser Thr His Leu Thr Arg His Arg Arg Ile His 100 105 <210> 51 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 51 Phe Met Cys Thr Trp Ser Tyr Cys Gly Lys Arg Phe Thr Asp Arg Ser 1 5 10 15 Ala Leu Ala Arg His Lys Arg Thr His Thr Gly Glu Lys Pro Phe Gln 20 25 30 Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr 35 40 45 His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp His Cys 50 55 60 Gly Lys Ser Phe Ser Gln Ser Ser His Leu Asn Val His Lys Arg Thr 65 70 75 80 His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys Ser Phe 85 90 95 Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His 100 105 <210> 52 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 52 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Gln His Arg Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met 20 25 30 Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln 35 40 45 Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys 50 55 60 Ser Phe Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His Thr 65 70 75 80 Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln 85 90 95 Ser Thr His Leu Thr Arg His Arg Arg Ile His 100 105 <210> 53 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 53 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp 20 25 30 His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg 35 40 45 Arg Ile His Thr Gly Glu Lys Pro Phe Glu Cys Lys Asp Cys Gly Lys 50 55 60 Ala Phe Ile Gln Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr 65 70 75 80 Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys 85 90 95 Pro Ser Asn Leu Arg Arg His Gly Arg Thr His 100 105 <210> 54 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 54 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys His 20 25 30 Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu Thr Arg His Arg 35 40 45 Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Asp Cys Gly Lys 50 55 60 Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg His Gln Arg Thr His Thr 65 70 75 80 Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg 85 90 95 Ser Asp His Leu Lys Thr His Thr Arg Thr His 100 105 <210> 55 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 55 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp 20 25 30 His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu Asn Val His Lys 35 40 45 Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys 50 55 60 Ser Phe Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His Thr 65 70 75 80 Gly Glu Lys Pro Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln 85 90 95 Lys Ser Asn Leu Ile Arg His Gln Arg Thr His 100 105 <210> 56 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 56 Phe Met Cys Thr Trp Ser Tyr Cys Gly Lys Arg Phe Thr Asp Arg Ser 1 5 10 15 Ala Leu Ala Arg His Lys Arg Thr His Thr Gly Glu Lys Pro Phe Gln 20 25 30 Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr 35 40 45 His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys 50 55 60 Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu Thr Lys His Lys Lys Ile 65 70 75 80 His Thr Gly Glu Lys Pro Tyr Glu Cys His Asp Cys Gly Lys Ser Phe 85 90 95 Arg Gln Ser Thr His Leu Thr Arg His Arg Arg Ile His 100 105 <210> 57 <211> 13 <212> PRT <213> Simian parainfluenza virus 5 <400> 57 Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser 1 5 10 <210> 58 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <400> 58 Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser 1 5 10 15 Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys 20 25 30 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His 35 40 45 Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys 50 55 60 Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His 65 70 75 80 Thr Lys Ile His Leu Arg Gln Lys Asp 85 <210> 59 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <221> VARIANT <222> 1, 13 <223> Xaa = phenylalanine or tyrosine <221> VARIANT <222> 2, 4-8, 10-12, 14-18, 20-21, 23-27 <223> Xaa = any amino acid <221> VARIANT <222> 19 <223> Xaa = hydrophobic residue <400> 59 Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 　1 5 10 15 20 Xaa His Xaa Xaa Xaa Xaa Xaa His 21 25 <210> 60 <211> 23 <212> PRT <213> Homo sapiens <400> 60 Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu 1 5 10 15 Arg Arg His Gly Arg Thr His 20 <210> 61 <211> 23 <212> PRT <213> Homo sapiens <400> 61 Tyr Gln Cys Asn Ile Cys Gly Lys Cys Phe Ser Cys Asn Ser Asn Leu 1 5 10 15 His Arg His Gln Arg Thr His 20 <210> 62 <211> 23 <212> PRT <213> Homo sapiens <400> 62 Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys 1 5 10 15 Arg Arg His Cys Ile Leu His 20 <210> 63 <211> 23 <212> PRT <213> Homo sapiens <400> 63 Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu 1 5 10 15 Asn Arg His Arg Arg Thr His 20 <210> 64 <211> 23 <212> PRT <213> Homo sapiens <400> 64 Tyr Lys Cys Lys Glu Cys Gly Lys Ala Phe Asn His Ser Ser Asn Phe 1 5 10 15 Asn Lys His His Arg Ile His 20 <210> 65 <211> 23 <212> PRT <213> Homo sapiens <400> 65 Phe Lys Cys Pro Val Cys Gly Lys Ala Phe Arg His Ser Ser Ser Leu 1 5 10 15 Val Arg His Gln Arg Thr His 20 <210> 66 <211> 24 <212> PRT <213> Homo sapiens <400> 66 Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Ile Ser Ser Asn Leu 1 5 10 15 Gln Arg His Val Arg Asn Ile His 20 <210> 67 <211> 23 <212> PRT <213> Homo sapiens <400> 67 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Ile Gly Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 68 <211> 23 <212> PRT <213> Homo sapiens <400> 68 Tyr Gly Cys His Leu Cys Gly Lys Ala Phe Ser Lys Ser Ser Asn Leu 1 5 10 15 Arg Arg His Glu Met Ile His 20 <210> 69 <211> 23 <212> PRT <213> Homo sapiens <400> 69 Tyr Lys Cys Lys Glu Cys Gly Gln Ala Phe Arg Gln Arg Ala His Leu 1 5 10 15 Ile Arg His His Lys Leu His 20 <210> 70 <211> 23 <212> PRT <213> Homo sapiens <400> 70 Tyr Lys Cys His Gln Cys Gly Lys Ala Phe Ile Gln Ser Phe Asn Leu 1 5 10 15 Arg Arg His Glu Arg Thr His 20 <210> 71 <211> 23 <212> PRT <213> Homo sapiens <400> 71 Phe Gln Cys Asn Gln Cys Gly Ala Ser Phe Thr Gln Lys Gly Asn Leu 1 5 10 15 Leu Arg His Ile Lys Leu His 20 <210> 72 <211> 23 <212> PRT <213> Homo sapiens <400> 72 Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Ser Ser His Leu 1 5 10 15 Arg Arg His Glu Lys Thr His 20 <210> 73 <211> 23 <212> PRT <213> Homo sapiens <400> 73 Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu 1 5 10 15 Thr Arg His Gln Lys Ile His 20 <210> 74 <211> 23 <212> PRT <213> Homo sapiens <400> 74 Tyr Ala Cys His Leu Cys Gly Lys Ala Phe Thr Gln Cys Ser His Leu 1 5 10 15 Arg Arg His Glu Lys Thr His 20 <210> 75 <211> 23 <212> PRT <213> Homo sapiens <400> 75 Tyr Ala Cys His Leu Cys Ala Lys Ala Phe Ile Gln Cys Ser His Leu 1 5 10 15 Arg Arg His Glu Lys Thr His 20 <210> 76 <211> 23 <212> PRT <213> Homo sapiens <400> 76 Tyr Val Cys Arg Glu Cys Gly Arg Gly Phe Arg Gln His Ser His Leu 1 5 10 15 Val Arg His Lys Arg Thr His 20 <210> 77 <211> 23 <212> PRT <213> Homo sapiens <400> 77 Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu 1 5 10 15 Thr Thr His Lys Ile Ile His 20 <210> 78 <211> 23 <212> PRT <213> Homo sapiens <400> 78 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 79 <211> 23 <212> PRT <213> Homo sapiens <400> 79 Tyr Met Cys Ser Glu Cys Gly Arg Gly Phe Ser Gln Lys Ser Asn Leu 1 5 10 15 Ile Ile His Gln Arg Thr His 20 <210> 80 <211> 23 <212> PRT <213> Homo sapiens <400> 80 Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Thr Lys His Lys Lys Ile His 20 <210> 81 <211> 23 <212> PRT <213> Homo sapiens <400> 81 Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 82 <211> 23 <212> PRT <213> Homo sapiens <400> 82 Tyr Val Cys Arg Glu Cys Arg Arg Gly Phe Ser Gln Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 83 <211> 23 <212> PRT <213> Homo sapiens <400> 83 Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu 1 5 10 15 Thr Arg His Lys Lys Ser His 20 <210> 84 <211> 23 <212> PRT <213> Homo sapiens <400> 84 Tyr Glu Cys Asn Thr Cys Arg Lys Thr Phe Ser Gln Lys Ser Asn Leu 1 5 10 15 Ile Val His Gln Arg Thr His 20 <210> 85 <211> 23 <212> PRT <213> Homo sapiens <400> 85 Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Thr Val His Gln Lys Ile His 20 <210> 86 <211> 23 <212> PRT <213> Homo sapiens <400> 86 Tyr Lys Cys Asp Glu Cys Gly Lys Asn Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Ile Val His Lys Arg Ile His 20 <210> 87 <211> 23 <212> PRT <213> Homo sapiens <400> 87 Tyr Glu Cys Asp Val Cys Gly Lys Thr Phe Thr Gln Lys Ser Asn Leu 1 5 10 15 Gly Val His Gln Arg Thr His 20 <210> 88 <211> 23 <212> PRT <213> Homo sapiens <400> 88 Tyr Glu Cys Val Gln Cys Gly Lys Gly Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Ile Thr His Gln Arg Val His 20 <210> 89 <211> 23 <212> PRT <213> Homo sapiens <400> 89 Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 90 <211> 23 <212> PRT <213> Homo sapiens <400> 90 Tyr Glu Cys Gln Asp Cys Gly Arg Ala Phe Asn Gln Asn Ser Ser Leu 1 5 10 15 Gly Arg His Lys Arg Thr His 20 <210> 91 <211> 23 <212> PRT <213> Homo sapiens <400> 91 Tyr Glu Cys Asn Glu Cys Gly Lys Phe Phe Ser Gln Ser Ser Ser Leu 1 5 10 15 Ile Arg His Arg Arg Ser His 20 <210> 92 <211> 23 <212> PRT <213> Homo sapiens <400> 92 Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Asn Gln Ser Ser Thr Leu 1 5 10 15 Thr Arg His Lys Ile Val His 20 <210> 93 <211> 23 <212> PRT <213> Homo sapiens <400> 93 Tyr Glu Cys Asn Glu Cys Gly Lys Ala Phe Ala Gln Asn Ser Thr Leu 1 5 10 15 Arg Val His Gln Arg Ile His 20 <210> 94 <211> 23 <212> PRT <213> Homo sapiens <400> 94 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Gln His Arg Arg Ile His 20 <210> 95 <211> 23 <212> PRT <213> Homo sapiens <400> 95 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 96 <211> 22 <212> PRT <213> Homo sapiens <400> 96 His Lys Cys Leu Glu Cys Gly Lys Cys Phe Ser Gln Asn Thr His Leu 1 5 10 15 Thr Arg His Gln Arg Thr 20 <210> 97 <211> 25 <212> PRT <213> Homo sapiens <400> 97 Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp 1 5 10 15 Glu Leu Asn Arg His Lys Lys Arg His 20 25 <210> 98 <211> 25 <212> PRT <213> Homo sapiens <400> 98 Tyr His Cys Asp Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp 1 5 10 15 Glu Leu Thr Arg His Tyr Arg Lys His 20 25 <210> 99 <211> 25 <212> PRT <213> Homo sapiens <400> 99 Tyr Arg Cys Ser Trp Glu Gly Cys Glu Trp Arg Phe Ala Arg Ser Asp 1 5 10 15 Glu Leu Thr Arg His Phe Arg Lys His 20 25 <210> 100 <211> 25 <212> PRT <213> Homo sapiens <400> 100 Phe Ser Cys Ser Trp Lys Gly Cys Glu Arg Arg Phe Ala Arg Ser Asp 1 5 10 15 Glu Leu Ser Arg His Arg Arg Thr His 20 25 <210> 101 <211> 25 <212> PRT <213> Homo sapiens <400> 101 Phe Ala Cys Ser Trp Gln Asp Cys Asn Lys Lys Phe Ala Arg Ser Asp 1 5 10 15 Glu Leu Ala Arg His Tyr Arg Thr His 20 25 <210> 102 <211> 25 <212> PRT <213> Homo sapiens <400> 102 Tyr His Cys Asn Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp 1 5 10 15 Glu Leu Thr Arg His Tyr Arg Lys His 20 25 <210> 103 <211> 24 <212> PRT <213> Homo sapiens <400> 103 Phe Leu Cys Gln Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu 1 5 10 15 Thr Arg His Met Lys Lys Ser His 20 <210> 104 <211> 23 <212> PRT <213> Homo sapiens <400> 104 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 105 <211> 23 <212> PRT <213> Homo sapiens <400> 105 Phe Ala Cys Glu Val Cys Gly Val Arg Phe Thr Arg Asn Asp Lys Leu 1 5 10 15 Lys Ile His Met Arg Lys His 20 <210> 106 <211> 25 <212> PRT <213> Homo sapiens <400> 106 Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp 1 5 10 15 Lys Leu Asn Arg His Lys Lys Arg His 20 25 <210> 107 <211> 23 <212> PRT <213> Homo sapiens <400> 107 Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu 1 5 10 15 Thr Arg His Gln Arg Ile His 20 <210> 108 <211> 23 <212> PRT <213> Homo sapiens <400> 108 Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 109 <211> 23 <212> PRT <213> Homo sapiens <400> 109 Tyr Leu Cys Ser Glu Cys Asp Lys Cys Phe Ser Arg Ser Thr Asn Leu 1 5 10 15 Ile Arg His Arg Arg Thr His 20 <210> 110 <211> 23 <212> PRT <213> Homo sapiens <400> 110 Tyr Glu Cys Lys Glu Cys Gly Lys Ala Phe Ser Ser Gly Ser Asn Phe 1 5 10 15 Thr Arg His Gln Arg Ile His 20 <210> 111 <211> 23 <212> PRT <213> Homo sapiens <400> 111 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 112 <211> 23 <212> PRT <213> Homo sapiens <400> 112 Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu 1 5 10 15 Arg Arg His Glu Thr Thr His 20 <210> 113 <211> 23 <212> PRT <213> Homo sapiens <400> 113 Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu 1 5 10 15 Ile Arg His Gln Arg Ile His 20 <210> 114 <211> 23 <212> PRT <213> Homo sapiens <400> 114 Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu 1 5 10 15 Thr Arg His Lys Arg Ile His 20 <210> 115 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Naturally occurring linker peptide <221> VARIANT <222> 3 <223> Xaa = Glu or Gln <221> VARIANT <222> 4 <223> Xaa = Lys or Arg <221> VARIANT <222> 6 <223> Xaa = Tyr or Phe <400> 115 Thr Gly Xaa Xaa Pro Xaa 1 5 <210> 116 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Synthetically generated peptide <221> VARIANT <222> 1, 13 <223> Xaa = phenylalanine or tyrosine <221> VARIANT <222> 2, 4-8, 10-14, 16, 20, 23-27 <223> Xaa = any amino acid <221> VARIANT <222> 19 <223> Xaa = a hydrophobic residue <400> 116 Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Ser Asn 1 5 10 15 Xaa Xaa Arg His Xaa Xaa Xaa Xaa Xaa His 20 25 <210> 117 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> Synthetically generated oligonucleotide <400> 117 atcgataagc taattctcac tcattaggca ccccaggctt tacactttat gcttccggct 60 cgtataatgt gtggaattgt gagcggataa caatttcaca caggaaacag cgtccatggg 120 taagcctatc cctaaccctc tcctcggtct cgattctaca caagctatgg gtgctcctcc 180 aaaaaagaag agaaaggtag ctggatccac tagtaacggc cgccagtgtg ctggaattct 240 gcagatatcc atcacactgg cggccgc 267 <210> 118 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> mutated sequence <400> 118 Phe Met Cys Thr Trp Ser Tyr Cys Gly Lys Arg Phe Thr Asp Arg Ser 1 5 10 15 Ala Leu Ala Arg His Lys Arg Thr His 20 25 <210> 119 <211> 23 <212> PRT <213> Homo sapiens <400> 119 Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu 1 5 10 15 Arg Arg His Gly Arg Thr His 20 <210> 120 <211> 23 <212> PRT <213> Homo sapiens <400> 120 Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu 1 5 10 15 Asn Arg His Arg Arg Thr His 20 <210> 121 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> mutated sequence <400> 121 Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Asp Ser Ser 1 5 10 15 Asn Leu Thr Arg His Ile Arg Ile His 20 25 <210> 122 <211> 23 <212> PRT <213> Homo sapiens <400> 122 Phe Lys Cys Pro Val Cys Gly Lys Ala Phe Arg His Ser Ser Ser Leu 1 5 10 15 Val Arg His Gln Arg Thr His 20 <210> 123 <211> 24 <212> PRT <213> Homo sapiens <400> 123 Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Ile Ser Ser Asn Leu 1 5 10 15 Gln Arg His Val Arg Asn Ile His 20 <210> 124 <211> 23 <212> PRT <213> Homo sapiens <400> 124 Tyr Lys Cys His Gln Cys Gly Lys Ala Phe Ile Gln Ser Phe Asn Leu 1 5 10 15 Arg Arg His Glu Arg Thr His 20 <210> 125 <211> 23 <212> PRT <213> Drosophila <400> 125 Tyr Thr Cys Ser Tyr Cys Gly Lys Ser Phe Thr Gln Ser Asn Thr Leu 1 5 10 15 Lys Gln His Thr Arg Ile His 20 <210> 126 <211> 23 <212> PRT <213> Homo sapiens <400> 126 Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu 1 5 10 15 Asn Val His Lys Arg Thr His 20 <210> 127 <211> 23 <212> PRT <213> Homo sapiens <400> 127 Tyr Met Cys Ser Glu Cys Gly Arg Gly Phe Ser Gln Lys Ser Asn Leu 1 5 10 15 Ile Ile His Gln Arg Thr His 20 <210> 128 <211> 23 <212> PRT <213> Homo sapiens <400> 128 Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Thr Lys His Lys Lys Ile His 20 <210> 129 <211> 23 <212> PRT <213> Homo sapiens <400> 129 Phe Glu Cys Lys Asp Cys Gly Lys Ala Phe Ile Gln Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 130 <211> 23 <212> PRT <213> Homo sapiens <400> 130 Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu 1 5 10 15 Thr Val His Gln Lys Ile His 20 <210> 131 <211> 23 <212> PRT <213> Homo sapiens <400> 131 Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 132 <211> 23 <212> PRT <213> Homo sapiens <400> 132 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Gln His Arg Arg Ile His 20 <210> 133 <211> 23 <212> PRT <213> Homo sapiens <400> 133 Tyr Glu Cys His Asp Cys Gly Lys Ser Phe Arg Gln Ser Thr His Leu 1 5 10 15 Thr Arg His Arg Arg Ile His 20 <210> 134 <211> 23 <212> PRT <213> Homo sapiens <400> 134 Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu 1 5 10 15 Lys Thr His Thr Arg Thr His 20 <210> 135 <211> 25 <212> PRT <213> Homo sapiens <400> 135 Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp 1 5 10 15 Lys Leu Asn Arg His Lys Lys Arg His 20 25 <210> 136 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> mutated sequence <400> 136 Phe Ala Cys Pro Glu Cys Pro Lys Arg Phe Met Arg Ser Asp Asn Leu 1 5 10 15 Thr Gln His Ile Lys Thr His 20 <210> 137 <211> 23 <212> PRT <213> Homo sapiens <400> 137 Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu 1 5 10 15 Thr Arg His Gln Arg Ile His 20 <210> 138 <211> 23 <212> PRT <213> Homo sapiens <400> 138 Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu 1 5 10 15 Ile Arg His Gln Arg Thr His 20 <210> 139 <211> 23 <212> PRT <213> Homo sapiens <400> 139 Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu 1 5 10 15 Asn Val His Arg Arg Ile His 20 <210> 140 <211> 23 <212> PRT <213> Homo sapiens <400> 140 Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu 1 5 10 15 Arg Arg His Glu Thr Thr His 20 <210> 141 <211> 23 <212> PRT <213> Homo sapiens <400> 141 Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu 1 5 10 15 Ile Arg His Gln Arg Ile His 20 <210> 142 <211> 23 <212> PRT <213> Homo sapiens <400> 142 Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu 1 5 10 15 Thr Arg His Lys Arg Ile His 20 <210> 143 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <400> 143 daadaaaath ga 12 <210> 144 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <221> misc_feature <222> 10 <223> n = a,t,c or g <400> 144 gyagrahgan ggk 13 <210> 145 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <400> 145 hgaaathgag gt 12 <210> 146 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <400> 146 gragragggg ra 12 <210> 147 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <221> misc_feature <222> 7 <223> n = a,t,c or g <400> 147 grahganggg tc 12 <210> 148 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <400> 148 gragragggh ga 12 <210> 149 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <400> 149 gavgaaaath ga 12 <210> 150 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <221> misc_feature <222> 1 <223> n = a,t,c or g <400> 150 ngggyagraa at 12 <210> 151 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <221> misc_feature <222> 10 <223> n = a,t,c or g <400> 151 gaagrahgan ggk 13 <210> 152 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> putative target sequence <221> misc_feature <222> 7 <223> n = a,t,c or g <400> 152 gradaanggg tc 12 <210> 153 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> binding sequence <221> misc_feature <222> 10 <223> n = a, t, c, or g <400> 153 gaagrahgan gg 12 <210> 154 <211> 189 <212> PRT <213> Escherichia coli <400> 154 Met Lys Arg Leu Ile Val Gly Ile Ser Gly Ala Ser Gly Ala Ile Tyr 1 5 10 15 Gly Val Arg Leu Leu Gln Val Leu Arg Asp Val Thr Asp Ile Glu Thr 20 25 30 His Leu Val Met Ser Gln Ala Ala Arg Gln Thr Leu Ser Leu Glu Thr 35 40 45 Asp Phe Ser Leu Arg Glu Val Gln Ala Leu Ala Asp Val Thr His Asp 50 55 60 Ala Arg Asp Ile Ala Ala Ser Ile Ser Ser Gly Ser Phe Gln Thr Leu 65 70 75 80 Gly Met Val Ile Leu Pro Cys Ser Ile Lys Thr Leu Ser Gly Ile Val 85 90 95 His Ser Tyr Thr Asp Gly Leu Leu Thr Arg Ala Ala Asp Val Val Leu 100 105 110 Lys Glu Arg Arg Pro Leu Val Leu Cys Val Arg Glu Thr Pro Leu His 115 120 125 Leu Gly His Leu Arg Leu Met Thr Gln Ala Ala Glu Ile Gly Ala Val 130 135 140 Ile Met Pro Pro Val Pro Ala Phe Tyr His Arg Pro Gln Ser Leu Asp 145 150 155 160 Asp Val Ile Asn Gln Thr Val Asn Arg Val Leu Asp Gln Phe Ala Ile 165 170 175 Thr Leu Pro Glu Asp Leu Phe Ala Arg Trp Gln Gly Ala 180 185 <210> 155 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 155 ctggaaagaa ccggaagaga tgctg 25 <210> 156 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 156 tgaaacgact cattgtaggc atcag 25 <210> 157 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> target sequence <221> misc_feature <222> 7 <223> n = a,t,c or g <400> 157 gctgranggg ah 12

Claims

하기 단계들을 포함하는, 원핵세포 내에서 유전자의 발현을 조절하는 방법:

인공 폴리펩타이드를 코딩하는 핵산을 포함하는 원핵세포를 제공하는 단계로서, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 유전자 내 표적 DNA 부위에 결합하는 것을 특징으로 하는 단계; 및

상기 인공 폴리펩타이드가 생산되고, 표적 DNA 부위에 결합하고, 유전자를 조절하는 조건 하에서 상기 세포 내에서 인공 폴리펩타이드를 코딩하는 핵산을 발현시키는 단계.
제1항에 있어서,

상기 인공 폴리펩타이드가 세 개 이상의 징크 핑거 도메인을 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,

상기 유전자가 내생 유전자인 것을 특징으로 하는 방법.
제3항에 있어서,

두 개 이상의 내생 유전자의 발현이 조절되는 것을 특징으로 하는 방법.
제4항에 있어서,

상기 인공 폴리펩타이드가 다시스트론성 RNA의 발현을 조절하는 것을 특징으로 하는 방법.
제1항에 있어서,

상기 유전자의 발현이, 상기 인공 단백질의 부재 시 유전자의 발현에 비하여 억제되는 것을 특징으로 하는 방법.
제1항에 있어서,

상기 세포가 대장균 세포인 것을 특징으로 하는 방법.
제1항에 있어서,

상기 조절이 대조 세포에 비하여 상기 세포의 특성을 변경시키는 것을 특징으로 하는 방법.
제8항에 있어서,

상기 특성이 열 저항성 또는 용매 저항성인 것을 특징으로 하는 방법.
제3항에 있어서,

상기 내생 유전자가 디카복실라제 효소를 코딩하는 것을 특징으로 하는 방법.
제10항에 있어서,

상기 디카복실라제 효소가 유비퀴논 생합성 경로의 디카복실라제 효소인 것을 특징으로 하는 방법.
제11항에 있어서,

상기 효소가 ubiX 유전자 산물인 것을 특징으로 하는 방법.
제1항에 있어서,

상기 인공 폴리펩타이드를 코딩하는 핵산의 발현이 조절가능한 것을 특징으로 하는 방법.
제3항에 있어서,

상기 내생 유전자의 특성을 분석하는 단계를 추가로 포함하는 방법.
제14항에 있어서,

상기 특성 분석이 상기 인공 폴리펩타이드에 의해 결합된 DNA를 동정하고, 결합된 DNA와 관련된 상기 내생 유전자의 염기서열을 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
제15항에 있어서,

상기 분리가 상기 DNA에 상기 인공 단백질을 교차-연결시키고, 상기 인공 단백질을 면역침전시키는 단계를 포함하는 것을 특징으로 하는 방법.
제15항에 있어서,

제2 유형의 세포 내에서 내생 유전자의 동족체를 동정하고, 상기 동족체의 발현을 조절하는 단계를 추가로 포함하는 방법.
제17항에 있어서,

상기 제2 유형의 세포가 원핵세포인 것을 특징으로 하는 방법.
제18항에 있어서,

상기 제2 유형의 세포가 세균 세포인 것을 특징으로 하는 방법.
하기 단계를 포함하는 방법:

복수개 각각의 세포가 인공 폴리펩타이드를 코딩하는 핵산을 포함하고, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 상기 인공 폴리펩타이드가 상기 복수개의 세포들간에는 서로 다른, 복수개의 원핵세포들을 제공하는 단계; 및

대조 세포에 비하여 변경된 특성을 갖는 세포를 상기 복수개의 세포들로부터 동정하는 단계.
제20항에 있어서,

상기 특성이 유기용매에 대한 내성이고, 상기 동정이 유기용매에 복수개의 세포들을 노출시키고 상기 세포들의 생존율을 평가하는 단계를 포함하는 것을 특징으로 하는 방법.
제20항에 있어서,

상기 특성이 내열성이고, 상기 평가가 상기 세포들을 열에 노출시키는 단계를 포함하는 것을 특징으로 하는 방법.
제20항에 있어서,

상기 동정된 세포로부터 상기 인공 폴리펩타이드를 코딩하는 핵산을 분리하는 것을 추가로 포함하는 방법.
제23항에 있어서,

상기 핵산의 서열을 분석하는 것을 추가로 포함하는 방법.
제20항에 있어서,

상기 동정된 세포로부터 상기 인공 폴리펩타이드를 분리하는 것을 추가로 포함하는 방법.
제20항에 있어서,

상기 동정된 세포로부터 상기 인공 폴리펩타이드를 코딩하는 핵산을 분리하고, 제2 복수개의 세포들 내로 상기 핵산을 도입하고, 상기 인공 폴리펩타이드가 생산되는 조건 하에서 상기 제2 복수개의 세포들을 배양하고, 대조 세포에 비하여 변경된 특성을 갖는 제2 복수개의 세포를 동정하는 단계를 추가로 포함하는 방법.
제20항에 있어서,

상기 인공 폴리펩타이드의 표적 DNA 부위의 서열을 결정하는 단계를 추가로 포함하는 방법.
제20항에 있어서,

상기 인공 폴리펩타이드에 의해 결합된 내생 유전자를 동정하는 단계를 추가로 포함하는 방법.
제20항에 있어서,

상기 세포의 하나 이상의 유전자들의 발현을 분석하는 단계를 추가로 포함하는 방법.
제28항에 있어서,

제2 세포 내에서 상기 내생 유전자의 발현을 변경시키는 단계를 추가로 포함하는 방법.
제20항에 있어서,

상기 인공 폴리펩타이드가 적어도 세 개의 징크 핑거 도메인들을 포함하는 것을 특징으로 하는 방법.
제31항에 있어서,

상기 징크 핑거 도메인들이 효모 징크 핑커 도메인들 또는 그의 변형체들인 것을 특징으로 하는 방법.
제20항에 있어서,

상기 변경된 특성을 이용하기 위하여 상기 동정된 세포를 배양하는 것을 추가로 포함하는 방법.
인공 폴리펩타이드를 코딩하는 핵산을 포함하는 원핵세포로서, 상기 인공 폴리펩타이드가 징크 핑거 도메인을 포함하고, 상기 핵산이 발현되는 조건 하에서 상기 인공 폴리펩타이드가 유전자 내 표적 DNA 부위에 결합하여 상기 유전자의 발현을 조절하는 것을 특징으로 하는 원핵세포.
제34항에 있어서,

상기 인공 폴리펩타이드가 내생 유전자의 발현을 조절하는 것을 특징으로 하는 원핵세포.
제34항에 있어서,

상기 인공 폴리펩타이드가 세 개 이상의 징크 핑커 도메인들을 포함하는 것을 특징으로 하는 원핵세포.
제35항에 있어서,

상기 유전자가 디카복실라제인 것을 특징으로 하는 방법.
제20항의 방법에 의해 선별된 세포.
한 개 이상의 징크 핑거 도메인을 포함하는 폴리펩타이드로서, 상기 징크 핑거 도메인의 위치 -1, +2, +3 및 +6에서 DNA 접촉 잔기들이 RSHR, HSSR, ISNR, RDHT, QTHR, VSTR, QNTQ, 및 CSNR로부터 선택된 모티프에 상응하고, 상기 폴리펩타이드가 내생 원핵세포 유전자를 조절하는 것을 특징으로 하는 폴리펩타이드.
제39항에 있어서,

제2 및 제3 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 및 제3 도메인들 의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 RSHR, HSSR, 및 ISNR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제39항에 있어서,

제2 및 제3 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 및 제3 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 ISNR, RDHT, 및 QTHR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제41항에 있어서,

제4 징크 핑거 도메인을 추가로 포함하고, 상기 제4 도메인의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 모티프 VSTR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제39항에 있어서,

제2 및 제3 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 및 제3 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 QNTQ, CSNR, 및 ISNR에 상응하는 것을 특징으로 하는 폴리펩타이드.
한 개 이상의 징크 핑거 도메인을 포함하는 폴리펩타이드로서, 상기 징크 핑거 도메인의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 QSHV, VSNV, QSNK, RDHT, QTHR, QSSR, WSNR, VSNV, RSHR, DSAR, QTHQ, RSHR, QSNR, 및 CSNR로부터 선택된 모티프에 상응하고, 상기 폴리펩타이드가 내생 원핵세포 유전자를 조절하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 QSHV, VSNV, QSNK, 및 QSNK에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 RDHT, QSHV, QTHR, 및 QSSR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 WSNR, QSHV, VSNV, 및 QSHV에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 QTHR, RSHR, QTHR, 및 QTHR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 DSAR, RDHT, QSHV, 및 QTHR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 QTHQ, RSHR, QTHR, 및 QTHR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 QSHV, VSNV, QSNR, 및 CSNR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 VSNV, QTHR, QSSR, 및 RDHT에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 RDHT, QSHV, QTHR, 및 QSNR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제44항에 있어서,

제2, 제3, 및 제4 징크 핑거 도메인을 추가로 포함하고, 상기 제1, 제2, 제3, 및 제4 도메인들의 위치 -1, +2, +3, 및 +6에서 DNA 접촉 잔기들이 각각 모티프 DSAR, RDHT, QSNK, 및 QTHR에 상응하는 것을 특징으로 하는 폴리펩타이드.
제39항의 폴리펩타이드를 코딩하는 핵산.
제39항의 폴리펩타이드를 코딩하는 핵산을 포함하는 세균 발현 벡터.